【軟體】BIG5 Extension 擴充規格 2.10



贊助商連結


lamina
2003-05-21, 05:43 PM
BIG5 Extension 擴充規格 2.10 (Win2k)

 軟體名稱:BIG5 Extension 擴充規格
 ∥版本:2.10
 ∥分類:補綴工具
 ∥環境:2K/XP 簡體中文/繁體中文
 ∥性質:免費軟體

 NLS 核心:巫培源 (Witch Five)
 ∥mailto:[email protected]
 ∥ICQ:16896247
 ∥網頁: http://cpatch.org/witchfive/

 網頁:柯志杰 (but)
 ∥mailto:[email protected]
 ∥ICQ:N/A
 ∥網頁:http://cpatch.org/unicode/ (Unicode 補完計畫新址)
 ∥網頁:http://student.thu.edu.tw/~s892941/japan/ (Unicode 補完計畫原址)
 ∥論壇:http://leoboard.cpatch.org/cgi-bin/forums.cgi?forum=21

 規劃、後製、NSIS 安裝:黃國書 (Kii Ali)
 ∥mailto:[email protected]
 ∥ICQ:5107476
 ∥網頁: http://cpatch.org/kiiali/

 部分版權 (C) 櫻花輸入法 Roy Hu <[email protected]>
 部分版權 (C) 中國海電腦


■軟體散布

很願意在 Free Software Foundation 的理念下,經由任何網站、
任何實體媒體、附加於任何光碟、或做為任何軟體的一部綑綁散布。

當然歡迎: 轉貼此軟體的 readme 全文 (就是你現在看的這篇) ,
到任何的留言板、討論版、BBS 、甚至個人 email。

不需要任何的條件、利益、事前通知。


■軟體描述

你想在 BBS/網頁 轉貼日文/簡體中文?想用日文 IME 輸入日文?
想用注音輸入法輸入簡體中文?想從大陸網站複製貼上到 BBS 
或純文字的地方,卻老是貼出一堆 ???? 問號?

甚至,你常常沒事某些軟體就一堆問號,或是解壓縮出問號檔案
,砍也砍不掉?現在,都解決了。

你只需要想像,裝了神奇的 Big5 Extension 以後,部分原本不屬
於 BIG5 的字元 (簡體字、日文假名......) 會被加入 BIG5 標準
規格裡面,這樣你就可以懂了吧?


■比較表
<FONT face="Fixedsys">

┌─────┬───────┬────────┬─────┬─────┐
│     │BIG5 Extension│Unicode 補完計畫│櫻花輸入法│中國海字集│
├─────┼───────┼────────┼─────┼─────┤
│總支援字數│  約 4800  │  約 120   │約 120  │約 4800  │
├─────┼───────┼────────┼─────┼─────┤
│Unicode  │UC 正確對應 │UC 正確對應  │UC 造字區│UC 造字區│
│碼位   │○在網路上交換│○ 在網路上交換│╳ 交換 │╳ 交換 │
│     │○轉貼日文簡中│※ 只能轉貼日文│╳ 轉貼 │╳ 轉貼 │
│     │○具可攜性  │○ 具可攜性  │╳ 可攜性│╳ 可攜性│
├─────┼───────┼────────┼─────┼─────┤
│技術   │ NLS 對應  │ NLS 對應   │額外造字 │額外造字 │
├─────┼───────┼────────┼─────┼─────┤
│Win2k/XP │  ○    │   ○    │  ○   │  ○  │
│Win98/ME │  ○    │   ╳    │  ○   │  ○  │
├─────┼───────┼────────┼─────┼─────┤
│日文假名 │  ○    │   ○    │  ○   │  ○  │
├─────┼───────┼────────┼─────┼─────┤
│日文國字 │  ○    │   ╳    │  ╳  │  ○  │
├─────┼───────┼────────┼─────┼─────┤
│符號支援 │  ○    │   ╳    │  ╳  │  ○  │
├─────┼───────┼────────┼─────┼─────┤
│生化方言字│  ○    │   ╳    │  ╳  │  ○  │
├─────┼───────┼────────┼─────┼─────┤
│簡體字支援│  ○    │   ╳    │  ╳  │  ○  │
├─────┼───────┼────────┼─────┼─────┤
│備註   │       │將與前者進行合併│     │     │
└─────┴───────┴────────┴─────┴─────┘
</FONT>

■測試網頁

填表完畢者:c_950.nls (for NT/2K/XP)、cp_950.nls (for 98SE/ME)

測試:
1.使用 IE 觀看測試:以 ie 開啟「測試頁」,看能不能看到「左
 簡右繁」、「日文假名」。
2.未安裝者,出現「部分空白」。
3.已安裝者,正常顯示。

ps: 測試頁位置如下
http://home.kimo.com.tw/s793016/1/C.HTM
http://home.kimo.com.tw/s793016/1/J.HTM


■答客問

BIG5 Extension 擴充規格 2.10

◆Q1 裝上這個,有什麼立刻的好處?
◆Q2 這跟「Unicode 補完計畫」有什麼不一樣?
◆Q3 這跟「中國海」有什麼不一樣?
◆Q4 已經安裝「Unicode 補完計畫」,要不要先解除安裝?
◆Q5 我們的輸入法不支援這些字啊?
◆Q6 簡體中文版 OS 下,能不能安裝?有什麼影響?
◆Q7 他是不是「國家標準」?是不是 FreeWare?
◆Q8 香港字、臺灣方言字的顧慮
◆Q9 其他廢話


◆Q1 裝上這個,有什麼立刻的好處?

 請參見安裝完後的範例圖片
 
 install_win2k_1_no.jpg 安裝前 之一
 install_win2k_1_yes.jpg 安裝後 之一
 install_win2k_2_no.jpg 安裝前 之二
 install_win2k_2_yes.jpg 安裝後 之二

 1.解決──簡體中文/日文片假名/日文平假名/中國海字
  1) 轉貼 BBS 時,所產生一大堆 ???? 問號問題。
  2) 正常顯示、正常列印放大縮小,不需要安裝造字。
  3) 因為他根本就不是造字!把 unicode 藏著的字,釋放出來!
    釋放 4800 (!!!) 字出來。

 2.解決──使用大陸地區製作的軟體,在繁體中文 win2k/win98
  原本一堆 ???? 問號,全部變成可以閱讀的簡體中文。

 3.解壓縮時,如果含有簡體中文檔名,再也不會產生「無法刪除」
  或是「問號」「亂碼」的檔案。

 4.游鍚「坤」,王建「火宣」,生物上的「酉每」之類的特別外字,
  原本未納入 BIG5 標準,現在全部納入。不需要再造字。提供絕大
  部分繁體字地區 (含香港/臺灣/人名等) 常見外字集。

 5.可顯示、列印,甚至可在網路交換 (在 unicode 平臺, IE6/ICQ/MSN,
  即使對方未安裝)。是的,所見即所得。

 能不能解決日文顯示列印問題?這是當然,而且是「順便解決」,
 要不然我們做這個幹嘛。


◆Q2 這跟「 Unicode 補完計畫」有什麼不一樣?

 補完計畫的舊網址
 http://student.thu.edu.tw/~s892941/japan/

 補完計畫著重在日文在 BIG5 當中的支援,只補齊了原始日文假名
 (大約 120 個) 而「BIG5 Extension 擴充規格」補齊大約 4800
 個(!!!) ,包括 日文/簡體中文/特別符號 等規格。

 基本理念 「ANSI vs unicode 對應表」,可說完全相同。我們也確認
 合併的諸多事宜,與人員分工。大體上 witch 製作 NLS、ho 製作
 網頁,而我 (ka) 負責安裝程式。敬請期待。 

◆Q3 這跟「中國海」有什麼不一樣?

 中國海的網址
 http://www.chinasea.com.tw

 坦白說,在拜讀「高衝緒」先生所排列出來的中國海字型,對其人
 在字型與內碼的思考與規劃,完全拜服。但很可惜的,因 unicode
 興起,註定在商業市場上落敗,而且未納為標準 (雖然一度是個人
 在 DOS 使用下的標準。)

 只是,中國海是「造字」格式,因此必須另外安裝造字檔案。對應
 到的 unicode 碼位段落,都在 unicode 造字區。交換訊息時會有
 問題。
 
 「BIG5 Extension 擴充規格」根本不是造字,只是把對應的碼
 位,重新排列到 unicode 的標準位置上。因此在網路上以
 unicode 環境交換時 (比如 IE/ICQ),根本不生問題。

 不管對方有沒有安裝,只要基於 unicode 平臺 (IE6/ICQ/MSN)
 交換訊息,不需要擔心流通問題。


◆Q4 1)已經安裝「Unicode 補完計畫」,要不要先解除安裝?
   2)已經安裝「BIG5 Extension 舊版」,要不要先解除安裝?
   3)已經安裝「中國海字型」,要不要先解除安裝?
   4)還是很想使用中國海的漂亮圖案字型呀!
 
 1) 已安裝 Unicode 補完計畫──「不」需要解除安裝。
 2) 已安裝 BIG5 Extension 舊版──「不」需要解除安裝。
 2) 已安裝中國海──不用解除安裝。
 3) 在空置碼位的部分,會繼承圖案的部分。

 因此可以讓你達到「最佳交換相容性」「最佳個人使用性」
 的雙重效果。在 unicode 上交換,沒有問題,個人使用也可以
 最爽的狀態。


◆Q5 我們的輸入法不支援這些字啊?

 誰說的。如果在 Win2k 使用微軟內建「標準注音」「標準倉頡」
 「標準大易」「微軟新注音」「微軟新倉頡」,早就支援了。
 (Win98 使用者別打我)
 
 如何設定: 控制臺/地區設定/輸入法設定/ ,有一個「只顯示
 BIG5字集」選項,該選項不要勾選即可使用。


◆Q6 1)簡體中文版 OS 下,能不能安裝?有什麼影響?
   2)英文版 OS 也可以嗎?

 當然可以。 (包含 Win98/win2k/xp)
 
 1) 對一般簡體中文的作業,不生任何影響。
 2) 以 IE6 觀看繁體中文的網頁時,產生擴增的效果。
 3) 執行純繁體中文程式,產生擴增的效果。
 4) 在 unicode 之下的港臺方言字,自然不是問題。

 當然,你也可以在英文版 Win2k/WinXP 安裝,並加裝使用 MUI 。
 我現在寫這份文件時,就是這樣使用。


◆Q7 他是不是「國家標準」?是不是 FreeWare?

 我們很有意願讓他納入「國家標準」。
 
 亦很願意在 Free Software Foundation 的理念下,自由地經由
 商業或非商業管道散佈,不需要任何條件、利益、或事前通知。

 我們不可能,亦毫無意願以此做謀利手段。

 與 unicode 是否相容?廢話,與 unicode 相容就是目的。
 不相容幹嘛要做?
 
 會不會破壞 BIG5 標準?恐怕言過其實。他仍然與目前 13503
 字完整對應,一字也沒有少。簡單說,目前的 BIG5 從碼位 A140
 開始,而「BIG5 Extension 擴充規格」從碼位 8140 開始。

  BIG5   (原): A140 - F97E , A1A1 - F9FE
  BIG5 Extension: 8140 - FE7E , 81A0 - FEFE
 

◆Q8 香港字、臺灣方言字的顧慮

 臺灣方言字,前面已經提到的如下。

 ──
 游鍚「坤」,王建「火宣」,生物上的「酉每」之類的特別外字,
 原本未納入 BIG5 標準,現在全部納入。不需要再造字。提供絕大
 部分繁體字地區 (含香港/臺灣/人名等) 常見外字集。
 ──

 香港特區政府至少還弄了一個 HKSCS ,而且還取得 unicode 組織
 的認可,已納入新版的 unicode 標準中。只可惜他還是要外掛字
 型,並沒有辦法在華康「細明體」直接出現。而且另外弄一個很奇怪
 的 NLS 951 規格,所以網頁交換時,也還是會出問題。
 
 用技術上的看法說明:
 
 1.範圍在「 CJK 統一表意文字」區塊當中的香港字
  a.我們都會列入(因為這些在系統內建的新細明體可以顯示)。
  b.大概有 100 多字。
  c.包括大部分的常用香港字。

 2.範圍在「 CJK 相容性表意文字」區塊當中的香港字
  a.我們在下個版本才考慮需求。
  b.大概 300 字以下,多數情形下很少使用。
  c.除非外掛造字,或是換如下述字型,否則不可能顯示。
  d.我們必須詳加評估,是否在下一版本解決香港字問題。

 對我們來說,的確兩難。我們還得考慮有限的擴充區碼位。
 
 除非使用者去找華康 (Dynalab Inc.) 所出版 Unicode 版本字型。
 如華康金碟 2002 2003 提供的新細明體版本。我手上的版本,名稱是

"華康細明體(P)-UN" DFU_MLT.TTF 24,500,692 bytes (Unicode Ver 3.0)
"華康中黑體(P)-UN" DFU_HMD.TTF 10,559,584 bytes (Unicode Ver 3.0)

 但只能拿來顯示網頁,無法取代 MingLiU.TTC 做為系統顯示。不管
 怎麼做,都還會有先天的限制。在絕大多數人不可能換系統字型之
 下,別人很可能看到空白或亂碼。

 那麼繼續使用 HKSCS 會不會更好?我以為,除非你「一定要用」全
 部常用與罕用香港字,而且絲毫不考慮 Unicode 上溝通。否則為此
 忍受外字集的缺點,沒有辦法跟 Unicode 溝通的後果,老是問號和
 亂碼,你還忍受不夠多吧?

 最重要的,HKSCS 別人看不到你的香港字。而 BIG5 Extension 可以。

 我們仍建議:BIG5 Extension 是比較務實的方案。

◆Q9 其他廢話

 BIG5 字碼的缺陷很多。大陸 1980 年起使用的 GB 2312 也是,
 只有 6763 個漢字及符號。
 
 但 1993 年公布的《漢字擴展規範 GBK 1.0》,讓大陸朋友在
 看繁體中文時,或使用繁體中文軟體,絲毫沒有亂碼、問號、缺
 字。對簡體中文用戶而言,這種爛問題,簡直是無法想像。

 繁體中文 OS 缺字就是缺字,不是「我們不會用到簡體字」就可
 以含混帶過,人家就不缺。臺灣政府雖有心整頓 BIG5 標準,卻
 無魄力與決心,亦無遠見解決簡體中文顯示、亂碼、問號、缺字
 種種問題。BIG5E, BIG5+ 都是這種理念下的過渡產物。比起 簡
 中/日/韓 的用戶,BIG5 1.0 使用者的處境,該如何覺得可恥。

 更不會有令人爆笑的,日文無法顯示問題。大陸在 2000 年已
 公布 GB 18030 規格。除了「宋體」字實在比「新細明體」醜
 之外,坦白說,內碼環境與規格,的確是人家的比較好。只是
 繁體中文使用者,有太多建築在 BIG5 上的包袱了。

 我們當然也知道 CNS-11643 ,但只恐不能解決問題。

 不客氣的說,BIG5 1.0 是被閹割而自我設限的,在這上面的 OS
 作業系統,都會有缺陷。
 
 我們只想解決 BIG5 1.0 的問題。而且,已經解決了!


■緣起和廢話


這是 2002年11月左右,對中國大陸福建省福州市的「炎之川」所提
到的內容。

======
這一點,在大陸的 GBK 的擴編已經納入繁体字的范圍,所以 unicode
或 utf-8 都可以看到。而 BIG5 本身並沒有規范簡体字的位置,所
以硬要在 BIG5 出現簡体字,都是各家的造字,Unicode 完全不承
認,這很麻煩。

簡單說好了,你們在 IE 里面复制下來的文字,可以是正確的 編碼,
即是是繁体字,也可以在簡體中文的操作系統正常顯示。我們在 IE
里面复制到的簡体字,在 ANSI 環境之下就一定會變成 ???? 一堆問
號。

應該看得懂我在說什麼吧。呃,這是 BIG5 會被消滅的隱憂。它的确
是不夠健全的系統。不過 GBK 也早晚會被 Unicode 合并掉,所以結
果一樣。 (苦笑)
======


■檔案下載

(win2k) 622KB
http://search.cpatch.org/download/patchutil/bgconv/big5ext2k_210.exe

(win98) BIG5 extension 659KB
http://search.cpatch.org/download/patchutil/bgconv/big5ext98_210.exe

(win98) BIG5 extension + 中國海合併安裝 2.1MB
http://search.cpatch.org/download/patchutil/bgconv/big5ext98_210csw.exe




■安裝方式

NSIS 2.0b4 多語言安裝格式。

1.依照螢幕指定進行。
2.重新開機。
3.如需要使用「櫻花輸入法」「日文輸入法」,請直接到
 控制臺/地區設定 (win2k) 控制臺/輸入法 (win98)
 「手動」安裝。

Win98 部分,仍需要安裝中國海字型,請參照「已知問題」部分。
Win2k 不需要。當然 Win98 使用者可以拿「合併安裝版本」,
省得麻煩。

(中國海字集) 4.4MB
ftp://input.cpatch.org/font/chinasea/csw10.exe


■技術資料

如果有興趣,請看安裝後的目錄 *.txt 相關檔案與測試圖片。
通常會放在

C:\Program Files\BIG5_Extension"

請駕臨: 中文化專業論壇
http://leoboard.cpatch.org/cgi-bin/forums.cgi?forum=21


■已知問題

1.Win98

 1)Win98 使用 ANSI (950) 代碼頁為運作核心,而非 unicode。
  Win2k 則使用 unicode 為核心。

 2)在 win98 之下,部分字元無法轉換,會以「底線表示」。
 unicode.bin 是給 ifsmgr.vxd 用的「對照表」,而去呼叫
 的結果。這部分的格式,我們仍在研究。Win2k 無此問題。

 3)Win98 下純「問號型式」的程式亂碼 (如簡體中文的程式,
 在繁體中文 Win98 執行),則業已解決。

 4)Win98 「需要」再安裝中國海字型 (以做為 ANSI 顯示,
 這樣才能正常顯示純文字檔案) 。換 NLS 只能解決 unicode
 端的問題,因為規格已被 unicode.bin 綁死。Win2k 無此問題。

2.win2k

 無以上問題。

3.缺字問題:

 Win98   MingLiU.TTC Ver 2.10 Size: 7,067,224 bytes
 Win2k/XP MingLiU.TTC Ver 3.21 Size: 8,823,308 bytes

 限於華康與微軟的版權,我們不能直接提供更新版本的「細明體」
 字型。您可以直接取用 Win2k/XP 的字型。我只能說,無論
 是 2.10 或 3.21 ,在 unicode 標準上,漏造了不少字。
 比如圈圈 1 到圈圈 20 ,簡中/日/韓 都有提供,唯讀繁中
 「細明體」沒有。但是「新細明體」倒有了,這真是怪事。

 華康另外一套號稱 Unicode 全字集,還算齊全。也有細明體可用。

 不管如何,至少記得把 Win2k 的字型,轉移到 Win98 上使用。
 好處顯而易見,至少不缺那麼多字了。

贊助商連結


琥珀
2003-05-21, 06:48 PM
GB18030 支援套件 (http://www.pczone.com.tw/showthread.php?s=&postid=649371#post649371)

lamina
2003-05-21, 08:34 PM
我之前有裝 BIG5 Extension 擴充規格 2.00 和一些其他東西
結果再安裝 BIG5 Extension 擴充規格 2.10 後,造成某些字無法顯示
所以安裝完後,請到測試網頁瀏覽看看
如果看到缺了很多字(缺字地方會空白)

http://home.kimo.com.tw/s793016/1/C.HTM
http://home.kimo.com.tw/s793016/1/J.HTM

那麼請下載 EUDC Association Editor
把 SystemDefaultEUDC 的關聯給 Delete 掉(如圖)
然後選 File -> Save 存檔,再重新開機就可以解決這種衝突問題...

EUDC Association Editor 下載點 1 (http://home.kimo.com.tw/lamina_net/EUDCAssociationEditor.exe)(KIMO 空間,請另存新檔)
EUDC Association Editor 下載點 2 (http://myweb.hinet.net/home1/lamina/EUDCAssociationEditor.exe)(Hinet 空間,速度慢了點)