【軟體】給 Mozilla win32 用的「中國海字集」...



贊助商連結


s793016
2002-11-13, 09:38 PM
Ya!! 從此以後要用 Mozilla 看 Big5 日文字不必再用「特區政府」的造字了 ... :D

詳情請見此篇文章 (http://www.csie.ntu.edu.tw/~b7506051/mozilla/forum/viewtopic.php?t=763)

贊助商連結


s793016
2002-11-24, 10:55 PM
==
說明檔
==
向 Big5-HKSCS 說再見!! 直接用 Win32-Mozilla 看超過 80% 的「中國海字集」... (http://www.csie.ntu.edu.tw/~b7506051/mozilla/forum/viewtopic.php?t=763)
==
優點

1.不需安裝「中國海字集造字檔」!! 只要您設定對應的字型中有提供 unicode 字即
可 (如:M$ 的「細明體」)

2.不再需要切換至 Big5-hkscs,不必再用 1999 年才出現的「香港政府造字集」了

3.在 Mozilla 下,新增 S-Jis & GB 碼 Bookmark 時,有對應的字會自動轉碼成「
中國海字集」儲存,以前還得自己手動 keyin Big5 碼的「書籤名稱」...
==
缺點

1.只確定能在 Mozilla 1.0 win32 版上使用 ... 其它 os 平台 & mozilla 其它版本
的人想當白老鼠的人請便,我只有 win32 的 mozilla 1.0,so 我也不知道您們的能
不能用 ... 有人「恐嚇」過我,說這樣「會讓系統整個爛掉」... 有試驗過的人,
請記得回來作「心得報告」... ^^;

2.Unicode 限制多多,很多中國海的字 (主要是「圖」) 對應不到 ...

3.M$ 的「細明體」缺字不少,建議用 unicode 缺字少的字型,如華康新出的 or
M$-Office2k 中的「Arial Unicode M$」...
==
檔案說明

ucvtw.txt - 本說明檔
ucvtw.dll - 主體,目前版本為 v0.03
history.txt - 版本說明
charsetalias.properties - 如果您有改過 "c:\Program Files\mozilla.org\Mozilla
\res\charsetalias.properties" 的內容,而又記不得要
如何復原它,請用此檔將其「覆蓋」
==
安裝步驟

1.先抓此檔:http://home.kimo.com.tw/s793016/1/Mozilla_ChinaSEA_v0.01.zip

2.將 Mozilla 完全關閉,如果您有用「快速啟動」功能,需連右下角 systray 上的
mozilla icon 都關掉 ...

3.解開 1. 的檔案,把 ucvtw.dll copy 到 "C:\Program Files\mozilla.org\Mozilla
\components" (假設您安裝時目徑沒改) 中,將原有的那個「覆蓋」掉 ... 如有必
要,請先自行備份 ...

4.如果您有修改過 "c:\Program Files\mozilla.org\Mozilla\res
\charsetalias.properties" 的內容的話,請先將其復原;如果您與我一樣記不得要
如何復原它,請用解出的 charsetalias.properties 將其「覆蓋」...

5.啟動 Mozilla,將「語系與編碼」放在「正體中文 Big5」即可 ...
==
移除「強制字碼對應」

如果您有裝過由 CoPos 網友提供的「將指定 big5 解碼的網頁自動變成 big5-hkscs
解碼」的 xpi 的話,請依以下方法「移除」,否則這個 ucvtw.dll 裝了等於沒裝 (
因為還是「強制以 hkscs 編碼顯示」) ...

反安裝:
1.刪除此資料夾 (假設您安裝 Mozilla 時使用資設路徑)
C:\Program Files\mozilla.org\Mozilla\chrome\big5hkscs\

2.用「WordPAD」開啟此檔:
C:\Program Files\mozilla.org\Mozilla\chrome\overlayinfo\navigator\content\overlays.rdf

3.找到下面這行後,將此行刪除,然後存檔 (格式:文字文件)
<RDF:li>chrome://big5hkscs/content/big5hkscsOverlay.xul</RDF:li>

看 big5 網頁時, 請看看 view->character coding 是否指向 big5-hkscs
==
更新「細明體」

如果您的系統是 win 98 se (含) 以前的版本時,請更新您的「細明體」字型!
因為舊版的「細明體」缺字嚴重,Unicode 下沒有提供「日文假名」字型 ...

您可以用 winme、win2k、winxp 的「細明體」字型,方法如下:

1.把 win me/2k/xp 的「細明體」copy 到 win98se 的某目錄下
2.win98se 選「開始」->「關機」->「重新啟動到 m$-dos 模式」->「確定」
3.c:\windows> 下,打「Move 某目錄\mingliu.ttc c:\windows\fonts」,然後按
Enter,之後會問要不要覆蓋,選 y
4.c:\windows> 下,打「exit」,然後按 Enter
==
刪除「韓文造字」

如果您在用了小弟的 ucvtw.dll 後,發現您的 mozilla 在顯示小弟提供的「測試
頁」時,莫明其妙的跑出一堆「韓文字符」的話,這是因為 ie 的「韓文顯示支援
」會幫您安裝 New Gulim (NGULIM.TTF) 字型,而此字型「內含」「韓文造字」 (
之前謠傳「xp 的細明體造字區有韓文字」是錯的) ,故導致顯示錯誤 ... 解決辦
法很簡單,您只要到「控制台」->「字型」中,把 New Gulim (NGULIM.TTF) 字型
砍掉,unicode 造字區的那些「韓文」就會自動消失了 ... :)
==
測試用:
http://home.kimo.com.tw/s793016/1/C.HTM
中國海字集:簡體中文 <-> 正體中文對照 (部份)

http://home.kimo.com.tw/s793016/1/J.HTM -
中國海字集:日文漢字 <-> 正體中文對照 (部份) (含日文假名)

如果您在這兩個網頁都可以看到左簡字右正字的話,就是 ok 了!!

例:体體 (不過這兩個字皆非「中國海」的字,只是用來說明)
==
需要協助

1.有很多中國海字集的簡字 & 漢字我沒有作對應,如果您確實知道某中國海字可對應
到某 unicode 字的話,請告訴我此字的中國海字集 big-5 碼 & unicode 碼,我會
在確認後加入下一版的 ucvtw.dll 中

2.教我只 compiler UCVTW.DLL 的方法 (我不會「只 compiler ucvtw.dll],我只會
「compiler 完整 Mozilla Win32」,故每次重新產生 ucvtw.dll 皆需浪費許多時
間) ... 如果您願意,我也可以給您檔案讓您自己弄

3.製作「說明文件」(我作文很差)

4.製作「安裝程式」(如有必要)

5.提供「下載點」(現在放在 kimo 網頁空間並不穩定)
===============================================================================
特別感謝:icsun
Francis S.Lin, http://www.csie.ntu.edu.tw/~b7506051/mozilla/
==
我的 e-mail:[email protected]
==
歷史檔
==
2002/06/12 - 初稿完成

2002/11/12 - ucvtw.dll v0.01 產生完畢,初公開

2002/11/20 - ucvtw.dll v0.02 產生完畢 (未公開)

此版更動:8474 ←→ U+4E60
未對應 ← U+4160
85FC ←→ U+53F6
未對應 ← U+85FC
9FD3 →→ U+FF50
9FD4 →→ U+FF51
9FD5 →→ U+FF52
9FD6 →→ U+FF53
9FD7 →→ U+FF54
9FD8 →→ U+FF55
9FD9 →→ U+FF56
9FDA →→ U+FF57
9FDB →→ U+FF58
9FDC →→ U+FF59
9FDD →→ U+FF5A
FEB0 ←→ U+00BD
FEB3 ←→ U+00BC
FEB4 ←→ U+00BE
FEE2 ←→ U+2030

2002/11/24 - ucvtw.dll v0.03 產生完畢

此版修正:因 Mozilla Source 定義 Big5 碼區錯誤而導致
FD40 ~ FEFE 全部無法顯示的問題

s793016
2002-12-14, 06:18 PM
Mozilla_ChinaSEA_v0.04.zip (http://home.kimo.com.tw/s793016/1/Mozilla_ChinaSEA_v0.04.zip)
==
2002/12/14 - ucvtw.dll/uconv.dll v0.04 產生完畢

※可在 mozilla 中 copy GB2312 編碼的網頁,然後直接貼到 bbs 上去,
mozilla 會自動幫您轉碼成「Big5 + 中國海字集」... :)

ps:目前 GB2312 全 8178 碼位,有對應者 8035 位,其餘 143 碼無對應

此版更動:

85C7 ←→ U+5FFE C7DF ←← U+FF6C A44D ←← U+5202
8AE1 ←→ U+7A51 C7E0 ←← U+FF94 A4BA ←← U+5185
93DA ←→ U+6447 C7E1 ←← U+FF6D A4C3 ←← U+5300
965D ←→ U+3013 C7E2 ←← U+FF95 A4E1 ←← U+6237
96BE ←→ U+82C4 C7E3 ←← U+FF6E A4E1 ←← U+6238
9F46 ←→ U+2237 C7E4 ←← U+FF96 A4FC ←← U+72AD
A05F ←→ U+63F8 C7E5 ←← U+FF97 A5E1 ←← U+4E22
C6BF ←→ U+4E36 C7E6 ←← U+FF98 A5DC ←← U+793B
C6C0 ←→ U+4E3F C7E7 ←← U+FF99 A749 ←← U+5151
C6C1 ←→ U+4E85 C7E8 ←← U+FF9A A74F ←← U+522B
C6C2 ←→ U+4EA0 C7E9 ←← U+FF9B A752 ←← U+5220
C6C3 ←→ U+5182 C7EB ←← U+FF9C A76F ←← U+5450
C6C4 ←→ U+5196 C7EE ←← U+FF66 A872 ←← U+79C3
C6C5 ←→ U+51AB C7EF ←← U+FF9D A96B ←← U+59D7
C6C6 ←→ U+52F9 FCD5 ←← U+75D6 A9DF ←← U+629B
C6C7 ←→ U+5338 FCD7 ←← U+75AC AA5C ←← U+6B81
C6C8 ←→ U+5369 FD7A ←← U+8D4D AB62 ←← U+5239
C6C9 ←→ U+53B6 FE40 ←← U+51FC ABDB ←← U+5F66
C6CA ←→ U+590A AC5D ←← U+6805
C6CC ←→ U+5DDB A143 ←← U+FF61 ADB9 ←← U+9963
C6D0 ←→ U+5F50 A147 ←← U+2236 AEAE ←← U+60A6
C6D1 ←→ U+5F61 A14A ←← U+2506 AFF0 ←← U+8346
C6D2 ←→ U+6534 A14A ←← U+2507 B1F7 ←← U+6800
C6E0 ←→ U+3005 A14B ←← U+2508 B2E6 ←← U+8131
C6E1 ←→ U+3006 A14B ←← U+2509 B57C ←← U+7A0E
C6E2 ←→ U+3007 A14C ←← U+2504 B6C0 ←← U+9EC4
A14C ←← U+2505 B6DE ←← U+556C
0022 ←← U+FF9E A155 ←← U+250A B6FE ←← U+5AAA
866A ←← U+949A A155 ←← U+250B B749 ←← U+5F11
8B6E ←← U+5785 A15F ←← U+2312 B759 ←← U+6120
8CE8 ←← U+7F30 A175 ←← U+FF62 B7C5 ←← U+6E29
94FE ←← U+9C87 A176 ←← U+FF63 B85B ←← U+7980
9640 ←← U+94B7 A1B3 ←← U+FFEE B8C0 ←← U+8715
9644 ←← U+9518 A1BD ←← U+FFED B9C7 ←← U+5C1C
96C1 ←← U+8C2B A1F4 ←← U+FFEA BA72 ←← U+6C32
96C7 ←← U+87A8 A1F5 ←← U+FFEC BABD ←← U+7476
9841 ←← U+2776 A1F6 ←← U+FFE9 BBBB ←← U+9065
9842 ←← U+2777 A1F7 ←← U+FFEB BBF2 ←← U+9EBD
9843 ←← U+2778 A1FD ←← U+FFE8 BBFE ←← U+51DB
9844 ←← U+2779 A258 ←← U+FF9F BC41 ←← U+567C
9845 ←← U+277A A271 ←← U+253D BCB5 ←← U+6491
9846 ←← U+277B A271 ←← U+253E BE6C ←← U+9980
9847 ←← U+277C A271 ←← U+253F C352 ←← U+9B49
9848 ←← U+277D A271 ←← U+2540 C962 ←← U+4E2C
9849 ←← U+277E A271 ←← U+2541 C9F8 ←← U+6C3D
984A ←← U+277F A271 ←← U+2542 D0F7 ←← U+5423
C6A1 ←← U+2780 A271 ←← U+2543 DAC6 ←← U+7856
C6A2 ←← U+2781 A271 ←← U+2544 DFA2 ←← U+8136
C6A3 ←← U+2782 A271 ←← U+2545 E0B6 ←← U+94F3
C6A4 ←← U+2783 A271 ←← U+2546 E3A6 ←← U+817D
C6A5 ←← U+2784 A271 ←← U+2547 E6D7 ←← U+7BA7
C6A6 ←← U+2785 A271 ←← U+2548 E75D ←← U+83BC
C6A7 ←← U+2786 A271 ←← U+2549 E7EC ←← U+8D49
C6A8 ←← U+2787 A271 ←← U+254A E952 ←← U+5AF1
C6A9 ←← U+2788 A271 ←← U+254B E96A ←← U+5C99
C6AA ←← U+2789 A272 ←← U+2535 E96F ←← U+5EEA
C6CA ←← U+5902 A272 ←← U+2536 EAD8 ←← U+7F12
C6CA ←← U+6535 A272 ←← U+2537 EAFE ←← U+835B
C6E3 ←← U+FF70 A272 ←← U+2538 EC7B ←← U+9C8B
C77B ←← U+FF67 A272 ←← U+2539 EC7C ←← U+9C90
C77C ←← U+FF71 A272 ←← U+253A ECF5 ←← U+6AA9
C77D ←← U+FF68 A272 ←← U+253B ECF7 ←← U+67FD
C77E ←← U+FF72 A273 ←← U+252D EDDE ←← U+7D77
C7A1 ←← U+FF69 A273 ←← U+252E EE40 ←← U+84E3
C7A2 ←← U+FF73 A273 ←← U+252F EF41 ←← U+7DD4
C7A3 ←← U+FF6A A273 ←← U+2530 EFB1 ←← U+9F0B
C7A4 ←← U+FF74 A273 ←← U+2531 EFEF ←← U+6EE2
C7A5 ←← U+FF6B A273 ←← U+2532 EFF5 ←← U+6F74
C7A6 ←← U+FF75 A273 ←← U+2533 F255 ←← U+6A65
C7A7 ←← U+FF76 A274 ←← U+2525 F258 ←← U+6A7C
C7A9 ←← U+FF77 A274 ←← U+2526 F2A1 ←← U+7934
C7AB ←← U+FF78 A274 ←← U+2527 F3B1 ←← U+998D
C7AD ←← U+FF79 A274 ←← U+2528 F3C7 ←← U+9CAE
C7AF ←← U+FF7A A274 ←← U+2529 F3C8 ←← U+9CB0
C7B1 ←← U+FF7B A274 ←← U+252A F3CB ←← U+9CB2
C7B3 ←← U+FF7C A274 ←← U+252B F458 ←← U+8616
C7B5 ←← U+FF7D A275 ←← U+251D F4A4 ←← U+7A06
C7B7 ←← U+FF7E A275 ←← U+251E F56B ←← U+9CBD
C7B9 ←← U+FF7F A275 ←← U+251F F56E ←← U+9CC6
C7BB ←← U+FF80 A275 ←← U+2520 F576 ←← U+9CC7
C7BD ←← U+FF81 A275 ←← U+2521 F57C ←← U+9E55
C7BF ←← U+FF6F A275 ←← U+2522 F75D ←← U+8E70
C7C0 ←← U+FF82 A275 ←← U+2523 F7AF ←← U+9CD3
C7C2 ←← U+FF83 A27A ←← U+250D F85B ←← U+9C85
C7C4 ←← U+FF84 A27A ←← U+250E F876 ←← U+9EEA
C7C6 ←← U+FF85 A27A ←← U+250F F87E ←← U+9F51
C7C7 ←← U+FF86 A27B ←← U+2511 F8B0 ←← U+6F24
C7C8 ←← U+FF87 A27B ←← U+2512 F8D7 ←← U+9CE2
C7C9 ←← U+FF88 A27B ←← U+2513 F8ED ←← U+816D
C7CA ←← U+FF89 A27C ←← U+2515 F965 ←← U+9F0D
C7CB ←← U+FF8A A27C ←← U+2516 F9C1 ←← U+9562
C7CE ←← U+FF8B A27C ←← U+2517 F9D0 ←← U+6EDF
C7D1 ←← U+FF8C A27D ←← U+2519 FB58 ←← U+67A7
C7D4 ←← U+FF8D A27D ←← U+251A FBB2 ←← U+98DA
C7D7 ←← U+FF8E A27D ←← U+251B FD53 ←← U+9CD8
C7DA ←← U+FF8F A2E4 ←← U+2228 FDBD ←← U+950F
C7DB ←← U+FF90 A34E ←← U+2227 FDD8 ←← U+98A5
C7DC ←← U+FF91 A353 ←← U+220F FDF4 ←← U+9C9E
C7DD ←← U+FF92 A355 ←← U+2211 FDF9 ←← U+9CCA
C7DE ←← U+FF93 A360 ←← U+2208 FE60 ←← U+7ED4

s793016
2003-02-02, 09:59 AM
Mozilla_ChinaSEA_v0.05.zip (http://home.kimo.com.tw/s793016/1/Mozilla_ChinaSEA_v0.05.zip)
==
2003/02/02 - ucvtw.dll/uconv.dll v0.05 產生完畢

※可在 mozilla 中 copy S-JIS 編碼的網頁,然後直接貼到 bbs 上去,
mozilla 會自動幫您轉碼成「Big5 + 中國海字集」... :)

ps:S-JIS 剩 378 碼無對應 ... 一般常用的漢字應該都有對應到了 ...

此版更動:

82A9 ←→ U+5024 A55A ←← U+520B B9F4 ←← U+5E64
91DE ←→ U+2021 A566 ←← U+5918 BA5B ←← U+66C1
925D ←→ U+61D0 A5BB ←← U+5932 BBA1 ←← U+8AAC
9266 ←→ U+5DFB A65E ←← U+56D8 BBAA ←← U+8C8E
92B5 ←→ U+570F A6B2 ←← U+66F5 BBE6 ←← U+9920
92DE ←→ U+7363 A75D ←← U+5451 BC67 ←← U+51A9
92E6 ←→ U+5968 A86D ←← U+7680 BC74 ←← U+53B0
9349 ←→ U+6226 A8AB ←← U+8D71 BCFA ←← U+596C
944D ←→ U+6802 A8C6 ←← U+4E8A BD47 ←← U+75E9
9456 ←→ U+7560 A8CA ←← U+4EB0 BE55 ←← U+92ED
9F4C ←→ U+222C A8E9 ←← U+52B5 BE5C ←← U+95B2
FBBF ←→ U+5056 A9EF ←← U+64E1 BE78 ←← U+9599
FC6B ←→ U+6900 AB5C ←← U+516A BF68 ←← U+66BC
AC64 ←← U+67FB BF75 ←← U+7C14
93DA ←← U+63FA ACB0 ←← U+7232 BF79 ←← U+7C12
95D3 ←← U+7690 AE41 ←← U+559E BFCE ←← U+5050
9BCC ←← U+2283 AE56 ←← U+59EB BFEC ←← U+8FA7
9BCF ←← U+2202 AF64 ←← U+7544 C05A ←← U+983D
C846 ←← U+2282 AF75 ←← U+771E C0A1 ←← U+5694
C852 ←← U+220B AFEF ←← U+8318 C170 ←← U+8068
B079 ←← U+91E1 C2B8 ←← U+7E4D
2220 ←← U+3099 B0B0 ←← U+50DE C2C8 ←← U+85AB
2220 ←← U+309B B0BD ←← U+5078 C2C8 ←← U+85B0
2220 ←← U+FF9E B146 ←← U+51A6 C2ED ←← U+93AD
2D20 ←← U+00AD B156 ←← U+5D15 C343 ←← U+9854
3120 ←← U+00B9 B1D2 ←← U+5553 C36D ←← U+663F
3220 ←← U+00B2 B1DF ←← U+6669 C45F ←← U+5BF3
3320 ←← U+00B3 B2A3 ←← U+7523 C462 ←← U+61F4
5920 ←← U+00DD B3EB ←← U+55A9 C476 ←← U+7AF8
6320 ←← U+00A9 B449 ←← U+51A8 C4D1 ←← U+9EAA
7920 ←← U+00FD B45C ←← U+5ECF C54B ←← U+9421
7C20 ←← U+00A6 B45C ←← U+5ED0 C571 ←← U+5DD3
A145 ←← U+30FB B540 ←← U+6F11 C655 ←← U+5EF0
A177 ←← U+FFE2 B5E9 ←← U+83B5 D14D ←← U+57D3
A1AD ←← U+266F B6BC ←← U+98EE DD54 ←← U+5D8C
A1B3 ←← U+25EF B744 ←← U+5D73 E35A ←← U+7B9A
A1BE ←← U+2207 B756 ←← U+613C E5C0 ←← U+5910
A1CF ←← U+2020 B76B ←← U+63BB EFD9 ←← U+65D9
A258 ←← U+309A B7AE ←← U+6961 F6E3 ←← U+6505
A258 ←← U+309C B7C7 ←← U+51D6 FCCB ←← U+9BF5
A2EA ←← U+266D B8FA ←← U+8EB1 FDE5 ←← U+7AC3
A551 ←← U+4EED