【轉貼】Unicode還給中國人新的文字樂趣



贊助商連結


頁 : [1] 2 3

dannyyeh
2003-04-08, 03:47 PM
Unicode還給中國人新的文字樂趣
2000/05/05
 雖然我不是唸中文系的,但是長期「只准」用13000個Big-5中文字的制約限制,始終令我極為不滿。所以當我把Unicode CJK Unified Ideograghs列印出來的時候,我幾乎感動的快要哭出來了。

 國小的時候軍公教待遇還極差,家中雖然不至於貧苦,但我幾乎沒有什麼玩具,唯一的樂趣就是翻辭典。那本辭典是光復書局出的,挺厚,有不少圖說,對我而言,那本書是我接觸知識的唯一管道。那時候我一邊看圖跟「字」,訓練訓練右腦,然後再看看內文說明,充實充實左腦。看到許多不同的中文字,實在是很有樂趣的事情。那本辭典的下場,是被我那纖細沒啥營養小手活生生翻爛的(數年後,我也對三民主義課本做過同樣的蠢事,只不過那一次我沒學到什麼就是了)。我想我後來會擁有數十本各種不同的字、辭典,絕對與這種童年記憶有關。

 Unicode跟萬惡不赦的Big-5一樣,是一種電腦的文字編碼系統。Big-5有多爛,或許大家沒有感覺,但是已經淡出政治圈的王建火宣、如日當中的陶吉吉和新科行政院秘書長游錫方方土感觸可就深了。相信台灣還有許多8字頭之前出生的人,對於父母替他們取了個「電腦打不出來的字」感到萬分的不悅。其實不是電腦打不出來,是設計Big-5的人程度太差!

 還好,8字頭的小朋友只會將我們這一段當作中文電腦的「黑暗時期」。而他們,則是文藝復興的新一代。

 Unicode跟Big-5不同的地方,在於字表容納的字數。由於Unicode的字數遠遠大於Big-5,所以除了CJK(中日韓)文字外,也把世界上大部分可以被書寫的各種符號列入了。西歐各種怪怪的字母之外,西藏文、阿拉伯文、緬甸文、泰文等全部被收納進來。當然,中文的簡繁體跟日文字也都在一個系統之內。

 只要一個作業系統,就可以顯示所有的文字。軟體只要支援Unicode,也就不再有雙位元系統相衝或是無法使用的問題。同時,也解決了台灣多年來「文字獄」的問題。我想,這在人類文明的長期發展上的功勞,絕不小於那Internet。

 游錫堃真是讓他給賺到了。他除了是「下場」最好的民進黨秘書長之外,也是Unicode的早期受惠者,不用每次上網就看到自己名字被打成游錫方方土或是「游錫 」。現在MS Explorer比較新的版本已經可以看到Unicode了,此外Office 2000與Windows 2000也支援Unicode。除了游錫堃外,陶喆也該高興一下了。雖然被打成陶吉吉好幾年了,但終於可以上網看到陶喆。陶大偉叔叔如果再生的話,小孩的名字不要說是陶喆了,連陶嚞都沒有問題!!

 現在正在翻那有九十幾頁的文字表。那種感覺好像自己又回到了當初還在龍安國小的樣子,每看到一個新字,就有一分新的喜悅。咦,我剛剛說的是「文藝復興」嗎?

(此文中許多文字使用Unicode,大部分Windows + IE 4.0以上的版本可以正常閱讀,Netscape則要6.0版以上才支援)

新聞工作者網路參與者李怡志

贊助商連結


pavo
2003-04-08, 03:59 PM
深有同感。
10多年前,我在軍中擔任文書,那時還沒有電腦化
一切都要手工,遇到要打字的文書時,就動用到中文打字機
你知道那種平台中有5401個鉛字再加上一些罕見字與空格添加自建
總是有一些字明明常見就是無法找到,
如..『糸秀』『女英』..(怪怪為何還找不到??)
我對中文到現在還在學習中,常常看我兒子的國語課本
看看當時與現在寫法與讀法不同的字,我發現還滿多的。
不信你試試去讀現在國小的國文....

wfm6918
2003-04-09, 11:04 AM
最初由 pavo 發表
看看當時與現在寫法與讀法不同的字,我發現還滿多的。
不信你試試去讀現在國小的國文....
還真是沒錯呀!我總覺得中文裡,讀音或是寫法好像都可以跟教材上的不一樣,中國人好像都是差不多,反正看得懂就好了,真要教育下一代,難道要告訴小朋友們,這樣的用法是針對考試用的,其餘的時間你要用.......,這不就很奇怪了嗎?

wfm6918
2003-04-09, 11:04 AM
很多時候明明念法就是錯的,大家就是習慣了,久而久之好像錯的也變成了通用的語法了。

quell
2003-04-09, 11:45 AM
還是打不出我爸的名字...............++

Javen
2003-04-09, 12:46 PM
堃, 喆, 媖, 綉, 這些不是 Unicode 才有的字吧? 是輸入法的問題吧....

~ 是 Unicode 沒錯 ~:corkysm:

琥珀
2003-04-16, 04:40 PM
最近發現(其實也很久了)許多比較重要的網頁,會採用unicode編碼,避免一些文字上的處理問題。最明顯的例子就是微軟的下載中心了,自從改版以後,不論是哪個區域(通常避免使用'國家')都統一改採此編碼,整個頁面看起來,文字還算蠻漂亮的。

中文字(不論是簡體、正體、甚至是日本漢字)都是我們最重要的文化資產,儘管英文是國際通用語言,但是如果我們自己不努力去爭取中文在世界上的地位,恐怕以後就沒中文版Windows可以用了!

說到中文,就想到 Windows Server 2003 的產品,特定版本是沒有中文版的~

flashon
2003-04-20, 06:27 PM
不知道是用哪個字表, 我用U2000.pdf (從unicode官方網站) 裡對照打出來的字都和表上的不一樣. 顯示出來是另一個中文字, 不是我要的字.
另外, 如果都要一邊對表一邊打字, 恐怕輸太慢了, 安裝個鍵盤輸入法什麼的, 應該會有效率又正確.
各位大大, 會用unicode的, 請指點指點, 謝謝!

(可以順便貼在這裡問嗎? 還是應該貼到哪一版...?)

DDSC
2006-02-12, 09:51 PM
我知道"考古"是有點不好的事 :D
但我要找資料,全站只有這一筆,所以就考古了。
UTF16的輸入可見我最新完成的中文UNICODE碼對照手冊 (http://myweb.hinet.net/home1/asccpu/DDSC/DDSC-J-00003.rar)
這是由我之前的這個 (http://myweb.hinet.net/home1/asccpu/DDSC/NEW_UNICODE_LIST.rar) 所延伸出來的,而這些又是由這個最原始的檔 (http://myweb.hinet.net/home1/asccpu/IMG/UNICODE.rar)所創出的。 :D
其實我是要問,有誰知在目前所視窗OS中那些可使用
CJK Unified Ideographs Extension B (也就是UTF32啦)
裝這Global IME 5.02 (http://www.microsoft.com/windows/ie/downloads/recommended/ime/install.mspx) 有用嗎,因為我不想一字一字處理4萬多字的向量圖。 :D

琥珀
2006-02-13, 04:11 PM
作業系統是一個問題。NT 4.0 算是琥珀最不熟悉的系統。雖然同屬 NT 系列,但是功能和 2000 相比,有較大的差距。

Global IME 5.02 不用安裝了。這主要是給 98/ME,並且沒有安裝新版 Office 使用的。不能支援 Ext A/B/C。

中日韩汉字超大字符集(SuperCJK)通用字体支持包 4.0 (http://www.pkucn.com/viewthread.php?tid=165761) 不知道行不行?

受限於字型的規格,目前沒有一套全 unicode 字型。需要多個字型連結起來,在 font linking 的技術下,同時顯示七萬多個漢字。

重新看了一次文章。其實 unicode 並不是只為中國人,或是 CJK 達人著想。



這真的只是少數。就算號稱有七萬個漢字,又能如何?

只要在 unicode 標準有定義的文字,理想狀態下,不管哪個人都能自由利用。文字的處理,可以超越作業系統和軟體的約束。