Mac OS X (10.3&10.4)安裝,設定,使用經驗談 - 第10頁 - PCZONE 討論區

返回   PCZONE 討論區 > ▲ -- 電 腦 軟 體 討 論 區 > -- FreeBSD & Linux 討 論 版


PCZONE 討論區



通知

-- FreeBSD & Linux 討 論 版 因為本站採用 FreeBSD 作業系統,所以自己本身也多學了一些技巧,希望各位在這裡互相討論 Unix 作業系統及程式等相關問題。

會員
回覆: Mac OS X (10.3&10.4)安裝,設定,使用經驗談
我自己試裝了FTP SERVER,
但是(我覺得啦)應是SERVER ADMIN及WORKGROUP了的設定搭不在ㄧ起,
不然我的WEB SERVER及MAIL SERVER幾乎都是直覺式的設定好,
馬上就能使用了,
唯一的FTP在PC上馬上就搞定,
換到MAC上真是一個頭兩個大,
灰心!!

加油,我等您的好消息!

回覆
FLY
boy
Mac OS X (10.3&10.4)安裝,設定,使用經驗談,補充54
Mac OS X (10.3&10.4)安裝,設定,使用經驗談,補充54

一部分"印刷字"專有名詞的中英對照

少爺之前段落有提過,"印刷字"面板視窗內的選項很多很雜,少爺自己也懶得一
個一個去解讀,偶然間找到了這些"印刷字"專有名詞的一部分中英對照資料,居
然是在商業排版軟體的"線上說明文件"分別的中英文版,以及wiki中文版也有一
部分資料。將就著對照吧,少爺還是找不到完整版的"印刷字"面板視窗內的專有
名詞的中英對照資料。嗯~這要怪微軟,怪蘋果,怪adobe,因為這三家廠商都
有出繁中版軟體,卻在售後服務其中一環"線上支援技術文件"這個部份,工作執
行不確實。


參考連結

Panther's Major Text Services Upgrade
http://www.hopelessgeek.com/2003/10/...rvices-upgrade

OpenType - 維基百科,自由的百科全書:
http://zh.wikipedia.org/w/index.php?...&variant=zh-tw

InDesign CS3:

http://help.adobe.com/zh_TW/InDesign...cb3f-6e1e.html

http://livedocs.adobe.com/en_US/InDe...cb3f-6e1e.html

兩個連結,中英對照,找"套用OpenType 字體屬性"這個子項目。


Adobe - Fonts : OpenType:

http://www.adobe.com/type/opentype/

http://partners.adobe.com/public/dev...index_tag.html

http://partners.adobe.com/public/dev...ndex_tag3.html

我可以說adobe公司"應翻譯而未翻譯"嗎?
回覆
FLY
boy
Mac OS X (10.3&10.4)安裝,設定,使用經驗談,補充55-1
Mac OS X (10.3&10.4)安裝,設定,使用經驗談,補充55-1

MacOSX10.4.11內建的與第三方的ftp server軟體,ftp客戶端軟體,再加上IP分
享器的搭配設定

因為臨時且即時的需要,必須啟動ftp server的服務,整個MacOSX圖形介面中,
少爺找到的唯一一個相關選項為 /系統偏好設定/共享/服務/FTP連線,少爺google
之後,發現就像apache一樣,系統內建的ftp server也就只是一個純文字指令行
的程式,操作者必須自己去搞清楚主程式與參數設定檔的相關位置與檔名,及如
何修改參數設定檔。少爺查詢了官方網站,在少爺的能力範圍內查到的,對少爺
有用的資訊是"零",而系統內建的說明文件,少爺查詢的結果,老話一句,對少
爺來說,那些文件內容全都是可有可無的"廢話",少爺還是得靠土法煉鋼的方式
把系統內建的ftp server主程式與參數設定檔名稱,路徑,等等相關資訊一個一
個挖出來,查出來。
先來尋找系統內建的ftp server相關資訊吧,先做一個簡單的提示,在unix-like
系統下,跟網路通訊中的伺服器與客戶端有關的軟體,通常都會被分成兩種檔名
來看,例如本段落中的例子"ftp",你的unix-like系統會有一個提供ftp伺服器服
務的軟體,它的主程式檔名可能是"ftpd",而你的unix-like系統也會有一個ftp
客戶端軟體,它的主程式檔名可能是"ftp"。以此類推,提供某種網路通訊服務的
軟體,它會有兩隻個別獨立的程式。提供伺服器服務的軟體,通常會在主程式檔
名的尾巴加個"d"字母。
接下來就要找系統內建的ftp相關軟體了,因為少爺在apple官方網站,找不到任
何官方文件,有說明MacOSX系統到底內建了哪些ftp相關程式,所以少耶想到的唯
一方法就是,用被最佳化設定過的spotlight與easyfind這兩個軟體,來搜尋系統
內會包含有ftp關鍵字的所有檔案,再一個一個踢掉不相關的,最後少爺整理出以
下的結果。

TFTP

採用UDP通訊協定的小型ftp程式,主要常被用來傳輸電子設備的"韌體"。相關程
式與設定檔有:

/usr/bin/tftp 這是客戶貒程式
/usr/libexec/tftpd 這是伺服器端程式
/private/tftpboot/ 少爺不懂,請看參考連結
/系統/資源庫/launchDaemons/tftp.plist 少爺不懂,請看參考連結

manual pages有tftp.1與tftpd.8可以查。


SFTP

少爺不懂,請看參考連結

/usr/bin/sftp 這是客戶貒程式
/usr/libexec/sftp-server 這是伺服器端程式

manual pages有sftp.1與sftp-server.8可以查。


FTP

/usr/bin/ftp 這是客戶貒程式
/usr/libexec/ftpd 這是伺服器端程式,少爺猜,圖形介面的FTP連線選項,就是啟動這個。
/private/etc/ftpusers 純文字檔參數設定檔
/private/etc/pam.d/ftpd 純文字檔參數設定檔
/private/var/log/ftp.log 操作流程紀錄檔
/系統/資源酷/launchDaemons/ftp.plist 參數設定檔

manual pages有ftp.1,ftp.n,ftpd.8,ftpd.n,ftpusers.5,ftp.conf.5可以
查。ftpd.8的原始檔案是tnftpd.8。


MacOSX10.4.11"FTP連線"服務點選啟動後,視窗下方會出現一段提示說明文字:

其他人可於ftp://192.168.1.xxx/存取您的電腦,或由Finder的"前往"選單下選
擇"網路"以瀏覽"主機的名稱"。

這一段提示說明文字實在有夠小,不仔細看根本不會注意到。在什麼都不改的預
設值之下,若在Safari直接輸入"ftp://192.168.1.XXX",會跳出需輸入名稱密碼
的視窗(ftp檔案系統認證),名稱欄位可以是你的系統登入帳號名稱,若之前"沒
有"為帳號設定密碼,則密碼欄位可以跳過,登入後會轉換成以Finder掛載了一個
ftp目錄的形式呈現,在Finder內瀏覽ftp目錄,而根目錄就是你的系統登入帳號
的家目錄。少爺再試試看用專門的ftp client圖形介面軟體,少爺臨時找到的免
費軟體為cyberduck,結果在密碼欄位輸入anonymous或不輸入任何字元在都無法
通行,試了另一個商用圖形介面軟體fetch,反而不輸入密碼就可以登入。
少爺再試試看,同一個網段的區域網路內,另一台MsWindows PC電腦用IE來連線
,登入身份的使用者名稱輸入MacOSX的使用者帳號名稱,密碼留空白,於是會登
入到使用者帳號名稱的家目錄下。使用ftp專用軟體filezilla來登入,使用者名
稱一樣也是MacOSX的使用者帳號名稱,密碼欄為空白,登入的預設根目錄也是MacOSX
的使用者帳號家目錄,且可以經由介面操作,往上延伸到MacOSX主機的系統根目
錄。

由以上的預設值試用,少爺規劃了接下來要修改的參數的方向,首先就是要設定
成不同的帳號密碼登入,都會在某一個固定好的根目錄下,登入的帳號不能再移
動到更上層目錄。

接下來就是要搞清楚ftpd的相關程式路徑,程式名稱與參數設定檔的資訊了。在
/系統偏好設定/共享/服務/FTP連線 項目的勾選與否,就會更改到
/系統/資源酷/launchDaemons/ftp.plist 的其中一個項目"Disabled"的設定,
少爺再看其他的ftp.plist內子項目的設定值,有一個是program,字串值為
/usr/libexec/ftpd,少爺猜想這就是在標示系統的ftp server主程式的路徑位置
了,剩下的參數少爺看不太懂。

少爺在查詢ftpd的manual pages的時候,最後 一個"files"段落,內容如下:

/etc/ftpchroot List of normal users whose root directory should be changed via chroot(2).
/etc/ftpd.conf Configure file conversions and other settings.
/etc/ftpusers List of unwelcome/restricted users.
/etc/ftpwelcome Welcome notice before login.
/etc/motd Welcome notice after login.
/etc/nologin If it exists, displayed and access is refused.
/var/run/ftpd.pids-CLASS
State file of logged-in processes for the tnftpd class `CLASS'.
/var/run/utmp List of logged-in users on the system.
/var/log/wtmp Login history database.

少爺發現系統內預設根本沒有/etc/ftpchroot,/etc/ftpd.conf,/etc/ftpusers,
/etc/ftpwelcome,/etc/motd這些檔案的存在。系統內建的ftpd.conf說明文件
寫說ftpd.conf有範例檔存在於某個目錄下,而少爺翻找不到,結果google之後
在apple官網的原始碼列表路徑中找到範例檔,只能說apple開發團隊在文件彙整
這部份不確實,內建說明文件寫說已經內建了某個檔案在某個子目錄中,結果,
實際上並沒有。
接下來,少爺猜想應該就是要湊齊並設定好以下這些檔案吧!?

/private/etc/ftpusers,
/private/etc/ftpchroot,
/private/etc/ftpd.conf,
/private/etc/ftpwelcome,
/private/etc/motd,
/private/etc/nologin,
/private/etc/pam.d/ftpd,
/系統/資源庫/launchDaemons/ftp.plist


少爺有預感會拖很久~所以本段落未完待續~參考連結等本段落完結後再補上~
那些manual pages對少爺來說真的很~天書~
回覆
FLY
boy
Mac OS X (10.3&10.4)安裝,設定,使用經驗談,補充56-1
Mac OS X (10.3&10.4)安裝,設定,使用經驗談,補充56-1

XMeeting 與NetMeeting的通訊設定經驗分享

寫在前頭:
ftp server 設定的段落還是沒搞定,繼續拖倒是最近摸索出了XMeeting與NetMeeting
的設定,所以就先來寫視訊會議軟體的設定吧。

以前的段落曾經有提過MacOSX平台上,即時通訊軟體的一些使用與設定經驗。對
少爺來說即時通訊軟體只要能同時包含有即時的輸入繁體中文文字訊息、檔案即
時傳輸、視訊傳輸、語音傳輸、一定字元數量的離線留言,五個基本功能即可,
其他的花俏功能,就暫時可有可無了,目前網路世界,最大宗的即時通訊軟體還
是微軟的msn messenger,然而微軟的msn messenger(現已改名為windows live messenger)
for MacOSX的版本"msn for mac"到目前為止的最新版偏偏就是不包含視訊與語音
的功能,少爺覺得很奇怪,以現在的軟體技術,沒道理做不到,後來想想,應該
也是公司政策吧,如果都做起來了,MsWindows平台使用者大概又流失"很多"了。
少爺現在所想像的一個情境是,在不另外申請一個別的品牌的即時通訊軟體的帳
號的條件前提下,要如何彌補msn for mac所缺乏的視訊與語音功能的不足,讓
MsWindows與MacOSX使用者能夠同時做到少爺所需的五項即時通訊軟體功能。少
爺查詢了許多資訊後,把腦筋動到了MsWindows XP所內建的NetMeeting頭上,
(位在C:\Program Files\NetMeeting\conf.exe)NetMeeting是微軟在大力推廣
msn messeger之前所推廣的一個視訊會議軟體解決方案,一樣有個目錄伺服器,
使用者可以設定一組免費的帳號密碼,透過,目錄伺服器的帳號密碼認證與其他
網友做視訊語音文字傳檔的即時通訊交流,而ip位址對應的問題,就像windows live messenger
一樣交給目錄伺服器與NetMeeting自動轉換對應解決。然而 NetMeeting也有提供
另一種通訊方式,就是直接呼叫對方的"IP位址",少爺就是要使用直接呼叫對方
的"IP位址" 這個功能。在MacOSX平台上,有一款XMeeting,它的功能特色與採用
的通訊協定就跟NetMeeting同類型。所以少爺打算採用XMeeting與NetMeeting的
通訊,來補足msn for mac所缺乏的視訊與語音的部份。
少爺所預想的通訊情境是,兩邊都是所謂的家庭用戶,一邊是MacOSX.4.11的平台
安裝了msn for mac以及XMeeting,另一邊則是MsWindows xp sp3的平台,安裝了
windows live messenger與NetMeeting,透過這兩邊的軟體,來同時達到少爺所
需要的五種通訊功能。少爺預想的家用網路硬體配置情境,還有可能兩邊都是將
單一上網主機,直接連線到寬頻數據機,然後上網主機會從寬頻數據機取得一個
所謂的公用ip,雙方的其中一人只要將對方的公用ip直接填入,要呼叫或撥打的
視窗輸入欄位內即可。第二個情境是,可能雙方的家中已經不只一台上網電腦主
機,所以可能會在寬頻數據機之後,再接一台所謂的ip分享器,才再接上網主機
,此時上網主機從ip分享器取得的ip不再是所謂的公用ip,而是所謂的私有ip,
在廣域網路的通訊環境中這個私有ip拿來撥打或呼叫就無效了。第三種情境,則
是一邊主機搭配公用ip上網,另一邊則搭配私有ip上網。所以少爺必須搞清楚整
個流程與設定,會遇到的問題以及要調整的參數設定值有哪些。最後讓第二與三
個情境可以順利的使用到五種通訊功能。先來把NetMeeting的基本設定跑一輪吧
!主程式的位置在C:\Program Files\NetMeeting\conf.exe,因為只要使用NetMeeting
呼叫ip的功能,所以有關目錄伺服器的部份就都關閉或著不去設定它了,微軟網
站官方的NetMeeting目錄伺服器,現在也因為推廣windows live messenger的關
係而關閉。應該還是有些第三方的目錄伺服器在運作,要google找找了。
一開始當然webcam與耳機麥可風等等視訊語音設備要安裝好並且確實安裝設備驅
動程式。在NetMeeting\檢視 項目中撥號盤項目可以取消勾選以切換成視訊畫面
的顯示空間,NetMeeting\工具\選項\一般 我的目錄資訊中的五個欄位分別是姓
氏、名字、電子郵件地址、位置、註解,隨便填寫都可以,但email請按照標準格
式,讓另一個通訊方能夠容易辨識這些資訊即可。然後勾選"不要將我的名字列入
目錄中",取消勾選"在NetMeeting啟動時登入目錄伺服器",寬頻設定選取"區域
網路"。安全性\打進來的呼叫與播出去的呼叫都取消勾選,視訊則依個人頻寬狀
況來選擇,少爺都選最大最好的選項。

寫到這邊先暫停了,因為~少爺的同學朋友們沒空陪少爺做連線測試(非常的花
時間)~少爺沒辦法整理出自己想要的結果,跟前一篇FTP Server一樣,又是寫
一半了~唉~
快兩個月沒有更新~點閱率還會增加耶!!!就是沒有回應~
回覆
FLY
boy
Mac OS X (10.3&10.4)安裝,設定,使用經驗談,補充57
Mac OS X (10.3&10.4)安裝,設定,使用經驗談,補充57

不完整的漢字處理配套經驗分享

少爺一直有個想法,整合出一個安裝、設定、與操作的流程,讓家用的中文資訊
處理系統,能夠輕易的輸入、顯示、編排、與列印輸出中華民國教育部及中華民
國戶政事務所,所承認並列管的近十萬個漢字。少爺以前寫的段落,曾經有提過
片段的資訊,這次再嘗試看看,能整合到什麼樣的程度,到底可以處理到多少漢
字?少爺最後還是發現一些瓶頸,以少爺目前的能力解決不了,所以這次的標題
加上了"不完整"。目前的操作環境為PowerMAC G4,全新安裝的MacOSX.4.11,系
統安全性更新安裝到2008.09月份,系統實體記憶體為1GB。文書處理軟體安裝有
NeoOffice 2.2.5 patch 1,OOo_2.4.1rc2_20080614_MacOSXPowerPC_X11_install_zh-TW
,以及進階文字編輯器TextWrangler_2.3。

第一步就是把所有能找到可以支援這近十萬漢字的中文字型檔湊出來,在此以包
含的字元數量越大越好的字形為蒐集依據,而不管字型樣式種類,湊到十萬字當
然不可能,找到多少算多少了。
其實少爺在以前寫的段落,都有提過相關中文字型了,湊齊它們,這裡再大概列
出幾個重要的字型檔。首先就是以前提過的全字庫的六個字型檔。還有內建於
MsWindows Vista的兩個一組的新細明體、微軟正黑體、微軟雅黑體(微軟好像有
將正黑、雅黑另外設計給MsWindows XP的版本在官網供下載,看官們請自行再上
微軟官網查詢)。還有文泉驛正黑體,HAN NOM高解析度版本。
少爺目前找到的就是本篇連載所提過的所有字型,如果看官們還有找到什麼可靠
來源的大字集字型檔,也給少爺一些訊息吧。接下來就是字型檔與Unicode編碼的
對應與比較。

MacOSX.4版系統只有支援到Unicode 4,理所當然系統內建的字元面板功能也都只
有到Unicode 4的資料量,沒有因為更新到MacOSX.4.11而跟著升級到Unicode 5.0
版,少爺嘗試尋找字元面板的替代軟體,好不容易找到唯一一款能支援到Unicode
5.0以上版本的PopChar X,結果其試用版是功能割醃版,而不是類似於30天全功
能試用版,結論是,少爺想在MacOSX平台上執行類似於MsWindows平台上免費的
BabelMap(已經支援到Unicode5.1)的字元管理及挑選使用的操作,目前是"無解"
。少爺只好參考既有文件來推測與拼湊了。
先查詢Unicode官方網站有關目前最新版的Unicode5.1的資料,少爺抓出跟漢字有
關的所有分類為:

CJK Compatibility - 中日韓相容字元 - 共256字元
字元全滿字型範例:全字庫正楷體 TW-Kai-95_1_4.ttf
裏頭所包含的字元種類像是:1~31日、1~24点、mA、GHz、株式會社等等。英文、
日文度量單位縮寫字元,日文、簡體漢字縮寫字元。

CJK Compatibility Forms - 中日韓相容格式 - 共32字元
字元全滿字型範例:文泉驛正黑 wqy-zenhei.ttf
裏頭所包含的字元種類像是:給漢字直行文書版面使用(由上而下,由右而左使
用的"括號"、書名號、標點符號等)為主,漢字橫行為輔。

CJK Compatibility Ideographs - 中日韓相容表意文字 - 共467字元
字元全滿字型範例:文泉驛正黑 wqy-zenhei.ttf
裏頭所包含的字元種類像是:少爺"猜測"是中日韓都認可通用,筆畫數與文字意
義都一樣的象形漢字(有描述錯誤請指正,並附上參考資料來源)。

CJK Compatibility Ideographs Supplement - 中日韓相容表意文字補充 - 共542字元
字元全滿字型範例:HAN NOM B.ttf
裏頭所包含的字元種類像是:同上

CJK Radicals Supplement - 中日韓部首補充 - 共115字元
字元全滿字型範例:全字庫正楷體 TW-Kai-95_1_4.ttf
裏頭所包含的字元種類像是:一些字根

CJK Strokes - 中日韓筆畫部件 - 共36字元
字元全滿字型範例:文泉驛正黑 wqy-zenhei.ttf
裏頭所包含的字元種類像是:一些字根

CJK Symbols and Punctuation - 中日韓符號和標點 - 共64字元
字元全滿字型範例:全字庫正楷體 TW-Kai-95_1_4.ttf

CJK Unified Ideographs - 中日韓統一表意文字 - 共20932字元
字元全滿字型範例:文泉驛正黑 wqy-zenhei.ttf
裏頭所包含的字元種類像是:中文象形漢字

CJK Unified Ideographs Extension A - 中日韓統一表意文字擴充A - 共6582字元
字元全滿字型範例:新細明體 mingliu.ttc (MsWindows Vista版本)
裏頭所包含的字元種類像是:中文象形漢字 擴充A

CJK Unified Ideographs Extension B - 中日韓統一表意文字擴充B - 共42711字元
字元全滿字型範例:新細明體-ExtB (MsWindows Vista版本)
裏頭所包含的字元種類像是:中文象形漢字 擴充B

Kanbun - 漢文標註號(漢字批註) - 共16字元
字元全滿字型範例:全字庫正楷體
裏頭所包含的字元種類像是:一二三四上中下甲乙丙丁天地人。整個字元位置偏
向字元方塊空間中的左上角,或許可以把它當成中國式的批註符號吧?漢文標註
號(漢字批註)這個詞彙解釋請去問國文老師。

Kangxi Radicals - 康熙字典部首 - 共214字元
字元全滿字型範例:uming.ttc
就是古代康熙字典所分類的漢字部首

Supplementary Private Area-A - 補充專用區-A
這是一個私人造字存放區,可供暫存的空間很大。全字庫正楷體 PLUS(TW-Kai-Plus-96_1_3.ttf)
全字庫正宋體 PLUS(TW-Sung-Plus-96_1_3.ttf)裏頭的字元所對應的碼位,就是
在Supplementary Private Area-A這個分類中,裏頭的某些部分區塊的碼位。既
然這是暫放的,就表示以後的某一天,如果Unicode有再更新版本的話,如果可能
,這TW-Kai-Plus-96_1_3.ttf或TW-Sung-Plus-96_1_3.ttf所包含的一萬四千多個
漢字字元,或許就會被分類到正式的CJK系列新分類之中,但這一天是什麼時候,
天知道!

以前的段落曾經提過,全字庫的六個字型檔如果直接匯入MacOSX的字體簿中的話
,可能會有些問題,一些第三方的文書處理軟體也無法直接掌握這六個字型檔,
因為這六個字型檔的"檔頭資訊"不完全。少爺必須想辦法將這六個字型檔的檔頭
資訊做一些修改再儲存,以方便MacOSX系統與應用軟體可以完全掌握這六個字型
檔。少爺安裝了 FontForge_macX.4_py2.3-20080927.pkg這個目前最新版的自由
軟體,啟動正常。以修改TW-Kai-Ext-B.ttf為範例,結果在主功能表/element/FONT INFO/os2/charsets/MS CODE PAGE
這個選項中,增加了幾個項目後,點選"OK"儲存時,FontForge就給它當掉了。系
統隨後出現的錯誤報告,那好幾頁字體極小又密密麻麻的代號與編碼,少爺完全
看不懂,完全沒有看到任何一般性的錯誤報告敘述句。少爺想說自由軟體搞不定
,只好暫時求助於商業軟體的試用版了,網路上最容易找到的是FONTLAB 的產品
,可是軟體的發行日期是MacOSX.3的年代,沒再更新了,少爺抓下來試用,這個
試用版的限制果然就是留一手,只能轉出一定數量百分比的字元,不能全部轉出
。結果整個在MacOSX平台上的字型檔檔頭資訊修改方案,就是"無解"。少爺很失
望,百分之百在MacOSX平台上是解決問題的方法都沒有了。
這也難怪MacOSX在台灣是小眾,少爺只是想改個字型檔檔頭資訊而已,都搞不定
,沒有繁體中文版軟體可用就算了,正常操作軟體還會當掉。沒辦法啦,只好回
到MsWindows平台了,少爺輕易的找到了一個字型檔製作軟體High-Logic/FontCreator
,這款軟體是30天全功能試用版,剛好符合少爺的需求,可以靠這款軟體來修改
全字庫六個字型檔的詳細檔頭資訊,接下來看看要改些什麼吧。

就以FontCreator開啟TW-Kai-Ext-B.ttf為範例,點選主功能表/Format/Naming
將Platform欄位中每一個項目都點選查詢看看,少爺發現,在Microsoft Unicode BMP Only
的Language子項目Chinese-Taiwan內,Include font family name name與
Include full font name這兩個欄位內容都一致為"全字庫正楷體 Ext-B"。以此
類推,少爺發現其他的Platform欄位Language子項目English內,Include full font name
的欄位內容則都是"YU",查詢了六個字型檔後,發現造成MacOSX系統與應用軟體
辨識錯誤的原因之一,就是資訊名稱都是"YU"。於是少爺將"每一個"(有資訊內容
的Platform 欄位)查到的Include font family name name欄位內容字樣,全部都
複製貼上到,其下方的Include full font name欄位內,把原先的YU字樣蓋掉,
點選OK,儲存。

再來點選主功能表/Format/Settings,選擇Ranges標籤,點選Code Page Character Ranges
項目中的Edit按鈕,出現Code Page Range Settings選項視窗,將其中的:
Chinese:Simplified chars--PRC and Singapore(936),
Chinese:Traditional chars--Taiwan and Hong Kong(950)這兩個選項勾選,
點選OK,OK儲存。
最後,點選主功能表/File/Save就將檔頭資訊寫進字型檔內了。

既然已經在MsWindows平台,如何看出檔案資訊差異呢?可以安裝一款微軟發行
的Font properties extension version 2.30小程式,以右鍵彈出式功能表點選
字型檔時,會出現字型檔詳細資訊標籤,在檔案內容視窗中,詳看每一個資訊欄
位,比較修改前與修改後的差異吧。接下來就是將每一個字型檔,輪流都照以上
的方法修改一次。
提一個額外的,少爺測試用的MsWindows PC的主記憶體加到了4GB,可是MsWindows XP PRO SP3
只能抓到3.4GB,剩下的600MB少爺做成了RAMDISK在用,FontCreator修改字型檔
檔頭資訊時,想說至少還有2GB的記憶體可以用,就乾脆一次開三個字型檔,開完
後發現,至少還有1.2GB的記憶體空間空著,這樣可以一次改完一次很快的輪流儲
存,而不用開一個,改一個,存檔,再開一個。少爺產生了這樣一個求快速的想
法。結果在存檔時,FontCreator居然出現了對話框,提示"OUT OF MEMORY"訊息
字樣,少爺覺得一整個遜掉了,明明工作管理員顯示的記憶體還剩1.2GB左右,怎
麼還會有記憶體不足的警示訊息?少爺才不管它的軟體技術原因,少爺只知道,
這是一個2008年軟體開發商都還在支援的系統與應用軟體不應該發生的問題。
最後還是只好乖乖的一次開啟,編輯一個檔案了。
少爺將字型檔都編輯完後,匯入到MacOSX的字體簿中,字型資訊正常顯示出來了
,NeoOffice 2.2.5 patch 1,OOo_2.4.1rc2_20080614_MacOSXPowerPC_X11_install_zh-TW
也都可以正常抓取了。

少爺再提幾個後來發現的字型檔(雖然有些都是很舊版的了)。在MsWindows平台
如果安裝了MS Office系列,系統中應該會多出一個Arial Unicode MS字型,這
是一個嘗試在字元種類數量上包山包海的字型,已經很久沒有出新版了,看了WIKI
,好像還是有些BUG在這個字型中的樣子。當然也有其他品牌類似概念的字型檔
,少爺找到的有:
ics5.ttf(來自香港);
GRF Chinese Font(來自香港);
Bitstream Cyberbit Cyberbit.ttf Cyberbit.ZIP,
Bitstream CyberCJK Cybercjk.ttf CyberCJK.ZIP,好像是當年隨附於netscape
軟體的子套件;
LastResort.ttf Unicode官方出品,這個比較特別,包含字元種類數量非常的大
,Unicode子分類區塊有150多個,但其中"並不是"正式的字元,而是代表該Unicode
子分類區塊的標籤圖示,也就是說,如果使用BabelMap,這類軟體來瀏覽這個字
型內的字元,會發現滿滿的標籤圖示;
UnicodeBMPFallback51.ttf Unicode子分類區塊只有BMP範圍,功能概念上跟LastResort.ttf
一樣,但只有包含Basic Multilingual plane(plane 0)的範圍,而且圖示是用碼
位數字樣式來呈現。

字型檔有了,Unicode5.1版的CJK分類規格文件有了,但就是沒有支援Unicode5.1
的字元對應軟體,少爺想到了一個替代方法,少爺以前寫的段落曾經提過的cnsphone.cin
檔案(目前的檔案日期為2006.09.06 期待能發行更新版),這是一個進階電腦玩家
跟政府單位全字庫申請了許多文件後,所編製的注音與漢字對照表,這個cnsphone.cin
純文字檔採用UTF-8編碼,少爺使用功能較強的純文字編輯器TextWrangler_2.3來
開啟這的檔案,少爺發現內含約九萬七千多行的對照表中,當然有所謂的重複字
元,也就是所謂的破音字,所以總字數,總會大概扣個幾千字吧,在使用TextWrangler
開啟cnsphone.cin之前,先對TextWrangler做好一些編碼與顯示字型的相關設定
,在TextWrangler/Preferences的項目中,Application/list display font:,
少爺改成13pt,讓程式介面字體大一些,editor defaults/defaults font:,這
裡是編輯區所採用的字型檔,少爺選用TW-Kai-Plus-96_1_3.ttf,Text encodings/
點選 Enable all;editor defaults/defaults font這個設定看起來就像是整個
內文編輯區同時只能使用一個字型檔。少爺在MsWindows平台使用過BabelPad這個
免費的進階文字編輯器,這個文字編輯器可讓一個編輯區內的不同Unicode子分類
的文字同時對應不同的字型檔,少爺一直再找類似BabelPad的軟體for MacOSX平
台的,到目前為止都找不到,所以"沒辦法"。少爺測試之後發現,在TextWrangler
如果Application/ list display font選用"全字庫正楷體"的話,到時候開啟cnsphone.cin
還是會有很多方塊字,如果改選用"全字庫正楷體 PLUS(TW-Kai-Plus-96_1_3.ttf)"
則文字編輯區內其他TW-Kai-Plus-96_1_3.ttf所不支援的文字,會自行挑一個字
型檔來搭配,可是這就變成了少爺沒有自行選擇對應字型檔的權利了。在TextWrangler
內,少爺把cnsphone.cin將近九萬7千多行,花了些時間快速了瀏覽一遍,乍看之
下,居然"沒有"瞄到方塊字,看樣子有機會了。

接下來就是整合中文輸入的環境,少爺使用的輸入來源有兩個,分別是開放香草
輸入法0.8(開放香草輸入法與cnsphone.cin的整合過程在以前的段落已經寫過了
,不再重複)與系統內建的"字元面板"。這裡使用 NeoOffice 2.2.5 patch 1,
OOo_2.4.1rc2_20080614_MacOSXPowerPC_X11_install_zh-TW這兩個免費的文書套
裝軟體版本,來當作測試的範例平台,先試試字元面板,開啟NeoOffice 2.2.5 patch 1
,開啟字元面板,選擇"編碼表/Unicode"這個子項目,以"標題"為排序查詢依據,
與上面的段落所列的CJK系列比對之後,少爺發現缺少了CJK Strokes這個子分類
,CJK Strokes的碼位範圍是31C0~31EF,少爺拖拉字元面板視窗中間,字元與碼
位大列表的卷軸,尋找31C0~31EF這個區域,還真的找到了,CJK Strokes的字根
字樣有出現,而且字元面板下方區塊也有多款字型可供選擇,對著中間大列表中
的字元點選兩下,該字元就會進入NeoOffice Writer的編輯區了(NeoOffice Writer
的對應字型也要先選好)。

接下來重點來了,少爺選取了CJK Unified Ideographs Extension B(蘋果繁體中
文翻譯:CJK統一示意文字 Ext.B(漢語延伸B))這個分類,任選其中連續的幾個字
元複製到NeoOffice Writer中,結果產生跳格或重疊的現象,切換了好幾種有包
含CJK統一示意文字 Ext.B 字元的字型,結果都是一樣情況,先擺著吧,測試另
一個情況。
少爺選取了Supplementary Private Area-A(蘋果繁體中文翻譯:Supp.專用區域-A)
這個 Unicode子分類區塊,它的碼位範圍是F0000~FFFFF,在字元面板的名稱列表
中有這個分類,可是在字元面板中間的字元大列表中,卻沒有延伸到這個區塊範
圍,少爺無法在編碼表/Unicode的顯示模式下,去找到並挑選位在Supp.專用區域-A
內的字元,只好換一種模式選擇/字形/字形庫/字體:TW-Kai-Plus。結果字元面板
顯示的碼位排序也不是依規Unicode的F0000~FFFFF排序法,而是一般的10進位排
序,這樣對少爺來說,要做跨平台的字元編碼對照,就很頭痛了,很不方便。還
好少爺有注意到,點選某個字元,不動滑鼠,過3~4秒後,會出現一個黃底浮動視
窗,裡頭有列出Unicode的F0000~FFFFF排序法碼位,查是可以查到了,可是沒有
直接顯示在字元面板上,查詢起來還是非常不方便阿。少爺先挑好幾個連續碼位
的TW-Kai-Plus內的漢字,這幾字在MsWindows平台的BabelMap也查到了,點選兩
下陸續輸入到NeoOffice Writer中,NeoOffice Writer有事先設定好顯示TW-Kai-Plus
字型,結果少爺發現這些字元也還是發生跳格或重疊的現象。
少爺開始嘗試各種可能的關鍵字來排列組合去google,包括NeoOffice,Supplementary Private Area-A
,surrogate等等,還有很多很多少爺現階段擁有的知識所能想到的相關關鍵詞,
結論是"無解"。少爺的英文程度不怎樣,所以沒考慮在英文論壇發問這個方式,
少爺連中文版都搞不定了,還問英文問題哩。

少爺再試著將字元面板內 CJK統一示意文字 Ext.B 與 Supp.專用區域-A 的字元
點選進入TextWrangler,則一切順暢,甚至連文字編輯.app都沒有問題。

少爺由此判定,這是第三方應用軟體本身支援度的問題,真的是"無解"了,原來
NeoOffice對Unicode的支援度這麼差阿,Unicode plane2(含plane2)以後的編碼
區塊就不支援了。
少爺目前確定的一點是,如果只是純文字編輯的話,在TextWrangler環境中,Unicode5.1
所包含的正規分類,所有表意漢字,再加上Supp.專用區域-A 全字庫正楷體plus
,就可以輸入、顯示、簡單編排、輸出列印八萬七千多漢字字元,這可是一般的
家用單機環境,而不是什麼公司行號或公家機關的大系統。

接下來試試看開放香草輸入法(配合"中標注音"(cnsphone.cin))在NeoOffice Writer
、TextWrangler、文字編輯.app的輸入情境,跟字元面板會遇到的完全一樣,只
要那個字的來源是CJK統一示意文字 Ext.B 與Supp.專用區域-A,就是不行。那意
思不就是說,即使版本到了NeoOffice 2.2.5 patch 1,還是只支援到Unicode BMP
範圍的程度真的很遜耶~還好這不是商業附費軟體,只是贊助軟體。

第二個測試的文書軟體是OOo_2.4.1rc2_20080614_MacOSXPowerPC_X11_install_zh-TW
,也就是官方發行的OpenOffice for MAC(X11),少爺以前有提過了,像是系統
內建的漢音,開放香草輸入法等等,處理亞洲字元的標準AQUA介面輸入法軟體,
是無法 直接立即性的將字元輸入到APPLE X11介面的軟體中的(想當然爾字元面
板也無法直接將字元傳給OpenOffice for MAC(X11))。少爺採用的做法是先將
要打的文字片段,全部輸入到像是TextWrangler之類的純文字編輯器中,再用複
製貼上的方式,將文字貼到OpenOffice for MAC (X11)內,這樣的做法下,少爺
發現 CJK統一示意文字 Ext.B 與Supp.專用區域-A 全都出的來,可是不能直接
立即性的輸入,還是很不方便阿~沒效率。

所以少爺一開始就提了,這篇是所謂"不完整"的經驗分享,因為AQUA原生介面的
的NeoOffice居然還不支援Unicode plane2及以後區塊。支援Unicode plane2及
以後區塊的OpenOffice for MAC(X11),非系統原生介面,使得容易安裝與操作
的中文輸入法軟體無法支援。真是遺憾阿~這也是為什麼蘋果電腦系統在台灣很
小眾的原因。

到現在 FTP SERVER 與 XMeeting 還是沒搞定~唉~

參考連結

Code Charts - Scripts:
http://www.unicode.org/charts/index.html

Vietnamese Unicode FAQs
hannomH.zip 內含HAN NOM A.ttf、HAN NOM B.ttf
http://vietunicode.sourceforge.net/
http://sourceforge.net/project/showf...kage_id=172061

北大中文论坛 www.pkucn.com » 中文信息处理 » 全字庫楷體(含ExtB)
http://www.pkucn.com/viewthread.php?...extra=page%3D1
這是少爺採用FontCreator修改字型檔的資訊參考來源

Font properties extension, version 2.30
http://www.microsoft.com/typography/...roperty21.mspx

Arial Unicode MS
http://zh.wikipedia.org/w/index.php?...&variant=zh-tw

ICS5
http://cg.scs.carleton.ca/~luc/china.html
http://www.chant.org/info/download/ics5.ttf

GRF Chinese Font
http://cerg1.ugc.edu.hk/cergprod/sta...nload_font.jsp

Bitstream Cyberbit Cyberbit.ttf Cyberbit.ZIP
Bitstream CyberCJK Cybercjk.ttf CyberCJK.ZIP
http://http.netscape.com.edgesuite.n...fonts/windows/
http://en.wikipedia.org/wiki/Bitstream_Cyberbit

LastResort.ttf
http://unicode.org/policies/lastresortfont_eula.html

UnicodeBMPFallback51.ttf
http://scripts.sil.org/cms/scripts/p...MPFallbackFont
回覆
FLY
boy
Mac OS X (10.3&10.4)安裝,設定,使用經驗談,補充58
Mac OS X (10.3&10.4)安裝,設定,使用經驗談,補充58

RAM DISK 現成軟體的一些補充

整理出幾個給MacOSX.4使用的現成的RAM DISK軟體,如果懂UNIX系統指令的話,
也可以用下純文字指令的方式製造RAM DISK,但少爺目前為止還看不懂,就先跳
過了。

商業軟體有Ram Disk Creator、ramBunctious,但是這些軟體都很久沒有更新版
了,所以少爺直接掠過沒測試。
免費軟體有Espérance DV、Make RAM Disk,Espérance DV一樣也是很久沒有更新
了,所以也不理它了。Make RAM Disk則是2007年的發行版,但少爺這陣子才發現
,就抓下來試用看看。

執行Make RAM Disk前少爺先把,網頁上的說明看了一遍,也把下載後的壓縮包中
的說明文件從頭到尾看了一遍。有一個重點是,執行Make RAM Disk前,要先按住
OPTION鍵,再點選執行,才能進入Make RAM Disk設定選項的畫面。在設定畫面中
有好幾種單位值的選項,像是MB(百萬位元組),有million bytes、MiB兩種表示
法。例如,如果選用"bytes"這個單位值,然後填入數字"300000000",就跟選用
單位值"million bytes"或"MiB",然後填入數字"300"意思一樣。
還有一點要注意,執行Make RAM Disk前,一些非必要的應用程式,最好都關掉,
免得有些會大量存取記憶體或檔案系統表的第三方或系統內建軟體,會跟製造RAM Disk
的過程衝突到,而發生Make RAM Disk啟動錯誤。Make RAM Disk設定好勾選了
"Save setting for next time"項目並執行後,可以將Make RAM Disk.APP加入到
系統偏好設定/帳號/登入項目,就相當於加入到MsWindows\開始功能表\啟動的意
思一樣。

少爺一直在找一個操作流程,少爺想把RAM Disk啟動順序擺在虛擬記憶體swap file
的啟動程序之前,這個技巧在MsWindows環境老早就可以做到了(圖形介面勾勾選選
再填入些數值就完成了),可是在MacOSX環境,少爺還是搞不定。

參考連結

商業軟體

Ram Disk Creator
http://www.donelleschi.com/ramdiskcreator/

ramBunctious
http://www.clarkwood.com/old/rambunctious/

免費軟體

Espérance DV
http://www.mparrot.net/index.php?page=downloads&lang=en

Make RAM Disk
http://boredzo.org/make-ram-disk/
這個軟體還有原始碼可以下載耶,雖然少爺看不懂。



這麼冷門(回應率趨近於零)的文章 點閱率居然也達三萬了~~~
回覆
FLY
boy
Mac OS X (10.3&10.4)安裝,設定,使用經驗談,補充59
Mac OS X (10.3&10.4)安裝,設定,使用經驗談,補充59

Unicode 5.1版~十萬字元全滿達成

少爺終於找到了字元面板的替代軟體,叫做UnicodeChecker,少爺試用結果,某
些使用經驗上,覺得UnicodeChecker還是有些瑕疵,不太好用,但是這是少爺目
前所找到的唯一一款免費軟體,只能說先求有再求好了。UnicodeChecker 目前
為止的發行版,為支援到Unicode 5.0,少爺看了說明文件,並把UnicodeChecker
的功能試用一輪之後,發現原來UnicodeChecker的做法為,設計一個介面程式,
以Unicode官方組織提供的"規格化過的純文字檔"當成資料庫來源,再配合已經安
裝在系統中,支援Unicode所有編碼的字型檔,來構成類似字元面板的介面功能。
所以少爺先將UnicodeChecker的偏好設定跑過一輪後,接下來就要做一個重要的
步驟,將UnicodeChecker所內建的"規格化過的純文字資料庫檔案",全部更換成
Unicode官方組織網站所發行的最新正式標準版檔案,這些規格化過的純文字資料
庫檔案,預設是放在 UnicodeChecker.app/Contents/Resources/Unicode Data/
之下。另外用ftp軟體登入(可匿名登入)Unicode官方組織的ftp站 ftp://ftp.unicode.org/Public/UNIDATA/
尋找並下載相對應的檔案,全都複製到UnicodeChecker.app/Contents/Resources/Unicode Data/
之下,覆蓋並取代原有檔案。注意其中一個Unihan.zip,下載回來後,要先解壓
縮再複製到 UnicodeChecker.app/Contents/Resources/Unicode Data/ 之下。
還有一個要注意的是 UnicodeChecker.app/Contents/Resources/AGLs/這個路徑
,少爺發現原來 AGLs/AGLFN/aglfn13.txt 這個檔案也有更新版的了,要去adobe
網站抓。
少爺的做法很偷懶,就是將 ftp://ftp.unicode.org/Public/挖到的所有Unicode
5.1版的"規格化過的純文字檔"全部都下載下來,往 UnicodeChecker.app/Contents/Resources/
裡頭依照分類全複製進去,檔案都替代完成後,啟動 UnicodeChecker,在
選單列/window/show data file versions window 這個視窗中,可以看到整個純
文字資料庫檔案列表機乎都升級成Unicode 5.1版了,接下來用文字編輯器開啟剛
剛從Unicode ftp站下載下來的blocks.txt,查看其內容,與UnicodeChecker
選單列/Character Blocks/ 的下拉列表做比對,發現內容都同步了,不過其中有
三個區塊本來就是空的,就被跳過了,分別為:
D800..DB7F; High Surrogates;
DB80..DBFF; High Private Use Surrogates;
DC00..DFFF; Low Surrogates;
這三個區塊的技術問題,少爺就看不懂了,只知道目前為止沒有被編入字元,在
選單列/perferences/general/default font for current character 這個選項
中少爺選用了"全字庫正楷體"這個目前看來包山包海最多字元的字型檔,如果覺
得主視窗左側的字元列表的字體太小,可以點選 選單列/View/Make Text Bigger
來放大字體,若想要查詢字元的字身與字高的相關資訊,可以點選
選單列/View/Show Font Metrics。
接下來看看主視窗的內容,左邊有一個預設項目為Basic Multilingual Plane的
下拉選單欄位,整個Unicode 5.1範圍內的字元,就在這個下拉列表中了,少爺選
取了Supplementary Multilingual Plane這個大分類,試試下方的字元列表就出
現一排的編碼與字元對應列,可以拉捲軸繼續往下查詢,少爺發現UnicodeChecker
會自己選一個原預設值字型檔所沒有該字元的,也能對應到該編碼碼位的字型檔
來顯示,但是少爺查不出來UnicodeChecker另外選字型檔的排序依據是什麼,少
爺之前查詢過TW-Kai-Plus-96_1_1.ttf是擺在所謂的plane 15(Supplementary Private Area-A)
編碼區塊(MsWindows平台下查到的)想說把下拉選項改選成plane 15-private use
看看,TW-Kai-Plus-96_1_1.ttf的字元會不會自動被呼叫出來,少爺把卷軸整個
拉完,發現並沒有,要使用者自己去列表中,任意賭選一個編碼,然後在右上方
的字體列表中看看,全字庫正楷體 plus有沒有出現在下拉列表中,少爺覺得這也
未免太不夠自動了吧,是因為UnicodeChecker不支援Private Area 抓字元的關係
嗎?在MsWindows平台的第三方軟體都抓得到阿!少爺覺得有點遜掉了,不過這是
免費軟體,也就算了。還是覺得很可惜,要是能夠自動抓編碼對應字元就好了。
接下來介紹一些可以透過UnicodeChecker查詢到的,少爺覺得有趣的字元資訊,
這些資訊都是來自少爺所匯入的Unicode 5.1最新版純文字字元資料庫檔案,舉一
個例子,少爺在Basic Multilingual Plane選取一個包含在CJK Unified Ideographs
區塊內的漢字,然後點選主視窗右下方Unihan標籤,查詢到 kDefinition 這個屬
性,就出現了這個字的英文"意譯",少爺把這當成某種程度的"漢英字典"了。針
對不同類型的字元,有不少字元資訊可以查,就請各位自行摸索了。
這個軟體還有一個bug,就是 選單列/History/ 這個功能項目不穩定,只要滑鼠點
選這個項目或只是經過這個項目,都有可能造成 UnicodeChecker 當掉,所以少爺
盡量避免讓滑鼠指標經過 選單列/History/ 這個功能項目。
另外少爺遇到一個問題,目前還沒解決,就是在ftp://ftp.unicode.org/Public/5.1.0/ucdxml/
下載了 ucd.all.flat.zip 這個檔案,解壓縮後會得到 ucd.all.flat.xml 這個檔
案,用純文字編輯器去開啟它,也看得出來是一個"規格化過的純文字資料庫檔"可
是少爺怎麼查詢,就是查不到,在MacOSX平台上該用什麼軟體來解析這個檔案,讓
它呈現出容易閱讀的格式,真是傷腦筋。

接下來就又是一個大重點,這可是少爺費時三個月,一個一個查詢,所累積出來的
資料整理,沒功勞也有苦勞阿。少爺把 Unicode 5.1包含的160多個區塊分類,一個
一個去google查詢該分類的意義與特色,有哪些現成的字型檔,與該分類相容,並
能達到編碼與字型的對應為全部滿編。以下就是少爺所整理出來的大列表,少爺看
得懂得區塊分類會自己嘗試解讀,看不懂的可能就直接挖網路上所能找到的現成資
訊。

第一行為原分類名稱與直譯,最後為該分類解讀。

Aegean Numbers = 愛琴海數字
總共有57個字元
編碼字元全滿字型 Aegean.otf
字型檔來源 http://users.teilar.gr/~g1951d/download.html
歐洲風格的甲骨文

Alphabetic Presentation Forms = 字母變體顯示(表達)形式
總共有58個字元
編碼字元全滿字型 DejaVuSans.ttf
字型檔來源 http://dejavu.sourceforge.net/wiki/index.php/Main_Page
拉丁文、美洲文、希伯來文的拼英文字連體字字元與變體

Ancient Greek Musical Notation = 古希臘音樂譜記號
總共有70個字元
編碼字元全滿字型 Cardo98s.ttf Aegean.otf Alexander.otf Musical.otf
字型檔來源 http://users.teilar.gr/~g1951d/download.html http://scholarsfonts.net/cardofnt.html

Ancient Greek Numbers = 古希臘數字
總共有75個字元
編碼字元全滿字型 Aegean.otf Alexander.otf
字型檔來源 http://users.teilar.gr/~g1951d/download.html

Ancient Symbols = 古代符號
總共有12個字元
編碼字元全滿字型 Aegean.otf

Arabic = 基本阿拉伯文
總共有250個字元
編碼字元全滿字型 unifont-5.1.20080706.ttf(點陣圖格式) 未滿字型 ScheherazadeRegOT.ttf
字型檔來源 http://unifoundry.com/unifont.html http://scripts.sil.org/ArabicFonts

Arabic Presentation Forms-A = 阿拉伯文變顯示現形式-A
總共有595個字元
編碼字元全滿字型 全字庫正楷體

Arabic Presentation Forms-B = 阿拉伯文變體顯現形式-B
總共有141個字元
編碼字元全滿字型 全字庫正楷體

Arabic Supplement = 阿拉伯文補充
總共有48個字元
編碼字元全滿字型 unifont-5.1.20080706.ttf 未滿字型 ScheherazadeRegOT.ttf LateefRegOT.ttf

Armenian = 亞美尼亞文
總共有86個字元
編碼字元全滿字型 FreeSans.otf damase_v.2.ttf
字型檔來源 http://ftp.gnu.org/gnu/freefont/ http://www.wazu.jp/downloads/damase_v.2.zip

Arrows = 箭頭符號
總共有112個字元
編碼字元全滿字型 DejaVuSans.ttf Unicode.otf
字型檔來源 http://users.teilar.gr/~g1951d/download.html

Balinese = 峇里文
總共有121個字元
編碼字元全滿字型 unifont-5.1.20080706.ttf(點陣圖格式)
巴厘島 Bali (印尼的行政區之一)旅遊勝地

Basic Latin = 基本拉丁字母
總共有128個字元
編碼字元全滿字型 新細明體(MsWindows Vista版本)

Bengali = 孟加拉文
總共有91個字元
編碼字元全滿字型 FreeSans.otf
22種印度官方語言之一

Block Elements = 區塊元件
總共有32個字元
編碼字元全滿字型 FreeSans.otf
一堆階層式依序排列的正方形或矩形圖案

Bopomofo = 注音符號
總共有41個字元
編碼字元全滿字型 uming.ttc
有些全面性的字型檔會包含早年已經被教育部廢用的額外四種符號

Bopomofo Extended = 注音符號擴充
總共有24個字元
編碼字元全滿字型 uming.ttc
另外設計來拼注閩南語與客家語的符號

Box Drawing = 製表符
總共有128個字元
編碼字元全滿字型 DejaVuSans.ttf
用來拼湊表格框線樣式的圖案,有粗線、細線、粗細交互、雙線,
也有圓角的樣式

Braille Patterns = 盲文;盲人點字
總共有256個字元
編碼字元全滿字型 全字庫正楷體

Buginese = 布吉文
總共有30個字元
編碼字元全滿字型 damase_v.2.ttf
布吉人 Buginese 印度尼西亞蘇拉維西島的民族。
語言屬澳斯特羅尼西亞(馬來-玻里尼西亞)語系。
為該島文化上占優勢的種族集... 摘錄自大英百科全書網站

Buhid = 布希德文
總共有20個字元
編碼字元全滿字型 全字庫正楷體
一種菲律賓文

Byzantine Musical Symbols = 東正教音樂符號(拜占庭音樂符號)
總共有246個字元
編碼字元全滿字型 Musical.otf

Carian = 卡里亞文
總共有49個字元
編碼字元全滿字型 Aegean.otf
古代語言,通行於小亞細亞西部的最南部地區,主要從埃及的卡里
亞人雇傭兵留下的一百多塊粗糙石雕上而為人所...摘錄自大英百科全書網站

Cham = 占文
總共有83個字元
編碼字元全滿字型 unifont-5.1.20080706.ttf(點陣圖格式)
位在越南、柬埔寨(舊稱 高棉)地區的一種文字

Cherokee = 切羅基文
總共有85個字元
編碼字元全滿字型 damase_v.2.ttf
是一群在1600年代生活於北美洲的民族,分佈地區相當於現今的美國東南部,
大多數在後來被迫向西遷徙。此民族是美洲原住民中的文明化五部族之一...
摘錄自 zh.wikipedia.org

CJK Compatibility = 中日韓相容字元
總共有256個字元
編碼字元全滿字型 全字庫正楷體
裏頭所包含的字元種類像是:1~31日、1~24点、mA、GHz、株式會社等等。英文、
日文度量單位縮寫字元,日文、簡體漢字縮寫字元。

CJK Compatibility Forms = 中日韓相容格式
總共有32個字元
編碼字元全滿字型 文泉驛正黑 wqy-zenhei.ttf
裏頭所包含的字元種類像是:給漢字直行文書版面使用(由上而下,由右而左使
用的"括號"、書名號、標點符號等)為主,漢字橫行為輔。

CJK Compatibility Ideographs = 中日韓相容表意文字
總共有467個字元
編碼字元全滿字型 文泉驛正黑 wqy-zenhei.ttf
裏頭所包含的字元種類像是:少爺"猜測"是中日韓都認可通用,筆畫數與文字意
義都一樣的象形漢字(有描述錯誤請指正,並附上參考資料來源)。

CJK Compatibility Ideographs Supplement = 中日韓相容表意文字補充
總共有542個字元
編碼字元全滿字型 HAN NOM B.ttf
同上

CJK Radicals Supplement = 中日韓部首補充
總共有115個字元
編碼字元全滿字型 全字庫正楷體
一些字根

CJK Strokes = 中日韓筆畫部件
總共有36個字元
編碼字元全滿字型 文泉驛正黑 wqy-zenhei.ttf
一些字根

CJK Symbols and Punctuation = 中日韓符號和標點
總共有64個字元
編碼字元全滿字型 全字庫正楷體

CJK Unified Ideographs = 中日韓統一表意文字
總共有20932個字元
編碼字元全滿字型 文泉驛正黑 wqy-zenhei.ttf
中文象形漢字

CJK Unified Ideographs Extension A = 中日韓統一表意文字擴充A
總共有6582個字元
編碼字元全滿字型 新細明體 mingliu.ttc (MsWindows Vista版本)
中文象形漢字 擴充A

CJK Unified Ideographs Extension B = 中日韓統一表意文字擴充B
總共有42711個字元
編碼字元全滿字型 新細明體-ExtB (MsWindows Vista版本)
中文象形漢字 擴充B

Combining Diacritical Marks = 組合音標附加符號
總共有112個字元
編碼字元全滿字型 unifont-5.1.20080706.ttf(點陣圖格式) 未滿字型 FreeSans.otf
可以在拼音文字上方或下方加上各種重音、輕音記號,可以疊在拼音文字字元上

Combining Diacritical Marks for Symbols = 符號用組合附加符號
總共有33個字元
編碼字元全滿字型 Unicode.otf

Combining Diacritical Marks Supplement = 組合音標附加符號補充
總共有41個字元
編碼字元全滿字型 unifont-5.1.20080706.ttf(點陣圖格式)

Combining Half Marks = 組合半形標示
總共有7個字元
編碼字元全滿字型 Unicode.otf

Control Pictures = 控制圖像
總共有39個字元
編碼字元全滿字型 Unicode.otf
一些表示控制字元的圖案,其他範例字型:Code2000

Coptic = 古埃及語
總共有114個字元
編碼字元全滿字型 Analecta.otf
字型檔來源 http://users.teilar.gr/~g1951d/download.html

Counting Rod Numerals = 算籌記數式
總共有18個字元
編碼字元全滿字型 Unicode.otf
類似中文"正"字記號的畫線計數

Cuneiform = 楔形文字
總共有879個字元
編碼字元全滿字型 Akkadian.otf
字型檔來源 http://users.teilar.gr/~g1951d/download.html
洋人的甲骨文

Cuneiform Numbers and Punctuation = 楔形文字數字及標點
總共有103個字元
編碼字元全滿字型 Akkadian.otf

Currency Symbols = 貨幣符號
總共有22個字元
編碼字元全滿字型 CharisSILR.ttf DejaVuSans.ttf

Cypriot Syllabary = 賽浦雷特音節文字
總共有55個字元
編碼字元全滿字型 Aegean.otf damase_v.2.ttf
歐洲地中海地區的文字

Cyrillic = 斯拉夫字母
總共有256個字元
編碼字元全滿字型 Unicode.otf
俄文

Cyrillic Extended-A = 斯拉夫字母擴充-A
總共有32個字元
編碼字元全滿字型 unifont-5.1.20080706.ttf(點陣圖格式)

Cyrillic Extended-B = 斯拉夫字母擴充-B
總共有78個字元
編碼字元全滿字型 unifont-5.1.20080706.ttf(點陣圖格式)

Cyrillic Supplement = 斯拉夫字母補充
總共有36個字元
編碼字元全滿字型 Unicode.otf

Deseret = 猶他大學音標
總共有80個字元
編碼字元全滿字型 Analecta.otf
http://en.wikipedia.org/wiki/Deseret_alphabet

Devanagari = 天城體梵文字母
總共有112個字元
編碼字元全滿字型 unifont-5.1.20080706.ttf(點陣圖格式) 未滿字型 FreeSans.otf
天城文是目前印度最流行的文字,用來寫印地語、梵語、尼泊爾語等語言。
摘錄自 zh.wikipedia.org

Dingbats = 什錦符號
總共有174個字元
編碼字元全滿字型 Unicode.otf DejaVuSans.ttf

Domino Tiles = 西洋骨牌牌面(骰子)
總共有100個字元
編碼字元全滿字型 Unicode.otf

Enclosed Alphanumerics = 圈型字母數字
總共有160個字元
編碼字元全滿字型 Junicode.dfont
字型檔來源 http://junicode.sourceforge.net/
帶括號或外圍圓圈的字母與數字

Enclosed CJK Letters and Months = 括號及圈型中日韓字母及月份
總共有242個字元
編碼字元全滿字型 CODE2000.TTF
字型檔來源 http://www.code2000.net/code2000_page.htm

Ethiopic = 伊索比亞文
總共有356個字元
編碼字元全滿字型 Abyssinica_SIL.ttf
字型檔來源 http://scripts.sil.org/AbyssinicaSIL_Download

Ethiopic Extended = 伊索比亞文擴充
總共有79個字元
編碼字元全滿字型 Abyssinica_SIL.ttf

Ethiopic Supplement = 伊索比亞文補充
總共有26個字元
編碼字元全滿字型 Abyssinica_SIL.ttf

General Punctuation = 一般標點符號
總共有107個字元
編碼字元全滿字型 unifont-5.1.20080706.ttf(點陣圖格式)
一些全形與半形標點符號(給洋人文書用的,也有幾個直行文書用的括號等等)

Geometric Shapes = 幾何形狀
總共有96個字元
編碼字元全滿字型 DejaVuSans.ttf
圓、方、三角、菱形、多邊形等等

Georgian = 喬治亞語
總共有83個字元
編碼字元全滿字型 DejaVuSans.ttf

Georgian Supplement = 喬治亞語補充
總共有38個字元
編碼字元全滿字型 damase_v.2.ttf

Glagolitic = 格拉哥里字母
總共有94個字元
編碼字元全滿字型 damase_v.2.ttf
格拉哥里字母是現存已知最古老的西里爾字母(Cyrillic alphabet)。它由聖西里爾於862年至863年期間所發明,
為要把聖經翻譯成古教會斯拉夫語。類型:全音素文字。摘錄自 zh.wikipedia.org

Gothic = 歌德文
總共有27個字元
編碼字元全滿字型 Analecta.otf
http://en.wikipedia.org/wiki/Gothic_alphabet

Greek and Coptic = 希臘字母和古埃及語
總共有134個字元
編碼字元全滿字型 Unicode.otf

Greek Extended = 希臘字母擴充
總共有233個字元
編碼字元全滿字型 DejaVuSans.ttf

Gujarati = 古吉拉特文
總共有83個字元
編碼字元全滿字型 全字庫正楷體
印度-伊朗語族,22種印度官方語言之一

Gurmukhi = 印度錫克教經籍文
總共有79個字元
編碼字元全滿字型 AMBAR系列
字型檔來源 http://www.gurbanifiles.org/unicode/

Halfwidth and Fullwidth Forms = 半形及全形字元
總共有225個字元
編碼字元全滿字型 全字庫正楷體
有英文字母,日文字母,韓文字母

Hangul Compatibility Jamo = 諺文相容字母
總共有94個字元
編碼字元全滿字型 全字庫正楷體
韓文

Hangul Jamo = 諺文字母
總共有240個字元
編碼字元全滿字型 全字庫正楷體
韓文

Hangul Syllables = 諺文音節(韓文)
總共有11172個字元
編碼字元全滿字型 文泉驛正黑
韓文Ga,韓文Na,韓文Da,韓文Ra,韓文Ma,韓文Ba,韓文Sa,
韓文Ah,韓文Ja,韓文Cha,韓文Ka,韓文Ta,韓文Pa,韓文Ha

Hanunoo 哈努諾文
總共有23個字元
編碼字元全滿字型 damase_v.2.ttf
菲律賓文的一種

Hebrew = 希伯來文
總共有87個字元
編碼字元全滿字型 SILEOTSR.ttf SILEOT.ttf
字型檔來源 http://scripts.sil.org/SILHebrUnic2

Hiragana = 平假名
總共有93個字元
編碼字元全滿字型 YOzFont 系列
字型檔來源 http://yozvox.web.infoseek.co.jp/YOz04.7z
日文 平假名

Ideographic Description Characters = 漢字結構描述字元
總共有12個字元
編碼字元全滿字型 全字庫正楷體
將漢字拆字根時的字根區塊劃分標記

IPA Extensions = 國際音標擴充
總共有96個字元
編碼字元全滿字型 CharisSILR.ttf DoulosSILR.ttf
字型檔來源 http://scripts.sil.org/CharisSIL_download http://scripts.sil.org/DoulosSIL_download
KK音標分散於其中

Kanbun = 漢文標註號(漢字批註)
總共有16個字元
編碼字元全滿字型 全字庫正楷體
裏頭所包含的字元種類像是:一二三四上中下甲乙丙丁天地人。整個字元位置偏
向字元方塊空間中的左上角,或許可以把它當成中國式的批註符號吧?漢文標註
號(漢字批註)這個詞彙解釋請去問國文老師。

Kangxi Radicals = 康熙字典部首
總共有214個字元
編碼字元全滿字型 uming.ttc
字型檔來源 http://www.freedesktop.org/wiki/Soft...fonts/Download
就是古代康熙字典所分類的漢字部首

Kannada = 卡納達文
總共有86個字元
編碼字元全滿字型 CODE2000.TTF
22種印度官方語言之一

Katakana = 片假名
總共有96個字元
編碼字元全滿字型 YOzFont 系列
日文 片假名

Katakana Phonetic Extensions = 片假名音標擴充
總共有16個字元
編碼字元全滿字型 YOzFont 系列

Kayah Li = 克耶文
總共有48個字元
編碼字元全滿字型 CODE2000.TTF
漢藏語系的一支

Kharoshthi = 佉盧字母
總共有65個字元
編碼字元全滿字型 damase_v.2.ttf
南亞文字

Khmer = 高棉文
總共有114個字元
編碼字元全滿字型 Khmer OS系列
字型檔來源 http://www.khmeros.info/drupal/?q=en/download/fonts

Khmer Symbols = 高棉符號
總共有32個字元
編碼字元全滿字型 Khmer OS系列

Lao = 老撾文
總共有65個字元
編碼字元全滿字型 全字庫正楷體
寮國文

Latin Extended Additional = 拉丁字母擴充附加
總共有256個字元
編碼字元全滿字型 CODE2000.TTF

Latin Extended-A = 拉丁字母擴充-A
總共有128個字元
編碼字元全滿字型 DejaVuSans.ttf

Latin Extended-B = 拉丁字母擴充-B
總共有208個字元
編碼字元全滿字型 DejaVuSans.ttf

Latin Extended-C = 拉丁字母擴充-C
總共有29個字元
編碼字元全滿字型 CODE2000.TTF

Latin Extended-D = 拉丁字母擴充-D
總共有114個字元
編碼字元全滿字型 CODE2000.TTF

Latin-1 Supplement = 拉丁字母補充-1
總共有128個字元
編碼字元全滿字型 unifont-5.1.20080706.ttf(點陣圖格式)

Lepcha = 雷布查語
總共有74個字元
編碼字元全滿字型 unifont-5.1.20080706.ttf(點陣圖格式)
雷布查人 Lepcha分布在尼泊爾東部、不丹西部和印度的錫金邦
及西孟加拉邦大吉嶺區... 摘錄自大英百科全書網站

Letterlike Symbols = 類字母符號
總共有80個字元
編碼字元全滿字型 Unicode.otf
變體的拉丁英文字母

Limbu = 林布文
總共有66個字元
編碼字元全滿字型 damase_v.2.ttf
林布人 Limbu 尼泊爾原住民民族基蘭蒂人(Kiranti)的第二個大部落,
住在喜馬拉雅山東端介於阿倫(Arun)河與... 摘錄自大英百科全書網站

Linear B Ideograms = 線性B表意文字
總共有123個字元
編碼字元全滿字型 Aegean.otf
西元前2千紀愛琴海文明時期所使用的線形文字形式。

Linear B Syllabary = 線性B音節文字
總共有88個字元
編碼字元全滿字型 Aegean.otf

Lycian = 呂基亞文
總共有29個字元
編碼字元全滿字型 Aegean.otf
已消亡的語言,曾通用於小亞細亞西南部,使用本土的呂西亞字母,
字母係以西部希臘字母原形為基礎而創製的... 摘錄自大英百科全書網站

Lydian = 呂底亞文
總共有27個字元
編碼字元全滿字型 Aegean.otf
古安納托利亞西部的一個地區,西濱愛琴海,已消亡... 摘錄自大英百科全書網站

Mahjong Tiles = 麻將牌面
總共有44個字元
編碼字元全滿字型 Unicode.otf

Malayalam = 馬拉亞拉姆文
總共有95個字元
編碼字元全滿字型 CODE2000.TTF
印度西南沿海文 22種印度官方語言之一

Mathematical Alphanumeric Symbols = 數學用字母數字符號
總共有996個字元
編碼字元全滿字型 Unicode.otf

Mathematical Operators = 數學運算符號
總共有256個字元
編碼字元全滿字型 Unicode.otf
數學運算子

Miscellaneous Mathematical Symbols-A = 雜項數學符號-A
總共有44個字元
編碼字元全滿字型 Unicode.otf

Miscellaneous Mathematical Symbols-B = 雜項數學符號-B
總共有128個字元
編碼字元全滿字型 Unicode.otf

Miscellaneous Symbols = 混合什錦符號
總共有191個字元
編碼字元全滿字型 Unicode.otf

Miscellaneous Symbols and Arrows = 混合什錦符號和箭頭符號
總共有82個字元
編碼字元全滿字型 Unicode.otf

Miscellaneous Technical = 混合什錦專門技術符號
總共有232個字元
編碼字元全滿字型 Unicode.otf

Modifier Tone Letters = 聲調符號
總共有32個字元
編碼字元全滿字型 CODE2000.TTF

Mongolian = 蒙古文
總共有156個字元
編碼字元全滿字型 ManchuFont2005.ttf
字型檔來源 http://sourceforge.net/projects/manchufont/

Musical Symbols = 音樂符號
總共有220個字元
編碼字元全滿字型 Musical.otf
字型檔來源 http://users.teilar.gr/~g1951d/download.html

Myanmar = 緬甸文
總共有156個字元
編碼字元全滿字型 CODE2000.TTF Padauk.ttf
字型檔來源 http://scripts.sil.org/Padauk

New Tai Lue = 新傣仂文(傣族)
總共有80個字元
編碼字元全滿字型 DBSIL 系列
字型檔來源 http://scripts.sil.org/DaiBannaSIL
屬於屬壯侗語系侗台語族,和泰語有親屬關係。中國官方認定操該語言的族群為傣族的一支。
摘錄自 zh.wikipedia.org

N'Ko = 西非 曼德語族
總共有59個字元
編碼字元全滿字型 CODE2000.TTF
書面語言

Number Forms = 數字形式
總共有54個字元
編碼字元全滿字型 Unicode.otf
分數,大寫與小寫的羅馬數字

Ogham = 歐甘文
總共有29個字元
編碼字元全滿字型 BabelStoneOgham 系列
字型檔來源 http://www.babelstone.co.uk/Fonts/Ogham.html
歐甘文字 古代不列顛,特別是愛爾蘭使用的文字

Ol Chiki = 桑塔利文
總共有48個字元
編碼字元全滿字型 CODE2000.TTF
屬於印度-南亞語系的蒙達語族。摘錄自 zh.wikipedia.org

Old Italic = 古義大利文
總共有35個字元
編碼字元全滿字型 Aegean.otf

Old Persian = 古波斯文
總共有50個字元
編碼字元全滿字型 Aegean.otf

Optical Character Recognition = 光學字元識別
總共有11個字元
編碼字元全滿字型 全字庫正楷體
光學字元辨識符號

Oriya = 奧利亞文
總共有84個字元
編碼字元全滿字型 CODE2000.TTF
22種印度官方語言之一

Osmanya = 奧斯曼亞文
總共有40個字元
編碼字元全滿字型 ANDAGII_.TTF
字型檔來源 http://www.i18nguy.com/unicode/unicode-font.html
非洲 索馬利亞語

Phags-pa = 八思巴字母
總共有56個字元
編碼字元全滿字型 CODE2000.TTF
蒙古文的一種

Phaistos Disc = 費斯托斯 泥圓盤文字
總共有46個字元
編碼字元全滿字型 Aegean.otf

Phoenician = 腓尼基字母
總共有27個字元
編碼字元全滿字型 Aegean.otf
腓尼基(Phoenicia)是古代中東的一個民族,起源於今巴勒斯坦附近。
摘錄自 zh.wikipedia.org

Phonetic Extensions = 音標擴充
總共有128個字元
編碼字元全滿字型 CharisSILR.ttf
KK音標分散其中

Phonetic Extensions Supplement = 音標擴充補充
總共有64個字元
編碼字元全滿字型 CharisSILR.ttf
KK音標分散其中

Private Use Area = 專用區
總共有6400個字元"空間"
相當於BIG5的私人造字存放區

Rejang = 勒姜文
總共有37個字元
編碼字元全滿字型 CODE2000.TTF
印尼的一支

Runic = 古北歐文
總共有81個字元
編碼字元全滿字型 Hnias.ttf LeedsUni07-09.ttf Junicode系列
字型檔來源 http://www.thesauruslex.com/typo/hniaseng.htm http://www.personal.leeds.ac.uk/~ecl6tam/ http://sourceforge.net/projects/junicode/

Saurashtra = 索拉什特拉文
總共有81個字元
編碼字元全滿字型 CODE2000.TTF
即「卡提亞瓦半島」,為印度西部地區。摘錄自 zh.wikipedia.org

Shavian = 簫伯納字母
總共有48個字元
編碼字元全滿字型 esl_gothic_unicode.ttf
字型檔來源 http://www.30below.com/~ethanl/fonts.html
http://en.wikipedia.org/wiki/Shavian

Sinhala = 僧伽羅字母
總共有80個字元
編碼字元全滿字型 kaputaunicode.ttf kandyunicode.ttf
字型檔來源 http://www.info.lk/slword/kaputaunicode.htm
斯里蘭卡的官方語言之一

Small Form Variants = 小寫變體
總共有26個字元
編碼字元全滿字型 CODE2000.TTF
一些標點符號、括號、四則運算符號

Spacing Modifier Letters = 進格修飾字元
總共有80個字元
編碼字元全滿字型 全字庫正楷體

Specials = 特殊字元
總共有5個字元
編碼字元全滿字型 全字庫正楷體
縮寫標示

Sundanese = 巽他文
總共有55個字元
編碼字元全滿字型 unifont-5.1.20080706.ttf(點陣圖格式)
用於印度尼西亞的爪哇島

Superscripts and Subscripts = 下標及上標
總共有34個字元
編碼字元全滿字型 Arev系列
字型檔來源 http://tavmjong.free.fr/FONTS/
有數字、四則運算符號、括號等等用上標與下標的位置來呈現

Supplemental Arrows-A = 補充性箭頭符號-A
總共有16個字元
編碼字元全滿字型 全字庫正楷體

Supplemental Arrows-B = 補充性箭頭符號-B
總共有128個字元
編碼字元全滿字型 全字庫正楷體

Supplemental Mathematical Operators = 補充性數學運算符號
總共有256個字元
編碼字元全滿字型 全字庫正楷體
更多的數學運算子

Supplemental Punctuation = 補充性標點符號
總共有49個字元
編碼字元全滿字型 CODE2000.TTF
一些特殊的標點符號

Supplementary Private Use Area-A = 補充專用區-A
總共有65534個字元
相當於BIG5的私人造字存放區

Supplementary Private Use Area-B = 補充專用區-B
總共有65534個字元
相當於BIG5的私人造字存放區

Syloti Nagri = 錫爾赫特文
總共有49個字元
編碼字元全滿字型 damase_v.2.ttf
一種印度文

Syriac = 敘利亞文
總共有77個字元
編碼字元全滿字型 全字庫正楷體

Tagalog = 他加祿文
總共有20個字元
編碼字元全滿字型 TagDoc93.ttf BayLopez.ttf BisHerv.ttf BikMintz.ttf TagStyle.ttf
字型檔來源 http://www.mts.net/~pmorrow/fonts.htm
南島語系的馬來-波里尼西亞語族

Tagbanwa = 塔加班瓦文
總共有18個字元
編碼字元全滿字型 tagbanwa.ttf
字型檔來源 http://youpibouh.thefreecat.org/download/tagbanwa.htm
菲律賓的一個文字系統

Tags = 語言編碼標籤
總共有97個字元
編碼字元全滿字型 目前沒找到,反正是可替代方案很多種的制式標籤圖案
(因為沒找到全滿字型,少爺所謂的"UNICDOE5.1全滿達成"就破功啦~)
數字標籤圖案

Tai Le = 傣哪文;德宏傣文
總共有35個字元
編碼字元全滿字型 taileval.ttf
字型檔來源 http://www.wazu.jp/gallery/Fonts_TaiLe.html
屬於屬壯侗語系侗台語族,和泰語有親屬關係。中國官方認定操該語言的族群為傣族的一支。
摘錄自 zh.wikipedia.org

Tai Xuan Jing Symbols = 太玄經符號
總共有87個字元
編碼字元全滿字型 文泉驛正黑
字型檔來源 http://wqy.sourceforge.net/cgi-bin/index.cgi
http://zh.wikipedia.org/w/index.php?...&variant=zh-tw

Tamil = 塔米爾文
總共有72個字元
編碼字元全滿字型 aava1.ttf
字型檔來源 http://www.jainworld.com/JWTamil/jainworld/JWTamil.htm
印度南部的一種文字

Telugu = 泰盧固文
總共有93個字元
編碼字元全滿字型 Pothana2000.ttf
字型檔來源 http://www.kavya-nandanam.com/dload.htm
印度文的一支

Thaana = 它拿字母
總共有50個字元
編碼字元全滿字型 Mv系列
字型檔來源 http://www.mcst.gov.mv/News_and_Events/xpfonts.htm
馬爾地夫官方語言

Thai = 泰文
總共有87個字元
編碼字元全滿字型 全字庫正楷體

Tibetan = 藏文
總共有201個字元
編碼字元全滿字型 unifont-5.1.20080706.ttf(點陣圖格式) 未滿字型 Jomolhari-alpha000.002a.ttf
字型檔來源 http://www.wazu.jp/gallery/Fonts_Tibetan.html
西藏文

Tifinagh = 提非納格字母
總共有55個字元
編碼字元全滿字型 hapaxber.ttf
http://www.hapax.qc.ca/
古老的地中海文字

Ugaritic = 烏加列楔形文字
總共有31個字元
編碼字元全滿字型 damase_v.2.ttf
http://en.wikipedia.org/wiki/Ugaritic

Unified Canadian Aboriginal Syllabics = 加拿大土著統一音節文字
總共有630個字元
編碼字元全滿字型 Aboriginal 系列 Kayases.ttf oski系列 Euphemia UCAS系列 rotinon系列
字型檔來源 http://www.languagegeek.com/font/fontdownload.html http://www.tiro.com/syllabics/resour...resources.html

Vai = 瓦伊文
總共有300個字元
編碼字元全滿字型 CODE2000.TTF
字型檔來源 http://en.wikipedia.org/wiki/Vai_script

Variation Selectors = 字型變換選取器
總共有16個字元
編碼字元全滿字型 全字庫正楷體
v1~v16數字標籤圖案。真正的功能作用,請看參考連結。

Variation Selectors Supplement = 字型變換選取器補充
總共有240個字元
編碼字元全滿字型 目前沒找到,真正的功能作用,請看參考連結。
(因為沒找到全滿字型 少爺所謂的 UNICDOE5.1全滿達成 就破功啦~)
數字標籤圖案

Vertical Forms = 豎式標點
總共有10個字元
編碼字元全滿字型 uming.ttc
給直行文書使用的標點符號、括號(含刪節號(or省略號))

Yi Radicals = 彝文字母
總共有55個字元
編碼字元全滿字型 全字庫正楷體
這種文字使用在四川涼山彝族自治州,是1979年在古彝文的基礎上設計的。
摘錄自 zh.wikipedia.org

Yi Syllables = 彝文音節
總共有1165個字元
編碼字元全滿字型 全字庫正楷體

Yijing Hexagram Symbols = 易經六十四卦象
總共有64個字元
編碼字元全滿字型 全字庫正楷體

接下來少爺還會陸續摸索、嘗試讓MacOSX平台的網路瀏覽器,瀏覽所有其所能支
援的所有文字編碼種類的文字。記錄下設定的心得。量好多阿~寫不完~
少爺猜想,只要是IT專業人員,看過了少爺所編寫並分享的這篇補充57、59兩個
段落後,應該就開始舉一反三的套用在MacOSX與MsWindows這兩個平台上了,也
就是說,一個禮拜後,全台灣家用(個人用)等級的中文資訊處理電腦系統,都
可以輸入、顯示、編排、列印十萬種字元,也可以處理八萬七千多個中文漢字。
因為少爺在不創造任何一行新程式碼的情況下,只是拼拼湊湊網路上撿來的免費
或自由軟體元件就可以做到,別人當然也可以做到。


參考連結

UnicodeChecker
http://earthlingsoft.net/UnicodeChecker/index.html.en

Unicode
http://zh.wikipedia.org/w/index.php?...&variant=zh-tw

Unicode字元列表
http://zh.wikipedia.org/w/index.php?...&variant=zh-tw

基本多文種平面
http://zh.wikipedia.org/w/index.php?...&variant=zh-tw

輔助平面
http://zh.wikipedia.org/w/index.php?...&variant=zh-tw

中日韓統一表意文字
http://zh.wikipedia.org/w/index.php?...&variant=zh-tw

UNICODE官方組織的 FTP站
ftp://ftp.unicode.org/Public/UNIDATA/

CodeCharts Unicode 5.1 全部字元基本樣式列表
ftp://ftp.unicode.org/Public/5.1.0/c...CodeCharts.pdf

Adobe - Unicode and Glyph Names:
http://www.adobe.com/devnet/opentype...ves/glyph.html
有 aglfn.txt 檔案連結(字串:Adobe Glyph List For New Fonts)

Adobe Glyph List For New Fonts
http://www.adobe.com/devnet/opentype/archives/aglfn.txt

Unicode fonts for Macintosh OS X computers
http://www.alanwood.net/unicode/fonts_macosx.html

BabelStone:The Secret Life of Variation Selectors
http://babelstone.blogspot.com/2007/...selectors.html
回覆
FLY
boy
Mac OS X (10.3&10.4)安裝,設定,使用經驗談,補充60
Mac OS X (10.3&10.4)安裝,設定,使用經驗談,補充60

所有Unicode以外的文字編碼格式

少爺發現,除了Big5、Unicode等等之外,全世界現有的"電腦字元編碼系統"其
實有"N"種。所謂的Unicode也只是"其中一種",一個軟體作業系統到底有支援多
少種電腦字元編碼系統文字的輸入、編輯、顯示、列印呢?以MsWindows XP PRO SP3
繁中版為例,可以查詢 控制台\地區及語言選項\進階\字碼頁轉換表,把所有項
目全都勾選了,原版光碟的軟體元件安裝了,該"字碼頁轉換表"的列表內容就全
支援了。
先簡單提一下"電腦字元編碼"這個東西,除了Unicode會盡可能包山包海全世界
的文字種類以外,其它的電腦字元編碼系統,每一種通常就只支援一個固定範圍
的地區或一個國家所通行使用的文字,例如斯拉夫語系的KOI8-R編碼,就不會去
支援中文漢字、韓文、日文等東亞文字字元。全世界不同的國家或著不同的地區
,通常都會有個所謂定立或管理可用於該國家或該地區電腦文字資訊系統標準的
機構,例如在台灣,就有個叫做CNS11643的單位。另外,有一定產品發行量的電
腦軟硬體公司或組織,會定立搭配該公司產品的電腦文字編碼"標準規範",例如
蘋果、微軟、IBM與unix系統開發的組織等等,然而這些機構、商業公司或組織
訂定的電腦文字編碼規範,是否有彼此百分之百相容,這是可以討論的一回事,
而它們所訂定的,這一大堆各式各樣的規範,有沒有被大多數的電腦使用者"廣泛採用"
又是另一回事。舉一個例子,一個廠商、社群或個人,想要開發一個以中文漢字
為主的向量或點陣字型檔,假設她已經將字的圖都做完了,下一步就是要設定這
個字型是要與哪一種編碼格式做對應,而她可以選擇的有:
936 gb2312 ANSI/OEM Simplified Chinese (PRC, Singapore); Chinese Simplified (GB2312)
950 big5 ANSI/OEM Traditional Chinese (Taiwan; Hong Kong SAR, PRC); Chinese Traditional (Big5)
10002 x-mac-chinesetrad MAC Traditional Chinese (Big5); Chinese Traditional (Mac)
10008 x-mac-chinesesimp MAC Simplified Chinese (GB 2312); Chinese Simplified (Mac)
20000 x-Chinese_CNS CNS Taiwan; Chinese Traditional (CNS)
20002 x_Chinese-Eten Eten Taiwan; Chinese Traditional (Eten)
20936 x-cp20936 Simplified Chinese (GB2312); Chinese Simplified (GB2312-80)
50227 x-cp50227 ISO 2022 Simplified Chinese; Chinese Simplified (ISO 2022)
50229 ISO 2022 Traditional Chinese
50935 EBCDIC Simplified Chinese Extended and Simplified Chinese
50936 EBCDIC Simplified Chinese
50937 EBCDIC US-Canada and Traditional Chinese
51936 EUC-CN EUC Simplified Chinese; Chinese Simplified (EUC)
51950 EUC Traditional Chinese
52936 hz-gb-2312 HZ-GB2312 Simplified Chinese; Chinese Simplified (HZ)
54936 GB18030 Windows XP and later: GB18030 Simplified Chinese (4 byte); Chinese Simplified (GB18030)
MacChineseTrad
MacChineseSimp
DOSChineseSimplif
DOSChineseTrad
MacTradChinese
MacSimpChinese
等等(摘錄自MSDN及realbasic help),可以只選其中一個或選擇好幾個,看字型
檔的開發者是要只針對某個作業系統平台某個操作環境(純繁體或存簡體或著Unicode
環境),或著跨平台都支援。

回到MacOSX 10.4.11平台,少爺當然會找系統中,類似MsWindows字碼頁轉換表
的選項,結果翻遍整個GUI系統設定介面,都沒有找到,然而少爺發現在文字編
輯.app/偏好設定/打開和儲存/純文字格式檔案編碼/正在打開檔案、正在儲存檔
案/自訂編碼列表,卻出現了有些類似於MsWindows字碼頁轉換表的編碼列表選項
,少爺當然選擇全部勾選,接下來就是要嘗試,將這份自訂編碼列表的全部內容
,都複製出來,整理看看到底有多少種字元編碼分類。
少爺依據過往經驗,選擇其中一個編碼名稱"鍵盤符號"當關鍵字,使用軟體EasyFind
來搜尋整個開機分割區的檔案內容,終於被少爺找到幾個相關檔案,有可以整理
與分類的依據,以了解MacOSX 10.4.11到底對既有的N種電腦字元編碼系統,支援
到什麼樣的程度,少爺所找到並選取的幾個檔案有:

/系統/資源庫/Frameworks/CoreServices.framework/Versions/A/frameworks
/CarbornCore.framework/Versions/A/Resources/
TextEncodingFallbackNames.strings 及
zh_TW.lproj/TextEncodingNames.strings (含"鍵盤符號"字樣)

/系統/資源庫/Frameworks/Foundation.framework/Versions/C/Resources/zh_TW.lproj/
EncodingNames.strings

/系統/資源庫/Frameworks/CoreServices.framework/Versions/A/frameworks/
CarbornCore.framework/Versions/A/Headers/
TextCommon.h 及 TextCommon.r

/系統/資源庫/Keyboard Layouts/Unicode.bundle/Contents/Resources/zh_TW.lproj/
InfoPlist.strings

/系統/資源庫/PrivateFrameworks/IntlPreferences.framework/Versions/A/Resources/
Language.strings 各國或各地區字元範例的縮寫說明
zh_TW.lproj/LocalizedLanguage.strings 繁體中文的縮寫說明

少爺用進階文字編輯器來回比較了這些檔案的內容後後,做了一個測試,因為
TextEncodingFallbackNames.strings的內容較TextEncodingNames.strings來的
多,少爺就將TextEncodingFallbackNames.strings多出來的幾行,全都複製穿插
到TextEncodingNames.strings所能夠前後對應的位置行數中,並且維持複製原來
的英文內容,不自行翻譯成繁體中文名稱,就這樣讓TextEncodingNames.strings
與TextEncodingFallbackNames.strings的編碼種類與數量一致,存檔時注意,檔
案的編碼要跟原來一樣。再來少爺以EncodingNames.strings的內容格式為標準,
將TextEncodingNames.strings有的,而EncodingNames.strings所缺少的編碼種
類,都補進EncodingNames.strings檔案中,另外Unicode的部分,因為夸號的部
分少爺看不出來對應的依據,就沒有補進去了,改好存檔(這些原始檔最好都先另
外備份,以防萬一)。重新啟動文字編輯.app的"自訂編碼列表",果然又多出了好
多文字編碼選項可以選,原來蘋果公司真的有"留一手",不過少爺比較後發現,文
字編輯.app的"自訂編碼列表"好像也只是透過某些機制,將TextEncodingNames.strings
與EncodingNames.strings各抓一部分內容,而不是全部採用,少爺到現在還是看
不懂找不到 那個機制是什麼。以下是少爺增補過後的內容:

TextEncodingNames.strings

"0x00010000" = "西方語系(Mac OS Roman)"; /* Western (Mac OS Roman) */
"0x00020000" = "西方語系(Mac OS Roman)"; /* Western (Mac OS Roman) */
"0x00000001" = "日文(Mac OS)"; /* Japanese (Mac OS) */
"0x00010001" = "日文(Mac OS)"; /* Japanese (Mac OS) */
"0x00020001" = "日文(Mac OS)"; /* Japanese (Mac OS) */
"0x00030001" = "日文(Mac OS)"; /* Japanese (Mac OS) */
"0x00040001" = "日文(Mac OS)"; /* Japanese (Mac OS) */
"0x00050001" = "日文(Mac OS)"; /* Japanese (Mac OS) */
"0x00000002" = "繁體中文(Mac OS)"; /* Traditional Chinese (Mac OS) */
"0x00000003" = "韓文(Mac OS)"; /* Korean (Mac OS) */
"0x00000004" = "阿拉伯文(Mac OS)"; /* Arabic (Mac OS) */
"0x00010004" = "阿拉伯文(Mac OS)"; /* Arabic (Mac OS) */
"0x00020004" = "阿拉伯文(Mac OS)"; /* Arabic (Mac OS) */
"0x00030004" = "阿拉伯文(Mac OS)"; /* Arabic (Mac OS) */
"0x00000005" = "希伯來文(Mac OS)"; /* Hebrew (Mac OS) */
"0x00010005" = "希伯來文(Mac OS)"; /* Hebrew (Mac OS) */
"0x00010006" = "希臘文(Mac OS)"; /* Greek (Mac OS) */
"0x00020006" = "希臘文(Mac OS)"; /* Greek (Mac OS) */
"0x00010007" = "斯拉夫語系(Mac OS)"; /* Cyrillic (Mac OS) */
"0x00020007" = "烏克蘭文(Mac OS)"; /* Ukrainian (Mac OS) */
"0x00030007" = "斯拉夫語系(Mac OS)"; /* Cyrillic (Mac OS) */
"0x00000009" = "梵文(Mac OS)"; /* Devanagari (Mac OS) */
"0x0000000A" = "古爾穆奇語(Mac OS)"; /* Gurmukhi (Mac OS) */
"0x0000000B" = "古吉拉特語(Mac OS)"; /* Gujarati (Mac OS) */
"0x00000015" = "泰文(Mac OS)"; /* Thai (Mac OS) */
"0x00000019" = "簡體中文(Mac OS)"; /* Simplified Chinese (Mac OS) */
"0x0000001A" = "藏文(Mac OS)"; /* Tibetan (Mac OS) */
"0x0000001D" = "中歐語系(Mac OS)"; /* Central European (Mac OS) */
"0x00000021" = "符號(Mac OS)"; /* Symbol (Mac OS) */
"0x00000022" = "Dingbats(Mac OS)"; /* Dingbats (Mac OS) */
"0x00000023" = "土耳其文(Mac OS)"; /* Turkish (Mac OS) */
"0x00010024" = "克羅埃西亞文(Mac OS)"; /* Croatian (Mac OS) */
"0x00020024" = "克羅埃西亞文(Mac OS)"; /* Croatian (Mac OS) */
"0x00020025" = "冰島文(Mac OS)"; /* Icelandic (Mac OS) */
"0x00030025" = "冰島文(Mac OS)"; /* Icelandic (Mac OS) */
"0x00040025" = "冰島文(Mac OS)"; /* Icelandic (Mac OS) */
"0x00050025" = "冰島文(Mac OS)"; /* Icelandic (Mac OS) */
"0x00010026" = "羅馬尼亞文(Mac OS)"; /* Romanian (Mac OS) */
"0x00020026" = "羅馬尼亞文(Mac OS)"; /* Romanian (Mac OS) */
"0x00000027" = "Celtic(Mac OS)"; /* Celtic (Mac OS) */
"0x00000028" = "Gaelic(Mac OS)"; /* Gaelic (Mac OS) */
"0x00000029" = "鍵盤符號(Mac OS)"; /* Keyboard Symbols (Mac OS) */
"0x0000008C" = "波斯語(Mac OS)"; /* Farsi (Mac OS) */
"0x0001008C" = "波斯語(Mac OS)"; /* Farsi (Mac OS) */
"0x000000EC" = "Inuit(Mac OS)"; /* Inuit (Mac OS) */
"0x000100FC" = "西方語系(Mac VT100)"; /* Western (Mac VT100) */
"0x000200FC" = "西方語系(Mac VT100)"; /* Western (Mac VT100) */
"0x00000101" = "Unicode 1.1"; /* Unicode 1.1 */
"0x04000101" = "Unicode 1.1 UTF-7"; /* Unicode 1.1 UTF-7 */
"0x08000101" = "Unicode 1.1 UTF-8"; /* Unicode 1.1 UTF-8 */
"0x00000103" = "Unicode 2.1"; /* Unicode 2.1 */
"0x04000103" = "Unicode 2.1 UTF-7"; /* Unicode 2.1 UTF-7 */
"0x08000103" = "Unicode 2.1 UTF-8"; /* Unicode 2.1 UTF-8 */
"0x00020103" = "Unicode 2.1 Canonical Decomposition"; /* Unicode 2.1 Canonical Decomposition */
"0x00000104" = "Unicode 3.0"; /* Unicode 3.0 */
"0x00020104" = "Unicode 3.0 Canonical Decomposition"; /* Unicode 3.0 Canonical Decomposition */
"0x00030104" = "Unicode 3.0 Canonical Composition"; /* Unicode 3.0 Canonical Composition */
"0x00080104" = "Unicode 3.0 HFS Plus Decomposition"; /* Unicode 3.0 HFS Plus Decomposition */
"0x00090104" = "Unicode 3.0 HFS Plus Composition"; /* Unicode 3.0 HFS Plus Composition */
"0x04000104" = "Unicode 3.0 UTF-7"; /* Unicode 3.0 UTF-7 */
"0x08000104" = "Unicode 3.0 UTF-8"; /* Unicode 3.0 UTF-8 */
"0x00000106" = "Unicode 3.2"; /* Unicode 3.2 */
"0x00020106" = "Unicode 3.2 Canonical Decomposition"; /* Unicode 3.2 Canonical Decomposition */
"0x00030106" = "Unicode 3.2 Canonical Composition"; /* Unicode 3.2 Canonical Composition */
"0x00080106" = "Unicode 3.2 HFS Plus Decomposition"; /* Unicode 3.2 HFS Plus Decomposition */
"0x00090106" = "Unicode 3.2 HFS Plus Composition"; /* Unicode 3.2 HFS Plus Composition */
"0x04000106" = "Unicode 3.2 UTF-7"; /* Unicode 3.2 UTF-7 */
"0x08000106" = "Unicode 3.2 UTF-8"; /* Unicode 3.2 UTF-8 */
"0x00000108" = "Unicode 4.0"; /* Unicode 4.0 */
"0x00020108" = "Unicode 4.0 Canonical Decomposition"; /* Unicode 4.0 Canonical Decomposition */
"0x00030108" = "Unicode 4.0 Canonical Composition"; /* Unicode 4.0 Canonical Composition */
"0x00080108" = "Unicode 4.0 HFS Plus Decomposition"; /* Unicode 4.0 HFS Plus Decomposition */
"0x00090108" = "Unicode 4.0 HFS Plus Composition"; /* Unicode 4.0 HFS Plus Composition */
"0x04000108" = "Unicode 4.0 UTF-7"; /* Unicode 4.0 UTF-7 */
"0x08000108" = "Unicode 4.0 UTF-8"; /* Unicode 4.0 UTF-8 */
"0x00000201" = "西方語系(ISO Latin 1)"; /* Western (ISO Latin 1) */
"0x00010201" = "西方語系(Music CD Latin 1)"; /* Western (Music CD Latin 1) */
"0x00000202" = "中歐語系(ISO Latin 2)"; /* Central European (ISO Latin 2) */
"0x00000203" = "西方語系(ISO Latin 3)"; /* Western (ISO Latin 3) */
"0x00000204" = "中歐語系(ISO Latin 4)"; /* Central European (ISO Latin 4) */
"0x00000205" = "斯拉夫語系(ISO 8859-5)"; /* Cyrillic (ISO 8859-5) */
"0x00000206" = "阿拉伯文(ISO 8859-6)"; /* Arabic (ISO 8859-6) */
"0x00010206" = "阿拉伯文(ISO 8859-6 visual order)"; /* Arabic (ISO 8859-6 visual order) */
"0x00020206" = "阿拉伯文(ISO 8859-6 explicit order)"; /* Arabic (ISO 8859-6 explicit order) */
"0x00000207" = "希臘文(ISO 8859-7)"; /* Greek (ISO 8859-7) */
"0x00000208" = "希伯來文(ISO 8859-8 implicit order)"; /* Hebrew (ISO 8859-8 implicit order) */
"0x00010208" = "希伯來文(ISO 8859-8 visual order)"; /* Hebrew (ISO 8859-8 visual order) */
"0x00020208" = "希伯來文(ISO 8859-8 explicit order)"; /* Hebrew (ISO 8859-8 explicit order) */
"0x00000209" = "土耳其文(ISO Latin 5)"; /* Turkish (ISO Latin 5) */
"0x0000020A" = "Western(ISO Latin 6)"; /* Western (ISO Latin 6) */
"0x0000020F" = "西方語系(ISO Latin 9)"; /* Western (ISO Latin 9) */
"0x00000210" = "羅馬尼亞文(ISO Latin 10)"; /* Romanian (ISO Latin 10) */
"0x00000400" = "拉丁美洲語系(DOS)"; /* Latin-US (DOS) */
"0x00000405" = "希臘文(DOS)"; /* Greek (DOS) */
"0x00000406" = "環波羅的海語系(DOS)"; /* Baltic Rim (DOS) */
"0x00000410" = "西方語系(DOS Latin 1)"; /* Western (DOS Latin 1) */
"0x00000411" = "Greek(DOS Greek 1)"; /* Greek (DOS Greek 1) */
"0x00000412" = "中歐語系(DOS Latin 2)"; /* Central European (DOS Latin 2) */
"0x00000413" = "Cyrillic(DOS)"; /* Cyrillic (DOS) */
"0x00000414" = "土耳其文(DOS)"; /* Turkish (DOS) */
"0x00000415" = "Portuguese(DOS)"; /* Portuguese (DOS) */
"0x00000416" = "冰島文(DOS)"; /* Icelandic (DOS) */
"0x00000417" = "Hebrew(DOS)"; /* Hebrew (DOS) */
"0x00000418" = "Canadian French(DOS)"; /* Canadian French (DOS) */
"0x00000419" = "阿拉伯文(DOS)"; /* Arabic (DOS) */
"0x0000041A" = "Nordic(DOS)"; /* Nordic (DOS) */
"0x0000041B" = "俄文(DOS)"; /* Russian (DOS) */
"0x0000041C" = "Greek(DOS Greek 2)"; /* Greek (DOS Greek 2) */
"0x0000041D" = "泰文(Windows, DOS)"; /* Thai (Windows, DOS) */
"0x00000420" = "日文(Windows, DOS)"; /* Japanese (Windows, DOS) */
"0x00010420" = "日文(Palm)"; /* Japanese (Palm) */
"0x00000421" = "簡體中文(Windows, DOS)"; /* Simplified Chinese (Windows, DOS) */
"0x00000422" = "韓文(Windows, DOS)"; /* Korean (Windows, DOS) */
"0x00000423" = "繁體中文(Windows, DOS)"; /* Traditional Chinese (Windows, DOS) */
"0x00000500" = "西方語系(Windows Latin 1)"; /* Western (Windows Latin 1) */
"0x00010500" = "西方語系(Palm Latin 1)"; /* Western (Palm Latin 1) */
"0x00000501" = "中歐語系(Windows Latin 2)"; /* Central European (Windows Latin 2) */
"0x00000502" = "斯拉夫語系(Windows)"; /* Cyrillic (Windows) */
"0x00000503" = "希臘文(Windows)"; /* Greek (Windows) */
"0x00000504" = "土耳其文(Windows Latin 5)"; /* Turkish (Windows Latin 5) */
"0x00000505" = "希伯來文(Windows)"; /* Hebrew (Windows) */
"0x00000506" = "阿拉伯文(Windows)"; /* Arabic (Windows) */
"0x00000507" = "環波羅的海語系(Windows)"; /* Baltic Rim (Windows) */
"0x00000508" = "越南文(Windows)"; /* Vietnamese (Windows) */
"0x00000600" = "西方語系(ASCII)"; /* Western (ASCII) */
"0x00000601" = "西方語系(ANSEL)"; /* Western (ANSEL) */
"0x00000622" = "日文(JIS X0208)"; /* Japanese (JIS X0208) */
"0x00000628" = "日文(Shift JIS X0213)"; /* Japanese (Shift JIS X0213) */
"0x00000630" = "簡體中文(GB 2312)"; /* Simplified Chinese (GB 2312) */
"0x00000631" = "中文(GBK)"; /* Chinese (GBK) */
"0x00000632" = "中文(GB 18030)"; /* Chinese (GB 18030) */
"0x00000640" = "韓文(KSC 5601-1987)"; /* Korean (KSC 5601-1987) */
"0x00000820" = "日文(ISO 2022-JP)"; /* Japanese (ISO 2022-JP) */
"0x00000821" = "日文(ISO 2022-JP-2)"; /* Japanese (ISO 2022-JP-2) */
"0x00000822" = "日文(ISO 2022-JP-1)"; /* Japanese (ISO 2022-JP-1) */
"0x00000830" = "簡體中文(ISO 2022-CN)"; /* Simplified Chinese (ISO 2022-CN) */
"0x00000840" = "韓文(ISO 2022-KR)"; /* Korean (ISO 2022-KR) */
"0x00000920" = "日文(EUC)"; /* Japanese (EUC) */
"0x00000930" = "簡體中文(EUC)"; /* Simplified Chinese (EUC) */
"0x00010930" = "簡體中文(EUC)"; /* Simplified Chinese (EUC) */
"0x00000931" = "繁體中文(EUC)"; /* Traditional Chinese (EUC) */
"0x00000940" = "韓文(EUC)"; /* Korean (EUC) */
"0x00010940" = "韓文(EUC)"; /* Korean (EUC) */
"0x00000A01" = "日文(Shift JIS)"; /* Japanese (Shift JIS) */
"0x00010A01" = "日文(Shift JIS)"; /* Japanese (Shift JIS) */
"0x00000A02" = "俄文(KOI8-R)"; /* Russian (KOI8-R) */
"0x00000A03" = "繁體中文(Big 5)"; /* Traditional Chinese (Big 5) */
"0x00030A03" = "繁體中文(Big 5)"; /* Traditional Chinese (Big 5) */
"0x00020A04" = "西方語系(Mac Mail)"; /* Western (Mac Mail) */
"0x00060A04" = "土耳其文(Mac Mail)"; /* Turkish (Mac Mail) */
"0x000B0A04" = "冰島文(Mac Mail)"; /* Icelandic (Mac Mail) */
"0x000E0A04" = "羅馬尼亞文(Mac Mail)"; /* Romanian (Mac Mail) */
"0x00000A05" = "簡體中文(HZ)"; /* Simplified Chinese (HZ) */
"0x00000A06" = "繁體中文(Big 5 HKSCS)"; /* Traditional Chinese (Big 5 HKSCS) */
"0x00000A08" = "烏克蘭文(KOI8-U)"; /* Ukrainian (KOI8-U) */
"0x00000A09" = "繁體中文(Big 5-E)"; /* Traditional Chinese (Big 5-E) */
"0x00000B01" = "西方語系(NextStep)"; /* Western (NextStep) */
"0x00000B02" = "日語(NextStep)"; /* Japanese (NextStep) */
"0x00000C02" = "西方語系(EBCDIC Latin 1)"; /* Western (EBCDIC Latin 1) */

EncodingNames.strings

"Western (Mac OS Roman)" = "西方語系(Mac OS Roman)";
"Japanese (Mac OS)" = "日文(Mac OS)";
"Traditional Chinese (Mac OS)" = "繁體中文(Mac OS)";
"Korean (Mac OS)" = "韓文(Mac OS)";
"Arabic (Mac OS)" = "阿拉伯文(Mac OS)";
"Hebrew (Mac OS)" = "希伯來文(Mac OS)";
"Greek (Mac OS)" = "希臘文(Mac OS)";
"Cyrillic (Mac OS)" = "斯拉夫語系(Mac OS)";
"Devanagari (Mac OS)" = "梵文(Mac OS)";
"Gurmukhi (Mac OS)" = "古爾穆奇語(Mac OS)";
"Gujarati (Mac OS)" = "古吉拉特語(Mac OS)";
"Thai (Mac OS)" = "泰文(Mac OS)";
"Simplified Chinese (Mac OS)" = "簡體中文(Mac OS)";
"Tibetan (Mac OS)" = "藏文(Mac OS)";
"Central European (Mac OS)" = "中歐語系(Mac OS)";
"Symbol (Mac OS)" = "符號(Mac OS)";
"Dingbats (Mac OS)" = "Dingbats(Mac OS)";
"Turkish (Mac OS)" = "土耳其文(Mac OS)";
"Croatian (Mac OS)" = "克羅埃西亞文(Mac OS)";
"Icelandic (Mac OS)" = "冰島文(Mac OS)";
"Romanian (Mac OS)" = "羅馬尼亞文(Mac OS)";
"Celtic (Mac OS)" = "Celtic(Mac OS)";
"Gaelic (Mac OS)" = "Gaelic(Mac OS)";
"Keyboard Symbols (Mac OS)" = "鍵盤符號(Mac OS)";
"Farsi (Mac OS)" = "波斯語(Mac OS)";
"Inuit (Mac OS)" = "Inuit(Mac OS)";
"Cyrillic (Mac OS Ukrainian)" = "斯拉夫語系(Mac OS Ukrainian)";
"Western (Mac VT100)" = "西方語系(Mac VT100)";
"Western (Mac Mail)" = "西方語系(Mac Mail)";
"Turkish (Mac Mail)" = "土耳其文(Mac Mail)";
"Icelandic (Mac Mail)" = "冰島文(Mac Mail)";
"Romanian (Mac Mail)" = "羅馬尼亞文(Mac Mail)";
"Unicode (UTF-8)" = "Unicode(UTF-8)";
"Unicode (UTF-16)" = "Unicode(UTF-16)";
"Unicode (UTF-16BE)" = "Unicode(UTF-16BE)";
"Unicode (UTF-16LE)" = "Unicode(UTF-16LE)";
"Unicode (UTF-32)" = "Unicode(UTF-32)";
"Unicode (UTF-32BE)" = "Unicode(UTF-32BE)";
"Unicode (UTF-32LE)" = "Unicode(UTF-32LE)";
"Western (Music CD Latin 1)" = "西方語系(Music CD Latin 1)";
"Western (ISO Latin 1)" = "西方語系(ISO Latin 1)";
"Central European (ISO Latin 2)" = "中歐語系(ISO Latin 2)";
"Western (ISO Latin 3)" = "西方語系(ISO Latin 3)";
"Central European (ISO Latin 4)" = "中歐語系(ISO Latin 4)";
"Turkish (ISO Latin 5)" = "土耳其文(ISO Latin 5)";
"Nordic (ISO Latin 6)" = "日耳曼語系(ISO Latin 6)";
"Baltic Rim (ISO Latin 7)" = "環波羅的海語系(ISO Latin 7)";
"Celtic (ISO Latin 8)" = "克爾特語(ISO Latin 8)";
"Western (ISO Latin 9)" = "西方語系(ISO Latin 9)";
"Romanian (ISO Latin 10)" = "羅馬尼亞文(ISO Latin 10)";
"Cyrillic (ISO 8859-5)" = "斯拉夫語系(ISO 8859-5)";
"Arabic (ISO 8859-6)" = "阿拉伯文(ISO 8859-6)";
"Arabic (ISO 8859-6 visual order)" = "阿拉伯文(ISO 8859-6 visual order)";
"Arabic (ISO 8859-6 explicit order)" = "阿拉伯文(ISO 8859-6 explicit order)";
"Greek (ISO 8859-7)" = "希臘文(ISO 8859-7)";
"Hebrew (ISO 8859-8)" = "希伯來文(ISO 8859-8)";
"Hebrew (ISO 8859-8 implicit order)" = "希伯來文(ISO 8859-8 implicit order)";
"Hebrew (ISO 8859-8 visual order)" = "希伯來文(ISO 8859-8 visual order)";
"Hebrew (ISO 8859-8 explicit order)" = "希伯來文(ISO 8859-8 explicit order)";
"Thai (ISO 8859-11)" = "泰文(ISO 8859-11)";
"Japanese (ISO 2022-JP)" = "日文(ISO 2022-JP)";
"Japanese (ISO 2022-JP-1)" = "日文(ISO 2022-JP-1)";
"Japanese (ISO 2022-JP-2)" = "日文(ISO 2022-JP-2)";
"Korean (ISO 2022-KR)" = "韓文(ISO 2022-KR)";
"Latin-US (DOS)" = "拉丁美洲語系(DOS)";
"Greek (DOS)" = "希臘文(DOS)";
"Baltic Rim (DOS)" = "環波羅的海語系(DOS)";
"Turkish (DOS)" = "土耳其文(DOS)";
"Portuguese (DOS)" = "Portuguese(DOS)";
"Icelandic (DOS)" = "冰島文(DOS)";
"Hebrew (DOS)" = "Hebrew(DOS)";
"Canadian French (DOS)" = "Canadian French(DOS)";
"Arabic (DOS)" = "阿拉伯文(DOS)";
"Nordic (DOS)" = "Nordic(DOS)";
"Russian (DOS)" = "俄文(DOS)";
"Greek (DOS Greek 1)" = "俄文(DOS Greek 1)";
"Greek (DOS Greek 2)" = "俄文(DOS Greek 2)";
"Cyrillic (DOS)" = "斯拉夫語系(DOS)";
"Western (DOS Latin 1)" = "西方語系(DOS Latin 1)";
"Central European (DOS Latin 2)" = "中歐語系(DOS Latin 2)";
"Thai (Windows, DOS)" = "泰文(Windows, DOS)";
"Japanese (Windows, DOS)" = "日文(Windows, DOS)";
"Simplified Chinese (Windows, DOS)" = "簡體中文(Windows, DOS)";
"Korean (Windows, DOS)" = "韓文(Windows, DOS)";
"Traditional Chinese (Windows, DOS)" = "繁體中文(Windows, DOS)";
"Western (Windows Latin 1)" = "西方語系(Windows Latin 1)";
"Central European (Windows Latin 2)" = "中歐語系(Windows Latin 2)";
"Turkish (Windows Latin 5)" = "土耳其文(Windows Latin 5)";
"Cyrillic (Windows)" = "斯拉夫語系(Windows)";
"Greek (Windows)" = "希臘文(Windows)";
"Hebrew (Windows)" = "希伯來文(Windows)";
"Arabic (Windows)" = "阿拉伯文(Windows)";
"Baltic Rim (Windows)" = "環波羅的海語系(Windows)";
"Vietnamese (Windows)" = "越南文(Windows)";
"Japanese (EUC)" = "日文(EUC)";
"Simplified Chinese (EUC)" = "簡體中文(EUC)";
"Traditional Chinese (EUC)" = "繁體中文(EUC)";
"Korean (EUC)" = "韓文(EUC)";
"Japanese (Palm)" = "日文(Palm)";
"Western (Palm Latin 1)" = "西方語系(Palm Latin 1)";
"Western (ASCII)" = "西方語系(ASCII)";
"Non-lossy ASCII" = "無耗損 ASCII";
"Western (ANSEL)" = "西方語系(ANSEL)";
"Japanese (Shift JIS)" = "日文(Shift JIS)";
"Japanese (Shift JIS X0213)" = "日文(Shift JIS X0213)";
"Japanese (JIS X0208)" = "日文(JIS X0208)";
"Korean (KSC 5601-1987)" = "韓文(KSC 5601-1987)";
"Simplified Chinese (HZ GB 2312)" = "簡體中文(HZ GB 2312)";
"Simplified Chinese (GB 2312)" = "簡體中文(GB 2312)";
"Simplified Chinese (HZ)" = "簡體中文(HZ)";
"Chinese (GBK)" = "中文(GBK)";
"Chinese (GB 18030)" = "中文(GB 18030)";
"Traditional Chinese (Big 5)" = "繁體中文(Big 5)";
"Traditional Chinese (Big 5 HKSCS)" = "繁體中文(Big 5 HKSCS)";
"Traditional Chinese (Big 5-E)" = "繁體中文(Big 5-E)";
"Ukrainian (KOI8-U)" = "烏克蘭文(KOI8-U)";
"Russian (KOI8-R)" = "俄文(KOI8-R)";
"Cyrillic (KOI8-R)" = "斯拉夫語系(KOI8-R)";
"Western (EBCDIC Latin 1)" = "西方語系(EBCDIC Latin 1)";
"Japanese (Auto Detect)" = "日文(自動偵測)";
"Western (NextStep)" = "西方語系(NextStep)";
"Japanese (NextStep)" = "日語(NextStep)";

另外少爺把TextEncodingNames.strings、EncodingNames.strings這兩個檔案重
新混合整理排序後,排出以下兩種內容版本:

依照作業系統平台來分類:

"0x00010000" = "西方語系(Mac OS Roman)"; /* Western (Mac OS Roman) */
"0x00000001" = "日文(Mac OS)"; /* Japanese (Mac OS) */
"0x00000002" = "繁體中文(Mac OS)"; /* Traditional Chinese (Mac OS) */
"0x00000003" = "韓文(Mac OS)"; /* Korean (Mac OS) */
"0x00000004" = "阿拉伯文(Mac OS)"; /* Arabic (Mac OS) */
"0x00000005" = "希伯來文(Mac OS)"; /* Hebrew (Mac OS) */
"0x00010006" = "希臘文(Mac OS)"; /* Greek (Mac OS) */
"0x00010007" = "斯拉夫語系(Mac OS)"; /* Cyrillic (Mac OS) */
"0x00020007" = "烏克蘭文(Mac OS)"; /* Ukrainian (Mac OS) */
"0x00000009" = "梵文(Mac OS)"; /* Devanagari (Mac OS) */
"0x0000000A" = "古爾穆奇語(Mac OS)"; /* Gurmukhi (Mac OS) */
"0x0000000B" = "古吉拉特語(Mac OS)"; /* Gujarati (Mac OS) */
"0x00000015" = "泰文(Mac OS)"; /* Thai (Mac OS) */
"0x00000019" = "簡體中文(Mac OS)"; /* Simplified Chinese (Mac OS) */
"0x0000001A" = "藏文(Mac OS)"; /* Tibetan (Mac OS) */
"0x0000001D" = "中歐語系(Mac OS)"; /* Central European (Mac OS) */
"0x00000021" = "符號(Mac OS)"; /* Symbol (Mac OS) */
"0x00000022" = "Dingbats(Mac OS)"; /* Dingbats (Mac OS) */
"0x00000023" = "土耳其文(Mac OS)"; /* Turkish (Mac OS) */
"0x00010024" = "克羅埃西亞文(Mac OS)"; /* Croatian (Mac OS) */
"0x00020025" = "冰島文(Mac OS)"; /* Icelandic (Mac OS) */
"0x00010026" = "羅馬尼亞文(Mac OS)"; /* Romanian (Mac OS) */
"0x00000027" = "Celtic (Mac OS)"; /* Celtic (Mac OS) */
"0x00000028" = "Gaelic (Mac OS)"; /* Gaelic (Mac OS) */
"0x00000029" = "鍵盤符號(Mac OS)"; /* Keyboard Symbols (Mac OS) */
"0x0000008C" = "波斯語(Mac OS)"; /* Farsi (Mac OS) */
"0x000000EC" = "Inuit (Mac OS)"; /* Inuit (Mac OS) */
"0x000100FC" = "西方語系(Mac VT100)"; /* Western (Mac VT100) */
"0x00020A04" = "西方語系(Mac Mail)"; /* Western (Mac Mail) */
"0x00060A04" = "土耳其文(Mac Mail)"; /* Turkish (Mac Mail) */
"0x000B0A04" = "冰島文(Mac Mail)"; /* Icelandic (Mac Mail) */
"0x000E0A04" = "羅馬尼亞文(Mac Mail)"; /* Romanian (Mac Mail) */
"Cyrillic (Mac OS Ukrainian)" = "斯拉夫語系(Mac OS Ukrainian)";

"0x00000101" = "Unicode 1.1"; /* Unicode 1.1 */
"0x04000101" = "Unicode 1.1 UTF-7"; /* Unicode 1.1 UTF-7 */
"0x08000101" = "Unicode 1.1 UTF-8"; /* Unicode 1.1 UTF-8 */
"0x00000103" = "Unicode 2.1"; /* Unicode 2.1 */
"0x04000103" = "Unicode 2.1 UTF-7"; /* Unicode 2.1 UTF-7 */
"0x08000103" = "Unicode 2.1 UTF-8"; /* Unicode 2.1 UTF-8 */
"0x00020103" = "Unicode 2.1 Canonical Decomposition"; /* Unicode 2.1 Canonical Decomposition */
"0x00000104" = "Unicode 3.0"; /* Unicode 3.0 */
"0x00020104" = "Unicode 3.0 Canonical Decomposition"; /* Unicode 3.0 Canonical Decomposition */
"0x00030104" = "Unicode 3.0 Canonical Composition"; /* Unicode 3.0 Canonical Composition */
"0x00080104" = "Unicode 3.0 HFS Plus Decomposition"; /* Unicode 3.0 HFS Plus Decomposition */
"0x00090104" = "Unicode 3.0 HFS Plus Composition"; /* Unicode 3.0 HFS Plus Composition */
"0x04000104" = "Unicode 3.0 UTF-7"; /* Unicode 3.0 UTF-7 */
"0x08000104" = "Unicode 3.0 UTF-8"; /* Unicode 3.0 UTF-8 */
"0x00000106" = "Unicode 3.2"; /* Unicode 3.2 */
"0x00020106" = "Unicode 3.2 Canonical Decomposition"; /* Unicode 3.2 Canonical Decomposition */
"0x00030106" = "Unicode 3.2 Canonical Composition"; /* Unicode 3.2 Canonical Composition */
"0x00080106" = "Unicode 3.2 HFS Plus Decomposition"; /* Unicode 3.2 HFS Plus Decomposition */
"0x00090106" = "Unicode 3.2 HFS Plus Composition"; /* Unicode 3.2 HFS Plus Composition */
"0x04000106" = "Unicode 3.2 UTF-7"; /* Unicode 3.2 UTF-7 */
"0x08000106" = "Unicode 3.2 UTF-8"; /* Unicode 3.2 UTF-8 */
"0x00000108" = "Unicode 4.0"; /* Unicode 4.0 */
"0x00020108" = "Unicode 4.0 Canonical Decomposition"; /* Unicode 4.0 Canonical Decomposition */
"0x00030108" = "Unicode 4.0 Canonical Composition"; /* Unicode 4.0 Canonical Composition */
"0x00080108" = "Unicode 4.0 HFS Plus Decomposition"; /* Unicode 4.0 HFS Plus Decomposition */
"0x00090108" = "Unicode 4.0 HFS Plus Composition"; /* Unicode 4.0 HFS Plus Composition */
"0x04000108" = "Unicode 4.0 UTF-7"; /* Unicode 4.0 UTF-7 */
"0x08000108" = "Unicode 4.0 UTF-8"; /* Unicode 4.0 UTF-8 */
"Unicode (UTF-32BE)" = "Unicode(UTF-32BE)";
"Unicode (UTF-8)" = "Unicode(UTF-8)";
"Unicode (UTF-16)" = "Unicode(UTF-16)";
"Unicode (UTF-16BE)" = "Unicode(UTF-16BE)";
"Unicode (UTF-16LE)" = "Unicode(UTF-16LE)";
"Unicode (UTF-32)" = "Unicode(UTF-32)";
"Unicode (UTF-32LE)" = "Unicode(UTF-32LE)";

"0x00000201" = "西方語系(ISO Latin 1)"; /* Western (ISO Latin 1) */
"0x00010201" = "西方語系(Music CD Latin 1)"; /* Western (Music CD Latin 1) */
"0x00000202" = "中歐語系(ISO Latin 2)"; /* Central European (ISO Latin 2) */
"0x00000203" = "西方語系(ISO Latin 3)"; /* Western (ISO Latin 3) */
"0x00000204" = "中歐語系(ISO Latin 4)"; /* Central European (ISO Latin 4) */
"0x00000209" = "土耳其文(ISO Latin 5)"; /* Turkish (ISO Latin 5) */
"0x0000020A" = "Western (ISO Latin 6)"; /* Western (ISO Latin 6) */
"0x0000020F" = "西方語系(ISO Latin 9)"; /* Western (ISO Latin 9) */
"0x00000210" = "羅馬尼亞文(ISO Latin 10)"; /* Romanian (ISO Latin 10) */
"0x00000205" = "斯拉夫語系(ISO 8859-5)"; /* Cyrillic (ISO 8859-5) */
"0x00000206" = "阿拉伯文(ISO 8859-6)"; /* Arabic (ISO 8859-6) */
"0x00010206" = "阿拉伯文(ISO 8859-6 visual order)"; /* Arabic (ISO 8859-6 visual order) */
"0x00020206" = "阿拉伯文(ISO 8859-6 explicit order)"; /* Arabic (ISO 8859-6 explicit order) */
"0x00000207" = "希臘文(ISO 8859-7)"; /* Greek (ISO 8859-7) */
"0x00000208" = "希伯來文(ISO 8859-8 implicit order)"; /* Hebrew (ISO 8859-8 implicit order) */
"0x00010208" = "希伯來文(ISO 8859-8 visual order)"; /* Hebrew (ISO 8859-8 visual order) */
"0x00020208" = "希伯來文(ISO 8859-8 explicit order)"; /* Hebrew (ISO 8859-8 explicit order) */
"0x00000820" = "日文(ISO 2022-JP)"; /* Japanese (ISO 2022-JP) */
"0x00000822" = "日文(ISO 2022-JP-1)"; /* Japanese (ISO 2022-JP-1) */
"0x00000821" = "日文(ISO 2022-JP-2)"; /* Japanese (ISO 2022-JP-2) */
"0x00000830" = "簡體中文(ISO 2022-CN)"; /* Simplified Chinese (ISO 2022-CN) */
"0x00000840" = "韓文(ISO 2022-KR)"; /* Korean (ISO 2022-KR) */
"Nordic (ISO Latin 6)" = "日耳曼語系(ISO Latin 6)";
"Baltic Rim (ISO Latin 7)" = "環波羅的海語系(ISO Latin 7)";
"Celtic (ISO Latin 8)" = "克爾特語(ISO Latin 8)";
"Hebrew (ISO 8859-8)" = "希伯來文(ISO 8859-8)";
"Thai (ISO 8859-11)" = "泰文(ISO 8859-11)";

"0x00000400" = "拉丁美洲語系(DOS)"; /* Latin-US (DOS) */
"0x00000405" = "希臘文(DOS)"; /* Greek (DOS) */
"0x00000406" = "環波羅的海語系(DOS)"; /* Baltic Rim (DOS) */
"0x00000413" = "Cyrillic (DOS)"; /* Cyrillic (DOS) */
"0x00000414" = "土耳其文(DOS)"; /* Turkish (DOS) */
"0x00000415" = "Portuguese (DOS)"; /* Portuguese (DOS) */
"0x00000416" = "冰島文(DOS)"; /* Icelandic (DOS) */
"0x00000417" = "Hebrew (DOS)"; /* Hebrew (DOS) */
"0x00000418" = "Canadian French (DOS)"; /* Canadian French (DOS) */
"0x00000419" = "阿拉伯文(DOS)"; /* Arabic (DOS) */
"0x0000041A" = "Nordic (DOS)"; /* Nordic (DOS) */
"0x0000041B" = "俄文(DOS)"; /* Russian (DOS) */
"0x00000410" = "西方語系(DOS Latin 1)"; /* Western (DOS Latin 1) */
"0x00000412" = "中歐語系(DOS Latin 2)"; /* Central European (DOS Latin 2) */
"0x00000411" = "Greek (DOS Greek 1)"; /* Greek (DOS Greek 1) */
"0x0000041C" = "Greek (DOS Greek 2)"; /* Greek (DOS Greek 2) */
"0x0000041D" = "泰文(Windows, DOS)"; /* Thai (Windows, DOS) */
"0x00000420" = "日文(Windows, DOS)"; /* Japanese (Windows, DOS) */
"0x00000421" = "簡體中文(Windows, DOS)"; /* Simplified Chinese (Windows, DOS) */
"0x00000422" = "韓文(Windows, DOS)"; /* Korean (Windows, DOS) */
"0x00000423" = "繁體中文(Windows, DOS)"; /* Traditional Chinese (Windows, DOS) */
"0x00000500" = "西方語系(Windows Latin 1)"; /* Western (Windows Latin 1) */
"0x00000501" = "中歐語系(Windows Latin 2)"; /* Central European (Windows Latin 2) */
"0x00000504" = "土耳其文(Windows Latin 5)"; /* Turkish (Windows Latin 5) */
"0x00000502" = "斯拉夫語系(Windows)"; /* Cyrillic (Windows) */
"0x00000503" = "希臘文(Windows)"; /* Greek (Windows) */
"0x00000505" = "希伯來文(Windows)"; /* Hebrew (Windows) */
"0x00000506" = "阿拉伯文(Windows)"; /* Arabic (Windows) */
"0x00000507" = "環波羅的海語系(Windows)"; /* Baltic Rim (Windows) */
"0x00000508" = "越南文(Windows)"; /* Vietnamese (Windows) */

"0x00000920" = "日文(EUC)"; /* Japanese (EUC) */
"0x00000930" = "簡體中文(EUC)"; /* Simplified Chinese (EUC) */
"0x00000931" = "繁體中文(EUC)"; /* Traditional Chinese (EUC) */
"0x00000940" = "韓文(EUC)"; /* Korean (EUC) */

"0x00010420" = "日文(Palm)"; /* Japanese (Palm) */
"0x00010500" = "西方語系(Palm Latin 1)"; /* Western (Palm Latin 1) */

"0x00000600" = "西方語系(ASCII)"; /* Western (ASCII) */
"0x00000601" = "西方語系(ANSEL)"; /* Western (ANSEL) */
"0x00000622" = "日文(JIS X0208)"; /* Japanese (JIS X0208) */
"0x00000A01" = "日文(Shift JIS)"; /* Japanese (Shift JIS) */
"0x00000628" = "日文(Shift JIS X0213)"; /* Japanese (Shift JIS X0213) */
"0x00000640" = "韓文(KSC 5601-1987)"; /* Korean (KSC 5601-1987) */
"0x00000630" = "簡體中文(GB 2312)"; /* Simplified Chinese (GB 2312) */
"0x00000631" = "中文(GBK)"; /* Chinese (GBK) */
"0x00000632" = "中文(GB 18030)"; /* Chinese (GB 18030) */
"0x00000A05" = "簡體中文(HZ)"; /* Simplified Chinese (HZ) */
"0x00000A03" = "繁體中文(Big 5)"; /* Traditional Chinese (Big 5) */
"0x00000A06" = "繁體中文(Big 5 HKSCS)"; /* Traditional Chinese (Big 5 HKSCS) */
"0x00000A09" = "繁體中文(Big 5-E)"; /* Traditional Chinese (Big 5-E) */
"0x00000A02" = "俄文(KOI8-R)"; /* Russian (KOI8-R) */
"0x00000A08" = "烏克蘭文(KOI8-U)"; /* Ukrainian (KOI8-U) */
"Cyrillic (KOI8-R)" = "斯拉夫語系(KOI8-R)";
"Simplified Chinese (HZ GB 2312)" = "簡體中文(HZ GB 2312)";
"Non-lossy ASCII" = "無耗損 ASCII";
"Japanese (Auto Detect)" = "日文(自動偵測)";

"0x00000B01" = "西方語系(NextStep)"; /* Western (NextStep) */
"0x00000B02" = "日語(NextStep)"; /* Japanese (NextStep) */

"0x00000C02" = "西方語系(EBCDIC Latin 1)"; /* Western (EBCDIC Latin 1) */

依照語言或地區的文字來分類:

"0x00010000" = "西方語系(Mac OS Roman)"; /* Western (Mac OS Roman) */
"0x000100FC" = "西方語系(Mac VT100)"; /* Western (Mac VT100) */
"0x00020A04" = "西方語系(Mac Mail)"; /* Western (Mac Mail) */
"0x00000201" = "西方語系(ISO Latin 1)"; /* Western (ISO Latin 1) */
"0x00010201" = "西方語系(Music CD Latin 1)"; /* Western (Music CD Latin 1) */
"0x00000203" = "西方語系(ISO Latin 3)"; /* Western (ISO Latin 3) */
"0x0000020A" = "Western (ISO Latin 6)"; /* Western (ISO Latin 6) */
"0x0000020F" = "西方語系(ISO Latin 9)"; /* Western (ISO Latin 9) */
"0x00000410" = "西方語系(DOS Latin 1)"; /* Western (DOS Latin 1) */
"0x00000500" = "西方語系(Windows Latin 1)"; /* Western (Windows Latin 1) */
"0x00010500" = "西方語系(Palm Latin 1)"; /* Western (Palm Latin 1) */
"0x00000600" = "西方語系(ASCII)"; /* Western (ASCII) */
"0x00000601" = "西方語系(ANSEL)"; /* Western (ANSEL) */
"0x00000B01" = "西方語系(NextStep)"; /* Western (NextStep) */
"0x00000C02" = "西方語系(EBCDIC Latin 1)"; /* Western (EBCDIC Latin 1) */
"Non-lossy ASCII" = "無耗損 ASCII";

"0x00000001" = "日文(Mac OS)"; /* Japanese (Mac OS) */
"0x00000420" = "日文(Windows, DOS)"; /* Japanese (Windows, DOS) */
"0x00010420" = "日文(Palm)"; /* Japanese (Palm) */
"0x00000622" = "日文(JIS X0208)"; /* Japanese (JIS X0208) */
"0x00000A01" = "日文(Shift JIS)"; /* Japanese (Shift JIS) */
"0x00000628" = "日文(Shift JIS X0213)"; /* Japanese (Shift JIS X0213) */
"0x00000820" = "日文(ISO 2022-JP)"; /* Japanese (ISO 2022-JP) */
"0x00000822" = "日文(ISO 2022-JP-1)"; /* Japanese (ISO 2022-JP-1) */
"0x00000821" = "日文(ISO 2022-JP-2)"; /* Japanese (ISO 2022-JP-2) */
"0x00000920" = "日文(EUC)"; /* Japanese (EUC) */
"0x00000B02" = "日語(NextStep)"; /* Japanese (NextStep) */
"Japanese (Auto Detect)" = "日文(自動偵測)";

"0x00000002" = "繁體中文(Mac OS)"; /* Traditional Chinese (Mac OS) */
"0x00000423" = "繁體中文(Windows, DOS)"; /* Traditional Chinese (Windows, DOS) */
"0x00000931" = "繁體中文(EUC)"; /* Traditional Chinese (EUC) */
"0x00000A03" = "繁體中文(Big 5)"; /* Traditional Chinese (Big 5) */
"0x00000A06" = "繁體中文(Big 5 HKSCS)"; /* Traditional Chinese (Big 5 HKSCS) */
"0x00000A09" = "繁體中文(Big 5-E)"; /* Traditional Chinese (Big 5-E) */

"0x00000003" = "韓文(Mac OS)"; /* Korean (Mac OS) */
"0x00000422" = "韓文(Windows, DOS)"; /* Korean (Windows, DOS) */
"0x00000640" = "韓文(KSC 5601-1987)"; /* Korean (KSC 5601-1987) */
"0x00000840" = "韓文(ISO 2022-KR)"; /* Korean (ISO 2022-KR) */
"0x00000940" = "韓文(EUC)"; /* Korean (EUC) */

"0x00000004" = "阿拉伯文(Mac OS)"; /* Arabic (Mac OS) */
"0x00000206" = "阿拉伯文(ISO 8859-6)"; /* Arabic (ISO 8859-6) */
"0x00010206" = "阿拉伯文(ISO 8859-6 visual order)"; /* Arabic (ISO 8859-6 visual order) */
"0x00020206" = "阿拉伯文(ISO 8859-6 explicit order)"; /* Arabic (ISO 8859-6 explicit order) */
"0x00000419" = "阿拉伯文(DOS)"; /* Arabic (DOS) */
"0x00000506" = "阿拉伯文(Windows)"; /* Arabic (Windows) */

"0x00000005" = "希伯來文(Mac OS)"; /* Hebrew (Mac OS) */
"0x00000208" = "希伯來文(ISO 8859-8 implicit order)"; /* Hebrew (ISO 8859-8 implicit order) */
"0x00010208" = "希伯來文(ISO 8859-8 visual order)"; /* Hebrew (ISO 8859-8 visual order) */
"0x00020208" = "希伯來文(ISO 8859-8 explicit order)"; /* Hebrew (ISO 8859-8 explicit order) */
"0x00000417" = "Hebrew (DOS)"; /* Hebrew (DOS) */
"0x00000505" = "希伯來文(Windows)"; /* Hebrew (Windows) */
"Hebrew (ISO 8859-8)" = "希伯來文(ISO 8859-8)";

"0x00010006" = "希臘文(Mac OS)"; /* Greek (Mac OS) */
"0x00000207" = "希臘文(ISO 8859-7)"; /* Greek (ISO 8859-7) */
"0x00000405" = "希臘文(DOS)"; /* Greek (DOS) */
"0x00000411" = "Greek (DOS Greek 1)"; /* Greek (DOS Greek 1) */
"0x0000041C" = "Greek (DOS Greek 2)"; /* Greek (DOS Greek 2) */
"0x00000503" = "希臘文(Windows)"; /* Greek (Windows) */

"0x00010007" = "斯拉夫語系(Mac OS)"; /* Cyrillic (Mac OS) */
"0x00000205" = "斯拉夫語系(ISO 8859-5)"; /* Cyrillic (ISO 8859-5) */
"0x00000413" = "Cyrillic (DOS)"; /* Cyrillic (DOS) */
"0x00000502" = "斯拉夫語系(Windows)"; /* Cyrillic (Windows) */
"Cyrillic (KOI8-R)" = "斯拉夫語系(KOI8-R)";

"0x00020007" = "烏克蘭文(Mac OS)"; /* Ukrainian (Mac OS) */
"0x00000A08" = "烏克蘭文(KOI8-U)"; /* Ukrainian (KOI8-U) */
"Cyrillic (Mac OS Ukrainian)" = "斯拉夫語系(Mac OS Ukrainian)";

"0x00000009" = "梵文(Mac OS)"; /* Devanagari (Mac OS) */

"0x0000000A" = "古爾穆奇語(Mac OS)"; /* Gurmukhi (Mac OS) */

"0x0000000B" = "古吉拉特語(Mac OS)"; /* Gujarati (Mac OS) */

"0x00000015" = "泰文(Mac OS)"; /* Thai (Mac OS) */
"0x0000041D" = "泰文(Windows, DOS)"; /* Thai (Windows, DOS) */
"Thai (ISO 8859-11)" = "泰文(ISO 8859-11)";

"0x00000019" = "簡體中文(Mac OS)"; /* Simplified Chinese (Mac OS) */
"0x00000421" = "簡體中文(Windows, DOS)"; /* Simplified Chinese (Windows, DOS) */
"0x00000830" = "簡體中文(ISO 2022-CN)"; /* Simplified Chinese (ISO 2022-CN) */
"0x00000930" = "簡體中文(EUC)"; /* Simplified Chinese (EUC) */
"0x00000A05" = "簡體中文(HZ)"; /* Simplified Chinese (HZ) */
"0x00000630" = "簡體中文(GB 2312)"; /* Simplified Chinese (GB 2312) */
"0x00000631" = "中文(GBK)"; /* Chinese (GBK) */
"0x00000632" = "中文(GB 18030)"; /* Chinese (GB 18030) */
"Simplified Chinese (HZ GB 2312)" = "簡體中文(HZ GB 2312)";

"0x0000001A" = "藏文(Mac OS)"; /* Tibetan (Mac OS) */

"0x0000001D" = "中歐語系(Mac OS)"; /* Central European (Mac OS) */
"0x00000202" = "中歐語系(ISO Latin 2)"; /* Central European (ISO Latin 2) */
"0x00000204" = "中歐語系(ISO Latin 4)"; /* Central European (ISO Latin 4) */
"0x00000412" = "中歐語系(DOS Latin 2)"; /* Central European (DOS Latin 2) */
"0x00000501" = "中歐語系(Windows Latin 2)"; /* Central European (Windows Latin 2) */

"0x00000021" = "符號(Mac OS)"; /* Symbol (Mac OS) */
"0x00000029" = "鍵盤符號(Mac OS)"; /* Keyboard Symbols (Mac OS) */
"0x00000022" = "Dingbats(Mac OS)"; /* Dingbats (Mac OS) */

"0x00000023" = "土耳其文(Mac OS)"; /* Turkish (Mac OS) */
"0x00000209" = "土耳其文(ISO Latin 5)"; /* Turkish (ISO Latin 5) */
"0x00000414" = "土耳其文(DOS)"; /* Turkish (DOS) */
"0x00000504" = "土耳其文(Windows Latin 5)"; /* Turkish (Windows Latin 5) */
"0x00060A04" = "土耳其文(Mac Mail)"; /* Turkish (Mac Mail) */

"0x00010024" = "克羅埃西亞文(Mac OS)"; /* Croatian (Mac OS) */

"0x00020025" = "冰島文(Mac OS)"; /* Icelandic (Mac OS) */
"0x00000416" = "冰島文(DOS)"; /* Icelandic (DOS) */
"0x000B0A04" = "冰島文(Mac Mail)"; /* Icelandic (Mac Mail) */

"0x00010026" = "羅馬尼亞文(Mac OS)"; /* Romanian (Mac OS) */
"0x00000210" = "羅馬尼亞文(ISO Latin 10)"; /* Romanian (ISO Latin 10) */
"0x000E0A04" = "羅馬尼亞文(Mac Mail)"; /* Romanian (Mac Mail) */

"0x00000027" = "Celtic (Mac OS)"; /* Celtic (Mac OS) */
"Celtic (ISO Latin 8)" = "克爾特語(ISO Latin 8)";

"0x00000028" = "Gaelic (Mac OS)"; /* Gaelic (Mac OS) */

"0x0000008C" = "波斯語(Mac OS)"; /* Farsi (Mac OS) */

"0x000000EC" = "Inuit (Mac OS)"; /* Inuit (Mac OS) */

"0x00000400" = "拉丁美洲語系(DOS)"; /* Latin-US (DOS) */

"0x00000406" = "環波羅的海語系(DOS)"; /* Baltic Rim (DOS) */
"0x00000507" = "環波羅的海語系(Windows)"; /* Baltic Rim (Windows) */
"Baltic Rim (ISO Latin 7)" = "環波羅的海語系(ISO Latin 7)";

"0x00000415" = "Portuguese (DOS)"; /* Portuguese (DOS) */

"0x00000418" = "Canadian French (DOS)"; /* Canadian French (DOS) */

"0x0000041A" = "Nordic (DOS)"; /* Nordic (DOS) */
"Nordic (ISO Latin 6)" = "日耳曼語系(ISO Latin 6)";

"0x0000041B" = "俄文(DOS)"; /* Russian (DOS) */
"0x00000A02" = "俄文(KOI8-R)"; /* Russian (KOI8-R) */

"0x00000508" = "越南文(Windows)"; /* Vietnamese (Windows) */

"0x00000101" = "Unicode 1.1"; /* Unicode 1.1 */
"0x04000101" = "Unicode 1.1 UTF-7"; /* Unicode 1.1 UTF-7 */
"0x08000101" = "Unicode 1.1 UTF-8"; /* Unicode 1.1 UTF-8 */
"0x00000103" = "Unicode 2.1"; /* Unicode 2.1 */
"0x04000103" = "Unicode 2.1 UTF-7"; /* Unicode 2.1 UTF-7 */
"0x08000103" = "Unicode 2.1 UTF-8"; /* Unicode 2.1 UTF-8 */
"0x00020103" = "Unicode 2.1 Canonical Decomposition"; /* Unicode 2.1 Canonical Decomposition */
"0x00000104" = "Unicode 3.0"; /* Unicode 3.0 */
"0x00020104" = "Unicode 3.0 Canonical Decomposition"; /* Unicode 3.0 Canonical Decomposition */
"0x00030104" = "Unicode 3.0 Canonical Composition"; /* Unicode 3.0 Canonical Composition */
"0x00080104" = "Unicode 3.0 HFS Plus Decomposition"; /* Unicode 3.0 HFS Plus Decomposition */
"0x00090104" = "Unicode 3.0 HFS Plus Composition"; /* Unicode 3.0 HFS Plus Composition */
"0x04000104" = "Unicode 3.0 UTF-7"; /* Unicode 3.0 UTF-7 */
"0x08000104" = "Unicode 3.0 UTF-8"; /* Unicode 3.0 UTF-8 */
"0x00000106" = "Unicode 3.2"; /* Unicode 3.2 */
"0x00020106" = "Unicode 3.2 Canonical Decomposition"; /* Unicode 3.2 Canonical Decomposition */
"0x00030106" = "Unicode 3.2 Canonical Composition"; /* Unicode 3.2 Canonical Composition */
"0x00080106" = "Unicode 3.2 HFS Plus Decomposition"; /* Unicode 3.2 HFS Plus Decomposition */
"0x00090106" = "Unicode 3.2 HFS Plus Composition"; /* Unicode 3.2 HFS Plus Composition */
"0x04000106" = "Unicode 3.2 UTF-7"; /* Unicode 3.2 UTF-7 */
"0x08000106" = "Unicode 3.2 UTF-8"; /* Unicode 3.2 UTF-8 */
"0x00000108" = "Unicode 4.0"; /* Unicode 4.0 */
"0x00020108" = "Unicode 4.0 Canonical Decomposition"; /* Unicode 4.0 Canonical Decomposition */
"0x00030108" = "Unicode 4.0 Canonical Composition"; /* Unicode 4.0 Canonical Composition */
"0x00080108" = "Unicode 4.0 HFS Plus Decomposition"; /* Unicode 4.0 HFS Plus Decomposition */
"0x00090108" = "Unicode 4.0 HFS Plus Composition"; /* Unicode 4.0 HFS Plus Composition */
"0x04000108" = "Unicode 4.0 UTF-7"; /* Unicode 4.0 UTF-7 */
"0x08000108" = "Unicode 4.0 UTF-8"; /* Unicode 4.0 UTF-8 */
"Unicode (UTF-32BE)" = "Unicode(UTF-32BE)";
"Unicode (UTF-8)" = "Unicode(UTF-8)";
"Unicode (UTF-16)" = "Unicode(UTF-16)";
"Unicode (UTF-16BE)" = "Unicode(UTF-16BE)";
"Unicode (UTF-16LE)" = "Unicode(UTF-16LE)";
"Unicode (UTF-32)" = "Unicode(UTF-32)";
"Unicode (UTF-32LE)" = "Unicode(UTF-32LE)";

本文的重點是在MacOSX 10.4.11平台上,當然就先把蘋果系統版本的文字編碼對
應資料一個一個全部挖出來查詢了。抱怨一下,比較的結果,還是微軟的Code Pages
資訊,比較容易查詢與對照,官方網站文件豐富。反觀蘋果系統的文件,就很少
很難查詢,而且第三方網站的文件列表,可能都比蘋果官方網站的文件來的容易
查詢。少爺之前描述Unicode的時候,用土法煉鋼的方式,一個一個去找字型與
編碼的對應,查了160多個分類。這裡也是有一大堆的分類,不過這次少爺懶了
因為這是蘋果自己版本的編碼分類,少爺在一開始安裝MacOSX系統時就有勾選將
系統安裝光碟內所有的字型檔全部都安裝,所以這次只會列出蘋果有該文字編碼
分類規範,但沒有碼位全滿字型檔對應的部分,來列出字型檔來源。有些編碼分
類在蘋果官方文件中居然還查不到,真是怪哉。

MacArabic 阿拉伯文
MacArmenian 亞美尼亞文
MacBengali 孟加拉文 字元面板/全部字元/南亞文字/孟加拉文
MacBurmese 緬甸文 字元面板/全部字元/東南亞文字/緬甸
MacCeltic 克爾特語族 包含多個語言子集 http://zh.wikipedia.org/w/index.php?...&variant=zh-tw
MacCentralEurRoman 中歐語系 (看不懂資料 不會解讀)
MacChineseSimp 簡體中文
MacChineseTrad 繁體中文
MacCroatian 克羅埃西亞文 http://zh.wikipedia.org/w/index.php?...&variant=zh-tw
MacCyrillic 斯拉夫語系
MacDevanagari 梵文
MacDingbats 印刷圖案 (看不懂資料 不會解讀)
MacEastEurRoman 東歐語系 (看不懂資料 不會解讀)
MacEthiopic 衣索比亞文
MacExtArabic 阿拉伯文擴充 (看不懂資料 不會解讀)
MacFarsi 波斯語 (看不懂資料 不會解讀)
MacGaelic 蓋爾文 http://zh.wikipedia.org/w/index.php?...&variant=zh-tw http://zh.wikipedia.org/w/index.php?...&variant=zh-tw
MacGeez 吉茲語 同 衣衣索比亞文
MacGeorgian 格魯吉亞文 字元面板/全部字元/歐洲文字/格魯吉亞文
MacGreek 希臘文
MacGujarati 古吉拉特語 字元面板/全部字元/南亞文字/吉亞拉塔文
MacGurmukhi 古爾穆奇語 字元面板/全部字元/南亞文字/古爾穆奇文
MacHebrew 希伯來文
MacHFS (看不懂資料 不會解讀)
MacIcelandic 冰島文
MacInuit 因紐特文 http://zh.wikipedia.org/w/index.php?...&variant=zh-tw
MacJapanese 日文
MacKannada 坎那達文 字元面板/全部字元/南亞文字/坎那達文
MacKhmer 高棉文
MacKorean 韓文
MacLaotian 寮國文
MacMalayalam 印度西南沿海文 字元面板/全部字元/南亞文字/印度西南沿海文
MacMongolian 蒙古語 字元面板/全部字元/東亞文字/蒙古文
MacOriya 歐利亞文 字元面板/全部字元/南亞文字/歐利亞文
MacRoman 西方語系 (看不懂資料 不會解讀)
MacRomanian 羅馬尼亞文 (看不懂資料 不會解讀)
MacRomanLatin1 (看不懂資料 不會解讀)
MacRSSymbol (看不懂資料 不會解讀)
MacSimpchinese 簡體中文
MacSinhalese 錫蘭文 (查不到資料 不會解讀)
MacSymbol 符號
MacTamil 坦米爾文 字元面板/全部字元/南亞文字/坦米爾文
MacTelugu 泰魯古文 字元面板/全部字元/南亞文字/泰魯古文
MacThai 泰文
MacTibetan 藏文
MacTradChinese 繁體中文
MacTurkish 土耳其文 (查不到資料 不會解讀)
MacUkrainian 烏克蘭文 (查不到資料 不會解讀)
MacUnicode (查不到資料 不會解讀)
MacUninterp (查不到資料 不會解讀)
MacVietnamese 越南文 (查不到資料 不會解讀)
MacVT100 (看不懂資料 不會解讀)

以上的英中對照,有些是從LocalizedLanguage.strings查來的,有些是網路上
查來的。結果少爺發現自己被考倒了,要對應的字型完全不曉得從何對照起。
網路上都很容易查的到Unicode blocks或MsWindows Code Pages與字型檔對應
的資訊,可是當少爺要查詢與MacRomanLatin1、MacRSSymbol、MacTurkish等等
對應的字型資訊時,資訊量卻是"零"。結果就是一個字型對應資訊都沒有完整
的查出來。

由以上的情境類推,例如IBM PC的編碼分類或是ISO 8859系列等等的編碼分類,
也是可以全都做一個大列表,一個一個去找,對應該編碼分類的字型檔,匯入字
體簿.app中,這樣再搭配支援多種編碼格式的文書軟體,就幾乎全世界所有符合
所謂公開標準文字編碼規格的文件,幾乎都可以讀取出來了。

少爺發現,同樣在MacOSX 10.4.11環境中,系統本身內建的詞彙,同一個英文單
字"Gujarati",卻有"古吉拉特語""吉亞拉塔文"兩種不同的翻譯,蘋果公司真的
該好好檢討。
還有,少爺終於找到了兩款用於文字編碼轉換的Cyclone X 替代軟體了。Charco
這款支援多達130多種文字編碼轉換,而功能最陽春。ConvertEncoding只有支援
80多種文字編碼轉換,但有預覽純文字檔內容的功能。
提一個有趣的,在LocalizedLanguage.strings發現,系統居然還有支援"克林貢文"。
再來,在文字編輯.app內,少爺發現了一個檔案TextEdit Test Document.rtf,
可惜沒包含漢字的demo在其中。

下次的預告,少爺不曉得能否將firefox、opera、safari這些網路瀏覽器,所支
援的所有文字編碼種類,做一個整理,要整理成什麼樣子?真是傷腦筋!

參考連結

字元編碼 - 維基百科,自由的百科全書
http://zh.wikipedia.org/w/index.php?...&variant=zh-tw

代碼頁 - 維基百科,自由的百科全書
http://zh.wikipedia.org/w/index.php?...&variant=zh-tw

字符集 - 維基百科,自由的百科全書
http://zh.wikipedia.org/w/index.php?...&variant=zh-tw

Windows code page
http://en.wikipedia.org/wiki/Windows_code_page

Code Pages Supported by Windows--Windows Code Pages
http://www.microsoft.com/globaldev/reference/WinCP.mspx

Code Pages Supported by Windows--OEM Code Pages
http://www.microsoft.com/globaldev/reference/oem.mspx

Code Pages Supported by Windows--ISO Code Pages
http://www.microsoft.com/globaldev/reference/iso.mspx

Code Page Identifiers
http://msdn.microsoft.com/en-us/library/ms776446.aspx

I'm not a Klingon : Code Pages, Unicode & Encodings
http://blogs.msdn.com/shawnste/pages...encodings.aspx

INFO: 在 Windows NT 支援 Macintosh 字碼頁
http://support.microsoft.com/?scid=k...87858&x=3&y=12

IBM i Globalization - Code Pages
http://www-03.ibm.com/systems/i/soft...codepages.html

Character Sets And Code Pages At The Push Of A Button
http://www.i18nguy.com/unicode/codepages.html

http://www.unicode.org/Public/MAPPINGS/VENDORS/

ICU Demonstration - ICU 地區深入探討示範-International Components for Unicode
http://demo.icu-project.org/icu-bin/locexp

大五碼 - 維基百科,自由的百科全書
http://zh.wikipedia.org/w/index.php?...&variant=zh-tw

http://www.moztw.org/docs/big5/

http://www.microsoft.com/globaldev/r.../dbcs/950.mspx

http://demo.icu-project.org/icu-bin/...ndows-950-2000

ISO/IEC 8859 - 維基百科,自由的百科全書
http://zh.wikipedia.org/w/index.php?...&variant=zh-tw

Technical Note TN1150: HFS Plus Volume Format
http://developer.apple.com/technotes/tn/tn1150.html
官方的文件,有MAC系統平台所定義的編碼分類

Text Encoding Conversion Manager Reference
http://developer.apple.com/documenta...reference.html

Mac OS X 10.4: Fonts list
http://support.apple.com/kb/HT1538

Mac OS X字體列表
http://zh.wikipedia.org/w/index.php?...&variant=zh-tw

Macintosh WorldScript Font Registry
http://www.evertype.com/software/apple/fontnums.html

TextConverter 類別:用於將字元從一種編碼系統轉換到另一種
http://www.rbfans.com/rbcnhelp/cht/Topics/2571.html
有MAC系統平台的字元編碼更多細部的分類

Iconv character set conversion
http://www.iconv.org/
網路線上版的字元編碼轉換器

Charco
http://www.marblesoftware.com/Charco.html
Cyclone X 的替代方案,支援130多種編碼轉換

ConvertEncoding
http://pagesperso-orange.fr/tcfj/site/index.html
Cyclone X 的替代方案,支援80多種編碼轉換


The Joel on Software Translation Project:萬國碼 From The Joel on Software Translation Project
每個軟體開發者都絕對一定要會的Unicode及字元集必備知識(沒有藉口!)
http://local.joelonsoftware.com/medi...9C%8B%E7%A2%BC
這篇文章非常值得一讀喔~~~
回覆
FLY
boy
Mac OS X (10.3&10.4)安裝,設定,使用經驗談,補充61
Mac OS X (10.3&10.4)安裝,設定,使用經驗談,補充61

網頁瀏覽器的多種文字編碼整理列表

少爺比較之後,選擇了Mozilla Firefox 3.0.4、Opera 9.62、Safari 3.2,這三
款來做比較。因為少爺覺得這三款是MacOSX平台上,彼此之間完全不同排版引擎
的免費軟體的樣板。採用相同排版引擎的網頁瀏覽器,就沒什麼好比較了。
Internet Explorer 5.2.3是2003年的發行版,瀏覽台灣YAHOO的首頁都會有問題
了,就不在這次的比較範圍了。

先看 Mozilla Firefox 3.0.4,Firefox選單列/檢視/語言及字元編碼/自訂列表/
可用的字元編碼。列表中有70多種編碼可以選擇。

IBM-864 阿拉伯文
ISO-8859-6 阿拉伯文
MacArabic 阿拉伯文
Windows-1256 阿拉伯文
ARMSCII-8 亞美尼亞文
ISO-8859-13 波羅的海語系
ISO-8859-4 波羅的海語系
Windows-1257 波羅的海語系
ISO-8859-14 愛爾蘭/賽爾特語系
IBM-852 中歐語系
ISO-8859-2 中歐語系
MacCE 中歐語系
Windows-1250 中歐語系
GB18030 簡體中文
GB2312 簡體中文
GBK 簡體中文
HZ 簡體中文
ISO-2022-CN 簡體中文
Big5 正體中文
Big5-HKSCS 正體中文
EUC-TW 正體中文
MacCroatian 克羅埃西亞文
IBM-855 俄文/斯拉夫語系
ISO-8859-5 俄文/斯拉夫語系
ISO-IR-111 俄文/斯拉夫語系
KOI8-R 俄文/斯拉夫語系
MacCyrillic 俄文/斯拉夫語系
Windows-1251 俄文/斯拉夫語系
CP-866 俄文/斯拉夫語系
KOI8-U 斯拉夫/烏克蘭語系
MacUkrainian 斯拉夫/烏克蘭語系
MacFarsi 波斯文
GEOSTD8 喬治亞文
ISO-8859-7 希臘文
MacGreek 希臘文
Windows-1253 希臘文
MacGujarati 古吉拉特梵文
MacGurmukhi 古魯穆奇文
IBM-862 希伯來文
ISO-8859-8-I 希伯來文
MacHebrew 希伯來文
Windows-1255 希伯來文
ISO-8859-8 希伯來文
MacDevanagari 印地文
MacIcelandic 冰島文
EUC-JP 日文
ISO-2022-JP 日文
Shift_JIS 日文
EUC-KR 韓文
ISO-2022-KR 韓文
JOHAB 韓文
UHC 韓文
ISO-8859-10 北歐語系
ISO-8859-16 羅馬尼亞文
MacRomanian 羅馬尼亞文
ISO-8859-3 南歐語系
ISO-8859-11 泰文
TIS-620 泰文
Windows-874 泰文
IBM-857 土耳其文
ISO-8859-9 土耳其文
MacTurkish 土耳其文
Windows-1254 土耳其文
UTF-16BE 萬國碼 Unicode
UTF-16LE 萬國碼 Unicode
UTF-16 萬國碼 Unicode
UTF-32BE 萬國碼 Unicode
UTF-32LE 萬國碼 Unicode
UTF-7 萬國碼 Unicode
UTF-8 萬國碼 Unicode
TCVN 越南文
VISCII 越南文
VPS 越南文
Windows-1258 越南文
IBM-850 英文/西歐語系
ISO-8859-1 英文/西歐語系
ISO-8859-15 英文/西歐語系
MacRoman 英文/西歐語系
Windows-1252 英文/西歐語系

少爺以系統來分類來重新排序:

ARMSCII-8 亞美尼亞文
Big5 正體中文
Big5-HKSCS 正體中文
CP-866 俄文/斯拉夫語系
GB18030 簡體中文
GB2312 簡體中文
GBK 簡體中文
GEOSTD8 喬治亞文
HZ 簡體中文
JOHAB 韓文
KOI8-R 俄文/斯拉夫語系
KOI8-U 斯拉夫/烏克蘭語系
Shift_JIS 日文
TCVN 越南文
TIS-620 泰文
UHC 韓文
VISCII 越南文
VPS 越南文
EUC-JP 日文
EUC-KR 韓文
EUC-TW 正體中文
IBM-850 英文/西歐語系
IBM-852 中歐語系
IBM-855 俄文/斯拉夫語系
IBM-857 土耳其文
IBM-862 希伯來文
IBM-864 阿拉伯文
ISO-2022-CN 簡體中文
ISO-2022-JP 日文
ISO-2022-KR 韓文
ISO-8859-1 英文/西歐語系
ISO-8859-2 中歐語系
ISO-8859-3 南歐語系
ISO-8859-4 波羅的海語系
ISO-8859-5 俄文/斯拉夫語系
ISO-8859-6 阿拉伯文
ISO-8859-7 希臘文
ISO-8859-8 希伯來文
ISO-8859-8-I 希伯來文
ISO-8859-9 土耳其文
ISO-8859-10 北歐語系
ISO-8859-11 泰文
ISO-8859-13 波羅的海語系
ISO-8859-14 愛爾蘭/賽爾特語系
ISO-8859-15 英文/西歐語系
ISO-8859-16 羅馬尼亞文
ISO-IR-111 俄文/斯拉夫語系
MacArabic 阿拉伯文
MacCE 中歐語系
MacCroatian 克羅埃西亞文
MacCyrillic 俄文/斯拉夫語系
MacDevanagari 印地文
MacFarsi 波斯文
MacGreek 希臘文
MacGujarati 古吉拉特梵文
MacGurmukhi 古魯穆奇文
MacHebrew 希伯來文
MacIcelandic 冰島文
MacRoman 英文/西歐語系
MacRomanian 羅馬尼亞文
MacTurkish 土耳其文
MacUkrainian 斯拉夫/烏克蘭語系
Windows-874 泰文
Windows-1250 中歐語系
Windows-1251 俄文/斯拉夫語系
Windows-1252 英文/西歐語系
Windows-1253 希臘文
Windows-1254 土耳其文
Windows-1255 希伯來文
Windows-1256 阿拉伯文
Windows-1257 波羅的海語系
Windows-1258 越南文
UTF-7 萬國碼 Unicode
UTF-8 萬國碼 Unicode
UTF-16 萬國碼 Unicode
UTF-16BE 萬國碼 Unicode
UTF-16LE 萬國碼 Unicode
UTF-32BE 萬國碼 Unicode
UTF-32LE 萬國碼 Unicode

如果用以前段落提過的Charco這個軟體所包含的分類做比較的話,Mozilla Firefox 3.0.4
似乎只有1/2 再多一點而已。

再來看 Opera 9.62,將 /Opera.app/Contents/Resources/zh_TW.lproj/zh_TW.lng
的資訊抓出來,有:

"Unicode"="UTF-8"
"Unicode"="UTF-16"
"Unicode"="UTF-32"
"Unicode"="UTF-7"
"西歐字母(W)"="美國 ASCII"
"西歐字母(W)"="ISO-8859-1"
"西歐字母(W)"="Windows-1252"
"西歐字母(W)"="ISO-8859-15"
"中歐字母(E)"="ISO-8859-2"
"中歐字母(E)"="ISO-8859-1"
"中歐字母(E)"="Windows-1250"
"南歐字母(S)"="ISO-8859-3"
"波羅的海文(B)"="ISO-8859-13"
"波羅的海文(B)"="Windows-1257"
"波羅的海文(B)"="ISO-8859-4"
"北歐文(N)"="ISO-8859-10"
"北歐文(N)"="Windows-Sami-2"
"凱爾特文(L)"="ISO-8859-14"
"土耳其文(T)"="ISO-8859-9"
"土耳其文(T)"="Windows-1254"
"越南文(V)"="Windows-1258"
"越南文(V)"="VISCII"
"越南文(V)"="VPS"
"斯拉夫文(Y)"="ISO-8859-5"
"斯拉夫文(Y)"="KOI8-R"
"斯拉夫文(Y)"="KOI8-U"
"斯拉夫文(Y)"="Windows-1251"
"斯拉夫文(Y)"="字碼頁 866"
"希臘文(G)"="ISO-8859-7"
"希臘文(G)"="Windows-1253"
"阿拉伯文(R)"="ISO-8859-6"
"阿拉伯文(R)"="Windows-1256"
"希伯來文(H)"="ISO-8859-8 (Logical)"
"希伯來文(H)"="ISO-8859-8 (Visual)"
"希伯來文(H)"="Windows-1255"
"泰文(I)"="ISO-8859-11 (TIS-620)"
"中文(C)"="繁體中文 Big5 (B)"
"中文(C)"="繁體中文-香港增補字符集 HKSCS(H)"
"中文(C)"="繁體中文資訊交換碼 EUC-TW (E)"
"中文(C)"="簡體中文 GBK/GB2312(G)"
"中文(C)"="簡體中文 HZ-GB2312(Z)"
"中文(C)"="簡體中文 GB18030(1)"
"中文(C)"="ISO-2022-CN"
"日文(J)"="Shift-JIS"
"日文(J)"="ISO-2022-JP"
"日文(J)"="EUC-JP"
"韓文(K)"="EUC-KR"
"韓文(K)"="ISO-2022-KR"

少爺以系統來分類來重新排序:

"日文(J)"="EUC-JP"
"韓文(K)"="EUC-KR"
"中文(C)"="繁體中文資訊交換碼 EUC-TW (E)"
"中文(C)"="ISO-2022-CN"
"日文(J)"="ISO-2022-JP"
"韓文(K)"="ISO-2022-KR"
"中歐字母(E)"="ISO-8859-1"
"西歐字母(W)"="ISO-8859-1"
"中歐字母(E)"="ISO-8859-2"
"南歐字母(S)"="ISO-8859-3"
"波羅的海文(B)"="ISO-8859-4"
"斯拉夫文(Y)"="ISO-8859-5"
"阿拉伯文(R)"="ISO-8859-6"
"希臘文(G)"="ISO-8859-7"
"希伯來文(H)"="ISO-8859-8 (Logical)"
"希伯來文(H)"="ISO-8859-8 (Visual)"
"土耳其文(T)"="ISO-8859-9"
"北歐文(N)"="ISO-8859-10"
"泰文(I)"="ISO-8859-11 (TIS-620)"
"波羅的海文(B)"="ISO-8859-13"
"凱爾特文(L)"="ISO-8859-14"
"西歐字母(W)"="ISO-8859-15"
"斯拉夫文(Y)"="KOI8-R"
"斯拉夫文(Y)"="KOI8-U"
"中歐字母(E)"="Windows-1250"
"斯拉夫文(Y)"="Windows-1251"
"西歐字母(W)"="Windows-1252"
"希臘文(G)"="Windows-1253"
"土耳其文(T)"="Windows-1254"
"希伯來文(H)"="Windows-1255"
"阿拉伯文(R)"="Windows-1256"
"波羅的海文(B)"="Windows-1257"
"越南文(V)"="Windows-1258"
"北歐文(N)"="Windows-Sami-2"
"Unicode"="UTF-8"
"Unicode"="UTF-16"
"Unicode"="UTF-32"
"Unicode"="UTF-7"
"西歐字母(W)"="美國 ASCII"
"中文(C)"="繁體中文 Big5 (B)"
"中文(C)"="繁體中文-香港增補字符集 HKSCS(H)"
"中文(C)"="簡體中文 GB18030(1)"
"中文(C)"="簡體中文 GBK/GB2312(G)"
"中文(C)"="簡體中文 HZ-GB2312(Z)"
"日文(J)"="Shift-JIS"
"越南文(V)"="VISCII"
"越南文(V)"="VPS"
"斯拉夫文(Y)"="字碼頁 866"

再來是Safari 3.2,少爺只能邊看邊打的照抄,找不到現成的文件檔可以直接複
製貼上。

繁體中文(Big 5)
繁體中文(Big 5 HKSCS)
繁體中文(Windows,DOS)
Unicode(UTF-8)
西方語系(ISO Latin 1)
西方語系(Mac OS Roman)
日文(Shift JIS)
日文(ISO 2022-JP)
日文(EUC)
日文(Shift JIS X0213)
韓文(ISO 2022-KR)
韓文(Mac OS)
韓文(Windows,DOS)
阿拉伯文(ISO 8859-6)
阿拉伯文(Windows,DOS)
希伯來文(ISO 8859-8)
希伯來文(Windows)
希臘文(ISO 8859-7)
希臘文(Windows)
斯拉夫語系(ISO 8859-5)
斯拉夫語系(Mac OS)
斯拉夫語系(KOI8-R)
斯拉夫語系(Windows)
烏克蘭文(KOI8-U)
泰文(Windows,DOS)
簡體中文(GB 2312)
簡體中文(HZ GB 2312)
中文(GB 18030)
中歐語系(ISO Latin 2)
中歐語系(Mac OS)
中歐語系(Windows Latin 2)
越南文(Windows)
土耳其文(ISO Latin 5)
土耳其文(Windows Latin 5)
中歐語系(Windows Latin 4)
環波羅的海語系(Windows)

少爺以系統來分類來重新排序:

日文(ISO 2022-JP)
韓文(ISO 2022-KR)
斯拉夫語系(ISO 8859-5)
阿拉伯文(ISO 8859-6)
希臘文(ISO 8859-7)
希伯來文(ISO 8859-8)
西方語系(ISO Latin 1)
中歐語系(ISO Latin 2)
土耳其文(ISO Latin 5)
西方語系(Mac OS Roman)
韓文(Mac OS)
斯拉夫語系(Mac OS)
中歐語系(Mac OS)
希伯來文(Windows)
希臘文(Windows)
斯拉夫語系(Windows)
越南文(Windows)
環波羅的海語系(Windows)
繁體中文(Windows,DOS)
韓文(Windows,DOS)
阿拉伯文(Windows,DOS)
泰文(Windows,DOS)
中歐語系(Windows Latin 2)
中歐語系(Windows Latin 4)
土耳其文(Windows Latin 5)
繁體中文(Big 5)
繁體中文(Big 5 HKSCS)
日文(EUC)
中文(GB 18030)
簡體中文(GB 2312)
簡體中文(HZ GB 2312)
斯拉夫語系(KOI8-R)
烏克蘭文(KOI8-U)
日文(Shift JIS)
日文(Shift JIS X0213)
Unicode(UTF-8)

由以上列表可以發現,Mozilla Firefox 3.0.4所支援的編碼種類最多,Safari 3.2
支援的編碼種類最少。
所以在社會科學研究領域的電腦使用者,少爺就建議使用Mozilla Firefox或其次
的Opera,因為可以支援的編碼種類比較多。

少爺在想,到底怎麼樣可以做出一個,包含Charco軟體中將近130多個編碼分類的
大列表的demo,可以適合在MacOSX環境中顯示,還在傷腦筋中。

參考連結

Character Sets Supported by Gecko
https://developer.mozilla.org/En/Cha...orted_by_Gecko

Web specifications supported in Opera 9.5
http://www.opera.com/docs/specs/#text

MozTW » 討論區 » 翻譯錯誤與建議回報 » 「Gurmukhi」未翻譯
http://209.85.173.132/search?q=cache...lnk&cd=1&gl=tw

網頁瀏覽器列表
http://zh.wikipedia.org/w/index.php?...&variant=zh-tw

網頁瀏覽器比較
http://zh.wikipedia.org/w/index.php?...&variant=zh-tw
回覆
FLY
boy
Mac OS X (10.3&10.4)安裝,設定,使用經驗談,補充62
Mac OS X (10.3&10.4)安裝,設定,使用經驗談,補充62

第一次嘗試翻譯小型軟體

少爺看了一些教學文章後,也想來嘗試翻譯自己常用的幾款小型免費軟體或贊助
軟體,記錄下一些翻譯時的操作感想,並將做好的繁體中文語系檔免費分享出來
。要注意的是,少爺的操作環境是PowerMAC G4 + MacOSX10.4.11 + Xcode2.5。
少爺不保證這些中文語系檔在其它人的蘋果電腦上可以正常運作(也讓少爺聯想
到微軟公司的"免責聲明")。
要將英文軟體中文化,少爺當然不可能一個一個查字典,若有現成的詞庫可用就
找來用。曾經在網路上找到微軟官方提供的中英對照字典檔,有包含許多微軟產
品的中英辭庫對照表,是CSV格式,用試算表軟體開啟後,查詢繁中字串,並複
製使用,過程非常方便。在MacOSX平台想當然爾,也要找類似的東西,進入查詢
蘋果的FTP與開發著網站後,也終於找到了類似的中英辭庫檔案,打開檔案之後
,發現是包含有XML標記的純文字檔,使用蘋果官方提供的ADViewer軟體來開啟
少爺一整個看不懂其結構,要查詢挑選並複製其繁體中文詞彙,非常的"不方便"
最後,少爺還是得一個一個手動輸入翻譯過的繁體中文詞彙,而無法像MsWindows
環境那樣方便直接且快速的複製貼上,真是有夠麻煩。

在MacOSX環境下,解壓縮後將zh_TW.lproj這個檔案夾直接複製到該 App/Contents/Resources/
路徑下,然後對該App點選"簡介"或"更多資訊"在語言欄位勾選"zh_TW"即可。

SharePoints 3.5.4

這個軟體有獨立的App與偏好設定面板兩種執行模式,UI介面有小小差異,所以
語系檔也要分兩個。

SharePointsPrefPane-zh_TW.lproj.zip
http://www.badongo.com/file/12344795

SharePointsAPP-zh_TW.lproj.zip
http://www.badongo.com/file/12344779

Easy Find 4.0.1

EasyFind4.0.1-zh_TW.lproj.zip
http://www.badongo.com/file/12344725

pref setter 2.0

PrefSetter2.0-zh_TW.lproj.zip
http://www.badongo.com/file/12344744

這三款軟體少爺都沒有做到100%中文化,大概只有90%左右中文化,因為有些詞
彙少爺真的"看不懂",即使很努力的google查資料,還是看不懂或著連GOOGLE也
找不到資訊,就放棄了~

參考連結

OIKOS 生活網 蘋果電腦/iPod網站 / 「精華」軟體本地化 (localization) 資源整理:
http://www.oikos.com.tw/v4/viewtopic.php?id=2420

OIKOS 生活網 蘋果電腦/iPod網站 / 中文化字彙疑問??:
http://www.oikos.com.tw/v4/viewtopic.php?id=9470

OSX軟體中文化教學:
http://mac.deray.org/mac_TC/teach.html

Localization Tools:
http://developer.apple.com/internati...ion/tools.html

Internationalization - Downloads:
Glossary: Chinese - Traditional (DMG)
http://developer.apple.com/internati...tion/download/

TA-TradChinese-zh_TW.dmg
ftp://ftp.apple.com/developer/Tool_C..._X_Glossaries/

為什麼是「妳」? | Jedi's BLOG:
http://jedi.org/blog/archives/004659.html
少爺在網路上看到這篇文章後,決定採用這篇文章所提的作法

回覆


類似的主題
主題 主題作者 討論版 回覆 最後發表
利用 VMware 安裝 Mac OS X JaS 10.4.8 iamdc -- FreeBSD & Linux 討 論 版 1 2008-03-17 08:49 PM
DirectX End-User Runtimes 10/10/2006 紅縞瑪瑙 -- Windows 更新 & 驅 動 程 式 版 2 2006-10-24 01:08 PM
Windows Update 更新 10/10/2006 紅縞瑪瑙 -- Windows 更新 & 驅 動 程 式 版 13 2006-10-16 03:47 PM
【硬體】ATI 最新驅動程式 Catalyst 5.10 For XP (10/12) 阿 土 -- Windows 更新 & 驅 動 程 式 版 3 2005-10-28 09:19 AM






 XML   RSS 2.0   RSS 
本站使用 vBulletin 合法版權程式
站務信箱 : [email protected]

本論壇所有文章僅代表留言者個人意見,並不代表本站之立場,討論區以「即時留言」方式運作,故無法完全監察所有即時留言,若您發現文章可能有異議,請 email :[email protected] 處理。