引用:
|
作者: otai 多謝琥珀兄的回應,原來unicode就是UTF-16 Little Endian,那麼UTF-16 Big Endian是否就是會有更多的bit呢?
如果像琥珀兄說的 "和網頁有關的,需要利用網頁應用的資料,像是 html/xml/txt,用 UTF-8 就對了" 的狀況下,有些瀏覽器(如簡體OS內的)就還是無法讀出正確的繁體中文網頁,除非是改為big5編碼.
不知此理論是否正確! |
little endian 和 big endian 與檔案大小無關,是指資料的 byte order 的問題,高位元組放前面或是低位元組放前面。UTF-16 同時有這兩種作法,並且會在檔案開頭放一個 Byte Order Mark 作為標示。你可以參考 wikipedia 舉的例子:
http://zh.wikipedia.org/wiki/UTF-16
對使用者而言不用太在乎是 UTF-16LE 還是 UTF-16BE,這是軟體會幫你處理好的部份。