二子從周 作品

第七百四十二章 新方案





“所以說這個多八位編碼字符集是有問題的呀,不適合中國的需要呀,那我們為什麼還要湊合著用呢?”周至反問道。





“要是不用這個,那又用哪個呢?”李紅江倒是不覺得周至是在無理取鬧,能夠提出問題來不是本事兒,關鍵是問題提出來之後,你還得能夠解決問題才算。





“為什麼不用unicode呢?”





“unicode?”李紅江想了一下:“unicode八字還沒一撇吧?國際標準都還沒有出來,我們哪來的參照?”





unicode的漢語翻譯,叫做統一碼,也叫萬國碼、單一碼,是由統一碼聯盟開發的一項計算機科學領域裡的業界標準,主要就包括字符集和編碼方案。





統一碼是為了解決傳統的字符編碼方案的侷限而產生的,它為每種語言中的每個字符,設定了統一併且唯一的二進制編碼,以滿足跨語言、跨平臺進行文本轉換、處理的要求。





統一碼設計之初的目的,就是為了打造一個能夠容納世界上所有文字和符號的字符編碼方案。





其設計思路,就是用數字0-0x10ffff來映射所有字符,最多可以容納1114112個字符,或者說有1114112個碼位。





後世大家所熟悉的utf-8、utf-16、utf-32,其實都是將數字轉換到程序數據的編碼方案。





當然這些碼位也不是隨便亂用的,而是規定了區間,比如上一世給漢字使用的區間,就是3400-4dbf,4e00-9fff,20000-3ffff三段,稱作:中日韓越統一表意文字區間。





這就有一百多萬個碼位,裝下所有漢字綽綽有餘。





因為不存在上限,utf理論上還可以繼續擴展。





當然從上一世的經驗來看,也完全沒有這個必要,足夠用了。





手機用戶請瀏覽wap..org閱讀,掌上閱讀更方便。