二子從周 作品

第七百四十章 新字庫

 周至卻毫不怯場,手裡連個稿子都沒有:“想來大家都知道,我們目前在使用的gB2312字庫,是我國第一個簡體中文字符集的國家標準,於1980年,由中國國家標準總局發佈,1981年5月1日實施。” 

 “它的準確全稱,是叫做《信息交換用漢字編碼字符集基本集》,其中規定了6763個漢字,以及682個非漢字圖形。” 

 “與西方文字不同,漢字是表意文字,成千上萬的不同含義需要成千上萬的不同漢字來表示。西方文字主要是拼音文字,通過幾十個字母的組合就可以變出成千上萬的單詞。在計算機裡面,西方文字只需要給幾十個字母編碼就夠了,而每一個漢字都要一個編碼才行。” 

 “隨著時代的進步和發展,gB2312已經滿足不了應用的需要,比如‘鎔’字現在是高頻率使用字,而gB2312卻沒有為它編碼,因而政府、新聞、出版、印刷等行業和部門,在使用中感到十分不便。” 

 “所以說,隨著信息技術的發展,gB2312的6763個漢字,已經不能再滿足人們使用要求。” 

 “而對於蜀大中文系,歷史系,圖書館這些單位來說,六千多個漢字,更是難以滿足信息數字化的需要。” 

 “最近,國際標準化組織下屬編碼字符集工作組,研製了一套新的編碼字符集標準,叫做isoieC10646。” 

 會議室裡又是一陣驚呼。 

 之前說的那些都是實際情況介紹,只要是稍微有點興趣的人,翻翻資料,都能夠說得出來。 

 可是isoieC10646國際標準則是國際標準化組織剛剛提出來的,而且到現在都只頒佈了一部分,這孩子已經接觸到前沿信息了。 

 周至繼續說道:“這是一個針對多文種處理的編碼字符集標準,目的是對世界上的所有文字統一編碼,以實現世界上所有文字在計算機上的統一處理。” 

 “理論上以此為基礎,我們能構建出一個在信息技術工程上通用的多八位編碼字符集,搭建出一個多文種的基本編碼體系結構。” 

 會議室裡已經有人忍不住舉起了手來,打斷了周至的發言:“周至同學,你是從哪裡知道我們國家正在根據isoieC10646標準,準備搭建多文種基本編碼體系結構的?”