二子從周 作品

第七百零三章 字庫

“也就要是將所有的字一一地寫出來。”

“你要做的,就是這些,剩下的校對、檢測,我會來完成。”

“最後我會將所有的字稿帶去蜀都,帶去首都,通過最原始的掃描匹配方式,生成我們需要的字庫。”

“咱們這麼做的目的,是設計出一個能夠涵蓋所有已知的繁體漢字和簡化漢字的大字庫出來,從而一勞永逸。”

“而今後的事情就簡單了,我們可以做做減法,搞出一些刪減版來,供人自由選擇,以解決字庫過於龐大和電腦存儲資源不足的矛盾。”

“雪珊你說,將電腦字庫從六千多字擴充到四萬七千多字,這是不是關係我們國家國計民生的大事兒?”

“只是寫字那我還行。”馮雪珊知道自己要幹什麼之後,倒是放鬆了下來:“就算五萬個字,我一天寫一百個,用不了兩年也能夠完成。”

“嗯,現在睡覺,等回去我們就開始這項工作。”

“好。”

這項工作是周至答應過辜老的,當時周至曾經跟辜老說過,如果等到他進入大學,國家依舊沒有推出相應的字庫的話,那這項工作便由他來完成。

當然在沒有設計軟件的情況下,前期的準備工作只能用手工,那註定將是繁瑣的。

僅僅是將近五萬個漢字復刻到十六乘十六的三十二比特信息量的柵格當中去,在沒有軟件輔助的情況下,會是非常耗時且枯燥的工程。

這項工作還相對簡單,且只是基礎。

有了基準字模之後,才談得到利用軟件和基礎字型設計,通過數字化擬合,自動生成不同的字體。

但是隻要將基礎工作做好,剩下的就可以通過計算機軟件來完成了。

周至在前期已經做了一些工作,主要就是將gB2312—1980的簡化字和康熙字典繁體字結合到一起,構成這個字庫所需的全部漢字。

至於附加的英文字母和常用字符,已經不屬於他的專業了,將來讓別人補充就好。

兩相結合再去除重複,馮雪珊信口說的五萬字,其實和事實非常接近。

周至之所以想要插手這件事兒,是因為現在的國人對這個事情沒有什麼經驗,因此走入了一個誤區。