漢字手抄報:漢字的計算機輸入

中文信息處理由於打字機鍵盤在設計時本身沒有考慮漢字輸入的問題,輸入漢字往往比輸入拼音文字困難。由於英文是由26個字母排列組合而成的文字,因此可以簡化輸入步驟;相比較之下漢字則不能如此,從字形上雖然可以拆解成不同的部分,但是被分成的部首或偏旁數量多,這樣不但不能達到簡化輸入的目的,反而顯得更為繁瑣,於是從漢字字音上去考慮漢字輸入被分成少量的語音元素組合排列,這樣可以達到簡化輸入的步驟。由於是語音輸入對漢字的讀音必須清楚,某些生僻字或不知道漢字發音的則會很困難,這在一定程度上限制了漢字的輸入。漢字沒有經過中文打字機的普及,直接進入了電腦中文信息處理階段。在電腦發明初期曾引起漢字能否適應電腦時代的問題,支持漢字拉丁化的學者甚至以此為理據。[5]

隨著各種中文輸入法的出現,漢字的計算機輸入、存儲、輸出技術得到了基本解決,大大提高了中文寫作、出版、信息檢索等的效率。中文輸入法有上千種之多,主要包括表音輸入和表形輸入兩類,也有兩者兼之的。漢字的語音輸入、手寫識別和光學字元識別(OCR)技術也已得到廣泛套用。

如收錄數千字的GB 2312(中國大陸), Big5 及CNS 11643(台灣), HKSCS(香港), JIS(日本),以及收錄兩萬多字的GBK(中國大陸), 國際標準Unicode, ISO 10646等等。在這個過程中,因為技術及其他種種因素,在收錄字數,及收錄字型等方面或做不同層次的調整。

中國政府為了解決郵政,戶籍整理等領域用字的迫切需要,於2000年實行了一個新的漢字編碼的國家標準《漢字編碼字元集-基本集的擴充》GB 18030-2000,共收漢字27484個。並強制所有在中國大陸地區售賣的計算機產品必須使用這個新官方標準。

漢字編碼系統為進行信息交換,各漢字使用地區都制訂了一系列漢字字元集標準。

國標碼(“國標”是中華人民共和國國家標準的簡稱)在中國大陸使用。GB2312收錄6763個漢字,GBK收錄20912個漢字,最新的GB18030收錄27533個漢字。

BIG5碼。收錄13053個漢字。在台灣和香港使用的一位元組或兩位元組編碼。

Unicode並不被中國政府很好的接受。中國政府要求在中國大陸出售的軟體必須支持GB18030編碼。

在國際通信化和軟體設計領域,CJK編碼收集了漢語、日語、韓語中的漢字集。