專利名稱:角形數(shù)字碼編碼法及其鍵盤的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計算機(jī)編碼法及其鍵盤,特別是一種不拆分漢字,認(rèn)知漢字角形就能進(jìn)行快速編碼的角形碼輸入方法及其鍵盤。
漢字是世界上最古老的文字之一,是世界上使用人口最多的文字,是華夏子孫乃至全人類的寶貴文化財富;漢字所記錄的語言,屬世界五大語言之一,也是聯(lián)合國的工作語言之一。為使?jié)h字能夠進(jìn)入計算機(jī)并可參與信息處理,眾多漢字編碼專家,計算機(jī)專家已創(chuàng)造出近千種漢字編碼方案。對促進(jìn)漢字與計算機(jī)的結(jié)合,推動計算機(jī)在我國的普及應(yīng)用,進(jìn)而促進(jìn)社會發(fā)展,提高社會生產(chǎn)力發(fā)揮了巨大的作用。從1986年在北京舉行的首屆“漢字編碼動態(tài)測試”活動看,被測方案中“形碼”比重很大,占58.82%。這是因為漢字在其幾千年的發(fā)展過程中,走過了從象形到指事到會意到形聲而成為圖形表意文字這樣的一個大概過程。而現(xiàn)代的“方塊”漢字是古老象形文字的繼續(xù)和發(fā)展。對漢字的“有理”編碼,自然應(yīng)從“音、形、義”三個方面入手。然而,同“音”的漢字太多,同“義”的漢字較少,同“形”的漢字沒有。就是說現(xiàn)有任何一部漢字字、詞典上,不存在形象完全相同的漢字,這說明了眾多漢字“無重形”。因此,用漢字的各種“形”對其編碼,是漢字編碼的一個重要方向?,F(xiàn)有“形碼”認(rèn)為任何一個漢字都是由若干個由基本筆劃組成的部件(從前稱字根或字元)構(gòu)成的。并將其編為代碼,合理分配在鍵盤的相應(yīng)鍵位上。按照一定順序(多采用書寫順序)對漢字進(jìn)行拆分而對其編碼。以“筆畫部件”為基礎(chǔ)的“拼形碼”,大多存在著一定的拆分“二義性”,為降低重碼率多又結(jié)合其較復(fù)雜的漢字結(jié)構(gòu)進(jìn)行編碼。因而普遍存在著記憶量偏大、學(xué)習(xí)較困難等問題。然而,對漢字用0~9十個阿拉伯?dāng)?shù)字進(jìn)行編碼,要想做出高性能指標(biāo)的數(shù)字編碼,其難度就更大,非創(chuàng)造性工作不能達(dá)此目的。
本發(fā)明的目的提供一種不拆分漢字,僅認(rèn)知漢字角形就能進(jìn)行快速編碼的角形碼輸入方法及鍵盤,并能解決小鍵盤漢字角形數(shù)字編碼問題。
編碼實現(xiàn)理論基礎(chǔ)漢字是由一筆一劃構(gòu)成的,漢字又是由偏旁部首構(gòu)成的。由于一字多音、一音多字、一字多義、一義(或近義)多字的存在。使得漢字編碼單從音或義上來實現(xiàn),想達(dá)到不重碼是不可能的。而漢字之所以能被嚴(yán)格地一一無漏地區(qū)分開來,在于它們具有不同的“形”,而漢字最大的“形”莫過于它的“方塊形”。利用漢字的角形進(jìn)行編碼就能夠做出較理想的編碼,并具有其獨(dú)特的直觀性。
1、由“筆形”認(rèn)知“筆型”方塊漢字的角形是由大量筆形體現(xiàn)的,而這些筆形又是由大量筆劃構(gòu)成的。就漢字的筆劃而言有二十八種(71年版《新華字典》),偏旁部首有二百零一個(1983年《國家文字改革委員會、國家出版局偏旁部首規(guī)范》),國家語言文字工作委員會于1997年11月發(fā)布的《信息處理用GB13000.1字符集漢字部件規(guī)范》中的“部件”有五百六十個之多。我們在對大量漢字進(jìn)行了大量地分析研究、科學(xué)試驗的基礎(chǔ)上,壓縮精選出了10類最能表征漢字角形信息的相對不變的筆形—筆型。依據(jù)人體工程學(xué)原理、綜合考慮了鍵入速度、鍵位使用頻度、重碼率、均勻度、便于記憶等諸因素,將其合理地非均勻地離散于0~9十個數(shù)字鍵位上。而實現(xiàn)了用角形對漢字進(jìn)行編碼。
2、漢字角形信息分類以國標(biāo)2132字庫為基準(zhǔn),我們統(tǒng)計計算出10類筆型分別占有的百分比如下(精確到小數(shù)點(diǎn)后二位)“方”占9.19%;“橫”占8.11%;“撇”占9.56%;“豎”占9.35%;“交”占12.6%;“插”占8.16%;“蓋”占11.62%;“拐”占8.32%;“八”占11.56%;“小”占11.47%;由此可見,其分類合理、分布均勻、相當(dāng)理想。
角形數(shù)字碼編碼原理角形數(shù)字碼充分把握住漢字的整體外形是方塊形狀這一重大而顯著的特征,將漢字的角所蘊(yùn)藏著的豐富的筆“形”信息,科學(xué)歸類整理為10類相對不變的筆型,轉(zhuǎn)換成數(shù)字信息,并按照一定順序排列起來,就實現(xiàn)了對漢字的數(shù)字化編碼,這種數(shù)字化編碼可很方便地在各種小型設(shè)備及現(xiàn)有通用大鍵盤的數(shù)字鍵位上,進(jìn)行漢字輸入和處理。
本發(fā)明將規(guī)范漢字不拆分,只根據(jù)漢字角形而作出取角原則;將表征角形信息的筆型對應(yīng)0~9十個數(shù)字鍵位;并由此形成本發(fā)明的單字錄入,簡碼、準(zhǔn)簡碼拾取,詞組錄入,特殊字符錄入。所述取角原則為(a)外角碼對漢字實行從左到右、從上到下的順序按其四角筆型代碼進(jìn)行編碼;(b)下角“無”筆型者,代碼為6;(c)一個筆型前角用過用6補(bǔ)充;(d)一個筆型整覆其上,右上角碼取左上內(nèi)角碼;(e)“門”一類字除第一碼外,其它取相應(yīng)內(nèi)角碼;(f)右下角屬豎鉤則取內(nèi)角碼;(g)不論位置如何若遇方框,首次取之,其次取內(nèi)角碼;(h)右下角內(nèi)角碼作單字編碼的第五位碼。所述表征角形信息的10類筆型分別對應(yīng)于0~9十個鍵位上,它們是方;橫(含提);撇(含二、兩點(diǎn)水);豎(含點(diǎn)捺、三、點(diǎn)水);叉(含兩筆交叉者);插(一筆縱插兩筆者);蓋(寶蓋、點(diǎn)下橫、點(diǎn)下橫折);拐;八(八含單人);小(小及其變形、草頭、刀頭)。并可用一句話高度概括幫助記憶方零橫一撇二二,豎捺三三交叉四,豎鉤插五點(diǎn)橫六,拐七八八小頭九。所述取角原則及筆型代碼認(rèn)定任何一個漢字既有外角又有內(nèi)角。所述簡碼、準(zhǔn)簡碼拾取法是(a)一級簡碼,旨在依據(jù)各類漢字字頻表靈活取用十個高頻字分別對應(yīng)0~9十個鍵位;(b)二級簡碼、準(zhǔn)簡碼,意在取單字編碼前兩碼加空格鍵,它包容了大量不易與其它單字組詞的介詞、連詞等;(c)三級準(zhǔn)簡碼,取其單字編碼之前三碼,對一千多常用漢字全部包含;(d)由單字編碼的前四碼構(gòu)成了包容規(guī)范漢字中的6763個漢字字符。所述準(zhǔn)簡碼、單字重碼,按提示行所示字符選擇錄入。所述詞組最長編碼采用五位碼,(a)雙字詞由首字前一、二及末字前三碼構(gòu)成;(b)三字詞取前兩字首碼及末字前三碼;(c)四字詞取前三字首碼及末字前兩碼;(d)五字以上詞由前四字及末字首碼組成。在單字或詞組需要精簡壓縮時,單字、詞組最長編碼可采用四位編碼,分別省編末碼。前述要求之任一條對單字或詞組進(jìn)行輸入的方法,可移植于任一大、中、小型漢字信息電子計算機(jī)處理系統(tǒng)中。將所述的角形數(shù)字碼編碼法移植于任一設(shè)備時,0~9十個阿拉伯?dāng)?shù)字鍵位可依據(jù)實際靈活安排設(shè)計。對漢字單字或詞組進(jìn)行編碼的方法,不僅適應(yīng)于國標(biāo)基本字符集,還可對《GB7589-87》及《GB7590-87》兩個輔助集進(jìn)行編碼,也可對繁體漢字進(jìn)行編碼,并可做為各種大、中、小型漢字字、詞典的索引工具。
角形數(shù)字碼的特點(diǎn)角形數(shù)字碼編碼方案,符合國家語言文字工作委員會于1997年11月發(fā)布的《信息處理用GB13000.1字符集漢字部件規(guī)范》及其國家有關(guān)規(guī)定,并通過了中國人民解放軍總參通信部于1998年12月19日在京召開的《掌上型漢字輸入系統(tǒng)》技術(shù)鑒定會。其主要特點(diǎn)是1.不肢解漢字,不論字的復(fù)雜結(jié)構(gòu),規(guī)則簡明,好學(xué)易記,使用方便,適應(yīng)于不同層次的各類人員使用;2.具有“形碼”的優(yōu)點(diǎn),比如對不識之字同樣可以編碼等;3.各項技術(shù)性能指標(biāo)好,無論是與現(xiàn)有大鍵盤輸入編碼相比,還是與現(xiàn)有數(shù)字編碼比較,都達(dá)到了較高水平;4.均勻度高對國標(biāo)漢字基本集(GB2312-80國標(biāo)字符集)的6763個漢字、字符,完全實現(xiàn)五碼輸入不翻“頁”(同碼字不超過5個),四碼輸入實現(xiàn)99.1%不翻“頁”;而對常用漢字一級字庫的3755字而言,完全實現(xiàn)四碼輸入不翻“頁”;5.可實現(xiàn)盲打由于該編碼重碼率低、均勻度高,再加上簡碼等技術(shù)處理,可滿足盲打要求;6.編碼空間利用率高,掛接詞組能力強(qiáng)經(jīng)試驗在單字、簡碼基礎(chǔ)上,掛接2萬左右詞組不破壞上述性能指標(biāo);7.單字、簡碼、標(biāo)點(diǎn)及特殊符號與詞組間實現(xiàn)編碼自然分離,無須鍵位切換;8.該編碼不僅適應(yīng)于基本字符集,還可對GB7589-87及GB7590-87兩個輔助集進(jìn)行編碼。不僅如此,該數(shù)字編碼還可做為各種大、中、小型字、詞典的索引工具。
圖1雙手操作鍵位2單手操作鍵位圖角形數(shù)字碼編碼規(guī)則實施例。
1、單字錄入編碼規(guī)則角形數(shù)字碼對漢字實行從左到右、從上到下的順序提取筆型代碼進(jìn)行編碼。其筆型代碼可用一句話概括記憶方零橫一撇是二,豎捺為三交叉四;豎鉤插五點(diǎn)橫六,拐七八八小頭九。例如鍵入4191即可出現(xiàn)桓字,鍵入2889就是徐字等。對于一、二級字庫而言外角四碼輸入就足夠了。若要實現(xiàn)盲打,則再于右下角提取一內(nèi)角碼,如鍵入41910桓字就會唯一出現(xiàn)(當(dāng)然四碼桓字也可能是唯一的)。
2、角形數(shù)字碼簡碼錄入編碼規(guī)則為了提高漢字錄入速度,方案依據(jù)漢字字頻表,設(shè)置有一、二、三、四級簡碼。其規(guī)則是1.一級簡碼0+空格=的 1+空格=中2.二、三、四級簡碼0~9十個鍵位上分別對應(yīng)著十個漢字,它們是是一我了有這就在人和。其規(guī)則是鍵位碼前加0。如“是”字鍵入00加一空格即可;“一”字鍵入01加一空格就行,等等。其它分別由單字編碼的前二、三、四碼構(gòu)成。如38=以、74=對、034=別、036=唉、3305=戰(zhàn),等等。
3.角形數(shù)字碼詞組錄入編碼規(guī)則詞組編碼與單字編碼相一致,采用五位編碼。
1.雙字詞取首字的第一、二及末字的前一、二、三碼。如軟件=478562.三字詞取前兩字的首碼和末字的前一、二、三碼。如出版社=326493.四字詞取前三字的首碼及末字的前一、二碼。如爭分奪秒=984294.五字以上詞取前四字及末字的首碼。如全國各族人民=8026權(quán)利要求
1.一種角形數(shù)字碼編碼法及其鍵盤,其特征是本發(fā)明將規(guī)范漢字不拆分,只根據(jù)漢字角形而作出取角原則;將表征角形信息的筆型對應(yīng)0~9十個數(shù)字鍵位;并由此形成本發(fā)明的單字錄入,簡碼、準(zhǔn)簡碼拾取,詞組錄入,特殊字符錄入。
2.如權(quán)利要求1所述的角形數(shù)字碼編碼法及其鍵盤,其特征是所述取角原則為(a)外角碼對漢字實行從左到右、從上到下的順序按其四角筆型代碼進(jìn)行編碼;(b)下角“無”筆型者,代碼為6;(c)一個筆型前角用過用6補(bǔ)充;(d)一個筆型整覆其上,右上角碼取左上內(nèi)角碼;(e)“門”一類字除第一碼外,其它取相應(yīng)內(nèi)角碼;(f)右下角屬豎鉤則取內(nèi)角碼;(g)不論位置如何若遇方框,首次取之,其次取內(nèi)角碼;(h)右下角內(nèi)角碼作單字編碼的第五位碼。
3.如權(quán)利要求1、2所述的角形數(shù)字碼編碼法及其鍵盤,其特征是所述表征角形信息的10類筆型分別對應(yīng)于0~9十個鍵位上,它們是方;橫(含提);撇(含二、兩點(diǎn)水);豎(含點(diǎn)捺、三點(diǎn)水);叉(含兩筆交叉者);插(一筆縱插兩筆及以上者);蓋(寶蓋、點(diǎn)下橫、點(diǎn)下橫折);拐;八(八含單人);小(小及其變形、草頭、刀頭)。并可用一句話高度概括幫助記憶方零橫一撇二二,豎捺三三交叉四,豎鉤插五點(diǎn)橫六,拐七八八小頭九。
4.如權(quán)利要求1、2、3所述的角形數(shù)字碼編碼法及其鍵盤,其特征是所述取角原則及筆型代碼認(rèn)定任何一個漢字既有外角又有內(nèi)角。
5.如權(quán)利要求1、2、3所述的角形數(shù)字碼編碼法及其鍵盤,其特征是所述簡碼、準(zhǔn)簡碼拾取法是(a)一級簡碼,旨在依據(jù)各類漢字字頻表靈活取用十個高頻字分別對應(yīng)0~9十個鍵位;(b)二級簡碼、準(zhǔn)簡碼,意在取單字編碼前兩碼加空格鍵,它包容了大量不易與其它單字組詞的介詞、連詞、形容詞、副詞等;(c)三級準(zhǔn)簡碼,取其單字編碼之前三碼,對一千多常用漢字全部包含;(d)由單字編碼的前四碼構(gòu)成了包容規(guī)范漢字中的6763個漢字字符。6.如權(quán)利要求4、5所述的角形數(shù)字碼編碼法及其鍵盤,其特征是所述準(zhǔn)簡碼、單字重碼,按提示行所示字符選擇錄入。
7.如權(quán)利要求1、3、4所述的角形數(shù)字碼編碼法及其鍵盤,其特征是所述詞組最長編碼采用五位碼,(a)雙字詞由首字前一、二及末字前三碼構(gòu)成;(b)三字詞取前兩字首碼及末字前三碼;(c)四字詞取前三字首碼及末字前兩碼;(d)五字以上詞由前四字及末字首碼組成。
8.如權(quán)利要求1、4、7所述的角形數(shù)字碼編碼法及其鍵盤,其特征是在單字或詞組需要精簡壓縮時,單字、詞組最長編碼可采用四位編碼,分別省編末碼。
9.如權(quán)利要求1~8所述的角形數(shù)字碼編碼法及其鍵盤,其特征是前述要求之任一條對單字或詞組進(jìn)行輸入的方法,可移植于任一大、中、小型漢字信息電子裝置中。
10.如權(quán)利要求1~9所述的角形數(shù)字碼編碼法及其鍵盤,其特征是將所述的角形數(shù)字碼編碼法移植于任一設(shè)備時,0~9十個阿拉伯?dāng)?shù)字鍵位可依據(jù)實際靈活安排設(shè)計。
11.如權(quán)利要求1、2、3、4、7、8所述的角形數(shù)字碼編碼法及其鍵盤,其特征是其所要求之任一條款,對漢字單字或詞組進(jìn)行編碼的方法,不僅適應(yīng)于國標(biāo)基本字符集,還可對《GB7589-87》及《GB7590-87》兩個輔助集進(jìn)行編碼。
12.如權(quán)利要求1~11所述的角形數(shù)字碼編碼法及其鍵盤,其特征是所述碼編碼法也可對繁體漢字進(jìn)行編碼,并可作為各種大、中、小型漢字字、詞典的索引工具。
全文摘要
本發(fā)明將規(guī)范漢字不拆分,只根據(jù)漢字角形而作出取角原則;將表征角形信息的筆型對應(yīng)0~9十個數(shù)字鍵位;并由此形成本發(fā)明的單字錄入,簡碼、準(zhǔn)簡碼拾取,詞組錄入,特殊字符錄入。充分把握了漢字整體外形為方塊形這一特征,在對6000多漢字的種種筆形進(jìn)行了大量分析、研究及試驗的基礎(chǔ)上,精選出10類不足20個最能表征漢字角形信息的相對不變地筆形-筆型,綜合考慮了鍵入速度、鍵位使用頻度等因素,將其合理地非均勻地離散于0~9十個阿拉伯?dāng)?shù)字鍵位上,本發(fā)明的特點(diǎn)是不肢解漢字,非常直觀,好學(xué)易用。
文檔編號G06F3/023GK1270344SQ9911643
公開日2000年10月18日 申請日期1999年4月14日 優(yōu)先權(quán)日1999年4月14日
發(fā)明者姜岱源, 李文修 申請人:中國人民解放軍通信指揮學(xué)院