專利名稱:無字根漢字信息輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種無字根漢字信息輸入法,簡稱“鄧碼”或“無根碼”,是一種無須編造字根、鍵盤容易記憶、規(guī)則簡明易學(xué)、使用效率較高、適用一切漢字的漢字信息處理方法。適用于計(jì)算機(jī)和其它漢字信息處理使用。
傳統(tǒng)漢字編碼中的音碼,由于受到普通話和漢語拼音知識(shí)普及程度的限制,使用范圍有限。傳統(tǒng)漢字編碼中的形碼,都是在筆畫或字根(部件)兩個(gè)層次上對(duì)漢字進(jìn)行拆分編碼,普遍存在著記憶困難、使用不便、僅適用于特定漢字集合等缺點(diǎn)。如果不從漢字編碼的基本理論上突破,這種狀況難以改變。
漢字的筆畫分為“橫、豎、撇、點(diǎn)、折”五種,其中折筆在書寫過程中轉(zhuǎn)變方向稱為“復(fù)方向筆畫”,其余為“單方向筆畫”(參見《漢字鍵盤輸入技術(shù)與理論基礎(chǔ)》,陳一凡胡宣華著,清華大學(xué)出版社1994年6月出版)。
漢字的筆畫組合分為以下四類(參見《漢字鍵盤輸入技術(shù)與理論基礎(chǔ)》,陳一凡胡宣華著,清華大學(xué)出版社1994年6月出版)一、離散。例如二、氵、刂、彡、火、巛等;二、連接。例如廠、丁等;三、交叉。例如十、豐、也、車等;四、包圍。例如囗、匚等。
本發(fā)明的目的在于提供一種無須專門的字根、采用規(guī)范的漢字的筆畫或筆畫組合構(gòu)成的筆畫組合,通過將各種筆畫組合定義到標(biāo)準(zhǔn)的計(jì)算機(jī)鍵盤或類似的輸入裝置上完成漢字信息處理的無字根漢字信息編碼方法。
本發(fā)明的上述目的是通過這樣的技術(shù)方案實(shí)現(xiàn)的,即一種無字根漢字信息編碼方法,其特征在于,是一種根據(jù)漢字的最基本規(guī)范,通過筆畫及筆畫組合歸納成筆畫塊,對(duì)漢字進(jìn)行拆分編碼,將漢字中可能出現(xiàn)的筆畫組合分為“合、聚、交、叉、圍、含、孔、口”8類基本筆畫塊,并根據(jù)筆畫數(shù)或最小包圍數(shù)進(jìn)一步細(xì)分30個(gè)次級(jí)筆畫塊,與橫、豎、點(diǎn)、撇、捺5種基本筆畫,共35種,與英文字母對(duì)應(yīng),通過取碼規(guī)則構(gòu)成編碼方法,對(duì)任意漢字、詞語進(jìn)行編碼,用這種編碼敲擊鍵盤上與碼對(duì)應(yīng)的英文字母,將漢字信息輸入計(jì)算機(jī)的方法。
所述筆畫組合“合、聚、交、叉、圍、含、孔、口”的定義如下合表示完全沒有折筆的離散、連接筆畫集合;聚表示至少有一折筆的離散、連接筆畫集合;交表示完全沒有折筆的筆筆相交的筆畫集合;叉表示至少有一折筆的筆筆相交的筆畫集合;口表示形成四面包圍周圍沒有筆畫伸出的筆畫集合,分為一般的口和大口;一般的口當(dāng)中沒有筆畫或只有一點(diǎn),大口中有點(diǎn)之外的筆畫或多點(diǎn);孔表示形成四面包圍但周圍有筆畫伸出的筆畫集合,分為一般得孔和大孔;一般的孔當(dāng)中沒有筆畫或只有一點(diǎn),大孔中有點(diǎn)之外的筆畫或多點(diǎn);其中孔周圍筆畫及這些筆畫上交叉的筆畫不再拆,交叉在周圍筆畫上的三面包圍也不再拆;圍表示形成三面包圍的筆畫集合;含表示形成三面包圍中間有豎筆或豎撇與之相交接的筆畫集合;其中中間豎筆上交叉的筆畫不再拆。
30個(gè)次級(jí)筆畫塊為將合、聚、交、叉按塊中筆畫數(shù)分為“二合、三合、四合、五合”,“二聚、三聚、四聚、五聚”,“二交、三交、四交、多交”,“二叉、三叉、四叉、多叉”諸種;將孔、口按筆畫塊中包含的最小四面包圍數(shù)量分為“一口、二口、三口、四口、多口、大口”,“一孔、二孔、三孔、四孔、多孔、大孔”諸種;圍、含各單獨(dú)為一種;加上橫、豎、點(diǎn)、撇、捺5個(gè)基本筆畫,按對(duì)稱易記方式排列,指定在標(biāo)準(zhǔn)鍵盤上與英文字母對(duì)應(yīng)。
附圖
為本發(fā)明的鍵盤的示意。其上的英文字母的鍵位與標(biāo)準(zhǔn)的英文打字機(jī)或計(jì)算機(jī)鍵盤相同,每個(gè)字母鍵位上對(duì)應(yīng)至少一個(gè)漢字筆畫塊。
本發(fā)明涉及的筆畫塊是一種比字根更基本的漢字結(jié)構(gòu),利用它設(shè)計(jì)的無字根漢字編碼法的編碼規(guī)則為“識(shí)圍交,分聚合,依筆順,取編碼”。
一、識(shí)圍交“圍”即各種包圍,“交”即各種交叉,鄧碼無字根漢字編碼法規(guī)定交叉不拆,包圍不拆,以交叉和包圍劃界,將一個(gè)字分解為若干部分,即在一個(gè)漢字中,設(shè)想把各種交叉、包圍用不同的顏色描畫出來,這個(gè)漢字就被拆分成了若干部分;二、分聚合連續(xù)書寫或去掉交叉或包圍筆畫塊后可以看成連續(xù)書寫的連接、離散筆畫只要不超過五筆就可以在一塊中;但必須注意(1)能大則大對(duì)連接和離散筆畫,盡量取大,如果超過五筆,則在照顧漢字結(jié)構(gòu)的前提下劃分為兩塊或多塊;如果結(jié)構(gòu)分析存在歧義,則按照先行取大的原則取碼。例如“容”字的第一碼應(yīng)是“五聚(穴)”而不是“三聚(宀)”,“忿”字的第一碼應(yīng)是“四聚(分)”而不是“二合(八)”;(2)不跨結(jié)構(gòu)不破壞漢字的自然結(jié)構(gòu),可以“合結(jié)構(gòu)”——將兩個(gè)完整的結(jié)構(gòu)合為一碼,不能“跨結(jié)構(gòu)”,即不能將一個(gè)結(jié)構(gòu)塊中的一部分和其它結(jié)構(gòu)塊組合為一碼。比如左右結(jié)構(gòu)的“劃”字左部取“三叉”之后剩下“一點(diǎn)”,這一點(diǎn)不能與右部的“立刀”結(jié)為一塊(“三聚”)而只能編碼為“三叉、點(diǎn)、二聚”,原因是“劃”字的“戈”和“刂”是兩個(gè)明顯的結(jié)構(gòu)塊。如果取大時(shí)可以將兩個(gè)或更多結(jié)構(gòu)塊組合在一起,則按能大則大原則取碼。例如“修”字中按能大則大規(guī)則“亻”和“丨”可以組合為“三合”,但不能將“亻”、“丨”和“夂”中之“丿”組合為“四合”,原因就是跨了結(jié)構(gòu);(3)少筆特例對(duì)于總筆畫數(shù)為五筆及以下的字,如果該字是左右型、上下型或三包圍、兩包圍,則不按照能大則大,而只按照不跨結(jié)構(gòu)。例如“分”字拆分為“二合、二聚、折”對(duì)應(yīng)的鍵為RUY,而不是“四聚、撇、捺”;“閂”拆分為“三聚、橫、橫”對(duì)應(yīng)的鍵為ITT,不是“四聚、點(diǎn)、折”;“憶”字拆分為“三合、折、折”對(duì)應(yīng)的鍵為EYY;“厄”字拆分為“二合、二聚、折”對(duì)應(yīng)的鍵為RUY。
三、按筆順取碼順序按書寫筆畫順序,但一個(gè)筆畫塊中如第一筆在前則整個(gè)筆畫塊在前,對(duì)應(yīng)的碼亦在前。例如“成”字中的“戈”,其第一筆是全字的第一筆,故“成”字的第一碼是“三叉”;四、取編碼每字取三碼或四碼。
1.如果一個(gè)字明顯劃分為左右或上下兩部分(或兩部分以上)其第一部分有兩碼或兩碼以上,則第一部分有兩碼取兩碼,超過兩碼則取首尾兩碼;其余部分如只有一碼則取一碼,如有兩碼則取兩碼,如超過兩碼則取首尾兩碼;例如“教”字,為左右型,其第一部分為左部的“孝”,其編碼為“二交、二合、折、二叉”,取首尾二碼為“二交、二叉”,其余部分為“攵”,取碼為“二合、二交”,因此“教”字的編碼為“二交、二叉、二合、二交”對(duì)應(yīng)的鍵為DJRJ?!氨凇弊?,為上下型,其第一部分為上部“辟”,第二部分為下部“土”,第一部分取碼其首碼“一孔”和尾碼“二交”,第二部分取“二交、橫”,故“壁”字的編碼為“一孔、二交、二交、橫”對(duì)應(yīng)的鍵為NDDT。
2.如果一個(gè)字沒有明顯的上下或左右兩部分,或雖有明顯的上下或左右兩部分但第一部分只有一碼,則依次取碼。例如“字”為上下型字,但第一部分只有一碼“宀(三聚)”故依次取碼為“三聚、折、二叉”對(duì)應(yīng)的鍵為IYJ;“設(shè)”為左右型字,但第一部分只有一碼“讠(二聚)”故依次取碼為“二聚、二聚、二叉”對(duì)應(yīng)的鍵為UUJ;“商”字難于明確劃分部分,故依次取碼為“四合、圍、二合、一口”對(duì)應(yīng)的鍵為WFRV。如一個(gè)字只有一碼,則補(bǔ)以第一筆和第二筆的筆畫碼,例如“三”字,取碼為“三合、橫、橫”對(duì)應(yīng)的鍵為ETT,“鳥”字,取碼為“五聚、撇、折”對(duì)應(yīng)的鍵為PGY;3.如果一個(gè)字只有二碼,則補(bǔ)以第二碼第一筆的筆畫碼,例如“典”取碼為“多口、二合、點(diǎn)”對(duì)應(yīng)的鍵為BRG;如一個(gè)字有三碼則依序取一、二、三碼,例如“鵬”字的編碼為“二孔、二孔、五聚”對(duì)應(yīng)的鍵為MMP,“通”字的編碼為“二聚、四口、三聚”對(duì)應(yīng)的鍵為UZI;4.如果一個(gè)字有四碼則依序取一、二、三、四碼例如“探”字的編碼為“三叉、四聚、二交、二合”對(duì)應(yīng)的鍵為KODR,“豚”字的編碼為“二孔、二孔、五合、一口”對(duì)應(yīng)的鍵為MMQC;5.如果一個(gè)字超過四碼,則取一、二、三、末碼,例如“操”字的碼如取全應(yīng)為“三交、一口、一口、一口、二交、二合”,按此規(guī)則取為“三交、一口、一口、二合”對(duì)應(yīng)的鍵為KVVR。
6.一個(gè)字按上述方法編碼之后,如只有三碼,可以再加上該字漢語拼音的第一個(gè)字母,湊成四碼,以減少重碼。例如“典”字的編碼BRGD,其第四碼“D”即為漢語拼音“Dian”的第一個(gè)字母;“通”字的編碼UZIT,其第四碼“T”即為漢語拼音“Tong”的第一個(gè)字母。
無字根漢字信息輸入法的詞語編碼規(guī)則如下1.二字詞取每字的前二碼,共四碼。例如“建設(shè)”中“建”字的前二碼為“二孔、二叉”,“設(shè)”字的前二碼為“二聚、二聚”,故“建設(shè)”的編碼為“二孔、二叉、二聚、二聚”對(duì)應(yīng)的鍵為MJUU;2.三字詞取第一字的第一碼、第二字的第一碼和第三字的前二碼,共四碼。例如“計(jì)算機(jī)”中“計(jì)”字的第一碼為“二聚”,“算”的第一碼為“三合”,“機(jī)”字的前二碼為“二交、二合”,故“計(jì)算機(jī)”的編碼為“二聚、三合、二交、二合”對(duì)應(yīng)的鍵為UEDR;3.四字詞取每字的第一碼,共四碼。例如“知識(shí)產(chǎn)權(quán)”中“知”字的第一碼為“二合”,“識(shí)”的第一碼為“二-聚”,“產(chǎn)”字的第一碼為“四合”,“權(quán)”字的第一碼為“二交”,故“知識(shí)產(chǎn)權(quán)”的編碼為“二合、二聚、四合、二交”對(duì)應(yīng)的鍵為RUWD;4.四字以上的詞取前三字和最后一字的第一碼,共四碼。例如“知識(shí)產(chǎn)權(quán)局”中“知”字的第一碼為“二合”,“識(shí)”的第一碼為“二聚”,“產(chǎn)”字的第一碼為“四合”,“局”字的第一碼為“一孔”,故“知識(shí)產(chǎn)權(quán)局”的編碼為“二合、二聚、四合、一孔”對(duì)應(yīng)的鍵為RUWN。
實(shí)際使用中如發(fā)生重碼,包括字與字重碼、字與詞重碼、詞與詞重碼,可利用數(shù)字鍵進(jìn)行選擇。
本發(fā)明無字根漢字信息輸入法有如下優(yōu)點(diǎn)
一、思路全新。鄧碼提供了一種漢字信息處理的全新思路。在過去形碼設(shè)計(jì)的使用基本筆畫和人為編制字根之外提出了一種全新思路。過去雖有個(gè)別漢字編碼方法涉及過類似本發(fā)明提出的筆畫塊中的一部分,但由于沒有把它作為編碼方法的理論基礎(chǔ),也就沒有提出這種全新思路。
二、記憶量小。由于完全沒有需要死記硬背的字根,只要會(huì)寫漢字就能夠理解鄧碼涉及的全部筆畫塊,在記憶筆畫塊方面不會(huì)產(chǎn)生任何困難。鄧碼鍵盤采用對(duì)稱方法排列,記憶也非常容易。
三、使用簡便。鄧碼無字根漢字編碼法的編碼規(guī)則十分簡單,理解、記憶和使用都很容易。包圍不拆、交叉不拆,使?jié)h字的拆分大為簡化。使用圍交劃界的方法,不會(huì)產(chǎn)生歧義。使得漢字編碼的方法變得十分簡便。
四、適應(yīng)面廣。可以為任何漢字集編碼。由于鄧碼筆畫塊包含了全部漢字可能的筆畫集合,以此為基礎(chǔ)的無字根漢字編碼法不但可以處理GB2312-80漢字集,可以處理GB13000的CJK漢字集,也可以處理其它任何漢字集合。
權(quán)利要求
1.一種無字根漢字信息輸入法,其特征在于,是一種根據(jù)漢字的最基本規(guī)范,通過筆畫及筆畫組合歸納成筆畫塊,對(duì)漢字進(jìn)行拆分編碼,將漢字中可能出現(xiàn)的筆畫組合分為“合、聚、交、叉、圍、含、孔、口”8類基本筆畫塊,并根據(jù)筆畫數(shù)或最小包圍個(gè)數(shù)進(jìn)一步細(xì)分30個(gè)次級(jí)筆畫塊,與橫、豎、點(diǎn)、撇、捺5種基本筆畫,共35種與英文字母對(duì)應(yīng),通過取碼規(guī)則構(gòu)成編碼方法,對(duì)任意漢字、詞語進(jìn)行編碼,用這種編碼敲擊鍵盤上與碼對(duì)應(yīng)的英文字母,將漢字信息輸入計(jì)算機(jī)或其它漢字信息處理設(shè)備的方法。
2.根據(jù)權(quán)利要求1所述的無字根漢字信息輸入方法,其特征在于編碼規(guī)則為“識(shí)圍交,分聚合,依筆順,取編碼”;其中“識(shí)圍交”中的“圍”即各種包圍,“交”即各種交叉交叉不拆,包圍不拆,以交叉和包圍劃界,將一個(gè)字分解為若干部分;“分聚合”包括“能大則大”、“不跨結(jié)構(gòu)”的取碼規(guī)則。
全文摘要
無字根漢字信息輸入法,是一種根據(jù)漢字的最基本規(guī)范,通過將筆畫及筆畫組合歸納成筆畫塊,對(duì)漢字進(jìn)行拆分編碼。將漢字中可能出現(xiàn)的筆畫組合分為“合、聚、交、叉、圍、含、孔、口”8類基本筆畫塊,并根據(jù)筆畫數(shù)或最小包圍個(gè)數(shù)進(jìn)一步細(xì)分30個(gè)次級(jí)筆畫塊,與橫、豎、點(diǎn)、撇、捺5種基本筆畫,共35種,與英文字母對(duì)應(yīng),通過取碼規(guī)則構(gòu)成編碼方法,對(duì)任意漢字、詞語進(jìn)行編碼,用這種編碼敲擊鍵盤上與碼對(duì)應(yīng)的英文字母,將漢字信息輸入計(jì)算機(jī)或其它漢字信息處理設(shè)備的方法。
文檔編號(hào)G06F3/023GK1244672SQ9911508
公開日2000年2月16日 申請(qǐng)日期1999年8月16日 優(yōu)先權(quán)日1999年8月16日
發(fā)明者鄧新民, 鄧穎 申請(qǐng)人:鄧新民, 鄧穎