專利名稱::漢字多息碼計(jì)算機(jī)輸入系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及一種漢字編碼及其計(jì)算機(jī)輸入系統(tǒng)。目前漢字編碼方法很多,已經(jīng)在計(jì)算機(jī)上使用的漢字編碼方法有幾十種,其中包括最常見的拼音碼、首尾碼、五筆字型碼、大眾碼和表形碼等。這些編碼都未能很好地同時(shí)解決漢字拆碼的簡易性、漢字輸入的快速性和編碼方法易記易學(xué)三方面的矛盾。例如拼音碼,雖然簡單易學(xué),但重碼率高,輸入速度慢。首尾碼、五筆字型碼、大眾碼和表形碼等雖能實(shí)現(xiàn)漢字的快速輸入,但漢字拆碼難,部件或字根難以記憶。最近出現(xiàn)的自然碼,是在雙拼法基礎(chǔ)上發(fā)展起來的,它采用以詞為主導(dǎo)、字詞混合的編碼方法,其漢字輸入速度更高。但是這種編碼方法仍然存在漢字不易拆碼、部件多、難以記憶等缺點(diǎn)。本發(fā)明的漢字編碼及其計(jì)算機(jī)輸入系統(tǒng)是通過采用漢字聲碼、韻碼和形碼中一種或兩種或各種碼對(duì)漢字和詞組編碼,形碼由橫、豎、撇、點(diǎn)和折五種基本筆畫及其組合筆畫決定,它具有規(guī)律性強(qiáng)、容易記憶等特點(diǎn)。由于只需記憶極少數(shù)部首的形碼,因此徹底克服了許多編碼方法中存在的漢字拆分困難、部件多、不易記憶等缺點(diǎn)。編碼方法分為全形碼法和部分形碼法,部分形碼法又分為聲韻形碼法、形聲韻碼法、聲形碼法和形聲碼法。本發(fā)明提供了多種編碼方法,可用任一種方法對(duì)漢字和詞組編碼。對(duì)于熟練掌握、一般掌握和完全不懂漢語拼音的人,都能做到編碼容易、方法簡單、易記易學(xué)、重碼率低,可以在計(jì)算機(jī)上實(shí)現(xiàn)漢字的高速度輸入。下面對(duì)本發(fā)明進(jìn)行詳細(xì)說明。在本發(fā)明中,漢字包含聲碼、韻碼、形碼(第一形碼、第二形碼等),分別將它們記為聲、韻、形1、形2等。聲碼、韻碼有兩種取法(1)分別取漢字拼音字母聲母和韻母的首字母,(2)分別按雙拼法取漢字拼音的聲母和韻母。形碼采用英文字母或數(shù)字作碼元,它們有三種取法(1)采用26個(gè)英文字母作碼元,它們分別與五種基本筆畫及其組合筆畫相對(duì)應(yīng),即分別對(duì)應(yīng)于橫、豎、撇、點(diǎn)、折、叉、串、八和口以及它們的組合筆畫,(2)采用25個(gè)英文字母作碼元,其分別對(duì)應(yīng)于五種基本筆畫及其組合的雙筆畫。(3)采用10個(gè)數(shù)字0-9或10個(gè)英文字母作碼元,它們分別對(duì)應(yīng)于不同的筆畫及其組合筆畫,即分別對(duì)應(yīng)于橫、豎、撇、點(diǎn)、折、叉、串和口及其組合筆畫。根據(jù)形碼碼元的不同取法,本發(fā)明的編碼方法分為三大類。(一)第一類編碼方法在這類方法中,形碼采用26個(gè)碼元,其碼元的取碼規(guī)則見下表注單形碼部首非單獨(dú)存在時(shí),一律不拆分。我們規(guī)定除相交筆畫外,所有漢字都按照筆畫順序進(jìn)行拆分。而對(duì)于“戌”、“吏”等有相交筆畫的漢字,要優(yōu)先處理相交部分,因此“戌”的編碼為MEF,“吏”的編碼為MMS。帶叉和串的部分編碼規(guī)則如下(1)一橫筆和一豎筆相叉,代碼一律為H,其它的兩筆畫相叉,代碼一律為N。(2)一橫筆和兩豎筆相串,代碼一律為J,一豎筆和兩橫筆相串,代碼一律為U,其它的三筆畫相串,代碼一律為M。(3)四筆以上筆畫相交,優(yōu)先處理相串筆畫。如“豐”的編碼為UH,“夷”的編碼為MMF。聲韻形碼法單字編碼規(guī)則為聲+韻+形1+形2形聲韻碼法單字編碼規(guī)則為形1+形2+聲+韻聲形碼法單字編碼規(guī)則為聲+形1+形2+形3形聲碼法單字編碼規(guī)則為形1+形2+形3+聲全形碼法單字編碼規(guī)則為形1+形2+形3+形4。在上述方法中,如果單字形碼數(shù)分別超過2、3、4個(gè),則還可將形2、形3、形4用漢字最后一個(gè)形碼(漢字最后幾筆構(gòu)成的形碼)形E代替。即聲韻形碼法單字編碼規(guī)則為聲+韻+形1+形E形聲韻碼法單字編碼規(guī)則為形1+形E+聲+韻聲形碼法單字編碼規(guī)則為聲+形1+形2+形E形聲碼法單字編碼規(guī)則為形1+形2+形E+聲全形碼法單字編碼規(guī)則為形1+形2+形3+形E。在聲韻形碼法和形聲韻碼法中,我們規(guī)定1.單形碼部首非單獨(dú)存在時(shí),一律以相應(yīng)的單一形碼取碼。2.基本筆畫小、叉、串、八和口等,非單獨(dú)存在時(shí),也一律以相應(yīng)的單一形碼取碼,如小、又、力、十、丸、也、八、人、皿等。在聲形碼法、形聲碼法和全形碼法中,為了減少重碼,我們還規(guī)定以下的部首(稱為雙形碼部首)在非單獨(dú)存在時(shí),一律用兩個(gè)形碼表示</tables>詞組的編碼方法如下雙字詞第一字的第一、第二碼+第二字的第一、第二碼。三字詞第一字的第一、第二碼+第二字的第一碼+第三字的第一碼。四字詞第一、第二、第三和第四字的第一碼相加。多字詞第一、第二、第三和最后一字的第一碼相加。㈡第二類方法在這類方法中,形碼的數(shù)量和取法不同于第一類方法,它采用25個(gè)碼元,可按照如下規(guī)則選擇形碼<>單形碼部首和雙形碼部首在非單獨(dú)存在時(shí)取碼的規(guī)定,與第一類方法中的規(guī)定完全相同。在取形碼時(shí),一律按漢字的筆畫順序、依次地按兩筆畫進(jìn)行,但當(dāng)僅有一筆畫或遇有單形碼部首或和雙形碼部首時(shí)例外。在第二類方法中,除筆畫順序的規(guī)定、形碼數(shù)量和取法以及單形碼部首、雙形碼部首不同于第一類方法外,單字和詞組編碼方法都相同。例如兩者都有聲韻形碼法、形聲韻碼法、聲形碼法、形聲碼法和全形碼法,單字編碼方法相同,詞組編碼方法也相同。(三)第三類方法這類方法為10碼元全形碼法,其最大碼長為5。10碼元全形碼法采用10個(gè)數(shù)字0-9或10個(gè)英文字母作為碼元,碼元取碼規(guī)則見下表當(dāng)漢字的形碼數(shù)不超過5時(shí),編碼規(guī)則為形1+形2+形3+形4+形5,碼長為1-5碼。而當(dāng)漢字的形碼數(shù)超過5時(shí),編碼規(guī)則為形1+形2+形3+形4+形E。為了減少重碼,我們規(guī)定1.單形碼部首非單獨(dú)存在時(shí),一律以相應(yīng)的單一形碼取碼。2.下列部首一律為雙形碼部首女、王、、、目、田、、穴、舟、酉、雨、魚和革。女”出現(xiàn)在字首時(shí),其形碼為77。3.下列部首一律為三形碼部首走、豸、齒、骨、鬼、髡、鹿、黑、鼠和鼻。4.基本筆畫小、叉、串、八和口等,非單獨(dú)存在時(shí),一律不拆開,均以相應(yīng)的單一形碼取碼。另外,我們規(guī)定帶有叉和串的部分編碼規(guī)則如下1.僅由相叉兩筆畫組成的漢字,其編碼為三碼,由首筆畫形碼、次筆畫形碼和6構(gòu)成。2.漢字第一部分為單形碼,而第二部分為僅由相叉的兩筆畫組成時(shí),其編碼為四碼,第二部分為三碼,由首筆畫形碼、次筆畫形碼和6構(gòu)成。3.漢字第一部分為僅由相叉的兩筆畫組成,而第二部分(非相叉的兩筆畫)為單形碼時(shí),其編碼也為四碼,第一部分由首筆畫形碼、次筆畫形碼和6三碼構(gòu)成。4.僅由相串的三筆畫組成的漢字,其編碼為四碼,由第一筆畫形碼、第二筆畫形碼、第三筆畫形碼和7構(gòu)成。5.四筆以上筆畫相交,優(yōu)先處理相串筆畫。如“豐”的編碼為76,“夷”的編碼為774。10個(gè)數(shù)字碼元0-9可用10個(gè)英文字母Q、W、E、R、T、Y、U、I、O和P或其它的英文字母代替。詞組的編碼方法如下雙字詞第一字的第一、第二碼+第二字的第一、第二和第三碼。三字詞第一字的第一、第二碼+第二字的第一、第二碼+第三字的第一碼。四字詞第一字的第一、第二碼+第二、第三和第四字的第一碼。五字詞第一、第二、第三、第四和第五字的第一碼相加。多字詞第一、第二、第三、第四和最后一字的第一碼相加。綜上所述,本發(fā)明涉及一種漢字編碼及其計(jì)算機(jī)輸入系統(tǒng)。其特征在于包括(1)采用計(jì)算機(jī)通用小鍵盤,(2)采用漢字聲碼、韻碼和形碼中的一種碼或兩種碼或各種碼對(duì)漢字和詞組進(jìn)行編碼,形碼由橫、豎、撇、點(diǎn)和折五種基本筆畫及其組合筆畫決定。編碼方法分為全形碼法和部分形碼法,部分形碼法又分為聲韻形碼法、形聲韻碼法、聲形碼法和形聲碼法。形聲韻碼法編碼規(guī)則為形1+形2+聲+韻或形1+形E+聲+韻。聲韻形碼法的編碼規(guī)則為聲+韻+形1+形2或聲+韻+形1+形E。聲形碼法編碼的規(guī)則為聲+形1+形2+形3或聲+形1+形2+形E。形聲碼法編碼規(guī)則為形1+形2+形3+聲或者形1+形2+形E+聲。全形碼法分為四位碼長全形碼法和五位碼長全形碼法,前者編碼規(guī)則為形1+形2+形3+形4或形1+形2+形3+形E。聲碼、韻碼有兩種取法(1)分別取漢字拼音字母聲母和韻母的首字母,(2)分別按雙拼法取漢字拼音的聲母和韻母。在四位碼長的編碼方法中,形碼由橫、豎、撇、點(diǎn)和折五種基本筆畫及其組合筆畫決定,可選擇26個(gè)英文字母作碼元,它們分別對(duì)應(yīng)橫、豎、撇、點(diǎn)、折、叉、串、八和口及其組合筆畫。形碼也可選擇25個(gè)英文字母作為碼元,它們分別對(duì)應(yīng)于橫、豎、撇、點(diǎn)、折筆畫及其組合的雙筆畫。在五位碼長全形碼法中,采用10個(gè)數(shù)字0-9或10個(gè)英文字母Q、W、E、R、T、Y、U、I、O和P或者10個(gè)不同的英文字母作為碼元,它們分別對(duì)應(yīng)于橫、豎、撇、點(diǎn)、折、叉、串和口及其組合筆畫,編碼規(guī)則為形1+形2+形3+形4+形5或形1+形2+形3+形4+形E。本發(fā)明的漢字編碼方法具有規(guī)律性強(qiáng)的優(yōu)點(diǎn),特別是采用了具有規(guī)律性的筆畫及其筆畫組合作為形碼,對(duì)熟練掌握漢語拼音、一般掌握漢語拼音和完全不懂漢語拼音的人,可以選擇不同編碼方法進(jìn)行編碼,都能做到易記易學(xué),重碼率低和漢字輸入速度快。下面舉例對(duì)部分編碼方法加以說明。權(quán)利要求1.一種漢字編碼及其計(jì)算機(jī)輸入系統(tǒng),其特征在于包括(1)采用計(jì)算機(jī)通用小鍵盤,(2)采用漢字聲碼、韻碼和形碼中的一種碼或兩種碼或各種碼對(duì)漢字和詞組進(jìn)行編碼,形碼由橫、豎、撇、點(diǎn)和折五種基本筆畫及其組合筆畫決定。2.按照權(quán)利要求1所述的漢字編碼及其計(jì)算機(jī)輸入系統(tǒng),其特征在于編碼方法分為全形碼法和部分形碼法,部分形碼法又分為聲韻形碼法、形聲韻碼法、聲形碼法和形聲碼法。3.按照權(quán)利要求2所述的漢字編碼及其計(jì)算機(jī)輸入系統(tǒng),其特征在于選擇26個(gè)英文字母作為形碼碼元,它們分別與不同筆畫及其組合筆畫相對(duì)應(yīng),并且分別對(duì)應(yīng)于相應(yīng)的單形碼部首,具體如下碼元筆畫單形碼部首碼元筆畫單形碼部首A橫王Z橫+折橫+撇石Q橫+橫橫+豎酉S豎蟲X豎+折山W豎+橫刂D撇C撇+折月E撇+橫钅F點(diǎn)氵V點(diǎn)+折讠R點(diǎn)+橫疒G折馬B折+折纟T折+橫點(diǎn)點(diǎn)點(diǎn)忄H叉木N斜叉犭Y正叉+橫土J橫串艸M斜串女U豎串扌K撇+點(diǎn)點(diǎn)+撇火I撇+豎亻L口口O口+橫日P口+橫等4.按照權(quán)利要求2所述的漢字編碼及其計(jì)算機(jī)輸入系統(tǒng),其特征在于選擇25個(gè)英文字母作為形碼碼元,它們分別與不同筆畫及其組合筆畫相對(duì)應(yīng),并且分別對(duì)應(yīng)于相應(yīng)的單形碼部首,具體如下碼元首筆畫次筆畫單形碼部首碼元首筆畫次筆畫單形碼部首B橫無或橫王S撇點(diǎn)V橫豎艸A撇折月C橫撇石Y點(diǎn)無或橫疒X橫點(diǎn)蟲U點(diǎn)豎門Z橫折扌I點(diǎn)撇火H豎無或橫土O點(diǎn)點(diǎn)氵J豎豎酉P點(diǎn)折讠K豎撇木T折無或橫口L豎點(diǎn)忄R折豎N豎折山E折撇女G撇無或橫撇钅W折點(diǎn)日F撇豎亻Q折折纟D撇撇犭5.按照權(quán)利要求3或4所述的漢字編碼及其計(jì)算機(jī)輸入系統(tǒng),其特征在于聲韻形碼法編碼規(guī)則為聲+韻+形1+形2或者聲+韻+形1+形E。6.按照權(quán)利要求3或4所述的漢字編碼及其計(jì)算機(jī)輸入系統(tǒng),其特征在于形聲韻碼法編碼規(guī)則為形1+形2+聲+韻或者形1+形E+聲+韻。7.按照權(quán)利要求3或4所述的漢字編碼及其計(jì)算機(jī)輸入系統(tǒng),其特征在于聲形碼法的編碼規(guī)則為聲+形1+形2+形3或者聲+形1+形2+形E。8.按照權(quán)利要求3或4所述的漢字編碼及其計(jì)算機(jī)輸入系統(tǒng),其特征在于形聲碼法的編碼規(guī)則為形1+形2+形3+聲或者形1+形2+形E+聲。9.按照權(quán)利要求3或4所述的漢字編碼及其計(jì)算機(jī)輸入系統(tǒng),其特征在于全形碼法的編碼規(guī)則為形1+形2+形3+形4或者形1+形2+形3+形E。10.按照權(quán)利要求2所述的漢字編碼及其計(jì)算機(jī)輸入系統(tǒng),其特征在于全形碼法為五位碼長法,編碼規(guī)則為形1+形2+形3+形4+形5或者形1+形2+形3+形4+形E,碼元采用10個(gè)數(shù)字0-9,它們分別對(duì)應(yīng)于不同筆畫及其組合筆畫,并且分別對(duì)應(yīng)于相應(yīng)的單形碼部首(10個(gè)碼元0-9可以用10個(gè)英文字母Q、W、E、R、T、Y、U、I、O和P或其它英文字母代替),具體如下碼元基本筆畫或組合筆畫單形碼部首1橫橫+折橫+撇橫+橫橫+豎艸2豎豎+折豎+橫豎+豎蟲3撇撇+折撇+橫钅4點(diǎn)點(diǎn)+橫氵5折折+折纟6叉木7串扌8撇+豎撇+點(diǎn)點(diǎn)+撇亻9點(diǎn)點(diǎn)+折點(diǎn)+豎點(diǎn)點(diǎn)點(diǎn)讠0口口全文摘要一種漢字編碼及其計(jì)算機(jī)輸入系統(tǒng),其特點(diǎn)是采用漢字聲碼、韻碼和形碼(英文字母或數(shù)字)中一種或兩種或各種碼對(duì)漢字編碼,形碼由橫、豎、撇、點(diǎn)和折五種基本筆畫及其組合筆畫決定。編碼方法分為全形碼法和部分形碼法。本發(fā)明提供多種編碼方法,對(duì)熟練掌握、一般掌握和完全不懂漢語拼音的人,可以用任何一種方法進(jìn)行編碼,都能做到編碼方法簡單、易記易學(xué)、重碼率低,可在計(jì)算機(jī)上實(shí)現(xiàn)漢字的高速度輸入。文檔編號(hào)G06F3/023GK1175725SQ97114439公開日1998年3月11日申請(qǐng)日期1997年7月22日優(yōu)先權(quán)日1997年7月22日發(fā)明者邱勵(lì)楠申請(qǐng)人:邱勵(lì)楠