專利名稱:角音碼漢字輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及電腦領(lǐng)域中的漢字輸入技術(shù)。
目前電腦鍵盤通常采用101-103個(gè)鍵的PC鍵盤。它是基于數(shù)字和英文輸入的鍵盤。若用這種鍵盤輸入漢字尚需按漢字的發(fā)音或?qū)h字進(jìn)行一些必要的分解,以求漢字的輸入碼,即需要對漢字進(jìn)行編碼。編碼輸入是目前唯一廣泛使用的漢字電腦輸入方法,它的最大特點(diǎn)是將方塊漢字按形或按音編碼。經(jīng)檢索按角音取碼輸入漢字的方案有幾個(gè),中國專利CN00100644.4、CN91100006.8、CN97101389等,都是以漢字發(fā)音作為音碼,然后按漢字四角的字形取碼。這些方案雖具有拼音碼及四角碼易學(xué)的優(yōu)點(diǎn),但是,它們實(shí)際上未柔軟對應(yīng)漢字構(gòu)型復(fù)雜的特點(diǎn),難免重碼出現(xiàn)多,為了減少重碼又不得不增加碼位或作出更多的規(guī)則加以限制。
本發(fā)明的目的是提供一種能對應(yīng)漢字結(jié)構(gòu)簡易取碼的、易學(xué)易記且重碼較少的角音碼電腦漢字輸入方法。
本發(fā)明目的是通過按具體漢字本身的字形結(jié)構(gòu)特點(diǎn),柔軟地分解成一些單字、復(fù)合字、偏旁和/或筆形的組合,然后相應(yīng)使用字形碼、偏旁碼和/或筆形碼再加上整個(gè)漢字的發(fā)音首碼構(gòu)成該漢字輸入碼的方法來實(shí)現(xiàn)的。具體講,本發(fā)明采用通用鍵盤輸入漢字,每個(gè)漢字全碼為四位碼,首位碼為整個(gè)漢字發(fā)音的第一個(gè)字母,此即為音碼,其余三個(gè)碼(形碼)由漢字的字形結(jié)構(gòu)決定,由字形碼、偏旁碼和/或筆形碼構(gòu)成,取碼方法是<1>在編碼位置上有偏旁時(shí)一律用偏旁碼;<2>在編碼位置上可分離出單字時(shí)用字形碼;<3>在編碼位置上,既無偏旁,又不能分離出字,就用筆形碼。
在上述取碼過程中,如果后兩個(gè)碼位共一個(gè)筆形且成字,則先用筆形碼后用字形碼;對于只有一個(gè)筆形的單字一律用筆形碼;依照上述規(guī)則不能編足三位形碼的可用字型代碼補(bǔ)足,以進(jìn)一步減少重碼率。
上述字形碼是指漢字中可分離出的單字或復(fù)字以其發(fā)音的第一個(gè)字母作為字形碼;偏旁碼是指漢字中的偏旁以其偏旁原字、變形字或形似字發(fā)音第一字母作為偏旁碼,或以其偏旁原字一級(jí)簡碼或相應(yīng)筆形碼作為偏旁碼;筆形碼是指按漢字的筆劃形狀取碼,本發(fā)明實(shí)例使用0-9數(shù)字作筆形碼。
本發(fā)明的編碼位置是由相應(yīng)漢字的編碼順序確定的,單個(gè)漢字編碼順序因字形不同而異,單體字編碼順序?yàn)樽笊辖?、右上?左下角、右下角;包圍形與內(nèi)外形漢字編碼順序?yàn)橥庾笊辖恰?nèi)左上角、內(nèi)右下角;二合字編碼順序?yàn)槭撞孔笊辖恰⑽膊孔笊辖?、右下角;三合字編碼順序?yàn)樽笊辖恰⒋尾孔笊辖?、右下角;四合字編碼順序?yàn)樽笊辖恰⒋尾孔笊辖?、右下角?br>
本發(fā)明方法構(gòu)成的角音輸入碼是漢字拼音與四角字形分層次有機(jī)的組合,具有拼音碼與四角碼易學(xué)易用的優(yōu)點(diǎn)。但它與現(xiàn)有技術(shù)不同,本發(fā)明柔軟對應(yīng)了漢字本身具有的結(jié)構(gòu)非單一的特點(diǎn),引進(jìn)了偏旁及復(fù)合字的概念,在取碼上以偏旁優(yōu)先、字形次之、筆形補(bǔ)充,大大減少了重碼,而且有很快的漢字輸入速度。對于標(biāo)準(zhǔn)一、二級(jí)漢字庫,本發(fā)明的角音碼有重碼249個(gè),較之于五筆碼的220個(gè),重碼是很相近的,因此二者的輸入速度也很相近。而在易學(xué)易用上,本發(fā)明則大為領(lǐng)先。
下面結(jié)合實(shí)例進(jìn)一步說明本發(fā)明。
本發(fā)明是在研究漢字字形,并將之分解成單字、復(fù)合字、偏旁及筆形的基礎(chǔ)之上完成的。因此有必要先對漢字的音與形加以分析。
一、漢字的音與形分析本發(fā)明構(gòu)成的角音碼實(shí)質(zhì)是音形結(jié)合碼,以其漢字發(fā)音的第一個(gè)字母作為角音碼的第一碼,即為音碼。另三個(gè)形碼由偏旁碼、字形碼和/或筆形碼構(gòu)成。
關(guān)于對形碼的認(rèn)識(shí),舉例如下例一、“暗“由“日、立、日”三個(gè)單字組成,其形碼由各單字發(fā)音的第一個(gè)字母構(gòu)成,即“rlr”例二、“饅”由“食”旁和“日、四、又”三個(gè)單字組成,其形碼構(gòu)成為左邊的“食”旁碼“s”,右上角單字“日”和右下角單字“又”二字發(fā)音的第一字母,即“sry”。例三、“澤”由“水”旁和“又”字及“ ”筆形組成,其形碼構(gòu)成為“水”旁碼“7”,“又”字的字形碼“y”和“ ”筆形碼“5”即“7y5”。
從上面三個(gè)例子可以看出字形碼和偏旁碼與人們的日常習(xí)慣是很相近的,筆形碼則以1978年由四川省人民出版社出版的《四角號(hào)碼新詞典》為基礎(chǔ),本發(fā)明在取角方式上作了一些改進(jìn)。下面是本發(fā)明的一些定義。
(一)、字形碼漢字中可分離出的單字或復(fù)字發(fā)音的第一個(gè)字母,下面列出了部分常用單字的字型碼。例口k、田t、車c、豸z、隹z、合h、髟b、日r、曰r、巛c、舛c、內(nèi)n、匕b、七q、耒l、厶s、孑j、巳s、芻c、氐d、夕x注因漢字中“日”“曰”不易區(qū)分,故全取作r(二)、偏旁碼1、偏旁的原字發(fā)音第一個(gè)字母。詳列于下b疒(病) e卩、阝(耳) h灬(火)j钅(金) l刂(立刀) q犭(犬)r亻、彳(人) s饣(食) w攵(文)X (穴) y衤、衣(衣) z (足)2、偏旁的原字一級(jí)簡碼。詳列于下i艸(草) o讠(言) u辶、廴(走) v(竹)3、字體變形作為偏旁。詳列于下b (匕), (半) e (厄) f (夫) j (己), (幾)k (克) l (立) n (牛) q (且), (七)S (手) t (土), (屯) w (亡), (王)y (元), (魚), (羊) z (止) q (僉)4、偏旁形似字發(fā)音第一字母,詳列于下c (廠) g (鬼) j (幾) m冂、、匚、 (門)w (文) x宀、冖、 (穴)Y礻(衣)5、字頭所成偏旁,詳列于下a (愛) h(虎) r (刃) x勹(旬)6、僅有一個(gè)筆形的偏旁“扌、卜”以及原字發(fā)音以s開始且其筆形碼之和小于9的偏旁“纟、氵、冫“用其筆形碼之和作為偏旁碼,詳列于下3纟 4冫 5扌 7氵 9卜7、偏旁碼注意事項(xiàng)(1)關(guān)于筆形碼的確定可閱下文而知。
(2)“ ”旁只要在編碼位置均可作“r”,例如“方”的編碼是“f02r”
(3)“礻”旁本應(yīng)作“示”旁,因?yàn)樗c“衤”旁極相似,為了減少辨認(rèn)時(shí)間,故取作“衣”旁。
(4)形似字偏旁“ ”指下列類型風(fēng)fj4v鳳fj14凰fjbw(5)門破或刃破則不能視作偏旁,如“內(nèi)”n422而不能作nm8v,“力”142v而不作14rv。
(6)“冖”上加任何筆形夠成的偏旁均作x(三)、筆形碼漢字的筆劃形狀,歸納起來有十種,用0-9分別代表。對照口訣如下橫1垂2 3點(diǎn)捺叉4插5方匡67角8八9是小 點(diǎn)下有橫變0頭展示上述口訣的說明見下表
1、筆形是從角的方位來看待。例如端左上角“亠”為0,右上角“ ”取2,左下角“ ”取1,右下角“”取2顏?zhàn)笊辖恰百铩睘?,右上角“一”取1,左下角“丿”取2,右下角“八”取8烙左上角“ ”為9,右上角“ ”取7,左下角“ ”取8,右下角“口”取6截左上角“ ”為4,右上角“ ”取3,左下角“ ”取2,右下角 ”取52、取角方法2.1一筆可以分角取碼。例27以826亂2147七117乙7172幾712.2一筆的上下兩段和別筆構(gòu)成兩種筆形的,分兩角取碼。例19水248大49木98火99米2.3下角筆形偏在一角的,按實(shí)際位置取碼。缺角則缺碼。例02產(chǎn)32戶1虧21飛211弓722.4一個(gè)筆形,前角已用過,后角則視作缺。例11王23冬733之41直5中2卜33、筆形碼注意事項(xiàng)3.1筆形應(yīng)盡量取復(fù)筆。例正確43寸5扎2172廠198興82介28氣192少錯(cuò)誤13寸212扎2112廠138興222介322氣1132少33.2點(diǎn)下帶橫折的如“戶、永“等字的上角取作3。
3.3單筆取左右!即角形有兩單筆或一單筆一復(fù)筆的。不論高低,一律取最左(左角)或最右(右角)的筆形。例11非111飛213州225物723.3復(fù)筆取高低!即有兩復(fù)筆可取時(shí),在上角取較高的筆形,在下角取較低的筆形。例42巾211功4247也4152成342皮4二、漢字的三種字型及其取碼方法(一).漢字的字型研究漢字的字型,即研究偏旁、單字或復(fù)字及筆形在漢字中的位置關(guān)系。角音碼把漢字分成三種字型左右型、上下型、雜合型,分別賦以字型代碼o、u、v,見下表 表中雜合型又稱獨(dú)體字,左右型和上下型又稱合體字。兩部分合在一起稱二合字,三部分合在一起稱三合字,四部分或多于四部分合在一起稱四合字。在角音碼中字型是編碼的重要依據(jù),不同的字型具有不同的編碼規(guī)則。下面分別說明。
1.雜合型(v型)有兩種情況(1)單體字由筆畫構(gòu)成,如乘、卜、又、等。也可能由單字加筆形構(gòu)成,如白、自、革、甚等。
(2)內(nèi)外型與包圍型字的外圍由“口、門、戊、幾、冂、凵、匚”構(gòu)成的漢字為內(nèi)外型,外圍形如“ ”的漢字為包圍型。如困、間、威、風(fēng)、兇、同、匡、這、司、病、壽等。
2.左右型(o型)有三種情況(1)二合字兩個(gè)部分左右排列,漢字左右間有明顯的界線和距離,如相、汗、明、揚(yáng)、體、郇、編等。其中明、郇、編等字的一邊是雜合型,但整個(gè)漢字是左右型。
(2)三合字整個(gè)漢字從左到右排列,或者單獨(dú)占據(jù)一邊的部分與另外兩部分呈左右排列,如湘、部、到、結(jié)等。
(3)四合字四部分或多于四部分從左到右排列,或分別組合后整體呈左右排列,如讎、能、候、鼢等。
3.上下型(u型)也有三種情況
(1)二合字兩個(gè)部分上下排列,漢字上下間有明顯的界線和距離,如節(jié)、字、青、忽、愚等。
(2)三合字三個(gè)部分上下排列,或者占一層的部分與另外兩個(gè)部分上下排列,如意、想、忿、型等。
(3)四合字四部分或多于四部分上下排列或分別組合后整體呈上下排列,如豆、鬣、翟、瞿、翡、鬃、盒、煎、箭等。
4、合體字注意事項(xiàng)首部、次部和尾部的區(qū)分順序與通常書寫習(xí)慣相同。
(二)、取碼方法對于一個(gè)結(jié)構(gòu)復(fù)雜的漢字,在取碼位置上可能是一個(gè)單字、或一個(gè)復(fù)合字,也可能是一個(gè)偏旁,或者只是一個(gè)筆形。其取碼方法如下1、在編碼位置上有偏旁時(shí)一律用偏旁碼。例如扁bhm42、在編碼位置上可分離出單字時(shí)(以不涉及另一取碼位置為限)用字形碼。例如“沒”字的編碼是“m7jy”,“馨”字的編碼是“xssx”?!办痹凇皼]”字中“占右上角和右下角”,故編碼為“jy”,而在“馨”字中僅占右上角,故取復(fù)合字碼“s”3、在編碼位置上,既無偏旁,又不能分離出字,就用筆形碼。例如本b523為了進(jìn)一步減少重碼率,補(bǔ)充下列取碼方法1、依照上述規(guī)則不能編足四位碼可用字型代碼補(bǔ)足;也可以實(shí)碼輸入,無需補(bǔ)足四位碼。因o、u、v作音碼和字形碼很少,故本發(fā)明實(shí)例采用o、u、v作字形代碼,以離散重碼。
2、如果后兩個(gè)碼位共一個(gè)筆形且成字,則先用筆形碼后用字形碼。例如啟qh6k等(也可先用字形碼后用筆形碼)。
3、對于只有一個(gè)筆形的單字一律用筆形碼(口例外)。如一1十4中5曳5聿5吏5八8小9。
下面就各種字型的取碼方法分別說明。
1.單體字由筆劃構(gòu)成的單體字形碼用筆形碼,形碼順序?yàn)樽笊辖?、右上?左下角(右上角若與左上角或右下角同一筆形則取左下角,下同)、右下角。例如乘c29v、卜b23v、由y56v、上s211、白b261。而對于上部可分解出單體字的漢字,形碼順序?yàn)樯?、左下角、右下角。例如革gn5v、甚sq71。
2.內(nèi)外型與包圍型形碼順序?yàn)橥庾笊辖恰?nèi)左上角、內(nèi)右下角。例如困k649、間jm61、威wwln、鳳fj14、周zmsk、兇xm4v、匡km11、這zu04、起qz11、處cw23、司srlk、刃rr32、氨aqxn、裁c403、虱s12c、病bb12、壽s54c、布b442、扁bhm4、差cy113.二合字形碼順序依下述狀況而定(1)第一部分是偏旁或是字、或僅有一個(gè)筆形,形碼順序?yàn)槭撞孔笊辖?、尾部左上角、右下角。例如字zx14、筆bv21、全q811、奉f55u、吝1w6k、漢h714、形xk22、性x921、嗎mk12、伸sr5s、的dbx3注首部是字而尾部是偏旁,則首部取兩碼,(即取左上角、右上角或左上角、左下角),尾部取偏旁碼。例如利1291、郇xxre(2)首部既非偏旁或字,又有兩個(gè)筆形,形碼順序?yàn)樽笊辖恰⒂疑辖?上下型)/左下角(左右型)、右下角。例如尋x17c、狀z31q注若取二碼部分是包圍型或內(nèi)外型,兩碼可用外左上角、內(nèi)右下角。
4.三合字形碼順序?yàn)樽笊辖恰⒋尾孔笊辖?、右下角。例如斑bwww、到dltl、段d7jy、將j3xc、室sxlt、花hirq、型xklt5.四合字形碼順序?yàn)樽笊辖?、次部左上角、右下角。例如能nsyb、瞿qmmz、豆dlkl。但如果前幾部分可合成一字,則先將這一個(gè)字視作一部分而取其字形碼,這樣組合后的四合字就可被視作三合字或二合字而照3、4規(guī)則取碼。例如翟dyrl、羹gg88。
三、簡碼輸入的方法為了提高輸入速度,對于一些經(jīng)常使用的漢字,角音碼方案設(shè)計(jì)了簡碼。角音碼取其前一碼,前兩碼或前三碼構(gòu)成一二三級(jí)簡碼。由于以Iuvo作第一發(fā)音的漢字很少,考慮到偏旁重碼的離散問題,我們將Iouv作為草言走竹的一級(jí)簡碼。
1、一級(jí)簡碼a b c d e f g h i j k l m安不產(chǎn)的而發(fā)工和草及可了民n o p q r s t u v w你言批起人是同走竹我x y z寫以在2、數(shù)字簡碼
1 2 3 4 5 6 7 8 9 0一 二 三 四 五 六 七 八 九 零1s 1b 1q 1w 1z 1y 11s 11b 11q 11w十 百 千 萬 兆 億 拾 佰 仟 萬其它二級(jí)、三級(jí)簡碼可在使用中逐步掌握。
四、詞匯輸入的方法本發(fā)明構(gòu)成的角音碼對詞匯輸入很方便,不管多長的詞匯,都只需擊四鍵,而且詞匯輸入和字的輸入統(tǒng)一,不加字或詞的輸入標(biāo)記,也無需換檔。
詞匯的取碼方法如下1、雙字詞分別取每個(gè)字的前兩碼作為輸入碼。例如輸入scr8詞匯coh7計(jì)算josv機(jī)器jmqk漢字h7zx分別f8bk2、三字詞前兩個(gè)漢字各取頭一碼,第三個(gè)漢字取前兩碼。例如角音碼jyms計(jì)算機(jī)jsjm操作員czyk電影院dyye國務(wù)院gwye3、四字詞取每個(gè)漢字的頭一碼。例如知識(shí)分子zsfz程序設(shè)計(jì)cxsj千篇一律qpyl說一不二sybe4、多字詞超過四個(gè)字的詞,分別取一、二、三、末字的第一碼。例如中華人民共和國zhrg此外,本發(fā)明設(shè)計(jì)有容錯(cuò)碼。容錯(cuò)碼是指容易搞錯(cuò)的碼和允許搞錯(cuò)的碼。在實(shí)際編碼中常會(huì)出現(xiàn)種種差錯(cuò),這些差錯(cuò)的產(chǎn)生有各種原因,且?guī)в幸欢ǖ钠毡樾浴榱溯斎肽茼樌M(jìn)行,本發(fā)明特設(shè)計(jì)容錯(cuò)碼,即承認(rèn)那些容易寫錯(cuò)的碼存在的合理性,把它們作為一類正常的可用碼保留,使那些和規(guī)則不相符的(有錯(cuò)誤的)碼也可以正常使用。
容錯(cuò)有以下幾種類型1、字形碼、偏旁碼和筆形碼容錯(cuò)。例如正確碼些xzbe多dx22容錯(cuò)碼些xzbl多dx272、字型容錯(cuò)。例如正確碼出cs77(看作雜合型)容錯(cuò)碼出cs27(看作上下型)3、對于只有一個(gè)筆形的漢字,尾碼用其韻母的第一字母作為容錯(cuò)碼。例如
正確碼中z5vv申s5vv事s5vv小x9vv容錯(cuò)碼中z5vo申s5ve事s5vi小x9va本發(fā)明用“?”鍵作為學(xué)習(xí)鍵,以替代任一碼元,通過重碼選擇來輸入漢字。
權(quán)利要求
1.一種電腦漢字角音碼輸入方法,用通用鍵盤輸入,每個(gè)漢字全碼為四位碼,以其整個(gè)漢字發(fā)音的第一個(gè)字母為第一碼,即為音碼,另三個(gè)碼由形碼組成,其特征在于形碼由字形碼、偏旁碼和/或筆形碼構(gòu)成,其取碼由編碼位置上的字形決定,具體取碼方法是(1)在編碼位置上有偏旁時(shí)一律用偏旁碼(2)在編碼位置上可分離出單字時(shí)用字形碼(3)在編碼位置上,既無偏旁,又不能分離出字,就用筆形碼。
2.如權(quán)利要求1所述的角音碼輸入方法,其特征在于在取碼過程中,如果后兩個(gè)碼位共一個(gè)筆形且成字,則先用筆形碼后用字形碼;對于只有一個(gè)筆形的單字一律用筆形碼依照上述規(guī)則不能編足三位形碼的可用字型代碼補(bǔ)足。
3.如權(quán)利要求1所述的角音碼輸入方法,其特征在于字形碼是指漢字中編碼位置可分離出的單字或復(fù)字以其發(fā)音的第一個(gè)字母作為字形碼偏旁碼是指漢字中的偏旁以其偏旁原字、變形字或形似字發(fā)音第一字母作為偏旁碼,或以其偏旁原字一級(jí)簡碼或相應(yīng)筆形碼作為偏旁碼;筆形碼是指按漢字的筆劃形狀取碼。
4.如權(quán)利要求1、2或3所述的角音碼輸入方法,其特征在于編碼位置是由相應(yīng)漢字的編碼順序確定的,單個(gè)漢字編碼順序因字形不同而異,單體字取筆形碼,編碼順序?yàn)樽笊辖?、右上?左下角、右下角;包圍形與內(nèi)外形漢字編碼順序?yàn)橥庾笊辖?、?nèi)左上角、內(nèi)右下角;二合字編碼順序?yàn)槭撞孔笊辖恰⑽膊孔笊辖?、右下角;三合字編碼順序?yàn)樽笊辖?、次部左上角、右下角;四合字編碼順序?yàn)樽笊辖?、次部左上角、右下角?br>
5.如權(quán)利要求4所述的角音碼輸入方法,其特征在于雙字詞的編碼是分別取每個(gè)字的前兩碼作為輸入碼;三字詞的編碼是前兩個(gè)漢字各取前一碼,第三個(gè)漢字取前兩碼組成,四字詞取每個(gè)漢字的頭一碼組成;超過四個(gè)字的多字詞由分別取1、2、3、末字的第一碼組成。
全文摘要
本發(fā)明公開了一種電腦漢字角音碼輸入方法。它通過按具體漢字本身的字形結(jié)構(gòu)特點(diǎn),柔軟地分解成一些單字、復(fù)合字、偏旁和/或筆形的組合,然后相應(yīng)使用字形碼、偏旁碼和/或筆形碼再加上整個(gè)漢字的發(fā)音首碼構(gòu)成該漢字輸入碼。本發(fā)明能對應(yīng)漢字結(jié)構(gòu)簡易取碼、易學(xué)易記且重碼少,輸入速度快。
文檔編號(hào)G06F3/023GK1310376SQ01107338
公開日2001年8月29日 申請日期2001年4月10日 優(yōu)先權(quán)日2001年4月10日
發(fā)明者吳榮常, 黃開蓉 申請人:吳榮常