專利名稱:字基掃描漢字輸入法(四無碼)及其鍵盤的制作方法
專利說明 本發(fā)明屬于電子計(jì)算機(jī)及其外部設(shè)備領(lǐng)域,現(xiàn)已在IBM-PC機(jī)上實(shí)現(xiàn),可應(yīng)用于電子計(jì)算機(jī)、中西文電子打字機(jī)等各種中文信息處理裝置。
目前,漢字輸入方案已達(dá)500種左右。方案雖多,但按其實(shí)質(zhì)分類,僅有4種,即專用碼、音碼、形碼、音形混合碼。專用碼的代表為電報(bào)碼、區(qū)位碼,其特點(diǎn)為記憶量大,非專業(yè)人員難以使用。音碼以漢語(yǔ)拼音為基礎(chǔ),其代表為拼音碼,特點(diǎn)為熟悉漢語(yǔ)拼音的人員較易輸入,但重碼多,速度慢,而且南方、海外等地不熟悉漢語(yǔ)拼音的人不能使用。形碼以漢字的各種特征部件為基礎(chǔ),其代表為《五筆字型》,特點(diǎn)為直觀,經(jīng)專門訓(xùn)練后輸入速度較快,不須懂漢語(yǔ)拼音,但仍有一定數(shù)量的重碼,字根多,難以記憶,不經(jīng)過專門訓(xùn)練難以輸入。音形混合碼則兼有上述兩種方案地特點(diǎn)。
本發(fā)明所使用的編碼屬于形碼,作出此發(fā)明的目的是,提供一種無重碼、無記憶量、無須專門學(xué)習(xí)、無須懂漢語(yǔ)拼音(四無)的漢字輸入方法,使每一個(gè)會(huì)寫漢字的人都能方便、快速地輸入漢字,使?jié)h字計(jì)算機(jī)輸入真正得到普及。
本發(fā)明有兩個(gè)版本,版本一為sw10系統(tǒng),使用26個(gè)字母鍵及10個(gè)數(shù)字鍵,適用于初學(xué)者和非專業(yè)錄入人員。版本二為sw20系統(tǒng),使用26個(gè)字母鍵,適用于專業(yè)錄入員和已熟悉本方法的非專業(yè)錄入人員。兩個(gè)版本均能達(dá)到以下指標(biāo)
實(shí)現(xiàn)“四無”,即
無重碼,國(guó)標(biāo)一、二級(jí)字庫(kù)6763個(gè)漢字均有唯一的編碼。無記憶量,本發(fā)明編碼的基本部件為52個(gè)常見漢字,可刻或粘貼在鍵盤上。無須專門學(xué)習(xí),輸入規(guī)則僅三句話,任何一個(gè)會(huì)寫漢字的人看過之后,略經(jīng)熟悉即可方便、快速地輸入漢字。無須懂漢語(yǔ)拼音,本發(fā)明完全獨(dú)立于西文輸入方法。
簡(jiǎn)繁兼容,按照本發(fā)明輸入簡(jiǎn)體、繁體漢字,輸入規(guī)則、編碼部件均不須改變。
字詞兼容,本發(fā)明可在3鍵無重碼、字詞輸入不轉(zhuǎn)換的情況下,容納2000多個(gè)詞組。
輸入速度較快。本發(fā)明基本碼長(zhǎng)為3碼,6763個(gè)漢字平均碼長(zhǎng)為3.1碼(sw10系統(tǒng))、3.2碼(sw20系統(tǒng))。在使用簡(jiǎn)碼的情況下,對(duì)于第一級(jí)字庫(kù)3755個(gè)漢字,sw10系統(tǒng)僅有100多個(gè)字不能3鍵輸入,sw20系統(tǒng)僅有200多個(gè)漢字不能3鍵輸入(僅使用三級(jí)簡(jiǎn)碼,如使用二級(jí)簡(jiǎn)碼,此數(shù)字還可減少)。在不用簡(jiǎn)碼的情況下,對(duì)于兩級(jí)字庫(kù)6763個(gè)漢字,3鍵無重碼輸入漢字?jǐn)?shù)為5500多(sw10系統(tǒng))、5060多(sw20系統(tǒng))個(gè),需4鍵輸入漢字為1220(sw10系統(tǒng))、1600(sw20系統(tǒng))個(gè)左右,需5鍵輸入漢字為50(sw10系統(tǒng))、100(sw20系統(tǒng))個(gè)左右。
本發(fā)明的輸入規(guī)則和規(guī)定如下
基本規(guī)則三類二級(jí)字基,首二尾分級(jí)掃描取碼(sw20系統(tǒng))。[或保首、二尾分級(jí)掃描取碼(sw10系統(tǒng))]
解釋如下1.三類二級(jí)字基本發(fā)明將漢字的基本部件稱為字基,這些字基分為三類第一類為52個(gè)漢字及其同義、同形部首,簡(jiǎn)稱部首;第二類是五種連寫同類筆劃,簡(jiǎn)稱連筆;第三類是五種筆劃,簡(jiǎn)稱筆劃。第一類和第二類字基(部首和連筆)統(tǒng)稱為一級(jí)字基,第三類字基(筆劃)稱為第二級(jí)字基。
第一類字基是日月金竹火水土,人記耳目悶趾口,草衣廣紋病手守,山私女木賈(讀古)。以上為第一組,第二組與第一組依次對(duì)應(yīng),排列如下魚風(fēng)戈雞甸翌夕,米獄革房馬刀食,進(jìn)兒玉匕車孜盤,小石罕豐雪。第二組字基處于首鍵輸入位置時(shí),須先擊一下空格鍵或用上檔鍵輸入。
第二類字基為五種連筆,即連點(diǎn)(
)、連橫(
)、連撇(
)、連折(
)、連豎(
)。
第三類字基為五種筆劃,即點(diǎn)(丶)、橫(一)、撇(丿)、折()、豎(丨)。
部首歸類和連筆、筆劃解釋詳見附表1。
保首、二尾分級(jí)掃描取碼
輸入漢字時(shí),按書寫順序取碼,第一個(gè)字基(無論其是部首、連筆或筆劃)即字首,總是第一鍵輸入,然后根據(jù)漢字中剩下的一級(jí)字基數(shù)決定取碼辦法。(如“特”第一鍵取撇,“無”取連橫,“即”取彐,“政”取橫。)
第二碼取法對(duì)漢字取第一碼后剩余部分進(jìn)行掃描,當(dāng)漢字中余下的一級(jí)字基數(shù)≥2時(shí),按書寫順序取下一個(gè)一級(jí)字基(如“特”第二鍵取扌,“政”取止);當(dāng)漢字中余下的一級(jí)字基數(shù)<2時(shí),取下一個(gè)字基(如“無”第二鍵取撇,“即”取折)。
第三碼取法對(duì)漢字取二碼后剩余部分進(jìn)行掃描,當(dāng)漢字中還有一級(jí)字基時(shí),取最后一個(gè)一級(jí)字基(如“特”第三鍵取寸,“即”即卩,“政”取攵);漢字中已無一級(jí)字基時(shí),取最后一個(gè)字基(即字尾最后一筆)(如“無”取折)。如漢字不足三鍵,一律用空格鍵補(bǔ)足。
首二尾分級(jí)掃描取碼當(dāng)漢字中的一級(jí)字基數(shù)≥3時(shí),按書寫順序依次取第一、第二和最后一個(gè)一級(jí)字基(如“特”取扌、土、寸)。其它同sw10系統(tǒng)輸入方法。
參照規(guī)定
規(guī)定一首鍵擊空下?lián)Q上即第一鍵擊空格,系統(tǒng)自動(dòng)將下一次輸入的一個(gè)下檔鍵換成上檔鍵。
規(guī)定二三碼遇重有提示三鍵擊過之后如遇重碼,系統(tǒng)發(fā)出短促、低沉的“撲”聲或使磁盤驅(qū)動(dòng)器指示燈閃亮,提示輸入者以下應(yīng)按補(bǔ)充規(guī)則輸入。如無提示,表示此字已輸入,可輸入下一個(gè)字。
補(bǔ)充規(guī)則倒輸空格、字基、筆形或筆劃
當(dāng)輸入的是常用字時(shí),系統(tǒng)提供簡(jiǎn)碼,三鍵擊后如遇提示,可擊空格鍵,將有簡(jiǎn)碼的字輸入。
對(duì)有簡(jiǎn)碼和無簡(jiǎn)碼的重碼字,三鍵擊后如遇提示,均可按書寫順序倒輸字基、筆形或筆劃。
第四鍵輸入法當(dāng)重碼字中還有一級(jí)字基時(shí),輸入倒數(shù)第一個(gè)一級(jí)字基,如已無一級(jí)字基,則輸入筆形。
如四鍵擊后,還有提示,字中還有一級(jí)字基時(shí),倒輸一級(jí)字基;如已無一級(jí)字基,且已取過筆形,則倒輸尚未取到的筆劃;如已無一級(jí)字基,但未取過筆形,則取筆形;如取過筆形后,字中已無筆劃,則擊空格。
字余筆概念某個(gè)漢字按本發(fā)明基本規(guī)則取一級(jí)字基后剩余部分的最后一個(gè)筆劃稱為字余筆。如按基本規(guī)則取一級(jí)字基后,此漢字已無一級(jí)字基,則該字的最后一個(gè)筆劃為字余筆。如“氮”、“毯”的一級(jí)字基均為“連橫”、“火”、“火”,其字余筆均為“折”?!爸弧?、“叭”按基本規(guī)則取三鍵均為“口”、“八”、空格,其字余筆均為點(diǎn)。
筆形概念本發(fā)明將漢字分為左右、獨(dú)立、上下三種形狀。傳統(tǒng)的左右包圍如“區(qū)”、“毯”、“建”歸入左右形,全包圍如“國(guó)”等歸入獨(dú)立形,上下包圍如“同”、“氮”、“肩”等歸入上下形。左右形、獨(dú)立形為一類,以筆劃鍵為代表;上下形為一類,以連筆鍵為代表。字余筆與字形的結(jié)合稱為筆形。如“氮”的筆形為“連折”,“毯”的筆形為“折”,“只”的筆形為“連點(diǎn)”,“叭”的筆形為“點(diǎn)”。
字基類漢字輸入方法對(duì)單體類字基漢字(如日、人等),規(guī)定一律連取此字基三次,如遇重碼,再取一次此字基。對(duì)復(fù)合類字基漢字(如私、賈等)本身,仍按規(guī)則輸入(如私取禾、厶,賈取西、貝)。對(duì)復(fù)合字基中包含的字基類漢字,規(guī)定取其左上角第一個(gè)漢字作為單體類字基漢字輸入(如私中之禾,賈中之西),余下的字基類漢字首碼取此字基,然后按基本規(guī)則輸入(如厶取禾、折、點(diǎn),貝取貝、門、人)。
不可處理的重碼漢字輸入法。本發(fā)明有21個(gè)按規(guī)則不可處理的重碼漢字,用設(shè)置簡(jiǎn)碼的辦法解決。這些漢字及其簡(jiǎn)碼為常見字7個(gè),鳳(z),犒(x),具(c),訛(v),迸(b),扛(n),柞(m)。罕見字14個(gè),灃(ZZ),亓(XX),媼(CC),厙(VV),鎣(BB),仨(NN),塤(MM),釓(ZZZ),唧(XXX),錙(CCC),粼(VVV),尢(BBB),螋(NNN),笸(MMM)。
詞組輸入法。詞組一律為3碼,2字詞組取第一字的前2碼和第二字的第一碼,3字詞組取各字的第一碼,并規(guī)定詞組的第一碼上下檔鍵一律翻轉(zhuǎn),即原字碼的上檔鍵變?yōu)橄聶n鍵,下檔鍵變?yōu)樯蠙n鍵。
部件在鍵盤上的組合。sw10系統(tǒng)將52個(gè)漢字及其同義同形部首定義于26個(gè)字母鍵上,5種筆劃和5種連筆定義于10個(gè)數(shù)字鍵上。sw20系統(tǒng)將全部部件定義于26個(gè)字母鍵上。詳見
圖1、圖2。
漢字拆分口訣。本發(fā)明在選定漢字部件時(shí),考慮了避免取碼二義性問題,因此按規(guī)則取碼時(shí),一般不會(huì)出現(xiàn)二義選擇。對(duì)個(gè)別例外情況,提供以下口訣
大碼須取完,戈弋在后邊,天大夫二人,申日甲由田。解釋如下
大碼須取完即取碼時(shí)如遇大部首包含小部首,須取大部首。
戈弋在后邊即對(duì)于含“戈”、“弋”等字形的漢字如“成”、“我”、“或”等,規(guī)定戈弋均最后取。
天大夫二人即規(guī)定“天”拆為“一、大”,“夫”、“”等人字出頭的部件,拆為“連橫、人”。
申日甲由田即規(guī)定“申”、“電”等日字上下兩邊出頭的部件拆為日與其余筆劃,“甲”、“由”等日字僅一邊出頭的部件拆為田與其余筆劃,且規(guī)定甲拆為“田、其余筆劃”,由拆為“其余筆劃、田”。
本發(fā)明的基本原理
以中國(guó)傳統(tǒng)思想方法為指南,提出字基的概念。中國(guó)傳統(tǒng)思想方法與西方思想方法比較,有著明顯的區(qū)別。前者模糊性、整體性、關(guān)聯(lián)性較強(qiáng),后者精確性、局部性、分割性較強(qiáng)。文字是思想方法的產(chǎn)物之一。因此,漢字與西方文字比較,也有著完全不同的特性。西文精確、分立,全部文字由字母或字根組成,這些字母或字根都是唯一的,精確的,不存在相互包含的關(guān)系。漢字模糊、多維。模糊性表現(xiàn)在三個(gè)方面1.包含性,漢字的基本部件可以互相包容。如“金”是漢字的基本部件,但又包含著“人”、“王”及連點(diǎn)。2.層次性,漢字的基本部件至少可分為三個(gè)層次,即部首、筆劃和筆劃的某些特定組合。3.類同性。一是同義,漢字的某些基本部件在歷史的發(fā)展過程中,形狀發(fā)生了變化,但意義仍然相同,如“人”、“亻”、“彳”形狀不同,其內(nèi)在含義卻相似。二是同形,漢字的某些部件,含義不同,但形狀卻相同,如“戈”與“弋”、“鳥”與“烏”等。漢字的多維性主要表現(xiàn)在它有幾種不同的形狀,可分為上下、左右、獨(dú)立等基本形狀。從以上認(rèn)識(shí)出發(fā),本發(fā)明認(rèn)為,漢字的基本部件不能稱為字根、字元、字母等,其原因在于根、元、母等概念都是不能互相包含的、精確的、分立的,不符合漢字的基本特征。本發(fā)明認(rèn)為,應(yīng)將全部漢字的集合看作一個(gè)模糊的多維系統(tǒng),猶如一個(gè)大廈群,構(gòu)成大廈的基本部件可以是磚瓦灰砂石等基礎(chǔ)材料(對(duì)應(yīng)于漢字的筆劃),也可以是某些基本的結(jié)構(gòu)件(對(duì)應(yīng)于筆劃的某些特定組合),還可以是某些作為基本單元來裝配使用的房間(對(duì)應(yīng)于各種部首)。因此應(yīng)將漢字的基本部件稱為字基,基和根、元、母等概念雖只一字之差,但卻代表著兩種不同的思想方法。
分級(jí)和掃描概念的引入。
西文的精確和分立,漢字的模糊和多維,不僅決定了它們的基本部件含義的差別,而且決定了二者電子計(jì)算機(jī)輸入方法的差別。西文只能用重構(gòu)的方法輸入,即將字或詞的全部部件從頭到尾,一個(gè)不漏地輸入。漢字如用重構(gòu)的方法輸入,則顯得非常繁瑣。但是,現(xiàn)有的全部漢字輸入方法,還沒有一個(gè)方案完全脫離重構(gòu)輸入的束縛,這就是漢字輸入極為困難的原因所在。實(shí)際上,漢字是較高層次的語(yǔ)言表達(dá)方式,它的計(jì)算機(jī)的輸入比西文更為簡(jiǎn)單。它不須也不應(yīng)用重構(gòu)方法,而應(yīng)用識(shí)別方法輸入。
對(duì)于一個(gè)模糊系統(tǒng),如何最優(yōu)地進(jìn)行識(shí)別?不妨再以大樓為例,我們從大樓群中識(shí)別某座大樓,決不會(huì)仔細(xì)而精確地去測(cè)量每一塊磚瓦,只須對(duì)其進(jìn)行瀏覽(即掃描),往往是先看主要的特征,再看次要的特征(即分級(jí)掃描)。同理,我們識(shí)別漢字,不須從頭至尾詳細(xì)地去分辨每一個(gè)部件,而應(yīng)該首先看它的主要特征部件,當(dāng)主要特征部件相同時(shí),再看次要特征部件。這種分級(jí)掃描識(shí)別的方法,符合于模糊識(shí)別的原理,也符合漢字書寫的習(xí)慣。然而,遺憾的是,現(xiàn)有的全部漢字輸入方法,由于自覺或不自覺地受到西文輸入方法的影響,還沒有一個(gè)方案應(yīng)用了分級(jí)掃描識(shí)別的方法。
從以上論述可知,本發(fā)明所應(yīng)用的漢字輸入方法符合于漢字的內(nèi)在特性,完全獨(dú)立于西文輸入方法,其基本原理與現(xiàn)有的全部漢字輸入方法有著根本的區(qū)別,其新穎性是無可置疑的。
本發(fā)明的技術(shù)基礎(chǔ)
漢字輸入的基本原則確定之后,如何得到最優(yōu)的漢字編碼?這個(gè)問題的實(shí)質(zhì),就是要在滿足某些限制條件的前提下(本發(fā)明編碼的限制條件為1.盡量減少不可處理的重碼,2.漢字部件的所有組合必須是漢字,3.盡量避免漢字拆分出現(xiàn)二義性),從數(shù)百個(gè)漢字部件中,找到一組盡可能少的部件,使所有的漢字均能為這組部件所代表。這個(gè)問題實(shí)質(zhì)上就是一個(gè)求超高階模糊系統(tǒng)的最優(yōu)解的數(shù)字問題。
求超高階模糊系統(tǒng)最優(yōu)解的數(shù)學(xué)方法,超出了本發(fā)明的范圍,因此以下僅介紹運(yùn)用數(shù)學(xué)方法處理漢字系統(tǒng),求得最優(yōu)編碼的經(jīng)驗(yàn)性結(jié)論
結(jié)論一漢字部件的重要程度,與這個(gè)部件的包容度及其在漢字中的出現(xiàn)頻度有正相關(guān)關(guān)系。
結(jié)論二漢字編碼的重碼數(shù),與漢字部件的嚙合度有負(fù)相關(guān)關(guān)系,與漢字部件的分布離散度有正相關(guān)關(guān)系。
部件包容度概念包容度即某個(gè)漢字部件包含其它部件多少的程度,包含較小部件越多,其包容度越高。
部件嚙合比概念嚙合比即同一鍵上同一鍵次各漢字部件出現(xiàn)頻度之比。
部件分布離散度概念分布離散度即某鍵上漢字部件出現(xiàn)概率與平均概率(1/26=3.85%)之差的絕對(duì)值。
結(jié)論一解決了選擇那些部件作為基本部件的問題。它告訴我們,1.應(yīng)盡量多選擇包含較小部件多的大部件,盡量少選擇較小的部件。2.盡量多選擇在漢字中出現(xiàn)頻度多的部件,盡量少選擇出現(xiàn)頻度少的部件。
結(jié)論二解決了如何將已選定的部件組合到鍵盤上的問題。它告訴我們1.盡量將在同一鍵次出現(xiàn)頻度多的部件與出現(xiàn)頻度少的部件相結(jié)合,2.盡量使每一鍵上所有部件出現(xiàn)頻度累計(jì)數(shù)均勻分布。
本發(fā)明根據(jù)以上結(jié)論,經(jīng)過多次優(yōu)選,得到了如附表1.所示的漢字基本部件及其組合表。下面給出本發(fā)明編碼部件的嚙合比、分布概率和分布離散度(其中A1代表第一碼嚙合比,A2代表第二碼嚙合比,A3代表第三碼嚙合比)
部件組合A1A2A3分布概率%分布離散度%
日(魚)31.624.43.170.68
月(幾,蟲)8.85.73.03.220.63
金(戈,橫)18.430.78.75.681.83
竹(又,鳥,連橫)4.923.12.95.381.53
火(勹,田)2.43.09.92.571.28
水(習(xí),立)1.51.95.23.810.04
土(夕,凵)3.23.74.03.720.13
人(米)7.65.94.920.13
記(犭,大)20.64.55.53.500.35
耳(革,點(diǎn))1.31.755.13.630.22
目(房,連點(diǎn))3.04.93.64.050.20
悶(馬)2.89.418.63.510.34
趾(刀,匚)1.91.916.82.771.08
口(食)35776.05.982.13
草(進(jìn),連折)4.36.22.74.460.61
衣(兒)4.51.23.210.64
廣(玉,豎)1.83.913.94.030.18
紋(匕,連豎)8.02.511.13.840.01
病,八(車)1.652.814.74.020.17
手(孜,折)2.65.43.74.851.00
部件組合A1A2A3分布概率分布離散度%
守(盤,口)24.627.05.62.880.97
山(小,
,撇) 8.0 4.2 2.0 5.54 1.69
禾,厶(石)1.58.16.82.581.27
女(罕,連撇)1.23.35.42.581.27
木(豐)1.53.43.320.53
賈(雪)1.42.261.72.761.09
平均嚙合比=∑各碼嚙合比/∑碼數(shù)=15.3
平均分布離散度=∑各鍵分布離散度/∑鍵數(shù)=0.80
從這些數(shù)據(jù)可以看出,本發(fā)明編碼的嚙合比較高,分布離散度較低,具有較高的內(nèi)在質(zhì)量。
正是由于本編碼內(nèi)在質(zhì)量較高,才使其最終質(zhì)量指標(biāo)遠(yuǎn)遠(yuǎn)超過現(xiàn)有的所有漢字編碼。現(xiàn)有漢字編碼一般用25鍵,4鍵輸入,鍵次全排列數(shù)為25的四次方,約39萬(wàn)。而其無重碼的漢字?jǐn)?shù)最多達(dá)到6300左右,每個(gè)無重碼漢字約占用65個(gè)排列;如加上2000多個(gè)無重碼詞組,無重碼編碼數(shù)也未超過9000,每個(gè)無重碼編碼仍占用約45個(gè)排列。而本編碼基本上是3鍵輸入,以sw20系統(tǒng)為例,3鍵次全排列數(shù)為52×26×26約3.5萬(wàn)個(gè)排列,其3鍵無重碼漢字為5062個(gè),每個(gè)無重碼漢字僅占用約6.9個(gè)排列,如加上2000多個(gè)詞組碼,則每個(gè)無重碼字詞占用約4.9個(gè)排列。按兩種方法計(jì)算,本方案的編碼緊湊程度,即每個(gè)無重碼漢字占用的鍵次排列數(shù),均差不多是現(xiàn)有編碼的10倍。
我們?cè)O(shè)想一種最理想的情況,用一個(gè)100鍵的鍵盤,每個(gè)鍵代表1個(gè)漢字的基本部件,采用3鍵次輸入,1、2鍵輸入漢字部件,第3鍵輸入漢字的3種不同形狀,3鍵次全排列數(shù)為3萬(wàn)。假設(shè)這3鍵能將6763個(gè)漢字全部無重碼地輸入,則每個(gè)無重碼漢字占用的排列數(shù)約為4.5個(gè)。這大約就是漢字編碼所能達(dá)到的極限。可以看出,本發(fā)明編碼的緊湊程度,即每個(gè)無重碼漢字占用的鍵次排列數(shù),已接近極限。
從以上論述可知,本發(fā)明編碼具有較高的內(nèi)在質(zhì)量,其最終質(zhì)量指標(biāo)不僅約為現(xiàn)有編碼的10倍,而且已接近極限。因此,本發(fā)明技術(shù)上的創(chuàng)造性不僅是無疑的,而且是歷史性的。完全有理由說,本發(fā)明所取得的突破是一個(gè)具有歷史意義的突破。
本發(fā)明所采用的實(shí)用技術(shù)
采用首鍵擊空格,將以下輸入的一個(gè)下檔鍵自動(dòng)轉(zhuǎn)換成上檔鍵的技術(shù),解決了提高速度與減少重碼之間的矛盾。本發(fā)明為了減少重碼,sw10系統(tǒng)中有26個(gè)漢字及其同形同義部首,第一鍵輸入時(shí)須用上檔鍵輸入,sw20系統(tǒng)中還有“豎”、“連豎”第一鍵輸入時(shí)須用上檔鍵輸入。為了在擊上檔鍵時(shí)不影響輸入速度,采用了以下方法首鍵輸入上檔鍵時(shí),可先擊一個(gè)空格鍵給計(jì)算機(jī)發(fā)出信號(hào),計(jì)算機(jī)收到首碼空格的轉(zhuǎn)換信號(hào)之后,自動(dòng)將以下輸入的一個(gè)下檔鍵轉(zhuǎn)換成上檔鍵,隨即取消轉(zhuǎn)換信號(hào)。
采用了三鍵輸入后遇重碼,計(jì)算機(jī)給輸入者聲或光提示的技術(shù),從而兼顧了全局與局部的矛盾,使輸入者可以不看顯示器盲打輸入。本發(fā)明中3鍵可輸入的漢字是多數(shù),具有全局性,3鍵不可輸入的漢字是少數(shù),具有局部性。如果為了局部不顧全局,要求每個(gè)漢字都用4鍵或5鍵輸入,顯然不合理。僅僅考慮全局不顧局部,全部漢字都用3鍵輸入,則不能實(shí)現(xiàn)無重碼。而且通觀世界上任何一種文字,其部件長(zhǎng)度都是不一致的,強(qiáng)行限定每個(gè)漢字編碼都具有相同的碼長(zhǎng),違反了文字構(gòu)成的基本規(guī)律,是漢字四角號(hào)碼出現(xiàn)以來形成的一種陳規(guī)。本發(fā)明打破了這一陳規(guī),使?jié)h字部分編碼有不同的碼長(zhǎng)。為了輸入者的方便,采用了以下方法當(dāng)輸入者擊三鍵之后,計(jì)算機(jī)自動(dòng)檢查編碼表,如還有二個(gè)以上相同漢字,則向計(jì)算機(jī)內(nèi)部的揚(yáng)聲器發(fā)出一個(gè)相對(duì)于錯(cuò)碼信號(hào)而言,頻率低、時(shí)間短的音頻信號(hào),讓揚(yáng)聲器發(fā)出聲音,磁盤驅(qū)動(dòng)器指示燈閃亮,提示輸入者以下應(yīng)按補(bǔ)充規(guī)則輸入。
本發(fā)明與現(xiàn)有漢字輸入方法的比較
本發(fā)明實(shí)現(xiàn)了“四無”,即無重碼、無記憶量、無須專門學(xué)習(xí)、無須懂漢語(yǔ)拼音,其編碼緊湊程度達(dá)到在6763個(gè)漢字75%以上無重碼的情況下,每6.9個(gè)鍵次排列中容納1個(gè)無重碼漢字,或每4.9個(gè)鍵次排列中容納1個(gè)無重碼漢字及詞組?,F(xiàn)有漢字輸入方案均未達(dá)到以上指標(biāo)。
為了進(jìn)一步說明問題,下面將本方案和目前處于領(lǐng)先地位的《五筆字型》方案作一個(gè)全面比較(為了在同等的條件下進(jìn)行比較,均以sw20系統(tǒng)(26鍵)和五筆字型(26鍵)比較)
字基掃描(A)五筆字型(B)比較
1.編碼基本部件數(shù)52130A優(yōu)于B約1.5倍
2.編碼全部部件數(shù)137217A優(yōu)于B約60%
3.不規(guī)范部件(即字1268A優(yōu)于B約4.7倍
典中沒有的部首)
4.部件記憶規(guī)律按字形、字義聯(lián)想按首筆筆劃排列A優(yōu)于B
不須記憶須強(qiáng)記
5.6763個(gè)漢字3鍵重碼17013678A優(yōu)于B約1.2倍
6.6763個(gè)漢字4鍵重碼122467A優(yōu)于B約2.8倍
7.6763個(gè)漢字5鍵重碼0不可處理A優(yōu)于B
8.使用簡(jiǎn)碼,第一級(jí)字273(僅用三897A優(yōu)于B約2.3倍
字庫(kù)中3鍵重碼級(jí)簡(jiǎn)碼)
9.75%以上漢字無重碼
情況下,每個(gè)無重碼漢字6.965A優(yōu)于B約8.4倍
占用的鍵次排列數(shù)
10.同上,考慮無重碼詞組4.948A優(yōu)于B約8.8倍
11.實(shí)現(xiàn)盲打的難易程度提示過后可按提示后須在屏幕上
補(bǔ)充規(guī)則輸入,較選擇,難于實(shí)現(xiàn)盲打
易實(shí)現(xiàn)盲打A優(yōu)于B
從以上對(duì)比可知,本方案從整體上較大幅度地超過了《五筆字型》。
實(shí)現(xiàn)本發(fā)明的最好方法
漢字編碼掃描表的制作??墒紫劝凑毡景l(fā)明的輸入規(guī)則對(duì)6763個(gè)漢字進(jìn)行編碼,然后進(jìn)行壓縮。鑒于sw10系統(tǒng)首碼用62個(gè)鍵表示,sw20系統(tǒng)首碼用52鍵表示,故各碼可一律壓縮成二進(jìn)制6位數(shù),一個(gè)漢字最多5碼,需占用30位。各漢字編碼可一律用4個(gè)字節(jié)儲(chǔ)存,還多2個(gè)空位,可用其中1個(gè)空位設(shè)置簡(jiǎn)碼。鑒于編碼工作量較大,且對(duì)漢字的書寫順序可能認(rèn)識(shí)不一致,故應(yīng)使用本發(fā)明現(xiàn)已編成、壓縮好的編碼掃描表。
實(shí)現(xiàn)首鍵擊空格,使以下輸入的一個(gè)下檔鍵自動(dòng)轉(zhuǎn)換成上檔鍵的方法。可按照本說明書12頁(yè)的描述,通過編制程序?qū)崿F(xiàn)。
實(shí)現(xiàn)三鍵遇重碼自動(dòng)給予提示的方法。可按照本說明書12頁(yè)的描述,通過編制程序?qū)崿F(xiàn)。
附表一
1.部首歸類表
鍵位字基部首歸類鍵位字基部首歸類
b 日 日(
) B 魚 魚
x 月 月 X 蟲 幾(
)、蟲
v金金(钅)V戈戈(弋)
c竹竹()C雞又、鳥(烏)
(
)
z火火Z甸勹、田
n 水 水(氵
灬) N 翌 習(xí)、立
m土土(士)M夕夕、凵
g人人(亻)G米米、(彳)
f記言(讠)F獄犭(豸)、犬(大)
己(已、巳、)
d耳耳(阝、卩)D革革(廿)
s 目 目(
) S 房 戶(尸)、方
(罒
)
a悶門(冂)、A馬馬
心(忄)
h 趾 足(、
)、 H 刀 刀(、刂、)
止匚
j口口J食食(饣)
t草草(艸)T進(jìn)辶廴(之)、隹
鍵位字基部首歸類鍵位字基部首歸類
r 衣 衣(亠、
) R 兒 兒
(礻)
e廣廣(廠)E玉玉(王)
w 紋 纟(幺
) W 匕 匕(七)
q 病 八(冫、
八) Q 車 車(
)
y手手(扌)Y孜子、攵(夂)
u 守 宀(
) U 盤 舟、皿
寸囗
k 山 山 K 小 小(
)
l私禾、厶()L石石
i女女I罕(穴),干
o 木 木 O 豐 豐(、
)
p 賈 西,貝 P 雪 雨,彐(
)
2.筆劃定義
點(diǎn)包括傳統(tǒng)的點(diǎn)和捺。
橫包括傳統(tǒng)的橫和所有從左到右的筆劃。
撇包括傳統(tǒng)的撇和所有從右上到左下的筆劃。
折傳統(tǒng)的折。
豎傳統(tǒng)的豎。
勾均忽略不計(jì)。
3.連筆定義
連點(diǎn)所有兩筆和兩筆以上連寫的點(diǎn),但點(diǎn)與點(diǎn)之間須有其它字形隔開(如“乎”,“平”中均有連點(diǎn),但“學(xué)”、“著”中均無連點(diǎn),其字頭分別為“兩點(diǎn)(歸入病部)”,“三點(diǎn)水(歸入水部)”等等)。
連橫所有兩筆和兩筆以上連寫的橫。
連撇所有兩筆和兩筆以上連寫的撇。
連折所有兩筆和兩筆以上連寫的折。
連豎所有兩筆和兩筆以上連寫的豎。
注釋1.在sw10系統(tǒng)中,部件組合“金”改為“釘”,加部件“丁”。在sw20系統(tǒng)中,部件組合“水”改為“江”,加部件“工”;部件“木”改為“”,加部件“丁”。
2.sw20系統(tǒng)中,加有筆劃、連筆的部件組合(豎、連豎除外),其上下檔鍵均翻轉(zhuǎn)。
3.筆劃、連筆的鍵位見附圖。
4.應(yīng)用于繁體漢字輸入時(shí),車、馬、門、鳥、烏等簡(jiǎn)體部首變?yōu)榉斌w。
權(quán)利要求
1、本發(fā)明提出的《字基掃描漢字輸入法(四無碼)及其鍵盤》,屬于電子計(jì)算機(jī)及其外部設(shè)備領(lǐng)域,是一種形碼漢字輸入方法和用這種方法制作或改造的漢字處理裝置的鍵盤。其特征是按照漢字編碼的所有部件組合必須是漢字的原則進(jìn)行部件組合,并將這些部件組合定義于漢字處理裝置的鍵盤上。將漢字部件分為漢字及其同形同義部首(簡(jiǎn)稱部首)、同類連寫筆劃(簡(jiǎn)稱連筆)和筆劃三類,令部首、連筆為第一級(jí)部件,筆劃為第二級(jí)部件,按分級(jí)掃描識(shí)別的方法進(jìn)行編碼;編碼基本碼長(zhǎng)為3碼,最高碼長(zhǎng)為5碼,3碼之后的重碼計(jì)算機(jī)自動(dòng)提示,要求輸入者按編碼補(bǔ)充規(guī)則進(jìn)行無重碼輸入;為了解決提高速度和減少重碼的矛盾,采用了計(jì)算機(jī)自動(dòng)轉(zhuǎn)換上下檔鍵的技術(shù);此外,還提供了一部分詞組碼。
2、權(quán)利要求1.所述的漢字部件組合,其特征是一部分漢字部件有一碼用上檔鍵輸入,具體組合為日(魚),月(
),金(戈),竹(雞),火(甸),水(翌),土(夕);人(米),記(獄),耳(革),目(房),悶(馬),趾(刀),口(食);草(進(jìn)),衣(兒),廣(玉),紋(匕),病(車),手(孜),守(盤);山(小),私(石),女(罕),木(豐),賈(雪)。在sw20系統(tǒng)中,連筆、筆劃與部首組合為(革,點(diǎn)),(房,連點(diǎn)),(戈,橫),(雞,連橫),(罕,撇),(小,連撇),(孜,折),(進(jìn),連折),(玉,豎),(匕,連豎)。當(dāng)用于繁體漢字輸入時(shí),簡(jiǎn)體部件改為相應(yīng)的繁體部件。
3、權(quán)利要求1.所述的漢字及其同形同義部首,其特征是將與漢字含義相近或形狀相似的部首進(jìn)行歸并。
4、權(quán)利要求1.所述的連筆,其特征是將兩筆及兩筆以上的連寫同類筆劃作為一類漢字部件。
5、權(quán)利要求1.所述的分級(jí)掃描識(shí)別方法,其特征是將漢字部件分為主要特征部件和次要特征部件兩個(gè)級(jí)別,編碼時(shí)按書寫順序取碼并給予主要特征部件較高的優(yōu)先權(quán),當(dāng)僅靠主要特征部件不能唯一地識(shí)別某個(gè)漢字時(shí),再考慮取次要特征部件。
6、權(quán)利要求1.所述的編碼補(bǔ)充規(guī)則,其特征是某漢字取3碼之后,按照倒輸一級(jí)部件、筆形和筆劃的方法取碼,即如某漢字取3碼之后還有一級(jí)部件,則按書寫順序倒輸一級(jí)部件,如無一級(jí)部件則輸筆形或倒輸筆劃。
7、權(quán)利要求6.所述的筆形,其特征是將漢字分為左右、獨(dú)立和上下3種基本形狀,傳統(tǒng)的左右包圍歸入左右形,上下包圍歸入上下形,全包圍歸入獨(dú)立形,左右形和獨(dú)立形均用筆劃鍵代表,上下形用連筆鍵代表。令漢字取3碼后剩余部分的最后一筆為字余筆,字余筆與字形的結(jié)合即為筆形。
8、權(quán)利要求1.所述的詞組碼,其特征是進(jìn)行詞組編碼時(shí),原字碼的上檔鍵轉(zhuǎn)換為下檔鍵,對(duì)應(yīng)的下檔鍵轉(zhuǎn)換為上檔鍵。
9、權(quán)利要求1.所述的字基掃描漢字輸入法所用的鍵盤,其特征是sw20系統(tǒng)中,本發(fā)明采用的全部漢字部件均定義于26個(gè)字母鍵上,sw10系統(tǒng)中,本發(fā)明采用的52個(gè)漢字及其同形同義部首定義于26個(gè)字母鍵上,5種連筆和5種筆劃定義于10個(gè)數(shù)字鍵上。
10、權(quán)利要求1.所述的重碼計(jì)算機(jī)自動(dòng)提示,其特征是當(dāng)輸入漢字遇重碼時(shí),計(jì)算機(jī)發(fā)出一個(gè)與錯(cuò)碼信號(hào)不同的信號(hào)。
11、權(quán)利要求1.所述的計(jì)算機(jī)自動(dòng)轉(zhuǎn)換上下檔鍵,其特征是需用上檔鍵輸入漢字時(shí),可不擊上檔鍵,而給計(jì)算機(jī)一個(gè)轉(zhuǎn)換信號(hào),計(jì)算機(jī)自動(dòng)將下檔鍵轉(zhuǎn)換為上檔鍵。
全文摘要
本發(fā)明提出的《字基掃描漢字輸入法(四無碼)及其鍵盤》屬于電子計(jì)算機(jī)及其外部設(shè)備領(lǐng)域,基本解決了漢字計(jì)算機(jī)輸入難于普及的問題。其特征是將漢字部件分為三類兩級(jí),以52個(gè)漢字為基本部件,用分級(jí)掃描識(shí)別的方法編碼,平均碼長(zhǎng)為3.1—3.2碼。其特點(diǎn)是無重碼、無記憶量、無須專門學(xué)習(xí)、無須懂漢語(yǔ)拼音,編碼緊湊程度約為現(xiàn)有領(lǐng)先編碼的10倍,已接近極限,可應(yīng)用于各種漢字輸入設(shè)備。
文檔編號(hào)G06F3/023GK1039133SQ8810801
公開日1990年1月24日 申請(qǐng)日期1988年11月23日 優(yōu)先權(quán)日1988年11月23日
發(fā)明者王愛思 申請(qǐng)人:王愛思