專利名稱:一種計(jì)算機(jī)自然語(yǔ)言的優(yōu)化輸入方法
技術(shù)領(lǐng)域:
本發(fā)明屬于計(jì)算機(jī)輸入技術(shù)領(lǐng)域,為有序序列型輸入裝置,更進(jìn)一步地提供了一種通用的優(yōu)化輸入方法。
自從計(jì)算機(jī)用于文字處理以來,人們很自然地采用了現(xiàn)存的打字機(jī)工作方式,特別是西文的計(jì)算機(jī)輸入更是如此。漢字的計(jì)算機(jī)輸入雖然采用了各種編碼,初步地解決了漢字的計(jì)算機(jī)輸入問題,但在原理上依然沒有跳出打字機(jī)的工作方式,這種工作方式的最大特征是把輸入過程變成一個(gè)純機(jī)械式的,并且輸入編碼和內(nèi)容之間是一種靜態(tài)的,一一對(duì)應(yīng)的簡(jiǎn)單關(guān)系。這種傳統(tǒng)的工作方式有兩個(gè)缺點(diǎn)一是在輸入過程中,沒有充分發(fā)揮出計(jì)算機(jī)的優(yōu)越性,而僅僅把計(jì)算機(jī)作為打字機(jī)對(duì)待;二是從信息的觀點(diǎn)看,這種靜態(tài)的輸入方式帶有許多冗余信息。雖然在漢字輸入中為了克服這一缺點(diǎn),引入了靜態(tài)的簡(jiǎn)碼,但這種靜態(tài)的簡(jiǎn)碼,無形中加大了輸入人員的記憶量,而且這種事先規(guī)定的簡(jiǎn)碼,往往在輸入許多文章時(shí)并不是真正的簡(jiǎn)碼。
雖然在計(jì)算機(jī)的漢字輸入方面也出現(xiàn)了幾種智能輸入法,如臺(tái)灣倚天公司“忘形輸入法”和哈爾濱工業(yè)大學(xué)王曉龍博士的“音聲輸入法”是當(dāng)前漢字智能輸入法的代表,這兩種輸入法的優(yōu)點(diǎn)是充分利用了計(jì)算機(jī)來處理漢字輸入的難題;缺點(diǎn)是對(duì)整個(gè)語(yǔ)句進(jìn)行分析,往往給輸入帶來不確定性,為了克服這種不確認(rèn)性,常常需要對(duì)整句進(jìn)行再編輯、修改后才能送出,這樣就容易打斷輸入人員的連續(xù)思維,也失去了和顯示內(nèi)容的實(shí)時(shí)和同步性。聯(lián)想漢字雖然不存在再編輯、修改問題,但聯(lián)想式輸入有三個(gè)缺點(diǎn)一是每個(gè)字,尤其是常用字可聯(lián)想的詞太多,導(dǎo)致大量的屏幕選擇,盡管以后的版本增加頻選功能,但反而把原來的次序調(diào)亂了;二是對(duì)聯(lián)想的第一個(gè)字輸入沒有簡(jiǎn)化,如果聯(lián)想不下去,只有老老實(shí)實(shí)輸入全編碼;三是由于中文大量是雙字詞,所以聯(lián)想往往只能聯(lián)想一次。
本發(fā)明的目的在于為有序序列型輸入裝置,提供一種通用的優(yōu)化輸入方法,它利用了文章中上、下文的關(guān)聯(lián)性,避免了輸入過程中的重復(fù)冗余信息。提高傳統(tǒng)輸入法(無論是中文還是西文)的輸入效率,改變傳統(tǒng)輸入法只要人去適應(yīng)計(jì)算機(jī)的單向工作方式,而新的優(yōu)化輸入法做到了讓計(jì)算機(jī)也適應(yīng)人的雙向工作方式。
本發(fā)明的特征在于當(dāng)自然語(yǔ)言的單字、詞組、短語(yǔ)構(gòu)成有序序列形式在輸入裝置上輸入時(shí),可依據(jù)上文輸入的完整有序序列,自動(dòng)地預(yù)區(qū)分下文輸入的有序序列第一步下文輸入可分兩種情況進(jìn)行1.下文輸入的完整有序序列在上文中未輸入過,繼續(xù)輸入完整的下文有序序列;
2.下文輸入的完整有序序列在上文中輸入過,輸入簡(jiǎn)碼以后,在屏幕提示區(qū),預(yù)提示的內(nèi)容是、與該簡(jiǎn)碼相對(duì)應(yīng)的當(dāng)前使用頻度最高的單字、詞組、短語(yǔ);
第二步預(yù)提示的單字、詞組或短語(yǔ)為需要輸入的內(nèi)容時(shí),可通過確認(rèn)動(dòng)作來選取;也可繼續(xù)進(jìn)行下文輸入,沒有確認(rèn)動(dòng)作;
第三步預(yù)提示的單字、詞組或短語(yǔ)不是所輸入的內(nèi)容時(shí),可繼續(xù)后面的下文輸入,沒有確認(rèn)動(dòng)作;
第四步對(duì)輸入過程中形成的簡(jiǎn)碼,可以進(jìn)行記憶、恢復(fù)、清除、予置、鎖定操作。
下面結(jié)合傳統(tǒng)編碼輸入法“前導(dǎo)漢字編碼”實(shí)例,進(jìn)一步說明本發(fā)明對(duì)自然語(yǔ)言輸入的優(yōu)化。
前導(dǎo)漢字編碼的單字編碼如下前導(dǎo)碼(點(diǎn)、橫、豎、撇)+聲母+韻母+同音字區(qū)分碼例如“北”、“京”二字的輸入全編碼為
bfb-北 *jcx-京上面第三鍵分別代表拼音韻母(即雙拼表示),f-ei、c-ing。單字全編碼長(zhǎng)度等于4。
這時(shí),第一步輸入分兩種情況如果在上文中未輸入過單字“北”、“京”二字,要想用單字輸入它們,便只能輸入上述單字的全編碼。
如果在上文中已輸入過單字“北”、“京”二字,只需輸入它們的簡(jiǎn)碼,這時(shí)屏幕的提示區(qū)便預(yù)提示出(假定“北”、“京”二字就是下面簡(jiǎn)碼相對(duì)應(yīng)的當(dāng)前最高頻字) b 北(在提示行的右下角預(yù)提示)*j京(在提示行的右下角預(yù)提示)第二步如果這時(shí)確實(shí)需要輸入的就是“北”、“京”二字,就可以在該字出現(xiàn)在提示區(qū)時(shí),鍵入空格鍵便完成輸入。碼長(zhǎng)等于二碼。
上例中,如果使用者沒有注意到預(yù)提示信息,那么,仍然可以輸入北京二字的全編碼。
另外,假定使用者想輸入的是“計(jì)”字,同時(shí)它也在上文中輸入過,但由于該字在上文的輸入頻度比“京”字的輸入頻度要低,因此,輸入編碼的前兩碼后,屏幕提示的是*j京(在提示行的右下角預(yù)提示)為了輸入“計(jì)”字,勿需理睬預(yù)提示信息,而直接轉(zhuǎn)入下一步。
第三步繼續(xù)輸入“計(jì)”字的全編碼,“*jis-計(jì)”,這樣就完成了“計(jì)”字的輸入。
同樣道理,前導(dǎo)漢字編碼的常用二字詞編碼為
前導(dǎo)碼+聲母+韻母+前導(dǎo)碼+聲母+韻母下面是“北京”一詞的全編碼
bf*jc-北京常用二字詞全編碼長(zhǎng)度等于6。
這時(shí),第一步輸入分兩種情況如果在上文中未輸入過“北京”一詞,要想用詞輸入它們,便只能輸入上述詞組的全編碼。
如果在上文中已輸入過詞組“北京”,只需輸入它們的簡(jiǎn)碼,這時(shí)屏幕的提示區(qū)便預(yù)提示出(假定“北京”就是下面簡(jiǎn)碼相對(duì)應(yīng)的當(dāng)前最高頻常用詞組)
bf 北京(在提示行的右下角預(yù)提示)第二步如果這時(shí)確實(shí)需要輸入的就是“北京”一詞,就可以在該詞出現(xiàn)在提示區(qū)時(shí),鍵入空格鍵便完成輸入。碼長(zhǎng)等于三碼。
上例中,如果使用者沒有注意到預(yù)提示信息,那么,仍然可以輸入北京一詞的全編碼。
另外,假定使用者想輸入的是“北方”一詞,同時(shí)它也在上文中輸入過,但由于該詞在上文的輸入頻度比“北京”的輸入頻度要低,因此,輸入編碼的前三碼后,屏幕提示的是
bf 北京(在提示行的右下角預(yù)提示)為了輸入“北方”一詞,勿需理睬預(yù)提示信息,而直接轉(zhuǎn)入下一步。
第三步繼續(xù)輸入“北方”一詞的全編碼,“*bf*fv-北方”,(例中v-<p>
本發(fā)明的應(yīng)用不完全依賴輸入裝置,只要是對(duì)自然語(yǔ)言采用有序序列的輸入裝置,均可采用本優(yōu)化輸入法,典型的實(shí)施例是用于中文或西文的筆輸入計(jì)算機(jī)中。
眾所周知,筆輸入的難點(diǎn)在于正確的識(shí)別率和輸入速度。采用本發(fā)明后對(duì)二者均有改善。
例1中文筆輸入假定我們?cè)谏衔闹休斎脒^某些字、詞、短語(yǔ),在下文輸入時(shí),由于上、下文的相關(guān)性,我們沒有必要重新輸入上文的全部重復(fù)成份,只需輸入某字、某詞、某短語(yǔ)的前面部分(和前例一樣),計(jì)算機(jī)可以預(yù)提示出可能性最大的某字、某詞、某短語(yǔ),如果命中,只需確認(rèn)一下,如果輸入的字、詞、短語(yǔ)和預(yù)提示不一致,只要繼續(xù)下面的輸入即可。這樣輸入的冗余信息減少,也減少了輸入冗余信息帶來的誤識(shí)別問題,同時(shí)提高了輸入速度和識(shí)別率。
例2西文筆輸入假定上文輸入過“computer”,在下文輸入時(shí),在手寫區(qū)域?qū)懭搿癱om”后,可預(yù)提示“computer”,這時(shí)在利用筆確認(rèn)后,即可輸入完整的“computer”。如果想輸入的是“command”,而不是“computer”,就無須確認(rèn)動(dòng)作,只要繼續(xù)補(bǔ)輸入后面的“mand”就行了。至于以后是“computer”,還是“command”占有“com”這個(gè)簡(jiǎn)碼,要由上面兩個(gè)詞使用的頻度決定。本例中到底簡(jiǎn)碼長(zhǎng)度取多少為宜?是3位還是4位?可根據(jù)實(shí)施方案確定,從上面例子可看出,無論是西文的筆輸入還是中文的筆輸入,采用本優(yōu)化輸入法后,都可以有效地提高筆式計(jì)算機(jī)的輸入速度,同時(shí)免去了對(duì)冗余信息的再識(shí)別引起的誤碼率。
權(quán)利要求
1.一種計(jì)算機(jī)自然語(yǔ)言的優(yōu)化輸入方法,其特征在于當(dāng)自然語(yǔ)言的單字、詞組、短語(yǔ)構(gòu)成有序序列形式在輸入裝置上輸入時(shí),可依據(jù)上文輸入的完整有序序列,自動(dòng)地預(yù)區(qū)分下文輸入的有序序列第一步下文輸入可分兩種情況進(jìn)行1.下文輸入的完整有序序列在上文中未輸入過,繼續(xù)輸入完整的下文有序序列;2.下文輸入的完整有序序列在上文中輸入過,輸入簡(jiǎn)碼以后,在屏幕提示區(qū),預(yù)提示的內(nèi)容是、與該簡(jiǎn)碼相對(duì)應(yīng)的當(dāng)前使用頻度最高的單字、詞組、短語(yǔ);第二步預(yù)提示的單字、詞組或短語(yǔ)為需要輸入的內(nèi)容時(shí),可通過確認(rèn)動(dòng)作來選??;也可繼續(xù)進(jìn)行下文輸入,沒有確認(rèn)動(dòng)作;第三步預(yù)提示的單字、詞組或短語(yǔ)不是所輸入的內(nèi)容時(shí),可繼續(xù)后面的下文輸入,沒有確認(rèn)動(dòng)作;第四步對(duì)輸入過程中形成的簡(jiǎn)碼,可以進(jìn)行記憶、恢復(fù)、清除、予置、鎖定操作。
2.如同權(quán)利要求1所述的優(yōu)化輸入方法,其特征在于所述的簡(jiǎn)碼元素個(gè)數(shù)(碼長(zhǎng))必須少于原來完整有序序列的元素個(gè)數(shù),并且保持原來次序、仍第一元素為序;單字、詞組或短語(yǔ)構(gòu)成的完整有序序列簡(jiǎn)碼的碼長(zhǎng),分別為n1、n2、n3,互不相等,其中n1,n2,n3的值取決于具體的實(shí)施方案。
3.如同權(quán)利要求1所述的優(yōu)化輸入方法,其特征在于所述的確認(rèn)動(dòng)作與輸入裝置有關(guān),當(dāng)輸入裝置帶有輸入鍵(或微動(dòng)開關(guān))時(shí),可指定相應(yīng)的鍵位(或微動(dòng)開關(guān))來實(shí)現(xiàn);當(dāng)輸入裝置帶有光標(biāo)(或坐標(biāo))定位功能,可通過光標(biāo)定位于預(yù)提示區(qū)區(qū)域或坐標(biāo)定位于特定的區(qū)域來實(shí)現(xiàn)。
4.如同權(quán)利要求1所述的優(yōu)化輸入方法,其特征在于所述的記憶操作是對(duì)本次輸入過程中可使用的簡(jiǎn)碼全部保存;所述的恢復(fù)操作是對(duì)前次記憶操作所保存的簡(jiǎn)碼全部恢復(fù);所述的清除操作是對(duì)本次輸入過程中可使用的簡(jiǎn)碼全部清除;所述的予置操作是對(duì)予先選定的簡(jiǎn)碼全部裝入;所述的鎖定操作是對(duì)本次輸入過程中可使用的簡(jiǎn)碼不再改變;需要變動(dòng)時(shí),可取消鎖定操作。
全文摘要
本發(fā)明屬于計(jì)算機(jī)輸入技術(shù)領(lǐng)域,為有序序列型輸入裝置,更進(jìn)一步地提供了一種通用的優(yōu)化輸入方法。它利用了文章中上、下文的相關(guān)性,避免了輸入過程中重復(fù)的冗余信息,提高了傳統(tǒng)輸入法(無論是中文還是西文)的輸入效率,改變了傳統(tǒng)輸入法只要人去適應(yīng)計(jì)算機(jī)的單向工作方式,而新的優(yōu)化輸入法做到了讓計(jì)算機(jī)也適應(yīng)人的雙向工作方式。
文檔編號(hào)G06F3/023GK1095504SQ9410247
公開日1994年11月23日 申請(qǐng)日期1994年3月12日 優(yōu)先權(quán)日1994年3月12日
發(fā)明者余克艱 申請(qǐng)人:余克艱