欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

具有鍵多義性的文本輸入設(shè)備和方法

文檔序號(hào):451891閱讀:265來源:國知局
專利名稱:具有鍵多義性的文本輸入設(shè)備和方法
技術(shù)領(lǐng)域
本發(fā)明一般涉及一種數(shù)據(jù)輸入方法和設(shè)備,尤其涉及一種用于從輸入設(shè)備如小鍵盤,特別是從存在鍵多義性并且需要解決的數(shù)字小鍵盤上輸入文本,例如文本信息的方法和裝置。
隨著要求攜帶越來越小的具有優(yōu)化功能的個(gè)人通信設(shè)備,如,尋呼機(jī),蜂窩式電話,和其它個(gè)人通信設(shè)備需求的增加,及要求通過遠(yuǎn)程通信和電纜的連接使得家庭自動(dòng)化的需求的增加,其中一個(gè)小房間將有一個(gè)或更多個(gè)能夠執(zhí)行各種應(yīng)用程序或控制各種應(yīng)用程序的小型設(shè)備;要求從非字母小鍵盤或從數(shù)字小鍵盤輸入字母數(shù)字文本的需求也不斷地增加。
在美利堅(jiān)合眾國,對(duì)于每個(gè)電話小鍵盤,鍵盤上顯示出數(shù)字和字母是一項(xiàng)標(biāo)準(zhǔn)。因此,表示數(shù)字"2 "的鍵上顯示有A,B,和C并且表示字母"3"的鍵上顯示有D,E,和F等。由對(duì)應(yīng)于小鍵盤上數(shù)字的字母來表示電話號(hào)碼是很普遍的。因此,例如,名稱為"Amtrack"的鐵道公司可有一電話號(hào)碼2687225并且該公司可告知客戶該公司電話號(hào)碼可通過激活有字母A-M-T-R-A-C-K的鍵來撥打。撥打這些字母將只產(chǎn)生一個(gè)數(shù)字序列,但是一個(gè)數(shù)字序列可由多個(gè)字母序列表示。
在遠(yuǎn)程通信領(lǐng)域,對(duì)于使用數(shù)字小鍵盤的人來講用名稱選擇的方法是眾所周知的。例如,眾所周知,在一個(gè)語音郵件系統(tǒng)中通過從遠(yuǎn)程電話鍵入用戶名的頭幾個(gè)字母來選擇用戶的語音信箱,作為結(jié)果,一個(gè)短數(shù)字流被發(fā)送到此語音郵件系統(tǒng)。此語音郵件系統(tǒng)把所輸入的數(shù)字流同查找表中的有限選項(xiàng)集作比較。必須輸入足夠的數(shù)字以唯一的標(biāo)識(shí)所期望的用戶。類似地,自動(dòng)客戶服務(wù)系統(tǒng)可使用這種文本輸入格式。例如,一個(gè)航空公司信息系統(tǒng)能夠請(qǐng)求目的地機(jī)場的頭三個(gè)字母,盡管存在由所傳送的數(shù)字所表示的字母的多義性,還是能夠僅由這三個(gè)字母來唯一地標(biāo)識(shí)機(jī)場,這是因?yàn)樗幸粋€(gè)用于搜尋匹配的機(jī)場名的限“字典”。同樣的方法可用于電話快速撥號(hào)查找方案中??蓮拇鎯?chǔ)在電話終端的受限名字列表中選擇一個(gè)名字并且撥打與所選名字相關(guān)聯(lián)的號(hào)碼。
各種其它的用于從非字母小鍵盤、只有數(shù)字的小鍵盤、或其它類型的比相應(yīng)字母少的多的鍵或按鈕的小鍵盤輸入字母數(shù)字輸入的方法已經(jīng)被發(fā)展起來或已經(jīng)被周知。這些方法中多數(shù)受益于在標(biāo)準(zhǔn)US電話小鍵盤上所顯示的字母。但是,與小鍵盤的字母數(shù)字文本相關(guān)的方法常常很麻煩而且難以編輯。另外,一般,必須限制輸入或者以一種特定的方式輸入從而使得每一輸入序列只有一個(gè)選項(xiàng)。更具體地來講,特定的輸入同字母表中特定的字母或符號(hào)有著直接的聯(lián)系。例如,如果一個(gè)用戶想要從非字母小鍵盤輸入單詞"call",則用戶必須輸入一特定的數(shù)字和/或符號(hào)的組合以表示單詞“call”。在用戶要輸入單詞“call”的例子中,該用戶必須如下輸入2***;2*;5***;5***;#。這樣一種輸入的方法是非常受限的,費(fèi)時(shí)的,并且編輯困難且慢。
以上所描述的數(shù)據(jù)輸入的方法并不適合于中文。中文中有幾千個(gè)字符。例如,由在中國的GB編碼標(biāo)準(zhǔn)所支持的漢字就有近7000個(gè),而且在臺(tái)灣和香港由BIG5編碼標(biāo)準(zhǔn)所支持的漢字約有13000個(gè)。對(duì)于建立一個(gè)能從如此巨大的字典中使用少數(shù)鍵例如只是一個(gè)有12個(gè)鍵的電子小鍵盤來選擇字符的設(shè)備來講,如此多的漢字是主要的挑戰(zhàn)。
因此,需要提供給用戶一個(gè)簡單直接的用于從具有比所需字母少的鍵的小鍵盤上輸入文本的方法和設(shè)備;并且需要提供一種不需借助于很大的計(jì)算能力或存儲(chǔ)要求的系統(tǒng)。
現(xiàn)在通過示例的方式,參照附圖來描述本發(fā)明的各種較好的實(shí)施方式。


圖1是一個(gè)說明依據(jù)本發(fā)明適合于接收輸入的文本輸入設(shè)備的前視圖。
圖2是一個(gè)詳細(xì)描述圖1中設(shè)備的內(nèi)部電路的框圖。
圖3是一個(gè)說明存儲(chǔ)在圖2的存儲(chǔ)器設(shè)備中的一級(jí)列表的數(shù)據(jù)結(jié)構(gòu)圖,其中該表中存儲(chǔ)了地址信息。
圖4是一個(gè)說明存儲(chǔ)在圖2的存儲(chǔ)器設(shè)備中的二級(jí)列表的數(shù)據(jù)結(jié)構(gòu)圖,其中該表中存儲(chǔ)了字符信息。
圖5是一個(gè)說明存儲(chǔ)在圖2中設(shè)備的存儲(chǔ)器中的三級(jí)列表的數(shù)據(jù)結(jié)構(gòu)圖,其中該表中存儲(chǔ)了雙字組信息。
圖6是一個(gè)說明圖2中處理器操作的流程圖。
圖7是一個(gè)詳細(xì)描述圖6中用于查找數(shù)據(jù)流ID的子程序100的流程圖。
圖8是一個(gè)詳細(xì)描述圖6中用于選擇字符的子程序400的流程圖。
圖9是一個(gè)用于查找單字組和雙字組共用的漢字的流程圖。
一般地,現(xiàn)在所描述的方法包括以下步驟在存儲(chǔ)器中保存一張一級(jí)列表,該表保存的是以所希望的語言表示的數(shù)字流或數(shù)字序列及對(duì)應(yīng)于數(shù)字流的字符地址;激活數(shù)據(jù)輸入設(shè)備(例如一個(gè)小鍵盤,但也可為一鍵盤或一查尋數(shù)字化裝置和輸入筆)的鍵,其中一個(gè)鍵可表示多個(gè)用于提供輸入數(shù)字流的字符;搜尋存儲(chǔ)器中的一級(jí)列表以查找對(duì)應(yīng)于輸入數(shù)字流的數(shù)字流并獲得相應(yīng)的字符地址。在這里,"字符"一般指字母或象形文字或語義符字符。
從十九世紀(jì)五十年代中期開始,一種漢字的標(biāo)準(zhǔn)語音表示方式被作為"拼音"接受了下來。每一個(gè)漢字的拼音,像每一英語單詞一樣,由羅馬字母a-z的26個(gè)字母混合而成。這26個(gè)字母可映射到電話小鍵盤或其它的例如只有12個(gè)鍵的小鍵盤上,其中每一鍵上顯示有3-4個(gè)字母。假設(shè)有適當(dāng)?shù)姆椒▉斫鉀Q多義性問題,這種小鍵盤可被用于利用拼音的書寫系統(tǒng)來輸入中文文本?,F(xiàn)在描述這樣一種方法。
現(xiàn)在參考附圖,圖1說明了一種根據(jù)本發(fā)明的裝置的一般且優(yōu)選的實(shí)施方式。一個(gè)有小鍵盤的蜂窩式電話(或其它數(shù)據(jù)輸入設(shè)備如無線電話,尋呼機(jī)或個(gè)人數(shù)字輔助設(shè)備或遠(yuǎn)程通信設(shè)備)的例子一般由參考數(shù)字10描述。所描述的蜂窩式電話10包括外殼12,顯示器14和用于接受輸入的小鍵盤16。顯示器14有一文本顯示區(qū)15和一用于顯示可選擇字符的區(qū)域17。小鍵盤16有12個(gè)以標(biāo)準(zhǔn)格式顯示數(shù)字0-9的鍵,而且拼音字母a-z也以標(biāo)準(zhǔn)格式顯示。這些字母可以其它方式排列,例如為求得更高的人機(jī)工程效率,但是如果考慮所建立的用途則所說明的格式是較好的。表示數(shù)字"1"的鍵上顯示有標(biāo)點(diǎn)",","。","?"和"?。?。該鍵左下方的鍵18上顯示有符號(hào)"《"(如下面所說明的,表示"回退鍵"或"向左滾動(dòng)鍵")及“*”(表示“星”)。該鍵右下方的鍵19上顯示有符號(hào)"》"(如下面所說明的,表示"回車鍵"或"向右滾動(dòng)鍵")和"#"(表示"擊打")。
作為一種可選的小鍵盤輸出格式,數(shù)字0-7可分別表示<prs>,<tuv>,<wxy>,<qz>或數(shù)字7-9和數(shù)字1可分別表示<prs>,<tuv>,<wxy>,<qz>。
在所提及的實(shí)施方式中,用到了拼音表??蛇x的是,根據(jù)本發(fā)明所提及的實(shí)施方式可用多種其它的字母表,如另一種中文語音字母表(注音)或基于筆畫的字母表或英語、俄語或亞洲語字母表。在附圖中所說明的本發(fā)明所提及的一種實(shí)施方式中,輸入設(shè)備為具有字母數(shù)比字母表中的字母數(shù)少的單獨(dú)鍵的小鍵盤。因此,字母表被分成多個(gè)序列,其中一個(gè)單獨(dú)的數(shù)字和一系列的字母或符號(hào)表示在一個(gè)單獨(dú)的鍵上,或小鍵盤或其它輸入設(shè)備的輸入塊上。按下一個(gè)鍵會(huì)輸送一個(gè)數(shù)字,但是該數(shù)字可表示一個(gè)字母或字符。
參照?qǐng)D2,蜂窩式電話被描述為具有一個(gè)微處理器30,該微處理器利用技術(shù)上周知的標(biāo)準(zhǔn)的輸入和輸出驅(qū)動(dòng)器連接到輸入板16和顯示器14上。還可連接到該微處理器30上的為一個(gè)一級(jí)存儲(chǔ)器31和一個(gè)二級(jí)存儲(chǔ)器32,其中一級(jí)存儲(chǔ)器最好是電可擦性只讀存儲(chǔ)器(EEPRM)或閃速存儲(chǔ)器,二級(jí)存儲(chǔ)器最好是有序存取存儲(chǔ)器(RAM)。在EEPR0M存儲(chǔ)器中至少存有三個(gè)表一表一(33),表二(34),表三(35)。相應(yīng)地分別參照?qǐng)D3,4和5,更詳細(xì)地描述了表33-35。一個(gè)可選的揚(yáng)聲器38被連接到該微處理器上。
參看附圖3,圖中顯示了圖2的表1的數(shù)據(jù),該表包括存儲(chǔ)了對(duì)應(yīng)于所有可能漢字的可能的拼音的數(shù)字串的第一列101。對(duì)應(yīng)于408個(gè)可能的拼音存在219個(gè)可能的數(shù)字串(序列)。(一個(gè)數(shù)字串可能對(duì)應(yīng)幾個(gè)拼音,因?yàn)槿齻€(gè)或四個(gè)羅馬字母映射到一個(gè)電話數(shù)字上)。多種可能的拼音對(duì)應(yīng)于幾千個(gè)字符。第一列的寬度為4個(gè)字節(jié)。圖中第一列101的左邊為每一個(gè)數(shù)字串的標(biāo)識(shí)號(hào)(ID)。該號(hào)并不存儲(chǔ)在存儲(chǔ)器中。數(shù)字串以它們值的順序存儲(chǔ),即,值越小,其索引越小。第二列102的寬度為2個(gè)字節(jié)并且存儲(chǔ)有具有相同數(shù)字串的漢字的起始地址(在表二中)(有相同的數(shù)字串的漢字總數(shù)可由第二列的相鄰二個(gè)項(xiàng)間的差來得到;例如第一個(gè)項(xiàng)和第二個(gè)項(xiàng)之間的差(7-1=6)表示有6個(gè)漢字有相同的數(shù)字串2)。第二列102的右邊顯示了映射到相應(yīng)數(shù)字串上的拼音。
為了定位對(duì)于可能對(duì)應(yīng)于一給定數(shù)字串的所有實(shí)際上的漢字在表2中的開始(和結(jié)束)地址,用到了表1,這在后面將會(huì)更詳細(xì)地描述。
圖4中顯示了表2并且表2包括四列110-113。在第一列中顯示了字符(每項(xiàng)2個(gè)字節(jié))的十六進(jìn)制GB編碼表示。對(duì)于字典中的每個(gè)漢字,表中都有一條記錄。圖中該表的左邊顯示了當(dāng)其被書寫時(shí)或在顯示器14的文本顯示區(qū)15和較下方的顯示區(qū)17中出現(xiàn)時(shí)實(shí)際上的漢字圖形。這種表示方式不需存儲(chǔ)在表2中(但是可存在表2中)。有相同數(shù)字串的漢字被順序存儲(chǔ)在字典中,然后依據(jù)十六進(jìn)制編碼值被排序,即,其值越小,其索引越小。圖的最左邊(但是并不存在存儲(chǔ)器中)所顯示的為表示具有相同數(shù)字流的每一漢字組中漢字的相對(duì)地址的索引。第二列111存儲(chǔ)了具有相同數(shù)字串的每一字符的單字組索引相對(duì)地址(每項(xiàng)1個(gè)字節(jié))。它根據(jù)與其相應(yīng)的漢字的頻率(單字組)排序。即,頻率越高,其索引越小。頻率被顯示在圖4的右方,但是并未存在存儲(chǔ)器中。第三列112(每一項(xiàng)3個(gè)字節(jié))存儲(chǔ)了具有同一首字符的兩字組在表3中的開始地址。第四列存儲(chǔ)了表3中具有同一首字符的兩字組數(shù)。
為了說明,圖4的1到6行左邊表示具有同一數(shù)字串"2"的漢字的相對(duì)地址,并且同一列的7到9行表示具有同一數(shù)字串"3"的漢字的相對(duì)地址。
列111表示每組中以其頻率次序排序的漢字的相對(duì)地址。例如,在第一組中(1到6行),第二行的頻率最高(頻率=11574),因此其相應(yīng)漢字的相對(duì)地址"2"被存在第一位(參看第一行,列111)。第三列112和第四列113分別表示表3中的開始地址和表3中具有同一首字符的兩字組的數(shù)目。
現(xiàn)在參看圖5,圖5中顯示了存儲(chǔ)有漢字兩字組數(shù)據(jù)的表3。兩字組為兩個(gè)字符的組合,該兩字組是由所討論的語言中該組合所出現(xiàn)的頻率標(biāo)識(shí)的。例如兩字組"qu"在英語中很普遍而兩字組"qa"就很罕見。這一信息被用來識(shí)別相似的和不相似的字符組合,字符組合反過來被用于解決數(shù)據(jù)輸入中的多義性問題。
在圖5中,第一列和第二列表示兩字組的漢字對(duì)的列表(用中文和"十六進(jìn)制"GB編碼格式并由""分隔開來)。第三列表示這兩個(gè)漢字同時(shí)出現(xiàn)的頻率。第四列表示在漢字對(duì)中第二個(gè)漢字的數(shù)字串。這四列并不存在存儲(chǔ)器中。圖5中的第5列160和第六列161作為表35存在存儲(chǔ)器中。
列160包括表示表1中數(shù)字流位置的相應(yīng)的數(shù)字串ID。例如,在第三行上,數(shù)字串"22"的ID為"4"。列161包括表2的漢字字典中第二個(gè)漢字的相對(duì)地址。
選取具有同一首字符"b0a2"的組作為示例,列160按其項(xiàng)(element)值排序(數(shù)字串ID)。如果列160中連續(xù)的項(xiàng)具有同一數(shù)字串ID,則它們在列161中的相應(yīng)項(xiàng)以其在列160中同時(shí)出現(xiàn)的頻率排序。由此看來,數(shù)字流ID-相對(duì)地址對(duì)可唯一地定位存儲(chǔ)在表2的漢字字典中的漢字。
在每一具有同一兩字組首字符的組中,各組均首先依據(jù)數(shù)字ID排序,然后依據(jù)兩字組概率排序。
在表2和表3中并不存儲(chǔ)頻率數(shù)據(jù)。而是,頻率由表2中列111的索引相對(duì)地址所表示的單字組和由表3中列160和161的索引數(shù)字流ID-相對(duì)地址對(duì)所表示的兩字組的存儲(chǔ)順序來標(biāo)識(shí)。這是一種存儲(chǔ)該擴(kuò)展數(shù)據(jù)的有效方式。
已介紹過數(shù)據(jù)輸入設(shè)備的結(jié)構(gòu)和存儲(chǔ)器中的表結(jié)構(gòu)?,F(xiàn)在描述設(shè)備的操作。
在標(biāo)準(zhǔn)數(shù)據(jù)輸入模式中,用戶通過使用標(biāo)有a,b,c,d等的電話鍵來輸入每一個(gè)他想要輸入的漢字的拼音,同樣的方式也描述在美國專利申請(qǐng)No.08/754,453中,該申請(qǐng)于11/21/96遞交,并轉(zhuǎn)讓給了本申請(qǐng)的受讓人,該專利在此被作為參考文獻(xiàn)。
用戶輸入拼音字母到小鍵盤16并且這些字母被送到微處理器30。微處理器擔(dān)負(fù)有識(shí)別由拼音輸入所表示的一組可能的字符和從一組可能的字符中識(shí)別最可能的候選字符的任務(wù)。這一處理過程在圖6中說明。
從步驟200開始,用戶在步驟210中輸入數(shù)字串并且所輸入的數(shù)字串首先在步驟210中通過使用一種快速二叉搜索方法在第一級(jí)表33(圖3所示的表1)中搜索。由于數(shù)字按其項(xiàng)值順序被排序并且對(duì)于基于拼音的方法只有219個(gè)項(xiàng),因此只需8次匹配。這是一種識(shí)別所輸入數(shù)字流的快速有效的方法。步驟210的細(xì)節(jié)在下面將參照?qǐng)D7被描述。
繼續(xù)參看圖6,對(duì)于一個(gè)新數(shù)字流的輸入,該處理在步驟215中判定這一新的數(shù)字流輸入是否標(biāo)識(shí)先前所輸入的數(shù)字流正是用戶所選擇的字符,如果是這樣,則該處理得出結(jié)論單字組和兩字組模式的匹配作為該用戶選擇的結(jié)果是合適的。該匹配在步驟211和212中完成并且將在下面描述。
如果不存在語言模式的匹配,則該處理跳轉(zhuǎn)到步驟311。這種情況是,例如,先前所輸入的數(shù)字流的輸入不正確且已被刪除并且不應(yīng)該被用于匹配。為了說明的簡明性,現(xiàn)在將描述這種情況。
把數(shù)字串ID作為索引,微處理器30從二級(jí)表34(圖4中所示的表2)中查找具有相同數(shù)字串的漢字的起始地址和數(shù)目。在步驟311中,候選漢字的初始列表從表2中讀出。通過使用在步驟210中所獲得的地址和數(shù)目,所有具有相同數(shù)字串的候選漢字可從表2中所描述的漢字字典數(shù)組中找到。它們組成了候選漢字的初始列。
緊接著步驟311,步驟312使得兩字組的列表從圖5的表3中讀得。通過使用已被用戶選中的先前的字符,處理器30從表2的列112和113中找到具有同一首字符的兩字組的起始地址和數(shù)目。然后該處理器從表3中所描述的兩字組數(shù)組中定位所有具有相同的首字符的兩字組。
由于兩字組在每一具有相同首字符的組中按數(shù)字串ID的順序進(jìn)行排序,因此處理器可在步驟313中利用快速二叉搜索法來查找對(duì)應(yīng)于由用戶所輸入的數(shù)字串的實(shí)際上的數(shù)字ID。由于有相同數(shù)字ID的兩字組也以兩字組概率的順序依次存儲(chǔ),因此通過在兩字組的第一數(shù)組中搜索相鄰項(xiàng)可很容易地找到其它有相同數(shù)字ID的兩字組。一旦找到所有具有相同數(shù)字ID的項(xiàng),則處理器30還從兩字組的第二數(shù)組中找到有相同數(shù)字ID的字符的相對(duì)地址。
在步驟314中創(chuàng)建了候選漢字的最終列表。通過使用在步驟313中所獲得的相對(duì)地址(依據(jù)兩字組概率存儲(chǔ)),處理器30從在步驟311中所獲得的候選漢字列表中獲得字符并且把它們放在最終候選漢字列表的前端。由于表2存儲(chǔ)了依頻率(單字組)排序的字符的相對(duì)地址,因此它可被用來從初始候選列表中獲取其它的漢字并把它們放入最終列表中。然后該處理器在顯示器14的顯示區(qū)17中按照最終候選列表的順序顯示漢字。
至此,已描述了一種把文本輸入到設(shè)備的方法,該方法包括以下步驟在存儲(chǔ)器中保存一個(gè)用所需要的語言表示的字符的數(shù)字流和對(duì)應(yīng)于該數(shù)字流的字符地址的一級(jí)列表;在內(nèi)存中保存位于對(duì)應(yīng)于一級(jí)表中的字符地址的地址處字符的二級(jí)表;激活數(shù)據(jù)輸入設(shè)備的鍵,其中一個(gè)鍵表示多個(gè)字符以提供輸入字符流;在存儲(chǔ)器中搜索一級(jí)表以找到對(duì)應(yīng)于輸入數(shù)字流的數(shù)字流并獲得一個(gè)相應(yīng)的字符地址;并從二級(jí)表中至少讀取一個(gè)位于此字符地址上的字符。已描述了搜索步驟如何執(zhí)行二叉搜索及讀取步驟如何從位于相對(duì)于字符地址的預(yù)定位置處的二級(jí)表查找多個(gè)分類有序字符。而且還描述了如何利用語言模式數(shù)據(jù)(如兩字組和單字組數(shù)據(jù))來解決多個(gè)字符的字符間的多義性。
接下來是一種選擇字符并在存儲(chǔ)器中依據(jù)所選字符重排字符的相對(duì)地址的軟件的描述和方法?,F(xiàn)在將要描述對(duì)應(yīng)于同一數(shù)字流的字符標(biāo)識(shí)如何被存儲(chǔ)在多個(gè)連續(xù)的地址上及以最佳方式有序排序的字符的相對(duì)地址如何存儲(chǔ)在連續(xù)的地址上,而并不依賴于相對(duì)地址所被存儲(chǔ)的連續(xù)地址。
語言模式的匹配為快速在線匹配。圖6的步驟211通過對(duì)存儲(chǔ)在表2的列111中數(shù)據(jù)的操作來完成單字組模式的匹配,并且步驟212通過對(duì)存儲(chǔ)在表3的列161中數(shù)據(jù)的操作來完成兩字組模式的匹配。
參看這些匹配步驟的開始處,前面已描述過,表2的第二列111中存儲(chǔ)了具有相同數(shù)字串的每一字符的相對(duì)地址。它按每一漢字的頻率(單字組)排序。步驟211完成把上次所選擇字符的相對(duì)地址放置在列111的最前位置114處并把該相對(duì)地址從其在列中的先前位置處移走的操作。隨著地址被移走,有相同位流的字符的相對(duì)地址(在位置115處)在列111中被向下移動(dòng)。
該過程是一個(gè)總是把上次所選的字符放置在可選列表頂端的過程。表2中字符的存儲(chǔ)順序是不變的,但是相對(duì)地址的存儲(chǔ)順序改變了。如果這樣,則真正的頻率信息就丟失了,但是該排列的實(shí)用性卻增強(qiáng)了,因?yàn)閷?duì)于用戶來說最近使用的字符信息被保留了(真正的頻率數(shù)據(jù)表示被所有的用戶所用的歷史頻率)。
例如,假設(shè)對(duì)應(yīng)于一個(gè)數(shù)字串有三個(gè)漢字A,B和C。它們的值和概率有如下關(guān)系B<A<C和Prob{A}>Prob{B}>Prob{C}。這三個(gè)漢字在字典中以其值的順序被存儲(chǔ)1B22A13C3在該表中,第一列表示它們的相對(duì)地址(并不存儲(chǔ)在存儲(chǔ)器中),第二列(表2的列110)表示存儲(chǔ)在字典中的這三個(gè)漢字,第三列為表2的列111,其中以其概率順序存儲(chǔ)了這三個(gè)字符的相對(duì)地址。當(dāng)用戶輸入對(duì)應(yīng)于這三個(gè)字符的數(shù)字串時(shí),則設(shè)備將會(huì)以ABC的順序顯示它們,因?yàn)樽址鸄的相對(duì)地址存儲(chǔ)在字符B的相對(duì)地址之前,且字符B的相對(duì)地址存儲(chǔ)在C的相對(duì)地址之前。如果用戶選擇了字符C作為他想要輸入的字符,則只需修改第三列1B32A23C1因此下次,當(dāng)用戶輸入相同的數(shù)字串時(shí),則系統(tǒng)將以CAB的順序把這三個(gè)字符顯示給用戶,因?yàn)楝F(xiàn)在字符C的相對(duì)地址存儲(chǔ)在A的相對(duì)地址之前并且字符A的相對(duì)地址存儲(chǔ)在B的相對(duì)地址之前。
也假設(shè)表112和113中的字符被重新排列并假設(shè)相對(duì)地址數(shù)據(jù)為用于互相參照而被保存,因?yàn)楸?為完整字符字典且為了定位實(shí)際上的字符必須保存信息。則代替保持表2中字符的存儲(chǔ)的順序不變并改變相對(duì)地址的存儲(chǔ)順序,字符的存儲(chǔ)順序可重新排列,步驟212中的匹配兩字組的過程與步驟211中匹配單字組的過程相似。而且,當(dāng)在兩字組中對(duì)應(yīng)于一數(shù)字串并具有同一個(gè)前面字符D有三個(gè)漢字A,B,C時(shí)也可考慮這個(gè)例子。它們的兩字組概率有如下關(guān)系Prob{D,A}>Prob{D,B}>Prob{D,C}。它們以42A41B43C的順序存儲(chǔ)在兩字組中。第一列(表3的列160)的第一行到第三行表示漢字A,B,和C各自的數(shù)字串ID,在此我們假設(shè)漢字A,B和C有同一數(shù)字串ID"4"。第二列(表3的列161)以其兩字組概率的順序表示它們各自的相對(duì)地址。第三列的項(xiàng)為由其相應(yīng)的數(shù)字ID-相對(duì)地址對(duì)所表示的中文兩字組字符對(duì)中的第二個(gè)漢字。當(dāng)用戶輸入有數(shù)字串ID"4"的數(shù)字串"22"時(shí),系統(tǒng)將會(huì)以ABC的順序把這些字符顯示給用戶,因?yàn)樽址鸄的相對(duì)地址存儲(chǔ)在B的相對(duì)地址之前,且字符B的相對(duì)地址存儲(chǔ)在C的相對(duì)地址之前。如果用戶選擇了字符C作為他想要輸入的字符,則只需修改第二列
43C42A41B因此下次,當(dāng)用戶輸入相同的數(shù)字串時(shí),則系統(tǒng)將以CAB的順序把這些字符顯示給用戶,因?yàn)楝F(xiàn)在字符C的相對(duì)地址存儲(chǔ)在A的相對(duì)地址之前并且字符A的相對(duì)地址存儲(chǔ)在B的相對(duì)地址之前。
在這一語言模式的匹配中,兩字組比單字組具有更高的優(yōu)先權(quán)。如果由用戶所選擇的漢字可在其兩字組中找到,則只需修改其兩字組。否則,需修改其單字組。
為了完全描述,現(xiàn)在描述圖6的步驟210和400的細(xì)節(jié)。
參照?qǐng)D7,所顯示的流程圖以一種更詳細(xì)的方式描述了在步驟210中所執(zhí)行的查找數(shù)字流ID的處理過程。這一過程在步驟700中以數(shù)字輸入開始。當(dāng)已經(jīng)輸入了一個(gè)完整字符的數(shù)字后,用戶按下鍵19(圖1)并且步驟701識(shí)別鍵"#"的輸入。當(dāng)要?jiǎng)h除一個(gè)數(shù)字時(shí),用戶按下鍵18且步驟702識(shí)別鍵"*"的輸入并在步驟703中刪除上一個(gè)數(shù)字。對(duì)于每一個(gè)數(shù)字輸入,該過程返回循環(huán)704,直至按下了鍵19。
按下鍵19后,該處理執(zhí)行步驟710,該步驟表示用于單一字符的拼音輸入的結(jié)束并開始字符的識(shí)別。在步驟711中對(duì)表1執(zhí)行快速二叉搜索以定位所輸入的字符。如果該搜索沒有發(fā)現(xiàn)與所輸入數(shù)字流的匹配則步驟712使得處理過程向前執(zhí)行步驟720并從揚(yáng)聲器28(圖2)或由其它指示器給出一個(gè)"蜂鳴"或其它的錯(cuò)誤信號(hào)。如果步驟711成功地找到了一個(gè)匹配,則步驟715使得該處理過程向前執(zhí)行圖6的步驟215。
參照?qǐng)D8,步驟400(圖6)的子程序在顯示器14的顯示區(qū)17中顯示匹配所輸入數(shù)字流的候選字符的頭十個(gè)(或少些)。用戶在步驟801中按下一個(gè)鍵。
如果用戶在列表中沒有看到他想要輸入的字符,則他可按下鍵19或鍵18并且步驟802和803將會(huì)相應(yīng)地使得步驟803和805顯示它們相應(yīng)的下十個(gè)或前十個(gè)字符。
如果鍵19和18均未被按下(即指在步驟801中按下了一個(gè)數(shù)字鍵),步驟810使得對(duì)應(yīng)于所輸入的數(shù)字的字符被選中。例如如果所需字符被顯示在列表中編號(hào)為1的位置處并且用戶輸入了"1",則該字符被選中。所選字符為該設(shè)備的最終輸出。所選字符被顯示在顯示器14的文本顯示區(qū)15中并且被送到操作中的任一應(yīng)用程序,例如被送到一個(gè)字處理程序。在步驟812程序返回到圖6的步驟200處?,F(xiàn)在程序?qū)⒁盟x擇的字符在上面所描述的步驟211和212中修改單字組和兩字組模式。
作為一種用于搜索兩字組的可選方法,存在下述問題,即存儲(chǔ)兩字組需要大量的存儲(chǔ)器。上述的兩字組和兩字組搜索方法是為一種特別的輸入方法所設(shè)計(jì)的,即用于中國大陸的基于拼音的方法。然而,如果其它的輸入方法如基于漢字筆畫的方法,與基于拼音的方法共享兩字組,則需以增加計(jì)算能力為代價(jià)給雙方提供更通用的兩字組和兩字組搜索方法。
可選的兩字組存儲(chǔ)器只存儲(chǔ)了兩字組的第二個(gè)字符(每單位兩個(gè)字節(jié))。具有相同首字符的字符被連續(xù)地存儲(chǔ),然后如同對(duì)表2的列110中所存儲(chǔ)漢字的處理一樣,按其值進(jìn)行排序。由于需要由兩字組進(jìn)行模型化的漢字不到8000個(gè),因此存儲(chǔ)一個(gè)漢字只需1 3位。其它3位可被用于給基于其兩字組概率的兩字組的第二個(gè)字符排序。
而且,假設(shè)對(duì)應(yīng)于一個(gè)數(shù)字串并有同一首字符D的兩字組中有三個(gè)漢字A,B和C。它們的值和兩字組概率有以下關(guān)系B>A>C和Prob{D,A}>Prob{D,B}>Prob{D,C}。它們以C5A7B6的順序存儲(chǔ)在兩字組中。第一列表示存儲(chǔ)在2字節(jié)存儲(chǔ)器的前13位中的漢字,第二列表示存儲(chǔ)在2字節(jié)存儲(chǔ)器的后3位中的其兩字組概率索引。因此存儲(chǔ)一個(gè)兩字組只需2字節(jié)存儲(chǔ)器(16位)。
獲得候選漢字的初始列表和剛才所述的兩字組列表的過程同前面所描述的相同。由于這兩個(gè)列表均按其項(xiàng)值的順序被搜索,因此它們可彼此間相互比較以查找對(duì)于兩個(gè)列表共同的漢字。
圖9是一個(gè)用于查找兩個(gè)列表共有的漢字的流程圖。在該圖中u_list[M]和b_list[N]為相應(yīng)的用于在初始列表和兩字組列表中存儲(chǔ)漢字的數(shù)組;M和N為這兩個(gè)列表中各自的項(xiàng)的個(gè)數(shù);并且chin_lists[N]為存儲(chǔ)兩個(gè)表共用的漢字的數(shù)組。
在圖9中,步驟900為一初始化步驟。索引計(jì)數(shù)K1和K和n分別被置為1,1和0。在步驟901中,執(zhí)行一匹配以決定單字組數(shù)組u_list[K1]中的項(xiàng)與兩字組數(shù)組b_list[K2]中的項(xiàng)是否相同。如果項(xiàng)是相同的,則該處理執(zhí)行分支910,接下來執(zhí)行步驟911,步驟912設(shè)置數(shù)組chin_list[N]的首(或下一個(gè))項(xiàng)與數(shù)組b_list[K2]的項(xiàng)相同。然后在步驟913中,單字組數(shù)組u_list[K1]的項(xiàng)被設(shè)置為0,實(shí)際上從單字組數(shù)組中刪除了該項(xiàng)。在步驟914中增量索引計(jì)數(shù)K1和K2。
如果,步驟901中數(shù)組項(xiàng)不相等,則,步驟920,921和922使得這兩個(gè)項(xiàng)中較小的索引計(jì)數(shù)被增量。以這種方式,步驟901可以以增值順序完成所有項(xiàng)的比較,直到步驟930中兩個(gè)列表的最后一個(gè)項(xiàng)已進(jìn)行了比較。當(dāng)比較結(jié)束時(shí),步驟931以對(duì)于單字組和兩字組相同的漢字的列表(chin_list[N])方式給出結(jié)果。
比較所需的最多次數(shù)為M+N-1,其中M和N為這兩個(gè)列表中相應(yīng)項(xiàng)的個(gè)數(shù)。然后,結(jié)果列表hin_list[N]中的漢字依據(jù)其兩字組概率索引被重新排序并且被放置到最終候選漢字列表的前端。
利用上述的同一的例子,這三個(gè)漢字將會(huì)以A,B,C的順序列出,因?yàn)锳的索引(=7)比B(=6)的索引大,并全B的索引(=6)比C(=5)的索引大。
在匹配之前,兩字組如下列出C5A7B6如果用戶選擇了字符C作為他想要輸入的字符,則只需修改第二列C7A6B5在匹配之后,C的索引被改為7,且A和B的索引相應(yīng)地被改為6和5。
現(xiàn)在更描述一種用于產(chǎn)生字符兩字組概率的新方法。
傳統(tǒng)的用于產(chǎn)生漢字兩字組概率的方法只是盲目地對(duì)在一個(gè)大的中文文本語言資料庫中兩個(gè)漢字同時(shí)出現(xiàn)的次數(shù)進(jìn)行計(jì)數(shù)。然后兩字組以同時(shí)出現(xiàn)的頻率被排序。由于用于存儲(chǔ)字符的存儲(chǔ)單元的限制,系統(tǒng)只選擇有最高同時(shí)出現(xiàn)頻率的頭N個(gè)兩字組。
在這種新方法中,用以產(chǎn)生漢字兩字組的過程被分成三步驟漢字單字組和兩字組的產(chǎn)生;產(chǎn)生漢字的詞內(nèi)(in-word)和詞間(cross word)兩字組;并且通過合并漢字的詞內(nèi)和詞間兩字組來產(chǎn)生漢字的最終兩字組。
一個(gè)中文詞有1至6個(gè)漢字組成。但是,多數(shù)中文詞由兩個(gè)漢字組成。例如,中文詞"人民"包括兩個(gè)漢字,"人"和"民"。一個(gè)包括60,000個(gè)中文詞的中文詞典被提供。用于產(chǎn)生語言模式的中文文本語言資料庫中的中文句子首先利用中文詞典被分解成中文詞序列。然后計(jì)算詞單字組(詞出現(xiàn)的次數(shù))和兩字組(兩個(gè)詞同時(shí)出現(xiàn)的次數(shù))。
中文詞單字組首先被漢字字典中的漢字分段。然后兩個(gè)漢字同時(shí)出現(xiàn)的次數(shù)被計(jì)數(shù)并被計(jì)算以得到漢字的詞內(nèi)兩字組。對(duì)于一個(gè)60K的詞典來說,大約有50K個(gè)漢字的詞間兩字組。顯然,詞間兩字組包括中文詞典中所有中文單詞的大多數(shù)最重要的信息。
漢字的詞間兩字組僅通過計(jì)數(shù)第一個(gè)單詞中的最后一個(gè)字符和第二個(gè)單詞中的第一個(gè)字符同時(shí)出現(xiàn)的次數(shù)就可產(chǎn)生。實(shí)驗(yàn)證明所產(chǎn)生的漢字詞內(nèi)兩字組的數(shù)目為1340K。但是,該列表在分類排序之后被截短了,使得只有出現(xiàn)頻率最高的50K個(gè)詞間兩字組被選中以形成漢字的最終兩字組列表。此詞間兩字組包括一些未被包括在中文詞典中的新詞的信息和一些通常只包括一個(gè)漢字的常用功能詞的用法的信息。
在漢字的詞內(nèi)和詞間兩字組之間存在著一些重疊。因此通過合并漢字的詞內(nèi)和詞間兩字組而產(chǎn)生最終漢字兩字組。
已描述了一種數(shù)據(jù)輸入的方法,這種方法容許從有限鍵或其它輸入設(shè)備上,如從一12個(gè)鍵的電話小鍵盤上,快速輸入數(shù)據(jù),并且對(duì)于用戶和人機(jī)工程效果來講這是自然的。鍵輸入的多義性由語言建模解決了。本發(fā)明描述了用單字組和兩字組語言模式,但是可用其它的模式。例如如果存儲(chǔ)器可用或如果利用這些模式可取得更高的效率則可使用三表模式和n表模式。這種方法對(duì)于處理項(xiàng)是有效的并有一個(gè)有效的數(shù)據(jù)結(jié)構(gòu)。這些特征可使得操作速度變快并且降低成本,從而使得這種方法可用于簡單廉價(jià)的客戶設(shè)備。在不超出本發(fā)明的精神和實(shí)質(zhì)范圍內(nèi)本領(lǐng)域技術(shù)熟練人員可作種種修改。
權(quán)利要求
1.一種把文本輸入具有鍵多義性設(shè)備的方法,包括步驟在存儲(chǔ)器中保存一個(gè)用所需要的語言表示的字符的數(shù)字流和對(duì)應(yīng)于該數(shù)字流的字符地址的一級(jí)列表;激活數(shù)據(jù)輸入設(shè)備的鍵以提供一個(gè)輸入數(shù)字流,其中一個(gè)鍵表示多個(gè)字符;并且搜索存儲(chǔ)器中的一級(jí)列表以找到對(duì)應(yīng)于輸入數(shù)字流的數(shù)字流并獲得相應(yīng)的字符地址。
2.權(quán)利要求1所述的方法,其中搜索步驟包括執(zhí)行二叉搜索。
3.一種把文本輸入設(shè)備的方法,包括步驟在存儲(chǔ)器中保存一個(gè)用所需要的語言表示的字符的數(shù)字流和對(duì)應(yīng)于該數(shù)字流的字符地址的一級(jí)列表;在存儲(chǔ)器中保存一個(gè)位于對(duì)應(yīng)于一級(jí)列表中字符地址的地址處的字符的二級(jí)列表;激活小鍵盤上的鍵,其中一個(gè)鍵表示多個(gè)字符以提供輸入數(shù)字流;搜索存儲(chǔ)器中的一級(jí)列表以找到一對(duì)應(yīng)于輸入數(shù)字流的數(shù)字流并獲得相應(yīng)的字符地址;并從二級(jí)列表中至少讀取一個(gè)位于字符地址上的字符。
4.權(quán)利要求3所述的方法,其中搜索步驟包括執(zhí)行二叉搜索。
5.權(quán)利要求3所述的方法,其中讀取步驟包括從二級(jí)列表中定位多個(gè)有序排列的字符,其中這些字符位于對(duì)應(yīng)于字符地址的預(yù)定位置處。
6.權(quán)利要求5所述的方法,進(jìn)一步驟包括了使用語言模式數(shù)據(jù)解決多個(gè)字符的字符間多義性的方法。
7.一種字符識(shí)別的方法,包括步驟在存儲(chǔ)器中保存一個(gè)字符和字符的有序排列的相對(duì)地址的表;選擇一個(gè)字符;并依據(jù)所選擇的字符重新排列存儲(chǔ)器中的字符的相對(duì)地址。
8.權(quán)利要求7所述的方法,其中保存步驟包括當(dāng)從數(shù)據(jù)輸入設(shè)備輸入時(shí),在多個(gè)連續(xù)地址上存儲(chǔ)對(duì)應(yīng)于共同數(shù)字流的字符標(biāo)識(shí);并在連續(xù)地址上存儲(chǔ)按序排列的字符的相應(yīng)地址,最好獨(dú)立于相對(duì)地址所被存儲(chǔ)的連續(xù)地址。
9.一個(gè)文本輸入設(shè)備,包括一個(gè)具有一組鍵的小鍵盤,每一個(gè)鍵表示多個(gè)字符;一個(gè)存儲(chǔ)器,該存儲(chǔ)器存儲(chǔ)了表示所需要的語言字符的數(shù)字流及對(duì)應(yīng)于該數(shù)字流的字符地址的一級(jí)列表和一個(gè)位于對(duì)應(yīng)于一級(jí)列表中字符地址的地址處的字符的二級(jí)列表的存儲(chǔ)器;一個(gè)輸出設(shè)備;和一個(gè)連接到小鍵盤、存儲(chǔ)器和輸出設(shè)備上的處理器,該處理器被編程為,接收對(duì)應(yīng)于所激活的鍵的數(shù)字流輸入,搜索存儲(chǔ)器中的一級(jí)列表以找到一對(duì)應(yīng)于輸入數(shù)字流的數(shù)字流,獲得相應(yīng)的字符地址,從存儲(chǔ)器的二級(jí)列表中讀取一個(gè)位于該字符地址上的字符標(biāo)識(shí)并提供給輸出設(shè)備一個(gè)對(duì)應(yīng)于該字符標(biāo)識(shí)的字符。
10.一個(gè)文本輸入設(shè)備包括一個(gè)有一組鍵的小鍵盤,每個(gè)鍵表示多個(gè)字符;一個(gè)存儲(chǔ)了字符和字符的有序排列的相對(duì)地址的表的存儲(chǔ)器;一個(gè)輸出設(shè)備;和一個(gè)連接到小鍵盤、存儲(chǔ)器和輸出設(shè)備上的處理器,該處理器被編程為,接收一對(duì)應(yīng)于所激活的鍵的數(shù)字流輸入,依據(jù)數(shù)字流輸入從存儲(chǔ)器的表中的多個(gè)字符中進(jìn)行選擇;從小鍵盤上接收一個(gè)字符選擇輸入并依據(jù)字符選擇輸入重新排列存儲(chǔ)器中字符的相對(duì)地址。
11.一個(gè)計(jì)算機(jī)可讀存儲(chǔ)器,存儲(chǔ)有指令和數(shù)據(jù),用于保存字符地址及表示所需語言字符的數(shù)字序列的一級(jí)列表;接收表示多個(gè)字符的輸入數(shù)字序列;搜索一級(jí)列表以找到對(duì)應(yīng)于該輸入數(shù)字序列的數(shù)字序列;并獲得一個(gè)相應(yīng)的字符地址。
12.一個(gè)計(jì)算機(jī)可讀存儲(chǔ)器,存儲(chǔ)指令和數(shù)據(jù),用于保存字符和字符的有序排序的相對(duì)地址的表;接收一個(gè)字符選擇輸入;并依據(jù)該字符選擇輸入重新排列字符的相對(duì)地址。
全文摘要
一種用于輸入文本的數(shù)據(jù)輸入方法和裝置,其中存在鍵多義性并需得到解決。數(shù)據(jù)輸入設(shè)備的小鍵盤的鍵被激活,其中一個(gè)鍵表示多個(gè)字符,以提供輸入數(shù)字流。數(shù)字流的列表被保存,該表表示所需語言的字符和對(duì)應(yīng)于該數(shù)字流的字符地址。搜索列表以找到對(duì)應(yīng)于輸入數(shù)字流的數(shù)字流并獲得一個(gè)相應(yīng)的字符地址。另一方面,存儲(chǔ)字符和字符有序排序的字符的相對(duì)地址的表,并且字符的相對(duì)地址依據(jù)所選擇的字符被重新排列。
文檔編號(hào)G06F3/00GK1194391SQ9810525
公開日1998年9月30日 申請(qǐng)日期1998年2月23日 優(yōu)先權(quán)日1998年2月23日
發(fā)明者陳錫先 申請(qǐng)人:摩托羅拉公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
紫阳县| 汤阴县| 体育| 班戈县| 宽甸| 木兰县| 东宁县| 中方县| 得荣县| 建始县| 玉树县| 雅江县| 高淳县| 石城县| 自贡市| 临沧市| 南阳市| 甘孜县| 西昌市| 揭东县| 井陉县| 什邡市| 靖西县| 天等县| 墨江| 霍邱县| 文水县| 伊宁市| 丹江口市| 安阳市| 大新县| 亚东县| 平远县| 合川市| 镇赉县| 龙海市| 调兵山市| 淳安县| 大港区| 白银市| 东兰县|