欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種計算機(jī)漢字輸入方法及系統(tǒng)的制作方法

文檔序號:6609737閱讀:347來源:國知局
專利名稱:一種計算機(jī)漢字輸入方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及計算機(jī)漢字輸入領(lǐng)域,特別涉及一種計算機(jī)漢字輸入方法及系統(tǒng)。
背景技術(shù)
中文輸入方法是運(yùn)行于操作系統(tǒng)上的一個輸入工具,是把鍵盤輸入的按鍵信息或其他非鍵盤輸入的信息轉(zhuǎn)換成漢字輸入的方法。目前使用最廣的是基于鍵盤的中文輸入方法。
由于英文字母只有26個,它們分別對應(yīng)著鍵盤上的26個字母,所以對于英文而言是不存在什么輸入方法的,直接輸入英文字母即可。由于漢字是由字的音、形、義來共同表達(dá)的,因此漢字的拼音可以用于確定漢字的候選詞?,F(xiàn)有的漢字拼音輸入方法是通過事先設(shè)定鍵盤與拼音字母的對應(yīng)關(guān)系,實(shí)現(xiàn)漢字的輸入。比如鍵盤A對應(yīng)拼音字母a、鍵盤B對應(yīng)拼音字母b、鍵盤V對應(yīng)拼音字母ü等等。雖然漢字的拼音的韻母是由很多字母組合而成,但是這些拼音的韻母也可以用對應(yīng)的鍵盤先后輸入確定。比如韻母üe,其對應(yīng)于先后輸入鍵盤V和鍵盤E。這種全拼輸入漢字的方法,雖然可以實(shí)現(xiàn)漢字的輸入,但由于每個詞都需要鍵入整個拼音字符串,用戶使用時比較麻煩。
現(xiàn)有中文輸入方法均支持簡拼字符串的輸入,即只輸入一個音節(jié)的聲母部分,就可以輸出候選詞。但現(xiàn)有支持簡拼輸入的中文輸入方法只支持聲母輸入。如果想輸入“中國”,除了輸入整個拼音字符串外,還可以輸入簡拼字符串“zhg”。當(dāng)輸入“zhg”時,輸出的候選詞為“1這個2整個3職工4中國5中共”。用戶再從候選詞中選擇4,便可完成“中國”的輸入。但是如果用戶在輸入簡拼時多輸入了韻母中的一些字母,就不能輸出對應(yīng)的候選詞,無法實(shí)現(xiàn)漢字的輸入。比如用戶輸入“zhog”,就不會輸出任何候選詞。此時就需要用戶刪除所有的韻母或者補(bǔ)齊韻母中漏掉的字母,才能實(shí)現(xiàn)候選詞的輸出。
現(xiàn)有簡拼輸入方法,如果獲取到的拼音串不是簡拼字符串或者全拼字符串時,不能實(shí)現(xiàn)候選詞的輸出,用戶使用很不方便,用戶體檢較差。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種計算機(jī)漢字輸入方法,該方法在獲取到的拼音串不是簡拼字符串或者全拼字符串時,能夠?qū)崿F(xiàn)候選詞的輸出,方便用戶使用,增強(qiáng)用戶體驗。
本發(fā)明的目的還提供一種計算機(jī)漢字輸入系統(tǒng),該系統(tǒng)在獲取到的拼音串不是簡拼字符串和全拼字符串時,能夠?qū)崿F(xiàn)候選詞的輸出,方便用戶使用。
為解決上述技術(shù)問題,本發(fā)明實(shí)施例提供一種計算機(jī)漢字輸入方法,包括以下步驟按音節(jié)劃分接收到的拼音串;提取每個音節(jié)的首字母組成簡拼字符串;在預(yù)先建立的簡拼字符串到全拼字符串映射表中查找出所述簡拼字符串對應(yīng)的所有全拼字符串;根據(jù)所述全拼字符串輸出對應(yīng)的候選詞。
優(yōu)選地,在預(yù)先建立的簡拼字符串到全拼字符串映射表中查找出所述簡拼字符串對應(yīng)的所有全拼字符串后包括步驟確定上述所有全拼字符串與該接收的拼音串相匹配的各全拼字符串;根據(jù)上述各全拼字符串輸出對應(yīng)的候選詞。
優(yōu)選地,所述所有候選詞是按照詞頻由大到小的順序排列。
優(yōu)選地,所述詞頻是預(yù)先用文本統(tǒng)計所述候選詞的出現(xiàn)頻率。
優(yōu)選地,所述簡拼字符串到全拼字符串映射表具體為簡拼字符串與通過所述簡拼字符串?dāng)U展的全部全拼字符串之間的關(guān)系對照表。
優(yōu)選地,所述按音節(jié)劃分接收的拼音串具體為按動態(tài)規(guī)劃算法劃分該接收到的拼音串的音節(jié)。
優(yōu)選地,所述確定上述所有全拼字符串與該接收的拼音串相匹配的各全拼字符串,具體為
將查找到的所述簡拼字符串對應(yīng)的所有全拼字符串逐個與該接收到的拼音串相比較,確定與該接收的拼音串相匹配的各全拼字符串。
本發(fā)明實(shí)施例提供一種計算機(jī)漢字輸入系統(tǒng),該系統(tǒng)包括存儲單元,用于存儲簡拼字符串到全拼字符串映射表和全拼字符串到候選詞映射表;接收單元,用于接收用戶輸入的拼音串;音節(jié)劃分單元,用于按音節(jié)劃分所述接收單元接收的拼音串;簡拼提取單元,用于提取所述音節(jié)劃分單元劃分后的拼音串中的每個音節(jié)的首字母,組成簡拼字符串;第一查找單元,用于根據(jù)所述存儲單元中存儲的簡拼字符串到全拼字符串映射表,查找出與所述簡拼提取單元生成的簡拼字符串對應(yīng)的所有全拼字符串;第二查找單元,用于根據(jù)所述存儲單元中存儲的全拼字符串到候選詞映射表,查找出所述第一查找單元確定的所有全拼字符串對應(yīng)的所有候選詞;輸出單元,用于輸出所述第二查找單元確定的所有候選詞。
優(yōu)選地,所述系統(tǒng)進(jìn)一步包括比較單元;所述比較單元,用于比較所述接收單元接收的拼音串與所述第一查找單元查找出的所有全拼字符串,確定相匹配的各全拼字符串;所述第二查找單元,用于根據(jù)所述存儲單元中存儲的全拼字符串到候選詞映射表,查找出所述比較單元確定的各全拼字符串對應(yīng)的所有候選詞;所述輸出單元,用于輸出所述第二查找單元確定的各全拼字符串對應(yīng)的所有候選詞。
優(yōu)選地,該系統(tǒng)還包括詞頻單元,用于記錄候選詞的詞頻;所述輸出單元將所述第二查找單元確定的所有候選詞按照所述詞頻單元記錄的候選詞詞頻順序進(jìn)行輸出。
優(yōu)選地,所述音節(jié)劃分單元是按動態(tài)規(guī)劃算法進(jìn)行音節(jié)劃分。
由于本發(fā)明實(shí)施例所述方法,預(yù)先建立了簡拼字符串到全拼字符串映射表。當(dāng)接收到拼音串后,對該拼音串按音節(jié)劃分,并提取每個音節(jié)的首字母組成簡拼字符串。然后對照簡拼字符串到全拼字符串的映射表查找到所有該簡拼字符串對應(yīng)的所有全拼字符串。最后輸出所有全拼字符串對應(yīng)的候選詞。因此,該方法在獲取到拼音串不是簡拼字符串或者全拼字符串時,能夠?qū)崿F(xiàn)候選詞的輸出,方便用戶使用。
由于本發(fā)明實(shí)施例所述系統(tǒng),存儲單元中存儲了預(yù)先建立了簡拼字符串到全拼字符串的映射表和全拼字符串到候選詞的映射表。當(dāng)接收單元接收到的拼音串后,音節(jié)劃分單元對該拼音串按音節(jié)進(jìn)行劃分。簡拼提取單元提取每個音節(jié)的首字母組成簡拼字符串。第一查找單元對照存儲單元中存儲的簡拼字符串到全拼字符串的映射表查找到所有該簡拼字符串對應(yīng)的全部全拼字符串。第二查找單元對照全拼字符串到候選詞的映射表,查找到所述第一查找單元確定的全部全拼字符串對應(yīng)的候選詞。所述輸出單元輸出所述第二查找單元確定的候選詞。因此,該系統(tǒng)在接收單元接收到的拼音串不是簡拼字符串或者全拼字符串時,仍能夠?qū)崿F(xiàn)候選詞的輸出,增強(qiáng)了用戶體驗。


圖1為本發(fā)明所述方法一種實(shí)施方式流程圖;圖2為本發(fā)明建立簡拼字符串與全拼字符串映射表的流程圖;圖3本發(fā)明所述簡拼字符串到全拼字符串映射表示意圖;圖4為本發(fā)明所述全拼字符串到候選詞映射表示意圖;圖5為本發(fā)明所述方法第二種實(shí)施方式流程圖;圖6為本發(fā)明所述方法第三種實(shí)施方式流程圖;圖7為本發(fā)明所述方法第四種實(shí)施方式流程圖;圖8為本發(fā)明所述系統(tǒng)第一種實(shí)施方式結(jié)構(gòu)圖;圖9為本發(fā)明所述系統(tǒng)第二種實(shí)施方式結(jié)構(gòu)圖;圖10為本發(fā)明所述系統(tǒng)第三種實(shí)施方式結(jié)構(gòu)圖。
具體實(shí)施例方式
本發(fā)明提供一種計算機(jī)漢字輸入方法,用于實(shí)現(xiàn)靈活的輸入。當(dāng)接收到的拼音串不是簡拼字符串或者全拼字符串時,仍能夠?qū)崿F(xiàn)候選詞的輸出。
為了使本技術(shù)領(lǐng)域的技術(shù)人員更好地理解本發(fā)明方案,下面結(jié)合附圖和具體實(shí)施方式
對本發(fā)明作進(jìn)一步的詳細(xì)說明。
參見圖1,該圖為本發(fā)明所述方法一種實(shí)施方式流程圖。
S10、按音節(jié)劃分接收到的拼音串。
此時接收到的拼音串可能是全拼字符串或者簡拼字符串或者是不完整的全拼字符串。
將接收到的拼音串按照音節(jié)進(jìn)行劃分。對于完整的音節(jié)按照一個音節(jié)處理。對于不完整的音節(jié),則要判斷是否為音節(jié)開始的一部分,若是則按一個音節(jié)處理。
S20、提取每個音節(jié)的首字母組成簡拼字符串。
由于已經(jīng)對接收的字符串進(jìn)行了音節(jié)劃分,可以很方便的提取每個音節(jié)的首字母,這樣就組成了簡拼字符串。
S30、在預(yù)先建立的簡拼字符串到全拼字符串映射表中查找出所述簡拼字符串對應(yīng)的所有全拼字符串。
對照預(yù)先建立的簡拼字符串到全拼字符串映射表,可以得到與該簡拼字符串對應(yīng)的所有全拼字符串。
S40、根據(jù)所述全拼字符串輸出對應(yīng)的候選詞。
對照預(yù)先建立的全拼字符串與候選詞映射表,輸出所有全拼字符串對應(yīng)的候選詞。
由于本發(fā)明第一種實(shí)施方式所述方法,預(yù)先建立了簡拼字符串到全拼字符串映射表。當(dāng)接收到拼音串后,對該拼音串按音節(jié)進(jìn)行劃分,并提取每個音節(jié)的首字母組成簡拼字符串。然后對照簡拼字符串到全拼字符串映射表查找到所有該簡拼字符串對應(yīng)的全部全拼字符串。最后輸出所有全拼字符串對應(yīng)的候選詞。因此,該方法在獲取到的拼音串不是簡拼字符串和全拼字符串時,仍能夠?qū)崿F(xiàn)候選詞的輸出,方便用戶使用。
下面結(jié)合圖2具體說明本發(fā)明建立簡拼字符串與全拼字符串映射表的過程。參見圖2,該圖為本發(fā)明建立簡拼字符串與全拼字符串映射表的流程圖。
S101、預(yù)先建立一個聲母到音節(jié)的映射表。
聲母到音節(jié)的映射表具體如下b對應(yīng)ba bai bao be ben beng bu......
c對應(yīng)ca cai can cang ce cen ceng......
zh對應(yīng)zha zhai zhe zhen zheng......
S102、通過該聲母到音節(jié)映射表,將各簡拼字符串對應(yīng)的每個字母進(jìn)行擴(kuò)展,形成多個全拼串。
例如簡拼字符串“zg”,對于“z”和“g”分別進(jìn)行擴(kuò)展,可以分別得出全拼字符串集合{za zan ze zen zeng......zhe zhen zheng zhizhong zhou zhu zhua zhuan......}和{ga gai gao gan gang ge gen......},這兩個集合相乘得出很多種組合方案,即形成了多個全拼字符串集合。
{zaga zagai zagao......zanga zangai zangao......}S103、將上述全部全拼字符串與候選詞全拼字符串相對應(yīng),確定能夠組成候選詞的全拼字符串。
例如全拼字符串集合{zaga zagai zagao......zanga zangaizangao......}與候選詞全拼字符串相對應(yīng)后,得到下列全拼字符串。
“zao’gao”、“zao’gui”、“zao’guo”、“zha’gang”、“zhan’gui”、“zhan’guo”、“zhao’gu”、“zhe’ge”、“zhen’gui”、“zheng’ge”、“zhong’gan”、“zhong’gu”、“zhong’guo”、“zhong’gong”、“zhou’gong”、“zhou’guang”、“zhou’gun”、“zhu’ge”、“zhu’gan”、“zhu′guan”、“zu’ge”、“zu’guo”、“zun’gui”。
S104、將每個簡拼字符串與步驟S103確定的全拼字符串建立映射表。
通過上述方法,就可以建立每個簡拼字符串與全拼字符串映射表。當(dāng)步驟S20提取每個音節(jié)的首字母組成簡拼字符串后,步驟S30就可以根據(jù)該簡拼字符串與全拼字符串映射表,查找出所述簡拼字符串對應(yīng)的所有全拼字符串。
下面結(jié)合具體實(shí)施例對本發(fā)明所述方法第一種實(shí)施方式進(jìn)行詳細(xì)描述。參見圖3和圖4,圖3本發(fā)明所述簡拼字符串到全拼字符串映射表示意圖;圖4為本發(fā)明所述全拼字符串到候選詞映射表示意圖。
首先,接收到的拼音串為“zhog”,按音節(jié)劃分后為“zho’g”和“zh’o’g”。
然后,提取上述音節(jié)劃分后的拼音串“zho’g” 和“zh’o’g”中的每個音節(jié)的首字母,組成具體的簡拼字符串“zg” 和“zog”。
根據(jù)圖3所示的簡拼字符串到全拼字符串映射表,則簡拼字符串“zg”對應(yīng)的全拼字符串有“zao’gao”、“zao’gui”、“zao’guo”、“zha’gang”、“zhan’gui”、“zhan’guo”、“zhao’gu”、“zhe’ge”、“zhen’gui”、“zheng’ge”、“zhong’gan”、“zhong’gu”、“zhong’guo”、“zhong’gong”、“zhou’gong”、“zhou’guang”、“zhou’gun”、“zhu’ge”、“zhu’gan”、“zhu′guan”、“zu’ge”、“zu’guo”、“zun’gui”。
“zog”沒有對應(yīng)的全拼字符串。
根據(jù)上述所有全拼字符串輸出對應(yīng)的候選詞。
本發(fā)明優(yōu)選實(shí)施方式,在確定簡拼字符串對應(yīng)的全拼字符串后,還需要將所述全拼字符串與接收到的拼音串比較。具體過程參見圖5和下文的本發(fā)明第二種具體實(shí)施方式
部分的描述。
以上面的例子進(jìn)行說明,在確定簡拼字符串對應(yīng)的全拼字符串后,將上述“zg”對應(yīng)的全拼字符串與接收到的拼音串“zhog”比較,確定匹配的全拼字符串。
具體過程為將上述“zg”對應(yīng)的全拼字符串逐個與“zhog”比較,確定與“zhog”匹配的全拼字符串。具體有“zhong’gan”、“zhong’gong”、“zhong’gu”、“zhong’guo”、“zhou’gong”、“zhou’guang”、“zhou’gun”。
根據(jù)圖4所示的全拼字符串到候選詞映射表,得出上述全拼字符串“zhong’gan”、“zhong’gong”、“zhong’gu”、“zhong’guo”、“zhou’gong”、“zhou’guang”、“zhou’gun”分別對應(yīng)的候選詞。
“zhong′gan”對應(yīng)“中干”;“zhong’gong”對應(yīng)“中共”;“zhong’gu”對應(yīng)“中古、中骨、鐘鼓、終古”;“zhong’guo”對應(yīng)“中國、種過”;“zhou’gong”對應(yīng)“周公、軸功”;“zhou’guang”對應(yīng)“晝光”;“zhou’gun”對應(yīng)“紂棍”。
則輸出的候選詞為“中干、中共、中古、中骨、鐘鼓、終古、中國、種過、周公、軸功、晝光、紂棍”。
參見圖5,該圖為本發(fā)明所述方法第二種實(shí)施方式流程圖。
本發(fā)明所述方法第二種實(shí)施方式相對于第一種實(shí)施方式,在步驟S30和S40之間增加了步驟S35。
S35、確定步驟S30中所有全拼字符串與步驟S10中接收的拼音串相匹配的各全拼字符串。
將步驟S30確定的全部全拼字符串逐個與步驟S10接收的拼音串進(jìn)行比較,確定與該接收的拼音串匹配的各全拼字符串。
S40、根據(jù)上述各全拼字符串輸出對應(yīng)的候選詞。
對照預(yù)先建立的全拼字符串與候選詞映射表,輸出所有符合接收到的拼音串的各全拼字符串對應(yīng)的候選詞。
由于本發(fā)明第二種實(shí)施方式所述方法能夠確定符合接收到的拼音串的所有全拼字符串。最后輸出符合接收到的拼音串的所有全拼字符串對應(yīng)的候選詞。因此,本發(fā)明第二種實(shí)施方式所述方法在獲取到的拼音串不是簡拼字符串和全拼字符串時,能夠?qū)崿F(xiàn)候選詞的有效輸出,方便用戶使用。
參見圖6,該圖為本發(fā)明所述方法第三種實(shí)施方式流程圖。
本發(fā)明所述方法第三種實(shí)施方式相對于第二種實(shí)施方式,所述步驟S40根據(jù)上述各全拼字符串輸出對應(yīng)的候選詞具體為S41、在預(yù)先建立的全拼字符串到選詞典映射表中查找出步驟S35確定的各全拼字符串對應(yīng)的所有候選詞。
S42、輸出上述所有候選詞。
關(guān)于全拼字符串到候選詞映射表的建立過程可以參見上述步驟S103,具體建立過程在此不再贅述。
參見圖7,該圖為本發(fā)明所述方法第四種實(shí)施方式流程圖。
本發(fā)明所述方法第四種實(shí)施方式,相對于第三種實(shí)施方式,所述步驟S35確定上述所有全拼字符串與該接收的拼音串相匹配的各全拼字符串包括S351、逐個比較所述所有全拼字符串與該接收到的拼音串。
S352、記錄與該接收的拼音串相匹配的全拼字符串。
將上述所有全拼字符串通過逐個判斷,比較是否與該接收的拼音串相匹配。這樣就可以防止漏掉與該接收的拼音串相匹配的全拼字符串。從而防止漏掉用戶需要的候選詞對應(yīng)的全拼字符串。
本發(fā)明優(yōu)選實(shí)施方式,所述步驟S40輸出的候選詞是可以按照詞頻由大到小的順序排列的。詞頻是預(yù)先通過文本統(tǒng)計所述各個候選詞的出現(xiàn)頻率進(jìn)行確定的。
當(dāng)本發(fā)明所述方法實(shí)施例按照詞頻由大到小的順序輸出候選詞時,這樣用戶需要的詞出現(xiàn)在所有候選詞的前面的概率就比較大。相對減小了用戶在查找候選詞時的翻頁次數(shù),更加有利于用戶的使用,進(jìn)一步增強(qiáng)了用戶體驗。
本發(fā)明優(yōu)選實(shí)施方式,所述按音節(jié)劃分接收的拼音串具體為按動態(tài)規(guī)劃算法劃分該接收到的拼音串的音節(jié)。
下面簡單介紹一下動態(tài)規(guī)劃算法設(shè)M矩陣的元素Mij記錄i到j(luò)之間的分割代價。
考察當(dāng)拼音字符串C1C2......Cn的子串Ci......Cj,用以下分段函數(shù)來表示該子串作為一個整體音節(jié)的分割代價值V(i,j)。
這里的0、1和2,不僅是一個用于區(qū)分的編號,還是根據(jù)動態(tài)規(guī)劃求最小分割代價的需要。這種設(shè)定的大小數(shù)值的區(qū)別,能夠從下面的遞歸公式中得到驗證。
動態(tài)規(guī)劃算法能夠有效地避免重復(fù)運(yùn)算,關(guān)鍵在于設(shè)有矩陣M,保存有子問題的分析結(jié)果,能夠在處理其他更大的子問題時直接訪問,要求分割效果最好,可得出遞歸公式Mij=V(i,j)(i=j)mini≤k<j{Mi,j+Mk+1,j+V(i,j)}(i<j)]]>下面還以拼音串“zhog”為例,說明采用動態(tài)規(guī)劃算法進(jìn)行音節(jié)劃分的過程。
“z”、“h”、“g”都可以作為一個音節(jié)的開始部分,“o”可以作為一個整體音節(jié)。
“z”的分割代價值V(i,j)=1;“h”的分割代價值V(i,j)=1;“g”的分割代價值V(i,j)=1;“o”的分割代價值V(i,j)=0此時,Mij=““z”的分割代價值”+““h”的分割代價值”+““g”的分割代價值”+““o”的分割代價值”=3。
如果把“zhog”劃分為“zh”、“o”和“g”,那么拼音串“zhog”的分割代價值V(i,j)=1+0+1=2。
如果把“zhog”劃分為“zho”和“g”,那么拼音串“zhog”的分割代價值V(i,j)=1+1=2。
所以整個拼音串“zhog”的最小分割代價的分割方式有兩種分割“zh”、“o”和“g”以及分割為“zho”和“g”。
當(dāng)然,本發(fā)明實(shí)施例所述按音節(jié)劃分還可以同時采用動態(tài)規(guī)劃算法和音節(jié)數(shù)量最少原則進(jìn)行劃分。即保留采用動態(tài)規(guī)劃算法進(jìn)行音節(jié)劃分后的拼音串,也保留采用音節(jié)數(shù)量最少原則進(jìn)行音節(jié)劃分后的拼音串。
本發(fā)明還提供一種計算機(jī)漢字輸入系統(tǒng),用于實(shí)現(xiàn)靈活的輸入。當(dāng)接收到的拼音串,既不是簡拼字符串又不是全拼字符串時,仍能夠?qū)崿F(xiàn)候選詞的輸出。
參見圖8,該圖為本發(fā)明所述系統(tǒng)第一種實(shí)施方式結(jié)構(gòu)圖。
本發(fā)明所述系統(tǒng)第一種實(shí)施方式的計算機(jī)漢字輸入系統(tǒng),包括存儲單元1、接收單元2、音節(jié)劃分單元3、簡拼提取單元4、第一查找單元5、第二查找單元7、輸出單元8。
存儲單元1,用于存儲簡拼字符串到全拼字符串映射表和全拼字符串到候選詞映射表。
簡拼字符串到全拼字符串映射表和全拼字符串到候選詞映射表的建立過程在前文中均已描述,在此不再贅述。
接收單元2,用于接收用戶輸入的拼音串。
音節(jié)劃分單元3,用于按音節(jié)劃分所述接收單元2接收的拼音串。
簡拼提取單元4,用于提取所述音節(jié)劃分單元3劃分后的拼音串中的每個音節(jié)的首字母組成簡拼字符串。
第一查找單元5,用于根據(jù)所述存儲單元1中存儲的簡拼字符串到全拼字符串映射表,查找出與所述簡拼提取單元4生成的簡拼字符串對應(yīng)的所有全拼字符串。
第二查找單元7,用于根據(jù)所述存儲單元1中存儲的全拼字符串到候選詞映射表,查找出所述第一查找單元5確定的各全拼字符串對應(yīng)的所有候選詞。
輸出單元8,用于輸出所述第二查找單元7確定的所有候選詞。
由于本發(fā)明實(shí)施例所述系統(tǒng),存儲單元1中存儲預(yù)先建立了簡拼字符串到全拼字符串映射表和全拼字符串到候選詞映射表。當(dāng)接收單元2接收到的拼音串后,音節(jié)劃分單元3對該拼音串按音節(jié)進(jìn)行劃分。簡拼提取單元4提取每個音節(jié)的首字母組成簡拼字符串。第一查找單元5對照存儲單元1中存儲的簡拼字符串到全拼字符串映射表,查找到該簡拼字符串對應(yīng)的所有全拼字符串。第二查找單元7對照存儲單元1中存儲的全拼字符串到候選詞映射表。輸出單元8輸出第二查找單元7確定的候選詞。因此,該系統(tǒng)在接收單元2接收到的拼音串不是簡拼字符串或者全拼字符串時,仍能夠?qū)崿F(xiàn)候選詞的輸出,方便用戶使用。
參見圖9,該圖為本發(fā)明所述系統(tǒng)第二種實(shí)施方式結(jié)構(gòu)圖。
本發(fā)明所述系統(tǒng)第二種實(shí)施方式的計算機(jī)漢字輸入系統(tǒng),相對第一種實(shí)施方式,增加了比較單元6。
比較單元6,用于比較所述接收單元2接收的拼音串與所述第一查找單元5查找出的所有全拼字符串比較,確定相匹配的各全拼字符串。
第二查找單元7,用于根據(jù)所述存儲單元1中存儲的全拼字符串到候選詞映射表,查找出所述比較單元6確定的各全拼字符串對應(yīng)的所有候選詞。
輸出單元8,用于輸出所述第二查找單元7確定的所有候選詞。
由于本發(fā)明實(shí)施例所述系統(tǒng),存儲單元1中存儲預(yù)先建立了簡拼字符串到全拼字符串映射表和全拼字符串到候選詞映射表。當(dāng)接收單元2接收到的拼音串后,音節(jié)劃分單元3對該拼音串按音節(jié)進(jìn)行劃分。簡拼提取單元4提取每個音節(jié)的首字母組成簡拼字符串。第一查找單元5對照存儲單元1中存儲的簡拼字符串到全拼字符串映射表,查找到該簡拼字符串對應(yīng)的所有全拼字符串。比較單元6比較所述接收單元2接收的拼音串與所述第一查找單元5查找出的所有全拼字符串,確定符合接收到的拼音串的全部全拼字符串。第二查找單元7對照存儲單元1中存儲的全拼字符串到候選詞映射表。輸出單元8輸出第二查找單元7確定的候選詞。因此,該系統(tǒng)在接收單元2接收到的拼音串不是簡拼字符串或者全拼字符串時,仍能夠?qū)崿F(xiàn)候選詞的輸出,方便用戶使用。
參見圖10,該圖為本發(fā)明所述系統(tǒng)第三種實(shí)施方式結(jié)構(gòu)圖。
本發(fā)明所述系統(tǒng)第三種實(shí)施方式相對第二種實(shí)施方式增加了詞頻單元9。
詞頻單元9,用于記錄每個候選詞的詞頻。所述輸出單元8將所述第二查找單元7確定的所有候選詞按照所述詞頻單元9記錄的候選詞詞頻順序進(jìn)行輸出。
當(dāng)本發(fā)明所述方法實(shí)施例按照詞頻單元9記錄候選詞的詞頻,當(dāng)由大到小的順序輸出候選詞時,用戶需要的詞出現(xiàn)在所有候選詞前面的概率就比較大,相對減小了用戶查找候選詞的翻頁次數(shù),更加有利于用戶的使用,增強(qiáng)了用戶體驗。
當(dāng)然還可以在存儲單元1存儲每個候選詞的詞頻,而不需要增加詞頻單元9。輸出單元8同樣可以將所述第二查找單元7確定的所有候選詞按照存儲單元1存儲的詞頻由大到小的順序輸出。
本發(fā)明所述系統(tǒng)優(yōu)選實(shí)施方式,所述音節(jié)劃分單元是按動態(tài)規(guī)劃算法進(jìn)行音節(jié)劃分。當(dāng)然,本發(fā)明實(shí)施例所述按音節(jié)劃分還可以同時采用動態(tài)規(guī)劃算法和音節(jié)數(shù)量最少原則進(jìn)行劃分。
以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤飾,這些改進(jìn)和潤飾也應(yīng)視為本發(fā)明的保護(hù)范圍。
權(quán)利要求
1.一種計算機(jī)漢字輸入方法,其特征在于,包括以下步驟按音節(jié)劃分接收到的拼音串;提取每個音節(jié)的首字母組成簡拼字符串;在預(yù)先建立的簡拼字符串到全拼字符串映射表中查找出所述簡拼字符串對應(yīng)的所有全拼字符串;根據(jù)所述全拼字符串輸出對應(yīng)的候選詞。
2.根據(jù)權(quán)利要求1所述的計算機(jī)漢字輸入方法,其特征在于,在預(yù)先建立的簡拼字符串到全拼字符串映射表中查找出所述簡拼字符串對應(yīng)的所有全拼字符串后包括步驟確定上述所有全拼字符串與該接收的拼音串相匹配的各全拼字符串;根據(jù)上述各全拼字符串輸出對應(yīng)的候選詞。
3.根據(jù)權(quán)利要求1或2所示的計算機(jī)漢字輸入方法,其特征在于,所述所有候選詞是按照詞頻由大到小的順序排列。
4.根據(jù)權(quán)利要求3所述的計算機(jī)漢字輸入方法,其特征在于,所述詞頻是預(yù)先用文本統(tǒng)計所述候選詞的出現(xiàn)頻率。
5.根據(jù)權(quán)利要求3所述的計算機(jī)漢字輸入方法,其特征在于,所述簡拼字符串到全拼字符串映射表具體為簡拼字符串與通過所述簡拼字符串?dāng)U展的全部全拼字符串之間的關(guān)系對照表。
6.根據(jù)權(quán)利要求1所述的計算機(jī)漢字輸入方法,其特征在于,所述按音節(jié)劃分接收的拼音串具體為按動態(tài)規(guī)劃算法劃分該接收到的拼音串的音節(jié)。
7.根據(jù)權(quán)利要求1所述的計算機(jī)漢字輸入方法,其特征在于,所述確定上述所有全拼字符串與該接收的拼音串相匹配的各全拼字符串,具體為將查找到的所述簡拼字符串對應(yīng)的所有全拼字符串逐個與該接收到的拼音串相比較,確定與該接收的拼音串相匹配的各全拼字符串。
8.一種計算機(jī)漢字輸入系統(tǒng),其特征在于,該系統(tǒng)包括存儲單元,用于存儲簡拼字符串到全拼字符串映射表和全拼字符串到候選詞映射表;接收單元,用于接收用戶輸入的拼音串;音節(jié)劃分單元,用于按音節(jié)劃分所述接收單元接收的拼音串;簡拼提取單元,用于提取所述音節(jié)劃分單元劃分后的拼音串中的每個音節(jié)的首字母,組成簡拼字符串;第一查找單元,用于根據(jù)所述存儲單元中存儲的簡拼字符串到全拼字符串映射表,查找出與所述簡拼提取單元生成的簡拼字符串對應(yīng)的所有全拼字符串;第二查找單元,用于根據(jù)所述存儲單元中存儲的全拼字符串到候選詞映射表,查找出所述第一查找單元確定的所有全拼字符串對應(yīng)的所有候選詞;輸出單元,用于輸出所述第二查找單元確定的所有候選詞。
9.根據(jù)權(quán)利要求8所述的計算機(jī)漢字輸入系統(tǒng),其特征在于,所述系統(tǒng)進(jìn)一步包括比較單元;所述比較單元,用于比較所述接收單元接收的拼音串與所述第一查找單元查找出的所有全拼字符串,確定相匹配的各全拼字符串;所述第二查找單元,用于根據(jù)所述存儲單元中存儲的全拼字符串到候選詞映射表,查找出所述比較單元確定的各全拼字符串對應(yīng)的所有候選詞;所述輸出單元,用于輸出所述第二查找單元確定的各全拼字符串對應(yīng)的所有候選詞。
10.根據(jù)權(quán)利要求9所述的計算機(jī)漢字輸入系統(tǒng),其特征在于,該系統(tǒng)還包括詞頻單元,用于記錄候選詞的詞頻;所述輸出單元將所述第二查找單元確定的所有候選詞按照所述詞頻單元記錄的候選詞詞頻順序進(jìn)行輸出。
11.根據(jù)權(quán)利要求8至10任一所述的計算機(jī)漢字輸入系統(tǒng),其特征在于,所述音節(jié)劃分單元是按動態(tài)規(guī)劃算法進(jìn)行音節(jié)劃分。
全文摘要
本發(fā)明公開了一種計算機(jī)漢字輸入方法,包括以下步驟按音節(jié)劃分接收到的拼音串;提取每個音節(jié)的首字母組成簡拼字符串;在預(yù)先建立的簡拼字符串到全拼字符串映射表中查找出所述簡拼字符串對應(yīng)的所有全拼字符串;根據(jù)上述所有全拼字符串輸出對應(yīng)的候選詞。本發(fā)明提供一種計算機(jī)漢字輸入方法和計算機(jī)漢字輸入系統(tǒng),在接收到的拼音串不是簡拼字符串或者全拼字符串時,能夠?qū)崿F(xiàn)候選詞的輸出,方便用戶使用,增強(qiáng)用戶體驗。
文檔編號G06F3/023GK101075262SQ20071011085
公開日2007年11月21日 申請日期2007年6月12日 優(yōu)先權(quán)日2007年6月12日
發(fā)明者張會鵬 申請人:騰訊科技(深圳)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
临高县| 金沙县| 西藏| 新疆| 道孚县| 四会市| 道孚县| 黔南| 庆安县| 德庆县| 台东县| 谢通门县| 通榆县| 团风县| 信阳市| 红安县| 呼图壁县| 博乐市| 乌拉特后旗| 铅山县| 苏尼特左旗| 历史| 宜宾市| 鹰潭市| 乌兰县| 余姚市| 遂昌县| 宕昌县| 龙游县| 西丰县| 巨鹿县| 上高县| 县级市| 安宁市| 会理县| 武鸣县| 龙井市| 商河县| 邵东县| 峨眉山市| 日喀则市|