專利名稱:一種漢字的拼音輸入方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種漢字的拼音輸入方法及系統(tǒng)。
背景技術(shù):
中文輸入方法是運(yùn)行于操作系統(tǒng)上的一個(gè)輸入工具,是把鍵盤輸入的按鍵信息或其他非鍵盤輸入的信息轉(zhuǎn)換成漢字輸入的方法。目前使用最廣的是基于鍵盤的中文輸入方法。由于漢字是由字的音、形、義來共同表達(dá)的,因此漢字的拼音可以用于確定漢字的候選
o現(xiàn)有的漢字拼音輸入方法是通過事先設(shè)定鍵盤與拼音字母的對(duì)應(yīng)關(guān)系,實(shí)現(xiàn)漢字 的輸入。由于漢字字?jǐn)?shù)繁多,讀音也比較多,當(dāng)進(jìn)行漢字的輸入時(shí)要求用戶了解漢字的全拼字符串或簡(jiǎn)拼字符串的輸入,即輸入一個(gè)漢字的全部音節(jié)或只輸入一個(gè)音節(jié)的聲母部分,就可以輸出候選詞。然而一般情況下,用戶只能記住常用字的全拼字符串或簡(jiǎn)拼字符串,對(duì)于大多數(shù)漢字,用戶知道其寫法,卻不知道其拼音,對(duì)于一些生僻字(不常見漢字)用戶更是無法通過拼音實(shí)現(xiàn)漢字的輸入,例如翁,鞾等,使得漢字輸入困難,用戶體驗(yàn)較不高。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例的目的在于提供一種漢字的拼音輸入方法及系統(tǒng),旨在解決由于在輸入生僻字等漢字時(shí),無法通過拼音實(shí)現(xiàn)漢字的輸入,導(dǎo)致漢字輸入困難,用戶體驗(yàn)較不高的問題。本發(fā)明實(shí)施例是這樣實(shí)現(xiàn)的,一種漢字的拼音輸入方法,所述方法包括下述步驟按音節(jié)將接收到的拼音字符串劃分為一個(gè)或多個(gè)音節(jié)字符串;提取從拼音字符串中劃分出的首字符串,判斷所述首字符串是否為預(yù)設(shè)的標(biāo)識(shí)符;當(dāng)所述首字符串為預(yù)設(shè)的標(biāo)識(shí)符時(shí),根據(jù)劃分出的一個(gè)或多個(gè)音節(jié)字符串與候選字的映射關(guān)系,輸出多個(gè)音節(jié)字符串對(duì)應(yīng)的候選字。本發(fā)明實(shí)施例的另一目的在于提供一種漢字的拼音輸入系統(tǒng),所述系統(tǒng)包括字符串劃分單元,用于按音節(jié)將接收到的拼音字符串劃分為一個(gè)或多個(gè)音節(jié)字符串;首字符串判斷單元,用于提取從拼音字符串中劃分出的首字符串,判斷所述首字符串是否為預(yù)設(shè)的標(biāo)識(shí)符;以及候選字輸出單元,用于當(dāng)首字符串為預(yù)設(shè)的標(biāo)識(shí)符時(shí),根據(jù)劃分出的一個(gè)或多個(gè)音節(jié)字符串與候選字的映射關(guān)系,輸出多個(gè)音節(jié)字符串對(duì)應(yīng)的候選字。本發(fā)明實(shí)施例通過按音節(jié)將接收到的拼音字符串劃分為一個(gè)或多個(gè)音節(jié)字符串,提取從拼音字符串中劃分出的首字符串,判斷首字符串是否為預(yù)設(shè)的標(biāo)識(shí)符,當(dāng)首字符串為預(yù)設(shè)的標(biāo)識(shí)符時(shí),根據(jù)劃分出的一個(gè)或多個(gè)音節(jié)字符串與候選字的映射關(guān)系,輸出多個(gè)音節(jié)字符串對(duì)應(yīng)的候選字,使得用戶在需要輸入生僻字等不知道待輸入漢字的拼音時(shí),通過將待輸入漢字拆成多個(gè)常用漢字后,通過輸入常用漢字的拼音完成漢字的輸入,從而提高了漢字的輸入效率和用戶體驗(yàn)。
圖I是本發(fā)明第一實(shí)施例提供的漢字的拼音輸入方法的實(shí)現(xiàn)流程圖;圖2是本發(fā)明第二實(shí)施例提供的漢字的拼音輸入方法的實(shí)現(xiàn)流程圖;圖3a、圖3b是本發(fā)明第二實(shí)施例提供的音節(jié)字符串與擴(kuò)展音節(jié)字符串的關(guān)系對(duì)照表;圖4是本發(fā)明第三實(shí)施例提供的漢字的拼音輸入方法的實(shí)現(xiàn)流程圖;圖5是本發(fā)明第三實(shí)施例提供的音節(jié)字符串與候選字的映射記錄實(shí)例圖;
圖6a、圖6b是本發(fā)明第四實(shí)施例提供的漢字的拼音輸入方法的實(shí)例圖;圖7是本發(fā)明第五實(shí)施例提供的漢字的拼音輸入系統(tǒng)的結(jié)構(gòu)圖;圖8是本發(fā)明第五實(shí)施例提供的漢字的拼音輸入系統(tǒng)的結(jié)構(gòu)圖。
具體實(shí)施例方式為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。本發(fā)明實(shí)施例通過在用戶需要輸入生僻字等不清楚待輸入漢字的拼音時(shí),通過將待輸入漢字拆成多個(gè)常用漢字后,通過輸入該多個(gè)常用漢字的拼音完成待輸入漢字的拼音輸入,在接收到輸入的拼音字符串時(shí),將其劃分為一個(gè)或多個(gè)音節(jié)字符串,根據(jù)多個(gè)音節(jié)字符串與候選字的映射關(guān)系,輸出多個(gè)音節(jié)字符串對(duì)應(yīng)的候選字,從而實(shí)現(xiàn)了漢字的輸入,提高了漢字的輸入效率和用戶體驗(yàn)。本發(fā)明實(shí)施例提供了一種漢字的拼音輸入方法,所述方法包括下述步驟按音節(jié)將接收到的拼音字符串劃分為一個(gè)或多個(gè)音節(jié)字符串;提取從拼音字符串中劃分出的首字符串,判斷所述首字符串是否為預(yù)設(shè)的標(biāo)識(shí)符;當(dāng)所述首字符串為預(yù)設(shè)的標(biāo)識(shí)符時(shí),根據(jù)劃分出的一個(gè)或多個(gè)音節(jié)字符串與候選字的映射關(guān)系,輸出多個(gè)音節(jié)字符串對(duì)應(yīng)的候選字。本發(fā)明實(shí)施例還提供了一種漢字的拼音輸入系統(tǒng),所述系統(tǒng)包括字符串劃分單元,用于按音節(jié)將接收到的拼音字符串劃分為一個(gè)或多個(gè)音節(jié)字符串;首字符串判斷單元,用于提取從拼音字符串中劃分出的首字符串,判斷所述首字符串是否為預(yù)設(shè)的標(biāo)識(shí)符;以及候選字輸出單元,用于當(dāng)首字符串為預(yù)設(shè)的標(biāo)識(shí)符時(shí),根據(jù)劃分出的一個(gè)或多個(gè)音節(jié)字符串與候選字的映射關(guān)系,輸出多個(gè)音節(jié)字符串對(duì)應(yīng)的候選字。本發(fā)明實(shí)施例通過在用戶需要輸入生僻字等不知道待輸入漢字的拼音時(shí),通過將待輸入漢字拆成多個(gè)常用漢字后,通過輸入該多個(gè)常用漢字的拼音完成待輸入漢字的拼音輸入,在接收到輸入的拼音字符串時(shí),將其劃分為一個(gè)或多個(gè)音節(jié)字符串,根據(jù)多個(gè)音節(jié)字符串與候選字的映射關(guān)系,輸出多個(gè)音節(jié)字符串對(duì)應(yīng)的候選字,從而實(shí)現(xiàn)了漢字的輸入,提高了漢字的輸入效率和用戶體驗(yàn)。以下結(jié)合具體實(shí)施例對(duì)本發(fā)明的具體實(shí)現(xiàn)進(jìn)行詳細(xì)描述實(shí)施例一:圖I示出了本發(fā)明第一實(shí)施例提供的漢字的拼音輸入方法的實(shí)現(xiàn)流程,詳述如下在步驟SlOl中,按音節(jié)將接收到的拼音字符串劃分為一個(gè)或多個(gè)音節(jié)字符串。在本發(fā)明實(shí)施例中,接收到的拼音字符串可能是全拼字符串或者簡(jiǎn)拼字符串或者是不完整的全拼字符串,接收到的拼音字符串可以來自鍵盤也可以是非鍵盤,在此不用以限制本發(fā)明。在接收到拼音字符串后,將接收到的拼音字符串按照音節(jié)進(jìn)行劃分,從而將接收到的拼音字符串劃分為一個(gè)或多個(gè)音節(jié)字符串,劃分出的字符串可能是一個(gè)完整的音節(jié) 或不完整的音節(jié)。在步驟S102中,提取從拼音字符串中劃分出的首字符串,判斷首字符串是否為預(yù)設(shè)的標(biāo)識(shí)符。在發(fā)明實(shí)施例中,通過步驟SlOl中將接收到的拼音字符串劃分為一個(gè)或多個(gè)音節(jié)字符串后,提取劃分出的音節(jié)字符串的首字符串,判斷首字符串是否為預(yù)設(shè)的標(biāo)識(shí)符,該標(biāo)識(shí)符表征從接收到的字符串劃分出來的一個(gè)或多個(gè)音節(jié)字符串為一個(gè)待輸入漢字被拆分各部分的拼音,為了與音節(jié)區(qū)分開來,預(yù)先設(shè)置的標(biāo)識(shí)符不能為音節(jié)字符串,可以為U、V或數(shù)字等非音節(jié)字符串。在步驟S103中,當(dāng)首字符串為預(yù)設(shè)的標(biāo)識(shí)符時(shí),根據(jù)劃分出的一個(gè)或多個(gè)音節(jié)字符串與候選字的映射關(guān)系,輸出多個(gè)音節(jié)字符串對(duì)應(yīng)的候選字。在本發(fā)明實(shí)施例中,當(dāng)首字符串為預(yù)設(shè)的標(biāo)識(shí)符時(shí),說明接收到的拼音字符串為一個(gè)漢字的各個(gè)組成部分的拼音字符串,各個(gè)組成部分可以是偏旁部首,也可以是單個(gè)常用漢字,當(dāng)組成部分是偏旁部首時(shí),該偏旁部的拼音可以為該偏旁部首作為單個(gè)漢字的拼音,例如‘M ”的拼音為“ren”,1 ”的拼音為“ti”。當(dāng)接收到的拼音字符串為一個(gè)漢字的各個(gè)組成部分的拼音字符串時(shí),根據(jù)劃分出的一個(gè)或多個(gè)音節(jié)字符串與候選字的映射關(guān)系,輸出多個(gè)音節(jié)字符串對(duì)應(yīng)的候選字,輸出的候選字可以按照字頻由大到小的順序排列,字頻可以根據(jù)用戶在一段時(shí)間選擇輸入的頻率來統(tǒng)計(jì),也可以根據(jù)國(guó)家標(biāo)準(zhǔn)局1981年公布的《信息交換用漢字編碼字符集基本集》中記錄的一級(jí)字庫(kù)、二級(jí)字庫(kù)的順序進(jìn)行順序排列輸出。在本發(fā)明實(shí)施例中,將接收到的拼音字符串按照音節(jié)將其劃分為一個(gè)漢字的各個(gè)組成部分的拼音字符串,各個(gè)組成部分可以是偏旁部首,也可以是單個(gè)常用漢字,再根據(jù)劃分出的一個(gè)或多個(gè)音節(jié)字符串與候選字的映射關(guān)系,輸出多個(gè)音節(jié)字符串對(duì)應(yīng)的候選字,使得用戶無需花費(fèi)大量時(shí)間記憶漢字拼音,用戶只需了解常用漢字的拼音就可實(shí)現(xiàn)所有漢字的輸入,同時(shí)也不會(huì)增加拼音字符串的輸入數(shù)量,從而提高了漢字的輸入效率和用戶體驗(yàn),進(jìn)一步擴(kuò)大了拼音輸入法的使用范圍。實(shí)施例二 :在本發(fā)明實(shí)施例中,通過在預(yù)先建立的音節(jié)字符串與通過該音節(jié)字符串?dāng)U展的全部音節(jié)字符串之間的關(guān)系對(duì)照表中查找劃分出的音節(jié)字符串中每個(gè)字符串對(duì)應(yīng)的所有音節(jié)字符串,將查找到的每個(gè)字符串對(duì)應(yīng)的所有音節(jié)字符串進(jìn)行組合,對(duì)照預(yù)先建立的音節(jié)字符串與候選字的映射表,輸出所有音節(jié)字符串對(duì)應(yīng)的候選字,從而進(jìn)一步簡(jiǎn)化了需要輸入的拼首字符串,提聞了用戶體驗(yàn)。圖2示出了本發(fā)明第二實(shí)施例提供的漢字的拼音輸入方法的實(shí)現(xiàn)流程,詳述如下在步驟S201中,按音節(jié)將接收到的拼音字符串劃分為一個(gè)或多個(gè)音節(jié)字符串。在本發(fā)明實(shí)施例中,接收到的拼音字符串可能是全拼字符串或者簡(jiǎn)拼字符串或者是不完整的全拼字符串,接收到的拼音字符串可以來自鍵盤也可以是非鍵盤,在此不用以限制本發(fā)明。將接收到的拼音字符串按照音節(jié)進(jìn)行劃分,從而將接收到的拼音字符串劃分為一個(gè)或多個(gè)音節(jié)字符串,劃分出的字符串可能是一個(gè)完整的音節(jié)或不完整的音節(jié)。、在步驟S202中,提取從拼音字符串中劃分出的首字符串。在步驟S203中,判斷首字符串是否為預(yù)設(shè)的標(biāo)識(shí)符,是則執(zhí)行步驟S204,否則執(zhí)行步驟S206。在發(fā)明實(shí)施例中,通過步驟S201中將接收到的拼音字符串劃分為一個(gè)或多個(gè)音節(jié)字符串后,提取劃分出的音節(jié)字符串的首字符串,判斷首字符串是否為預(yù)設(shè)的標(biāo)識(shí)符,該標(biāo)識(shí)符表征從接收到的字符串劃分出來的一個(gè)或多個(gè)音節(jié)字符串為一個(gè)待輸入漢字被拆分各部分的拼音,為了與音節(jié)區(qū)分開來,預(yù)先設(shè)置的標(biāo)識(shí)符不能為音節(jié)字符串,可以為U、V或數(shù)字等非音節(jié)字符串。在步驟S204中,當(dāng)首字符串為預(yù)設(shè)的標(biāo)識(shí)符時(shí),在預(yù)先建立的音節(jié)字符串與通過該音節(jié)字符串?dāng)U展的全部音節(jié)字符串之間的關(guān)系對(duì)照表中查找劃分出的音節(jié)字符串中每個(gè)字符串對(duì)應(yīng)的所有音節(jié)字符串。在本發(fā)明實(shí)施例中,當(dāng)首字符串為預(yù)設(shè)的標(biāo)識(shí)符時(shí),說明接收到的拼音字符串為一個(gè)漢字的各個(gè)組成部分的拼音字符串,各個(gè)組成部分可以是偏旁部首,也可以是單個(gè)常用漢字,當(dāng)組成部分是偏旁部首時(shí),該偏旁部的拼音可以為該偏旁部首作為單個(gè)漢字的拼音,例如‘M ”的拼音為“red ”的拼音為“ti”。當(dāng)接收到的拼音字符串為一個(gè)漢字的各個(gè)組成部分的拼音字符串時(shí)。進(jìn)一步地,應(yīng)預(yù)先建立音節(jié)字符串與通過該音節(jié)字符串?dāng)U展的全部音節(jié)字符串之間的關(guān)系對(duì)照表,例如,圖3a和圖3b所示的音節(jié)字符串與通過該音節(jié)字符串?dāng)U展的全部音節(jié)字符串之間的關(guān)系對(duì)照表。在圖3a中,當(dāng)劃分出的音節(jié)字符中有一個(gè)音節(jié)字符串為a時(shí),則音節(jié)a的擴(kuò)展音節(jié)包括音節(jié)ai、an、ang和ao,在圖3b中,當(dāng)劃分出的音節(jié)字符中有一個(gè)音節(jié)字符串為de時(shí),則音節(jié)de的擴(kuò)展音節(jié)包括音節(jié)dei、den和deng。在步驟S205中,將查找到的每個(gè)字符串對(duì)應(yīng)的所有音節(jié)字符串進(jìn)行組合,對(duì)照預(yù)先建立的音節(jié)字符串與候選字的映射表,輸出所有音節(jié)字符串對(duì)應(yīng)的候選字。在本發(fā)明實(shí)施例中,當(dāng)通過步驟S204查找劃分出的音節(jié)字符串中每個(gè)字符串對(duì)應(yīng)的所有音節(jié)字符串后,將查找到的每個(gè)字符串對(duì)應(yīng)的所有音節(jié)字符串進(jìn)行組合,例如,若劃分的音節(jié)字符串包括a和de時(shí),查找到音節(jié)a的所有擴(kuò)展音節(jié)為ai、an、ang和ao,de的所有擴(kuò)展音節(jié)為dei、den和deng,貝U所有音節(jié)字符串組合后包括ai dei、ai den、ai deng、an dei、an den、an deng、ang dei、ang den、ang deng、ao dei、ao den 和 ao deng。在得到組合后的音節(jié)音符串后,將組合后的音節(jié)字符串與預(yù)先構(gòu)建的音節(jié)字符串與候選字的映射表進(jìn)行對(duì)照,輸出所有與組合音節(jié)字符串對(duì)應(yīng)的候選字。在步驟S206中,當(dāng)首字符串不為預(yù)設(shè)的標(biāo)識(shí)符時(shí),在預(yù)先建立的音節(jié)字符串與通過該音節(jié)字符串?dāng)U展的全部音節(jié)字符串之間的關(guān)系對(duì)照表中查找劃分出的音節(jié)字符串對(duì)應(yīng)的所有音節(jié)字符串。在步驟S207中,對(duì)照預(yù)先建立的音節(jié)字符串與候選詞的映射表,輸出所有音節(jié)字符串對(duì)應(yīng)的候選詞。在本發(fā)明實(shí)施例中,當(dāng)首字符串不為預(yù)設(shè)的標(biāo)識(shí)符時(shí),則對(duì)劃分出的音節(jié)字符串每個(gè)字符串進(jìn)行擴(kuò)展后,進(jìn)行組合,將組合后的音節(jié)字符串與預(yù)先建立的音節(jié)字符串與候選詞的映射表進(jìn)行對(duì)照,輸出所有組合后的音節(jié)字符串對(duì)應(yīng)的候選詞。實(shí)施例三:在本發(fā)明實(shí)施例中,通過在查找劃分出的一個(gè)或多個(gè)音節(jié)字符串與候選字的映射 關(guān)系時(shí)限定候選字被映射成音節(jié)字符串的數(shù)目,從而縮小候選字的查找范圍,提高漢字的輸入效率。圖4示出了本發(fā)明第三實(shí)施例提供的漢字的拼音輸入方法的實(shí)現(xiàn)流程,詳述如下在步驟S401中,按音節(jié)將接收到的拼音字符串劃分為一個(gè)或多個(gè)音節(jié)字符串。在步驟S402中,提取從拼音字符串中劃分出的首字符串。在步驟S403中,判斷首字符串是否為預(yù)設(shè)的標(biāo)識(shí)符,當(dāng)首字符串為預(yù)設(shè)的標(biāo)識(shí)符時(shí),執(zhí)行步驟S404,否則執(zhí)行步驟S408。在步驟S404中,當(dāng)首字符串為預(yù)設(shè)的標(biāo)識(shí)符時(shí),在預(yù)先建立的音節(jié)字符串與通過該音節(jié)字符串?dāng)U展的全部音節(jié)字符串之間的關(guān)系對(duì)照表中查找劃分出的音節(jié)字符串中每個(gè)字符串對(duì)應(yīng)的所有音節(jié)字符串。在步驟S405中,獲取在步驟S401中劃分出的音節(jié)字符串的數(shù)目。在步驟S406中,在預(yù)先建立的音節(jié)字符串與候選字的映射表的映射記錄中查找包含與獲取劃分出的音節(jié)字符串的數(shù)目相同的音節(jié)字符串的映射記錄。在本發(fā)明實(shí)施例中,預(yù)先建立的音節(jié)字符串與候選字的映射表的每一條映射記錄中除了保存候選字,候選字對(duì)應(yīng)的音節(jié)字符串,還包括音節(jié)字符串的數(shù)目,在查找時(shí),根據(jù)每條記錄保存的音節(jié)字符串的數(shù)目,先檢索出與獲取劃分出的音節(jié)字符串的數(shù)目相同的音節(jié)字符串的映射記錄,最后在檢索出的映射記錄中進(jìn)行候選字的查找。例如,如圖5所示的音節(jié)字符串與候選字的映射記錄,該映射記錄有四個(gè)字段,每個(gè)字段用十六進(jìn)制表示,字段I用來保存漢字,占兩個(gè)字節(jié),字段2用于存儲(chǔ)漢字的組成部分的數(shù)目(兩個(gè)組成部分),占一個(gè)字節(jié),字段3占四個(gè)字節(jié),用于保存字段I中漢字的兩個(gè)組成部分的音節(jié)字符串(拼音串)O在步驟S407中,將查找到的每個(gè)字符串對(duì)應(yīng)的所有音節(jié)字符串進(jìn)行組合,將組合后的音節(jié)字符串與查找到的映射記錄進(jìn)行對(duì)照,輸出組合后的音節(jié)字符串對(duì)應(yīng)的候選字。在步驟S408中,當(dāng)所述首字符串不為預(yù)設(shè)的標(biāo)識(shí)符時(shí),在預(yù)先建立的音節(jié)字符串與通過該音節(jié)字符串?dāng)U展的全部音節(jié)字符串之間的關(guān)系對(duì)照表中查找劃分出的音節(jié)字符串對(duì)應(yīng)的所有音節(jié)字符串。
在步驟S409中,對(duì)照預(yù)先建立的音節(jié)字符串與候選詞的映射表,輸出所有音節(jié)字符串對(duì)應(yīng)的候選詞。實(shí)施例四圖6a、圖6b示出了本發(fā)明第四實(shí)施例提供的漢字的拼音輸入方法的實(shí)例。在本發(fā)明實(shí)施例中,用字符串U作為標(biāo)識(shí)符,表示接收到的拼音字符串為一個(gè)漢字的各個(gè)組成部分的拼音字符串,接收到的拼音字符串為urenren,系統(tǒng)根據(jù)音節(jié)將其劃分為u ren ren,進(jìn)而獲取與音節(jié)字符串ren ren存在映射關(guān)系的候選字進(jìn)行顯示輸出,例如,圖6a中的從、仞、俎等。本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分步驟是可以 通過程序來指令相關(guān)的硬件來完成,所述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,所述的存儲(chǔ)介質(zhì),如R0M/RAM、磁盤、光盤等。實(shí)施例五圖7示出了本發(fā)明第五實(shí)施例提供漢字的拼音輸入系統(tǒng)的結(jié)構(gòu),為了便于說明,僅不出了與本發(fā)明實(shí)施例相關(guān)的部分。字符串劃分單元71按音節(jié)將接收到的拼音字符串劃分為一個(gè)或多個(gè)音節(jié)字符串。在本發(fā)明實(shí)施例中,接收到的拼音字符串可能是全拼字符串或者簡(jiǎn)拼字符串或者是不完整的全拼字符串,接收到的拼音字符串可以來自鍵盤也可以是非鍵盤,在此不用以限制本發(fā)明。將接收到的拼音字符串按照音節(jié)進(jìn)行劃分,從而將接收到的拼音字符串劃分為一個(gè)或多個(gè)音節(jié)字符串,劃分出的字符串可能是一個(gè)完整的音節(jié)或不完整的音節(jié)。首字符串判斷單元72提取從拼音字符串中劃分出的首字符串,判斷首字符串是否為預(yù)設(shè)的標(biāo)識(shí)符。在發(fā)明實(shí)施例中,通過將接收到的拼音字符串劃分為一個(gè)或多個(gè)音節(jié)字符串后,提取劃分出的音節(jié)字符串的首字符串,判斷首字符串是否為預(yù)設(shè)的標(biāo)識(shí)符,該標(biāo)識(shí)符表征從接收到的字符串劃分出來的一個(gè)或多個(gè)音節(jié)字符串為一個(gè)待輸入漢字被拆分各部分的拼音,為了與音節(jié)區(qū)分開來,預(yù)先設(shè)置的標(biāo)識(shí)符不能為音節(jié)字符串,可以為U、V或數(shù)字等非音節(jié)字符串。候選字輸出單元73當(dāng)首字符串為預(yù)設(shè)的標(biāo)識(shí)符時(shí),根據(jù)劃分出的一個(gè)或多個(gè)音節(jié)字符串與候選字的映射關(guān)系,輸出多個(gè)音節(jié)字符串對(duì)應(yīng)的候選字。在本發(fā)明實(shí)施例中,當(dāng)首字符串為預(yù)設(shè)的標(biāo)識(shí)符時(shí),說明接收到的拼音字符串為一個(gè)漢字的各個(gè)組成部分的拼音字符串,各個(gè)組成部分可以是偏旁部首,也可以是單個(gè)常用漢字,當(dāng)組成部分是偏旁部首時(shí),該偏旁部的拼音可以為該偏旁部首作為單個(gè)漢字的拼音,例如M ”的拼音為“ren”,“子”的拼音為“ti”。當(dāng)接收到的拼音字符串為一個(gè)漢字的各個(gè)組成部分的拼音字符串時(shí),根據(jù)劃分出的一個(gè)或多個(gè)音節(jié)字符串與候選字的映射關(guān)系,輸出多個(gè)音節(jié)字符串對(duì)應(yīng)的候選字。第二字符串查找單元74當(dāng)首字符串不為預(yù)設(shè)的標(biāo)識(shí)符時(shí),在預(yù)先建立的音節(jié)字符串與通過該音節(jié)字符串?dāng)U展的全部音節(jié)字符串之間的關(guān)系對(duì)照表中查找劃分出的音節(jié)字符串對(duì)應(yīng)的所有音節(jié)字符串。候選詞輸出單兀75對(duì)照預(yù)先建立的音節(jié)字符串與候選詞的映射表,輸出所有音節(jié)字符串對(duì)應(yīng)的候選詞。在具體實(shí)施過程中,候選字輸出單元73包括第一字符串查找單元731和第一輸出子單元732,如圖8所示,其中第一字符串查找單元731,用于當(dāng)首字符串為預(yù)設(shè)的標(biāo)識(shí)符時(shí),在預(yù)先建立的音節(jié)字符串與通過該音節(jié)字符串?dāng)U展的全部音節(jié)字符串之間的關(guān)系對(duì)照表中查找劃分出的音節(jié)字符串中每個(gè)字符串對(duì)應(yīng)的所有音節(jié)字符串;以及第一輸出子單元732,用于將查找到的每個(gè)字符串對(duì)應(yīng)的所有音節(jié)字符串進(jìn)行組合,對(duì)照預(yù)先建立的音節(jié)字符串與候選字的映射表,輸出所有音節(jié)字符串對(duì)應(yīng)的候選字。更進(jìn)一步地,第一輸出子單元732可以由字符串?dāng)?shù)目獲取單元、映射記錄查找單元以及第二輸出子單元,其中字符串?dāng)?shù)目獲取單元獲取劃分出的音節(jié)字符串的數(shù)目,映射記錄查找單元在預(yù)先建立的音節(jié)字符串與候選字的映射表的映射記錄中查找包含與獲取劃分出的音節(jié)字符串的數(shù)目相同的音節(jié)字符串的映射記錄,第二輸出子單元將查找到的每個(gè)字符串對(duì)應(yīng)的所有音節(jié)字符串進(jìn)行組合,將組合后的音節(jié)字符串與查找到的映射記錄進(jìn)行對(duì)照,輸出組合后的音節(jié)字符串對(duì)應(yīng)的候選字。本發(fā)明實(shí)施例通過在用戶需要輸入生僻字等無法知道待輸入漢字的拼音時(shí),通過將待輸入漢字拆成多個(gè)常用漢字后,通過輸入該多個(gè)常用漢字的拼音完成待輸入漢字的拼音輸入,在接收到輸入的拼音字符串時(shí),將其劃分為一個(gè)或多個(gè)音節(jié)字符串,根據(jù)多個(gè)音節(jié)字符串與候選字的映射關(guān)系,輸出多個(gè)音節(jié)字符串對(duì)應(yīng)的候選字,從而實(shí)現(xiàn)了漢字的輸入,提高了漢字的輸入效率和用戶體驗(yàn)。以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精 神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種漢字的拼音輸入方法,其特征在于,所述方法包括下述步驟 按音節(jié)將接收到的拼音字符串劃分為一個(gè)或多個(gè)音節(jié)字符串; 提取從拼音字符串中劃分出的首字符串,判斷所述首字符串是否為預(yù)設(shè)的標(biāo)識(shí)符; 當(dāng)所述首字符串為預(yù)設(shè)的標(biāo)識(shí)符時(shí),根據(jù)劃分出的一個(gè)或多個(gè)音節(jié)字符串與候選字的映射關(guān)系,輸出多個(gè)音節(jié)字符串對(duì)應(yīng)的候選字。
2.如權(quán)利要求I所述的方法,其特征在于,所述當(dāng)所述首字符串為預(yù)設(shè)的標(biāo)識(shí)符時(shí),根據(jù)劃分出的一個(gè)或多個(gè)音節(jié)字符串與候選字的映射關(guān)系,輸出多個(gè)音節(jié)字符串對(duì)應(yīng)的候選字的步驟具體為 當(dāng)所述首字符串為預(yù)設(shè)的標(biāo)識(shí)符時(shí),在預(yù)先建立的音節(jié)字符串與通過該音節(jié)字符串?dāng)U展的全部音節(jié)字符串之間的關(guān)系對(duì)照表中查找劃分出的音節(jié)字符串中每個(gè)字符串對(duì)應(yīng)的所有音節(jié)字符串; 將查找到的每個(gè)字符串對(duì)應(yīng)的所有音節(jié)字符串進(jìn)行組合,對(duì)照預(yù)先建立的音節(jié)字符串與候選字的映射表,輸出所有音節(jié)字符串對(duì)應(yīng)的候選字。
3.如權(quán)利要求2所述的方法,其特征在于,所述將查找到的每個(gè)字符串對(duì)應(yīng)的所有音節(jié)字符串進(jìn)行組合,對(duì)照預(yù)先建立的音節(jié)字符串與候選字的映射表,輸出所有音節(jié)字符串對(duì)應(yīng)的候選字的步驟具體包括下述步驟 獲取劃分出的音節(jié)字符串的數(shù)目; 在預(yù)先建立的音節(jié)字符串與候選字的映射表的映射記錄中查找包含與獲取劃分出的音節(jié)字符串的數(shù)目相同的音節(jié)字符串的映射記錄; 將查找到的每個(gè)字符串對(duì)應(yīng)的所有音節(jié)字符串進(jìn)行組合,將組合后的音節(jié)字符串與查找到的映射記錄進(jìn)行對(duì)照,輸出組合后的音節(jié)字符串對(duì)應(yīng)的候選字。
4.如權(quán)利要求I所述的方法,其特征在于,所述方法還包括下述步驟 當(dāng)所述首字符串不為預(yù)設(shè)的標(biāo)識(shí)符時(shí),在預(yù)先建立的音節(jié)字符串與通過該音節(jié)字符串?dāng)U展的全部音節(jié)字符串之間的關(guān)系對(duì)照表中查找劃分出的音節(jié)字符串對(duì)應(yīng)的所有音節(jié)字符串; 對(duì)照預(yù)先建立的音節(jié)字符串與候選詞的映射表,輸出所有音節(jié)字符串對(duì)應(yīng)的候選詞。
5.如權(quán)利要求I所述的方法,其特征在于,所述劃分出的一個(gè)或多個(gè)音節(jié)字符串為簡(jiǎn)拼字符串或全拼字符串。
6.如權(quán)利要求I所述的方法,其特征在于,所述輸出的所有音節(jié)字符串對(duì)應(yīng)的候選字按照字頻由大到小的順序排列。
7.一種漢字的拼音輸入系統(tǒng),其特征在于,所述系統(tǒng)包括 字符串劃分單元,用于按音節(jié)將接收到的拼音字符串劃分為一個(gè)或多個(gè)音節(jié)字符串; 首字符串判斷單元,用于提取從拼音字符串中劃分出的首字符串,判斷所述首字符串是否為預(yù)設(shè)的標(biāo)識(shí)符;以及 候選字輸出單元,用于當(dāng)首字符串為預(yù)設(shè)的標(biāo)識(shí)符時(shí),根據(jù)劃分出的一個(gè)或多個(gè)音節(jié)字符串與候選字的映射關(guān)系,輸出多個(gè)音節(jié)字符串對(duì)應(yīng)的候選字。
8.如權(quán)利要求7所述的系統(tǒng),其特征在于,所述候選字輸出單元具體包括 第一字符串查找單元,用于當(dāng)首字符串為預(yù)設(shè)的標(biāo)識(shí)符時(shí),在預(yù)先建立的音節(jié)字符串與通過該音節(jié)字符串?dāng)U展的全部音節(jié)字符串之間的關(guān)系對(duì)照表中查找劃分出的音節(jié)字符串中每個(gè)字符串對(duì)應(yīng)的所有首節(jié)字符串;以及 第一輸出子單元,用于將查找到的每個(gè)字符串對(duì)應(yīng)的所有音節(jié)字符串進(jìn)行組合,對(duì)照預(yù)先建立的音節(jié)字符串與候選字的映射表,輸出所有音節(jié)字符串對(duì)應(yīng)的候選字。
9.如權(quán)利要求8所述的系統(tǒng),其特征在于,所述候選字輸出子單元包括 字符串?dāng)?shù)目獲取單元,用于獲取劃分出的音節(jié)字符串的數(shù)目; 映射記錄查找單元,用于在預(yù)先建立的音節(jié)字符串與候選字的映射表的映射記錄中查找包含與獲取劃分出的音節(jié)字符串的數(shù)目相同的音節(jié)字符串的映射記錄;以及 第二輸出子單元,用于將查找到的每個(gè)字符串對(duì)應(yīng)的所有音節(jié)字符串進(jìn)行組合,將組合后的音節(jié)字符串與查找到的映射記錄進(jìn)行對(duì)照,輸出組合后的音節(jié)字符串對(duì)應(yīng)的候選、字。
10.如權(quán)利要求I所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括 第二字符串查找單元,用于當(dāng)首字符串不為預(yù)設(shè)的標(biāo)識(shí)符時(shí),在預(yù)先建立的音節(jié)字符串與通過該音節(jié)字符串?dāng)U展的全部音節(jié)字符串之間的關(guān)系對(duì)照表中查找劃分出的音節(jié)字符串對(duì)應(yīng)的所有音節(jié)字符串;以及 候選詞輸出單兀,用于對(duì)照預(yù)先建立的音節(jié)字符串與候選詞的映射表,輸出所有音節(jié)字符串對(duì)應(yīng)的候選詞。
11.如權(quán)利要求7所述的系統(tǒng),其特征在于,所述字符串劃分單元?jiǎng)澐殖龅囊粋€(gè)或多個(gè)音節(jié)字符串為簡(jiǎn)拼字符串或全拼字符串。
12.如權(quán)利要求7所述的方法,其特征在于,所述候選字輸出單元輸出的所有音節(jié)字符串對(duì)應(yīng)的候選字按照字頻由大到小的順序排列。
全文摘要
本發(fā)明適用于計(jì)算機(jī)技術(shù)領(lǐng)域,提供了一種漢字的拼音輸入方法及系統(tǒng),所述方法包括下述步驟按音節(jié)將接收到的拼音字符串劃分為一個(gè)或多個(gè)音節(jié)字符串;提取從拼音字符串中劃分出的首字符串,判斷所述首字符串是否為預(yù)設(shè)的標(biāo)識(shí)符;當(dāng)所述首字符串為預(yù)設(shè)的標(biāo)識(shí)符時(shí),根據(jù)劃分出的一個(gè)或多個(gè)音節(jié)字符串與候選字的映射關(guān)系,輸出多個(gè)音節(jié)字符串對(duì)應(yīng)的候選字。本發(fā)明在接收到輸入的拼音字符串時(shí),將其劃分為一個(gè)或多個(gè)音節(jié)字符串,根據(jù)多個(gè)音節(jié)字符串與候選字的映射關(guān)系,輸出多個(gè)音節(jié)字符串對(duì)應(yīng)的候選字,從而實(shí)現(xiàn)了漢字的輸入,提高了漢字的輸入效率和用戶體驗(yàn)。
文檔編號(hào)G06F3/023GK102736741SQ20111009119
公開日2012年10月17日 申請(qǐng)日期2011年4月12日 優(yōu)先權(quán)日2011年4月12日
發(fā)明者張會(huì)鵬, 張藝弘 申請(qǐng)人:騰訊科技(深圳)有限公司