本發(fā)明涉及文字輸入
技術(shù)領(lǐng)域:
,尤其涉及一種基于人工智能的基于人工智能的文字輸入方法和裝置。
背景技術(shù):
:人工智能(ArtificialIntelligence),英文縮寫為AI。它是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機(jī)器,該領(lǐng)域的研究包括機(jī)器人、語音識(shí)別、圖像識(shí)別、自然語言處理和專家系統(tǒng)等。輸入法是一種常用的文字輸入裝置,在各類輸入法中,基于拼音的輸入法應(yīng)用最為廣泛。但由于漢字的特殊性,同樣的一個(gè)發(fā)音會(huì)有對(duì)應(yīng)的多個(gè)單字,如何能夠根據(jù)用戶所輸入的拼音,準(zhǔn)確地確定出用戶所需的字,也就是提高輸入的準(zhǔn)確性是亟待解決的問題。技術(shù)實(shí)現(xiàn)要素:本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。為此,本發(fā)明的第一個(gè)目的在于提出一種基于人工智能的基于人工智能的文字輸入方法,以提高拼音輸入法的輸入準(zhǔn)確性。本發(fā)明的第二個(gè)目的在于提出一種基于人工智能的基于人工智能的文字輸入裝置。本發(fā)明的第三個(gè)目的在于提出另一種基于人工智能的基于人工智能的文字輸入裝置。本發(fā)明的第四個(gè)目的在于提出一種非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。本發(fā)明的第五個(gè)目的在于提出一種計(jì)算機(jī)程序產(chǎn)品。為達(dá)上述目的,本發(fā)明第一方面實(shí)施例提出了一種基于人工智能的基于人工智能的文字輸入方法,包括:將用戶所輸入的拼音序列輸入聲學(xué)模型,得到候選文本,以及候選文本中每一個(gè)字的聲學(xué)概率;針對(duì)所述候選文本,按照字的方式進(jìn)行擴(kuò)展,得到字組成的序列;在由每一個(gè)字對(duì)應(yīng)的字狀態(tài)所確定出的所述候選文本對(duì)應(yīng)字狀態(tài)序列中,基于字狀態(tài)的語言模型進(jìn)行預(yù)測,確定所述候選文本中各個(gè)字的語言概率;根據(jù)所述候選文本中各個(gè)字的所述語言概率和所述聲學(xué)概率,從所述候選文本中選出目標(biāo)文本進(jìn)行輸出。本發(fā)明實(shí)施例的基于人工智能的基于人工智能的文字輸入方法,通過將用戶所輸入的拼音序列輸入聲學(xué)模型,得到候選文本以及其聲學(xué)概率之后,針對(duì)候選文本,按照字的方式進(jìn)行擴(kuò)展,得到字組成的序列,進(jìn)而在由每一個(gè)字對(duì)應(yīng)的字狀態(tài)所確定出的所述候選文本對(duì)應(yīng)字狀態(tài)序列中,基于字狀態(tài)的語言模型進(jìn)行預(yù)測,確定候選文本中各個(gè)字的語言概率,最后根據(jù)所述候選文本中各個(gè)字的所述語言概率和所述聲學(xué)概率,從所述候選文本中選出目標(biāo)文本進(jìn)行輸出,由于綜合利用了聲學(xué)模型以及語言模型確定目標(biāo)文本,增大了目標(biāo)文本為用戶所需輸入文本的可能性,解決現(xiàn)有技術(shù)中拼音輸入法的輸入準(zhǔn)確性較低的技術(shù)問題。為達(dá)上述目的,本發(fā)明第二方面實(shí)施例提出了一種基于人工智能的文字輸入裝置,包括:聲學(xué)處理模塊,用于將用戶所輸入的拼音序列輸入聲學(xué)模型,得到候選文本,以及候選文本中每一個(gè)字的聲學(xué)概率;擴(kuò)展模塊,用于針對(duì)所述候選文本,按照字的方式進(jìn)行擴(kuò)展,得到字組成的序列;語言處理模塊,用于在由每一個(gè)字對(duì)應(yīng)的字狀態(tài)所確定出的所述候選文本對(duì)應(yīng)字狀態(tài)序列中,基于字狀態(tài)的語言模型進(jìn)行預(yù)測,確定所述候選文本中各個(gè)字的語言概率;查詢模塊,用于根據(jù)所述候選文本中各個(gè)字的所述語言概率和所述聲學(xué)概率,從所述候選文本中選出目標(biāo)文本進(jìn)行輸出。本發(fā)明實(shí)施例的基于人工智能的基于人工智能的文字輸入裝置,通過將用戶所輸入的拼音序列輸入聲學(xué)模型,得到候選文本以及其聲學(xué)概率之后,針對(duì)候選文本,按照字的方式進(jìn)行擴(kuò)展,得到字組成的序列,進(jìn)而在由每一個(gè)字對(duì)應(yīng)的字狀態(tài)所確定出的所述候選文本對(duì)應(yīng)字狀態(tài)序列中,基于字狀態(tài)的語言模型進(jìn)行預(yù)測,確定候選文本中各個(gè)字的語言概率,最后根據(jù)所述候選文本中各個(gè)字的所述語言概率和所述聲學(xué)概率,從所述候選文本中選出目標(biāo)文本進(jìn)行輸出,由于綜合利用了聲學(xué)模型以及語言模型確定目標(biāo)文本,增大了目標(biāo)文本為用戶所需輸入文本的可能性,解決現(xiàn)有技術(shù)中拼音輸入法的輸入準(zhǔn)確性較低的技術(shù)問題。為達(dá)上述目的,本發(fā)明第三方面實(shí)施例提出了另一種基于人工智能的文字輸入裝置,包括:處理器;用于存儲(chǔ)所述處理器可執(zhí)行指令的存儲(chǔ)器;其中,所述處理器被配置為:將用戶所輸入的拼音序列輸入聲學(xué)模型,得到候選文本,以及候選文本中每一個(gè)字的聲學(xué)概率;針對(duì)所述候選文本,按照字的方式進(jìn)行擴(kuò)展,得到字組成的序列;在由每一個(gè)字對(duì)應(yīng)的字狀態(tài)所確定出的所述候選文本對(duì)應(yīng)字狀態(tài)序列中,基于字狀態(tài)的語言模型進(jìn)行預(yù)測,確定所述候選文本中各個(gè)字的語言概率;根據(jù)所述候選文本中各個(gè)字的所述語言概率和所述聲學(xué)概率,從所述候選文本中選出目標(biāo)文本進(jìn)行輸出。為了實(shí)現(xiàn)上述目的,本發(fā)明第四方面實(shí)施例提出了一種非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),當(dāng)所述存儲(chǔ)介質(zhì)中的指令由客戶端的處理器被執(zhí)行時(shí),使得客戶端能夠執(zhí)行一種基于人工智能的文字輸入方法,所述方法包括:將用戶所輸入的拼音序列輸入聲學(xué)模型,得到候選文本,以及候選文本中每一個(gè)字的聲學(xué)概率;針對(duì)所述候選文本,按照字的方式進(jìn)行擴(kuò)展,得到字組成的序列;在由每一個(gè)字對(duì)應(yīng)的字狀態(tài)所確定出的所述候選文本對(duì)應(yīng)字狀態(tài)序列中,基于字狀態(tài)的語言模型進(jìn)行預(yù)測,確定所述候選文本中各個(gè)字的語言概率;根據(jù)所述候選文本中各個(gè)字的所述語言概率和所述聲學(xué)概率,從所述候選文本中選出目標(biāo)文本進(jìn)行輸出。為了實(shí)現(xiàn)上述目的,本發(fā)明第五方面實(shí)施例提出了一種計(jì)算機(jī)程序產(chǎn)品,當(dāng)所述計(jì)算機(jī)程序產(chǎn)品中的指令處理器執(zhí)行時(shí),執(zhí)行一種基于人工智能的文字輸入方法,所述方法包括:將用戶所輸入的拼音序列輸入聲學(xué)模型,得到候選文本,以及候選文本中每一個(gè)字的聲學(xué)概率;針對(duì)所述候選文本,按照字的方式進(jìn)行擴(kuò)展,得到字組成的序列;在由每一個(gè)字對(duì)應(yīng)的字狀態(tài)所確定出的所述候選文本對(duì)應(yīng)字狀態(tài)序列中,基于字狀態(tài)的語言模型進(jìn)行預(yù)測,確定所述候選文本中各個(gè)字的語言概率;根據(jù)所述候選文本中各個(gè)字的所述語言概率和所述聲學(xué)概率,從所述候選文本中選出目標(biāo)文本進(jìn)行輸出。本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實(shí)踐了解到。附圖說明本發(fā)明上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:圖1為本發(fā)明實(shí)施例所提供的一種基于人工智能的文字輸入方法的流程示意圖;圖2為本發(fā)明實(shí)施例提供的另一種基于人工智能的文字輸入方法的流程示意圖;圖3為單字構(gòu)圖的示意圖;圖4為本發(fā)明實(shí)施例提供的一種基于人工智能的文字輸入裝置的結(jié)構(gòu)示意圖;以及圖5為本發(fā)明實(shí)施例提供的另一種基于人工智能的文字輸入裝置的結(jié)構(gòu)示意圖。具體實(shí)施方式下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實(shí)施例是示例性的,旨在用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。下面參考附圖描述本發(fā)明實(shí)施例的基于人工智能的文字輸入方法和裝置。圖1為本發(fā)明實(shí)施例所提供的一種基于人工智能的文字輸入方法的流程示意圖。如圖1所示,該基于人工智能的文字輸入方法包括以下步驟:步驟101,將用戶所輸入的拼音序列輸入聲學(xué)模型,得到候選文本,以及候選文本中每一個(gè)字的聲學(xué)概率。具體地,將用戶所輸入的拼音序列輸入經(jīng)過訓(xùn)練的聲學(xué)模型,預(yù)測所述拼音序列所拼讀的各語音,以及拼讀各語音的聲學(xué)概率;根據(jù)預(yù)設(shè)字典,查詢發(fā)音符合所述各語音的字;按照各個(gè)字的拼音在所述拼音序列中出現(xiàn)的先后順序,由所查詢到的字組合成所述候選文本。其中,候選文本中每一個(gè)字的聲學(xué)概率是根據(jù)該字的語音的聲學(xué)概率獲得的。步驟102,針對(duì)所述候選文本,按照字的方式進(jìn)行擴(kuò)展,得到字組成的序列。具體地,針對(duì)所述候選文本,以每一個(gè)字作為一個(gè)元素進(jìn)行劃分,得到字組成的序列。步驟103,在由每一個(gè)字對(duì)應(yīng)的字狀態(tài)所確定出的所述候選文本對(duì)應(yīng)字狀態(tài)序列中,基于字狀態(tài)的語言模型進(jìn)行預(yù)測,確定所述候選文本中各個(gè)字的語言概率。具體地,根據(jù)預(yù)先確定的字與字狀態(tài)之間的對(duì)應(yīng)關(guān)系,查詢所述候選文本中每一個(gè)字對(duì)應(yīng)的字狀態(tài),得到所述候選文本對(duì)應(yīng)的字狀態(tài)序列;將所述字狀態(tài)序列,輸入所述基于字狀態(tài)的語言模型,以預(yù)測所述候選文本中各個(gè)字與在所述字之前出現(xiàn)的字組合后,形成通順短語的語言概率。步驟104,根據(jù)候選文本中各個(gè)字的語言概率和聲學(xué)概率,從候選文本中選出目標(biāo)文本進(jìn)行輸出。具體地,將候選文本中的各個(gè)字分別對(duì)應(yīng)一條查詢路徑的起點(diǎn),獲得各個(gè)查詢路徑;針對(duì)每一條查詢路徑,將候選文本中,在起點(diǎn)對(duì)應(yīng)的字之后出現(xiàn)的字,依次作為查詢路徑的當(dāng)前節(jié)點(diǎn),根據(jù)語言概率和所述聲學(xué)概率,計(jì)算從查詢路徑的起點(diǎn)開始至當(dāng)前節(jié)點(diǎn)的總概率;若從查詢路徑的起點(diǎn)開始至當(dāng)前節(jié)點(diǎn)的總概率低于預(yù)設(shè)閾值,則篩選掉所述查詢路徑;根據(jù)篩選保留的查詢路徑,確定目標(biāo)文本。本實(shí)施例中,通過將用戶所輸入的拼音序列輸入聲學(xué)模型,得到候選文本以及其聲學(xué)概率之后,針對(duì)候選文本,按照字的方式進(jìn)行擴(kuò)展,得到字組成的序列,進(jìn)而在由每一個(gè)字對(duì)應(yīng)的字狀態(tài)所確定出的所述候選文本對(duì)應(yīng)字狀態(tài)序列中,基于字狀態(tài)的語言模型進(jìn)行預(yù)測,確定候選文本中各個(gè)字的語言概率,最后根據(jù)所述候選文本中各個(gè)字的所述語言概率和所述聲學(xué)概率,從所述候選文本中選出目標(biāo)文本進(jìn)行輸出,由于綜合利用了聲學(xué)模型以及語言模型確定目標(biāo)文本,增大了目標(biāo)文本為用戶所需輸入文本的可能性,解決現(xiàn)有技術(shù)中拼音輸入法的輸入準(zhǔn)確性較低的技術(shù)問題。為了清楚說明上一實(shí)施例,本發(fā)明還提供了另一種基于人工智能的文字輸入方法,圖2為本發(fā)明實(shí)施例提供的另一種基于人工智能的文字輸入方法的流程示意圖,可以用于拼音輸入法,如圖2所示,包括:步驟201,將用戶所輸入的拼音序列輸入聲學(xué)模型,得到候選文本,以及候選文本中每一個(gè)字的聲學(xué)概率,針對(duì)該候選文本,按照字的方式進(jìn)行擴(kuò)展,得到字組成的序列。例如:用戶輸入“woyaoqubaidukejiyuan”由于用戶在進(jìn)行輸入時(shí),是不需要在不同字的拼音之間進(jìn)行斷句的,因此,需要基于聲學(xué)模型,預(yù)測用戶所需拼讀的各語音,以“wo”為例,可以預(yù)測用戶所需拼讀的語音為“我”,還有可能為“w”和“o”作為首字母的兩個(gè)字組成的短語。并查詢?cè)~典,根據(jù)預(yù)測的語音確定發(fā)音與之相符的字或詞,作為候選文本。作為一種可能的結(jié)果,將用戶所輸入的拼音序列輸入聲學(xué)模型之后,可以得到候選文本“我要去百度科技園”。在實(shí)際模型中,一般會(huì)針對(duì)預(yù)測的一個(gè)發(fā)音,選擇10-20個(gè)發(fā)音與之相符的字添加到候選文本中,所以實(shí)際上候選文本中會(huì)包含大量的字,并且字之間存在先后順序,字之間的順序是按照對(duì)應(yīng)的拼音在拼音序列中出現(xiàn)的先后順序所確定的。步驟202,針對(duì)候選文本,按照字的方式進(jìn)行擴(kuò)展,得到字組成的序列。例如:針對(duì)上一步驟中所獲得的候選文本“我要去百度科技園”,每一個(gè)詞擴(kuò)展成單字組成的序列,即{我,要,去,百,度,科,技,園}。步驟203,根據(jù)字和字狀態(tài)之間的對(duì)應(yīng)關(guān)系查詢候選文本中每一個(gè)字對(duì)應(yīng)的字狀態(tài),得到候選文本對(duì)應(yīng)的字狀態(tài)序列。隱馬爾科夫模型(HMM)是通過在所有可能的HMM狀態(tài)跳轉(zhuǎn)序列中找出最優(yōu)的跳轉(zhuǎn)序列,將其對(duì)應(yīng)的文本信息作為最終的識(shí)別結(jié)果。而解碼網(wǎng)絡(luò)描述所有可能的HMM狀態(tài)跳轉(zhuǎn),我們的目的就是在解碼網(wǎng)絡(luò)上搜尋最佳跳轉(zhuǎn)狀態(tài)序列,搜尋過程中,HMM狀態(tài)跳轉(zhuǎn)的序列被稱為路徑,最終得到的結(jié)果也是解碼網(wǎng)絡(luò)所能描述的所有可能路徑中的一種。具體地,在現(xiàn)有技術(shù)中,HMM中的狀態(tài)是音素狀態(tài),也就是說,僅有音素(tri-phone)到音素狀態(tài)(tri-state)之間的映射,本實(shí)施例中的HMM采用了字和字狀態(tài)之間的映射,其中,用state表示字狀態(tài)。例如:可以將字序列中每一個(gè)字采用一個(gè)字符替換進(jìn)行解碼,具體來說{我,要,去,百,度,科,技,園}可以替換為字符序列{a,b,c,d,e,f,x,y},其中,可以用phone表示字符序列中的字符,也就是對(duì)應(yīng)一個(gè)單字。需要說明的是,在字符序列中還可以包括“<s>”、“<s\>”等輔助標(biāo)識(shí),如標(biāo)識(shí)起始和結(jié)尾的字符。根據(jù)下表的示例可見,字符與phone之間存在對(duì)應(yīng)的關(guān)系,也就是用phone對(duì)應(yīng)單字。<s>(01)D$[wb]<s\>(01)D$[wb]abcdefphone1[wb]phone2phone3phone4phone5phone6[wb]abdefphone1[wb]phone2phone4phone5phone6[wb]bdefphone2[wb]phone4phone5phone6phone7[wb]xyzphone24[wb]phone25phone26[wb]xyphone24[wb]phone25[wb]表1phone的示例根據(jù)如下表所示的phone和state之間的映射關(guān)系,確定出字狀態(tài)序列。D$0phone11phone22phone33…………phone59815981表2phone和state之間的映射關(guān)系步驟204,將字狀態(tài)序列,輸入基于字狀態(tài)的語言模型,以預(yù)測候選文本中各個(gè)字與在所述字之前出現(xiàn)的字組合后,形成通順短語的語言概率。步驟205,根據(jù)候選文本中各個(gè)字的所述語言概率和所述聲學(xué)概率,從所述候選文本中選出目標(biāo)文本進(jìn)行輸出。具體來說,首先,將所述候選文本中的各個(gè)字分別對(duì)應(yīng)一條查詢路徑的起點(diǎn),獲得各個(gè)查詢路徑。進(jìn)而,針對(duì)每一條查詢路徑,將所述候選文本中,在所述起點(diǎn)對(duì)應(yīng)的字之后出現(xiàn)的字,依次作為所述查詢路徑的當(dāng)前節(jié)點(diǎn),根據(jù)所述語言概率和所述聲學(xué)概率,計(jì)算從所述查詢路徑的起點(diǎn)開始至當(dāng)前節(jié)點(diǎn)的總概率,若從所述查詢路徑的起點(diǎn)開始至當(dāng)前節(jié)點(diǎn)的總概率低于預(yù)設(shè)閾值,則篩選掉所述查詢路徑。其中,總概率是根據(jù)各節(jié)點(diǎn)對(duì)應(yīng)字的所述語言概率和所述聲學(xué)概率進(jìn)行加權(quán),獲得字的概率之后,對(duì)各個(gè)字的概率進(jìn)行求和所獲得的。最后,根據(jù)篩選保留的查詢路徑,確定目標(biāo)文本??蛇x地,作為一種可能的實(shí)現(xiàn)方式,可以對(duì)至少兩條查詢路徑進(jìn)行合并,得到查詢路徑的公共部分,根據(jù)所述公共部分中各節(jié)點(diǎn)對(duì)應(yīng)字,確定目標(biāo)文本。例如,圖3為單字構(gòu)圖的示意圖,在圖3中將字符序列{a,b,c,d,e,f}拆分之后,從中選取一部分單字,每一個(gè)節(jié)點(diǎn)對(duì)應(yīng)一個(gè)單字的字符作為查詢路徑的起點(diǎn)。針對(duì)每一條路徑按照單字的先后順序,查詢接續(xù)在前一個(gè)節(jié)點(diǎn)之后的當(dāng)前節(jié)點(diǎn),使得查詢路徑的起點(diǎn)開始至當(dāng)前節(jié)點(diǎn)的總概率最大化。并且,為了減少不必要的計(jì)算,可以在查詢路徑每確定一個(gè)節(jié)點(diǎn)之后,判斷總概率是否低于閾值,篩選掉低于閾值的查詢路徑。最后,保留高于閾值的各查詢路徑,分別采用前向合并和后向合并的方式進(jìn)行合并處理,以得到最終輸出的目標(biāo)文本。需要說明的是,圖3中“nodeid”表示這個(gè)節(jié)點(diǎn)在圖中的標(biāo)號(hào),“state”、“we”、“towe”、“null”、“stop”等表示的是這個(gè)節(jié)點(diǎn)的性質(zhì)。圖中弧線上的標(biāo)號(hào),如果為“id:label”這種形式,表示的是單字組成短語的標(biāo)號(hào)和對(duì)應(yīng)的短語;如果只是一個(gè)“id”,那么表示的是字狀態(tài)的標(biāo)號(hào)。本實(shí)施例中,通過將用戶所輸入的拼音序列輸入聲學(xué)模型,得到候選文本以及其聲學(xué)概率之后,針對(duì)候選文本,按照字的方式進(jìn)行擴(kuò)展,得到字組成的序列,進(jìn)而在由每一個(gè)字對(duì)應(yīng)的字狀態(tài)所確定出的所述候選文本對(duì)應(yīng)字狀態(tài)序列中,基于字狀態(tài)的語言模型進(jìn)行預(yù)測,確定候選文本中各個(gè)字的語言概率,最后根據(jù)所述候選文本中各個(gè)字的所述語言概率和所述聲學(xué)概率,從所述候選文本中選出目標(biāo)文本進(jìn)行輸出,由于綜合利用了聲學(xué)模型以及語言模型確定目標(biāo)文本,增大了目標(biāo)文本為用戶所需輸入文本的可能性,解決現(xiàn)有技術(shù)中拼音輸入法的輸入準(zhǔn)確性較低的技術(shù)問題。為了實(shí)現(xiàn)上述實(shí)施例,本發(fā)明還提出一種基于人工智能的文字輸入裝置。圖4為本發(fā)明實(shí)施例提供的一種基于人工智能的文字輸入裝置的結(jié)構(gòu)示意圖。如圖4所示,該基于人工智能的文字輸入裝置包括:聲學(xué)處理模塊41、擴(kuò)展模塊42、語言處理模塊43和查詢模塊44。聲學(xué)處理模塊41,用于將用戶所輸入的拼音序列輸入聲學(xué)模型,得到候選文本,以及候選文本中每一個(gè)字的聲學(xué)概率。擴(kuò)展模塊42,用于針對(duì)所述候選文本,按照字的方式進(jìn)行擴(kuò)展,得到字組成的序列。具體地,擴(kuò)展模塊42,具體用于:針對(duì)所述候選文本,以每一個(gè)字作為一個(gè)元素進(jìn)行劃分,得到字組成的序列。語言處理模塊43,用于在由每一個(gè)字對(duì)應(yīng)的字狀態(tài)所確定出的所述候選文本對(duì)應(yīng)字狀態(tài)序列中,基于字狀態(tài)的語言模型進(jìn)行預(yù)測,確定所述候選文本中各個(gè)字的語言概率。查詢模塊44,用于根據(jù)所述候選文本中各個(gè)字的所述語言概率和所述聲學(xué)概率,從所述候選文本中選出目標(biāo)文本進(jìn)行輸出。需要說明的是,前述對(duì)方法實(shí)施例的解釋說明也適用于該實(shí)施例的裝置,此處不再贅述。基于上述實(shí)施例,本發(fā)明實(shí)施例還提供了一種基于人工智能的文字輸入裝置的可能的實(shí)現(xiàn)方式,圖5為本發(fā)明實(shí)施例提供的另一種基于人工智能的文字輸入裝置的結(jié)構(gòu)示意圖。在上一實(shí)施例的基礎(chǔ)上,如圖5所示,基于人工智能的文字輸入裝置中的查詢模塊44,包括:確定單元441、計(jì)算單元442、篩選單元443和處理單元444。確定單元441,用于將所述候選文本中的各個(gè)字分別對(duì)應(yīng)一條查詢路徑的起點(diǎn),獲得各個(gè)查詢路徑。計(jì)算單元442,用于針對(duì)每一條查詢路徑,將所述候選文本中,在所述起點(diǎn)對(duì)應(yīng)的字之后出現(xiàn)的字,依次作為所述查詢路徑的當(dāng)前節(jié)點(diǎn),根據(jù)所述語言概率和所述聲學(xué)概率,計(jì)算從所述查詢路徑的起點(diǎn)開始至當(dāng)前節(jié)點(diǎn)的總概率。其中,總概率是根據(jù)各節(jié)點(diǎn)對(duì)應(yīng)字的所述語言概率和所述聲學(xué)概率進(jìn)行加權(quán),獲得字的概率之后,對(duì)各個(gè)字的概率進(jìn)行求和所獲得的。篩選單元443,用于若從所述查詢路徑的起點(diǎn)開始至當(dāng)前節(jié)點(diǎn)的總概率低于預(yù)設(shè)閾值,則篩選掉所述查詢路徑。處理單元444,用于根據(jù)篩選保留的查詢路徑,確定所述目標(biāo)文本。進(jìn)一步,作為一種可能的實(shí)現(xiàn)方式,處理單元444,具體用于對(duì)至少兩條查詢路徑采用前向和/或后向方式進(jìn)行合并,獲得所述至少兩條查詢路徑中的公共部分;根據(jù)所述公共部分中各節(jié)點(diǎn)對(duì)應(yīng)字,確定所述目標(biāo)文本。進(jìn)一步,聲學(xué)處理模塊41,包括:預(yù)測單元411、查詢單元412和生成單元413。預(yù)測單元411,用于將用戶所輸入的拼音序列輸入經(jīng)過訓(xùn)練的聲學(xué)模型,預(yù)測所述拼音序列所拼讀的各語音,以及拼讀各語音的聲學(xué)概率。查詢單元412,用于根據(jù)預(yù)設(shè)字典,查詢發(fā)音符合所述各語音的字。生成單元413,用于按照各個(gè)字的拼音在所述拼音序列中出現(xiàn)的先后順序,由所查詢到的字組合成所述候選文本。其中,所述候選文本中每一個(gè)字的聲學(xué)概率是根據(jù)所述字的語音的聲學(xué)概率獲得的。進(jìn)一步,語言處理模塊43,包括:狀態(tài)確定單元431和概率計(jì)算單元432。狀態(tài)確定單元431,用于根據(jù)預(yù)先確定的字與字狀態(tài)之間的對(duì)應(yīng)關(guān)系,查詢所述候選文本中每一個(gè)字對(duì)應(yīng)的字狀態(tài),得到所述候選文本對(duì)應(yīng)的字狀態(tài)序列。概率計(jì)算單元432,用于將所述字狀態(tài)序列,輸入所述基于字狀態(tài)的語言模型,以預(yù)測所述候選文本中各個(gè)字與在所述字之前出現(xiàn)的字組合后,形成通順短語的語言概率。本發(fā)明實(shí)施例中,通過將用戶所輸入的拼音序列輸入聲學(xué)模型,得到候選文本以及其聲學(xué)概率之后,針對(duì)候選文本,按照字的方式進(jìn)行擴(kuò)展,得到字組成的序列,進(jìn)而在由每一個(gè)字對(duì)應(yīng)的字狀態(tài)所確定出的所述候選文本對(duì)應(yīng)字狀態(tài)序列中,基于字狀態(tài)的語言模型進(jìn)行預(yù)測,確定候選文本中各個(gè)字的語言概率,最后根據(jù)所述候選文本中各個(gè)字的所述語言概率和所述聲學(xué)概率,從所述候選文本中選出目標(biāo)文本進(jìn)行輸出,由于綜合利用了聲學(xué)模型以及語言模型確定目標(biāo)文本,增大了目標(biāo)文本為用戶所需輸入文本的可能性,解決現(xiàn)有技術(shù)中拼音輸入法的輸入準(zhǔn)確性較低的技術(shù)問題。為了實(shí)現(xiàn)上述實(shí)施例,本發(fā)明還提出另一種基于人工智能的文字輸入裝置,包括:處理器,以及用于存儲(chǔ)所述處理器可執(zhí)行指令的存儲(chǔ)器。其中,處理器被配置為:將用戶所輸入的拼音序列輸入聲學(xué)模型,得到候選文本,以及候選文本中每一個(gè)字的聲學(xué)概率;針對(duì)所述候選文本,按照字的方式進(jìn)行擴(kuò)展,得到字組成的序列;在由每一個(gè)字對(duì)應(yīng)的字狀態(tài)所確定出的所述候選文本對(duì)應(yīng)字狀態(tài)序列中,基于字狀態(tài)的語言模型進(jìn)行預(yù)測,確定所述候選文本中各個(gè)字的語言概率;根據(jù)所述候選文本中各個(gè)字的所述語言概率和所述聲學(xué)概率,從所述候選文本中選出目標(biāo)文本進(jìn)行輸出。為了實(shí)現(xiàn)上述實(shí)施例,本發(fā)明還提出一種非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),當(dāng)所述存儲(chǔ)介質(zhì)中的指令由客戶端的處理器被執(zhí)行時(shí),使得客戶端能夠執(zhí)行一種基于人工智能的文字輸入方法,所述方法包括:將用戶所輸入的拼音序列輸入聲學(xué)模型,得到候選文本,以及候選文本中每一個(gè)字的聲學(xué)概率;針對(duì)所述候選文本,按照字的方式進(jìn)行擴(kuò)展,得到字組成的序列;在由每一個(gè)字對(duì)應(yīng)的字狀態(tài)所確定出的所述候選文本對(duì)應(yīng)字狀態(tài)序列中,基于字狀態(tài)的語言模型進(jìn)行預(yù)測,確定所述候選文本中各個(gè)字的語言概率;根據(jù)所述候選文本中各個(gè)字的所述語言概率和所述聲學(xué)概率,從所述候選文本中選出目標(biāo)文本進(jìn)行輸出。為了實(shí)現(xiàn)上述實(shí)施例,本發(fā)明還提出一種計(jì)算機(jī)程序產(chǎn)品,當(dāng)所述計(jì)算機(jī)程序產(chǎn)品中的指令處理器執(zhí)行時(shí),執(zhí)行一種基于人工智能的文字輸入方法,所述方法包括:將用戶所輸入的拼音序列輸入聲學(xué)模型,得到候選文本,以及候選文本中每一個(gè)字的聲學(xué)概率;針對(duì)所述候選文本,按照字的方式進(jìn)行擴(kuò)展,得到字組成的序列;在由每一個(gè)字對(duì)應(yīng)的字狀態(tài)所確定出的所述候選文本對(duì)應(yīng)字狀態(tài)序列中,基于字狀態(tài)的語言模型進(jìn)行預(yù)測,確定所述候選文本中各個(gè)字的語言概率;根據(jù)所述候選文本中各個(gè)字的所述語言概率和所述聲學(xué)概率,從所述候選文本中選出目標(biāo)文本進(jìn)行輸出。在本說明書的描述中,參考術(shù)語“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說明書中,對(duì)上述術(shù)語的示意性表述不必須針對(duì)的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。此外,在不相互矛盾的情況下,本領(lǐng)域的技術(shù)人員可以將本說明書中描述的不同實(shí)施例或示例以及不同實(shí)施例或示例的特征進(jìn)行結(jié)合和組合。此外,術(shù)語“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對(duì)重要性或者隱含指明所指示的技術(shù)特征的數(shù)量。由此,限定有“第一”、“第二”的特征可以明示或者隱含地包括至少一個(gè)該特征。在本發(fā)明的描述中,“多個(gè)”的含義是至少兩個(gè),例如兩個(gè),三個(gè)等,除非另有明確具體的限定。流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個(gè)或更多個(gè)用于實(shí)現(xiàn)定制邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的優(yōu)選實(shí)施方式的范圍包括另外的實(shí)現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時(shí)的方式或按相反的順序,來執(zhí)行功能,這應(yīng)被本發(fā)明的實(shí)施例所屬
技術(shù)領(lǐng)域:
的技術(shù)人員所理解。在流程圖中表示或在此以其他方式描述的邏輯和/或步驟,例如,可以被認(rèn)為是用于實(shí)現(xiàn)邏輯功能的可執(zhí)行指令的定序列表,可以具體實(shí)現(xiàn)在任何計(jì)算機(jī)可讀介質(zhì)中,以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備(如基于計(jì)算機(jī)的系統(tǒng)、包括處理器的系統(tǒng)或其他可以從指令執(zhí)行系統(tǒng)、裝置或設(shè)備取指令并執(zhí)行指令的系統(tǒng))使用,或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用。就本說明書而言,"計(jì)算機(jī)可讀介質(zhì)"可以是任何可以包含、存儲(chǔ)、通信、傳播或傳輸程序以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用的裝置。計(jì)算機(jī)可讀介質(zhì)的更具體的示例(非窮盡性列表)包括以下:具有一個(gè)或多個(gè)布線的電連接部(電子裝置),便攜式計(jì)算機(jī)盤盒(磁裝置),隨機(jī)存取存儲(chǔ)器(RAM),只讀存儲(chǔ)器(ROM),可擦除可編輯只讀存儲(chǔ)器(EPROM或閃速存儲(chǔ)器),光纖裝置,以及便攜式光盤只讀存儲(chǔ)器(CDROM)。另外,計(jì)算機(jī)可讀介質(zhì)甚至可以是可在其上打印所述程序的紙或其他合適的介質(zhì),因?yàn)榭梢岳缤ㄟ^對(duì)紙或其他介質(zhì)進(jìn)行光學(xué)掃描,接著進(jìn)行編輯、解譯或必要時(shí)以其他合適方式進(jìn)行處理來以電子方式獲得所述程序,然后將其存儲(chǔ)在計(jì)算機(jī)存儲(chǔ)器中。應(yīng)當(dāng)理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來實(shí)現(xiàn)。在上述實(shí)施方式中,多個(gè)步驟或方法可以用存儲(chǔ)在存儲(chǔ)器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實(shí)現(xiàn)。如,如果用硬件來實(shí)現(xiàn)和在另一實(shí)施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來實(shí)現(xiàn):具有用于對(duì)數(shù)據(jù)信號(hào)實(shí)現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(PGA),現(xiàn)場可編程門陣列(FPGA)等。本
技術(shù)領(lǐng)域:
的普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法攜帶的全部或部分步驟是可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),包括方法實(shí)施例的步驟之一或其組合。此外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理模塊中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),也可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤或光盤等。盡管上面已經(jīng)示出和描述了本發(fā)明的實(shí)施例,可以理解的是,上述實(shí)施例是示例性的,不能理解為對(duì)本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可以對(duì)上述實(shí)施例進(jìn)行變化、修改、替換和變型。當(dāng)前第1頁1 2 3