一種信息處理方法和移動終端的制作方法
【專利摘要】本發(fā)明提供一種信息處理方法和移動終端,該方法包括:接收到語音信息后,將所述語音信息轉(zhuǎn)換成文本信息,對所述文本信息進(jìn)行分析,生成格表示;將所述格表示與預(yù)存的知識庫中的格表示進(jìn)行匹配,如匹配成功,則將所述格表示生成對應(yīng)的操控指令。本發(fā)明在語音應(yīng)用方面,通過語音識別技術(shù)可以將人說的一句話轉(zhuǎn)化為文本信息,用格文法這一語句的句法分析和語義分析組合起來的關(guān)鍵技術(shù),進(jìn)行移動終端任務(wù)領(lǐng)域的自然語言理解分析,以達(dá)到讓移動終端理解用戶的操控意圖的目的。
【專利說明】一種信息處理方法和移動終端
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及移動通訊領(lǐng)域,特別是涉及一種信息處理方法和移動終端。
【背景技術(shù)】
[0002]格文法的特點(diǎn)是許以動詞為中心構(gòu)造分析結(jié)果,盡管文法規(guī)則只描述句法,但分析結(jié)果產(chǎn)生的結(jié)構(gòu)卻相應(yīng)于語義關(guān)系,而非嚴(yán)格的句法關(guān)系。例如英語句子:
[0003]Mary hit Bill.的格文法分析結(jié)果可表示為:
[0004]Hit(Agent Mary)(Dative Bill)
[0005]這種表示結(jié)構(gòu)稱為格表示。在格表示中,一個語句包含的名詞詞組和介詞詞組均以它們與句子中動詞的關(guān)系來表示,稱為格。上例中的Agent和Dat ive均是格,而像"(Agent Mary)"這樣的基本表示則稱為格結(jié)構(gòu)。格表示易于以語義網(wǎng)絡(luò)表示法描述,從而多個句子的格表示相互關(guān)聯(lián)而形成大的語義網(wǎng)絡(luò),以便開發(fā)句子間的關(guān)系,理解多句構(gòu)成的上下文,并用于回答問題。究竟要定義哪些格才合適,目前并無一致的意見,因此格文法的可擴(kuò)展性很強(qiáng),可以列舉一些常見的格:
[0006].Agent—動作主體,.Dative—動作給與的對象,
[0007].Locative—事件發(fā)生的地點(diǎn),.Goal—終點(diǎn),目的地,
[0008].Time—事件發(fā)生的地點(diǎn),.Instrument—動作實(shí)施的工具或手段,
[0009].Factitive—事件中主體使役的對象,.Source—物體移動的起點(diǎn),
[0010].Beneficiary—事件中的受益者,.0bject—動作的施加對象。
[0011]自然語言文法本身也有格概念,例如,英語中的"I"為主格,"me"為賓格,但并不像格文法那樣具有健全的格定義,以至于可完全用格來分析句子。為了作區(qū)分,稱自然語言文法中的格為文法格(或淺格),而格文法中定義的格為語義格(或深格)。語義格的定義使語句的分析結(jié)果一格表示包含了大量語義信息,從而成為有效的語義分析方法。
[0012]詞法分析,是計算機(jī)科學(xué)中將字符序列轉(zhuǎn)換為單詞序列的過程。進(jìn)行詞法分析的程序或者函數(shù)稱為詞法分析器,也叫掃描器。詞法分析器一般以函數(shù)的形式存在,供語法分析器調(diào)用。
[0013]句法分析,句法分析由專門設(shè)計的分析器進(jìn)行,基于詞法分析器的結(jié)果分析器依賴自然語言遵從的文法(語法)分析輸入的句子,并把每個合法句轉(zhuǎn)變?yōu)橐活w分析樹。
[0014]目前,普通的手機(jī)并不能夠主動理解用戶的操控意圖。
【發(fā)明內(nèi)容】
[0015]本發(fā)明要解決的技術(shù)問題是提供一種信息處理方法和移動終端,用格文法這一語句的句法分析和語義分析組合起來的關(guān)鍵技術(shù),進(jìn)行移動終端任務(wù)領(lǐng)域的自然語言理解分析,以達(dá)到讓移動終端理解用戶的操控意圖的目的。
[0016]為了解決上述技術(shù)問題,本發(fā)明提供了一種信息處理方法,包括:
[0017]接收到語音信息后,將所述語音信息轉(zhuǎn)換成文本信息,對所述文本信息進(jìn)行分析,生成格表示;
[0018]將所述格表示與預(yù)存的知識庫中的格表示進(jìn)行匹配,如匹配成功,則將所述格表示生成對應(yīng)的操控指令。
[0019]進(jìn)一步地,上述方法還具有下面特點(diǎn):對所述文本信息進(jìn)行分析,生成格表示包括:
[0020]對所述文本信息進(jìn)行句法分析,標(biāo)注出中心動詞和語義格;
[0021]將所述文本信息的中內(nèi)容填充到對應(yīng)的語義格中,生成格表示。
[0022]進(jìn)一步地,上述方法還具有下面特點(diǎn):所述生成格表示的過程中包括:
[0023]將中心動詞和/或語義格對應(yīng)的內(nèi)容分別轉(zhuǎn)化為預(yù)定的同義語。
[0024]進(jìn)一步地,上述方法還具有下面特點(diǎn):對所述文本信息進(jìn)行分析包括:
[0025]對所述文本信息中的關(guān)鍵詞進(jìn)行分析,確立與所述關(guān)鍵詞對應(yīng)的應(yīng)用操作類型;
[0026]將所述格表示與預(yù)存的知識庫中的格表示進(jìn)行匹配,包括:
[0027]將所述格表示與預(yù)存的知識庫中與所述應(yīng)用操作類型相同類型的格表示進(jìn)行匹配。
[0028]為了解決上述問題,本發(fā)明還提供了一種移動終端,包括:
[0029]第一模塊,用于接收到語音信息后,將所述語音信息轉(zhuǎn)換成文本信息,對所述文本信息進(jìn)行分析,生成格表示;
[0030]第二模塊,用于將所述格表示與預(yù)存的知識庫中的格表示進(jìn)行匹配,如匹配成功,則將所述格表示生成對應(yīng)的操控指令。
[0031]進(jìn)一步地,上述移動終端還具有下面特點(diǎn):所述第一模塊包括:
[0032]第一單元,用于對所述文本信息進(jìn)行句法分析,標(biāo)注出中心動詞和語義格;
[0033]第二單元,用于將所述文本信息的中內(nèi)容填充到對應(yīng)的語義格中,生成格表示。
[0034]進(jìn)一步地,上述移動終端還具有下面特點(diǎn):
[0035]所述第二單元,在生成格表示的過程中具體用于,將中心動詞和/或語義格對應(yīng)的內(nèi)容分別轉(zhuǎn)化為預(yù)定的同義語。
[0036]進(jìn)一步地,上述移動終端還具有下面特點(diǎn):所述第一模塊包括,
[0037]第三單元,用于對所述語句信息中的關(guān)鍵詞進(jìn)行分析,確立與所述關(guān)鍵詞對應(yīng)的應(yīng)用操作類型;
[0038]所述第二模塊,具體用于將所述格表示與預(yù)存的知識庫中與所述應(yīng)用操作類型相同類型的格表示進(jìn)行匹配。
[0039]本發(fā)明提供一種信息處理方法和移動終端,在語音應(yīng)用方面,手機(jī)通過語音識別技術(shù)可以將人說的一句話轉(zhuǎn)化為文本信息,用格文法這一語句的句法分析和語義分析組合起來的關(guān)鍵技術(shù),進(jìn)行移動終端任務(wù)領(lǐng)域的自然語言理解分析,以達(dá)到讓移動終端理解用戶的操控意圖的目的。
【專利附圖】
【附圖說明】
[0040]圖1為本發(fā)明實(shí)施例的一種信息處理方法的流程圖;
[0041 ] 圖2為本發(fā)明實(shí)施例的句法分析好后的句法樹的示意圖;
[0042]圖3為本發(fā)明實(shí)施例的移動終端的示意圖?!揪唧w實(shí)施方式】
[0043]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,下文中將結(jié)合附圖對本發(fā)明的實(shí)施例進(jìn)行詳細(xì)說明。需要說明的是,在不沖突的情況下,本申請中的實(shí)施例及實(shí)施例中的特征可以相互任意組合。
[0044]為了更好地理解本發(fā)明,下面結(jié)合附圖和具體實(shí)施例對本發(fā)明作進(jìn)一步地描述。
[0045]圖1為本發(fā)明實(shí)施例的一種信息處理方法的流程圖,如圖1所示,本實(shí)施例的方法包括以下步驟:
[0046]S11、接收到語音信息后,將所述語音信息轉(zhuǎn)換成文本信息,對所述文本信息進(jìn)行分析,生成格表示;
[0047]S12、將所述格表示與預(yù)存的知識庫中的格表示進(jìn)行匹配,如匹配成功,則將所述格表示生成對應(yīng)的操控指令。
[0048]格文法很適合手機(jī)操控領(lǐng)域的語義分析理解階段的使用,中心動詞即為操控的核心動作,句子中的語義格則明確了操控所需要的相關(guān)信息,一句話如果具有核心動作和足夠的相關(guān)信息就能夠讓手機(jī)理解用戶的操控意圖,并根據(jù)理解到的意圖做出相應(yīng)的操作。
[0049]具體實(shí)施例
[0050]步驟101:接收到語音信息后,將所述語音信息轉(zhuǎn)換為文本的語句信息,可以對語句中的關(guān)鍵詞進(jìn)行分析,確立相關(guān)的應(yīng)用主題,以確立用戶操控意圖中心內(nèi)容;
[0051]例如,出現(xiàn)“電話”,“撥打”等關(guān)鍵詞的時候則可以將該句處理劃分為電話這一類操作,同理出現(xiàn)“短信”等關(guān)鍵詞的時候則可以將該句處理劃分為短信這一類操作。
[0052]以“給張三打電話”為例,該句子中出現(xiàn)了“打電話”因此該句的意圖可確立為“電話”類。
[0053]步驟102:對所述語句進(jìn)行句法分析,標(biāo)注好中心動詞和語義格,無論是通過句法樹的分析還是句子模板匹配的方式,在句法分析結(jié)果中標(biāo)注好中心動詞和語義格,將句子中的內(nèi)容填充到對應(yīng)的語義格中,生成格表示,供格表示的匹配。
[0054]這里以句法樹為例子,有如圖2所示的句法分析好后的句法樹:圖中用圓圈圈住部分為語義格標(biāo)注節(jié)點(diǎn)。
[0055]V-打:中心動詞
[0056]N-張三:Contact 格
[0057]N-電話:0bject 格
[0058]根據(jù)語義格標(biāo)注節(jié)點(diǎn)分別獲取到相關(guān)內(nèi)容以后生成如下格表示:
[0059](中心動詞:打[Contact格:張三][Object格:電話])。
[0060]步驟103:可以規(guī)約同義詞,可以對中心動詞進(jìn)行規(guī)約,同樣可以對格內(nèi)容進(jìn)行規(guī)約,將中心動詞和/或語義格對應(yīng)的內(nèi)容分別轉(zhuǎn)化為預(yù)定的同義語,以方便知識庫的匹配,提高語義分析的效率。
[0061]例如,打電話的動作都可以歸結(jié)為撥打這樣一個動作,以步驟102的結(jié)果為例進(jìn)行處理,該句的意圖為電話類,因此“打”的同義詞可以轉(zhuǎn)化為“撥打”,同理意圖為電話類的另一句話中心動詞如果為“呼叫”同樣可以轉(zhuǎn)化為“撥打”。因此處理好以后的格表示轉(zhuǎn)化為:[0062](中心動詞:撥打[Contact格:張三][Object格:電話])
[0063]除中心動詞外格內(nèi)容也可以根據(jù)需要進(jìn)行規(guī)約。
[0064]步驟104:將生成好的格表示與知識庫中的格表示按格表示的結(jié)構(gòu)類型跟同類型的格表示進(jìn)行語義的匹配,匹配成功則語義分析成功,手機(jī)就可以根據(jù)該有正確語義的格表示生成對應(yīng)的操控指令。
[0065]知識庫中格表示按照意圖進(jìn)行分類存儲示例如下(這里只用了三個意圖類型作為示例):
[0066]電話類:
[0067](中心動詞:撥打[Object格:電話])
[0068](中心動詞:撥打[Contact格:*][Object格:電話])
[0069]......[0070]短信類:
[0071](中心動詞:發(fā)送[Object格:短信])
[0072](中心動詞:發(fā)送[Contact格:*][Object格:短信])
[0073](中心動詞:發(fā)送[Contact格:*] [Object 格:短信][Content 格:*])
[0074]......[0075]導(dǎo)航類:
[0076](中心動詞:定位[Destination格:*])
[0077](中心動詞:導(dǎo)航[Destination格:*] [Source 格:*])
[0078]......[0079]步驟103處理好的結(jié)果在知識庫中根據(jù)其結(jié)構(gòu)(中心動詞:撥打[Contact格:張三][Object格:電話])應(yīng)該跟(中心動詞:[Contact格:][Object格:])這樣的格表示進(jìn)行匹配,電話類中搜到了如下滿足條件的格表示:
[0080](中心動詞:撥打[Contact格:*][Object格:電話])
[0081]比較后中心動詞滿足,Object格滿足,但是可以看到知識庫中存儲的Contact格有缺省內(nèi)容“*”,這個時候還要做的就是進(jìn)行詞義匹配,可以在知識庫中構(gòu)建詞的各種標(biāo)簽,用以進(jìn)行語義分析,這里“張三”可以附帶“Contact”語義標(biāo)簽,因此張三就滿足了Contact格,該句子意圖分析完成,在知識庫中有相關(guān)的語義,用戶的意圖就能理解為是想要給張三這個聯(lián)系人撥打電話,語義分析成功并結(jié)束。
[0082]相反“給張三撥打老虎”這樣一句話,步驟103分析出的結(jié)果如下:
[0083](中心動詞:撥打[Contact格:張三][Object格:老虎]),
[0084]此時Object格匹配不成功,語義分析失敗并結(jié)束。
[0085]亦或者“給電腦撥打電話”這樣一句話,步驟103分析出的結(jié)果如下:
[0086](中心動詞:撥打[Contact格:電腦][Object格:電話]),
[0087]電腦在知識庫中沒有Contact語義標(biāo)簽,同樣語義分析失敗并結(jié)束。
[0088]圖3為本發(fā)明實(shí)施例的移動終端的示意圖,如圖3所示,本實(shí)施例的移動終端包括:
[0089]第一模塊,用于接收到語音信息后,將所述語音信息轉(zhuǎn)換成文本信息,對所述文本信息進(jìn)行分析,生成格表示;[0090]第二模塊,用于將所述格表示與預(yù)存的知識庫中的格表示進(jìn)行匹配,如匹配成功,則將所述格表示生成對應(yīng)的操控指令。
[0091]其中,所述第一模塊包括:
[0092]第一單元,用于對所述文本信息進(jìn)行句法分析,標(biāo)注出中心動詞和語義格;
[0093]第二單元,用于將所述文本信息的中內(nèi)容填充到對應(yīng)的語義格中,生成格表示。
[0094]其中,所述第二單元,在生成格表示的過程中具體用于,將中心動詞和/或語義格對應(yīng)的內(nèi)容分別轉(zhuǎn)化為預(yù)定的同義語。
[0095]其中,所述第一模塊包括,
[0096]第三單元,用于對所述語句信息中的關(guān)鍵詞進(jìn)行分析,確立與所述關(guān)鍵詞對應(yīng)的應(yīng)用操作類型;
[0097]所述第二模塊,具體用于將所述格表示與預(yù)存的知識庫中與所述應(yīng)用操作類型相同類型的格表示進(jìn)行匹配。
[0098]本領(lǐng)域普通技術(shù)人員可以理解上述方法中的全部或部分步驟可通過程序來指令相關(guān)硬件完成,所述程序可以存儲于計算機(jī)可讀存儲介質(zhì)中,如只讀存儲器、磁盤或光盤等??蛇x地,上述實(shí)施例的全部或部分步驟也可以使用一個或多個集成電路來實(shí)現(xiàn)。相應(yīng)地,上述實(shí)施例中的各模塊/單元可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。本發(fā)明不限制于任何特定形式的硬件和軟件的結(jié)合。
[0099]以上僅為本發(fā)明的優(yōu)選實(shí)施例,當(dāng)然,本發(fā)明還可有其他多種實(shí)施例,在不背離本發(fā)明精神及其實(shí)質(zhì)的情況下,熟悉本領(lǐng)域的技術(shù)人員當(dāng)可根據(jù)本發(fā)明作出各種相應(yīng)的改變和變形,但這些相應(yīng)的改變和變形都應(yīng)屬于本發(fā)明所附的權(quán)利要求的保護(hù)范圍。
【權(quán)利要求】
1.一種信息處理方法,包括: 接收到語音信息后,將所述語音信息轉(zhuǎn)換成文本信息,對所述文本信息進(jìn)行分析,生成格表不; 將所述格表示與預(yù)存的知識庫中的格表示進(jìn)行匹配,如匹配成功,則將所述格表示生成對應(yīng)的操控指令。
2.如權(quán)利要求1所述的方法,其特征在于:對所述文本信息進(jìn)行分析,生成格表示包括: 對所述文本信息進(jìn)行句法分析,標(biāo)注出中心動詞和語義格; 將所述文本信息的中內(nèi)容填充到對應(yīng)的語義格中,生成格表示。
3.如權(quán)利要求2所述的方法,其特征在于:所述生成格表示的過程中包括: 將中心動詞和/或語義格對應(yīng)的內(nèi)容分別轉(zhuǎn)化為預(yù)定的同義語。
4.如權(quán)利要求1-3任一項(xiàng)所述的方法,其特征在于:對所述文本信息進(jìn)行分析包括: 對所述文本信息中的關(guān)鍵詞進(jìn)行分析,確立與所述關(guān)鍵詞對應(yīng)的應(yīng)用操作類型; 將所述格表示與預(yù)存的知識庫中的格表示進(jìn)行匹配,包括: 將所述格表示與預(yù)存的知識庫中與所述應(yīng)用操作類型相同類型的格表示進(jìn)行匹配。
5.—種移動終端,包括: 第一模塊,用于接收到語音信息后,將所述語音信息轉(zhuǎn)換成文本信息,對所述文本信息進(jìn)行分析,生成格表示; 第二模塊,用于將所述格表示與預(yù)存的知識庫中的格表示進(jìn)行匹配,如匹配成功,則將所述格表示生成對應(yīng)的操控指令。
6.如權(quán)利要求5所述的移動終端,其特征在于:所述第一模塊包括: 第一單元,用于對所述文本信息進(jìn)行句法分析,標(biāo)注出中心動詞和語義格; 第二單元,用于將所述文本信息的中內(nèi)容填充到對應(yīng)的語義格中,生成格表示。
7.如權(quán)利要求6所述的移動終端,其特征在于: 所述第二單元,在生成格表示的過程中具體用于,將中心動詞和/或語義格對應(yīng)的內(nèi)容分別轉(zhuǎn)化為預(yù)定的同義語。
8.如權(quán)利要求5-7任一項(xiàng)所述的移動終端,其特征在于:所述第一模塊包括, 第三單元,用于對所述語句信息中的關(guān)鍵詞進(jìn)行分析,確立與所述關(guān)鍵詞對應(yīng)的應(yīng)用操作類型; 所述第二模塊,具體用于將所述格表示與預(yù)存的知識庫中與所述應(yīng)用操作類型相同類型的格表示進(jìn)行匹配。
【文檔編號】H04M1/725GK103945044SQ201310021569
【公開日】2014年7月23日 申請日期:2013年1月22日 優(yōu)先權(quán)日:2013年1月22日
【發(fā)明者】劉偉 申請人:中興通訊股份有限公司