欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種主題對話方法和裝置的制作方法

文檔序號:6375389閱讀:260來源:國知局
專利名稱:一種主題對話方法和裝置的制作方法
技術(shù)領(lǐng)域
本申請涉及計算機技術(shù)領(lǐng)域,特別是涉及ー種主題對話方法和裝置。
背景技術(shù)
對話系統(tǒng)是ー種能夠與人通過自然語言進行交互的電子系統(tǒng),由人輸入自然語言,系統(tǒng)理解后再做出自然語言的回應(yīng)。比如用戶輸入文字信息,電子系統(tǒng)中虛擬的機器人針對文字信息與用戶進行交互?,F(xiàn)有技術(shù)中,大致存在兩種對話系統(tǒng)一是基于問答對的對話系統(tǒng)基于問答對的對話系統(tǒng)就是指通過預(yù)先設(shè)定好的問答對來存儲的知識的對話系統(tǒng),在用戶提問后,從問答對知識庫中選取出最匹配的問題,然 后以該問題的答案做回答?;趩柎饘Φ膶υ捪到y(tǒng),對于不同的數(shù)據(jù)來源有不同的應(yīng)用,比如,垂直領(lǐng)域中以人工編輯為數(shù)據(jù)來源的常用于客服類的對話系統(tǒng);以用戶數(shù)據(jù)為數(shù)據(jù)來源的常用于娛樂類的聊天系統(tǒng);以已有問答社區(qū)的資源為數(shù)據(jù)來源的常用于回答公共知識?;趩柎饘Φ膶υ捪到y(tǒng)大致實現(xiàn)方式如下I、建立知識庫通過“人工編輯”、“用戶數(shù)據(jù)”、“問答社區(qū)”等知識來源(問答對來源)中的ー個或幾個來建立索引庫,建立時需要對問題進行語義關(guān)鍵詞的提取再做索引,形成知識庫;2、用戶查詢當輸入用戶查詢后,先將該用戶查詢轉(zhuǎn)換為語義指紋,再從知識庫中檢索出與其語義相似度大于一定閾值的問題,并獲取該問題對應(yīng)的答案;3、生成答案如果檢索出用戶查詢對應(yīng)的答案,則輸出給用戶,否則按預(yù)設(shè)的流程或答案對用戶進行反饋。對于此類對話系統(tǒng),由于基干“人工編輯”、“用戶數(shù)據(jù)”、“問答社區(qū)”等方式獲得的問題及答案數(shù)量非常有限,對于常見問題可以較好地回答,但對于生僻問題往往效果不佳,同時對用戶查詢進行的語義解析還不成熟,步驟復(fù)合且各項操作都沒有較理想的解析精度,只能簡單的匹配問題來尋找答案,對話的回合之間相對獨立,匹配往往不準確,無法根據(jù)用戶輸入進行相關(guān)話題的互動交流。ニ是基于具體服務(wù)的對話系統(tǒng)這種對話系統(tǒng)往往基于某些特定應(yīng)用進行構(gòu)建,故并不能充分理解用戶的意圖,只是根據(jù)規(guī)則或者模型判斷出用戶需要的應(yīng)用,提取出有價值的關(guān)鍵詞,并直接調(diào)用對應(yīng)的函數(shù),由該特定服務(wù)來返回結(jié)果,比如天氣預(yù)報,信息查詢等應(yīng)用。此種對話系統(tǒng)大致實現(xiàn)方式如下I、設(shè)定應(yīng)用類型和應(yīng)用模塊定義需要支持的應(yīng)用類型,建立相應(yīng)的功能模塊和接ロ,并建立用于需求識別的統(tǒng)計模型和/或規(guī)則模型。其中,各應(yīng)用模塊中也以用戶查詢中的關(guān)鍵詞建立索引,并與相應(yīng)答案進行對應(yīng)。2、用戶查詢當用戶輸入查詢后,利用已經(jīng)設(shè)定好的規(guī)則模型和/或統(tǒng)計模型判斷用戶對應(yīng)的應(yīng)用類型并提取出相應(yīng)的關(guān)鍵詞,發(fā)送給對應(yīng)的應(yīng)用模塊,應(yīng)用模塊依據(jù)關(guān)鍵詞匹配相應(yīng)的答案,然后返回結(jié)果。此類對話系統(tǒng)只是基于特定類型的應(yīng)用,比如天氣預(yù)報等服務(wù),其知識范圍僅限于指定的應(yīng)用領(lǐng)域,并且僅是簡單的基于獲得的關(guān)鍵詞將對應(yīng)的答案返回給用戶,但當用戶與對話系統(tǒng)之間對話回合增多時,對話回合之間則缺乏連貫性,往往造成回話表達的語義與輸入查詢不一致,即“機器聽不懂人話”,同樣使用戶無法基于相關(guān)話題與對話系統(tǒng)進行互動交流。

發(fā)明內(nèi)容
本申請所要解決的技術(shù)問題是提供ー種主題對話方法和裝置,通過對話回合之間的主題準確理解輸入的自然語言文本的語義,并結(jié)合相應(yīng)主題進行匹配分析,從而形成回話,使用戶與對話系統(tǒng)之間的交流連貫,匹配準確,形成相關(guān)話題的互動交流。為了解決上述問題,本申請公開了ー種主題對話方法,包括 步驟110、解析首次輸入的自然語言文本中各詞所屬的詞性,確認對應(yīng)匹配的第一語義表達式;步驟120、針對所述第一語義表達式在結(jié)構(gòu)化知識庫中進行匹配分析,得到對應(yīng)所述第一語義表達式對應(yīng)的回話表達式,并確認當前回合的會話主題;步驟130、根據(jù)當前回合的回話表達式和所述當前回合的會話主題,生成自然語言回話進行返回;步驟140、解析再次輸入的自然語言文本中各詞所屬的詞性,結(jié)合前一回合的會話信息確認對應(yīng)匹配的第二語義表達式;步驟150、針對所述第二語義表達式在結(jié)構(gòu)化知識庫中進行匹配分析,得到對應(yīng)所述第二語義表達式對應(yīng)的回話表達式,結(jié)合前一回合的會話信息確認當前回合的會話主題;轉(zhuǎn)到步驟130,直至無自然語言文本輸入。優(yōu)選的,還包括基于當前回合的會話主題從結(jié)構(gòu)化知識庫中匹配分析相關(guān)的候選會話主題。優(yōu)選的,所述從結(jié)構(gòu)化知識庫中匹配分析相關(guān)的候選會話主題包括結(jié)合用戶的個性化信息和/或預(yù)置的系統(tǒng)偏好信息,與當前回合的會話主題在結(jié)構(gòu)化知識庫中進行匹配分析,得到相應(yīng)符合用戶個性化信息和/或系統(tǒng)偏好信息的候選會話主題。優(yōu)選的,還包括根據(jù)當前回合的回話表達式和所述候選會話主題,或者根據(jù)當前回合的回話表達式、所述候選會話主題和所述當前回合的會話主題,生成自然語言回話返回至用戶端。優(yōu)選的,還包括若當前回合的會話主題不符合預(yù)置的系統(tǒng)偏好信息時,根據(jù)當前回合的回話表達式和所選擇的候選會話主題生成自然語言回話返回至用戶端。優(yōu)選的,還包括將所述當前回合的會話主題對應(yīng)的關(guān)鍵詞輸入結(jié)構(gòu)化知識庫,檢索獲得與當前回合的回話表達式相關(guān)的候選回話表達式;結(jié)合當前回合的回話表達式,及所述當前回合的會話主題對應(yīng)的關(guān)鍵詞,從候選回話表達式中選取對應(yīng)的關(guān)鍵詞作為候選會話主題。優(yōu)選的,將所述當前回合的會話主題對應(yīng)的關(guān)鍵詞輸入結(jié)構(gòu)化知識庫,檢索獲得與當前回合的回話表達式相關(guān)的候選回話表達式包括將所述當前回合的會話主題對應(yīng)的關(guān)鍵詞輸入結(jié)構(gòu)化知識庫,檢索包含所述關(guān)鍵詞的第三回話表達式;計算所述第三回話表達式與當前回合的回話表達式的相關(guān)性,將相關(guān)性大于閾值的第三回話表達式作為候選回話表達式。優(yōu)選的,所述將相關(guān)性大于閾值的第三回話表達式作為候選回話表達式進ー步包括
將所述同一知識類別的第三回話表達式進行排序;選擇排序靠前的至少ー個第三回話表達式作為候選回話表達式。優(yōu)選的,還包括從候選回話表達式中,選取與所述當前回合的會話主題對應(yīng)的關(guān)鍵詞在當前回合的回話表達式中的相同詞性對應(yīng)的數(shù)據(jù)內(nèi)容作為候選會話主題。優(yōu)選的,解析所述輸入的自然語言文本中各詞所屬的詞性,包括遍歷實體詞表,將所述自然語言文本轉(zhuǎn)換為既定格式;標記所述轉(zhuǎn)換后的自然語言文本中各實體詞所屬的詞性;所述詞性包括實體詞、屬性詞、屬性詞對應(yīng)的屬性值。優(yōu)選的,所述結(jié)合前一回合的會話信息確認當前回合的會話主題包括結(jié)合前一回合的會話信息中的會話主題和/或候選會話主題確認當前回合的會話主題。優(yōu)選的,還包括通過從全網(wǎng)的各網(wǎng)頁中提取的實體詞、所述實體詞對應(yīng)的屬性詞和屬性值構(gòu)建所述結(jié)構(gòu)化知識庫。優(yōu)選的,所述結(jié)構(gòu)化知識庫構(gòu)建時包括針對抓取的同一知識類別的各知識網(wǎng)站,利用相應(yīng)知識網(wǎng)站的解析模板解析各知識網(wǎng)站的網(wǎng)頁內(nèi)容,獲得實體詞及與實體詞相應(yīng)的屬性詞和屬性值;針對同一實體詞,以實體詞、實體詞對應(yīng)的屬性詞、屬性詞對應(yīng)的屬性值的數(shù)據(jù)結(jié)構(gòu)存入結(jié)構(gòu)化知識庫。相應(yīng)的,本申請還公開了ー種主題對話裝置,包括第一解析模塊,用于解析首次輸入的自然語言文本中各詞所屬的詞性,確認對應(yīng)匹配的第一語義表達式;第一聯(lián)想模塊,用于針對所述第一語義表達式在結(jié)構(gòu)化知識庫中進行匹配分析,得到對應(yīng)所述第一語義表達式對應(yīng)的回話表達式,并確認當前回合的會話主題;答案生成模塊,用于根據(jù)當前回合的回話表達式和所述當前回合的會話主題,生成自然語言回話進行返回;第二解析模塊,用于解析再次輸入的自然語言文本中各詞所屬的詞性,結(jié)合前一回合的會話信息確認對應(yīng)匹配的第二語義表達式;第二聯(lián)想模塊,用于針對所述第二語義表達式在結(jié)構(gòu)化知識庫中進行匹配分析,得到對應(yīng)所述第二語義表達式對應(yīng)的回話表達式,結(jié)合前一回合的會話信息確認當前回合的會話主題;轉(zhuǎn)到答案生成模塊,直至無自然語言文本輸入。優(yōu)選的,所述聯(lián)想模塊還用于基于當前回合的會話主題從結(jié)構(gòu)化知識庫中匹配分析相關(guān)的候選會話主題。優(yōu)選的,還包括用戶個性化信息記錄模塊,用于記錄用戶個性化信息;進ー步的,所述聯(lián)想模塊還用于結(jié)合用戶的個性化信息,與當前回合的會話主題從結(jié)構(gòu)化知識庫中進行匹配分析,得到相應(yīng)的符合用戶個性化信息的候選會話主題;和/或系統(tǒng)性格模塊,用于記錄預(yù)置的系統(tǒng)偏好信息;進ー步的,所述聯(lián)想模塊還用于結(jié)合預(yù)置的系統(tǒng)的偏好信息,與當前回合的會話 主題從結(jié)構(gòu)化知識庫中進行匹配分析,得到相應(yīng)的符合系統(tǒng)的偏好信息的候選會話主題。優(yōu)選的,所述答案生成模塊還用于根據(jù)當前回合的回話表達式和所述候選會話主題,或者根據(jù)當前回合的回話表達式、所述候選會話主題和所述當前回合的會話主題,生成自然語言回話返回至用戶端。與現(xiàn)有技術(shù)相比,本申請包括以下優(yōu)點在本申請中,首先,基于結(jié)構(gòu)化知識庫和已記錄的前一回合對話的上下文中的信息,將用戶輸入的自然語言文本解析為能在結(jié)構(gòu)化知識庫中匹配答案的語義表達式,并將所述語義表達式在所述結(jié)構(gòu)化知識庫中進行匹配查找,得到相應(yīng)的回話表達式,從而準確解析用戶輸入的自然語言文本;其次,基于所述語義表達式及查詢得到的對應(yīng)的回話表達式,和所述記錄的前一回合對話的會話信息,確認當前回合的會話主題,從而在結(jié)構(gòu)化知識庫中生成相應(yīng)答案并輸出。本申請中,用戶基于會話主題與對話系統(tǒng)進行交流,則對話回合之間能夠保持連貫性,使對話系統(tǒng)產(chǎn)生的回話對應(yīng)的語義與用戶的輸入查詢一致,且回話能夠結(jié)合會話主題反問用戶,達到使對話系統(tǒng)能夠模擬真人進行聊天的效果,井能準確、連貫地響應(yīng)用戶的輸入查詢,與用戶形成互動。


圖I是本申請一種主題對話方法實施例一的流程不意圖;圖2是本申請優(yōu)選的一種構(gòu)建結(jié)構(gòu)化數(shù)據(jù)庫的流程示意圖;圖3是本申請一種主題對話方法實施例ニ的流程不意圖;圖4是本申請優(yōu)選的從第二回合開始的ー種主題對話方法實施例三的流程示意圖;圖5是本申請ー種主題對話裝置的結(jié)構(gòu)示意圖;圖6是本申請ー種主題對話裝置的結(jié)構(gòu)示意圖。
具體實施例方式為使本申請的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結(jié)合附圖和具體實施方式
對本申請作進一步詳細的說明。本申請利用預(yù)先基于全網(wǎng)中以實體詞、屬性詞、屬性值為基礎(chǔ)構(gòu)建的結(jié)構(gòu)化知識庫和前一回合的會話信息,精確分析用戶每回合輸入的自然語言文本,并記錄對話回合的會話主題,由此可基于用戶毎回合的會話主題,選擇相關(guān)的話題進行回答,如此,即可連貫地與用戶進行溝通,對話回合之間主題相互聯(lián)系,使對話系統(tǒng)達到模擬真人進行聊天的效果,井能準確、連貫地響應(yīng)用戶的輸入查詢,與用戶形成互動。參照圖1,示出了本申請ー種主題對話方法的流程示意圖實施例一,具體可以包括步驟110、解析首次輸入的自然語言文本中各詞所屬的詞性,確認對應(yīng)匹配的第一語義表達式;步驟120、針對所述第一語義表達式在結(jié)構(gòu)化知識庫中進行匹配分析,得到對應(yīng)所述第一語義表達式對應(yīng)的回話表達式,并確認當前回合的會話主題;步驟130、根據(jù)當前回合的回話表達式和所述當前回合的會話主題,生成自然語言回話返回至用戶端; 步驟140、解析再次輸入的自然語言文本中各詞所屬的詞性,結(jié)合前一回合的會話信息確認對應(yīng)匹配的第二語義表達式;步驟150、針對所述第二語義表達式在結(jié)構(gòu)化知識庫中進行匹配分析,得到對應(yīng)所述第二語義表達式對應(yīng)的回話表達式,結(jié)合前一回合的會話信息確認當前回合的會話主題;轉(zhuǎn)到步驟130,直至無自然語言文本輸入。本申請還包括步驟100,通過從全網(wǎng)的各網(wǎng)頁中提取的實體詞、所述實體詞對應(yīng)的屬性詞和屬性值進行構(gòu)建所述結(jié)構(gòu)化知識庫。本申請的結(jié)構(gòu)化知識庫一般根據(jù)全網(wǎng)數(shù)據(jù)中抓取的結(jié)構(gòu)化數(shù)據(jù)進行分析構(gòu)建。結(jié)構(gòu)化知識庫的組織結(jié)構(gòu),從描述結(jié)構(gòu)上來講,結(jié)構(gòu)化知識庫是由實體,屬性,屬性值進行結(jié)構(gòu)化存儲而成的I、實體對應(yīng)的ー個具體的個體,在明星類別中,比如劉德華,張柏芝,林青霞等,也包含一些寬泛的代表類別的個體,比如人,電影明星,歌手等。2、屬性就是實體所包含的特性,除了包含屬性名稱外,每個屬性還有ー個反應(yīng)屬性值類型的類型變量,比如[身高長度],[年齡整數(shù)],[出生日期日期],[配偶人名]等°3、屬性值與屬性對應(yīng)的值,比如174cm(身高),87kg(體重),朱麗倩(劉德華配偶)等,這部分也就是知識庫中的知識。屬性值還會記錄知識的來源,用于幫助用戶判斷知識的可靠性。通過上述組織結(jié)構(gòu)對每類知識進行結(jié)構(gòu)化處理,即可得到精確的結(jié)構(gòu)化知識。所述結(jié)構(gòu)化知識庫從全網(wǎng)中提取的實體詞,所述實體詞對應(yīng)的屬性詞和屬性值進行構(gòu)建。優(yōu)選的,參照圖2,從各信息中提取的實體詞,所述實體詞對應(yīng)的屬性詞和屬性值構(gòu)建所述結(jié)構(gòu)化知識庫的步驟包括步驟S110,針對抓取的同一知識類別的各知識網(wǎng)站,利用相應(yīng)知識網(wǎng)站的解析模板解析各知識網(wǎng)站的網(wǎng)頁內(nèi)容,獲得實體詞及與實體詞相應(yīng)的屬性詞和屬性值;針對同一知識類別,其提供該類別知識的各種網(wǎng)站,可能以不同的內(nèi)容構(gòu)建其該知識類別的網(wǎng)頁;那么可獲取各網(wǎng)站該知識類別相應(yīng)的解析模板,解析各網(wǎng)頁內(nèi)容,獲得實體詞,及與實體詞相應(yīng)的屬性詞和屬性值。
優(yōu)選的,針對抓取的同一知識類別的各網(wǎng)頁內(nèi)容,利用相應(yīng)網(wǎng)頁的解析模板解析各網(wǎng)頁內(nèi)容,獲得實體詞, 及與實體相應(yīng)的屬性詞和屬性值的步驟包括步驟S111,對抓取的同一知識類別各知識網(wǎng)站,利用該類別的各種子挖掘各知識網(wǎng)站的內(nèi)容存放格式,獲取各知識網(wǎng)站的解析模板;為了保證知識的精確性,本申請一般抓取全網(wǎng)中的垂直知識網(wǎng)站的網(wǎng)頁,比如明星類,那么可選擇明星類網(wǎng)站。在實際中,各種網(wǎng)站往往已基于客觀類別分類完畢,在ー些“網(wǎng)址導(dǎo)航”類的頁面中,如http://123. sogou. com,往往將全網(wǎng)中的網(wǎng)站基于其主營內(nèi)容進行客觀分類,如[商城]類別下為淘寶商城、當當購物、新蛋商城、V+名品、蘇寧易購等等。對于每一知識類,一般可選擇該知識類領(lǐng)域里具有代表性的,排序靠前的和內(nèi)容豐富的網(wǎng)站。比如明星類網(wǎng)站,可選取搜狐明星庫,新浪明星庫,網(wǎng)易明星庫,騰訊明星庫等網(wǎng)站。對于ー特定知識類別,根據(jù)該類別知識的知識描述形式,可人工獲取小數(shù)據(jù)分析出種子的種子屬性,用于獲取該知識類別各網(wǎng)站的解析模板。在分析得到“種子”后,對抓取一網(wǎng)站的一個或幾個網(wǎng)頁內(nèi)容,將“種子”即種子屬性和種子屬性值與網(wǎng)頁內(nèi)容進行匹配,當種子屬性命中吋,則將網(wǎng)頁內(nèi)容被種子屬性匹配上的內(nèi)容標記為“種子屬性”,當命中種子屬性值時,則將網(wǎng)頁內(nèi)容被種子屬性值匹配上的內(nèi)容標記為“種子屬性值”,然后分析所述標記,即可挖掘該知識網(wǎng)站的各頁面的內(nèi)容存放格式,然后基于該內(nèi)容存放格式即可獲得網(wǎng)站解析模板。在實際中,每個網(wǎng)站的解析模板有相應(yīng)網(wǎng)站的網(wǎng)址進行標記。當對于抓取的網(wǎng)址,首先根據(jù)標記的網(wǎng)址與抓取的網(wǎng)址進行比較,采用匹配上的網(wǎng)址的解析模板對抓取的網(wǎng)址的內(nèi)容進行解析。所述的解析模板包括解析范圍,待解析的與種子屬性對應(yīng)的種子屬性的位置,相應(yīng)種子屬性值對應(yīng)的種子屬性值的位置。步驟S112,針對所述每一知識網(wǎng)站,利用相應(yīng)知識網(wǎng)站的解析模板,解析出所述知識網(wǎng)站內(nèi)與種子屬性對應(yīng)的第一屬性詞,及與所述第一屬性詞相應(yīng)的第一屬性值;比如前述搜狐明星庫網(wǎng)站的解析模板,對搜狐明星資料庫的各網(wǎng)頁內(nèi)容進行解析,解析出各網(wǎng)頁中與種子的種子屬性對應(yīng)的第一屬性詞,及該網(wǎng)頁內(nèi)容中與所述第一屬性詞相應(yīng)的第一屬性值。實際中第一屬性詞與種子屬性是相同的。步驟S113,選取各種子屬性中與實體詞相關(guān)的種子屬性,將所述與實體詞相關(guān)的種子屬性相應(yīng)的第一屬性詞的第一屬性值作為實體詞;比如姓名對應(yīng)實體詞,解析得到的第一屬性詞為“姓名”,那么姓名的對應(yīng)的第一屬性值“林志穎”即為實體詞。步驟S114,選取各種子屬性中與屬性詞相關(guān)的種子屬性,將所述與屬性詞相關(guān)的種子屬性相應(yīng)的第一屬性詞作為屬性詞,將相應(yīng)第一屬性值作為屬性值;tヒ如“性別”對應(yīng)屬性詞,解析得到的第一屬性詞為“性別”時,將“性別”作為該實體的屬性詞,相應(yīng)的第一屬性值“男”作為屬性值。步驟Slll至S114,是為了節(jié)省獲取成本,以最小的人工成本獲得各網(wǎng)頁內(nèi)容的實體詞,及與實體詞相應(yīng)的屬性詞和屬性值即先選擇領(lǐng)域知識網(wǎng)站,之后挖掘網(wǎng)站的解析模板,再用解析模板解析網(wǎng)站內(nèi)全部頁面信息,獲取原始垂直知識,之后再把原始知識利用類別對應(yīng)的實體模板(比如購物模板、汽車模板)整理成結(jié)構(gòu)化數(shù)據(jù)。在前述步驟Slll至S114構(gòu)建結(jié)構(gòu)化知識庫時,可構(gòu)建實體詞表、屬性詞表、停用詞表、疑問詞表和語義模板表等表。其中,對于結(jié)構(gòu)化知識庫中存儲的第一屬性詞,所述屬性詞表中包括所述第一屬性詞的同義詞。比如,對于前述例子中,結(jié)構(gòu)化知識庫中,對于明星類,以第一屬性詞“年齡”存儲屬性值即年齡大小,那么在建立屬性詞表時,可將“年齡”的同義詞“年紀”加入屬性詞表中,并可與年齡進行對應(yīng)。步驟120,針對網(wǎng)頁內(nèi)容中的同一實體詞,以實體詞、屬性詞、屬性值結(jié)構(gòu)存入結(jié)構(gòu)化知識庫。 針對同一實體詞,以實體詞、實體詞對應(yīng)的屬性詞、屬性詞對應(yīng)的屬性值的數(shù)據(jù)結(jié)構(gòu)存入結(jié)構(gòu)化知識庫。比如,ー顯示明星“林志穎”個人資料的網(wǎng)頁可解析得到[實體詞-林志穎],[屬性詞-性別]-[屬性值-男],[屬性-生日]-[屬性值-1974-10-15]等以實體詞、屬性詞、屬性值的三元組數(shù)據(jù)存入結(jié)構(gòu)化知識庫。另外,為了優(yōu)化結(jié)構(gòu)化知識庫,本申請可根據(jù)全網(wǎng)用戶的用戶行為進行更新維護。針對所述結(jié)構(gòu)化知識庫中每ー實體的屬性值,根據(jù)用戶的觸發(fā)信息進行優(yōu)化;即利用用戶的主動觸發(fā)信息對結(jié)構(gòu)化知識庫進行優(yōu)化和修正,主動觸發(fā)信息就是本申請在展示的位置讓用戶可以根據(jù)自己的滿意程度做反饋,如果有較多的用戶反映不滿意,則需要關(guān)注;特別是對于有多條結(jié)果的屬性,可以讓用戶選擇認可哪ー個答案,由此對結(jié)構(gòu)化知識庫的各條信息提供可信度的依據(jù),進而經(jīng)分析判斷后,更新結(jié)構(gòu)化知識庫中對應(yīng)實體的屬性值。和/或,針對所述結(jié)構(gòu)化知識庫中各實體屬性值,根據(jù)分析用戶的搜索行為日志得到的所述屬性值的可信度對結(jié)構(gòu)化知識庫中的實體的屬性值進行優(yōu)化。本申請也可以利用被動信息對結(jié)構(gòu)化知識庫進行優(yōu)化和修正,被動信息就是當用戶輸入查詢后的一系列操作,比如是否點擊其他結(jié)果,頁面停留時間,捜索的后續(xù)行為等,以此來挖掘數(shù)據(jù)的可信度信息,由此對結(jié)構(gòu)化知識庫的各條信息提供可信度的依據(jù),進而經(jīng)分析判斷后,更新結(jié)構(gòu)化知識庫中對應(yīng)實體的屬性值?;跇?gòu)建的結(jié)構(gòu)化知識庫,下面詳細描述本申請的步驟,參照圖I :步驟110、解析首次輸入的自然語言文本中各詞所屬的詞性,確認對應(yīng)匹配的第一語義表達式;當用戶需要進行查詢或者交流吋,則會輸入自然語言文本,本申請則可接受所述自然語言文本。優(yōu)選的,本申請的用戶還可輸入語音,即在步驟110之前還包括接收用戶輸入的語音,并將所述語音識別為對應(yīng)的自然語言文本,并解析所述自然語言文本中各詞所屬的詞性,從而確認自然語言文本對應(yīng)匹配的第一語義表達式。解析所述自然語言文本中各詞所屬的詞性,包括步驟S11,通過實體識別模型,將所述自然語言文本中符合實體識別模型的詞串轉(zhuǎn)換為標準格式;其中實體識別模型為通過規(guī)則模型識別出“時間”,“日期”,“數(shù)字”,“價格”,“長度”,“重量”,等類型的信息,并轉(zhuǎn)換為標準格式。比如,自然語言文本為“劉德華ー米八么? ”,那么通過實體識別模型可將數(shù)字“ー米ノV”識別為身高,即將“劉德華一米八么? ”轉(zhuǎn)換為標準格式為“劉德華的身高為180cm ”。步驟S12,解析所述轉(zhuǎn)換后的自然語言文本中各詞所屬的詞性;所述詞性包括實體詞、屬性詞、屬性詞對應(yīng)的屬性值;
解析所述轉(zhuǎn)換后的自然語言文本中各詞所屬的詞性時包括步驟Al,針對所述自然語言文本,遍歷實體詞表,獲得各實體詞;在本申請中,在解析所述自然語言文本中各詞的詞性時,需要首先利用實體詞表,標注自然語言文本中的實體詞,利用實體詞所屬類別確定后續(xù)的屬性詞、疑問詞的范圍,提高解析效率。比如解析出實體詞為劉德華,則確定自然語言文本所屬類別為明星類,則在明星類范圍內(nèi)標注后續(xù)的屬性詞、疑問詞等。步驟A2,根據(jù)各實體詞所屬類別,遍歷相應(yīng)類別中的屬性詞表、疑問詞表和特殊疑問模板表,標注自然語言文本中的各屬性詞、各疑問詞;在實體詞所屬范圍內(nèi),利用屬性詞表、疑問詞表和特殊疑問模板表,獲得屬性詞、和/或疑問詞。另外本申請中還存在停用詞表,用于標注停用詞。其中停用詞為完全沒有意思的詞或本身有語義,但不會影響問題的主要意思的詞,比如“的”,“目前”,“你知道”,“能否告訴我”,“詳細”等。其中屬性詞表中包括屬性詞和其同義詞,“身高I高度” ,“體重重量I分量”,“出生日期I生日I出生日”,“職業(yè)I工作I職位”等。另外,還可標注疑問詞等,例如“是什么”,“叫什么”,“有哪些”等。比如對于前述“劉德華的身高為180 ”,解析該自然語言文本中各詞的詞性,< 實體詞I劉德華 >〈停用詞I的 >〈屬性詞I身高 >〈屬性值1180X疑問句 >。其中屬性值為在對應(yīng)確認屬性詞后,可將跟隨屬性詞的名詞作為該屬性詞的屬性值。那么,比如用戶輸入第一回合對話為“你知道北京有什么特色菜好吃的嗎”,被標注為“[停用詞I你知道][城市I北京][疑問詞I有什么][屬性詞I特色菜好吃的][疑問詞I嗎?]”然后,根據(jù)所述詞性確認自然語言文本對應(yīng)匹配的第一語義表達式。在本申請中,預(yù)設(shè)了語義模板庫,將標注完詞性的自然語言文本在語義模板庫中的各模型中進行匹配分析,即可確認自然語言文本對應(yīng)匹配的第一語義表達式。比如前述“[停用詞I你知道][城市I北京][疑問詞I有什么][屬性詞I美食][疑問詞I嗎?] ”,則得到的第一語義表達式為[く實體I北京 >〈屬性詞I特色 >〈屬性值I >]。步驟120、針對所述第一語義表達式在結(jié)構(gòu)化知識庫中進行匹配分析,得到對應(yīng)所述第一語義表達式對應(yīng)的回話表達式,并確認當前回合的會話主題;比如將其識別為語義表達式[く實體I北京X屬性詞I特色菜X屬性值I >],通過該語義表達式通過后續(xù)步驟查詢結(jié)構(gòu)化數(shù)據(jù)庫得到回話表達式[〈實體I北京〉〈屬性詞I特色菜 >〈屬性值I北京烤鴨>]。那么即可根據(jù)回話表達式[〈實體I北京〉〈屬性詞I特色菜〉〈屬性值I北京烤鴨>]確認當前回合的會話主題,即從三個詞性對應(yīng)的數(shù)據(jù)結(jié)構(gòu)中選擇ー個詞性數(shù)據(jù)結(jié)構(gòu)或者幾個詞性數(shù)據(jù)結(jié)構(gòu)的組合的關(guān)鍵詞作為主題。比如,本申請對[〈實體I北京〉〈屬性詞特色菜 >〈屬性值I北京烤鴨 >]選擇,本實施例中,選取〈屬性值I北京烤鴨 > 作為主題,則當前回合的會話主題對應(yīng)的關(guān)鍵詞為“北京烤鴨”。在用戶與本系統(tǒng)第一回合對話時,可從所述回話表達式中根據(jù)預(yù)置規(guī)則隨機選擇一個或者多個詞性的詞作為當前回合的會話主題對應(yīng)的關(guān)鍵詞。比如直接選擇實體作為當前回合的會話主題對應(yīng)的關(guān)鍵詞;當屬性值對應(yīng)在結(jié)構(gòu)化知識庫中為實體詞時,選擇屬性值為當前回合的會話主題對應(yīng)的關(guān)鍵詞;當屬性值對應(yīng)在結(jié)構(gòu)化知識庫中不為實體詞時,可選擇“屬性詞+屬性值”作為當前回合的會話主題對應(yīng)的關(guān)鍵詞;或者當“實體+屬性詞”對應(yīng)在結(jié)構(gòu)化知識庫中的回話表達式不唯一時,可選擇“實體+屬性詞”作為當前回合的會話主題對應(yīng)的關(guān)鍵詞等等。步驟130、根據(jù)當前回合的回話表達式和所述當前回合的會話主題,生成自然語言回話返回至用戶端;比如對于前述回話表達式[く實體I北京X屬性詞I特色菜X屬性值I北京烤鴨〉],屬性值“北京烤鴨”為當前回合的會話主題對應(yīng)的關(guān)鍵詞,根據(jù)回話表達式和關(guān)鍵詞,通過調(diào)用預(yù)存的回話模板輸出“嗯.· ·北京烤鴨挺好吃的,你吃過嗎? ”。在本申請中,對應(yīng)每個知識類別的結(jié)構(gòu)化信息,針對該類別的屬性構(gòu)造了相應(yīng)的回話模板;當然,還可設(shè)置各類別公用的屬性對應(yīng)的回話模板,還可針對所有不可識別情況設(shè)置的普適的回話模板。本申請中,根據(jù)所述語義表達式和相應(yīng)回話表達式可以確定當前用戶詢問的對象 是什么,比如語義表達式〈實體詞I北京 >〈屬性詞I特色菜 >〈屬性值I >和回話表達式〈實體詞I北京〉〈屬性詞I特色菜〉〈屬性值I北京烤鴨〉,則確定當前用戶詢問的對象為北京烤鴨。步驟140、解析再次輸入的自然語言文本中各詞所屬的詞性,結(jié)合前一回合的會話信息確認對應(yīng)匹配的第二語義表達式;tヒ如,針對在前一回合的回話中“嗯...北京烤鴨挺好吃的,你吃過嗎?”,用戶第二回合輸入的自然語言文本為“沒有,好吃? ”,那么首先自然語言文本解析為[く實體Inullx屬性詞I評價>〈屬性值I >],之后通過已記錄根據(jù)結(jié)合前一回合的會話信息,即前一回合的會話主題“北京烤鴨”,補全得到第二語義表達式[く實體I北京烤鴨 >〈屬性詞I評價 >〈屬性值I >,即通過前一回合的語義表達式、前一回合的會話主題等將所述自然語言文本解析為對應(yīng)匹配的第二語義表達式;使用戶和機器人之間的會話一直圍繞相同或相關(guān)的主題進行,從而保證了會話的連續(xù)性和相關(guān)性。步驟150、針對所述第二語義表達式在結(jié)構(gòu)化知識庫中進行匹配分析,得到對應(yīng)所述第二語義表達式對應(yīng)的回話表達式,結(jié)合前一回合的會話信息確認當前回合的會話主題;轉(zhuǎn)到步驟130,直至無自然語言文本輸入。比如,前述第二語義表達式[く實體I北京烤鴨X屬性詞I評價X屬性值I >輸入結(jié)構(gòu)化知識庫進行匹配分析獲得[〈實體I北京烤鴨 >〈屬性詞I評價 >〈屬性值19. 7>,前一回合的會話信息中記錄的會話主題對應(yīng)的關(guān)鍵詞為北京烤鴨,而得到的回話表達式中也有“北京烤鴨”,則當前回合的會話主題對應(yīng)的關(guān)鍵詞不變,仍為“北京烤鴨”。由于此時對話沒有結(jié)束,則轉(zhuǎn)到步驟130繼續(xù)對話,即根據(jù)當前回合的回話表達式和所述當前回合的會話主題,生成自然語言回話返回至用戶端。在本申請中,所述前一回合的會話信息可包括前一回合的語義表達式,前一回合的回話表達式,前一回合的會話主題。所述結(jié)合前一回合的會話信息確認當前回合的會話主題包括結(jié)合前一回合的會話信息中的語義表達式,和/或回話表達式,和/或會話主題確認當前回合的會話主題。比如,前一回合的會話主題為〈屬性值I北京烤鴨 >,而當前回合解析用戶輸入的自然語言文本得到的語義表達式為[く實體I北京烤鴨 >〈屬性詞I評價 >〈屬性值I >,將前一回合的會話主題與當前回合的語義表達式中的詞進行匹配,將匹配上的關(guān)鍵詞及對應(yīng)的詞性作為當前回合的會話主題。當前回合中,可對會話主題“北京烤鴨”進行回答,在結(jié)構(gòu)化知識庫中查找〈實體I北京烤鴨〉的某個屬性或者某個屬性值與用戶交流。比如,對話系統(tǒng)在回答[く實體I北京烤鴨 >〈屬性詞I評價 >〈屬性值I >時,還可根據(jù)北京烤鴨的〈屬性詞I做法〉生成自然語言與用戶進行交流,從而將當前回合的會話主題改為“烤鴨做法”。參照圖3,示出了本申請ー種主題對話方法的流程示意圖實施例ニ,具體可以包括步驟P110、解析首次輸入的自然語言文本中各詞所屬的詞性,確認對應(yīng)匹配的第ー語義表達式;步驟P120、針對所述第一語義表達式在結(jié)構(gòu)化知識庫中進行匹配分析,得到對應(yīng)所述第一語義表達式對應(yīng)的回話表達式,并確認當前回合的會話主題;
步驟P110、P120與實施例一中步驟110、步驟110類似,不再詳述。步驟P123,基于當前回合的會話主題從結(jié)構(gòu)化知識庫中匹配分析相關(guān)的候選會話主題;在確定了當前回合的會話主題后,即可基于當前回合的會話主題從結(jié)構(gòu)化知識庫中匹配分析相關(guān)的候選會話主題。比如當前回合的會話主題為“北京烤鴨”,則可從結(jié)構(gòu)化知識庫中匹配分析與“北京烤鴨”相關(guān)的各種信息為候選會話主題,比如北京烤鴨的“原料”,北京烤鴨的“做法”,賣北京烤鴨的“飯店”等等。進ー步優(yōu)選的,基于當前回合的會話主題從結(jié)構(gòu)化知識庫中匹配分析相關(guān)的候選會話主題包括結(jié)合用戶的個性化信息,和當前回合的會話主題從結(jié)構(gòu)化知識庫中匹配分析,得到符合用戶個性化信息的候選會話主題。和/或,結(jié)合預(yù)置的系統(tǒng)的偏好信息,和當前回合的會話主題從結(jié)構(gòu)化知識庫中匹配分析,得到符合系統(tǒng)的偏好信息的候選會話主題。在本實施例中可記錄用戶的個性化信息,比如,用戶自身信息和用戶偏好信息,用戶自身信息是以用戶為ー個實體,建立用戶的各項屬性,當用戶在問答中包含屬性中的對應(yīng)值的時候,則記錄在模塊中。用戶偏好信息則是記錄用戶對所有知識庫中的實體的態(tài)度,用一些標記和等級來定義,比如,“喜歡電影”、“對狗過敏”、“非常討厭越南菜”等。那么在匹配查詢得到候選會話主題時,可根據(jù)用戶的個性化信息和用戶個性化信息匹配得到相關(guān)類別的各候選會話主題,比如匹配用戶喜好指數(shù)最大的候選會話主題,避免匹配到用戶不喜歡的候選會話主題。在本申請中,本系統(tǒng)自身也可設(shè)置性格模塊,即選擇對話系統(tǒng)自身預(yù)置偏好信息,實現(xiàn)對結(jié)構(gòu)化知識庫中各種實體的偏好、態(tài)度,以及對各種屬性對應(yīng)的概念和相應(yīng)的屬性值區(qū)間的偏好等。比如,對實體〈汽車 > 的偏好,對某些屬性值條件下的實體[く汽車 >〈顏色〉〈黃色〉]的偏好。那么系統(tǒng)會篩選符合其偏好的候選會話主題,比如會主動選擇黃色汽車為候選會話主題。優(yōu)選的,所述基于當前回合的會話主題從結(jié)構(gòu)化知識庫中匹配分析相關(guān)的候選會話主題包括
步驟S31,將所述當前回合的會話主題對應(yīng)的關(guān)鍵詞輸入結(jié)構(gòu)化知識庫,檢索獲得與當前回合的回話表達式相關(guān)的候選回話表達式;如當前回合的會話主題對應(yīng)的關(guān)鍵詞為“北京烤鴨”,則可將“北京烤鴨”在結(jié)構(gòu)化知識庫中匹配分析,得到相關(guān)的第三回話表達式為候選。比如檢索到第三回話表達式1、く實體I北京烤鴨>-ーく屬性詞I原料>-ーく屬性值I鴨子>,2、〈實體I全聚德>---く屬性詞I北京特色菜>---く屬性值I北京烤鴨 > ;那么可將第三回話表達式〈實體I北京烤鴨>---〈屬性詞I原料〉---〈屬性值I鴨子〉作為候選回話表達式,也可將第三回話表達式<實體I全聚德>---く屬性詞I北京特色菜>---く屬性值I北京烤鴨 > 作為候選回話表達式。優(yōu)選的,將所述當前回合的會話主題對應(yīng)的關(guān)鍵詞輸入結(jié)構(gòu)化知識庫,檢索獲得與當前回合的回話表達式相關(guān)的候選回話表達式包括將所述當前回合的會話主題對應(yīng)的關(guān)鍵詞輸入結(jié)構(gòu)化知識庫,檢索包含所述關(guān)鍵詞的第三回話表達式; 計算所述第三回話表達式與當前回合的回話表達式的相關(guān)性,將相關(guān)性大于閾值的第三回話表達式作為候選回話表達式。比如,檢索得到第三回話表達式〈實體I北京烤鴨X屬性詞I供應(yīng)餐館X屬性值全聚德 > 等等。而當前的第三回話表達式為〈實體I北京 >〈屬性詞I特色菜 >〈屬性值北京烤鴨〉,則相同詞為“北京”、“北京烤鴨”,那么同時出現(xiàn)的詞在當前的第三回話表達式
信息中出現(xiàn)的占比為2/3,在檢索得到的第三回話表達式中出現(xiàn)的占比為1/3,實體詞“北京”,和實體詞北京烤鴨的相似度為50%,那么最終相關(guān)性可為2/3+1/3+50%= 1.5。如果存在多個第三回話表達式,那么將大于閾值的第三回話表達式作為候選回話表達式。在其他實施例中,本申請還可采用其他方式計算相關(guān)性,通過關(guān)鍵詞模型進行第三回話表達式的匹配,根據(jù)表達式中的各關(guān)鍵詞所對應(yīng)的分值得到第三表達式對應(yīng)的總分值,將分值最高的第三回話表達式最為候選回話表達式,本申請不對其加以限制。優(yōu)選的,所述將相關(guān)性大于閾值的第三回話表達式作為候選回話表達式進ー步包括I、將所述同一知識類別的第三回話表達式進行排序;2、選擇排序靠前的至少ー個第三回話表達式作為候選回話表達式。對于同一知識類別的第三回話表達式,比如第三回話表達式〈實體I北京烤鴨X屬性詞I供應(yīng)餐館 >〈屬性值I全聚德 > 和〈實體I北京烤鴨 >〈屬性詞I供應(yīng)餐館 >〈屬性值I便宜坊〉等,均屬于〈實體I北京烤鴨〉對應(yīng)的供應(yīng)餐館,那么可對這些第三回話表達式進行排序。比如按照對各供應(yīng)餐館的評價排序等。然后從排完序的第三回話表達式中選擇排序靠前的至少ー個第三回話表達式作為候選回話表達式即可,本實施例中,選擇第三回話表達式〈實體I北京烤鴨 >〈屬性詞I供應(yīng)餐館 >〈屬性值I全聚德 > 作為候選回話表達式。步驟S32,結(jié)合當前回合的回話表達式,及當前回合的會話主題對應(yīng)的關(guān)鍵詞,從候選回話表達式中選取候選會話主題對應(yīng)的關(guān)鍵詞作為候選會話主題。比如,前述當前回合的回話表達式為[〈實體I北京〉〈屬性詞I特色菜〉〈屬性值北京烤鴨 >],當前回合的會話主題對應(yīng)的關(guān)鍵詞為“北京烤鴨”,對于候選回話表達式〈實體I北京烤鴨 >〈屬性詞I供應(yīng)餐館 >〈屬性值I全聚德 >,那么將〈屬性值I全聚德 > 作為候選會話主題。在從候選回話表達式中選取候選會話主題時,優(yōu)選的,從候選回話表達式中,選取與所述當前回合的會話主題對應(yīng)的關(guān)鍵詞在當前回合的回話表達式中的相同詞性對應(yīng)的數(shù)據(jù)內(nèi)容作為候選會話主題。tヒ如,前述當前回合的回話表達式為[く實體I北京X屬性詞I特色菜X屬性值北京烤鴨〉],當前回合的會話主題對應(yīng)的關(guān)鍵詞為“北京烤鴨”,其在當前回合的回話表
達式中的詞性為“屬性值”,而候選回話表達式為〈實體詞I北京烤鴨>〈屬性詞I供應(yīng)餐館>〈屬性值I全聚德〉,那么可選擇與詞性“屬性值”相同詞性對應(yīng)的數(shù)據(jù)內(nèi)容“全聚德”作為候選會話主題。在其他實施例中,也可選擇與詞性“屬性值”相應(yīng)或者相異的詞性對應(yīng)的數(shù)據(jù)內(nèi)容,如屬性詞中的數(shù)據(jù)內(nèi)容“供應(yīng)餐館”作為候選會話主題。還可選擇所述回話表達式中,與當前主題關(guān)鍵詞不同的關(guān)鍵詞或者關(guān)鍵詞組合作為候選會話主題。
步驟P130、単獨根據(jù)當前回合的回話表達式,或者,根據(jù)當前回合的回話表達式和所述當前回合的會話主題,或者,根據(jù)當前回合的回話表達式和所述候選會話主題,或者,根據(jù)當前回合的回話表達式、所述候選會話主題和所述當前回合的會話主題,生成自然語言回話返回至用戶端。其中,単獨根據(jù)當前回合的回話表達式,或者根據(jù)當前回合的回話表達式和所述當前回合的會話主題,與步驟130所述類似,在此不在詳述。對于“根據(jù)當前回合的回話表達式和所述候選會話主題”,比如當前回合的回話表達式為[く實體I北京〉〈屬性詞I特色〉〈屬性值I北京烤鴨〉,候選會話主題為“全聚德”。那么可調(diào)用回話模板,生成自然語言“知道啊,北京烤鴨很有特色。全聚德你知道嗎? ”。在其他實施例中,如果選擇與詞性“屬性值”相應(yīng)或者相異的詞性對應(yīng)的數(shù)據(jù)內(nèi)容“供應(yīng)餐館”作為候選會話主題,則那么可調(diào)用回話模板,生成自然語言“知道啊,北京烤鴨很有特色。附近就有一個不錯的餐館,有興趣么? ”。對于“根據(jù)當前回合的回話表達式、所述候選會話主題和所述當前回合的會話主題”,比如當前的回話表達式為[く實體I北京 >〈屬性詞I特色 >〈屬性值I北京烤鴨 >,候選會話主題為“全聚德”,當前回合會話主題為“北京烤鴨”,那么可調(diào)用回話模板,生成自然語言“知道啊,北京烤鴨很不錯。全聚德的北京烤鴨你吃過嗎? ”。優(yōu)選的,所述根據(jù)當前回合的回話表達式、所述候選會話主題和所述當前回合的會話主題,生成自然語言回話返回至用戶端包括若當前回合的會話主題不符合預(yù)置的系統(tǒng)偏好信息時,根據(jù)當前回合的回話表達式和所選擇的候選會話主題生成自然語言回話返回至用戶端。當本系統(tǒng)存在自身的偏好信息時,則在回答用戶問題時,則可根據(jù)自身的偏好信息選擇是否主動切換到候選會話主題與用戶進行交流。即根據(jù)設(shè)置的系統(tǒng)偏好信息,來決定是否主動切換到選取候選會話主題。如判斷切換到候選會話主題,則結(jié)合當前回合的回話表達式生成帶有回問句式的自然語言回話,所述回問句式根據(jù)候選會話主題調(diào)用回話模板得到。如此,對話系統(tǒng)的回話內(nèi)容除回答用戶的提問外,還帶有與提問答案相關(guān)的回問句式,真實地模擬了真人聊天的效果。比如,系統(tǒng)偏好信息被用戶設(shè)置為“學(xué)究型”,則結(jié)構(gòu)化數(shù)據(jù)庫中查詢“北京烤鴨”得到的候選會話主題為“歷史”、“做法”、“流派”和“名店”;根據(jù)系統(tǒng)偏好信息選擇候選會話主題為“歷史”,則結(jié)合當前回合的回話表達式生成帶有回問句式的自然語言回話“嗯...北京烤鴨挺好吃的,你知道它的歷史么? ”步驟P140、解析再次輸入的自然語言文本中各詞所屬的詞性,結(jié)合前一回合的會話信息確認對應(yīng)匹配的第二語義表達式;本步驟與實施例一中的步驟140類似,在此不再詳述。步驟P150、針對所述第二語義表達式在結(jié)構(gòu)化知識庫中進行匹配分析,得到對應(yīng)所述第二語義表達式對應(yīng)的回話表達式,結(jié)合前一回合的會話信息確認當前回合的會話主題;轉(zhuǎn)到步驟P123,直至無自然語言文本輸入,對話中止。本步驟中,針對所述第二語義表達式在結(jié)構(gòu)化知識庫中進行匹配分析,得到對應(yīng)所述第二語義表達式對應(yīng)的回話表達式與實施例一中步驟150所述類似,在此不再詳述。
在本實施例中,所述前一回合的會話信息除了包括前一回合的語義表達式、前一回合的回話表達式、前一回合的會話主題之外,在前一回合存在候選會話主題時,則還包括前一回合的候選會話主題。在步驟P150中,存在候選會話主題時,結(jié)合前一回合的會話信息中的會話主題和/或候選會話主題確認當前回合的會話主題。比如,前一回合的會話主題為“北京”、候選會話主題為“北京烤鴨”,而本回合解析用戶輸入的自然語言文本對應(yīng)的語義表達式為[く實體I北京烤鴨 >〈屬性詞I評價 >〈屬性值I >,將會話主題和候選會話主題分別匹配[く實體I北京烤鴨 >〈屬性詞I評價>〈屬性值I >,即將[〈實體I北京烤鴨〉作為當前回合的會話主題?;谠摃捴黝}對應(yīng)的關(guān)鍵詞在結(jié)構(gòu)化知識庫中繼續(xù)進行聯(lián)想查找,即輸入結(jié)構(gòu)化知識庫查找候選會話主題,或是統(tǒng)計全網(wǎng)內(nèi)文本中與“北京烤鴨”共現(xiàn)頻率最高的關(guān)鍵詞。比如,供應(yīng)“北京烤鴨”的餐館作為候選會話主題,或者與“北京烤鴨”原料相同的鴨子一一“填鴨“作為候選會話主題等。即選擇當前回合的會話主題對應(yīng)關(guān)鍵詞在結(jié)構(gòu)化知識庫中的實體詞、屬性詞、屬性值其中之一或者幾種的組合作為候選會話主題。參照圖4,其示出了本申請進ー步優(yōu)選的從第二回合開始的ー種主題對話方法實施例三的流程示意圖。由前述可知構(gòu)建的結(jié)構(gòu)化知識庫可存儲的以“實體詞-屬性詞-屬性值”的三元數(shù)據(jù)結(jié)構(gòu)的表達式。在此基礎(chǔ)之上,從第二回合對話開始的ー種主題對話方法具體可以包括步驟310,接收用戶的自然語言文本;比如前一回合對話為“用戶華山有什么好吃的?系統(tǒng)很多呢,比如羊肉泡饃,知道’同盛祥’么? ”而本回合用戶輸入“那是什么呀? ”步驟320,結(jié)合已記錄的前一回合對話的會話信息,將所述自然語言文本解析為語義表達式;所述會話信息包括會話主題對應(yīng)的關(guān)鍵詞,語義表達式及對應(yīng)的回話表達式,與所述會話主題對應(yīng)的關(guān)鍵詞相關(guān)的候選三元組信息、及從候選三元組中選擇的候選會話主題對應(yīng)的關(guān)鍵詞。前一回合的會話信息包括第一語義表達式く實體I華山>ーく屬性詞I美食>-<屬性值I >;回話表達式〈實體I華山く屬性詞I美食く屬性值I羊肉泡饃>,會話主題華山;候選回話表達式〈實體I羊肉泡饃〈屬性詞I供應(yīng)餐館〈屬性值同盛祥〉;候選會話主題同盛祥,其中,候選會話主題“同盛祥“通過候選回話表達式〈實體I羊肉泡饃く屬性詞I供應(yīng)餐館く屬性值I同盛祥 > 獲得。那么本回合系統(tǒng)首先將“那是什么呀? ”進行解析,首先將“那是什么呀? ”解析為<實體I同盛祥く屬性詞I類別く屬性值I >。優(yōu)選的,結(jié)合已記錄的前一回合對話的會話信息,將所述自然語言文本解析為語義表達式包括通過實體識別模型,將所述自然語言文本中符合實體識別模型的詞串轉(zhuǎn)換為標準格式;解析所述轉(zhuǎn)換后的自然語言文本中各詞所屬的詞性;所述詞性包括實體詞、屬性詞、屬性詞對應(yīng)的屬性值;根據(jù)所述自然語言文本中各詞所屬的詞性、前一回合對話的上下文中的信息,確認自然語言文本對應(yīng)匹配的語義表達式;所述語義表達式由包括實體詞、屬性 詞、屬性詞對應(yīng)的屬性值三元數(shù)據(jù)結(jié)構(gòu)組成。步驟330,將所述語義表達式輸入結(jié)構(gòu)化知識庫進行匹配分析,獲取與語義表達式相匹配的第一三元組信息;所述結(jié)構(gòu)化知識庫中存儲以實體詞、屬性詞、屬性值為三元結(jié)構(gòu)
的第一三元組信息;在本申請中,一個語義表達式可能在結(jié)構(gòu)化知識庫中匹配出多個三元組信息,那么可根據(jù)預(yù)設(shè)規(guī)則從其中選擇ー個或者幾個作為第一三元組信息。將所述〈實體I同盛祥>ーく屬性詞I功能>ーく屬性值I >輸入結(jié)構(gòu)化知識庫進行匹配分析,獲得第一三元組信息〈實體I同盛祥>--く屬性詞I類別>--く屬性值I餐館〉。步驟340,基于所述記錄的前一回合對話的會話信息,所述第一三元組信息,確認當前回合的會話主題對應(yīng)的關(guān)鍵詞;如前所述,將前一回合的會話主題“華山“和前一回合的候選會話主題“同盛祥”與第一三元組信息〈實體I同盛祥>--く屬性詞I功能>--く屬性值I餐館 > 進行匹配,發(fā)現(xiàn)候選會話主題“同盛祥”匹配上,則將當前回合的會話主題確認為“同盛祥”。那么會話主題即從前一回合的“華山”轉(zhuǎn)變?yōu)楫斍盎睾系摹巴⑾椤保褂脩粲X得對話系統(tǒng)中的“人,,十分健談,可繼續(xù)有效的進行多回合溝通。步驟350,結(jié)合用戶的個性化信息,將所述當前回合的會話主題對應(yīng)的關(guān)鍵詞輸入結(jié)構(gòu)化知識庫,檢索獲得與第一三元組信息和用戶個性化信息相關(guān)的候選三元組信息;和/或,結(jié)合預(yù)置的系統(tǒng)的偏好信息,將所述主題對應(yīng)的關(guān)鍵詞輸入結(jié)構(gòu)化知識庫,檢索獲得與第一三元組信息相關(guān)的,并符合系統(tǒng)偏好信息的候選三元組信息;在檢索候選三元組信息過程中可包括步驟S251,結(jié)合用戶的個性化信息和/或預(yù)置的系統(tǒng)的偏好信息,將所述當前回合的會話主題對應(yīng)的關(guān)鍵詞輸入結(jié)構(gòu)化知識庫,檢索包含所述會話主題對應(yīng)的關(guān)鍵詞的三元組信息;比如會話主題對應(yīng)的關(guān)鍵詞“汽車”作為檢索關(guān)鍵詞,用戶不喜歡日本車,而系統(tǒng)不喜歡藍色車,那么將“汽車”輸入結(jié)構(gòu)化知識庫,檢索所有不為日本車,或者也不是藍色車的“汽車”的三元組信息。
步驟S252,計算所述檢索得到的三元組信息與所述第一三元組信息的相關(guān)性;本實施例中,計算所述三元組信息中與第一三元組信息同時出現(xiàn)的詞在第一三元組信息中和檢索得到的三元組信息中各自的占比;然后可比較相同詞性結(jié)構(gòu)中的各詞相似程度。本步驟將步驟S312將第三回話表達式替換為三元組信息后,即類似,在此不再詳述。步驟S253,選擇將相關(guān)性 大于閾值的三元組信息作為候選三元組信息。可設(shè)置ー個相關(guān)性閾值,當相關(guān)性大于所述相關(guān)性閾值時,則將檢索得到的三元組信息作為候選三元組信息。其中,在從相關(guān)性大于所述相關(guān)性閾值的三元組信息中進行選擇時,優(yōu)先選擇同一類別的三元組信息作為候選三元組信息。步驟360,結(jié)合第一三元組信息及當前回合的會話主題對應(yīng)的關(guān)鍵詞,從候選三元組信息中選取候選會話主題對應(yīng)的關(guān)鍵詞;步驟370,結(jié)合所述語義表達式,第一三元組信息、候選三元組信息,候選會話主題對應(yīng)的關(guān)鍵詞,系統(tǒng)的偏好信息,調(diào)用相應(yīng)的回話模板生成自然語言文本;其中,若第一三兀組信息不符合系統(tǒng)偏好信息時,根據(jù)候選會話主題對應(yīng)的關(guān)鍵詞及對應(yīng)的候選三元組信息,選擇相應(yīng)的回話模板生成自然語言文本。步驟380,將所述自然語言文本返回至用戶端。當本系統(tǒng)存在自身的偏好信息時,則在回答用戶問題時,則可根據(jù)自身的偏好信息選擇是否切換到候選會話主題與用戶進行交流。即根據(jù)系統(tǒng)本身對主題的偏好分值,來決定是不是要切換到其他相關(guān)的候選會話主題,如果不存在閾值的系統(tǒng)偏好信息,則采用隨機生成的方式確定要主動切換到其他相關(guān)的候選會話主題?;谇笆霾襟E,對于圖4,在此以ー組實例分析說明實施例的執(zhí)行過程(I)用戶你知道北京有什么特色好吃的嗎?(2)對話系統(tǒng)知道啊,北京烤鴨你吃過嗎?(3)用戶沒有,好吃?(4)對話系統(tǒng)大家的評價都很高,老字號的全聚德你知道嗎?(5)用戶知道了(6)對話系統(tǒng)還有便宜坊,大童烤鴨,鴨王烤鴨也都很有名啊,值得ー試。上面的六句對話的處理過程如下(I)該句話是用戶的第一回合對話,本系統(tǒng)記錄的前一回合對話的上下文信息為空。在步驟310中,接收“你知道北京有什么特色好吃的嗎? ”在步驟320中,結(jié)合實體詞表、屬性詞表、停用詞表、實體識別模型等,將“你知道北京有什么特色好吃的嗎? ”標注為“[停用詞I你知道][城市I北京][疑問詞I有什么][屬性詞I美食][疑問詞I嗎?]”;然后將“[停用詞I你知道][城市I北京][疑問詞I有什么][屬性詞I美食][疑問詞I嗎?]”與語義模板庫進行匹配分析,解析得到語義表達式[〈實體I北京〉〈屬性詞I特色菜X屬性值I >],其中語義表達式的問題類型為疑問句。在步驟330中,將[く實體I北京X屬性詞I特色菜X屬性值I >]輸入結(jié)構(gòu)化知識庫進行匹配分析,獲取與語義表達式相匹配的第一三元組信息,獲取得到[く實體北京〉〈屬性詞I特色菜〉〈屬性值I北京烤鴨〉],即得到相應(yīng)屬性值為“北京烤鴨”。在步驟340中,因為記錄的前一回合的會話信息為空,那么從[〈實體I北京〉〈屬性詞I特色菜〉〈屬性值I北京烤鴨〉]隨機尋找ー個詞性結(jié)構(gòu)或者幾個詞性結(jié)構(gòu)的詞作為當前回合的會話主題對應(yīng)的關(guān)鍵詞,比如選擇了〈屬性值I北京烤鴨 > 作為當前回合的會話主題對應(yīng)的關(guān)鍵詞。在步驟350中,從用戶的個性化信息中沒有發(fā)現(xiàn)對〈屬性值I評價 > 的偏好屬性值為大于8. 0,那么將會話主題對應(yīng)的關(guān)鍵詞“北京烤鴨”輸入結(jié)構(gòu)化知識庫中查詢,查詢包括“北京烤鴨”的所有候選三元組信息吋,如果將〈屬性值I評價 > 低于8. O的候選三元組信息過濾。通過前面描述的方法原理,在結(jié)構(gòu)化知識庫中獲得ー個與[く實體I北京X屬性詞I特色菜 >〈屬性值I北京烤鴨 >]和用戶個性化信息相關(guān)的候選三元組信息[く實體北京烤鴨 >〈屬性詞I供應(yīng)餐館 >〈屬性值I全聚德>]。 在步驟360中,第一三元組信息為[く實體I北京X屬性詞I特色菜X屬性值北京烤鴨 >],當前回合對話的會話主題對應(yīng)的關(guān)鍵詞為〈屬性值I北京烤鴨 >],那么從候選三元組信息[く實體I北京烤鴨 >〈屬性詞I供應(yīng)餐館 >〈屬性值I全聚德 >]中,可保存主題關(guān)鍵詞不變。在步驟370中,結(jié)合所述語義表達式[く實體I北京X屬性詞I特色菜X屬性值 >],第一三元組信息[く實體I北京 >〈屬性詞I特色菜 >〈屬性值I北京烤鴨 >],候選
三元組信息[く實體I北京烤鴨 >〈屬性詞I供應(yīng)餐館 >〈屬性值I全聚德 >],候選會話主題對應(yīng)的關(guān)鍵詞〈實體I北京烤鴨〉,可選擇對應(yīng)的回話模板生成自然語言,即步驟380,將所述自然語言文本返回至用戶端,得到(2)。(2) “知道啊,北京烤鴨你吃過嗎? ”。(3)用戶輸入“沒有,好吃? ”即再次轉(zhuǎn)到步驟310,進行下一次循環(huán)首先被標注為[語義塊I沒有][屬性詞I好吃][疑問詞I嗎?],再進ー步解為語義表達式[く實體Inullx屬性詞I評價>〈屬性值I >,那么根據(jù)已記錄的前一回合的上下文信息,即記錄的前一回合的主題對應(yīng)的關(guān)鍵詞“北京烤鴨”將[く實體Inullx屬性詞I評價 >〈屬性值
>補全為[く實體I北京烤鴨 >〈屬性詞I評價 >〈屬性值I >,將其輸入結(jié)構(gòu)化知識庫獲取三元組信息為[く實體I北京烤鴨 >〈屬性詞I評價 >〈屬性值|9. 7>(其中,該評價值大于8. 0,符合用戶的個性化信息中的偏好,因此沒被過濾)。前一回合記錄的主題對應(yīng)的關(guān)鍵詞為“北京烤鴨”,而得到的三元組信息中也有“北京烤鴨”,那么主題對應(yīng)的關(guān)鍵詞不變。基于該主題對應(yīng)的關(guān)鍵詞可繼續(xù)進行聯(lián)想查找,即輸入結(jié)構(gòu)化知識庫查找候選三元組信息,比如查找得到各第三回話表達式〈實體詞I北京烤鴨 >〈屬性詞I供應(yīng)餐館X屬性值I全聚德 >,〈實體詞I北京烤鴨 >〈屬性詞I供應(yīng)餐館 >〈屬性值I大童烤鴨 >,〈實體詞I北京烤鴨 >〈屬性詞I供應(yīng)餐館 >〈屬性值I便宜坊 >,< 實體詞I北京烤鴨 >〈屬性詞I供應(yīng)餐館X屬性值I鴨王烤鴨〉等,從中選擇了相同類別的三元組信息,即前述屬性均為供應(yīng)餐館的三元組信息。此時對于同一類別的三元組信息,需要對其進行排序,則可對三元組信息中不同的詞進行排序操作,在上述三元組信息中則對屬性值全聚德、大童烤鴨、便宜坊、鴨王烤鴨等進行操作,由于無法直接排序,所以將這些詞輸入結(jié)構(gòu)化知識庫查詢其評價,得到評價值,然后基于這些評價值進行排序,排序完畢得到〈實體詞I北京烤鴨 >〈屬性詞I供應(yīng)餐館X屬性值I全聚德〉排序第一。則可選擇〈實體詞I北京烤鴨X屬性詞I供應(yīng)餐館X屬性值I全聚德 > 作為候選三元組信息,并從中隨機選擇了 “全聚德”作為候選會話主題對應(yīng)的關(guān)鍵詞。則基于當前回合的第一三元組信息的屬性詞,候選三元組信息的屬性詞選擇回話模板,結(jié)合候選會話主題“全聚德”生成自然語言(4)返回。(4)大家的評價都很高,老字號的全聚德你知道嗎?(5)用戶輸入“知道了”,即當用戶輸入無用的語義信息的自然語言文本時,獲取前一回合對話的會話信息,根據(jù)前一回合對話的會話主題對應(yīng)的關(guān)鍵詞在結(jié)構(gòu)化知識庫中匹配,得到相應(yīng)的候選三元組信息后調(diào)用相應(yīng)的回話模板生成自然語言文本。標注用戶的輸 入[語義段I知道了],解析為語義表達是[NULL],沒有有用的語義信息,所以為了將對話繼續(xù)下去我們先從記憶模塊獲取上一次對話的會話信息,也就是查詢語義表達式[く實體北京烤鴨 >〈屬性詞I評價 >〈屬性值I >]、三元組信息[く實體I全聚德 >〈屬性詞I評價X屬性值|9. 7>],和會話主題對應(yīng)的關(guān)鍵詞“北京烤鴨”,可繼續(xù)將“北京烤鴨”輸入結(jié)構(gòu)化知識庫查詢相關(guān)的候選三元組信息,比如還是搜索到候選三元組信息〈實體詞I北京烤鴨X屬性詞I供應(yīng)餐館 >〈屬性值I全聚德 >,< 實體詞I北京烤鴨 >〈屬性詞I供應(yīng)餐館X屬性值I大童烤鴨 >,< 實體詞I北京烤鴨 >〈屬性詞I供應(yīng)餐館 >〈屬性值I便宜坊>,〈實體詞I北京烤鴨 >〈屬性詞I供應(yīng)餐館 >〈屬性值I鴨王烤鴨〉,則可將選取候選三元組信息中選取候選會話主題對應(yīng)的各關(guān)鍵詞,得到“全聚德”、“便宜坊”、“大董烤鴨”,“鴨王烤鴨”,將除“全聚德“外的關(guān)鍵詞“便宜坊”、“大董烤鴨”,“鴨王烤鴨”也調(diào)用相應(yīng)回話模板生成自然語言(6)。(6)還有便宜坊,大童烤鴨,鴨王烤鴨也都很有名啊,值得ー試。參照圖5,其示出了本申請ー種主題對話裝置的結(jié)構(gòu)示意圖,包括第一解析模塊410,用于解析首次輸入的自然語言文本中各詞所屬的詞性,確認對應(yīng)匹配的第一語義表達式;第一聯(lián)想模塊420,用于針對所述第一語義表達式在結(jié)構(gòu)化知識庫中進行匹配分析,得到對應(yīng)所述第一語義表達式對應(yīng)的回話表達式,并確認當前回合的會話主題;答案生成模塊430,用于根據(jù)當前回合的回話表達式和所述當前回合的會話主題,生成自然語言回話返回至用戶端;第二解析模塊440,用于解析再次輸入的自然語言文本中各詞所屬的詞性,結(jié)合前一回合的會話信息確認對應(yīng)匹配的第二語義表達式;第二聯(lián)想模塊450,用于針對所述第二語義表達式在結(jié)構(gòu)化知識庫中進行匹配分析,得到對應(yīng)所述第二語義表達式對應(yīng)的回話表達式,結(jié)合前一回合的會話信息確認當前回合的會話主題;轉(zhuǎn)到答案生成模塊430,直至無自然語言文本輸入。優(yōu)選的,所述聯(lián)想模塊還用于基于當前回合的會話主題從結(jié)構(gòu)化知識庫中匹配分析相關(guān)的候選會話主題。優(yōu)選的,還包括
用戶個性化信息記錄模塊,用于記錄用戶個性化信息;進ー步的,所述聯(lián)想模塊還用于結(jié)合用戶的個性化信息,與當前回合的會話主題從結(jié)構(gòu)化知識庫中進行匹配分析,得到相應(yīng)的符合用戶個性化信息的候選會話主題;和/或系統(tǒng)性格模塊,用于記錄預(yù)置的系統(tǒng)偏好信息;進ー步的,所述聯(lián)想模塊還用于結(jié)合預(yù)置的系統(tǒng)的偏好信息,與當前回合的會話主題從結(jié)構(gòu)化知識庫中進行匹配分析,得到相應(yīng)的符合系統(tǒng)的偏好信息的候選會話主題。優(yōu)選的,所述答案生成模塊還用于根據(jù)當前回合的回話表達式和所述候選會話主題,或者根據(jù)當前回合的回話表達式、所述候選會話主題和所述當前回合的會話主題,生成自然語言回話返回至用戶端。參照圖6,其示出了本申請ー種主題對話裝置的結(jié)構(gòu)示意圖,包括 查詢解析模塊510,包括第一解析模塊,用于解析首次輸入的自然語言文本中各詞所屬的詞性,確認對應(yīng)匹配的第一語義表達式;和,第二解析模塊,用于解析再次輸入的自然語言文本中各詞所屬的詞性,結(jié)合前一回合的會話信息確認對應(yīng)匹配的第二語義表達式;聯(lián)想模塊520,包括第一聯(lián)想模塊,用于針對所述第一語義表達式在結(jié)構(gòu)化知識庫中進行匹配分析,得到對應(yīng)所述第一語義表達式對應(yīng)的回話表達式,并確認當前回合的會話主題;第二聯(lián)想模塊,用于針對所述第二語義表達式在結(jié)構(gòu)化知識庫中進行匹配分析,得到對應(yīng)所述第二語義表達式對應(yīng)的回話表達式,結(jié)合前一回合的會話信息確認當前回合的會話主題;轉(zhuǎn)到答案生成模塊530,直至無自然語言文本輸入。答案生成模塊530,用于根據(jù)當前回合的回話表達式和所述當前回合的會話主題,生成自然語言回話返回至用戶端;記憶模塊540,用于記錄前一回合的會話信息;結(jié)構(gòu)化知識庫550,用于進行所述匹配分析。對于系統(tǒng)實施例而言,由于其與方法實施例基本相似,所以描述的比較簡單,相關(guān)之處參見方法實施例的部分說明即可。本說明書中的各個實施例均采用遞進的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似的部分互相參見即可。最后,還需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個實體或者操作與另ー個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關(guān)系或者順序。以上對本申請所提供的ー種主題對話方法和裝置,進行了詳細介紹,本文中應(yīng)用了具體個例對本申請的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本申請的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本申請的思想,在具體實施方式
及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書自然語言文本不應(yīng)理解為對本申請的限制。
權(quán)利要求
1.ー種主題對話方法,其特征在于,包括 步驟110、解析首次輸入的自然語言文本中各詞所屬的詞性,確認對應(yīng)匹配的第一語義表達式; 步驟120、針對所述第一語義表達式在結(jié)構(gòu)化知識庫中進行匹配分析,得到對應(yīng)所述第一語義表達式對應(yīng)的回話表達式,并確認當前回合的會話主題; 步驟130、根據(jù)當前回合的回話表達式和所述當前回合的會話主題,生成自然語言回話進行返回; 步驟140、解析再次輸入的自然語言文本中各詞所屬的詞性,結(jié)合前一回合的會話信息確認對應(yīng)匹配的第二語義表達式; 步驟150、針對所述第二語義表達式在結(jié)構(gòu)化知識庫中進行匹配分析,得到對應(yīng)所述第ニ語義表達式對應(yīng)的回話表達式,結(jié)合前一回合的會話信息確認當前回合的會話主題;轉(zhuǎn)到步驟130,直至無自然語言文本輸入。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,還包括 基于當前回合的會話主題從結(jié)構(gòu)化知識庫中匹配分析相關(guān)的候選會話主題。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述從結(jié)構(gòu)化知識庫中匹配分析相關(guān)的候選會話主題包括 結(jié)合用戶的個性化信息和/或預(yù)置的系統(tǒng)偏好信息,與當前回合的會話主題在結(jié)構(gòu)化知識庫中進行匹配分析,得到相應(yīng)符合用戶個性化信息和/或系統(tǒng)偏好信息的候選會話主題。
4.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,還包括 根據(jù)當前回合的回話表達式和所述候選會話主題,或者根據(jù)當前回合的回話表達式、所述候選會話主題和所述當前回合的會話主題,生成自然語言回話返回至用戶端。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,還包括 若當前回合的會話主題不符合預(yù)置的系統(tǒng)偏好信息時,根據(jù)當前回合的回話表達式和所選擇的候選會話主題生成自然語言回話返回至用戶端。
6.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,還包括 將所述當前回合的會話主題對應(yīng)的關(guān)鍵詞輸入結(jié)構(gòu)化知識庫,檢索獲得與當前回合的回話表達式相關(guān)的候選回話表達式; 結(jié)合當前回合的回話表達式,及所述當前回合的會話主題對應(yīng)的關(guān)鍵詞,從候選回話表達式中選取對應(yīng)的關(guān)鍵詞作為候選會話主題。
7.根據(jù)權(quán)利要求6所述的方法,其特征在干,將所述當前回合的會話主題對應(yīng)的關(guān)鍵詞輸入結(jié)構(gòu)化知識庫,檢索獲得與當前回合的回話表達式相關(guān)的候選回話表達式包括 將所述當前回合的會話主題對應(yīng)的關(guān)鍵詞輸入結(jié)構(gòu)化知識庫,檢索包含所述關(guān)鍵詞的第三回話表達式; 計算所述第三回話表達式與當前回合的回話表達式的相關(guān)性,將相關(guān)性大于閾值的第三回話表達式作為候選回話表達式。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述將相關(guān)性大于閾值的第三回話表達式作為候選回話表達式進ー步包括 將所述同一知識類別的第三回話表達式進行排序;選擇排序靠前的至少ー個第三回話表達式作為候選回話表達式。
9.根據(jù)權(quán)利要求7或8所述的方法,其特征在于,還包括 從候選回話表達式中,選取與所述當前回合的會話主題對應(yīng)的關(guān)鍵詞在當前回合的回話表達式中的相同詞性對應(yīng)的數(shù)據(jù)內(nèi)容作為候選會話主題。
10.根據(jù)權(quán)利要求I所述的方法,其特征在于,解析所述輸入的自然語言文本中各詞所屬的詞性,包括 遍歷實體詞表,將所述自然語言文本轉(zhuǎn)換為既定格式; 標記所述轉(zhuǎn)換后的自然語言文本中各實體詞所屬的詞性;所述詞性包括實體詞、屬性詞、屬性詞對應(yīng)的屬性值。
11.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述結(jié)合前一回合的會話信息確認當前回合的會話主題包括 結(jié)合前一回合的會話信息中的會話主題和/或候選會話主題確認當前回合的會話主題。
12.根據(jù)權(quán)利要求I所述的方法,其特征在于,還包括 通過從全網(wǎng)的各網(wǎng)頁中提取的實體詞、所述實體詞對應(yīng)的屬性詞和屬性值構(gòu)建所述結(jié)構(gòu)化知識庫。
13.根據(jù)權(quán)利要求12所述的方法,其特征在于,所述結(jié)構(gòu)化知識庫構(gòu)建時包括 針對抓取的同一知識類別的各知識網(wǎng)站,利用相應(yīng)知識網(wǎng)站的解析模板解析各知識網(wǎng)站的網(wǎng)頁內(nèi)容,獲得實體詞及與實體詞相應(yīng)的屬性詞和屬性值; 針對同一實體詞,以實體詞、實體詞對應(yīng)的屬性詞、屬性詞對應(yīng)的屬性值的數(shù)據(jù)結(jié)構(gòu)存入結(jié)構(gòu)化知識庫。
14.ー種主題對話裝置,其特征在于,包括 第一解析模塊,用于解析首次輸入的自然語言文本中各詞所屬的詞性,確認對應(yīng)匹配的第一語義表達式; 第一聯(lián)想模塊,用于針對所述第一語義表達式在結(jié)構(gòu)化知識庫中進行匹配分析,得到對應(yīng)所述第一語義表達式對應(yīng)的回話表達式,并確認當前回合的會話主題; 答案生成模塊,用于根據(jù)當前回合的回話表達式和所述當前回合的會話主題,生成自然語言回話進行返回; 第二解析模塊,用于解析再次輸入的自然語言文本中各詞所屬的詞性,結(jié)合前一回合的會話信息確認對應(yīng)匹配的第二語義表達式; 第二聯(lián)想模塊,用于針對所述第二語義表達式在結(jié)構(gòu)化知識庫中進行匹配分析,得到對應(yīng)所述第二語義表達式對應(yīng)的回話表達式,結(jié)合前一回合的會話信息確認當前回合的會話主題;轉(zhuǎn)到答案生成模塊,直至無自然語言文本輸入。
15.根據(jù)權(quán)利要求14所述的系統(tǒng),其特征在于,所述聯(lián)想模塊還用于 基于當前回合的會話主題從結(jié)構(gòu)化知識庫中匹配分析相關(guān)的候選會話主題。
16.根據(jù)權(quán)利要求15所述的系統(tǒng),其特征在于,還包括 用戶個性化信息記錄模塊,用于記錄用戶個性化信息; 進ー步的,所述聯(lián)想模塊還用于結(jié)合用戶的個性化信息,與當前回合的會話主題從結(jié)構(gòu)化知識庫中進行匹配分析,得到相應(yīng)的符合用戶個性化信息的候選會話主題;和/或系統(tǒng)性格模塊,用于記錄預(yù)置的系統(tǒng)偏好信息; 進ー步的,所述聯(lián)想模塊還用于結(jié)合預(yù)置的系統(tǒng)的偏好信息,與當前回合的會話主題從結(jié)構(gòu)化知識庫中進行匹配分析,得到相應(yīng)的的符合系統(tǒng)的偏好信息的候選會話主題。
17.根據(jù)權(quán)利要求15或16所述的系統(tǒng),其特征在于,所述答案生成模塊還用于根據(jù)當前回合的回話表達式和所述候選會話主題,或者根據(jù)當前回合的回話表達式、所述候選會話主題和所述當前回合的會話主題,生成自然語言回話返回至用戶端。
全文摘要
本申請?zhí)峁┝艘环N主題對話方法和裝置,涉及計算機技術(shù)領(lǐng)域。方法包括解析首次輸入的自然語言文本,確認第一語義表達式;針對第一語義表達式匹配分析,得到回話表達式,并確認當前回合的會話主題;根據(jù)回話表達式和當前回合的會話主題生成自然語言回話進行返回;解析再次輸入的自然語言文本,確認第二語義表達式;針對第二語義表達式進行匹配分析,得到回話表達式,確認當前回合的會話主題;轉(zhuǎn)到下一回合對話直至結(jié)束。本申請使用戶基于會話主題與對話系統(tǒng)進行交流,使對話回合之間保持連貫性,回話對應(yīng)的語義與用戶的輸入查詢一致,且結(jié)合會話主題反問用戶,使對話系統(tǒng)模擬真人聊天,準確連貫地響應(yīng)用戶的自然語言輸入查詢,與用戶積極互動。
文檔編號G06F17/28GK102866990SQ20121029792
公開日2013年1月9日 申請日期2012年8月20日 優(yōu)先權(quán)日2012年8月20日
發(fā)明者張帆 申請人:北京搜狗信息服務(wù)有限公司, 北京搜狗科技發(fā)展有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
麟游县| 大邑县| 常山县| 南木林县| 昆山市| 漠河县| 三都| 东山县| 清河县| 长海县| 新蔡县| 洛宁县| 沭阳县| 图片| 古浪县| 随州市| 德安县| 台东县| 鄱阳县| 那坡县| 社会| 招远市| 监利县| 哈巴河县| 开江县| 晋宁县| 河西区| 南江县| 龙海市| 吴桥县| 蓬溪县| 吉木乃县| 郴州市| 舒兰市| 长宁县| 乌鲁木齐县| 崇礼县| 镇宁| 仁化县| 赤水市| 乐山市|