本發(fā)明涉及智能識別技術(shù)領(lǐng)域,具體涉及一種人機(jī)對話系統(tǒng)中基于時間線記憶的認(rèn)知方法及裝置。
背景技術(shù):
現(xiàn)有的人機(jī)對話系統(tǒng)中,對于用戶事件活動相關(guān)話題的理解與潛在邏輯的推理普遍依賴于規(guī)則系統(tǒng)的預(yù)設(shè)規(guī)則?;居|發(fā)形式或由用戶發(fā)出“指令式”的對話,或由機(jī)器識別固定的對話句型,導(dǎo)致對話無法深入并且不符合人類自然的交互習(xí)慣。
技術(shù)實(shí)現(xiàn)要素:
針對現(xiàn)有技術(shù)中的缺陷,本發(fā)明提供了一種人機(jī)對話系統(tǒng)中基于時間線記憶的認(rèn)知方法及裝置,將用戶表述的事件活動抽象為時間線,并在后續(xù)的用戶對話中根據(jù)關(guān)鍵詞進(jìn)行記憶檢索,實(shí)現(xiàn)對用戶活動的認(rèn)知,使人機(jī)對話更加符合人類自然的交互習(xí)慣。
第一方面,本發(fā)明提供的一種人機(jī)對話系統(tǒng)中基于時間線記憶的認(rèn)知方法,包括:抽取對話信號中的多元信號;根據(jù)所述多元信號得到活動要素;按所述活動要素中的時間要素為順序,將所述活動要素添加到用戶時間線中。
本實(shí)施例提供的人機(jī)對話系統(tǒng)中基于時間線記憶的認(rèn)知現(xiàn)方法,實(shí)現(xiàn)了一種基于時間線自動提取記憶的方法,依賴于對話信號中的時間表達(dá)式、話題、語句類型、情緒、語言行為、語義角色標(biāo)準(zhǔn)、人稱命名實(shí)體、地點(diǎn)命名實(shí)體、等,將用戶表述的事件活動抽象為時間線,基于用戶時間線構(gòu)建對用戶活動的記憶認(rèn)知,使得機(jī)器人更加智能化和人性化。
優(yōu)選地,還包括:對所述對話信號進(jìn)行句型分析;所述按所述活動要素中的時間要素為順序,將所述活動要素添加到用戶時間線中,包括:若所述對話信號的句型為陳述句,則按所述活動要素中的時間要素為順序,將所述活動要素添加到用戶時間線中;若所述對話信號的句型為疑問句,則在用戶時間線中檢索與所述活動要素匹配的記錄,根據(jù)檢索到的記錄進(jìn)行對話回答。
優(yōu)選地,所述按所述活動要素中的時間要素為順序,將所述活動要素添加到用戶時間線中,包括:在用戶時間線中檢索與所述活動要素匹配的記錄;若檢索到匹配的記錄,則根據(jù)所述活動要素對匹配到的記錄進(jìn)行補(bǔ)全;若未檢索到匹配的記錄,則根據(jù)所述時間要素生成新增記錄,按所述活動要素中的時間要素為順序,將所述新增記錄添加到用戶時間線中。
優(yōu)選地,還包括:在所述用戶時間線中檢索與所述新增記錄存在沖突的記錄,若存在沖突,則向用戶發(fā)出提醒。
優(yōu)選地,所述多元信號包括時間表達(dá)式、人稱命名實(shí)體、地點(diǎn)命名實(shí)體、語義角色標(biāo)注、話題、句型、情緒、語言行為中的至少一種。
優(yōu)選地,所述活動要素包括時間要素、地點(diǎn)要素、人物要素、事件要素中的至少一種。
第二方面,本發(fā)明提供的一種人機(jī)對話系統(tǒng)中基于時間線記憶的認(rèn)知裝置,包括:信號抽取模塊,用于抽取對話信號中的多元信號;要素提取模塊,用于根據(jù)所述多元信號得到活動要素;記憶添加模塊,用于按所述活動要素中的時間要素為順序,將所述活動要素添加到用戶時間線中。
本實(shí)施例提供的人機(jī)對話系統(tǒng)中基于時間線記憶的認(rèn)知現(xiàn)裝置,實(shí)現(xiàn)了一種基于時間線自動提取記憶的方法,依賴于對話信號中的時間表達(dá)式、話題、語句類型、情緒、語言行為、語義角色標(biāo)準(zhǔn)、人稱命名實(shí)體、地點(diǎn)命名實(shí)體、等,將用戶表述的事件活動抽象為時間線,基于用戶時間線構(gòu)建對用戶活動的記憶認(rèn)知,使得機(jī)器人更加智能化和人性化。
優(yōu)選地,還包括句型分析模塊,用于對所述對話信號進(jìn)行句型分析;所述記憶添加模塊具體用于:若所述對話信號的句型為陳述句,則按所述活動要素中的時間要素為順序,將所述活動要素添加到用戶時間線中;若所述對話信號的句型為疑問句,則在用戶時間線中檢索與所述活動要素匹配的記錄,根據(jù)檢索到的記錄進(jìn)行對話回答。
優(yōu)選地,所述記憶添加模塊中,按所述活動要素中的時間要素為順序,將所述活動要素添加到用戶時間線中,包括:在用戶時間線中檢索與所述活動要素匹配的記錄;若檢索到匹配的記錄,則根據(jù)所述活動要素對匹配到的記錄進(jìn)行補(bǔ)全;若未檢索到匹配的記錄,則根據(jù)所述時間要素生成新增記錄,按所述活動要素中的時間要素為順序,將所述新增記錄添加到用戶時間線中。
優(yōu)選地,還包括沖突檢測模塊,用于在所述用戶時間線中檢索與所述新增記錄存在沖突的記錄,若存在沖突,則向用戶發(fā)出提醒。
附圖說明
圖1示出了本發(fā)明實(shí)施例所提供的人機(jī)對話系統(tǒng)中基于時間線記憶的認(rèn)知方法的流程圖;
圖2示出了本發(fā)明實(shí)施例所提供的人機(jī)對話系統(tǒng)中基于時間線記憶的認(rèn)知裝置的結(jié)構(gòu)框圖。
具體實(shí)施方式
下面將結(jié)合附圖對本發(fā)明技術(shù)方案的實(shí)施例進(jìn)行詳細(xì)的描述。以下實(shí)施例僅用于更加清楚地說明本發(fā)明的技術(shù)方案,因此只是作為示例,而不能以此來限制本發(fā)明的保護(hù)范圍。
需要注意的是,除非另有說明,本申請使用的技術(shù)術(shù)語或者科學(xué)術(shù)語應(yīng)當(dāng)為本發(fā)明所屬領(lǐng)域技術(shù)人員所理解的通常意義。
如圖1所示,本實(shí)施例提供的一種人機(jī)對話系統(tǒng)中基于時間線記憶的認(rèn)知現(xiàn)方法,包括:
步驟s1,抽取對話信號中的多元信號。
其中,多元信號包括但不限于以下內(nèi)容時間表達(dá)式、人稱命名實(shí)體、地點(diǎn)命名實(shí)體、語義角色標(biāo)注、話題、情緒、語言行為。在抽取對話信號中的多元信號時,不一定能抽取到上述所有內(nèi)容,也不需要抽取到所有內(nèi)容。上述多元信號的獲取方法可以采用既有方案實(shí)現(xiàn),有較高的準(zhǔn)確度。
時間表達(dá)式包括日期、時間,通過現(xiàn)有的基于機(jī)器學(xué)習(xí)的crfmodel(條件隨機(jī)場模型)訓(xùn)練標(biāo)注時間表達(dá)式,并通過nlp分詞和詞性標(biāo)注處理后對表達(dá)式進(jìn)行歸一化處理,去除“的”等助詞,如果是“16年11月1日”通過正則表達(dá)式識別“年”“月”“日”部分并進(jìn)行標(biāo)準(zhǔn)化,如果是“上周一”“下周三”等推算格式,則進(jìn)行對應(yīng)的時間推算。時間表達(dá)式采用標(biāo)準(zhǔn)格式,類似于“2016年11月1日15:30”的結(jié)構(gòu)化格式,并且是基于當(dāng)前時間基線計算的,如昨天,明天,下周一等等,但是概括的時間只精確到日期,如明天是“2016年11月1日”,明天下午三點(diǎn)是“2016年11月1日15:00”。
命名實(shí)體就是人名、機(jī)構(gòu)名、地名以及其他所有以名稱為標(biāo)識的實(shí)體,常見有機(jī)構(gòu)名、人名、地名等,也可以有時間、日期、數(shù)量短語等。人稱命名實(shí)體指人名,通過現(xiàn)有的基于機(jī)器學(xué)習(xí)的crfmodel、關(guān)鍵詞詞典與正則表達(dá)式規(guī)則的識別方法識別人稱命名實(shí)體。地點(diǎn)命名實(shí)體指地名,通過現(xiàn)有的基于機(jī)器學(xué)習(xí)的crfmodel、關(guān)鍵詞詞典與正則表達(dá)式規(guī)則的識別方法識別地點(diǎn)命名實(shí)體。
語義角色標(biāo)注是句子語法結(jié)構(gòu)樹的抽象,表明了句子各短語的依賴修飾關(guān)系,即句子的施事和受事關(guān)系,例如:“我明天去西單看電影”,施事是“我看”和“我去”,受事為“看電影”,地點(diǎn)修飾為“去西單”。
通過現(xiàn)有的對nlp(naturallanguageprocessing,自然語言處理)依存句法樹進(jìn)行集束搜索和聯(lián)合學(xué)習(xí)的方式標(biāo)注句子的語義角色標(biāo)注。
話題是對話中常用語/短語的語義標(biāo)注,例如“我明天去西單看電影”,其中“看電影”的話題是“娛樂休閑活動”,“西單”是“北京商圈”,句子成分中的話題標(biāo)注是作為用戶記憶層次分類的依據(jù),在記憶用戶“明天去看電影”的同時,能夠理解用戶的“看電影”活動要素屬于“娛樂休閑活動”,地點(diǎn)要素“西單”屬于“北京商圈”,便于輔助用戶的記憶檢索。例如用戶詢問“明天我要去玩什么?”,其中“玩”對應(yīng)的話題為“娛樂休閑活動”,這樣對應(yīng)可以將用戶看電影的活動檢索出來。話題的獲取需要建立人工分類的常識辭典庫,在此之上結(jié)合lstm深度學(xué)習(xí)算法識別多輪對話下的話題。
情緒代表了對話中的喜、怒、中性狀態(tài),用戶強(qiáng)烈情緒狀態(tài)下的事件通常是比較重要的記憶,基于deeplearning(深度學(xué)習(xí))模型訓(xùn)練識別句子的情緒。
語言行為代表了對話的行為傾向是陳述、確認(rèn)、道歉、肯定/否定意見、疑問、指責(zé)等等,是識別對話語義中活動事件需要記憶的重要依據(jù),通過現(xiàn)有的deeplearningcnn(深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò))模型訓(xùn)練識別語言行為。
步驟s2,根據(jù)多元信號得到活動要素。
其中,對用戶對話中表述的活動可以抽象為時間,地點(diǎn),人物,事件這四要素,因此,步驟s2中的活動要素包括時間要素、地點(diǎn)要素、人物要素、時間要素。但各個活動要素并非是記憶認(rèn)知的不可或缺的部分,實(shí)際中,根據(jù)一條對話信號可能只能獲取其中的一個或多個活動要素,其它活動要素可以在多輪對話過程中進(jìn)行信息補(bǔ)全。在人機(jī)交互過程中,根據(jù)對話信號中的時間表達(dá)式抽取時間要素;根據(jù)人稱以及人稱命名實(shí)體識別人物得到人物要素,或通過對語義角色標(biāo)注中的施事進(jìn)行人稱命名實(shí)體匹配得到人物要素;根據(jù)地點(diǎn)命名實(shí)體識別地點(diǎn)得到地點(diǎn)要素,或通過對語義角色標(biāo)注中的地點(diǎn)修飾進(jìn)行地點(diǎn)命名實(shí)體匹配得到地點(diǎn)要素;根據(jù)語義角色標(biāo)注(semanticrolelabeling)與話題等多元信號識別事件要素,如根據(jù)語義角色標(biāo)注中施受關(guān)系將句子中的活動成分抽取為事件,以“明天我要帶女朋友去看電影”為例,事件為“看電影”。
步驟s3,按活動要素中的時間要素為順序,將活動要素添加到用戶時間線中。
其中,添加到用戶時間線中的活動要素按預(yù)先設(shè)定好的格式進(jìn)行存儲,例如:“時間要素-地點(diǎn)要素-人物要素-事件要素”,存儲的記錄中除時間要素外各個活動要素可以缺省。
本實(shí)施例提供的人機(jī)對話系統(tǒng)中基于時間線記憶的認(rèn)知現(xiàn)方法,實(shí)現(xiàn)了一種基于時間線自動提取記憶的方法,依賴于對話信號中的時間表達(dá)式、話題、語句類型、情緒、語言行為、語義角色標(biāo)準(zhǔn)、人稱命名實(shí)體、地點(diǎn)命名實(shí)體、等,將用戶表述的事件活動抽象為時間線,基于用戶時間線構(gòu)建對用戶活動的記憶認(rèn)知,使得機(jī)器人更加智能化和人性化。
為了使機(jī)器人更加智能,需要針機(jī)器人對不同的句型作出不同的回應(yīng),為了實(shí)現(xiàn)上述功能,本實(shí)施例提供的方法還包括:對話信號進(jìn)行句型分析。具體地,通過現(xiàn)有的基于aimlartificialintelligencemarkuplanguage(人工智能標(biāo)記語言)與正則表達(dá)式規(guī)則的方法識別對話信號的句型,并可以結(jié)合多元信號中的情緒、語言行為提高判斷對話信號的句型的精確度。
基于上述句型分析的結(jié)果,步驟s3具體包括:
步驟s31,若對話信號的句型為陳述句,則按活動要素中的時間要素為順序,將活動要素添加到用戶時間線中。
步驟s32,若對話信號的句型為疑問句,則在用戶時間線中檢索與活動要素匹配的記錄,根據(jù)檢索到的記錄進(jìn)行對話回答。
在上述任一方法實(shí)施例的基礎(chǔ)上,可以綜合多輪對話中提取的活動要素,對用戶時間線中的記錄進(jìn)行補(bǔ)全,使機(jī)器人更加的智能化。具體地,步驟s3中,按活動要素中的時間要素為順序,將活動要素添加到用戶時間線中,包括:在用戶時間線中檢索與活動要素匹配的記錄;若檢索到匹配的記錄,則根據(jù)活動要素對匹配到的記錄進(jìn)行補(bǔ)全;若未檢索到匹配的記錄,則根據(jù)時間要素生成新增記錄,按活動要素中的時間要素為順序,將新增記錄添加到用戶時間線中。
在涉及到多輪對話的過程中,可能第一輪對話只獲取到人物要素和事件要素,如用戶:“我要去看電影”,在時間線中新增“用戶-時間缺省-地點(diǎn)缺省-看電影”;在第二輪對話中,機(jī)器人:“去哪看電影?”,用戶:“去西單看電影”,則提取地點(diǎn)要素“西單”、事件要素“看電影”,根據(jù)“看電影”這一關(guān)鍵詞檢索到第一條記錄并進(jìn)行補(bǔ)全得到“用戶-時間缺省-西單-看電影”,第三輪對話,機(jī)器人:“什么時候去看電影?”,用戶:“明天去看電影”,則根據(jù)時間表達(dá)式“明天”得到時間要素“2016年11月2日”(假設(shè)今天是2016年11月1日)、事件要素“看電影”,根據(jù)“看電影”這一關(guān)鍵詞檢索到第一條記錄并進(jìn)行補(bǔ)全得到“用戶-2016年11月2日-西單-看電影”。
為了防止用戶時間線中的記錄發(fā)生沖突,本實(shí)施例提供的方法還包括:在用戶時間線中檢索與新增記錄存在沖突的記錄,若存在沖突,則向用戶發(fā)出提醒。在進(jìn)行沖突檢索時,可以根據(jù)用戶對話中的關(guān)鍵詞或時間要素進(jìn)行記憶檢索。
這種沖突判定典型應(yīng)用于用戶的行程安排,例如用戶一周之前就提過“下周三下午四點(diǎn)和老板開會”,時間線記憶為“2016年11月1日16:00-地點(diǎn)缺省-老板-和老板開會”,如果用戶周二在對話中說“明天下午開會”,則按照用戶所提的“明天下午”(2016年11月1日12:00–18:00)和“開會”關(guān)鍵詞進(jìn)行檢索,現(xiàn)有的“開會”活動的時間在查詢范圍之內(nèi),表明沒有沖突,則機(jī)器人回復(fù):“對呀,下午四點(diǎn)和老板開會”;如用戶說“明天要去看電影”,按照用戶所提的“明天”(2016年11月1日)和“看電影”進(jìn)行檢索,現(xiàn)有的“開會”活動在2016年11月1日范圍內(nèi),表明可能存在沖突,機(jī)器人回復(fù)“別忘了下午四點(diǎn)和老板開會”。通過記憶檢索,給用戶提供了沖突提醒,提供了更好的用戶體驗(yàn)。
本實(shí)施例提供的方法,通過挖掘人機(jī)交互對話的自然語言信息,并將這些信息轉(zhuǎn)化成可用于記憶認(rèn)知的多元信號,根據(jù)多元信號將用戶活動抽象為通用的活動要素,便于利用多元信號進(jìn)行記憶的補(bǔ)全與檢索,將用戶活動記憶組織為時間線,有利于排序與構(gòu)建索引實(shí)現(xiàn)快速的記憶檢索,機(jī)器能夠識別不同的對話句型,使人機(jī)對話更加符合人類自然的交互習(xí)慣。
基于與上述人機(jī)對話系統(tǒng)中基于時間線記憶的認(rèn)知方法相同的發(fā)明構(gòu)思,本實(shí)施例提供了一種人機(jī)對話系統(tǒng)中基于時間線記憶的認(rèn)知裝置,如圖2所示包括:信號抽取模塊,用于抽取對話信號中的多元信號;要素提取模塊,用于根據(jù)多元信號得到活動要素;記憶添加模塊,用于按活動要素中的時間要素為順序,將活動要素添加到用戶時間線中。
本實(shí)施例提供的人機(jī)對話系統(tǒng)中基于時間線記憶的認(rèn)知現(xiàn)裝置,實(shí)現(xiàn)了一種基于時間線自動提取記憶的方法,依賴于對話信號中的時間表達(dá)式、話題、語句類型、情緒、語言行為、語義角色標(biāo)準(zhǔn)、人稱命名實(shí)體、地點(diǎn)命名實(shí)體、等,將用戶表述的事件活動抽象為時間線,基于用戶時間線構(gòu)建對用戶活動的記憶認(rèn)知,使得機(jī)器人更加智能化和人性化。
優(yōu)選地,本實(shí)施例提供的裝置還包括句型分析模塊,用于對對話信號進(jìn)行句型分析;相應(yīng)地,記憶添加模塊具體用于:若對話信號的句型為陳述句,則按活動要素中的時間要素為順序,將活動要素添加到用戶時間線中;若對話信號的句型為疑問句,則在用戶時間線中檢索與活動要素匹配的記錄,根據(jù)檢索到的記錄進(jìn)行對話回答。
優(yōu)選地,記憶添加模塊中,按活動要素中的時間要素為順序,將活動要素添加到用戶時間線中,包括:在用戶時間線中檢索與活動要素匹配的記錄;若檢索到匹配的記錄,則根據(jù)活動要素對匹配到的記錄進(jìn)行補(bǔ)全;若未檢索到匹配的記錄,則根據(jù)時間要素生成新增記錄,按活動要素中的時間要素為順序,將新增記錄添加到用戶時間線中。
優(yōu)選地,還包括沖突檢測模塊,用于在用戶時間線中檢索與新增記錄存在沖突的記錄,若存在沖突,則向用戶發(fā)出提醒。
本實(shí)施例提供的裝置,通過挖掘人機(jī)交互對話的自然語言信息,并將這些信息轉(zhuǎn)化成可用于記憶認(rèn)知的多元信號,根據(jù)多元信號將用戶活動抽象為通用的活動要素,便于利用多元信號進(jìn)行記憶的補(bǔ)全與檢索,將用戶活動記憶組織為時間線,有利于排序與構(gòu)建索引,實(shí)現(xiàn)快速的記憶檢索,機(jī)器能夠識別不同的對話句型,使人機(jī)對話更加符合人類自然的交互習(xí)慣。
最后應(yīng)說明的是:以上各實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述各實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求和說明書的范圍當(dāng)中。