欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

對話管理方法和裝置與流程

文檔序號:12465485閱讀:424來源:國知局
對話管理方法和裝置與流程

本申請涉及自然語言處理技術(shù)領(lǐng)域,尤其涉及一種對話管理方法和裝置。



背景技術(shù):

隨著智能化時(shí)代的到來,人機(jī)交互方式也越來越符合人類的交互方式,從鍵盤交互,到圖形界面交互,再到目前的通過聲音圖像的多媒體交互,實(shí)現(xiàn)人類和機(jī)器的更加自然更加人性化的交互方式。交互過程中,需要通過對話管理方法根據(jù)用戶的請求,確定用戶意圖后,將相應(yīng)響應(yīng)結(jié)果反饋給用戶。

相關(guān)技術(shù)中,對話管理方法一般是基于規(guī)則的方法確定用戶意圖后,找到相應(yīng)響應(yīng)文本數(shù)據(jù)反饋給用戶,所述規(guī)則需要預(yù)先收集大量對話文本數(shù)據(jù)后,人工分析出對話邏輯后,確定相應(yīng)規(guī)則,所述規(guī)則一般只能針對對話邏輯出現(xiàn)過的語料,當(dāng)對話邏輯未出現(xiàn)時(shí),則很難適用,規(guī)則存在局限性,并且很難完全覆蓋所有對話邏輯;人工分析對話文本數(shù)據(jù)的對話邏輯,工作量較大,工作效率較低。因此,如何高效準(zhǔn)確地根據(jù)用戶文本數(shù)據(jù)確定用戶意圖對人機(jī)交互的用戶體驗(yàn)尤為重要。



技術(shù)實(shí)現(xiàn)要素:

本申請旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。

為此,本申請的一個(gè)目的在于提出一種對話管理方法,該方法可以高效準(zhǔn)確地確定出用戶意圖,進(jìn)而高效準(zhǔn)確地反饋響應(yīng)文本數(shù)據(jù)。

本申請的另一個(gè)目的在于提出一種對話管理裝置。

為達(dá)到上述目的,本申請第一方面實(shí)施例提出的對話管理方法,包括:獲取待處理用戶文本數(shù)據(jù),以及待處理用戶文本數(shù)據(jù)對應(yīng)的歷史數(shù)據(jù);分別對所述待處理用戶文本數(shù)據(jù)和所述歷史數(shù)據(jù)進(jìn)行特征提取,提取得到所述待處理用戶文本數(shù)據(jù)和所述歷史數(shù)據(jù)分別對應(yīng)的句子語義特征;根據(jù)預(yù)先構(gòu)建的對話管理模型和提取得到的句子語義特征,確定用戶意圖;根據(jù)所述用戶意圖,反饋與所述待處理用戶文本數(shù)據(jù)對應(yīng)的響應(yīng)文本數(shù)據(jù)。

本申請第一方面實(shí)施例提出的對話管理方法,通過根據(jù)對話管理模型確定用戶意圖,可以提高用戶意圖確定的準(zhǔn)確性,并且不需要人工總結(jié)規(guī)則,大大提高了對話管理的效果,從而可以在對話管理時(shí)高效準(zhǔn)確地確定出用戶意圖,進(jìn)而高效準(zhǔn)確地反饋響應(yīng)文本數(shù)據(jù)。

為達(dá)到上述目的,本申請第二方面實(shí)施例提出的對話管理裝置,包括:獲取模塊,用于獲取待處理用戶文本數(shù)據(jù),以及待處理用戶文本數(shù)據(jù)對應(yīng)的歷史數(shù)據(jù);提取模塊,用于分別對所述待處理用戶文本數(shù)據(jù)和所述歷史數(shù)據(jù)進(jìn)行特征提取,提取得到所述待處理用戶文本數(shù)據(jù)和所述歷史數(shù)據(jù)分別對應(yīng)的句子語義特征;確定模塊,用于根據(jù)預(yù)先構(gòu)建的對話管理模型和提取得到的句子語義特征,確定用戶意圖;反饋模塊,用于根據(jù)所述用戶意圖,反饋與所述待處理用戶文本數(shù)據(jù)對應(yīng)的響應(yīng)文本數(shù)據(jù)。

本申請第二方面實(shí)施例提出的對話管理裝置,通過根據(jù)對話管理模型確定用戶意圖,可以提高用戶意圖確定的準(zhǔn)確性,并且不需要人工總結(jié)規(guī)則,大大提高了對話管理的效果,從而可以在對話管理時(shí)高效準(zhǔn)確地確定出用戶意圖,進(jìn)而高效準(zhǔn)確地反饋響應(yīng)文本數(shù)據(jù)。

本申請附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本申請的實(shí)踐了解到。

附圖說明

本申請上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對實(shí)施例的描述中將變得明顯和容易理解,其中:

圖1是本申請一個(gè)實(shí)施例提出的對話管理方法的流程示意圖;

圖2是本申請另一個(gè)實(shí)施例提出的對話管理方法的流程示意圖;

圖3是本申請實(shí)施例中對待提取文本數(shù)據(jù)進(jìn)行特征提取的方法的流程示意圖;

圖4是本申請實(shí)施例中確定用戶文本數(shù)據(jù)樣本對應(yīng)的用戶意圖的方法的流程示意圖;

圖5是本申請實(shí)施例中對話管理模型的一種網(wǎng)絡(luò)結(jié)構(gòu)示意圖;

圖6是本申請一個(gè)實(shí)施例提出的對話管理裝置的結(jié)構(gòu)示意圖;

圖7是本申請另一個(gè)實(shí)施例提出的對話管理裝置的結(jié)構(gòu)示意圖。

具體實(shí)施方式

下面詳細(xì)描述本申請的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號表示相同或類似的模塊或具有相同或類似功能的模塊。下面通過參考附圖描述的實(shí)施例是示例性的,僅用于解釋本申請,而不能理解為對本申請的限制。相反,本申請的實(shí)施例包括落入所附加權(quán)利要求書的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同物。

圖1是本申請一個(gè)實(shí)施例提出的對話管理方法的流程示意圖。

如圖1所示,本實(shí)施例的方法包括:

S11:獲取待處理用戶文本數(shù)據(jù),以及待處理用戶文本數(shù)據(jù)對應(yīng)的歷史數(shù)據(jù)。

用戶文本數(shù)據(jù)是指人機(jī)交互過程中用戶主動發(fā)出的文本數(shù)據(jù),可以為直接輸入到系統(tǒng)中的用戶文本數(shù)據(jù),也可以為用戶使用語音數(shù)據(jù)輸入后,對所述語音數(shù)據(jù)進(jìn)行語音識別后得到的識別文本。

人機(jī)交互過程中,可以以一句用戶文本數(shù)據(jù)與一句響應(yīng)文本數(shù)據(jù)交替出現(xiàn)的形式進(jìn)行,響應(yīng)文本數(shù)據(jù)是指機(jī)器反饋給用戶的與用戶文本數(shù)據(jù)對應(yīng)的數(shù)據(jù)。一句用戶文本數(shù)據(jù)及對應(yīng)的一句響應(yīng)文本數(shù)據(jù)可以組成一輪對話文本數(shù)據(jù)。在人機(jī)交互過程中,可以包括一輪或多輪對話文本數(shù)據(jù),多輪指至少兩輪。

在處理時(shí),可以分別將每輪對話文本數(shù)據(jù)中的用戶文本數(shù)據(jù)作為待處理用戶文本數(shù)據(jù)。在人機(jī)交互過程中可以記錄對話文本數(shù)據(jù),以在記錄的數(shù)據(jù)中獲取到待處理用戶文本數(shù)據(jù)對應(yīng)的歷史數(shù)據(jù)。

歷史數(shù)據(jù)是指待處理用戶文本數(shù)據(jù)之前的預(yù)設(shè)N輪的對話文本數(shù)據(jù),N可以根據(jù)應(yīng)用需求設(shè)置。如上所示,對話文本數(shù)據(jù)包括用戶文本數(shù)據(jù)和響應(yīng)文本數(shù)據(jù),則歷史數(shù)據(jù)包括歷史用戶文本數(shù)據(jù)和歷史響應(yīng)文本數(shù)據(jù)。如果待處理用戶文本數(shù)據(jù)是第一輪交互中的用戶文本數(shù)據(jù),則對應(yīng)的歷史數(shù)據(jù)為空。

S12:分別對所述待處理用戶文本數(shù)據(jù)和所述歷史數(shù)據(jù)進(jìn)行特征提取,提取得到所述待處理用戶文本數(shù)據(jù)和所述歷史數(shù)據(jù)分別對應(yīng)的句子語義特征。

由于需要分別對待處理用戶文本數(shù)據(jù)和歷史數(shù)據(jù)進(jìn)行特征提取,因此,待處理用戶文本數(shù)據(jù)和歷史數(shù)據(jù)可以統(tǒng)稱為待提取文本數(shù)據(jù),而在后續(xù)內(nèi)容中,還會涉及對樣本進(jìn)行特征提取的步驟,因此,樣本也可以稱為待提取文本數(shù)據(jù)。具體的對待提取文本數(shù)據(jù)進(jìn)行特征提取的方法可以參見后續(xù)內(nèi)容。

如果待提取文本數(shù)據(jù)為空,比如歷史數(shù)據(jù)為空,則可以設(shè)置對應(yīng)的句子語義特征為固定值,如將此時(shí)的句子語義特征的取值設(shè)置為0。

S13:根據(jù)預(yù)先構(gòu)建的對話管理模型和提取得到的句子語義特征,確定所述待處理用戶文本數(shù)據(jù)對應(yīng)的用戶意圖。

具體構(gòu)建對話管理模型的方法可以如后續(xù)內(nèi)容所示。

對話管理模型的輸入為句子語義特征,輸出為用戶意圖信息,從而在提取得到句子語義特征后,將提取得到的句子語義特征作為對話管理模型的輸入,得到對話管理模型輸出的用戶意圖信息,再根據(jù)用戶意圖信息確定用戶意圖,比如,用戶意圖信息為每種預(yù)設(shè)用戶意圖的概率值,則將概率值最高的用戶意圖確定為待處理用戶文本數(shù)據(jù)對應(yīng)的用戶意圖。

S14:根據(jù)所述用戶意圖,反饋與所述用戶文本數(shù)據(jù)對應(yīng)的響應(yīng)文本數(shù)據(jù)。

例如,可以預(yù)先配置每種用戶意圖對應(yīng)的響應(yīng)文本數(shù)據(jù),從而在用戶意圖確定后,可以直接獲取對應(yīng)的響應(yīng)文本數(shù)據(jù)反饋給用戶。比如,預(yù)先配置用戶意圖為“查詢話費(fèi)”對應(yīng)的響應(yīng)文本數(shù)據(jù)包括:“您想查詢哪個(gè)月的話費(fèi)”,則在確定出用戶意圖為“查詢話費(fèi)”時(shí),向用戶反饋“您想查詢哪個(gè)月的話費(fèi)”。在反饋時(shí),可以顯示響應(yīng)文本數(shù)據(jù),或者,采用語音合成技術(shù)將響應(yīng)文本數(shù)據(jù)轉(zhuǎn)換為語音,采用語音播放的方式進(jìn)行反饋。

本實(shí)施例中,通過根據(jù)對話管理模型確定用戶意圖,可以提高用戶意圖確定的準(zhǔn)確性,并且不需要人工總結(jié)規(guī)則,大大提高了對話管理的效果,從而可以在對話管理時(shí)高效準(zhǔn)確地確定出用戶意圖,進(jìn)而高效準(zhǔn)確地反饋響應(yīng)文本數(shù)據(jù)。

圖2是本申請另一個(gè)實(shí)施例提出的對話管理方法的流程示意圖。

如圖2所示的,本實(shí)施例的方法包括:

S21:構(gòu)建對話管理模型。

具體如后續(xù)描述。

S22:獲取待處理用戶文本數(shù)據(jù),以及待處理用戶文本數(shù)據(jù)對應(yīng)的歷史數(shù)據(jù)。

S23:分別對所述待處理用戶文本數(shù)據(jù)和所述歷史數(shù)據(jù)進(jìn)行特征提取,提取得到所述待處理用戶文本數(shù)據(jù)和所述歷史數(shù)據(jù)分別對應(yīng)的句子語義特征。

S24:根據(jù)預(yù)先構(gòu)建的對話管理模型和提取得到的句子語義特征,確定所述待處理用戶文本數(shù)據(jù)對應(yīng)的用戶意圖。

S25:根據(jù)所述用戶意圖,反饋與所述待處理用戶文本數(shù)據(jù)對應(yīng)的響應(yīng)文本數(shù)據(jù)。

其中,S22-S25的具體內(nèi)容可以參見S11-S14,在此不再詳述。

如圖2所示,構(gòu)建對話管理模型的方法可以包括:

S211:獲取對話文本數(shù)據(jù)樣本,所述對話文本數(shù)據(jù)樣本包括:用戶文本數(shù)據(jù)樣本、用戶文本數(shù)據(jù)樣本對應(yīng)的歷史數(shù)據(jù)樣本。

對話文本數(shù)據(jù)樣本是指已有的對話文本數(shù)據(jù),具體可以采用收集的方式或者從日志中直接獲取的方式,獲取到對話文本數(shù)據(jù)樣本。

對話文本數(shù)據(jù)樣本包括多輪,每輪包括一句用戶文本數(shù)據(jù)樣本和一句響應(yīng)文本數(shù)據(jù)樣本。在處理時(shí),可以將每輪對話文本數(shù)據(jù)樣本中的用戶文本數(shù)據(jù)樣本依次作為當(dāng)前處理的用戶文本數(shù)據(jù)樣本,以及獲取與當(dāng)前處理的用戶文本數(shù)據(jù)樣本對應(yīng)的歷史數(shù)據(jù)樣本。當(dāng)前處理的用戶文本數(shù)據(jù)樣本對應(yīng)的歷史數(shù)據(jù)樣本是指當(dāng)前處理的用戶文本數(shù)據(jù)樣本之前的對話文本數(shù)據(jù)樣本,具體包括歷史用戶文本數(shù)據(jù)樣本和歷史響應(yīng)文本數(shù)據(jù)樣本。

S212:分別對所述用戶文本數(shù)據(jù)樣本和所述歷史數(shù)據(jù)樣本進(jìn)行特征提取,提取得到所述用戶文本數(shù)據(jù)樣本和所述歷史數(shù)據(jù)樣本分別對應(yīng)的句子語義特征。

用戶文本數(shù)據(jù)樣本、歷史數(shù)據(jù)樣本以及上述實(shí)施例中的待處理用戶文本數(shù)據(jù)及其對應(yīng)的歷史數(shù)據(jù)可以統(tǒng)稱為待提取文本數(shù)據(jù),對待提取文本數(shù)據(jù)進(jìn)行特征提取的方法可以如圖3所示。

S213:確定所述用戶文本數(shù)據(jù)樣本對應(yīng)的用戶意圖。

在獲取的對話文本數(shù)據(jù)樣本中還包括與用戶文本數(shù)據(jù)樣本屬于同一輪交互的響應(yīng)文本數(shù)據(jù)樣本,可以基于響應(yīng)文本數(shù)據(jù)樣本對應(yīng)的句子語義特征和用戶文本數(shù)據(jù)樣本對應(yīng)的句子語義特征確定用戶文本數(shù)據(jù)樣本對應(yīng)的用戶意圖,具體如圖4所示。

S214:基于預(yù)先確定的網(wǎng)絡(luò)結(jié)構(gòu),根據(jù)所述用戶文本數(shù)據(jù)樣本和所述歷史數(shù)據(jù)樣本分別對應(yīng)的句子語義特征以及所述用戶文本數(shù)據(jù)樣本對應(yīng)的用戶意圖,進(jìn)行模型訓(xùn)練,構(gòu)建得到對話管理模型。

網(wǎng)絡(luò)結(jié)構(gòu)可以具體為深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。

模型訓(xùn)練過程可以包括:將所述用戶文本數(shù)據(jù)樣本和所述歷史數(shù)據(jù)樣本分別對應(yīng)的句子語義特征作為模型輸入,經(jīng)過與模型各層參數(shù)的運(yùn)算后,得到模型輸出,模型輸出包括各用戶意圖的概率值,將概率值最高的用戶意圖作為預(yù)測值,再將所述用戶文本數(shù)據(jù)樣本對應(yīng)的用戶意圖作為真實(shí)值,根據(jù)真實(shí)值和預(yù)測值得到損失函數(shù),通過最小化損失函數(shù),可以得到模型各層參數(shù),從而得到對話管理模型。具體的模型訓(xùn)練方式可以參見各種相關(guān)技術(shù),在此不再詳述。

下面對上述涉及的一些步驟進(jìn)行具體說明。

參見圖3,對待提取文本數(shù)據(jù)進(jìn)行特征提取的方法可以包括:

S31:對待提取文本數(shù)據(jù)進(jìn)行分詞,得到分詞后的詞語。

具體分詞方法可以參見各種相關(guān)技術(shù),如基于條件隨機(jī)場的方法對文本數(shù)據(jù)進(jìn)行分詞,如文本數(shù)據(jù)“取消已經(jīng)開通的十元一百兆的流量”分詞后得到的詞語包括“取消已經(jīng)開通的十元一百兆的流量”。

需要說明的是,如果待提取文本數(shù)據(jù)中包含有非法或無意義的字符,可以先清洗待提取文本數(shù)據(jù),去除其中的非法或無意義字符,具體清洗方法可以參見各種相關(guān)技術(shù)。

S32:對所述詞語進(jìn)行詞向量化,得到所述詞語對應(yīng)的詞向量。

具體詞向量化方法可以參見各種相關(guān)技術(shù),如使用word2vec技術(shù)進(jìn)行詞向量化。

一般收集的對話文本數(shù)據(jù)較多,因此,得到的詞語也非常多,為了將不同詞的詞向量區(qū)分開,可以使用高維向量表示每個(gè)詞語,如每個(gè)詞向量的維數(shù)為256維。

S33:根據(jù)所述詞向量提取出所述待提取文本數(shù)據(jù)對應(yīng)的句子語義特征。

具體的,可以將每句文本數(shù)據(jù)包含的詞語對應(yīng)的詞向量的平均向量作為對應(yīng)的句子語義特征。例如,直接將每輪對話中用戶文本數(shù)據(jù)包含詞語的詞向量的平均向量作為用戶文本數(shù)據(jù)對應(yīng)的句子語義特征,將響應(yīng)文本數(shù)據(jù)包含詞語的詞向量的平均向量作為響應(yīng)文本數(shù)據(jù)對應(yīng)的句子語義特征。所述句子語義特征的維數(shù)與詞向量維數(shù)相同,平均向量是指將向量包含的各元素按位進(jìn)行平均。需要說明的是,由于句子語義特征是一種向量,因此在后續(xù)內(nèi)容中也可以將句子語義特征稱為句子語義特征向量。

參見圖4,確定用戶文本數(shù)據(jù)樣本對應(yīng)的用戶意圖的方法可以包括:

S41:獲取所述響應(yīng)文本數(shù)據(jù)樣本對應(yīng)的句子語義特征,并根據(jù)所述響應(yīng)文本數(shù)據(jù)樣本對應(yīng)的句子語義特征確定初始用戶意圖。

可以采用如圖3所示的方法對所述響應(yīng)文本數(shù)據(jù)樣本進(jìn)行特征提取,獲取到所述響應(yīng)文本數(shù)據(jù)樣本對應(yīng)的句子語義特征。

在獲取到所述響應(yīng)文本數(shù)據(jù)樣本對應(yīng)的句子語義特征后,可以對該句子語義特征進(jìn)行分類,確定初始用戶意圖。

具體的,可以預(yù)先設(shè)置多種類別的用戶意圖,比如設(shè)置用戶意圖包括“查話費(fèi)、查流量、查賬單、話費(fèi)套餐辦理、流量套餐辦理、網(wǎng)絡(luò)故障報(bào)修”六種類別,之后可以采用各種相關(guān)技術(shù),將所述響應(yīng)文本數(shù)據(jù)樣本對應(yīng)的句子語義特征分類到上述六種類別中的一種,作為初始用戶意圖,比如分類到“查話費(fèi)”,則將初始用戶意圖標(biāo)記為001。

S42:根據(jù)所述用戶文本數(shù)據(jù)樣本對應(yīng)的句子語義特征和所述初始用戶意圖,確定用戶意圖確定特征,并根據(jù)所述用戶意圖確定特征確定出所述用戶文本數(shù)據(jù)樣本對應(yīng)的用戶意圖。

具體的,可以對所述用戶文本數(shù)據(jù)樣本對應(yīng)的句子語義特征和所述初始用戶意圖進(jìn)行組合,將組合后的向量作為用戶意圖確定特征,比如,句子語義特征為256維,初始用戶意圖為3維,則組合后得到的用戶意圖確定特征為259維。在得到用戶意圖確定特征后,可以采用各種相關(guān)技術(shù),將用戶意圖確定特征分類到上述預(yù)設(shè)類別中的一種,作為最終的用戶意圖。其中,此時(shí)的預(yù)設(shè)類別與確定初始用戶意圖時(shí)的類別相同,如依然為上述的六種類別。

可以理解的是,上述以采用分類的方式確定用戶意圖為例,但不限于上述實(shí)現(xiàn)方式,比如還可以采用人工標(biāo)注方式,由領(lǐng)域?qū)<覍τ脩粑谋緮?shù)據(jù)樣本對應(yīng)的用戶意圖進(jìn)行標(biāo)注,從而可以根據(jù)標(biāo)注信息直接確定用戶文本數(shù)據(jù)樣本對應(yīng)的用戶意圖。

下面以一種網(wǎng)絡(luò)結(jié)構(gòu)為例,對所述對話管理模型進(jìn)行說明。

如圖5所示,示出了一種網(wǎng)絡(luò)結(jié)構(gòu)的對話管理模型。參見圖5,該對話管理模型包括:輸入層、注意力層、連接層和輸出層。

需要說明的是,對話管理模型可以分為訓(xùn)練階段和應(yīng)用階段,且為了區(qū)分訓(xùn)練階段和應(yīng)用階段,使用的輸入數(shù)據(jù)可以具有不同的名稱。如在應(yīng)用階段,輸入數(shù)據(jù)包括待處理用戶文本數(shù)據(jù)及其對應(yīng)的歷史數(shù)據(jù),歷史數(shù)據(jù)包括歷史用戶文本數(shù)據(jù)及其對應(yīng)的歷史響應(yīng)文本數(shù)據(jù)。而在訓(xùn)練階段,輸入數(shù)據(jù)可以稱為樣本,具體包括用戶文本數(shù)據(jù)樣本及其對應(yīng)的歷史數(shù)據(jù)樣本??梢岳斫獾氖牵m然在訓(xùn)練階段在相應(yīng)數(shù)據(jù)的名稱后加上了樣本,但是模型對輸入數(shù)據(jù)進(jìn)行處理的原理是一致的,下面以輸入數(shù)據(jù)包括待處理用戶文本數(shù)據(jù)及其對應(yīng)的歷史數(shù)據(jù)為例進(jìn)行說明,對用戶文本數(shù)據(jù)樣本及其對應(yīng)的歷史數(shù)據(jù)樣本進(jìn)行處理的流程可以參照執(zhí)行。

輸入層用于接收輸入特征,其中,輸入特征共包含三部分,具體如下:

1)待處理用戶文本數(shù)據(jù)的句子語義特征向量,使用S表示;

2)待處理用戶文本數(shù)據(jù)對應(yīng)的歷史用戶文本數(shù)據(jù)的句子語義特征向量,使用U={u1,u2,...,uk}表示,其中,uk表示待處理用戶文本數(shù)據(jù)第k輪歷史用戶文本數(shù)據(jù)的句子語義特征,k表示待處理用戶文本數(shù)據(jù)向前取的歷史數(shù)據(jù)的輪數(shù);

3)待處理用戶文本數(shù)據(jù)對應(yīng)的歷史響應(yīng)文本數(shù)據(jù)的句子語義特征向量,使用R={r1,r2,...,rk},其中,rk表示待處理用戶文本數(shù)據(jù)第k輪歷史響應(yīng)文本數(shù)據(jù)的句子語義特征向量;

進(jìn)一步地,由于不同的用戶文本數(shù)據(jù)可能對應(yīng)相同或類似的響應(yīng)文本數(shù)據(jù),直接根據(jù)響應(yīng)文本數(shù)據(jù)得到的句子語義特征向量的區(qū)分性不好,因此,在模型構(gòu)建的過程中,可以對待處理用戶文本數(shù)據(jù)對應(yīng)歷史響應(yīng)文本數(shù)據(jù)的句子語義向量進(jìn)行不斷更新,以保證句子語義向量更加準(zhǔn)確。

注意力層用于計(jì)算待處理用戶文本數(shù)據(jù)對應(yīng)的響應(yīng)文本數(shù)據(jù)的特征向量,具體的,可以先計(jì)算待處理用戶文本數(shù)據(jù)與其對應(yīng)的每個(gè)歷史用戶文本數(shù)據(jù)的相關(guān)度權(quán)重,再根據(jù)上述的相關(guān)度權(quán)重計(jì)算待處理用戶文本數(shù)據(jù)對應(yīng)的響應(yīng)文本數(shù)據(jù)的特征向量。

所述相關(guān)度權(quán)重計(jì)算時(shí),可以先計(jì)算待處理用戶文本數(shù)據(jù)的句子語義特征向量與其每一個(gè)歷史用戶文本數(shù)據(jù)的句子語義特征向量的內(nèi)積后,再計(jì)算待處理用戶文本數(shù)據(jù)與其每一個(gè)歷史用戶文本數(shù)據(jù)的相關(guān)度權(quán)重;也可以先計(jì)算待處理用戶文本數(shù)據(jù)的句子語義特征向量與其每一個(gè)歷史用戶文本數(shù)據(jù)的句子語義特征向量之間的距離,再計(jì)算待處理用戶文本數(shù)據(jù)與其每一個(gè)歷史用戶文本數(shù)據(jù)的相關(guān)度權(quán)重;所述相關(guān)度權(quán)重取值越大,待處理用戶文本數(shù)據(jù)與其對應(yīng)的歷史用戶文本數(shù)據(jù)的相關(guān)度越高,具體使用P={p1,p2,...pk}表示,以先計(jì)算向量之間的內(nèi)積為例,所述相關(guān)度權(quán)重的計(jì)算方法如式(1)所示:

pi=f(STui) (1)

其中,pi表示待處理用戶文本數(shù)據(jù)與其第i輪的歷史用戶文本數(shù)據(jù)的相關(guān)度權(quán)重,ui為待處理用戶文本數(shù)據(jù)的第i輪歷史用戶文本數(shù)據(jù)的句子語義特征向量;f為相關(guān)度權(quán)重計(jì)算函數(shù),如softmax()函數(shù)。

所述待處理用戶文本數(shù)據(jù)對應(yīng)的響應(yīng)文本數(shù)據(jù)的特征向量計(jì)算時(shí),可以將上述的相關(guān)度權(quán)重作為對應(yīng)的每個(gè)歷史響應(yīng)文本數(shù)據(jù)的句子語義特征向量的加權(quán)值,進(jìn)行加權(quán)求和后得到,具體計(jì)算方法如式(2)所示:

其中,A表示待處理用戶文本數(shù)據(jù)對應(yīng)的響應(yīng)文本數(shù)據(jù)的特征向量。

連接層用于對注意力層計(jì)算得到的待處理用戶文本數(shù)據(jù)對應(yīng)的響應(yīng)文本數(shù)據(jù)的特征向量A以及待處理用戶文本數(shù)據(jù)的句子語義特征向量S進(jìn)行變換,得到變換后的特征向量變換后的特征向量中包含了待處理用戶文本數(shù)據(jù)的語義信息。具體變換方法如式(3)所示:

其中,W為特征向量變換權(quán)重矩陣,為模型參數(shù),具體可以通過大量訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練得到,初始取值可以通過隨機(jī)初始化方法得到,或直接統(tǒng)一初始化為0;f為特征向量變換函數(shù),如softmax()函數(shù)。

輸出層用于根據(jù)所述變換后的特征向量輸出用戶意圖信息,例如每種預(yù)設(shè)用戶意圖的概率值。

本實(shí)施例中,通過根據(jù)對話管理模型確定用戶意圖,可以提高用戶意圖確定的準(zhǔn)確性,并且不需要人工總結(jié)規(guī)則,大大提高了對話管理的效果,從而可以在對話管理時(shí)高效準(zhǔn)確地確定出用戶意圖。進(jìn)一步的,通過上述的深度神經(jīng)網(wǎng)絡(luò)構(gòu)建對話管理模型,可以進(jìn)一步提高模型準(zhǔn)確度,進(jìn)而提高用戶意圖確定的準(zhǔn)確度。

圖6是本申請一個(gè)實(shí)施例提出的對話管理裝置的結(jié)構(gòu)示意圖。

如圖6所示,本實(shí)施例的裝置60包括:獲取模塊61、提取模塊62、確定模塊63和反饋模塊64。

獲取模塊61,用于獲取待處理用戶文本數(shù)據(jù),以及待處理用戶文本數(shù)據(jù)對應(yīng)的歷史數(shù)據(jù);

提取模塊62,用于分別對所述待處理用戶文本數(shù)據(jù)和所述歷史數(shù)據(jù)進(jìn)行特征提取,提取得到所述待處理用戶文本數(shù)據(jù)和所述歷史數(shù)據(jù)分別對應(yīng)的句子語義特征;

確定模塊63,用于根據(jù)預(yù)先構(gòu)建的對話管理模型和提取得到的句子語義特征,確定用戶意圖;

反饋模塊64,用于根據(jù)所述用戶意圖,反饋與所述待處理用戶文本數(shù)據(jù)對應(yīng)的響應(yīng)文本數(shù)據(jù)。

一些實(shí)施例中,所述提取模塊62用于進(jìn)行所述特征提取包括:

對待提取文本數(shù)據(jù)進(jìn)行分詞,得到分詞后的詞語;

對所述詞語進(jìn)行詞向量化,得到所述詞語對應(yīng)的詞向量;

根據(jù)所述詞向量提取出所述待提取文本數(shù)據(jù)對應(yīng)的句子語義特征;

其中,所述待提取文本數(shù)據(jù)包括:所述待處理用戶文本數(shù)據(jù),和/或,所述歷史數(shù)據(jù)。

一些實(shí)施例中,參見圖7,該裝置60還包括:用于構(gòu)建對話管理模型的構(gòu)建模塊65,所述構(gòu)建模塊65具體用于:

獲取對話文本數(shù)據(jù)樣本,所述對話文本數(shù)據(jù)樣本包括:用戶文本數(shù)據(jù)樣本、用戶文本數(shù)據(jù)樣本對應(yīng)的歷史數(shù)據(jù)樣本;

分別對所述用戶文本數(shù)據(jù)樣本和所述歷史數(shù)據(jù)樣本進(jìn)行特征提取,提取得到所述用戶文本數(shù)據(jù)樣本和所述歷史數(shù)據(jù)樣本分別對應(yīng)的句子語義特征;

確定所述用戶文本數(shù)據(jù)樣本對應(yīng)的用戶意圖;

基于預(yù)先確定的網(wǎng)絡(luò)結(jié)構(gòu),根據(jù)所述用戶文本數(shù)據(jù)樣本和所述歷史數(shù)據(jù)樣本分別對應(yīng)的句子語義特征以及所述用戶文本數(shù)據(jù)樣本對應(yīng)的用戶意圖,進(jìn)行模型訓(xùn)練,構(gòu)建得到對話管理模型。

一些實(shí)施例中,所述對話文本數(shù)據(jù)樣本還包括:與用戶文本數(shù)據(jù)樣本屬于同一輪交互的響應(yīng)文本數(shù)據(jù)樣本;所述構(gòu)建模塊65用于確定所述用戶文本數(shù)據(jù)樣本對應(yīng)的用戶意圖,包括:

獲取所述響應(yīng)文本數(shù)據(jù)樣本對應(yīng)的句子語義特征,并根據(jù)所述響應(yīng)文本數(shù)據(jù)樣本對應(yīng)的句子語義特征確定初始用戶意圖;

根據(jù)所述用戶文本數(shù)據(jù)樣本對應(yīng)的句子語義特征和所述初始用戶意圖,確定用戶意圖確定特征,并根據(jù)所述用戶意圖確定特征確定出所述用戶文本數(shù)據(jù)樣本對應(yīng)的用戶意圖。

一些實(shí)施例中,所述對話管理模型的網(wǎng)絡(luò)結(jié)構(gòu)包括:深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。

一些實(shí)施例中,所述歷史數(shù)據(jù)包括:歷史用戶文本數(shù)據(jù)和歷史響應(yīng)文本數(shù)據(jù),所述網(wǎng)絡(luò)結(jié)構(gòu)包括:

輸入層、注意力層、連接層和輸出層;

所述輸入層用于輸入如下特征:所述待處理用戶文本數(shù)據(jù)對應(yīng)的句子語義特征、所述歷史用戶文本數(shù)據(jù)對應(yīng)的句子語義特征和所述歷史響應(yīng)文本數(shù)據(jù)對應(yīng)的句子語義特征;

所述注意力層用于根據(jù)所述待處理用戶文本數(shù)據(jù)對應(yīng)的句子語義特征和所述歷史用戶文本數(shù)據(jù)對應(yīng)的句子語義特征,計(jì)算所述待處理用戶文本數(shù)據(jù)與所述歷史用戶文本數(shù)據(jù)之間的相關(guān)度權(quán)重,并根據(jù)所述相關(guān)度權(quán)重和所述歷史響應(yīng)文本數(shù)據(jù)對應(yīng)的句子語義特征,計(jì)算所述待處理用戶文本數(shù)據(jù)對應(yīng)的響應(yīng)文本數(shù)據(jù)的特征向量;

所述連接層用于對所述特征向量和所述待處理用戶文本數(shù)據(jù)對應(yīng)的句子語義特征進(jìn)行變換,得到變換后的特征向量;

所述輸出層用于根據(jù)所述變換后的特征向量輸出用戶意圖信息。

可以理解的是,本實(shí)施例的裝置與上述方法實(shí)施例對應(yīng),具體內(nèi)容可以參見方法實(shí)施例的相關(guān)描述,在此不再詳細(xì)說明。

本實(shí)施例中,通過根據(jù)對話管理模型確定用戶意圖,可以提高用戶意圖確定的準(zhǔn)確性,并且不需要人工總結(jié)規(guī)則,大大提高了對話管理的效果,從而可以在對話管理時(shí)高效準(zhǔn)確地確定出用戶意圖,進(jìn)而高效準(zhǔn)確地反饋響應(yīng)文本數(shù)據(jù)。

可以理解的是,上述各實(shí)施例中相同或相似部分可以相互參考,在一些實(shí)施例中未詳細(xì)說明的內(nèi)容可以參見其他實(shí)施例中相同或相似的內(nèi)容。

需要說明的是,在本申請的描述中,術(shù)語“第一”、“第二”等僅用于描述目的,而不能理解為指示或暗示相對重要性。此外,在本申請的描述中,除非另有說明,“多個(gè)”的含義是指至少兩個(gè)。

流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個(gè)或更多個(gè)用于實(shí)現(xiàn)特定邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本申請的優(yōu)選實(shí)施方式的范圍包括另外的實(shí)現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時(shí)的方式或按相反的順序,來執(zhí)行功能,這應(yīng)被本申請的實(shí)施例所屬技術(shù)領(lǐng)域的技術(shù)人員所理解。

應(yīng)當(dāng)理解,本申請的各部分可以用硬件、軟件、固件或它們的組合來實(shí)現(xiàn)。在上述實(shí)施方式中,多個(gè)步驟或方法可以用存儲在存儲器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實(shí)現(xiàn)。例如,如果用硬件來實(shí)現(xiàn),和在另一實(shí)施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來實(shí)現(xiàn):具有用于對數(shù)據(jù)信號實(shí)現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(PGA),現(xiàn)場可編程門陣列(FPGA)等。

本技術(shù)領(lǐng)域的普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法攜帶的全部或部分步驟是可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計(jì)算機(jī)可讀存儲介質(zhì)中,該程序在執(zhí)行時(shí),包括方法實(shí)施例的步驟之一或其組合。

此外,在本申請各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理模塊中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),也可以存儲在一個(gè)計(jì)算機(jī)可讀取存儲介質(zhì)中。

上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。

在本說明書的描述中,參考術(shù)語“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本申請的至少一個(gè)實(shí)施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不一定指的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任何的一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。

盡管上面已經(jīng)示出和描述了本申請的實(shí)施例,可以理解的是,上述實(shí)施例是示例性的,不能理解為對本申請的限制,本領(lǐng)域的普通技術(shù)人員在本申請的范圍內(nèi)可以對上述實(shí)施例進(jìn)行變化、修改、替換和變型。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
深水埗区| 留坝县| 县级市| 满城县| 海宁市| 彰武县| 星子县| 象山县| 大渡口区| 邳州市| 小金县| 原平市| 衡阳市| 皋兰县| 策勒县| 古浪县| 陆川县| 临夏市| 荣昌县| 内丘县| 凉山| 招远市| 柳河县| 宁强县| 西乡县| 通渭县| 乌恰县| 嘉黎县| 贵南县| 怀柔区| 威宁| 双桥区| 锡林浩特市| 绥宁县| 兴隆县| 南丹县| 棋牌| 昌邑市| 松溪县| 柞水县| 连南|