針對(duì)用戶的提問(wèn)意圖獲取答案信息的方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本申請(qǐng)涉及數(shù)據(jù)挖掘技術(shù)領(lǐng)域,特別是涉及針對(duì)用戶的提問(wèn)意圖獲取答案信息的 方法及裝置。
【背景技術(shù)】
[0002] 隨著電子商務(wù)用戶行為數(shù)據(jù)庫(kù)的不斷完善,以及傳統(tǒng)通信、移動(dòng)通信等技術(shù)的快 速發(fā)展,越來(lái)越多的人們通過(guò)網(wǎng)上購(gòu)物的方式來(lái)獲取自己所需的商品,商品的種類可以涉 及到人們?nèi)粘I畹姆椒矫婷?,為人們生活提供了極大的便利。
[0003] 在網(wǎng)上購(gòu)物的過(guò)程中,買家用戶經(jīng)常需要與賣家用戶進(jìn)行一些在線的溝通,例如, 一個(gè)買家用戶在收到了一件商品之后,發(fā)現(xiàn)顏色不喜歡,或者大小不合適等,需要進(jìn)行退貨 或者換貨,此時(shí),該買家用戶就可以通過(guò)在線通訊工具聯(lián)系到該賣家的客服人員,與客服人 員溝通退換貨事宜。
[0004] 在傳統(tǒng)的實(shí)現(xiàn)方式下,賣家用戶一般需要雇傭客服人員來(lái)專門完成上述在線溝通 服務(wù),人工成本會(huì)比較高,并且在出現(xiàn)多個(gè)買家同時(shí)發(fā)來(lái)咨詢消息的情況下,經(jīng)常會(huì)造成買 家用戶的排隊(duì)等待現(xiàn)象。為了解決該問(wèn)題,有些電子商務(wù)用戶行為數(shù)據(jù)庫(kù)為賣家用戶提供 了"智能機(jī)器人"服務(wù),通過(guò)該服務(wù)可以由計(jì)算機(jī)自動(dòng)解答買家用戶發(fā)送來(lái)的各種問(wèn)題,最 終達(dá)成一種快速幫助商家完成人工客服所做的日常工作。但是,在該服務(wù)在實(shí)現(xiàn)過(guò)程中有 個(gè)關(guān)鍵的問(wèn)題需要解決,那就是如何使得計(jì)算機(jī)系統(tǒng)能夠準(zhǔn)確地識(shí)別出用戶的意圖,并據(jù) 此來(lái)給出恰當(dāng)?shù)拇饛?fù)。例如,如果用戶說(shuō)"這個(gè)衣服顏色不正,我要退了",計(jì)算機(jī)系統(tǒng)需要 將其理解為"客戶需要退貨",然后再給出正確的答復(fù)。
[0005] 現(xiàn)有技術(shù)中,為如何準(zhǔn)確識(shí)別用戶意圖提出了一些解決方案,例如,通過(guò)分析用戶 之間的聊天記錄,建立語(yǔ)言模型,接收到用戶的當(dāng)前聊天語(yǔ)料后,進(jìn)行語(yǔ)義分析,把分析完 的語(yǔ)義結(jié)果通過(guò)主題模型計(jì)算得到最大概率的主題,并作為該用戶的意圖。
[0006] 現(xiàn)有技術(shù)雖然為如何識(shí)別用戶意圖給出了實(shí)現(xiàn)方案,但是關(guān)于具體的用戶意圖對(duì) 應(yīng)的答案,一般是需要由用戶或者后臺(tái)技術(shù)人員進(jìn)行手動(dòng)配置的,也即,智能機(jī)器人在代替 客服與買家用戶進(jìn)行對(duì)話的過(guò)程中,自動(dòng)識(shí)別出買家用戶的意圖之后,就可以將預(yù)先人工 配置好的針對(duì)該意圖的答案返回給該買家用戶,實(shí)現(xiàn)與其對(duì)話。但是,預(yù)先人工為各個(gè)意圖 配置答案的過(guò)程同樣可能會(huì)耗費(fèi)較多的人力及時(shí)間成本。
[0007] 因此,如何在使得計(jì)算機(jī)系統(tǒng)能夠自動(dòng)獲取到用戶意圖對(duì)應(yīng)的答案,并自動(dòng)進(jìn)行 回復(fù),以便進(jìn)一步節(jié)省時(shí)間及人力成本,是迫切需要本領(lǐng)域技術(shù)人員解決的技術(shù)問(wèn)題。
【發(fā)明內(nèi)容】
[0008] 本申請(qǐng)?zhí)峁┝酸槍?duì)用戶的提問(wèn)意圖獲取答案信息的方法及裝置,可以進(jìn)一步地節(jié) 省人力以及時(shí)間成本。
[0009] 本申請(qǐng)?zhí)峁┝巳缦路桨福?br>[0010] -種針對(duì)用戶的提問(wèn)意圖獲取答案信息的方法,包括: toon] 獲取第一用戶與多個(gè)第二用戶進(jìn)行即時(shí)通信過(guò)程中的歷史對(duì)話記錄;
[0012] 從所述歷史對(duì)話記錄中對(duì)各個(gè)第二用戶提出的問(wèn)題語(yǔ)料進(jìn)行用戶意圖識(shí)別,獲取 同一用戶意圖下包括的各個(gè)問(wèn)題語(yǔ)料,并獲取該第一用戶對(duì)同一用戶意圖下的各問(wèn)題語(yǔ)料 給出的回復(fù)語(yǔ)料;
[0013] 針對(duì)同一用戶意圖,對(duì)各個(gè)回復(fù)語(yǔ)料進(jìn)行聚類,得出多個(gè)類別,并在包含回復(fù)語(yǔ)料 數(shù)目多于預(yù)置閾值的目標(biāo)類別中,分別計(jì)算各個(gè)回復(fù)語(yǔ)料在所述目標(biāo)類別中成為類別中心 的權(quán)重;
[0014] 根據(jù)所述權(quán)重,確定該用戶意圖的中心答案。
[0015] -種針對(duì)用戶的提問(wèn)意圖獲取答案信息的裝置,包括:
[0016] 歷史對(duì)話記錄獲取單元,用于獲取第一用戶與多個(gè)第二用戶進(jìn)行即時(shí)通信過(guò)程中 的歷史對(duì)話記錄;
[0017] 回復(fù)語(yǔ)料獲取單元,用于從所述歷史對(duì)話記錄中對(duì)各個(gè)第二用戶提出的問(wèn)題語(yǔ)料 進(jìn)行用戶意圖識(shí)別,獲取同一用戶意圖下包括的各個(gè)問(wèn)題語(yǔ)料,并獲取該第一用戶對(duì)同一 用戶意圖下的各問(wèn)題語(yǔ)料給出的回復(fù)語(yǔ)料;
[0018] 權(quán)重計(jì)算單元,用于針對(duì)同一用戶意圖,對(duì)各個(gè)回復(fù)語(yǔ)料進(jìn)行聚類,得出多個(gè)類 另IJ,并在包含回復(fù)語(yǔ)料數(shù)目多于預(yù)置閾值的目標(biāo)類別中,分別計(jì)算各個(gè)回復(fù)語(yǔ)料在所述目 標(biāo)類別中成為類別中心的權(quán)重;
[0019] 中心答案確定單元,用于根據(jù)所述權(quán)重,確定該用戶意圖的中心答案。
[0020] 根據(jù)本申請(qǐng)?zhí)峁┑木唧w實(shí)施例,本申請(qǐng)公開了以下技術(shù)效果:
[0021] 通過(guò)本申請(qǐng)實(shí)施例,可以通過(guò)計(jì)算機(jī)程序?qū)v史對(duì)話記錄進(jìn)行數(shù)據(jù)挖掘,為各個(gè) 用戶意圖自動(dòng)獲取到對(duì)應(yīng)的答案,而不再需要用戶或者后臺(tái)技術(shù)人員為各個(gè)用戶意圖執(zhí)行 手動(dòng)的答案輸入或者設(shè)置等工作,可以進(jìn)一步地節(jié)省人力以及時(shí)間成本。
[0022] 當(dāng)然,實(shí)施本申請(qǐng)的任一產(chǎn)品并不一定需要同時(shí)達(dá)到以上所述的所有優(yōu)點(diǎn)。
【附圖說(shuō)明】
[0023] 為了更清楚地說(shuō)明本申請(qǐng)實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例中所 需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請(qǐng)的一些實(shí)施 例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲 得其他的附圖。
[0024] 圖1是本申請(qǐng)實(shí)施例提供的針對(duì)用戶的提問(wèn)意圖獲取答案信息的方法的流程圖;
[0025] 圖2是本申請(qǐng)實(shí)施例提供的針對(duì)用戶的提問(wèn)意圖獲取答案信息的裝置的示意圖。
【具體實(shí)施方式】
[0026] 下面將結(jié)合本申請(qǐng)實(shí)施例中的附圖,對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例僅僅是本申請(qǐng)一部分實(shí)施例,而不是全部的實(shí)施例。基于 本申請(qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員所獲得的所有其他實(shí)施例,都屬于本申請(qǐng)保護(hù)的 范圍。
[0027] 在本申請(qǐng)實(shí)施例中,可以從即時(shí)通訊工具中用戶的歷史對(duì)話記錄中進(jìn)行數(shù)據(jù)挖 掘,獲取出對(duì)應(yīng)各個(gè)用戶意圖的答案,建立起"意圖-答案"數(shù)據(jù)庫(kù)(也即保存有用戶意圖 與答案之間的對(duì)應(yīng)關(guān)系),這樣,可以通過(guò)計(jì)算機(jī)程序?yàn)楦鱾€(gè)用戶意圖自動(dòng)獲取到對(duì)應(yīng)的答 案,而不再需要用戶或者后臺(tái)技術(shù)人員為各個(gè)用戶意圖執(zhí)行手動(dòng)的答案輸入或者設(shè)置等工 作,可以進(jìn)一步地節(jié)省人力以及時(shí)間成本。下面對(duì)具體的實(shí)現(xiàn)方式進(jìn)行詳細(xì)地介紹。
[0028] 參見圖1,本申請(qǐng)實(shí)施例首先提供了一種針對(duì)用戶的提問(wèn)意圖獲取答案信息的方 法,該方法可以包括以下步驟:
[0029] S101 :獲取第一用戶與多個(gè)第二用戶進(jìn)行即時(shí)通信過(guò)程中的歷史對(duì)話記錄;
[0030] 對(duì)于電子商務(wù)交易平臺(tái)中的"智能機(jī)器人"而言,其主要的功能是代替客服人員, 幫助賣家用戶來(lái)回答買家用戶提出的各種問(wèn)題,在該"智能機(jī)器人"出現(xiàn)之前,主要就是由 賣家用戶的客服人員與買家用戶之間通過(guò)即時(shí)通訊工具進(jìn)行對(duì)話,兩者之間主要是采用 "一問(wèn)一答"的方式進(jìn)行對(duì)話,并且在此過(guò)程中會(huì)產(chǎn)生大量的歷史對(duì)話記錄。因此,本申請(qǐng)實(shí) 施例就可以基于這些歷史對(duì)話記錄進(jìn)行數(shù)據(jù)挖掘,從中獲取到針對(duì)不同的買家用戶意圖, 應(yīng)該給出怎樣的答案。當(dāng)然,在實(shí)際應(yīng)用中,該方法也可以應(yīng)用于其他具有類似特點(diǎn)以及 需求的領(lǐng)域,因此,在本申請(qǐng)實(shí)施例中,將即時(shí)通訊中的對(duì)話雙方用戶稱為"第一用戶"以及 "第二用戶",其中,第二用戶在對(duì)話過(guò)程中主要扮演提問(wèn)者的角色,例如交易平臺(tái)中的買家 用戶,而第一用戶在對(duì)話過(guò)程中則主要扮演回答者的角色,例如交易平臺(tái)中的賣家用戶。
[0031] 而本申請(qǐng)發(fā)明人在實(shí)現(xiàn)本申請(qǐng)的過(guò)程中發(fā)現(xiàn),對(duì)于第二用戶提出的同一問(wèn)題,不 同的第一用戶給出的答案一般是不同的。例如,對(duì)于不同的賣家用戶而言,由于各自銷售 的商品對(duì)象類型等有所不同,各自使用的合作方快遞服務(wù)商可能不同,各自的退貨地址等 等都可能是不同的,因此,針對(duì)買家用戶相同的問(wèn)題,給出的答案可能是不同的。例如,某買 家用戶詢問(wèn)賣家用戶"請(qǐng)問(wèn)會(huì)使用什么快遞進(jìn)行送貨",賣家用戶A給出的答案可能是"快 遞甲",賣家用戶B給出的答案可能是"快遞乙",賣家用戶C給出的答案可能是"默認(rèn)發(fā)快 遞甲,也可以選擇快遞乙",等等。因此,在本申請(qǐng)實(shí)施例中,可以分別針對(duì)不同的第一用戶 進(jìn)行答案的自動(dòng)提取,因此,在