欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種評價問答對質(zhì)量的方法和裝置與流程

文檔序號:12786374閱讀:281來源:國知局
一種評價問答對質(zhì)量的方法和裝置與流程

本申請涉及計算機(jī)技術(shù)領(lǐng)域,尤其涉及一種評價問答對質(zhì)量的方法和裝置。



背景技術(shù):

隨著互聯(lián)網(wǎng)技術(shù)的蓬勃發(fā)展,用戶在生活或工作遇到各種各樣的問題時越來越傾向于在問答等社區(qū)或者是其他網(wǎng)頁中搜索答案。問答社區(qū)的基本形式通常為用戶根據(jù)自己的需求提出問題,并由其他的用戶來給出答案。這種形式為用戶在網(wǎng)絡(luò)上獲取答案信息提供了新的渠道。然而由于任何用戶都可以隨意地創(chuàng)建內(nèi)容,即創(chuàng)建問題和創(chuàng)建答案,導(dǎo)致了問答社區(qū)中的信息質(zhì)量差異非常大,致使問答社區(qū)中出現(xiàn)了大量的低質(zhì)量問答對,降低了問答社區(qū)的質(zhì)量。

為了解決上述問題,問答對質(zhì)量評價方法的研究工作逐漸開展起來,目前主要是將問答對質(zhì)量評價問題看作是高質(zhì)量問答對和低質(zhì)量問答對的二分類問題,使用文本特征對問題和答案分別建立分類模型,最終將兩個分類模型的預(yù)測結(jié)果融合起來進(jìn)而對問答對質(zhì)量進(jìn)行評價,這里的文本特征主要指文本視覺特征(例如標(biāo)點(diǎn)符號密度,平均詞長,文本熵等)和文本內(nèi)容特征(例如文本內(nèi)容詞比例,疑問詞密度,相關(guān)詞覆蓋等)。

使用文本特征來描述問題和答案時,對問題和答案分別提取出特征后,在訓(xùn)練集上分別學(xué)習(xí)出一個問題質(zhì)量預(yù)測模型和答案質(zhì)量預(yù)測模型,并使用兩個模型的輸出結(jié)果來評價問答對質(zhì)量。該技術(shù)對問答對質(zhì)量評價時,僅僅使用了相關(guān)詞覆蓋特征來描述問題和答案間的語義匹配度,這不但僅僅是停留在詞法層面上的,而且很多問題和答案間并不存在相關(guān)詞的覆蓋,從而導(dǎo)致問題和答案間的語義匹配度為0,然而問題和答案間的語義匹配度恰恰是問答對質(zhì)量的核心,例如問答社區(qū)中某一問題為“山東的省會是哪個城市”,相應(yīng)的答案有以下兩個“濟(jì)南”,“山東的省會是北京”?,F(xiàn)有技術(shù)利用相關(guān)詞覆蓋特征來評價問答對質(zhì)量時,根據(jù)問題和答案間的語義匹配度則會將“山東的省會是哪個城市”和“山東的省會是北京”認(rèn)為是一個高質(zhì)量的問答對,這明顯與實(shí)際不符,由此可以看出,現(xiàn)有技術(shù)在問答對進(jìn)行質(zhì)量評價時,評價的準(zhǔn)確性較低。



技術(shù)實(shí)現(xiàn)要素:

為解決上述技術(shù)問題,本申請實(shí)施例提供一種評價問答對質(zhì)量的方法和裝置,用于提高評價問答對質(zhì)量的準(zhǔn)確性。

本申請實(shí)施例采用下述技術(shù)方案:

一種評價問答對質(zhì)量的方法,包括:獲取待評價問答對的問題內(nèi)容中的詞語和答案內(nèi)容中的詞語;從問答知識庫中選取與獲取到的問題內(nèi)容中的詞語和答案內(nèi)容中的詞語均相匹配的問答記錄,其中,一條問答記錄包括一個問題詞語、與所述問題詞語相關(guān)聯(lián)的多個答案詞語,以及每個答案詞語分別和所述問題詞語之間的語義相關(guān)度;根據(jù)相匹配的問答記錄中的問題詞語和答案詞語之間的語義相關(guān)度,對問答對的質(zhì)量進(jìn)行評價。

優(yōu)選地,從問答知識庫中選取與獲取到的問題內(nèi)容中的詞語和答案內(nèi)容中的詞語均相匹配的問答記錄,具體包括:

將獲取到的問題內(nèi)容中的詞語與問答記錄中的問題詞語相匹配,如果匹配成功,則標(biāo)記該問答記錄;

然后將將獲取到的答案內(nèi)容中的詞語與標(biāo)記的問答記錄中的答案詞語相匹配,如果匹配成功,則選取該問答記錄。

優(yōu)選地,獲取待評價問答對的問題內(nèi)容中的詞語和答案內(nèi)容中的詞語之前,所述方法還包括:

預(yù)先提取出多個問答對,并獲取每個問答對對應(yīng)的類別,構(gòu)建包含有多條問答記錄的問答知識庫。

優(yōu)選地,構(gòu)建包含有多條問答記錄的問答知識庫,具體包括:

對提取的每一個問答對,提取該問答對的問題內(nèi)容和答案內(nèi)容中的詞語,得到問題詞語集合和答案詞語集合;

令問題詞語集合中的每個問題詞語和答案詞語集合中的每個答案詞語分別在與該問答對對應(yīng)的每個類別上形成一條信息記錄;

對每一條信息記錄,執(zhí)行以下操作:

計算該答案詞語屬于該類別的概率,計算在該類別上該答案詞語對該問題詞語的解釋的專一程度,計算在該類別上該問題詞語用該答案詞語進(jìn)行解釋的強(qiáng)度;

將上述概率、專一程度和強(qiáng)度相乘,所得到的乘積是該答案詞語和該問題詞語的語義相關(guān)度;

令該問題詞語,多個答案詞語,和,多個答案詞語中的每個答案詞語和所述問題詞語之間的語義相關(guān)度形成一條對應(yīng)于所述類別的問答記錄。

優(yōu)選地,計算該答案詞語屬于該類別的概率,具體包括:

計算在該類別上該答案詞語對該問題詞語的解釋的專一程度,具體包括:

計算在該類別上該問題詞語用該答案詞語進(jìn)行解釋的強(qiáng)度,具體包括:

將概率、專一程度和強(qiáng)度相乘,具體包括:

weight(QWi,AWj|C=Ck)=P(Ck|AWj)*specific(QWi,AWj|C=Ck)*interpret(QWi,AWj|C=Ck)

其中:

P(Ck|AWj)為答案詞語AWj屬于類別Ck的概率;

specific(QWi,AWj|C=Ck)為在類別Ck上答案詞語AWj對問題詞語QWi的解釋的專一程度;

interpret(QWi,AWj|C=Ck)為在類別Ck上問題詞語QWi用答案詞語AWj進(jìn)行解釋的強(qiáng)度;

P(CK)表示類別Ck出現(xiàn)的概率;P(AWj)表示答案為AWj的概率;P(AWj|Ck)表示Ck類別屬于AWj的概率;#(QWi,AWj)表示問題詞語為QWi且答案詞語為AWj的次數(shù);#(AWj)表示答案詞語為AWj的次數(shù)。

優(yōu)選地,根據(jù)相匹配的問答記錄中的問題詞語和答案詞語之間的語義相關(guān)度,對問答對的質(zhì)量進(jìn)行評價,具體包括:

根據(jù)相匹配的問答記錄中對應(yīng)于相同類別下的問答記錄,并根據(jù)相匹配的問答記錄中的問題詞語和答案詞語之間的語義相關(guān)度,得到待分析的問答對針對各個類別的相關(guān)聯(lián)程度;

選取上述該待分析的問答對針對各個類別的相關(guān)聯(lián)程度的最大值,根據(jù)該最大值的大小對待分析的問答對進(jìn)行評價。

本申請實(shí)施例還提供一種評價問答對質(zhì)量的裝置,包括:獲取模塊,選取模塊和評價模塊,其中:

所述獲取模塊,用于獲取待評價問答對的問題內(nèi)容中的詞語和答案內(nèi)容中的詞語;

所述選取模塊,從問答知識庫中選取與獲取到的問題內(nèi)容中的詞語和答案內(nèi)容中的詞語均相匹配的問答記錄;

所述評價模塊,用于根據(jù)相匹配的問答記錄中的問題詞語和答案詞語之間的語義相關(guān)度,對問答對的質(zhì)量進(jìn)行評價。

優(yōu)選地,所述選取模塊具體包括有匹配單元,其中:

所述匹配單元,用于將獲取到的問題內(nèi)容中的詞語與問答記錄中的問題詞語相匹配,如果匹配成功,則標(biāo)記該問答記錄;

然后將將獲取到的答案內(nèi)容中的詞語與標(biāo)記的問答記錄中的答案詞語相匹配,如果匹配成功,則選取該問答記錄。

優(yōu)選地,所述裝置還包括問答知識庫創(chuàng)建模塊,其中:

所述問答知識庫創(chuàng)建模塊,用于預(yù)先提取出多個問答對,并獲取每個問答對對應(yīng)的類別,構(gòu)建包含有多條問答記錄的問答知識庫。

優(yōu)選地,所述評價模塊具體包括有評價單元,其中:

所述評價單元,用于根據(jù)相匹配的問答記錄中對應(yīng)于相同類別下的問答記錄,并根據(jù)相匹配的問答記錄中的問題詞語和答案詞語之間的語義相關(guān)度,得到待分析的問答對針對各個類別的相關(guān)聯(lián)程度;

選取上述該待分析的問答對針對各個類別的相關(guān)聯(lián)程度的最大值,根據(jù)該最大值的大小對待分析的問答對進(jìn)行評價。

本申請實(shí)施例采用的上述至少一個技術(shù)方案能夠達(dá)到以下有益效果:根據(jù)獲取到的待評價問答對的問題內(nèi)容中的詞語和答案內(nèi)容中的詞語,從問答知識庫中選取與獲取到的問題內(nèi)容中的詞語和答案內(nèi)容中的詞語均相匹配的問答記錄,根據(jù)相匹配的問答記錄中的問題詞語和答案詞語之間的語義相關(guān)度,對問答對的質(zhì)量進(jìn)行評價,相對于現(xiàn)有技術(shù)中僅僅根據(jù)待評價的問題和答案的相關(guān)詞覆蓋特征來評價問答對質(zhì)量,提高評價的準(zhǔn)確性。

附圖說明

此處所說明的附圖用來提供對本申請的進(jìn)一步理解,構(gòu)成本申請的一部分,本申請的示意性實(shí)施例及其說明用于解釋本申請,并不構(gòu)成對本申請的不當(dāng)限定。在附圖中:

圖1為本申請實(shí)施例提供的一種評價問答對質(zhì)量的方法的流程示意圖;

圖2為本申請實(shí)施例提供的一種問答知識庫的構(gòu)建流程示意圖;

圖3為本申請實(shí)施例提供的問答記錄細(xì)節(jié)示意圖;

圖4為本申請實(shí)施例提供的一種評價問答對質(zhì)量的裝置示意圖。

具體實(shí)施方式

為使本申請的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本申請具體實(shí)施例及相應(yīng)的附圖對本申請技術(shù)方案進(jìn)行清楚、完整地描述。顯然,所描述的實(shí)施例僅是本申請一部分實(shí)施例,而不是全部的實(shí)施例?;诒旧暾堉械膶?shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本申請保護(hù)的范圍。

圖1為本申請實(shí)施例提供的一種評價問答對質(zhì)量的方法的實(shí)現(xiàn)流程示意圖,包括以下幾個步驟:

步驟11:獲取待評價問答對的問題內(nèi)容中的詞語和答案內(nèi)容中的詞語。

問答對通常為網(wǎng)絡(luò)應(yīng)用中,某些用戶根據(jù)自己需求提出問題內(nèi)容,由其他用戶來給出答案內(nèi)容,其中,一條問題內(nèi)容可能對應(yīng)多條答案內(nèi)容,這里可以將一條問題內(nèi)容和一條答案內(nèi)容成為一個問答對。

對問答對的質(zhì)量進(jìn)行評價時,可以將其分為優(yōu),中,差三個級別,當(dāng)然還可以用二分法分為高質(zhì)量問答對和低質(zhì)量問答對。對某一個問答對進(jìn)行評價時,首先應(yīng)獲取該問答對問題內(nèi)容中的詞語和答案內(nèi)容中的詞語。具體的可以分別對問題內(nèi)容和答案內(nèi)容經(jīng)過分詞、去除停用詞、word join、提取實(shí)體詞等步驟,最終獲取到的問題內(nèi)容和答案內(nèi)容中的詞語信息可以按如下所示的格式:

(<QW1,QW2,…,QWi,…,QWm>,<AW1,AW2,…,AWi,…,AWn>),

其中的QW為一個問題詞語,AW為一個答案詞語,右下角的標(biāo)號則為問題詞語或答案詞語的編號。例如某一問答對的問題內(nèi)容是“山東的省會是哪個城市”,相應(yīng)的答案內(nèi)容是:“山東的省會是濟(jì)南”,則獲取的問題內(nèi)容中的詞語答案內(nèi)容中的詞語可以為(<山東1,省會2,城市3>,<山東1,省會2,濟(jì)南3>)。

步驟12:從問答知識庫中選取與獲取到的問題內(nèi)容中的詞語和答案內(nèi)容中的詞語均相匹配的問答記錄。

問答知識庫是預(yù)先建立好的,其中包括有大量的問答記錄,其中一條問答記錄包括一個問題詞語、與所述問題詞語相關(guān)聯(lián)的多個答案詞語,以及每個答案詞語分別和所述問題詞語之間的語義相關(guān)度。則從問答知識庫中選取與獲取到的問題內(nèi)容中的詞語和答案內(nèi)容中的詞語均相匹配的問答記錄時,可以對于待評價問答對的問題詞語中的每一個詞語,均從問答記錄的問題詞語中選取出與其相匹配的問題詞語。例如獲取到的待評價問答對的問題內(nèi)容中的詞語為<山東,省會,城市>,則從選取與“山東”相匹配的問題詞語,選取與“省會”相匹配的問題詞語,選取與“城市”相匹配的問題詞語,問題詞語匹配完之后再將答案詞語相匹配,答案詞語的匹配過程與之類似,問題詞語和答案詞語完全匹配則選取出該問答記錄。

步驟13:根據(jù)相匹配的問答記錄中的問題詞語和答案詞語之間的語義相關(guān)度,對問答對的質(zhì)量進(jìn)行評價。

根據(jù)相匹配的問答記錄中的問題詞語和答案詞語之間的語義相關(guān)度,得到具體的與語義相關(guān)度的相關(guān)的數(shù)值。還以之前所舉的一個例子為例,對于待評價問答對的問題內(nèi)容中的詞語和答案內(nèi)容中的詞語(<山東,省會,城市>,<山東,省會,濟(jì)南>),選取出與其相匹配的問答記錄,根據(jù)問答記錄中的答案詞語和問題詞語之間的語義相關(guān)度。得到待評價問答對的語義相關(guān)度的相關(guān)的數(shù)值,根據(jù)上述語義相關(guān)度的數(shù)值,即可對問答對的質(zhì)量進(jìn)行評價。

例如待評價的問答對的質(zhì)量總體可分為優(yōu),中,差三級,相應(yīng)的與語義相關(guān)度的相關(guān)的數(shù)值范圍為0至1,則根據(jù)上述級數(shù)將與語義相關(guān)度的相關(guān)的數(shù)值進(jìn)行分區(qū),如果某一與語義相關(guān)度的相關(guān)的數(shù)值落在[0,0.33]之間,則可認(rèn)為該問答對的質(zhì)量為“差”,落在[0.67,1]之間,則可認(rèn)為該問答對的質(zhì)量為“優(yōu)”。

本申請實(shí)施例采用的上述技術(shù)方案,獲取待評價問答對的問題內(nèi)容中的詞語和答案內(nèi)容中的詞語,從問答知識庫中選取與獲取到的問題內(nèi)容中的詞語和答案內(nèi)容中的詞語均相匹配的問答記錄,根據(jù)相匹配的問答記錄中的問題詞語和答案詞語之間的語義相關(guān)度,對問答對的質(zhì)量進(jìn)行評價。相對于現(xiàn)有技術(shù)中僅僅根據(jù)待評價的問題和答案的相關(guān)詞覆蓋特征來評價問答對質(zhì)量,提高評價的準(zhǔn)確性。

上述實(shí)施例的步驟12中提到“從問答知識庫中選取與獲取到的問題內(nèi)容中的詞語和答案內(nèi)容中的詞語均相匹配的問答記錄”,具體可以按以下步驟進(jìn)行選?。?/p>

將獲取到的問題內(nèi)容中的詞語與問答記錄中的問題詞語相匹配,如果匹配成功,則標(biāo)記該問答記錄;

然后將將獲取到的答案內(nèi)容中的詞語與標(biāo)記的問答記錄中的答案詞語相匹配,如果匹配成功,則選取該問答記錄。

需要說明的是,這里的匹配成功,可以是兩個詞語完全一致,還可以為兩個詞語為同義詞或近義詞,又或者是兩個中的一個詞語是另一個詞語的子串等。

上述實(shí)施例的步驟12中提到問答知識庫,接下來將對問答知識庫的創(chuàng)建過程進(jìn)行詳細(xì)說明,具體參照圖2。

創(chuàng)建問答知識庫時,首先可以利用爬蟲從互聯(lián)網(wǎng)上抓取含有高質(zhì)量問答對的網(wǎng)頁,這些網(wǎng)頁可以為cQA社區(qū)、各大專業(yè)論壇,對上述網(wǎng)頁進(jìn)行解析得到大量的高質(zhì)量的問答對。另外在獲取問答對的同時,還可以提取出該問答對所屬類別信息,這些類別可以為問答社區(qū)對問答對整體的分類,例如分為游戲,醫(yī)療健康,運(yùn)動,閱讀,商業(yè)等等類別,最終獲得的問答對內(nèi)容和類別的具體格式可以如下公式所示:

<question:><content:><answer:><cate1:><cate2:><cate3:>

其次,獲取問答對以及類別之后即可構(gòu)建問答知識庫,對于上述獲取到的每條問答對,分別對問題內(nèi)容和答案內(nèi)容經(jīng)過分詞、去除停用詞、word join、提取實(shí)體詞等步驟得到問題詞語集合和答案詞語集合,其中集合的存儲格式可以如下所示:

(<QW1,QW2,…,QWi,…,QWm>,<AW1,AW2,…,AWi,…,AWn>,cate1)

令問題詞語集合中的每個問題詞語和答案詞語集合中的每個答案詞語分別在與該問答對對應(yīng)的每個類別上形成一條信息記錄,對于上述的每個問題詞語QWi(i=1,2,…,m),均計算答案詞語AWj(j=1,…,n)和問題詞語QWi的在類別cate1上的語義相關(guān)度,具體可以按如下公式:

計算該答案詞語屬于該類別的概率,具體可以按以下公式:

計算在該類別上該答案詞語對該問題詞語的解釋的專一程度,具體可以按以下公式:

計算在該類別上該問題詞語用該答案詞語進(jìn)行解釋的強(qiáng)度,具體可以按以下公式:

將概率、專一程度和強(qiáng)度相乘,所得到的乘積是該答案詞語和該問題詞語的語義相關(guān)度,具體包括:

weight(QWi,AWj|C=Ck)=P(Ck|AWj)*specific(QWi,AWj|C=Ck)*interpret(QWi,AWj|C=Ck)

其中:

P(Ck|AWj)為答案詞語AWj屬于類別Ck的概率;

specific(QWi,AWj|C=Ck)為在類別Ck上答案詞語AWj對問題詞語QWi的解釋的專一程度;

interpret(QWi,AWj|C=Ck)為在類別Ck上問題詞語QWi用答案詞語AWj進(jìn)行解釋的強(qiáng)度;

P(CK)表示類別Ck出現(xiàn)的概率;P(AWj)表示答案為AWj的概率;P(AWj|Ck)表示Ck類別屬于AWj的概率;#(QWi,AWj)表示問題詞語為QWi且答案詞語為AWj的次數(shù);#(AWj)表示答案詞語為AWj的次數(shù)。

最終,對于每個QWi,得到其對應(yīng)的問答記錄細(xì)節(jié)如圖3所示。圖3中只是顯示出三個問答記錄,需要說明的是,一個問答對可以包括多條問答記錄,這里的一個問答記錄包括一個問題詞語、與所述問題詞語相關(guān)聯(lián)的多個答案詞語,以及每個答案詞語和所述問題詞語之間的語義相關(guān)度。還需要說明的是,上述示例的語義相關(guān)度是問答記錄在一個類別之下的語義相關(guān)度。另外,一個問答記錄又包括多條記錄信息,其中每個記錄信息中包括一個問題詞語,一個答案詞語,以及答案詞語和問題詞語在所述問答記錄歸屬的類別下的語義相關(guān)度。多個上述的問答記錄構(gòu)成問答知識庫。

根據(jù)相匹配的問答記錄中的問題詞語和答案詞語之間的語義相關(guān)度,對問答對的質(zhì)量進(jìn)行評價,具體包括:根據(jù)相匹配的問答記錄中對應(yīng)于相同類別下的問答記錄,并根據(jù)相匹配的問答記錄中的問題詞語和答案詞語之間的語義相關(guān)度,得到待分析的問答對針對各個類別的相關(guān)聯(lián)程度;選取上述該待分析的問答對針對各個類別的相關(guān)聯(lián)程度的最大值,根據(jù)該最大值的大小對待分析的問答對進(jìn)行評價。

在具體計算根據(jù)問答知識庫QAWordNet計算待評價問答對的問題和答案的相關(guān)聯(lián)程度時,可以采用如下算法:

為了更清楚地說明本申請的技術(shù)方案,下面列舉一個實(shí)例進(jìn)行詳細(xì)說明。該實(shí)例為對表1所示的問答對進(jìn)行評價。

表1待評價的問答對

第一步:通過分詞技術(shù)處理,獲取待評價問答對的問題內(nèi)容中的詞語和答案內(nèi)容中的詞語,得到問題和答案中的詞語如表2所示:

從分詞結(jié)果可以看出,問題和答案中沒有相關(guān)詞覆蓋,因此現(xiàn)有技術(shù)會認(rèn)為該問答對沒有語義相關(guān)度,最終將其分為一個低質(zhì)量的問答對。

表2對待評價的問答對進(jìn)行分詞處理

第二步,根據(jù)表2中問題詞語,從問答知識庫中選取與表2中問題內(nèi)容中的詞語和答案內(nèi)容中的詞語均相匹配的問答記錄,具體如表3所示。表3中的數(shù)值為相關(guān)聯(lián)的答案詞語與問題詞語在類別為醫(yī)療健康下的語義相關(guān)度。

表3問題詞語和相關(guān)聯(lián)的答案詞語

由表3可以看出,出現(xiàn)在的相關(guān)聯(lián)的答案詞語有[口服,咳喘,小兒感冒顆粒,檢查,止咳,治療,流感癥狀,感冒顆粒]。

第三步,根據(jù)[口服,咳喘,小兒感冒顆粒,檢查,止咳,治療,流感癥狀,感冒顆粒]與表3中的問題詞語的語義相關(guān)度,得到待分析的問答對針對類別醫(yī)療健康的相關(guān)聯(lián)程度;根據(jù)相關(guān)聯(lián)程度的取值,對問答對的質(zhì)量進(jìn)行評價。經(jīng)過問答對計算可以得出,該問答對的相關(guān)聯(lián)程度的取值達(dá)到了0.9(相關(guān)聯(lián)程度的取值范圍為0-1)。因此可以看出本申請可以很好的解決這類無相關(guān)詞覆蓋但語義相似度很高的問答對。

上述幾個實(shí)施例皆為本申請的方法實(shí)施例,相應(yīng)地,本申請還提供了一種評價問答對質(zhì)量的裝置實(shí)施例,具體見圖4,包括:獲取模塊21,選取模塊22和評價模塊23,其中:

所述獲取模塊21,可以用于獲取待評價問答對的問題內(nèi)容中的詞語和答案內(nèi)容中的詞語;

所述選取模塊22,可以用于從問答知識庫中選取與獲取到的問題內(nèi)容中的詞語和答案內(nèi)容中的詞語均相匹配的問答記錄;

所述評價模塊23,可以用于根據(jù)相匹配的問答記錄中的問題詞語和答案詞語之間的語義相關(guān)度,對問答對的質(zhì)量進(jìn)行評價。

本裝置實(shí)施例工作時,選取模塊22根據(jù)獲取模塊21獲取到的問題內(nèi)容中的詞語和答案內(nèi)容中的詞語,從問答知識庫中選取與問題內(nèi)容中的詞語和答案內(nèi)容中的詞語均相匹配的問答記錄,其中,一條問答記錄包括一個問題詞語、與所述問題詞語相關(guān)聯(lián)的多個答案詞語,以及每個答案詞語分別和所述問題詞語之間的語義相關(guān)度;評價模塊23根據(jù)相匹配的問答記錄中的問題詞語和答案詞語之間的語義相關(guān)度,對問答對的質(zhì)量進(jìn)行評價,相對于現(xiàn)有技術(shù)中僅僅根據(jù)待評價的問題和答案的相關(guān)詞覆蓋特征來評價問答對質(zhì)量,提高評價的準(zhǔn)確性。

另外,選取模塊22具體包括有匹配單元,其中:匹配單元可以用于將獲取到的問題內(nèi)容中的詞語與問答記錄中的問題詞語相匹配,如果匹配成功,則標(biāo)記該問答記錄;然后將將獲取到的答案內(nèi)容中的詞語與標(biāo)記的問答記錄中的答案詞語相匹配,如果匹配成功,則選取該問答記錄。

上述提到問答知識庫,相應(yīng)的,上述裝置實(shí)施例還可以包括問答知識庫創(chuàng)建模塊,其中:所述問答知識庫創(chuàng)建模塊,可以用于預(yù)先提取出多個問答對,并獲取每個問答對對應(yīng)的類別,構(gòu)建包含有多條問答記錄的問答知識庫。

所述評價模塊23具體包括有評價單元,其中:所述評價單元,用于根據(jù)相匹配的問答記錄中對應(yīng)于相同類別下的問答記錄,并根據(jù)相匹配的問答記錄中的問題詞語和答案詞語之間的語義相關(guān)度,得到待分析的問答對針對各個類別的相關(guān)聯(lián)程度;選取上述該待分析的問答對針對各個類別的相關(guān)聯(lián)程度的最大值,根據(jù)該最大值的大小對待分析的問答對進(jìn)行評價。

以上僅為本申請的實(shí)施例而已,并不用于限制本申請。對于本領(lǐng)域技術(shù)人員來說,本申請可以有各種更改和變化。凡在本申請的精神和原理之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本申請的權(quán)利要求范圍之內(nèi)。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
杂多县| 永新县| 古蔺县| 星座| 贡觉县| 乐业县| 北票市| 余江县| 本溪| 舞阳县| 连州市| 蚌埠市| 灌云县| 乌拉特前旗| 海丰县| 伊金霍洛旗| 大姚县| 资兴市| 石台县| 华宁县| 新安县| 页游| 常德市| 深州市| 泰安市| 合川市| 那曲县| 灵寿县| 苏尼特左旗| 霍山县| 陇西县| 丰县| 光山县| 泰来县| 永顺县| 呼图壁县| 原阳县| 三河市| 凌云县| 武陟县| 棋牌|