欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

查詢方法和裝置與流程

文檔序號:11515007閱讀:327來源:國知局
查詢方法和裝置與流程

本申請涉及計(jì)算機(jī)技術(shù)領(lǐng)域,具體涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及查詢方法和裝置。



背景技術(shù):

隨著信息技術(shù)的發(fā)展,越來越多的用戶使用互聯(lián)網(wǎng)進(jìn)行信息查詢。用戶使用互聯(lián)網(wǎng)進(jìn)行查詢時(shí),往往很難在一次查詢后得到預(yù)期的查詢結(jié)果。也即由查詢引擎得到的信息通常有準(zhǔn)確度較低的問題。



技術(shù)實(shí)現(xiàn)要素:

本申請的目的在于提出一種改進(jìn)的查詢方法和裝置,來解決以上背景技術(shù)部分提到的技術(shù)問題。

第一方面,本申請實(shí)施例提供了一種查詢方法,該方法包括:從歷史查詢語句集合中獲取目標(biāo)歷史查詢語句;基于查詢?nèi)罩?,對目?biāo)歷史查詢語句進(jìn)行擴(kuò)展,生成與目標(biāo)歷史查詢語句相關(guān)聯(lián)的擴(kuò)展語句片段;將擴(kuò)展語句片段作為與目標(biāo)歷史查詢語句相關(guān)聯(lián)的語句片段特征添加到預(yù)設(shè)模型的語句片段特征庫,其中,預(yù)設(shè)模型包括領(lǐng)域識別模型和/或意圖槽位識別模型,領(lǐng)域識別模型用以表征查詢語句和查詢語句的語義所屬的預(yù)設(shè)領(lǐng)域的對應(yīng)關(guān)系,意圖槽位識別模型用以表征查詢語句和查詢語句所指示的查詢目的、對查詢目的的限定關(guān)鍵詞的對應(yīng)關(guān)系;響應(yīng)于接收到查詢語句,基于預(yù)設(shè)模型的語句片段特征庫生成查詢語句對應(yīng)的查詢結(jié)果。

在一些實(shí)施例中,基于查詢?nèi)罩荆瑢δ繕?biāo)歷史查詢語句進(jìn)行擴(kuò)展,得到擴(kuò)展語句片段,包括:利用多種預(yù)設(shè)分詞方式,對目標(biāo)歷史查詢語句進(jìn)行分詞,生成多個(gè)語句片段;從多個(gè)語句片段中,確定按照用戶選擇概率由最高到低的順序的選取預(yù)設(shè)數(shù)量的語句片段作為擴(kuò)展語句片段,或者選取用戶選擇概率高于概率閾值的語句片段作為擴(kuò)展語句片段,其中,用戶選擇概率是由每組語句片段中的每個(gè)語句片段在查詢?nèi)罩舅涗浀牟樵兘Y(jié)果的歷史點(diǎn)擊次數(shù)確定的。

在一些實(shí)施例中,基于查詢?nèi)罩荆瑢δ繕?biāo)歷史查詢語句進(jìn)行擴(kuò)展,得到擴(kuò)展語句片段,包括:利用多種預(yù)設(shè)分詞方式,對目標(biāo)歷史查詢語句進(jìn)行分詞,生成多個(gè)語句片段;對于多個(gè)語句片段中的語句片段,確定作為查詢語句的該語句片段所對應(yīng)的歷史用戶選擇網(wǎng)頁的標(biāo)題;對標(biāo)題進(jìn)行分詞,生成標(biāo)題的至少兩個(gè)語句片段;確定標(biāo)題的每個(gè)語句片段的權(quán)重值,并將權(quán)重值高于預(yù)設(shè)權(quán)重閾值的語句片段作為擴(kuò)展語句片段。

在一些實(shí)施例中,基于查詢?nèi)罩?,對目?biāo)歷史查詢語句進(jìn)行擴(kuò)展,得到擴(kuò)展語句片段,包括:響應(yīng)于確定目標(biāo)歷史查詢語句中的第一目標(biāo)片段和目標(biāo)歷史查詢語句所對應(yīng)的歷史用戶選擇網(wǎng)頁的標(biāo)題中的第二目標(biāo)片段在句中單側(cè)的語境一致的概率大于第一預(yù)設(shè)閾值,或者兩側(cè)的語境一致的概率大于第二預(yù)設(shè)閾值,則確定第一目標(biāo)片段和第二目標(biāo)片段是同義片段,并將第二目標(biāo)片段確定為擴(kuò)展語句片段,其中,歷史用戶選擇網(wǎng)頁被選擇的記錄記錄于查詢?nèi)罩局小?/p>

在一些實(shí)施例中,基于查詢?nèi)罩?,對目?biāo)歷史查詢語句進(jìn)行擴(kuò)展,得到擴(kuò)展語句片段,包括:響應(yīng)于確定在指定歷史時(shí)間段內(nèi),第一目標(biāo)片段位于目標(biāo)歷史查詢語句中并且第二目標(biāo)片段位于目標(biāo)歷史查詢語句所對應(yīng)的多個(gè)歷史用戶選擇網(wǎng)頁的標(biāo)題中的概率大于預(yù)設(shè)閾值,則確定第一目標(biāo)片段和第二目標(biāo)片段是同義片段,并將第二目標(biāo)片段確定為擴(kuò)展語句片段,其中,歷史用戶選擇網(wǎng)頁被選擇的記錄記錄于查詢?nèi)罩局小?/p>

在一些實(shí)施例中,基于查詢?nèi)罩?,對目?biāo)歷史查詢語句進(jìn)行擴(kuò)展,得到擴(kuò)展語句片段,包括:基于深度神經(jīng)網(wǎng)絡(luò),確定目標(biāo)歷史查詢語句中的第一目標(biāo)片段和目標(biāo)歷史查詢語句所對應(yīng)的歷史用戶選擇網(wǎng)頁的標(biāo)題中的第二目標(biāo)片段的語義相似度,其中,歷史用戶選擇網(wǎng)頁被選擇的記錄記錄于查詢?nèi)罩局?;響?yīng)于確定語義相似度在預(yù)設(shè)相似度閾值以上,則確定第一目標(biāo)片段和第二目標(biāo)片段是同義片段,并將第二目標(biāo)片段確定為擴(kuò)展語句片段。

在一些實(shí)施例中,在確定第一目標(biāo)片段和第二目標(biāo)片段是同義片段之后,基于查詢?nèi)罩?,對目?biāo)歷史查詢語句進(jìn)行擴(kuò)展,得到擴(kuò)展語句片段,還包括:向客戶端推送包括第一目標(biāo)片段和第二目標(biāo)片段的同義片段待確認(rèn)信息;響應(yīng)于接收到客戶端返回同義片段確認(rèn)信息,確定第一目標(biāo)片段和第二目標(biāo)片段是確認(rèn)同義片段。

在一些實(shí)施例中,該方法還包括:響應(yīng)于確定目標(biāo)歷史查詢語句包括待確定語句片段和預(yù)設(shè)查詢目的片段集合中的查詢目的片段,確定查詢?nèi)罩局惺欠翊嬖谀繕?biāo)歷史查詢語句;響應(yīng)于確定查詢?nèi)罩局写嬖谀繕?biāo)歷史查詢語句,對語句片段特征庫中的待確定語句片段添加用于指示修飾功能的指定標(biāo)簽。

在一些實(shí)施例中,基于預(yù)設(shè)模型的語句片段特征庫生成查詢語句對應(yīng)的查詢結(jié)果,包括:響應(yīng)于預(yù)設(shè)模型包括領(lǐng)域識別模型和意圖槽位識別模型,根據(jù)多個(gè)領(lǐng)域識別模型中的每個(gè)領(lǐng)域識別模型的語句片段特征庫,從多個(gè)領(lǐng)域識別模型中,確定與查詢語句相匹配的至少一個(gè)領(lǐng)域識別模型及至少一個(gè)領(lǐng)域識別模型對應(yīng)的預(yù)設(shè)領(lǐng)域;對于每一個(gè)預(yù)設(shè)領(lǐng)域,將查詢語句輸入該預(yù)設(shè)領(lǐng)域?qū)?yīng)的意圖槽位識別模型,基于查詢語句與意圖槽位模型的語句片段特征庫中語句片段特征的匹配,得到查詢語句所指示的查詢目的和對查詢目的的限定關(guān)鍵詞;在信息庫中查找與查詢目的和限定關(guān)鍵詞匹配的信息,將查找到的信息作為查詢結(jié)果。

第二方面,本申請?zhí)峁┝艘环N查詢裝置,該裝置包括:獲取單元,配置用于從歷史查詢語句集合中獲取目標(biāo)歷史查詢語句;擴(kuò)展單元,配置用于基于查詢?nèi)罩?,對目?biāo)歷史查詢語句進(jìn)行擴(kuò)展,生成與目標(biāo)歷史查詢語句相關(guān)聯(lián)的擴(kuò)展語句片段;添加單元,配置用于將擴(kuò)展語句片段作為與目標(biāo)歷史查詢語句相關(guān)聯(lián)的語句片段特征添加到預(yù)設(shè)模型的語句片段特征庫,其中,預(yù)設(shè)模型包括領(lǐng)域識別模型和/或意圖槽位識別模型,領(lǐng)域識別模型用以表征查詢語句和查詢語句的語義所屬的預(yù)設(shè)領(lǐng)域的對應(yīng)關(guān)系,意圖槽位識別模型用以表征查詢語句和查詢語句所指示的查詢目的、對查詢目的的限定關(guān)鍵詞的對應(yīng)關(guān)系;生成單元,配置用于響應(yīng)于接收到查詢語句,基于預(yù)設(shè)模型的語句片段特征庫生成查詢語句對應(yīng)的查詢結(jié)果。

在一些實(shí)施例中,擴(kuò)展單元,包括:分詞模塊,配置用于利用多種預(yù)設(shè)分詞方式,對目標(biāo)歷史查詢語句進(jìn)行分詞,生成多個(gè)語句片段;確定模塊,配置用于從多個(gè)語句片段中,確定按照用戶選擇概率由最高到低的順序的選取預(yù)設(shè)數(shù)量的語句片段作為擴(kuò)展語句片段,或者選取用戶選擇概率高于概率閾值的語句片段作為擴(kuò)展語句片段,其中,用戶選擇概率是由每組語句片段中的每個(gè)語句片段在查詢?nèi)罩舅涗浀牟樵兘Y(jié)果的歷史點(diǎn)擊次數(shù)確定的。

在一些實(shí)施例中,擴(kuò)展單元,包括:生成模塊,配置用于利用多種預(yù)設(shè)分詞方式,對目標(biāo)歷史查詢語句進(jìn)行分詞,生成多個(gè)語句片段;語句片段生成模塊,配置用于對于多個(gè)語句片段中的語句片段,確定作為查詢語句的該語句片段所對應(yīng)的歷史用戶選擇網(wǎng)頁的標(biāo)題;對標(biāo)題進(jìn)行分詞,生成標(biāo)題的至少兩個(gè)語句片段;確定標(biāo)題的每個(gè)語句片段的權(quán)重值,并將權(quán)重值高于預(yù)設(shè)權(quán)重閾值的語句片段作為擴(kuò)展語句片段。

在一些實(shí)施例中,擴(kuò)展單元,包括:確定同義模塊,配置用于響應(yīng)于確定目標(biāo)歷史查詢語句中的第一目標(biāo)片段和目標(biāo)歷史查詢語句所對應(yīng)的歷史用戶選擇網(wǎng)頁的標(biāo)題中的第二目標(biāo)片段在句中單側(cè)的語境一致的概率大于第一預(yù)設(shè)閾值,或者兩側(cè)的語境一致的概率大于第二預(yù)設(shè)閾值,則確定第一目標(biāo)片段和第二目標(biāo)片段是同義片段,并將第二目標(biāo)片段確定為擴(kuò)展語句片段,其中,歷史用戶選擇網(wǎng)頁被選擇的記錄記錄于查詢?nèi)罩局小?/p>

在一些實(shí)施例中,擴(kuò)展單元,還包括:推送模塊,配置用于向客戶端推送包括第一目標(biāo)片段和第二目標(biāo)片段的同義片段待確認(rèn)信息;同義確認(rèn)模塊,配置用于響應(yīng)于接收到客戶端返回同義片段確認(rèn)信息,確定第一目標(biāo)片段和第二目標(biāo)片段是確認(rèn)同義片段。

本申請實(shí)施例提供的查詢方法和裝置,首先通過從歷史查詢語句集合中獲取目標(biāo)歷史查詢語句;之后基于查詢?nèi)罩?,對目?biāo)歷史查詢語句進(jìn)行擴(kuò)展,生成與目標(biāo)歷史查詢語句相關(guān)聯(lián)的擴(kuò)展語句片段;然后將擴(kuò)展語句片段作為與目標(biāo)歷史查詢語句相關(guān)聯(lián)的語句片段特征添加到預(yù)設(shè)模型的語句片段特征庫,其中,預(yù)設(shè)模型包括領(lǐng)域識別模型和/或意圖槽位識別模型,領(lǐng)域識別模型用以表征查詢語句和查詢語句的語義所屬的預(yù)設(shè)領(lǐng)域的對應(yīng)關(guān)系,意圖槽位識別模型用以表征查詢語句和查詢語句所指示的查詢目的、對查詢目的的限定關(guān)鍵詞的對應(yīng)關(guān)系;最后響應(yīng)于接收到查詢語句,基于預(yù)設(shè)模型的語句片段特征庫生成查詢語句對應(yīng)的查詢結(jié)果。通過將擴(kuò)展語句片段作為與目標(biāo)歷史查詢語句相關(guān)聯(lián)的語句片段特征添加到預(yù)設(shè)模型的語句片段特征庫,能夠生成更準(zhǔn)確的查找結(jié)果。

附圖說明

通過閱讀參照以下附圖所作的對非限制性實(shí)施例所作的詳細(xì)描述,本申請的其它特征、目的和優(yōu)點(diǎn)將會變得更明顯:

圖1是本申請可以應(yīng)用于其中的示例性系統(tǒng)架構(gòu)圖;

圖2是根據(jù)本申請的查詢方法的一個(gè)實(shí)施例的流程圖;

圖3是根據(jù)本申請的查詢方法的一個(gè)應(yīng)用場景的示意圖;

圖4是根據(jù)本申請的查詢方法的又一個(gè)實(shí)施例的流程圖;

圖5是根據(jù)本申請的查詢方法的又一個(gè)實(shí)施例的流程圖;

圖6是根據(jù)本申請的查詢方法的又一個(gè)實(shí)施例的流程圖;

圖7是根據(jù)本申請的查詢方法的又一個(gè)實(shí)施例的流程圖;

圖8是根據(jù)本申請的查詢方法的又一個(gè)實(shí)施例的流程圖;

圖9是根據(jù)本申請的查詢方法的又一個(gè)實(shí)施例的流程圖;

圖10是根據(jù)本申請的查詢裝置的一個(gè)實(shí)施例的結(jié)構(gòu)示意圖;

圖11是適于用來實(shí)現(xiàn)本申請實(shí)施例的服務(wù)器的計(jì)算機(jī)系統(tǒng)的結(jié)構(gòu)示意圖。

具體實(shí)施方式

下面結(jié)合附圖和實(shí)施例對本申請作進(jìn)一步的詳細(xì)說明??梢岳斫獾氖?,此處所描述的具體實(shí)施例僅僅用于解釋相關(guān)發(fā)明,而非對該發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與有關(guān)發(fā)明相關(guān)的部分。

需要說明的是,在不沖突的情況下,本申請中的實(shí)施例及實(shí)施例中的特征可以相互組合。下面將參考附圖并結(jié)合實(shí)施例來詳細(xì)說明本申請。

圖1示出了可以應(yīng)用本申請的查詢方法或查詢裝置的實(shí)施例的示例性系統(tǒng)架構(gòu)100。

如圖1所示,系統(tǒng)架構(gòu)100可以包括終端設(shè)備101、102、103,網(wǎng)絡(luò)104和服務(wù)器105。網(wǎng)絡(luò)104用以在終端設(shè)備101、102、103和服務(wù)器105之間提供通信鏈路的介質(zhì)。網(wǎng)絡(luò)104可以包括各種連接類型,例如有線、無線通信鏈路或者光纖電纜等等。

用戶可以使用終端設(shè)備101、102、103通過網(wǎng)絡(luò)104與服務(wù)器105交互,以接收或發(fā)送消息等。終端設(shè)備101、102、103上可以安裝有各種通訊客戶端應(yīng)用,例如查詢類應(yīng)用、即時(shí)通信工具、郵箱客戶端、社交平臺軟件等。

終端設(shè)備101、102、103可以是具有顯示屏并且支持查詢的各種電子設(shè)備,包括但不限于智能手機(jī)、平板電腦、電子書閱讀器、mp3播放器(movingpictureexpertsgroupaudiolayeriii,動態(tài)影像專家壓縮標(biāo)準(zhǔn)音頻層面3)、mp4(movingpictureexpertsgroupaudiolayeriv,動態(tài)影像專家壓縮標(biāo)準(zhǔn)音頻層面4)播放器、膝上型便攜計(jì)算機(jī)和臺式計(jì)算機(jī)等等。

服務(wù)器105可以是提供各種服務(wù)的服務(wù)器,例如對終端設(shè)備101、102、103上顯示的查詢界面提供支持的后臺網(wǎng)頁服務(wù)器。后臺網(wǎng)頁服務(wù)器可以對接收到的查詢請求等數(shù)據(jù)進(jìn)行分析等處理,并將處理結(jié)果(例如查詢結(jié)果)反饋給終端設(shè)備。

需要說明的是,本申請實(shí)施例所提供的查詢方法一般由服務(wù)器105執(zhí)行,相應(yīng)地,查詢裝置一般設(shè)置于服務(wù)器105中。

應(yīng)該理解,圖1中的終端設(shè)備、網(wǎng)絡(luò)和服務(wù)器的數(shù)目僅僅是示意性的。根據(jù)實(shí)現(xiàn)需要,可以具有任意數(shù)目的終端設(shè)備、網(wǎng)絡(luò)和服務(wù)器。

繼續(xù)參考圖2,示出了根據(jù)本申請的查詢方法的一個(gè)實(shí)施例的流程200。該查詢方法,包括以下步驟:

步驟201,從歷史查詢語句集合中獲取目標(biāo)歷史查詢語句。

在本實(shí)施例中,查詢方法運(yùn)行于其上的電子設(shè)備(例如圖1所示的服務(wù)器)可以從指定的歷史查詢語句集合中,獲取目標(biāo)歷史查詢語句。這里的歷史查詢語句集合是用戶在過去所查詢的一些查詢語句的集合。該集合可以是指定的歷史時(shí)間段內(nèi)所查詢的多個(gè)(也可以是一個(gè))查詢語句組成的集合,也可以是人為指定的一些查詢語句所生成的集合。目標(biāo)歷史查詢語句為人為設(shè)定的或者按照預(yù)設(shè)規(guī)則獲取的(比如獲取時(shí)間最新的查詢語句或者獲取三個(gè)月內(nèi)最先查詢的查詢語句)在過去用戶所查詢的語句。

這里的查詢可以是利用網(wǎng)絡(luò)查詢引擎進(jìn)行的查詢,也可以是在指定的查詢平臺上進(jìn)行的查詢。而如果查詢指的是后者,進(jìn)行查詢的用戶則為使用查詢平臺進(jìn)行查詢的產(chǎn)品端用戶。

步驟202,基于查詢?nèi)罩?,對目?biāo)歷史查詢語句進(jìn)行擴(kuò)展,生成與目標(biāo)歷史查詢語句相關(guān)聯(lián)的擴(kuò)展語句片段。

在本實(shí)施例中,上述電子設(shè)備在獲取到目標(biāo)歷史查詢語句之后,可以基于查詢?nèi)罩?,對獲取到目標(biāo)歷史查詢語句進(jìn)行擴(kuò)展,生成擴(kuò)展語句片段。生成的擴(kuò)展語句片段與目標(biāo)歷史查詢語句相關(guān)聯(lián)。查詢?nèi)罩緸橛脩暨M(jìn)行查詢所生成的包括查詢記錄的日志。為了獲得更加豐富的數(shù)據(jù),查詢?nèi)罩舅涗浀挠脩艨梢允鞘褂镁W(wǎng)絡(luò)查詢引擎進(jìn)行查詢的用戶。當(dāng)然,這里的用戶也可以是指定查詢平臺的用戶。擴(kuò)展指根據(jù)目標(biāo)歷史查詢語句,進(jìn)行語句片段的增加,以得到更多的相關(guān)聯(lián)語句片段。語句片段指可以參與組成語句的字、詞、詞組或短語等,字符長度比較靈活。擴(kuò)展語句片段為對目標(biāo)歷史查詢語句進(jìn)行擴(kuò)展,得到的與目標(biāo)歷史查詢語句相關(guān)聯(lián)的一個(gè)或多個(gè)語句片段。

與目標(biāo)歷史查詢語句相關(guān)聯(lián)的詞語片段與目標(biāo)歷史查詢語句可以是多種關(guān)系。比如,包含、語義相近或語義相反等等。

步驟203,將擴(kuò)展語句片段作為與目標(biāo)歷史查詢語句相關(guān)聯(lián)的語句片段特征添加到預(yù)設(shè)模型的語句片段特征庫。

在本實(shí)施例中,上述電子設(shè)備將得到的擴(kuò)展語句片段作為與目標(biāo)歷史查詢語句相關(guān)聯(lián)的語句片段特征,將該語句片段特征添加到語句片段特征庫中。預(yù)設(shè)模型包括領(lǐng)域識別模型和/或意圖槽位識別模型,領(lǐng)域識別模型用以表征查詢語句和查詢語句的語義所屬的預(yù)設(shè)領(lǐng)域的對應(yīng)關(guān)系,意圖槽位識別模型用以表征查詢語句和查詢語句所指示的查詢目的、對查詢目的的限定關(guān)鍵詞的對應(yīng)關(guān)系。在意圖槽位識別模型中輸入查詢語句,可以輸出查詢目的、對查詢目的的限定關(guān)鍵詞。

舉例來說,查詢語句為“推薦恐怖的影片”,輸入領(lǐng)域識別模型,模型輸出查詢語句的領(lǐng)域?yàn)椤半娪啊?。如果將該查詢語句輸入意圖槽位識別模型,輸出查詢目的為“尋找電影”,限定關(guān)鍵詞為“恐怖”。

查詢語句的語義指查詢語句的語言含義。預(yù)設(shè)領(lǐng)域指預(yù)先設(shè)置的信息所屬的廣泛的類別。查詢目的(也即意圖),為用戶進(jìn)行查詢的直接目的,也就是用戶想通過查詢得到什么,體現(xiàn)了查詢語句要進(jìn)行怎樣的操作,以及該操作所要得到的核心內(nèi)容。限定關(guān)鍵詞(也即槽位)為對查詢目的的修飾和限定的詞語或語句片段,可以在查詢目的的基礎(chǔ)上,進(jìn)一步細(xì)化表現(xiàn)用戶的需求。

語句片段特征庫是預(yù)設(shè)模型所采用的數(shù)據(jù)庫,數(shù)據(jù)庫中存放著大量的語句片段特征。語句片段特征可以是各種各樣的語句片段,比如字、詞、詞組和短語等等,用以對查詢語句進(jìn)行對照和識別,以了解查詢語句的語義。向預(yù)設(shè)模型中輸入查詢語句,將查詢語句匹配到語義最接近的語句片段特征,進(jìn)而得到預(yù)設(shè)模型的輸出。

構(gòu)建上述領(lǐng)域識別模型可以預(yù)先組成該模型的語句片段特征庫,并建立語句片段特征庫中的語句片段特征與領(lǐng)域識別模型的輸出的對應(yīng)關(guān)系表。之后可以將該對應(yīng)關(guān)系表作為領(lǐng)域識別模型。意圖槽位識別模型也可以預(yù)先組成該模型的語句片段特征庫,并建立語句片段特征與模型的輸出的對應(yīng)關(guān)系表。之后將該對應(yīng)關(guān)系表作為意圖槽位識別模型。

可以使用如下方式構(gòu)建領(lǐng)域識別模型:首先將語句片段作為訓(xùn)練樣本,獲取大量語句片段,并且對語句片段標(biāo)注查詢領(lǐng)域,將標(biāo)注后的語句片段存入語句片段特征庫。利用語句片段特征庫中的語句片段特征對詞袋模型(bagofwords)或卷積神經(jīng)網(wǎng)絡(luò)(convolutionalneuralnetwork,cnn)等現(xiàn)有的用于文本相似度分析的模型進(jìn)行訓(xùn)練,得到領(lǐng)域識別模型。

可以使用如下方式構(gòu)建意圖槽位識別模型:將語句片段作為訓(xùn)練樣本,獲取大量語句片段,并對語句片段標(biāo)注查詢目的和對查詢目的的限定關(guān)鍵詞,將標(biāo)注后的語句片段存入語句片段特征庫。之后利用語句片段特征庫中的語句片段特征對循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrentneuralnetworks,rnn)、深度神經(jīng)網(wǎng)絡(luò)(deepneuralnetwork,dnn)等現(xiàn)有的分析模型進(jìn)行訓(xùn)練,得到意圖槽位識別模型。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,意圖槽位識別模型除了可以得到限定關(guān)鍵詞以外,還可以得到限定關(guān)鍵詞所屬的具體類別。比如“恐怖”的具體類別為電影類型。具體類別與領(lǐng)域和查詢目的相關(guān)聯(lián)。

預(yù)設(shè)模型可以包括領(lǐng)域識別模型和意圖槽位識別模型中的任意一者或兩者。所以,將語句片段特征可以添加到上述兩種模型中的一者或者兩者中。預(yù)設(shè)模型可以是二分類模型,也即通過模型的語句片段特征庫,判斷一個(gè)查詢語句是否屬于該模型的類別。也可以是多分類模型。

在對目標(biāo)歷史查詢語句進(jìn)行擴(kuò)展后,得到新的語句片段特征,可以對原有的語句片段特征庫進(jìn)行補(bǔ)充。使原有的預(yù)設(shè)模型不能識別的查詢語句能夠得到識別,或者識別得更加準(zhǔn)確。

步驟204,響應(yīng)于接收到查詢語句,基于預(yù)設(shè)模型的語句片段特征庫生成查詢語句對應(yīng)的查詢結(jié)果。

在本實(shí)施例中,上述電子設(shè)備在接收到查詢語句后,可以基于預(yù)設(shè)模型的已經(jīng)更新的語句片段特征庫,生成查詢語句對應(yīng)的查詢結(jié)果。具體地,可以在語句片段特征庫中查找查詢語句對應(yīng)的語句片段特征,進(jìn)而輸出領(lǐng)域,以及與該領(lǐng)域相關(guān)的查詢目的和限定關(guān)鍵詞?;蛘咧惠敵鲱I(lǐng)域或者只輸出查詢目的和限定關(guān)鍵詞。根據(jù)輸出,在信息庫中查找與輸出相匹配的信息,將查找到的信息作為查詢結(jié)果。

繼續(xù)參見圖3,圖3是根據(jù)本實(shí)施例的查詢方法的應(yīng)用場景的一個(gè)示意圖。在圖3的應(yīng)用場景中,服務(wù)器從歷史查詢語句集合中,獲取一條目標(biāo)歷史查詢語句“推薦恐怖的影片”302;之后,服務(wù)器可以后基于查詢?nèi)罩荆瑢Α巴扑]恐怖的影片”進(jìn)行擴(kuò)展,生成擴(kuò)展語句片段“影片”303;然后,上述服務(wù)器將“影片”作為與“推薦恐怖的影片”相關(guān)聯(lián)的語句片段特征添加到領(lǐng)域識別模型的語句片段特征庫和意圖槽位識別模型的語句片段特征庫;最后,用戶306進(jìn)行查詢,上述服務(wù)器獲得查詢語句304,并利用更新后的領(lǐng)域識別模型的語句片段特征庫和意圖槽位識別模型的語句片段特征庫,生成查詢結(jié)果305,并推送給用戶306。

本申請的上述實(shí)施例提供的方法通過將擴(kuò)展語句片段作為與目標(biāo)歷史查詢語句相關(guān)聯(lián)的語句片段特征添加到預(yù)設(shè)模型的語句片段特征庫,能夠生成更準(zhǔn)確的查找結(jié)果。

進(jìn)一步參考圖4,其示出了查詢方法的又一個(gè)實(shí)施例的流程400。該查詢方法的流程400,包括以下步驟:

步驟401,從歷史查詢語句集合中獲取目標(biāo)歷史查詢語句。

在本實(shí)施例中,服務(wù)器可以從指定的歷史查詢語句集合中,獲取目標(biāo)歷史查詢語句。這里的歷史查詢語句集合是用戶在過去所查詢的一些查詢語句的集合。該集合可以是指定的歷史時(shí)間段內(nèi)所查詢的多個(gè)(也可以是一個(gè))查詢語句組成的集合,也可以是人為指定的一些查詢語句所組成的集合。目標(biāo)歷史查詢語句為人為設(shè)定的或者按照預(yù)設(shè)規(guī)則獲取的,在過去用戶所查詢的語句。

步驟402,利用多種預(yù)設(shè)分詞方式,對目標(biāo)歷史查詢語句進(jìn)行分詞,生成多個(gè)語句片段。

在本實(shí)施例中,上述服務(wù)器利用預(yù)設(shè)的多種分詞方式,對目標(biāo)歷史查詢語句進(jìn)行分詞。分詞后生成多組語句片段。每一組語句片段中包括多個(gè)語句片段。這里的分詞為對語句進(jìn)行拆開和分解。每種分詞方式都可以生成若干個(gè)語句片段。由多種分詞方式,可以得到多個(gè)不同的語句片段。得到的多個(gè)語句片段的粒度可以是不同的。比如,查詢語句為“淮北這兩天要上映的動畫片兒”,可以分詞得到“淮北”和“這兩天要上映的動畫片兒”。也可以分詞得到“淮北”、“這兩天要上映的”和“動畫片兒”等等。預(yù)設(shè)的多種分詞方式可以包括正向最大匹配法,逆向最大匹配法和雙向最大匹配法等等。

步驟403,從多個(gè)語句片段中,確定按照用戶選擇概率由最高到低的順序的選取預(yù)設(shè)數(shù)量的語句片段作為擴(kuò)展語句片段,或者選取用戶選擇概率高于概率閾值的語句片段作為擴(kuò)展語句片段。

在本實(shí)施例中,上述服務(wù)器在多個(gè)語句片段中,確定用戶選擇概率較高的。具體的,可以按照用戶選擇概率由高到低的順序,選取預(yù)設(shè)數(shù)量的語句片段作為擴(kuò)展語句片段。預(yù)設(shè)數(shù)量可以是一個(gè)或者多個(gè)。此外,也可以預(yù)先設(shè)定概率閾值,將上述多個(gè)語句片段中用戶選擇概率大于概率閾值的語句片段作為擴(kuò)展語句片段。用戶選擇概率是由每組語句片段中的每個(gè)語句片段在查詢?nèi)罩舅涗浀牟樵兘Y(jié)果的歷史點(diǎn)擊次數(shù)確定的,指用戶在對該語句片段所對應(yīng)的查詢結(jié)果進(jìn)行點(diǎn)擊選擇的概率。歷史點(diǎn)擊次數(shù)為用戶在過去以一個(gè)語句片段作為查詢語句進(jìn)行查詢時(shí),對得到的查詢結(jié)果進(jìn)行點(diǎn)擊選擇的次數(shù)。曾經(jīng)以該語句片段作為查詢語句,所得到的查詢結(jié)果可以是多個(gè)網(wǎng)頁的網(wǎng)址,也即統(tǒng)一資源定位符(uniformresourelocator,url)。對查詢結(jié)果中的任意一個(gè)網(wǎng)址進(jìn)行的點(diǎn)擊都可以進(jìn)行點(diǎn)擊次數(shù)累計(jì)。

在查詢?nèi)罩居涗浛梢杂涗浻幸悦總€(gè)語句片段為查詢語句進(jìn)行查詢后,用戶對查詢結(jié)果進(jìn)行點(diǎn)擊的次數(shù)。用戶對查詢結(jié)果的點(diǎn)擊次數(shù)可以體現(xiàn)用戶對查詢結(jié)果的滿意度。如果用戶面對查詢結(jié)果,進(jìn)行了多次點(diǎn)擊或者沒有進(jìn)行點(diǎn)擊,都表示查詢結(jié)果不是用戶的理想查詢結(jié)果,用戶的滿意度較低。所以,可以預(yù)設(shè)一個(gè)點(diǎn)擊次數(shù)值,若對一個(gè)語句片段的點(diǎn)擊次數(shù)與該預(yù)設(shè)的點(diǎn)擊次數(shù)值越接近,則確定該語句片段的用戶選擇概率高。也可以設(shè)定點(diǎn)擊次數(shù)與用戶選擇概率的對應(yīng)關(guān)系,從而根據(jù)對應(yīng)關(guān)系由點(diǎn)擊次數(shù)確定用戶選擇概率。上述服務(wù)器確定各組語句片段的用戶選擇概率,并將選擇概率最高的一組語句片段確定為擴(kuò)展語句片段。

步驟404,將擴(kuò)展語句片段作為與目標(biāo)歷史查詢語句相關(guān)聯(lián)的語句片段特征添加到預(yù)設(shè)模型的語句片段特征庫。

在本實(shí)施例中,上述服務(wù)器將得到的擴(kuò)展語句片段作為與目標(biāo)歷史查詢語句相關(guān)聯(lián)的語句片段特征,將該語句片段特征添加到語句片段特征庫中。預(yù)設(shè)模型包括領(lǐng)域識別模型和/或意圖槽位識別模型,領(lǐng)域識別模型用以表征查詢語句和查詢語句的語義所屬的預(yù)設(shè)領(lǐng)域的對應(yīng)關(guān)系,意圖槽位識別模型用以表征查詢語句和查詢語句所指示的查詢目的、對查詢目的的限定關(guān)鍵詞的對應(yīng)關(guān)系。在意圖槽位識別模型中輸入查詢語句,可以輸出查詢目的、對查詢目的的限定關(guān)鍵詞。

語句片段特征庫是預(yù)設(shè)模型所采用的數(shù)據(jù)庫,數(shù)據(jù)庫中存放著大量的語句片段特征。語句片段特征可以是各種各樣的語句片段,比如字、詞、詞組和短語等等,用以對查詢語句進(jìn)行對照和識別,以了解查詢語句的語義。向預(yù)設(shè)模型中輸入查詢語句,將查詢語句匹配到語義最接近的語句片段特征,進(jìn)而得到預(yù)設(shè)模型的輸出。

查詢語句的語義指查詢語句的語言含義。預(yù)設(shè)領(lǐng)域指預(yù)先設(shè)置的信息所屬的廣泛的類別。查詢目的(也即意圖),為用戶進(jìn)行查詢的直接目的,也就是用戶想通過查詢得到什么,體現(xiàn)了查詢語句要進(jìn)行怎樣的操作,以及該操作所要得到的核心內(nèi)容。限定關(guān)鍵詞(也即槽位)為對查詢目的的修飾和限定的詞語或語句片段,可以在查詢目的的基礎(chǔ)上,進(jìn)一步細(xì)化表現(xiàn)用戶的需求。

舉例來說,查詢語句為“推薦恐怖的電影”,其領(lǐng)域?yàn)椤半娪啊保樵兡康臑椤皩ふ译娪啊?,限定關(guān)鍵詞為“恐怖”。而如果語句片段特征庫中,不存在“電影”這個(gè)語句片段特征,則領(lǐng)域識別模型則無法識別查詢語句的領(lǐng)域。如果將該查詢語句作為目標(biāo)歷史查詢語句,則可以經(jīng)過分詞和確定用戶選擇概率,得到“電影”這個(gè)語句片段特征。后續(xù)再有查找電影的查詢語句,領(lǐng)域識別模型就可以識別得到“電影”領(lǐng)域。

步驟405,響應(yīng)于接收到查詢語句,基于預(yù)設(shè)模型的語句片段特征庫生成查詢語句對應(yīng)的查詢結(jié)果。

在本實(shí)施例中,上述服務(wù)器在接收到查詢語句后,可以基于預(yù)設(shè)模型的已經(jīng)更新的語句片段特征庫,生成查詢語句對應(yīng)的查詢結(jié)果。具體地,可以在語句片段特征庫中查找查詢語句對應(yīng)的語句片段特征,進(jìn)而輸出領(lǐng)域,以及與該領(lǐng)域相關(guān)的查詢目的和限定關(guān)鍵詞。或者只輸出領(lǐng)域或者只輸出查詢目的和限定關(guān)鍵詞。根據(jù)輸出,在信息庫中查找與輸出相匹配的信息,將查找到的信息作為查詢結(jié)果。

本實(shí)施例利用了查詢?nèi)罩局杏脩暨M(jìn)行點(diǎn)擊的數(shù)據(jù),在豐富語句片段特征庫的同時(shí),使語句片段特征庫中的特征更能夠滿足用戶的需求。

進(jìn)一步參考圖5,其示出了查詢方法的又一個(gè)實(shí)施例的流程500。該查詢方法的流程500,包括以下步驟:

步驟501,從歷史查詢語句集合中獲取目標(biāo)歷史查詢語句。

在本實(shí)施例中,服務(wù)器可以從指定的歷史查詢語句集合中,獲取目標(biāo)歷史查詢語句。這里的歷史查詢語句集合是用戶在過去所查詢的一些查詢語句的集合。該集合可以是指定的歷史時(shí)間段內(nèi)所查詢的多個(gè)(也可以是一個(gè))查詢語句組成的集合,也可以是人為指定的一些查詢語句所組成的集合。目標(biāo)歷史查詢語句為人為設(shè)定的或者按照預(yù)設(shè)規(guī)則獲取的,在過去用戶所查詢的語句。

步驟502,利用多種預(yù)設(shè)分詞方式,對目標(biāo)歷史查詢語句進(jìn)行分詞,生成多個(gè)語句片段。

在本實(shí)施例中,上述服務(wù)器利用預(yù)設(shè)的多種分詞方式,對目標(biāo)歷史查詢語句進(jìn)行分詞。分詞后生成多組語句片段。每一組語句片段中包括多個(gè)語句片段。這里的分詞為對語句進(jìn)行拆開和分解。每種分詞方式都可以生成若干個(gè)語句片段。由多種分詞方式,可以得到多個(gè)不同的語句片段。預(yù)設(shè)的多種分詞方式可以包括正向最大匹配法,逆向最大匹配法和雙向最大匹配法等等。

舉例來說,

步驟503,對于多個(gè)語句片段中的語句片段,確定作為查詢語句的該語句片段所對應(yīng)的歷史用戶選擇網(wǎng)頁的標(biāo)題;對標(biāo)題進(jìn)行分詞,生成標(biāo)題的至少兩個(gè)語句片段;確定標(biāo)題的每個(gè)語句片段的權(quán)重值,并將權(quán)重值高于預(yù)設(shè)權(quán)重閾值的語句片段作為擴(kuò)展語句片段。

在本實(shí)施例中,將步驟503分解成如下的3個(gè)子步驟,即步驟5031、步驟5032和步驟5033。

步驟5031,對于多個(gè)語句片段中的語句片段,確定作為查詢語句的該語句片段所對應(yīng)的歷史用戶選擇網(wǎng)頁的標(biāo)題。

在本實(shí)施例中,上述服務(wù)器對于多個(gè)語句片段中的語句片段,確定過去在該語句片段作為查詢語句后,用戶在查詢結(jié)果中所選擇的網(wǎng)頁的標(biāo)題。歷史用戶選擇網(wǎng)頁為在過去用戶對某個(gè)語句片段進(jìn)行查詢后,從查詢結(jié)果中選取的url對應(yīng)的網(wǎng)頁。

在這里,執(zhí)行操作的對象可以是多個(gè)語句片段中的一個(gè)或者多個(gè)語句片段。從多個(gè)語句片段中確定語句片段可以有多種方式,比如,從多個(gè)語句片段中,確定按照用戶選擇概率由最高到低的順序的選取預(yù)設(shè)數(shù)量的語句片段,或者選取用戶選擇概率高于概率閾值的語句片段。還可以按照獲得語句片段的時(shí)間順序,或者進(jìn)行隨機(jī)選取等等。

步驟5032,對標(biāo)題進(jìn)行分詞,生成標(biāo)題的至少兩個(gè)語句片段。

在本實(shí)施例中,上述服務(wù)器可以使用預(yù)設(shè)的某種分詞方式,對得到的網(wǎng)頁的標(biāo)題進(jìn)行分詞。對一個(gè)標(biāo)題進(jìn)行分詞,生成的語句片段至少是兩個(gè),所以得到標(biāo)題對應(yīng)的至少兩個(gè)語句片段。

步驟5033,確定標(biāo)題的每個(gè)語句片段的權(quán)重值,并將權(quán)重值高于預(yù)設(shè)權(quán)重閾值的語句片段作為擴(kuò)展語句片段。

在本實(shí)施例中,上述服務(wù)器確定標(biāo)題的至少兩個(gè)語句片段中的每個(gè)語句片段的權(quán)重值。將各個(gè)語句片段的權(quán)重值與預(yù)設(shè)權(quán)重閾值進(jìn)行比較,并將權(quán)重值高于預(yù)設(shè)權(quán)重閾值的語句片段作為擴(kuò)展語句片段。語句片段的權(quán)重值可以采用多種方式設(shè)置(比如使用tf-idf,termfrequency–inversedocumentfrequency)。

步驟504,將擴(kuò)展語句片段作為與目標(biāo)歷史查詢語句相關(guān)聯(lián)的語句片段特征添加到預(yù)設(shè)模型的語句片段特征庫。

在本實(shí)施例中,上述服務(wù)器將得到的擴(kuò)展語句片段作為與目標(biāo)歷史查詢語句相關(guān)聯(lián)的語句片段特征,將該語句片段特征添加到語句片段特征庫中。預(yù)設(shè)模型包括領(lǐng)域識別模型和/或意圖槽位識別模型,領(lǐng)域識別模型用以表征查詢語句和查詢語句的語義所屬的預(yù)設(shè)領(lǐng)域的對應(yīng)關(guān)系,意圖槽位識別模型用以表征查詢語句和查詢語句所指示的查詢目的、對查詢目的的限定關(guān)鍵詞的對應(yīng)關(guān)系。在意圖槽位識別模型中輸入查詢語句,可以輸出查詢目的、對查詢目的的限定關(guān)鍵詞。

語句片段特征庫是預(yù)設(shè)模型所采用的數(shù)據(jù)庫,數(shù)據(jù)庫中存放著大量的語句片段特征。語句片段特征可以是各種各樣的語句片段,比如字、詞、詞組和短語等等,用以對查詢語句進(jìn)行對照和識別,以了解查詢語句的語義。向預(yù)設(shè)模型中輸入查詢語句,將查詢語句匹配到語義最接近的語句片段特征,進(jìn)而得到預(yù)設(shè)模型的輸出。

查詢語句的語義指查詢語句的語言含義。預(yù)設(shè)領(lǐng)域指預(yù)先設(shè)置的信息所屬的廣泛的類別。查詢目的(也即意圖),為用戶進(jìn)行查詢的直接目的,也就是用戶想通過查詢得到什么,體現(xiàn)了查詢語句要進(jìn)行怎樣的操作,以及該操作所要得到的核心內(nèi)容。限定關(guān)鍵詞(也即槽位)為對查詢目的的修飾和限定的詞語或語句片段,可以在查詢目的的基礎(chǔ)上,進(jìn)一步細(xì)化表現(xiàn)用戶的需求。比如,查詢語句為“推薦恐怖的影片”,其領(lǐng)域?yàn)椤半娪啊?,查詢目的為“尋找電影”,限定關(guān)鍵詞為“恐怖”。

步驟505,響應(yīng)于接收到查詢語句,基于預(yù)設(shè)模型的語句片段特征庫生成查詢語句對應(yīng)的查詢結(jié)果。

在本實(shí)施例中,上述服務(wù)器在接收到查詢語句后,可以基于預(yù)設(shè)模型的已經(jīng)更新的語句片段特征庫,生成查詢語句對應(yīng)的查詢結(jié)果。具體地,可以在語句片段特征庫中查找查詢語句對應(yīng)的語句片段特征,進(jìn)而輸出領(lǐng)域,以及與該領(lǐng)域相關(guān)的查詢目的和限定關(guān)鍵詞?;蛘咧惠敵鲱I(lǐng)域或者只輸出查詢目的和限定關(guān)鍵詞。根據(jù)輸出,在信息庫中查找與輸出相匹配的信息,將查找到的信息作為查詢結(jié)果。

本實(shí)施例利用了歷史用戶選擇網(wǎng)頁的標(biāo)題,擴(kuò)充語句片段特征庫中的特征,使預(yù)設(shè)模型的輸出更加準(zhǔn)確。

進(jìn)一步參考圖6,其示出了查詢方法的又一個(gè)實(shí)施例的流程600。該查詢方法的流程600,包括以下步驟:

步驟601,從歷史查詢語句集合中獲取目標(biāo)歷史查詢語句。

在本實(shí)施例中,服務(wù)器可以從指定的歷史查詢語句集合中,獲取目標(biāo)歷史查詢語句。這里的歷史查詢語句集合是用戶在過去所查詢的一些查詢語句的集合。該集合可以是指定的歷史時(shí)間段內(nèi)所查詢的多個(gè)(也可以是一個(gè))查詢語句組成的集合,也可以是人為指定的一些查詢語句所組成的集合。目標(biāo)歷史查詢語句為人為設(shè)定的或者按照預(yù)設(shè)規(guī)則獲取的,在過去用戶所查詢的語句。

步驟602,響應(yīng)于確定目標(biāo)歷史查詢語句中的第一目標(biāo)片段和目標(biāo)歷史查詢語句所對應(yīng)的多個(gè)歷史用戶選擇網(wǎng)頁的標(biāo)題中共有的第二目標(biāo)片段在句中單側(cè)的語境一致的概率大于第一預(yù)設(shè)閾值,或者兩側(cè)的語境一致的概率大于第二預(yù)設(shè)閾值,則確定第一目標(biāo)片段和第二目標(biāo)片段是同義片段,并將第二目標(biāo)片段確定為擴(kuò)展語句片段。

在本實(shí)施例中,在目標(biāo)歷史查詢語句中存在第一目標(biāo)片段,同時(shí)在目標(biāo)歷史查詢語句對應(yīng)的多個(gè)歷史用戶選擇網(wǎng)頁的標(biāo)題中,存在多個(gè)標(biāo)題所共有的第二目標(biāo)片段。歷史用戶選擇網(wǎng)頁被用戶選擇的記錄記錄在查詢?nèi)罩局小I鲜龇?wù)器可以對查詢?nèi)罩局?,用戶輸入的某個(gè)查詢語句和多個(gè)標(biāo)題進(jìn)行比對,如果存在兩個(gè)語句片段,語境相似程度非常高,則做出響應(yīng):將這兩個(gè)語句片段確定為同義片段。在這里,第一目標(biāo)片段是目標(biāo)歷史查詢語句中的語句片段,第二目標(biāo)片段是用戶選擇的網(wǎng)頁的標(biāo)題中的語句片段。

具體地,一個(gè)語句片段在一個(gè)語句中,在語句中間位置時(shí)該語句片段則具有兩側(cè)的語境(句首側(cè)和句尾側(cè))。將查詢語句和各個(gè)標(biāo)題進(jìn)行比對,可以將單側(cè)語境一致的數(shù)量與比對總數(shù)量的比值作為單側(cè)語境一致的概率。相應(yīng)的,可以將兩側(cè)語境一致的數(shù)量與比對總數(shù)量的比值作為兩側(cè)語境一致的概率。第一預(yù)設(shè)閾值和第二預(yù)設(shè)閾值都是對語境一致的概率預(yù)先設(shè)定的閾值??梢詫⒌玫降膯蝹?cè)語境一致的概率和兩側(cè)語境一致的概率與這兩個(gè)閾值分別進(jìn)行比較,以確定所得到概率的高低。如果概率較高,則可以確定為同義片段。

上述服務(wù)器在確定第一目標(biāo)片段和第二目標(biāo)片段為同義片段的情況下,將第二目標(biāo)片段作為擴(kuò)展語句片段。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,將查詢語句作為擴(kuò)展語句片段。這樣,可以將同義的兩個(gè)語句片段都加入到語句片段特征庫中,以使語句片段特征庫中的資源更加豐富。

步驟603,將擴(kuò)展語句片段作為與目標(biāo)歷史查詢語句相關(guān)聯(lián)的語句片段特征添加到預(yù)設(shè)模型的語句片段特征庫。

在本實(shí)施例中,上述服務(wù)器將得到的擴(kuò)展語句片段作為與目標(biāo)歷史查詢語句相關(guān)聯(lián)的語句片段特征,將該語句片段特征添加到語句片段特征庫中。預(yù)設(shè)模型包括領(lǐng)域識別模型和/或意圖槽位識別模型,領(lǐng)域識別模型用以表征查詢語句和查詢語句的語義所屬的預(yù)設(shè)領(lǐng)域的對應(yīng)關(guān)系,意圖槽位識別模型用以表征查詢語句和查詢語句所指示的查詢目的、對查詢目的的限定關(guān)鍵詞的對應(yīng)關(guān)系。在意圖槽位識別模型中輸入查詢語句,可以輸出查詢目的、對查詢目的的限定關(guān)鍵詞。

語句片段特征庫是預(yù)設(shè)模型所采用的數(shù)據(jù)庫,數(shù)據(jù)庫中存放著大量的語句片段特征。語句片段特征可以是各種各樣的語句片段,比如字、詞、詞組和短語等等,用以對查詢語句進(jìn)行對照和識別,以了解查詢語句的語義。向預(yù)設(shè)模型中輸入查詢語句,將查詢語句匹配到語義最接近的語句片段特征,進(jìn)而得到預(yù)設(shè)模型的輸出。

查詢語句的語義指查詢語句的語言含義。預(yù)設(shè)領(lǐng)域指預(yù)先設(shè)置的信息所屬的廣泛的類別。查詢目的(也即意圖),為用戶進(jìn)行查詢的直接目的,也就是用戶想通過查詢得到什么,體現(xiàn)了查詢語句要進(jìn)行怎樣的操作,以及該操作所要得到的核心內(nèi)容。限定關(guān)鍵詞(也即槽位)為對查詢目的的修飾和限定的詞語或語句片段,可以在查詢目的的基礎(chǔ)上,進(jìn)一步細(xì)化表現(xiàn)用戶的需求。比如,查詢語句為“推薦恐怖的影片”,其領(lǐng)域?yàn)椤半娪啊保樵兡康臑椤皩ふ译娪啊?,限定關(guān)鍵詞為“恐怖”。

步驟604,響應(yīng)于接收到查詢語句,基于預(yù)設(shè)模型的語句片段特征庫生成查詢語句對應(yīng)的查詢結(jié)果。

在本實(shí)施例中,上述服務(wù)器在接收到查詢語句后,可以基于預(yù)設(shè)模型的已經(jīng)更新的語句片段特征庫,生成查詢語句對應(yīng)的查詢結(jié)果。具體地,可以在語句片段特征庫中查找查詢語句對應(yīng)的語句片段特征,進(jìn)而輸出領(lǐng)域,以及與該領(lǐng)域相關(guān)的查詢目的和限定關(guān)鍵詞?;蛘咧惠敵鲱I(lǐng)域或者只輸出查詢目的和限定關(guān)鍵詞。根據(jù)輸出,在信息庫中查找與輸出相匹配的信息,將查找到的信息作為查詢結(jié)果。

本實(shí)施例根據(jù)語境判斷兩個(gè)語句片段是否為同義片段,能夠進(jìn)一步豐富語句片段特征庫,使預(yù)設(shè)模型的輸出更加準(zhǔn)確。

進(jìn)一步參考圖7,其示出了查詢方法的又一個(gè)實(shí)施例的流程700。該查詢方法的流程700,包括以下步驟:

步驟701,從歷史查詢語句集合中獲取目標(biāo)歷史查詢語句。

在本實(shí)施例中,服務(wù)器可以從指定的歷史查詢語句集合中,獲取目標(biāo)歷史查詢語句。這里的歷史查詢語句集合是用戶在過去所查詢的一些查詢語句的集合。該集合可以是指定的歷史時(shí)間段內(nèi)所查詢的多個(gè)(也可以是一個(gè))查詢語句組成的集合,也可以是人為指定的一些查詢語句所組成的集合。目標(biāo)歷史查詢語句為人為設(shè)定的或者按照預(yù)設(shè)規(guī)則獲取的,在過去用戶所查詢的語句。

步驟702,響應(yīng)于確定在指定歷史時(shí)間段內(nèi),第一目標(biāo)片段位于目標(biāo)歷史查詢語句中并且第二目標(biāo)片段位于目標(biāo)歷史查詢語句所對應(yīng)的多個(gè)歷史用戶選擇網(wǎng)頁的標(biāo)題中的概率大于預(yù)設(shè)閾值,則確定第一目標(biāo)片段和第二目標(biāo)片段是同義片段,并將第二目標(biāo)片段確定為擴(kuò)展語句片段。

在本實(shí)施例中,上述服務(wù)器響應(yīng)于確定在指定歷史時(shí)間段內(nèi),第一目標(biāo)片段位于目標(biāo)歷史查詢語句中,并且第二目標(biāo)片段位于目標(biāo)歷史查詢語句所對應(yīng)的多個(gè)歷史用戶選擇網(wǎng)頁的標(biāo)題中。概率指第一目標(biāo)片段和第二目標(biāo)片段分別出現(xiàn)在目標(biāo)歷史查詢語句和用戶選擇網(wǎng)頁的標(biāo)題中的次數(shù),與所統(tǒng)計(jì)的以目標(biāo)歷史查詢語句進(jìn)行查詢的查詢總次數(shù)的比值。歷史用戶選擇網(wǎng)頁被選擇的記錄記錄于查詢?nèi)罩局小?/p>

若得到的概率大于預(yù)設(shè)閾值,即存在兩個(gè)語句片段,高頻率地出現(xiàn)在目標(biāo)歷史查詢語句和其對應(yīng)的多個(gè)網(wǎng)頁的標(biāo)題中。這樣則可以確定第一目標(biāo)片段和第二目標(biāo)片段是同義片段。

上述服務(wù)器在確定第一目標(biāo)片段和第二目標(biāo)片段為同義片段的情況下,將第二目標(biāo)片段作為擴(kuò)展語句片段。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,將查詢語句作為擴(kuò)展語句片段。這樣,可以將同義的兩個(gè)語句片段都加入到語句片段特征庫中,以使語句片段特征庫中的資源更加豐富。

步驟703,將擴(kuò)展語句片段作為與目標(biāo)歷史查詢語句相關(guān)聯(lián)的語句片段特征添加到預(yù)設(shè)模型的語句片段特征庫。

在本實(shí)施例中,上述服務(wù)器將得到的擴(kuò)展語句片段作為與目標(biāo)歷史查詢語句相關(guān)聯(lián)的語句片段特征,將該語句片段特征添加到語句片段特征庫中。預(yù)設(shè)模型包括領(lǐng)域識別模型和/或意圖槽位識別模型,領(lǐng)域識別模型用以表征查詢語句和查詢語句的語義所屬的預(yù)設(shè)領(lǐng)域的對應(yīng)關(guān)系,意圖槽位識別模型用以表征查詢語句和查詢語句所指示的查詢目的、對查詢目的限定關(guān)鍵詞的的對應(yīng)關(guān)系。在意圖槽位識別模型中輸入查詢語句,可以輸出查詢目的、對查詢目的的限定關(guān)鍵詞。

語句片段特征庫是預(yù)設(shè)模型所采用的數(shù)據(jù)庫,數(shù)據(jù)庫中存放著大量的語句片段特征。語句片段特征可以是各種各樣的語句片段,比如字、詞、詞組和短語等等,用以對查詢語句進(jìn)行對照和識別,以了解查詢語句的語義。向預(yù)設(shè)模型中輸入查詢語句,將查詢語句匹配到語義最接近的語句片段特征,進(jìn)而得到預(yù)設(shè)模型的輸出。

查詢語句的語義指查詢語句的語言含義。預(yù)設(shè)領(lǐng)域指預(yù)先設(shè)置的信息所屬的廣泛的類別。查詢目的(也即意圖),為用戶進(jìn)行查詢的直接目的,也就是用戶想通過查詢得到什么,體現(xiàn)了查詢語句要進(jìn)行怎樣的操作,以及該操作所要得到的核心內(nèi)容。限定關(guān)鍵詞(也即槽位)為對查詢目的的修飾和限定的詞語或語句片段,可以在查詢目的的基礎(chǔ)上,進(jìn)一步細(xì)化表現(xiàn)用戶的需求。比如,查詢語句為“推薦恐怖的影片”,其領(lǐng)域?yàn)椤半娪啊?,查詢目的為“尋找電影”,限定關(guān)鍵詞為“恐怖”。

步驟704,響應(yīng)于接收到查詢語句,基于預(yù)設(shè)模型的語句片段特征庫生成查詢語句對應(yīng)的查詢結(jié)果。

在本實(shí)施例中,上述服務(wù)器在接收到查詢語句后,可以基于預(yù)設(shè)模型的已經(jīng)更新的語句片段特征庫,生成查詢語句對應(yīng)的查詢結(jié)果。具體地,可以在語句片段特征庫中查找查詢語句對應(yīng)的語句片段特征,進(jìn)而輸出領(lǐng)域,以及與該領(lǐng)域相關(guān)的查詢目的和限定關(guān)鍵詞?;蛘咧惠敵鲱I(lǐng)域或者只輸出查詢目的和限定關(guān)鍵詞。根據(jù)輸出,在信息庫中查找與輸出相匹配的信息,將查找到的信息作為查詢結(jié)果。

能夠進(jìn)一步豐富語句片段特征庫,使預(yù)設(shè)模型的輸出更加準(zhǔn)確。

進(jìn)一步參考圖8,其示出了查詢方法的又一個(gè)實(shí)施例的流程800。該查詢方法的流程800,包括以下步驟:

步驟801,從歷史查詢語句集合中獲取目標(biāo)歷史查詢語句。

在本實(shí)施例中,服務(wù)器可以從指定的歷史查詢語句集合中,獲取目標(biāo)歷史查詢語句。這里的歷史查詢語句集合是用戶在過去所查詢的一些查詢語句的集合。該集合可以是指定的歷史時(shí)間段內(nèi)所查詢的多個(gè)(也可以是一個(gè))查詢語句組成的集合,也可以是人為指定的一些查詢語句所組成的集合。目標(biāo)歷史查詢語句為人為設(shè)定的或者按照預(yù)設(shè)規(guī)則獲取的,在過去用戶所查詢的語句。

步驟802,基于深度神經(jīng)網(wǎng)絡(luò),確定目標(biāo)歷史查詢語句中的第一目標(biāo)片段和目標(biāo)歷史查詢語句所對應(yīng)的歷史用戶選擇網(wǎng)頁的標(biāo)題中的第二目標(biāo)片段的語義相似度。

在本實(shí)施例中,服務(wù)器利用深度神經(jīng)網(wǎng)絡(luò),確定第一目標(biāo)片段和第二目標(biāo)片段的語義相似度。深度神經(jīng)網(wǎng)絡(luò)可以用于表征兩個(gè)語句片段和這兩個(gè)語句片段之間的語義相似度的對應(yīng)關(guān)系。第一目標(biāo)片段是目標(biāo)歷史查詢語句中的語句片段,第二目標(biāo)片段是用戶選擇網(wǎng)頁的標(biāo)題中的語句片段。歷史用戶選擇網(wǎng)頁被選擇的記錄記錄于查詢?nèi)罩局小?/p>

步驟803,響應(yīng)于確定語義相似度在預(yù)設(shè)相似度閾值以上,則確定第一目標(biāo)片段和第二目標(biāo)片段是同義片段,并將第二目標(biāo)片段確定為擴(kuò)展語句片段。

在本實(shí)施例中,可以預(yù)先設(shè)定相似度閾值,若確定得到的語義相似度大于或等于預(yù)設(shè)相似度閾值,則確定第一目標(biāo)片段和第二目標(biāo)片段為同義片段。上述服務(wù)器在確定第一目標(biāo)片段和第二目標(biāo)片段為同義片段的情況下,將第二目標(biāo)片段作為擴(kuò)展語句片段。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,將查詢語句作為擴(kuò)展語句片段。這樣,可以將同義的兩個(gè)語句片段都加入到語句片段特征庫中,以使語句片段特征庫中的資源更加豐富。

步驟804,將擴(kuò)展語句片段作為與目標(biāo)歷史查詢語句相關(guān)聯(lián)的語句片段特征添加到預(yù)設(shè)模型的語句片段特征庫。

在本實(shí)施例中,上述服務(wù)器將得到的擴(kuò)展語句片段作為與目標(biāo)歷史查詢語句相關(guān)聯(lián)的語句片段特征,將該語句片段特征添加到語句片段特征庫中。預(yù)設(shè)模型包括領(lǐng)域識別模型和/或意圖槽位識別模型,領(lǐng)域識別模型用以表征查詢語句和查詢語句的語義所屬的預(yù)設(shè)領(lǐng)域的對應(yīng)關(guān)系,意圖槽位識別模型用以表征查詢語句和查詢語句所指示的查詢目的、對查詢目的限定關(guān)鍵詞的的對應(yīng)關(guān)系。在意圖槽位識別模型中輸入查詢語句,可以輸出查詢目的、對查詢目的的限定關(guān)鍵詞。

語句片段特征庫是預(yù)設(shè)模型所采用的數(shù)據(jù)庫,數(shù)據(jù)庫中存放著大量的語句片段特征。語句片段特征可以是各種各樣的語句片段,比如字、詞、詞組和短語等等,用以對查詢語句進(jìn)行對照和識別,以了解查詢語句的語義。向預(yù)設(shè)模型中輸入查詢語句,將查詢語句匹配到語義最接近的語句片段特征,進(jìn)而得到預(yù)設(shè)模型的輸出。

查詢語句的語義指查詢語句的語言含義。預(yù)設(shè)領(lǐng)域指預(yù)先設(shè)置的信息所屬的廣泛的類別。查詢目的(也即意圖),為用戶進(jìn)行查詢的直接目的,也就是用戶想通過查詢得到什么,體現(xiàn)了查詢語句要進(jìn)行怎樣的操作,以及該操作所要得到的核心內(nèi)容。限定關(guān)鍵詞(也即槽位)為對查詢目的的修飾和限定的詞語或語句片段,可以在查詢目的的基礎(chǔ)上,進(jìn)一步細(xì)化表現(xiàn)用戶的需求。比如,查詢語句為“推薦恐怖的影片”,其領(lǐng)域?yàn)椤半娪啊保樵兡康臑椤皩ふ译娪啊?,限定關(guān)鍵詞為“恐怖”。

步驟805,響應(yīng)于預(yù)設(shè)模型包括領(lǐng)域識別模型和意圖槽位識別模型,根據(jù)多個(gè)領(lǐng)域識別模型中的每個(gè)領(lǐng)域識別模型的語句片段特征庫,從多個(gè)領(lǐng)域識別模型中,確定與查詢語句相匹配的至少一個(gè)領(lǐng)域識別模型及至少一個(gè)領(lǐng)域識別模型對應(yīng)的預(yù)設(shè)領(lǐng)域。

在本實(shí)施例中,上述服務(wù)器在預(yù)設(shè)模型包括領(lǐng)域識別模型和意圖槽位識別模型的情況下,根據(jù)多個(gè)領(lǐng)域識別模型中的每個(gè)領(lǐng)域識別模型的語句片段特征庫,從多個(gè)領(lǐng)域識別模型中,確定與查詢語句相匹配的至少一個(gè)領(lǐng)域識別模型,并確定與這至少一個(gè)領(lǐng)域識別模型對應(yīng)的預(yù)設(shè)領(lǐng)域。一個(gè)查詢語句可能有多個(gè)領(lǐng)域與之相匹配。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,領(lǐng)域識別模型在輸出查詢語句所指示的領(lǐng)域的同時(shí),還輸出該領(lǐng)域的置信度。若置信度較低,可以向客戶端發(fā)送待確認(rèn)信息,以使用戶對輸出的領(lǐng)域判斷正確與否,或者進(jìn)行標(biāo)注。之后上述服務(wù)器可以根據(jù)客戶端返回的確定正確信息或者確定錯(cuò)誤信息,來確定領(lǐng)域是否正確。通過用戶的反饋,可以提高確定領(lǐng)域的準(zhǔn)確性。

步驟806,對于每一個(gè)預(yù)設(shè)領(lǐng)域,將查詢語句輸入該預(yù)設(shè)領(lǐng)域?qū)?yīng)的意圖槽位識別模型,基于查詢語句與意圖槽位模型的語句片段特征庫中語句片段特征的匹配,得到查詢語句所指示的查詢目的和對查詢目的的限定關(guān)鍵詞。

在本實(shí)施例中,對于所確定的至少一個(gè)領(lǐng)域中的每一個(gè)預(yù)設(shè)領(lǐng)域,上述服務(wù)器將查詢語句輸入該預(yù)設(shè)領(lǐng)域?qū)?yīng)的意圖槽位識別模型。每個(gè)預(yù)設(shè)領(lǐng)域(或者預(yù)設(shè)領(lǐng)域模型)都有與之對應(yīng)的意圖槽位識別模型??梢栽诖_定預(yù)設(shè)領(lǐng)域的情況下,根據(jù)預(yù)設(shè)領(lǐng)域確定查詢目的和限定關(guān)鍵詞。將查詢語句與意圖槽位識別模型的語句片段特征庫中的語句片段進(jìn)行匹配。若查找到匹配的語句片段特征,則輸出該語句片段特征對應(yīng)的限定關(guān)鍵詞。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,意圖槽位識別模型在輸出查詢語句所指示的查詢目的和對查詢目的的限定關(guān)鍵詞的同時(shí),還輸出查詢目的和限定關(guān)鍵詞的置信度。若置信度較低,可以向客戶端發(fā)送待確認(rèn)信息,以使用戶對輸出的查詢目的和限定關(guān)鍵詞判斷正確與否,或者進(jìn)行標(biāo)注。之后上述服務(wù)器可以根據(jù)客戶端返回的確定正確信息或者確定錯(cuò)誤信息,來確定查詢目的和限定關(guān)鍵詞是否正確。通過用戶的反饋,也可以提高確定查詢目的和限定關(guān)鍵詞的準(zhǔn)確性。

步驟807,在信息庫中查找與查詢目的和限定關(guān)鍵詞匹配的信息,將查找到的信息作為查詢結(jié)果。

在本實(shí)施例中,上述服務(wù)器在信息庫中查找與查詢目的、限定關(guān)鍵詞相匹配的信息。之后將查找到的信息作為查詢結(jié)果。

本實(shí)施例能夠進(jìn)一步豐富語句片段特征庫,使預(yù)設(shè)模型的輸出更加準(zhǔn)確。

進(jìn)一步參考圖9,其示出了查詢方法的又一個(gè)實(shí)施例的流程900。該查詢方法的流程900,包括以下步驟:

步驟901,從歷史查詢語句集合中獲取目標(biāo)歷史查詢語句。

在本實(shí)施例中,服務(wù)器可以從指定的歷史查詢語句集合中,獲取目標(biāo)歷史查詢語句。這里的歷史查詢語句集合是用戶在過去所查詢的一些查詢語句的集合。該集合可以是指定的歷史時(shí)間段內(nèi)所查詢的多個(gè)(也可以是一個(gè))查詢語句組成的集合,也可以是人為指定的一些查詢語句所組成的集合。目標(biāo)歷史查詢語句為人為設(shè)定的或者按照預(yù)設(shè)規(guī)則獲取的,在過去用戶所查詢的語句。

步驟902,響應(yīng)于確定目標(biāo)歷史查詢語句包括待確定語句片段和預(yù)設(shè)查詢目的片段集合中的查詢目的片段,確定查詢?nèi)罩局惺欠翊嬖谀繕?biāo)歷史查詢語句。

在本實(shí)施例中,上述服務(wù)器確定目標(biāo)歷史查詢語句包括待確定語句片段和查詢目的片段,則做出響應(yīng):在查詢?nèi)罩局胁檎夷繕?biāo)歷史查詢語句,以確定查詢?nèi)罩局惺欠翊嬖谀繕?biāo)歷史查詢語句。這里的查詢目的片段是指示查詢目的的語句片段,包含于預(yù)設(shè)的查詢目的片段集合中。

步驟903,響應(yīng)于確定查詢?nèi)罩局写嬖谀繕?biāo)歷史查詢語句,對語句片段特征庫中的待確定語句片段添加用于指示修飾功能的指定標(biāo)簽。

在本實(shí)施例中,上述服務(wù)器響應(yīng)于確定查詢?nèi)罩局写嬖谀繕?biāo)歷史查詢語句,則對語句片段特征庫中該待確定語句片段添加指定標(biāo)簽。該指定標(biāo)簽用于指示該待確定語句片段為修飾性的語句片段。也即在目標(biāo)歷史查詢語句中,待確定語句片段是用以修飾查詢目的片段的語句片段。添加指定標(biāo)簽后,語句片段特征庫中有更加豐富的語句片段特征。而更新了語句片段特征庫的預(yù)設(shè)模型能夠更準(zhǔn)確地進(jìn)行輸出。

步驟904,響應(yīng)于確定目標(biāo)歷史查詢語句中的第一目標(biāo)片段和目標(biāo)歷史查詢語句所對應(yīng)的多個(gè)歷史用戶選擇網(wǎng)頁的標(biāo)題中共有的第二目標(biāo)片段在句中單側(cè)的語境一致的概率大于第一預(yù)設(shè)閾值,或者兩側(cè)的語境一致的概率大于第二預(yù)設(shè)閾值,則確定第一目標(biāo)片段和第二目標(biāo)片段是同義片段。

在本實(shí)施例中,在目標(biāo)歷史查詢語句中存在第一目標(biāo)片段,同時(shí)在目標(biāo)歷史查詢語句對應(yīng)的多個(gè)歷史用戶選擇網(wǎng)頁的標(biāo)題中,存在多個(gè)標(biāo)題所共有的第二目標(biāo)片段。歷史用戶選擇網(wǎng)頁被用戶選擇的記錄記錄在查詢?nèi)罩局?。在語句片段特征庫得到更新的情況下,上述服務(wù)器可以對查詢?nèi)罩局?,用戶輸入的某個(gè)查詢語句和多個(gè)標(biāo)題進(jìn)行比對,如果存在兩個(gè)語句片段,語境相似程度非常高,則做出響應(yīng):將這兩個(gè)語句片段確定為同義片段。在這里,第一目標(biāo)片段是目標(biāo)歷史查詢語句中的語句片段,第二目標(biāo)片段是用戶選擇的網(wǎng)頁的標(biāo)題中的語句片段。

步驟905,向客戶端推送包括第一目標(biāo)片段和第二目標(biāo)片段的同義片段待確認(rèn)信息。

在本實(shí)施例中,上述服務(wù)器為了進(jìn)一步確定第一目標(biāo)片段和第二目標(biāo)片段是否是同義詞,則向客戶端推送包括這兩個(gè)語句片段的同義片段待確認(rèn)信息,以使用戶判斷這兩個(gè)語句片段是否同義。同義片段待確認(rèn)信息為用于讓用戶判斷兩個(gè)語句片段是否同義的信息。

步驟906,響應(yīng)于接收到客戶端返回同義片段確認(rèn)信息,確定第一目標(biāo)片段和第二目標(biāo)片段是確認(rèn)同義片段。

在本實(shí)施例中,上述服務(wù)器若接收到客戶端根據(jù)待確認(rèn)信息返回的同義片段確認(rèn)信息,則進(jìn)一步確定第一目標(biāo)片段和第二目標(biāo)片段是同義的。同義片段確認(rèn)信息用于指示用戶判斷待確認(rèn)信息中的第一目標(biāo)片段和第二目標(biāo)片段為同義片段。將第一目標(biāo)片段和第二目標(biāo)片段確定為確認(rèn)同義片段。確認(rèn)同義片段為用戶確認(rèn)過為同義的(兩個(gè))語句片段。

步驟907,將第二目標(biāo)片段確定為擴(kuò)展語句片段。

在本實(shí)施例中,上述服務(wù)器在確定第一目標(biāo)片段和第二目標(biāo)片段為確認(rèn)同義片段的情況下,將第二目標(biāo)片段作為擴(kuò)展語句片段。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,將查詢語句作為擴(kuò)展語句片段。這樣,可以將同義的兩個(gè)語句片段都加入到語句片段特征庫中,以使語句片段特征庫中的資源更加豐富。

步驟908,將擴(kuò)展語句片段作為與目標(biāo)歷史查詢語句相關(guān)聯(lián)的語句片段特征添加到預(yù)設(shè)模型的語句片段特征庫。

在本實(shí)施例中,上述服務(wù)器將得到的擴(kuò)展語句片段作為與目標(biāo)歷史查詢語句相關(guān)聯(lián)的語句片段特征,將該語句片段特征添加到語句片段特征庫中。預(yù)設(shè)模型包括領(lǐng)域識別模型和/或意圖槽位識別模型,領(lǐng)域識別模型用以表征查詢語句和查詢語句的語義所屬的預(yù)設(shè)領(lǐng)域的對應(yīng)關(guān)系,意圖槽位識別模型用以表征查詢語句和查詢語句所指示的查詢目的、對查詢目的的限定關(guān)鍵詞的對應(yīng)關(guān)系。在意圖槽位識別模型中輸入查詢語句,可以輸出查詢目的、對查詢目的的限定關(guān)鍵詞。

語句片段特征庫是預(yù)設(shè)模型所采用的數(shù)據(jù)庫,數(shù)據(jù)庫中存放著大量的語句片段特征。語句片段特征可以是各種各樣的語句片段,比如字、詞、詞組和短語等等,用以對查詢語句進(jìn)行對照和識別,以了解查詢語句的語義。向預(yù)設(shè)模型中輸入查詢語句,將查詢語句匹配到語義最接近的語句片段特征,進(jìn)而得到預(yù)設(shè)模型的輸出。

查詢語句的語義指查詢語句的語言含義。預(yù)設(shè)領(lǐng)域指預(yù)先設(shè)置的信息所屬的廣泛的類別。查詢目的(也即意圖),為用戶進(jìn)行查詢的直接目的,也就是用戶想通過查詢得到什么,體現(xiàn)了查詢語句要進(jìn)行怎樣的操作,以及該操作所要得到的核心內(nèi)容。限定關(guān)鍵詞(也即槽位)為對查詢目的的修飾和限定的詞語或語句片段,可以在查詢目的的基礎(chǔ)上,進(jìn)一步細(xì)化表現(xiàn)用戶的需求。比如,查詢語句為“推薦恐怖的影片”,其領(lǐng)域?yàn)椤半娪啊?,查詢目的為“尋找電影”,限定關(guān)鍵詞為“恐怖”。

步驟909,響應(yīng)于接收到查詢語句,基于預(yù)設(shè)模型的語句片段特征庫生成查詢語句對應(yīng)的查詢結(jié)果。

在本實(shí)施例中,上述服務(wù)器在接收到查詢語句后,可以基于預(yù)設(shè)模型的進(jìn)一步更新的語句片段特征庫,生成查詢語句對應(yīng)的查詢結(jié)果。具體地,可以在語句片段特征庫中查找查詢語句對應(yīng)的語句片段特征,進(jìn)而輸出領(lǐng)域,以及與該領(lǐng)域相關(guān)的查詢目的和限定關(guān)鍵詞?;蛘咧惠敵鲱I(lǐng)域或者只輸出查詢目的和限定關(guān)鍵詞。根據(jù)輸出,在信息庫中查找與輸出相匹配的信息,將查找到的信息作為查詢結(jié)果。

本實(shí)施例通過添加標(biāo)簽,能夠準(zhǔn)確、快速地確定修飾片段。并且,通過向用戶推送同義片段待確認(rèn)信息,得到用戶對語句片段是否同義的判斷,能夠確定語句片段是否同義,增強(qiáng)對查詢語句的識別能力,增加模型輸出的準(zhǔn)確性。

進(jìn)一步參考圖10,作為對上述各圖所示方法的實(shí)現(xiàn),本申請?zhí)峁┝艘环N查詢確定裝置的一個(gè)實(shí)施例,該裝置實(shí)施例與圖2所示的方法實(shí)施例相對應(yīng),該裝置具體可以應(yīng)用于各種電子設(shè)備中。

如圖10所示,本實(shí)施例的查詢裝置1000包括:獲取單元1001、擴(kuò)展單元1002、添加單元1003和生成單元1004。獲取單元1001,配置用于從歷史查詢語句集合中獲取目標(biāo)歷史查詢語句;擴(kuò)展單元1002,配置用于基于查詢?nèi)罩?,對目?biāo)歷史查詢語句進(jìn)行擴(kuò)展,生成與目標(biāo)歷史查詢語句相關(guān)聯(lián)的擴(kuò)展語句片段;添加單元1003,配置用于將擴(kuò)展語句片段作為與目標(biāo)歷史查詢語句相關(guān)聯(lián)的語句片段特征添加到預(yù)設(shè)模型的語句片段特征庫,其中,預(yù)設(shè)模型包括領(lǐng)域識別模型和/或意圖槽位識別模型,領(lǐng)域識別模型用以表征查詢語句和查詢語句的語義所屬的預(yù)設(shè)領(lǐng)域的對應(yīng)關(guān)系,意圖槽位識別模型用以表征查詢語句和查詢語句所指示的查詢目的、對查詢目的的限定關(guān)鍵詞的對應(yīng)關(guān)系;生成單元1004,配置用于響應(yīng)于接收到查詢語句,基于預(yù)設(shè)模型的語句片段特征庫生成查詢語句對應(yīng)的查詢結(jié)果。

在本實(shí)施例中,獲取單元1001可以從指定的歷史查詢語句集合中,獲取目標(biāo)歷史查詢語句。這里的歷史查詢語句集合是用戶在過去所查詢的一些查詢語句的集合。該集合可以是指定的歷史時(shí)間段內(nèi)所查詢的多個(gè)(也可以是一個(gè))查詢語句組成的集合,也可以是人為指定的一些查詢語句所組成的集合。目標(biāo)歷史查詢語句為人為設(shè)定的或者按照預(yù)設(shè)規(guī)則獲取的,在過去用戶所查詢的語句。

在本實(shí)施例中,擴(kuò)展單元1002在獲取到目標(biāo)歷史查詢語句之后,可以基于查詢?nèi)罩?,對獲取到目標(biāo)歷史查詢語句進(jìn)行擴(kuò)展,生成擴(kuò)展語句片段。生成的擴(kuò)展語句片段與目標(biāo)歷史查詢語句相關(guān)聯(lián)。查詢?nèi)罩緸橛脩暨M(jìn)行查詢所生成的包括查詢記錄的日志。為了獲得更加豐富的數(shù)據(jù),查詢?nèi)罩舅涗浀挠脩艨梢允鞘褂镁W(wǎng)絡(luò)查詢引擎進(jìn)行查詢的用戶。當(dāng)然,這里的用戶也可以是指定查詢平臺的用戶。擴(kuò)展指根據(jù)目標(biāo)歷史查詢語句,進(jìn)行語句片段的增加,以得到更多的相關(guān)聯(lián)語句片段。語句片段指可以參與組成語句的字、詞、詞組或短語等,字符長度比較靈活。得到的擴(kuò)展語句片段可以是一個(gè)或多個(gè)。

在本實(shí)施例中,添加單元1003將得到的擴(kuò)展語句片段作為與目標(biāo)歷史查詢語句相關(guān)聯(lián)的語句片段特征,將該語句片段特征添加到語句片段特征庫中。預(yù)設(shè)模型包括領(lǐng)域識別模型和/或意圖槽位識別模型,領(lǐng)域識別模型用以表征查詢語句和查詢語句的語義所屬的預(yù)設(shè)領(lǐng)域的對應(yīng)關(guān)系,意圖槽位識別模型用以表征查詢語句和查詢語句所指示的查詢目的、對查詢目的的限定關(guān)鍵詞的對應(yīng)關(guān)系。在意圖槽位識別模型中輸入查詢語句,可以輸出查詢目的、對查詢目的的限定關(guān)鍵詞。

在本實(shí)施例中,生成單元1004在接收到查詢語句后,可以基于預(yù)設(shè)模型的已經(jīng)更新的語句片段特征庫,生成查詢語句對應(yīng)的查詢結(jié)果。具體地,可以在語句片段特征庫中查找查詢語句對應(yīng)的語句片段特征,進(jìn)而輸出領(lǐng)域,以及與該領(lǐng)域相關(guān)的查詢目的和限定關(guān)鍵詞?;蛘咧惠敵鲱I(lǐng)域或者只輸出查詢目的和限定關(guān)鍵詞。根據(jù)輸出,在信息庫中查找與輸出相匹配的信息,將查找到的信息作為查詢結(jié)果。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,擴(kuò)展單元,包括:分詞模塊(未示出),配置用于利用多種預(yù)設(shè)分詞方式,對目標(biāo)歷史查詢語句進(jìn)行分詞,生成多個(gè)語句片段;確定模塊(未示出),配置用于從多個(gè)語句片段中,確定按照用戶選擇概率由最高到低的順序的選取預(yù)設(shè)數(shù)量的語句片段作為擴(kuò)展語句片段,或者選取用戶選擇概率高于概率閾值的語句片段作為擴(kuò)展語句片段,其中,用戶選擇概率是由每組語句片段中的每個(gè)語句片段在查詢?nèi)罩舅涗浀牟樵兘Y(jié)果的歷史點(diǎn)擊次數(shù)確定的。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,擴(kuò)展單元,包括:生成模塊(未示出),配置用于利用多種預(yù)設(shè)分詞方式,對目標(biāo)歷史查詢語句進(jìn)行分詞,生成多個(gè)語句片段;語句片段生成模塊(未示出),配置用于對于多個(gè)語句片段中的語句片段,確定作為查詢語句的該語句片段所對應(yīng)的歷史用戶選擇網(wǎng)頁的標(biāo)題;對標(biāo)題進(jìn)行分詞,生成標(biāo)題的至少兩個(gè)語句片段;確定標(biāo)題的每個(gè)語句片段的權(quán)重值,并將權(quán)重值高于預(yù)設(shè)權(quán)重閾值的語句片段作為擴(kuò)展語句片段。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,擴(kuò)展單元,包括:確定同義模塊(未示出),配置用于響應(yīng)于確定目標(biāo)歷史查詢語句中的第一目標(biāo)片段和目標(biāo)歷史查詢語句所對應(yīng)的歷史用戶選擇網(wǎng)頁的標(biāo)題中的第二目標(biāo)片段在句中單側(cè)的語境一致的概率大于第一預(yù)設(shè)閾值,或者兩側(cè)的語境一致的概率大于第二預(yù)設(shè)閾值,則確定第一目標(biāo)片段和第二目標(biāo)片段是同義片段,其中,歷史用戶選擇網(wǎng)頁被選擇的記錄記錄于查詢?nèi)罩局?;確定擴(kuò)展語句片段模塊(未示出),配置用于將第二目標(biāo)片段確定為擴(kuò)展語句片段。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,擴(kuò)展單元進(jìn)一步配置用于:響應(yīng)于確定在指定歷史時(shí)間段內(nèi),第一目標(biāo)片段位于目標(biāo)歷史查詢語句中并且第二目標(biāo)片段位于目標(biāo)歷史查詢語句所對應(yīng)的多個(gè)歷史用戶選擇網(wǎng)頁的標(biāo)題中的概率大于預(yù)設(shè)閾值,則確定第一目標(biāo)片段和第二目標(biāo)片段是同義片段,其中,歷史用戶選擇網(wǎng)頁被選擇的記錄記錄于查詢?nèi)罩局校粚⒌诙繕?biāo)片段確定為擴(kuò)展語句片段。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,擴(kuò)展單元包括:相似度確定模塊(未示出),配置用于基于深度神經(jīng)網(wǎng)絡(luò),確定目標(biāo)歷史查詢語句中的第一目標(biāo)片段和目標(biāo)歷史查詢語句所對應(yīng)的歷史用戶選擇網(wǎng)頁的標(biāo)題中的第二目標(biāo)片段的語義相似度,其中,歷史用戶選擇網(wǎng)頁被選擇的記錄記錄于查詢?nèi)罩局校煌x片段確定模塊(未示出),配置用于響應(yīng)于確定語義相似度在預(yù)設(shè)相似度閾值以上,則確定第一目標(biāo)片段和第二目標(biāo)片段是同義片段;語句片段擴(kuò)展模塊(未示出),配置用于將第二目標(biāo)片段確定為擴(kuò)展語句片段。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,擴(kuò)展單元,還包括:推送模塊(未示出),配置用于向客戶端推送包括第一目標(biāo)片段和第二目標(biāo)片段的同義片段待確認(rèn)信息;同義確認(rèn)模塊(未示出),配置用于響應(yīng)于接收到客戶端返回同義片段確認(rèn)信息,確定第一目標(biāo)片段和第二目標(biāo)片段是確認(rèn)同義片段。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,該裝置進(jìn)一步配置用于:響應(yīng)于確定目標(biāo)歷史查詢語句包括待確定語句片段和預(yù)設(shè)查詢目的片段集合中的查詢目的片段,確定查詢?nèi)罩局惺欠翊嬖谀繕?biāo)歷史查詢語句;響應(yīng)于確定查詢?nèi)罩局写嬖谀繕?biāo)歷史查詢語句,對語句片段特征庫中的待確定語句片段添加用于指示修飾功能的指定標(biāo)簽。

在本實(shí)施例的一些可選的實(shí)現(xiàn)方式中,生成單元進(jìn)一步配置用于:響應(yīng)于預(yù)設(shè)模型包括領(lǐng)域識別模型和意圖槽位識別模型,根據(jù)多個(gè)領(lǐng)域識別模型中的每個(gè)領(lǐng)域識別模型的語句片段特征庫,從多個(gè)領(lǐng)域識別模型中,確定與查詢語句相匹配的至少一個(gè)領(lǐng)域識別模型及至少一個(gè)領(lǐng)域識別模型對應(yīng)的預(yù)設(shè)領(lǐng)域;對于每一個(gè)預(yù)設(shè)領(lǐng)域,將查詢語句輸入該預(yù)設(shè)領(lǐng)域?qū)?yīng)的意圖槽位識別模型,基于查詢語句與意圖槽位模型的語句片段特征庫中語句片段特征的匹配,得到查詢語句所指示的查詢目的和對查詢目的的限定關(guān)鍵詞;在信息庫中查找與查詢目的和限定關(guān)鍵詞匹配的信息,將查找到的信息作為查詢結(jié)果。

下面參考圖11,其示出了適于用來實(shí)現(xiàn)本申請實(shí)施例的電子設(shè)備的計(jì)算機(jī)系統(tǒng)1100的結(jié)構(gòu)示意圖。圖11示出的電子設(shè)備僅僅是一個(gè)示例,不應(yīng)對本申請實(shí)施例的功能和使用范圍帶來任何限制。

圖11示出了適于用來實(shí)現(xiàn)本申請實(shí)施例的電子設(shè)備的計(jì)算機(jī)系統(tǒng)的結(jié)構(gòu)示意圖。如圖11所示,計(jì)算機(jī)系統(tǒng)1100包括中央處理單元(cpu)1101,其可以根據(jù)存儲在只讀存儲器(rom)1102中的程序或者從存儲部分1108加載到隨機(jī)訪問存儲器(ram)1103中的程序而執(zhí)行各種適當(dāng)?shù)膭幼骱吞幚怼T趓am1103中,還存儲有系統(tǒng)1100操作所需的各種程序和數(shù)據(jù)。cpu1101、rom1102以及ram1103通過總線1104彼此相連。輸入/輸出(i/o)接口1105也連接至總線1104。

以下部件連接至i/o接口1105:包括鍵盤、鼠標(biāo)等的輸入部分1106;包括諸如陰極射線管(crt)、液晶顯示器(lcd)等以及揚(yáng)聲器等的輸出部分1107;包括硬盤等的存儲部分1108;以及包括諸如lan卡、調(diào)制解調(diào)器等的網(wǎng)絡(luò)接口卡的通信部分1109。通信部分1109經(jīng)由諸如因特網(wǎng)的網(wǎng)絡(luò)執(zhí)行通信處理。驅(qū)動器1110也根據(jù)需要連接至i/o接口1105。可拆卸介質(zhì)1111,諸如磁盤、光盤、磁光盤、半導(dǎo)體存儲器等等,根據(jù)需要安裝在驅(qū)動器1110上,以便于從其上讀出的計(jì)算機(jī)程序根據(jù)需要被安裝入存儲部分1108。

特別地,根據(jù)本申請的實(shí)施例,上文參考流程圖描述的過程可以被實(shí)現(xiàn)為計(jì)算機(jī)軟件程序。例如,本申請的實(shí)施例包括一種計(jì)算機(jī)程序產(chǎn)品,其包括承載在計(jì)算機(jī)可讀介質(zhì)上的計(jì)算機(jī)程序,該計(jì)算機(jī)程序包含用于執(zhí)行流程圖所示的方法的程序代碼。在這樣的實(shí)施例中,該計(jì)算機(jī)程序可以通過通信部分1109從網(wǎng)絡(luò)上被下載和安裝,和/或從可拆卸介質(zhì)1111被安裝。在該計(jì)算機(jī)程序被中央處理單元(cpu)1101執(zhí)行時(shí),執(zhí)行本申請的方法中限定的上述功能。需要說明的是,本申請的計(jì)算機(jī)可讀介質(zhì)可以是計(jì)算機(jī)可讀信號介質(zhì)或者計(jì)算機(jī)可讀存儲介質(zhì)或者是上述兩者的任意組合。計(jì)算機(jī)可讀存儲介質(zhì)例如可以是——但不限于——電、磁、光、電磁、紅外線、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者任意以上的組合。計(jì)算機(jī)可讀存儲介質(zhì)的更具體的例子可以包括但不限于:具有一個(gè)或多個(gè)導(dǎo)線的電連接、便攜式計(jì)算機(jī)磁盤、硬盤、隨機(jī)訪問存儲器(ram)、只讀存儲器(rom)、可擦式可編程只讀存儲器(eprom或閃存)、光纖、便攜式緊湊磁盤只讀存儲器(cd-rom)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。在本申請中,計(jì)算機(jī)可讀存儲介質(zhì)可以是任何包含或存儲程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。而在本申請中,計(jì)算機(jī)可讀的信號介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號,其中承載了計(jì)算機(jī)可讀的程序代碼。這種傳播的數(shù)據(jù)信號可以采用多種形式,包括但不限于電磁信號、光信號或上述的任意合適的組合。計(jì)算機(jī)可讀的信號介質(zhì)還可以是計(jì)算機(jī)可讀存儲介質(zhì)以外的任何計(jì)算機(jī)可讀介質(zhì),該計(jì)算機(jī)可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。計(jì)算機(jī)可讀介質(zhì)上包含的程序代碼可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括但不限于:無線、電線、光纜、rf等等,或者上述的任意合適的組合。

附圖中的流程圖和框圖,圖示了按照本申請各種實(shí)施例的系統(tǒng)、方法和計(jì)算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上,流程圖或框圖中的每個(gè)方框可以代表一個(gè)模塊、程序段、或代碼的一部分,該模塊、程序段、或代碼的一部分包含一個(gè)或多個(gè)用于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實(shí)現(xiàn)中,方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個(gè)接連地表示的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時(shí)也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個(gè)方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來實(shí)現(xiàn),或者可以用專用硬件與計(jì)算機(jī)指令的組合來實(shí)現(xiàn)。

描述于本申請實(shí)施例中所涉及到的單元可以通過軟件的方式實(shí)現(xiàn),也可以通過硬件的方式來實(shí)現(xiàn)。所描述的單元也可以設(shè)置在處理器中,例如,可以描述為:一種處理器包括獲取單元、擴(kuò)展單元、添加單元和生成單元。其中,這些單元的名稱在某種情況下并不構(gòu)成對該單元本身的限定,例如,接收單元還可以被描述為“獲取目標(biāo)歷史查詢語句的單元”。

作為另一方面,本申請還提供了一種計(jì)算機(jī)可讀介質(zhì),該計(jì)算機(jī)可讀介質(zhì)可以是上述實(shí)施例中描述的裝置中所包含的;也可以是單獨(dú)存在,而未裝配入該裝置中。上述計(jì)算機(jī)可讀介質(zhì)承載有一個(gè)或者多個(gè)程序,當(dāng)上述一個(gè)或者多個(gè)程序被該裝置執(zhí)行時(shí),使得該裝置:從歷史查詢語句集合中獲取目標(biāo)歷史查詢語句;基于查詢?nèi)罩?,對目?biāo)歷史查詢語句進(jìn)行擴(kuò)展,生成與目標(biāo)歷史查詢語句相關(guān)聯(lián)的擴(kuò)展語句片段;將擴(kuò)展語句片段作為與目標(biāo)歷史查詢語句相關(guān)聯(lián)的語句片段特征添加到預(yù)設(shè)模型的語句片段特征庫,其中,預(yù)設(shè)模型包括領(lǐng)域識別模型和/或意圖槽位識別模型,領(lǐng)域識別模型用以表征查詢語句和查詢語句的語義所屬的預(yù)設(shè)領(lǐng)域的對應(yīng)關(guān)系,意圖槽位識別模型用以表征查詢語句和查詢語句所指示的查詢目的、對查詢目的的限定關(guān)鍵詞的對應(yīng)關(guān)系;響應(yīng)于接收到查詢語句,基于預(yù)設(shè)模型的語句片段特征庫生成查詢語句對應(yīng)的查詢結(jié)果。

以上描述僅為本申請的較佳實(shí)施例以及對所運(yùn)用技術(shù)原理的說明。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,本申請中所涉及的發(fā)明范圍,并不限于上述技術(shù)特征的特定組合而成的技術(shù)方案,同時(shí)也應(yīng)涵蓋在不脫離上述發(fā)明構(gòu)思的情況下,由上述技術(shù)特征或其等同特征進(jìn)行任意組合而形成的其它技術(shù)方案。例如上述特征與本申請中公開的(但不限于)具有類似功能的技術(shù)特征進(jìn)行互相替換而形成的技術(shù)方案。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
馆陶县| 安福县| 阳信县| 丹江口市| 舞钢市| 五河县| 溧阳市| 冷水江市| 滨海县| 南和县| 南充市| 沙河市| 溧阳市| 河西区| 库车县| 昭通市| 南京市| 清丰县| 景宁| 安远县| 邢台市| 晋中市| 德庆县| 屯门区| 长海县| 广安市| 德惠市| 大关县| 安阳县| 焉耆| 信阳市| 肇州县| 图木舒克市| 溧阳市| 开平市| 朝阳县| 阳泉市| 乌海市| 通州市| 错那县| 长宁区|