本申請涉及計(jì)算機(jī),具體涉及一種內(nèi)容搜索方法、裝置和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著計(jì)算機(jī)技術(shù)的快速發(fā)展,網(wǎng)絡(luò)上產(chǎn)生了海量的內(nèi)容,用戶可以通過搜索引擎在海量內(nèi)容中搜索出需要的內(nèi)容。在現(xiàn)有的內(nèi)容搜索方法中,一般通過在用戶輸入的搜索文本中提取出搜索關(guān)鍵詞(query),從而根據(jù)提取到的query來搜索與搜索文本匹配的搜索內(nèi)容。
2、在對現(xiàn)有技術(shù)的研究和實(shí)踐過程中發(fā)現(xiàn),現(xiàn)有的內(nèi)容搜索方法中極易出現(xiàn)用戶輸入搜索文本而未搜索到匹配的搜索內(nèi)容的情況,導(dǎo)致內(nèi)容搜索效率較低,進(jìn)而使得內(nèi)容搜索的體驗(yàn)較差。
技術(shù)實(shí)現(xiàn)思路
1、本申請實(shí)施例提供一種內(nèi)容搜索方法、裝置和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),避免出現(xiàn)用戶輸入搜索文本而未搜索到匹配的搜索內(nèi)容的情況,以及避免在未搜索到搜索內(nèi)容時(shí)帶來的不必要的資源以及時(shí)間消耗,提升內(nèi)容搜索效率,進(jìn)而提升內(nèi)容搜索體驗(yàn)。
2、本申請實(shí)施例提供一種內(nèi)容搜索方法,包括:
3、獲取搜索文本;
4、采用訓(xùn)練好的關(guān)鍵詞改寫模型對所述搜索文本進(jìn)行關(guān)鍵詞處理,得到所述搜索文本對應(yīng)的搜索關(guān)鍵詞,以及所述搜索關(guān)鍵詞對應(yīng)的搜索響應(yīng)類型;
5、在所述搜索響應(yīng)類型為搜索引擎響應(yīng)類型時(shí),基于所述搜索關(guān)鍵詞,通過搜索引擎搜索出與所述搜索文本匹配的搜索結(jié)果;
6、在所述搜索響應(yīng)類型為對話模型響應(yīng)類型時(shí),基于所述搜索關(guān)鍵詞,通過對話生成模型生成與所述搜索文本匹配的答復(fù)信息作為搜索結(jié)果;
7、將所述搜索結(jié)果發(fā)送至所述搜索文本對應(yīng)的發(fā)送方中。
8、相應(yīng)的,本申請實(shí)施例提供一種內(nèi)容搜索裝置,包括:
9、獲取單元,用于獲取搜索文本;
10、處理單元,用于采用訓(xùn)練好的關(guān)鍵詞改寫模型對所述搜索文本進(jìn)行關(guān)鍵詞處理,得到所述搜索文本對應(yīng)的搜索關(guān)鍵詞,以及所述搜索關(guān)鍵詞對應(yīng)的搜索響應(yīng)類型;
11、搜索單元,用于在所述搜索響應(yīng)類型為搜索引擎響應(yīng)類型時(shí),基于所述搜索關(guān)鍵詞,通過搜索引擎搜索出與所述搜索文本匹配的搜索結(jié)果;
12、生成單元,用于在所述搜索響應(yīng)類型為對話模型響應(yīng)類型時(shí),基于所述搜索關(guān)鍵詞,通過對話生成模型生成與所述搜索文本匹配的答復(fù)信息作為搜索結(jié)果;
13、發(fā)送單元,用于將所述搜索結(jié)果發(fā)送至所述搜索文本對應(yīng)的發(fā)送方中。
14、在一實(shí)施例中,所述處理單元,用于:
15、采用訓(xùn)練好的關(guān)鍵詞改寫模型將所述搜索文本改寫為與搜索引擎的搜索輸入需求匹配的搜索關(guān)鍵詞,并預(yù)測所述搜索關(guān)鍵詞對應(yīng)的搜索響應(yīng)類型。
16、在一實(shí)施例中,所述搜索單元,用于:
17、基于所述搜索關(guān)鍵詞,通過搜索引擎搜索與所述搜索文本匹配的搜索內(nèi)容;
18、對所述搜索內(nèi)容進(jìn)行摘要提取,生成所述搜索內(nèi)容對應(yīng)的摘要信息;
19、將所述摘要信息和所述搜索內(nèi)容作為與所述搜索文本匹配的搜索結(jié)果。
20、在一實(shí)施例中,所述內(nèi)容搜索裝置,還包括:
21、樣本獲取單元,用于獲取預(yù)設(shè)關(guān)鍵詞改寫模型對應(yīng)的訓(xùn)練樣本,所述訓(xùn)練樣本包括搜索文本樣本、所述搜索文本樣本對應(yīng)的期望搜索關(guān)鍵詞以及期望搜索響應(yīng)類型;
22、樣本處理單元,用于采用所述預(yù)設(shè)關(guān)鍵詞改寫模型對所述搜索文本樣本進(jìn)行關(guān)鍵詞提取以及搜索響應(yīng)類型預(yù)測,得到所述搜索文本樣本對應(yīng)的預(yù)測搜索關(guān)鍵詞以及預(yù)測搜索響應(yīng)類型;
23、損失計(jì)算單元,用于根據(jù)所述期望搜索關(guān)鍵詞和所述預(yù)測搜索關(guān)鍵詞,以及所述期望搜索響應(yīng)類型和所述預(yù)測搜索響應(yīng)類型,計(jì)算所述預(yù)設(shè)關(guān)鍵詞改寫模型對應(yīng)的損失信息;
24、模型訓(xùn)練單元,用于基于所述損失信息對所述預(yù)設(shè)關(guān)鍵詞改寫模型進(jìn)行收斂,得到訓(xùn)練好的關(guān)鍵詞改寫模型。
25、在一實(shí)施例中,所述樣本獲取單元,用于:
26、獲取預(yù)設(shè)關(guān)鍵詞改寫模型對應(yīng)的訓(xùn)練樣本數(shù)據(jù)集,將所述訓(xùn)練樣本數(shù)據(jù)集劃分為簡單訓(xùn)練樣本集合以及困難訓(xùn)練樣本集合;
27、獲取所述簡單訓(xùn)練樣本集合在所述預(yù)設(shè)關(guān)鍵詞改寫模型的每一訓(xùn)練回合對應(yīng)的第一權(quán)重參數(shù),以及所述困難訓(xùn)練樣本集合在所述預(yù)設(shè)關(guān)鍵詞改寫模型的每一訓(xùn)練回合對應(yīng)的第二權(quán)重參數(shù);
28、根據(jù)所述第一權(quán)重參數(shù)和所述第二權(quán)重參數(shù),在所述簡單訓(xùn)練樣本集合和所述困難訓(xùn)練樣本集合中篩選出所述預(yù)設(shè)關(guān)鍵詞改寫模型在每一訓(xùn)練回合的訓(xùn)練樣本。
29、在一實(shí)施例中,所述第一權(quán)重參數(shù)隨著所述預(yù)設(shè)關(guān)鍵詞改寫模型的訓(xùn)練迭代次數(shù)遞減,所述第二權(quán)重參數(shù)隨著所述預(yù)設(shè)關(guān)鍵詞改寫模型的訓(xùn)練迭代次數(shù)遞增。
30、在一實(shí)施例中,所述損失計(jì)算單元,用于:
31、根據(jù)所述期望搜索關(guān)鍵詞和所述預(yù)測搜索關(guān)鍵詞,計(jì)算所述預(yù)設(shè)關(guān)鍵詞改寫模型對應(yīng)的關(guān)鍵詞預(yù)測損失信息;
32、根據(jù)所述期望搜索響應(yīng)類型和所述預(yù)測搜索響應(yīng)類型,計(jì)算所述預(yù)設(shè)關(guān)鍵詞改寫模型對應(yīng)的響應(yīng)類型預(yù)測損失信息;
33、將所述關(guān)鍵詞預(yù)測損失信息和所述響應(yīng)類型預(yù)測損失信息進(jìn)行融合處理,得到所述預(yù)設(shè)關(guān)鍵詞改寫模型對應(yīng)的損失信息。
34、此外,本申請實(shí)施例還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有多條指令,所述指令適于處理器進(jìn)行加載,以執(zhí)行本申請實(shí)施例所提供的任一種內(nèi)容搜索方法中的步驟。
35、此外,本申請實(shí)施例還提供一種計(jì)算機(jī)設(shè)備,包括處理器和存儲(chǔ)器,所述存儲(chǔ)器存儲(chǔ)有應(yīng)用程序,所述處理器用于運(yùn)行所述存儲(chǔ)器內(nèi)的應(yīng)用程序?qū)崿F(xiàn)本申請實(shí)施例提供的內(nèi)容搜索方法。
36、本申請實(shí)施例還提供一種計(jì)算機(jī)程序產(chǎn)品或計(jì)算機(jī)程序,所述計(jì)算機(jī)程序產(chǎn)品或計(jì)算機(jī)程序包括計(jì)算機(jī)指令,所述計(jì)算機(jī)指令存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中。計(jì)算機(jī)設(shè)備的處理器從計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)讀取所述計(jì)算機(jī)指令,處理器執(zhí)行所述計(jì)算機(jī)指令,使得所述計(jì)算機(jī)設(shè)備執(zhí)行本申請實(shí)施例提供的內(nèi)容搜索方法中的步驟。
37、本申請實(shí)施例通過獲取搜索文本;采用訓(xùn)練好的關(guān)鍵詞改寫模型對搜索文本進(jìn)行關(guān)鍵詞處理,得到搜索文本對應(yīng)的搜索關(guān)鍵詞,以及搜索關(guān)鍵詞對應(yīng)的搜索響應(yīng)類型;在搜索響應(yīng)類型為搜索引擎響應(yīng)類型時(shí),基于搜索關(guān)鍵詞,通過搜索引擎搜索出與搜索文本匹配的搜索結(jié)果;在搜索響應(yīng)類型為對話模型響應(yīng)類型時(shí),基于搜索關(guān)鍵詞,通過對話生成模型生成與搜索文本匹配的答復(fù)信息作為搜索結(jié)果;將搜索結(jié)果發(fā)送至搜索文本對應(yīng)的發(fā)送方中。以此,可以在針對搜索文本進(jìn)行內(nèi)容搜索時(shí),通過采用訓(xùn)練好的關(guān)鍵詞改寫模型預(yù)測搜索文本對應(yīng)的搜索關(guān)鍵詞,以及搜索關(guān)鍵詞對應(yīng)的搜索響應(yīng)類型,從而根據(jù)搜索文本對應(yīng)的搜索關(guān)鍵詞以及搜索響應(yīng)類型,直接確定是需要通過搜索引擎進(jìn)行搜索還是直接采用對話生成模型生成答復(fù)信息,可以避免出現(xiàn)用戶輸入搜索文本而未搜索到匹配的搜索內(nèi)容的情況,以及在搜索不到搜索內(nèi)容時(shí)帶來的不必要的資源以及時(shí)間消耗,提升內(nèi)容搜索效率,進(jìn)而提升內(nèi)容搜索體驗(yàn)。
1.一種內(nèi)容搜索方法,其特征在于,包括:
2.如權(quán)利要求1所述的內(nèi)容搜索方法,其特征在于,所述采用訓(xùn)練好的關(guān)鍵詞改寫模型對所述搜索文本進(jìn)行關(guān)鍵詞處理,得到所述搜索文本對應(yīng)的搜索關(guān)鍵詞,以及所述搜索關(guān)鍵詞對應(yīng)的搜索響應(yīng)類型,包括:
3.如權(quán)利要求1所述的內(nèi)容搜索方法,其特征在于,所述基于所述搜索關(guān)鍵詞,通過搜索引擎搜索出與所述搜索文本匹配的搜索結(jié)果,包括:
4.如權(quán)利要求1至3中任一項(xiàng)所述的內(nèi)容搜索方法,其特征在于,所述采用訓(xùn)練好的關(guān)鍵詞改寫模型對所述搜索文本進(jìn)行關(guān)鍵詞處理之前,還包括:
5.如權(quán)利要求4所述的內(nèi)容搜索方法,其特征在于,所述獲取預(yù)設(shè)關(guān)鍵詞改寫模型對應(yīng)的訓(xùn)練樣本,包括:
6.如權(quán)利要求5所述的內(nèi)容搜索方法,其特征在于,所述第一權(quán)重參數(shù)隨著所述預(yù)設(shè)關(guān)鍵詞改寫模型的訓(xùn)練迭代次數(shù)遞減,所述第二權(quán)重參數(shù)隨著所述預(yù)設(shè)關(guān)鍵詞改寫模型的訓(xùn)練迭代次數(shù)遞增。
7.如權(quán)利要求4所述的內(nèi)容搜索方法,其特征在于,所述根據(jù)所述期望搜索關(guān)鍵詞和所述預(yù)測搜索關(guān)鍵詞,以及所述期望搜索響應(yīng)類型和所述預(yù)測搜索響應(yīng)類型,計(jì)算所述預(yù)設(shè)關(guān)鍵詞改寫模型對應(yīng)的損失信息,包括:
8.一種內(nèi)容搜索裝置,其特征在于,包括:
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有多條指令,所述指令適于處理器進(jìn)行加載,以執(zhí)行權(quán)利要求1至7任一項(xiàng)所述的內(nèi)容搜索方法中的步驟。
10.一種計(jì)算機(jī)設(shè)備,其特征在于,包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器中并可以在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)權(quán)利要求1至7中任一項(xiàng)所述的內(nèi)容搜索方法。