本公開涉及數(shù)據(jù)處理,具體而言,涉及一種資源召回方法、資源召回裝置、電子設(shè)備以及計算機可讀存儲介質(zhì)。
背景技術(shù):
1、在電商場景中,依據(jù)用戶的搜索詞準(zhǔn)確地從海量候選中召回特定的集合商品可以提高訂單轉(zhuǎn)化率?,F(xiàn)有技術(shù)通常是基于文本信息的雙塔語義模型實現(xiàn)相關(guān)商品的匹配和檢索的。
2、然而,在實際落地場景中,考慮到性能等因素,通常采用多層級漏斗結(jié)構(gòu)系統(tǒng)實現(xiàn)上述商品的匹配和檢索過程,包括召回、粗排及精排的階段,但由于各階段的目標(biāo)不一致,例如,召回階段關(guān)注點擊,粗排階段關(guān)注點擊與轉(zhuǎn)化,精排階段關(guān)注轉(zhuǎn)化和多樣性,從而導(dǎo)致度量空間中的語義和目標(biāo)不一致,使得召回的匹配度和準(zhǔn)確度較低。
3、為了解決上述問題,本公開實施例提供了一種資源召回方法、資源召回裝置、電子設(shè)備以及計算機可讀存儲介質(zhì)。
技術(shù)實現(xiàn)思路
1、本公開實施例的目的在于提供一種資源召回方法、資源召回裝置、電子設(shè)備以及計算機可讀存儲介質(zhì),從而在一定程度上解決了相關(guān)技術(shù)存在的由于各階段的目標(biāo)不一致,導(dǎo)致度量空間中的語義和目標(biāo)不一致,從而使得召回的匹配度和準(zhǔn)確度較低的問題。
2、根據(jù)本公開的第一方面,提供一種資源召回方法,包括:獲取樣本數(shù)據(jù),所述樣本數(shù)據(jù)包括根據(jù)用戶對資源的操作得到的多類樣本;依據(jù)所述樣本數(shù)據(jù)構(gòu)建目標(biāo)損失函數(shù),并通過所述目標(biāo)損失函數(shù)對預(yù)訓(xùn)練得到的雙塔模型進行微調(diào);基于微調(diào)后的所述雙塔模型依據(jù)所述用戶輸入的查詢詞召回資源。
3、在本公開的一種示例性實施例中,所述雙塔模型包括用戶塔和資源塔,所述雙塔模型的預(yù)訓(xùn)練階段,包括:獲取用戶數(shù)據(jù)及資源數(shù)據(jù),所述用戶數(shù)據(jù)包括所述用戶輸入的所述查詢詞及用戶信息,所述資源數(shù)據(jù)包括資源標(biāo)題;將所述用戶數(shù)據(jù)輸入所述用戶塔,將所述資源數(shù)據(jù)輸入所述資源塔,以對所述雙塔模型進行預(yù)訓(xùn)練,所述雙塔模型通過對比所述查詢詞及所述資源標(biāo)題的相似度進行資源召回。
4、在本公開的一種示例性實施例中,所述方法還包括:獲取所述資源標(biāo)題,并從所述資源標(biāo)題中截取目標(biāo)字段;將所述目標(biāo)字段作為所述查詢詞輸入所述用戶塔,將截取所述目標(biāo)字段之后的所述資源標(biāo)題輸入所述資源塔,對所述雙塔模型進行預(yù)訓(xùn)練。
5、在本公開的一種示例性實施例中,所述樣本數(shù)據(jù)包括訂單樣本、點擊樣本、曝光未點擊樣本、隨機負(fù)例樣本;所述依據(jù)所述樣本數(shù)據(jù)構(gòu)建目標(biāo)損失函數(shù),包括:依據(jù)所述訂單樣本及所述曝光未點擊樣本確定第一損失函數(shù);依據(jù)所述點擊樣本與所述曝光未點擊樣本確定第二損失函數(shù);依據(jù)所述點擊樣本與所述隨機負(fù)例樣本確定第三損失函數(shù);依據(jù)所述曝光未點擊樣本與所述隨機負(fù)例樣本確定第四損失函數(shù);依據(jù)所述第一損失函數(shù)、所述第二損失函數(shù)、所述第三損失函數(shù)及所述第四損失函數(shù)構(gòu)建所述目標(biāo)損失函數(shù)。
6、在本公開的一種示例性實施例中,所述基于微調(diào)后的所述雙塔模型依據(jù)所述用戶輸入的查詢詞召回資源,包括:接收所述用戶輸入的所述查詢詞;通過所述雙塔模型確定所述查詢詞及資源庫中各所述資源的所述資源標(biāo)題的相似度,并基于所述相似度召回資源。
7、在本公開的一種示例性實施例中,所述通過所述雙塔模型確定所述查詢詞及資源庫中各所述資源的所述資源標(biāo)題的相似度,包括:通過所述雙塔模型得到所述用戶塔側(cè)輸入信息的特征向量,所述用戶塔側(cè)輸入信息包括所述查詢詞及所述用戶的用戶信息;通過所述雙塔模型預(yù)先確定所述資源塔側(cè)輸入信息的特征向量,所述資源塔側(cè)輸入信息包括所述資源的屬性信息及所述資源標(biāo)題;計算所述用戶塔側(cè)輸入信息的特征向量及所述資源塔側(cè)輸入信息的特征向量的向量內(nèi)積,并基于向量內(nèi)積確定所述相似度。
8、根據(jù)本公開的第二方面,提供一種資源召回裝置,包括:數(shù)據(jù)獲取模塊,用于獲取樣本數(shù)據(jù),所述樣本數(shù)據(jù)包括根據(jù)用戶對資源的操作得到的多類樣本;模型微調(diào)模塊,用于依據(jù)所述樣本數(shù)據(jù)構(gòu)建目標(biāo)損失函數(shù),并通過所述目標(biāo)損失函數(shù)對預(yù)訓(xùn)練得到的雙塔模型進行微調(diào);資源召回模塊,用于基于微調(diào)后的所述雙塔模型依據(jù)所述用戶輸入的查詢詞召回資源。
9、在本公開的一種示例性實施例中,所述樣本數(shù)據(jù)包括訂單樣本、點擊樣本、曝光未點擊樣本、隨機負(fù)例樣本;所述模型微調(diào)模塊用于:依據(jù)所述訂單樣本及所述曝光未點擊樣本確定第一損失函數(shù);依據(jù)所述點擊樣本與所述曝光未點擊樣本確定第二損失函數(shù);依據(jù)所述點擊樣本與所述隨機負(fù)例樣本確定第三損失函數(shù);依據(jù)所述曝光未點擊樣本與所述隨機負(fù)例樣本確定第四損失函數(shù);依據(jù)所述第一損失函數(shù)、所述第二損失函數(shù)、所述第三損失函數(shù)及所述第四損失函數(shù)構(gòu)建所述目標(biāo)損失函數(shù)。
10、根據(jù)本公開的第三方面,提供一種電子設(shè)備,包括:處理器;以及存儲器,用于存儲所述處理器的可執(zhí)行指令;其中,所述處理器配置為經(jīng)由執(zhí)行所述可執(zhí)行指令來執(zhí)行上述任意一項所述的方法。
11、根據(jù)本公開的第四方面,提供一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)上述任意一項所述的方法。
12、本公開示例性實施例可以具有以下部分或全部有益效果:
13、在本公開示例實施方式所提供的資源召回方法中,獲取樣本數(shù)據(jù),樣本數(shù)據(jù)包括根據(jù)用戶對資源的操作得到的多類樣本;依據(jù)樣本數(shù)據(jù)構(gòu)建目標(biāo)損失函數(shù),并通過目標(biāo)損失函數(shù)對預(yù)訓(xùn)練得到的雙塔模型進行微調(diào);基于微調(diào)后的雙塔模型依據(jù)用戶輸入的查詢詞召回資源。本公開依據(jù)不同的樣本之間的關(guān)系構(gòu)建目標(biāo)損失函數(shù),并通過目標(biāo)損失函數(shù)對雙塔模型進行微調(diào),通過微調(diào)后的雙塔模型進行資源召回,可以解決度量空間中的語義和目標(biāo)一致性問題,提高資源召回的匹配度及準(zhǔn)確性。
14、應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開。
1.一種資源召回方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的資源召回方法,其特征在于,所述雙塔模型包括用戶塔和資源塔,所述雙塔模型的預(yù)訓(xùn)練階段,包括:
3.根據(jù)權(quán)利要求2所述的資源召回方法,其特征在于,所述方法還包括:
4.根據(jù)權(quán)利要求1所述的資源召回方法,其特征在于,所述樣本數(shù)據(jù)包括訂單樣本、點擊樣本、曝光未點擊樣本、隨機負(fù)例樣本;所述依據(jù)所述樣本數(shù)據(jù)構(gòu)建目標(biāo)損失函數(shù),包括:
5.根據(jù)權(quán)利要求1所述的資源召回方法,其特征在于,所述基于微調(diào)后的所述雙塔模型依據(jù)所述用戶輸入的查詢詞召回資源,包括:
6.根據(jù)權(quán)利要求5所述的資源召回方法,其特征在于,所述通過所述雙塔模型確定所述查詢詞及資源庫中各所述資源的所述資源標(biāo)題的相似度,包括:
7.一種資源召回裝置,其特征在于,包括:
8.根據(jù)權(quán)利要求7所述的資源召回模塊,其特征在于,所述樣本數(shù)據(jù)包括訂單樣本、點擊樣本、曝光未點擊樣本、隨機負(fù)例樣本;所述模型微調(diào)模塊用于:
9.一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1-6任一項所述的方法。
10.一種電子設(shè)備,其特征在于,包括: