本申請涉及數(shù)據(jù)處理,尤其涉及一種點擊率預(yù)估模型的生成方法、裝置、電子設(shè)備和存儲介質(zhì)。
背景技術(shù):
1、點擊率預(yù)估,即對于給定的用戶和商品,預(yù)估用戶會點擊商品的概率值。點擊率預(yù)估在搜索引擎、在線廣告平臺以及推薦系統(tǒng)等應(yīng)用場景中扮演著重要的角色。為了減輕訓(xùn)練和測試分布之間的差異,通常廣泛地采用以下的流程:收集用戶數(shù)據(jù),基于用戶數(shù)據(jù)訓(xùn)練模型,然后部署訓(xùn)練好的模型用于在線服務(wù),直到下一個新的再訓(xùn)練模型生成。
2、相關(guān)技術(shù)中,基于深度神經(jīng)網(wǎng)絡(luò)的點擊率預(yù)估方法,通常使用交叉熵?fù)p失函數(shù)來優(yōu)化模型,但這類簡單的經(jīng)驗風(fēng)險最小化方法無法保證迭代的再訓(xùn)練模型比當(dāng)前已在線部署的模型更好,從而導(dǎo)致再訓(xùn)練模型存在上線效果不穩(wěn)定的問題。綜上,如何訓(xùn)練再訓(xùn)練模型使得比在線部署的模型準(zhǔn)確性要好,依然是個懸而未決的問題。
技術(shù)實現(xiàn)思路
1、本申請?zhí)岢鲆环N點擊率預(yù)估模型的生成方法、裝置、電子設(shè)備和存儲介質(zhì)。
2、本申請第一方面實施例提出了一種點擊率預(yù)估模型的生成方法,包括:獲取樣本的特征向量、點擊標(biāo)簽和在線點擊率預(yù)估值,所述在線點擊率預(yù)估值為在線點擊率預(yù)估模型輸出的所述樣本的點擊率預(yù)估值;將所述特征向量輸入至待訓(xùn)練的第一離線點擊率預(yù)估模型中,得到所述樣本的第一離線點擊率預(yù)估值;根據(jù)所述點擊標(biāo)簽、所述在線點擊率預(yù)估值和所述第一離線點擊率預(yù)估值生成置信度損失函數(shù);根據(jù)所述置信度損失函數(shù)對所述待訓(xùn)練的第一離線點擊率預(yù)估模型進(jìn)行模型訓(xùn)練,得到訓(xùn)練好的第一離線點擊率預(yù)估模型;根據(jù)所述訓(xùn)練好的第一離線點擊率預(yù)估模型更新所述在線點擊率預(yù)估模型。
3、本申請實施例的點擊率預(yù)估模型的生成方法,獲取樣本的特征向量、點擊標(biāo)簽和在線點擊率預(yù)估值,在線點擊率預(yù)估值為在線點擊率預(yù)估模型輸出的樣本的點擊率預(yù)估值,將特征向量輸入至待訓(xùn)練的第一離線點擊率預(yù)估模型中,得到樣本的第一離線點擊率預(yù)估值,根據(jù)點擊標(biāo)簽、在線點擊率預(yù)估值和第一離線點擊率預(yù)估值生成置信度損失函數(shù),根據(jù)置信度損失函數(shù)對待訓(xùn)練的第一離線點擊率預(yù)估模型進(jìn)行模型訓(xùn)練,得到訓(xùn)練好的第一離線點擊率預(yù)估模型,根據(jù)所述訓(xùn)練好的第一離線點擊率預(yù)估模型更新在線點擊率預(yù)估模型。本申請實施例根據(jù)樣本的點擊標(biāo)簽、經(jīng)在線點擊率預(yù)估模型后輸出的在線點擊率預(yù)估值和經(jīng)第一離線點擊率預(yù)估模型后輸出的第一離線點擊率預(yù)估值,生成置信度損失函數(shù),基于置信度損失函數(shù)對第一離線點擊率預(yù)估模型進(jìn)行模型優(yōu)化,即優(yōu)化已部署模型和再訓(xùn)練模型的打分值來進(jìn)行點擊率預(yù)估,使得優(yōu)化得到的第一離線點擊率預(yù)估模型即再訓(xùn)練模型比已在線部署的在線點擊率預(yù)估模型準(zhǔn)確性更好,避免了再訓(xùn)練模型上線效果不穩(wěn)定的問題。
4、本申請第二方面實施例提出一種點擊率預(yù)估模型的生成裝置,包括:獲取模塊,被配置為獲取樣本的特征向量、點擊標(biāo)簽和在線點擊率預(yù)估值,所述在線點擊率預(yù)估值為在線點擊率預(yù)估模型輸出的所述樣本的點擊率預(yù)估值;輸入模塊,被配置為將所述特征向量輸入至待訓(xùn)練的第一離線點擊率預(yù)估模型中,得到所述樣本的第一離線點擊率預(yù)估值;生成模塊,被配置為根據(jù)所述點擊標(biāo)簽、所述在線點擊率預(yù)估值和所述第一離線點擊率預(yù)估值生成置信度損失函數(shù);訓(xùn)練模塊,被配置為根據(jù)所述置信度損失函數(shù)對所述待訓(xùn)練的第一離線點擊率預(yù)估模型進(jìn)行模型訓(xùn)練,得到訓(xùn)練好的第一離線點擊率預(yù)估模型;更新模塊,被配置為根據(jù)所述訓(xùn)練好的第一離線點擊率預(yù)估模型更新所述在線點擊率預(yù)估模型。
5、本申請實施例的點擊率預(yù)估模型的生成裝置,獲取樣本的特征向量、點擊標(biāo)簽和在線點擊率預(yù)估值,在線點擊率預(yù)估值為在線點擊率預(yù)估模型輸出的樣本的點擊率預(yù)估值,將特征向量輸入至待訓(xùn)練的第一離線點擊率預(yù)估模型中,得到樣本的第一離線點擊率預(yù)估值,根據(jù)點擊標(biāo)簽、在線點擊率預(yù)估值和第一離線點擊率預(yù)估值生成置信度損失函數(shù),根據(jù)置信度損失函數(shù)對待訓(xùn)練的第一離線點擊率預(yù)估模型進(jìn)行模型訓(xùn)練,得到訓(xùn)練好的第一離線點擊率預(yù)估模型,根據(jù)所述訓(xùn)練好的第一離線點擊率預(yù)估模型更新在線點擊率預(yù)估模型。本申請實施例根據(jù)樣本的點擊標(biāo)簽、經(jīng)在線點擊率預(yù)估模型后輸出的在線點擊率預(yù)估值和經(jīng)第一離線點擊率預(yù)估模型后輸出的第一離線點擊率預(yù)估值,生成置信度損失函數(shù),基于置信度損失函數(shù)對第一離線點擊率預(yù)估模型進(jìn)行模型優(yōu)化,即優(yōu)化已部署模型和再訓(xùn)練模型的打分值來進(jìn)行點擊率預(yù)估,使得優(yōu)化得到的第一離線點擊率預(yù)估模型即再訓(xùn)練模型比已在線部署的在線點擊率預(yù)估模型準(zhǔn)確性更好,避免了再訓(xùn)練模型上線效果不穩(wěn)定的問題。
6、本申請第三方面實施例提出了一種電子設(shè)備,包括:至少一個處理器;以及與所述至少一個處理器通信連接的存儲器;其中,所述存儲器存儲有可被所述至少一個處理器執(zhí)行的指令,所述指令被所述至少一個處理器執(zhí)行,以使所述至少一個處理器能夠執(zhí)行如上述第一方面實施例所述的點擊率預(yù)估模型的生成方法。
7、本申請第四方面實施例提出了一種存儲有計算機指令的計算機可讀存儲介質(zhì),所述計算機指令用于使所述計算機執(zhí)行如上述第一方面實施例所述的點擊率預(yù)估模型的生成方法。
8、本申請附加的方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本申請的實踐了解到。
1.一種點擊率預(yù)估模型的生成方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的生成方法,其特征在于,所述根據(jù)所述點擊標(biāo)簽、所述在線點擊率預(yù)估值和所述第一離線點擊率預(yù)估值生成置信度損失函數(shù),包括:
3.根據(jù)權(quán)利要求2所述的生成方法,其特征在于,所述置信度損失函數(shù)包括:基于單樣本的置信度損失函數(shù)和/或基于正負(fù)樣本的置信度損失函數(shù)。
4.根據(jù)權(quán)利要求3所述的生成方法,其特征在于,對于正樣本,所述基于單樣本的置信度損失函數(shù)的優(yōu)化目標(biāo)是最大化所述第一離線點擊率預(yù)估值與所述在線點擊率預(yù)估值的差值;
5.根據(jù)權(quán)利要求3所述的生成方法,其特征在于,所述置信度損失函數(shù)包括所述基于單樣本的置信度損失函數(shù);
6.根據(jù)權(quán)利要求3所述的生成方法,其特征在于,所述基于正負(fù)樣本的置信度損失函數(shù)的優(yōu)化目標(biāo)是最大化正負(fù)樣本的第一差值和正負(fù)樣本的第二差值的距離,所述正負(fù)樣本的第一差值為正負(fù)樣本所述第一離線點擊率預(yù)估值的差值,所述正負(fù)樣本的第二差值為正負(fù)樣本所述在線點擊率預(yù)估值的差值。
7.根據(jù)權(quán)利要求3所述的生成方法,其特征在于,所述置信度損失函數(shù)包括所述基于正負(fù)樣本的置信度損失函數(shù);
8.根據(jù)權(quán)利要求1所述的生成方法,其特征在于,所述獲取樣本的特征向量,包括:
9.根據(jù)權(quán)利要求1所述的生成方法,其特征在于,所述根據(jù)所述置信度損失函數(shù)對所述待訓(xùn)練的第一離線點擊率預(yù)估模型進(jìn)行模型訓(xùn)練,得到訓(xùn)練好的第一離線點擊率預(yù)估模型,包括:
10.根據(jù)權(quán)利要求1所述的生成方法,其特征在于,所述訓(xùn)練好的第一離線點擊率預(yù)估模型訓(xùn)練時采用的為第一時間粒度的所述樣本,所述待訓(xùn)練的第一離線點擊率預(yù)估模型的初始模型為訓(xùn)練好的第二離線點擊率預(yù)估模型,所述第二離線點擊率預(yù)估模型訓(xùn)練時采用的為第二時間粒度的所述樣本,所述第二時間粒度大于所述第一時間粒度。
11.一種點擊率預(yù)估模型的生成裝置,其特征在于,包括:
12.一種電子設(shè)備,其特征在于,包括:
13.一種存儲有計算機指令的計算機可讀存儲介質(zhì),其特征在于,所述計算機指令用于使所述計算機執(zhí)行如權(quán)利要求1-10中任一項所述的方法。