本公開涉及計(jì)算機(jī),特別涉及調(diào)整物品展示位置的方法及裝置、計(jì)算機(jī)可存儲(chǔ)介質(zhì)。
背景技術(shù):
1、在電商搜索場(chǎng)景下,相關(guān)流量分發(fā)技術(shù)中,響應(yīng)于用戶的搜索操作或搜索請(qǐng)求,向用戶展示順序排列在多個(gè)展示位置的多個(gè)物品。在流量分發(fā)過程中,通過調(diào)整向用戶展示的多個(gè)物品在多個(gè)展示位置的排列順序,進(jìn)行流量調(diào)控。如何實(shí)現(xiàn)精準(zhǔn)的流量調(diào)控,亟待解決。
技術(shù)實(shí)現(xiàn)思路
1、本公開提出了一種解決方案,可以實(shí)現(xiàn)精準(zhǔn)的流量調(diào)控,提高針對(duì)不同用戶和/或不同搜索操作下物品展示的精確度。
2、根據(jù)本公開的第一方面,提供了一種調(diào)整物品展示位置的方法,包括:獲取響應(yīng)于用戶在當(dāng)前時(shí)刻的搜索操作生成的初始物品序列,所述初始物品序列包括排列在多個(gè)展示位置的多個(gè)物品;確定用于調(diào)整所述多個(gè)物品在所述初始物品序列中的展示位置的目標(biāo)特征信息,所述目標(biāo)特征信息包括所述用戶在所述當(dāng)前時(shí)刻的用戶特征信息、所述當(dāng)前時(shí)刻的搜索操作所使用的搜索文本的屬性特征信息;根據(jù)所述目標(biāo)特征信息,調(diào)整所述多個(gè)物品在所述初始物品序列中的展示位置。
3、在一些實(shí)施例中,根據(jù)所述目標(biāo)特征信息,調(diào)整所述多個(gè)物品在所述初始物品序列中的展示位置包括:根據(jù)所述目標(biāo)特征信息,利用強(qiáng)化學(xué)習(xí)模型,確定每個(gè)物品處于每個(gè)展示位置的分值;通過比較不同物品處于每個(gè)展示位置的分值,調(diào)整所述多個(gè)物品在所述初始物品序列中的展示位置。
4、在一些實(shí)施例中,根據(jù)所述目標(biāo)特征信息,利用強(qiáng)化學(xué)習(xí)模型,確定每個(gè)物品處于每個(gè)展示位置的分值包括:根據(jù)所述目標(biāo)特征信息,利用控制不同業(yè)務(wù)目標(biāo)的多個(gè)強(qiáng)化學(xué)習(xí)模型,確定每個(gè)物品在每種業(yè)務(wù)目標(biāo)下處于每個(gè)展示位置的分值,每個(gè)強(qiáng)化學(xué)習(xí)模型控制一種業(yè)務(wù)目標(biāo);融合每個(gè)物品在多種業(yè)務(wù)目標(biāo)下處于每個(gè)展示位置的多個(gè)分值,得到每個(gè)物品處于每個(gè)展示位置的分值。
5、在一些實(shí)施例中,融合每個(gè)物品在多種業(yè)務(wù)目標(biāo)下處于每個(gè)展示位置的多個(gè)分值,得到每個(gè)物品處于每個(gè)展示位置的分值包括:獲取與所述多個(gè)業(yè)務(wù)目標(biāo)對(duì)應(yīng)的多個(gè)權(quán)重;利用與所述多種業(yè)務(wù)目標(biāo)對(duì)應(yīng)的多個(gè)權(quán)重,融合每個(gè)物品在所述多種業(yè)務(wù)目標(biāo)下處于每個(gè)展示位置的多個(gè)分值,得到每個(gè)物品處于每個(gè)展示位置的分值。
6、在一些實(shí)施例中,獲取與所述多個(gè)業(yè)務(wù)目標(biāo)對(duì)應(yīng)的多個(gè)權(quán)重包括:利用交叉熵方法cem,以最大化搜索操作相關(guān)的指標(biāo)為目標(biāo),確定與所述多個(gè)業(yè)務(wù)目標(biāo)對(duì)應(yīng)的多個(gè)權(quán)重。
7、在一些實(shí)施例中,所述目標(biāo)特征信息還包括針對(duì)每個(gè)物品的調(diào)整目標(biāo)的完成度,根據(jù)所述目標(biāo)特征信息,利用控制不同業(yè)務(wù)目標(biāo)的多個(gè)強(qiáng)化學(xué)習(xí)模型,確定每個(gè)物品在每種業(yè)務(wù)目標(biāo)下處于每個(gè)展示位置的分值包括:根據(jù)所述用戶在所述當(dāng)前時(shí)刻的用戶特征信息、所述當(dāng)前時(shí)刻的搜索操作所使用的搜索文本的屬性特征信息和所述針對(duì)每個(gè)物品的調(diào)整目標(biāo)的完成度,利用控制所述每種業(yè)務(wù)目標(biāo)的強(qiáng)化學(xué)習(xí)模型,確定每個(gè)物品在所述每種業(yè)務(wù)目標(biāo)下處于每個(gè)展示位置的分值。
8、在一些實(shí)施例中,在每個(gè)強(qiáng)化學(xué)習(xí)模型控制的業(yè)務(wù)目標(biāo)所對(duì)應(yīng)的用戶行為發(fā)生的情況下,所述每個(gè)強(qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì)函數(shù)的值為第一值,在每個(gè)強(qiáng)化學(xué)習(xí)模型控制的業(yè)務(wù)目標(biāo)所對(duì)應(yīng)的用戶行為未發(fā)生的情況下,所述每個(gè)強(qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì)函數(shù)的值為第二值,根據(jù)所述目標(biāo)特征信息,利用控制不同業(yè)務(wù)目標(biāo)的多個(gè)強(qiáng)化學(xué)習(xí)模型,確定每個(gè)物品在每種業(yè)務(wù)目標(biāo)下處于每個(gè)展示位置的分值包括:根據(jù)所述目標(biāo)特征信息,利用控制每種業(yè)務(wù)目標(biāo)的強(qiáng)化學(xué)習(xí)模型,確定每個(gè)物品在所述每種業(yè)務(wù)目標(biāo)下處于每個(gè)展示位置的獎(jiǎng)勵(lì)函數(shù)的值;根據(jù)每個(gè)物品在所述每種業(yè)務(wù)目標(biāo)下處于每個(gè)展示位置的獎(jiǎng)勵(lì)函數(shù)的值,確定所述每個(gè)物品在每種業(yè)務(wù)目標(biāo)下處于每個(gè)展示位置的分值。
9、在一些實(shí)施例中,所述目標(biāo)特征信息還包括所述每個(gè)物品在每個(gè)展示位置的物品特征信息及上下文特征信息,根據(jù)所述目標(biāo)特征信息,利用強(qiáng)化學(xué)習(xí)模型,確定每個(gè)物品處于每個(gè)展示位置的分值包括:對(duì)于每個(gè)物品,根據(jù)所述用戶特征信息、所述屬性特征信息和所述每個(gè)物品對(duì)應(yīng)的上下文特征信息,確定強(qiáng)化學(xué)習(xí)模型的價(jià)值函數(shù)網(wǎng)絡(luò)的輸出值,作為第一輸出值;對(duì)于所述每個(gè)物品,根據(jù)所述用戶特征信息、所述屬性特征信息、所述每個(gè)物品對(duì)應(yīng)的上下文特征信息和所述每個(gè)物品在每個(gè)展示位置的物品特征信息,確定強(qiáng)化學(xué)習(xí)模型的優(yōu)勢(shì)函數(shù)網(wǎng)絡(luò)的輸出值,作為第二輸出值;根據(jù)與所述每個(gè)物品對(duì)應(yīng)的所述第一輸出值和所述第二輸出值,確定所述每個(gè)物品處于所述每個(gè)展示位置的分值。
10、在一些實(shí)施例中,所述目標(biāo)特征信息還包括所述用戶與所述多個(gè)物品之間的雙邊特征信息,所述雙邊特征信息作為所述強(qiáng)化學(xué)習(xí)模型的價(jià)值函數(shù)網(wǎng)絡(luò)和優(yōu)勢(shì)函數(shù)網(wǎng)絡(luò)的輸入。
11、在一些實(shí)施例中,所述雙邊特征信息包括所述用戶針對(duì)所述多個(gè)物品的歷史行為特征信息。
12、在一些實(shí)施例中,所述多個(gè)物品包括多個(gè)第一物品和多個(gè)第二物品,通過比較不同物品處于每個(gè)展示位置的分值,調(diào)整所述多個(gè)物品在所述初始物品序列中的展示位置包括:對(duì)于每個(gè)第一物品,確定在所述初始物品序列中排列在所述每個(gè)第一物品之前的至少一個(gè)第二物品,作為至少一個(gè)參考物品;通過比較所述每個(gè)第一物品處于每個(gè)參考物品在所述初始物品序列中所處展示位置的分值與所述每個(gè)參考物品在所述初始物品序列中所處展示位置的分值的大小關(guān)系,確定所述初始物品序列中第一個(gè)分值比所述每個(gè)第一物品對(duì)應(yīng)的分值低的參考物品,作為與所述每個(gè)第一物品對(duì)應(yīng)的目標(biāo)物品;在所述初始物品序列中,調(diào)整所述每個(gè)第一物品的展示位置,使所述每個(gè)第一物品的展示位置位于與所述每個(gè)第一物品對(duì)應(yīng)的目標(biāo)物品的展示位置之前;重復(fù)執(zhí)行確定至少一個(gè)參考物品、確定目標(biāo)物品和調(diào)整每個(gè)第一物品的展示位置的操作,直到任一個(gè)第一物品的展示位置位于與該任一個(gè)第一物品對(duì)應(yīng)的目標(biāo)物品的展示位置之前。
13、根據(jù)本公開第二方面,提供了一種調(diào)整物品展示位置的裝置,包括:獲取模塊,被配置為獲取響應(yīng)于用戶在當(dāng)前時(shí)刻的搜索操作生成的初始物品序列,所述初始物品序列包括排列在多個(gè)展示位置的多個(gè)物品;確定模塊,被配置為確定用于調(diào)整所述多個(gè)物品在所述初始物品序列中的展示位置的目標(biāo)特征信息,所述目標(biāo)特征信息包括所述用戶在所述當(dāng)前時(shí)刻的用戶特征信息、所述當(dāng)前時(shí)刻的搜索操作所使用的搜索文本的屬性特征信息;調(diào)整模塊,被配置為根據(jù)所述目標(biāo)特征信息,調(diào)整所述多個(gè)物品在所述初始物品序列中的展示位置。
14、根據(jù)本公開第三方面,提供了一種調(diào)整物品展示位置的裝置,包括:存儲(chǔ)器;以及耦接至所述存儲(chǔ)器的處理器,所述處理器被配置為基于存儲(chǔ)在所述存儲(chǔ)器的指令,執(zhí)行上述任一實(shí)施例所述的調(diào)整物品展示位置的方法。
15、根據(jù)本公開的第六方面,提供了一種計(jì)算機(jī)可存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序指令,該指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述任一實(shí)施例所述的調(diào)整物品展示位置的方法。
16、在上述實(shí)施例中,可以實(shí)現(xiàn)精準(zhǔn)的流量調(diào)控,提高針對(duì)不同用戶和/或不同搜索操作下物品展示的精確度。
1.一種調(diào)整物品展示位置的方法,包括:
2.根據(jù)權(quán)利要求1所述的調(diào)整物品展示位置的方法,其中,根據(jù)所述目標(biāo)特征信息,調(diào)整所述多個(gè)物品在所述初始物品序列中的展示位置包括:
3.根據(jù)權(quán)利要求2所述的調(diào)整物品展示位置的方法,其中,根據(jù)所述目標(biāo)特征信息,利用強(qiáng)化學(xué)習(xí)模型,確定每個(gè)物品處于每個(gè)展示位置的分值包括:
4.根據(jù)權(quán)利要求3所述的調(diào)整物品展示位置的方法,其中,融合每個(gè)物品在多種業(yè)務(wù)目標(biāo)下處于每個(gè)展示位置的多個(gè)分值,得到每個(gè)物品處于每個(gè)展示位置的分值包括:
5.根據(jù)權(quán)利要求4所述的調(diào)整物品展示位置的方法,其中,獲取與所述多個(gè)業(yè)務(wù)目標(biāo)對(duì)應(yīng)的多個(gè)權(quán)重包括:
6.根據(jù)權(quán)利要求3所述的調(diào)整物品展示位置的方法,其中,所述目標(biāo)特征信息還包括針對(duì)每個(gè)物品的調(diào)整目標(biāo)的完成度,根據(jù)所述目標(biāo)特征信息,利用控制不同業(yè)務(wù)目標(biāo)的多個(gè)強(qiáng)化學(xué)習(xí)模型,確定每個(gè)物品在每種業(yè)務(wù)目標(biāo)下處于每個(gè)展示位置的分值包括:
7.根據(jù)權(quán)利要求3所述的調(diào)整物品展示位置的方法,其中,在每個(gè)強(qiáng)化學(xué)習(xí)模型控制的業(yè)務(wù)目標(biāo)所對(duì)應(yīng)的用戶行為發(fā)生的情況下,所述每個(gè)強(qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì)函數(shù)的值為第一值,在每個(gè)強(qiáng)化學(xué)習(xí)模型控制的業(yè)務(wù)目標(biāo)所對(duì)應(yīng)的用戶行為未發(fā)生的情況下,所述每個(gè)強(qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì)函數(shù)的值為第二值,根據(jù)所述目標(biāo)特征信息,利用控制不同業(yè)務(wù)目標(biāo)的多個(gè)強(qiáng)化學(xué)習(xí)模型,確定每個(gè)物品在每種業(yè)務(wù)目標(biāo)下處于每個(gè)展示位置的分值包括:
8.根據(jù)權(quán)利要求2所述的調(diào)整物品展示位置的方法,其中,所述目標(biāo)特征信息還包括所述每個(gè)物品在每個(gè)展示位置的物品特征信息及上下文特征信息,根據(jù)所述目標(biāo)特征信息,利用強(qiáng)化學(xué)習(xí)模型,確定每個(gè)物品處于每個(gè)展示位置的分值包括:
9.根據(jù)權(quán)利要求8所述的調(diào)整物品展示位置的方法,其中,所述目標(biāo)特征信息還包括所述用戶與所述多個(gè)物品之間的雙邊特征信息,所述雙邊特征信息作為所述強(qiáng)化學(xué)習(xí)模型的價(jià)值函數(shù)網(wǎng)絡(luò)和優(yōu)勢(shì)函數(shù)網(wǎng)絡(luò)的輸入。
10.根據(jù)權(quán)利要求9所述的調(diào)整物品展示位置的方法,其中,所述雙邊特征信息包括所述用戶針對(duì)所述多個(gè)物品的歷史行為特征信息。
11.根據(jù)權(quán)利要求2-10任一項(xiàng)所述的調(diào)整物品展示位置的方法,其中,所述多個(gè)物品包括多個(gè)第一物品和多個(gè)第二物品,通過比較不同物品處于每個(gè)展示位置的分值,調(diào)整所述多個(gè)物品在所述初始物品序列中的展示位置包括:
12.一種調(diào)整物品展示位置的裝置,包括:
13.一種調(diào)整物品展示位置的裝置,包括:
14.一種計(jì)算機(jī)可存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序指令,該指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至11任一項(xiàng)所述的調(diào)整物品展示位置的方法。