本發(fā)明涉及數(shù)據(jù)處理,具體涉及用于互聯(lián)網(wǎng)廣告投放的用戶畫像生成方法及系統(tǒng)。
背景技術(shù):
1、互聯(lián)網(wǎng)廣告投放的準(zhǔn)確性依賴于對用戶畫像的精準(zhǔn)構(gòu)建,一般使用用戶畫像生成技術(shù)實現(xiàn)。用戶畫像生成技術(shù)可以通過用戶的相關(guān)信息及行為數(shù)據(jù),精準(zhǔn)捕捉和分析用戶的興趣、行為和人口屬性等特征,實現(xiàn)目標(biāo)受眾定位,提升廣告的投放效果,提高廣告的點擊率與轉(zhuǎn)化率,降低無效投放的成本。由于用戶屬性和行為的高度動態(tài)化特征,需要及時根據(jù)用戶的相關(guān)信息及行為數(shù)據(jù)更新和優(yōu)化用戶畫像,提升用戶標(biāo)簽定位的準(zhǔn)確性,進而保證互聯(lián)網(wǎng)廣告投放的準(zhǔn)確性。
2、在根據(jù)用戶的相關(guān)信息及行為數(shù)據(jù)更新和優(yōu)化用戶畫像的過程中,不同種類的用戶數(shù)據(jù)的有效性存在差異,不同種類的用戶數(shù)據(jù)對用戶的各標(biāo)簽的影響程度也不相同,所以,直接定期根據(jù)用戶在時間段內(nèi)的相關(guān)信息及行為數(shù)據(jù)直接進行用戶畫像的提取和更新,得到的更新后的用戶畫像并不準(zhǔn)確,存在更新滯后的問題,致使互聯(lián)網(wǎng)廣告投放效果不佳。
技術(shù)實現(xiàn)思路
1、本發(fā)明提供用于互聯(lián)網(wǎng)廣告投放的用戶畫像生成方法及系統(tǒng),以解決用戶的行為數(shù)據(jù)屬性的變動情況和關(guān)聯(lián)方式不同,使更新后的用戶畫像不準(zhǔn)確,導(dǎo)致互聯(lián)網(wǎng)廣告投放效果不佳的問題,所采用的技術(shù)方案具體如下:
2、第一方面,本發(fā)明一個實施例提供了用于互聯(lián)網(wǎng)廣告投放的用戶畫像生成方法,該方法包括以下步驟:
3、采集用戶的行為數(shù)據(jù),獲取用戶的用戶畫像,用戶畫像包含用戶的標(biāo)簽,根據(jù)行為數(shù)據(jù)和標(biāo)簽的對應(yīng)關(guān)系,獲取標(biāo)簽的操作數(shù)據(jù)、轉(zhuǎn)化權(quán)重和單日轉(zhuǎn)化權(quán)重;
4、將標(biāo)簽的操作數(shù)據(jù)對應(yīng)的產(chǎn)生時刻所在的自然日,記為標(biāo)簽的操作數(shù)據(jù)的采集自然日,根據(jù)標(biāo)簽在相鄰采集自然日的單日轉(zhuǎn)化權(quán)重之間的差異,獲取標(biāo)簽的相鄰日持續(xù)度,根據(jù)標(biāo)簽的操作數(shù)據(jù)的種類數(shù)量和所有的操作數(shù)據(jù)的種類數(shù)量,獲取標(biāo)簽的操作數(shù)據(jù)比,結(jié)合標(biāo)簽的轉(zhuǎn)化權(quán)重與相鄰日持續(xù)度,獲取標(biāo)簽的穩(wěn)定性;
5、根據(jù)標(biāo)簽在所有自然日的單日轉(zhuǎn)化權(quán)重之間的差異,以及相同標(biāo)簽的操作數(shù)據(jù)比之間的差異,獲取用戶的標(biāo)簽的關(guān)聯(lián)指數(shù);
6、根據(jù)所有用戶的相同標(biāo)簽在同一自然日的單日轉(zhuǎn)化權(quán)重之間的差異、用戶的標(biāo)簽的關(guān)聯(lián)指數(shù)和標(biāo)簽的穩(wěn)定性,獲取更新的用戶畫像。
7、進一步,所述獲取標(biāo)簽的操作數(shù)據(jù)、轉(zhuǎn)化權(quán)重和單日轉(zhuǎn)化權(quán)重,包括的具體方法為:
8、將對應(yīng)同一個標(biāo)簽的行為數(shù)據(jù),記為標(biāo)簽的操作數(shù)據(jù);
9、將平臺針對標(biāo)簽投放的廣告中,點擊進入廣告并產(chǎn)生購買的用戶數(shù)量,記為標(biāo)簽的轉(zhuǎn)化數(shù)量,將包含同一標(biāo)簽的所有用戶的數(shù)量,記為標(biāo)簽的潛在轉(zhuǎn)化數(shù)量,將標(biāo)簽的轉(zhuǎn)化數(shù)量與潛在轉(zhuǎn)化數(shù)量的比值,記為標(biāo)簽的轉(zhuǎn)化權(quán)重;
10、對于每一個自然日,將自然日內(nèi)標(biāo)簽的轉(zhuǎn)化數(shù)量與同一自然日內(nèi)標(biāo)簽的潛在轉(zhuǎn)化數(shù)量的比值,記為標(biāo)簽在自然日的單日轉(zhuǎn)化權(quán)重。
11、進一步,所述標(biāo)簽的相鄰日持續(xù)度,獲取的具體方法為:
12、將任意一個采集自然日作為目標(biāo)采集自然日;
13、對于同一標(biāo)簽,將標(biāo)簽在目標(biāo)采集自然日與目標(biāo)采集自然日的下一個相鄰的采集自然日的單日轉(zhuǎn)化權(quán)重的差值的平方,記為標(biāo)簽在目標(biāo)采集自然日的單日轉(zhuǎn)化權(quán)重差異;
14、根據(jù)標(biāo)簽在所有采集自然日的單日轉(zhuǎn)化權(quán)重差異,確定標(biāo)簽的相鄰日持續(xù)度,所述標(biāo)簽的相鄰日持續(xù)度與標(biāo)簽在所有采集自然日的單日轉(zhuǎn)化權(quán)重差異呈負(fù)相關(guān)關(guān)系。
15、進一步,所述標(biāo)簽的操作數(shù)據(jù)比,獲取的具體方法為:
16、對于用戶畫像包含的用戶的任意一個標(biāo)簽,將標(biāo)簽的操作數(shù)據(jù)的種類數(shù)量與所有的操作數(shù)據(jù)的種類數(shù)量的比值,記為標(biāo)簽的操作數(shù)據(jù)比。
17、進一步,所述標(biāo)簽的穩(wěn)定性,獲取的具體方法為:
18、將標(biāo)簽的操作數(shù)據(jù)比與標(biāo)簽的轉(zhuǎn)化權(quán)重、相鄰日持續(xù)度的乘積的歸一化值,記為標(biāo)簽的穩(wěn)定性。
19、進一步,所述根據(jù)標(biāo)簽在所有自然日的單日轉(zhuǎn)化權(quán)重之間的差異,以及相同標(biāo)簽的操作數(shù)據(jù)比之間的差異,獲取用戶的標(biāo)簽的關(guān)聯(lián)指數(shù),包括的具體方法為:
20、將標(biāo)簽在所有自然日的單日轉(zhuǎn)化權(quán)重的標(biāo)準(zhǔn)差的歸一化值,記為標(biāo)簽的單日轉(zhuǎn)化權(quán)重差異,將第二預(yù)設(shè)閾值與標(biāo)簽的單日轉(zhuǎn)化權(quán)重差異的差值,記為標(biāo)簽的單日轉(zhuǎn)化權(quán)重穩(wěn)定性;
21、將任意一個用戶記為目標(biāo)用戶,將除去目標(biāo)用戶之外的所有其他用戶的相同標(biāo)簽的操作數(shù)據(jù)比的均值,記為目標(biāo)用戶的標(biāo)準(zhǔn)操作數(shù)據(jù)比,將目標(biāo)用戶的標(biāo)簽的操作數(shù)據(jù)比與標(biāo)準(zhǔn)操作數(shù)據(jù)比的差值的絕對值,記為目標(biāo)用戶的標(biāo)簽的操作數(shù)據(jù)比差異,將第二預(yù)設(shè)閾值與標(biāo)簽的操作數(shù)據(jù)比差異的差值,記為目標(biāo)用戶的標(biāo)簽的操作數(shù)據(jù)比穩(wěn)定性;
22、根據(jù)目標(biāo)用戶的標(biāo)簽的單日轉(zhuǎn)化權(quán)重穩(wěn)定性與操作數(shù)據(jù)比穩(wěn)定性,確定目標(biāo)用戶的標(biāo)簽的關(guān)聯(lián)指數(shù)。
23、進一步,所述根據(jù)目標(biāo)用戶的標(biāo)簽的單日轉(zhuǎn)化權(quán)重穩(wěn)定性與操作數(shù)據(jù)比穩(wěn)定性,確定目標(biāo)用戶的標(biāo)簽的關(guān)聯(lián)指數(shù),包括的具體方法為:
24、將目標(biāo)用戶的標(biāo)簽的單日轉(zhuǎn)化權(quán)重穩(wěn)定性與操作數(shù)據(jù)比穩(wěn)定性的均值,記為目標(biāo)用戶的標(biāo)簽的關(guān)聯(lián)指數(shù)。
25、進一步,所述根據(jù)所有用戶的相同標(biāo)簽在同一自然日的單日轉(zhuǎn)化權(quán)重之間的差異、用戶的標(biāo)簽的關(guān)聯(lián)指數(shù)和標(biāo)簽的穩(wěn)定性,獲取更新的用戶畫像,包括的具體方法為:
26、將除去目標(biāo)用戶之外的所有其他用戶的相同標(biāo)簽在同一自然日的單日轉(zhuǎn)化權(quán)重的均值,記為標(biāo)簽在自然日的標(biāo)準(zhǔn)單日轉(zhuǎn)化權(quán)重,將目標(biāo)用戶的標(biāo)簽在自然日的單日轉(zhuǎn)化權(quán)重與標(biāo)準(zhǔn)單日轉(zhuǎn)化權(quán)重的差值,記為目標(biāo)用戶的標(biāo)簽在自然日的單日轉(zhuǎn)化權(quán)重偏差,將目標(biāo)用戶的標(biāo)簽的關(guān)聯(lián)指數(shù)與用戶的標(biāo)簽在自然日的單日轉(zhuǎn)化權(quán)重偏差、標(biāo)簽的穩(wěn)定性的乘積,記為目標(biāo)用戶的標(biāo)簽在自然日的第一乘積,將目標(biāo)用戶的標(biāo)簽在自然日的單日轉(zhuǎn)化權(quán)重與用戶的標(biāo)簽在自然日的第一乘積的和,記為目標(biāo)用戶的標(biāo)簽在自然日的更新權(quán)重;
27、根據(jù)用戶的標(biāo)簽在自然日的更新權(quán)重,獲取更新的用戶畫像。
28、進一步,所述根據(jù)用戶的標(biāo)簽在自然日的更新權(quán)重,獲取更新的用戶畫像,包括的具體方法為:
29、當(dāng)標(biāo)簽在自然日的更新權(quán)重大于等于第三預(yù)設(shè)閾值時,繼續(xù)保留用戶的標(biāo)簽;
30、當(dāng)標(biāo)簽在自然日的更新權(quán)重小于第三預(yù)設(shè)閾值時,刪除用戶的標(biāo)簽;
31、將用戶剩余的所有標(biāo)簽作為更新后的用戶畫像。
32、第二方面,本發(fā)明實施例還提供了用于互聯(lián)網(wǎng)廣告投放的用戶畫像生成系統(tǒng),包括存儲器、處理器以及存儲在所述存儲器中并在所述處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)上述任意一項所述方法的步驟。
33、本發(fā)明的有益效果是:
34、本發(fā)明根據(jù)用戶的每一個標(biāo)簽受到多個種類的行為數(shù)據(jù)的共同影響確定的特性,根據(jù)互聯(lián)網(wǎng)投放的廣告吸引用戶進行購買的行為,確定用戶標(biāo)簽的轉(zhuǎn)化權(quán)重和單日轉(zhuǎn)化權(quán)重,根據(jù)用戶的用戶畫像更新的過程中,不同行為數(shù)據(jù)對應(yīng)的數(shù)據(jù)種類的有效性存在差異的特征,對標(biāo)簽的操作數(shù)據(jù)的穩(wěn)定性進行分析,根據(jù)相鄰采集自然日的廣告吸引用戶進行購買的行為的差異,以及標(biāo)簽對應(yīng)的操作數(shù)據(jù)的種類分布的廣泛性,確定標(biāo)簽的穩(wěn)定性,標(biāo)簽的穩(wěn)定性是標(biāo)簽對于用戶特征評價的全面性、客觀性和可靠性評價;進一步的,根據(jù)每一個用戶的標(biāo)簽對應(yīng)的其他用戶與用戶的關(guān)聯(lián)性,獲取用戶的標(biāo)簽的關(guān)聯(lián)指數(shù);最后,根據(jù)所有用戶的相同標(biāo)簽在同一自然日的單日轉(zhuǎn)化權(quán)重之間的差異、用戶的標(biāo)簽的關(guān)聯(lián)指數(shù)和標(biāo)簽的穩(wěn)定性,獲取更新的用戶畫像,解決用戶的行為數(shù)據(jù)屬性的變動情況和關(guān)聯(lián)方式不同,使更新后的用戶畫像不準(zhǔn)確,導(dǎo)致互聯(lián)網(wǎng)廣告投放效果不佳的問題。