本發(fā)明涉及數(shù)據(jù)處理,尤其涉及一種電子產(chǎn)品激活量預(yù)測(cè)方法及一種服務(wù)器集群。
背景技術(shù):
個(gè)人計(jì)算機(jī)(pc)、手機(jī)、平板電腦等電子產(chǎn)品為貴重的硬件產(chǎn)品,其庫(kù)存積壓,不論是整機(jī)庫(kù)存還是部件庫(kù)存,都會(huì)嚴(yán)重影響資金流動(dòng),甚至拖垮企業(yè)的資金鏈。降低庫(kù)存最有效的方式就是:第一,準(zhǔn)確把握市場(chǎng)的需求,使得生產(chǎn)量與銷(xiāo)售量的差(即庫(kù)存)最小;第二,提前把握市場(chǎng)的需求,通過(guò)在采購(gòu)提前期前給出預(yù)測(cè)值,來(lái)指導(dǎo)科學(xué)合理的采購(gòu)。那么如何度量市場(chǎng)的需求以降低庫(kù)存呢?由于電子產(chǎn)品的智能性,能夠?qū)㈦娮赢a(chǎn)品的激活數(shù)據(jù)直接上報(bào),使得電子產(chǎn)品的激活量直接、準(zhǔn)確的反映了市場(chǎng)需求量,所以對(duì)電子產(chǎn)品激活量準(zhǔn)確的預(yù)測(cè),尤為重要。
現(xiàn)有技術(shù)中,對(duì)電子產(chǎn)品激活量的預(yù)測(cè),均是通過(guò)單一的回歸模型或時(shí)間序列分析方法進(jìn)行預(yù)測(cè),但是,前者無(wú)法擬合數(shù)據(jù)的時(shí)間規(guī)律,即,無(wú)法擬合出電子產(chǎn)品激活量隨時(shí)間變化的規(guī)律,后者無(wú)法學(xué)習(xí)相關(guān)因子隨時(shí)間變化的影響力,即,無(wú)法學(xué)習(xí)影響電子產(chǎn)品激活量的相關(guān)因子(例如,促銷(xiāo)活動(dòng)、代言活動(dòng)等)隨時(shí)間變化的影響力,所以其效果均不穩(wěn)定,且準(zhǔn)確率非常低。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供一種電子產(chǎn)品激活量預(yù)測(cè)方法及一種服務(wù)器集群,能夠準(zhǔn)確的預(yù)測(cè)電子產(chǎn)品激活量。
本發(fā)明提供了一種電子產(chǎn)品激活量預(yù)測(cè)方法,包括:
獲取第一激活量數(shù)據(jù)和影響第一激活量數(shù)據(jù)的至少一個(gè)第一因子數(shù)據(jù);
對(duì)所述第一激活量數(shù)據(jù)和所述至少一個(gè)第一因子數(shù)據(jù)分別進(jìn)行時(shí)間序列化;
對(duì)時(shí)間序列化后的數(shù)據(jù)進(jìn)行時(shí)間規(guī)律拆解,得到第二激活量數(shù)據(jù),所述第二激活量數(shù)據(jù)包括電子產(chǎn)品激活量未受所述至少一個(gè)第一因子數(shù)據(jù)影響情況下隨時(shí)間的變化趨勢(shì)數(shù)據(jù);
判斷所述變化趨勢(shì)數(shù)據(jù)是否具有時(shí)間規(guī)律;
如果所述變化趨勢(shì)數(shù)據(jù)具有時(shí)間規(guī)律,將所述變化趨勢(shì)數(shù)據(jù)進(jìn)行特征化處理生成第二因子數(shù)據(jù),將所述至少一個(gè)第一因子數(shù)據(jù)與第二因子數(shù)據(jù)輸入預(yù)設(shè)模型進(jìn)行學(xué)習(xí),以對(duì)預(yù)定時(shí)間的電子產(chǎn)品激活量進(jìn)行預(yù)測(cè)。
作為優(yōu)選,還包括,
如果所述變化趨勢(shì)數(shù)據(jù)不具有時(shí)間規(guī)律,則將所述至少一個(gè)第一因子數(shù)據(jù)輸入預(yù)設(shè)模型進(jìn)行學(xué)習(xí),以對(duì)預(yù)定時(shí)間的電子產(chǎn)品激活量進(jìn)行預(yù)測(cè)。
作為優(yōu)選,所述至少一個(gè)第一因子數(shù)據(jù)包括價(jià)格因子數(shù)據(jù)、市場(chǎng)活動(dòng)因子數(shù)據(jù)、產(chǎn)品質(zhì)量因子數(shù)據(jù)、輿論因子數(shù)據(jù)、競(jìng)爭(zhēng)產(chǎn)品因子數(shù)據(jù)中的一個(gè)或多個(gè)。
作為優(yōu)選,所述輿論因子數(shù)據(jù)包括情感指數(shù)因子數(shù)據(jù),所述情感指數(shù)因子數(shù)據(jù)基于正面輿論評(píng)價(jià)信息數(shù)量以及負(fù)面輿論評(píng)價(jià)信息數(shù)量確認(rèn)。
作為優(yōu)選,對(duì)所述至少一個(gè)第一因子數(shù)據(jù)進(jìn)行時(shí)間序列化包括對(duì)價(jià)格因子數(shù)據(jù)進(jìn)行時(shí)間序列化,并且在對(duì)所述價(jià)格因子數(shù)據(jù)進(jìn)行時(shí)間序列化前,對(duì)所述價(jià)格因子數(shù)據(jù)進(jìn)行離散化。
作為優(yōu)選,將所述變化趨勢(shì)數(shù)據(jù)進(jìn)行特征化處理包括,將所述變化趨勢(shì)數(shù)據(jù)的依賴(lài)時(shí)長(zhǎng)構(gòu)造成一維特征或多維特征作為所述第二因子數(shù)據(jù)。
作為優(yōu)選,所述第一因子數(shù)據(jù)與所述第二因子數(shù)據(jù)的權(quán)重相等。
本發(fā)明還公開(kāi)了一種服務(wù)器集群,包括至少一個(gè)處理器、至少一個(gè)存儲(chǔ)器,所述至少一個(gè)存儲(chǔ)器能夠存儲(chǔ)被所述至少一個(gè)處理器處理的指令,所述至少一個(gè)處理器配置為執(zhí)行所述指令以:
獲取第一激活量數(shù)據(jù)和影響第一激活量數(shù)據(jù)的至少一個(gè)第一因子數(shù)據(jù);
對(duì)所述第一激活量數(shù)據(jù)和所述至少一個(gè)第一因子數(shù)據(jù)分別進(jìn)行時(shí)間序列化;
對(duì)時(shí)間序列化后的數(shù)據(jù)進(jìn)行時(shí)間規(guī)律拆解,得到第二激活量數(shù)據(jù),所述第二激活量數(shù)據(jù)包括電子產(chǎn)品激活量未受所述至少一個(gè)第一因子數(shù)據(jù)影響情況下隨時(shí)間的變化趨勢(shì)數(shù)據(jù);
判斷所述變化趨勢(shì)數(shù)據(jù)是否具有時(shí)間規(guī)律;
如果所述變化趨勢(shì)數(shù)據(jù)具有時(shí)間規(guī)律,將所述變化趨勢(shì)數(shù)據(jù)進(jìn)行特征化處理生成第二因子數(shù)據(jù),將所述至少一個(gè)第一因子數(shù)據(jù)與第二因子數(shù)據(jù)輸入預(yù)設(shè)模型進(jìn)行學(xué)習(xí),以對(duì)預(yù)定時(shí)間的電子產(chǎn)品激活量進(jìn)行預(yù)測(cè)。
作為優(yōu)選,所述至少一個(gè)處理器配置為進(jìn)一步執(zhí)行所述指令以:
如果所述變化趨勢(shì)數(shù)據(jù)不具有時(shí)間規(guī)律,則將所述至少一個(gè)第一因子數(shù)據(jù)輸入預(yù)設(shè)模型進(jìn)行學(xué)習(xí),以對(duì)預(yù)定時(shí)間的電子產(chǎn)品激活量進(jìn)行預(yù)測(cè)。
作為優(yōu)選,所述至少一個(gè)第一因子數(shù)據(jù)包括價(jià)格因子數(shù)據(jù)、市場(chǎng)活動(dòng)因子數(shù)據(jù)、產(chǎn)品質(zhì)量因子數(shù)據(jù)、輿論因子數(shù)據(jù)、競(jìng)爭(zhēng)產(chǎn)品因子數(shù)據(jù)中的一個(gè)或多個(gè)。
作為優(yōu)選,所述輿論因子數(shù)據(jù)包括情感指數(shù)因子數(shù)據(jù),所述情感指數(shù)因子數(shù)據(jù)基于正面輿論評(píng)價(jià)信息數(shù)量以及負(fù)面輿論評(píng)價(jià)信息數(shù)量確認(rèn)。
作為優(yōu)選,對(duì)所述至少一個(gè)第一因子數(shù)據(jù)進(jìn)行時(shí)間序列化包括對(duì)價(jià)格因子數(shù)據(jù)進(jìn)行時(shí)間序列化,并且在對(duì)所述價(jià)格因子數(shù)據(jù)進(jìn)行時(shí)間序列化前,對(duì)所述價(jià)格因子數(shù)據(jù)進(jìn)行離散化。
作為優(yōu)選,將所述變化趨勢(shì)數(shù)據(jù)進(jìn)行特征化處理包括,將所述變化趨勢(shì)數(shù)據(jù)的依賴(lài)時(shí)長(zhǎng)構(gòu)造成一維特征或多維特征作為所述第二因子數(shù)據(jù)。
作為優(yōu)選,所述第一因子數(shù)據(jù)與所述第二因子數(shù)據(jù)的權(quán)重相等。
與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果在于:通過(guò)利用時(shí)間序列法將第一激活量數(shù)據(jù)拆解為不受第一因子數(shù)據(jù)影響的第二激活量數(shù)據(jù),并將第二激活量數(shù)據(jù)特征化處理后與第一因子數(shù)據(jù)輸入集成學(xué)習(xí)模型進(jìn)行學(xué)習(xí),預(yù)測(cè)預(yù)定時(shí)間的電子產(chǎn)品激活量,預(yù)測(cè)的穩(wěn)定性和準(zhǔn)確率都有明顯的提升,訓(xùn)練誤差和測(cè)試誤差都有明顯的降低。
附圖說(shuō)明
圖1是本發(fā)明一個(gè)實(shí)施例的電子產(chǎn)品激活量預(yù)測(cè)方法的流程圖;
圖2是本發(fā)明另一實(shí)施例的電子產(chǎn)品激活量預(yù)測(cè)方法的流程圖。
具體實(shí)施方式
下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述,但不作為對(duì)本發(fā)明的限定。
此處參考附圖描述本發(fā)明的各種方案以及特征。
應(yīng)理解的是,可以對(duì)此處發(fā)明的實(shí)施例做出各種修改。因此,上述說(shuō)明書(shū)不應(yīng)該視為限制,而僅是作為實(shí)施例的范例。本領(lǐng)域的技術(shù)人員將想到在本發(fā)明的范圍和精神內(nèi)的其他修改。
包含在說(shuō)明書(shū)中并構(gòu)成說(shuō)明書(shū)的一部分的附圖示出了本發(fā)明的實(shí)施例,并且與上面給出的對(duì)本發(fā)明的大致描述以及下面給出的對(duì)實(shí)施例的詳細(xì)描述一起用于解釋本發(fā)明的原理。
通過(guò)下面參照附圖對(duì)給定為非限制性實(shí)例的實(shí)施例的優(yōu)選形式的描述,本發(fā)明的這些和其它特性將會(huì)變得顯而易見(jiàn)。
還應(yīng)當(dāng)理解,盡管已經(jīng)參照一些具體實(shí)例對(duì)本發(fā)明進(jìn)行了描述,但本領(lǐng)域技術(shù)人員能夠確定地實(shí)現(xiàn)本發(fā)明的很多其它等效形式,它們具有如權(quán)利要求所述的特征并因此都位于借此所限定的保護(hù)范圍內(nèi)。
當(dāng)結(jié)合附圖時(shí),鑒于以下詳細(xì)說(shuō)明,本發(fā)明的上述和其他方面、特征和優(yōu)勢(shì)將變得更為顯而易見(jiàn)。
此后參照附圖描述本發(fā)明的具體實(shí)施例;然而,應(yīng)當(dāng)理解,所發(fā)明的實(shí)施例僅僅是本發(fā)明的實(shí)例,其可采用多種方式實(shí)施。熟知和/或重復(fù)的功能和結(jié)構(gòu)并未詳細(xì)描述以避免不必要或多余的細(xì)節(jié)使得本發(fā)明模糊不清。因此,本文所發(fā)明的具體的結(jié)構(gòu)性和功能性細(xì)節(jié)并非意在限定,而是僅僅作為權(quán)利要求的基礎(chǔ)和代表性基礎(chǔ)用于教導(dǎo)本領(lǐng)域技術(shù)人員以實(shí)質(zhì)上任意合適的詳細(xì)結(jié)構(gòu)多樣地使用本發(fā)明。
本說(shuō)明書(shū)可使用詞組“在一種實(shí)施例中”、“在另一個(gè)實(shí)施例中”、“在又一實(shí)施例中”或“在其他實(shí)施例中”,其均可指代根據(jù)本發(fā)明的相同或不同實(shí)施例中的一個(gè)或多個(gè)。
如圖1所示,本發(fā)明公開(kāi)的一個(gè)實(shí)施例中,電子產(chǎn)品激活量預(yù)測(cè)方法,包括:
s1,獲取第一激活量數(shù)據(jù)和影響第一激活量數(shù)據(jù)的至少一個(gè)第一因子數(shù)據(jù)。
其中,第一激活量數(shù)據(jù)是統(tǒng)計(jì)的用戶激活的電子產(chǎn)品的數(shù)據(jù),其是用戶實(shí)際購(gòu)買(mǎi)電子產(chǎn)品的數(shù)量的一個(gè)反映,用戶實(shí)際購(gòu)買(mǎi)的電子產(chǎn)品的數(shù)量越多,第一激活量數(shù)據(jù)越大,可以根據(jù)第一激活量數(shù)據(jù)來(lái)判斷用戶實(shí)際購(gòu)買(mǎi)電子產(chǎn)品的數(shù)量,也就是可以根據(jù)第一激活量數(shù)據(jù)來(lái)判斷銷(xiāo)售的電子產(chǎn)品的數(shù)量。
影響第一激活量數(shù)據(jù)的至少一個(gè)第一因子數(shù)據(jù)可以包括價(jià)格因子數(shù)據(jù)、市場(chǎng)活動(dòng)因子數(shù)據(jù)、產(chǎn)品質(zhì)量因子數(shù)據(jù)、輿論因子數(shù)據(jù)、競(jìng)爭(zhēng)產(chǎn)品因子數(shù)據(jù)中的一個(gè)或多個(gè)。價(jià)格因子數(shù)據(jù)可以是廠家規(guī)定的電子產(chǎn)品的價(jià)格,也可以是售賣(mài)平臺(tái)的售價(jià),價(jià)格因子數(shù)據(jù)可以是變化的,例如,廠家為了多賣(mài)電子產(chǎn)品而對(duì)電子產(chǎn)品進(jìn)行降價(jià)。市場(chǎng)活動(dòng)因子數(shù)據(jù)可以是促銷(xiāo)活動(dòng)中花費(fèi)的人力成本或物力成本,也可以是代言活動(dòng)中名人的出場(chǎng)費(fèi)用或代言場(chǎng)所的租賃費(fèi)用或者代言場(chǎng)所的觀眾數(shù)量。產(chǎn)品質(zhì)量因子數(shù)據(jù)可以包括返修率。輿論因子數(shù)據(jù)可以包括電子產(chǎn)品的討論熱度或者情感指數(shù)因子數(shù)據(jù)。另外,第一因子數(shù)據(jù)還可以包括競(jìng)品活動(dòng)因子數(shù)據(jù),競(jìng)品活動(dòng)因子數(shù)據(jù)可以是作為競(jìng)爭(zhēng)對(duì)手的廠家做促銷(xiāo)活動(dòng)或代言活動(dòng)的數(shù)據(jù)。
s2,對(duì)第一激活量數(shù)據(jù)和至少一個(gè)第一因子數(shù)據(jù)分別進(jìn)行時(shí)間序列化。
對(duì)第一激活量數(shù)據(jù)進(jìn)行時(shí)間序列化可以是對(duì)第一激活量數(shù)據(jù)按照時(shí)間順序進(jìn)行排列,例如,電子產(chǎn)品的激活量按照日期的排列數(shù)據(jù)。
對(duì)第一因子數(shù)據(jù)進(jìn)行時(shí)間序列化可以是對(duì)第一因子數(shù)據(jù)按照時(shí)間順序進(jìn)行排列。例如,對(duì)價(jià)格因子數(shù)據(jù)進(jìn)行時(shí)間序列化可以是廠家規(guī)定的價(jià)格按照日期的排列數(shù)據(jù),如果廠家在某段時(shí)間降低價(jià)格,可以在時(shí)間序列化后的價(jià)格因子數(shù)據(jù)中體現(xiàn)出來(lái)。
另外,對(duì)于代言活動(dòng)中名人的出場(chǎng)費(fèi)用的時(shí)間序列化可以是將出場(chǎng)費(fèi)用平均到代言活動(dòng)期間的每一天,再按照此段期間中的每一天對(duì)應(yīng)平均化后的出場(chǎng)費(fèi)用。租賃費(fèi)用或觀眾數(shù)量的時(shí)間序列化類(lèi)似于出場(chǎng)費(fèi)用的時(shí)間序列化,在此不再贅述。對(duì)于競(jìng)品活動(dòng)因子數(shù)據(jù)進(jìn)行時(shí)間序列化也與之類(lèi)似。
對(duì)于返修率的時(shí)間序列化可以是返修率按照日期的排列數(shù)據(jù)。而對(duì)于討論熱度的時(shí)間序列化可以是利用爬蟲(chóng)技術(shù)將人們?cè)诰W(wǎng)上的討論進(jìn)行抓取,并計(jì)算關(guān)于電子產(chǎn)品的討論的數(shù)量,最后對(duì)應(yīng)日期進(jìn)行排列。對(duì)于輿論因子數(shù)據(jù)中的情感指數(shù)因子數(shù)據(jù),可以是基于正面輿論評(píng)價(jià)信息數(shù)量以及負(fù)面輿論評(píng)價(jià)信息數(shù)量確認(rèn)。具體可以是,通過(guò)對(duì)正面和負(fù)面的輿論評(píng)價(jià)信息進(jìn)行統(tǒng)計(jì),并根據(jù)(n正-n負(fù))*10/(n正+n負(fù))計(jì)算得到情感指數(shù),并對(duì)情感指數(shù)按照時(shí)間進(jìn)行排列。其中,n正為統(tǒng)計(jì)的當(dāng)天的正面輿論評(píng)價(jià)信息的數(shù)量,n負(fù)為統(tǒng)計(jì)的當(dāng)天的負(fù)面輿論評(píng)價(jià)信息的數(shù)量。
s3,對(duì)時(shí)間序列化后的數(shù)據(jù)進(jìn)行時(shí)間規(guī)律拆解,得到第二激活量數(shù)據(jù),第二激活量數(shù)據(jù)包括電子產(chǎn)品激活量未受所述至少一個(gè)第一因子數(shù)據(jù)影響情況下隨時(shí)間的變化趨勢(shì)數(shù)據(jù)。
其中,對(duì)時(shí)間序列化后的數(shù)據(jù)進(jìn)行時(shí)間規(guī)律拆解可以是利用時(shí)間序列分析方法對(duì)時(shí)間序列化后的數(shù)據(jù)進(jìn)行時(shí)間規(guī)律拆解,具體的,可以是利用時(shí)間序列分析方法中的stl(seasonalandtrenddecompositionusingloess‘)分解方法,stl分解方法是以魯棒局部加權(quán)回歸作為平滑方法的時(shí)間序列分解方法,從而可以得到第二激活量數(shù)據(jù),其中第二激活量數(shù)據(jù)包括電子產(chǎn)品激活量未受至少一個(gè)第一因子數(shù)據(jù)影響情況下隨時(shí)間的變化趨勢(shì)數(shù)據(jù),也即是,第二激活量數(shù)據(jù)是從第一激活量數(shù)據(jù)中將第一因子數(shù)據(jù)的影響剝離后的隨時(shí)間變化的電子產(chǎn)品的激活量的數(shù)據(jù),隨時(shí)間變化的趨勢(shì)數(shù)據(jù)包括隨時(shí)間變化的長(zhǎng)期趨勢(shì)數(shù)據(jù)和隨時(shí)間變化的短期趨勢(shì)數(shù)據(jù)。其中,隨時(shí)間變化的長(zhǎng)期趨勢(shì)數(shù)據(jù)可以是電子產(chǎn)品激活量隨時(shí)間變化的長(zhǎng)期趨勢(shì)數(shù)據(jù),例如,在一年內(nèi)隨著時(shí)間變化的長(zhǎng)期趨勢(shì)數(shù)據(jù)。隨時(shí)間變化的短期趨勢(shì)數(shù)據(jù)可以是電子產(chǎn)品激活量隨著時(shí)間變化的短期趨勢(shì)數(shù)據(jù),例如,在7天之內(nèi)的變化。
s4,判斷變化趨勢(shì)數(shù)據(jù)是否具有時(shí)間規(guī)律。
判斷變化趨勢(shì)數(shù)據(jù)是否具有時(shí)間規(guī)律具體可以是判斷隨時(shí)間變化的長(zhǎng)期趨勢(shì)數(shù)據(jù)或隨時(shí)間變化的短期趨勢(shì)數(shù)據(jù)是否有時(shí)間規(guī)律,即,判斷隨時(shí)間變化的長(zhǎng)期趨勢(shì)數(shù)據(jù)是否逐漸降低或逐漸升高,或者隨時(shí)間變化的短期趨勢(shì)數(shù)據(jù)是否具有周期性或季節(jié)性。
s5,如果變化趨勢(shì)數(shù)據(jù)具有時(shí)間規(guī)律,將變化趨勢(shì)數(shù)據(jù)進(jìn)行特征化處理生成第二因子數(shù)據(jù),將至少一個(gè)第一因子數(shù)據(jù)與第二因子數(shù)據(jù)輸入預(yù)設(shè)模型進(jìn)行學(xué)習(xí),以對(duì)預(yù)定時(shí)間的電子產(chǎn)品激活量進(jìn)行預(yù)測(cè)。
如果判斷為,隨時(shí)間變化的長(zhǎng)期趨勢(shì)數(shù)據(jù)是逐漸升高的,例如在一年內(nèi)隨著時(shí)間而逐漸升高,隨時(shí)間變化的短期趨勢(shì)數(shù)據(jù)是例如以7天為周期逐漸變化的,那么,將變化趨勢(shì)數(shù)據(jù)進(jìn)行特征化處理生成第二因子數(shù)據(jù)。
其中,將變化趨勢(shì)數(shù)據(jù)進(jìn)行特征化可以包括將隨時(shí)間變化的長(zhǎng)期趨勢(shì)數(shù)據(jù)和隨時(shí)間變化的短期趨勢(shì)數(shù)據(jù)的依賴(lài)時(shí)長(zhǎng)構(gòu)造成多維特征或者一維特征作為第二因子數(shù)據(jù)。例如,如果隨時(shí)間變化的短期趨勢(shì)數(shù)據(jù)是以7天為周期逐漸變化的,那么將以7天為周期輸入例如lag(n)函數(shù)將其構(gòu)造為七維特征。又例如,如果隨時(shí)間變化的短期趨勢(shì)數(shù)據(jù)是以1天為周期逐漸變化的,那么將以1天為周期輸入例如lag(n)函數(shù)將其構(gòu)造為一維特征。
將第二因子數(shù)據(jù)與至少一個(gè)第一因子數(shù)據(jù)輸入預(yù)設(shè)模型進(jìn)行學(xué)習(xí),以對(duì)預(yù)定時(shí)間的電子產(chǎn)品激活量進(jìn)行預(yù)測(cè)。預(yù)設(shè)模型可以是集成學(xué)習(xí)模型,例如是gbdt或xgboost算法。將第一因子數(shù)據(jù)與第二因子數(shù)據(jù)輸入預(yù)設(shè)模型時(shí),每一個(gè)第一因子數(shù)據(jù)與第二因子數(shù)據(jù)的權(quán)重均相等。
對(duì)電子產(chǎn)品的激活量進(jìn)行預(yù)測(cè),例如可以是將隨時(shí)間變化逐漸上升的長(zhǎng)期趨勢(shì)特征化和將以7天為周期的短期趨勢(shì)數(shù)據(jù)進(jìn)行特征化后為第二因子數(shù)據(jù),并將預(yù)定時(shí)間以及至少一個(gè)第一因子數(shù)據(jù)輸入預(yù)設(shè)模型進(jìn)行學(xué)習(xí),此時(shí)的至少一個(gè)第一因子數(shù)據(jù)可以為預(yù)定時(shí)間對(duì)應(yīng)的第一因子數(shù)據(jù),從而得到在第二因子數(shù)據(jù)和至少一個(gè)第一因子數(shù)據(jù)作用下,預(yù)定時(shí)間的電子產(chǎn)品激活量。其中,預(yù)定時(shí)間可以是未來(lái)某一天的時(shí)間,也可以是未來(lái)某一段的時(shí)間。
通過(guò)利用時(shí)間序列法將第一激活量數(shù)據(jù)拆解為不受第一因子數(shù)據(jù)影響的第二激活量數(shù)據(jù),并將第二激活量數(shù)據(jù)特征化處理后與第一因子數(shù)據(jù)輸入集成學(xué)習(xí)模型進(jìn)行學(xué)習(xí),預(yù)測(cè)預(yù)定時(shí)間的電子產(chǎn)品激活量,預(yù)測(cè)的穩(wěn)定性和準(zhǔn)確率都有明顯的提升,訓(xùn)練誤差和測(cè)試誤差都有明顯的降低。
如圖2所示,本發(fā)明公開(kāi)的另一個(gè)實(shí)施例中,電子產(chǎn)品激活量預(yù)測(cè)方法包括:
s1,獲取第一激活量數(shù)據(jù)和影響第一激活量數(shù)據(jù)的至少一個(gè)第一因子數(shù)據(jù);
s2,對(duì)所述第一激活量數(shù)據(jù)和所述至少一個(gè)第一因子數(shù)據(jù)分別進(jìn)行時(shí)間序列化;
s3,對(duì)時(shí)間序列化后的數(shù)據(jù)進(jìn)行時(shí)間規(guī)律拆解,得到第二激活量數(shù)據(jù),第二激活量數(shù)據(jù)包括電子產(chǎn)品激活量未受至少一個(gè)第一因子數(shù)據(jù)影響情況下隨時(shí)間的變化趨勢(shì)數(shù)據(jù);
s4,判斷變化趨勢(shì)數(shù)據(jù)是否具有時(shí)間規(guī)律;
s6,如果變化趨勢(shì)數(shù)據(jù)不具有時(shí)間規(guī)律,則將至少一個(gè)第一因子數(shù)據(jù)輸入預(yù)設(shè)模型進(jìn)行學(xué)習(xí),以對(duì)預(yù)定時(shí)間的電子產(chǎn)品激活量進(jìn)行預(yù)測(cè)。
本實(shí)施例與上一個(gè)實(shí)施例的區(qū)別主要在于s6,s6中,由于變化趨勢(shì)數(shù)據(jù)不具有時(shí)間規(guī)律,則僅將至少一個(gè)第一因子數(shù)據(jù)以及預(yù)定時(shí)間輸入預(yù)設(shè)模型進(jìn)行學(xué)習(xí),從而得到在至少一個(gè)第一因子作用下,預(yù)定時(shí)間的電子產(chǎn)品激活量。預(yù)設(shè)模型可以是集成學(xué)習(xí)模型,例如是gbdt或xgboost算法。其中,預(yù)定時(shí)間可以是未來(lái)某一天的時(shí)間,也可以是未來(lái)某一段的時(shí)間。
在上述兩個(gè)實(shí)施例中,對(duì)至少一個(gè)第一因子數(shù)據(jù)進(jìn)行時(shí)間序列化包括對(duì)價(jià)格因子數(shù)據(jù)進(jìn)行時(shí)間序列化,并且在對(duì)價(jià)格因子數(shù)據(jù)進(jìn)行時(shí)間序列化前,對(duì)價(jià)格因子數(shù)據(jù)進(jìn)行離散化,例如,可以對(duì)價(jià)格數(shù)據(jù)離散化為不同價(jià)格區(qū)間。
本發(fā)明還公開(kāi)了一種服務(wù)器集群,包括至少一個(gè)處理器、至少一個(gè)存儲(chǔ)器,至少一個(gè)存儲(chǔ)器能夠存儲(chǔ)被至少一個(gè)處理器處理的指令,至少一個(gè)處理器配置為執(zhí)行指令以:
獲取第一激活量數(shù)據(jù)和影響第一激活量數(shù)據(jù)的至少一個(gè)第一因子數(shù)據(jù);
對(duì)第一激活量數(shù)據(jù)和至少一個(gè)第一因子數(shù)據(jù)分別進(jìn)行時(shí)間序列化;
對(duì)時(shí)間序列化后的數(shù)據(jù)進(jìn)行時(shí)間規(guī)律拆解,得到第二激活量數(shù)據(jù),第二激活量數(shù)據(jù)包括電子產(chǎn)品激活量未受所述至少一個(gè)第一因子數(shù)據(jù)影響情況下隨時(shí)間的變化趨勢(shì)數(shù)據(jù);
判斷變化趨勢(shì)數(shù)據(jù)是否具有時(shí)間規(guī)律;
如果變化趨勢(shì)數(shù)據(jù)具有時(shí)間規(guī)律,將變化趨勢(shì)數(shù)據(jù)進(jìn)行特征化處理生成第二因子數(shù)據(jù),將至少一個(gè)第一因子數(shù)據(jù)與第二因子數(shù)據(jù)輸入預(yù)設(shè)模型進(jìn)行學(xué)習(xí),以對(duì)預(yù)定時(shí)間的電子產(chǎn)品激活量進(jìn)行預(yù)測(cè)。
進(jìn)一步的,至少一個(gè)處理器配置為進(jìn)一步執(zhí)行指令以:
如果變化趨勢(shì)數(shù)據(jù)不具有時(shí)間規(guī)律,則將至少一個(gè)第一因子數(shù)據(jù)輸入預(yù)設(shè)模型進(jìn)行學(xué)習(xí),以對(duì)預(yù)定時(shí)間的電子產(chǎn)品激活量進(jìn)行預(yù)測(cè)。
進(jìn)一步的,至少一個(gè)第一因子數(shù)據(jù)包括價(jià)格因子數(shù)據(jù)、市場(chǎng)活動(dòng)因子數(shù)據(jù)、產(chǎn)品質(zhì)量因子數(shù)據(jù)、輿論因子數(shù)據(jù)、競(jìng)爭(zhēng)產(chǎn)品因子數(shù)據(jù)中的一個(gè)或多個(gè)。
進(jìn)一步的,輿論因子數(shù)據(jù)包括情感指數(shù)因子數(shù)據(jù),情感指數(shù)因子數(shù)據(jù)基于正面輿論評(píng)價(jià)信息數(shù)量以及負(fù)面輿論評(píng)價(jià)信息數(shù)量確認(rèn)。
進(jìn)一步的,對(duì)至少一個(gè)第一因子數(shù)據(jù)進(jìn)行時(shí)間序列化包括對(duì)價(jià)格因子數(shù)據(jù)進(jìn)行時(shí)間序列化,并且在對(duì)價(jià)格因子數(shù)據(jù)進(jìn)行時(shí)間序列化前,對(duì)價(jià)格因子數(shù)據(jù)進(jìn)行離散化。
進(jìn)一步的,將變化趨勢(shì)數(shù)據(jù)進(jìn)行特征化處理包括,將變化趨勢(shì)數(shù)據(jù)的依賴(lài)時(shí)長(zhǎng)構(gòu)造成一維特征或多維特征作為第二因子數(shù)據(jù)。
進(jìn)一步的,第一因子數(shù)據(jù)與第二因子數(shù)據(jù)的權(quán)重相等。
通過(guò)利用時(shí)間序列法將第一激活量數(shù)據(jù)拆解為不受第一因子數(shù)據(jù)影響的第二激活量數(shù)據(jù),并將第二激活量數(shù)據(jù)特征化處理后與第一因子數(shù)據(jù)輸入集成學(xué)習(xí)模型進(jìn)行學(xué)習(xí),預(yù)測(cè)預(yù)定時(shí)間的電子產(chǎn)品激活量,預(yù)測(cè)的穩(wěn)定性和準(zhǔn)確率都有明顯的提升,訓(xùn)練誤差和測(cè)試誤差都有明顯的降低。
以上實(shí)施例僅為本發(fā)明的示例性實(shí)施例,不用于限制本發(fā)明,本發(fā)明的保護(hù)范圍由權(quán)利要求書(shū)限定。本領(lǐng)域技術(shù)人員可以在本發(fā)明的實(shí)質(zhì)和保護(hù)范圍內(nèi),對(duì)本發(fā)明做出各種修改或等同替換,這種修改或等同替換也應(yīng)視為落在本發(fā)明的保護(hù)范圍內(nèi)。