本申請涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種確定對象影響力的方法及裝置。
背景技術(shù):
在互聯(lián)網(wǎng)領(lǐng)域中,往往需要評價一個“對象”(如:互聯(lián)網(wǎng)用戶、網(wǎng)站、互聯(lián)網(wǎng)提供的商品等)的影響力。通過對用戶影響力的評估,可以找到那些在互聯(lián)網(wǎng)中高影響力的用戶。在相關(guān)技術(shù)中,由于每個“對象”一般包括一個或多個能夠反映影響力的影響力特征(如,用戶發(fā)布的消息數(shù),用戶被關(guān)注數(shù)等),可以根據(jù)“對象”對應(yīng)的每一影響力特征的特征值大小,人為評估該“對象”的影響力的高低。然而,上述方法由于需要人為參與,并不能準(zhǔn)確地評價“對象”的影響力。
技術(shù)實現(xiàn)要素:
有鑒于此,本申請?zhí)峁┮环N確定對象影響力的方法及裝置。
為實現(xiàn)上述目的,本申請?zhí)峁┘夹g(shù)方案如下:
根據(jù)本申請的第一方面,提出了一種確定對象影響力的方法,包括:
獲取目標(biāo)對象對應(yīng)的至少一個影響力特征的特征值;
對于每一影響力特征,根據(jù)所述特征值在該影響力特征對應(yīng)的分位數(shù)圖中所處位置,確定所述目標(biāo)對象在該影響力特征下的影響力分?jǐn)?shù);其中所述分位數(shù)圖是根據(jù)預(yù)先選取的若干對象樣本確定的;
根據(jù)所述目標(biāo)對象在各影響力特征下的影響力分?jǐn)?shù),確定所述目標(biāo)對象的影響力值。
根據(jù)本申請的第二方面,提出了一種確定對象影響力的裝置,包括:
獲取單元,用于獲取目標(biāo)對象對應(yīng)的至少一個影響力特征的特征值;
第一確定單元,用于對于每一影響力特征,根據(jù)所述特征值在該影響力特征對應(yīng)的分位數(shù)圖中所處位置,確定所述目標(biāo)對象在該影響力特征下的影響力分?jǐn)?shù);其中所述分位數(shù)圖是根據(jù)預(yù)先選取的若干對象樣本確定的;
第二確定單元,用于根據(jù)所述目標(biāo)對象在各影響力特征下的影響力分?jǐn)?shù),確定所述目標(biāo)對象的影響力值。
根據(jù)本申請的第三方面,提出了一種確定用戶影響力的方法,包括:
獲取目標(biāo)用戶對應(yīng)的至少一個影響力特征的特征值;
對于每一影響力特征,根據(jù)所述特征值在該影響力特征對應(yīng)的分位數(shù)圖中所處位置,確定所述目標(biāo)用戶在該影響力特征下的影響力分?jǐn)?shù);其中所述分位數(shù)圖是根據(jù)預(yù)先選取的若干用戶樣本確定的,并用于反映所述用戶樣本的特征值分布情況;
根據(jù)所述目標(biāo)用戶在各影響力特征下的影響力分?jǐn)?shù),確定所述目標(biāo)用戶的影響力值。
根據(jù)本申請的第四方面,提出了一種確定用戶影響力的裝置,包括:
獲取單元,用于獲取目標(biāo)用戶對應(yīng)的至少一個影響力特征的特征值;
第一確定單元,用于對于每一影響力特征,根據(jù)所述特征值在該影響力特征對應(yīng)的分位數(shù)圖中所處位置,確定所述目標(biāo)用戶在該影響力特征下的影響力分?jǐn)?shù);其中所述分位數(shù)圖是根據(jù)預(yù)先選取的若干用戶樣本確定的,并用于反映所述用戶樣本的特征值分布情況;
第二確定單元,用于根據(jù)所述目標(biāo)用戶在各影響力特征下的影響力分?jǐn)?shù),確定所述目標(biāo)用戶的影響力值。
本申請實施例中,通過根據(jù)預(yù)先選取的包含若干對象樣本的第一集合,可以針對每一種影響力特征,分別確定與每一影響力特征對應(yīng)的分位數(shù)圖。在利用上述分位數(shù)圖確定一目標(biāo)對象的影響力值的過程中,對于每一影響力特征,可根據(jù)該影響力特征對應(yīng)的特征值在該影響力特征對應(yīng)的分位數(shù)圖中所處位置,確定所述目標(biāo)對象在該影響力特征下的影響力分?jǐn)?shù),最終,根據(jù)所述目標(biāo)對象在各影響力特征下的影響力分?jǐn)?shù),確定所述目標(biāo)對象的影響力值。以上過程中,由于不需要人為參與打分,故最終確定的影響力值可以準(zhǔn)確地反映對象的影響力。
附圖說明
圖1是本申請一實施例中的一種確定對象影響力的方法的流程圖;
圖2是本申請一示例性實施例中的針對某一影響力特征繪制的百分位數(shù)分布圖;
圖3是本申請一實施例中的另一種確定對象影響力的方法的流程圖;
圖4示出了本申請一實施例中的用戶影響力值的百分位數(shù)分布情況;
圖5是本申請一示例性實施例的一種電子設(shè)備的結(jié)構(gòu)示意圖;
圖6是本申請一示例性實施例的一種確定對象影響力的裝置的框圖;
圖7是本申請一示例性實施例的另一種確定對象影響力的裝置的框圖。
具體實施方式
鑒于互聯(lián)網(wǎng)環(huán)境中往往存在著確定“對象”的影響力的需求,本申請實施例提出了一種能夠更加準(zhǔn)確地計算能夠反映“對象”影響力的影響力值的方法。一般地,每一互聯(lián)網(wǎng)“對象”包括一種或多種影響力特征。例如,若所述“對象”是互聯(lián)網(wǎng)用戶,則所述互聯(lián)網(wǎng)用戶的影響力特征可包括但不限于:用戶發(fā)布的信息數(shù)、用戶被關(guān)注數(shù)、用戶發(fā)布的信息被轉(zhuǎn)發(fā)次數(shù)、用戶賬戶的注冊時長等。又例如,若所述“對象”是網(wǎng)站,則網(wǎng)站的影響力特征可包括但不限于:每天被訪問次數(shù)、網(wǎng)站成立時長、用戶在網(wǎng)站上發(fā)表的評論數(shù)等。再例如,若所述“對象”是互聯(lián)網(wǎng)中的線上商戶,則線上商戶的影響力特征可包括但不限于:上架的商品種類數(shù)、每天的訂單數(shù)、在商戶消費的用戶數(shù)等。
為便于描述,以下將以確定互聯(lián)網(wǎng)用戶的影響力為例來介紹本方法實施例。
圖1是本申請一實施例中的一種確定對象影響力的方法的流程圖,包括如下步驟101至步驟103,其中:
在步驟101中,獲取目標(biāo)對象對應(yīng)的至少一個影響力特征的特征值。
以所述對象為用戶為例,用戶可以是在社交平臺或電商平臺上注冊的用戶。一般地,每一用戶對應(yīng)的原始影響力特征可以包括:用戶關(guān)注數(shù),用戶被關(guān)注數(shù),用戶發(fā)布的消息數(shù),用戶被點贊數(shù),用戶注冊時長(如:注冊天數(shù)),用戶是否通過某種認(rèn)證(如某稱號的認(rèn)證)等。
本申請一實施例中,根據(jù)實際需求,可以基于以上原始影響力特征確定出一個或多個優(yōu)化影響力特征,以提高準(zhǔn)確性。例如,優(yōu)化影響力特征可以包括但不限于如下一種或多種:
1)用戶被關(guān)注數(shù)/用戶關(guān)注數(shù);
2)用戶被關(guān)注數(shù)/用戶注冊時長(如注冊天數(shù));
3)用戶關(guān)注數(shù)/用戶注冊時長(如注冊天數(shù));
4)用戶被關(guān)注數(shù)/用戶發(fā)布的信息數(shù)。
為此,上述步驟101可以具體包括:
獲取目標(biāo)對象對應(yīng)的至少一個優(yōu)化影響力特征的特征值。
在步驟102中,對于每一影響力特征,根據(jù)所述特征值在該影響力特征對應(yīng)的分位數(shù)圖中所處位置,確定所述目標(biāo)對象在該影響力特征下的影響力分?jǐn)?shù);其中,所述分位數(shù)圖是根據(jù)預(yù)先選取的若干對象樣本確定的,并用于反映所述對象樣本的特征值分布情況。
在步驟102之前,需要根據(jù)預(yù)先選取一包含若干對象樣本(如:用戶樣本)的第一集合q1,并根據(jù)該第一集合q1確定分位數(shù)圖(quantileplot)。其中,分位數(shù)圖是一種用于反映單變量數(shù)據(jù)分布情況的圖。分位數(shù)圖可以包括但不限于:百分位數(shù)(percentile)分布圖、或十分位數(shù)(deciles)分布圖、或四分位數(shù)(quartiles)分布圖,等等。
本申請一實施例中,為了便于準(zhǔn)確地區(qū)分出高影響力用戶,上述第一集合q1中包含的對象樣本可以是被預(yù)先標(biāo)記為高影響力對象的樣本。在一些社交平臺上,社交平臺會根據(jù)自定義的規(guī)則,識別出一些明顯的高影響力對象。例如,社交平臺將被關(guān)注數(shù)超過1000萬的用戶確定為高影響力用戶,并對這些識別出的高影響力用戶進(jìn)行特定標(biāo)識的標(biāo)記。如,在某社交平臺上,對高影響力用戶標(biāo)記為“大v”。為此,可以將社交平臺上被標(biāo)記為“大v”的全部或部分用戶確定為“用戶樣本”,并分別獲取每一“用戶樣本”對應(yīng)的各影響力特征的特征值,得到以上第一集合q1。
在本申請另一實施例中,可以通過隨機方式抽取一定數(shù)量的對象樣本,以得到上述第一集合q1。
在本申請又一實施例中,可以將某一種影響力特征作為基準(zhǔn),并找出在該影響力特征下排名前m(如m=1000)位的對象確定為對象樣本,以得到包含這些對象樣本的上述第一集合q1。
在獲得上述包含若干對象樣本的第一集合q1之后,便可以利用這些對象樣本確定分位數(shù)圖。本申請一實施例中,確定分位數(shù)圖的過程可以包括步驟s10至s30,其中:
在s10中,針對每一影響力特征,將選取的各對象樣本在該影響力特征下的特征值進(jìn)行從小到大的排列,得到排序后的特征值序列。
例如,選取了20個用戶樣本,每個用戶樣本分別包含上述各個影響力特征對應(yīng)的特征值。本申請實施例需要針對每一種影響力特征,分別構(gòu)建分位數(shù)圖,也就是說,分位數(shù)圖的數(shù)量與影響力特征的數(shù)量相等。
以影響力特征“被關(guān)注數(shù)/關(guān)注數(shù)”為例,若選取了20個用戶樣本,假設(shè)用戶樣本中與影響力特征“被關(guān)注數(shù)/關(guān)注數(shù)”對應(yīng)的20個特征值如下:
{5,3,1,2,6,8,0,5,3,16,8,3,9,2,6,2,19,5,3,11};
如果將以上與影響力特征“被關(guān)注數(shù)/關(guān)注數(shù)”對應(yīng)的20個特征值按照從小到大進(jìn)行排列,得到排序后的特征值序列如下:
{0,1,2,2,2,3,3,3,3,5,5,5,6,6,8,8,9,11,16,19}。
在s20中,將所述特征值序列均分成n份,得到n個分位;其中,n≥2。
其中,在將所述特征值序列均分成n份,得到n個子特征值系列,則可以定義所述“分位”為每一份子特征值系列中的最后一個特征值所在的位置。
若以繪制四分位數(shù)(quartiles)分布圖為例,則n=4??梢詫⑸鲜鎏卣髦敌蛄芯殖?份:
{0,1,2,2,2},{3,3,3,3,5},{5,5,6,6,8},{8,9,11,16,19};
其中包括4個分位:第一分位(特征值序列中第5個特征值所在位置),第二分位(特征值序列中第10個特征值所在位置),第三分位(特征值序列中第15個特征值所在位置),第四分位(特征值序列中第20個特征值所在位置)。
同樣地,若需要繪制十分位數(shù)分布圖為例,則n=10??梢詫⑸鲜鎏卣髦敌蛄芯殖?0份。
在s30中,確定所述特征值序列在每一分位上的特征值,得到所述分位數(shù)圖。
在以上例子中,以四分位數(shù)分布圖為例,最終確定出的在4個分位上的值分別是:2,5,8,19。其中,可以看出,在上述20個用戶樣本中,有25%的用戶在影響力特征“被關(guān)注數(shù)/關(guān)注數(shù)”上的特征值小于2,有50%的用戶在影響力特征“被關(guān)注數(shù)/關(guān)注數(shù)”上的特征值小于5,有75%的用戶在影響力特征“被關(guān)注數(shù)/關(guān)注數(shù)”上的特征值小于8。
值得述及的是,在以上實施例中,在確定“四分位數(shù)分布圖”、或“十分位數(shù)分布圖”、或“百分位數(shù)分布圖”的過程中,都是將用戶樣本的特征值序列進(jìn)行均分,以得到處于各個分位上的特征值大小。然而,在可行的其他實施例中,也采取非均分的方式對特征值序列進(jìn)行劃分,并得到各個分位上的特征值大小。
圖2是本申請一示例性實施例中的針對某一影響力特征繪制的百分位數(shù)(percentile)分布圖。本實施例中,可以選取k(k≥100)個被標(biāo)記為高影響力用戶的用戶樣本,并利用這些用戶樣本分別繪制出與每一影響力特征對應(yīng)的百分位數(shù)(percentile)分布圖。
在繪制出以上圖2所示的百分位數(shù)(percentile)分布圖之后,對于任意一個待計算影響力值的目標(biāo)用戶,可以基于圖2所示的百分位數(shù)(percentile)分布圖,為該目標(biāo)用戶在每一個影響力特征下進(jìn)行打分,得到與每一影響力特征對應(yīng)的影響力分?jǐn)?shù)。其中,影響力分?jǐn)?shù)的波動范圍不受限制,如,可介于0~100,影響力分?jǐn)?shù)越大,則可以表明該目標(biāo)用戶在該影響力特征下的影響力越高。
假設(shè)圖2是與影響力特征:“被關(guān)注數(shù)/關(guān)注數(shù)”對應(yīng)的百分位數(shù)(percentile)分布圖。倘若目標(biāo)用戶在影響力特征:“被關(guān)注數(shù)/關(guān)注數(shù)”下的特征值為:10,則通過確定該特征值“10”在圖2中所在位置(可以是大致的位置),發(fā)現(xiàn)特征值“10”大致對應(yīng)于第43個百分位,相應(yīng)地,可以確定該目標(biāo)用戶在影響力特征:“被關(guān)注數(shù)/關(guān)注數(shù)”下的影響力分?jǐn)?shù)為:43。又例如,倘若目標(biāo)用戶在影響力特征:“被關(guān)注數(shù)/關(guān)注數(shù)”下的特征值為:12.3,通過確定該特征值“12.3”在圖2中所在位置,發(fā)現(xiàn)特征值“12.3”大致位于第52個百分位和第53個百分位之間。此時,可分別確定該特征值“12.3”和在第52個百分位上的特征值間的第一差值,及該特征值“12.3”和在第53個百分位上的特征值間的第二差值,并比較第一差值和第二差值的大小,將差值更小的百分位確定為上述特征值“12.3”所在位置。如,第52個百分位上的特征值是12.2,第53個百分位上的特征值是12.5,則確定該目標(biāo)用戶在影響力特征:“被關(guān)注數(shù)/關(guān)注數(shù)”下的影響力分?jǐn)?shù)為:52。
至此,通過利用與每一影響力特征對應(yīng)的分位數(shù)圖,可以在每一影響力特征下,分別為目標(biāo)用戶確定一個影響力分?jǐn)?shù),如下表1所示:
表1:
在步驟103中,根據(jù)所述目標(biāo)對象在各影響力特征下的影響力分?jǐn)?shù),確定所述目標(biāo)對象的影響力值。
在本申請一實施例中,可以將目標(biāo)對象在各影響力特征下的影響力分?jǐn)?shù)進(jìn)行累加,得到一累加值,并對該累加值進(jìn)行歸一化處理,最終,將歸一化處理后得到的歸一化值確定為所述目標(biāo)對象的影響力值。
本申請實施例中,該方法通過根據(jù)預(yù)先選取的包含若干對象樣本的第一集合,可以針對每一種影響力特征,分別確定與每一影響力特征對應(yīng)的分位數(shù)圖。在利用上述分位數(shù)圖確定一目標(biāo)對象的影響力值的過程中,對于每一影響力特征,可根據(jù)該影響力特征對應(yīng)的特征值在該影響力特征對應(yīng)的分位數(shù)圖中所處位置,確定所述目標(biāo)對象在該影響力特征下的影響力分?jǐn)?shù),最終,根據(jù)所述目標(biāo)對象在各影響力特征下的影響力分?jǐn)?shù),確定所述目標(biāo)對象的影響力值。以上過程中,由于不需要人為參與打分,故最終確定的影響力值可以準(zhǔn)確地反映對象的影響力。
此外,本申請實施例中選取的對象樣本是預(yù)先被標(biāo)記為高影響力對象的樣本,由于這些被標(biāo)記為高影響力對象的樣本在全部群體中的影響力較高,從而可以預(yù)測一個普通用戶(即非高影響力用戶或影響力一般的用戶)在高影響力用戶(如大v)視角(view)下的影響力。最終,可以得到較少的高影響力值的用戶,在需要更加精確地確定出少量高影響力的用戶的應(yīng)用場景中,有利于業(yè)務(wù)方以較少的資源對高影響力用戶進(jìn)行關(guān)注;相反,如果使用全量用戶樣本來繪制百分位數(shù)分布圖,則可能會得到相對平均的特征值分布,并不利于業(yè)務(wù)方重點關(guān)注少量的高影響力用戶,使得業(yè)務(wù)方難以準(zhǔn)確地篩選出高影響力用戶。
圖3是本申請一實施例中的另一種確定對象影響力的方法的流程圖。如圖3所示,基于上述圖1所示的實施例,在本實施例中,為使得影響力值更加準(zhǔn)確,在步驟103之前,還可包括:
步驟104,確定與每一影響力特征對應(yīng)的權(quán)重系數(shù)。
其中,可以根據(jù)人為經(jīng)驗確定與每一影響力特征對應(yīng)的權(quán)重系數(shù)。
在一優(yōu)選的實施例中,為進(jìn)一步提高準(zhǔn)確性,避免人為參與,上述步驟104可具體包括s1041~s1043,其中:
在s1041中,獲取第二集合q2;其中,所述第一集合q1可以是所述第二集合q2的子集。如上所述,第一集合q1可以是預(yù)先被標(biāo)記為高影響力對象(如,某社交平臺上標(biāo)記為“大v”的用戶)的樣本集合,而第二集合q2可以是某一互聯(lián)網(wǎng)平臺上的全量用戶集合。當(dāng)然,在可行的實施例中,第二集合q2也可以是一種隨機選取的若干對象樣本的集合。
在s1042中,利用所述第二集合q2中的各對象樣本進(jìn)行主成分分析(principalcomponentsanalysis,pca),得到第一主成分(thefirstprincipalcomponent);
本申請實施例中,在s1042中的主成分分析過程大致可包括步驟s40~s70,其中:
在s40中,對第二集合q2中的各對象樣本進(jìn)行中心化處理。
為便于描述,本文以2維樣本(即每個用戶包含2個影響力特征)為例進(jìn)行說明,其中,假設(shè)q2中包含10個樣本,2個影響力特征例如是:用戶被關(guān)注數(shù)/用戶關(guān)注數(shù)(記為x)和用戶被關(guān)注數(shù)/用戶發(fā)布的信息數(shù)(記為y)。其中,假設(shè)獲取到的樣本數(shù)據(jù)如下:
x=[2.5,0.5,2.2,1.9,3.1,2.3,2,1,1.5,1.1]
y=[2.4,0.7,2.9,2.2,3.0,2.7,1.6,1.1,1.6,0.9]
對上述樣本數(shù)據(jù)分別進(jìn)行中心化處理,即每一維的數(shù)據(jù)都減去該維的均值,得到:
x=[0.69,-1.31,0.39,0.09,1.29,0.49,0.19,-0.81,-0.31,-0.71]
y=[0.49,-1.21,0.99,0.29,1.09,0.79,-0.31,-0.81,-0.31,-1.01]
在s50中,計算協(xié)方差矩陣。其中,若對象樣本包括n個影響力特征,則計算出的協(xié)方差矩陣是n*n維的。
在上述例子中,協(xié)方差矩陣為:
由于計算協(xié)方差的過程是本領(lǐng)域公知技術(shù),不再詳細(xì)介紹。
因為上述樣本數(shù)據(jù)是2維的,最終,計算出的協(xié)方差矩陣如下:
在s60中,計算協(xié)方差矩陣的特征向量和與每一特征向量對應(yīng)的特征值。
在上述例子中,最終計算得到的特征值為:
特征向量為:
在s70中,確定第一主成分。
一般地,在根據(jù)協(xié)方差矩陣確定特征向量后,可按照每一特征向量特征值由大到小進(jìn)行排列,其中,最大特征值對應(yīng)的特征向量即為“第一主成分”。
最終,與最大特征值:“1.28402771”對應(yīng)的第一主成分為:
在s1043中,根據(jù)所述第一主成分,確定與各影響力特征對應(yīng)的權(quán)重系數(shù)。
在可選的實施例中,可通過對得到的第一主成分進(jìn)行歸一化處理,并將歸一化得到的數(shù)值確定為與各個影響力特征對應(yīng)的權(quán)重系數(shù)。在以上例子中,最終得到的與影響力特征x對應(yīng)的權(quán)重系數(shù)為:
0.677873399/(0.677873399+0.735178656)=0.4797;
與影響力特征y對應(yīng)的權(quán)重系數(shù)為:
0.735178656/(0.677873399+0.735178656)=0.5203。
當(dāng)然,以上僅以2個影響力特征為例對pca過程進(jìn)行了示例性說明,當(dāng)影響力特征的數(shù)量更多時,可基于以上原理相應(yīng)地確定出與各個影響力特征對應(yīng)的權(quán)重系數(shù)。例如:與“被關(guān)注數(shù)/關(guān)注數(shù)”對應(yīng)的權(quán)重系數(shù)x1是0.2、與“被關(guān)注數(shù)/用戶注冊天數(shù)”對應(yīng)的權(quán)重系數(shù)x2是0.3,與“關(guān)注數(shù)/用戶注冊天數(shù)”對應(yīng)的權(quán)重系數(shù)x3是0.6,與“被關(guān)注數(shù)/發(fā)布信息數(shù)”對應(yīng)的權(quán)重系數(shù)x4是0.5,等等。由于上述各個影響力特征的特征值都與影響力呈正相關(guān),因此,在確定各影響力特征對應(yīng)的權(quán)重系數(shù)的過程中,需要檢查各權(quán)重系數(shù)都是正數(shù)。
如圖3所示,本申請一實施例中,所述步驟103可具體包括步驟1031~步驟1033,其中:
在步驟1031中,將所述目標(biāo)對象在每一影響力特征下的影響力分?jǐn)?shù)分別乘以該影響力特征對應(yīng)的權(quán)重系數(shù),得到所述目標(biāo)對象在每一影響力特征下的乘積值。
在步驟1032中,將所述目標(biāo)對象在每一影響力特征下的乘積值進(jìn)行求和,并對求和得到的和值進(jìn)行歸一化。
在步驟1033中,將歸一化得到的歸一化數(shù)值,確定為所述目標(biāo)對象的影響力值。
承上述例子,假設(shè)為某一目標(biāo)用戶確定出的與每一種影響力特征對應(yīng)的影響力分?jǐn)?shù)如下表2所示:
表2:
最終,計算得到的和值為:
(60*0.2+50*0.6+60*0.3+90*0.5+20*0.1+50*0.2)
=117
在計算出全量用戶中每一個用戶的上述和值之后,可以對每一用戶的和值采用統(tǒng)一的歸一化規(guī)則進(jìn)行歸一化計算,以將歸一化計算得到的數(shù)值(介于0~1之間)確定為能夠反映用戶的影響力大小的影響力值。
圖4示出了本申請一實施例中的用戶影響力值的百分位數(shù)分布情況??梢钥闯觯幱诘?9個百分位上的用戶影響力值接近于1.0,并且明顯大于處于第1~98個百分位上的用戶影響力值,從而方便業(yè)務(wù)方確定出用于確定高影響力用戶的影響力閾值,并能夠準(zhǔn)確地確定出高影響力用戶。
圖5示出了根據(jù)本申請的一示例性實施例的電子設(shè)備的示意結(jié)構(gòu)圖。該電子設(shè)備可以是商戶平臺服務(wù)器或支付平臺服務(wù)器,請參考圖5,在硬件層面,該電子設(shè)備包括處理器、內(nèi)部總線、網(wǎng)絡(luò)接口、內(nèi)存以及非易失性存儲器,當(dāng)然還可能包括其他業(yè)務(wù)所需要的硬件。處理器從非易失性存儲器中讀取對應(yīng)的計算機程序到內(nèi)存中然后運行,在邏輯層面上形成確定對象影響力的裝置。當(dāng)然,除了軟件實現(xiàn)方式之外,本申請并不排除其他實現(xiàn)方式,比如邏輯器件抑或軟硬件結(jié)合的方式等等,也就是說以下處理流程的執(zhí)行主體并不限定于各個邏輯單元,也可以是硬件或邏輯器件。
請參考圖6,在一種軟件實施方式中,確定對象影響力的裝置包括:
獲取單元301,用于獲取目標(biāo)對象對應(yīng)的至少一個影響力特征的特征值;
第一確定單元302,用于對于每一影響力特征,根據(jù)所述特征值在該影響力特征對應(yīng)的分位數(shù)圖中所處位置,確定所述目標(biāo)對象在該影響力特征下的影響力分?jǐn)?shù);其中,所述分位數(shù)圖是根據(jù)預(yù)先選取的若干對象樣本確定的。
第二確定單元303,用于根據(jù)所述目標(biāo)對象在各影響力特征下的影響力分?jǐn)?shù),確定所述目標(biāo)對象的影響力值。
在本申請一實施例中,所述對象樣本可以是被預(yù)先標(biāo)記為高影響力對象的樣本。
請參考圖7,在另一種軟件實施方式中,在以上圖6所示的實施例的基礎(chǔ)上,確定對象影響力的裝置還可以包括:
排序單元304,用于針對每一影響力特征,將選取的各對象樣本在該影響力特征下的特征值進(jìn)行從小到大的排列,得到排序后的特征值序列;
均分單元305,用于將所述特征值序列均分成n份,得到n個分位;其中,n≥2;
分位數(shù)圖繪制單元306,用于確定所述特征值序列在每一分位上的特征值,得到所述分位數(shù)圖。
在本申請一實施例中,所述裝置還可以包括:
權(quán)重確定單元307,用于確定與每一影響力特征對應(yīng)的權(quán)重系數(shù);
相應(yīng)地,所述第二確定單元303可具體包括:
第一計算子單元3031,用于將所述目標(biāo)對象在每一影響力特征下的影響力分?jǐn)?shù)分別乘以該影響力特征對應(yīng)的權(quán)重系數(shù),得到所述目標(biāo)對象在每一影響力特征下的乘積值;
第二計算子單元3032,用于將所述目標(biāo)對象在每一影響力特征下的乘積值進(jìn)行求和,并對求和得到的和值進(jìn)行歸一化;
影響力值確定子單元3033,用于將歸一化得到的歸一化數(shù)值,確定為所述目標(biāo)對象的影響力值。
在本申請一優(yōu)先實施例中,所述權(quán)重確定單元307可以具體包括:
樣本獲取子單元3071,用于獲取包含若干對象樣本的第二集合;
pca分析子單元3072,用于利用所述第二集合中的各對象樣本進(jìn)行主成分分析pca,得到第一主成分;
權(quán)重系數(shù)確定子單元3073,用于根據(jù)所述第一主成分,確定與各影響力特征對應(yīng)的權(quán)重系數(shù)。
在本申請一實施例中,所述獲取單元301可具體用于:
獲取目標(biāo)對象對應(yīng)的至少一個優(yōu)化影響力特征的特征值;其中所述優(yōu)化影響力特征是根據(jù)所述目標(biāo)對象的原始影響力特征確定的。
需說明的是,本文所記載的方法實施例的內(nèi)容和裝置實施例的內(nèi)容,在不相沖突的情況下,可以互為補充。
本申請實施例提供的上述方法及裝置,利用半監(jiān)督學(xué)習(xí)技術(shù)和主成分分析技術(shù),其中,半監(jiān)督學(xué)習(xí)利用少量有標(biāo)注的樣本進(jìn)行監(jiān)督學(xué)習(xí),并通過大量無標(biāo)注樣本學(xué)習(xí)樣本空間結(jié)構(gòu),最終以較少的成本得到的精準(zhǔn)模型。主成分分析通過多個影響力特征(多維度)的線性組成,依次重構(gòu)對象樣本分布的主要變化維度。本方法中,只需要選取少量的“正樣本”(即影響力較大的用戶),并不需要對這些用戶進(jìn)行預(yù)打分,對正樣本的精度也沒有很高的要求,有較強的容錯性。本方法可以利用全量用戶樣本進(jìn)行主成分分析,不需要引入人工經(jīng)驗進(jìn)行權(quán)重的調(diào)整,在變化較快的業(yè)務(wù)環(huán)境下,仍然能快速更新打分規(guī)則。
本申請?zhí)峁┑纳鲜龇椒?,可以避免將某些用戶誤判為高影響力用戶。如:微博機器人會自動為某些用戶發(fā)送大量微博狀態(tài),但這些用戶的粉絲數(shù)和關(guān)注數(shù)等影響力特征的值通常不會很大;或者,一些營銷機構(gòu)可以提供虛假粉絲(“僵尸粉”),但是具備虛假粉絲的這些用戶在其他影響力特征上并不會得到很高的影響力分?jǐn)?shù),最終也不會得到較高的影響力值,等等。
上述實施例闡明的系統(tǒng)、裝置、模塊或單元,具體可以由計算機芯片或?qū)嶓w實現(xiàn),或者由具有某種功能的產(chǎn)品來實現(xiàn)。一種典型的實現(xiàn)設(shè)備為計算機,計算機的具體形式可以是個人計算機、膝上型計算機、蜂窩電話、相機電話、智能電話、個人數(shù)字助理、媒體播放器、導(dǎo)航設(shè)備、電子郵件收發(fā)設(shè)備、游戲控制臺、平板計算機、可穿戴設(shè)備或者這些設(shè)備中的任意幾種設(shè)備的組合。
為了描述的方便,描述以上裝置時以功能分為各種單元分別描述。當(dāng)然,在實施本申請時可以把各單元的功能在同一個或多個軟件和/或硬件中實現(xiàn)。
本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實施例可提供為方法、系統(tǒng)、或計算機程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(zhì)(包括但不限于磁盤存儲器、cd-rom、光學(xué)存儲器等)上實施的計算機程序產(chǎn)品的形式。
本發(fā)明是參照根據(jù)本發(fā)明實施例的方法、設(shè)備(系統(tǒng))、和計算機程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合。可提供這些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些計算機程序指令也可存儲在能引導(dǎo)計算機或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計算機或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理,從而在計算機或其他可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
在一個典型的配置中,計算設(shè)備包括一個或多個處理器(cpu)、輸入/輸出接口、網(wǎng)絡(luò)接口和內(nèi)存。
內(nèi)存可能包括計算機可讀介質(zhì)中的非永久性存儲器,隨機存取存儲器(ram)和/或非易失性內(nèi)存等形式,如只讀存儲器(rom)或閃存(flashram)。內(nèi)存是計算機可讀介質(zhì)的示例。
計算機可讀介質(zhì)包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術(shù)來實現(xiàn)信息存儲。信息可以是計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模塊或其他數(shù)據(jù)。計算機的存儲介質(zhì)的例子包括,但不限于相變內(nèi)存(pram)、靜態(tài)隨機存取存儲器(sram)、動態(tài)隨機存取存儲器(dram)、其他類型的隨機存取存儲器(ram)、只讀存儲器(rom)、電可擦除可編程只讀存儲器(eeprom)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤只讀存儲器(cd-rom)、數(shù)字多功能光盤(dvd)或其他光學(xué)存儲、磁盒式磁帶,磁帶磁磁盤存儲或其他磁性存儲設(shè)備或任何其他非傳輸介質(zhì),可用于存儲可以被計算設(shè)備訪問的信息。按照本文中的界定,計算機可讀介質(zhì)不包括暫存電腦可讀媒體(transitorymedia),如調(diào)制的數(shù)據(jù)信號和載波。
還需要說明的是,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、商品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、商品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的過程、方法、商品或者設(shè)備中還存在另外的相同要素。
本領(lǐng)域技術(shù)人員應(yīng)明白,本申請的實施例可提供為方法、系統(tǒng)或計算機程序產(chǎn)品。因此,本申請可采用完全硬件實施例、完全軟件實施例或結(jié)合軟件和硬件方面的實施例的形式。而且,本申請可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(zhì)(包括但不限于磁盤存儲器、cd-rom、光學(xué)存儲器等)上實施的計算機程序產(chǎn)品的形式。
本申請可以在由計算機執(zhí)行的計算機可執(zhí)行指令的一般上下文中描述,例如程序模塊。一般地,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對象、組件、數(shù)據(jù)結(jié)構(gòu)等等。也可以在分布式計算環(huán)境中實踐本申請,在這些分布式計算環(huán)境中,由通過通信網(wǎng)絡(luò)而被連接的遠(yuǎn)程處理設(shè)備來執(zhí)行任務(wù)。在分布式計算環(huán)境中,程序模塊可以位于包括存儲設(shè)備在內(nèi)的本地和遠(yuǎn)程計算機存儲介質(zhì)中。
本說明書中的各個實施例均采用遞進(jìn)的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對于系統(tǒng)實施例而言,由于其基本相似于方法實施例,所以描述的比較簡單,相關(guān)之處參見方法實施例的部分說明即可。
以上所述僅為本申請的實施例而已,并不用于限制本申請。對于本領(lǐng)域技術(shù)人員來說,本申請可以有各種更改和變化。凡在本申請的精神和原理之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本申請的權(quán)利要求范圍之內(nèi)。