一種好友推薦方法、裝置及服務(wù)器的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)應(yīng)用技術(shù)領(lǐng)域,尤其涉及一種好友推薦方法、裝置及服務(wù)器。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,社交網(wǎng)絡(luò)(SNS,Social Network Service)得到了極速的發(fā)展,而SNS中最重要的是關(guān)系鏈。
[0003]在SNS中,用戶間的關(guān)系,用戶產(chǎn)生的互聯(lián)網(wǎng)術(shù)語(yǔ)(UGC,User GeneratedContent),用戶轉(zhuǎn)發(fā)、評(píng)論、用戶感興趣的內(nèi)容、用戶之間的互動(dòng),等等,都是基于關(guān)系鏈作為基礎(chǔ)來(lái)傳播散發(fā)的,那如何拓展和維系關(guān)系鏈,顯得至關(guān)重要。
[0004]現(xiàn)有的SNS社區(qū),大部分針對(duì)擴(kuò)展關(guān)系鏈,推薦好友,主要是通過(guò)兩個(gè)人的共同關(guān)系來(lái)找到一些交集,即例如公共城市,共同學(xué)校,同一個(gè)公司,共同好友等因素來(lái)判斷是否擴(kuò)展關(guān)系鏈,是否需要推薦好友,但是如何評(píng)估這些因素的權(quán)重,現(xiàn)有技術(shù)中往往是通過(guò)經(jīng)驗(yàn)由人工來(lái)確定并配置各個(gè)維度因素的權(quán)重,因此該權(quán)重的配置是固定的,不利于向用戶準(zhǔn)確地?cái)U(kuò)展關(guān)系鏈,使得關(guān)系鏈的推薦不夠準(zhǔn)確。
【發(fā)明內(nèi)容】
[0005]本發(fā)明實(shí)施例所要解決的技術(shù)問(wèn)題在于,提供一種好友推薦方法、裝置及系統(tǒng),可基于原始數(shù)據(jù)和多決策樹(shù)預(yù)測(cè)模型來(lái)自動(dòng)進(jìn)行較為準(zhǔn)確的預(yù)測(cè)進(jìn)行關(guān)系鏈推薦。
[0006]為了解決上述技術(shù)問(wèn)題,本發(fā)明實(shí)施例提供了一種好友推薦方法,其特征在于,包括:
[0007]獲取目標(biāo)用戶的用戶關(guān)聯(lián)集中各個(gè)關(guān)聯(lián)用戶的原始數(shù)據(jù),所述原始數(shù)據(jù)包括每一個(gè)關(guān)聯(lián)用戶與目標(biāo)用戶之間的位置關(guān)系數(shù)據(jù)、關(guān)聯(lián)好友數(shù)據(jù)、時(shí)間關(guān)系數(shù)據(jù)中的任一種或多種;
[0008]從每一個(gè)關(guān)聯(lián)用戶的原始數(shù)據(jù)中篩選出特征數(shù)據(jù),構(gòu)成針對(duì)每一個(gè)關(guān)聯(lián)用戶的特征組合;
[0009]根據(jù)預(yù)置的多決策樹(shù)預(yù)測(cè)模型對(duì)所述特征組合進(jìn)行預(yù)測(cè)計(jì)算,得到針對(duì)每一個(gè)關(guān)聯(lián)用戶的關(guān)聯(lián)預(yù)測(cè)值;
[0010]根據(jù)得到的每一個(gè)關(guān)聯(lián)用戶的關(guān)聯(lián)預(yù)測(cè)值從所述用戶關(guān)聯(lián)集中確定出所述目標(biāo)用戶的好友用戶,并將確定的好友用戶推薦給所述目標(biāo)用戶
[0011]相應(yīng)地,本發(fā)明還提供了一種好友推薦裝置,包括:
[0012]獲取模塊,用于獲取目標(biāo)用戶的用戶關(guān)聯(lián)集中各個(gè)關(guān)聯(lián)用戶的原始數(shù)據(jù),所述原始數(shù)據(jù)包括每一個(gè)關(guān)聯(lián)用戶與目標(biāo)用戶之間的位置關(guān)系數(shù)據(jù)、關(guān)聯(lián)好友數(shù)據(jù)、時(shí)間關(guān)系數(shù)據(jù)中的任一種或多種;
[0013]組合模塊,從每一個(gè)關(guān)聯(lián)用戶的原始數(shù)據(jù)中篩選出特征數(shù)據(jù),構(gòu)成針對(duì)每一個(gè)關(guān)聯(lián)用戶的特征組合;
[0014]處理模塊,用于根據(jù)預(yù)置的多決策樹(shù)預(yù)測(cè)模型對(duì)所述特征組合進(jìn)行預(yù)測(cè)計(jì)算,得到針對(duì)每一個(gè)關(guān)聯(lián)用戶的關(guān)聯(lián)預(yù)測(cè)值;
[0015]推薦模塊,用于根據(jù)得到的每一個(gè)關(guān)聯(lián)用戶的關(guān)聯(lián)預(yù)測(cè)值從所述用戶關(guān)聯(lián)集中確定出所述目標(biāo)用戶的好友用戶,并將確定的好友用戶推薦給所述目標(biāo)用戶。
[0016]相應(yīng)地,本發(fā)明還提供了一種服務(wù)器,包括上述好友推薦裝置。
[0017]本發(fā)明實(shí)施例通過(guò)提取用戶表示關(guān)系因素的特征數(shù)據(jù),并根據(jù)多決策樹(shù)預(yù)測(cè)模型,能夠自動(dòng)地確定目標(biāo)用戶與推薦用戶之間的關(guān)聯(lián)程度,提高了終端用戶與推薦用戶進(jìn)行互動(dòng)的幾率,更利于用戶擴(kuò)展關(guān)系鏈,也滿足了好友推薦的自動(dòng)化智能化需求。
【附圖說(shuō)明】
[0018]為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0019]圖1是本發(fā)明提供的一種好友推薦方法的流程示意圖;
[0020]圖2是本發(fā)明實(shí)施例的預(yù)置多決策樹(shù)預(yù)測(cè)模型的方法的流程示意圖;
[0021]圖3是本發(fā)明實(shí)施例的另一種好友推薦方法的流程示意圖;
[0022]圖4是本發(fā)明實(shí)施例的一種好友推薦裝置的結(jié)構(gòu)示意圖;
[0023]圖5是本發(fā)明實(shí)施例的另一種好友推薦裝置的結(jié)構(gòu)示意圖;
[0024]圖6是圖5中的預(yù)置模塊的其中一種結(jié)構(gòu)示意圖;
[0025]圖7是圖5中的推薦模塊的其中一種結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0026]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0027]參見(jiàn)圖1,是本發(fā)明提供的一種好友推薦方法的流程示意圖,本發(fā)明實(shí)施例可應(yīng)用在各種即時(shí)通信應(yīng)用、社交網(wǎng)站應(yīng)用等類(lèi)型的應(yīng)用服務(wù)器中,在某個(gè)用戶接入到應(yīng)用或者發(fā)起好友查找時(shí),將該用戶作為目標(biāo)用戶觸發(fā)執(zhí)行所述的好友推薦方法,具體的,該方法包括:
[0028]SlOl:獲取目標(biāo)用戶的用戶關(guān)聯(lián)集中各個(gè)關(guān)聯(lián)用戶的原始數(shù)據(jù);
[0029]其中,所述原始數(shù)據(jù)包括每一個(gè)關(guān)聯(lián)用戶與目標(biāo)用戶之間的位置關(guān)系數(shù)據(jù)、關(guān)聯(lián)好友數(shù)據(jù)、時(shí)間關(guān)系數(shù)據(jù)中的任一種或多種。
[0030]具體可以基于所述目標(biāo)用戶當(dāng)前所處的位置、其已登記的所屬的公司、所屬的行業(yè)、學(xué)校、星座等等內(nèi)容來(lái)從登記服務(wù)器中確定出一個(gè)或者多個(gè)與該目標(biāo)用戶關(guān)聯(lián)的其他用戶構(gòu)成用戶關(guān)聯(lián)集,該用戶關(guān)聯(lián)集中具體可以包括一個(gè)或者多個(gè)關(guān)聯(lián)用戶,例如是否為同一個(gè)學(xué)?;蛘吣硞€(gè)時(shí)間范圍內(nèi)是同一個(gè)學(xué)校。同時(shí),將這些關(guān)聯(lián)用戶的當(dāng)前所處的位置、已登記的所屬的公司、所屬的行業(yè)、學(xué)校、星座、甚至出生地點(diǎn)、生日等信息作為原始數(shù)據(jù)。
[0031]S102:從每一個(gè)關(guān)聯(lián)用戶的原始數(shù)據(jù)中篩選出特征數(shù)據(jù),構(gòu)成針對(duì)每一個(gè)關(guān)聯(lián)用戶的特征組合;
[0032]對(duì)于提取的原始數(shù)據(jù),有些數(shù)據(jù)可能對(duì)本次推薦處理并無(wú)用處,例如對(duì)于初始數(shù)據(jù)中出生地點(diǎn)、生日等信息基本可以確定對(duì)本次推薦處理無(wú)用,因此,會(huì)剔除這些數(shù)據(jù),提取得到諸如所在位置、所屬公司、所屬行業(yè)、學(xué)校等數(shù)據(jù)作為特征數(shù)據(jù),進(jìn)而得到每一個(gè)關(guān)聯(lián)用戶的特征組合。
[0033]S103:根據(jù)預(yù)置的多決策樹(shù)預(yù)測(cè)模型對(duì)所述特征組合進(jìn)行預(yù)測(cè)計(jì)算,得到針對(duì)每一個(gè)關(guān)聯(lián)用戶的關(guān)聯(lián)預(yù)測(cè)值。
[0034]多決策樹(shù)預(yù)測(cè)模型可以為基于GBDT(Gradient Boosting Decis1n Tree,梯度提升決策樹(shù))的預(yù)測(cè)模型,通過(guò)預(yù)置了相應(yīng)權(quán)重的多個(gè)GBDT構(gòu)成的預(yù)測(cè)模型,可以得到每一個(gè)關(guān)聯(lián)用戶的特征組合在相應(yīng)的權(quán)重下的關(guān)聯(lián)預(yù)測(cè)值。
[0035]需要說(shuō)明的是,多決策樹(shù)預(yù)測(cè)模型不像決策樹(shù)模型那樣僅由一棵決策樹(shù)構(gòu)成,而是由多棵決策樹(shù)構(gòu)成,通常都是上百棵樹(shù),而且每棵樹(shù)規(guī)模都較小(即樹(shù)的深度會(huì)比較淺)。本發(fā)明實(shí)施例中的多決策樹(shù)預(yù)測(cè)模型在預(yù)測(cè)的時(shí)候,對(duì)于輸入的特征組合,例如城市、公司、學(xué)校的組合,會(huì)根據(jù)為每一個(gè)決策樹(shù)中各個(gè)節(jié)點(diǎn)預(yù)置好的權(quán)重值,在遍歷每一棵決策樹(shù)時(shí)進(jìn)行計(jì)算時(shí),每棵樹(shù)都會(huì)根據(jù)節(jié)點(diǎn)的權(quán)重值對(duì)組合進(jìn)行計(jì)算得到每一棵決策樹(shù)的預(yù)測(cè)值。初始的權(quán)重值可以由人工設(shè)置,具體可以根據(jù)特征組合中的特征數(shù)據(jù)與目標(biāo)用戶的數(shù)據(jù)是否相同來(lái)進(jìn)行設(shè)置,例如,對(duì)應(yīng)在兩者屬于同一城市的節(jié)點(diǎn)的權(quán)重值為2,對(duì)應(yīng)屬于不同城市的節(jié)點(diǎn)的權(quán)重值設(shè)置為0.5,不同決策樹(shù)中節(jié)點(diǎn)的權(quán)重值根據(jù)損失函數(shù)具有不同的值。
[0036]根據(jù)每一個(gè)節(jié)點(diǎn)的權(quán)重,可以得到每一個(gè)棵決策樹(shù)的預(yù)測(cè)值,然后將所有的預(yù)測(cè)值相加,即可得到該關(guān)聯(lián)用戶的該特征組合下最終的關(guān)聯(lián)預(yù)測(cè)值,公式可以采用如下形式:
[0037]F(x) = F0+β J1 (χ) + β2Τ2(χ)...+ βΜΤΜ(χ);
[0038]其中M為大于2的自然數(shù)A是設(shè)置的初值,Ti是第i棵決策樹(shù)。針對(duì)特征組合,對(duì)于不同的問(wèn)題(回歸問(wèn)題或者分類(lèi)問(wèn)題)以及各GBDT中選擇不同的損失函數(shù),相應(yīng)的權(quán)重值的設(shè)置是不相同的。
[0039]S104:根據(jù)得到的每一個(gè)關(guān)聯(lián)用戶的關(guān)聯(lián)預(yù)測(cè)值從所述用戶關(guān)聯(lián)集中確定出所述目標(biāo)用戶的好友用戶,并將確定的好友用戶推薦給所述目標(biāo)用戶。
[0040]另外,需要說(shuō)明的是,本發(fā)明實(shí)施例中的關(guān)系鏈推薦,包括但不限于用戶好友推薦、評(píng)論推薦、感興趣新聞推薦等信息推薦。
[0041]本發(fā)明實(shí)施例通過(guò)提取用戶表示關(guān)系因素的特征數(shù)據(jù),并根據(jù)多決策樹(shù)預(yù)測(cè)模型,能夠自動(dòng)地確定目標(biāo)用戶與推薦用戶之間的關(guān)聯(lián)程度,提高了終端用戶與推薦用戶進(jìn)行互動(dòng)的幾率,更利于用戶擴(kuò)展關(guān)系鏈,也滿足了好友推薦的自動(dòng)化智能化需求。
[0042]再請(qǐng)參見(jiàn)圖2,是本發(fā)明實(shí)施例的預(yù)置多決策樹(shù)預(yù)測(cè)模型的方法的流程示意圖,本發(fā)明實(shí)施例的所述方法可以完成多決策樹(shù)預(yù)測(cè)模型的預(yù)置,以便于完成上述圖1中的確定特征組合的關(guān)聯(lián)預(yù)測(cè)值,具體的,所述方法包括:
[0043]S201:確定出多個(gè)預(yù)測(cè)用戶的特征組合;該預(yù)測(cè)用戶為虛擬用戶,特征組合為相應(yīng)的虛擬用戶與可能的目標(biāo)用戶之間的特征數(shù)據(jù)的組合。
[0044]S202