本發(fā)明涉及社交網(wǎng)絡(luò)系統(tǒng),具體涉及一種社交網(wǎng)絡(luò)用戶推薦方法及系統(tǒng)。
背景技術(shù):
1、隨著社交網(wǎng)絡(luò)的普及,用戶面臨著越來越多的信息和聯(lián)系人選擇,但如何有效地發(fā)現(xiàn)和建立與自己興趣相關(guān)的社交關(guān)系成為一項挑戰(zhàn)。傳統(tǒng)的社交網(wǎng)絡(luò)平臺依賴于用戶自行添加好友或關(guān)注賬號,多根據(jù)用戶自行選擇的興趣進行推薦,缺乏對用戶行為分析的推薦機制,使得用戶體驗和社交互動的質(zhì)量有所限制。
2、通過用戶推薦可以涵蓋多種場景和情境,主要目的是在興趣愛好、學(xué)習(xí)資源或生活工作等領(lǐng)域,迅速向用戶推薦相關(guān)人員賬戶,以拓寬用戶的社交關(guān)系。因此,確保用戶推薦的可靠性是非常重要的。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供了一種社交網(wǎng)絡(luò)用戶推薦方法及系統(tǒng),所要解決的技術(shù)問題是:傳統(tǒng)的社交網(wǎng)絡(luò)平臺依賴于用戶自行添加好友或關(guān)注賬號,缺乏精確的推薦機制,使得用戶體驗和社交互動的質(zhì)量有所限制,尤其是數(shù)據(jù)信息變化劇烈的今天;本發(fā)明目的在于專門針對大數(shù)據(jù)及用戶多種興趣的場景,提供了社交網(wǎng)絡(luò)用戶推薦方法及系統(tǒng),在社交網(wǎng)絡(luò)用戶推薦中考慮了用戶潛在行為對推薦用戶的影響值,提出了一種基于用戶多行為和潛在興趣進行分析預(yù)測的社交網(wǎng)絡(luò)用戶推薦方法及系統(tǒng),旨在通過數(shù)據(jù)建模精確識別和推薦用戶可能感興趣的潛在社交關(guān)系,從而提升用戶體驗和社交網(wǎng)絡(luò)平臺的活躍度。
2、本發(fā)明的目的主要通過以下技術(shù)方案實現(xiàn):一種社交網(wǎng)絡(luò)用戶推薦方法,包括以下步驟:
3、步驟s1、收集系統(tǒng)注冊用戶的行為信息數(shù)據(jù),行為信息數(shù)據(jù)包括用戶數(shù)據(jù)、行為數(shù)據(jù)和興趣點數(shù)據(jù),行為數(shù)據(jù)包括社交互動數(shù)據(jù),將行為信息數(shù)據(jù)通過詞向量模型進行向量化后輸出四組向量組,四組向量組分別為:用戶向量組、行為向量組、用戶興趣向量組及社交互動向量組。
4、步驟s2、將行為信息數(shù)據(jù)采用深度神經(jīng)網(wǎng)絡(luò)模型進行分析和學(xué)習(xí)實現(xiàn)對用戶向量和用戶興趣向量的嵌入,進而完成用戶向量和用戶興趣向量的初始化嵌入,輸出用戶向量和用戶興趣向量的嵌入被初始化的第一行為;
5、將行為向量組中的行為向量通過深度神經(jīng)網(wǎng)絡(luò)模型的圖卷積網(wǎng)絡(luò)學(xué)習(xí)用戶向量和用戶興趣向量的嵌入,將行為向量中學(xué)到的嵌入作為后續(xù)行為向量的輸入特征,捕捉嵌入學(xué)習(xí)過程中的行為向量依賴關(guān)系,建立用戶向量的多種行為向量的級聯(lián)關(guān)系;
6、將多種行為向量的級聯(lián)關(guān)系通過解耦表征技術(shù)得到不同因素向量,并建模出不同因素向量對不同用戶偏好得分的影響值,將用戶向量和用戶興趣向量在所有行為向量中的嵌入作為用戶向量和用戶興趣向量的個性化特征,從當(dāng)前行為向量中提取用戶向量和興趣特征向量作為元單元,將元單元通過兩層前饋神經(jīng)網(wǎng)絡(luò)計算形成元網(wǎng)絡(luò),將元網(wǎng)絡(luò)生成轉(zhuǎn)換矩陣用來表示在不同用戶向量和用戶興趣向量在不同行為向量中的個性化特征轉(zhuǎn)換;
7、其中不同因素向量對不同用戶偏好得分的影響值是通過聚合嵌入方法計算出的用戶向量對用戶興趣向量的偏好分數(shù),對偏好分數(shù)進行排序得到用戶興趣標簽作為用戶向量畫像。
8、步驟s3、基于用戶向量畫像和社交互動向量,依次采用相似性矩陣和層次聚類方法進行兩階段的篩選潛在好友,匹配用戶向量之間可能的社交關(guān)系,根據(jù)設(shè)定閾值數(shù)量推薦相近興趣的潛在好友。
9、進一步優(yōu)化方案為,將行為信息數(shù)據(jù)通過詞向量模型進行向量化后輸出四組向量組,具體包括:
10、將用戶數(shù)據(jù)采用詞向量模型,訓(xùn)練出用戶向量記為u,u∈u=(u1,u2,…,um),m表示用戶向量的總數(shù)量,u表示用戶向量組,um表示第m位用戶的用戶向量。
11、將行為數(shù)據(jù)和興趣點數(shù)據(jù)采用詞向量模型,訓(xùn)練出行為向量記作gb,gb∈g=(g1,g2,…,gb),g代表行為向量組,b表示向量組中的第b個行為即當(dāng)前行為向量記作行為向量b,b表示行為向量的總數(shù)量,訓(xùn)練出用戶興趣向量記作i,i∈i=(i1,i2,...,in),i代表用戶興趣向量組,n表示用戶興趣向量種類。
12、根據(jù)社交互動向量組構(gòu)建用戶-社交的信任矩陣xuu'代表用戶向量u和用戶向量u’之間的互動,用戶和用戶間有互動記作1,無互動記作0。
13、其中詞向量模型是一種將文本映射為到高維向量空間的模型,使得文本中的短詞在這個向量空間中具有表示,將詞語的語義信息編碼為向量,語義相近的單詞在向量空間中距離也較近,其基本思想是通過學(xué)習(xí)一個詞的上下文來捕捉詞語之間的語義關(guān)系,從而使得這些向量能在數(shù)學(xué)上反映出詞匯之間的相似性和關(guān)系。
14、進一步優(yōu)化方案為,用戶向量和用戶興趣向量的嵌入被初始化的第一行為具體輸出步驟如下:
15、用戶向量u和用戶興趣向量i分別被初始化為和d表示嵌入的大小,表示域,表示大小為d的域。
16、令和分別用來表示用戶向量和用戶興趣向量的嵌入矩陣,m和n分別為用戶向量的總數(shù)和用戶興趣向量的總數(shù)。
17、每個用戶向量和用戶興趣向量都由一個向量唯一表示,通過使用idu和idi分別表示所有用戶向量和用戶興趣向量的向量嵌入,和分別是用戶向量um和用戶興趣向量in的向量。
18、用戶向量um和用戶興趣向量in的嵌入被初始化的第一行為向量:
19、進一步優(yōu)化方案為,用戶向量的多種行為向量的級聯(lián)關(guān)系具體構(gòu)建步驟如下:
20、對于行為向量b中用戶向量和用戶興趣向量的嵌入記作和在行為向量b的用戶向量-用戶興趣向量交互圖上執(zhí)行圖卷積操作,得到
21、
22、和分別表示用戶向量u和用戶興趣向量i在行為向量b下,通過第l層更新后的嵌入,是歸一化項,nu與用戶向量u交互的用戶興趣向量集合,ni與用戶興趣向量i交互的用戶向量集合。
23、第一次嵌入記作l=0,總共有l(wèi)層嵌入,經(jīng)過l層嵌入后,每一層的嵌入融合起來構(gòu)建用戶向量和用戶興趣向量的最終綜合嵌入,最終綜合嵌入也是多種行為向量的級聯(lián)關(guān)系,表示為在行為向量b下學(xué)習(xí)到的用戶向量u和用戶興趣向量i的表示為:
24、
25、用于控制聚合,表示在第l層嵌入的權(quán)重。
26、進一步優(yōu)化方案為,個性化特征構(gòu)建步驟如下:
27、從行為向量b得到的嵌入使用解耦表征技術(shù)識別建模出不同因素向量對不同用戶偏好得分的影響值,因為不同類型的行為向量反映了用戶偏好的不同方面,是將用戶向量和用戶興趣向量的綜合嵌入,解耦表征出各自獨立的因素向量在各種行為向量中,確保每個因素向量保持獨立,這種分離允許更準確地基于這些單獨因素向量對用戶偏好得分進行建模,更好的挖掘出用戶向量的潛在興趣。
28、使用解耦表征技術(shù),每個行為向量中學(xué)到的用戶向量和用戶興趣向量的嵌入均均勻分成k個獨立的塊,即因素向量表示為:
29、且
30、分別來表示用戶向量和用戶興趣向量嵌入的第k個塊,d表示嵌入的維度,k表示劃分的總塊數(shù)。
31、每個塊代表一個獨立的因素向量更有效地挖掘用戶向量在不同行為向量中對用戶興趣向量的多樣化偏好,將用戶向量和用戶興趣向量在所有行為向量中的嵌入劃分為k個塊,并作為個性化特征。
32、進一步優(yōu)化方案為,個性化特征轉(zhuǎn)換步驟如下:
33、用戶向量和用戶興趣向量的個性化特征映射為從當(dāng)前行為向量b過渡到下一個行為向量,從行為向量b中提取用戶向量和興趣特征向量的元單元。
34、逐個對k個塊進行嵌入,在第b塊中的元單元的定義如下:
35、
36、分別表示行為向量b中用戶向量和用戶興趣向量的第k個塊嵌入的元單元;表示行為向量b中學(xué)習(xí)到的用戶向量和用戶興趣向量的第k個塊嵌入。
37、分別對應(yīng)于從前一個行為向量中學(xué)習(xí)到的用戶向量和用戶興趣向量周圍一階潛在好友的聚合嵌入。
38、圖卷積將用戶向量和用戶興趣向量自身節(jié)點的第k個塊嵌入以及前一個行為向量一階潛在好友的第k個塊嵌入作為元單元;將從當(dāng)前行為向量中的交互學(xué)到的特征與直接繼承自前一個行為向量的特征結(jié)合在一起,捕捉用戶向量和用戶興趣向量的個性化特征。
39、利用在元網(wǎng)絡(luò)中收集的元單元生成用戶向量和用戶興趣向量個性化轉(zhuǎn)換矩陣;元網(wǎng)絡(luò)的定義如下:
40、
41、f(…)代表元網(wǎng)絡(luò),采用兩層的前饋神經(jīng)網(wǎng)絡(luò),是個性化轉(zhuǎn)換矩陣,并嵌入到行為向量b中相應(yīng)用戶向量和用戶興趣向量的第k個塊中。
42、進一步優(yōu)化方案為,用戶向量畫像具體構(gòu)建步驟如下:
43、行為向量b中的用戶興趣向量i,通過聚合嵌入的方法利用注意力機制計算出用戶向量u對用戶興趣向量i的用戶偏好得分:
44、
45、yui得到用戶向量u對用戶興趣向量i的用戶偏好得分,表示用戶向量u對第k個因素向量的偏好的聚合,考慮到在不同行為向量中的偏好程度,利用所有行為向量的信息計算用戶興趣向量第k個因素向量的偏好分數(shù)。
46、最終所有k個因素向量的計算出得分,按照分數(shù)進行排序做出用戶興趣標簽作為用戶向量畫像,并記作用戶向量-用戶興趣向量矩陣
47、進一步優(yōu)化方案為,兩階段篩選潛在好友中兩階段篩選潛在好友中第一階段篩選潛在好友具體包括:
48、第一階段篩選潛在好友利用用戶向量-用戶興趣向量矩陣,采用皮爾森相似度計算,計算用戶向量u和用戶向量v的融合屬性偏好的相似度,根據(jù)計算出的相似度進行排序,找到相似度最高的w個用戶向量作為潛在好友。
49、
50、可信度系數(shù)iu∩iv表示用戶向量u、v的共同興趣項集,|iu∩iv|表示兩個用戶向量的共同評分項個數(shù),|iu∪iv|表示用戶向量u、v的所有評分項個數(shù),is表示兩個用戶向量非共同評分項的共同屬性集,simf(u,v)表示用戶向量u和v的相似度,rui表示用戶向量u對用戶興趣向量i的偏好度,表示用戶向量u的評分均值,用戶向量v表示同理,rvi表示用戶向量v對用戶興趣向量i的偏好度,表示用戶向量v的評分均值。
51、進一步優(yōu)化方案為,兩階段篩選潛在好友中兩階段篩選潛在好友中第二階段篩選潛在好友具體包括:
52、用戶向量-用戶興趣向量矩陣采用層次聚類方法將第二階段篩選潛在好友w個潛在好友進行聚類,并指定聚類數(shù)量為y個,在聚類完成之后,每一類中的潛在好友有著相似的興趣愛好,從每一類中選一個與目標用戶向量相似性最高的潛在好友,最終得到y(tǒng)個相近興趣潛在好友。
53、本發(fā)明的社交網(wǎng)絡(luò)用戶推薦系統(tǒng),包括順序連接的數(shù)據(jù)收集與整合模塊、用戶向量畫像構(gòu)建模塊和潛在好友匹配推薦模塊;
54、數(shù)據(jù)收集與整合模塊,依次為收集數(shù)據(jù)單元和詞向量模型數(shù)據(jù)整合單元;
55、收集數(shù)據(jù)單元收集系統(tǒng)注冊用戶的行為信息數(shù)據(jù),行為信息數(shù)據(jù)包括用戶數(shù)據(jù)、行為數(shù)據(jù)和興趣點數(shù)據(jù),行為數(shù)據(jù)還包括社交互動數(shù)據(jù),詞向量模型數(shù)據(jù)整合單元通過詞向量模型將收集到的行為信息數(shù)據(jù)通過詞向量模型進行向量化后輸出四組向量組,四組向量組分別為:用戶向量組、行為向量組、用戶興趣向量組及社交互動向量組,并根據(jù)社交互動向量組做出用戶-社交的信任矩陣;
56、用戶向量畫像構(gòu)建模塊,依次為嵌套單元、解耦級聯(lián)單元和個性化特征轉(zhuǎn)換單元;
57、嵌套單元利用用戶向量、用戶興趣向量、行為向量和用戶-社交的信任矩陣,采用深度神經(jīng)網(wǎng)絡(luò)模型進行分析和學(xué)習(xí),對用戶向量和用戶興趣向量進行嵌入,輸出用戶向量和用戶興趣向量的嵌入初始化的第一行為向量;
58、解耦級聯(lián)單元對將用戶向量和用戶興趣向量的嵌入初始化的第一行為向量進行多次嵌套,建立用戶向量的多種行為向量的級聯(lián)關(guān)系,通過解耦表征技術(shù)建模不同因素向量對不同用戶偏好得分的影響值;
59、個性化特征轉(zhuǎn)換單元將用戶向量和用戶興趣向量的個性化特征映射為從當(dāng)前行為向量過渡到下一個行為向量,并從當(dāng)前行為向量中提取用戶向量和興趣特征向量作為元單元,元單元通過兩層前饋神經(jīng)網(wǎng)絡(luò)計算形成元網(wǎng)絡(luò),元網(wǎng)絡(luò)實現(xiàn)了在不同用戶向量和用戶興趣向量在不同行為向量中的特征轉(zhuǎn)換,采用聚合嵌入的方法利用注意力機制計算出用戶向量對用戶興趣向量的偏好分數(shù),對偏好分數(shù)進行排序得到用戶興趣標簽作為用戶向量畫像;
60、潛在好友匹配推薦模塊,包括兩階段的篩選潛在好友;第一階段篩選潛在好友基于用戶向量畫像的用戶興趣標簽和社交互動向量,采用相似性矩陣計算出類似興趣的用戶向量;第二階段篩選潛在好友,基于第一階段篩選潛在好友判斷出最相似的w個矩陣作為類似興趣的用戶向量,層次聚類方法進行兩階段的篩選潛在好友,匹配用戶向量之間可能的社交關(guān)系,推薦最相近興趣的y位潛在好友。
61、本方案工作原理:根據(jù)行為信息數(shù)據(jù)采用詞向量模型轉(zhuǎn)換為對應(yīng)的向量組,通過解耦表征技術(shù)和注意力機制進行深度學(xué)習(xí)分析用戶的行為、潛在行為與興趣的關(guān)系,利用圖卷積網(wǎng)絡(luò)進行用戶向量畫像,標記用戶興趣向量,通過皮爾森相似度計算和層次聚類方法兩階段篩選潛在好友推薦好友,并提出了一種基于用戶向量多行為向量進行分析預(yù)測的社交網(wǎng)絡(luò)用戶推薦方法及系統(tǒng)。
62、綜上所述,本發(fā)明與現(xiàn)有技術(shù)相比具有以下有益效果:本發(fā)明的社交網(wǎng)絡(luò)用戶推薦方法及系統(tǒng),利用先進的技術(shù)手段和算法,解決了傳統(tǒng)社交網(wǎng)絡(luò)推薦系統(tǒng)中存在的精準性和個性化問題,為用戶向量提供更優(yōu)質(zhì)的社交體驗,具有顯著的市場應(yīng)用潛力和經(jīng)濟價值。