本發(fā)明涉及信息推薦的技術(shù)領(lǐng)域,具體涉及一種基于協(xié)同過濾的社交網(wǎng)絡(luò)推薦裝置及方法。
背景技術(shù):
概述互聯(lián)網(wǎng)信息的迅速增長(zhǎng)產(chǎn)生了海量的數(shù)據(jù),用戶往往要耗費(fèi)大量的時(shí)間和精力,才能找到自己感興趣的信息。低效率的互聯(lián)網(wǎng)信息檢索技術(shù)已經(jīng)成為阻礙用戶有效利用信息的瓶頸,推薦技術(shù)就是在這樣的背景下產(chǎn)生的。推薦技術(shù)可以有效解決信息過載的問題,從海量數(shù)據(jù)中檢索到對(duì)用戶有所幫助的內(nèi)容。目前的推薦技術(shù)在同一時(shí)刻一般都是為單個(gè)用戶進(jìn)行推薦,但現(xiàn)實(shí)應(yīng)用中可能經(jīng)常需要為某一群體進(jìn)行推薦,比如一個(gè)旅游團(tuán)要旅游的目的地、一次聚會(huì)的用餐地點(diǎn)以及一個(gè)家庭的觀影計(jì)劃等。群體成員間的興趣愛好具有很大的差異性,所以傳統(tǒng)的推薦技術(shù)已經(jīng)難以適用于群體推薦的要求,研究基于社交網(wǎng)絡(luò)的群體推薦技術(shù)就具有重要的現(xiàn)實(shí)意義。
推薦裝置及社交網(wǎng)絡(luò)群體推薦裝置的研究涉及到個(gè)人推薦裝置、社交網(wǎng)絡(luò)以及群體決策等技術(shù)領(lǐng)域?,F(xiàn)存的推薦裝置多數(shù)為個(gè)人推薦裝置,即推薦行為旨在為單個(gè)用戶提供服務(wù),其最常用的推薦算法為協(xié)同過濾推薦算法和基于內(nèi)容的推薦算法;協(xié)同過濾算法借鑒與被推薦用戶具有相似興趣的用戶的行為進(jìn)行推薦,基于內(nèi)容的推薦算法分析被推薦用戶訪問的歷史內(nèi)容,并利用不同內(nèi)容的相似程度來進(jìn)行推薦。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的第一個(gè)目的是為了解決現(xiàn)有技術(shù)中的上述缺陷,提供一種基于協(xié)同過濾的社交網(wǎng)絡(luò)推薦裝置。
本發(fā)明的另一個(gè)目的是為了解決現(xiàn)有技術(shù)中的上述缺陷,提供一種基于協(xié)同過濾的社交網(wǎng)絡(luò)推薦方法。
本發(fā)明的第一個(gè)目的可以通過采取如下技術(shù)方案達(dá)到:
一種基于協(xié)同過濾的社交網(wǎng)絡(luò)推薦裝置,所述推薦裝置包括依次連接的啟動(dòng)模塊、過濾模塊、推薦模塊和排序模塊,
其中,所述啟動(dòng)模塊用于對(duì)推薦社交網(wǎng)絡(luò)用戶的行為數(shù)據(jù)和個(gè)人屬性進(jìn)行初始化定義,將用戶的行為分類并設(shè)置初始搜索引擎的條件,向推薦引擎發(fā)起推薦請(qǐng)求,并將初始化的數(shù)據(jù)集發(fā)送給推薦引擎;
所述過濾模塊通過社交網(wǎng)絡(luò)中設(shè)置的基礎(chǔ)搜索條件,由基礎(chǔ)搜索引擎過濾掉不符合要求的用戶,形成可推薦候選集A;
所述推薦模塊將可推薦候選集A根據(jù)用戶歷史行為和數(shù)據(jù)進(jìn)行篩選,得出基本的用戶感興趣集,并基于用戶的協(xié)同過濾思想,得到各個(gè)用戶的可推薦結(jié)果集B;
所述排序模塊根據(jù)可推薦結(jié)果集B,對(duì)社交網(wǎng)絡(luò)用戶的行為數(shù)據(jù)和個(gè)人屬性進(jìn)行劃分,將社交網(wǎng)絡(luò)用戶感興趣集進(jìn)行排序,得到初步推薦列表C。
進(jìn)一步地,用戶的初始個(gè)人屬性由用戶在注冊(cè)時(shí)填寫,推薦引擎可以根據(jù)用戶填寫的個(gè)人屬性值,為初始用戶進(jìn)行特征劃分。
進(jìn)一步地,當(dāng)過濾篩選后的可推薦候選集A中人數(shù)不足最低計(jì)算人數(shù)時(shí),所述啟動(dòng)模塊中推薦引擎將發(fā)送指令,由社交網(wǎng)絡(luò)擴(kuò)大篩選范圍或者增加篩選人數(shù)。
本發(fā)明的另一個(gè)目的可以通過采取如下技術(shù)方案達(dá)到:
一種基于協(xié)同過濾的社交網(wǎng)絡(luò)推薦方法,所述推薦方法包括下列步驟:
S1、啟動(dòng)模塊通過業(yè)務(wù)方對(duì)推薦社交網(wǎng)絡(luò)用戶的行為數(shù)據(jù)和個(gè)人屬性進(jìn)行初始化定義,將用戶的行為數(shù)據(jù)分類并設(shè)置初始搜索引擎的條件,完成初始化設(shè)定和推薦引擎接入后,向推薦引擎發(fā)起推薦請(qǐng)求,并將初始化的數(shù)據(jù)集發(fā)送給推薦引擎;
S2、過濾模塊通過推薦引擎根據(jù)業(yè)務(wù)方的初始搜索引擎的條件,將滿足搜索條件的數(shù)據(jù),匯總形成初步可推薦候選集,對(duì)初步可推薦候選集通過相似度判定得到相似用戶集,并基于用戶的協(xié)同過濾思想,進(jìn)行數(shù)據(jù)篩選得到可推薦候選集A;
S3、推薦模塊將可推薦候選集A根據(jù)推薦社交網(wǎng)絡(luò)用戶歷史行為和數(shù)據(jù)進(jìn)行篩選,得出基本的用戶感興趣集,并基于用戶的協(xié)同過濾思想,得到各個(gè)推薦社交網(wǎng)絡(luò)用戶的可推薦結(jié)果集B;
S4、排序模塊根據(jù)推薦社交網(wǎng)絡(luò)用戶的個(gè)人屬性,對(duì)個(gè)人屬性的特征值進(jìn)行劃分,根據(jù)用戶的感興趣集中各個(gè)特征值所占的比例,得到可推薦結(jié)果集B的用戶中每個(gè)屬性特征值所占的權(quán)重,并根據(jù)各個(gè)最顯著的特征集去得到用戶感知最敏感的屬性,根據(jù)感知最敏感的屬性的不同參考權(quán)重,將用戶的感興趣集進(jìn)行排序,得到初步推薦列表C。
進(jìn)一步地,所述步驟S2具體過程如下:
S201、社交網(wǎng)絡(luò)給用戶設(shè)定一個(gè)初始篩選條件,由用戶進(jìn)行選擇或直接根據(jù)用戶的歷史行為進(jìn)行設(shè)定。
S202、社交網(wǎng)絡(luò)將初始篩選條件和初始化數(shù)據(jù)集發(fā)送給推薦引擎,推薦引擎根據(jù)這些條件進(jìn)行篩選,形成可推薦候選集A。
進(jìn)一步地,所述步驟S3具體過程如下:
S301、將用戶的行為分為T1~TK共K類,并對(duì)這K類行為分別進(jìn)行權(quán)重賦值w1~wk,根據(jù)不同的用戶行為區(qū)分為正面、負(fù)面以及高、中、低六個(gè)維度,賦值向量w的取值為w=【-2,-1,0,1,2,3】;
S302、獲取用戶對(duì)社交網(wǎng)絡(luò)用戶的行為操作累加值得到用戶對(duì)社交網(wǎng)絡(luò)用戶的喜好度H=∑w;
S303、通過不同用戶對(duì)各個(gè)社交網(wǎng)絡(luò)用戶的喜好度H,利用歐幾里得距離
計(jì)算得到用戶之間的相似度:
當(dāng)兩個(gè)用戶之間的相似度sim(x,y)>k時(shí),其中k由業(yè)務(wù)方?jīng)Q定,即認(rèn)為兩者相似從而得到相似用戶集,并基于用戶的協(xié)同過濾思想,得到各個(gè)用戶的可推薦結(jié)果集B。
進(jìn)一步地,所述步驟S4具體過程如下:
S401、根據(jù)可推薦結(jié)果集B,對(duì)推薦社交網(wǎng)絡(luò)用戶的個(gè)人屬性和特征值進(jìn)行劃分,設(shè)推薦社交網(wǎng)絡(luò)用戶的個(gè)人屬性向量為:
屬性Si的特征值向量為:
S402、通過各個(gè)個(gè)人屬性的區(qū)分度向量和候選推薦集構(gòu)造屬性特征矩陣;
對(duì)用戶A而言,候選推薦集QT中某一社交網(wǎng)絡(luò)用戶的個(gè)人屬性Si的特征值vk在所占的比例為則在候選推薦集QT中,設(shè)該社交網(wǎng)絡(luò)用戶的個(gè)人屬性的特征值vk所占的權(quán)重:
另,當(dāng)(i,k取任意可取值)
則認(rèn)為個(gè)人屬性Sx的區(qū)分度最強(qiáng);各個(gè)屬性的區(qū)分度取:
所以,當(dāng)給出QA后,可得索性區(qū)分度向量:
得到QT后,可得社交網(wǎng)絡(luò)用戶的屬性特征矩陣:
S403、根據(jù)屬性特征矩陣和屬性區(qū)分度向量,可以得到候選推薦集QT的各社交網(wǎng)絡(luò)用戶的推薦分?jǐn)?shù)向量:
S404、根據(jù)得到的推薦分?jǐn)?shù)向量對(duì)可推薦結(jié)果集B的排序,確定初步推薦列表C。
進(jìn)一步地,所述推薦社交網(wǎng)絡(luò)用戶的個(gè)人屬性及特征值的定義的方式為【屬性-值】鍵值對(duì)。
進(jìn)一步地,當(dāng)用戶對(duì)社交網(wǎng)絡(luò)用戶的喜好度H>3時(shí),則認(rèn)為用戶對(duì)該物品感興趣。
本發(fā)明相對(duì)于現(xiàn)有技術(shù)具有如下的優(yōu)點(diǎn)及效果:
本發(fā)明公開了一種基于協(xié)同過濾的社交網(wǎng)絡(luò)推薦裝置及方法,相較于傳統(tǒng)的基于人口統(tǒng)計(jì)學(xué)和基于內(nèi)容的推薦裝置相比,該社交網(wǎng)絡(luò)推薦裝置強(qiáng)調(diào)了用戶之間的差異性,可針對(duì)用戶的歷史數(shù)據(jù)不斷學(xué)習(xí)并革新推薦引擎,具有更強(qiáng)的魯棒性。并且,利用協(xié)同過濾思想,更符合用戶在真實(shí)社交場(chǎng)景中的交友情景,推薦的結(jié)果也會(huì)趨向于精確化。
附圖說明
圖1是本發(fā)明公開的基于協(xié)同過濾的社交網(wǎng)絡(luò)推薦裝置的組成框圖;
圖2是本發(fā)明公開的基于協(xié)同過濾的社交網(wǎng)絡(luò)推薦方法的流程圖。
具體實(shí)施方式
為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
實(shí)施例
如附圖1所示,本實(shí)施例公開了一種基于協(xié)調(diào)過濾的社交網(wǎng)絡(luò)推薦裝置,該社交網(wǎng)絡(luò)推薦裝置借鑒協(xié)同過濾思想和基于內(nèi)容的推薦思想,設(shè)計(jì)一套社交網(wǎng)絡(luò)交友的推薦引擎。
該社交網(wǎng)絡(luò)推薦裝置具體包括依次連接的啟動(dòng)模塊、過濾模塊、推薦模塊和排序模塊,
其中,所述啟動(dòng)模塊用于對(duì)推薦社交網(wǎng)絡(luò)用戶的行為數(shù)據(jù)和個(gè)人屬性進(jìn)行初始化定義,將用戶的行為分類并設(shè)置初始搜索引擎的條件,向推薦引擎發(fā)起推薦請(qǐng)求,并將初始化的數(shù)據(jù)集發(fā)送給推薦引擎;
具體實(shí)施方式中,所述啟動(dòng)模塊的工作過程如下:
業(yè)務(wù)方對(duì)推薦社交網(wǎng)絡(luò)用戶的行為數(shù)據(jù)和個(gè)人屬性進(jìn)行初始化定義,將用戶的行為分類并設(shè)置初始搜索引擎的條件,完成初始化設(shè)定和推薦引擎接入后,向推薦引擎發(fā)起推薦請(qǐng)求,并將初始化的數(shù)據(jù)集發(fā)送給推薦引擎。
具體應(yīng)用中,用戶的初始個(gè)人屬性由用戶在注冊(cè)時(shí)填寫,推薦引擎可以根據(jù)用戶填寫的個(gè)人屬性值,為初始用戶進(jìn)行特征劃分。
其中,所述過濾模塊通過社交網(wǎng)絡(luò)中設(shè)置的基礎(chǔ)搜索條件,由基礎(chǔ)搜索引擎過濾掉不符合要求的用戶,形成可推薦候選集A,實(shí)現(xiàn)精簡(jiǎn)推薦裝置計(jì)算量的目的。
主要工作原理如下:
1)社交網(wǎng)絡(luò)給用戶設(shè)定一個(gè)初始篩選條件,由用戶進(jìn)行選擇或直接根據(jù)用戶的歷史行為進(jìn)行設(shè)定。
2)社交網(wǎng)絡(luò)將初始篩選條件和初始化數(shù)據(jù)集發(fā)送給推薦引擎,推薦引擎根據(jù)這些條件進(jìn)行篩選,形成可推薦候選集A。
3)當(dāng)篩選后的人數(shù)不足最低計(jì)算人數(shù)時(shí),推薦引擎將發(fā)送指令,由社交網(wǎng)絡(luò)擴(kuò)大篩選范圍或者增加篩選人數(shù)。
其中,所述推薦模塊將可推薦候選集A根據(jù)用戶歷史行為和數(shù)據(jù)進(jìn)行篩選,得出基本的用戶感興趣集,并基于用戶的協(xié)同過濾思想,得到各個(gè)用戶的可推薦結(jié)果集B。
該模塊為推薦裝置的核心模塊,主要目的是將篩選后的用戶根據(jù)用戶歷史行為和數(shù)據(jù)進(jìn)一步進(jìn)行篩選,得出基本的用戶感興趣集。
主要工作原理如下:
1)將用戶的行為進(jìn)行分類,并對(duì)分類后的行為分別進(jìn)行權(quán)重賦值。
2)推薦模塊獲取用戶對(duì)交友的行為操作累加值得到用戶對(duì)社交網(wǎng)絡(luò)用戶的喜好度大于一定值時(shí),則認(rèn)為用戶對(duì)該社交網(wǎng)絡(luò)用戶感興趣;
3)計(jì)算不同用戶對(duì)各個(gè)其他社交網(wǎng)絡(luò)用戶感的喜好度,并通過不同用戶的喜好度,利用歐幾里得距離計(jì)算得到用戶之間的相似度,當(dāng)兩個(gè)用戶之間的相似度大于一定值時(shí),既認(rèn)為兩者相似從而得到相似用戶集,并基于用戶的協(xié)同過濾思想,得到各個(gè)用戶的可推薦結(jié)果集B。
其中,所述排序模塊根據(jù)可推薦結(jié)果集B,對(duì)社交網(wǎng)絡(luò)用戶的行為數(shù)據(jù)和個(gè)人屬性進(jìn)行劃分,將社交網(wǎng)絡(luò)用戶感興趣集進(jìn)行排序,得到初步推薦列表C。
主要工作原理如下:
1)根據(jù)社交網(wǎng)絡(luò)用戶的個(gè)人屬性,對(duì)個(gè)人屬性的特征值進(jìn)行劃分,根據(jù)社交網(wǎng)絡(luò)用戶感興趣集中各個(gè)特征值所占的比例,得到可推薦候選集A中用戶的每個(gè)屬性特征值所占的權(quán)重,并根據(jù)各個(gè)最顯著的特征集去得到用戶感知最敏感的屬性,以此得出各個(gè)屬性的不同參考權(quán)重。
2)通過各個(gè)屬性的區(qū)分度向量和候選推薦集的屬性特征矩陣,得到候選推薦集的得分向量,根據(jù)得分向量對(duì)可推薦結(jié)果集B的排序,得到初步推薦列表C,即為最終的推薦結(jié)果。
實(shí)施例二
如附圖2所示,本實(shí)施例公開了一種基于協(xié)調(diào)過濾的社交網(wǎng)絡(luò)推薦方法,該社交網(wǎng)絡(luò)推薦方法借鑒協(xié)同過濾思想和基于內(nèi)容的推薦思想,設(shè)計(jì)一套社交網(wǎng)絡(luò)交友的推薦引擎。
該社交網(wǎng)絡(luò)推薦方法具體包括下列步驟:
S1、啟動(dòng)模塊通過業(yè)務(wù)方對(duì)推薦社交網(wǎng)絡(luò)用戶的行為數(shù)據(jù)和個(gè)人屬性進(jìn)行初始化定義,定義的方式為【屬性-值】鍵值對(duì),例如【身高-170CM】;將用戶的行為數(shù)據(jù)分類并設(shè)置初始搜索引擎的條件,完成初始化設(shè)定和推薦引擎接入后,向推薦引擎發(fā)起推薦請(qǐng)求,并將初始化的數(shù)據(jù)集發(fā)送給推薦引擎。
具體應(yīng)用中,用戶的初始屬性由用戶在注冊(cè)時(shí)填寫,推薦引擎可以根據(jù)用戶填寫的屬性值,為初始用戶進(jìn)行特征劃分。
S2、過濾模塊通過推薦引擎根據(jù)業(yè)務(wù)方的初始搜索引擎的條件,將滿足搜索條件的數(shù)據(jù),匯總形成初步可推薦候選集,對(duì)初步可推薦候選集通過相似度判定得到相似用戶集,并基于用戶的協(xié)同過濾思想,進(jìn)行數(shù)據(jù)篩選得到可推薦候選集A;如果可推薦候選集A的人數(shù)不滿足最低推薦人數(shù)要求,則向業(yè)務(wù)方請(qǐng)求擴(kuò)大搜索條件。
該步驟具體過程如下:
S201、社交網(wǎng)絡(luò)給用戶設(shè)定一個(gè)初始篩選條件,由用戶進(jìn)行選擇或直接根據(jù)用戶的歷史行為進(jìn)行設(shè)定。
S202、社交網(wǎng)絡(luò)將初始篩選條件和初始化數(shù)據(jù)集發(fā)送給推薦引擎,推薦引擎根據(jù)這些條件進(jìn)行篩選,形成可推薦候選集A。
S3、推薦模塊將可推薦候選集A根據(jù)推薦社交網(wǎng)絡(luò)用戶歷史行為和數(shù)據(jù)進(jìn)行篩選,得出基本的用戶感興趣集,并基于用戶的協(xié)同過濾思想,得到各個(gè)用戶的可推薦結(jié)果集B。
該步驟S3的具體過程如下:
S301、將用戶的行為分為T1~TK共K類,并對(duì)這K類行為分別進(jìn)行權(quán)重賦值w1~wk,根據(jù)不同的用戶行為區(qū)分為正面、負(fù)面以及高、中、低六個(gè)維度,賦值向量w的取值為w=【-2,-1,0,1,2,3】;
具體應(yīng)用中,根據(jù)用戶在線上的行為數(shù)據(jù),定義不同行為的特征。
S302、獲取用戶對(duì)社交網(wǎng)絡(luò)用戶的行為操作累加值得到用戶對(duì)社交網(wǎng)絡(luò)用戶的喜好度H=∑w,當(dāng)H>3時(shí),則認(rèn)為用戶對(duì)該社交網(wǎng)絡(luò)用戶感興趣;
S303、通過不同用戶對(duì)各個(gè)社交網(wǎng)絡(luò)用戶的喜好度H,利用歐幾里得距離
計(jì)算得到用戶之間的相似度:
當(dāng)兩個(gè)用戶之間的相似度sim(x,y)>k時(shí),其中k由業(yè)務(wù)方?jīng)Q定,即認(rèn)為兩者相似從而得到相似用戶集,并基于用戶的協(xié)同過濾思想,得到各個(gè)用戶的可推薦結(jié)果集B。
S4、排序模塊根據(jù)推薦社交網(wǎng)絡(luò)用戶的個(gè)人屬性,對(duì)個(gè)人屬性的特征值進(jìn)行劃分,根據(jù)用戶的感興趣集中各個(gè)特征值所占的比例,得到可推薦結(jié)果集B的用戶中每個(gè)屬性特征值所占的權(quán)重,并根據(jù)各個(gè)最顯著的特征集去得到用戶感知最敏感的屬性,根據(jù)感知最敏感的屬性的不同參考權(quán)重,將用戶的感興趣集進(jìn)行排序,得到初步推薦列表C。
該步驟具體過程如下:
S401、根據(jù)可推薦結(jié)果集B,對(duì)推薦社交網(wǎng)絡(luò)用戶的個(gè)人屬性和特征值進(jìn)行劃分,設(shè)推薦社交網(wǎng)絡(luò)用戶的個(gè)人屬性向量為:
屬性Si的特征值向量為:
S402、通過各個(gè)個(gè)人屬性的區(qū)分度向量和候選推薦集構(gòu)造屬性特征矩陣;
對(duì)用戶A而言,候選推薦集QT中某一社交網(wǎng)絡(luò)用戶的個(gè)人屬性Si的特征值vk在所占的比例為則在候選推薦集QT中,設(shè)該社交網(wǎng)絡(luò)用戶的個(gè)人屬性的特征值vk所占的權(quán)重:
另,當(dāng)(i,k取任意可取值)
則認(rèn)為個(gè)人屬性Sx的區(qū)分度最強(qiáng);各個(gè)屬性的區(qū)分度?。?/p>
所以,當(dāng)給出QA后,可得索性區(qū)分度向量:
得到QT后,可得社交網(wǎng)絡(luò)用戶的屬性特征矩陣:
S403、根據(jù)屬性特征矩陣和屬性區(qū)分度向量,可以得到候選推薦集QT的各社交網(wǎng)絡(luò)用戶的推薦分?jǐn)?shù)向量:
S404、根據(jù)得到的推薦分?jǐn)?shù)向量對(duì)可推薦結(jié)果集B的排序,確定初步推薦列表C。
上述實(shí)施例為本發(fā)明較佳的實(shí)施方式,但本發(fā)明的實(shí)施方式并不受上述實(shí)施例的限制,其他的任何未背離本發(fā)明的精神實(shí)質(zhì)與原理下所作的改變、修飾、替代、組合、簡(jiǎn)化,均應(yīng)為等效的置換方式,都包含在本發(fā)明的保護(hù)范圍之內(nèi)。