用戶推薦方法和裝置制造方法
【專利摘要】本發(fā)明提供了一種用戶推薦方法,所述方法包括:讀取用戶的興趣標(biāo)簽和所述興趣標(biāo)簽對(duì)應(yīng)的分值;讀取用戶的擅長(zhǎng)標(biāo)簽和所述擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值;根據(jù)所述興趣標(biāo)簽對(duì)應(yīng)的分值和所述擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值生成兩個(gè)用戶之間的匹配度;根據(jù)所述匹配度選取待推薦用戶進(jìn)行推薦。該用戶推薦方法能夠減少冗余信息的推送,節(jié)省網(wǎng)絡(luò)資源。此外,還提供了一種用戶推薦裝置。
【專利說(shuō)明】用戶推薦方法和裝置
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及網(wǎng)絡(luò)【技術(shù)領(lǐng)域】,特別是涉及一種用戶推薦方法和裝置。
【背景技術(shù)】
[0002] 傳統(tǒng)的用戶推薦方法通常采用基于好友關(guān)系的推薦方式,比如,若兩個(gè)用戶有共 同的好友或共同關(guān)注了某些人,則可將其中一個(gè)用戶推薦給另一個(gè)用戶。
[0003] 然而,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中至少存在以下技術(shù)問(wèn)題:
[0004] 基于好友關(guān)系的推薦方式雖然可以有效拓展用戶的社交關(guān)系,但是僅依賴用戶的 好友關(guān)系或者關(guān)注人的話,推薦給用戶的人往往不符合用戶所需,從而造成用戶推薦的盲 目性,這樣,必然會(huì)造成大量冗余信息的推送,從而浪費(fèi)了網(wǎng)絡(luò)資源。
【發(fā)明內(nèi)容】
[0005] 基于此,有必要針對(duì)上述技術(shù)問(wèn)題,提供一種能減少冗余信息推送,從而節(jié)省網(wǎng)絡(luò) 資源的用戶推薦方法和裝置。
[0006] -種用戶推薦方法,所述方法包括:
[0007] 讀取用戶的興趣標(biāo)簽和所述興趣標(biāo)簽對(duì)應(yīng)的分值;
[0008] 讀取用戶的擅長(zhǎng)標(biāo)簽和所述擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值;
[0009] 根據(jù)所述興趣標(biāo)簽對(duì)應(yīng)的分值和所述擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值生成兩個(gè)用戶之間的 匹配度;
[0010] 根據(jù)所述匹配度選取待推薦用戶進(jìn)行推薦。
[0011] 一種用戶推薦裝置,所述裝置包括:
[0012] 興趣標(biāo)簽讀取模塊,用于讀取用戶的興趣標(biāo)簽和所述興趣標(biāo)簽對(duì)應(yīng)的分值;
[0013] 擅長(zhǎng)標(biāo)簽讀取模塊,用于讀取用戶的擅長(zhǎng)標(biāo)簽和所述擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值;
[0014] 第一匹配度生成模塊,用于根據(jù)所述興趣標(biāo)簽對(duì)應(yīng)的分值和所述擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的 分值生成兩個(gè)用戶之間的匹配度;
[0015] 用戶推薦模塊,用于根據(jù)所述匹配度選取待推薦用戶進(jìn)行推薦。
[0016] 上述用戶推薦方法和裝置,由于興趣標(biāo)簽表示了用戶感興趣的領(lǐng)域或詞匯,而擅 長(zhǎng)標(biāo)簽表示了用戶擅長(zhǎng)的領(lǐng)域或詞匯,通過(guò)興趣標(biāo)簽對(duì)應(yīng)的分值和擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值來(lái) 生成兩個(gè)用戶之間的匹配度,從而將兩個(gè)用戶的興趣和擅長(zhǎng)進(jìn)行相互匹配,根據(jù)匹配度選 取待推薦用戶進(jìn)行推薦,推薦給用戶的人很可能是用戶對(duì)其感興趣的內(nèi)容比較擅長(zhǎng)的,或 者對(duì)其擅長(zhǎng)的內(nèi)容比較感興趣的,從而使得推薦給用戶的人更能滿足用戶所需,避免了用 戶推薦的盲目性,從而減少了冗余信息的推送,節(jié)省了網(wǎng)絡(luò)資源。
【專利附圖】
【附圖說(shuō)明】
[0017] 圖1為一個(gè)實(shí)施例中用戶推薦方法的流程示意圖;
[0018] 圖2為一個(gè)實(shí)施例中挖掘用戶的興趣標(biāo)簽的流程示意圖;
[0019] 圖3為另一個(gè)實(shí)施例中挖掘用戶的興趣標(biāo)簽的流程示意圖;
[0020] 圖4為一個(gè)實(shí)施例中根據(jù)專業(yè)相關(guān)數(shù)據(jù)挖掘用戶的擅長(zhǎng)標(biāo)簽的流程示意圖;
[0021] 圖5為另一個(gè)實(shí)施例中根據(jù)專業(yè)相關(guān)數(shù)據(jù)挖掘用戶的擅長(zhǎng)標(biāo)簽的流程示意圖;
[0022] 圖6為一個(gè)實(shí)施例中根據(jù)專業(yè)相關(guān)數(shù)據(jù)和個(gè)人信息挖掘用戶的擅長(zhǎng)標(biāo)簽的流程 示意圖;
[0023] 圖7為圖6所示實(shí)施例提供的挖掘用戶的擅長(zhǎng)類別的流程示意圖;
[0024] 圖8為一個(gè)實(shí)施例中生成兩個(gè)用戶之間的匹配度的流程示意圖;
[0025] 圖9為另一個(gè)實(shí)施例中生成兩個(gè)用戶之間的匹配度的流程示意圖;
[0026] 圖10為一個(gè)實(shí)施例中用戶推薦裝置的結(jié)構(gòu)框圖;
[0027] 圖11為另一個(gè)實(shí)施例中用戶推薦裝置的結(jié)構(gòu)框圖;
[0028] 圖12為一個(gè)實(shí)施例中興趣標(biāo)簽挖掘模塊的結(jié)構(gòu)框圖;
[0029] 圖13為另一個(gè)實(shí)施例中興趣標(biāo)簽挖掘模塊的結(jié)構(gòu)框圖;
[0030] 圖14為再一個(gè)實(shí)施例中用戶推薦裝置的結(jié)構(gòu)框圖;
[0031] 圖15為一個(gè)實(shí)施例中第一擅長(zhǎng)標(biāo)簽挖掘模塊的結(jié)構(gòu)框圖;
[0032] 圖16為另一個(gè)實(shí)施例中第一擅長(zhǎng)標(biāo)簽挖掘模塊的結(jié)構(gòu)框圖;
[0033] 圖17為又一個(gè)實(shí)施例中用戶推薦裝置的結(jié)構(gòu)框圖;
[0034] 圖18為一個(gè)實(shí)施例中第二擅長(zhǎng)標(biāo)簽挖掘模塊的結(jié)構(gòu)框圖;
[0035] 圖19為另一個(gè)實(shí)施例中第二擅長(zhǎng)標(biāo)簽挖掘模塊的結(jié)構(gòu)框圖;
[0036] 圖20為一個(gè)實(shí)施例中匹配度生成模塊的結(jié)構(gòu)框圖;
[0037] 圖21為另一個(gè)實(shí)施例中匹配度生成模塊的結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0038] 為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì) 本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并 不用于限定本發(fā)明。
[0039] 如圖1所示,在一個(gè)實(shí)施例中,提供了一種用戶推薦方法,該方法以應(yīng)用在各種服 務(wù)器中進(jìn)行舉例說(shuō)明,包括:
[0040] 步驟102,讀取用戶的興趣標(biāo)簽和興趣標(biāo)簽對(duì)應(yīng)的分值。
[0041] 服務(wù)器預(yù)先存儲(chǔ)了與用戶標(biāo)識(shí)對(duì)應(yīng)的興趣標(biāo)簽和興趣標(biāo)簽對(duì)應(yīng)的分值,其中興趣 標(biāo)簽包括標(biāo)簽詞和標(biāo)簽詞所屬類別,用以表征用戶感興趣的內(nèi)容。如興趣標(biāo)簽可以是"外科 疾病",表示用戶對(duì)外科疾病的內(nèi)容感興趣,興趣標(biāo)簽也可以是"軍事",表示用戶對(duì)軍事類 別的內(nèi)容感興趣,等。而興趣標(biāo)簽對(duì)應(yīng)的分值表示用戶對(duì)標(biāo)簽的相關(guān)內(nèi)容感興趣的程度。
[0042] 步驟104,讀取用戶的擅長(zhǎng)標(biāo)簽和擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值。
[0043] 服務(wù)器預(yù)先存儲(chǔ)了與用戶標(biāo)識(shí)對(duì)應(yīng)的擅長(zhǎng)標(biāo)簽和擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值,其中擅長(zhǎng) 標(biāo)簽包括標(biāo)簽詞和標(biāo)簽詞所屬類別,用以表征用戶擅長(zhǎng)的內(nèi)容。如擅長(zhǎng)標(biāo)簽可以是"法律", 表示用戶對(duì)法律類別的內(nèi)容比較擅長(zhǎng),等。而擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值則表示用戶對(duì)該標(biāo)簽的 相關(guān)內(nèi)容擅長(zhǎng)的程度。
[0044] 本實(shí)施例中,用戶的興趣標(biāo)簽可預(yù)先從用戶大量的線上行為數(shù)據(jù)挖掘出來(lái),而興 趣標(biāo)簽對(duì)應(yīng)的分值則可通過(guò)對(duì)用戶的線上行為數(shù)據(jù)中的文檔進(jìn)行處理得到。用戶的擅長(zhǎng)標(biāo) 簽可預(yù)先從用戶大量的專業(yè)相關(guān)數(shù)據(jù)中挖掘出來(lái),而擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值則可通過(guò)對(duì)用戶 的專業(yè)相關(guān)數(shù)據(jù)中的文檔進(jìn)行處理得到。得到每個(gè)用戶的興趣標(biāo)簽、興趣標(biāo)簽對(duì)應(yīng)的分值、 擅長(zhǎng)標(biāo)簽和擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值后,可存儲(chǔ)在服務(wù)器中,以便在推薦用戶的時(shí)候讀取出來(lái) 進(jìn)行處理。
[0045] 步驟106,根據(jù)興趣標(biāo)簽對(duì)應(yīng)的分值和擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值生成兩個(gè)用戶之間的 匹配度。
[0046] 具體的,兩個(gè)用戶之間的匹配度表示了其中一個(gè)用戶的興趣標(biāo)簽與另一個(gè)用戶的 擅長(zhǎng)標(biāo)簽匹配、以及該用戶的擅長(zhǎng)標(biāo)簽與另一個(gè)用戶的興趣標(biāo)簽匹配的程度。對(duì)于兩個(gè)用 戶,可將其中一個(gè)用戶的興趣標(biāo)簽匹配另一個(gè)用戶的擅長(zhǎng)標(biāo)簽,得到該用戶的興趣標(biāo)簽和 另一個(gè)用戶的擅長(zhǎng)標(biāo)簽的相似度,以及將該用戶的擅長(zhǎng)標(biāo)簽匹配另一個(gè)用戶的興趣標(biāo)簽, 得到該用戶的擅長(zhǎng)標(biāo)簽和另一個(gè)用戶的興趣標(biāo)簽的相似度,然后結(jié)合興趣標(biāo)簽對(duì)應(yīng)的分值 和擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值從而生成得到兩個(gè)用戶之間的匹配度。
[0047] 步驟108,根據(jù)匹配度選取待推薦用戶進(jìn)行推薦。
[0048] 本實(shí)施例中,對(duì)于服務(wù)器中的每個(gè)用戶,都可以生成該用戶與服務(wù)器中的其他用 戶之間的匹配度。這樣,在確定該用戶的推薦列表時(shí),可選取匹配度最高的預(yù)設(shè)數(shù)量的待推 薦用戶進(jìn)行推薦。例如,可選取與該用戶的匹配度最高的前100個(gè)待推薦用戶進(jìn)行推薦。 進(jìn)一步的,可獲取選取的待推薦用戶的個(gè)人信息,包括用戶所在SNS社區(qū)的昵稱、頭像等信 息,將這些信息通過(guò)網(wǎng)絡(luò)發(fā)送至用戶所在終端。
[0049] 本實(shí)施例中,通過(guò)興趣標(biāo)簽對(duì)應(yīng)的分值和擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值來(lái)生成兩個(gè)用戶之 間的匹配度,從而將兩個(gè)用戶的興趣和擅長(zhǎng)進(jìn)行相互匹配,根據(jù)匹配度選取待推薦用戶進(jìn) 行推薦,推薦給用戶的人很可能是用戶對(duì)其感興趣的內(nèi)容比較擅長(zhǎng)的,或者對(duì)其擅長(zhǎng)的內(nèi) 容比較感興趣的,從而使得推薦給用戶的人更能滿足用戶所需,避免了用戶推薦的盲目性, 從而減少了冗余信息的推送,節(jié)省了網(wǎng)絡(luò)資源。
[0050] 在一個(gè)實(shí)施例中,用戶推薦方法還包括:收集用戶的線上行為數(shù)據(jù),根據(jù)用戶的線 上行為數(shù)據(jù)挖掘用戶的興趣標(biāo)簽。
[0051] 用戶的線上行為數(shù)據(jù)為用戶使用各種網(wǎng)絡(luò)應(yīng)用所形成的數(shù)據(jù),包括但不限于用戶 在搜索網(wǎng)站中的搜索關(guān)鍵詞、用戶在微博上發(fā)布的微博、用戶在SNS社區(qū)中發(fā)表的日志、評(píng) 論等、用戶的群聊天記錄、用戶在問(wèn)答社區(qū)的提問(wèn)或回答和用戶在論壇上發(fā)表的帖子或回 復(fù),等等。對(duì)于每個(gè)用戶,可從不同的業(yè)務(wù)服務(wù)器中獲取到與該用戶標(biāo)識(shí)對(duì)應(yīng)的線上行為數(shù) 據(jù),進(jìn)而根據(jù)線上行為數(shù)據(jù)挖掘出該用戶的興趣標(biāo)簽,并對(duì)應(yīng)用戶標(biāo)識(shí)進(jìn)行存儲(chǔ)。
[0052] 進(jìn)一步的,在一個(gè)實(shí)施例中,如圖2所示,根據(jù)線上行為數(shù)據(jù)挖掘用戶的興趣標(biāo) 簽,包括:
[0053] 步驟202,對(duì)線上行為數(shù)據(jù)中的文檔進(jìn)行分詞。
[0054] 本實(shí)施例中,可提取出用戶的線上行為數(shù)據(jù)中的文檔,然后采用傳統(tǒng)的分詞方法 對(duì)文檔中的內(nèi)容進(jìn)行分割,并去除掉一些常見(jiàn)的副詞、動(dòng)詞和名詞,如"你"、"我"、"的"、"得" 等,得到多個(gè)標(biāo)簽詞。
[0055] 步驟204,計(jì)算分詞后得到的標(biāo)簽詞對(duì)應(yīng)的分值為標(biāo)簽詞的詞頻與用戶的所有標(biāo) 簽詞的詞頻總和的比率。
[0056] 步驟204中,統(tǒng)計(jì)分詞后得到的標(biāo)簽詞的詞頻,即該標(biāo)簽詞出現(xiàn)的頻率,按照如下 公式計(jì)算每個(gè)標(biāo)簽詞對(duì)應(yīng)的分值: T 、 P Hx)
[0057] Ins(X)=--- pv(all)
[0058] 其中,Ins(x)表示標(biāo)簽詞x對(duì)應(yīng)的分值,pv(x)表示標(biāo)簽詞x的詞頻,pv(all)表 示該用戶的所有標(biāo)簽詞的詞頻總和。
[0059] 步驟206,根據(jù)標(biāo)簽詞對(duì)應(yīng)的分值選取標(biāo)簽詞作為用戶的興趣標(biāo)簽。
[0060] 具體的,可根據(jù)標(biāo)簽詞對(duì)應(yīng)的分值選取分值最大的預(yù)設(shè)數(shù)量的標(biāo)簽詞作為用戶的 興趣標(biāo)簽。比如,選取分值最大的10個(gè)標(biāo)簽詞作為用戶的興趣標(biāo)簽。
[0061] 在另一個(gè)實(shí)施例中,如圖3所示,根據(jù)線上行為數(shù)據(jù)挖掘用戶的興趣標(biāo)簽,包括:
[0062] 步驟302,對(duì)線上行為數(shù)據(jù)中的文檔進(jìn)行分詞。
[0063] 步驟304,對(duì)分詞后得到的標(biāo)簽詞進(jìn)行歸類。
[0064] 具體的,可人工對(duì)分詞后得到的標(biāo)簽詞進(jìn)行歸類,也可按照傳統(tǒng)的機(jī)器學(xué)習(xí)的方 法對(duì)標(biāo)簽詞進(jìn)行歸類。比如,標(biāo)簽詞所屬類別包括:科技、教育、軍事、醫(yī)學(xué)等。
[0065] 步驟306,計(jì)算分詞后得到的標(biāo)簽詞對(duì)應(yīng)的分值為標(biāo)簽詞的詞頻與用戶的所有標(biāo) 簽詞的詞頻總和的比率。
[0066] 步驟308,根據(jù)標(biāo)簽詞對(duì)應(yīng)的分值計(jì)算標(biāo)簽詞所屬類別對(duì)應(yīng)的分值。
[0067] 本實(shí)施例中,可獲取用戶在每個(gè)類別下的標(biāo)簽詞和標(biāo)簽詞的分值,則用戶在每個(gè) 類別對(duì)應(yīng)的分值為該類別下的標(biāo)簽詞的分值的總和。例如,標(biāo)簽詞所屬類別包括A、B和C 三個(gè)類別,在A類別下的標(biāo)簽詞和對(duì)應(yīng)的分值包括{tagAl: 3分}、{ tagA2:2分}和{tagA3:3 分},在B類別下的標(biāo)簽詞和對(duì)應(yīng)的分值包括:{tagBl: 2分}和{tagB2:1分},在C類別下的 標(biāo)簽詞和對(duì)應(yīng)的分值包括{tagCl: 3分},則該用戶的A類別對(duì)應(yīng)的分值為6分,B類別對(duì)應(yīng) 的分值為4分,C類別對(duì)應(yīng)的分值為3分。
[0068] 步驟310,根據(jù)標(biāo)簽詞所屬類別對(duì)應(yīng)的分值選取類別作為用戶的興趣類別。
[0069] 具體的,可選取標(biāo)簽詞所屬類別對(duì)應(yīng)的分值最大的預(yù)設(shè)數(shù)量的類別作為用戶的興 趣類別,比如,選取分值最大的2個(gè)類別作為用戶的興趣類別。本實(shí)施例中,還可根據(jù)標(biāo)簽 詞對(duì)應(yīng)的分值選取標(biāo)簽詞作為用戶的興趣標(biāo)簽,比如選取分值最大的8個(gè)標(biāo)簽詞作為用戶 的興趣標(biāo)簽。本實(shí)施例中,每個(gè)用戶的興趣標(biāo)簽包括用戶感興趣的類別和標(biāo)簽詞,使得后續(xù) 在生成匹配度時(shí),除了可根據(jù)標(biāo)簽詞對(duì)應(yīng)的分值進(jìn)行計(jì)算外,還可根據(jù)類別對(duì)應(yīng)的分值進(jìn) 行計(jì)算。
[0070] 在一個(gè)實(shí)施例中,用戶推薦方法還包括:收集用戶的專業(yè)相關(guān)數(shù)據(jù),根據(jù)專業(yè)相關(guān) 數(shù)據(jù)挖掘用戶的擅長(zhǎng)標(biāo)簽。
[0071] 用戶的專業(yè)相關(guān)數(shù)據(jù),是指用戶使用各種網(wǎng)絡(luò)應(yīng)用產(chǎn)生的與專業(yè)相關(guān)的數(shù)據(jù),包 括問(wèn)答社區(qū)數(shù)據(jù)、專業(yè)論壇數(shù)據(jù)中的至少一種,其中問(wèn)答社區(qū)數(shù)據(jù)是指用戶在問(wèn)答社區(qū)的 提問(wèn)和問(wèn)答等,專業(yè)論壇數(shù)據(jù)是指用戶在一些專業(yè)論壇發(fā)表的帖子和回帖等。進(jìn)一步的,可 從與專業(yè)相關(guān)的業(yè)務(wù)服務(wù)器中獲取到與用戶標(biāo)識(shí)對(duì)應(yīng)的專業(yè)相關(guān)數(shù)據(jù),進(jìn)而根據(jù)專業(yè)相關(guān) 數(shù)據(jù)挖掘出每個(gè)用戶的擅長(zhǎng)標(biāo)簽,并對(duì)應(yīng)用戶標(biāo)識(shí)進(jìn)行存儲(chǔ)。
[0072] 進(jìn)一步的,在一個(gè)實(shí)施例中,根據(jù)專業(yè)相關(guān)數(shù)據(jù)挖掘用戶擅長(zhǎng)標(biāo)簽,包括:
[0073] 步驟402,對(duì)專業(yè)相關(guān)數(shù)據(jù)中的文檔進(jìn)行分詞。
[0074] 如上所述,可提取出用戶的專業(yè)相關(guān)數(shù)據(jù)中的文檔,然后采用傳統(tǒng)的分詞方法對(duì) 文檔中的內(nèi)容進(jìn)行分割,并去除掉一些常見(jiàn)的副詞、動(dòng)詞和名詞,如"你"、"我"、"的"、"得" 等,得到多個(gè)標(biāo)簽詞。
[0075] 步驟404,計(jì)算分詞后得到的標(biāo)簽詞對(duì)應(yīng)的分值為標(biāo)簽詞的詞頻與用戶的所有標(biāo) 簽詞的詞頻總和的比率。
[0076] 步驟404中,統(tǒng)計(jì)分詞后得到的標(biāo)簽詞的詞頻,即該標(biāo)簽詞出現(xiàn)的頻率,按照如下 公式計(jì)算每個(gè)標(biāo)簽詞對(duì)應(yīng)的分值: ev(x)
[0077] Lxpert(X)=--- ev{ali)
[0078] 其中,Expert(x)表示標(biāo)簽詞x對(duì)應(yīng)的分值,ev (x)表示標(biāo)簽詞x的詞頻,ev (all) 表示該用戶的所有標(biāo)簽詞的詞頻總和。
[0079] 步驟406,根據(jù)標(biāo)簽詞對(duì)應(yīng)的分值選取標(biāo)簽詞作為用戶的擅長(zhǎng)標(biāo)簽。
[0080] 具體的,可根據(jù)標(biāo)簽詞對(duì)應(yīng)的分值選取分值最大的預(yù)設(shè)數(shù)量的標(biāo)簽詞作為用戶的 擅長(zhǎng)標(biāo)簽。比如,選取分值最大的10個(gè)標(biāo)簽詞作為用戶的擅長(zhǎng)標(biāo)簽。
[0081] 在另一個(gè)實(shí)施例中,如圖5所示,根據(jù)專業(yè)相關(guān)數(shù)據(jù)挖掘用戶的擅長(zhǎng)標(biāo)簽,包括:
[0082] 步驟502,對(duì)專業(yè)相關(guān)數(shù)據(jù)中的文檔進(jìn)行分詞。
[0083] 步驟504,對(duì)分詞后得到的標(biāo)簽詞進(jìn)行歸類。
[0084] 具體的,可人工對(duì)分詞后得到的標(biāo)簽詞進(jìn)行歸類,也可按照傳統(tǒng)的機(jī)器學(xué)習(xí)的方 法對(duì)標(biāo)簽詞進(jìn)行歸類。比如,標(biāo)簽詞所屬類別包括:科技、教育、軍事、醫(yī)學(xué)等。
[0085] 步驟506,計(jì)算分詞后得到的標(biāo)簽詞對(duì)應(yīng)的分值為標(biāo)簽詞的詞頻與用戶的所有標(biāo) 簽詞的詞頻總和的比率。
[0086] 步驟508,根據(jù)標(biāo)簽詞對(duì)應(yīng)的分值計(jì)算標(biāo)簽詞所屬類別對(duì)應(yīng)的分值。
[0087] 本實(shí)施例中,可獲取用戶在每個(gè)類別下的標(biāo)簽詞和標(biāo)簽詞的分值,則用戶在每個(gè) 類別對(duì)應(yīng)的分值為該類別下的標(biāo)簽詞的分值的總和。
[0088] 步驟510,根據(jù)標(biāo)簽詞所屬類別對(duì)應(yīng)的分值選取類別作為用戶的擅長(zhǎng)標(biāo)簽。
[0089] 具體的,可選取標(biāo)簽詞所屬類別對(duì)應(yīng)的分值最大的預(yù)設(shè)數(shù)量的類別作為用戶的擅 長(zhǎng)類別,比如,選取分值最大的2個(gè)類別作為用戶的擅長(zhǎng)類別。本實(shí)施例中,還可根據(jù)標(biāo)簽 詞對(duì)應(yīng)的分值選取標(biāo)簽詞作為用戶的擅長(zhǎng)標(biāo)簽,比如選取分值最大的8個(gè)標(biāo)簽詞作為用戶 的擅長(zhǎng)標(biāo)簽。本實(shí)施例中,每個(gè)用戶的擅長(zhǎng)標(biāo)簽包括用戶擅長(zhǎng)的類別和標(biāo)簽詞,使得后續(xù)在 生成匹配度時(shí),除了可根據(jù)標(biāo)簽詞對(duì)應(yīng)的分值進(jìn)行計(jì)算外,還可根據(jù)類別對(duì)應(yīng)的分值進(jìn)行 計(jì)算。
[0090] 在另一個(gè)實(shí)施例中,還提供了另一種挖掘用戶的擅長(zhǎng)標(biāo)簽的方式,具體的,用戶推 薦方法還包括:收集用戶的專業(yè)相關(guān)數(shù)據(jù)和個(gè)人信息,根據(jù)專業(yè)相關(guān)數(shù)據(jù)和個(gè)人信息挖掘 用戶的擅長(zhǎng)標(biāo)簽。
[0091] 如上所述,專業(yè)相關(guān)數(shù)據(jù)包括問(wèn)答社區(qū)數(shù)據(jù)、專業(yè)論壇數(shù)據(jù)中的至少一種。用戶的 個(gè)人信息包括但不限于用戶的教育、工作、年齡和職業(yè)等信息。具體的,可從不同的業(yè)務(wù)服 務(wù)器中獲取到與用戶標(biāo)識(shí)對(duì)應(yīng)的個(gè)人信息,這些個(gè)人信息可以是用戶登錄網(wǎng)絡(luò)應(yīng)用所填寫(xiě) 的個(gè)人信息,也可以是用戶所在群組中的個(gè)人信息等。
[0092] 進(jìn)一步的,在一個(gè)實(shí)施例中,如圖6所示,根據(jù)專業(yè)相關(guān)數(shù)據(jù)和個(gè)人信息挖掘用戶 的擅長(zhǎng)標(biāo)簽,包括:
[0093] 步驟602,對(duì)專業(yè)相關(guān)數(shù)據(jù)中的文檔進(jìn)行分詞。
[0094] 步驟604,計(jì)算分詞后得到的標(biāo)簽詞對(duì)應(yīng)的詞頻概率為標(biāo)簽詞的詞頻與用戶的所 有標(biāo)簽詞的詞頻總和的比率。
[0095] 關(guān)于分詞和計(jì)算標(biāo)簽詞的詞頻概率的過(guò)程如上所述,在此則不再贅述。
[0096] 步驟606,根據(jù)個(gè)人信息獲取對(duì)應(yīng)的標(biāo)簽詞,以及根據(jù)個(gè)人信息計(jì)算獲取到的標(biāo)簽 詞對(duì)應(yīng)的置信度。
[0097] 具體的,預(yù)先可設(shè)置與一些專業(yè)相關(guān)的詞匯對(duì)應(yīng)的標(biāo)簽詞,則可根據(jù)用戶的個(gè)人 信息中與專業(yè)相關(guān)的詞匯獲取到對(duì)應(yīng)的標(biāo)簽詞。例如,用戶的職業(yè)為"律師",則獲取到與 "律師"對(duì)應(yīng)的標(biāo)簽詞為"法律",又例如,用戶所在群組為"XX律師事務(wù)所",則獲取到對(duì)應(yīng)到 標(biāo)簽詞為"法律"。進(jìn)一步的,預(yù)先可設(shè)置置信度函數(shù),其取值為0?1,可根據(jù)個(gè)人信息中與 專業(yè)相關(guān)的詞匯的來(lái)源來(lái)確定對(duì)應(yīng)的標(biāo)簽詞所對(duì)應(yīng)的置信度函數(shù)的取值。如,若用戶的職 業(yè)為用戶填寫(xiě)的,則該職業(yè)所對(duì)應(yīng)的標(biāo)簽詞的置信度為1,若用戶所在群組中一共有10個(gè) 成員,其中8個(gè)成員的職業(yè)都為"律師",則該用戶的標(biāo)簽詞"法律"的置信度的取值為0. 8。
[0098] 步驟608,根據(jù)標(biāo)簽詞對(duì)應(yīng)的詞頻概率和置信度進(jìn)行擬合,得到標(biāo)簽詞對(duì)應(yīng)的分 值。
[0099] 具體的,可按照如下公式計(jì)算標(biāo)簽詞對(duì)應(yīng)的分值:
[0100] Fin_expert(x) = y ^Expert(x) + A ^Profession(x)
[0101] 其中,F(xiàn)in_expert (x)表示標(biāo)簽詞x對(duì)應(yīng)的分值,Expert (x)表示標(biāo)簽詞x的詞頻 概率,Profession(X)表示標(biāo)簽詞X的置信度,Y和入為常數(shù),且Y+入=1。優(yōu)選的,Y可 取值為0.7,入可取值為0.3。
[0102] 步驟610,根據(jù)標(biāo)簽詞對(duì)應(yīng)的分值選取標(biāo)簽詞作為用戶的擅長(zhǎng)標(biāo)簽。
[0103] 計(jì)算出每個(gè)標(biāo)簽次對(duì)應(yīng)的分值后,可選取分值最大的預(yù)設(shè)數(shù)量的標(biāo)簽詞作為用戶 的擅長(zhǎng)標(biāo)簽。本實(shí)施例中,根據(jù)用戶的專業(yè)相關(guān)數(shù)據(jù)和個(gè)人信息來(lái)挖掘用戶的擅長(zhǎng)標(biāo)簽,所 挖掘出的擅長(zhǎng)標(biāo)簽更能體現(xiàn)用戶所擅長(zhǎng)的內(nèi)容,因此更具有準(zhǔn)確性。
[0104] 進(jìn)一步的,在一個(gè)實(shí)施例中,在圖6所示實(shí)施例的基礎(chǔ)上,根據(jù)專業(yè)相關(guān)數(shù)據(jù)和個(gè) 人信息挖掘用戶的擅長(zhǎng)標(biāo)簽,還包括:
[0105] 步驟702,根據(jù)分詞后得到的標(biāo)簽進(jìn)行歸類。
[0106] 步驟704,根據(jù)標(biāo)簽詞對(duì)應(yīng)的分值計(jì)算標(biāo)簽詞所屬類別對(duì)應(yīng)的分值。
[0107] 步驟706,根據(jù)標(biāo)簽詞所屬類別對(duì)應(yīng)的分值選取類別作為用戶的擅長(zhǎng)類別。
[0108] 本實(shí)施例中,根據(jù)用戶的專業(yè)相關(guān)數(shù)據(jù)和個(gè)人信息挖掘出的擅長(zhǎng)標(biāo)簽除了包含擅 長(zhǎng)的標(biāo)簽詞外還包含擅長(zhǎng)類別,后續(xù)則可根據(jù)擅長(zhǎng)的標(biāo)簽詞對(duì)應(yīng)的分值和擅長(zhǎng)類別來(lái)計(jì)算 兩個(gè)用戶之間的匹配度,使得推薦給用戶的人更符合用戶所需,進(jìn)一步減少了冗余信息的 推送,節(jié)省了網(wǎng)絡(luò)資源。
[0109] 在一個(gè)實(shí)施例中,如圖8所示,根據(jù)興趣標(biāo)簽對(duì)應(yīng)的分值和擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值 生成兩個(gè)用戶之間的匹配度,包括:
[0110] 步驟802,將第一用戶的興趣標(biāo)簽匹配第二用戶的擅長(zhǎng)標(biāo)簽,獲取第一用戶的興趣 標(biāo)簽與第二用戶的擅長(zhǎng)標(biāo)簽的第一相似度。
[0111] 具體的,當(dāng)用第一用戶的興趣標(biāo)簽去匹配第二用戶的擅長(zhǎng)標(biāo)簽時(shí),可采用機(jī)器學(xué) 習(xí)的方式來(lái)得到第一用戶的興趣標(biāo)簽與第二用戶的擅長(zhǎng)標(biāo)簽之間的第一相似度,例如,可 在海量用戶的線上行為數(shù)據(jù)中統(tǒng)計(jì)興趣標(biāo)簽和擅長(zhǎng)標(biāo)簽共同出現(xiàn)的次數(shù)來(lái)計(jì)算得到第一 用戶的興趣標(biāo)簽與第二用戶的擅長(zhǎng)標(biāo)簽之間的第一相似度。在一個(gè)實(shí)施例中,也可判斷第 一用戶的興趣標(biāo)簽和第二用戶的擅長(zhǎng)標(biāo)簽是否相同,若相同,則第一相似度取值為1,若不 相同,貝 1J第一相似度取值為〇。
[0112] 步驟804,將第一用戶的擅長(zhǎng)標(biāo)簽匹配第二用戶的興趣標(biāo)簽,獲取第一用戶的擅長(zhǎng) 標(biāo)簽與第二用戶的興趣標(biāo)簽的第二相似度。
[0113] 具體的,當(dāng)用第一用戶的擅長(zhǎng)標(biāo)簽去匹配第二用戶的興趣標(biāo)簽時(shí),也可采用機(jī)器 學(xué)習(xí)的方式來(lái)得到第二相似度。在一個(gè)實(shí)施例中,也可判斷第一用戶的擅長(zhǎng)標(biāo)簽和第二用 戶的興趣標(biāo)簽是否相同,若相同,則第二相似度取值為1,若不相同,則第二相似度取值為 0〇
[0114] 步驟806,根據(jù)第一用戶的興趣標(biāo)簽對(duì)應(yīng)的分值、第二用戶的擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分 值、第一用戶的擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值、第二用戶的興趣標(biāo)簽對(duì)應(yīng)的分值、第一相似度和第二 相似度計(jì)算第一用戶和第二用戶之間的匹配度。
[0115] 本實(shí)施例中,興趣標(biāo)簽為表示興趣的標(biāo)簽詞,擅長(zhǎng)標(biāo)簽為表示擅長(zhǎng)的標(biāo)簽詞。在一 個(gè)實(shí)施例中,當(dāng)用第一用戶的興趣標(biāo)簽去匹配第二用戶的擅長(zhǎng)標(biāo)簽時(shí),則將第一用戶的興 趣標(biāo)簽對(duì)應(yīng)的分值、第二用戶的擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值和第一相似度相乘;當(dāng)用第一用戶的 擅長(zhǎng)標(biāo)簽去匹配第二用戶的興趣標(biāo)簽時(shí),則將第一用戶的擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值、第二用戶 的興趣標(biāo)簽對(duì)應(yīng)的分值和第二相似度相乘;最后將所有得到的乘值相加,即為第一用戶和 第二用戶之間的匹配度。
[0116] 進(jìn)一步的,在一個(gè)實(shí)施例中,在步驟806中,可按照如下公式計(jì)算第一用戶和第二 用戶之間的匹配度: n m
[0117] match_score(a,b) = wy)u 551 (w..)7' match(x,y) x=i y=l
[0118] 其中,match_score(a, b)為第一用戶a與第二用戶b之間的匹配度,n為第一用 戶a的標(biāo)簽個(gè)數(shù),m為第二用戶b的標(biāo)簽個(gè)數(shù),a和P為常數(shù)。優(yōu)選的,a和P相等,取 值都為0.5。
[0119] 當(dāng)將第一用戶a的興趣標(biāo)簽匹配第二用戶b的擅長(zhǎng)標(biāo)簽時(shí),match (x,y)為第一相 似度,Wx為第一用戶a的興趣標(biāo)簽對(duì)應(yīng)的分值,Wy為第二用戶b的擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值;當(dāng) 將第一用戶a的擅長(zhǎng)標(biāo)簽匹配第二用戶b的興趣標(biāo)簽時(shí),match (x,y)為第二相似度,Wx為 第一用戶a的擅長(zhǎng)標(biāo)簽的對(duì)應(yīng)的分值,Wy為第二用戶b的興趣標(biāo)簽對(duì)應(yīng)的分值。
[0120] 在一個(gè)優(yōu)選的實(shí)施例中,match (X,y)取值可為1或0,即:當(dāng)?shù)谝挥脩舻呐d趣標(biāo)簽 和第二用戶的擅長(zhǎng)標(biāo)簽相同,或者第一用戶的擅長(zhǎng)標(biāo)簽和第二用戶的興趣標(biāo)簽相同時(shí),則 取值為1,否則取值為〇。這樣,可以簡(jiǎn)化運(yùn)算,提高處理效率。
[0121] 在另一個(gè)實(shí)施例中,還可采用興趣類別和擅長(zhǎng)類別來(lái)計(jì)算兩個(gè)用戶之間的匹配 度。本實(shí)施例中,興趣標(biāo)簽包括興趣類別,擅長(zhǎng)標(biāo)簽包括擅長(zhǎng)類別;根據(jù)興趣標(biāo)簽對(duì)應(yīng)的分 值和擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值生成兩個(gè)用戶之間的匹配度,則包括:根據(jù)興趣類別對(duì)應(yīng)的分值 和擅長(zhǎng)類別對(duì)應(yīng)的分值生成兩個(gè)用戶之間的匹配度。
[0122] 具體的,在一個(gè)實(shí)施例中,如圖9所示,根據(jù)興趣類別對(duì)應(yīng)的分值和擅長(zhǎng)類別對(duì)應(yīng) 的分值生成兩個(gè)用戶之間的匹配度,包括:
[0123] 步驟902,將第一用戶的興趣標(biāo)簽匹配第二用戶的擅長(zhǎng)標(biāo)簽,獲取第一用戶的興趣 標(biāo)簽與第二用戶的擅長(zhǎng)標(biāo)簽的第一相似度。
[0124] 步驟904,將第一用戶的擅長(zhǎng)標(biāo)簽匹配第二用戶的興趣標(biāo)簽,獲取第一用戶的擅長(zhǎng) 標(biāo)簽與第二用戶的興趣標(biāo)簽的第二相似度。
[0125] 步驟906,根據(jù)第一用戶的興趣類別對(duì)應(yīng)的分值、第二用戶的擅長(zhǎng)標(biāo)類別對(duì)應(yīng)的分 值、第一用戶的擅長(zhǎng)類別對(duì)應(yīng)的分值、第二用戶的興趣類別對(duì)應(yīng)的分值、第一相似度和第二 相似度計(jì)算第一用戶和第二用戶之間的匹配度。
[0126] 在一個(gè)實(shí)施例中,當(dāng)用第一用戶的興趣標(biāo)簽去匹配第二用戶的擅長(zhǎng)標(biāo)簽時(shí),則將 第一用戶的興趣類別對(duì)應(yīng)的分值、第二用戶的擅長(zhǎng)類別對(duì)應(yīng)的分值和第一相似度相乘;當(dāng) 用第一用戶的擅長(zhǎng)標(biāo)簽去匹配第二用戶的興趣標(biāo)簽時(shí),則將第一用戶的擅長(zhǎng)類別對(duì)應(yīng)的分 值、第二用戶的興趣類別對(duì)應(yīng)的分值和第二相似度相乘;最后將所有得到的乘值相加,即為 第一用戶和第二用戶之間的匹配度。
[0127] 進(jìn)一步的,在一個(gè)實(shí)施例中,步驟906中,可按照如下公式計(jì)算所述第一用戶和第 二用戶之間的匹配度: n m
[0128] match _score{a ,b)= ZZ (h\. )u *(H'v)/; *match(x, x=l y=l
[0129] 其中,match_score(a,b)為第一用戶a與第二用戶b之間的匹配度,n為第一用戶 a的類別個(gè)數(shù),m為第二用戶b的類別個(gè)數(shù),a和P為常數(shù);
[0130] 當(dāng)將第一用戶a的興趣標(biāo)簽匹配第二用戶b的擅長(zhǎng)標(biāo)簽時(shí),match (X,y)為所述第 一相似度,Wx為第一用戶a的興趣類別對(duì)應(yīng)的分值,Wy為第二用戶b的擅長(zhǎng)類別對(duì)應(yīng)的分 值;
[0131] 當(dāng)將第一用戶a的擅長(zhǎng)標(biāo)簽匹配第二用戶b的興趣標(biāo)簽時(shí),match (x,y)為所述第 二相似度,Wx為第一用戶a的擅長(zhǎng)類別的對(duì)應(yīng)的分值,Wy為第二用戶b的興趣類別對(duì)應(yīng)的 分值。
[0132] 在一個(gè)優(yōu)選的實(shí)施例中,match (x,y)取值可為1或0, S卩:當(dāng)?shù)谝挥脩舻呐d趣標(biāo)簽 和第二用戶的擅長(zhǎng)標(biāo)簽相同,或者第一用戶的擅長(zhǎng)標(biāo)簽和第二用戶的興趣標(biāo)簽相同時(shí),則 取值為1,否則取值為0。這樣,可以簡(jiǎn)化運(yùn)算,提高處理效率。
[0133] 本實(shí)施例中,還可采用興趣類別對(duì)應(yīng)的分值和擅長(zhǎng)類別對(duì)應(yīng)的分值來(lái)參與計(jì)算兩 個(gè)用戶之間的匹配度。進(jìn)一步的,還可結(jié)合采用標(biāo)簽詞參與計(jì)算得到的匹配度和采用類別 參與計(jì)算的匹配度來(lái)得到兩個(gè)用戶之間的綜合匹配度,最終根據(jù)兩個(gè)用戶之間的總和匹配 度來(lái)選取匹配度最高的預(yù)設(shè)數(shù)量的用戶進(jìn)行推薦。如,對(duì)于一個(gè)用戶集合B={bl,b2, b3,… ,bn}和用戶a進(jìn)行匹配,得到用戶集合B中每個(gè)用戶與用戶a之間的匹配度,最后選取其中 匹配度最高的1〇〇個(gè)用戶推薦給用戶a。本實(shí)施例中,結(jié)合類別和標(biāo)簽詞來(lái)參與計(jì)算,能夠 提高推薦的準(zhǔn)確度,這種將興趣和擅長(zhǎng)交叉匹配的方式能夠避免用戶推薦的盲目性,從而 減少冗余信息的推送,節(jié)省了網(wǎng)絡(luò)資源。
[0134] 如圖10所示,在一個(gè)實(shí)施例中,還提供了一種用戶推薦裝置,包括:
[0135] 興趣標(biāo)簽讀取模塊1002,用于讀取用戶的興趣標(biāo)簽和興趣標(biāo)簽對(duì)應(yīng)的分值。
[0136] 擅長(zhǎng)標(biāo)簽讀取模塊1004,用于讀取用戶的擅長(zhǎng)標(biāo)簽和擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值。
[0137] 匹配度生成模塊1006,用于根據(jù)興趣標(biāo)簽對(duì)應(yīng)的分值和擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值生成 兩個(gè)用戶之間的匹配度。
[0138] 用戶推薦模塊1008,用于根據(jù)匹配度選取待推薦用戶進(jìn)行推薦。
[0139] 在另一個(gè)實(shí)施例中,如圖11所示,在圖10所示實(shí)施例的基礎(chǔ)上,用戶推薦裝置還 包括:
[0140] 興趣標(biāo)簽挖掘模塊1001,用于收集用戶的線上行為數(shù)據(jù),根據(jù)線上行為數(shù)據(jù)挖掘 用戶的興趣標(biāo)簽。
[0141] 進(jìn)一步的,在一個(gè)實(shí)施例中,如圖12所示,興趣標(biāo)簽挖掘模塊1001包括:
[0142] 第一分詞模塊1001a,用于對(duì)線上行為數(shù)據(jù)中的文檔進(jìn)行分詞。
[0143] 第一分值計(jì)算模塊1001b,用于計(jì)算分詞后得到的標(biāo)簽詞對(duì)應(yīng)的分值為標(biāo)簽詞的 詞頻與用戶的所有標(biāo)簽詞的詞頻的比率。
[0144] 興趣標(biāo)簽選取模塊1001c,用于根據(jù)標(biāo)簽詞對(duì)應(yīng)的分值選取標(biāo)簽詞作為用戶的興 趣標(biāo)簽。
[0145] 在另一個(gè)實(shí)施例中,如圖13所示,在圖12所示實(shí)施例的基礎(chǔ)上,興趣標(biāo)簽挖掘模 塊1001還包括:
[0146] 第一歸類模塊1001d,用于對(duì)分詞后得到的標(biāo)簽詞進(jìn)行歸類。
[0147] 第一類別分值計(jì)算模塊lOOle,用于根據(jù)標(biāo)簽詞對(duì)應(yīng)的分值計(jì)算標(biāo)簽詞所屬類別 對(duì)應(yīng)的分值。
[0148] 興趣類別選取模塊IOOlf,用于根據(jù)標(biāo)簽詞所屬類別對(duì)應(yīng)的分值選取類別作為用 戶的興趣類別。
[0149] 如圖14所示,在另一個(gè)實(shí)施例中,用戶推薦裝置還包括:
[0150] 第一擅長(zhǎng)標(biāo)簽挖掘模塊1003,用于收集用戶的專業(yè)相關(guān)數(shù)據(jù),根據(jù)專業(yè)相關(guān)數(shù)據(jù) 挖掘用戶的擅長(zhǎng)標(biāo)簽。
[0151] 進(jìn)一步的,在一個(gè)實(shí)施例中,如圖15所示,第一擅長(zhǎng)標(biāo)簽挖掘模塊1003包括:
[0152] 第二分詞模塊1003a,用于對(duì)專業(yè)相關(guān)數(shù)據(jù)中的文檔進(jìn)行分詞。
[0153] 第二分值計(jì)算模塊1003b,用于計(jì)算分詞后得到的標(biāo)簽詞對(duì)應(yīng)的分值為標(biāo)簽詞的 詞頻與用戶的所有標(biāo)簽詞的詞頻的比率。
[0154] 第一擅長(zhǎng)標(biāo)簽選取模塊1003c,用于根據(jù)標(biāo)簽詞對(duì)應(yīng)的分值選取標(biāo)簽詞作為用戶 的擅長(zhǎng)標(biāo)簽。
[0155] 在另一個(gè)實(shí)施例中,在圖16所示,在圖15所示實(shí)施例的基礎(chǔ)上,第一擅長(zhǎng)標(biāo)簽挖 掘模塊1003還包括 :
[0156] 第二歸類模塊1003d,用于對(duì)分詞后得到的標(biāo)簽進(jìn)行歸類。
[0157] 第二類別分值計(jì)算模塊1003e,用于根據(jù)標(biāo)簽詞對(duì)應(yīng)的分值計(jì)算標(biāo)簽詞所屬類別 對(duì)應(yīng)的分值。
[0158] 第一擅長(zhǎng)類別選取模塊1003f,用于根據(jù)標(biāo)簽詞所述類別對(duì)應(yīng)的分值選取類別作 為用戶的擅長(zhǎng)類別。
[0159] 在一個(gè)實(shí)施例中,如圖17所示,用戶推薦裝置還包括:
[0160] 第二擅長(zhǎng)標(biāo)簽挖掘模塊1005,用于收集用戶的專業(yè)相關(guān)數(shù)據(jù)和個(gè)人信息,根據(jù)專 業(yè)相關(guān)數(shù)據(jù)和個(gè)人信息挖掘用戶的擅長(zhǎng)標(biāo)簽。
[0161] 進(jìn)一步的,在一個(gè)實(shí)施例中,如圖18所示,第二擅長(zhǎng)標(biāo)簽挖掘模塊1005包括:
[0162] 第三分詞模塊1005a,用于對(duì)專業(yè)相關(guān)數(shù)據(jù)中的文檔進(jìn)行分詞。
[0163] 詞頻概率計(jì)算模塊1005b,用于計(jì)算分詞得到的標(biāo)簽詞對(duì)應(yīng)的詞頻概率為標(biāo)簽詞 的詞頻與用戶的所有標(biāo)簽詞的詞頻的比率。
[0164] 置信度計(jì)算模塊1005c,用于根據(jù)個(gè)人信息獲取對(duì)應(yīng)的標(biāo)簽詞,以及根據(jù)個(gè)人信息 計(jì)算獲取的標(biāo)簽詞所對(duì)應(yīng)的置信度。
[0165] 第三分值計(jì)算模塊1005d,用于對(duì)標(biāo)簽詞對(duì)應(yīng)的詞頻概率和置信度進(jìn)行擬合,得到 標(biāo)簽詞對(duì)應(yīng)的分值。
[0166] 第二擅長(zhǎng)標(biāo)簽選取模塊1005e,用于根據(jù)標(biāo)簽詞對(duì)應(yīng)的分值選取標(biāo)簽詞作為用戶 的擅長(zhǎng)標(biāo)簽。
[0167] 在另一個(gè)實(shí)施例中,如圖19所示,在圖18所示實(shí)施例的基礎(chǔ)上,第二擅長(zhǎng)標(biāo)簽挖 掘模塊1005還包括 :
[0168] 第三歸類模塊1005f,用于對(duì)分詞后得到的標(biāo)簽進(jìn)行歸類。
[0169] 第三類別分值計(jì)算模塊1005g,用于根據(jù)標(biāo)簽詞對(duì)應(yīng)的分值計(jì)算標(biāo)簽詞所屬類別 對(duì)應(yīng)的分值。
[0170] 第二擅長(zhǎng)類別選取模塊1005h,用于根據(jù)標(biāo)簽詞所述類別對(duì)應(yīng)的分值選取類別作 為用戶的擅長(zhǎng)類別。
[0171] 具體的,在一個(gè)實(shí)施例中,如圖20所示,匹配度生成模塊1006包括:
[0172] 第一匹配模塊1006a,用于將第一用戶的興趣標(biāo)簽匹配第二用戶的擅長(zhǎng)標(biāo)簽,獲取 第一用戶的興趣標(biāo)簽與第二用戶的擅長(zhǎng)標(biāo)簽的第一相似度;以及用于將第一用戶的擅長(zhǎng)標(biāo) 簽匹配第二用戶的興趣標(biāo)簽,獲取第一用戶的擅長(zhǎng)標(biāo)簽與第二用戶的興趣標(biāo)簽的第二相似 度。
[0173] 第一匹配度計(jì)算模塊1006b,用于根據(jù)第一用戶的興趣標(biāo)簽對(duì)應(yīng)的分值、第二用戶 的擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值、第一用戶的擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值、第二用戶的興趣標(biāo)簽對(duì)應(yīng)的分 值、第一相似度和第二相似度計(jì)算第一用戶和第二用戶之間的匹配度。
[0174] 進(jìn)一步的,在一個(gè)實(shí)施例中,第一匹配度計(jì)算模塊1006b用于按照如下公式計(jì)算 所述第一用戶和第二用戶之間的匹配度:
[0175]
【權(quán)利要求】
1. 一種用戶推薦方法,所述方法包括: 讀取用戶的興趣標(biāo)簽和所述興趣標(biāo)簽對(duì)應(yīng)的分值; 讀取用戶的擅長(zhǎng)標(biāo)簽和所述擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值; 根據(jù)所述興趣標(biāo)簽對(duì)應(yīng)的分值和所述擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值生成兩個(gè)用戶之間的匹配 度; 根據(jù)所述匹配度選取待推薦用戶進(jìn)行推薦。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 收集用戶的線上行為數(shù)據(jù),根據(jù)所述線上行為數(shù)據(jù)挖掘用戶的興趣標(biāo)簽。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)線上行為數(shù)據(jù)挖掘用戶的興趣 標(biāo)簽,包括: 對(duì)所述線上行為數(shù)據(jù)中的文檔進(jìn)行分詞; 計(jì)算分詞后得到的標(biāo)簽詞對(duì)應(yīng)的分值為標(biāo)簽詞的詞頻與用戶的所有標(biāo)簽詞的詞頻總 和的比率; 根據(jù)所述標(biāo)簽詞對(duì)應(yīng)的分值選取標(biāo)簽詞作為用戶的興趣標(biāo)簽。
4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)線上行為數(shù)據(jù)挖掘用戶的興趣 標(biāo)簽,還包括: 對(duì)所述分詞后得到的標(biāo)簽詞進(jìn)行歸類; 根據(jù)所述標(biāo)簽詞對(duì)應(yīng)的分值計(jì)算標(biāo)簽詞所屬類別對(duì)應(yīng)的分值; 根據(jù)所述標(biāo)簽詞所屬類別對(duì)應(yīng)的分值選取類別作為用戶的興趣類別。
5. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 收集用戶的專業(yè)相關(guān)數(shù)據(jù),根據(jù)所述專業(yè)相關(guān)數(shù)據(jù)挖掘用戶的擅長(zhǎng)標(biāo)簽; 所述專業(yè)相關(guān)數(shù)據(jù)包括問(wèn)答社區(qū)數(shù)據(jù)、專業(yè)論壇數(shù)據(jù)中的至少一種。
6. 根據(jù)權(quán)利要求5所述的方法,其特征在于,所述根據(jù)專業(yè)相關(guān)數(shù)據(jù)挖掘用戶的擅長(zhǎng) 標(biāo)簽,包括: 對(duì)所述專業(yè)相關(guān)數(shù)據(jù)中的文檔進(jìn)行分詞; 計(jì)算分詞后得到的標(biāo)簽詞對(duì)應(yīng)的分值為標(biāo)簽詞的詞頻與用戶的所有標(biāo)簽詞的詞頻總 和的比率; 根據(jù)所述標(biāo)簽詞對(duì)應(yīng)的分值選取標(biāo)簽詞作為用戶的擅長(zhǎng)標(biāo)簽。
7. 根據(jù)權(quán)利要求6所述的方法,其特征在于,所述根據(jù)專業(yè)相關(guān)數(shù)據(jù)挖掘用戶的擅長(zhǎng) 標(biāo)簽,還包括: 對(duì)所述分詞后得到的標(biāo)簽進(jìn)行歸類; 根據(jù)所述標(biāo)簽詞對(duì)應(yīng)的分值計(jì)算標(biāo)簽詞所屬類別對(duì)應(yīng)的分值; 根據(jù)所述標(biāo)簽詞所屬類別對(duì)應(yīng)的分值選取類別作為用戶的擅長(zhǎng)類別。
8. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 收集用戶的專業(yè)相關(guān)數(shù)據(jù)和個(gè)人信息,根據(jù)所述專業(yè)相關(guān)數(shù)據(jù)和個(gè)人信息挖掘用戶的 擅長(zhǎng)標(biāo)簽; 所述專業(yè)相關(guān)數(shù)據(jù)包括問(wèn)答社區(qū)數(shù)據(jù)、專業(yè)論壇數(shù)據(jù)中的至少一種。
9. 根據(jù)權(quán)利要求8所述的方法,其特征在于,所述根據(jù)專業(yè)相關(guān)數(shù)據(jù)和個(gè)人信息挖掘 用戶的擅長(zhǎng)標(biāo)簽,包括: 對(duì)所述專業(yè)相關(guān)數(shù)據(jù)中的文檔進(jìn)行分詞; 計(jì)算分詞得到的標(biāo)簽詞對(duì)應(yīng)的詞頻概率為所述標(biāo)簽詞的詞頻與用戶的所有標(biāo)簽詞的 詞頻總和的比率; 根據(jù)所述個(gè)人信息獲取對(duì)應(yīng)的標(biāo)簽詞,以及根據(jù)所述個(gè)人信息計(jì)算獲取的標(biāo)簽詞所對(duì) 應(yīng)的置信度; 對(duì)標(biāo)簽詞對(duì)應(yīng)的詞頻概率和置信度進(jìn)行擬合,得到所述標(biāo)簽詞對(duì)應(yīng)的分值; 根據(jù)所述標(biāo)簽詞對(duì)應(yīng)的分值選取標(biāo)簽詞作為用戶的擅長(zhǎng)標(biāo)簽。
10. 根據(jù)權(quán)利要求9所述的方法,其特征在于,所述根據(jù)專業(yè)相關(guān)數(shù)據(jù)和個(gè)人信息挖掘 用戶的擅長(zhǎng)標(biāo)簽,還包括: 對(duì)所述分詞后得到的標(biāo)簽進(jìn)行歸類; 根據(jù)所述標(biāo)簽詞對(duì)應(yīng)的分值計(jì)算標(biāo)簽詞所屬類別對(duì)應(yīng)的分值; 根據(jù)所述標(biāo)簽詞所屬類別對(duì)應(yīng)的分值選取類別作為用戶的擅長(zhǎng)類別。
11. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)興趣標(biāo)簽對(duì)應(yīng)的分值和擅長(zhǎng)標(biāo) 簽對(duì)應(yīng)的分值生成兩個(gè)用戶之間的匹配度,包括: 將第一用戶的興趣標(biāo)簽匹配第二用戶的擅長(zhǎng)標(biāo)簽,獲取所述第一用戶的興趣標(biāo)簽與所 述第二用戶的擅長(zhǎng)標(biāo)簽的第一相似度; 將第一用戶的擅長(zhǎng)標(biāo)簽匹配第二用戶的興趣標(biāo)簽,獲取所述第一用戶的擅長(zhǎng)標(biāo)簽與第 二用戶的興趣標(biāo)簽的第二相似度; 根據(jù)所述第一用戶的興趣標(biāo)簽對(duì)應(yīng)的分值、第二用戶的擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值、第一用 戶的擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值、第二用戶的興趣標(biāo)簽對(duì)應(yīng)的分值、所述第一相似度和第二相似 度計(jì)算第一用戶和第二用戶之間的匹配度。
12. 根據(jù)權(quán)利要求11所述的方法,其特征在于,按照如下公式計(jì)算所述第一用戶和第 二用戶之間的匹配度:
其中,match_score(a, b)為第一用戶a與第二用戶b之間的匹配度,n為第一用戶a的 標(biāo)簽個(gè)數(shù),m為第二用戶b的標(biāo)簽個(gè)數(shù),α和β為常數(shù); 當(dāng)將第一用戶a的興趣標(biāo)簽匹配第二用戶b的擅長(zhǎng)標(biāo)簽時(shí),match (X,y)為所述第一相 似度,Wx為第一用戶a的興趣標(biāo)簽對(duì)應(yīng)的分值,Wy為第二用戶b的擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值; 當(dāng)將第一用戶a的擅長(zhǎng)標(biāo)簽匹配第二用戶b的興趣標(biāo)簽時(shí),match (X,y)為所述第二相 似度,Wx為第一用戶a的擅長(zhǎng)標(biāo)簽的對(duì)應(yīng)的分值,Wy為第二用戶b的興趣標(biāo)簽對(duì)應(yīng)的分值。
13. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述興趣標(biāo)簽包括興趣類別,所述擅長(zhǎng) 標(biāo)簽包括擅長(zhǎng)類別;所述根據(jù)興趣標(biāo)簽對(duì)應(yīng)的分值和所述擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值生成兩個(gè)用 戶之間的匹配度,包括 : 根據(jù)所述興趣類別對(duì)應(yīng)的分值和擅長(zhǎng)類別對(duì)應(yīng)的分值生成兩個(gè)用戶之間的匹配度。
14. 根據(jù)權(quán)利要求13所述的方法,其特征在于,所述根據(jù)興趣類別對(duì)應(yīng)的分值和擅長(zhǎng) 類別對(duì)應(yīng)的分值生成兩個(gè)用戶之間的匹配度,包括: 將第一用戶的興趣標(biāo)簽匹配第二用戶的擅長(zhǎng)標(biāo)簽,獲取所述第一用戶的興趣標(biāo)簽與所 述第二用戶的擅長(zhǎng)標(biāo)簽的第一相似度; 將第一用戶的擅長(zhǎng)標(biāo)簽匹配第二用戶的興趣標(biāo)簽,獲取所述第一用戶的擅長(zhǎng)標(biāo)簽與第 二用戶的興趣標(biāo)簽的第二相似度; 根據(jù)所述第一用戶的興趣類別對(duì)應(yīng)的分值、第二用戶的擅長(zhǎng)類別對(duì)應(yīng)的分值、第一用 戶的擅長(zhǎng)類別對(duì)應(yīng)的分值、第二用戶的興趣類別對(duì)應(yīng)的分值、所述第一相似度和第二相似 度計(jì)算第一用戶和第二用戶之間的匹配度。
15. 根據(jù)權(quán)利要求14所述的方法,其特征在于,按照如下公式計(jì)算所述第一用戶和第 二用戶之間的匹配度: JL-l V-I
其中,match_score(a, b)為第一用戶a與第二用戶b之間的匹配度,n為第一用戶a的 類別個(gè)數(shù),m為第二用戶b的類別個(gè)數(shù),α和β為常數(shù); 當(dāng)將第一用戶a的興趣標(biāo)簽匹配第二用戶b的擅長(zhǎng)標(biāo)簽時(shí),match (X,y)為所述第一相 似度,Wx為第一用戶a的興趣類別對(duì)應(yīng)的分值,Wy為第二用戶b的擅長(zhǎng)類別對(duì)應(yīng)的分值; 當(dāng)將第一用戶a的擅長(zhǎng)標(biāo)簽匹配第二用戶b的興趣標(biāo)簽時(shí),match (X,y)為所述第二相 似度,Wx為第一用戶a的擅長(zhǎng)類別的對(duì)應(yīng)的分值,Wy為第二用戶b的興趣類別對(duì)應(yīng)的分值。
16. -種用戶推薦裝置,其特征在于,所述裝置包括: 興趣標(biāo)簽讀取模塊,用于讀取用戶的興趣標(biāo)簽和所述興趣標(biāo)簽對(duì)應(yīng)的分值; 擅長(zhǎng)標(biāo)簽讀取模塊,用于讀取用戶的擅長(zhǎng)標(biāo)簽和所述擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值; 匹配度生成模塊,用于根據(jù)所述興趣標(biāo)簽對(duì)應(yīng)的分值和所述擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值生成 兩個(gè)用戶之間的匹配度; 用戶推薦模塊,用于根據(jù)所述匹配度選取待推薦用戶進(jìn)行推薦。
17. 根據(jù)權(quán)利要求16所述的裝置,其特征在于,所述裝置還包括: 興趣標(biāo)簽挖掘模塊,用于收集用戶的線上行為數(shù)據(jù),根據(jù)所述線上行為數(shù)據(jù)挖掘用戶 的興趣標(biāo)簽。
18. 根據(jù)權(quán)利要求17所述的裝置,其特征在于,所述興趣標(biāo)簽挖掘模塊包括: 第一分詞模塊,用于對(duì)所述線上行為數(shù)據(jù)中的文檔進(jìn)行分詞; 第一分值計(jì)算模塊,用于計(jì)算分詞后得到的標(biāo)簽詞對(duì)應(yīng)的分值為標(biāo)簽詞的詞頻與用戶 的所有標(biāo)簽詞的詞頻的比率; 興趣標(biāo)簽選取模塊,用于根據(jù)所述標(biāo)簽詞對(duì)應(yīng)的分值選取標(biāo)簽詞作為用戶的興趣標(biāo) 簽。
19. 根據(jù)權(quán)利要求18所述的裝置,其特征在于,所述興趣標(biāo)簽挖掘模塊還包括: 第一歸類模塊,用于對(duì)所述分詞后得到的標(biāo)簽詞進(jìn)行歸類; 第一類別分值計(jì)算模塊,用于根據(jù)所述標(biāo)簽詞對(duì)應(yīng)的分值計(jì)算標(biāo)簽詞所屬類別對(duì)應(yīng)的 分值; 興趣類別選取模塊,用于根據(jù)所述標(biāo)簽詞所屬類別對(duì)應(yīng)的分值選取類別作為用戶的興 趣類別。
20. 根據(jù)權(quán)利要求16所述的裝置,其特征在于,所述裝置還包括: 第一擅長(zhǎng)標(biāo)簽挖掘模塊,用于收集用戶的專業(yè)相關(guān)數(shù)據(jù),根據(jù)所述專業(yè)相關(guān)數(shù)據(jù)挖掘 用戶的擅長(zhǎng)標(biāo)簽; 所述專業(yè)相關(guān)數(shù)據(jù)包括問(wèn)答社區(qū)數(shù)據(jù)、專業(yè)論壇數(shù)據(jù)中的至少一種。
21. 根據(jù)權(quán)利要求20所述的裝置,其特征在于,所述第一擅長(zhǎng)標(biāo)簽挖掘模塊包括: 第二分詞模塊,用于對(duì)所述專業(yè)相關(guān)數(shù)據(jù)中的文檔進(jìn)行分詞; 第二分值計(jì)算模塊,用于計(jì)算分詞后得到的標(biāo)簽詞對(duì)應(yīng)的分值為標(biāo)簽詞的詞頻與用戶 的所有標(biāo)簽詞的詞頻的比率; 第一擅長(zhǎng)標(biāo)簽選取模塊,用于根據(jù)所述標(biāo)簽詞對(duì)應(yīng)的分值選取標(biāo)簽詞作為用戶的擅長(zhǎng) 標(biāo)簽。
22. 根據(jù)權(quán)利要求21所述的裝置,其特征在于,所述第一擅長(zhǎng)標(biāo)簽挖掘模塊還包括: 第二歸類模塊,用于對(duì)所述分詞后得到的標(biāo)簽進(jìn)行歸類; 第二類別分值計(jì)算模塊,用于根據(jù)所述標(biāo)簽詞對(duì)應(yīng)的分值計(jì)算標(biāo)簽詞所屬類別對(duì)應(yīng)的 分值; 第一擅長(zhǎng)類別選取模塊,用于根據(jù)所述標(biāo)簽詞所述類別對(duì)應(yīng)的分值選取類別作為用戶 的擅長(zhǎng)類別。
23. 根據(jù)權(quán)利要求16所述的裝置,其特征在于,所述裝置還包括: 第二擅長(zhǎng)標(biāo)簽挖掘模塊,用于收集用戶的專業(yè)相關(guān)數(shù)據(jù)和個(gè)人信息,根據(jù)所述專業(yè)相 關(guān)數(shù)據(jù)和個(gè)人信息挖掘用戶的擅長(zhǎng)標(biāo)簽; 所述專業(yè)相關(guān)數(shù)據(jù)包括問(wèn)答社區(qū)數(shù)據(jù)、專業(yè)論壇數(shù)據(jù)中的至少一種。
24. 根據(jù)權(quán)利要求23所述的裝置,其特征在于,所述第二擅長(zhǎng)標(biāo)簽挖掘模塊包括: 第三分詞模塊,用于對(duì)所述專業(yè)相關(guān)數(shù)據(jù)中的文檔進(jìn)行分詞; 詞頻概率計(jì)算模塊,用于計(jì)算分詞得到的標(biāo)簽詞對(duì)應(yīng)的詞頻概率為所述標(biāo)簽詞的詞頻 與用戶的所有標(biāo)簽詞的詞頻的比率; 置信度計(jì)算模塊,用于根據(jù)所述個(gè)人信息獲取對(duì)應(yīng)的標(biāo)簽詞,以及根據(jù)所述個(gè)人信息 計(jì)算獲取的標(biāo)簽詞所對(duì)應(yīng)的置信度; 第三分值計(jì)算模塊,用于對(duì)標(biāo)簽詞對(duì)應(yīng)的詞頻概率和置信度進(jìn)行擬合,得到所述標(biāo)簽 詞對(duì)應(yīng)的分值; 第二擅長(zhǎng)標(biāo)簽選取模塊,用于根據(jù)所述標(biāo)簽詞對(duì)應(yīng)的分值選取標(biāo)簽詞作為用戶的擅長(zhǎng) 標(biāo)簽。
25. 根據(jù)權(quán)利要求24所述的裝置,其特征在于,所述第二擅長(zhǎng)標(biāo)簽挖掘模塊還包括: 第三歸類模塊,用于對(duì)所述分詞后得到的標(biāo)簽進(jìn)行歸類; 第三類別分值計(jì)算模塊,用于根據(jù)所述標(biāo)簽詞對(duì)應(yīng)的分值計(jì)算標(biāo)簽詞所屬類別對(duì)應(yīng)的 分值; 第二擅長(zhǎng)類別選取模塊,用于根據(jù)所述標(biāo)簽詞所述類別對(duì)應(yīng)的分值選取類別作為用戶 的擅長(zhǎng)類別。
26. 根據(jù)權(quán)利要求16所述的裝置,其特征在于,所述匹配度生成模塊包括: 第一匹配模塊,用于將第一用戶的興趣標(biāo)簽匹配第二用戶的擅長(zhǎng)標(biāo)簽,獲取所述第一 用戶的興趣標(biāo)簽與所述第二用戶的擅長(zhǎng)標(biāo)簽的第一相似度;以及用于將第一用戶的擅長(zhǎng)標(biāo) 簽匹配第二用戶的興趣標(biāo)簽,獲取所述第一用戶的擅長(zhǎng)標(biāo)簽與第二用戶的興趣標(biāo)簽的第二 相似度; 第一匹配度計(jì)算模塊,用于根據(jù)所述第一用戶的興趣標(biāo)簽對(duì)應(yīng)的分值、第二用戶的擅 長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值、第一用戶的擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值、第二用戶的興趣標(biāo)簽對(duì)應(yīng)的分值、所 述第一相似度和第二相似度計(jì)算第一用戶和第二用戶之間的匹配度。
27. 根據(jù)權(quán)利要求26所述的裝置,其特征在于,所述第一匹配度計(jì)算模塊用于按照如 下公式計(jì)算所述第一用戶和第二用戶之間的匹配度:
其中,match_score(a, b)為第一用戶a與第二用戶b之間的匹配度,n為第一用戶a的 標(biāo)簽個(gè)數(shù),m為第二用戶b的標(biāo)簽個(gè)數(shù),α和β為常數(shù); 當(dāng)將第一用戶a的興趣標(biāo)簽匹配第二用戶b的擅長(zhǎng)標(biāo)簽時(shí),match (X,y)為所述第一相 似度,Wx為第一用戶a的興趣標(biāo)簽對(duì)應(yīng)的分值,Wy為第二用戶b的擅長(zhǎng)標(biāo)簽對(duì)應(yīng)的分值; 當(dāng)將第一用戶a的擅長(zhǎng)標(biāo)簽匹配第二用戶b的興趣標(biāo)簽時(shí),match (X,y)為所述第二相 似度,Wx為第一用戶a的擅長(zhǎng)標(biāo)簽的對(duì)應(yīng)的分值,Wy為第二用戶b的興趣標(biāo)簽對(duì)應(yīng)的分值。
28. 根據(jù)權(quán)利要求16所述的裝置,其特征在于,所述興趣標(biāo)簽包括興趣類別,所述擅長(zhǎng) 標(biāo)簽包括擅長(zhǎng)類別;所述匹配度生成模塊還用于根據(jù)所述興趣類別對(duì)應(yīng)的分值和擅長(zhǎng)類別 對(duì)應(yīng)的分值生成兩個(gè)用戶之間的匹配度。
29. 根據(jù)權(quán)利要求28所述的裝置,其特征在于,所述匹配度生成模塊包括: 第二匹配模塊,用于將第一用戶的興趣標(biāo)簽匹配第二用戶的擅長(zhǎng)標(biāo)簽,獲取所述第一 用戶的興趣標(biāo)簽與所述第二用戶的擅長(zhǎng)標(biāo)簽的第一相似度;以及用于將第一用戶的擅長(zhǎng)標(biāo) 簽匹配第二用戶的興趣標(biāo)簽,獲取所述第一用戶的擅長(zhǎng)標(biāo)簽與第二用戶的興趣標(biāo)簽的第二 相似度; 第二匹配度計(jì)算模塊,用于根據(jù)所述第一用戶的興趣類別對(duì)應(yīng)的分值、第二用戶的擅 長(zhǎng)類別對(duì)應(yīng)的分值、第一用戶的擅長(zhǎng)類別對(duì)應(yīng)的分值、第二用戶的興趣類別對(duì)應(yīng)的分值、所 述第一相似度和第二相似度計(jì)算第一用戶和第二用戶之間的匹配度。
30. 根據(jù)權(quán)利要求29所述的裝置,其特征在于,所述第二匹配度計(jì)算模塊用于按照如 下公式計(jì)算所述第一用戶和第二用戶之間的匹配度:
其中,match_score(a, b)為第一用戶a與第二用戶b之間的匹配度,n為第一用戶a的 類別個(gè)數(shù),m為第二用戶b的類別個(gè)數(shù),α和β為常數(shù); 當(dāng)將第一用戶a的興趣標(biāo)簽匹配第二用戶b的擅長(zhǎng)標(biāo)簽時(shí),match (X,y)為所述第一相 似度,Wx為第一用戶a的興趣類別對(duì)應(yīng)的分值,Wy為第二用戶b的擅長(zhǎng)類別對(duì)應(yīng)的分值; 當(dāng)將第一用戶a的擅長(zhǎng)標(biāo)簽匹配第二用戶b的興趣標(biāo)簽時(shí),match (X,y)為所述第二相 似度,Wx為第一用戶a的擅長(zhǎng)類別的對(duì)應(yīng)的分值,Wy為第二用戶b的興趣類別對(duì)應(yīng)的分值。
【文檔編號(hào)】G06F17/30GK104376010SQ201310354181
【公開(kāi)日】2015年2月25日 申請(qǐng)日期:2013年8月14日 優(yōu)先權(quán)日:2013年8月14日
【發(fā)明者】程剛 申請(qǐng)人:騰訊科技(深圳)有限公司