欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種社會網(wǎng)絡(luò)建立方法和系統(tǒng)及網(wǎng)絡(luò)社區(qū)挖掘方法和系統(tǒng)的制作方法

文檔序號:6578230閱讀:213來源:國知局
專利名稱:一種社會網(wǎng)絡(luò)建立方法和系統(tǒng)及網(wǎng)絡(luò)社區(qū)挖掘方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及本發(fā)明涉及通信及互聯(lián)網(wǎng)領(lǐng)域,尤其涉及一種社會網(wǎng)絡(luò)建立方法和系 統(tǒng)及網(wǎng)絡(luò)社區(qū)挖掘方法和系統(tǒng)。
背景技術(shù)
網(wǎng)絡(luò)論壇以互聯(lián)網(wǎng)作為傳播載體和運(yùn)行平臺,論壇中的網(wǎng)絡(luò)用戶可以自由地參與 其中,圍繞某類或某個特定的問題,自主地面向公眾發(fā)布信息、發(fā)表評論、交流觀點(diǎn)和意見。 網(wǎng)絡(luò)論壇為網(wǎng)民提供了一個方便的發(fā)表個人觀點(diǎn)的場所,網(wǎng)民通過論壇能找到志趣相投的 網(wǎng)友進(jìn)行各種交流,例如分享原創(chuàng)文章、求助或者幫別人解決疑難問題等等。隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,論壇能夠?yàn)橛脩籼峁┰絹碓蕉嗟姆?wù),如音樂論壇向用戶 推薦歌曲,新聞?wù)搲蛴脩敉扑]時下熱點(diǎn)主題等等。發(fā)明人通過研究發(fā)現(xiàn),現(xiàn)有的這些推薦基本上都是根據(jù)用戶的搜索歷史以及用戶 的登記屬性對用戶進(jìn)行的,雖然有一定效果,但是仍然不能準(zhǔn)確全面的反映用戶的興趣愛 好。更何況,用戶的興趣愛好是隨著時間不斷變化的,搜索歷史并不能真實(shí)地反映用戶當(dāng)前 的興趣點(diǎn);而用戶的登記屬性,信息是有限的,并且不能實(shí)時更新。

發(fā)明內(nèi)容
有鑒于此,本發(fā)明實(shí)施例的目的在于提供一種社會網(wǎng)絡(luò)建立方法和系統(tǒng)及網(wǎng)絡(luò)社 區(qū)挖掘方法和系統(tǒng),用于發(fā)現(xiàn)具有某種特征,并且能夠?yàn)橹峁└袃r值的服務(wù)的用戶群 或用戶社區(qū)。為實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例提供了如下技術(shù)方案一種社會網(wǎng)絡(luò)建立方法,包括從信息單元中提取并保存相互關(guān)聯(lián)的數(shù)據(jù);根據(jù)保存的相互關(guān)聯(lián)的數(shù)據(jù)確定網(wǎng)絡(luò)用戶之間的關(guān)系,根據(jù)所述網(wǎng)絡(luò)用戶之間的 關(guān)系建立所述社會網(wǎng)絡(luò)。一種社會網(wǎng)絡(luò)中的社區(qū)挖掘方法,包括計算社會網(wǎng)絡(luò)中的各個節(jié)點(diǎn)的節(jié)點(diǎn)強(qiáng)度,某個節(jié)點(diǎn)的節(jié)點(diǎn)強(qiáng)度為所有與該節(jié)點(diǎn)相 連的邊的權(quán)值之和;根據(jù)節(jié)點(diǎn)強(qiáng)度選取初始節(jié)點(diǎn),以所述初始節(jié)點(diǎn)為基礎(chǔ),根據(jù)當(dāng)前社區(qū)的模塊度對 當(dāng)前社區(qū)進(jìn)行擴(kuò)展直至當(dāng)前社區(qū)的模塊度達(dá)到極大值,模塊度達(dá)到極大值的社區(qū)即為待挖 掘社區(qū)。一種建立論壇用戶社會網(wǎng)絡(luò)的系統(tǒng),包括存儲單元,用于從信息單元中提取并保存相互關(guān)聯(lián)的數(shù)據(jù);構(gòu)建單元,用于根據(jù)所述存儲單元保存的相互關(guān)聯(lián)的數(shù)據(jù)確定網(wǎng)絡(luò)用戶之間的關(guān) 系,根據(jù)所述網(wǎng)絡(luò)用戶之間的關(guān)系建立所述社會網(wǎng)絡(luò)。一種社會網(wǎng)絡(luò)中的社區(qū)挖掘系統(tǒng),包括
統(tǒng)計單元,用于計算所述社會網(wǎng)絡(luò)中的各個節(jié)點(diǎn)的節(jié)點(diǎn)強(qiáng)度,某個節(jié)點(diǎn)的節(jié)點(diǎn)強(qiáng) 度為所有與該節(jié)點(diǎn)相連的邊的權(quán)值之和;挖掘單元,用于根據(jù)所述統(tǒng)計單元計算的節(jié)點(diǎn)強(qiáng)度選取初始節(jié)點(diǎn),以所述初始節(jié) 點(diǎn)為基礎(chǔ),根據(jù)當(dāng)前社區(qū)的模塊度對當(dāng)前社區(qū)進(jìn)行擴(kuò)展直至當(dāng)前社區(qū)的模塊度達(dá)到極大 值,模塊度達(dá)到極大值的社區(qū)即為待挖掘社區(qū)??梢?,在本發(fā)明實(shí)施例中,從信息單元中提取并保存相互關(guān)聯(lián)的數(shù)據(jù);根據(jù)保存的 相互關(guān)聯(lián)的數(shù)據(jù)確定網(wǎng)絡(luò)用戶之間的關(guān)系,根據(jù)所述網(wǎng)絡(luò)用戶之間的關(guān)系建立所述社會網(wǎng) 絡(luò),在社會網(wǎng)絡(luò)建立后,計算所述社會網(wǎng)絡(luò)中的各個節(jié)點(diǎn)的節(jié)點(diǎn)強(qiáng)度,某個節(jié)點(diǎn)的節(jié)點(diǎn)強(qiáng)度 為所有與該節(jié)點(diǎn)相連的邊的權(quán)值之和;根據(jù)節(jié)點(diǎn)強(qiáng)度選取初始節(jié)點(diǎn),以所述初始節(jié)點(diǎn)為基 礎(chǔ),根據(jù)當(dāng)前社區(qū)的模塊度對當(dāng)前社區(qū)進(jìn)行擴(kuò)展直至當(dāng)前社區(qū)的模塊度達(dá)到極大值,模塊 度達(dá)到極大值的社區(qū)即為待挖掘社區(qū),本發(fā)明實(shí)施例所提供的方法,根據(jù)信息單元中的信 息建立社會網(wǎng)絡(luò),客觀地反映出了網(wǎng)絡(luò)用戶之間的關(guān)系;同時,能夠有效地從社會網(wǎng)絡(luò)中發(fā) 現(xiàn)具有某種特征的用戶群或用戶社區(qū),且能夠向這些具有不同特征的用戶群或社區(qū)中的用 戶,提供更有價值的服務(wù),比如信息傳播、業(yè)務(wù)推薦和朋友推薦等。


圖1為本發(fā)明一實(shí)施例所提供的方法的流程圖;圖2為本發(fā)明另一實(shí)施例所提供的方法的流程圖;圖2a為本發(fā)明一實(shí)施例所提供的方法的子步驟的流程圖;圖3為本發(fā)明一實(shí)施例所提供的社會網(wǎng)絡(luò)結(jié)構(gòu)示意圖;圖4為本發(fā)明另一實(shí)施例所提供的方法的流程圖;圖5為本發(fā)明一實(shí)施例所提供的方法的流程圖;圖6為本發(fā)明一實(shí)施例所提供的另一社會網(wǎng)絡(luò)結(jié)構(gòu)示意圖;圖7為本發(fā)明一實(shí)施例所提供的系統(tǒng)的結(jié)構(gòu)示意圖;圖8為本發(fā)明另一實(shí)施例所提供的系統(tǒng)的結(jié)構(gòu)示意圖;圖9為本發(fā)明一實(shí)施例所提供的系統(tǒng)中一單元的結(jié)構(gòu)示意圖。
具體實(shí)施例方式本發(fā)明實(shí)施例公開了一種社會網(wǎng)絡(luò)建立及網(wǎng)絡(luò)社區(qū)挖掘方法和系統(tǒng),為使本發(fā)明 的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下參照附圖并舉實(shí)施例,對本發(fā)明作進(jìn)一步詳細(xì) 說明。參見圖1,本發(fā)明實(shí)施例所提供的方法具體包括步驟101 從信息單元中提取并保存相互關(guān)聯(lián)的數(shù)據(jù)。所述信息單元可以是網(wǎng)頁中包含的任何信息,在本發(fā)明實(shí)施例中以網(wǎng)頁中的帖子 為例進(jìn)行說明。一個網(wǎng)絡(luò)中的帖子包括幾個基本屬性,如帖子的主題標(biāo)識、主題相關(guān)用戶的用戶 標(biāo)識以及主題相關(guān)用戶間相互溝通的次數(shù)。所述帖子的主題標(biāo)識可以是帖子的名稱或者是帖子在網(wǎng)頁中的特定代碼;所述主 題相關(guān)用戶的用戶標(biāo)識可以是用戶的用戶名或者用戶在網(wǎng)頁中的特定代碼。主題相關(guān)用戶則包括該主題的發(fā)起者和該主題的參與者。主題相關(guān)用戶之間通過互相對彼此所發(fā)帖子的回復(fù)或者引用來表達(dá)自己對一個 主題不同的觀點(diǎn)。而通過這些互相回復(fù)或者引用,這些主題的相關(guān)用戶都關(guān)聯(lián)了起來。步驟102 根據(jù)保存的相互關(guān)聯(lián)的數(shù)據(jù)提取網(wǎng)絡(luò)用戶之間的關(guān)系,根據(jù)所述網(wǎng)絡(luò) 用戶之間的關(guān)系建立所述社會網(wǎng)絡(luò)。如前所述,以網(wǎng)絡(luò)中的帖子為基本的信息單元,主題相關(guān)用戶都關(guān)聯(lián)了起來。一個網(wǎng)頁中不僅僅包含一個主題,一個主題的用戶也有可能會在多個帖子間瀏 覽,所以,通過主題相關(guān)用戶之間回復(fù)和引用的關(guān)系就將網(wǎng)絡(luò)中的用戶都聯(lián)系起來。提取出 主題相關(guān)用戶和他們之間的連接關(guān)系,就建成了所述社會網(wǎng)絡(luò)。下面參見圖2,通過一個具體的例子說明社會網(wǎng)絡(luò)建立的過程。步驟201 抓取網(wǎng)頁并保存到本地。步驟202 分析抓取到的網(wǎng)頁的結(jié)構(gòu),以帖子為單元將網(wǎng)頁進(jìn)行拆分,提取出帖子 中相關(guān)聯(lián)的數(shù)據(jù)。所述相關(guān)聯(lián)的數(shù)據(jù)包括主題編號,各發(fā)帖回帖用戶編號,用戶間相互回復(fù)和引用 次數(shù)。步驟203 將提取的數(shù)據(jù)保存到本地數(shù)據(jù)庫。將相關(guān)聯(lián)的數(shù)據(jù)保存到本地數(shù)據(jù)庫有利于后續(xù)方便快捷地對相關(guān)數(shù)據(jù)進(jìn)行分析 進(jìn)而能夠更加快速地建立社會網(wǎng)絡(luò)。進(jìn)一步地,可以根據(jù)相關(guān)聯(lián)的數(shù)據(jù)的特點(diǎn)建立相應(yīng)的表格對相關(guān)聯(lián)的數(shù)據(jù)進(jìn)行保存。例如,在本發(fā)明實(shí)施例中,建立一個主題信息表(topicinfo)來記錄所有的 主題的信息,包括主題編號,對應(yīng)的主題發(fā)起者的編號等信息。建立一個主題用戶表 (topicanduser)來記錄主題編號以及主題參與者編號等信息;建立一個引用關(guān)系表 (quotat ion)來記錄主題相關(guān)用戶間的引用關(guān)系。步驟204:從數(shù)據(jù)庫中提取數(shù)據(jù),確定網(wǎng)絡(luò)用戶間的相互關(guān)系,構(gòu)成社會網(wǎng)絡(luò)。網(wǎng)絡(luò)用戶間的關(guān)系通過如下方法確定如果兩個用戶之間存在回復(fù)或者引用關(guān) 系,那么他們之間就有一條邊,邊的權(quán)值為用戶間回復(fù)和引用的次數(shù)。參見圖2a,一個主題中的用戶網(wǎng)絡(luò)關(guān)系采用如下方法具體構(gòu)建步驟SlOl 根據(jù)保存的主題信息表,獲取某個主題的發(fā)起者,為描述方便,簡稱主 題A。步驟S102 從主題用戶表中獲取參與主題A的用戶,建立發(fā)起者與參與者的關(guān)系。 即建立一個由發(fā)起者指向參與者的有向連接。連邊的權(quán)值設(shè)定為參與者對發(fā)起者的回復(fù)次 數(shù)。步驟S103 從引用關(guān)系表中根據(jù)該主題中的用戶的引用關(guān)系,建立由被引用者指 向引用者的有向連接。連邊的權(quán)值為引用者引用被引用者的次數(shù)。若步驟S103與步驟S102得到的用戶關(guān)系產(chǎn)生重疊,則將權(quán)值求和。重復(fù)步驟S101-S103直至所有主題中的用戶關(guān)系都處理完成,從而構(gòu)建出用戶社 會網(wǎng)絡(luò)。網(wǎng)絡(luò)關(guān)系的存儲采用三元組實(shí)現(xiàn),以一張數(shù)據(jù)表的形式保存在數(shù)據(jù)庫中。該表數(shù)據(jù)結(jié)構(gòu)如表1所示。其中memberA表示用戶A,memberB表示用戶B,relationValue4表示 用戶A和用戶B之間回復(fù)或者引用的次數(shù)。表 1 通過上述方法構(gòu)建出基于回復(fù)和引用的用戶社會網(wǎng)絡(luò)是有向帶權(quán)網(wǎng)絡(luò),網(wǎng)絡(luò)中的 節(jié)點(diǎn)表示論壇的用戶,邊的方向表示用戶之間的回復(fù)和引用關(guān)系,關(guān)系強(qiáng)度用通過回復(fù)和 引用次數(shù)形成的權(quán)值來表示。本發(fā)明實(shí)施例中,構(gòu)建社會網(wǎng)絡(luò)的目的是為了發(fā)現(xiàn)用戶關(guān)系,而圖中的方向?qū)W(wǎng) 絡(luò)關(guān)系的存在沒有特別的影響,所以為了更好地挖掘用戶關(guān)系,本發(fā)明實(shí)施例在不改變網(wǎng) 絡(luò)分布的前提下對網(wǎng)絡(luò)進(jìn)行改造,將網(wǎng)絡(luò)中的方向刪除,同時將兩個用戶間的關(guān)系進(jìn)行修 正,從而將有向帶權(quán)網(wǎng)絡(luò)改造為無向帶權(quán)網(wǎng)絡(luò)。修正方法為,將原有向連接兩端點(diǎn)間的單向連接次數(shù)進(jìn)行合并,例如,假設(shè)用戶1 對用戶2進(jìn)行了 3次回復(fù),而用戶2對用戶1進(jìn)行了 1次回復(fù)和1次引用,那么用戶1和用 戶2之間的關(guān)系強(qiáng)度為3+1+1 = 5。在數(shù)據(jù)表中的表現(xiàn)為去除用戶與自己的關(guān)系,對于確定 的用戶A和用戶B來說,二者之間的關(guān)系是唯一且對稱的。本發(fā)明實(shí)施例所提供的方法,以網(wǎng)絡(luò)中的帖子為信息單元,基于網(wǎng)絡(luò)用戶間回復(fù) 和引用而構(gòu)建出社會網(wǎng)絡(luò),客觀地反映出了網(wǎng)絡(luò)用戶之間的關(guān)系。本發(fā)明實(shí)施例還提供一種從社會網(wǎng)絡(luò)挖掘局部社區(qū)的方法。社會網(wǎng)絡(luò)直觀地體現(xiàn)了網(wǎng)絡(luò)用戶之間的連接關(guān)系,這些關(guān)系錯綜復(fù)雜。所述局部 社區(qū)挖掘就是要從社會網(wǎng)絡(luò)中將聯(lián)系最為緊密的網(wǎng)絡(luò)用戶組成的局部社區(qū)挖掘出來,一般 來說,這樣的社區(qū)中的用戶具有較為接近的具有某種特征,例如較為相同的興趣點(diǎn)等等,從 而為有針對性地對這個局部社區(qū)中的網(wǎng)絡(luò)用戶提供后續(xù)的服務(wù),提高網(wǎng)絡(luò)用戶的體驗(yàn)奠定 ■石出。為了使社區(qū)挖掘方法更為清楚明白,下面先介紹幾個相關(guān)概念。1)節(jié)點(diǎn)強(qiáng)度即與某節(jié)點(diǎn)相連的邊的權(quán)值之和,用符號I表示。例如,在圖3中,節(jié)點(diǎn)1和節(jié)點(diǎn)2,節(jié)點(diǎn)4,節(jié)點(diǎn)6有連接關(guān)系,連接關(guān)系的權(quán)值分別 為3,4,6,那么節(jié)點(diǎn)1的節(jié)點(diǎn)強(qiáng)度就為3+4+6 = 13。同理節(jié)點(diǎn)6的節(jié)點(diǎn)強(qiáng)度為6+5+1 = 12。2)節(jié)點(diǎn)對社區(qū)的貢獻(xiàn)度指節(jié)點(diǎn)與社區(qū)聯(lián)系的緊密程度,其計算公式如式1所 示r(,,c) = ip 式 1其中,所述T(i,。)表示節(jié)點(diǎn)i對社區(qū)C的貢獻(xiàn)度;1(“)為節(jié)點(diǎn)i與社區(qū)C的聯(lián)系強(qiáng) 度,即節(jié)點(diǎn)i與社區(qū)C中所有節(jié)點(diǎn)的關(guān)聯(lián)節(jié)點(diǎn)強(qiáng)度;所述Ii為節(jié)點(diǎn)i的節(jié)點(diǎn)強(qiáng)度。例如在圖3中,假設(shè)節(jié)點(diǎn)1,4,5,6已經(jīng)合并為一個社區(qū)C,現(xiàn)在社區(qū)C的鄰接點(diǎn)為節(jié)點(diǎn)2和節(jié)點(diǎn)3。那么節(jié)點(diǎn)2對社區(qū)C的貢獻(xiàn)度=(3+1)/(3+1+2) = 2/3,同理節(jié)點(diǎn)3對 社區(qū)C的貢獻(xiàn)度=2/(2+2) = 1/2。3)模塊度模塊度用來衡量網(wǎng)絡(luò)的某一個社區(qū)劃分結(jié)果的優(yōu)劣程度。如果一個社會網(wǎng)絡(luò)所劃 分的社區(qū)內(nèi)部有很多連邊,而社區(qū)與社區(qū)之間的連邊很少,那么模塊度較大,社區(qū)劃分結(jié)果 較好。本發(fā)明實(shí)施例所提出的社區(qū)模塊度的計算公式如式2所示 其中,所述ei為社區(qū)i內(nèi)部所有邊的權(quán)值之和與所述社會網(wǎng)絡(luò)所有邊的權(quán)值之和 的比值;所述α i為所述社會網(wǎng)絡(luò)中所有與所述社區(qū)i相連的邊的權(quán)值之和與所述社會網(wǎng) 絡(luò)所有邊的權(quán)值之和的比值;所述Ni為所述社區(qū)i內(nèi)部節(jié)點(diǎn)總數(shù);所述N。ut為所述社會網(wǎng) 絡(luò)中所有與所述社區(qū)i相連的節(jié)點(diǎn)數(shù)與社區(qū)i的節(jié)點(diǎn)數(shù)之和。參見圖4,本發(fā)明實(shí)施例所提供的一種社會網(wǎng)絡(luò)中的社區(qū)挖掘方法包括步驟401 計算所述社會網(wǎng)絡(luò)中的各個節(jié)點(diǎn)的節(jié)點(diǎn)強(qiáng)度。本發(fā)明實(shí)施例中,首先根據(jù)前述社會網(wǎng)絡(luò)建立方法構(gòu)建社會網(wǎng)絡(luò),該社會網(wǎng)絡(luò)由 網(wǎng)絡(luò)節(jié)點(diǎn)和節(jié)點(diǎn)間的連接構(gòu)成。其中,所述網(wǎng)絡(luò)節(jié)點(diǎn)即為網(wǎng)絡(luò)用戶,而節(jié)點(diǎn)間的連接即為用 戶之間的連接關(guān)系,通過用戶之間針對一個或者多個主題的回復(fù)或者引用產(chǎn)生。本發(fā)明實(shí) 施例中的社會網(wǎng)絡(luò)的連接是有權(quán)值的,該權(quán)值表示網(wǎng)絡(luò)節(jié)點(diǎn)之間的連接強(qiáng)度,其實(shí)質(zhì)是網(wǎng) 絡(luò)用戶之間針對一個或者多個主題相互回復(fù)或者引用的次數(shù)之和。如前所述,節(jié)點(diǎn)i的節(jié)點(diǎn)強(qiáng)度是與節(jié)點(diǎn)i所連接的所有邊的權(quán)值之和。按照式2 進(jìn)行計算即可。所述節(jié)點(diǎn)強(qiáng)度實(shí)際上是節(jié)點(diǎn)i與所述社會網(wǎng)絡(luò)中其他節(jié)點(diǎn)的連接強(qiáng)度。步驟402 根據(jù)節(jié)點(diǎn)強(qiáng)度選取初始節(jié)點(diǎn),以所述初始節(jié)點(diǎn)為基礎(chǔ),根據(jù)當(dāng)前社區(qū)的 模塊度對當(dāng)前社區(qū)進(jìn)行擴(kuò)展直至當(dāng)前社區(qū)的模塊度達(dá)到極大值,模塊度達(dá)到極大值的社區(qū) 即為待挖掘社區(qū)。為使本發(fā)明實(shí)施例所提供的社區(qū)挖掘方法更加清楚,下面結(jié)合圖5,以圖6所示的 社會網(wǎng)絡(luò)為例對社區(qū)挖掘方法進(jìn)行詳細(xì)說明。步驟501 計算各個節(jié)點(diǎn)的節(jié)點(diǎn)強(qiáng)度。步驟502 選取節(jié)點(diǎn)強(qiáng)度最小的節(jié)點(diǎn)作為初始節(jié)點(diǎn),以所述初始節(jié)點(diǎn)為基礎(chǔ)形成 當(dāng)前社區(qū)。步驟503 從當(dāng)前社區(qū)的鄰居節(jié)點(diǎn)中選擇對當(dāng)前社區(qū)貢獻(xiàn)度最大的節(jié)點(diǎn)加入當(dāng)前 社區(qū)。從初始節(jié)點(diǎn)開始,對當(dāng)前社區(qū)進(jìn)行不斷擴(kuò)展。假設(shè)圖6中的節(jié)點(diǎn)1、2、3已經(jīng)合并成一個社區(qū)C,那么當(dāng)前社區(qū)就是社區(qū)C。社區(qū) C的鄰居節(jié)點(diǎn)有節(jié)點(diǎn)5和節(jié)點(diǎn)4,從中選擇對社區(qū)C貢獻(xiàn)最大的節(jié)點(diǎn),即按照式1分別計算 節(jié)點(diǎn)4和節(jié)點(diǎn)5對社區(qū)C的貢獻(xiàn)度。其中T(4,c) = (4+5)/(4+5+1+1) = 9/ll,T(5,c) = (3+1) / (3+1+2+2) = 1/2,因?yàn)?T(4,c) > Τ(5,β,所以選擇節(jié)點(diǎn)4加入到社區(qū)C中。步驟504 計算節(jié)點(diǎn)加入前后當(dāng)前社區(qū)的模塊度。
步驟505 判斷當(dāng)前社區(qū)的模塊度是否達(dá)到極大值;如果是,進(jìn)入步驟506 ;否則進(jìn) 入步驟503。要判斷當(dāng)前社區(qū)的模塊度是否達(dá)到極大值,就需要將加入新節(jié)點(diǎn)后的社區(qū)的模塊 度與加入新節(jié)點(diǎn)前的社區(qū)的模塊度進(jìn)行對比,如果加入新節(jié)點(diǎn)后社區(qū)模塊度大于加入新節(jié) 點(diǎn)前的模塊度,那說明社區(qū)還處于增長狀態(tài);當(dāng)時,如果加入新節(jié)點(diǎn)后社區(qū)模塊度小于加入 新節(jié)點(diǎn)前的模塊度,則說明社區(qū)的增長在加入新節(jié)點(diǎn)前已經(jīng)達(dá)到極限,加入新節(jié)點(diǎn)前的社 區(qū)即為待挖掘社區(qū)。將節(jié)點(diǎn)4加入社區(qū)C后,為了判斷此時社區(qū)C的模塊度是否達(dá)到極值,就需要根據(jù) 式2分別計算節(jié)點(diǎn)4加入社區(qū)C之前社區(qū)C的模塊度Ql和節(jié)點(diǎn)4加入社區(qū)C之后社區(qū)C 的模塊度Q2,其中,
顯然,Q2>Q1,所
以社區(qū)C的模塊度沒有達(dá)到極值。此時,社區(qū)C包含節(jié)點(diǎn)1、2、3、4共4個節(jié)點(diǎn),進(jìn)入步驟 503,繼續(xù)向社區(qū)C中加入節(jié)點(diǎn),直至社區(qū)C的模塊度達(dá)到極大值。步驟506 模塊度達(dá)到極大值的社區(qū)即為待挖掘社區(qū),將待挖掘社區(qū)的節(jié)點(diǎn)和邊 從社會網(wǎng)絡(luò)中移除。步驟507 將待挖掘社區(qū)移除后產(chǎn)生的孤立節(jié)點(diǎn)從所述社會網(wǎng)絡(luò)中移除并加入待 挖掘社區(qū)。仍然以圖6為例,假設(shè)包含節(jié)點(diǎn)1 4的社區(qū)C的模塊度已經(jīng)達(dá)到極大值,此時的 社區(qū)C即為待挖掘社區(qū),將社區(qū)C從社會網(wǎng)絡(luò)中移除之后,節(jié)點(diǎn)6和節(jié)點(diǎn)7成為孤立節(jié)點(diǎn), 根據(jù)步驟507將這兩個節(jié)點(diǎn)也從社會網(wǎng)絡(luò)中移除,加入到社區(qū)C中,此時社區(qū)C所包含的節(jié) 點(diǎn)為節(jié)點(diǎn)1 節(jié)點(diǎn)4、節(jié)點(diǎn)6和節(jié)點(diǎn)7共6個節(jié)點(diǎn)。步驟508 檢查所述社會網(wǎng)絡(luò)中是否還有剩余節(jié)點(diǎn),如果是,進(jìn)入步驟502 ;否則,
結(jié)束流程。本發(fā)明實(shí)施例所提供的方法,能夠有效地從社會網(wǎng)絡(luò)中發(fā)現(xiàn)具有某種特征的用戶 群或用戶社區(qū),且能夠基于這些具有不同特征的用戶群或社區(qū),提供更有價值的服務(wù),比如 信息傳播、業(yè)務(wù)推薦和朋友推薦等。與方法實(shí)施例相對應(yīng),本發(fā)明實(shí)施例還提供一種建立社會網(wǎng)絡(luò)的系統(tǒng),參見圖7, 該系統(tǒng)包括存儲單元701,用于從信息單元中提取并保存相互關(guān)聯(lián)的數(shù)據(jù);所述信息單元為網(wǎng)頁中的帖子,所述相互關(guān)聯(lián)的數(shù)據(jù)包括帖子的主題標(biāo)識、主題 相關(guān)用戶的用戶標(biāo)識以及主題相關(guān)用戶之間相互溝通的次數(shù)。優(yōu)選地,在本發(fā)明的另一實(shí)施例中,可以將以表格的形式將所述相互關(guān)聯(lián)的數(shù)據(jù) 存儲在數(shù)據(jù)庫中,以便后續(xù)快速地查找和使用。例如,在本發(fā)明實(shí)施例中,建立一個主題信 息表(topicinfo)來記錄所有的主題的信息,包括主題編號,對應(yīng)的主題發(fā)起者的編號等 信息。建立一個主題用戶表(topicanduser)來記錄主題編號以及主題參與者編號等信息; 建立一個引用關(guān)系表(quotation)來記錄主題中用戶間的引用關(guān)系。構(gòu)建單元702,用于根據(jù)所述存儲單元保存的相互關(guān)聯(lián)的數(shù)據(jù)確定網(wǎng)絡(luò)用戶之間 的關(guān)系,根據(jù)所述網(wǎng)絡(luò)用戶之間的關(guān)系建立所述社會網(wǎng)絡(luò)。
進(jìn)一步地,所述構(gòu)建單元703包括第一構(gòu)建子單元7021,用于根據(jù)保存的某個帖子的主題標(biāo)識、主題相關(guān)用戶的用 戶標(biāo)識,確定當(dāng)前主題的發(fā)起者以及參與者;第二構(gòu)建子單元7022,用于根據(jù)所述當(dāng)前主題相關(guān)用戶相互溝通的次數(shù)建立當(dāng)前 主題相關(guān)用戶之間的連接關(guān)系,以便根據(jù)所述連接關(guān)系形成社會網(wǎng)絡(luò)。所述主題相關(guān)用戶通過對所述主題進(jìn)行回復(fù)或者相互之間的引用進(jìn)行溝通。更進(jìn)一步地,所述第二構(gòu)建子單元7022包括第一連接模塊M1,用于根據(jù)主題相關(guān)用戶對所述主題進(jìn)行回復(fù)建立由主題發(fā)起者 指向主題參與者的有向連接,連接的權(quán)值為主題參與者對主題發(fā)起者的回復(fù)次數(shù);第二連接模塊M2,用于根據(jù)主題相關(guān)用戶相互之間的引用建立被引用者指向引用 者的有向連接,連接的權(quán)值為引用者引用被引用者的次數(shù)。本發(fā)明實(shí)施例所提供的系統(tǒng)構(gòu)建出用戶社會網(wǎng)絡(luò)是有向帶權(quán)網(wǎng)絡(luò),網(wǎng)絡(luò)中的節(jié)點(diǎn) 表示論壇的用戶,邊的方向表示用戶之間的回復(fù)和引用關(guān)系,關(guān)系強(qiáng)度用通過回復(fù)和引用 次數(shù)形成的權(quán)值來表示。本發(fā)明實(shí)施例中,構(gòu)建社會網(wǎng)絡(luò)的目的是為了發(fā)現(xiàn)網(wǎng)絡(luò)用戶間的關(guān)系,而圖中的 方向?qū)W(wǎng)絡(luò)關(guān)系的存在沒有特別的影響,在本發(fā)明另一實(shí)施例中,在不改變網(wǎng)絡(luò)分布的前 提下對網(wǎng)絡(luò)進(jìn)行改造,將網(wǎng)絡(luò)中的方向刪除,同時將兩個用戶間的關(guān)系進(jìn)行修正,從而將有 向帶權(quán)網(wǎng)絡(luò)改造為無向帶權(quán)網(wǎng)絡(luò)。即圖7所示的系統(tǒng)還包括修正單元703,用于刪除所述第一連接模塊和第二連接模塊建立的有向連接的方 向,將原有向連接兩端點(diǎn)間的單向連接次數(shù)進(jìn)行合并。本發(fā)明實(shí)施例所提供的系統(tǒng),以網(wǎng)絡(luò)中的帖子為信息單元,基于網(wǎng)絡(luò)用戶間回復(fù) 和引用而構(gòu)建出社會網(wǎng)絡(luò),客觀地反映出了網(wǎng)絡(luò)用戶之間的關(guān)系。參見圖8,本發(fā)明實(shí)施例還提供一種網(wǎng)絡(luò)社區(qū)挖掘系統(tǒng),該系統(tǒng)包括統(tǒng)計單元801,用于計算所述社會網(wǎng)絡(luò)中的各個節(jié)點(diǎn)的節(jié)點(diǎn)強(qiáng)度,某個節(jié)點(diǎn)的節(jié)點(diǎn) 強(qiáng)度為所有與該節(jié)點(diǎn)相連的邊的權(quán)值之和。挖掘單元802,用于根據(jù)所述統(tǒng)計單元計算的節(jié)點(diǎn)強(qiáng)度選取初始節(jié)點(diǎn),以所述初始 節(jié)點(diǎn)為基礎(chǔ),根據(jù)當(dāng)前社區(qū)的模塊度對當(dāng)前社區(qū)進(jìn)行擴(kuò)展直至當(dāng)前社區(qū)的模塊度達(dá)到極大 值,模塊度達(dá)到極大值的社區(qū)即為待挖掘社區(qū)。移除單元803,用于將所述待挖掘社區(qū)關(guān)聯(lián)的節(jié)點(diǎn)和邊從所述社會網(wǎng)絡(luò)中移除。進(jìn)一步地,參見圖9,所述挖掘單元802包括第一選取子單元8021,用于根據(jù)所述統(tǒng)計單元計算的節(jié)點(diǎn)強(qiáng)度選取初始節(jié)點(diǎn);第二選取子單元8022,用于計算與所述第一選取子單元8021選取的初始節(jié)點(diǎn)相 連的所有節(jié)點(diǎn)對當(dāng)前社區(qū)的貢獻(xiàn)度,選取所述貢獻(xiàn)度值最大的節(jié)點(diǎn)加入當(dāng)前社區(qū);判斷子單元8023,用于計算當(dāng)前社區(qū)的模塊度,判斷當(dāng)前社區(qū)的模塊度是否達(dá)到 極大值;控制子單元8024,用于在判斷子單元確定當(dāng)前社區(qū)的模塊度到極大值時結(jié)束社區(qū) 挖掘,模塊度達(dá)到極大值的社區(qū)即為待挖掘社區(qū)。優(yōu)選地,所述控制子單元8024,還用于在判斷子單元8023確定當(dāng)前社區(qū)的模塊度 未到極大值時將當(dāng)前社區(qū)信息輸入所述第二選取子單元8022 ;
12
所述第二選取子單元8022,還用于根據(jù)所述控制子單元8024輸入的當(dāng)前社區(qū)的 信息,計算與當(dāng)前社區(qū)相連的所有節(jié)點(diǎn)對當(dāng)前社區(qū)的貢獻(xiàn)度,選取所述貢獻(xiàn)度值最大的節(jié) 點(diǎn)加入當(dāng)前社區(qū)。為了進(jìn)一步對挖掘到的社區(qū)進(jìn)行完善,圖8所示的系統(tǒng)還可以包括修正單元804,用于將所述移除單元操作后產(chǎn)生的孤立節(jié)點(diǎn)從所述社會網(wǎng)絡(luò)中移 除并加入所述待挖掘社區(qū)。為了對社會網(wǎng)絡(luò)所包含的節(jié)點(diǎn)進(jìn)行完整的挖掘,當(dāng)某個社區(qū)被挖掘后,還要繼續(xù) 對社會網(wǎng)絡(luò)中剩余的節(jié)點(diǎn)進(jìn)行考察,故在本發(fā)明另一實(shí)施例中,圖8所示的系統(tǒng)還包括檢測單元805,用于檢測當(dāng)前社會網(wǎng)絡(luò)是否還有剩余節(jié)點(diǎn),如果有,將剩余節(jié)點(diǎn)信 息發(fā)送給所述挖掘單元的第一選取子單元8021,啟動所述第一選取子單元,繼續(xù)進(jìn)行社區(qū) 挖掘。本發(fā)明實(shí)施例所提供的系統(tǒng),能夠有效地從社會網(wǎng)絡(luò)中發(fā)現(xiàn)具有某種特征的用戶 群或用戶社區(qū),且能夠基于這些具有不同特征的用戶群或社區(qū),提供更有價值的服務(wù),比如 信息傳播、業(yè)務(wù)推薦和朋友推薦等。本發(fā)明可以在由計算機(jī)執(zhí)行的計算機(jī)可執(zhí)行指令的一般上下文中描述,例如程序 模塊。一般地,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對象、組 件、數(shù)據(jù)結(jié)構(gòu)等等。也可以在分布式計算環(huán)境中實(shí)踐本發(fā)明,在這些分布式計算環(huán)境中,由 通過通信網(wǎng)絡(luò)而被連接的遠(yuǎn)程處理設(shè)備來執(zhí)行任務(wù)。在分布式計算環(huán)境中,程序模塊可以 位于包括存儲設(shè)備在內(nèi)的本地和遠(yuǎn)程計算機(jī)存儲介質(zhì)中。以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人 員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤飾,這些改進(jìn)和潤飾也應(yīng) 視為本發(fā)明的保護(hù)范圍。
權(quán)利要求
一種社會網(wǎng)絡(luò)建立方法,其特征在于,包括從信息單元中提取并保存相互關(guān)聯(lián)的數(shù)據(jù);根據(jù)保存的相互關(guān)聯(lián)的數(shù)據(jù)確定網(wǎng)絡(luò)用戶之間的關(guān)系,根據(jù)所述網(wǎng)絡(luò)用戶之間的關(guān)系建立所述社會網(wǎng)絡(luò)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述信息單元為網(wǎng)頁中的帖子,所述相互 關(guān)聯(lián)的數(shù)據(jù)包括帖子的主題標(biāo)識、主題相關(guān)用戶的用戶標(biāo)識、以及主題相關(guān)用戶之間相互 溝通的次數(shù),所述主題相關(guān)用戶包括主題的發(fā)起者以及主題的參與者。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)保存的相互關(guān)聯(lián)的數(shù)據(jù)確定網(wǎng) 絡(luò)用戶之間的關(guān)系,根據(jù)所述網(wǎng)絡(luò)用戶之間的關(guān)系建立所述社會網(wǎng)絡(luò)包括根據(jù)保存的某個帖子的主題標(biāo)識、主題相關(guān)用戶的用戶標(biāo)識,確定當(dāng)前主題的發(fā)起者 以及參與者;根據(jù)所述主題相關(guān)用戶之間溝通的次數(shù)建立當(dāng)前主題相關(guān)用戶之間的連接關(guān)系;當(dāng)所保存的相關(guān)數(shù)據(jù)中的所有主題相關(guān)用戶之間的連接關(guān)系都建立完成時形成的網(wǎng) 絡(luò)即社會網(wǎng)絡(luò)。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述主題相關(guān)用戶通過對所述主題進(jìn)行 回復(fù)或者相互之間的引用進(jìn)行溝通。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,根據(jù)所述主題相關(guān)用戶之間相互溝通的 次數(shù)建立當(dāng)前主題相關(guān)用戶之間的連接關(guān)系包括根據(jù)主題相關(guān)用戶對所述主題進(jìn)行回復(fù)建立由主題發(fā)起者指向主題參與者的有向連 接,連接的權(quán)值為主題參與者對主題發(fā)起者的回復(fù)次數(shù);根據(jù)主題相關(guān)用戶相互之間的引用建立被引用者指向引用者的有向連接,連接的權(quán)值 為引用者引用被引用者的次數(shù)。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,還包括刪除所述有向連接的方向,將原有向連接兩端點(diǎn)間的單向連接次數(shù)進(jìn)行合并。
7.根據(jù)權(quán)利要求1 6任意一項所述的方法,其特征在于,還包括計算所述社會網(wǎng)絡(luò)中的各個節(jié)點(diǎn)的節(jié)點(diǎn)強(qiáng)度,某個節(jié)點(diǎn)的節(jié)點(diǎn)強(qiáng)度為所有與該節(jié)點(diǎn)相 連的邊的權(quán)值之和;根據(jù)節(jié)點(diǎn)強(qiáng)度選取初始節(jié)點(diǎn),以所述初始節(jié)點(diǎn)為基礎(chǔ)形成當(dāng)前社區(qū),根據(jù)當(dāng)前社區(qū)的 模塊度對當(dāng)前社區(qū)進(jìn)行擴(kuò)展直至當(dāng)前社區(qū)的模塊度達(dá)到極大值,模塊度達(dá)到極大值的社區(qū) 即為待挖掘社區(qū)。
8.—種社會網(wǎng)絡(luò)中的社區(qū)挖掘方法,其特征在于,包括計算社會網(wǎng)絡(luò)中的各個節(jié)點(diǎn)的節(jié)點(diǎn)強(qiáng)度,某個節(jié)點(diǎn)的節(jié)點(diǎn)強(qiáng)度為所有與該節(jié)點(diǎn)相連的 邊的權(quán)值之和;根據(jù)節(jié)點(diǎn)強(qiáng)度選取初始節(jié)點(diǎn),以所述初始節(jié)點(diǎn)為基礎(chǔ)形成當(dāng)前社區(qū),根據(jù)當(dāng)前社區(qū)的 模塊度對當(dāng)前社區(qū)進(jìn)行擴(kuò)展直至當(dāng)前社區(qū)的模塊度達(dá)到極大值,模塊度達(dá)到極大值的社區(qū) 即為待挖掘社區(qū)。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,以所述初始節(jié)點(diǎn)為基礎(chǔ)形成當(dāng)前社區(qū),根 據(jù)當(dāng)前社區(qū)的模塊度對當(dāng)前社區(qū)進(jìn)行擴(kuò)展直至當(dāng)前社區(qū)的模塊度達(dá)到極大值包括計算與所述初始節(jié)點(diǎn)相連的所有節(jié)點(diǎn)對當(dāng)前社區(qū)的貢獻(xiàn)度,選取所述貢獻(xiàn)度值最大的節(jié)點(diǎn)加入當(dāng)前社區(qū);根據(jù)當(dāng)前社區(qū)中的節(jié)點(diǎn)強(qiáng)度計算當(dāng)前社區(qū)的模塊度;若當(dāng)前社區(qū)的模塊度達(dá)到極大值,則模塊度達(dá)到極大值的社區(qū)即為待挖掘社區(qū),則當(dāng) 前社區(qū)即為待挖掘社區(qū);否則,以當(dāng)前社區(qū)為基礎(chǔ),計算與當(dāng)前社區(qū)相連的所有節(jié)點(diǎn)對當(dāng)前社區(qū)的貢獻(xiàn)度,選取 所述貢獻(xiàn)度值最大的節(jié)點(diǎn)加入當(dāng)前社區(qū),進(jìn)入根據(jù)當(dāng)前社區(qū)中的節(jié)點(diǎn)強(qiáng)度計算當(dāng)前社區(qū)的 模塊度的步驟。
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述貢獻(xiàn)度通過如下方法計算某一節(jié)點(diǎn)i對社區(qū)C的節(jié)點(diǎn)貢獻(xiàn)度,其中所述為節(jié)點(diǎn)i與社區(qū)C中所有節(jié)點(diǎn)的關(guān)聯(lián)節(jié)點(diǎn)強(qiáng)度;所述Ii為節(jié)點(diǎn)i的節(jié)點(diǎn)強(qiáng)度。
11.根據(jù)權(quán)利要求8所述的方法,其特征在于,還包括,將所述待挖掘社區(qū)關(guān)聯(lián)的節(jié)點(diǎn)和邊從所述社會網(wǎng)絡(luò)中移除。
12.根據(jù)權(quán)利要求11所述的方法,其特征在于,還包括將所述待挖掘社區(qū)關(guān)聯(lián)的節(jié)點(diǎn)移除后產(chǎn)生的孤立節(jié)點(diǎn)從所述社會網(wǎng)絡(luò)中移除并加入 所述待挖掘社區(qū)。
13.根據(jù)權(quán)利要求12所述的方法,其特征在于,還包括判斷當(dāng)前社會網(wǎng)絡(luò)是否還有剩余節(jié)點(diǎn),如果有,進(jìn)入根據(jù)所述剩余節(jié)點(diǎn)的節(jié)點(diǎn)強(qiáng)度選 取初始節(jié)點(diǎn)的步驟。
14.根據(jù)權(quán)利要求8 13任意一項所述的方法,其特征在于,所述模塊度根據(jù)如下方法 計算社區(qū)i的模塊度β唭中in iy out所述ei為社區(qū)i內(nèi)部所有邊的權(quán)值之和與所述社會網(wǎng)絡(luò)所有邊的權(quán)值之和的比值;所 述α i為所述社會網(wǎng)絡(luò)中所有與所述社區(qū)i相連的邊的權(quán)值之和與所述社會網(wǎng)絡(luò)所有邊的 權(quán)值之和的比值;所述Nin為所述社區(qū)i內(nèi)部節(jié)點(diǎn)總數(shù);所述N。ut為所述社會網(wǎng)絡(luò)中所有與 所述社區(qū)i相連的節(jié)點(diǎn)數(shù)與社區(qū)i的節(jié)點(diǎn)數(shù)之和。
15.一種建立論壇用戶社會網(wǎng)絡(luò)的系統(tǒng),其特征在于,包括存儲單元,用于從信息單元中提取并保存相互關(guān)聯(lián)的數(shù)據(jù);構(gòu)建單元,用于根據(jù)所述存儲單元保存的相互關(guān)聯(lián)的數(shù)據(jù)確定網(wǎng)絡(luò)用戶之間的關(guān)系, 根據(jù)所述網(wǎng)絡(luò)用戶之間的關(guān)系建立所述社會網(wǎng)絡(luò)。
16.根據(jù)權(quán)利要求15所述的系統(tǒng),其特征在于,所述信息單元為網(wǎng)頁中的帖子,所述相 互關(guān)聯(lián)的數(shù)據(jù)包括帖子的主題標(biāo)識、主題相關(guān)用戶的用戶標(biāo)識以及主題相關(guān)用戶之間相 互溝通的次數(shù),所述主題相關(guān)用戶包括主題的發(fā)起者以及主題的參與者。
17.根據(jù)權(quán)利要求16所述的系統(tǒng),其特征在于,所述構(gòu)建單元包括第一構(gòu)建子單元,用于根據(jù)保存的某個帖子的主題標(biāo)識、主題相關(guān)用戶的用戶標(biāo)識,確 定當(dāng)前主題的發(fā)起者以及參與者;第二構(gòu)建子單元,用于根據(jù)所述當(dāng)前主題相關(guān)用戶相互溝通的次數(shù)建立當(dāng)前主題相關(guān)用戶之間的連接關(guān)系,以便根據(jù)所述連接關(guān)系形成社會網(wǎng)絡(luò)。
18.根據(jù)權(quán)利要求17所述的系統(tǒng),其特征在于,所述主題,所述主題相關(guān)用戶包括主題 的發(fā)起者以及主題的參與者通過對所述主題進(jìn)行回復(fù)或相互之間的者引用進(jìn)行溝通。
19.根據(jù)權(quán)利要求18所述的系統(tǒng),其特征在于,所述第二構(gòu)建子單元包括第一連接模塊,用于根據(jù)主題相關(guān)用戶對所述主題進(jìn)行回復(fù)建立由主題發(fā)起者指向主 題參與者的有向連接,連接的權(quán)值為主題參與者對主題發(fā)起者的回復(fù)次數(shù);第二連接模塊,用于根據(jù)主題相關(guān)用戶相互之間的引用建立被引用者指向引用者的有 向連接,連接的權(quán)值為引用者引用被引用者的次數(shù)。
20.根據(jù)權(quán)利要求19所述的系統(tǒng),其特征在于,還包括修正單元,用于刪除所述第一連接模塊和第二連接模塊建立的有向連接的方向,將原 有向連接兩端點(diǎn)間的單向連接次數(shù)進(jìn)行合并。
21.根據(jù)權(quán)利要求15 20任意一項所述的系統(tǒng),其特征在于,還包括挖掘子系統(tǒng),用于計算所述社會網(wǎng)絡(luò)中的各個節(jié)點(diǎn)的節(jié)點(diǎn)強(qiáng)度;根據(jù)節(jié)點(diǎn)強(qiáng)度選取初 始節(jié)點(diǎn),以所述初始節(jié)點(diǎn)為基礎(chǔ),根據(jù)當(dāng)前社區(qū)的模塊度對當(dāng)前社區(qū)進(jìn)行擴(kuò)展直至當(dāng)前社 區(qū)的模塊度達(dá)到極大值,模塊度達(dá)到極大值的社區(qū)即為待挖掘社區(qū)。
22.一種社會網(wǎng)絡(luò)中的社區(qū)挖掘系統(tǒng),其特征在于,包括統(tǒng)計單元,用于計算所述社會網(wǎng)絡(luò)中的各個節(jié)點(diǎn)的節(jié)點(diǎn)強(qiáng)度,某個節(jié)點(diǎn)的節(jié)點(diǎn)強(qiáng)度為 所有與該節(jié)點(diǎn)相連的邊的權(quán)值之和;挖掘單元,用于根據(jù)所述統(tǒng)計單元計算的節(jié)點(diǎn)強(qiáng)度選取初始節(jié)點(diǎn),以所述初始節(jié)點(diǎn)為 基礎(chǔ),根據(jù)當(dāng)前社區(qū)的模塊度對當(dāng)前社區(qū)進(jìn)行擴(kuò)展直至當(dāng)前社區(qū)的模塊度達(dá)到極大值,模 塊度達(dá)到極大值的社區(qū)即為待挖掘社區(qū)。
23.根據(jù)權(quán)利要求22所述的系統(tǒng),其特征在于,所述挖掘單元包括第一選取子單元,用于根據(jù)所述統(tǒng)計單元計算的節(jié)點(diǎn)強(qiáng)度選取的初始節(jié)點(diǎn);第二選取子單元,用于計算與所述第一選取子單元選取的初始節(jié)點(diǎn)相連的所有節(jié)點(diǎn)對 當(dāng)前社區(qū)的貢獻(xiàn)度,選取所述貢獻(xiàn)度值最大的節(jié)點(diǎn)加入當(dāng)前社區(qū);判斷子單元,用于計算當(dāng)前社區(qū)的模塊度,判斷當(dāng)前社區(qū)的模塊度是否達(dá)到極大值;控制子單元,用于在判斷子單元確定當(dāng)前社區(qū)的模塊度到極大值時結(jié)束社區(qū)挖掘,模 塊度達(dá)到極大值的社區(qū)即為待挖掘社區(qū)。
24.根據(jù)權(quán)利要求23所述的系統(tǒng),其特征在于,所述控制子單元,還用于在判斷子單元確定當(dāng)前社區(qū)的模塊度未到極大值時將當(dāng)前社 區(qū)信息輸入所述第二選取子單元;所述第二選取子單元,還用于根據(jù)所述控制子單元輸入的當(dāng)前社區(qū)的信息,計算與當(dāng) 前社區(qū)相連的所有節(jié)點(diǎn)對當(dāng)前社區(qū)的貢獻(xiàn)度,選取所述貢獻(xiàn)度值最大的節(jié)點(diǎn)加入當(dāng)前社 區(qū)。
25.根據(jù)權(quán)利要求23所述的系統(tǒng),其特征在于,所述貢獻(xiàn)度通過如下方法計算某一節(jié)點(diǎn)i對社區(qū)c的節(jié)點(diǎn)貢獻(xiàn)度:r(,,c),其中Λ所述為節(jié)點(diǎn)i與社區(qū)C中所有節(jié)點(diǎn)的關(guān)聯(lián)節(jié)點(diǎn)強(qiáng)度;所述Ii為節(jié)點(diǎn)i的節(jié)點(diǎn)強(qiáng)度。
26.根據(jù)權(quán)利要求22所述的系統(tǒng),其特征在于,還包括,移除單元,用于將所述待挖掘社區(qū)關(guān)聯(lián)的節(jié)點(diǎn)和邊從所述社會網(wǎng)絡(luò)中移除。
27.根據(jù)權(quán)利要求26所述的系統(tǒng),其特征在于,還包括修正單元,用于將所述移除單元操作后產(chǎn)生的孤立節(jié)點(diǎn)從所述社會網(wǎng)絡(luò)中移除并加入 所述待挖掘社區(qū)。
28.根據(jù)權(quán)利要求27所述的系統(tǒng),其特征在于,還包括檢測單元,用于檢測當(dāng)前社會網(wǎng)絡(luò)是否還有剩余節(jié)點(diǎn),如果有,將剩余節(jié)點(diǎn)信息發(fā)送給 所述挖掘單元的第一選取子單元,啟動所述第一選取子單元,繼續(xù)進(jìn)行社區(qū)挖掘。
29.根據(jù)權(quán)利要求22 28任意一項所述的系統(tǒng),其特征在于,所述模塊度根據(jù)如下方 法計算社區(qū)i的模塊度β唭中in iy out所述ei為社區(qū)i內(nèi)部所有邊的權(quán)值之和與所述社會網(wǎng)絡(luò)所有邊的權(quán)值之和的比值;所 述α i為所述社會網(wǎng)絡(luò)中所有與所述社區(qū)i相連的邊的權(quán)值之和與所述社會網(wǎng)絡(luò)所有邊的 權(quán)值之和的比值;所述Nin為所述社區(qū)i內(nèi)部節(jié)點(diǎn)總數(shù);所述N。ut為所述社會網(wǎng)絡(luò)中所有與 所述社區(qū)i相連的節(jié)點(diǎn)數(shù)與社區(qū)i的節(jié)點(diǎn)數(shù)之和。
全文摘要
本發(fā)明實(shí)施例公開了一種社會網(wǎng)絡(luò)建立方法和系統(tǒng)及網(wǎng)絡(luò)中社區(qū)挖掘方法和系統(tǒng),其中,所述社區(qū)挖掘方法包括計算所述社會網(wǎng)絡(luò)中的各個節(jié)點(diǎn)的節(jié)點(diǎn)強(qiáng)度,某個節(jié)點(diǎn)的節(jié)點(diǎn)強(qiáng)度為所有與該節(jié)點(diǎn)相連的邊的權(quán)值之和;根據(jù)節(jié)點(diǎn)強(qiáng)度選取的初始節(jié)點(diǎn),以所述初始節(jié)點(diǎn)為基礎(chǔ),根據(jù)當(dāng)前社區(qū)的模塊度對當(dāng)前社區(qū)進(jìn)行擴(kuò)展直至當(dāng)前社區(qū)的模塊度達(dá)到極大值,模塊度達(dá)到極大值的社區(qū)即為待挖掘社區(qū)。本發(fā)明實(shí)施例所提供的方法,能夠有效地從社會網(wǎng)絡(luò)中發(fā)現(xiàn)具有某種特征的用戶群或用戶社區(qū),且能夠基于這些具有不同特征的用戶群或社區(qū),提供更有價值的服務(wù),比如信息傳播、業(yè)務(wù)推薦和朋友推薦等。
文檔編號G06F17/30GK101887441SQ20091014045
公開日2010年11月17日 申請日期2009年5月15日 優(yōu)先權(quán)日2009年5月15日
發(fā)明者劉茂征 申請人:華為技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
昌宁县| 巨野县| 泽库县| 无为县| 仙游县| 金阳县| 永登县| 昌图县| 堆龙德庆县| 甘德县| 五河县| 通山县| 咸宁市| 田东县| 益阳市| 句容市| 静乐县| 米泉市| 荆门市| 岫岩| 耒阳市| 马关县| 怀化市| 海盐县| 南投市| 浦北县| 莫力| 澳门| 遂宁市| 武宁县| 石屏县| 祁东县| 日喀则市| 平罗县| 保康县| 林西县| 裕民县| 都昌县| 龙南县| 武穴市| 南漳县|