欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于異質圖的社區(qū)發(fā)現方法和裝置與流程

文檔序號:40612359發(fā)布日期:2025-01-07 20:57閱讀:7來源:國知局
基于異質圖的社區(qū)發(fā)現方法和裝置與流程

本說明書一個或多個實施例涉及計算機領域,尤其涉及基于異質圖的社區(qū)發(fā)現方法和裝置。


背景技術:

1、在數學領域,圖是由一組頂點(也稱為節(jié)點或點)以及一組連接這些頂點的邊(也稱為弧或線)組成的組合結構,用來模擬實體之間的關系。在圖結構中具有兩個基本要素,分別為頂點和邊。其中,頂點,是圖中的基本單位,代表實體或對象。邊,也稱為連接邊,是圖中連接兩個頂點的線段,代表頂點之間的某種關系或連接。圖數據中可能包含了用戶的隱私數據。

2、圖結構包括同質圖和異質圖。同質圖:圖中所有頂點屬于同一類別,并具有相同類型的邊。異質圖:圖中包含不同類型的頂點和邊,頂點和邊根據其屬性和意義被劃分為不同的類別。

3、當前,常?;趫D算法來解決社區(qū)發(fā)現等問題??梢岳斫獾氖牵瑘D算法為一系列在圖數據上執(zhí)行的算法。社區(qū)發(fā)現:是在圖數據中識別具有相似性或密集連接的頂點群組的過程,這些群組內部的連接密度比外部的連接密度要高。現有技術中,常?;谕|圖進行社區(qū)發(fā)現,未提供穩(wěn)定有效的基于異質圖的社區(qū)發(fā)現方案。


技術實現思路

1、本說明書一個或多個實施例描述了一種基于異質圖的社區(qū)發(fā)現方法和裝置,能夠得到穩(wěn)定有效的社區(qū)發(fā)現結果。

2、第一方面,提供了一種基于異質圖的社區(qū)發(fā)現方法,所述異質圖包括代表m個用戶的m個實體頂點,以及代表用戶的n類特征的各個可選特征取值的若干個輔助頂點,任一實體頂點與該用戶的實際特征取值對應的輔助頂點之間具有連接邊,方法包括若干輪圖迭代,其中至少一輪圖迭代包括:

3、對于每個代表當前社區(qū)的實體頂點,進行局部移動處理;所述局部移動處理包括:遍歷與其滿足預設關系的各個鄰居實體頂點,確定將該實體頂點移動到鄰居實體頂點所代表社區(qū)后的確定性指標的增益;根據所述增益,確定是否進行所述移動;所述確定性指標根據社區(qū)中各個實體頂點關聯的各類輔助頂點的特征取值的分布而確定;

4、針對局部移動處理后得到的各個社區(qū),將任一社區(qū)中的若干實體頂點聚合成一個新的實體頂點代表該社區(qū)。

5、在一種可能的實施方式中,所述n類特征包括用戶進行預設網絡操作時的操作特征。

6、進一步地,所述預設網絡操作包括登錄操作、領券操作或點擊操作,所述操作特征包括操作基于的應用程序、操作基于的手機型號或操作基于的網絡協議地址。

7、在一種可能的實施方式中,在所述若干輪圖迭代之前,所述方法還包括:

8、初始化m個社區(qū),每個社區(qū)包含一個實體頂點。

9、在一種可能的實施方式中,所述預設關系包括:與其具有至少一個共同連接的輔助頂點的二度鄰居實體頂點;或者,與其具有多個共同連接的輔助頂點的二度鄰居實體頂點。

10、在一種可能的實施方式中,在所述若干輪圖迭代之前,所述方法還包括:

11、若所述異質圖中的第一實體頂點和第二實體頂點之間滿足所述預設關系,則將第一實體頂點和第二實體頂點加入輔助圖中,并在所述輔助圖中添加二者之間的連接邊;

12、所述遍歷與其滿足預設關系的各個鄰居實體頂點,包括:

13、在所述輔助圖中,查找與其具有連接邊的實體頂點,作為與其滿足預設關系的鄰居實體頂點。

14、在一種可能的實施方式中,任一社區(qū)的確定性指標采用如下方式確定:

15、根據社區(qū)中各個實體頂點關聯的任一類輔助頂點的各個特征取值的加權出現次數,確定該社區(qū)中該類輔助頂點的信息熵;信息熵反映了特征取值的分布;

16、根據該類輔助頂點的信息熵,確定該類輔助頂點的確定性指標;其中,信息熵越小,確定性指標越大;

17、基于對各類輔助頂點的確定性指標進行加權求和,得到該社區(qū)的確定性指標。

18、進一步地,所述確定該社區(qū)中該類輔助頂點的信息熵,包括:

19、根據社區(qū)中各個實體頂點關聯的任一類輔助頂點的各個特征取值的加權出現次數與實體頂點數目m的比值,確定各個特征取值的出現概率;

20、根據各個特征取值的出現概率,計算特征取值的不確定性,得到該社區(qū)中該類輔助頂點的初始信息熵;

21、判斷初始信息熵是否小于或等于預設數值;

22、若判斷出初始信息熵小于或等于預設數值,則保留初始信息熵不變;

23、若判斷出初始信息熵大于預設數值,則更新初始信息熵為所述預設數值。

24、進一步地,所述特征取值的加權出現次數采用如下方式確定:

25、根據社區(qū)中各個實體頂點分別連接的所述特征取值對應的輔助頂點的次數,以及連接邊的邊權重,確定所述特征取值的加權出現次數。

26、在一種可能的實施方式中,所述方法還包括:

27、將任一社區(qū)中的若干實體頂點與同一輔助頂點之間的若干連接邊聚合成一個新的連接邊,所述新的連接邊的邊權重為聚合前的若干連接邊的邊權重之和。

28、在一種可能的實施方式中,所述根據所述增益,確定是否進行所述移動,包括:

29、判斷是否存在所述增益為正的鄰居實體頂點;

30、若存在所述增益為正的鄰居實體頂點,則將該實體頂點移動到所述增益最大的鄰居實體頂點所在社區(qū);

31、若不存在所述增益為正的鄰居實體頂點,則不進行所述移動。

32、在一種可能的實施方式中,所述至少一輪圖迭代還包括:

33、判斷當前輪次得到的各個社區(qū)相對于上一輪次得到的各個社區(qū)的社區(qū)數量是否減少;

34、若社區(qū)數量減少,觸發(fā)下一輪次的圖迭代,否則終止圖迭代。

35、在一種可能的實施方式中,所述若干輪圖迭代形成多層級社區(qū),第n+1輪圖迭代得到的社區(qū)與第n輪圖迭代得到的社區(qū)之間形成層級關系。

36、第二方面,提供了一種基于異質圖的社區(qū)發(fā)現裝置,所述異質圖包括代表m個用戶的m個實體頂點,以及代表用戶的n類特征的各個可選特征取值的若干個輔助頂點,任一實體頂點與該用戶的實際特征取值對應的輔助頂點之間具有連接邊,裝置用于執(zhí)行若干輪圖迭代中的至少一輪圖迭代,包括:

37、移動單元,用于對于每個代表當前社區(qū)的實體頂點,進行局部移動處理;所述局部移動處理包括:遍歷與其滿足預設關系的各個鄰居實體頂點,確定將該實體頂點移動到鄰居實體頂點所代表社區(qū)后的確定性指標的增益;根據所述增益,確定是否進行所述移動;所述確定性指標根據社區(qū)中各個實體頂點關聯的各類輔助頂點的特征取值的分布而確定;

38、聚合單元,用于針對所述移動單元進行局部移動處理后得到的各個社區(qū),將任一社區(qū)中的若干實體頂點聚合成一個新的實體頂點代表該社區(qū)。

39、第三方面,提供了一種計算機可讀存儲介質,其上存儲有計算機程序,當所述計算機程序在計算機中執(zhí)行時,令計算機執(zhí)行第一方面的方法。

40、第四方面,提供了一種計算設備,包括存儲器和處理器,所述存儲器中存儲有可執(zhí)行代碼,所述處理器執(zhí)行所述可執(zhí)行代碼時,實現第一方面的方法。

41、通過本說明書實施例提供的方法和裝置,在至少一輪圖迭代中,首先對于每個代表當前社區(qū)的實體頂點,進行局部移動處理;所述局部移動處理包括:遍歷與其滿足預設關系的各個鄰居實體頂點,確定將該實體頂點移動到鄰居實體頂點所代表社區(qū)后的確定性指標的增益;根據所述增益,確定是否進行所述移動;所述確定性指標根據社區(qū)中各個實體頂點關聯的各類輔助頂點的特征取值的分布而確定;然后針對局部移動處理后得到的各個社區(qū),將任一社區(qū)中的若干實體頂點聚合成一個新的實體頂點代表該社區(qū)。由上可見,本說明書實施例,能夠充分利用輔助頂點信息進行社區(qū)發(fā)現,同時避免了將輔助頂點添加到社區(qū)中,有效適配了異質圖結構。此外,提出了一種新的用于社區(qū)發(fā)現的確定性指標的指標計算方式,根據社區(qū)中各個實體頂點關聯的各類輔助頂點的特征取值的分布,來評估該社區(qū)的緊密度,基于確定性指標通過若干輪圖迭代,確定各個實體頂點歸屬的社區(qū),無隨機性問題,多次計算結果一致,從而能夠得到穩(wěn)定有效的社區(qū)發(fā)現結果。

當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
霍林郭勒市| 蛟河市| 东源县| 淮北市| 那坡县| 巴彦县| 肥东县| 扎鲁特旗| 鹤庆县| 松阳县| 当涂县| 井陉县| 获嘉县| 万山特区| 临泽县| 乌什县| 桃园市| 汉中市| 栖霞市| 教育| 江源县| 江陵县| 南涧| 镶黄旗| 山阴县| 漳浦县| 高邮市| 德惠市| 北辰区| 昌江| 外汇| 湘阴县| 永清县| 喀喇沁旗| 武隆县| 大名县| 大庆市| 庐江县| 宾川县| 涞源县| 铁岭县|