本發(fā)明涉及信息處理技術(shù)領(lǐng)域,特別是涉及一種生成用戶組合的方法和裝置。
背景技術(shù):
社交網(wǎng)絡(luò)和其他復(fù)雜網(wǎng)絡(luò)一樣,隨著信息的發(fā)布和交互,其中每個用戶會具有不同的影響力或信息覆蓋人群。重要的用戶可以影響更多的用戶。當(dāng)企業(yè)利用社交網(wǎng)絡(luò)中的信息傳播屬性和重要用戶影響力進行節(jié)目營銷、產(chǎn)品推廣或者輿情分析時,多種情況下需要多個重要用戶的共同作用,并且信息要通過這些用戶在社交網(wǎng)絡(luò)中覆蓋或影響到更多的用戶,即影響力最大化。
為使得影響力實現(xiàn)最大化需要尋找使信息受眾數(shù)量最大化的設(shè)定個數(shù)用戶的用戶組合,在高復(fù)雜度社交網(wǎng)絡(luò)中,現(xiàn)有的方案,得到的結(jié)果經(jīng)常無法近似最優(yōu)解,而且也不具備尋找多個組合的能力。
技術(shù)實現(xiàn)要素:
本發(fā)明實施例所要解決的技術(shù)問題是提供一種生成用戶組合的方法及裝置,從而提升了生成信息受眾數(shù)較多的用戶組合的效率,而且,所得到的用戶組合更接近最優(yōu)用戶組合,提高了在社交網(wǎng)絡(luò)中尋找影響力最大的用戶組合的效率。
為了解決上述問題,本發(fā)明公開了一種生成用戶組合的方法,包括:
步驟101,選擇設(shè)定個數(shù)的用戶組成第一用戶組合;
步驟102,通過更換所述第一用戶組合中的至少一個用戶,生成與所述第一用戶組合用戶數(shù)相同的第二用戶組合;
步驟103,若所述第二用戶組合的信息受眾數(shù)相比于所述第一用戶組合發(fā)生增長,或所述第二用戶組合的信息受眾數(shù)相比于所述第一用戶組合的衰減表征值小于第一設(shè)定閾值,則以所述第二用戶組合替換所述第一用戶組合,所述衰減表征值根據(jù)成反比關(guān)系的衰減調(diào)整參數(shù)計算;
步驟104,迭代執(zhí)行步驟102和步驟103直至最新生成的兩個用戶組合的信息受眾數(shù)的改變量小于第二設(shè)定閾值,將所述第一用戶組合作為所要生成的用戶組合,其中所述衰減調(diào)整參數(shù)在完成設(shè)定次數(shù)的迭代后按設(shè)定速度減小。
優(yōu)選地,所述通過更換所述第一用戶組合中的至少一個用戶,生成與所述第一用戶組合用戶數(shù)相同的第二用戶組合包括:
在所述第二用戶組合的信息受眾數(shù)相比于所述第一用戶組合連續(xù)設(shè)定次數(shù)沒有發(fā)生增長后,通過將所述第一用戶組合中的信息受眾數(shù)最少的至少一個用戶更換為信息受眾數(shù)最多的至少一個用戶,生成與所述第一用戶組合用戶數(shù)相同的所述第二用戶組合。
優(yōu)選地,所述選擇設(shè)定個數(shù)的用戶組成第一用戶組合的步驟之前,所述方法還包括:
抓取社交網(wǎng)絡(luò)信息,所述社交網(wǎng)絡(luò)信息包括信息的內(nèi)容、信息發(fā)布用戶、信息的交互關(guān)系;
根據(jù)所述社交網(wǎng)絡(luò)信息,將直接互動用戶和間接互動用戶確定為信息發(fā)布用戶的受眾。
優(yōu)選地,所述方法包括:
所述直接互動用戶包括與信息發(fā)布用戶具備互動關(guān)系的用戶,所述間接互動用戶包括通過至少一個具備互動關(guān)系的用戶與所述信息發(fā)布用戶關(guān)聯(lián)的用戶。具備互動關(guān)系包括轉(zhuǎn)發(fā)發(fā)布信息,評論發(fā)布信息,互相關(guān)注。
優(yōu)選地,所述選擇設(shè)定個數(shù)的用戶組成第一用戶組合包括:
根據(jù)所述社交網(wǎng)絡(luò)信息,確定信息發(fā)布用戶為信息的初始發(fā)布用戶;
在所述初始發(fā)布用戶中選擇設(shè)定個數(shù)的用戶組成第一用戶組合。
優(yōu)選地,所述選擇設(shè)定個數(shù)的用戶組成第一用戶組合包括:
根據(jù)所述社交網(wǎng)絡(luò)信息,確定符合設(shè)定內(nèi)容特征的信息的特定發(fā)布用戶;
在所述特定發(fā)布用戶中選擇設(shè)定個數(shù)的用戶組成第一用戶組合。
優(yōu)選地,所述根據(jù)所述社交網(wǎng)絡(luò)信息,將直接互動用戶和間接互動用戶確定為信息發(fā)布用戶的受眾包括:
根據(jù)所述社交網(wǎng)絡(luò)信息,查找評論和/或轉(zhuǎn)發(fā)次數(shù)超過設(shè)定次數(shù)的直接互動用戶和間接互動用戶;
將所述查找的直接互動用戶和間接互動用戶確定為信息發(fā)布用戶的受眾。
優(yōu)選地,所述根據(jù)所述社交網(wǎng)絡(luò)信息,將直接互動用戶和間接互動用戶確定為信息發(fā)布用戶的受眾包括:
根據(jù)所述社交網(wǎng)絡(luò)信息,查找在評論和/或轉(zhuǎn)發(fā)中含有與原始信息的內(nèi)容相關(guān)的信息的直接互動用戶和間接互動用戶;
將所述查找的直接互動用戶和間接互動用戶確定為信息發(fā)布用戶的受眾。
相應(yīng)的,本發(fā)明實施例還提供了一種生成用戶組合的裝置,所述裝置包括:
第一用戶組合模塊,用于選擇設(shè)定個數(shù)的用戶組成第一用戶組合;
第二用戶組合模塊,用于通過更換所述第一用戶組合中的至少一個用戶,生成與所述第一用戶組合用戶數(shù)相同的第二用戶組合;
組合替換模塊,用于若所述第二用戶組合的信息受眾數(shù)相比于所述第一用戶組合發(fā)生增長,或所述第二用戶組合的信息受眾數(shù)相比于所述第一用戶組合的衰減表征值小于第一設(shè)定閾值,則以所述第二用戶組合替換所述第一用戶組合,所述衰減表征值根據(jù)成反比關(guān)系的衰減調(diào)整參數(shù)計算;
迭代模塊,用于迭代執(zhí)行第二用戶組合模塊和組合替換模塊直至最新生成的兩個用戶組合的信息受眾數(shù)的改變量小于第二設(shè)定閾值,將所述第一用戶組合作為所要生成的用戶組合,其中所述衰減調(diào)整參數(shù)在完成設(shè)定次數(shù)的迭代后按設(shè)定速度減小。
優(yōu)選地,所述第二用戶組合模塊,具體用于在所述第二用戶組合的信息受眾數(shù)相比于所述第一用戶組合連續(xù)設(shè)定次數(shù)沒有發(fā)生增長后,通過將所述第一用戶組合中的信息受眾數(shù)最少的至少一個用戶更換為信息受眾數(shù)最多的至少一個用戶,生成與所述第一用戶組合用戶數(shù)相同的所述第二用戶組合。
綜上所述,依據(jù)本發(fā)明實施例,通過選擇設(shè)定個數(shù)的用戶組成第一用戶組合,通過更換所述第一用戶組合中的至少一個用戶,生成與所述第一用戶組合用戶數(shù)相同的第二用戶組合,若所述第二用戶組合的信息受眾數(shù)相比于所述第一用戶組合發(fā)生增長,或所述第二用戶組合的信息受眾數(shù)相比于所述第一用戶組合的衰減表征值小于第一設(shè)定閾值,則以所述第二用戶組合替換所述第一用戶組合,所述衰減表征值根據(jù)成反比關(guān)系的衰減調(diào)整參數(shù)計算,迭代執(zhí)行直至最新生成的兩個用戶組合的信息受眾數(shù)的改變量小于第二設(shè)定閾值,將所述第一用戶組合作為所要生成的用戶組合,其中所述衰減調(diào)整參數(shù)在完成設(shè)定次數(shù)的迭代后按設(shè)定速度減小,從而提升了生成信息受眾數(shù)較多的用戶組合的效率,而且,所得到的用戶組合更接近最優(yōu)用戶組合,還可以是獲得足夠多的被接受的用戶組合,提高了在社交網(wǎng)絡(luò)中尋找影響力最大的用戶組合的效率。
附圖說明
圖1是本發(fā)明的一種生成用戶組合的方法實施例的步驟流程圖;
圖2是本發(fā)明的另一種生成用戶組合的方法實施例的步驟流程圖;
圖3是本發(fā)明一種生成用戶組合的裝置實施例的結(jié)構(gòu)框圖。
具體實施方式
為使本發(fā)明的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結(jié)合附圖和具體實施方式對本發(fā)明作進一步詳細的說明。
實施例一
參照圖1,示出了本發(fā)明的一種生成用戶組合的方法實施例的步驟流程圖,具體可以包括如下步驟:
步驟101、選擇設(shè)定個數(shù)的用戶組成第一用戶組合。
在本發(fā)明實施例中,選擇設(shè)定個數(shù)的用戶的方式可以是隨機選擇設(shè)定個數(shù)的用戶,也可以是選擇信息受眾數(shù)較大的設(shè)定個數(shù)的用戶,也可以選擇信息受眾沒有重復(fù)的設(shè)定個數(shù)的用戶,具體而言,本方法應(yīng)用于社交網(wǎng)絡(luò)中時,用戶同時是信息的發(fā)布者和接收者,本發(fā)明選擇設(shè)定個數(shù)的用戶組成第一用戶組合,第一用戶組合的信息受眾就可以代表第一用戶組合在社交網(wǎng)絡(luò)中的影響力。
步驟102、通過更換所述第一用戶組合中的至少一個用戶,生成與所述第一用戶組合用戶數(shù)相同的第二用戶組合。
在本發(fā)明實施例中,第一用戶組合中有設(shè)定個數(shù)的用戶,可以將第一用戶組合中的全部或部分用戶進行替換,替換的方式可以是隨機的替換,也可以是將第一用戶組合中信息受眾最少的用戶替換成一個比該用戶的信息受眾多的用戶,替換的用戶的個數(shù)在本發(fā)明實施例中不作限制,可以根據(jù)實際情況進行設(shè)置。
步驟103、若所述第二用戶組合的信息受眾數(shù)相比于所述第一用戶組合發(fā)生增長,或所述第二用戶組合的信息受眾數(shù)相比于所述第一用戶組合的衰減表征值小于第一設(shè)定閾值,則以所述第二用戶組合替換所述第一用戶組合,所述衰減表征值根據(jù)成反比關(guān)系的衰減調(diào)整參數(shù)計算。
在本發(fā)明實施例中,衰減表征值與第二用戶組合的信息受眾數(shù)減第一用戶組合的信息受眾數(shù)得到的差值成正比,與衰減調(diào)整參數(shù)成反比。衰減調(diào)整參數(shù)的初始值設(shè)置是影響在全局中搜索用戶組合的重要因素之一、初始值高,則搜索到全局最優(yōu)解的可能性大,但因此要花費大量的計算時間;反之,則可節(jié)約計算時間,但全局搜索性能可能受到影響。實際應(yīng)用過程中,初始值一般需要依據(jù)實驗結(jié)果進行若干次調(diào)整。第一設(shè)定閾值是一個在設(shè)定范圍內(nèi)的隨機數(shù)或固定數(shù),設(shè)定范圍用來控制第二用戶組合比第一用戶組合的信息受眾數(shù)小時,以第二用戶組合替換第一用戶組合的概率,實際應(yīng)用過程中,設(shè)定范圍根據(jù)衰減表征值的計算方式確定。
具體而言,得到第一用戶組合和第二用戶組合后,通過比較第一用戶組合和第二用戶組合的信息受眾數(shù),如果第二用戶組合的信息受眾數(shù)比第一用戶組合的信息受眾數(shù)多,也就是第二用戶組合的信息受眾數(shù)相比于第一用戶組合發(fā)生增長,則用第二用戶組合替換第一用戶組合;如果第二用戶組合的信息受眾數(shù)比第一用戶組合的信息受眾數(shù)少,且第二用戶組合的信息受眾數(shù)相比于第一用戶組合的衰減表征值小于第一設(shè)定閾值,則以第二用戶組合替換第一用戶組合;如果第二用戶組合的信息受眾數(shù)比第一用戶組合的信息受眾數(shù)少,且第二用戶組合的信息受眾數(shù)相比于第一用戶組合的衰減表征值不小于第一設(shè)定閾值,則保留第一用戶組合。
在具體實現(xiàn)中,可以計算出衰減表征值對應(yīng)的接受概率和第一設(shè)定閾值對應(yīng)的第一設(shè)定概率,接受概率大于第一設(shè)定概率,也就是第二用戶組合的信息受眾數(shù)相比于第一用戶組合的衰減表征值小于第一設(shè)定閾值。
步驟104,迭代執(zhí)行步驟102和步驟103直至最新生成的兩個用戶組合的信息受眾數(shù)的改變量小于第二設(shè)定閾值,將所述第一用戶組合作為所要生成的用戶組合,其中所述衰減調(diào)整參數(shù)在完成設(shè)定次數(shù)的迭代后按設(shè)定速度減小。
在本發(fā)明實施例中,第二設(shè)定閾值是結(jié)束迭代執(zhí)行步驟102和步驟103的條件,第二設(shè)定閾值越小,得到全局最優(yōu)解的可能性越大,但因此要花費大量的計算時間,在實際應(yīng)用過程中,第二設(shè)定閾值一般需要依據(jù)實驗結(jié)果進行若干次調(diào)整。
具體而言,迭代執(zhí)行步驟102和步驟103,迭代設(shè)定次數(shù)后,衰減調(diào)整參數(shù)按設(shè)定速度減少,例如可以按照預(yù)設(shè)的進度表減少、或者按照預(yù)設(shè)的函數(shù)計算得到減少后的值,設(shè)定速度越慢,得到全局最優(yōu)解的可能性越大,但因此要花費大量的計算時間,在實際應(yīng)用過程中,設(shè)定速度一般需要依據(jù)實驗結(jié)果進行若干次調(diào)整。每次執(zhí)行后得到最新生成的兩個用戶組合的信息受眾數(shù)的改變量,如果該改變量小于第二設(shè)定閾值,則停止迭代,將第一用戶組合作為所要生成的用戶組合。
實際應(yīng)用中,上述步驟102和步驟103可以利用模擬退火算法(SimulatedAnnealing,SA),以最終獲得信息受眾數(shù)最多的用戶組合。模擬退火算法是一種通用概率算法,通常用于在一個較大的搜索空間內(nèi)計算最優(yōu)結(jié)果。
具體地,模擬退火算法中的初始解狀態(tài)S的概念可以用于表示第一用戶組合,即迭代計算的起點;S′可以表示第二用戶組合。每一次的隨機更換第一用戶組合中的設(shè)定個數(shù)的用戶而獲得第二用戶組合,即產(chǎn)生新解S’,并累計迭代次數(shù)一次。通過計算公式Δt′=C(S′)-C(S)計算信息受眾數(shù)的增量;其中,C(S)為表示信息受眾數(shù)的評價函數(shù),Δt′為該次迭代計算得到的信息受眾數(shù)增量。
當(dāng)Δt′大于0,即第二用戶組合的信息受眾數(shù)相比于所述第一用戶組合發(fā)生增長,可以接受S′作為新的當(dāng)前解。當(dāng)Δt′小于0,即第二用戶組合的信息受眾數(shù)小于第一用戶組合的信息受眾數(shù),通過計算公式P=exp(-Δt′/T(i))計算接收S′作為新的當(dāng)前解的接收概率P,其中,T(i)為第i-1次減小后的衰減調(diào)整參數(shù),Δt′/T(i)為衰減表征值,如果P>c=random[0,1],c=random[0,1]為第一設(shè)定閾值對應(yīng)的第一設(shè)定概率,可以接受S′作為新的當(dāng)前解。重復(fù)隨機更換第一用戶組合的設(shè)定個數(shù)的用戶獲得第二用戶組合的步驟,以對第二用戶組合相對第一用戶組合的信息受眾數(shù)增量進行迭代計算,滿足終止條件后則將終止迭代計算并將當(dāng)前解作為最優(yōu)解,即最優(yōu)的用戶組合。終止條件是最新生成的兩個用戶組合的信息受眾數(shù)的改變量小于第二設(shè)定閾值,也可以為連續(xù)N個新解均沒有被接受,還可以是獲得足夠多的被接受的當(dāng)前解,當(dāng)前解的數(shù)量應(yīng)盡可能大,以保證后續(xù)可以獲得最優(yōu)解。當(dāng)然,本領(lǐng)域技術(shù)人員也可以根據(jù)實際情況設(shè)定當(dāng)前解的數(shù)量。
綜上所述,依據(jù)本發(fā)明實施例,通過選擇設(shè)定個數(shù)的用戶組成第一用戶組合,通過更換所述第一用戶組合中的至少一個用戶,生成與所述第一用戶組合用戶數(shù)相同的第二用戶組合,若所述第二用戶組合的信息受眾數(shù)相比于所述第一用戶組合發(fā)生增長,或所述第二用戶組合的信息受眾數(shù)相比于所述第一用戶組合的衰減表征值小于第一設(shè)定閾值,則以所述第二用戶組合替換所述第一用戶組合,所述衰減表征值根據(jù)成反比關(guān)系的衰減調(diào)整參數(shù)計算,迭代執(zhí)行直至最新生成的兩個用戶組合的信息受眾數(shù)的改變量小于第二設(shè)定閾值,將所述第一用戶組合作為所要生成的用戶組合,其中所述衰減調(diào)整參數(shù)在完成設(shè)定次數(shù)的迭代后按設(shè)定速度減小,從而提升了生成信息受眾數(shù)較多的用戶組合的效率,而且,所得到的用戶組合更接近最優(yōu)用戶組合,還可以是獲得足夠多的被接受的用戶組合,提高了在社交網(wǎng)絡(luò)中尋找影響力最大的用戶組合的效率。
在本發(fā)明實施例中,優(yōu)選地,所述通過更換所述第一用戶組合中的至少一個用戶,生成與所述第一用戶組合用戶數(shù)相同的第二用戶組合包括:在所述第二用戶組合的信息受眾數(shù)相比于所述第一用戶組合連續(xù)設(shè)定次數(shù)沒有發(fā)生增長后,通過將所述第一用戶組合中的信息受眾數(shù)最少的至少一個用戶更換為信息受眾數(shù)最多的至少一個用戶,生成與所述第一用戶組合用戶數(shù)相同的所述第二用戶組合。
具體而言,可以記錄第二用戶組合的信息受眾數(shù)相比于第一用戶組合連續(xù)沒有發(fā)生增長的次數(shù),當(dāng)連續(xù)沒有發(fā)生增長的次數(shù)達到設(shè)定次數(shù)后,在更換第一用戶組合中的至少一個用戶時,可以選擇將第一用戶組合中信息受眾數(shù)最少的至少一個用戶去除,加入除了第一用戶組合中的用戶外的其他用戶中信息受眾數(shù)最多的至少一個用戶,其中設(shè)定次數(shù)一般需要依據(jù)實驗結(jié)果進行若干次調(diào)整,本發(fā)明對此不作限制。因為這種更換用戶的方式,從概率上來說更容易使第二用戶組合的信息受眾數(shù)相比于第一用戶組合發(fā)生增長,從而提高生成信息受眾數(shù)較多的用戶組合的效率。
實施例二
參照圖2,示出了本發(fā)明的另一種生成用戶組合的方法實施例的步驟流程圖,具體可以包括如下步驟:
步驟201,抓取社交網(wǎng)絡(luò)信息,所述社交網(wǎng)絡(luò)信息包括信息的內(nèi)容、信息發(fā)布用戶、信息的交互關(guān)系。
在本發(fā)明實施例中,利用數(shù)據(jù)采集器可以抓取社交網(wǎng)絡(luò)信息,社交網(wǎng)絡(luò)信息包括信息的內(nèi)容、信息發(fā)布用戶、信息的交互關(guān)系。其中信息發(fā)布用戶可以包括信息的初始發(fā)布用戶、信息的轉(zhuǎn)發(fā)用戶,信息的交互關(guān)系包括信息的發(fā)布用戶與評論用戶的關(guān)系、信息的發(fā)布用戶與轉(zhuǎn)發(fā)用戶的關(guān)系、信息的發(fā)布用戶與關(guān)注發(fā)布用戶的用戶的關(guān)系。
步驟202,根據(jù)所述社交網(wǎng)絡(luò)信息,將直接互動用戶和間接互動用戶確定為信息發(fā)布用戶的受眾。
在本發(fā)明實施例中,根據(jù)抓取的社交網(wǎng)絡(luò)信息,查找到信息發(fā)布用戶的直接互動用戶和間接互動用戶,將直接互動用戶和間接互動用戶確定為信息發(fā)布用戶的受眾,具體而言,信息發(fā)布用戶的受眾包括:對信息發(fā)布用戶發(fā)布的信息進行評論和/或轉(zhuǎn)發(fā)的用戶,對轉(zhuǎn)發(fā)信息發(fā)布用戶發(fā)布的信息進行評論和/或轉(zhuǎn)發(fā)的用戶,其中轉(zhuǎn)發(fā)可以經(jīng)多次轉(zhuǎn)發(fā)后進行的轉(zhuǎn)發(fā)。
在本發(fā)明實施例中,優(yōu)選地,所述直接互動用戶包括與信息發(fā)布用戶具備互動關(guān)系的用戶,所述間接互動用戶包括通過至少一個具備互動關(guān)系的用戶與所述信息發(fā)布用戶關(guān)聯(lián)的用戶。具備互動關(guān)系包括轉(zhuǎn)發(fā)發(fā)布信息,評論發(fā)布信息,互相關(guān)注。
具體而言,具備互動關(guān)系是指用戶與用戶間具有轉(zhuǎn)發(fā)發(fā)布信息,評論發(fā)布信息,互相關(guān)注的關(guān)系,直接互動用戶就是直接與信息發(fā)布用戶具備互動關(guān)系的用戶,間接互動用戶就是需要通過至少一個具備互動關(guān)系的用戶與信息發(fā)布用戶有關(guān)聯(lián)的用戶。
在本發(fā)明實施例中,優(yōu)選地,所述根據(jù)所述社交網(wǎng)絡(luò)信息,將直接互動用戶和間接互動用戶確定為信息發(fā)布用戶的受眾的一種實現(xiàn)方式可以是根據(jù)所述社交網(wǎng)絡(luò)信息,查找評論和/或轉(zhuǎn)發(fā)次數(shù)超過設(shè)定次數(shù)的直接互動用戶和間接互動用戶;將所述查找的直接互動用戶和間接互動用戶確定為信息發(fā)布用戶的受眾。
根據(jù)抓取的社交網(wǎng)絡(luò)信息,在所有的直接互動用戶和間接互動用戶中,查找評論和/或轉(zhuǎn)發(fā)次數(shù)超過設(shè)定次數(shù)的用戶,并將查找的直接互動用戶和間接互動用戶確定為信息發(fā)布用戶的受眾,其中,設(shè)定次數(shù)大,則查找到的直接互動用戶與間接互動用戶是受信息發(fā)布用戶越大影響的受眾,起到了對受眾進行篩選的作用,設(shè)定次數(shù)可以根據(jù)實際需要進行設(shè)定,本發(fā)明不作限制。
在本發(fā)明實施例中,優(yōu)選地,所述根據(jù)所述社交網(wǎng)絡(luò)信息,將直接互動用戶和間接互動用戶確定為信息發(fā)布用戶的受眾的一種實現(xiàn)方式可以是根據(jù)所述社交網(wǎng)絡(luò)信息,查找在評論和/或轉(zhuǎn)發(fā)中含有與原始信息的內(nèi)容相關(guān)的信息的直接互動用戶和間接互動用戶;將所述查找的直接互動用戶和間接互動用戶確定為信息發(fā)布用戶的受眾。
根據(jù)抓取的社交網(wǎng)絡(luò)信息,在所有的直接互動用戶和間接互動用戶中,查找在評論和/或轉(zhuǎn)發(fā)中自己發(fā)布的內(nèi)容與原始信息在內(nèi)容上具有相關(guān)性的用戶,具體可以通過關(guān)鍵詞進行分析,并將查找的直接互動用戶和間接互動用戶確定為信息發(fā)布用戶的受眾,從而使得查找到的直接互動用戶與間接互動用戶是受信息發(fā)布用戶越大影響的受眾,起到了對受眾進行篩選的作用。
步驟203、選擇設(shè)定個數(shù)的用戶組成第一用戶組合。
在本發(fā)明實施例中,選擇設(shè)定個數(shù)的用戶的方式可以是隨機選擇設(shè)定個數(shù)的用戶,也可以是選擇信息受眾數(shù)較大的設(shè)定個數(shù)的用戶,也可以選擇信息受眾沒有重復(fù)的設(shè)定個數(shù)的用戶,具體而言,本方法應(yīng)用于社交網(wǎng)絡(luò)中時,用戶同時是信息的發(fā)布者和接收者,本發(fā)明選擇設(shè)定個數(shù)的用戶組成第一用戶組合,第一用戶組合的信息受眾就可以代表第一用戶組合在社交網(wǎng)絡(luò)中的影響力。
在本發(fā)明實施例中,優(yōu)選地,所述選擇設(shè)定個數(shù)的用戶組成第一用戶組合的一種實現(xiàn)方式可以是根據(jù)所述社交網(wǎng)絡(luò)信息,確定信息發(fā)布用戶為信息的初始發(fā)布用戶;在所述初始發(fā)布用戶中選擇設(shè)定個數(shù)的用戶組成第一用戶組合。
具體而言,根據(jù)抓取的社交網(wǎng)絡(luò)信息,查找到信息的初始發(fā)布用戶,在查找到的初始發(fā)布用戶中選擇設(shè)定個數(shù)的用戶組成第一用戶組合,因為初始發(fā)布用戶更容易具有更多的受眾,從而使得用戶組合更容易找到最優(yōu)解。
在本發(fā)明實施例中,優(yōu)選地,所述選擇設(shè)定個數(shù)的用戶組成第一用戶組合的另一種實現(xiàn)方式可以是根據(jù)所述社交網(wǎng)絡(luò)信息,確定符合設(shè)定內(nèi)容特征的信息的特定發(fā)布用戶;在所述特定發(fā)布用戶中選擇設(shè)定個數(shù)的用戶組成第一用戶組合。
具體而言,特定發(fā)布用戶是指發(fā)布了符合設(shè)定內(nèi)容特征的信息的信息發(fā)布用戶,根據(jù)抓取的社交網(wǎng)絡(luò)信息,查找到特定發(fā)布用戶,在所述特定發(fā)布用戶中選擇設(shè)定個數(shù)的用戶組成第一用戶組合,從而對信息發(fā)布用戶進行篩選,僅選擇發(fā)布特定類型信息的信息發(fā)布用戶進入用戶組合。
步驟204、通過更換所述第一用戶組合中的至少一個用戶,生成與所述第一用戶組合用戶數(shù)相同的第二用戶組合。
在本發(fā)明實施例中,第一用戶組合中有設(shè)定個數(shù)的用戶,可以將第一用戶組合中的全部或部分用戶進行替換,替換的方式可以是隨機的替換,也可以是將第一用戶組合中信息受眾最少的用戶替換成一個比該用戶的信息受眾多的用戶,替換的用戶的個數(shù)在本發(fā)明實施例中不作限制,可以根據(jù)實際情況進行設(shè)置。
步驟205、若所述第二用戶組合的信息受眾數(shù)相比于所述第一用戶組合發(fā)生增長,或所述第二用戶組合的信息受眾數(shù)相比于所述第一用戶組合的衰減表征值小于第一設(shè)定閾值,則以所述第二用戶組合替換所述第一用戶組合,所述衰減表征值根據(jù)成反比關(guān)系的衰減調(diào)整參數(shù)計算。
在本發(fā)明實施例中,衰減表征值與第二用戶組合比第一用戶組合的信息受眾數(shù)的減少量成正比,與衰減調(diào)整參數(shù)成反比。衰減調(diào)整參數(shù)的初始值設(shè)置是影響在全局中搜索用戶組合的重要因素之一、初始值高,則搜索到全局最優(yōu)解的可能性大,但因此要花費大量的計算時間;反之,則可節(jié)約計算時間,但全局搜索性能可能受到影響。實際應(yīng)用過程中,初始值一般需要依據(jù)實驗結(jié)果進行若干次調(diào)整。第一設(shè)定閾值是一個在設(shè)定范圍內(nèi)的隨機數(shù)或固定數(shù),設(shè)定范圍用來控制第二用戶組合比第一用戶組合的信息受眾數(shù)小時,以第二用戶組合替換第一用戶組合的概率,實際應(yīng)用過程中,設(shè)定范圍根據(jù)衰減表征值的計算方式確定。
具體而言,得到第一用戶組合和第二用戶組合后,通過比較第一用戶組合和第二用戶組合的信息受眾數(shù),如果第二用戶組合的信息受眾數(shù)比第一用戶組合的信息受眾數(shù)多,也就是第二用戶組合的信息受眾數(shù)相比于第一用戶組合發(fā)生增長,則用第二用戶組合替換第一用戶組合;如果第二用戶組合的信息受眾數(shù)比第一用戶組合的信息受眾數(shù)少,且第二用戶組合的信息受眾數(shù)相比于第一用戶組合的衰減表征值小于第一設(shè)定閾值,則以第二用戶組合替換第一用戶組合;如果第二用戶組合的信息受眾數(shù)比第一用戶組合的信息受眾數(shù)少,且第二用戶組合的信息受眾數(shù)相比于第一用戶組合的衰減表征值不小于第一設(shè)定閾值,則保留第一用戶組合。
步驟206,迭代執(zhí)行步驟204和步驟205直至最新生成的兩個用戶組合的信息受眾數(shù)的改變量小于第二設(shè)定閾值,將第一用戶組合作為所要生成的用戶組合,其中所述衰減調(diào)整參數(shù)在完成設(shè)定次數(shù)的迭代后按設(shè)定速度減小。
在本發(fā)明實施例中,第二設(shè)定閾值是結(jié)束迭代執(zhí)行步驟204和步驟205的條件,第二設(shè)定閾值越小,得到全局最優(yōu)解的可能性越大,但因此要花費大量的計算時間,在實際應(yīng)用過程中,第二設(shè)定閾值一般需要依據(jù)實驗結(jié)果進行若干次調(diào)整。
具體而言,迭代執(zhí)行步驟204和步驟205,迭代設(shè)定次數(shù)后,衰減調(diào)整參數(shù)按設(shè)定速度減少,例如可以按照預(yù)設(shè)的進度表減少、或者按照預(yù)設(shè)的函數(shù)計算得到減少后的值,設(shè)定速度越慢,得到全局最優(yōu)解的可能性越大,但因此要花費大量的計算時間,在實際應(yīng)用過程中,設(shè)定速度一般需要依據(jù)實驗結(jié)果進行若干次調(diào)整。每次執(zhí)行后得到最新生成的兩個用戶組合的信息受眾數(shù)的改變量,如果該改變量小于第二設(shè)定閾值,則停止迭代,將第一用戶組合作為所要生成的用戶組合。
綜上所述,依據(jù)本發(fā)明實施例,通過選擇設(shè)定個數(shù)的用戶組成第一用戶組合,通過更換所述第一用戶組合中的至少一個用戶,生成與所述第一用戶組合用戶數(shù)相同的第二用戶組合,若所述第二用戶組合的信息受眾數(shù)相比于所述第一用戶組合發(fā)生增長,或所述第二用戶組合的信息受眾數(shù)相比于所述第一用戶組合的衰減表征值小于第一設(shè)定閾值,則以所述第二用戶組合替換所述第一用戶組合,所述衰減表征值根據(jù)成反比關(guān)系的衰減調(diào)整參數(shù)計算,迭代執(zhí)行直至最新生成的兩個用戶組合的信息受眾數(shù)的改變量小于第二設(shè)定閾值,將所述第一用戶組合作為所要生成的用戶組合,其中所述衰減調(diào)整參數(shù)在完成設(shè)定次數(shù)的迭代后按設(shè)定速度減小,從而提升了生成信息受眾數(shù)較多的用戶組合的效率,而且,所得到的用戶組合更接近最優(yōu)用戶組合,提高了在社交網(wǎng)絡(luò)中尋找影響力最大的用戶組合的效率。
需要說明的是,對于方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明實施例并不受所描述的動作順序的限制,因為依據(jù)本發(fā)明實施例,某些步驟可以采用其他順序或者同時進行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實施例均屬于優(yōu)選實施例,所涉及的動作并不一定是本發(fā)明實施例所必須的。
實施例三
參照圖3,示出了本發(fā)明一種生成用戶組合的裝置實施例的結(jié)構(gòu)框圖,具體可以包括如下模塊:
第一用戶組合模塊301,用于選擇設(shè)定個數(shù)的用戶組成第一用戶組合;
第二用戶組合模塊302,用于通過更換所述第一用戶組合中的至少一個用戶,生成與所述第一用戶組合用戶數(shù)相同的第二用戶組合;
組合替換模塊303,用于若所述第二用戶組合的信息受眾數(shù)相比于所述第一用戶組合發(fā)生增長,或所述第二用戶組合的信息受眾數(shù)相比于所述第一用戶組合的衰減表征值小于第一設(shè)定閾值,則以所述第二用戶組合替換所述第一用戶組合,所述衰減表征值根據(jù)成反比關(guān)系的衰減調(diào)整參數(shù)計算;
迭代模塊304,用于迭代執(zhí)行第二用戶組合模塊302和組合替換模塊303直至最新生成的兩個用戶組合的信息受眾數(shù)的改變量小于第二設(shè)定閾值,將所述第一用戶組合作為所要生成的用戶組合,其中所述衰減調(diào)整參數(shù)在完成設(shè)定次數(shù)的迭代后按設(shè)定速度減小。
在本發(fā)明實施例中,優(yōu)選地,所述第二用戶組合模塊,具體用于在所述第二用戶組合的信息受眾數(shù)相比于所述第一用戶組合連續(xù)設(shè)定次數(shù)沒有發(fā)生增長后,通過將所述第一用戶組合中的信息受眾數(shù)最少的至少一個用戶更換為信息受眾數(shù)最多的至少一個用戶,生成與所述第一用戶組合用戶數(shù)相同的所述第二用戶組合。
優(yōu)選地,所述裝置還包括:
信息抓取模塊305,用于選擇設(shè)定個數(shù)的用戶組成第一用戶組合的步驟之前抓取社交網(wǎng)絡(luò)信息,所述社交網(wǎng)絡(luò)信息包括信息的內(nèi)容、信息發(fā)布用戶、信息的交互關(guān)系;
受眾確定模塊306,用于根據(jù)所述社交網(wǎng)絡(luò)信息,將直接互動用戶和間接互動用戶確定為信息發(fā)布用戶的受眾。
優(yōu)選地,所述裝置包括:
所述直接互動用戶包括與信息發(fā)布用戶具備互動關(guān)系的用戶,所述間接互動用戶包括通過至少一個具備互動關(guān)系的用戶與所述信息發(fā)布用戶關(guān)聯(lián)的用戶。具備互動關(guān)系包括轉(zhuǎn)發(fā)發(fā)布信息,評論發(fā)布信息,互相關(guān)注。
優(yōu)選地,所述第一用戶組合模塊301包括:
初始用戶確定子模塊3011,用于根據(jù)所述社交網(wǎng)絡(luò)信息,確定信息發(fā)布用戶為信息的初始發(fā)布用戶;
初始用戶組合子模塊3012,用于在所述初始發(fā)布用戶中選擇設(shè)定個數(shù)的用戶組成第一用戶組合。
優(yōu)選地,所述第一用戶組合模塊301包括:
特定用戶確定子模塊3013,用于根據(jù)所述社交網(wǎng)絡(luò)信息,確定符合設(shè)定內(nèi)容特征的信息的特定發(fā)布用戶;
特定用戶組合子模塊3014,用于在所述特定發(fā)布用戶中選擇設(shè)定個數(shù)的用戶組成第一用戶組合。
優(yōu)選地,所述受眾確定模塊306包括:
第一查找子模塊3061,用于根據(jù)所述社交網(wǎng)絡(luò)信息,查找評論和/或轉(zhuǎn)發(fā)次數(shù)超過設(shè)定次數(shù)的直接互動用戶和間接互動用戶;
第一受眾確定子模塊3062,用于將所述查找的直接互動用戶和間接互動用戶確定為信息發(fā)布用戶的受眾。
優(yōu)選地,所述受眾確定模塊306包括:
第二查找子模塊3063,用于根據(jù)所述社交網(wǎng)絡(luò)信息,查找在評論和/或轉(zhuǎn)發(fā)中含有與原始信息的內(nèi)容相關(guān)的信息的直接互動用戶和間接互動用戶;
第二受眾確定子模塊3064,用于將所述查找的直接互動用戶和間接互動用戶確定為信息發(fā)布用戶的受眾。
綜上所述,依據(jù)本發(fā)明實施例,通過選擇設(shè)定個數(shù)的用戶組成第一用戶組合,通過更換所述第一用戶組合中的至少一個用戶,生成與所述第一用戶組合用戶數(shù)相同的第二用戶組合,若所述第二用戶組合的信息受眾數(shù)相比于所述第一用戶組合發(fā)生增長,或所述第二用戶組合的信息受眾數(shù)相比于所述第一用戶組合的衰減表征值小于第一設(shè)定閾值,則以所述第二用戶組合替換所述第一用戶組合,所述衰減表征值根據(jù)成反比關(guān)系的衰減調(diào)整參數(shù)計算,迭代執(zhí)行直至最新生成的兩個用戶組合的信息受眾數(shù)的改變量小于第二設(shè)定閾值,將所述第一用戶組合作為所要生成的用戶組合,其中所述衰減調(diào)整參數(shù)在完成設(shè)定次數(shù)的迭代后按設(shè)定速度減小,從而提升了生成信息受眾數(shù)較多的用戶組合的效率,而且,所得到的用戶組合更接近最優(yōu)用戶組合,提高了在社交網(wǎng)絡(luò)中尋找影響力最大的用戶組合的效率。
對于裝置實施例而言,由于其與方法實施例基本相似,所以描述的比較簡單,相關(guān)之處參見方法實施例的部分說明即可。
本說明書中的各個實施例均采用遞進的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似的部分互相參見即可。
本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明實施例的實施例可提供為方法、裝置、或計算機程序產(chǎn)品。因此,本發(fā)明實施例可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且,本發(fā)明實施例可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(zhì)(包括但不限于磁盤存儲器、CD-ROM、光學(xué)存儲器等)上實施的計算機程序產(chǎn)品的形式。
本發(fā)明實施例是參照根據(jù)本發(fā)明實施例的方法、終端設(shè)備(系統(tǒng))、和計算機程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合。可提供這些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理終端設(shè)備的處理器以產(chǎn)生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理終端設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些計算機程序指令也可存儲在能引導(dǎo)計算機或其他可編程數(shù)據(jù)處理終端設(shè)備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理終端設(shè)備上,使得在計算機或其他可編程終端設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理,從而在計算機或其他可編程終端設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
盡管已描述了本發(fā)明實施例的優(yōu)選實施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對這些實施例做出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實施例以及落入本發(fā)明實施例范圍的所有變更和修改。
最后,還需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個實體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者終端設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者終端設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者終端設(shè)備中還存在另外的相同要素。
以上對本發(fā)明所提供的一種生成用戶組合方法和裝置,進行了詳細介紹,本文中應(yīng)用了具體個例對本發(fā)明的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實施方式及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。