本發(fā)明涉及計算機,特別涉及聚類和內(nèi)容的推薦方法、設(shè)備、介質(zhì)和計算機程序產(chǎn)品。
背景技術(shù):
1、將物理或抽象對象的集合分成由類似的對象組成的多個類的過程被稱為聚類。換言之,就是把“相同”的對象,劃分到一起的過程。例如,在內(nèi)容推薦領(lǐng)域,將服務(wù)器中存儲的內(nèi)容作為對象進行聚類。通常,聚類中會用高維特征來表示一個對象(節(jié)點),通過計算兩個節(jié)點之間的距離來度量兩個節(jié)點之間的相似度。如果該相似度達到一定閾值,則判定兩個節(jié)點是相同的,把它們聚成一類。雖然這樣的方式簡單高效,但是很容易受到噪聲的影響,沒有用到更多全局的信息。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于提供聚類和內(nèi)容的推薦方法、設(shè)備、介質(zhì)和計算機程序產(chǎn)品,解決如何避免噪音節(jié)點在聚類中的不利影響的技術(shù)問題。
2、本發(fā)明的第一實施方式公開了一種聚類方法,用于電子設(shè)備,所述方法包括:
3、初始化第一簇和簇集合,所述簇集合包括所述第一簇,所述第一簇包括待聚類的多個節(jié)點中的第一節(jié)點;
4、對于所述多個節(jié)點中的其他每一個節(jié)點:
5、確定所述簇集合中與所述節(jié)點連通的簇的數(shù)量;
6、基于所述數(shù)量,將所述節(jié)點刪除、或與所述簇集合中的簇合并;
7、以所述簇集合作為聚類結(jié)果。
8、可選地,所述基于所述數(shù)量,將所述節(jié)點刪除、或與所述簇集合中的簇合并,包括:
9、在所述數(shù)量為0的情況下,在所述簇集合中新建一個包括所述節(jié)點的簇;
10、在所述數(shù)量為1的情況下,將所述節(jié)點合并到與所述節(jié)點連通的簇中;
11、在所述數(shù)量為2的情況下,其中,如果與所述節(jié)點連通的2個簇之間連通,則將所述節(jié)點和所述2個簇合并,如果與所述節(jié)點連通的2個簇之間排異,則將所述節(jié)點刪除,否則將所述節(jié)點合并到與所述節(jié)點連通的2個簇中的一個簇中;
12、在所述數(shù)量為其他數(shù)值的情況下,將所述節(jié)點刪除。
13、可選地,所述確定所述簇集合中與所述節(jié)點連通的簇的數(shù)量,包括:
14、對于所述簇集合中的每一個簇:
15、確定所述簇與所述節(jié)點的節(jié)點-簇連通率,所述節(jié)點-簇連通率等于所述簇中與所述節(jié)點之間有邊的節(jié)點的數(shù)量與所述簇中所有節(jié)點的數(shù)量的比,其中,確定余弦距離小于等于第一預(yù)定閾值的兩個節(jié)點之間有邊;
16、在所述節(jié)點-簇連通率大于等于第二預(yù)定閾值的情況下,確定所述簇與所述節(jié)點連通。
17、可選地,所述如果與所述節(jié)點連通的2個簇之間連通,則將所述節(jié)點和所述2個簇合并,包括:
18、確定所述2個簇之間的簇-簇連通率,所述簇-簇連通率等于所述2個簇之間有邊的節(jié)點對的數(shù)量與所述2個簇之間所有節(jié)點對的數(shù)量的比;
19、在所述簇-簇連通率大于等于第三預(yù)定閾值的情況下,確定所述2個簇之間連通。
20、可選地,所述如果與所述節(jié)點連通的2個簇之間排異,則將所述節(jié)點刪除,包括:
21、在所述簇-簇連通率小于第四預(yù)定閾值的情況下,確定所述2個簇之間排異。
22、可選地,所述否則將所述節(jié)點合并到與所述節(jié)點連通的2個簇中的一個簇中,包括:
23、如果所述2個簇與所述節(jié)點的所述節(jié)點-簇連通率不相等,則將所述節(jié)點合并到所述2個簇中與所述節(jié)點的所述節(jié)點-簇連通率較大的一個簇中;
24、如果所述2個簇與所述節(jié)點的所述節(jié)點-簇連通率相等,則將所述節(jié)點合并到所述2個簇中節(jié)點數(shù)量較多的一個簇中。
25、本發(fā)明的第二實施方式公開了一種內(nèi)容的推薦方法,用于電子設(shè)備,所述方法包括:
26、使用根據(jù)本發(fā)明第一實施方式的聚類方法,對待推薦的內(nèi)容進行聚類;
27、基于所述聚類結(jié)果,推薦所述內(nèi)容。
28、本發(fā)明的第三實施方式公開了一種電子設(shè)備,所述電子設(shè)備包括存儲有計算機可執(zhí)行指令的存儲器和處理器,當(dāng)所述指令被所述處理器執(zhí)行時,使得所述電子設(shè)備實施根據(jù)本發(fā)明第一實施方式的聚類方法或根據(jù)本發(fā)明第二實施方式的內(nèi)容的推薦方法。
29、本發(fā)明的第四實施方式公開了一種計算機存儲介質(zhì),在所述計算機存儲介質(zhì)上存儲有指令,當(dāng)所述指令在計算機上運行時,使得所述計算機執(zhí)行根據(jù)本發(fā)明第一實施方式的聚類方法或根據(jù)本發(fā)明第二實施方式的內(nèi)容的推薦方法。
30、本發(fā)明的第五實施方式公開了一種計算機程序產(chǎn)品,包括計算機可執(zhí)行指令,所述指令被處理器執(zhí)行以實施根據(jù)本發(fā)明第一實施方式的聚類方法或根據(jù)本發(fā)明第二實施方式的內(nèi)容的推薦方法。
31、本發(fā)明實施方式與現(xiàn)有技術(shù)相比,主要區(qū)別及其效果在于:
32、在本發(fā)明中,聚類方法通過節(jié)點-簇的連通率和簇-簇的連通率,有效的避免了由于噪音節(jié)點而把不同類的簇混在一起,同時簇的合并條件不會太苛刻,可以接受同類內(nèi)較大的個體差異,提升聚類的性能。并且本發(fā)明具有普適性,不但可以用在內(nèi)容推薦等常用的聚類場景中,對追蹤任務(wù)或者其它一些序列內(nèi)去噪的場景,也可以有效的適用。
1.一種聚類方法,用于電子設(shè)備,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于所述數(shù)量,將所述節(jié)點刪除、或與所述簇集合中的簇合并,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述確定所述簇集合中與所述節(jié)點連通的簇的數(shù)量,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述如果與所述節(jié)點連通的2個簇之間連通,則將所述節(jié)點和所述2個簇合并,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述如果與所述節(jié)點連通的2個簇之間排異,則將所述節(jié)點刪除,包括:
6.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述否則將所述節(jié)點合并到與所述節(jié)點連通的2個簇中的一個簇中,包括:
7.一種內(nèi)容的推薦方法,用于電子設(shè)備,其特征在于,所述方法包括:
8.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括存儲有計算機可執(zhí)行指令的存儲器和處理器,當(dāng)所述指令被所述處理器執(zhí)行時,使得所述電子設(shè)備實施根據(jù)權(quán)利要求1-7中任一項所述的方法。
9.一種計算機存儲介質(zhì),其特征在于,在所述計算機存儲介質(zhì)上存儲有指令,當(dāng)所述指令在計算機上運行時,使得所述計算機執(zhí)行根據(jù)權(quán)利要求1-7中任一項所述的方法。
10.一種計算機程序產(chǎn)品,其特征在于,包括計算機可執(zhí)行指令,所述指令被處理器執(zhí)行以實施根據(jù)權(quán)利要求1-7中任一項所述的方法。