本發(fā)明涉及人工智能機器學習,特別是涉及一種基于意圖導向的自監(jiān)督學習圖推薦方法、系統(tǒng)、終端設備及計算機可讀存儲介質(zhì)。
背景技術(shù):
1、在互聯(lián)網(wǎng)和數(shù)字技術(shù)迅猛發(fā)展的信息時代,人們面臨著海量的信息和內(nèi)容,如何從中篩選出符合用戶興趣和偏好的信息已經(jīng)成為了一個急需解決的問題。推薦系統(tǒng)能夠根據(jù)用戶之前交互過的物品以及各種行為數(shù)據(jù),向用戶推薦其未來可能進行交互的物品和內(nèi)容,從而能夠提高用戶的體驗,增加用戶的粘性以及促進各種商品的交易。
2、目前,傳統(tǒng)的推薦算法大多是只使用協(xié)同過濾的算法來進行推薦,這類推薦算法的缺點是在訓練推薦算法時會面臨數(shù)據(jù)稀疏性以及數(shù)據(jù)中存在假負樣本的問題。這些問題會降低推薦算法的準確度,從而影響到推薦系統(tǒng)的性能。
技術(shù)實現(xiàn)思路
1、為了解決上述現(xiàn)有技術(shù)中的至少一個問題,本發(fā)明提供了一種基于意圖導向的自監(jiān)督學習圖推薦方法、系統(tǒng)、終端設備及計算機可讀存儲介質(zhì),能夠更好地建模用戶的興趣,從而實現(xiàn)更準確、更高效的用戶推薦。
2、本發(fā)明的第一個目的在于提供一種基于意圖導向的自監(jiān)督學習圖推薦方法。
3、本發(fā)明的第二個目的在于提供一種基于意圖導向的自監(jiān)督學習圖推薦系統(tǒng)。
4、本發(fā)明的第三個目的在于提供一種終端設備。
5、本發(fā)明的第四個目的在于提供一種計算機可讀存儲介質(zhì)。
6、本發(fā)明的第一個目的可以通過采取如下技術(shù)方案達到:
7、一種基于意圖導向的自監(jiān)督學習圖推薦方法,所述方法包括:
8、根據(jù)用戶與物品的交互數(shù)據(jù)構(gòu)建用戶-物品交互圖,將用戶-物品交互圖中用戶-物品的id輸入意圖感知的圖編碼器,獲取每個意圖下的用戶-物品的嵌入表示,并對每個意圖下的用戶-物品嵌入表示進行聚合;
9、將聚合后用戶-物品的嵌入表示輸入訓練好的自監(jiān)督學習框架中的在線網(wǎng)絡,預測用戶-物品的推薦分數(shù);其中,所述自監(jiān)督學習框架包括在線網(wǎng)絡和目標網(wǎng)絡,所述在線網(wǎng)絡用于根據(jù)聚合后用戶-物品的嵌入表示預測用戶-物品的推薦分數(shù),所述目標網(wǎng)絡用于在訓練過程中對聚合后用戶-物品的嵌入表示進行數(shù)據(jù)增強。
10、進一步的,所述將用戶-物品交互圖中用戶-物品的id輸入意圖感知的圖編碼器,獲取每個意圖下的用戶-物品的嵌入表示,包括:
11、將用戶和物品的id轉(zhuǎn)換為可學習的初始嵌入表示,再將初始嵌入表示根據(jù)k個意圖分解為k個不同的嵌入表示;k為大于1的正整數(shù);
12、根據(jù)每個意圖的嵌入表示以及用戶在該意圖下跟物品進行交互的概率,構(gòu)建每個意圖下的用戶-物品交互圖;
13、對每個意圖下的用戶-物品交互圖進行圖卷積操作,獲取每個意圖下的用戶-物品的嵌入表示。
14、進一步的,所述數(shù)據(jù)增強采用節(jié)點特化的方式。
15、進一步的,設在線網(wǎng)絡的輸出為其中,和分別為用戶的輸出和物品的輸出;
16、設目標網(wǎng)絡的擾動輸出為其中,和分別為用戶的輸出和物品的輸出;
17、在訓練過程中,只在在線網(wǎng)絡上進行反向傳播損失,損失函數(shù)為負余弦損失函數(shù)c·;在目標網(wǎng)絡上停止梯度傳播,采用sg(·)作為停止梯度算子;則自監(jiān)督學習框架的損失函數(shù)為:
18、
19、進一步的,采用交叉預測的方法預測用戶和物品之間的交互得分,即為推薦分數(shù):
20、s(eu,ei)=h(eu)·(ei)t+eu·h(ei)t
21、其中,s(eu,ei)為用戶u對物品i的推薦分數(shù),(eu,ei)為用戶-物品的嵌入表示,eu和ei分別為用戶的嵌入表示和物品的嵌入表示;(·)t表示進行轉(zhuǎn)置操作,h(·)為在線網(wǎng)絡。
22、進一步的,在自監(jiān)督學習框架中加入去噪模塊以實現(xiàn)數(shù)據(jù)去噪;利用去噪模塊的輸出與目標網(wǎng)絡的輸出進行對比學習,以減輕訓練過程中噪聲的影響。
23、進一步的,所述數(shù)據(jù)去噪,包括:
24、將用戶-物品交互圖輸入去噪模塊,根據(jù)節(jié)點與其相鄰節(jié)點的結(jié)構(gòu)相似性計算用戶和物品交互的可靠程度;
25、根據(jù)用戶和物品交互的可靠程度重新構(gòu)建鄰接矩陣,并且將其中可靠程度低于設定閾值的交互丟棄,實現(xiàn)去噪;
26、對去噪后的鄰接矩陣進行圖卷積,獲得去噪后的用戶和物品的嵌入表示,即為去噪模塊的輸出。
27、進一步的,所述在線網(wǎng)絡為單層感知機。
28、本發(fā)明的第二個目的可以通過采取如下技術(shù)方案達到:
29、一種基于意圖導向的自監(jiān)督學習圖推薦系統(tǒng),所述系統(tǒng)包括:
30、獲取模塊,用于根據(jù)用戶與物品的交互數(shù)據(jù)構(gòu)建用戶-物品交互圖,將用戶-物品交互圖中用戶-物品的id輸入意圖感知的圖編碼器,獲取每個意圖下的用戶-物品的嵌入表示,并對每個意圖下的用戶-物品嵌入表示進行聚合;
31、預測模塊,用于將聚合后用戶-物品的嵌入表示輸入訓練好的自監(jiān)督學習框架中的在線網(wǎng)絡,預測用戶-物品的推薦分數(shù);其中,所述自監(jiān)督學習框架包括在線網(wǎng)絡和目標網(wǎng)絡,所述在線網(wǎng)絡用于根據(jù)聚合后用戶-物品的嵌入表示預測用戶-物品的推薦分數(shù),所述目標網(wǎng)絡用于在訓練過程中對聚合后用戶-物品的嵌入表示進行數(shù)據(jù)增強。
32、本發(fā)明的第三個目的可以通過采取如下技術(shù)方案達到:
33、一種終端設備,包括處理器以及用于存儲處理器可執(zhí)行程序的存儲器,所述處理器執(zhí)行存儲器存儲的程序時,實現(xiàn)上述的基于意圖導向的自監(jiān)督學習圖推薦方法。
34、本發(fā)明的第四個目的可以通過采取如下技術(shù)方案達到:
35、一種計算機可讀存儲介質(zhì),存儲有程序,所述程序被處理器執(zhí)行時,實現(xiàn)上述的基于意圖導向的自監(jiān)督學習圖推薦方法。
36、本發(fā)明相對于現(xiàn)有技術(shù)具有如下的有益效果:
37、本發(fā)明采用自監(jiān)督學習,有效解決了數(shù)據(jù)稀疏性的問題;通過設計對應的輔助任務,能夠更好的利用現(xiàn)有的用戶-物品交互數(shù)據(jù)中的信息;通過采用意圖感知的圖編碼器,能夠更好地建模用戶的各種興趣,從而提高推薦的性能;相比于眾多推薦系統(tǒng)方法中采用的bpr損失函數(shù),本發(fā)明在孿生網(wǎng)絡的自監(jiān)督學習框架中,在計算損失函數(shù)時能夠只使用觀測到的用戶-物品交互的信息,從而避免了數(shù)據(jù)中存在假負樣本的問題,提高推薦的準確率;采用對比學習的形式將去噪模塊結(jié)合到推薦任務上,減輕了數(shù)據(jù)噪聲對算法的影響。
1.一種基于意圖導向的自監(jiān)督學習圖推薦方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的自監(jiān)督學習圖推薦方法,其特征在于,所述將用戶-物品交互圖中用戶-物品的id輸入意圖感知的圖編碼器,獲取每個意圖下的用戶-物品的嵌入表示,包括:
3.根據(jù)權(quán)利要求1所述的自監(jiān)督學習圖推薦方法,其特征在于,所述數(shù)據(jù)增強采用節(jié)點特化的方式。
4.根據(jù)權(quán)利要求1所述的自監(jiān)督學習圖推薦方法,其特征在于,設在線網(wǎng)絡的輸出為其中,和分別為用戶的輸出和物品的輸出;
5.根據(jù)權(quán)利要求1所述的自監(jiān)督學習圖推薦方法,其特征在于,采用交叉預測的方法預測用戶和物品之間的交互得分,即為推薦分數(shù):
6.根據(jù)權(quán)利要求1~5任一項所述的自監(jiān)督學習圖推薦方法,其特征在于,在自監(jiān)督學習框架中加入去噪模塊以實現(xiàn)數(shù)據(jù)去噪;利用去噪模塊的輸出與目標網(wǎng)絡的輸出進行對比學習,以減輕訓練過程中噪聲的影響。
7.根據(jù)權(quán)利要求6所述的自監(jiān)督學習圖推薦方法,其特征在于,所述數(shù)據(jù)去噪,包括:
8.根據(jù)權(quán)利要求1~5任一項所所述的自監(jiān)督學習圖推薦方法,其特征在于,所述在線網(wǎng)絡為單層感知機。
9.一種基于意圖導向的自監(jiān)督學習圖推薦系統(tǒng),其特征在于,所述系統(tǒng)包括:
10.一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時,實現(xiàn)權(quán)利要求1~8任一項所述的自監(jiān)督學習圖推薦方法。