本發(fā)明涉及圖書(shū)推薦方法,尤其涉及基于deepfm和注意力機(jī)制的知識(shí)圖譜圖書(shū)推薦方法及系統(tǒng)。
背景技術(shù):
1、隨著智能手機(jī)和平板電腦的普及,在線圖書(shū)為讀者提供了便捷的閱讀平臺(tái),使讀者能夠利用碎片化時(shí)間隨時(shí)隨地進(jìn)行閱讀,為滿足不同讀者的閱讀需求,在線圖書(shū)的種類(lèi)和數(shù)量呈現(xiàn)指數(shù)式增長(zhǎng),信息過(guò)載問(wèn)題相應(yīng)出現(xiàn)。推薦系統(tǒng)作為有效緩解信息過(guò)載的工具,在圖書(shū)推薦中得到廣泛應(yīng)用,其根據(jù)讀者閱讀行為和偏好實(shí)時(shí)調(diào)整推薦列表,確保找到符合其閱讀偏好的書(shū)籍,從而提升閱讀體驗(yàn)。
2、讀者數(shù)量與電子圖書(shū)的海量庫(kù)存相比微不足道,與此同時(shí),讀者與電子圖書(shū)的交互數(shù)據(jù)往往是隱式的,導(dǎo)致讀者的閱讀偏好不易捕捉,存在數(shù)據(jù)稀疏性問(wèn)題。目前圖書(shū)網(wǎng)站通過(guò)輔助信息社交網(wǎng)絡(luò)、評(píng)論文本、知識(shí)圖譜和上下文信息緩解數(shù)據(jù)稀疏。其中,知識(shí)圖譜因其豐富的語(yǔ)義關(guān)系和精準(zhǔn)獲取用戶(hù)興趣脫穎而出。
3、針對(duì)上述問(wèn)題,本發(fā)明提出了基于deepfm和注意力機(jī)制的知識(shí)圖譜圖書(shū)推薦方法,以解決圖書(shū)推薦場(chǎng)景中因隱式交互數(shù)據(jù)稀疏,無(wú)法精準(zhǔn)捕捉讀者興趣導(dǎo)致的推薦列表不準(zhǔn)確問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、鑒于上述現(xiàn)有技術(shù)中存在的問(wèn)題,提出了本發(fā)明。
2、因此,本發(fā)明解決的技術(shù)問(wèn)題是:通過(guò)結(jié)合deepfm模型和注意力機(jī)制,構(gòu)建一個(gè)新型的推薦系統(tǒng),旨在克服現(xiàn)有系統(tǒng)的局限性。首先,將實(shí)現(xiàn)更精確的知識(shí)圖譜嵌入表示,不僅關(guān)注三元組本身,還考慮實(shí)體之間的復(fù)雜關(guān)系和高階信息,從而提升推薦系統(tǒng)的信息挖掘能力和推薦準(zhǔn)確度。其次,采用注意力機(jī)制優(yōu)化模型,平衡和整合低階和高階特征交互,以提高向量表示的精確性和推薦效果。最后,開(kāi)發(fā)一種通用且具有良好泛化能力的路徑分析方法,能夠自動(dòng)學(xué)習(xí)和適應(yīng)不同的場(chǎng)景和應(yīng)用需求,從而使得推薦系統(tǒng)在實(shí)際應(yīng)用中更具靈活性和可擴(kuò)展性。
3、為解決上述技術(shù)問(wèn)題,本發(fā)明提供如下技術(shù)方案:基于deepfm和注意力機(jī)制的知識(shí)圖譜圖書(shū)推薦方法,包括:構(gòu)建協(xié)同知識(shí)圖譜,利用transe方法獲取讀者初始向量嵌入,利用transh方法獲取電子圖書(shū)的初始向量嵌入;利用one-hot編碼處理讀者特征和電子圖書(shū)特征,獲取讀者向量表示和電子圖書(shū)向量表示;通過(guò)deepfm模型對(duì)讀者向量表示優(yōu)化,將transe模型獲得的讀者初始嵌入向量與deepfm模型的輸出融合,獲取最終讀者向量xreader;將one-hot編碼預(yù)處理后的電子圖書(shū)向量表示輸入kgat模型的嵌入層獲取電子圖書(shū)的特征嵌入表示,與transh模型獲得的電子圖書(shū)初始嵌入向量求和,獲取d維電子圖書(shū)向量嵌入后使用kgat模型的信息傳播模塊優(yōu)化,獲取電子圖書(shū)向量xbook;將讀者向量和電子圖書(shū)向量做內(nèi)積操作獲取預(yù)測(cè)評(píng)分,采用綜合損失函數(shù)優(yōu)化模型參數(shù)。
4、作為本發(fā)明所述的基于deepfm和注意力機(jī)制的知識(shí)圖譜圖書(shū)推薦方法的一種優(yōu)選方案,其中:所述構(gòu)建協(xié)同知識(shí)圖譜包括將讀者電子圖書(shū)二部圖r={(u,v)|u∈u,v∈v}的項(xiàng)目v和知識(shí)圖譜gkg={(h,r,t)|h,t∈e,r∈r}中的實(shí)體e對(duì)齊連接,并將讀者作為新的實(shí)體加入到實(shí)體集中,讀者和電子圖書(shū)的隱式交互關(guān)系作為新的關(guān)系加入到關(guān)系集中,構(gòu)建協(xié)同知識(shí)圖譜g={(h,r,t)|h,t∈e',r∈r'},其中,h,r,t分別表示三元組的頭實(shí)體、關(guān)系和尾實(shí)體;e'=e∪u,二部圖項(xiàng)目v是知識(shí)圖譜實(shí)體e的子集,u是讀者集合;r'=r∪{interaction},r是知識(shí)圖譜中的關(guān)系集合,{interaction}是讀者與電子圖書(shū)的隱式交互關(guān)系,構(gòu)建完成協(xié)同知識(shí)圖譜,利用transe方法獲取讀者初始向量嵌入,利用transh方法獲取電子圖書(shū)的初始向量嵌入。
5、作為本發(fā)明所述的基于deepfm和注意力機(jī)制的知識(shí)圖譜圖書(shū)推薦方法的一種優(yōu)選方案,其中:所述讀者初始向量嵌入包括將讀者的人口統(tǒng)計(jì)信息抽取到知識(shí)圖譜中,利用transe方法將讀者知識(shí)圖譜的實(shí)體和關(guān)系嵌入到維度為m的向量空間,獲取讀者初始向量嵌入eu={e1,e2,…em},其中,em表示讀者m的第i個(gè)屬性所對(duì)應(yīng)的向量;所述電子圖書(shū)的初始向量嵌入包括將電子圖書(shū)的屬性信息抽取到知識(shí)圖譜中,利用transh方法將電子圖書(shū)知識(shí)圖譜中實(shí)體和關(guān)系嵌入到n維的向量空間,獲取電子圖書(shū)初始向量嵌入,表示為:
6、evi={e1i,e2i,…eni},
7、其中:
8、eni={e1ni,e2ni,…efni},
9、其中,eni表示電子圖書(shū)n的第i個(gè)屬性所對(duì)應(yīng)的向量,efni表示電子圖書(shū)n的第i個(gè)屬性的第f個(gè)取值。
10、作為本發(fā)明所述的基于deepfm和注意力機(jī)制的知識(shí)圖譜圖書(shū)推薦方法的一種優(yōu)選方案,其中:所述one-hot編碼處理包括處理讀者特征包括性別,年齡以及職業(yè)和電子圖書(shū)特征包括作者,主角以及題材,對(duì)讀者特征和電子圖書(shū)特征進(jìn)行預(yù)處理one-hot編碼,將數(shù)值特征進(jìn)行標(biāo)準(zhǔn)化處理,獲取讀者向量表示和電子圖書(shū)向量表示,使用deepfm模型對(duì)讀者向量?jī)?yōu)化,使用kgat模型的信息傳播層對(duì)電子圖書(shū)向量?jī)?yōu)化。
11、作為本發(fā)明所述的基于deepfm和注意力機(jī)制的知識(shí)圖譜圖書(shū)推薦方法的一種優(yōu)選方案,其中:所述使用deepfm模型對(duì)讀者向量?jī)?yōu)化包括利用fm模塊提取讀者的一階特征信息和二階特征交互信息,deep模塊提取讀者的高階特征交互信息,將deepfm的fm模塊和deep兩個(gè)模塊的輸出加權(quán)求和,獲取優(yōu)化后的讀者向量表示:
12、
13、其中,wi是讀者特征xi的參數(shù)權(quán)重,vi是特征向量xi的隱含向量,b是偏置項(xiàng);
14、將transe獲取的讀者初始向量嵌入eu與deepfm優(yōu)化后的讀者向量表示reader融合,d表示讀者向量表示維度,在transe和deepfm模型的最后添加全連接層。
15、作為本發(fā)明所述的基于deepfm和注意力機(jī)制的知識(shí)圖譜圖書(shū)推薦方法的一種優(yōu)選方案,其中:所述使用kgat模型的信息傳播層對(duì)電子圖書(shū)向量?jī)?yōu)化包括采用關(guān)系感知圖注意力網(wǎng)絡(luò)迭代聚合鄰域信息,獲取電子圖書(shū)的實(shí)體表示,經(jīng)過(guò)多層迭代傳播后得到電子圖書(shū)的每一層表示,累加得到d維的電子圖書(shū)向量xbook;
16、第l層迭代具體過(guò)程表示為:h表示頭實(shí)體,nh表示與頭實(shí)體h相鄰的尾,實(shí)體和關(guān)系r的集合,頭實(shí)體h鄰域內(nèi)包含多個(gè)鄰居實(shí)體,頭實(shí)體與不同鄰居實(shí)體的關(guān)系權(quán)重不同,利用注意力機(jī)制動(dòng)態(tài)計(jì)算鄰居實(shí)體的權(quán)重,δ‘r(h,t)表示為:
17、δ‘r(h,t)=fsim(eh⊥,er+et⊥)
18、其中,fsim是余弦相似度函數(shù),eh⊥,et⊥是給定知識(shí)圖譜三元組(h,r,t),經(jīng)過(guò)映射后的頭實(shí)體和尾實(shí)體表示,er是頭尾實(shí)體間的關(guān)系表示,使用softmax函數(shù)歸一化處理,表示為:
19、
20、得到當(dāng)前頭實(shí)體h在l層的鄰域特征利用鄰域信息表示:
21、
22、其中,是l層迭代過(guò)程中融合了關(guān)系特征的尾實(shí)體t的表示;
23、使用gcn聚合函數(shù)將頭實(shí)體h自身特征和鄰域特征相加,經(jīng)過(guò)非線性變換層得到l+1層的頭實(shí)體h表示:
24、
25、其中,表示頭實(shí)體h在第層的嵌入表示,σ是激活函數(shù);
26、經(jīng)過(guò)多層注意力機(jī)制迭代的信息傳播后,獲得電子圖書(shū)的每一層表示,將每一層的表示累加,得到d維的電子圖書(shū)向量xbook。
27、作為本發(fā)明所述的基于deepfm和注意力機(jī)制的知識(shí)圖譜圖書(shū)推薦方法的一種優(yōu)選方案,其中:所述預(yù)測(cè)評(píng)分包括將讀者向量和電子圖書(shū)向量做內(nèi)積操作獲得預(yù)測(cè)評(píng)分:所述優(yōu)化模型參數(shù)包括綜合損失優(yōu)化電子圖書(shū)推薦模型參數(shù),將推薦模型的損失函數(shù)和知識(shí)圖譜初始向量嵌入的損失函數(shù)相加:l=le-book+lkg;
28、推薦模型的任務(wù)目標(biāo)包括將預(yù)測(cè)評(píng)分最高的前k個(gè)電子圖書(shū)推薦給讀者,選用bpr損失函數(shù)優(yōu)化推薦模型參數(shù),確保正樣本的預(yù)測(cè)評(píng)分高于負(fù)樣本:
29、
30、transe方法將讀者知識(shí)圖譜映射到低維稠密向量空間和使用transh方法將電子圖書(shū)知識(shí)圖譜射到低維稠密向量空間的損失函數(shù):
31、lkg=∑(h,r,t,t')-lnσ(g(h,r,t')-g(h,r,t))。
32、為解決上述技術(shù)問(wèn)題,本發(fā)明提供如下技術(shù)方案:基于deepfm和注意力機(jī)制的知識(shí)圖譜圖書(shū)推薦系統(tǒng),包括:知識(shí)圖譜嵌入模塊、kgat信息傳播模塊、deepfm模塊以及評(píng)分預(yù)測(cè)模塊;
33、所述知識(shí)圖譜嵌入模塊,根據(jù)讀者人口統(tǒng)計(jì)信息和電子圖書(shū)的屬性特征,使用transe方法和transh方法獲取初始向量嵌入eu和evi;
34、所述kgat信息傳播模塊,將one-hot編碼預(yù)處理后的低維稠密向量特征v和transh模型獲得的電子圖書(shū)初始嵌入向量evi求和,獲取d維的電子圖書(shū)向量嵌入表示,作為kgat模型嵌入層的輸入,采用關(guān)系感知圖注意力網(wǎng)絡(luò)迭代聚合領(lǐng)域信息,使用kgat模型的信息傳播模塊優(yōu)化,獲取最終電子圖書(shū)向量xbook;
35、所述deepfm模塊,通過(guò)fm模塊提取讀者的一階特征信息和二階特征交互信息,deep模塊提取讀者的高階特征交互信息,通過(guò)激活函數(shù)獲取優(yōu)化后的讀者向量表示reader,在transe和deepfm模型的最后添加全連接層將transe獲取的讀者初始向量嵌入eu與deepfm優(yōu)化后的讀者向量表示reader融合,獲取最終讀者向量xreader;
36、所述評(píng)分預(yù)測(cè)模塊,將預(yù)測(cè)評(píng)分最高的前k個(gè)電子圖書(shū)推薦給讀者。
37、一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如上所述的基于deepfm和注意力機(jī)制的知識(shí)圖譜圖書(shū)推薦方法的步驟。
38、一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的基于deepfm和注意力機(jī)制的知識(shí)圖譜圖書(shū)推薦方法的步驟。
39、本發(fā)明的有益效果:相較于傳統(tǒng)的推薦算法,該方法不僅降低了冷啟動(dòng)對(duì)推薦效果的影響,還充分利用知識(shí)圖譜的關(guān)系信息和特征的交互信息,獲取多源信息,使得讀者向量和圖書(shū)向量表示更加準(zhǔn)確,進(jìn)而提升模型的泛化能力和推薦效果。