一種基于本體的電子商務推薦方法
【技術領域】
[0001] -種基于本體的電子商務推薦方法,用于計算不同本體在本體庫中相似度,并使 用該相似度對基于協(xié)同過濾計算的相似度進行修正,屬于關聯(lián)推薦,知識庫,數(shù)據(jù)挖掘等領 域。
【背景技術】
[0002] 近年來,隨著互聯(lián)網(wǎng)技術的不斷發(fā)展,越來越多的電子商務如雨后春筍般蓬勃發(fā) 展,為社會提供了巨大的效益。然后在這個信息爆炸的時代,每天將會產(chǎn)生大量的商品信息 與用戶信息。面對這些信息,電商企業(yè)如何能夠有效的加以利用,從而能夠挖掘潛在客戶, 發(fā)現(xiàn)用戶的興趣從而能夠做到針對不同的用戶進行個性化服務成為一個難點。另一方面, 對于用戶來說,大量的信息充斥在設備屏幕上,導致用戶查找自己真正需要的信息變的十 分困難。特別對于非專業(yè)人士來說,當用戶輸入的關鍵詞不夠準確的時候,系統(tǒng)通常無法提 供準確的搜索結果,導致用戶體驗大大降低,搜索效率不高的問題。與此同時,當用戶無法 確定自己需要的東西是什么,當用戶不知道該怎么描述自己需要的東西,或者當用戶需要 系統(tǒng)能夠有一定推薦功能的時候,傳統(tǒng)的搜索引擎系統(tǒng)往往很難滿足用戶的這些需求。使 得用戶在實際搜索的過程中陷入困難,甚至根本無法找到自己需要的東西。
[0003] 面對上面提到的這些,在用戶實際使用過程中會遇到的問題。在電子商務領域,為 了能夠提高用戶的整體體驗,幫助用戶找到自己需要的東西,提高商家的銷售量,為商家找 到合適的用戶,通常使用推薦系統(tǒng)來彌補現(xiàn)有搜索引擎系統(tǒng)的不足。以往的推薦系統(tǒng)通常 通過收集用戶行為,例如用戶對項的評分,依據(jù)評分記錄計算用戶或者項之間的相似度,最 后通過相似度對用戶進行相關推薦。然后在實際使用過程中,一些問題慢慢的凸顯出來,例 如項的數(shù)量特別大,而用戶評分記錄比較少的情況下,將會導致系統(tǒng)難于計算用戶或者項 之間的相似度,而相似度計算不準確將直接導致推薦結果的不準確,使得推薦系統(tǒng)的推薦 效果往往不是特別理想。在新的挑戰(zhàn)面前,迫切的需要一些科學、高效的方法對相似度在數(shù) 據(jù)量比較小,用戶評分矩陣相對稀疏的情況下,計算不準確問題的解決方法,從而使得研制 和完善這樣一個系統(tǒng)的課題成為了國內(nèi)外學者及工程技術專家的研究熱點。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明針對現(xiàn)有推薦技術的不足提供了一種基于本體的電子商務推薦方法,用于 解決在用戶數(shù)據(jù)采集量小的情況下,造成系統(tǒng)無法準確計算用戶或者待推薦對象之間的相 似度從而導致系統(tǒng)難于準確向用戶推薦正確結果的問題。
[0005] 為實現(xiàn)上述目的,本發(fā)明采用的技術方案為:
[0006] -種基于本體的電子商務推薦方法,其特征在于,如下步驟:
[0007] (1)分析所需業(yè)務所涉及到的領域的各項知識,再根據(jù)分析的結果有針對性的去 獲取知識,對知識進行提取,利用提取的知識,使用傳統(tǒng)本體庫構建方法構建本體知識庫;
[0008] (2)獲取用戶輸入的關鍵詞,使用傳統(tǒng)分詞算法對用戶輸入的關鍵詞進行分詞處 理,并將停用詞去除;
[0009] (3)將已進行分詞和去除停用詞的關鍵詞,在本體知識庫中查詢出相關聯(lián)的待推 薦對像;
[0010] (4)根據(jù)關鍵詞得到待推薦對象后,獲取用戶對待推薦對象的評分數(shù)據(jù);
[0011] (5)根據(jù)用戶對待推薦對象的評分數(shù)據(jù),利用傳統(tǒng)關聯(lián)推薦算法計算產(chǎn)生的用 戶-項評分矩陣,基于用戶-項評分矩陣使用傳統(tǒng)關聯(lián)推薦算法,計算待推薦對象之間的相 似度;
[0012] (6)使用傳統(tǒng)本體庫構建方法構建本體知識庫后,基于本體知識庫計算待推薦對 象之間的相似度;
[0013] (7)使用步驟(6)中基于本體知識庫計算的待推薦對象之間的相似度對步驟(5) 中基于傳統(tǒng)關聯(lián)推薦算法計算的待推薦對象之間的相似度結果進行修正;
[0014] (8)根據(jù)修正結果選出待推薦對象的鄰居集并生成推薦列表。
[0015] 進一步,所述步驟(5)中,基于用戶-項評分矩陣使用傳統(tǒng)關聯(lián)推薦算法,計算待 推薦對象之間的相似度的公式為:
[0016]
[0017] 其中Pux為用戶u對待推薦對象x的評分,Puy為用戶u對待推薦對象y的評分,巧 為用戶對待推薦對象x評分的均值,g為用戶對待推薦對象y評分的均值,uinU"為對待 推薦對象x與待推薦對象y進行過評分的用戶u。
[0018] 進一步,所述步驟(6)中,基于本體知識庫計算待推薦對象之間的相似度的具體 步驟為:
[0019] (61)計算兩兩本體之間的最短路徑,即計算兩兩待推薦對象之間的最短路徑;
[0020] (62)統(tǒng)計推薦過程中,所涉及到的待推薦對象之間,最短路徑上的權值;
[0021] (63)統(tǒng)計兩兩待推薦對象到根節(jié)點間的路徑中,去除重疊部分后剩下路徑包含的 節(jié)點數(shù)的差;
[0022] (64)根據(jù)步驟(61)、步驟(62)和步驟(63)得到的結果,計算兩兩待推薦對象之 間的相似度。
[0023] 進一步,所述步驟(64)中,計算兩兩待推薦對象之間的相似度的公式為:
[0024]
[0025] 其中,x,y代表在本體知識庫中兩個不同的待推薦對象,Ux,y)表示x,y點到根 節(jié)點間的路徑中,去除重疊部分后,兩條路徑中包含的節(jié)點數(shù)的差,ld(x,y)表示x,y點之 間的最短路徑,a(x,y)表示x,y最短路徑上的權值。
[0026] 進一步,所述步驟(7)中,基于本體知識庫計算的待推薦對象之間的相似度對基 于傳統(tǒng)關聯(lián)推薦算法計算的待推薦對象之間的相似度結果進行修正的公式為:
[0027] Sim(x,y) =aXS(x,y) + 0XSD(x,y),
[0028] 其中,x,y分別表示兩個待計算相似度的待推薦對象,S(x,y)表示基于傳統(tǒng)關聯(lián) 推薦算法得到的兩個待推薦對象的相似度,Sjxj)表示基于本體知識庫計算的相似度,a 和0為基于傳統(tǒng)推薦算法計算的相似度與基于本體的相似度的不同權值,該權值可以根 據(jù)項目實際情況進行適當調(diào)整。
[0029] 與現(xiàn)有技術相比,本發(fā)明在優(yōu)點在于:
[0030] -、使用基于本體庫的方法計算待推薦對象之間的相似程度,其中主要考慮的因 素為:兩個待推薦對象在本體庫中最短路徑的距離;兩個待推薦對象到根節(jié)點的路徑中, 去除重疊部分后剩下路徑中,所包含的節(jié)點數(shù)的差;對本體庫中的每條路徑,根據(jù)知識背景 加入的權值,等3個方面,使用該方法計算的相似度結果更加準確,并且更能客觀的反映待 推薦對象之間的相似度;
[0031] 二、使用基于本體知識庫計算出來的相似度對傳統(tǒng)關聯(lián)推薦算法計算出來的相似 度進行修正,很好的解決了傳統(tǒng)相似度計算方法中,在待推薦對象的數(shù)目太大而用戶數(shù)據(jù) 相對比較稀疏的情況下,計算出來的相似度不準確從而導致整體推薦結果的不準確情況;
[0032] 三、使用該方法進行推薦可以較容易的對推薦結果進行解釋,不會出現(xiàn)當用戶需 要推薦緣由的時候無法給出的情況。
【附圖說明】
[0033] 圖1為本發(fā)明的流程示意圖;
[0034] 圖2為本發(fā)明的框架示意圖;
[0035] 圖3為本發(fā)明的本體庫示意圖。
【具體實施方式】
[0036] 下面將結合附圖及【具體實施方式】對本發(fā)明作進一步的描述。
[0037] 如圖1所示,首先搜集用戶輸入的關鍵詞,使用傳統(tǒng)分詞算法對用戶輸入的關鍵 詞進行分詞及去除與推薦不相關的字詞。在得到一個關鍵詞向量之后,使用傳統(tǒng)協(xié)同過濾 推薦方法計算待推薦對象之間的相似度,之后通過本體庫計算不同待推薦對象之間的相似 度,并根據(jù)調(diào)整公式,使用基于本體知識庫計算的相似度對基于傳統(tǒng)協(xié)同過濾推薦方法計 算得到的相似度進行調(diào)整。最后基于調(diào)整后的相似度產(chǎn)生推薦結果推薦給用戶。基于上述 的方法流程得到如圖2和圖3所示的示意圖。具體如下:
[0038] -種基于本體的電子商務推薦方法,步驟如下:
[0039] (1)分析所需業(yè)務所涉及到的領域的各項知識,即根據(jù)所提供的業(yè)務找到業(yè)務的 特性(如:業(yè)務為手機,對應手機的各項知識可為品牌、價格、顏色等屬性或手機適用的年 齡層等),再根據(jù)分析的結果有針對性的去獲取知識,對知識進行提取,利用提取的知識,使 用傳統(tǒng)本體庫構建方法構建本體知識庫,構建的本體知識庫中包含有多個待推薦對象;
[0040] (2)獲取用戶輸入的關鍵詞,并根據(jù)傳統(tǒng)分詞算法進行分詞處理,并將停用詞去 除;
[0041] (3)將已進行分詞和去除停用詞的關鍵詞,在本體知識庫中查詢出相關聯(lián)的待推 薦對像,此處的查詢方法通過現(xiàn)有的查詢方法進行查詢;
[0042] (4)根據(jù)關鍵詞得到待推薦對象后,獲取用戶對待推薦對象的評分數(shù)據(jù)(即用戶 對待推薦對象的評分或者