一種網(wǎng)絡(luò)服務(wù)資源的提供方法
【專利摘要】一種網(wǎng)絡(luò)服務(wù)資源的提供方法,首先對網(wǎng)絡(luò)服務(wù)資源進(jìn)行分類,然后根據(jù)用戶的興趣提供檢索方案,并根據(jù)該檢索方案提供分類后的網(wǎng)絡(luò)服務(wù)資源,對網(wǎng)絡(luò)服務(wù)資源進(jìn)行分類時,先提取待分類服務(wù)資源的特征向量,然后計算特征向量中每個屬性出現(xiàn)在每個分類中的概率以及權(quán)值,再利用加權(quán)樸素貝葉斯公式獲取每個屬性屬于每個類別的概率,選取最大的作為該服務(wù)資源的分類類別。本發(fā)明在對服務(wù)資源進(jìn)行分類時,利用貝葉斯分類算法并結(jié)合了屬性相似度的計算,提高了服務(wù)資源分類的準(zhǔn)確率;而向用戶提供服務(wù)資源時,是在向量空間模型的框架下探索基于用戶興趣的個性化服務(wù)資源檢索方法,降低了檢索算法中時間和空間的復(fù)雜度,提高了檢索效率。
【專利說明】一種網(wǎng)絡(luò)服務(wù)資源的提供方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及到互聯(lián)網(wǎng)服務(wù)資源的提供領(lǐng)域,具體的說是一種網(wǎng)絡(luò)服務(wù)資源的提供方法。
【背景技術(shù)】
[0002]服務(wù)資源分類是指對網(wǎng)絡(luò)中各種已存在的服務(wù)和資源按照其各自的屬性和特點進(jìn)行分析,并劃分使其歸屬于特定的類別。隨著互聯(lián)網(wǎng)技術(shù)的高速發(fā)展以及計算機技術(shù)的不斷普及,促使人們對網(wǎng)絡(luò)服務(wù)資源的依賴愈加強烈,而服務(wù)資源的分類是一個復(fù)雜的加工處理過程,其涉及到服務(wù)資源的預(yù)處理、特征向量集合的提取和分類等技術(shù)環(huán)節(jié),服務(wù)資源分類則可理解為采用一定的方法與模式,按照一定的規(guī)則將網(wǎng)絡(luò)上的各種資源進(jìn)行全面的分析、優(yōu)選、加工、排列組合、整理、分類等加工處理,使其形成一個有序的、便于用戶高效獲取并利用的服務(wù)資源體的系統(tǒng)過程。服務(wù)資源的分類使得繁雜零散的資源集合形成了有序化的結(jié)構(gòu),使之轉(zhuǎn)化為一個有意義的整體,便于服務(wù)資源能依據(jù)某一特定形式的規(guī)則進(jìn)行更高層次的存取和利用。目前網(wǎng)絡(luò)上的服務(wù)和資源十分豐富,如何將海量的服務(wù)資源準(zhǔn)確的分類,這已成為資源分類技術(shù)要處理的一個關(guān)鍵問題。
[0003]當(dāng)前服務(wù)資源分類方法基本是用戶依據(jù)一定規(guī)則自行手動進(jìn)行人工分類。在資源量過大的時候,使用這種方法必定將消耗大量人力,并且效率相當(dāng)?shù)拖?。?dāng)用戶定義新類別時,又要對原先未定義種類的服務(wù)資源進(jìn)行再次分類,若再進(jìn)行人工分類,代價過大。近年來,一些學(xué)者使用智能學(xué)習(xí)的方法來進(jìn)行分類,取得了一定的成果。現(xiàn)在一些常用的智能分類方法有聚類算法、決策樹算法等。聚類算法由于具有無監(jiān)督的學(xué)習(xí)能力,但在高維數(shù)據(jù)空間中,聚類往往只存在于某些子空間中,并且不同的聚類所關(guān)聯(lián)的子空間也存在差異。受“維度效應(yīng)”的影響,傳統(tǒng)的聚類算法一般無法直接對高維數(shù)據(jù)進(jìn)行有效的聚類,需要通過一些特殊的處理。決策樹分類的直觀表示方法較容易轉(zhuǎn)化為標(biāo)準(zhǔn)的數(shù)據(jù)庫查詢,其歸納的方法行之有效,尤其適合大型數(shù)據(jù)集。但其算法的伸縮性太差,隨著數(shù)據(jù)量的增大其運行時間大大增加。
[0004]目前,個性化檢索是服務(wù)資源檢索領(lǐng)域的熱點和難點。這一領(lǐng)域的研究范圍很廣,涉及到的問題也很多。許多學(xué)者從不同的角度,提出多種技術(shù)方法,主要有:①網(wǎng)絡(luò)數(shù)據(jù)庫技術(shù)(web Database),構(gòu)建用戶等相關(guān)數(shù)據(jù)庫;②過程跟蹤技術(shù)(Process Tracking),如Cookies技術(shù)等;③代理技術(shù)(Agent),代理指在分布式系統(tǒng)中持續(xù)自主的發(fā)揮作用的計算實體,他有獨立性、自主性和交互性等特性,,借助代理,可以很好地完成用戶與系統(tǒng)的交互數(shù)據(jù)挖掘技術(shù)(Data Mining),從海量數(shù)據(jù)中采掘出隱含的、先前未知的、對決策有潛在價值的知識和規(guī)則,并根據(jù)這些規(guī)則,預(yù)測用戶即將發(fā)生的行為;⑤推送技術(shù)(Push),根據(jù)用戶定義的準(zhǔn)則,自動搜索用戶感興趣的服務(wù)資源,并主動傳遞至用戶指定“地點”;⑥信息過濾技術(shù)(Information Filtering),信息過濾是一種用來過濾大量信息流,為用戶提供相關(guān)信息子集的技術(shù)。信息過濾可以分為:基于規(guī)則的過濾、基于協(xié)作的過濾、基于內(nèi)容的過濾,它們的目標(biāo)都是根據(jù)用戶興趣需要將最有價值的服務(wù)資源信息自動推薦給用戶,并最大限度地節(jié)省用戶的閱讀時間。
[0005]傳統(tǒng)的服務(wù)資源檢索技術(shù)滿足了人們一定的檢索需要,但受通用性限制,無法滿足用戶一些復(fù)雜的查詢需求。隨著信息爆炸出現(xiàn),人們對檢索系統(tǒng)的功能、智能化程度以及檢索效果有了更高的要求,希望能提供更準(zhǔn)確、更精煉和更符合個人需要的檢索結(jié)果。
【發(fā)明內(nèi)容】
[0006]為解決傳統(tǒng)的檢索技術(shù)難以滿足人們對檢索系統(tǒng)功能、智能化程度以及檢索效果的要求的問題,本發(fā)明提供了一種網(wǎng)絡(luò)服務(wù)資源的提供方法,來滿足用戶多樣化的實時需求,更加快捷的為用戶提供更優(yōu)質(zhì)的服務(wù)。
[0007]本發(fā)明為解決上述技術(shù)問題采用的技術(shù)方案為:一種網(wǎng)絡(luò)服務(wù)資源的提供方法,首先對網(wǎng)絡(luò)服務(wù)資源進(jìn)行分類,然后根據(jù)用戶的興趣提供檢索方案,并根據(jù)該檢索方案提供分類后的網(wǎng)絡(luò)服務(wù)資源,所述對網(wǎng)絡(luò)服務(wù)資源進(jìn)行分類包括以下步驟:
1)預(yù)定義m個類別,類標(biāo)號為(C1.C2.....Cm},然后提取待分類服務(wù)資源X的若干特征向量,并將這些特征向量組成表征該服務(wù)資源的一個η維特征向量I =?
,分別描述對η個屬性J1,Af, Aft的η個度量;
2)針對η維特征向量中每個屬性+的屬性值,每個類別Cf,計算類別Cf下屬性值 出現(xiàn)的概率’以及類別5出現(xiàn)的概率P(Cf);
3)確定η維特征向量中每個屬性+的權(quán)值.^;
方法如下:首先,定義兩個對象空間&和Oj , fi?(工為兩對象空間第d維屬性集合置觀與置沐之間的距離`
【權(quán)利要求】
1.一種網(wǎng)絡(luò)服務(wù)資源的提供方法,首先對網(wǎng)絡(luò)服務(wù)資源進(jìn)行分類,然后根據(jù)用戶的興趣提供檢索方案,并根據(jù)該檢索方案提供分類后的網(wǎng)絡(luò)服務(wù)資源,其特征在于:所述對網(wǎng)絡(luò)服務(wù)資源進(jìn)行分類包括以下步驟: 1)預(yù)定義m個類別,類標(biāo)號為(C1,C2.-,Cm),然后提取待分類服務(wù)資源X的若干特征向量,并將這些特征向量組成表征該服務(wù)資源的一個η維特征向量
2.根據(jù)權(quán)利要求1所述的一種網(wǎng)絡(luò)服務(wù)資源的提供方法,其特征在于:所述步驟4)的
加權(quán)樸素貝葉斯公式
3.根據(jù)權(quán)利要求1所述的一種網(wǎng)絡(luò)服務(wù)資源的提供方法,其特征在于:所述步驟I)中提取待分類服務(wù)資源X的若干特征向量,特征向量包括文件名、文件后綴名、文本內(nèi)容和文件大小。
4.根據(jù)權(quán)利要求1所述的一種網(wǎng)絡(luò)服務(wù)資源的提供方法,其特征在于:所述根據(jù)用戶的興趣提供檢索方案,首先,定義文檔集合D中的文檔總數(shù)為N,任一屬于集合D的文檔都可以表示為t維向量的形式:dj = (Wsr3Wf5Wijr) 其中,t是索引詞的個數(shù),向量分量Wff代表第i個索引詞Jii在文檔dj中所具有的權(quán)重,然后再根據(jù)用戶的興趣進(jìn)行檢索,具體步驟如下: 步驟一、獲取用戶興趣信息,然后用向量或圖形的方法將興趣信息進(jìn)行形式化的表示,即形成用戶興趣剖像; 步驟二、借助分類目錄表征用戶興趣,并將分類目錄映射為樹狀結(jié)構(gòu)形成用戶興趣樹,用戶興趣樹中的節(jié)點表示類目,該節(jié)點的權(quán)值表示用戶對該節(jié)點表示的類目的感興趣程度; 步驟三、使用二元組興趣向量)來表征用戶興趣剖像,則用戶i的興趣剖像構(gòu)成的興趣剖像庫表征如下:
5.根據(jù)權(quán)利要求4所述的一種網(wǎng)絡(luò)服務(wù)資源的提供方法,其特征在于:所述步驟八中更新該用戶的興趣剖像庫,其具體步驟如下: ①初始化用戶興趣樹,使每個節(jié)點均對應(yīng)一原始權(quán)值&(其中,0〈k〈n+l ),該數(shù)值表征用戶對此節(jié)點下所有文檔的訪問次數(shù); ②葉子節(jié)點權(quán)值不變,重新計算每一個非葉子節(jié)點的權(quán)值:
【文檔編號】G06F17/30GK103778206SQ201410015647
【公開日】2014年5月7日 申請日期:2014年1月14日 優(yōu)先權(quán)日:2014年1月14日
【發(fā)明者】張明川, 鄭瑞娟, 吳慶濤, 楊春蕾, 魏汪洋, 白秀玲, 崔敏, 李晨, 李瑩 申請人:河南科技大學(xué)