專利名稱:一種基于服務(wù)組合歷史的服務(wù)分類和推薦方法
技術(shù)領(lǐng)域:
本發(fā)明屬于服務(wù)計(jì)算技術(shù)領(lǐng)域,特別是涉及一種基于二部圖及其投影的服務(wù)分類和推薦方法。
背景技術(shù):
面向服務(wù)的計(jì)算(Service-Oriented Computing, S0C)是針對分布式系統(tǒng)的新型計(jì)算模式,為解決分布異構(gòu)環(huán)境中跨組織敏捷應(yīng)用集成問題帶來了諸多便利,已成為軟件領(lǐng)域最熱門的話題之一。SOC倡導(dǎo)以服務(wù)及其組合為基礎(chǔ)構(gòu)造應(yīng)用的開發(fā)模式,導(dǎo)致軟件系統(tǒng)的主要形態(tài)、生產(chǎn)方式、運(yùn)行方式和使用方式都發(fā)生了巨大變化,軟件系統(tǒng)正處在一個(gè)由軟件服務(wù)實(shí)體組成的開放協(xié)同的軟件環(huán)境中。可以想象,未來的軟件系統(tǒng)都可以由網(wǎng)絡(luò)上分布的各種服務(wù)動態(tài)組合而成,我們將生活在“無網(wǎng)不在、無服務(wù)不在”的網(wǎng)絡(luò)化軟件世界里?;诜?wù)的軟件開發(fā)必將成為業(yè)界開發(fā)軟件采用的主要方式。隨著軟件體系結(jié)構(gòu)研究的深入,人們逐漸意識到軟件結(jié)構(gòu)是決定軟件質(zhì)量的重要因素。一些研究者將軟件系統(tǒng)抽象成網(wǎng)絡(luò)結(jié)構(gòu)(軟件網(wǎng)絡(luò)),即將軟件元素(數(shù)據(jù)對象、 方法、模塊、類、構(gòu)件、子系統(tǒng)等)視為節(jié)點(diǎn),元素之間的關(guān)系作為連接各節(jié)點(diǎn)的無向(有向) 邊,采取軟件工程和復(fù)雜網(wǎng)絡(luò)相關(guān)理論相結(jié)合的研究方法,以分析軟件結(jié)構(gòu)特征為著眼點(diǎn),以理解軟件的結(jié)構(gòu)特性,為軟件開發(fā)和維護(hù)提供支持為目標(biāo),從表征、分析、度量和應(yīng)用四個(gè)方面來對面向?qū)ο筌浖o態(tài)結(jié)構(gòu)進(jìn)行分析,取得了一些成果,這些研究成果對指導(dǎo)面向?qū)ο?Object-Oriented,00)軟件的開發(fā)具有一定的指導(dǎo)意義。如今面向服務(wù)軟件 (Service-Oriented Software, SOS)已經(jīng)日益成為主流,我們有必要研究SOS的結(jié)構(gòu),挖掘其結(jié)構(gòu)中蘊(yùn)含的知識,更好地指導(dǎo)SOS的開發(fā)。服務(wù)發(fā)現(xiàn)和服務(wù)組合吸引了國內(nèi)外眾多學(xué)者的關(guān)注,成為SOC領(lǐng)域中的關(guān)鍵問題。但是目前的服務(wù)缺少分類信息,給服務(wù)發(fā)現(xiàn)、檢索以及服務(wù)資源的管理帶來不便。如果采用手工的方式對服務(wù)分類,當(dāng)服務(wù)數(shù)量大時(shí)顯然是不可取的,因此如何實(shí)現(xiàn)服務(wù)的自動分類構(gòu)成SOC的挑戰(zhàn)。與此同時(shí),服務(wù)組合中服務(wù)的可組合關(guān)系往往是根據(jù)服務(wù)間的輸入輸出來進(jìn)行判斷的,這一原則過于嚴(yán)格。那么除了輸入輸出匹配外,是否存在一種新的服務(wù)匹配方法,挖掘服務(wù)間的潛在可組合關(guān)系。
發(fā)明內(nèi)容
本發(fā)明主要是解決現(xiàn)有技術(shù)所存在的目前的服務(wù)缺少分類信息,給服務(wù)發(fā)現(xiàn)、檢索以及服務(wù)資源的管理帶來不便等的技術(shù)問題;提供了一種可以實(shí)現(xiàn)服務(wù)的自動分類,為服務(wù)添加分類信息,從而給服務(wù)發(fā)現(xiàn)、檢索、以及服務(wù)資源的管理提供便利的一種基于服務(wù)組合歷史的服務(wù)分類和推薦方法。本發(fā)明還有一目的是解決現(xiàn)有技術(shù)所存在的服務(wù)組合中服務(wù)的可組合關(guān)系往往是根據(jù)服務(wù)間的輸入輸出來進(jìn)行判斷的,這一原則過于嚴(yán)格等的技術(shù)問題;提供了一種重用歷史開發(fā)經(jīng)驗(yàn),為軟件開發(fā)者提供可組合的服務(wù),從而為面向服務(wù)的軟件開發(fā)提供支持,同時(shí),利用服務(wù)組合(SOS)的歷史信息,從結(jié)構(gòu)角度(二部圖及其投影)入手,挖掘結(jié)構(gòu)中蘊(yùn)含的知識,最終實(shí)現(xiàn)服務(wù)分類和和服務(wù)推薦,方法利用的信息少,并且簡便易操作的一種基于服務(wù)組合歷史的服務(wù)分類和推薦方法。 本發(fā)明的上述技術(shù)問題主要是通過下述技術(shù)方案得以解決的
一種基于服務(wù)組合歷史的服務(wù)分類和推薦方法,其特征在于,包括服務(wù)分類步驟以及服務(wù)推薦步驟,具體方法如下 所述的服務(wù)分類步驟包括
步驟1.1,收集SOS的元信息數(shù)據(jù),包括S0S的名稱、SOS描述信息、SOS使用的服務(wù)集合、標(biāo)識SOS的標(biāo)簽、SOS加入的時(shí)間、SOS的開發(fā)者、SOS的地址,并將收集SOS的元信息數(shù)據(jù)進(jìn)行數(shù)據(jù)錯(cuò)誤處理,這些處理后的數(shù)據(jù)存于本地?cái)?shù)據(jù)庫;
步驟1. 2,解析步驟1. 1獲得的數(shù)據(jù),分析SOS和服務(wù)之間的構(gòu)成關(guān)系,并將這種構(gòu)成關(guān)系用二部圖表示,所述二部圖包含兩類節(jié)點(diǎn),包括代表SOS的節(jié)點(diǎn)和代表服務(wù)的節(jié)點(diǎn);
步驟1. 3,將步驟1. 2中得到的二部圖在SOS維度進(jìn)行投影,得到相應(yīng)的一維投影圖一SOS相似步驟1. 4,利用聚類算法或社區(qū)發(fā)現(xiàn)算法對步驟1. 3中的SOS相似圖中的節(jié)點(diǎn)進(jìn)行聚類,將SOS節(jié)點(diǎn)劃分成若干類并檢查每一類中各SOS后為各類指定類別名;
步驟1. 5,在步驟1. 4得到的SOS分類結(jié)果的基礎(chǔ)上,根據(jù)步驟1. 2中SOS和服務(wù)間二部圖,計(jì)算每一個(gè)服務(wù)在各類中參與的SOS數(shù)量,然后將其分到SOS數(shù)量最大的那個(gè)類中, 完成服務(wù)分類;
所述的服務(wù)推薦步驟如下包括
步驟2. 1,將步驟1. 2中得到的二部圖在服務(wù)維度進(jìn)行投影,得到相應(yīng)的一維投影圖即服務(wù)組合圖,所述服務(wù)組合圖的節(jié)點(diǎn)代表服務(wù);邊代表這條邊兩端節(jié)點(diǎn)表示的服務(wù)間的可組合關(guān)系;邊上的權(quán)值表示這種可組合關(guān)系的強(qiáng)度,該權(quán)值可以通過這條邊兩端節(jié)點(diǎn)代表的服務(wù)在SOS中的共現(xiàn)關(guān)系來度量;
步驟2. 2,根據(jù)步驟1.2中得到的SOS和服務(wù)的二部圖分析SOS和服務(wù)間的使用模式,即SOS使用幾個(gè)服務(wù),服務(wù)被幾個(gè)SOS使用,并分析這些數(shù)字的分布, 從而確定大部分SOS使用服務(wù)數(shù)的一個(gè)較小范圍[足幻,確定范圍[足鍆的方法為若有#個(gè)303,將這#個(gè)SOS按其使用的服務(wù)數(shù)從小到大排序,取排在前面的
「JV>cm%l個(gè)S0S,其中m%力大于等于go 小于100%的百分值,設(shè)排在第「JV5ci I%1位的
SOS使用的服務(wù)數(shù)為認(rèn)那么就設(shè)置[Α,Β]為[1,奶;
步驟2. 3,將使用頻率高的前i 個(gè)服務(wù)作為核心服務(wù); 步驟2. 4,選擇執(zhí)行以下步驟
步驟2. 41,若用戶還沒選擇任何服務(wù),則為其推薦步驟2. 3中的核心服務(wù); 步驟2. 42,若用戶已經(jīng)選擇了一個(gè)服務(wù),則根據(jù)步驟2. 1中服務(wù)組合圖為其推薦與該服務(wù)相連的,并且它們間權(quán)值排在topi的服務(wù)α是一個(gè)用戶輸入的參數(shù),若A大于該服務(wù)的度則A為該服務(wù)的度,否則A不變。A可以取大于0的任意整數(shù)。但是一般A值越大, 推薦算法在推薦服務(wù)的時(shí)候所需時(shí)間越長;
步驟2. 43,若用戶已選擇了 2項(xiàng)(包括2項(xiàng))以上的服務(wù)首先求這些服務(wù)的所有兩兩組合;然后針對每一種組合,在服務(wù)組合圖中求以這一組合中兩個(gè)服務(wù)為起止點(diǎn),且包含其它服務(wù)(所選擇服務(wù)中除這一組合中兩個(gè)服務(wù)外的服務(wù))的所有路徑;最后分別求每條路徑的邊權(quán)和,并按路徑的邊權(quán)和對所有路徑降序排列,將topi路徑推薦給用戶(一般推薦的都是路徑上節(jié)點(diǎn)數(shù)在5以內(nèi)的路徑)。在上述的一種基于服務(wù)組合歷史的服務(wù)分類和推薦方法,所述步驟1. 2中,所述代表SOS的節(jié)點(diǎn)和代表服務(wù)的節(jié)點(diǎn)均存在邊,表示SOS和服務(wù)之間的構(gòu)成關(guān)系,S卩如果一個(gè) SOS由3個(gè)服務(wù)構(gòu)成,則代表這個(gè)SOS的節(jié)點(diǎn)分別和代表服務(wù)的3個(gè)節(jié)點(diǎn)間存在邊,但是同類的節(jié)點(diǎn)間不存在邊,即代表SOS的節(jié)點(diǎn)間和代表服務(wù)的節(jié)點(diǎn)間不存在邊。在上述的一種基于服務(wù)組合歷史的服務(wù)分類和推薦方法,所述步驟1. 3中,SOS相似圖的節(jié)點(diǎn)代表SOS軟件;網(wǎng)絡(luò)的邊表示其兩端SOS間存在相似性關(guān)系,即SOS間存在相似性則有邊,沒有任何相似性則無邊;邊上的權(quán)值,表示這兩個(gè)SOS間的相似度,該權(quán)值可以通過這兩個(gè)SOS之間元信息進(jìn)行度量,包括描述信息的相似性、共用的服務(wù)、共用的標(biāo)簽、 共同的開發(fā)者。因此,本發(fā)明具有如下優(yōu)點(diǎn)1.可以實(shí)現(xiàn)服務(wù)的自動分類,為服務(wù)添加分類信息, 從而給服務(wù)發(fā)現(xiàn)、檢索、以及服務(wù)資源的管理提供便利;2.重用歷史開發(fā)經(jīng)驗(yàn),為軟件開發(fā)者提供可組合的服務(wù),從而為面向服務(wù)的軟件開發(fā)提供支持,同時(shí),利用服務(wù)組合(SOS)的歷史信息,從結(jié)構(gòu)角度(二部圖及其投影)入手,挖掘結(jié)構(gòu)中蘊(yùn)含的知識,最終實(shí)現(xiàn)服務(wù)分類和和服務(wù)推薦,方法利用的信息少,并且簡便易操作。
圖1 mashup和API服務(wù)二部圖及其投影圖示意圖; 圖2為本實(shí)施例中最終分類后的分類1結(jié)果舉例;
圖3為本實(shí)施例中最終分類后的分類2結(jié)果舉例。
具體實(shí)施例方式下面通過實(shí)施例,并結(jié)合附圖,對本發(fā)明的技術(shù)方案作進(jìn)一步具體的說明。實(shí)施例
本實(shí)施例是基于Programmableffeb, Programmableffeb是著名的mashup禾口開放API月艮務(wù)目錄,到2011年2月止已羅列了 5,000多個(gè)mashup和3,000多個(gè)API服務(wù),并提供了 mashup和API服務(wù)的一些注冊信息,包括它們的名字、URL、提供者、標(biāo)簽等。mashup是由 API服務(wù)組合得到的S0S,API是服務(wù),因此符合本發(fā)明對數(shù)據(jù)的要求。為了便于實(shí)施,本發(fā)明以ftOgrammabIeWeb上的數(shù)據(jù)為載體,提供了實(shí)施例。本實(shí)施例包括包括服務(wù)分類步驟以及服務(wù)推薦步驟,具體方法如下 1、服務(wù)分類步驟
mashup是由API服務(wù)通過組合構(gòu)成的,可以看成一個(gè)大粒度的服務(wù)。為了實(shí)現(xiàn)服務(wù) (mashup、API)的自動分類
步驟3. 1,使用網(wǎng)爬工具將ProgrammableWeb上從2005年(建站時(shí))到2011年1月12 日(實(shí)例工作開展時(shí))所有mashup應(yīng)用的名稱、描述信息、API和標(biāo)簽信息爬了下來,存儲在本地?cái)?shù)據(jù)庫中。ProgrammableWeb上的數(shù)據(jù)都是由用戶提交的,存在一定的隨意性,數(shù)據(jù)存在一些錯(cuò)誤(1)有些mashup存在重復(fù)注冊現(xiàn)象,一些mashup雖然它們名稱不一樣,但是它們的其它信息都一樣。對于這些mashup在數(shù)據(jù)集中只保存一份。(2)有些mashup僅提供了名稱,但是其它的注冊信息缺失。這些mashup將不作為實(shí)驗(yàn)數(shù)據(jù)。同時(shí),用于標(biāo)識 mashup的標(biāo)簽也存在不一致,同一種含義的標(biāo)簽有多種不同的表現(xiàn)形式,如“api”、“Api” 和“APIs”都表示API,但是形式不同,有些標(biāo)簽甚至拼寫錯(cuò)誤。使用Suffix Stripping Algorithm對標(biāo)簽進(jìn)行預(yù)處理,并轉(zhuǎn)化成同一詞性,盡量消除存在的不一致性。最終,數(shù)據(jù)集包含5,115個(gè)mashup、750個(gè)API和1,489個(gè)標(biāo)簽。步驟3. 2,解析步驟3. 1獲得的數(shù)據(jù),分析mashup和API服務(wù)之間的構(gòu)成關(guān)系,并將這種構(gòu)成關(guān)系用二部圖(2-mode graph)表示。該二部圖包含兩類節(jié)點(diǎn),即代表mahsup的節(jié)點(diǎn)和代表API服務(wù)的節(jié)點(diǎn)。這兩類節(jié)點(diǎn)間存在邊,表示mashup使用了該API服務(wù)(見圖 1)。步驟3. 3,將步驟3. 2中得到的二部圖在mashup維度進(jìn)行投影,得到相應(yīng)的一維投影圖——mashup相似圖(見圖1)。mashup相似圖中的節(jié)點(diǎn)代表mashup ;網(wǎng)絡(luò)的邊表示其兩端mashup間存在相似性關(guān)系,即mashup間存在相似性則有邊,沒有任何相似性則無邊;邊上的權(quán)值,表示這兩個(gè)mashup間的相似度。本例中mashup之間的相似度由兩部分構(gòu)成,由共用API產(chǎn)生的相似度和由共用標(biāo)簽產(chǎn)生的相似度,是這兩個(gè)部分的加權(quán)和。這兩個(gè)部分的相似度通過Jacard相似度系數(shù)(Jacard similarity coefficient)計(jì)算,即由API (標(biāo)簽)產(chǎn)生的相似度在數(shù)值上等于由API (標(biāo)簽)的交集的秩與API (標(biāo)簽)并集的秩的比值。步驟3. 4,修改Newman M E J提出的快速算法,使其可以處理加權(quán)圖,然后用于對 mashup相似圖進(jìn)行聚類,得到17個(gè)社區(qū)。然后將這些社區(qū)中個(gè)體數(shù)少的幾個(gè)社區(qū)去掉,最終得到5個(gè)類別。通過對這5個(gè)分類的手工抽樣檢查可知分類1中的mashup主要與手機(jī)移動通信有關(guān)的;分類2中的mashup主要跟在線辦公相關(guān);分類3中主要一些與出行相關(guān)的mashup應(yīng)用;分類4中主要是一些與地圖相關(guān)的mashup應(yīng)用;分類5中主要是一些與社交網(wǎng)絡(luò)密切相關(guān)的mashup應(yīng)用。分類1和分類2的結(jié)果見圖2和圖3所示,其它分類結(jié)果因規(guī)模太大,顯示不清而將其忽略。步驟3. 5,在步驟3. 4得到的mashup分類結(jié)果的基礎(chǔ)上,根據(jù)步驟3. 2中mashup 和API服務(wù)間二部圖,計(jì)算每一個(gè)API服務(wù)在各類中參與的mashup的數(shù)量,然后將其分到 mashup數(shù)量最大的那個(gè)類中,從而實(shí)現(xiàn)API服務(wù)的分類。2、服務(wù)推薦
為了為mashup開發(fā)者推薦服務(wù),本發(fā)明需要完成以下幾個(gè)步驟 步驟4. 1,將步驟3. 2中得到的二部圖在API維度進(jìn)行投影,得到相應(yīng)的一維投影圖——API服務(wù)組合圖(見圖1)。API服務(wù)組合圖的節(jié)點(diǎn)代表API服務(wù);節(jié)點(diǎn)間的邊表示這兩個(gè)服務(wù)間的可組合關(guān)系;邊上的權(quán)值表示這種可組合關(guān)系的強(qiáng)度。本例中API服務(wù)間的邊的權(quán)值計(jì)算如下若這兩個(gè)API都在同一個(gè)mashup中出現(xiàn),那么我們就用這個(gè)mashup中 API服務(wù)數(shù)的倒數(shù)作為這兩個(gè)API服務(wù)在這個(gè)mashup中的相似度的分量,然后將所有這樣的共現(xiàn)關(guān)系累加就可以得到這兩個(gè)API之間連接關(guān)系的強(qiáng)度。步驟4. 2,根據(jù)步驟3. 2中得到的mashup和API服務(wù)的二部圖分析mashup和API 服務(wù)間的使用模式,分析這些使用模式可以為我們推薦API服務(wù)和構(gòu)建Mashup應(yīng)用提供指導(dǎo)。通過分析可以發(fā)現(xiàn),大部分mashup應(yīng)用僅使用了較少的API服務(wù)(80. 1%的mashup應(yīng)用的僅使用了 1個(gè)和2個(gè)API服務(wù)),只有1. 1%的mashup應(yīng)用使用了超過10個(gè)的API服務(wù)(因此將大部分mashup使用API服務(wù)數(shù)的一個(gè)較小范圍[足釗定為[1,10],在本實(shí)施例中,確定[足鍆范圍時(shí),取·。),平均每個(gè)mashup應(yīng)用僅使用了 13. 8個(gè)API服務(wù)。 這說明大部分mashup應(yīng)用僅由少量的API服務(wù)組合而成。步驟4. 3,大部分的API服務(wù)僅參與了較少的maShup(50. 7%的API服務(wù)僅參與了 1個(gè)和2個(gè)mashup),只有17. 9%的API服務(wù)參與了大于10個(gè)的mashup,平均每個(gè)API服務(wù)僅參與了 9. 5maShup。這說明大部分API服務(wù)僅參與了少量的mashup應(yīng)用??梢詫⑴c mashup最多的10個(gè)API服務(wù)稱為核心API服務(wù),因?yàn)樗鼈兂蔀楹芏鄊ashup應(yīng)用的構(gòu)成單元。步驟4. 3,選擇執(zhí)行以下步驟
步驟4. 31,若用戶還沒選擇任何服務(wù),則為其推薦核心API服務(wù),S卩Google Maps、 FlickrλYouTubeλTwitterλAmazon eCommerce、Facebook、eBay、Microsoft Virtual Earth、 Last, fm、Google Search ;
步驟4. 32,若用戶已經(jīng)選擇了一個(gè)API服務(wù),則根據(jù)步驟4. 1中API服務(wù)組合圖為其推薦與該APi服務(wù)相連的,并且它們間權(quán)值排在topi的服務(wù)α是一個(gè)用戶輸入的參數(shù), 若左大于該服務(wù)的度則A為該服務(wù)的度,否則A不變)。如以“23”為預(yù)查詢的API服務(wù),則返回的 top-5 個(gè) API 月艮務(wù)是Flickr、del. icio. us、Google Picasa、Google Maps 禾口 Riya ; 步驟4. 33,若用戶已經(jīng)選擇了多個(gè)(彡2)服務(wù),求從這些點(diǎn)中任選2個(gè)點(diǎn)的所有組合, 針對每一個(gè)組合,求以這兩個(gè)點(diǎn)為起止點(diǎn),并且包含其它服務(wù)的路徑中,路徑權(quán)值和最大且步長在i 以內(nèi)(包括們的top-左個(gè)服務(wù)進(jìn)行推薦。如以“23”和“Riya”為查詢API服務(wù), 返回的3步內(nèi)的的所有路徑中top-2的是[23,F(xiàn)lickr, Riya]和[23,Google Picasa, Riya]。本文中所描述的具體實(shí)施例僅僅是對本發(fā)明精神作舉例說明。本發(fā)明所屬技術(shù)領(lǐng)域的技術(shù)人員可以對所描述的具體實(shí)施例做各種各樣的修改或補(bǔ)充或采用類似的方式替代,但并不會偏離本發(fā)明的精神或者超越所附權(quán)利要求書所定義的范圍。
權(quán)利要求
1.一種基于服務(wù)組合歷史的服務(wù)分類和推薦方法,其特征在于,包括服務(wù)分類步驟以及服務(wù)推薦步驟,具體方法如下所述的服務(wù)分類步驟包括步驟1.1,收集SOS的元信息數(shù)據(jù),包括S0S的名稱、SOS描述信息、SOS使用的服務(wù)集合、標(biāo)識SOS的標(biāo)簽、SOS加入的時(shí)間、SOS的開發(fā)者、SOS的地址,并將收集SOS的元信息數(shù)據(jù)進(jìn)行數(shù)據(jù)錯(cuò)誤處理,這些處理后的數(shù)據(jù)存于本地?cái)?shù)據(jù)庫;步驟1. 2,解析步驟1. 1獲得的數(shù)據(jù),分析SOS和服務(wù)之間的構(gòu)成關(guān)系,并將這種構(gòu)成關(guān)系用二部圖表示,所述二部圖包含兩類節(jié)點(diǎn),包括代表SOS的節(jié)點(diǎn)和代表服務(wù)的節(jié)點(diǎn);步驟1. 3,將步驟1. 2中得到的二部圖在SOS維度進(jìn)行投影,得到相應(yīng)的一維投影圖一SOS相似圖;步驟1. 4,利用聚類算法或社區(qū)發(fā)現(xiàn)算法對步驟1. 3中的SOS相似圖中的節(jié)點(diǎn)進(jìn)行聚類,將SOS節(jié)點(diǎn)劃分成若干類并檢查每一類中各SOS后為各類指定類別名;步驟1. 5,在步驟1. 4得到的SOS分類結(jié)果的基礎(chǔ)上,根據(jù)步驟1. 2中SOS和服務(wù)間二部圖,計(jì)算每一個(gè)服務(wù)在各類中參與的SOS數(shù)量,然后將其分到SOS數(shù)量最大的那個(gè)類中, 完成服務(wù)分類;所述的服務(wù)推薦步驟如下包括步驟2. 1,將步驟1. 2中得到的二部圖在服務(wù)維度進(jìn)行投影,得到相應(yīng)的一維投影圖即服務(wù)組合圖,所述服務(wù)組合圖的節(jié)點(diǎn)代表服務(wù);邊代表這條邊兩端節(jié)點(diǎn)表示的服務(wù)間的可組合關(guān)系;邊上的權(quán)值表示這種可組合關(guān)系的強(qiáng)度,該權(quán)值可以通過這條邊兩端節(jié)點(diǎn)代表的服務(wù)在SOS中的共現(xiàn)關(guān)系來度量;步驟2. 2,根據(jù)步驟1. 2中得到的SOS和服務(wù)的二部圖分析SOS和服務(wù)間的使用模式,即SOS使用幾個(gè)服務(wù),服務(wù)被幾個(gè)SOS使用,并分析這些數(shù)字的分布, 從而確定大部分SOS使用服務(wù)數(shù)的一個(gè)較小范圍[4,幻,確定范圍[足鍆的方法為若有#個(gè)303,將這#個(gè)SOS按其使用的服務(wù)數(shù)從小到大排序,取排在前面的個(gè)S0S,其中m%力大于等于;go 小于100%的百分值,設(shè)排在第pVxm%l位的SOS使用的服務(wù)數(shù)為認(rèn)那么就設(shè)置[Α,Β]為[1,奶;步驟2. 3,將使用頻率高的前i 個(gè)服務(wù)作為核心服務(wù); 步驟2. 4,選擇執(zhí)行以下步驟步驟2. 41,若用戶還沒選擇任何服務(wù),則為其推薦步驟2. 3中的核心服務(wù); 步驟2. 42,若用戶已經(jīng)選擇了一個(gè)服務(wù),則根據(jù)步驟2. 1中服務(wù)組合圖為其推薦與該服務(wù)相連的,并且它們間權(quán)值排在topi的服務(wù),其中j是一個(gè)用戶輸入的參數(shù),若A大于該服務(wù)的度則A為該服務(wù)的度,否則A不變j取大于0的任意整數(shù),A值越大,推薦算法在推薦服務(wù)的時(shí)候所需時(shí)間越長;步驟2. 43,若用戶已選擇了大于等于2項(xiàng)以上的服務(wù)首先求這些服務(wù)的所有兩兩組合;然后針對每一種組合,在服務(wù)組合圖中求以這一組合中兩個(gè)服務(wù)為起止點(diǎn),且包含其它服務(wù)(所選擇服務(wù)中除這一組合中兩個(gè)服務(wù)外的服務(wù))的所有路徑;最后分別求每條路徑的邊權(quán)和,并按路徑的邊權(quán)和對所有路徑降序排列,將topi路徑推薦給用戶。
2.根據(jù)權(quán)利要求1所述的一種基于服務(wù)組合歷史的服務(wù)分類和推薦方法,其特征在于,所述步驟1. 2中,所述代表SOS的節(jié)點(diǎn)和代表服務(wù)的節(jié)點(diǎn)均存在邊,表示SOS和服務(wù)之間的構(gòu)成關(guān)系,即如果一個(gè)SOS由3個(gè)服務(wù)構(gòu)成,則代表這個(gè)SOS的節(jié)點(diǎn)分別和代表服務(wù)的 3個(gè)節(jié)點(diǎn)間存在邊,但是同類的節(jié)點(diǎn)間不存在邊,即代表SOS的節(jié)點(diǎn)間和代表服務(wù)的節(jié)點(diǎn)間不存在邊。
3.根據(jù)權(quán)利要求1所述的一種基于服務(wù)組合歷史的服務(wù)分類和推薦方法,其特征在于,所述步驟1. 3中,SOS相似圖的節(jié)點(diǎn)代表SOS軟件;網(wǎng)絡(luò)的邊表示其兩端SOS間存在相似性關(guān)系,即SOS間存在相似性則有邊,沒有任何相似性則無邊;邊上的權(quán)值,表示這兩個(gè)SOS 間的相似度,該權(quán)值可以通過這兩個(gè)SOS之間元信息進(jìn)行度量,包括描述信息的相似性、共用的服務(wù)、共用的標(biāo)簽、共同的開發(fā)者。
全文摘要
本發(fā)明屬于服務(wù)計(jì)算技術(shù)領(lǐng)域,涉及一種基于二部圖及其投影的服務(wù)分類和推薦方法,包括服務(wù)分類步驟以及服務(wù)推薦步驟,服務(wù)分類步驟包括收集面向服務(wù)軟件(SOS)的信息并用二部圖抽象SOS和服務(wù)間的構(gòu)成關(guān)系;然后將二部圖在SOS維度進(jìn)行投影,得到SOS相似圖;對SOS相似圖聚類得到SOS的分類;服務(wù)推薦步驟包括將二部圖在服務(wù)維度進(jìn)行投影,得到服務(wù)組合圖并根據(jù)SOS和服務(wù)的二部圖分析SOS和服務(wù)間的使用模式;將使用頻率高的若干服務(wù)作為核心服務(wù);根據(jù)不同的應(yīng)用場景推薦相應(yīng)的服務(wù)。優(yōu)點(diǎn)如下實(shí)現(xiàn)了服務(wù)的自動分類,為服務(wù)添加分類信息,從而給服務(wù)發(fā)現(xiàn)、檢索、以及服務(wù)資源的管理提供便利。
文檔編號G06F9/44GK102331929SQ20111017505
公開日2012年1月25日 申請日期2011年6月27日 優(yōu)先權(quán)日2011年6月27日
發(fā)明者李兵, 潘偉豐, 邵波 申請人:武漢大學(xué)