本發(fā)明屬于互聯(lián)網(wǎng)領(lǐng)域,更具體地,涉及一種基于評(píng)分網(wǎng)絡(luò)的含時(shí)信譽(yù)評(píng)價(jià)算法。
背景技術(shù):
現(xiàn)有技術(shù)提出了融合主客觀要素的動(dòng)態(tài)信譽(yù)計(jì)算模型,該模型主要通過將數(shù)據(jù)提供者的行為方式、動(dòng)機(jī)、愛好傾向、態(tài)度等建模成信譽(yù)計(jì)算的主觀要素,將數(shù)據(jù)提供者提供的數(shù)據(jù)質(zhì)量建模成信譽(yù)計(jì)算的客觀要素,并在時(shí)間域上對(duì)主客觀要素進(jìn)行整合。Adali等人根據(jù)社交網(wǎng)絡(luò)中用戶的通信行為方式建立了相應(yīng)的行為信譽(yù)計(jì)算模型:綜合會(huì)話信任和傳播信任來計(jì)算行為可信度,該模型的前提假設(shè)是有規(guī)律的通信行為比隨機(jī)通信行為有更高可信度。其中,會(huì)話信任用來表示用戶之間的會(huì)話時(shí)間和會(huì)話頻率,頻率越高、時(shí)間越長(zhǎng)表明他們之間信任度越高;傳播信任是指信息的傳播度,信息從一個(gè)用戶傳到其他用戶的越多說明對(duì)信息源用戶的信任度越高。
現(xiàn)有技術(shù)還提出了一個(gè)基于優(yōu)先級(jí)的信譽(yù)計(jì)算模型,主要從4個(gè)方面來構(gòu)建服務(wù)提供者的信譽(yù)度:服務(wù)請(qǐng)求者、服務(wù)提供者的服務(wù)經(jīng)驗(yàn)與服務(wù)提供者關(guān)于服務(wù)質(zhì)量屬性優(yōu)先級(jí)分布的相似度、候選服務(wù)對(duì)服務(wù)需求的適應(yīng)性以及由第三方提供的評(píng)價(jià)信息,由這4個(gè)屬性共同決定了最終的信譽(yù)值。
現(xiàn)有技術(shù)還提出了基于多Agent系統(tǒng)的網(wǎng)絡(luò)交易動(dòng)態(tài)信任計(jì)算模型與信譽(yù)系統(tǒng)。模型包括用戶時(shí)域的信任度、信譽(yù)反饋評(píng)分的加權(quán)平均計(jì)算及社區(qū)貢獻(xiàn)加權(quán),建立了事前開展防范,事中進(jìn)行協(xié)調(diào),事后給予懲罰三位一體的信譽(yù)約束機(jī)制。
現(xiàn)有技術(shù)還提出了由交互經(jīng)驗(yàn)計(jì)算用戶態(tài)度,以及利用交互時(shí)間序列計(jì)算用戶行為模式變化的方法,進(jìn)而利用態(tài)度、交互經(jīng)驗(yàn)、行為模式3種信息綜合建立信任評(píng)估模型。在當(dāng)前互聯(lián)網(wǎng)環(huán)境中,高質(zhì)量和個(gè)性化推薦是許多在線系統(tǒng)的一個(gè)關(guān)鍵特性。為了幫助用戶從大量的產(chǎn)品或者服務(wù)中找到正確的產(chǎn)品或服務(wù),避免推薦虛假或失望的服務(wù)是網(wǎng)絡(luò)服務(wù)系統(tǒng)設(shè)計(jì)中的一個(gè)基礎(chǔ)性研究問題。為了達(dá)到這個(gè)目的,科研人員提出許多方法。
在現(xiàn)有技術(shù)中最具有代表性的一種方法稱為迭代細(xì)化(簡(jiǎn)稱為IR)算法,在IR算法中,用戶的信譽(yù)與他的評(píng)分向量和對(duì)象的估計(jì)質(zhì)量向量的差異是成反比,估計(jì)質(zhì)量的對(duì)象和評(píng)估用戶的信譽(yù)是通過迭代進(jìn)行更新,直到它們變得穩(wěn)定。在IR算法的基礎(chǔ)上,通過給每個(gè)單獨(dú)的評(píng)分賦予信譽(yù)來優(yōu)化此迭代算法形成了一種新的算法。一種改進(jìn)的迭代算法(為CR)主要是通過用戶的評(píng)分?jǐn)?shù)與對(duì)象的估計(jì)質(zhì)量之間的皮爾森相關(guān)公式來計(jì)算用戶的信譽(yù),這種方法據(jù)稱是對(duì)垃圾郵件惡意的行為非常有效?,F(xiàn)有技術(shù)還提出了一種應(yīng)對(duì)用戶惡意行為的迭代算法(稱為IAAR),主要是通過采用一個(gè)信譽(yù)再分配過程來提高知名用戶的影響和兩個(gè)懲罰因子來惡制用戶惡意行為。
現(xiàn)有的迭代算法中,無論是新提出的還是基于已有算法進(jìn)行優(yōu)化,大部分都是從應(yīng)用上下文信息來進(jìn)行挖掘的導(dǎo)致用戶信譽(yù)評(píng)估不準(zhǔn)確從而導(dǎo)致相關(guān)質(zhì)量排名算法失效的問題。
技術(shù)實(shí)現(xiàn)要素:
針對(duì)現(xiàn)有技術(shù)的缺陷,本發(fā)明的目的在于提供一種基于評(píng)分網(wǎng)絡(luò)的含時(shí)信譽(yù)評(píng)價(jià)算法,旨在解決社交網(wǎng)絡(luò)中因不確定因素導(dǎo)致用戶信譽(yù)評(píng)估不準(zhǔn)確從而導(dǎo)致相關(guān)質(zhì)量排名算法失效的問題。
本發(fā)明提供了一種基于評(píng)分網(wǎng)絡(luò)的含時(shí)信譽(yù)評(píng)價(jià)方法,包括下述步驟:
S1:對(duì)第一行為權(quán)重因子、第二行為權(quán)重因子、用戶信譽(yù)和對(duì)象質(zhì)量分別進(jìn)行初始化;
S2:判斷質(zhì)量變化量是否小于設(shè)定值,若是,則獲得對(duì)象質(zhì)量Qi;若否,則進(jìn)入步驟S3;
S3:依次獲得信譽(yù)積累值、質(zhì)量積累值和用戶的臨時(shí)信譽(yù)值;
S4:根據(jù)所述信譽(yù)積累值、質(zhì)量積累值和用戶的臨時(shí)信譽(yù)值對(duì)用戶信譽(yù)值和對(duì)象質(zhì)量進(jìn)行更新后返回至步驟S2。
更進(jìn)一步地,在步驟S1中,通過公式對(duì)用戶行為權(quán)重因子進(jìn)行初始化;通過公式對(duì)對(duì)象行為權(quán)重因子進(jìn)行初始化;通過公式對(duì)用戶信譽(yù)進(jìn)行初始化;通過公式對(duì)所述對(duì)象質(zhì)量進(jìn)行初始化;其中,Wuij為某段時(shí)間的用戶行為權(quán)重因子,i為一個(gè)序號(hào)標(biāo)識(shí)符,t為一個(gè)具體時(shí)間段標(biāo)識(shí)符,UUj為在某段時(shí)間內(nèi)的用戶集合,Tj為總記錄數(shù)中在某段時(shí)間內(nèi)的對(duì)象集合,Vt為單個(gè)用戶在某段時(shí)間內(nèi)的對(duì)象集合,UTix為用戶在某個(gè)時(shí)間段的集合;woij為對(duì)象在某段時(shí)間內(nèi)的權(quán)重,i為一個(gè)序號(hào)標(biāo)識(shí)符,t為一個(gè)具體時(shí)間段標(biāo)識(shí)符,OTix為對(duì)象在某段時(shí)間內(nèi)的集合,OOj為在某段時(shí)間內(nèi)的對(duì)象集合,Tj為總記錄數(shù)中在某段時(shí)間內(nèi)的對(duì)象集合,Vt為單個(gè)用戶在某段時(shí)間內(nèi)的對(duì)象集合,OTix為對(duì)象在某個(gè)時(shí)間段內(nèi)的集合;Ri為某個(gè)用戶的信譽(yù)值,x為一個(gè)序號(hào)標(biāo)識(shí)符,Oij為用戶在某個(gè)時(shí)間段內(nèi)選擇的對(duì)象集合,Wuij為用戶在某段時(shí)間的權(quán)重,rix為用戶給某個(gè)對(duì)象的評(píng)分,kui為某個(gè)用戶的度;Qi為某個(gè)對(duì)象的質(zhì)量,i為一個(gè)序號(hào)標(biāo)識(shí)符,Uij為在某個(gè)時(shí)間段內(nèi)選擇某個(gè)對(duì)象的用戶集合,Woij為對(duì)象在某段時(shí)間內(nèi)的權(quán)重,Ri為某個(gè)用戶的信譽(yù)值,rix為用戶給某個(gè)對(duì)象的評(píng)分。
更進(jìn)一步地,在步驟S2中,所述質(zhì)量變化量其中,|Q-Q′|為一個(gè)條件變量,用來結(jié)束算法運(yùn)轉(zhuǎn),Ql為某個(gè)對(duì)象的質(zhì)量,Q′l為其他對(duì)象的質(zhì)量,accoi為某個(gè)對(duì)象的質(zhì)量積累過程分量值,l為一個(gè)序號(hào)標(biāo)識(shí)符,Ototal為對(duì)象的總數(shù)量,o表示對(duì)象。
更進(jìn)一步地,設(shè)定值Δ=10-4。
更進(jìn)一步地,在步驟S3中,兩個(gè)分量積累過程和信譽(yù)值;臨時(shí)信譽(yù)值其中,accui為某個(gè)用戶信譽(yù)積累過程的信譽(yù)值,kui為某個(gè)用戶的度,kok為某個(gè)對(duì)象的度,k為一個(gè)序號(hào)標(biāo)識(shí)符,Oij為用戶在某個(gè)時(shí)間段內(nèi)選擇的對(duì)象集合,rix為用戶給某個(gè)對(duì)象的評(píng)分;Qi為某個(gè)對(duì)象的質(zhì)量,Ri為某個(gè)用戶的信譽(yù)值;accoi為某個(gè)對(duì)象質(zhì)量積累過程的值,kui為某個(gè)用戶的度,kok為某個(gè)對(duì)象的度,k為一個(gè)序號(hào)標(biāo)識(shí)符,Uij為在某個(gè)時(shí)間段內(nèi)選擇某個(gè)對(duì)象的用戶集合,Qi為某個(gè)對(duì)象的質(zhì)量,Ri為某個(gè)用戶的信譽(yù)值;accui為某個(gè)用戶信譽(yù)積累過程的信譽(yù)值,Qi為某個(gè)對(duì)象的質(zhì)量,x為一個(gè)序號(hào)標(biāo)識(shí)符,Oij為用戶在某個(gè)時(shí)間段內(nèi)選擇的對(duì)象集合,Woij為對(duì)象在某段時(shí)間內(nèi)的權(quán)重,rix為用戶給某個(gè)對(duì)象的評(píng)分,Wuij為用戶在某段時(shí)間的權(quán)重,為某個(gè)用戶的評(píng)分向量的平均值,Dri為某個(gè)用戶評(píng)分向量的標(biāo)準(zhǔn)差,DQi為某個(gè)對(duì)象質(zhì)量向量的標(biāo)準(zhǔn)差,為某個(gè)對(duì)象質(zhì)量的平均值。
更進(jìn)一步地,在步驟S4中,通過公式對(duì)信譽(yù)進(jìn)行更新;通過公式對(duì)所述對(duì)象質(zhì)量進(jìn)行更行。
通過本發(fā)明所構(gòu)思的以上技術(shù)方案,與現(xiàn)有技術(shù)相比,由于能有效預(yù)測(cè)用戶的信譽(yù),并對(duì)惡意用戶行為能夠有效的進(jìn)行制約,并結(jié)合兩個(gè)評(píng)分時(shí)間因子的迭代算法,能夠在一定程度扼制了用戶的惡意評(píng)分行為,大大增強(qiáng)了魯棒性。通過時(shí)間分段的兩個(gè)行為權(quán)重因子能夠在時(shí)間的方式上量化用戶的權(quán)重值,并且多個(gè)時(shí)間段權(quán)重值的綜合計(jì)算更符合實(shí)際情況。通過從度和時(shí)間兩個(gè)角度設(shè)計(jì)兩個(gè)積累過程能夠有效提升對(duì)象的質(zhì)量和用戶的信譽(yù)。
附圖說明
圖1是本發(fā)明實(shí)施例提供的基于評(píng)分網(wǎng)絡(luò)的含時(shí)信譽(yù)評(píng)價(jià)算法的實(shí)現(xiàn)流程圖。
具體實(shí)施方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
本發(fā)明實(shí)施例提供的基于評(píng)分網(wǎng)絡(luò)的含時(shí)信譽(yù)評(píng)價(jià)算法可以應(yīng)用于多個(gè)領(lǐng)域,比如:應(yīng)用于科研領(lǐng)域,可以作為對(duì)比算法,應(yīng)用方式是編程實(shí)現(xiàn)并導(dǎo)入擬檢測(cè)數(shù)據(jù)集運(yùn)行。應(yīng)用于互聯(lián)網(wǎng)領(lǐng)域,可以應(yīng)用于國(guó)家產(chǎn)品、論文系統(tǒng)、電子商務(wù)等,應(yīng)用方式是編程實(shí)現(xiàn)并導(dǎo)入擬檢測(cè)數(shù)據(jù)集運(yùn)行。應(yīng)用于工業(yè)領(lǐng)域,可應(yīng)用于網(wǎng)絡(luò)入侵檢測(cè)、信用卡欺詐檢測(cè)、交通流量檢測(cè)等,應(yīng)用方式是編程實(shí)現(xiàn)并導(dǎo)入擬檢測(cè)數(shù)據(jù)集運(yùn)行。應(yīng)用于生活領(lǐng)域,可應(yīng)用于個(gè)人信譽(yù)評(píng)估、競(jìng)賽排名等,應(yīng)用方式是編程實(shí)現(xiàn)并導(dǎo)入擬檢測(cè)數(shù)據(jù)集運(yùn)行。
本發(fā)明實(shí)施例提供的一種基于評(píng)分網(wǎng)絡(luò)的含時(shí)信譽(yù)評(píng)價(jià)算法主要包括:通過時(shí)間分段的兩個(gè)行為權(quán)重因子能夠在時(shí)間的方式上量化用戶的權(quán)重值,并且多個(gè)時(shí)間段權(quán)重值的綜合計(jì)算更符合實(shí)際情況;從度和時(shí)間兩個(gè)角度設(shè)計(jì)兩個(gè)積累過程能夠有效提升對(duì)象的質(zhì)量和用戶的信譽(yù)。
具體如下:
兩個(gè)不同的行為權(quán)重因子:
一個(gè)用戶在不同的時(shí)間會(huì)表現(xiàn)不同的行為,為了體現(xiàn)這種行為在時(shí)間因素下的權(quán)重值,可以用如下公式設(shè)定:
一個(gè)對(duì)象在不同的時(shí)間會(huì)體現(xiàn)不同的質(zhì)量,為了體現(xiàn)這種質(zhì)量在時(shí)間因素下的權(quán)重值,可以用如下公式設(shè)定:
用Ri表示用戶i的信譽(yù),每個(gè)用戶信譽(yù)的初始值通過如下公式設(shè)定:
用Qa表示對(duì)象a的質(zhì)量,每個(gè)對(duì)象質(zhì)量的初始值可通過如下公式設(shè)定:
從公式(1)(2)(3)(4)可知,一個(gè)用戶的行為權(quán)重值因子的大小取決于他在一段時(shí)間所看對(duì)象的數(shù)量,在這篇文章里面指所看電影的數(shù)量。一個(gè)對(duì)象的行為權(quán)重因子大小取決于它在一段時(shí)間被用戶所涉及的頻率,頻率越高則表示在這段時(shí)間內(nèi)的權(quán)重值越大。一個(gè)用戶的信譽(yù)值不再是簡(jiǎn)單的通過平均值來初始化,而是取決于用戶信譽(yù)、用戶行為權(quán)重因子、用戶的度,這樣更能體現(xiàn)多因素的影響,從側(cè)面也與實(shí)際情況相符合。
在某一次更新過程中,為了計(jì)算用戶i的信譽(yù)值,我們基于時(shí)間和度的角度設(shè)計(jì)了一個(gè)信譽(yù)積累過程,如下:
由于一個(gè)用戶的信譽(yù)不是一次建立的,而是逐漸積累的過程,所以我們將與此用戶相關(guān)的信息作了分析并計(jì)算。從公式可以看出一個(gè)用戶的信譽(yù)分量與此用戶所看的對(duì)象的質(zhì)量、對(duì)象的度、對(duì)象的評(píng)分、用戶總體信譽(yù)、用戶的度呈現(xiàn)一定的比例關(guān)系。另外這個(gè)積累過程能夠有效應(yīng)對(duì)惡意評(píng)分,因?yàn)橐淮蔚膼阂庠u(píng)論對(duì)整體的信譽(yù)影響不大,隨著用戶涉及的對(duì)象越來越多,其信譽(yù)分量值會(huì)變得越來越大,也就代表其的信譽(yù)越來越好。
同樣的,在某一次更新過程中,為了計(jì)算對(duì)象的質(zhì)量值,我們也從時(shí)間和度的角度設(shè)計(jì)了一個(gè)質(zhì)量積累過程,如下:
一個(gè)對(duì)象的質(zhì)量值也并不是一次就可以測(cè)試出來的,而是通過許多的用戶行為才會(huì)有評(píng)價(jià),所以我們綜合分析了相關(guān)信息并做了計(jì)算,從上面公式可以知道一個(gè)對(duì)象的質(zhì)量分量與它所涉及的用戶信譽(yù)、對(duì)象質(zhì)量、對(duì)象的度及用戶的度呈一定的關(guān)系。其實(shí)這個(gè)質(zhì)量積累過程也能夠有效應(yīng)對(duì)信譽(yù)差的用戶及質(zhì)量不好的對(duì)象,因?yàn)檫@中一個(gè)積累過程,單次的值對(duì)整個(gè)對(duì)象的質(zhì)量并不會(huì)產(chǎn)生很大的影響。隨著對(duì)象被不同用戶產(chǎn)生越來越多的行為時(shí),其對(duì)應(yīng)的質(zhì)量分量值會(huì)越來越高,這也表示它的質(zhì)量經(jīng)過了大家的認(rèn)可,確實(shí)是一個(gè)高質(zhì)量的對(duì)象。
另外,迭代過程中Ri都會(huì)更新,因此在某一次更新過程中,為了計(jì)算用戶i的信譽(yù)值,通過計(jì)算融合兩個(gè)行為權(quán)重因子的用戶評(píng)分向量和相應(yīng)對(duì)象質(zhì)量向量之間的改進(jìn)皮爾森相關(guān)系數(shù)作為用戶的臨時(shí)信譽(yù)值,如下:
如果TRi小于或者等于0,那么用戶i的臨時(shí)信譽(yù)值就會(huì)設(shè)定為1因此,臨時(shí)信譽(yù)值TRi的區(qū)間為[0,1]。另外,用戶的信譽(yù)與他的評(píng)分向量和相應(yīng)的對(duì)象的加權(quán)平均評(píng)分向量的平均平方誤差是成反比的。基于皮爾森相關(guān)分析的信譽(yù)被證明是更強(qiáng)大的應(yīng)對(duì)垃圾郵件評(píng)分中是比上述方法更有效果,能夠更準(zhǔn)確地評(píng)估物體的質(zhì)量。
考慮到用戶的信譽(yù)受到用戶度的影響,均衡信譽(yù)值,在某一次迭代過程中,通過臨時(shí)信譽(yù)值與用戶信譽(yù)積累過程分量值的比值作為本次迭代后用戶的最終信譽(yù),如下:
通過以上公式我們知道,用戶信譽(yù)積累過程類似于著名的K近鄰算法,完全將噪聲消除在用戶的度以外,并且這種效果是累積在每一次更新迭代過程中,并最終在評(píng)估目標(biāo)質(zhì)量準(zhǔn)確性中將獲得一個(gè)大的改善,雖然修改的方法似乎是小的,但改善是巨大的。
此外在迭代過程中,對(duì)象Qi也會(huì)改變,通過如下公式來更新每一次迭代過程中對(duì)象的質(zhì)量值:
用戶的信譽(yù)和對(duì)象的質(zhì)量將在每一步更新。當(dāng)質(zhì)量變化小到一個(gè)最小值Δ時(shí)(本文中Δ=10-4),算法停止;
在本發(fā)明實(shí)施例中,整個(gè)算法可以基于大數(shù)語言來開發(fā)實(shí)現(xiàn),如spark、hadoop等。
本發(fā)明從時(shí)間和度的角度設(shè)計(jì)兩個(gè)行為權(quán)重因子和兩分量積累過程能夠在一定程度上反映具體的事物流程,能夠有效扼制惡意行為,并直接細(xì)化了每個(gè)對(duì)象質(zhì)量和用戶信譽(yù)的變化過程,對(duì)比其他算法,此算法所取得的效果有較大幅度的提高,可以為實(shí)際應(yīng)用帶來價(jià)值。
本領(lǐng)域的技術(shù)人員容易理解,以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。