本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其涉及一種中心式認知無線網(wǎng)絡(luò)中基于嵌套博弈的信任管理方法。
背景技術(shù):
認知無線網(wǎng)絡(luò)允許非授權(quán)用戶在不干擾授權(quán)用戶的前提下,伺機利用空閑譜,從而有效提高頻譜資源的利用率,滿足更多用戶的需求。認知無線網(wǎng)絡(luò)的這些新功能又引入了許多新型網(wǎng)絡(luò)攻擊,比如:感知數(shù)據(jù)篡改攻擊、學(xué)習(xí)威脅、干擾主用戶攻擊、合伙欺騙等。而傳統(tǒng)的加密技術(shù)、認證技術(shù)、訪問控制技術(shù)等安全策略又無法解決這些來自認知無線網(wǎng)絡(luò)內(nèi)部的軟安全威脅。信任管理機制是目前公認的解決認知無線網(wǎng)絡(luò)軟安全威脅最有效的策略和方法之一。
高效信任管理機制是保障認知無線網(wǎng)絡(luò)安全的前提和基礎(chǔ),準確可靠的信任值更新方案是頻譜分配的可靠保證。目前已被提出的認知無線電網(wǎng)絡(luò)中信任管理機制大多數(shù)都是為了解決SSDF攻擊等局部問題提出的。因此提出一種著眼于整個認知循環(huán),將認知過程中次級用戶行為的每一步都作為評價其信譽值得一部分,對判定系統(tǒng)中用戶的良莠以及公平的分配頻譜,對于整個系統(tǒng)剔除惡意用戶,實現(xiàn)良性循環(huán)非常必要。而在認知環(huán)境下,次級用戶為獲得頻譜所做出的努力其本質(zhì)上是一種博弈,因此將博弈理論應(yīng)用于信任管理方案,并抵抗惡意攻擊對認知無線電安全的研究有重要的意義。
近年來,國內(nèi)外學(xué)者對認知無線點網(wǎng)絡(luò)信任機制進行了許多研究和探索,也大多數(shù)針對單一角色的需求,很少結(jié)合認知無線電網(wǎng)絡(luò)的特點,從整體需求出發(fā),進行信任管理機制的研究,并且這些研究還處于初步階段,雖然有一些研究針對無線網(wǎng)絡(luò)的信任設(shè)計有一些研究,還沒有學(xué)者設(shè)計和提出完整的信任管理機制方法和體系。
Parveen Kailgineedi等人提出了一種平均組合的數(shù)據(jù)融合算法,利用信任因子來參與頻譜決策,這樣大大提高了系統(tǒng)的決策性能。但是,該算法只能識別那些上傳的感知結(jié)果一直是“授權(quán)用戶正在使用”或者“授權(quán)用戶當前不在”的惡意用戶,所以該算法在某種程度上有一些缺陷。Sazia Parvin在隨后的文章中還把信任作為認知無線網(wǎng)絡(luò)的安全通信認證,其優(yōu)點在于證書機構(gòu)可以提供認證、不可否認性、訪問控制等安全保障,不可忽視的是信譽值高的次級用戶充當了證書機構(gòu),所以當這個次級用戶被發(fā)現(xiàn)具有不良行為時,其損失是巨大的,當證書失效有備用證書機構(gòu)替代時,之前存儲的信譽信息就會丟失,網(wǎng)絡(luò)進入重啟狀態(tài)。
技術(shù)實現(xiàn)要素:
有鑒于現(xiàn)有技術(shù)的上述缺陷,本發(fā)明所要解決的技術(shù)問題是提供一種中心式認知無線網(wǎng)絡(luò)中基于嵌套博弈的信任管理方法,該方法為在中心式式認知無線網(wǎng)絡(luò)的框架下基于嵌套博弈決策理論的信任管理方案和信任評價融合機制。在該方案下可以實現(xiàn)最大限度公平分配頻譜,且可以抵御惡意用戶攻擊,并通過學(xué)習(xí)使得系統(tǒng)不斷趨于良性循環(huán)。
為實現(xiàn)上述目的,本發(fā)明提供了一種中心式認知無線網(wǎng)絡(luò)中基于嵌套博弈的信任管理方法,其特征在于,包括以下步驟:
步驟一、建立模型:
將中心式認知無線網(wǎng)絡(luò)中次用戶的活動分為感知階段和傳輸階段兩個時期,并根據(jù)兩個時段的次級用戶的行為建立博弈模型;
步驟二、次級用戶感知頻譜狀態(tài)信息:
次級用戶對于參與頻譜分配的次級用戶,通過能量感知的方式感知目前頻譜空洞信息;
步驟三、次級用戶上傳感知信息:
次級用戶將感知到的頻譜狀態(tài)信息上傳到數(shù)據(jù)中心DC,上傳信息的準確性概率即為用戶的博弈策略,策略集為
上傳的頻譜狀態(tài)信息表示為本地頻譜表,記錄次用戶檢測頻段結(jié)果,表示為1*m的矩陣,m為次用戶所檢測到的頻段的數(shù)目,矩陣中用1表示該處頻譜空洞,0表示該處頻譜忙碌不可用;
步驟四、數(shù)據(jù)中心DC對于頻譜狀態(tài)進行數(shù)據(jù)收集融合:
頻譜狀態(tài)信息的融合方式為次級用戶上傳的頻譜狀態(tài)的均值,其大于0.8則認為該處頻譜空洞;
步驟五、數(shù)據(jù)中心更新感知階段信任值:
數(shù)據(jù)中心根據(jù)各個次級用戶上傳的感知數(shù)據(jù),對該階段的用戶行為進行信任值的更新,感知的評價值表示為函數(shù)的計算公式是Fi代表每一個次級用戶i其物理感知準確率我們假設(shè)次級用戶的感知準確率服從泊松分布,均值為λ;
步驟六、數(shù)據(jù)傳輸階段,次級用戶進行頻譜傳輸:
獲得信道的次級用戶利用信道對頻譜進行傳輸,并作出該階段的博弈決策,其策略內(nèi)容為傳輸階段用戶良好利用頻譜的概率取值范圍為
步驟七、根據(jù)其傳輸階段的表現(xiàn),數(shù)據(jù)中心對該階段的用戶行為進行信任值的更新,本次傳輸?shù)男抛u值變化為α為權(quán)重因子,根據(jù)對于此次傳輸?shù)闹匾暢潭热藶樵O(shè)定,歷史傳輸信譽值為TQi,其中
其中TNi為傳輸正常的次數(shù),TTi為傳輸?shù)目偞螖?shù);
步驟八、信譽值計算;
步驟九、計算嵌套博弈效用函數(shù)和優(yōu)化迭代:
步驟十、根據(jù)頻譜分配方案進行頻譜分配,根據(jù)信譽值的大小進行排序,按順序分配頻譜;
步驟十一、更新傳輸階段用戶信任值;
步驟十二、系統(tǒng)在多次頻譜分配后剔除惡意用戶,用戶行為通過相互學(xué)習(xí)趨于良好,并使得整個系統(tǒng)趨于良性循環(huán)。
進一步地,所述步驟八包括:
第一步、滑動窗口選擇:
系統(tǒng)隨機生成滑動窗口Win1,其中滑動窗口的大小代表了在計算歷史信譽值時選取多少次的值作為歷史信譽值來計算;
第二步、計算滑動窗口時間內(nèi)的信譽值:
根據(jù)滑動窗口的大小,計算滑動窗口時間內(nèi)次級用戶的歷史感知信譽值
SAi代表第i個用戶的感知正確率,STi代表在Win1中用戶i參與頻譜感知并上傳感知結(jié)果數(shù)據(jù)的總次數(shù),SRi代表正確感知的信道個數(shù),uks_d和uko_d分別是用戶的感知時長和在線時長,感知時長指節(jié)點從入網(wǎng)來參與的總感知次數(shù),在線時長指節(jié)點從入網(wǎng)來經(jīng)歷的總感知次數(shù)和歷史傳輸信譽值;
第三步:根據(jù)次級用戶選擇的策略計算該次的直接感知信譽值和直接傳輸信譽值;
第四步:對歷史感知數(shù)據(jù)和直接感知數(shù)據(jù)進行融合,為了實現(xiàn)系統(tǒng)的慢升快降,加入邊際函數(shù)做為參數(shù),
進一步地,所述步驟九包括:
第一步、通過計算和融合感知階段和傳輸階段的信譽值計算出博弈第一階段和第二階段的效用函數(shù):
第一階段為照下式計算的效用函數(shù):
其中w1+w2=1,w1,w2分別代表信任值融合時的系數(shù);
第二階段代表照下式計算系統(tǒng)第二階段的效用函數(shù):
pT代表了實際的傳輸階段的表現(xiàn)與承諾的策略之間的差距值,φ代表了系統(tǒng)的收益值系數(shù)。price代表共享信道的造成的利益損耗值,αi代表了每一條共享信道的收益值;
第二步、通過嵌套博弈的優(yōu)化理論對效用函數(shù)進行迭代優(yōu)化,用戶選擇最優(yōu)策略,利用嵌套博弈的優(yōu)化方法自底向上進行嵌套博弈迭代優(yōu)化,得出納什均衡下的用戶策略。
進一步地,所述步驟十一包括:
第一步、次用戶在分配到的空閑頻段傳輸數(shù)據(jù),記錄傳輸數(shù)據(jù)時實際的表現(xiàn)和時間;
第二步、若次用戶傳輸數(shù)據(jù)時實際的時間和功率都高于其在博弈進行時所聲稱的傳輸質(zhì)量,則將傳輸階段次用戶信任值乘以獎勵參數(shù)更新;反之,將該階段次用戶信任值乘以懲罰因子更新。
本發(fā)明的有益效果是:
第一,本發(fā)明著眼于整個認知循環(huán),將認知過程中次級用戶行為的每一步都作為評價其信譽值得一部分,對判定系統(tǒng)中用戶的良莠以及公平的分配頻譜,對于整個系統(tǒng)剔除惡意用戶,實現(xiàn)良性循環(huán)非常必要。而在認知環(huán)境下,次級用戶為獲得頻譜所做出的努力其本質(zhì)上是一種博弈,因此將博弈理論應(yīng)用于信任管理方案,有重要的意義。。
第二,本發(fā)明應(yīng)用嵌套博弈理論繪制博弈樹,建立子博弈,對良好行為用戶進行獎勵,惡意用戶進行懲罰,使得整個系統(tǒng)趨于良性循環(huán),以達到頻譜分配按需,公平的目的。在每一次交互過后,對于信任值得增長變化,采用邊際效用理論,引入邊際效用遞減函數(shù)來增加不同的值,剔除惡意用戶,是整個系統(tǒng)趨于良性循環(huán)。
以下將結(jié)合附圖對本發(fā)明的構(gòu)思、具體結(jié)構(gòu)及產(chǎn)生的技術(shù)效果作進一步說明,以充分地了解本發(fā)明的目的、特征和效果。
附圖說明
圖1為本發(fā)明的流程圖;
圖2為本發(fā)明實施例的場景圖;
圖3位本發(fā)明博弈模型圖。
具體實施方式
本發(fā)明的應(yīng)用場景為中心式認知無線網(wǎng)絡(luò),網(wǎng)絡(luò)中次用戶處于同一地理位置中,存在數(shù)據(jù)中心記錄用戶行為和存儲用戶的信譽值,次用戶采用能量感知的方法感知信號數(shù)據(jù),然后進行數(shù)據(jù)通信。
如圖1、2所示,本發(fā)明提供了一種中心式認知無線網(wǎng)絡(luò)中基于嵌套博弈的信任管理方法,其特征在于,包括以下步驟:
步驟一、建立模型:
將中心式認知無線網(wǎng)絡(luò)中次用戶的活動分為感知階段和傳輸階段兩個時期,并根據(jù)兩個時段的次級用戶的行為建立博弈模型,其博弈樹模型如圖3所示。
步驟二、次級用戶感知頻譜狀態(tài)信息:
次級用戶對于參與頻譜分配的次級用戶,通過能量感知的方式感知目前頻譜空洞信息;
步驟三、次級用戶上傳感知信息:
次級用戶將感知到的頻譜狀態(tài)信息上傳到數(shù)據(jù)中心DC,上傳信息的準確性概率即為用戶的博弈策略,策略集為上傳的感知信息的準確性除了受到策略選擇的影響,還與次級用戶i本身的物理感知準確率Fi,其準確率分布服從泊松分布。
上傳的頻譜狀態(tài)信息表示為本地頻譜表,記錄次用戶檢測頻段結(jié)果,表示為1*m的矩陣,m為次用戶所檢測到的頻段的數(shù)目,矩陣中用1表示該處頻譜空洞,0表示該處頻譜忙碌不可用;
步驟四、數(shù)據(jù)中心DC對于頻譜狀態(tài)進行數(shù)據(jù)收集融合:
頻譜狀態(tài)信息的融合方式為次級用戶上傳的頻譜狀態(tài)的均值,其大于0.8則認為該處頻譜空洞;
步驟五、數(shù)據(jù)中心更新感知階段信任值:
數(shù)據(jù)中心根據(jù)各個次級用戶上傳的感知數(shù)據(jù),對該階段的用戶行為進行信任值的更新,感知的評價值表示為函數(shù)的計算公式是
步驟六、數(shù)據(jù)傳輸階段,次級用戶進行頻譜傳輸:
獲得信道的次級用戶利用信道對頻譜進行傳輸,并作出該階段的博弈決策,其策略內(nèi)容為傳輸階段用戶良好利用頻譜的概率取值范圍為
步驟七、根據(jù)其傳輸階段的表現(xiàn),數(shù)據(jù)中心對該階段的用戶行為進行信任值的更新,本次傳輸?shù)男抛u值變化為
步驟八、信譽值計算;
步驟九、計算嵌套博弈效用函數(shù)和優(yōu)化迭代:
步驟十、根據(jù)頻譜分配方案進行頻譜分配,根據(jù)信譽值的大小進行排序,按順序分配頻譜;
步驟十一、更新傳輸階段用戶信任值;
步驟十二、系統(tǒng)在多次頻譜分配后剔除惡意用戶,用戶行為通過相互學(xué)習(xí)趨于良好,并使得整個系統(tǒng)趨于良性循環(huán)。
本實施例中,所述步驟八包括:
第一步、滑動窗口選擇:
系統(tǒng)隨機生成滑動窗口Win1,其中滑動窗口的大小代表了在計算歷史信譽值時選取多少次的值作為歷史信譽值來計算;
第二步、計算滑動窗口時間內(nèi)的信譽值:
根據(jù)滑動窗口的大小,計算滑動窗口時間內(nèi)次級用戶的歷史感知信譽值
SAi代表第i個用戶的感知正確率,STi代表在Win1中用戶i參與頻譜感知并上傳感知結(jié)果數(shù)據(jù)的總次數(shù),SRi代表正確感知的信道個數(shù),uks_d和uko_d分別是用戶的感知時長和在線時長,感知時長指節(jié)點從入網(wǎng)來參與的總感知次數(shù),在線時長指節(jié)點從入網(wǎng)來經(jīng)歷的總感知次數(shù)和歷史傳輸信譽值;
第三步:根據(jù)次級用戶選擇的策略計算該次的直接感知信譽值和直接傳輸信譽值;
第四步:對歷史感知數(shù)據(jù)和直接感知數(shù)據(jù)進行融合,為了實現(xiàn)系統(tǒng)的慢升快降,加入邊際函數(shù)做為參數(shù),
本實施例中,所述步驟九包括:
第一步、通過計算和融合感知階段和傳輸階段的信譽值計算出博弈第一階段和第二階段的效用函數(shù):
第一階段為照下式計算的效用函數(shù):
其中w1+w2=1,w1,w2分別代表信任值融合時的系數(shù);
第二階段代表照下式計算系統(tǒng)第二階段的效用函數(shù):
pT代表了實際的傳輸階段的表現(xiàn)與承諾的策略之間的差距值;
第二步、通過嵌套博弈的優(yōu)化理論對效用函數(shù)進行迭代優(yōu)化,用戶選擇最優(yōu)策略,利用嵌套博弈的優(yōu)化方法自底向上進行嵌套博弈迭代優(yōu)化,得出納什均衡下的用戶策略。
本實施例中,所述步驟十一包括:
第一步、次用戶在分配到的空閑頻段傳輸數(shù)據(jù),記錄傳輸數(shù)據(jù)時實際的表現(xiàn)和時間;
第二步、若次用戶傳輸數(shù)據(jù)時實際的時間和功率都高于其在博弈進行時所聲稱的傳輸質(zhì)量,則將傳輸階段次用戶信任值乘以獎勵參數(shù)更新;反之,將該階段次用戶信任值乘以懲罰因子更新。
以上詳細描述了本發(fā)明的較佳具體實施例。應(yīng)當理解,本領(lǐng)域的普通技術(shù)人員無需創(chuàng)造性勞動就可以根據(jù)本發(fā)明的構(gòu)思做出諸多修改和變化。因此,凡本技術(shù)領(lǐng)域中技術(shù)人員依本發(fā)明的構(gòu)思在現(xiàn)有技術(shù)的基礎(chǔ)上通過邏輯分析、推理或者有限的實驗可以得到的技術(shù)方案,皆應(yīng)在由權(quán)利要求書所確定的保護范圍內(nèi)。