一種分布式自適應調(diào)節(jié)小基站發(fā)射功率偏置值的方法【專利摘要】本發(fā)明公開了一種分布式自適應調(diào)節(jié)小基站發(fā)射功率偏置值的方法。本發(fā)明在小基站的回程鏈路容量受限的情況下通過使用機器學習中的Q-learning的方法自適應地調(diào)節(jié)小基站發(fā)射功率偏置來分擔宏蜂窩負載,提高小基站回程鏈路資源利用率。利用機器學習的一種稱為Q-learning的方法可以方便每個小基站實時監(jiān)控周圍用戶數(shù)目以及用戶分布的變化,及時調(diào)整自己的參考信號功率偏置值來獲得當前情況下最優(yōu)的偏置值選擇,從而充分利用自己的資源為宏基站實現(xiàn)分擔負載的功能。本發(fā)明所提供的方法不僅能夠有效地提高系統(tǒng)容量和覆蓋效果,更有助于節(jié)省宏基站的運行成本,實現(xiàn)綠色通信。【專利說明】一種分布式自適應調(diào)節(jié)小基站發(fā)射功率偏置值的方法【
技術領域:
】[0001]本發(fā)明涉及通信領域,特別涉及一種分布式自適應調(diào)節(jié)小基站發(fā)射功率偏置值的方法?!?br>背景技術:
】[0002]在下一代無線通信技術中,異構網(wǎng)絡對于提升系統(tǒng)容量和覆蓋效果,提供較好的數(shù)據(jù)服務有巨大的幫助。在異構網(wǎng)絡中,一些低功耗、低花費的小基站被用來分擔傳統(tǒng)的宏基站的數(shù)據(jù)服務任務。然而,受制于其低發(fā)射功率的特性,小基站的覆蓋的半徑較小,一般情況下僅能服務較少的的用戶。而在布置小基站時,每個小基站都會分配到固定的回程鏈路資源,這導致了小基站的資源并沒有被充分地利用,另一方面,宏基站可能還在一個高負載的環(huán)境下運行。資源利用受限導致在大密度布置小基站的情況下,系統(tǒng)的性能并不能夠獲得應有的足夠的提升。因此,提高小基站資源利用率來為宏基站分擔負載的方法急需探索。[0003]現(xiàn)有文獻中給出的提高小基站資源利用率的方法主要有:(I)直接提高小基站的信號發(fā)射功率來擴大小基站的覆蓋范圍以接入更多的周邊用戶;(2)在用戶進行接入選擇時,設定某種特定的接入策略引導更多用戶去接入小基站;(3)為每個小基站配一個固定的信號發(fā)射功率偏置,使小基站的覆蓋范圍虛擬上“擴大”。(4)每個用戶根據(jù)自己的需求以及系統(tǒng)的性能選定自己的信號發(fā)射功率偏置等等。[0004]在對現(xiàn)有方法進行分析后發(fā)現(xiàn):文獻所提方法或是存在弊端,或是在現(xiàn)實可行性方面有所欠缺。方法(I)雖然能夠提高小基站資源利用率,但是系統(tǒng)的能量效率將因此降低,并不符合綠色通信的理念。方法(2)(3)無法動態(tài)適應環(huán)境的變化,用戶過多時可能發(fā)生阻塞而用戶較少時,其資源利用率仍舊處于一個較低的水平。方法(4)在如今的用戶終端上實現(xiàn)大運算量的工作沒有現(xiàn)實可行性?!?br/>發(fā)明內(nèi)容】[0005]本發(fā)明的目的定針對現(xiàn)狀中在小基站為宏基站分擔負載時小基站的資源利用率相當?shù)偷膯栴},提供一種分布式自適應調(diào)節(jié)小基站發(fā)射功率偏置值的方法。[0006]分布式自適應調(diào)節(jié)小基站發(fā)射功率偏置值的方法的步驟如下:[0007]I)為使適量用戶從宏基站轉到小基站享受數(shù)據(jù)服務以使小基站最終的吞吐量逼近其所擁有的回程鏈路信道資源,從而充分利用小基站回程鏈路資源來給宏基站分擔負載,小基站在考慮當前用戶服務性能的同時,根據(jù)自己當前的回程鏈路資源的使用情況通過設置自己的參考信號功率偏置值來實現(xiàn)覆蓋范圍的調(diào)整;[0008]2)在小基站調(diào)整好自己的覆蓋范圍后,在所有候選的基站中,用戶計算接收到的每個基站的參考信號功率,并在此功率上分別加上每個基站設定的參考信號功率偏置值作為來自該基站的最終接收“參考信號功率”,用戶選擇加上偏置后的參考信號功率值最大的基站進行連接;[0009]3)所有用戶確定自己所接入的基站后,小基站在考慮自己當前的回程鏈路資源的使用和當前用戶的服務性能情況下,動態(tài)調(diào)整自己的最優(yōu)參考信號功率偏置值;[0010]4)重復步驟2)和步驟3),直至小基站的最優(yōu)參考信號功率偏置值收斂,當算法收斂后小基站調(diào)低最優(yōu)參考信號功率偏置值的學習強度,減少運算量并實時監(jiān)測環(huán)境變化,當小基站周圍用戶數(shù)以及分布情況發(fā)生重大改變,則小基站重新調(diào)高最優(yōu)參考信號功率偏置值的學習強度,執(zhí)行步驟2)。[0011]所述的步驟I)包括:[0012](I)若回程鏈路資源充足,則小基站應當擴展其當前的覆蓋范圍,使在保證用戶服務性能下將原覆蓋范圍外附近的用戶被包括進來,該部分用戶轉而由該小基站利用其空余的回程鏈路資源提供數(shù)據(jù)服務;[0013](2)若當前小基站的吞吐量超過了回程鏈路資源數(shù),則小基站應當縮小當前的覆蓋范圍,減少為一部分用戶提供服務,直至剩余吞吐量小于回程鏈路資源數(shù),該部分被移出覆蓋范圍的用戶則選擇其他基站為其服務。[0014]所述的步驟3)包括:[0015](I)若回程鏈路資源充足,小基站提高其參考信號功率偏置值,使加上偏置后的參考信號功率值變大,擴張覆蓋范圍以接入更多用戶;[0016](2)若當前吞吐量大于回程鏈路資源數(shù),小基站減小其參考信號功率偏置值,相應地使加上偏置后參考信號功率變小,收縮覆蓋范圍。[0017]步驟3)所述的動態(tài)調(diào)整自己的最優(yōu)參考信號功率偏置值的方法為:小基站開啟時運行Q-1earning算法對各狀態(tài)下最優(yōu)的參考信號功率偏置值進行學習,小基站在知道自己的回程鏈路資源數(shù)的情況下,將自己當前的吞吐量作為Q-1earning的狀態(tài)變量,根據(jù)不同的狀態(tài),小基站學習在各狀態(tài)下的最優(yōu)的參考信號功率偏置值,方法的具體步驟包括:[0018]S1、算法開始運行時,宏基站的偏置值始終為0,小基站的偏置值初始化為0,小基站維護一張表格即Q-table來記錄每個狀態(tài)的每一種執(zhí)行措施下所能獲得的Q-value值,該Q-value值與當前狀態(tài)下采取當前措施獲得的獎勵值即reward有關;[0019]S2、在所有候選的基站中,用戶計算接收到的每個基站的參考信號功率,并在此功率上分別加上每個基站設定的參考信號功率偏置值作為來自該基站的最終接收“參考信號功率”,用戶選擇加上偏置后的參考信號功率值最大的基站進行連接;[0020]S3、按照當前的接入情況,小基站計算當前的吞吐量,并找到該吞吐量所對應的狀態(tài)。小基站按照一定準則選取一個參考信號功率偏置值作為下一時刻該小基站采用的參考信號功率的偏置值,同時,計算采取當前偏置值所獲得的獎勵值,以一定的準則來更新Q-table;[0021]S4、循環(huán)執(zhí)行步驟S2和步驟S3直到算法收斂,即在每一種狀態(tài)下相應的最優(yōu)的偏置值已經(jīng)收斂;[0022]步驟S3中的參考信號功率偏置值的選擇準則滿足以下過程:[0023](I)定義一個選擇因子ε,0<ε<I;[0024](2)在O到I之間隨機產(chǎn)生一個值X,若X比ε大,則隨機選擇一個執(zhí)行措施,否貝U,選擇該狀態(tài)下Q-table中最大值對應的執(zhí)行措施作為下一時刻的小基站參考信號功率偏置值;[0025]步驟S3中的Q-table更新準則滿足以下過程:[0026](I)選定一個更新因子α,0<α<I;[0027](2)將該狀態(tài)下使用當前偏置值的Q-table對應值按照如下公式進行更新:[0028]【權利要求】1.一種分布式自適應調(diào)節(jié)小基站發(fā)射功率偏置值的方法,其特征在于,它的步驟如下:1)為使適量用戶從宏基站轉到小基站享受數(shù)據(jù)服務以使小基站最終的吞吐量逼近其所擁有的回程鏈路信道資源,從而充分利用小基站回程鏈路資源來給宏基站分擔負載,小基站在考慮當前用戶服務性能的同時,根據(jù)自己當前的回程鏈路資源的使用情況通過設置自己的參考信號功率偏置值來實現(xiàn)覆蓋范圍的調(diào)整;2)在小基站調(diào)整好自己的覆蓋范圍后,在所有候選的基站中,用戶計算接收到的每個基站的參考信號功率,并在此功率上分別加上每個基站設定的參考信號功率偏置值作為來自該基站的最終接收“參考信號功率”,用戶選擇加上偏置后的參考信號功率值最大的基站進行連接;3)所有用戶確定自己所接入的基站后,小基站在考慮自己當前的回程鏈路資源的使用和當前用戶的服務性能情況下,動態(tài)調(diào)整自己的最優(yōu)參考信號功率偏置值;4)重復步驟2)和步驟3),直至小基站的最優(yōu)參考信號功率偏置值收斂,當算法收斂后小基站調(diào)低最優(yōu)參考信號功率偏置值的學習強度,減少運算量并實時監(jiān)測環(huán)境變化,當小基站周圍用戶數(shù)以及分布情況發(fā)生重大改變,則小基站重新調(diào)高最優(yōu)參考信號功率偏置值的學習強度,執(zhí)行步驟2)。2.根據(jù)權利要求1所述的一種分布式自適應調(diào)節(jié)小基站發(fā)射功率偏置值的方法,其特征在于,所述的步驟1)包括:(1)若回程鏈路資源充足,則小基站應當擴展其當前的覆蓋范圍,使在保證用戶服務性能下將原覆蓋范圍外附近的用戶被包括進來,該部分用戶轉而由該小基站利用其空余的回程鏈路資源提供數(shù)據(jù)服務;(2)若當前小基站的吞吐量超過了回程鏈路資源數(shù),則小基站應當縮小當前的覆蓋范圍,減少為一部分用戶提供服務,直至剩余吞吐量小于回程鏈路資源數(shù),該部分被移出覆蓋范圍的用戶則選擇其他基站為其服務。3.根據(jù)權利要求1所述的一種分布式自適應調(diào)節(jié)小基站發(fā)射功率偏置值的方法,其特征在于,所述的步驟3)包括:(1)若回程鏈路資源充足,小基站提高其參考信號功率偏置值,使加上偏置后的參考信號功率值變大,擴張覆蓋范圍以接入更多用戶;(2)若當前吞吐量大于回程鏈路資源數(shù),小基站減小其參考信號功率偏置值,相應地使加上偏置后參考信號功率變小,收縮覆蓋范圍。4.根據(jù)權利要求1所述的一種分布式自適應調(diào)節(jié)小基站發(fā)射功率偏置值的方法,其特征在于,步驟3)所述的動態(tài)調(diào)整自己的最優(yōu)參考信號功率偏置值的方法為:小基站開啟時運行Q-1earning算法對各狀態(tài)下最優(yōu)的參考信號功率偏置值進行學習,小基站在知道自己的回程鏈路資源數(shù)的情況下,將自己當前的吞吐量作為Q-1earning的狀態(tài)變量,根據(jù)不同的狀態(tài),小基站學習在各狀態(tài)下的最優(yōu)的參考信號功率偏置值,方法的具體步驟包括:S1、算法開始運行時,宏基站的偏置值始終為O,小基站的偏置值初始化為O,小基站維護一張表格即Q-table來記錄每個狀態(tài)的每一種執(zhí)行措施下所能獲得的Q-value值,該Q-value值與當前狀態(tài)下采取當前措施獲得的獎勵值即reward有關;S2、在所有候選的基站中,用戶計算接收到的每個基站的參考信號功率,并在此功率上分別加上每個基站設定的參考信號功率偏置值作為來自該基站的最終接收“參考信號功率”,用戶選擇加上偏置后的參考信號功率值最大的基站進行連接;S3、按照當前的接入情況,小基站計算當前的吞吐量,并找到該吞吐量所對應的狀態(tài)。小基站按照一定準則選取一個參考信號功率偏置值作為下一時刻該小基站采用的參考信號功率的偏置值,同時,計算采取當前偏置值所獲得的獎勵值,以一定的準則來更新Q-table;S4、循環(huán)執(zhí)行步驟S2和步驟S3直到算法收斂,即在每一種狀態(tài)下相應的最優(yōu)的偏置值已經(jīng)收斂;步驟S3中的參考信號功率偏置值的選擇準則滿足以下過程:(O定義一個選擇因子ε,0<ε<1;(2)在O到I之間隨機產(chǎn)生一個值X,若X比ε大,則隨機選擇一個執(zhí)行措施,否則,選擇該狀態(tài)下Q-table中最大值對應的執(zhí)行措施作為下一時刻的小基站參考信號功率偏置值;步驟S3中的Q-table更新準則滿足以下過程:(1)選定一個更新因子α,O<α<1;(2)將該狀態(tài)下使用當前偏置值的Q-table對應值按照如下公式進行更新:【文檔編號】H04W52/26GK103906076SQ201410116392【公開日】2014年7月2日申請日期:2014年3月26日優(yōu)先權日:2014年3月26日【發(fā)明者】殷銳,許陽,余官定,王安定,鐘財軍申請人:浙江工商大學