本發(fā)明涉及一種基于mab的大規(guī)模mimo用戶(hù)調(diào)度和波束賦形方法及系統(tǒng),屬于無(wú)線(xiàn)通信。
背景技術(shù):
1、信道狀態(tài)信息的獲取難易程度對(duì)于大規(guī)模mimo系統(tǒng)預(yù)編碼算法的研究至關(guān)重要。對(duì)于目前通信領(lǐng)域中的兩種雙工方式,即頻分雙工(fdd)和時(shí)分雙工(tdd),它們的信道狀態(tài)信息獲取方式有著顯著區(qū)別。對(duì)于頻分雙工(fdd)方式,由于上下行信道不對(duì)稱(chēng),下行鏈路同樣需要基站發(fā)送導(dǎo)頻序列,終端設(shè)備分別計(jì)算各自的所屬信道的狀態(tài)信息并反饋給基站,其導(dǎo)頻開(kāi)銷(xiāo)量將與天線(xiàn)陣列的數(shù)量成正比,顯然對(duì)于大規(guī)模mimo系統(tǒng)而言,眾多的天線(xiàn)數(shù)造成了巨量的導(dǎo)頻開(kāi)銷(xiāo),導(dǎo)頻污染也隨之激增。雖然動(dòng)態(tài)天線(xiàn)切換技術(shù)可以減少導(dǎo)頻鏈路數(shù)量,但這種技術(shù)沒(méi)有充分利用多天線(xiàn)增益的優(yōu)勢(shì),并且在反向鏈路上存在信號(hào)延遲問(wèn)題,因此很難及時(shí)獲取系統(tǒng)所有的信道信息。
2、為了充分利用大規(guī)模mimo的優(yōu)勢(shì),在基站(bs)獲取信道狀態(tài)信息尤為重要。然而,頻分雙工(fdd)中信道互易性不成立,為了獲取瞬時(shí)csi,不得不取得較大的下行導(dǎo)頻長(zhǎng)度(dtl),承受大量csi反饋開(kāi)銷(xiāo)。在未來(lái)的無(wú)線(xiàn)通信中,tdd和fdd模式都是非常重要的,因此有必要減少頻分雙工(fdd)模式下的下行導(dǎo)頻長(zhǎng)度(dtl)和信道反饋。同時(shí),在用戶(hù)數(shù)大于系統(tǒng)所能服務(wù)的情況下,提高頻譜效率也將會(huì)是系統(tǒng)的剛需。在頻分雙工(fdd)大規(guī)模mimo中,采用信道協(xié)方差矩陣(ccm)的兩階段波束成形(tsb)可以降低下行鏈路訓(xùn)練長(zhǎng)度(dtl)和信道反饋。但估算信道協(xié)方差矩陣(ccm)的代價(jià)也是很大的。因此,有必要提出一種不需要信道協(xié)方差矩陣(ccm)的tsb算法,在兼顧用戶(hù)數(shù)量、減少開(kāi)銷(xiāo)的情況下又可以提升tsb的性能。
3、adhikary利用大規(guī)模mimo的空間相關(guān)性和信道稀疏性,研究了一種兩階段預(yù)編碼方案,該方案以聯(lián)合空分多路復(fù)用(jsdm)技術(shù)為基礎(chǔ),?其關(guān)鍵思想是通過(guò)用戶(hù)調(diào)度將具有不同空間特性的用戶(hù)設(shè)備分配至不同組內(nèi),將下行預(yù)編碼過(guò)程劃分為兩個(gè)矩陣的求解過(guò)程。為大規(guī)模mimo技術(shù)在頻分雙工(fdd)制式下的預(yù)編碼實(shí)現(xiàn)奠定了基礎(chǔ)。在用戶(hù)數(shù)大于系統(tǒng)所能服務(wù)的情況下,一些研究提出了用戶(hù)調(diào)度方案來(lái)提高頻譜效率。這些工作依賴(lài)于基站上可用的ccm,但是信道協(xié)方差矩陣(ccm)的估計(jì)仍然是一個(gè)具有挑戰(zhàn)性的問(wèn)題。此外,在用戶(hù)快速移動(dòng)等場(chǎng)景下,信道協(xié)方差矩陣(ccm)變化較快,這使得ccm的估計(jì)更困難。
4、song考慮到估計(jì)ccm的高代價(jià),設(shè)計(jì)了基于多臂賭博機(jī)(mab)的tsb方案,避免了對(duì)信道協(xié)方差矩陣(ccm)的估計(jì),提高了頻譜效率。基于多臂賭博機(jī)(mab)的tsb方案將預(yù)波束賦形矩陣設(shè)計(jì)問(wèn)題轉(zhuǎn)化為mab問(wèn)題,并利用該算法訓(xùn)練預(yù)波束賦形矩陣,不再需要信道協(xié)方差矩陣(ccm)。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種基于mab的大規(guī)模mimo用戶(hù)調(diào)度和波束賦形方法及系統(tǒng),解決現(xiàn)有技術(shù)里面無(wú)法應(yīng)對(duì)多用戶(hù)場(chǎng)景、下行訓(xùn)練長(zhǎng)度過(guò)長(zhǎng)、有效頻譜效率較低的問(wèn)題;
2、為達(dá)到上述目的/為解決上述技術(shù)問(wèn)題,本發(fā)明是采用下述技術(shù)方案實(shí)現(xiàn)的:
3、第一方面:一種基于mab的大規(guī)模mimo用戶(hù)調(diào)度和波束賦形方法,所述方法包括:
4、建立tsb方案通信模型,得到頻譜效率最大化的設(shè)計(jì)問(wèn)題;
5、將得到的頻譜效率最大化的設(shè)計(jì)問(wèn)題轉(zhuǎn)換為二維空間的組合式多臂賭博機(jī)問(wèn)題;
6、將二維空間的組合式多臂賭博機(jī)問(wèn)題的目標(biāo)函數(shù)進(jìn)一步分為兩個(gè)子問(wèn)題,在第一個(gè)子問(wèn)題中選擇賭博臂來(lái)尋找功率角譜中的零值,在第二個(gè)子問(wèn)題選擇賭博臂來(lái)最大化接收能量;
7、根據(jù)兩個(gè)子問(wèn)題,采用最優(yōu)線(xiàn)性u(píng)cb算法和次優(yōu)線(xiàn)性u(píng)cb算法對(duì)二維空間的組合式多臂賭博機(jī)問(wèn)題進(jìn)行求解,得到波束賦形矩陣。
8、可選地,所述建立tsb方案通信模型,得到頻譜效率最大化的設(shè)計(jì)問(wèn)題,包括:
9、采用dft矩陣來(lái)設(shè)計(jì)預(yù)波束賦形矩陣,其中,表示發(fā)送端未經(jīng)處理的信號(hào),用表示在第個(gè)時(shí)間窗口中的所選用戶(hù),用表示在第個(gè)時(shí)間窗口中的所選dft矢量,則預(yù)波束賦形矩陣表示為,在第個(gè)時(shí)間窗口中的有效信道矩陣表示為;
10、設(shè)為的基數(shù),表示復(fù)數(shù)集合,l為基站陣元數(shù)量,則當(dāng)基站發(fā)送信號(hào)的導(dǎo)頻矩陣為時(shí),第個(gè)用戶(hù)接收到的信號(hào)為:
11、;
12、其中,表示共軛轉(zhuǎn)置矩陣,表示第個(gè)用戶(hù)在時(shí)刻接收到的信號(hào),與為第個(gè)用戶(hù)的信道矢量與第個(gè)時(shí)間窗口中的噪聲;
13、在適用信道中,將問(wèn)題轉(zhuǎn)化為在下行訓(xùn)練長(zhǎng)度受限的情況下設(shè)計(jì)和,使得頻譜效率最大化,由香農(nóng)公式的推導(dǎo),在接收信號(hào)的能量最大時(shí),頻譜效率指標(biāo)將隨之提升,由于,預(yù)波束賦形矩陣的設(shè)計(jì)問(wèn)題的目標(biāo)函數(shù)為:
14、;
15、其中,表示在第個(gè)時(shí)間窗口中的所選用戶(hù),表示在第個(gè)時(shí)間窗口中的所選dft矢量,表示所選用戶(hù)的索引集,表示所選dft矢量的索引集,為第個(gè)用戶(hù)在第個(gè)時(shí)間窗口中的信道矢量,為索引為的dft矢量,為下行訓(xùn)練長(zhǎng)度的限制常數(shù)。
16、可選地,所述將得到的頻譜效率最大化的設(shè)計(jì)問(wèn)題轉(zhuǎn)換為二維空間的組合式多臂賭博機(jī)問(wèn)題,包括:
17、二維空間的組合式多臂賭博機(jī)問(wèn)題有兩個(gè)變量集和,和表示這兩個(gè)變量集各自的元素?cái)?shù)量,為用戶(hù)數(shù),為dft矢量數(shù),兩個(gè)變量集每一對(duì)元素的組合均有一個(gè)未知的均值,每個(gè)均值均滿(mǎn)足獨(dú)立同分布;
18、將問(wèn)題適用為兩個(gè)變量集所對(duì)應(yīng)的一個(gè)二維空間的組合式多臂賭博機(jī)問(wèn)題,表示所選用戶(hù)的索引集,,表示所選dft矢量的索引集,,多臂賭博機(jī)的超級(jí)臂為,相應(yīng)的獎(jiǎng)勵(lì)為。
19、可選地,所述將得到的頻譜效率最大化的設(shè)計(jì)問(wèn)題轉(zhuǎn)換為二維空間的組合式多臂賭博機(jī)問(wèn)題,包括:
20、二維空間的組合式多臂賭博機(jī)問(wèn)題有兩個(gè)變量集和,和表示這兩個(gè)變量集各自的元素?cái)?shù)量,為用戶(hù)數(shù),為dft矢量數(shù),兩個(gè)變量集每一對(duì)元素的組合均有一個(gè)未知的均值,每個(gè)均值均滿(mǎn)足獨(dú)立同分布;
21、將問(wèn)題適用為兩個(gè)變量集所對(duì)應(yīng)的一個(gè)二維空間的組合式多臂賭博機(jī)問(wèn)題,表示所選用戶(hù)的索引集,,表示所選dft矢量的索引集,,多臂賭博機(jī)的超級(jí)臂為,相應(yīng)的獎(jiǎng)勵(lì)為。
22、可選地,所述將二維空間的組合式多臂賭博機(jī)問(wèn)題的目標(biāo)函數(shù)進(jìn)一步分為兩個(gè)子問(wèn)題,包括:
23、第一個(gè)子問(wèn)題,用一個(gè)標(biāo)準(zhǔn)化的效用函數(shù)對(duì)似然比在從0至1的區(qū)間內(nèi)標(biāo)準(zhǔn)化,所述標(biāo)準(zhǔn)化的效用函數(shù)如下:
24、;
25、其中,表示第個(gè)用戶(hù)的信道矢量經(jīng)過(guò)第個(gè)dft矢量的運(yùn)算后信號(hào)能量的似然比,則為的標(biāo)準(zhǔn)化形式,似然比越大,也隨之越大,若信號(hào)以相同的概率傳輸,則與其所映射的非零;
26、則第一個(gè)子問(wèn)題被轉(zhuǎn)化為如何選擇與能讓之和最大,第一個(gè)子問(wèn)題公式表達(dá)如下:
27、;
28、;
29、;
30、其中,表示第個(gè)用戶(hù)的信道矢量經(jīng)過(guò)第個(gè)dft矢量的運(yùn)算后信號(hào)能量的標(biāo)準(zhǔn)化似然比,表示所選用戶(hù)的索引集,表示所選dft矢量的索引集,為下行訓(xùn)練長(zhǎng)度的限制常數(shù),表示在這個(gè)子問(wèn)題中第個(gè)時(shí)間窗口中的所選用戶(hù),表示在這個(gè)子問(wèn)題中第個(gè)時(shí)間窗口中的所選dft矢量;
31、由于組的似然比在剩余的集里為零,存在多解,在每個(gè)解中,存在使得對(duì)有或使得對(duì)有,需從解中移除元素均為零的行與列,使得似然比的和是最大值;
32、當(dāng)解出,選擇剩下的臂來(lái)最大化接收的能量,則第二個(gè)子問(wèn)題公式表達(dá)如下:
33、;
34、;
35、;
36、其中,表示在第個(gè)時(shí)間窗口中的所選用戶(hù),表示在第個(gè)時(shí)間窗口中的所選dft矢量,表示所選用戶(hù)的索引集,表示所選dft矢量的索引集,為第個(gè)用戶(hù)在第個(gè)時(shí)間窗口中的信道矢量,為索引為的dft矢量,為下行訓(xùn)練長(zhǎng)度的限制常數(shù),表示在第個(gè)子問(wèn)題中第個(gè)時(shí)間窗口中的所選用戶(hù),表示在第個(gè)子問(wèn)題中第個(gè)時(shí)間窗口中的所選dft矢量。
37、可選地,根據(jù)兩個(gè)子問(wèn)題,采用最優(yōu)線(xiàn)性u(píng)cb算法或次優(yōu)線(xiàn)性u(píng)cb算法對(duì)二維空間的組合式多臂賭博機(jī)問(wèn)題進(jìn)行求解,得到波束賦形矩陣,包括:基于單環(huán)信道的應(yīng)用場(chǎng)合采用最優(yōu)線(xiàn)性u(píng)cb算法和次優(yōu)線(xiàn)性u(píng)cb算法對(duì)二維空間的組合式多臂賭博機(jī)問(wèn)題進(jìn)行求解,得到波束賦形矩陣。
38、可選地,基于單環(huán)信道的應(yīng)用場(chǎng)合采用最優(yōu)線(xiàn)性u(píng)cb算法對(duì)二維空間的組合式多臂賭博機(jī)問(wèn)題進(jìn)行求解,得到波束賦形矩陣,包括:
39、在第一個(gè)子問(wèn)題中,將效用函數(shù)作為由dft矢量索引與用戶(hù)索引組成的賭博臂的獎(jiǎng)勵(lì),在最優(yōu)線(xiàn)性算法中,一個(gè)基礎(chǔ)的賭博臂的ucb值定義如下:
40、;
41、其中,表示最優(yōu)算法中賭博臂的ucb值,為用戶(hù)數(shù),為dft矢量數(shù),表示第次迭代中該賭博臂被選中過(guò)的次數(shù),為用戶(hù)信道中有效信道矢量所對(duì)應(yīng)的未定賭博臂集,為當(dāng)前賭博臂在第次迭代中已獲取的獎(jiǎng)勵(lì)值的模;為了選出使得ucb值最小的超級(jí)臂,用一個(gè)矢量來(lái)表示用戶(hù)是否已被選擇過(guò),用表示是否已經(jīng)選擇過(guò)波束,代表第個(gè)波束已經(jīng)被選擇過(guò),為0則相反,選擇賭博機(jī)的超級(jí)臂的問(wèn)題將被轉(zhuǎn)述為如下表達(dá):
42、;
43、;
44、其中,表示轉(zhuǎn)置操作,為表示各用戶(hù)是否已被選擇過(guò)的0-1矢量,為表示第個(gè)用戶(hù)是否已被選擇過(guò)的邏輯值,為表示各dft矢量是否已經(jīng)選擇過(guò)的0-1矢量,為全體信道,為第個(gè)用戶(hù)的信道矢量。
45、可選地,基于單環(huán)信道的應(yīng)用場(chǎng)合,采用次優(yōu)線(xiàn)性u(píng)cb算法對(duì)二維空間的組合式多臂賭博機(jī)問(wèn)題進(jìn)行求解,得到波束賦形矩陣,包括:
46、考慮第一個(gè)子問(wèn)題,設(shè)在次優(yōu)算法的第次迭代中,與為被選中用戶(hù)與波束的索引集,在下一次迭代中動(dòng)作的獎(jiǎng)勵(lì)將被定義如下:
47、;
48、其中,為第次迭代中賭博臂的獎(jiǎng)勵(lì),、為當(dāng)前賭博臂與第i-1次迭代中用戶(hù)集與dft矢量集的并集,為表示第個(gè)用戶(hù)的信道矢量經(jīng)過(guò)第個(gè)dft矢量的運(yùn)算后信號(hào)能量的標(biāo)準(zhǔn)化似然比;
49、由于,易證,因此,在次優(yōu)算法中將第次迭代中每個(gè)賭博臂的ucb值定義為下式:
50、;
51、其中,表示次優(yōu)算法的第一個(gè)子問(wèn)題中賭博臂的ucb值,為第次迭代中賭博臂的獎(jiǎng)勵(lì)的取值上限,表示第次迭代中該賭博臂被選中過(guò)的次數(shù),為當(dāng)前賭博臂在第次迭代中已獲取的獎(jiǎng)勵(lì)值的模;將ucb值最大化,在第次迭代中原問(wèn)題將被羅列如下:
52、;
53、;
54、為了求解問(wèn)題,先計(jì)算每個(gè)未被選中的賭博臂的ucb值,如式中的,并從中選擇最大值;
55、考慮第二個(gè)子問(wèn)題時(shí),設(shè)在次優(yōu)算法的第次迭代中,與為被選中用戶(hù)與矢量的索引集,在下一次迭代中動(dòng)作的獎(jiǎng)勵(lì)將被定義如下:
56、;
57、其中,為第次迭代中賭博臂的獎(jiǎng)勵(lì),、為當(dāng)前賭博臂與第i-1次迭代中用戶(hù)集與dft矢量集的并集,為第個(gè)用戶(hù)在第個(gè)時(shí)間窗口中的信道矢量,為索引為的dft矢量;
58、獎(jiǎng)勵(lì)將呈現(xiàn)次指數(shù)分布,于是每個(gè)賭博臂的ucb值將有定義如下;
59、;
60、其中,表示次優(yōu)算法的第二個(gè)子問(wèn)題中賭博臂的ucb值,為用戶(hù)數(shù),為賭博臂,表示第次迭代中該賭博臂被選中過(guò)的次數(shù),為當(dāng)前賭博臂在第次迭代中已獲取的獎(jiǎng)勵(lì)值的模,為當(dāng)前系統(tǒng)在第i次迭代中已經(jīng)取得的總獎(jiǎng)勵(lì);在第次迭代中原問(wèn)題將被羅列如下:
61、;
62、;
63、計(jì)算每個(gè)未被選中的賭博臂的ucb值,并從中選擇最大值。
64、可選地,還包括:基于多散射簇信道,將約束條件中下行訓(xùn)練長(zhǎng)度的計(jì)算轉(zhuǎn)換為圖著色問(wèn)題,采用次優(yōu)線(xiàn)性u(píng)cb算法對(duì)圖的色數(shù)進(jìn)行求解,得到波束賦形矩陣,其中,將約束條件中下行訓(xùn)練長(zhǎng)度的計(jì)算轉(zhuǎn)換為圖著色問(wèn)題,包括:
65、利用圖的色數(shù)降低計(jì)算復(fù)雜度,滿(mǎn)足的最小dtl值為,其中,為用戶(hù)的有效信道矩陣,表示轉(zhuǎn)置,為表示dft矢量與用戶(hù)配對(duì)關(guān)系的0-1矩陣,表示的鄰接矩陣的圖的色數(shù),設(shè)為的一種解,導(dǎo)頻矩陣被設(shè)計(jì)為,其中,是任意大小的酉矩陣的第列。
66、可選地,基于多散射簇信道中,將下行訓(xùn)練長(zhǎng)度轉(zhuǎn)換為圖的色數(shù),采用次優(yōu)線(xiàn)性u(píng)cb算法對(duì)圖的色數(shù)進(jìn)行求解,得到波束賦形矩陣,包括:
67、設(shè)在次優(yōu)線(xiàn)性算法的第次迭代中,與為被選中用戶(hù)與矢量的索引集,的獎(jiǎng)勵(lì)為,在第次迭代中動(dòng)作的獎(jiǎng)勵(lì)將被定義如下:
68、;
69、其中,表示msc信道的第一個(gè)子問(wèn)題中賭博臂的ucb值,為第次迭代中賭博臂的獎(jiǎng)勵(lì)的取值上限,表示第次迭代中該賭博臂被選中過(guò)的次數(shù),為當(dāng)前賭博臂在第次迭代中已獲取的獎(jiǎng)勵(lì)值的模;
70、將被選中動(dòng)作的ucb值最大化的問(wèn)題,在第次迭代中將被羅列如下:
71、;
72、;
73、求解第一個(gè)子問(wèn)題,先計(jì)算每個(gè)未被選中的賭博臂的ucb值,后得以選出ucb最大的賭博臂,并使之滿(mǎn)足,再利用回溯算法來(lái)計(jì)算色數(shù);
74、求解第二個(gè)子問(wèn)題,獎(jiǎng)勵(lì)將呈現(xiàn)次指數(shù)分布,每個(gè)賭博臂的ucb值將有定義如下:
75、;
76、其中,表示msc信道的第二個(gè)子問(wèn)題中賭博臂的ucb值,為用戶(hù)數(shù),為賭博臂,表示第次迭代中該賭博臂被選中過(guò)的次數(shù),為當(dāng)前賭博臂在第次迭代中已獲取的獎(jiǎng)勵(lì)值的模,為當(dāng)前系統(tǒng)在第i次迭代中已經(jīng)取得的總獎(jiǎng)勵(lì);在第次迭代中原問(wèn)題將被羅列如下:
77、;
78、;
79、計(jì)算在約束條件下每個(gè)未被選中的賭博臂的ucb值,約束中的色數(shù)將有回溯算法求得,并從中選擇ucb值最大的賭博臂。
80、第二方面:一種基于mab的大規(guī)模mimo用戶(hù)調(diào)度和波束賦形系統(tǒng),所述系統(tǒng)包括:
81、建模模塊,用于建立tsb方案通信模型,得到頻譜效率最大化的設(shè)計(jì)問(wèn)題;
82、轉(zhuǎn)換模塊,用于將得到的頻譜效率最大化的設(shè)計(jì)問(wèn)題轉(zhuǎn)換為二維空間的組合式多臂賭博機(jī)問(wèn)題;
83、問(wèn)題分解模塊,用于將二維空間的組合式多臂賭博機(jī)問(wèn)題的目標(biāo)函數(shù)進(jìn)一步分為兩個(gè)子問(wèn)題,在第一個(gè)子問(wèn)題中選擇賭博臂來(lái)尋找功率角譜中的零值,在第二個(gè)子問(wèn)題選擇賭博臂來(lái)最大化接收能量;
84、計(jì)算模塊,用于根據(jù)兩個(gè)子問(wèn)題,采用最優(yōu)線(xiàn)性u(píng)cb算法和次優(yōu)線(xiàn)性u(píng)cb算法對(duì)二維空間的組合式多臂賭博機(jī)問(wèn)題進(jìn)行求解,得到波束賦形矩陣。
85、與現(xiàn)有技術(shù)相比,本發(fā)明所達(dá)到的有益效果:
86、本發(fā)明定義了面對(duì)二維問(wèn)題的組合式多臂賭博機(jī),用其來(lái)描述兩階段波束賦形方案(tsb)中的預(yù)波束賦形矩陣和用戶(hù)調(diào)度設(shè)計(jì)問(wèn)題,并將問(wèn)題進(jìn)一步分為兩個(gè)子問(wèn)題,先選擇賭博臂來(lái)尋找功率角譜中的零值,再選擇賭博臂來(lái)最大化接收能量,從而提高頻譜效率。
87、本發(fā)明針對(duì)單環(huán)信道的應(yīng)用場(chǎng)合,提出了最優(yōu)線(xiàn)性u(píng)cb算法和次優(yōu)ucb算法對(duì)mab問(wèn)題進(jìn)行求解;在多散射簇(msc)信道中,本發(fā)明證明了下行訓(xùn)練長(zhǎng)度(dtl)等于圖的色數(shù),并提出了一種計(jì)算復(fù)雜度低的次優(yōu)線(xiàn)性u(píng)cb算法,提升有效頻譜效率、降低反饋長(zhǎng)度與dtl上的優(yōu)勢(shì)。