1.一種基于距離相關(guān)系數(shù)檢驗(yàn)的非高斯中性矢量判斷方法,其過(guò)程包括以下幾步驟:
1)樣本預(yù)判斷步驟:判斷矢量變量樣本是否非負(fù)并且加和為一,成立則滿足非高斯特性;
2)正態(tài)性檢驗(yàn)步驟:運(yùn)用正態(tài)性檢驗(yàn)生成正態(tài)概率圖,并進(jìn)行假設(shè)檢驗(yàn),以檢查輸入的矢量變量樣本是否服從正態(tài)分布;若不服從,則說(shuō)明變量樣本具有“非高斯”特性;
3)中性特性判斷步驟:根據(jù)非高斯中性矢量滿足協(xié)方差矩陣負(fù)相關(guān)的特點(diǎn),通過(guò)判斷協(xié)方差矩陣為負(fù)相關(guān),以判斷非高斯矢量變量樣本為中性向量;
4)非線性去相關(guān)步驟:運(yùn)用“并行”方法,對(duì)矢量變量樣本進(jìn)行非線性變換,以得到一組相互獨(dú)立的非高斯矢量;
5)置換檢驗(yàn)步驟:通過(guò)檢驗(yàn)所得變量之間的相互獨(dú)立,判定原矢量變量樣本滿足“中性”特性。
2.根據(jù)權(quán)利要求1所述,在樣本預(yù)判斷步驟中,對(duì)樣本矢量變量進(jìn)行簡(jiǎn)單的加和計(jì)算,根據(jù)非高斯矢量的特點(diǎn),當(dāng)樣本矢量變量的和為一時(shí),該樣本才有可能為非高斯矢量。
3.根據(jù)權(quán)利要求1所述,在正態(tài)性檢驗(yàn)步驟中,對(duì)于已經(jīng)滿足變量加和為一的矢量樣本,再次進(jìn)行正態(tài)性檢驗(yàn),通過(guò)生成正態(tài)概率圖,查看樣本散點(diǎn)與假設(shè)回歸直線呈現(xiàn)出的圖像結(jié)果,得出樣本與正態(tài)分布的關(guān)系,不服從情況下,則說(shuō)明樣本有“非高斯”特性。
4.根據(jù)權(quán)利要求1所述,在中性特性判斷步驟中,通過(guò)計(jì)算樣本矢量的協(xié)方差矩陣,判斷其相關(guān)性,在矩陣負(fù)相關(guān)的情況下,樣本矢量變量才為中性向量。
5.根據(jù)權(quán)利要求1所述,在非線性去相關(guān)步驟中,得到一組相互獨(dú)立的非高斯矢量變量;假設(shè)x=[x1,x2,···,xK]T非高斯矢量變量,通過(guò)非線性變換,可以獲得K-1維的非高斯矢量變量u=[μ1,μ2,···,μK-1]T,時(shí)間復(fù)雜度為O(log2K);此步驟的具體計(jì)算過(guò)程如下:
1)從第二次迭代開(kāi)始,每次迭代前對(duì)矢量變量樣本進(jìn)行歸一化操作,得到一組新的滿足“非高斯”特性的矢量變量x;
2)對(duì)非高斯矢量變量進(jìn)行迭代非線性變化:
以六維向量為例,首次迭代得到三個(gè)相互獨(dú)立的變量u1,u2,u3分別為:
第二次迭代得到向量u4:
最后一輪迭代得到向量u5:
u5=x1+x2+x3+x4
在六維矢量的情況下,本方法僅用三步就完成了矢量的非線性變化,有效的在時(shí)間復(fù)雜度相對(duì)小的情況下得到一組相互獨(dú)立的新的非高斯中性矢量。
6.根據(jù)權(quán)利要求1所述,在置換檢驗(yàn)步驟中,相關(guān)系數(shù)可以測(cè)量?jī)蓚€(gè)隨機(jī)變量或任意維度的兩個(gè)隨機(jī)向量間的統(tǒng)計(jì)獨(dú)立性,當(dāng)它等于零時(shí)說(shuō)明變量之間相互獨(dú)立;基于距離相關(guān)系數(shù)判定變量之間獨(dú)立性的方法可通過(guò)置換檢驗(yàn)實(shí)現(xiàn),具體步驟如下:
1)給定來(lái)自兩個(gè)不同變量的兩組樣本X=[x1,···,xN]和Y=[y1,···,yN],分別逐一計(jì)算樣本間的歐式距離
aij=||xi-xj||2和bij=||yi-yj||2
然后計(jì)算
和
上式中,表示第i行的均值,表示第j列的均值,表示整個(gè)矩陣的均值,
對(duì)和也采用同樣的計(jì)算方法;
此樣本序列的距離相關(guān)系數(shù)為:
其中,
2)保持X中樣本的順序不變。通過(guò)對(duì)從1到N的序號(hào)進(jìn)行隨機(jī)置換(Random Permutation),可從Y得到新的樣本序列Y*,對(duì)于X和Y*,按照步驟一中的方法重新計(jì)算DC;
3)重復(fù)步驟二Q次(Q應(yīng)為較大的正整數(shù)),統(tǒng)計(jì)所得到的DC值小于步驟一中得到的DC的次數(shù)為P,那么P/Q即為p-value;
此檢驗(yàn)的零假設(shè)(Null Hypothesis)是兩個(gè)變量統(tǒng)計(jì)上相互不獨(dú)立。當(dāng)通過(guò)計(jì)算距離相關(guān)系數(shù)得到的p-value小于顯著性閾值(如0.05)時(shí),此零假設(shè)被拒絕,則可判定兩個(gè)變量相互獨(dú)立;K維非高斯中性矢量變量共需要計(jì)算(K-1)(K-2)/2組變量對(duì)的p-value,與K!/2相比,有效降低了計(jì)算量;
當(dāng)通過(guò)置換檢驗(yàn)判斷步驟四得到的變量相互獨(dú)立后,可以確定矢量變量滿足“中性”特性,結(jié)合之前步驟,可知該矢量變量是非高斯中性矢量。