本發(fā)明涉及高壓直流輸電技術(shù)領(lǐng)域,更具體地,涉及一種實(shí)測(cè)地面合成電場(chǎng)數(shù)據(jù)的處理方法及系統(tǒng)。
背景技術(shù):
隨著我國(guó)經(jīng)濟(jì)持續(xù)快速發(fā)展,能源需求,特別是電力資源需求持續(xù)增長(zhǎng)。然而我國(guó)電力資源總體上西多東少、北多南少,具有分布與需求不均衡的特點(diǎn)。因此為實(shí)現(xiàn)電力資源優(yōu)化配置,我國(guó)將“西電東送、南北互供、全國(guó)聯(lián)網(wǎng)”作為電網(wǎng)發(fā)展的戰(zhàn)略目標(biāo)。這意味著需要建設(shè)大規(guī)模、遠(yuǎn)距離、高效率的輸電工程,高壓直流輸電技術(shù)成為實(shí)現(xiàn)這一目標(biāo)的不二之選。
高壓直流輸電線路傳輸電能時(shí),由于導(dǎo)線放電不可避免地會(huì)產(chǎn)生電暈電流、無(wú)線電干擾、可聽(tīng)噪聲和合成電場(chǎng)等,造成電能損耗和其他環(huán)境問(wèn)題。近年來(lái)我國(guó)直流輸電線路建設(shè)快速發(fā)展,直流輸電線路周圍的電磁環(huán)境問(wèn)題愈來(lái)愈引起人們的關(guān)注。地面合成電場(chǎng)數(shù)據(jù)是直流輸電線路的主要電磁環(huán)境參數(shù),預(yù)測(cè)直流線路下的地面合成場(chǎng)已成為線路導(dǎo)線選型的一項(xiàng)重要工作。
現(xiàn)有技術(shù)(CN:201110342945.8)是從直流輸電線路直流地面合成電場(chǎng)產(chǎn)生機(jī)理出發(fā),采用有限元法進(jìn)行建模,預(yù)測(cè)直流輸電線路地面合成電場(chǎng)數(shù)據(jù)。在建模過(guò)程中,利用子域提高了導(dǎo)線表面電場(chǎng)計(jì)算精度;利用數(shù)學(xué)方法,推算了有空間電荷情況下的電場(chǎng),最終獲得了更加精確的直流輸電線路地面合成電場(chǎng)計(jì)算方法。
然而實(shí)測(cè)的地面合成電場(chǎng)數(shù)據(jù)中,可能由于設(shè)備臨時(shí)的不正常工作或數(shù)據(jù)傳輸過(guò)程中的意外情況,導(dǎo)致采集到的地面合成電場(chǎng)數(shù)據(jù)中含有缺失值或異常值。同時(shí),由于高壓直流輸電線路下的環(huán)境復(fù)雜的特點(diǎn),也有可能導(dǎo)致采集到的數(shù)據(jù)包含部分隨機(jī)干擾值的噪聲,從而影響后續(xù)的對(duì)地面合成電場(chǎng)數(shù)據(jù)進(jìn)行研究的工作?,F(xiàn)有技術(shù)沒(méi)有對(duì)地面合成電場(chǎng)數(shù)據(jù)的缺失值、異常值和隨機(jī)干擾值的處理方法。
因此,需要一種技術(shù),以解決對(duì)地面合成電場(chǎng)數(shù)據(jù)的缺失值、異常值和隨機(jī)干擾值的處理問(wèn)題。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供了一種實(shí)測(cè)地面合成電場(chǎng)數(shù)據(jù)的處理方法及系統(tǒng),以解決對(duì)實(shí)測(cè)地面合成電場(chǎng)數(shù)據(jù)進(jìn)行處理的問(wèn)題。
為了解決上述問(wèn)題,本發(fā)明提供了一種實(shí)測(cè)地面合成電場(chǎng)數(shù)據(jù)的處理方法,所述方法包括:
根據(jù)實(shí)測(cè)的地面合成電場(chǎng)數(shù)據(jù)的缺失值寫入規(guī)則對(duì)所述缺失值進(jìn)行判斷并剔除;
利用拉依達(dá)準(zhǔn)則法對(duì)實(shí)測(cè)的地面合成電場(chǎng)數(shù)據(jù)的異常值分段進(jìn)行判斷并剔除;
利用線性回歸方法對(duì)地面合成電場(chǎng)數(shù)據(jù)中被剔除的缺失值和異常值進(jìn)行彌補(bǔ),獲取所述彌補(bǔ)后的地面合成電場(chǎng)數(shù)據(jù);
判斷彌補(bǔ)后的地面合成電場(chǎng)數(shù)據(jù)是否符合預(yù)期,若不符合預(yù)期,則調(diào)整分段方式,對(duì)異常值重新利用線性回歸方法進(jìn)行彌補(bǔ);
若所述彌補(bǔ)后的地面合成電場(chǎng)數(shù)據(jù)是符合預(yù)期,則利用奇異值分解濾除所述彌補(bǔ)后的地面合成電場(chǎng)數(shù)據(jù)中的隨機(jī)干擾值。
優(yōu)選地,所述利用拉依達(dá)準(zhǔn)則法對(duì)實(shí)測(cè)的地面合成電場(chǎng)數(shù)據(jù)的缺失值分段進(jìn)行判斷包括:
通過(guò)Bezier公式計(jì)算標(biāo)準(zhǔn)偏差:
公式(1)中,x1,x2,…,xn是某個(gè)位置下地面合成電場(chǎng)數(shù)據(jù)的n次觀測(cè),為這n次觀測(cè)的均值,△xi是第i次觀測(cè)與均值的偏差;
對(duì)△xi進(jìn)行判斷,當(dāng)△xi大于3σ時(shí),確認(rèn)第i次觀測(cè)的地面合成電場(chǎng)數(shù)據(jù)為異常值。
優(yōu)選地,所述利用線性回歸方法對(duì)實(shí)測(cè)的地面合成電場(chǎng)數(shù)據(jù)中被剔除的缺失值和異常值進(jìn)行彌補(bǔ)包括:
獲取經(jīng)過(guò)缺失值和異常值判斷后的地面合成電場(chǎng)數(shù)據(jù)為X(1),X(1)列矩陣表示不同位置,行矩陣表示不同時(shí)間采樣點(diǎn)的地面合成電場(chǎng)數(shù)據(jù)矩陣;
確定包括缺失值和異常值的地面合成電場(chǎng)數(shù)據(jù)的位置為擬合位置;
利用擬合位置地面合成電場(chǎng)數(shù)據(jù)外的其余不同位置下的地面合成電場(chǎng)強(qiáng)度建立所述擬合位置的擬合地面合成電場(chǎng)數(shù)據(jù)的線性回歸預(yù)測(cè)模型,確認(rèn)所述線性回歸預(yù)測(cè)模型的組合系數(shù);
利用所述擬合位置的線性回歸預(yù)測(cè)模型,對(duì)擬合位置的判斷出來(lái)的缺失值和異常值進(jìn)行彌補(bǔ),確定對(duì)所述缺失值和異常值彌補(bǔ)后的地面合成電場(chǎng)數(shù)據(jù)X(2)。
優(yōu)選地,所述線性回歸預(yù)測(cè)模型的組合系數(shù)通過(guò)最小二乘方式求解,包括:
確認(rèn)X(1)中所有不含缺失值和異常值地面合成電場(chǎng)數(shù)據(jù)為X*,
構(gòu)造矩陣A及向量a,Q*為矩陣X*擬合位置地面合成電場(chǎng)數(shù)據(jù)外的其余列構(gòu)成的矩陣,向量a為所述線性回歸預(yù)測(cè)模型的組合系數(shù),
根據(jù)線性方程Aa獲取X(1)中對(duì)應(yīng)擬合位置的列矩陣,并確認(rèn)所述線性方程Aa的最小二乘問(wèn)題的解為擬合位置的組合系數(shù)。
優(yōu)選地,所述利用奇異值分解濾除所述擬合后的地面合成電場(chǎng)數(shù)據(jù)中的隨機(jī)干擾值包括:
對(duì)于經(jīng)過(guò)缺失值和異常值擬合后的地面合成電場(chǎng)數(shù)據(jù)X(2),進(jìn)行奇異值分解:
其中,U=[u1,u2,…,ur],S=diag(σ1,σ2,…,σr),V=[v1,v2,…,vr],U的列向量組是X(2)X(2)T的標(biāo)準(zhǔn)正交特征向量,V的列向量組是X(2)TX(2)的標(biāo)準(zhǔn)正交特征向量,r為矩陣X(2)的秩,σ1,σ2,…,σr分別為矩陣X(2)的r個(gè)奇異值;
利用表征有效信號(hào)的前m個(gè)奇異值重構(gòu)矩陣,得到去掉隨機(jī)干擾值后的地面合成電場(chǎng)數(shù)據(jù)X(3),
基于本發(fā)明的另一方面,本發(fā)明提供一種實(shí)測(cè)地面合成電場(chǎng)數(shù)據(jù)的處理系統(tǒng),所述系統(tǒng)包括:
第一判斷單元,用于根據(jù)實(shí)測(cè)的地面合成電場(chǎng)數(shù)據(jù)的缺失值寫入規(guī)則對(duì)所述缺失值進(jìn)行判斷并剔除;
第二判斷單元,用于利用拉依達(dá)準(zhǔn)則法對(duì)實(shí)測(cè)的地面合成電場(chǎng)數(shù)據(jù)的異常值分段進(jìn)行判斷并剔除;
第一處理單元,用于利用線性回歸方法對(duì)地面合成電場(chǎng)數(shù)據(jù)中被剔除的缺失值和異常值進(jìn)行彌補(bǔ),獲取所述彌補(bǔ)后的地面合成電場(chǎng)數(shù)據(jù);判斷彌補(bǔ)后的地面合成電場(chǎng)數(shù)據(jù)是否符合預(yù)期,若不符合預(yù)期,則調(diào)整分段方式,對(duì)異常值重新利用線性回歸方法進(jìn)行彌補(bǔ);
第二處理單元,用于若所述彌補(bǔ)后的地面合成電場(chǎng)數(shù)據(jù)是符合預(yù)期,則利用奇異值分解濾除所述彌補(bǔ)后的地面合成電場(chǎng)數(shù)據(jù)中的隨機(jī)干擾值。
優(yōu)選地,所述第二判斷單元還用于:
通過(guò)Bezier公式計(jì)算標(biāo)準(zhǔn)偏差:
公式(1)中,x1,x2,…,xn是某個(gè)位置下地面合成電場(chǎng)數(shù)據(jù)的n次觀測(cè),為這n次觀測(cè)的均值,△xi是第i次觀測(cè)與均值的偏差;
對(duì)△xi進(jìn)行判斷,當(dāng)△xi大于3σ時(shí),確認(rèn)第i次觀測(cè)的地面合成電場(chǎng)數(shù)據(jù)為異常值。
優(yōu)選地,所述第一處理單元還用于:
獲取經(jīng)過(guò)缺失值和異常值判斷后的地面合成電場(chǎng)數(shù)據(jù)為X(1),X(1)列矩陣表示不同位置,行矩陣表示不同時(shí)間采樣點(diǎn)的地面合成電場(chǎng)數(shù)據(jù)矩陣;
確定包括缺失值和異常值的地面合成電場(chǎng)數(shù)據(jù)的位置為擬合位置;
利用擬合位置地面合成電場(chǎng)數(shù)據(jù)外的其余不同位置下的地面合成電場(chǎng)強(qiáng)度建立所述擬合位置的擬合地面合成電場(chǎng)數(shù)據(jù)的線性回歸預(yù)測(cè)模型,確認(rèn)所述線性回歸預(yù)測(cè)模型的組合系數(shù);
利用所述擬合位置的線性回歸預(yù)測(cè)模型,對(duì)擬合位置的判斷出來(lái)的缺失值和異常值進(jìn)行彌補(bǔ),確定對(duì)所述缺失值和異常值彌補(bǔ)后的地面合成電場(chǎng)數(shù)據(jù)X(2)。
優(yōu)選地,所述線性回歸預(yù)測(cè)模型的組合系數(shù)通過(guò)最小二乘方式求解,包括:
確認(rèn)X(1)中所有不含缺失值和異常值地面合成電場(chǎng)數(shù)據(jù)為X*,
構(gòu)造矩陣A及向量a,Q*為矩陣X*擬合位置地面合成電場(chǎng)數(shù)據(jù)外的其余列構(gòu)成的矩陣,向量a為所述線性回歸預(yù)測(cè)模型的組合系數(shù),
根據(jù)線性方程Aa獲取X(1)中對(duì)應(yīng)擬合位置的列矩陣,并確認(rèn)所述線性方程Aa的最小二乘問(wèn)題的解為擬合位置的組合系數(shù)。
優(yōu)選地,所述第二處理單元用于:
對(duì)于經(jīng)過(guò)缺失值和異常值擬合后的地面合成電場(chǎng)數(shù)據(jù)X(2),進(jìn)行奇異值分解:
其中,U=[u1,u2,…,ur],S=diag(σ1,σ2,…,σr),V=[v1,v2,…,vr],U的列向量組是X(2)X(2)T的標(biāo)準(zhǔn)正交特征向量,V的列向量組是X(2)TX(2)的標(biāo)準(zhǔn)正交特征向量,r為矩陣X(2)的秩,σ1,σ2,…,σr分別為矩陣X(2)的r個(gè)奇異值;
利用表征有效信號(hào)的前m個(gè)奇異值重構(gòu)矩陣,得到去掉隨機(jī)干擾值后的地面合成電場(chǎng)數(shù)據(jù)X(3),
本發(fā)明的有益效果:
本發(fā)明的技術(shù)方案首先對(duì)實(shí)測(cè)的地面合成電場(chǎng)數(shù)據(jù)進(jìn)行缺失值的判斷并剔除,然后通過(guò)拉依達(dá)準(zhǔn)則法對(duì)實(shí)測(cè)的地面合成電場(chǎng)數(shù)據(jù)分段進(jìn)行異常值的判別并剔除;接著利用線性回歸方法對(duì)地面合成電場(chǎng)數(shù)據(jù)中判別出來(lái)的缺失值和異常值進(jìn)行彌補(bǔ);再判斷處理結(jié)果是否符合預(yù)期;如果不符合預(yù)期,需要調(diào)整分段方式,對(duì)缺失值、異常值重新彌補(bǔ);最后,利用奇異值分解來(lái)提取地面合成電場(chǎng)數(shù)據(jù)的主要特征,從而濾除數(shù)據(jù)中的隨機(jī)干擾。本發(fā)明的技術(shù)方案可以實(shí)現(xiàn)對(duì)實(shí)測(cè)地面合成電場(chǎng)數(shù)據(jù)中缺失值和異常值的判斷和彌補(bǔ),實(shí)現(xiàn)地面合成電場(chǎng)數(shù)據(jù)中隨機(jī)干擾值的濾除,從而降低由于測(cè)量設(shè)備異?;蛲饨绛h(huán)境干擾對(duì)地面合成電場(chǎng)數(shù)據(jù)的影響,對(duì)地面合成電場(chǎng)的機(jī)理分析有重要的推動(dòng)作用。
附圖說(shuō)明
通過(guò)參考下面的附圖,可以更為完整地理解本發(fā)明的示例性實(shí)施方式:
圖1為根據(jù)本發(fā)明實(shí)施方式的一種實(shí)測(cè)地面合成電場(chǎng)數(shù)據(jù)的處理方法流程圖;
圖2為根據(jù)本發(fā)明實(shí)施方式的一種實(shí)測(cè)地面合成電場(chǎng)數(shù)據(jù)的處理系統(tǒng)結(jié)構(gòu)圖;
圖3為無(wú)異常數(shù)據(jù)的地面合成電場(chǎng)數(shù)據(jù)X在12個(gè)不同位置的相關(guān)系數(shù)矩陣示意圖;
圖4為有異常數(shù)據(jù)的地面合成電場(chǎng)數(shù)據(jù)Xa在12個(gè)不同位置的相關(guān)系數(shù)矩陣示意圖;
圖5為異常值處理后的地面合成電場(chǎng)數(shù)據(jù)Xe在12個(gè)不同位置的相關(guān)系數(shù)矩陣示意圖;
圖6為濾除隨機(jī)干擾后的地面合成電場(chǎng)數(shù)據(jù)Y在12個(gè)不同位置的相關(guān)系數(shù)矩陣示意圖;
圖7為本發(fā)明實(shí)施方式的預(yù)處理前、后地面合成電場(chǎng)數(shù)據(jù)X,Xa,Xe,Y的細(xì)節(jié)比較示意圖。
具體實(shí)施方式
現(xiàn)在參考附圖介紹本發(fā)明的示例性實(shí)施方式,然而,本發(fā)明可以用許多不同的形式來(lái)實(shí)施,并且不局限于此處描述的實(shí)施例,提供這些實(shí)施例是為了詳盡地且完全地公開(kāi)本發(fā)明,并且向所屬技術(shù)領(lǐng)域的技術(shù)人員充分傳達(dá)本發(fā)明的范圍。對(duì)于表示在附圖中的示例性實(shí)施方式中的術(shù)語(yǔ)并不是對(duì)本發(fā)明的限定。在附圖中,相同的單元/元件使用相同的附圖標(biāo)記。
除非另有說(shuō)明,此處使用的術(shù)語(yǔ)(包括科技術(shù)語(yǔ))對(duì)所屬技術(shù)領(lǐng)域的技術(shù)人員具有通常的理解含義。另外,可以理解的是,以通常使用的詞典限定的術(shù)語(yǔ),應(yīng)當(dāng)被理解為與其相關(guān)領(lǐng)域的語(yǔ)境具有一致的含義,而不應(yīng)該被理解為理想化的或過(guò)于正式的意義。
圖1為根據(jù)本發(fā)明實(shí)施方式的一種實(shí)測(cè)地面合成電場(chǎng)數(shù)據(jù)的處理方法流程圖。本發(fā)明的實(shí)施方式首先對(duì)實(shí)測(cè)的地面合成電場(chǎng)數(shù)據(jù)進(jìn)行缺失值的判斷并剔除,然后通過(guò)拉依達(dá)準(zhǔn)則法對(duì)實(shí)測(cè)的地面合成電場(chǎng)數(shù)據(jù)分段進(jìn)行異常值的判別并剔除;以及利用線性回歸方法對(duì)地面合成電場(chǎng)數(shù)據(jù)中判別出來(lái)的缺失值和異常值進(jìn)行彌補(bǔ);再判斷地面合成電場(chǎng)數(shù)據(jù)彌補(bǔ)結(jié)果是否符合預(yù)期;如果不符合預(yù)期,需要調(diào)整分段方式,對(duì)缺失值、異常值重新彌補(bǔ);最后,利用奇異值分解來(lái)提取地面合成電場(chǎng)數(shù)據(jù)的主要特征,從而濾除地面合成電場(chǎng)數(shù)據(jù)中的隨機(jī)干擾值。如圖1所示,方法100從步驟101開(kāi)始。
優(yōu)選地,在步驟101:根據(jù)實(shí)測(cè)的地面合成電場(chǎng)數(shù)據(jù)的缺失值寫入規(guī)則對(duì)缺失值進(jìn)行判斷并剔除。
通常情況下,在實(shí)際地面合成電場(chǎng)數(shù)據(jù)的采集過(guò)程中,往往由于各種原因,比如機(jī)器臨時(shí)故障導(dǎo)致的采集地面合成電場(chǎng)數(shù)據(jù)的缺失。實(shí)際采集操作中,規(guī)定為某些特殊值例如9999,或特殊文本如ERR為缺失值。所以,可以根據(jù)缺失數(shù)據(jù)寫入的規(guī)則來(lái)實(shí)現(xiàn)對(duì)缺失值的判斷,并將判斷出的缺失值進(jìn)行剔除。
優(yōu)選地,在步驟102:利用拉依達(dá)準(zhǔn)則法對(duì)實(shí)測(cè)的地面合成電場(chǎng)數(shù)據(jù)的異常值分段進(jìn)行判斷并剔除。本發(fā)明實(shí)施方式中,首先根據(jù)先驗(yàn)知識(shí)將實(shí)測(cè)地面合成電場(chǎng)數(shù)據(jù)所對(duì)應(yīng)的時(shí)間等分為多個(gè)時(shí)間段,然后對(duì)每個(gè)時(shí)間段上的地面合成電場(chǎng)數(shù)據(jù)分別進(jìn)行異常值判斷。當(dāng)實(shí)測(cè)地面合成電場(chǎng)數(shù)據(jù)對(duì)應(yīng)的時(shí)間較長(zhǎng)時(shí),分段數(shù)應(yīng)較多,以保證每一小段時(shí)間內(nèi)的地面合成電場(chǎng)數(shù)據(jù)值有比較平穩(wěn)的變化;當(dāng)實(shí)測(cè)地面合成電場(chǎng)數(shù)據(jù)對(duì)應(yīng)的時(shí)間較短時(shí),分段數(shù)應(yīng)較少,以保證每一小段時(shí)間內(nèi)的樣本數(shù)滿足拉依達(dá)準(zhǔn)則法的條件,從而提高判別精度。優(yōu)選地,利用拉依達(dá)準(zhǔn)則法對(duì)實(shí)測(cè)的地面合成電場(chǎng)數(shù)據(jù)的缺失值分段進(jìn)行判斷包括:
通過(guò)Bezier公式計(jì)算標(biāo)準(zhǔn)偏差:
公式(1)中,x1,x2,…,xn是某個(gè)位置下地面合成電場(chǎng)數(shù)據(jù)的n次觀測(cè),為這n次觀測(cè)的均值,△xi是第i次觀測(cè)與均值的偏差;
對(duì)△xi進(jìn)行判斷,當(dāng)△xi大于3σ時(shí),確認(rèn)第i次觀測(cè)的地面合成電場(chǎng)數(shù)據(jù)為異常值。
本發(fā)明的實(shí)施方式中,拉依達(dá)準(zhǔn)則又稱3σ準(zhǔn)則,它假設(shè)一組檢測(cè)數(shù)據(jù)只含有隨機(jī)誤差,對(duì)這組數(shù)據(jù)進(jìn)行計(jì)算處理得到其標(biāo)準(zhǔn)偏差,然后按一定概率確定一個(gè)區(qū)間,當(dāng)誤差超過(guò)這個(gè)區(qū)間,則認(rèn)為不是隨機(jī)誤差,其對(duì)應(yīng)的數(shù)據(jù)應(yīng)予以剔除。其中,標(biāo)準(zhǔn)偏差一般為Bezier公式計(jì)算的標(biāo)準(zhǔn)差:
其中,x1,x2,…,xn是某個(gè)位置下地面合成電場(chǎng)數(shù)據(jù)的n次觀測(cè),為這n次觀測(cè)的均值,△xi是第i次觀測(cè)與均值的偏差。根據(jù)正態(tài)分布理論,偏差△xi<3σ的概率約為99.7%。因此,在有限次如n次的觀測(cè)中,如果某次觀測(cè)的偏差大于3σ,說(shuō)明該次觀測(cè)具有較大的可疑誤差,被判斷為異常值,應(yīng)該予以剔除。
優(yōu)選地,在步驟103:利用線性回歸方法對(duì)地面合成電場(chǎng)數(shù)據(jù)中被剔除的缺失值和異常值進(jìn)行彌補(bǔ),獲取彌補(bǔ)后的地面合成電場(chǎng)數(shù)據(jù)。
利用線性回歸方法對(duì)實(shí)測(cè)的地面合成電場(chǎng)數(shù)據(jù)中被剔除的缺失值和異常值進(jìn)行彌補(bǔ)包括:獲取經(jīng)過(guò)缺失值和異常值判斷后的地面合成電場(chǎng)數(shù)據(jù)為X(1),X(1)列矩陣表示不同位置,行矩陣表示不同時(shí)間采樣點(diǎn)的地面合成電場(chǎng)數(shù)據(jù)矩陣;確定包括缺失值和異常值的地面合成電場(chǎng)數(shù)據(jù)的位置為擬合位置;利用擬合位置地面合成電場(chǎng)數(shù)據(jù)外的其余不同位置下的地面合成電場(chǎng)強(qiáng)度建立擬合位置的擬合地面合成電場(chǎng)數(shù)據(jù)的線性回歸預(yù)測(cè)模型,確認(rèn)線性回歸預(yù)測(cè)模型的組合系數(shù);利用擬合位置的線性回歸預(yù)測(cè)模型,對(duì)擬合位置的判斷出來(lái)的缺失值和異常值進(jìn)行彌補(bǔ),確定對(duì)缺失值和異常值彌補(bǔ)后的地面合成電場(chǎng)數(shù)據(jù)X(2)。
優(yōu)選地,線性回歸預(yù)測(cè)模型的組合系數(shù)通過(guò)最小二乘方式求解,包括:
確認(rèn)X(1)中所有不含缺失值和異常值地面合成電場(chǎng)數(shù)據(jù)為X*,
構(gòu)造矩陣A及向量a,Q*為矩陣X*擬合位置地面合成電場(chǎng)數(shù)據(jù)外的其余列構(gòu)成的矩陣,向量a為線性回歸預(yù)測(cè)模型的組合系數(shù),
根據(jù)線性方程Aa獲取X(1)中對(duì)應(yīng)擬合位置的列矩陣,并確認(rèn)線性方程Aa的最小二乘問(wèn)題的解為擬合位置的組合系數(shù)。
判斷彌補(bǔ)后的地面合成電場(chǎng)數(shù)據(jù)是否符合預(yù)期,若不符合預(yù)期,則調(diào)整分段方式,對(duì)異常值重新利用線性回歸方法進(jìn)行彌補(bǔ)。其中調(diào)整分段方式包括,當(dāng)擬合后的地面合成電場(chǎng)數(shù)據(jù)過(guò)于平滑時(shí),應(yīng)適當(dāng)減小段數(shù)來(lái)增加每一小段的樣本數(shù),從而反映出地面合成電場(chǎng)數(shù)據(jù)值的變化;當(dāng)擬合后的地面合成電場(chǎng)數(shù)據(jù)與相鄰地面合成電場(chǎng)數(shù)據(jù)的差距過(guò)大時(shí),應(yīng)適當(dāng)增加段數(shù)來(lái)減少每一小段的樣本數(shù),從而削弱較長(zhǎng)時(shí)間間隔的不相關(guān)信息對(duì)其的干擾。
本發(fā)明的實(shí)施方式中,利用線性回歸方法對(duì)地面合成電場(chǎng)數(shù)據(jù)中判斷出來(lái)的缺失值和異常值進(jìn)行彌補(bǔ)。
首先,將經(jīng)過(guò)缺失值和異常值判斷后的電場(chǎng)數(shù)據(jù)標(biāo)記為X(1):
公式(2)中,變量x1,x2,…,xp代表其中的p個(gè)不同測(cè)量位置隨時(shí)間變化的電場(chǎng)值,N為采樣點(diǎn)的樣本個(gè)數(shù),即xij(i=1,2,…,N;j=1,2,…,p)表示第i個(gè)采樣時(shí)刻下第j個(gè)位置處的地面合成電場(chǎng)強(qiáng)度值。在X(1)中,含有無(wú)效數(shù)據(jù),即判別為缺失值或異常值的地面合成電場(chǎng)強(qiáng)度數(shù)據(jù),需要在后續(xù)的處理中進(jìn)行彌補(bǔ)。
優(yōu)選地,由于實(shí)測(cè)的不同位置下地面合成電場(chǎng)強(qiáng)度值具有一定的關(guān)聯(lián)性,且隨時(shí)間的變化程度相近,所以可以通過(guò)對(duì)不含缺失值和異常值的那部分地面電場(chǎng)強(qiáng)度數(shù)據(jù)來(lái)擬合出一個(gè)不同位置下地面合成電場(chǎng)強(qiáng)度之間線性關(guān)系的預(yù)測(cè)模型。本發(fā)明的實(shí)施方式中以第1個(gè)位置下隨時(shí)間變化的地面合成電場(chǎng)強(qiáng)度x1的擬合為例,有如下的預(yù)測(cè)模型,其它位置下的擬合預(yù)測(cè)模型可簡(jiǎn)單類比:
x1=a0+a2x2+a3x3+…+apxp
其中x1是待擬合的對(duì)象,x2,x3,…,xp是其余的不同位置下的地面合成電場(chǎng)強(qiáng)度,a0,a2,a3,…,ap是擬合出來(lái)的線性回歸模型的組合系數(shù),a0為其中的常數(shù)項(xiàng)。根據(jù)上述x1的預(yù)測(cè)模型,可對(duì)x1中第i個(gè)采樣時(shí)刻下的缺失值和異常值xi1進(jìn)行補(bǔ)充:
xi1=a0+a2xi2+a3xi3+…+apxip
同理,也類似地求解及彌補(bǔ)出x2,x3,…,xp中某些采樣時(shí)刻下的缺失值和異常值。
最終,通過(guò)對(duì)x1,x2,…,xp經(jīng)過(guò)缺失值和異常值處理后,得到新的地面合成電場(chǎng)數(shù)據(jù)X(2):
其中變量x1,x2,…,xp代表其中的p個(gè)不同測(cè)量位置,N為采樣點(diǎn)的樣本個(gè)數(shù),即xij(i=1,2,…,N;j=1,2,…,p)表示第i個(gè)采樣時(shí)刻下第j個(gè)位置處的地面合成電場(chǎng)強(qiáng)度值。與地面合成電場(chǎng)強(qiáng)度矩陣X(1)相比,X(2)僅彌補(bǔ)了X(1)中的缺失值和異常值。
優(yōu)選地,本發(fā)明的實(shí)施方式中,在對(duì)x1中判別出來(lái)的缺失值和異常值進(jìn)行彌補(bǔ)的過(guò)程中,線性回歸模型的系數(shù)a0,a2,a3,…,ap可以通過(guò)最小二乘方式求解。
標(biāo)記X*為X(1)中所有不含缺失值或異常值的采樣時(shí)刻下的電場(chǎng)數(shù)據(jù):
其中X(1)為N×p的矩陣,X*為M×p的矩陣(M<N),即X*由去掉X(1)中含缺失值或異常值的某些行得到。另外,為矩陣X*的第1列,Q*為矩陣X*的其余列構(gòu)成的矩陣。所以,X*中已對(duì)地面合成電場(chǎng)數(shù)據(jù)的缺失值和異常值進(jìn)行了彌補(bǔ),即X*中所有數(shù)據(jù)均有意義。然后,構(gòu)造矩陣A及向量a:
則線性方程組Aa=x1的最小二乘問(wèn)題的解為:a=(ATA)-1ATx1。此時(shí),求解出來(lái)的a即為x1的預(yù)測(cè)模型的組合系數(shù)a0,a2,a3,…,ap,即對(duì)x1中第i個(gè)采樣時(shí)刻下的缺失值和異常值xi1進(jìn)行補(bǔ)充:
xi1=a0+a2xi2+a3xi3+…+apxip
同理,也類似地求解及彌補(bǔ)出x2,x3,…,xp中某些采樣時(shí)刻下的缺失值和異常值。按此方法,可完成對(duì)位置1至p個(gè)測(cè)量位置測(cè)量的地面合成電場(chǎng)數(shù)據(jù)的缺失值和異常值進(jìn)行彌補(bǔ)。
優(yōu)選地,在步驟103:若彌補(bǔ)后的地面合成電場(chǎng)數(shù)據(jù)是符合預(yù)期,利用奇異值分解濾除彌補(bǔ)后的地面合成電場(chǎng)數(shù)據(jù)中的隨機(jī)干擾值。由于不同位置下的地面合成電場(chǎng)強(qiáng)度值具有一定的關(guān)聯(lián)性,所以可以利用奇異值分解來(lái)提取地面合成電場(chǎng)數(shù)據(jù)的主要特征,實(shí)現(xiàn)降噪目的。對(duì)于經(jīng)過(guò)缺失值和異常值擬合后的地面合成電場(chǎng)數(shù)據(jù)X(2),進(jìn)行奇異值分解:
其中,U=[u1,u2,…,ur],S=diag(σ1,σ2,…,σr),V=[v1,v2,…,vr],U的列向量組是X(2)X(2)T的標(biāo)準(zhǔn)正交特征向量,V的列向量組是X(2)TX(2)的標(biāo)準(zhǔn)正交特征向量,r為矩陣X(2)的秩,σ1,σ2,…,σr分別為矩陣X(2)的r個(gè)奇異值,且σ1>σ2>…>σr。
優(yōu)選地,本發(fā)明的實(shí)施方式中,矩陣X(2)是由地面合成電場(chǎng)強(qiáng)度和隨機(jī)噪聲共同組成的,那么它的按遞減順序排列的奇異值σ1,σ2,…,σr可以清楚地反映實(shí)際信號(hào)即地面合成電場(chǎng)強(qiáng)度和噪聲能量集中的情況:前m個(gè)較大的奇異值主要反映信號(hào),其余的奇異值則主要反映噪聲。因此,只用表征有效信號(hào)的前m個(gè)奇異值重構(gòu)矩陣,則可以有效地去除隨機(jī)干擾。
利用表征有效信號(hào)的前m個(gè)奇異值重構(gòu)矩陣,得到去掉隨機(jī)干擾值后的地面合成電場(chǎng)數(shù)據(jù)X(3),
圖3-圖6為根據(jù)本發(fā)明實(shí)施方式的地面合成電場(chǎng)數(shù)據(jù)在預(yù)處理前、后地面合成電場(chǎng)數(shù)據(jù)X,Xa,Xe,Y的相關(guān)系數(shù)矩陣,色塊的顏色越深,表示對(duì)應(yīng)的兩種粒徑大小的顆粒物濃度的關(guān)聯(lián)性越強(qiáng)。
通過(guò)對(duì)比本發(fā)明實(shí)施方式的四種地面合成電場(chǎng)數(shù)據(jù)X,Xa,Xe,Y的相關(guān)系數(shù)矩陣可以發(fā)現(xiàn),異常值對(duì)地面合成電場(chǎng)數(shù)據(jù)不同位置下的相關(guān)系數(shù)矩陣具有較大影響。而經(jīng)異常值處理后,Xe的相關(guān)系數(shù)矩陣和無(wú)異常值的電場(chǎng)數(shù)據(jù)X的相關(guān)系數(shù)矩陣類似。經(jīng)過(guò)隨機(jī)干擾的濾除后,不同位置下的電場(chǎng)強(qiáng)度之間的關(guān)聯(lián)與不關(guān)聯(lián)的程度更加明顯,說(shuō)明基于奇異值分解的隨機(jī)干擾濾除方法有效地提取了地面合成電場(chǎng)數(shù)據(jù)的主要特征。
圖7為本發(fā)明一種實(shí)施例的預(yù)處理前、后地面合成電場(chǎng)數(shù)據(jù)X,Xa,Xe,Y的細(xì)節(jié)比較。圖7顯示了12種不同位置下,在[270,300]區(qū)間的地面合成電場(chǎng)數(shù)據(jù)。
本發(fā)明的實(shí)施方式有效地實(shí)現(xiàn)了對(duì)實(shí)測(cè)地面合成電場(chǎng)數(shù)據(jù)的預(yù)處理。其中,對(duì)地面合成電場(chǎng)數(shù)據(jù)中的缺失值和異常值進(jìn)行了判斷,并對(duì)被判斷為缺失值和異常值的數(shù)據(jù)進(jìn)行了彌補(bǔ),同時(shí)對(duì)地面合成電場(chǎng)數(shù)據(jù)中的隨機(jī)干擾值進(jìn)行了濾除,從而降低由于測(cè)量設(shè)備異?;蛲饨绛h(huán)境干擾對(duì)地面合成電場(chǎng)數(shù)據(jù)的影響。本發(fā)明的實(shí)施方式通過(guò)分段的拉依達(dá)準(zhǔn)則法對(duì)異常值進(jìn)行判別,有效地提高了判別精度。本發(fā)明的實(shí)施方式通過(guò)線性回歸方法對(duì)缺失值和異常值進(jìn)行彌補(bǔ),有效地利用了地面合成電場(chǎng)數(shù)據(jù)內(nèi)部的關(guān)聯(lián)特性來(lái)得到合適的彌補(bǔ)數(shù)據(jù)。本發(fā)明的實(shí)施方式通過(guò)奇異值分解來(lái)提取地面合成電場(chǎng)數(shù)據(jù)的主要特征,在一定程度上濾除了地面合成電場(chǎng)數(shù)據(jù)中的隨機(jī)干擾值。
綜上,本發(fā)明實(shí)施方式提供的一種實(shí)測(cè)地面合成電場(chǎng)數(shù)據(jù)的預(yù)處理方法,是基于實(shí)測(cè)數(shù)據(jù)本身可能帶有的缺失值、異常值以及某些隨機(jī)干擾進(jìn)行的有效的數(shù)據(jù)預(yù)處理方法。在預(yù)處理過(guò)程中,充分利用不同位置下的地面合成電場(chǎng)強(qiáng)度之間的關(guān)聯(lián)特性來(lái)進(jìn)行。最終有效地實(shí)現(xiàn)了復(fù)雜的實(shí)測(cè)地面合成電場(chǎng)數(shù)據(jù)的預(yù)處理。
已經(jīng)通過(guò)參考少量實(shí)施方式描述了本發(fā)明。然而,本領(lǐng)域技術(shù)人員所公知的,正如附帶的專利權(quán)利要求所限定的,除了本發(fā)明以上公開(kāi)的其他的實(shí)施例等同地落在本發(fā)明的范圍內(nèi)。
通常地,在權(quán)利要求中使用的所有術(shù)語(yǔ)都根據(jù)他們?cè)诩夹g(shù)領(lǐng)域的通常含義被解釋,除非在其中被另外明確地定義。所有的參考“一個(gè)/所述/該[裝置、組件等]”都被開(kāi)放地解釋為所述裝置、組件等中的至少一個(gè)實(shí)例,除非另外明確地說(shuō)明。這里公開(kāi)的任何方法的步驟都沒(méi)必要以公開(kāi)的準(zhǔn)確的順序運(yùn)行,除非明確地說(shuō)明。