基于獨(dú)立分量分析-殘余總體相關(guān)分析的低維時(shí)域量化特征提取技術(shù)的制作方法
【專利摘要】本發(fā)明公開了一種基于獨(dú)立分量分析?殘余總體相關(guān)分析的低維時(shí)域量化特征提取技術(shù),其特征在于,該方法包括如下步驟:1)數(shù)據(jù)選擇、預(yù)處理與訓(xùn)練集的構(gòu)建;2)獨(dú)立分量分析特征抽取網(wǎng)絡(luò)的批訓(xùn)練;3)模式分類目標(biāo)綜合分析;4)時(shí)域特征提取器的聯(lián)合構(gòu)建;5)殘余總體相關(guān)低維量化特征提?。?)特征數(shù)據(jù)的空間可視化后處理。本發(fā)明的有益效果是,方法設(shè)計(jì)合理,使用簡(jiǎn)明,提取特征典型。
【專利說明】
基于獨(dú)立分量分析-殘余總體相關(guān)分析的低維時(shí)域量化特征 提取技術(shù)
技術(shù)領(lǐng)域
[0001] 本發(fā)明基于特征提取理論,在獨(dú)立分量分析的基礎(chǔ)上提出一種殘余總體相關(guān)分析 時(shí)域特征提取方法,利用獨(dú)立分量分析的冗余取消特性以及殘余總體相關(guān)分析的整體約簡(jiǎn) 能力,抽取描述不同模式類的典型低維特征,削減原始數(shù)據(jù)中的外來噪聲干擾。該計(jì)算方法 為解決許多領(lǐng)域中涉及的模式分類的特征提取問題奠定了理論基礎(chǔ)。
【背景技術(shù)】
[0002] 特征提取是模式分類的關(guān)鍵環(huán)節(jié)[1]。如果能獲取具有高度準(zhǔn)確描述能力的特征, 則無疑對(duì)分類系統(tǒng)的建立具有重要意義。它可以較少的存貯,表達(dá)較多的物理意義,從而為 后續(xù)的分類(判別)器的正確設(shè)計(jì)打下基礎(chǔ)。
[0003]在實(shí)際的模式分類應(yīng)用場(chǎng)合,信號(hào)檢測(cè)中待分類對(duì)象周邊的外來干擾以及信號(hào)采 集系統(tǒng)的內(nèi)噪聲等均可能在原始觀測(cè)數(shù)據(jù)中引入噪聲干擾;傳感器件異?;蚬收弦部赡墚a(chǎn) 生異常的觀測(cè)數(shù)據(jù)即野值。這些存在于原始數(shù)據(jù)中的噪聲或野值如果不適當(dāng)處理,將隨同 特征提取進(jìn)入特征空間,形成明顯偏離整體類特征的噪點(diǎn)或野點(diǎn)。根據(jù)已有的研究結(jié)果,當(dāng) 原始觀測(cè)數(shù)據(jù)中存在局部的噪聲或野值時(shí)其分布往往呈現(xiàn)出典型的非高斯特性,增加了特 征提取的困難 [2]。此外,還有許多影響模式分類的負(fù)面因素,例如傳感觀測(cè)的信息冗余,特 征提取環(huán)節(jié)所選擇的過高特征維數(shù)等。信息冗余將直接造成后續(xù)特征提取的困難,并進(jìn)一 步放大噪聲或野值的負(fù)面作用;特征維數(shù)選擇過高,則會(huì)使樣本統(tǒng)計(jì)特性的估計(jì)更加困難, 從而降低分類器的泛化推廣能力 [3]。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的是為了解決上述問題,開發(fā)了一種基于獨(dú)立分量分析-殘余總體相 關(guān)分析的低維時(shí)域量化特征提取技術(shù)。
[0005] 實(shí)現(xiàn)上述目的本發(fā)明的技術(shù)方案為,一種基于獨(dú)立分量分析-殘余總體相關(guān)分析 的低維時(shí)域量化特征提取技術(shù),其特征在于,該方法包括如下步驟: 1) 數(shù)據(jù)選擇、預(yù)處理與訓(xùn)練集的構(gòu)建; 2) 獨(dú)立分量分析特征抽取網(wǎng)絡(luò)的批訓(xùn)練; 3) 模式分類目標(biāo)綜合分析; 4) 時(shí)域特征提取器的聯(lián)合構(gòu)建; 5) 殘余總體相關(guān)低維量化特征提??; 6) 特征數(shù)據(jù)的空間可視化后處理。
[0006] 所述數(shù)據(jù)選擇、預(yù)處理與訓(xùn)練集的構(gòu)建為:
式中立(63:為非二次函數(shù)(6(6-):的負(fù)熵w為#中第i個(gè)行向量,約束子%的取值 為:&= 〇,當(dāng)^/兵念時(shí);占^ = 1,當(dāng)j·=々時(shí),五.{·}.為數(shù)學(xué)期望估計(jì), 所述獨(dú)立分量分析特征抽取網(wǎng)絡(luò)的批訓(xùn)練式為:
[0007]式中c =五{>/}為數(shù)據(jù)協(xié)方差矩陣。r *為r的估計(jì)新值。1\.= {>u), 1 = 1, 2,…,4, c= 1,2,…,c為分屬不同模式類的c個(gè)原始觀測(cè)數(shù)據(jù)訓(xùn)練集,為第 女個(gè)訓(xùn)練樣本,c為訓(xùn)練集編號(hào),即對(duì)應(yīng)的模式類號(hào)。ΛΓ為訓(xùn)練集容量,即每個(gè)訓(xùn)練集中所 包含的訓(xùn)練樣本數(shù)。Ubl為由每個(gè)模式類的個(gè)訓(xùn)練樣本組合成的批訓(xùn)練樣本 所述模式分類目標(biāo)綜合分析原理為:
式中&與6均為實(shí)常數(shù)且& > 0。¥( X,X )為核函數(shù),選取不同形式的核函數(shù)可 以獲得不同性質(zhì)的分類器。
[0008] 所述時(shí)域特征提取器的聯(lián)合構(gòu)建式為:
式中l(wèi),C = 1,…,C為由屬于C個(gè)模式類的原始觀測(cè)訓(xùn)練樣本得到的C個(gè)獨(dú)立分量分析估計(jì)基, 為由I共同構(gòu)成的獨(dú)立分量分析特征提取器。
[0009] 所述殘余總體相關(guān)低維量化特征提取計(jì)算式為:
式中ixy為輸出估計(jì)向量中第i個(gè)與第J個(gè)獨(dú)立分量間的零時(shí)延相關(guān)系數(shù)。從而, 由每個(gè)觀測(cè)數(shù)據(jù)樣本,可以得到一個(gè)C維的特征向量片[//,A,…,辦]。
[0010]所述特征數(shù)據(jù)的空間可視化后處理式為:
式中{Xf}為有效特征樣本集合。{!〇}為可視特征散點(diǎn)集合,^和心分別為其中的第 i個(gè)和第J個(gè)特征樣本點(diǎn)。
[0011] 利用本發(fā)明的技術(shù)方案制作的基于獨(dú)立分量分析-殘余總體相關(guān)分析的低維時(shí)域 量化特征提取技術(shù),設(shè)計(jì)合理,使用簡(jiǎn)明,提取特征典型,可很好的提取模式分類中復(fù)雜模 式的低維時(shí)域量化特征。
[0012]
【附圖說明】
[0013] 圖1是本發(fā)明所述基于獨(dú)立分量分析-殘余總體相關(guān)分析的低維時(shí)域量化特征提 取技術(shù)的流程示意圖; 圖2獨(dú)立分量分析-殘余總體相關(guān)特征提取原理; 圖3二維特征數(shù)據(jù)的空間可視化分布; 圖4三維特征數(shù)據(jù)的空間可視化分布。
【具體實(shí)施方式】
[0014] 下面結(jié)合附圖對(duì)本發(fā)明進(jìn)行具體描述,如圖1是本發(fā)明所述基于獨(dú)立分量分析-殘 余總體相關(guān)分析的低維時(shí)域量化特征提取技術(shù)的流程示意圖,如圖所示,采用有約束最大 化數(shù)據(jù)權(quán)向量負(fù)熵的非二次函數(shù)進(jìn)行數(shù)據(jù)選擇,對(duì)數(shù)據(jù)進(jìn)行融合壓縮預(yù)處理,并以模塊取 樣方式進(jìn)行訓(xùn)練集的構(gòu)建。
[0015] 本技術(shù)方案以齒輪箱正常狀態(tài)、輪齒破壞和機(jī)座松動(dòng)三類模式的分類為例子闡述 低維時(shí)域量化特征提取的過程,其基本提取原理為:當(dāng)隸屬于某一模式類的原始觀測(cè)數(shù)據(jù) 樣本輸入該特征提取器中對(duì)應(yīng)的估計(jì)基(已經(jīng)過同類樣本數(shù)據(jù)訓(xùn)練),則輸出的殘余總體相 關(guān)值相比于輸入其他的獨(dú)立分量估計(jì)基(經(jīng)過不同模式類樣本數(shù)據(jù)訓(xùn)練)所獲得的輸出值 更小,即
:2 式中B為獨(dú)立分量估計(jì)基,Bt為已經(jīng)過同類樣本訓(xùn)練的獨(dú)立分量估計(jì)基。&為用于 特征提取的觀測(cè)數(shù)據(jù)樣本。為&輸入獨(dú)立分量估計(jì)基后輸出的殘余總體相關(guān)值。
[0016] 實(shí)施例1 兩維時(shí)域量化特征提取及模式分類 基于約束優(yōu)化選擇正常狀態(tài)、輪齒破壞與機(jī)座送動(dòng)三類模式的訓(xùn)練數(shù)據(jù),并進(jìn)行融合 壓縮預(yù)處理。采用模塊取樣方式構(gòu)建訓(xùn)練集。
[0017]
[0018] 式中、rg以及Γ?分別為正常狀態(tài)、輪齒破壞以及機(jī)座送動(dòng)模式類的原始觀測(cè) 數(shù)據(jù)訓(xùn)練集,為第1個(gè)訓(xùn)練樣本,為訓(xùn)練集中所包含的訓(xùn)練樣本數(shù)。{^b}n、{^b}g以 及Ubh分別為由正常狀態(tài)、輪齒破壞以及機(jī)座送動(dòng)模式類的個(gè)訓(xùn)練樣本組成的批訓(xùn) 練集。
[0019] 分別批訓(xùn)練三個(gè)獨(dú)立分量分析基特征抽取網(wǎng)絡(luò),即估計(jì)基或逆變換矩陣rn、rg以 及ffu
[0020] 對(duì)模式分類的目標(biāo)進(jìn)行綜合分析,本實(shí)施實(shí)例為基于二維特征的多模式分類,分 類在二維平面進(jìn)行。因此,對(duì)正常狀態(tài)、輪齒破壞以及機(jī)座送動(dòng)三個(gè)模式類的獨(dú)立分量分析 估計(jì)基進(jìn)行兩兩組合,構(gòu)建三個(gè)兩維特征提取器。
[0021]
如圖2,基于殘余總體相關(guān)分析特征提取,由每個(gè)兩維特征提取器可以得到兩個(gè)兩維的 特征集合。
[0022]
[0023] 分別對(duì)兩維特征提取器所提取的同一模式類的特征向量集進(jìn)行平均化處理,每一 模式類可以得到一個(gè)平均特征向量集。
[0024]
如圖3,三個(gè)模式類特征的空間散布描述在二維平面上,可以看到不同模式類彼此之間 已經(jīng)呈現(xiàn)出明顯的空間分集特性,表明基于獨(dú)立分量分析-殘余總體相關(guān)分析的時(shí)域量化 特征提取技術(shù)所獲取的二維特征大大地簡(jiǎn)化了后續(xù)的模式分類工作。
[0025] 實(shí)施例2 三維時(shí)域量化特征提取及模式分類 對(duì)模式分類的目標(biāo)進(jìn)行綜合分析,本實(shí)施實(shí)例為基于三維特征的多模式分類,分類在 三維空間中進(jìn)行。因此,以正常狀態(tài)、輪齒破壞以及機(jī)座送動(dòng)三個(gè)模式類的獨(dú)立分量分析估 計(jì)基共同構(gòu)建一個(gè)三維特征提取器
,并基于如圖2所示的殘余總 體相關(guān)分析特征提取原理由該特征提取器得到三個(gè)三維的特征集合。
如圖4,三個(gè)模式類特征的空間散布描述在三維空間中??梢钥吹讲煌J筋愔g也具 有較好的空間分集特性,進(jìn)一步驗(yàn)證了基于獨(dú)立分量分析-殘余總體相關(guān)分析的時(shí)域量化 特征提取技術(shù)的優(yōu)勢(shì)。
[0027] 參考文獻(xiàn)
[1] 徐敏,設(shè)備故障診斷手冊(cè).西安:西安交通大學(xué)出版社,1998.
[2] 焦衛(wèi)東.基于獨(dú)立分量分析的旋轉(zhuǎn)機(jī)械故障診斷新方法的研究.杭州:浙江大 學(xué)博士學(xué)位論文,2003.
[3]張彪.文本分類中特征選擇算法的分析與研究[D].合肥:中國(guó)科學(xué)技術(shù)大學(xué)碩 士學(xué)位論文,2010. 上述技術(shù)方案僅體現(xiàn)了本發(fā)明技術(shù)方案的優(yōu)選技術(shù)方案,本技術(shù)領(lǐng)域的技術(shù)人員對(duì)其 中某些部分所可能做出的一些變動(dòng)均體現(xiàn)了本發(fā)明的原理,屬于本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1. 一種基于獨(dú)立分量分析-殘余總體相關(guān)分析的低維時(shí)域量化特征提取技術(shù),其特征 在于,該方法包括如下步驟: 1) 數(shù)據(jù)選擇、預(yù)處理與訓(xùn)練集的構(gòu)建; 2) 獨(dú)立分量分析特征抽取網(wǎng)絡(luò)的批訓(xùn)練; 3) 模式分類目標(biāo)綜合分析; 4) 時(shí)域特征提取器的聯(lián)合構(gòu)建; 5) 殘余總體相關(guān)低維量化特征提?。? 6) 特征數(shù)據(jù)的空間可視化后處理。2. 根據(jù)權(quán)利要求1所述的基于獨(dú)立分量分析-殘余總體相關(guān)分析的低維時(shí)域量化特征 提取技術(shù),其特征在于,所述數(shù)據(jù)選擇、預(yù)處理與訓(xùn)練集的構(gòu)建為:式中Λ(·)為非二次函數(shù)(6:結(jié)的負(fù)賭, wi為r中第i個(gè)行向量,約束子解的取值為:舞0,當(dāng)y'#A-時(shí);d, = 1,當(dāng)j = A時(shí),為數(shù)學(xué)期望估計(jì)。3. 根據(jù)權(quán)利要求1所述的基于獨(dú)立分量分析-殘余總體相關(guān)分析的低維時(shí)域量化特征 提取技術(shù),其特征在于,所述獨(dú)立分量分析特征抽取網(wǎng)絡(luò)的批訓(xùn)練式為:式中C=幻χχΤ}為數(shù)據(jù)協(xié)方差矩陣,為r的估計(jì)新值,{xW,A= 1,2, …,幻,c = 1,2,…,C為分屬不同模式類的C個(gè)原始觀測(cè)數(shù)據(jù)訓(xùn)練集,xW為第A 個(gè)訓(xùn)練樣本,C為訓(xùn)練集編號(hào),即對(duì)應(yīng)的模式類號(hào),J為訓(xùn)練集容量,即每個(gè)訓(xùn)練集中所包 含的訓(xùn)練樣本數(shù),Ub}。為由每個(gè)模式類的J個(gè)訓(xùn)練樣本組合成的批訓(xùn)練樣本。4. 根據(jù)權(quán)利要求1所述的基于獨(dú)立分量分析-殘余總體相關(guān)分析的低維時(shí)域量化特征 提取技術(shù),其特征在于,所述模式分類目標(biāo)綜合分析原理為:式中a*與6均為實(shí)常數(shù)且a*〉0,Υ(Χ,Χ)為核函數(shù),選取不同形式的核函數(shù)可 w獲得不同性質(zhì)的分類器。5. 根據(jù)權(quán)利要求1所述的基于獨(dú)立分量分析-殘余總體相關(guān)分析的低維時(shí)域量化特征 提取技術(shù),其特征在于,所述時(shí)域特征提取器的聯(lián)合構(gòu)建式為: 抑)二W心…W。), 式中/fc,c= 1,…,C為由屬于C個(gè)模式類的原始觀測(cè)訓(xùn)練樣本得到的C個(gè)獨(dú)立分 量分析估計(jì)基,外')為由於共同構(gòu)成的獨(dú)立分量分析特征提取器。6. 根據(jù)權(quán)利要求1所述的基于獨(dú)立分量分析-殘余總體相關(guān)分析的低維時(shí)域量化特征 提取技術(shù),其特征在于,所述殘余總體相關(guān)低維量化特征提取計(jì)算式為:式中rj,為輸出估計(jì)向量中第i個(gè)與第J個(gè)獨(dú)立分量間的零時(shí)延相關(guān)系數(shù),從而,由 每個(gè)觀測(cè)數(shù)據(jù)樣本,可W得到一個(gè)C維的特征向量片[/;,&,···i/c]。7. 根據(jù)權(quán)利要求1所述的基于獨(dú)立分量分析-殘余總體相關(guān)分析的低維時(shí)域量化特征 提取技術(shù),其特征在于,所述特征數(shù)據(jù)的空間可視化后處理式為:式中Uf}為有效特征樣本集合,{:龍}為可視特征散點(diǎn)集合,Xj和xj分別為其中的第i 個(gè)和第J個(gè)特征樣本點(diǎn)。
【文檔編號(hào)】G06K9/46GK105975976SQ201510126583
【公開日】2016年9月28日
【申請(qǐng)日】2015年3月23日
【發(fā)明人】焦衛(wèi)東, 毛劍, 林樹森, 王曉燕, 翁孟超
【申請(qǐng)人】浙江師范大學(xué)