專利名稱:基于自適應冗余字典的語音信號稀疏表示方法
技術(shù)領(lǐng)域:
本 發(fā)明涉及信號處理領(lǐng)域,特別是涉及一種基于自適應冗余字典的語音信號稀疏表示方法,用于稀疏表示語音信號,可應用于語音信號去噪、語音信號特征識別、語音壓縮編碼和語音壓縮感知等領(lǐng)域。
背景技術(shù):
傳統(tǒng)語音信號去噪方法基于以下假設(shè)在含有噪聲的語音信號中,有用信息部分的頻率較低,而噪聲的頻率較高。但是,實際中上述假設(shè)條件并不總是成立。一方面,語音中清音幀和過渡幀的有用信息部分含有高頻分量;另一方面,噪聲雖然以高頻成分為主,但也含有低頻成分。因此,語音中的有用信息部分和噪聲往往在頻帶上存在重迭,這是造成基于有用信息和噪聲頻率特性差別的傳統(tǒng)語音去噪方法存在缺陷的根本原因?;谡Z音稀疏分解的去噪方法,將語音中的有用信息部分作為稀疏成分,而將噪聲作為語音去除其中稀疏成分后得到的殘差,并以此作為語音去噪處理的基礎(chǔ)。利用語音的稀疏成分重構(gòu)語音信號可以有效地消除噪聲的影響,獲得較高的信噪比,提高語音通話質(zhì)量,具有應用價值。在信號處理中,用空間變換有效地表達信號,可提高壓縮效率。傳統(tǒng)的信號表示是基于“正交基”的展開,如DCT,小波變換等,但這種分解不總能夠達到較好的效果,尤其是對時頻變化范圍很廣的信號效果更差。一種更好的信號表示方式應是根據(jù)信號的特點,自適應地選擇基函數(shù)?,F(xiàn)有技術(shù)中,有提出信號在過完備原子庫(或稱為冗余字典)上進行稀疏分解的思想,該原子庫比通常的完備正交基大得多,在信號所表示的空間中足夠密。因此, 信號稀疏表示的結(jié)果就是信號線性展開中大部分基函數(shù)的系數(shù)為零,只有少數(shù)基函數(shù)具有較大的非零系數(shù)。這里稱基函數(shù)為原子,其集合為字典。信號稀疏表示具有由可揭示信號主要特征與內(nèi)在結(jié)構(gòu)的少量原子來表示信號的優(yōu)良特性,因此在信號去噪、特征識別、弱信號提取和數(shù)據(jù)壓縮等領(lǐng)域得到了廣泛應用。語音信號稀疏表示的關(guān)鍵問題之一是設(shè)計有效的冗余字典。當前,人們提出多種冗余字典,但它們不總能保證信號的稀疏性。井愛雯等人選取可分離Gabor函數(shù)作為語音原子庫(井愛雯,劉云,“基于MP算法的語音信號稀疏分解”,計算機工程與應用,2009, 45(5) :144-146),但離散Gabor函數(shù)中多個時頻參數(shù)所得的原子數(shù)量巨大,增加了冗余字典的復雜度。Aharon 等人提出了 K-SVD 算法(M. Aharon, Μ. Elad, Α. Μ. Bruckstein, "The K-SVD :an algorithm for designing of overcomplete dictionaries for sparse representation". IEEE Transactions on Signal Processing,2006,54(11) 4311-4322.),通過學習、訓練大量樣本來更新自適應冗余字典,計算量和存儲空間巨大?;谀0迤ヅ浣芀LT域上的語音信號壓縮感知重構(gòu)算法中(郭海燕,楊震,“基于近似KLT 域的語音信號壓縮感知”,電子與信息學報,2009,31 (12) :2948-2952),清音幀信號在近似 KLT冗余字典上不具有稀疏性。語音信號稀疏表示的關(guān)鍵問題之二是設(shè)計快速有效的稀疏分解算法。目前已有 Matching Pursuit (MP) (S. Mallat, Ζ. Zhang, "Matching pursuit with time-frequency dictionaries",IEEE Transactions on Signal Processing,1993,41(12) 3397-3415.),Basis Pursuit (BP)(S· Chen,D· L Donoho,"Atomic decomposition by basis pursuit,,,SIAM Journal on Scientific Computing,1999,20 (1) :33-61·) 禾口 Method of Frames(I. Daubechies,“Time-frequency localization operators :a geometric phase space approach,,,IEEE Transactions on Information Theory,1988, 34(4) =605-612.)等多種算法,但是這些算法都需要進行復雜度較高的優(yōu)化迭代運算。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服上述已有技術(shù)的不足,提供一種稀疏性強、稀疏分解效率高的基于自適應冗余字典的語音信號稀疏表示方法。本發(fā)明的目的可通過如下解決方案來達到一種基于自適應冗余字典的語音信號稀疏表示算法,包括步驟1)針對數(shù)字語音信號短時自相關(guān)函數(shù)具有指數(shù)衰減的特性,構(gòu)造基于K-L展開的自適應冗余字典;2)設(shè)計自適應冗余字典的語音信號稀疏表示算法;所述步驟1)中,假設(shè)連續(xù)實隨機過程{x(t),t e
}是二階矩過程,則其K-L
展開式為
權(quán)利要求
1. 一種基于自適應冗余字典的語音信號稀疏表示算法,其特征是包括步驟1)針對數(shù)字語音信號短時自相關(guān)函數(shù)具有指數(shù)衰減的特性,構(gòu)造基于K-L展開的自適應冗余字典;2)設(shè)計自適應冗余字典的語音信號稀疏表示算法;所述步驟1)中,假設(shè)連續(xù)實隨機過程lx(t),t e
}是二階矩過程,則其K-L展開式為其中,系數(shù)= f0x(typn(t)dt ;正交K-L基{%(/)}是自相關(guān)函數(shù)Rx(t,u)的特征函數(shù),和與之對應的特征值λ e R滿足Fredholm積分方程(O = j0 Rx (t, υ)φη(υ) υ于是,X (t)的N項近似式為雄)=;η=\由上述K-L展開定義可知,K-L展開的關(guān)鍵是獲得自相關(guān)函數(shù)的特征值和特征函數(shù);針對平穩(wěn)隨機過程的自相關(guān)函數(shù)在時延較小時較快衰減的特性,考慮指數(shù)衰減型自相關(guān)函數(shù) Rx(t,u) Zrx(O)eI^ul,其中參數(shù)μ反映了衰減速度和rx(0) = var(X(t)),并求解如下的 Fredholm積分方程λφ( ) = jlQRx(t^(u)du = rxJo' eMy(u)du + e"'^ ε-μ"φ(υ) υ)fl兀獲得一組正交特征函數(shù)組= —coS(n^)+Sm(n^Xne Z-{0};再加入=丨,構(gòu)建完備的自適應正交K-L基函數(shù)組£ = 他(0, eZ-{0}};。離散E中基函數(shù), 獲得自適應冗余字典左= {e。}uK,weZ+},其中en= [en(l),…,en(i), en(M)]T,(/■) = —cos( ) /) + sm( ) /) μ M-IM-I(i = 1,-,Μ)和 e0 = [1,"·,1]τ。所述步驟2)中,因為數(shù)字語音信號短時自相關(guān)函數(shù)具有指數(shù)衰減的特性,所以可以基于冗余字典#自適應選取K個原子對語音信號χ e Rm作非線性逼近^ = fKx=Yj α( Κ = Σ \x e"\e ,其中Card(IK) =K, α = [α (1),···,α (N) ]τ為分解系數(shù)向量;。保留α中絕對值最大的K個α (η) (η e Ικ),并令《( ) = O ( /J,可得到稀疏分解向量 和重構(gòu)語音信號^ =翻, 則逼近絕對誤差為& =\\x-FKx II2=II χ-Λ Il2。
全文摘要
一種基于自適應冗余字典的語音信號稀疏表示算法,包括步驟1)針對數(shù)字語音信號短時自相關(guān)函數(shù)具有指數(shù)衰減的特性,構(gòu)造基于K-L展開的自適應冗余字典;2)設(shè)計自適應冗余字典的語音信號稀疏表示算法。
文檔編號G10L19/00GK102332268SQ20111028366
公開日2012年1月25日 申請日期2011年9月22日 優(yōu)先權(quán)日2011年9月22日
發(fā)明者王天荊 申請人:王天荊