欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于輸出的客觀語音質量評估的方法

文檔序號:2828056閱讀:296來源:國知局
一種基于輸出的客觀語音質量評估的方法
【專利摘要】一種基于輸出的客觀語音質量評估的方法,其步驟如下:首先提取干凈語音的非均勻線形預測倒譜系數(shù)用來對GMM-HMM模型進行訓練,通過訓練給干凈語音建立參考模型;然后由所述參考模型和失真語音的非均勻線形預測倒譜系數(shù)向量可以得到它們之間的一致性測度;最后,通過多元非線性回歸模型建立主觀MOS分和一致性測度之間的映射關系,可以得到對MOS分的客觀預測模型,通過所述客觀預測模型進行語音質量的客觀評價。本發(fā)明建立主觀MOS分和客觀測度之間的映射關系,得到對主觀MOS分的預測模型,使得分更接近主觀質量。
【專利說明】一種基于輸出的客觀語音質量評估的方法

【技術領域】
[0001] 本發(fā)明涉及語音信號處理【技術領域】,具體為一種基于輸出的客觀語音質量評估的 方法。

【背景技術】
[0002] 語音質量客觀評價從評價方法上可分為侵入式(intrusive)和非侵入式 (non-intrusive)。侵入式的評價通常也被稱為雙端或基于輸入-輸出的評價,它是以語音 系統(tǒng)的輸入信號和輸出信號之間的誤差大小來判斷語音質量的好壞,通過提取兩端語音信 號的特征參量來建立評價模型。非侵入式的評價也被稱為單端或基于輸出的評價,它僅根 據(jù)語音系統(tǒng)的輸出信號來進行質量評價?;谳斎?輸出的評價,在評價語音質量時必須 要有原始語音。而在實際應用中,某些場合中難以或者不便于采集到原始語音材料。因此, 對該的語音材料的評估需要有一種科學客觀的語音質量評估方法。
[0003] 在客觀語音質量評估中,選擇特征參數(shù)是至關重要的,它影響著評估系統(tǒng)的性能。 由于人耳對聲音的感知特性并不是以線性頻率為尺度來變化的,而是用稱之為巴克的臨界 頻帶的一系列有限頻段來表達。故一般在特征參數(shù)提取時要通過頻譜彎折來實現(xiàn)對人的聽 覺特性的模擬。如在MFCC參數(shù)時,將頻譜轉化為基于Mel評標的非線性頻譜。帶寬類似人 耳聽覺臨界譜帶的濾波器組來實現(xiàn)頻譜彎折。而PLP參數(shù)將頻域劃分為22個頻帶,取中間 20個頻帶。將每個頻帶內的能量譜與知覺驅動的加權重函數(shù)相乘得到臨界聽覺譜帶,以此 實現(xiàn)頻譜彎折。顯然在上面兩種特征參數(shù)提取時,線性頻率和彎曲頻率間的變換計算量是 比較大的。


【發(fā)明內容】

[0004] 本申請的目的在于克服現(xiàn)有技術的不足,提供一種基于輸出的客觀語音質量評估 的方法,這種方法在評估時不需要原始語音,通過結合非均勻線性預測倒譜系數(shù)和GMM-HMM 的語音質量客觀評估方法,建立主觀MOS分和客觀測度之間的映射關系,得到對主觀MOS分 的預測模型,從而可以用來客觀評價編碼或經信道傳輸后的語音質量。
[0005] 為了達到上述目的,本發(fā)明的技術方案如下:
[0006] -種基于輸出的客觀語音質量評估的方法,其步驟如下:
[0007] 首先提取干凈語音的非均勻線形預測倒譜系數(shù)用來對GMM-HMM模型進行訓練,通 過訓練給干凈語音建立參考模型;
[0008] 然后由所述參考模型和失真語音的非均勻線形預測倒譜系數(shù)向量可以得到它們 之間的一致性測度;
[0009] 最后,通過多元非線性回歸模型建立主觀MOS分和一致性測度之間的映射關系, 可以得到對MOS分的客觀預測模型,通過所述客觀預測模型進行語音質量的客觀評價。
[0010] 進一步,所述非均勻線形預測倒譜系數(shù)為5階的非均勻感知線性預測倒譜(NLPC) 的特征參數(shù),其處理步驟如下:
[0011] 1、預處理,在提取NLPC參數(shù)前要進行預處理,預處理包括預加重,分幀和加窗:
[0012] (1)預加重,所述預加重用具有6dB/倍頻程的提升高頻特性的數(shù)字濾波器來實 現(xiàn),其傳遞函數(shù)為:
[0013] H(Z)=I-μ Z-1 (1)
[0014] 其中μ為預加重系數(shù),可取為1或比1稍小的值,一般取μ = 0. 95 ;
[0015] (2)分巾貞,將語音信號劃分為一個一個的短時段,每一短時段稱為一巾貞,每一巾貞的 長度為l〇-3〇ms,所述分幀為交疊分段的方法,即每一幀的幀尾與下一幀的幀頭是重疊的;
[0016] (3)加窗,設巾貞信號為x(n),窗函數(shù)為w(n),貝U加窗后的信號y(n)為:
[0017] y (n) = x (n) w (η), 0 ^ n ^ N-I (2)
[0018] 其中,N為每幀的取樣點數(shù),所述窗函數(shù)是Hamming窗,即升余弦窗:
[0019] w (η) = 0. 54-0. 46cos [2 n n/ (N-I) ], 0 ^ η ^ N-I (3)
[0020] 2、基于Bark雙線性變換的頻譜彎折,設線性頻域為Z平面,彎曲頻域為1平面,則 選擇三個特殊的點(^ i,Z1)、( ^ 2, Z2)和(^ 3, Z3),通過一階雙線性變換可以確定Z平面和 1平面的映射關系:

【權利要求】
1. 一種基于輸出的客觀語音質量評估的方法,其步驟如下: 首先提取干凈語音的非均勻線形預測倒譜系數(shù)用來對GMM-HMM模型進行訓練,通過訓 練給干凈語音建立參考模型; 然后由所述參考模型和失真語音的非均勻線形預測倒譜系數(shù)向量可以得到它們之間 的一致性測度; 最后,通過多元非線性回歸模型建立主觀MOS分和一致性測度之間的映射關系,可以 得到對MOS分的客觀預測模型,通過所述客觀預測模型進行語音質量的客觀評價。
2. 根據(jù)權利要求1所述的一種基于輸出的客觀語音質量評估的方法,其特征在于:所 述非均勻線形預測倒譜系數(shù)為5階的非均勻感知線性預測倒譜(NLPC)的特征參數(shù),其處理 步驟如下: 一) 預處理,在提取NLPC參數(shù)前要進行預處理,預處理包括預加重,分幀和加窗: (1) 預加重,所述預加重用具有6dB/倍頻程的提升高頻特性的數(shù)字濾波器來實現(xiàn),其 傳遞函數(shù)為: H(z) = I-u Z-1 (1) 其中U為預加重系數(shù),可取為1或比1稍小的值,一般取U = 0. 95 ; (2) 分巾貞,將語音信號劃分為一個一個的短時段,每一短時段稱為一巾貞,每一巾貞的長度 為10-30ms,所述分幀為交疊分段的方法,即每一幀的幀尾與下一幀的幀頭是重疊的; (3) 加窗,設巾貞信號為x(n),窗函數(shù)為w(n),則加窗后的信號y(n)為: y (n) = X (n) w (n), 0 ^ n ^ N-I (2) 其中,N為每幀的取樣點數(shù),所述窗函數(shù)是Hamming窗,即升余弦窗:w (n) = 0. 54-0. 46cos [2 n n/ (N-I) ], 0 ^ n ^ N-I (3) 二) 基于Bark雙線性變換的頻譜彎折,設線性頻域為z平面,彎曲頻域為1平面,則選 擇三個特殊的點^,^ )、(G,4)和(G,A),通過一階雙線性變換可以確定z平面和1平面的 映射關系:
考慮到線性頻域和Bark譜域的特點,則取A = A =1,& =幻,可以得到下式:
其中z和to為復數(shù),常數(shù)P為彎折系數(shù),且0 < P < 1 ;顯然式(7-4)為全通系統(tǒng),它 將z平面的單位圓映射為$平面的單位圓;在進行頻譜彎折時,z為線性頻域,為Bark譜 域,則有Z = f 故彎曲頻率0可以由下式求出:
若原始系統(tǒng)具有截止頻率為的分段恒定低通頻率響應,經過雙線性變換,系統(tǒng)將同 樣具有類似的截止頻率為e p的低通響應,P、和e p滿足如下公式:
對P的優(yōu)化取決于語音信號的采樣頻率fs,本方法采用的P的優(yōu)化形式:
三)非均勻線性預測倒譜的特征參數(shù)提取,非均勻線性預測倒譜特征參數(shù)的計算步驟 如下: 1) 通過每幀語音信號,采用P階線性預測分析計算出聲道全極點傳輸函數(shù)H(Z)
式中G為增益常數(shù),ak為第k階線性預測參數(shù),取p = 12 ; 2) 對向量a(n) = [1,-&1,…_ap]進行DFT變換得到A(eiu);在A(e iu)上非均勻取M 個點,則有
其中9 k為利用雙線性變換逼近的巴克頻率刻度,它與原始線性頻率 間的關系為:

其中P是由采樣頻率決定的頻率彎折因子,考慮Bark譜域有22個頻帶,本發(fā)明中M 取為88 ; 3) 彎折后的LPC譜為
用q階AR模型來逼近汽幻得到聲道時域相應的自相關函數(shù):
4) 根據(jù)萊文遜-德賓(Levinson-Durbin)算法,從r(n)可以求得一組新的線性預測系 數(shù)毛,n = 〇,l,…,q,根據(jù)式(7-14)可以由線性預測系數(shù)毛得出倒譜系數(shù)Cn,該參數(shù)即為 NLPC參數(shù): C1 = ax
3.根據(jù)權利要求2所述的一種基于輸出的客觀語音質量評估的方法,其特征在于:所 述參考語音模型是通過采用HMM模型對特征向量進行分類,然后通過GMM對每一類特征向 量建模,其方法如下: 一)基于GMM-HMM的語音建模和訓練,設觀測的特征向量序列為O = 〇1,〇2,…,〇T,該序 列的狀態(tài)模型序列為S = Sl,S2,…,sN,則該序列的HMM模型可表示為: 入=(ji,A,B) (15) 其中,31 = {31 i = P(Sl = i), i = 1,2,…,N}為初始狀態(tài)概率矢量;A = {aij}為狀 態(tài)間跳轉的轉移概率矩陣,為從狀態(tài)i跳轉到狀態(tài)j的概率;B = Ibi (ot) = P (ot I St = i),2彡i彡N-1}為狀態(tài)的輸出概率分布集; 對連續(xù)HMM模型,觀測序列為連續(xù)信號,其與狀態(tài)j對應的信號空間用M個混合高斯密 度函數(shù)的和來表示:
其中,(?表示狀態(tài)j的第k個高斯混合密度函數(shù)的系數(shù);是高斯密度函數(shù)的均值 向量;為協(xié)方差矩陣,D為觀測序列0的維數(shù);HMM參數(shù)可以觀測序列0 = 〇1,〇2,…,〇T估 計得到,估計的目標是使模型與訓練數(shù)據(jù)的似然函數(shù)P(〇| A)最大化來估計最新的A,即 使afgI .這可以采用碰算法來實現(xiàn),所述碰算法包含兩部分:前向后向概率計 算和HMM參數(shù)及高斯混合參數(shù)的再估計; 上述似然函數(shù)P (〇| A )的前向概率計算公式如下:
MT) = 1,K i < N
對給定觀測序列〇 = 〇1,〇2,…,〇T通過重估計得到最新的A,在此定義Mi,j)為t 時刻狀態(tài)為Si且t+1時刻狀態(tài)為的概率,可由下式得到
在給定模型A和觀測序列0的條件下,狀態(tài)Si在時刻t的后驗概率為
在t時刻狀態(tài)j第k個高斯混合分量的參數(shù)cjk,y jk和Cjk可以由下列式子重新估計:
其中,Yt (j,k)表示在t時刻狀態(tài)j第k個高斯混合分量的概率,可由下式得到
二)基于多元非線性自回歸分析的MOS分預測,在對參考語音建模及訓練后,對失真 語音的特征向量序列Q 可以由Viterbi譯碼算法計算其狀態(tài)模型序列
同時也可得到第i幀的失真語音特征向量序列' 處于對應狀態(tài)模型A的概率 /-"h. I氣}其中s = Sl,S2,…,Sn,當所有失真語音特征向量序列的狀態(tài)模型確定 ^ 1 , 后,此段語音中所有處于狀態(tài)模型Si的語音幀數(shù)由%,可以計算出來,狀態(tài)模型Si下參考語 音參數(shù)模型與失真語音參數(shù)向量的一致性測度的計算公式如下:
其中%是處于狀態(tài)模型Si的第j個失真語音參數(shù)向量,Ci表示處于狀態(tài)模型Si語音 幀的一致性測度,其值越大表示失真語音與參考語音一致性越好,對每一類狀態(tài)模型的失 真語音幀都計算出其一致性測度,然后通過MOS映射來得到最終對失真語音MOS分的預測 值; 求出每一類語音幀的一致性測度后可以用一種函數(shù)映射關系來表示一致性測度與MOS 分的映射關系: MOS = f(c))+£ (3〇) 其中,f(*)為預測函數(shù),它可以是線性或非線性回歸關系,也可以是多項式擬合關系; e為預測方差;MOS是通過f(_)預測出的MOS分,假定MOS分映射關系f(*)為非線性 關系,通過多元非線性回歸模型來建立; 主觀MOS分與一致性測度間的映射關系f( ?)的非線性關系可用如下多元非線性回歸 模型描述:
其中,4表不處于狀態(tài)模型Si語音巾貞的一致性測度Ci的k次方;令<^_ = %,則上述多 元非線性回歸模型可以轉化為多元線性回歸模型,即
其中,f(1) (Ci),f(2) (Ci),…,f(n) (Ci)表示1,2,…,n個觀測值;矩陣C中各元素的上標代 表各模型一致性測度的1,2,…,n個觀測值; 根據(jù)最小二乘法原理,回歸系數(shù)的估計值應滿足
式中,C是n行(NXK+1)列的矩陣;N為HMM參考模型的個數(shù);K為多項式的階數(shù); (NXK+1)表示多元非線性回歸模型轉化為多元線性回歸模型的變量數(shù);所述觀測值的個 數(shù)n要大于變量數(shù),所述矩陣C是行滿秩矩陣,Ct是列滿秩矩陣,根據(jù)矩陣的秩的性質有 R(C) = R(Ct) = R(CtC) (37) 矩陣CtC是滿秩矩陣,即對稱矩陣CtC可逆,從而(C1Cr1存在,P的最小二乘估計擇為 P = (CrC)-1CrF (38) 對式(38)根據(jù)最小二乘法進行求解,便可求得回歸系數(shù)。
【文檔編號】G10L25/60GK104361894SQ201410696593
【公開日】2015年2月18日 申請日期:2014年11月27日 優(yōu)先權日:2014年11月27日
【發(fā)明者】李慶生, 劉良江, 卞昕, 柏文琦, 周鑫, 彭正梁, 徐昱 申請人:湖南省計量檢測研究院, 中國計量科學研究院
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
建宁县| 江川县| 六枝特区| 阜宁县| 南京市| 高邑县| 新疆| 南康市| 镇沅| 绥棱县| 罗源县| 潜山县| 白城市| 洛浦县| 南丰县| 延安市| 上饶县| 高清| 门源| 清徐县| 安阳市| 峨眉山市| 潞城市| 四子王旗| 廉江市| 南开区| 白朗县| 乌鲁木齐市| 扎兰屯市| 林芝县| 清流县| 田林县| 茌平县| 育儿| 汽车| 阿坝县| 大冶市| 长岛县| 高阳县| 梧州市| 宁乡县|