語音的失真大小。定義偽參 考語音第η帖在第1個美爾頻帶上的第一人耳聽覺響度為Lni(l),偽劣化語音的第η帖在第1 個美爾頻帶上的第二人耳聽覺響度為Ln2(l);則偽參考語音的第η帖第一人耳聽覺響度與偽 劣化語音的第η帖人耳聽覺響度距離為:
其中1為美爾頻帶 總數(shù);第一人耳聽覺響度與第二人耳聽覺響度的平均人耳聽覺響度距離為
其中,Ν為信號總帖數(shù),Εη為第η帖的能量。二、采用多組已知M0S值的語音樣本進(jìn)行測試,計 算得出該多組語音樣本所對應(yīng)的平均人耳聽覺響度距離,并對該每組語音樣本所對應(yīng)的平 均人耳聽覺響度距離按最小二乘法準(zhǔn)則進(jìn)行二次多項式擬合得到評估中間值計算公式。將 每一組RTP分組流所對應(yīng)的平均人耳聽覺響度距離代入所述評估中間值計算公式,計算得 出每組RTP分組流的評估中間值。
[0102] 本實施例中所述重構(gòu)單元131,具體還用于根據(jù)每一有效載荷信息,將相應(yīng)的RTP 分組流的偽參考語音中的有效載荷替換為所述RTP分組流當(dāng)前的有效載荷,生成所述偽劣 化語音。
[0103] 參見圖7,圖7為本發(fā)明網(wǎng)絡(luò)電話語音質(zhì)量客觀評估處理的裝置100-實施例的另 一功能模塊示意圖。本實施例中,所述的網(wǎng)絡(luò)電話語音質(zhì)量客觀評估處理的裝置100還包 括:預(yù)處理模塊160。所述預(yù)處理模塊160,用于將每一組RTP分組流相應(yīng)的偽參考語音和偽 劣化語音的電平值調(diào)整至設(shè)定值;W及采用時間對齊函數(shù),補(bǔ)償每一組RTP分組流相應(yīng)的偽 劣化語音的延遲時間,得到每組RTP分組流對應(yīng)的預(yù)處理后的偽參考語音和偽劣化語音。
[0104] 本實施例中,所述計算單元132,具體用于對所述RTP分組流對應(yīng)的偽參考語音和 偽劣化語音分別進(jìn)行加漢寧窗的FFT變換處理,得到第一信號功率譜Pi(w)和第二信號功率 譜P2(w);分別對所述第一信號功率譜Pi(w)、所述第二信號功率譜Pi(w)進(jìn)行等響度預(yù)加重 及SNR加權(quán)處理,得到第一感知功率譜扣i(w)和第二感知功率譜Pe2(w);分別對所述第一感 知功率譜扣i(w)、所述第二感知功率譜扣2(W)進(jìn)行臨界帶譜映射處理,得到第一臨界帶功率 譜扣B1(W)、第二臨界帶功率譜扣B2(W);分別對第一臨界帶功率譜扣B1(W)、第二臨界帶功率譜 PeB2(W)進(jìn)行離散余弦變換處理,得到第一感知功率譜倒譜系數(shù)和第二感知功率譜倒譜系 數(shù);分別對所述第一感知功率譜倒譜系數(shù)和第二感知功率譜倒譜系數(shù)進(jìn)行聽覺響度變換處 理,得到所述第一人耳聽覺響度和所述第二人耳聽覺響度。其中,所述偽參考語音和偽劣化 語音為預(yù)處理后的偽參考語音和偽劣化語音。
[0105] 本發(fā)明提出網(wǎng)絡(luò)電話語音質(zhì)量客觀評估處理的裝置另一實施例,參見圖8,圖8為 本發(fā)明的網(wǎng)絡(luò)電話語音質(zhì)量客觀評估處理的裝置另一實施例的功能模塊示意圖。本實施例 所提供的網(wǎng)絡(luò)電話語音質(zhì)量客觀評估處理的裝置100在上述實施例的基礎(chǔ)上還包括:第一 解碼模塊170、第二獲取模塊180、第一計算模塊190、評估模塊101。其中所述第一解碼模塊 170,用于獲取第一RTP分組流,對所述第一RTP分組流解碼,獲得對應(yīng)的第一劣化語音和第 一有效載荷信息。所述第一獲取模塊180,用于獲取所述第一劣化語音的第一必要語音參 數(shù)。所述第一計算模塊190,用于根據(jù)所述第一有效載荷信息和所述第一RTP分組流的第一 偽參考語音,計算所述第一 RTP分組流的第一評估中間值。所述評估模塊101,用于調(diào)用所述 計算函數(shù),根據(jù)所述第一必要語音參數(shù)和所述第一評估中間值,計算所述第一 RTP分組流的 語音質(zhì)量客觀評估值。
[0106] 其中,所述第一必要語音參數(shù)包括:語音電平SpeechLevel、局部樣點(diǎn)的距離均值 LocalMeanDistSamp、全局背景噪聲GlobalBGNoise、局部背景噪聲LocalBGNoise、基因周期 互功率PitchCross化wer、倒譜偏態(tài)CepSkew、線性預(yù)測系數(shù)峰態(tài)LPCCurt、局部背景噪聲平 均能量1^)。日1136齡13日1日日]1、帖重復(fù)率化日111日1?巧日日13、機(jī)械性噪聲冊日6口3。
[0107] 本實施例中,所述評估模塊101,具體用于將所述第一必要語音參數(shù)和所述第一評 估中間值代入所述計算函數(shù),計算得出的結(jié)果即為所述第一 RTP分組流的語音質(zhì)量客觀評 估值。
[0108] 參見圖9,圖9為圖8中的第一計算模塊的具體細(xì)化功能模塊示意圖。所述第一計算 模塊190包括:第一重構(gòu)單元191和第一計算單元192。其中,所述第一重構(gòu)單元191,用于根 據(jù)所述第一有效載荷信息,對所述第一 RTP分組流的第一偽參考語音重構(gòu),生成第一偽劣化 語音。所述第一計算單元192,用計算所述第一偽參考語音的第1人耳聽覺響度、第一偽劣化 語音的第2人耳聽覺響度,根據(jù)所述第1、2人耳聽覺響度,計算第一評估中間值。
[0109] 其中,所述第一重構(gòu)單元191,具體用于根據(jù)所述第一有效載荷信息,將所述第一 RTP分組流的偽參考語音中的有效載荷替換為所述第一 RTP分組流當(dāng)前的有效載荷,生成所 述第一偽劣化語音。
[0110] 參見圖10,圖10為本發(fā)明的網(wǎng)絡(luò)電話語音質(zhì)量客觀評估處理的裝置另一實施例另 一功能模塊示意圖。所述網(wǎng)絡(luò)電話語音質(zhì)量客觀評估處理的裝置100還包括:第一預(yù)處理模 塊102。所述第一預(yù)處理模塊102,用于將所述第一偽參考語音和第一偽劣化語音的電平值 調(diào)整至設(shè)定值;采用時間對齊函數(shù),補(bǔ)償所述第一偽劣化語音的延遲時間,得到所述第一 RTP分組流對應(yīng)的預(yù)處理后的第一偽參考語音和第一偽劣化語音。
[0111] 本實施例中,所述第一計算單元192,具體用于對所述第一偽參考語音和第一偽劣 化語音分別進(jìn)行加漢寧窗的FFT變換處理,得到第1信號功率譜P〇)(w)和第2信號功率譜P@ (W);分別對所述第1信號功率譜化(W)、所述第2信號功率譜P@(w)進(jìn)行等響度預(yù)加重及SNR 加權(quán)處理,得到第1感知功率譜Pe?(w)和第2感知功率譜Pe2(w);分別對所述第1感知功率譜 P曬(W)、所述第2感知功率譜P蹈)(w)進(jìn)行臨界帶譜映射處理,得到第1臨界帶功率譜扣⑩(W)、 第2臨界帶功率譜扣昭(W);分別對第1臨界帶功率譜扣曬(W)、第2臨界帶功率譜扣昭(W)進(jìn)行 離散余弦變換處理,得到第1感知功率譜倒譜系數(shù)和第2感知功率譜倒譜系數(shù);分別對所述 第1感知功率譜倒譜系數(shù)和第2感知功率譜倒譜系數(shù)進(jìn)行聽覺響度變換處理,得到所述第1 人耳聽覺響度和所述第2人耳聽覺響度。其中所述第一偽參考語音和第一偽劣化語音為預(yù) 處理后的第一偽參考語音和第一偽劣化語音。
[0112] 上述網(wǎng)絡(luò)電話語音質(zhì)量客觀評估處理的裝置實施例,通過獲取多組RTP分組流,對 每組RTP分組流解碼,獲得對應(yīng)的劣化語音和有效載荷信息;獲取每組RTP分組流的劣化語 音的必要語音參數(shù);根據(jù)每一有效載荷信息和每組RTP分組流的偽參考語音,計算每組RTP 分組流的評估中間值;獲取所述多組RTP分組流的語音質(zhì)量主觀評估值;根據(jù)每組RTP分組 流對應(yīng)的所述必要語音參數(shù)、評估中間值、語音質(zhì)量主觀評估值,構(gòu)建RTP分組流的語音質(zhì) 量客觀評估的計算函數(shù)的方式,后續(xù)通過所述計算函數(shù)根據(jù)獲取的RTP分組流的必要語音 參數(shù)和評估中間值即可計算評估出所獲取的RTP分組流的語音質(zhì)量客觀評估值,適用于在 線網(wǎng)絡(luò)語音質(zhì)量評估場景,相比現(xiàn)有的語音質(zhì)量評估方式,數(shù)據(jù)計算量小,能夠滿足實時性 要求,語音質(zhì)量評價準(zhǔn)確度高。
[0113] W上僅為本發(fā)明的優(yōu)選實施例,并非因此限制本發(fā)明的專利范圍,凡是利用本發(fā) 明說明書及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效流程變換,或直接或間接運(yùn)用在其他相關(guān)的技 術(shù)領(lǐng)域,均同理包括在本發(fā)明的專利保護(hù)范圍內(nèi)。
【主權(quán)項】
1. 一種網(wǎng)絡(luò)電話語音質(zhì)量客觀評估處理的方法,其特征在于,所述語音質(zhì)量客觀評估 處理的方法包括: 獲取多組RTP(Theater Server protocol,實時傳輸協(xié)議)分組流,對每組RTP分組流解 碼,獲得對應(yīng)的劣化語音和有效載荷信息; 獲取每組RTP分組流的劣化語音的必要語音參數(shù); 根據(jù)每一有效載荷信息和每組RTP分組流的偽參考語音,計算每組RTP分組流的評估中 間值; 獲取所述多組RTP分組流的語音質(zhì)量主觀評估值; 根據(jù)每組RTP分組流對應(yīng)的所述必要語音參數(shù)、評估中間值、語音質(zhì)量主觀評估值,構(gòu) 建RTP分組流的語音質(zhì)量客觀評估的計算函數(shù);所述計算函數(shù)用于根