專利名稱:一種基于漢語言語測聽動態(tài)詞表的漢語言語自動測聽方法
技術(shù)領(lǐng)域:
本發(fā)明屬于言語測聽技術(shù)領(lǐng)域,涉及一種言語測聽動態(tài)詞表的設(shè)計方法和漢語言語測聽系統(tǒng)。所述的言語測聽動態(tài)詞表,是一種由指定長度的必測詞表和不定長度的隱含詞表組成的言語測聽詞表。所述的指定長度的必測詞表是指從語音文件的聲學(xué)特征的角度對聲韻母進(jìn)行聽感分類和清晰度計算,并以此為核心而編制的言語測聽詞表。所述的不定長度的隱含詞表是對必測詞表的擴(kuò)充,是指在測聽過程中,當(dāng)受試者對必測詞表項聽辨錯誤時所選擇的補(bǔ)充測試項的集合,所選擇的補(bǔ)充測試項與該必測詞表聽辨錯誤項的聲韻母屬于同一聲韻母分類。所述的漢語言語測聽系統(tǒng)是指存儲有多個等價的言語測聽動態(tài)詞表并通過隱含詞表項對必測詞表聽辨錯誤項進(jìn)行補(bǔ)償測試的言語測聽系統(tǒng),測聽過程能通過軟件系統(tǒng)自動化完成,相比傳統(tǒng)測聽系統(tǒng),具有更高的測試效率、測試信度和等價性。
背景技術(shù):
60年代中期,張家騄先生通過分析大量主觀聽辨測試結(jié)果,并依據(jù)音位平衡原則編制了 10張“語言清晰度測試音節(jié)表”,每張表75個單音節(jié)字,從主觀上研究了漢語的清晰度問題。21世紀(jì)初,從事言語測聽領(lǐng)域的研究者們基于上述清晰度測試音節(jié)表編制了多套言語測聽詞表,并用于言語測聽。言語測聽方法是基于言語測聽識別率來評價受試者聽力情況的方法。具體做法是先按照 一定原則制定統(tǒng)一的詞表,然后讓受試者聽完一個或多個詞表的所有項,記錄并統(tǒng)計所有聽辨正確的項,最終以正確項數(shù)與對應(yīng)一個或多個表中項的總數(shù)的比值,即言語識別率,作為最終聽力評價指標(biāo)。其中詞表的設(shè)計遵循三個原則挑常用字,考慮音位平衡,保證詞表間的等價性。詞表長度的發(fā)展趨勢是由長變短,先后設(shè)計了 75字/表、50字/表、25字/表和20字/表。但是,已有方法存在一些不足(I)詞表長度固定,詞表越長,測試時間越長,受試者疲勞,測試效率低,信度差;詞表越短,詞表間的等價性越低,測聽結(jié)果的離散度越大;(2)詞表設(shè)計未考慮語音聲學(xué)特征之間的差異,詞表在錄音中語音信號聲學(xué)特征(頻譜、音高、音長和能量)的變化會引起聽辨誤差;(3)已有測試方法未考慮到隨機(jī)性因素的干擾,比如受試者的情緒以及注意力不集中等因素的影響,最終會導(dǎo)致降低測試結(jié)果的信度。本發(fā)明從聲學(xué)特征的角度分別對韻母和聲母進(jìn)行了聽感分析。通過提取韻母線性預(yù)測編碼LPC譜,經(jīng)過層次聚類,最終對韻母進(jìn)行聽感上的分類。通過對聲母時域和頻域特征的分析,經(jīng)過層次聚類,最終對聲母進(jìn)行聽感上的分類,并提出了一種聲母清晰度計算方法?;谝陨下牳蟹治觯景l(fā)明提出了一種新的言語測聽動態(tài)詞表設(shè)計方法和漢語言語測聽系統(tǒng)。
發(fā)明內(nèi)容
本發(fā)明提出了一種言語測聽系統(tǒng),涉及一種言語測聽動態(tài)詞表的設(shè)計方法和漢語言語測聽系統(tǒng)。與已有方法相比,該方法主要有三個創(chuàng)新點(diǎn)1)在已有詞表設(shè)計方法的基礎(chǔ)上,以詞表錄音的聲學(xué)特征評估詞表的清晰度,以此編制的詞表具有高信度和高等價性;2)設(shè)計了動態(tài)詞表,詞表長度不再固定,從而在測試周期上能表現(xiàn)出更高的靈活性,同時能在保證較高信度的基礎(chǔ)上縮短測試時間,提高測試效率;3)設(shè)計的漢語言語測聽系統(tǒng)的測試方法可對聽辨錯誤項進(jìn)行補(bǔ)償,并設(shè)計了一套基于多維特征的計分規(guī)則,能提高測試結(jié)果的信度。該方法克服了已有言語測聽中測試周期與詞表長度之間難以平衡的矛盾以及測試信度偏低的缺陷,同時通過評估詞表清晰度及測試方法中對聽辨錯誤項的修正,提高測試結(jié)果的信度。其特征在于,是在一個漢語言語測聽系統(tǒng)中依次按以下步驟實(shí)現(xiàn)的步驟(I),構(gòu)建一個包括中央處理器、鼠標(biāo)、鍵盤、圖形顯示器、外存設(shè)備和聽力計的漢語言語測聽系統(tǒng),所述中央處理器的各輸入端分別與所述鍵盤、鼠標(biāo)及聽力計的輸出端相連,所述聽力計的輸入端與揚(yáng)聲器的輸出端相連,所述中央處理器的各其他輸出/輸入端與圖形顯示器和外存設(shè)備分別互連;步驟(2),在所述中央處理器中,依次按以下步驟構(gòu)造一個漢語普通話言語測聽動態(tài)詞表,其中包括一個指定長度的必測詞表和·一個不定長度的隱含詞表步驟(2. 1),依次按以下步驟構(gòu)造一個所述的指定長度的必測詞表步驟(2.1. 1),選擇測試文件方式的測試項,每個所述測試項在漢語口語交流中出現(xiàn)的頻次都排名在前2000以內(nèi),所述測試項的集合要覆蓋漢語普通話所有聲韻調(diào)的組合,并為每個所述測試項錄制成一個相應(yīng)語音文件;步驟(2.1. 2),對步驟(2.1.1)得到的語音文件分別標(biāo)注每個音節(jié)中聲母和韻母的起始位置,并把聲母部分的語音信號重新存儲為一個聲母語音文件,把韻母部分的語音信號重新存儲為一個韻母語音文件;步驟(2.1. 3),依次按以下步驟在聽感上對聲母進(jìn)行分類步驟(2.1. 3. 1),按以下步驟從步驟(2.1. 2)得到的聲母語音文件中提取如下所述聲學(xué)特征參數(shù)聲母過零率參數(shù)ZCR、聲母MFCC參數(shù)M以及聲母Bark頻帶能量比率參數(shù)
所述的ZCR,M及4是按照以下步驟得到的步驟(2. 1.3.1. 1),所述的聲母過零率參數(shù)ZCR按以下公式計算
權(quán)利要求
1. 一種基于漢語言語測聽動態(tài)詞表的漢語言語自動測聽方法,其特征在于,是在一個漢語言語測聽系統(tǒng)中依次按以下步驟實(shí)現(xiàn)的 步驟(I),構(gòu)建一個包括中央處理器、鼠標(biāo)、鍵盤、圖形顯示器、外存設(shè)備和聽力計的漢語言語測聽系統(tǒng),所述中央處理器的各輸入端分別與所述鍵盤、鼠標(biāo)及聽力計的輸出端相連,所述聽力計的輸入端與揚(yáng)聲器的輸出端相連,所述中央處理器的各其他輸出/輸入端與圖形顯示器和外存設(shè)備分別互連; 步驟(2),在所述中央處理器中,依次按以下步驟構(gòu)造一個漢語普通話言語測聽動態(tài)詞表,其中包括一個指定長度的必測詞表和一個不定長度的隱含詞表 步驟(2. 1),依次按以下步驟構(gòu)造一個所述的指定長度的必測詞表 步驟(2.1. 1),選擇測試文件方式的測試項,每個所述測試項在漢語口語交流中出現(xiàn)的頻次都排名在前2000以內(nèi),所述測試項的集合要覆蓋漢語普通話所有聲韻調(diào)的組合,并為每個所述測試項錄制成一個相應(yīng)語音文件; 步驟(2.1. 2),對步驟(2.1.1)得到的語音文件分別標(biāo)注每個音節(jié)中聲母和韻母的起始位置,并把聲母部分的語音信號重新存儲為一個聲母語音文件,把韻母部分的語音信號重新存儲為一個韻母語音文件; 步驟(2.1. 3),依次按以下步驟在聽感上對聲母進(jìn)行分類 步驟(2.1. 3. 1),按以下步驟從步驟(2.1. 2)得到的聲母語音文件中提取如下所述聲學(xué)特征參數(shù)聲母過零率參數(shù)ZCR、聲母MFCC參數(shù)M以及聲母Bark頻帶能量比率參數(shù)B,,所述的ZCR,M及4是按照以下步驟得到的 步驟(2.1. 3.1.1 ),所述的聲母過零率參數(shù)ZCR按以下公式計算
全文摘要
一種基于漢語言語測聽動態(tài)詞表的漢語言語自動測聽方法屬于言語測聽技術(shù)領(lǐng)域,其特征在于使用一種由指定長度的必測詞表和不定長度的隱含詞表組成的言語測聽詞表。必測詞表是指從語音文件的聲學(xué)特征的角度對聲韻母進(jìn)行聽感分類和清晰度計算,并以此為核心而編制的言語測聽詞表。隱含詞表是對必測詞表的擴(kuò)充,是受試者對必測詞表項聽辨錯誤時所選擇的補(bǔ)充測試項的集合,補(bǔ)充測試項與該必測詞表聽辨錯誤項的聲韻母屬于同一聲韻母分類。從而組成多個等價的言語測聽動態(tài)詞表并通過隱含詞表項對必測詞表聽辨錯誤項進(jìn)行補(bǔ)償測試的言語測聽軟件,測聽過程在一個漢語言語測聽系統(tǒng)中通過軟件系統(tǒng)自動化完成,相比傳統(tǒng)測聽系統(tǒng),具有更高的測試效率、測試信度和等價性。
文檔編號A61B5/12GK103054586SQ20121054915
公開日2013年4月24日 申請日期2012年12月17日 優(yōu)先權(quán)日2012年12月17日
發(fā)明者田業(yè), 賈珈, 蔡蓮紅 申請人:清華大學(xué)