一種語(yǔ)音識(shí)別方法、裝置及語(yǔ)音控制系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于語(yǔ)音識(shí)別技術(shù)領(lǐng)域,具體地說(shuō),是涉及一種語(yǔ)音識(shí)別方法、語(yǔ)音識(shí)別裝 置以及語(yǔ)音控制系統(tǒng)。
【背景技術(shù)】
[0002] 語(yǔ)音識(shí)別技術(shù)是一種重要的人機(jī)交互手段,可以應(yīng)用在智能家電控制、工業(yè)現(xiàn)場(chǎng) 控制等多種場(chǎng)合。
[0003] 但現(xiàn)有的語(yǔ)音識(shí)別技術(shù)識(shí)別率較低,嚴(yán)重制約了語(yǔ)音識(shí)別技術(shù)的應(yīng)用。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明提供了一種語(yǔ)音識(shí)別方法,解決了現(xiàn)有技術(shù)中語(yǔ)音識(shí)別率低的問(wèn)題。
[0005] 為解決上述技術(shù)問(wèn)題,本發(fā)明采用下述技術(shù)方案予以實(shí)現(xiàn): 一種語(yǔ)音識(shí)別方法,包括下述步驟: 分別通過(guò)邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型中的任意兩個(gè)模型對(duì)語(yǔ)音 信號(hào)進(jìn)行識(shí)別,獲得兩個(gè)識(shí)別結(jié)果; 比較所述兩個(gè)識(shí)別結(jié)果是否相同; 若否,則通過(guò)第三個(gè)模型對(duì)所述語(yǔ)音信號(hào)進(jìn)行識(shí)別,獲得第三個(gè)識(shí)別結(jié)果;并比較第三 個(gè)識(shí)別結(jié)果與前兩個(gè)識(shí)別結(jié)果中的一個(gè)是否相同; 若是,則驗(yàn)證相同的識(shí)別結(jié)果是否為正確識(shí)別結(jié)果; 若是,則輸出該識(shí)別結(jié)果。
[0006] 進(jìn)一步的,當(dāng)驗(yàn)證出相同的識(shí)別結(jié)果不是正確識(shí)別結(jié)果時(shí),所述方法還包括: 判斷是否存儲(chǔ)該識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào); 若是,則存儲(chǔ)該識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)。
[0007] 又進(jìn)一步的,所述判斷是否存儲(chǔ)相同的識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)包括:判斷相同 的識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)連續(xù)收到次數(shù)是否大于等于設(shè)定次數(shù)。
[0008] 更進(jìn)一步的,所述存儲(chǔ)該識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)包括: 對(duì)語(yǔ)音信號(hào)的特征參數(shù)分別進(jìn)行邏輯回歸建模、深信度網(wǎng)絡(luò)建模、隱馬爾可夫建模,獲 得語(yǔ)音信號(hào)的邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型; 將語(yǔ)音信號(hào)的邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型進(jìn)行存儲(chǔ)。
[0009] 優(yōu)選的,采用支持向量機(jī)模型驗(yàn)證所述相同的識(shí)別結(jié)果是否為正確識(shí)別結(jié)果。 [0010] 一種語(yǔ)音識(shí)別裝置,所述裝置包括: 識(shí)別模塊,用于分別通過(guò)邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型對(duì)語(yǔ)音信號(hào) 進(jìn)行識(shí)別,獲得識(shí)別結(jié)果; 比較模塊,用于比較前兩個(gè)識(shí)別結(jié)果是否相同;以及在前兩個(gè)識(shí)別結(jié)果不同時(shí),比較第 三個(gè)識(shí)別結(jié)果是否與前兩個(gè)識(shí)別結(jié)果中的一個(gè)相同; 驗(yàn)證模塊,用于驗(yàn)證相同的識(shí)別結(jié)果是否為正確識(shí)別結(jié)果; 輸出模塊,用于輸出該識(shí)別結(jié)果。
[0011] 進(jìn)一步的,所述裝置還包括: 判斷模塊,用于判斷是否存儲(chǔ)相同的識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào); 存儲(chǔ)模塊,用于存儲(chǔ)相同的識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)。
[0012] 又進(jìn)一步的,所述判斷模塊具體用于判斷相同的識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)連續(xù)收 到次數(shù)是否大于等于設(shè)定次數(shù); 所述驗(yàn)證模塊,具體用于采用支持向量機(jī)模型驗(yàn)證相同的識(shí)別結(jié)果是否為正確識(shí)別結(jié) 果。
[0013] 再進(jìn)一步的,所述存儲(chǔ)模塊包括建模單元和存儲(chǔ)單元,其中, 所述建模單元,用于對(duì)語(yǔ)音信號(hào)的特征參數(shù)分別進(jìn)行邏輯回歸建模、深信度網(wǎng)絡(luò)建模、 隱馬爾可夫建模,獲得語(yǔ)音信號(hào)的邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型; 所述存儲(chǔ)單元,用于將語(yǔ)音信號(hào)的邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型進(jìn) 行存儲(chǔ)。
[0014] 基于上述語(yǔ)音識(shí)別裝置的設(shè)計(jì),本發(fā)明還提出了一種語(yǔ)音控制系統(tǒng),包括控制終 端、云端服務(wù)器、被控終端,所述云端服務(wù)器包括所述的語(yǔ)音識(shí)別裝置和主控裝置;所述語(yǔ) 音識(shí)別裝置包括:識(shí)別模塊,用于分別通過(guò)邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模 型對(duì)語(yǔ)音信號(hào)進(jìn)行識(shí)別,獲得識(shí)別結(jié)果;比較模塊,用于比較前兩個(gè)識(shí)別結(jié)果是否相同;以 及在前兩個(gè)識(shí)別結(jié)果不同時(shí),比較第三個(gè)識(shí)別結(jié)果是否與前兩個(gè)識(shí)別結(jié)果中的一個(gè)相同; 驗(yàn)證模塊,用于驗(yàn)證相同的識(shí)別結(jié)果是否為正確識(shí)別結(jié)果;輸出模塊,用于輸出該識(shí)別結(jié) 果;所述控制終端發(fā)送的語(yǔ)音信號(hào)傳輸至所述語(yǔ)音識(shí)別裝置,所述語(yǔ)音識(shí)別裝置對(duì)接收的 信號(hào)進(jìn)行處理后輸出識(shí)別結(jié)果至主控裝置,所述主控裝置根據(jù)接收到的識(shí)別結(jié)果生成控制 信號(hào),并發(fā)送至被控終端。
[0015]與現(xiàn)有技術(shù)相比,本發(fā)明的優(yōu)點(diǎn)和積極效果是:本發(fā)明的語(yǔ)音識(shí)別方法和裝置通 過(guò)采用邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型相結(jié)合的方法對(duì)語(yǔ)音信號(hào)進(jìn)行識(shí) 另IJ,克服了單獨(dú)使用一種模型時(shí)識(shí)別準(zhǔn)確率低的問(wèn)題,識(shí)別準(zhǔn)確率可提升至95%以上;采用 支持向量機(jī)模型驗(yàn)證識(shí)別結(jié)果是否正確,在驗(yàn)證出識(shí)別結(jié)果為錯(cuò)誤識(shí)別結(jié)果時(shí),可判斷是 否存儲(chǔ)該識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào),使裝置具有交互式學(xué)習(xí)的功能,提高了用戶(hù)使用滿(mǎn)意 度。本發(fā)明的語(yǔ)音控制系統(tǒng),實(shí)現(xiàn)了對(duì)被控終端的遠(yuǎn)程控制,減輕了被控終端的負(fù)載壓力, 用戶(hù)體驗(yàn)好。
[0016] 結(jié)合附圖閱讀本發(fā)明的【具體實(shí)施方式】后,本發(fā)明的其他特點(diǎn)和優(yōu)點(diǎn)將變得更加清 楚。
【附圖說(shuō)明】
[0017] 圖1是本發(fā)明提出的語(yǔ)音識(shí)別方法的一個(gè)實(shí)施例的流程圖; 圖2是圖1中部分步驟的流程圖; 圖3是本發(fā)明提出的語(yǔ)音識(shí)別裝置的一個(gè)實(shí)施例的結(jié)構(gòu)圖; 圖4是圖3中存儲(chǔ)模塊的結(jié)構(gòu)圖; 圖5是本發(fā)明提出的語(yǔ)音控制系統(tǒng)的一個(gè)實(shí)施例的結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0018]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下將結(jié)合附圖和實(shí)施例, 對(duì)本發(fā)明作進(jìn)一步詳細(xì)說(shuō)明。
[0019] 參見(jiàn)圖1所示,本實(shí)施例的語(yǔ)音識(shí)別方法的具體包括下述步驟: 步驟S10:語(yǔ)音信號(hào)輸入。
[0020] 步驟S11 :分別通過(guò)邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型中的任意兩 個(gè)模型對(duì)語(yǔ)音信號(hào)進(jìn)行識(shí)別,獲得兩個(gè)識(shí)別結(jié)果。
[0021] 識(shí)別過(guò)程具體包括下述步驟,參見(jiàn)圖2所示: 步驟S11-1:對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)處理。
[0022] 對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)處理主要包括依次對(duì)語(yǔ)音信號(hào)進(jìn)行采樣、去噪音、端點(diǎn)檢測(cè)、預(yù) 加重、加窗分幀等操作。
[0023]采樣,就是將模擬信號(hào)轉(zhuǎn)化為語(yǔ)音信號(hào)。由于原始語(yǔ)音信號(hào)是模擬信號(hào),通過(guò)采樣 處理,將模擬的語(yǔ)音信號(hào)轉(zhuǎn)化為數(shù)字化的語(yǔ)音信號(hào)。
[0024]去噪音,就是去除聲音中的一些無(wú)用信息,保證信號(hào)的質(zhì)量與速度。
[0025]端點(diǎn)檢測(cè),就是找到語(yǔ)音信號(hào)的首尾兩個(gè)端點(diǎn),一般采用兩級(jí)判斷法。
[0026]預(yù)加重,主要是為了加重語(yǔ)音信號(hào)的高頻部分,降低口唇對(duì)語(yǔ)音的影響。通常通過(guò) 一階高通數(shù)字濾波器來(lái)實(shí)現(xiàn),傳遞函數(shù)為其中α為預(yù)加重系數(shù),取值范 圍為 0.9-1. 0。
[0027]加窗分幀,用于將數(shù)字信號(hào)有限化。對(duì)語(yǔ)音信號(hào)進(jìn)行加窗分幀,將語(yǔ)音信號(hào)分成若 干個(gè)分析幀。本實(shí)施例采用漢明窗函數(shù)進(jìn)行加窗分幀。
[0028] 步驟S11-2 :提取語(yǔ)音信號(hào)的特征參數(shù)。
[0029]語(yǔ)音信號(hào)的特征參數(shù)非常多,為了提高識(shí)別率,本實(shí)施例分別從頻域、時(shí)域、對(duì)數(shù) 譜空間、倒譜空間去修正相應(yīng)參數(shù)。
[0030]步驟S11-3:匹配。
[0031] 將語(yǔ)音信號(hào)的特征參數(shù)分別與預(yù)先存儲(chǔ)的語(yǔ)音信號(hào)的邏輯回歸模型、深信度網(wǎng)絡(luò) 模型、隱馬爾可夫模型中的任意兩個(gè)模型進(jìn)行匹配,獲得兩個(gè)識(shí)別結(jié)果。
[0032]在本實(shí)施例中,將語(yǔ)音信號(hào)的特征參數(shù)分別與預(yù)先存儲(chǔ)的語(yǔ)音信號(hào)的邏輯回歸模 型、深信度網(wǎng)絡(luò)模型這兩個(gè)模型進(jìn)行匹配,獲得兩個(gè)識(shí)別結(jié)果。
[0033]語(yǔ)音信號(hào)的邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型預(yù)先存儲(chǔ)在模板庫(kù) 中。在模板庫(kù)中,事先存儲(chǔ)有多個(gè)語(yǔ)音信號(hào)的邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫 模型。存儲(chǔ)過(guò)程為:對(duì)語(yǔ)音信號(hào)的特征參數(shù)分別進(jìn)行邏輯回歸建模、深信度網(wǎng)絡(luò)建模、隱馬 爾可夫建模,獲得語(yǔ)音信號(hào)的邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型,并存儲(chǔ)在 模板庫(kù)中。
[0034]邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型的建模過(guò)程,以及語(yǔ)音信號(hào)分別 與邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型的匹配過(guò)程為現(xiàn)有技術(shù),具體可參見(jiàn)現(xiàn) 有技術(shù),此處不再贅述。
[0035] 步驟S12 :比較兩個(gè)識(shí)別結(jié)果是否相同。
[0036]若否,說(shuō)明兩個(gè)識(shí)別結(jié)果不相同,進(jìn)入步驟S13; 若是,說(shuō)明兩個(gè)識(shí)別結(jié)果相同,進(jìn)入步驟S15。
[0037] 步驟S13 :通過(guò)第三個(gè)模型對(duì)語(yǔ)音信號(hào)進(jìn)行識(shí)別,獲得第三個(gè)識(shí)別結(jié)果。
[0038] 在本實(shí)施例中,前兩個(gè)模型采用的是邏輯回歸模型、深信度網(wǎng)絡(luò)模型,第三個(gè)模型 采用的隱馬爾可夫模型。
[0039] 步驟S14 :比較第三個(gè)識(shí)別結(jié)果與前兩個(gè)識(shí)別結(jié)果中的一個(gè)是否相同。
[0040] 也就是說(shuō),判斷這三個(gè)識(shí)別結(jié)果中是否有兩個(gè)是相同的。
[0041] 若否,說(shuō)明這三個(gè)識(shí)別結(jié)果各不相同,返回步驟S10。
[0042] 若是,說(shuō)明第三個(gè)識(shí)別結(jié)果與前兩個(gè)識(shí)別結(jié)果中的一個(gè)是相同的,即三個(gè)識(shí)別結(jié) 果中有兩個(gè)是相同的,進(jìn)入步驟s15。
[0043] 步驟S15 :驗(yàn)證相同的識(shí)別結(jié)果是否為正確識(shí)別結(jié)果。
[0044] 在本實(shí)施例中,采用支持向量機(jī)模型驗(yàn)證相同的識(shí)別結(jié)果是否為正確識(shí)別結(jié)果。
[0045] 由于采用支持向量機(jī)驗(yàn)證識(shí)別結(jié)果為現(xiàn)有技術(shù),此處不再贅述。
[0046] 若否,說(shuō)明識(shí)別結(jié)果是錯(cuò)誤的,進(jìn)入步驟S16。
[0047] 若是,說(shuō)明識(shí)別結(jié)果是正確的,進(jìn)入步驟S18。
[0048] 步驟S16 :判斷是否存儲(chǔ)該識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)。
[0049] 若否,則不存儲(chǔ),返回步驟S10 ; 若是,則存儲(chǔ),進(jìn)入步驟S17。
當(dāng)前第1頁(yè)
1 
2