一種語(yǔ)音識(shí)別方法、裝置及語(yǔ)音控制系統(tǒng)的制作方法

文檔序號(hào)：9616940閱讀：685來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

一種語(yǔ)音識(shí)別方法、裝置及語(yǔ)音控制系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于語(yǔ)音識(shí)別技術(shù)領(lǐng)域，具體地說(shuō)，是涉及一種語(yǔ)音識(shí)別方法、語(yǔ)音識(shí)別裝置以及語(yǔ)音控制系統(tǒng)。
【背景技術(shù)】
[0002] 語(yǔ)音識(shí)別技術(shù)是一種重要的人機(jī)交互手段，可以應(yīng)用在智能家電控制、工業(yè)現(xiàn)場(chǎng) 控制等多種場(chǎng)合。
[0003] 但現(xiàn)有的語(yǔ)音識(shí)別技術(shù)識(shí)別率較低，嚴(yán)重制約了語(yǔ)音識(shí)別技術(shù)的應(yīng)用。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明提供了一種語(yǔ)音識(shí)別方法，解決了現(xiàn)有技術(shù)中語(yǔ)音識(shí)別率低的問(wèn)題。
[0005] 為解決上述技術(shù)問(wèn)題，本發(fā)明采用下述技術(shù)方案予以實(shí)現(xiàn)：一種語(yǔ)音識(shí)別方法，包括下述步驟：分別通過(guò)邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型中的任意兩個(gè)模型對(duì)語(yǔ)音信號(hào)進(jìn)行識(shí)別，獲得兩個(gè)識(shí)別結(jié)果；比較所述兩個(gè)識(shí)別結(jié)果是否相同；若否，則通過(guò)第三個(gè)模型對(duì)所述語(yǔ)音信號(hào)進(jìn)行識(shí)別，獲得第三個(gè)識(shí)別結(jié)果；并比較第三個(gè)識(shí)別結(jié)果與前兩個(gè)識(shí)別結(jié)果中的一個(gè)是否相同；若是，則驗(yàn)證相同的識(shí)別結(jié)果是否為正確識(shí)別結(jié)果；若是，則輸出該識(shí)別結(jié)果。
[0006] 進(jìn)一步的，當(dāng)驗(yàn)證出相同的識(shí)別結(jié)果不是正確識(shí)別結(jié)果時(shí)，所述方法還包括：判斷是否存儲(chǔ)該識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)；若是，則存儲(chǔ)該識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)。
[0007] 又進(jìn)一步的，所述判斷是否存儲(chǔ)相同的識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)包括：判斷相同的識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)連續(xù)收到次數(shù)是否大于等于設(shè)定次數(shù)。
[0008] 更進(jìn)一步的，所述存儲(chǔ)該識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)包括：對(duì)語(yǔ)音信號(hào)的特征參數(shù)分別進(jìn)行邏輯回歸建模、深信度網(wǎng)絡(luò)建模、隱馬爾可夫建模，獲得語(yǔ)音信號(hào)的邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型；將語(yǔ)音信號(hào)的邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型進(jìn)行存儲(chǔ)。
[0009] 優(yōu)選的，采用支持向量機(jī)模型驗(yàn)證所述相同的識(shí)別結(jié)果是否為正確識(shí)別結(jié)果。 [0010] 一種語(yǔ)音識(shí)別裝置，所述裝置包括：識(shí)別模塊，用于分別通過(guò)邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型對(duì)語(yǔ)音信號(hào) 進(jìn)行識(shí)別，獲得識(shí)別結(jié)果；比較模塊，用于比較前兩個(gè)識(shí)別結(jié)果是否相同；以及在前兩個(gè)識(shí)別結(jié)果不同時(shí)，比較第三個(gè)識(shí)別結(jié)果是否與前兩個(gè)識(shí)別結(jié)果中的一個(gè)相同；驗(yàn)證模塊，用于驗(yàn)證相同的識(shí)別結(jié)果是否為正確識(shí)別結(jié)果；輸出模塊，用于輸出該識(shí)別結(jié)果。
[0011] 進(jìn)一步的，所述裝置還包括：判斷模塊，用于判斷是否存儲(chǔ)相同的識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)；存儲(chǔ)模塊，用于存儲(chǔ)相同的識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)。
[0012] 又進(jìn)一步的，所述判斷模塊具體用于判斷相同的識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)連續(xù)收到次數(shù)是否大于等于設(shè)定次數(shù)；所述驗(yàn)證模塊，具體用于采用支持向量機(jī)模型驗(yàn)證相同的識(shí)別結(jié)果是否為正確識(shí)別結(jié) 果。
[0013] 再進(jìn)一步的，所述存儲(chǔ)模塊包括建模單元和存儲(chǔ)單元，其中，所述建模單元，用于對(duì)語(yǔ)音信號(hào)的特征參數(shù)分別進(jìn)行邏輯回歸建模、深信度網(wǎng)絡(luò)建模、隱馬爾可夫建模，獲得語(yǔ)音信號(hào)的邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型；所述存儲(chǔ)單元，用于將語(yǔ)音信號(hào)的邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型進(jìn) 行存儲(chǔ)。
[0014] 基于上述語(yǔ)音識(shí)別裝置的設(shè)計(jì)，本發(fā)明還提出了一種語(yǔ)音控制系統(tǒng)，包括控制終端、云端服務(wù)器、被控終端，所述云端服務(wù)器包括所述的語(yǔ)音識(shí)別裝置和主控裝置；所述語(yǔ) 音識(shí)別裝置包括：識(shí)別模塊，用于分別通過(guò)邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型對(duì)語(yǔ)音信號(hào)進(jìn)行識(shí)別，獲得識(shí)別結(jié)果；比較模塊，用于比較前兩個(gè)識(shí)別結(jié)果是否相同；以及在前兩個(gè)識(shí)別結(jié)果不同時(shí)，比較第三個(gè)識(shí)別結(jié)果是否與前兩個(gè)識(shí)別結(jié)果中的一個(gè)相同；驗(yàn)證模塊，用于驗(yàn)證相同的識(shí)別結(jié)果是否為正確識(shí)別結(jié)果；輸出模塊，用于輸出該識(shí)別結(jié) 果；所述控制終端發(fā)送的語(yǔ)音信號(hào)傳輸至所述語(yǔ)音識(shí)別裝置，所述語(yǔ)音識(shí)別裝置對(duì)接收的信號(hào)進(jìn)行處理后輸出識(shí)別結(jié)果至主控裝置，所述主控裝置根據(jù)接收到的識(shí)別結(jié)果生成控制信號(hào)，并發(fā)送至被控終端。
[0015]與現(xiàn)有技術(shù)相比，本發(fā)明的優(yōu)點(diǎn)和積極效果是：本發(fā)明的語(yǔ)音識(shí)別方法和裝置通過(guò)采用邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型相結(jié)合的方法對(duì)語(yǔ)音信號(hào)進(jìn)行識(shí) 另IJ，克服了單獨(dú)使用一種模型時(shí)識(shí)別準(zhǔn)確率低的問(wèn)題，識(shí)別準(zhǔn)確率可提升至95%以上；采用支持向量機(jī)模型驗(yàn)證識(shí)別結(jié)果是否正確，在驗(yàn)證出識(shí)別結(jié)果為錯(cuò)誤識(shí)別結(jié)果時(shí)，可判斷是否存儲(chǔ)該識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)，使裝置具有交互式學(xué)習(xí)的功能，提高了用戶(hù)使用滿(mǎn)意度。本發(fā)明的語(yǔ)音控制系統(tǒng)，實(shí)現(xiàn)了對(duì)被控終端的遠(yuǎn)程控制，減輕了被控終端的負(fù)載壓力，用戶(hù)體驗(yàn)好。
[0016] 結(jié)合附圖閱讀本發(fā)明的【具體實(shí)施方式】后，本發(fā)明的其他特點(diǎn)和優(yōu)點(diǎn)將變得更加清楚。
【附圖說(shuō)明】
[0017] 圖1是本發(fā)明提出的語(yǔ)音識(shí)別方法的一個(gè)實(shí)施例的流程圖；圖2是圖1中部分步驟的流程圖；圖3是本發(fā)明提出的語(yǔ)音識(shí)別裝置的一個(gè)實(shí)施例的結(jié)構(gòu)圖；圖4是圖3中存儲(chǔ)模塊的結(jié)構(gòu)圖；圖5是本發(fā)明提出的語(yǔ)音控制系統(tǒng)的一個(gè)實(shí)施例的結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0018]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白，以下將結(jié)合附圖和實(shí)施例，對(duì)本發(fā)明作進(jìn)一步詳細(xì)說(shuō)明。
[0019] 參見(jiàn)圖1所示，本實(shí)施例的語(yǔ)音識(shí)別方法的具體包括下述步驟：步驟S10:語(yǔ)音信號(hào)輸入。
[0020] 步驟S11 :分別通過(guò)邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型中的任意兩個(gè)模型對(duì)語(yǔ)音信號(hào)進(jìn)行識(shí)別，獲得兩個(gè)識(shí)別結(jié)果。
[0021] 識(shí)別過(guò)程具體包括下述步驟，參見(jiàn)圖2所示：步驟S11-1:對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)處理。
[0022] 對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)處理主要包括依次對(duì)語(yǔ)音信號(hào)進(jìn)行采樣、去噪音、端點(diǎn)檢測(cè)、預(yù) 加重、加窗分幀等操作。
[0023]采樣，就是將模擬信號(hào)轉(zhuǎn)化為語(yǔ)音信號(hào)。由于原始語(yǔ)音信號(hào)是模擬信號(hào)，通過(guò)采樣處理，將模擬的語(yǔ)音信號(hào)轉(zhuǎn)化為數(shù)字化的語(yǔ)音信號(hào)。
[0024]去噪音，就是去除聲音中的一些無(wú)用信息，保證信號(hào)的質(zhì)量與速度。
[0025]端點(diǎn)檢測(cè)，就是找到語(yǔ)音信號(hào)的首尾兩個(gè)端點(diǎn)，一般采用兩級(jí)判斷法。
[0026]預(yù)加重，主要是為了加重語(yǔ)音信號(hào)的高頻部分，降低口唇對(duì)語(yǔ)音的影響。通常通過(guò) 一階高通數(shù)字濾波器來(lái)實(shí)現(xiàn)，傳遞函數(shù)為其中α為預(yù)加重系數(shù)，取值范圍為 0.9-1. 0。
[0027]加窗分幀，用于將數(shù)字信號(hào)有限化。對(duì)語(yǔ)音信號(hào)進(jìn)行加窗分幀，將語(yǔ)音信號(hào)分成若干個(gè)分析幀。本實(shí)施例采用漢明窗函數(shù)進(jìn)行加窗分幀。
[0028] 步驟S11-2 :提取語(yǔ)音信號(hào)的特征參數(shù)。
[0029]語(yǔ)音信號(hào)的特征參數(shù)非常多，為了提高識(shí)別率，本實(shí)施例分別從頻域、時(shí)域、對(duì)數(shù) 譜空間、倒譜空間去修正相應(yīng)參數(shù)。
[0030]步驟S11-3:匹配。
[0031] 將語(yǔ)音信號(hào)的特征參數(shù)分別與預(yù)先存儲(chǔ)的語(yǔ)音信號(hào)的邏輯回歸模型、深信度網(wǎng)絡(luò) 模型、隱馬爾可夫模型中的任意兩個(gè)模型進(jìn)行匹配，獲得兩個(gè)識(shí)別結(jié)果。
[0032]在本實(shí)施例中，將語(yǔ)音信號(hào)的特征參數(shù)分別與預(yù)先存儲(chǔ)的語(yǔ)音信號(hào)的邏輯回歸模型、深信度網(wǎng)絡(luò)模型這兩個(gè)模型進(jìn)行匹配，獲得兩個(gè)識(shí)別結(jié)果。
[0033]語(yǔ)音信號(hào)的邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型預(yù)先存儲(chǔ)在模板庫(kù) 中。在模板庫(kù)中，事先存儲(chǔ)有多個(gè)語(yǔ)音信號(hào)的邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型。存儲(chǔ)過(guò)程為：對(duì)語(yǔ)音信號(hào)的特征參數(shù)分別進(jìn)行邏輯回歸建模、深信度網(wǎng)絡(luò)建模、隱馬爾可夫建模，獲得語(yǔ)音信號(hào)的邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型，并存儲(chǔ)在模板庫(kù)中。
[0034]邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型的建模過(guò)程，以及語(yǔ)音信號(hào)分別與邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型的匹配過(guò)程為現(xiàn)有技術(shù)，具體可參見(jiàn)現(xiàn) 有技術(shù)，此處不再贅述。
[0035] 步驟S12 :比較兩個(gè)識(shí)別結(jié)果是否相同。
[0036]若否，說(shuō)明兩個(gè)識(shí)別結(jié)果不相同，進(jìn)入步驟S13; 若是，說(shuō)明兩個(gè)識(shí)別結(jié)果相同，進(jìn)入步驟S15。
[0037] 步驟S13 :通過(guò)第三個(gè)模型對(duì)語(yǔ)音信號(hào)進(jìn)行識(shí)別，獲得第三個(gè)識(shí)別結(jié)果。
[0038] 在本實(shí)施例中，前兩個(gè)模型采用的是邏輯回歸模型、深信度網(wǎng)絡(luò)模型，第三個(gè)模型采用的隱馬爾可夫模型。
[0039] 步驟S14 :比較第三個(gè)識(shí)別結(jié)果與前兩個(gè)識(shí)別結(jié)果中的一個(gè)是否相同。
[0040] 也就是說(shuō)，判斷這三個(gè)識(shí)別結(jié)果中是否有兩個(gè)是相同的。
[0041] 若否，說(shuō)明這三個(gè)識(shí)別結(jié)果各不相同，返回步驟S10。
[0042] 若是，說(shuō)明第三個(gè)識(shí)別結(jié)果與前兩個(gè)識(shí)別結(jié)果中的一個(gè)是相同的，即三個(gè)識(shí)別結(jié) 果中有兩個(gè)是相同的，進(jìn)入步驟s15。
[0043] 步驟S15 :驗(yàn)證相同的識(shí)別結(jié)果是否為正確識(shí)別結(jié)果。
[0044] 在本實(shí)施例中，采用支持向量機(jī)模型驗(yàn)證相同的識(shí)別結(jié)果是否為正確識(shí)別結(jié)果。
[0045] 由于采用支持向量機(jī)驗(yàn)證識(shí)別結(jié)果為現(xiàn)有技術(shù)，此處不再贅述。
[0046] 若否，說(shuō)明識(shí)別結(jié)果是錯(cuò)誤的，進(jìn)入步驟S16。
[0047] 若是，說(shuō)明識(shí)別結(jié)果是正確的，進(jìn)入步驟S18。
[0048] 步驟S16 :判斷是否存儲(chǔ)該識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)。
[0049] 若否，則不存儲(chǔ)，返回步驟S10 ; 若是，則存儲(chǔ)，進(jìn)入步驟S17。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：劉振宇;陳貴;潘洋;趙艷濱;宋思萌;邵景銀;周小璇;
技術(shù)所有人：青島海爾智能技術(shù)研發(fā)有限公司;
我是此專(zhuān)利的發(fā)明人