>[0050] 本步驟具體包括: 判斷相同的識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)連續(xù)收到次數(shù)是否大于等于設(shè)定次數(shù)。在本實(shí)施 例中,設(shè)定次數(shù)優(yōu)選為3。
[0051] 若否,則不存儲(chǔ),提示用戶語(yǔ)音信號(hào)錯(cuò)誤,返回步驟S10。
[0052] 若是,則提示用戶選擇是否存儲(chǔ);若用戶選擇存儲(chǔ),則進(jìn)入步驟S17,若用戶選擇 不存儲(chǔ),則返回步驟S10。
[0053] 步驟S17 :存儲(chǔ)該識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)。
[0054] 首先,對(duì)語(yǔ)音信號(hào)的特征參數(shù)分別進(jìn)行邏輯回歸建模、深信度網(wǎng)絡(luò)建模、隱馬爾可 夫建模,獲得語(yǔ)音信號(hào)的邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型。然后,將語(yǔ)音信 號(hào)的邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型存儲(chǔ)至模板庫(kù)。
[0055] 步驟S18 :輸出該識(shí)別結(jié)果。
[0056] 該識(shí)別結(jié)果為正確的識(shí)別結(jié)果,輸出該識(shí)別結(jié)果。后續(xù)可根據(jù)該識(shí)別結(jié)果生成控 制信號(hào),控制其他設(shè)備運(yùn)行。
[0057] 基于上述語(yǔ)音識(shí)別方法,本實(shí)施例還提出了一種語(yǔ)音識(shí)別裝置,該裝置主要包括 識(shí)別模塊10、比較模塊20、驗(yàn)證模塊30、輸出模塊40,參見圖3所示。
[0058] 識(shí)別模塊10,用于分別通過(guò)邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型對(duì)語(yǔ) 音信號(hào)進(jìn)行識(shí)別,獲得識(shí)別結(jié)果。
[0059] 比較模塊20,用于比較前兩個(gè)識(shí)別結(jié)果是否相同;以及在前兩個(gè)識(shí)別結(jié)果不同 時(shí),比較第三個(gè)識(shí)別結(jié)果是否與前兩個(gè)識(shí)別結(jié)果中的一個(gè)相同。
[0060] 驗(yàn)證模塊30,用于驗(yàn)證相同的識(shí)別結(jié)果是否為正確識(shí)別結(jié)果。具體地,驗(yàn)證模塊 30用于采用支持向量機(jī)模型驗(yàn)證相同的識(shí)別結(jié)果是否為正確識(shí)別結(jié)果。
[0061] 輸出模塊40,用于輸出該識(shí)別結(jié)果。
[0062] 在所述裝置中還設(shè)置有判斷模塊50和存儲(chǔ)模塊60。
[0063]判斷模塊50,用于判斷是否存儲(chǔ)相同的識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)。具體地,判斷模 塊50用于判斷相同的識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)連續(xù)收到次數(shù)是否大于等于設(shè)定次數(shù)。
[0064]存儲(chǔ)模塊60,用于存儲(chǔ)相同的識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)。
[0065]存儲(chǔ)模塊60主要包括建模單元601和存儲(chǔ)單元602,參見圖4所示。
[0066] 建模單元601,用于對(duì)語(yǔ)音信號(hào)的特征參數(shù)分別進(jìn)行邏輯回歸建模、深信度網(wǎng)絡(luò)建 模、隱馬爾可夫建模,獲得語(yǔ)音信號(hào)的邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型; 存儲(chǔ)單元602,用于將語(yǔ)音信號(hào)的邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型進(jìn) 行存儲(chǔ)。
[0067] 具體的語(yǔ)音識(shí)別裝置的工作過(guò)程,已經(jīng)在上述語(yǔ)音識(shí)別方法中詳述,此處不予贅 述。
[0068]本實(shí)施例的語(yǔ)音識(shí)別方法和裝置,通過(guò)采用邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬 爾可夫模型相結(jié)合的方法對(duì)語(yǔ)音信號(hào)進(jìn)行識(shí)別,克服了單獨(dú)使用一種模型時(shí)識(shí)別準(zhǔn)確率低 的問(wèn)題,提高了語(yǔ)音識(shí)別準(zhǔn)確率,識(shí)別準(zhǔn)確率可提升至95%以上;采用支持向量機(jī)模型驗(yàn)證 識(shí)別結(jié)果是否正確,在驗(yàn)證出識(shí)別結(jié)果為錯(cuò)誤識(shí)別結(jié)果時(shí),可判斷是否存儲(chǔ)該識(shí)別結(jié)果對(duì) 應(yīng)的語(yǔ)音信號(hào),使裝置具有交互式學(xué)習(xí)的功能,提高了用戶使用滿意度。
[0069]基于上述語(yǔ)音識(shí)別裝置,本實(shí)施例還提出了一種語(yǔ)音控制系統(tǒng),主要包括控制終 端、云端服務(wù)器、被控終端,參見圖5所示,其中,云端服務(wù)器主要包括上述的語(yǔ)音識(shí)別裝置 以及主控裝置。控制終端發(fā)送的語(yǔ)音信號(hào)傳輸至語(yǔ)音識(shí)別裝置,經(jīng)語(yǔ)音識(shí)別裝置進(jìn)行處理 后,輸出識(shí)別結(jié)果至主控裝置,主控裝置根據(jù)接收到的識(shí)別結(jié)果生成控制信號(hào),并發(fā)送至被 控終端,控制被控終端的運(yùn)行。
[0070]控制終端主要為手機(jī)、IPAD、PC等具有語(yǔ)音采集功能的終端。被控終端主要為家 庭設(shè)備、工業(yè)現(xiàn)場(chǎng)設(shè)備等。
[0071] 下面以家庭設(shè)備中的電視機(jī)為例進(jìn)行說(shuō)明。
[0072] 用戶發(fā)出語(yǔ)音信號(hào),控制終端進(jìn)行采集,并將采集到的語(yǔ)音信號(hào)發(fā)送至語(yǔ)音識(shí)別 裝置,語(yǔ)音識(shí)別裝置對(duì)接收到的語(yǔ)音信號(hào)進(jìn)行處理后,經(jīng)過(guò)輸出模塊輸出識(shí)別結(jié)果,主控模 塊根據(jù)接收到的識(shí)別結(jié)果生成控制信號(hào),通過(guò)通信模塊發(fā)送至電視機(jī),電視機(jī)根據(jù)接收到 的控制信號(hào)執(zhí)行操作,并將執(zhí)行結(jié)果反饋回用戶,用戶可以根據(jù)結(jié)果選擇下一步操作。
[0073]通過(guò)該系統(tǒng),用戶可以實(shí)現(xiàn)對(duì)電視機(jī)的語(yǔ)音控制,例如頻道切換、音量大小、信號(hào) 源選擇、開關(guān)機(jī)等。
[0074]本實(shí)施例的語(yǔ)音控制系統(tǒng),實(shí)現(xiàn)了對(duì)被控終端的遠(yuǎn)程控制,對(duì)被控終端的各個(gè)設(shè) 備進(jìn)行統(tǒng)一管理,使用方便,提高了用戶體驗(yàn);由于云端服務(wù)器執(zhí)行語(yǔ)音信號(hào)識(shí)別、控制信 號(hào)生成等主要的數(shù)據(jù)處理過(guò)程,減少了本地被控終端的負(fù)載壓力;且由于語(yǔ)音信號(hào)識(shí)別正 確率尚,能夠?qū)Ρ豢亟K端進(jìn)彳丁有效的控制,被控終端執(zhí)彳丁動(dòng)作正確率$父尚,提尚了系統(tǒng)的市 場(chǎng)競(jìng)爭(zhēng)力,便于推廣。
[0075] 以上實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案,而非對(duì)其進(jìn)行限制;盡管參照前述實(shí) 施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說(shuō)明,對(duì)于本領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),依然可以對(duì)前述實(shí)施 例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或替 換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明所要求保護(hù)的技術(shù)方案的精神和范圍。
【主權(quán)項(xiàng)】
1. 一種語(yǔ)音識(shí)別方法,其特征在于:包括下述步驟: 分別通過(guò)邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型中的任意兩個(gè)模型對(duì)語(yǔ)音 信號(hào)進(jìn)行識(shí)別,獲得兩個(gè)識(shí)別結(jié)果; 比較所述兩個(gè)識(shí)別結(jié)果是否相同; 若否,則通過(guò)第三個(gè)模型對(duì)所述語(yǔ)音信號(hào)進(jìn)行識(shí)別,獲得第三個(gè)識(shí)別結(jié)果;并比較第三 個(gè)識(shí)別結(jié)果與前兩個(gè)識(shí)別結(jié)果中的一個(gè)是否相同; 若是,則驗(yàn)證相同的識(shí)別結(jié)果是否為正確識(shí)別結(jié)果; 若是,則輸出該識(shí)別結(jié)果。2. 根據(jù)權(quán)利要求1所述的語(yǔ)音識(shí)別方法,其特征在于:當(dāng)驗(yàn)證出相同的識(shí)別結(jié)果不是 正確識(shí)別結(jié)果時(shí),所述方法還包括: 判斷是否存儲(chǔ)該識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào); 若是,則存儲(chǔ)該識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)。3. 根據(jù)權(quán)利要求2所述的語(yǔ)音識(shí)別方法,其特征在于:所述判斷是否存儲(chǔ)相同的識(shí)別 結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)包括: 判斷相同的識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)連續(xù)收到次數(shù)是否大于等于設(shè)定次數(shù)。4. 根據(jù)權(quán)利要求2所述的語(yǔ)音識(shí)別方法,其特征在于:所述存儲(chǔ)該識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ) 音信號(hào)包括: 對(duì)語(yǔ)音信號(hào)的特征參數(shù)分別進(jìn)行邏輯回歸建模、深信度網(wǎng)絡(luò)建模、隱馬爾可夫建模,獲 得語(yǔ)音信號(hào)的邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型; 將語(yǔ)音信號(hào)的邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型進(jìn)行存儲(chǔ)。5. 根據(jù)權(quán)利要求1所述的語(yǔ)音識(shí)別方法,其特征在于:采用支持向量機(jī)模型驗(yàn)證所述 相同的識(shí)別結(jié)果是否為正確識(shí)別結(jié)果。6. -種語(yǔ)音識(shí)別裝置,其特征在于:所述裝置包括: 識(shí)別模塊,用于分別通過(guò)邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型對(duì)語(yǔ)音信號(hào) 進(jìn)行識(shí)別,獲得識(shí)別結(jié)果; 比較模塊,用于比較前兩個(gè)識(shí)別結(jié)果是否相同;以及在前兩個(gè)識(shí)別結(jié)果不同時(shí),比較第 三個(gè)識(shí)別結(jié)果是否與前兩個(gè)識(shí)別結(jié)果中的一個(gè)相同; 驗(yàn)證模塊,用于驗(yàn)證相同的識(shí)別結(jié)果是否為正確識(shí)別結(jié)果; 輸出模塊,用于輸出該識(shí)別結(jié)果。7. 根據(jù)權(quán)利要求6所述的語(yǔ)音識(shí)別裝置,其特征在于:所述裝置還包括: 判斷模塊,用于判斷是否存儲(chǔ)相同的識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào); 存儲(chǔ)模塊,用于存儲(chǔ)相同的識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)。8. 根據(jù)權(quán)利要求7所述的語(yǔ)音識(shí)別裝置,其特征在于: 所述判斷模塊具體用于判斷相同的識(shí)別結(jié)果對(duì)應(yīng)的語(yǔ)音信號(hào)連續(xù)收到次數(shù)是否大于 等于設(shè)定次數(shù); 所述驗(yàn)證模塊,具體用于采用支持向量機(jī)模型驗(yàn)證相同的識(shí)別結(jié)果是否為正確識(shí)別結(jié) 果。9. 根據(jù)權(quán)利要求7所述的語(yǔ)音識(shí)別裝置,其特征在于:所述存儲(chǔ)模塊包括建模單元和 存儲(chǔ)單元,其中, 所述建模單元,用于對(duì)語(yǔ)音信號(hào)的特征參數(shù)分別進(jìn)行邏輯回歸建模、深信度網(wǎng)絡(luò)建模、 隱馬爾可夫建模,獲得語(yǔ)音信號(hào)的邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型; 所述存儲(chǔ)單元,用于將語(yǔ)音信號(hào)的邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型進(jìn) 行存儲(chǔ)。10. -種語(yǔ)音控制系統(tǒng),其特征在于:包括控制終端、云端服務(wù)器、被控終端,所述云端 服務(wù)器包括如權(quán)利要求6至9中任一項(xiàng)所述的語(yǔ)音識(shí)別裝置和主控裝置;所述控制終端發(fā) 送的語(yǔ)音信號(hào)傳輸至所述語(yǔ)音識(shí)別裝置,所述語(yǔ)音識(shí)別裝置對(duì)接收的信號(hào)進(jìn)行處理后輸出 識(shí)別結(jié)果至主控裝置,所述主控裝置根據(jù)接收到的識(shí)別結(jié)果生成控制信號(hào),并發(fā)送至被控 終端。
【專利摘要】本發(fā)明公開了一種語(yǔ)音識(shí)別方法、裝置及語(yǔ)音控制系統(tǒng),方法包括:分別通過(guò)邏輯回歸模型、深信度網(wǎng)絡(luò)模型、隱馬爾可夫模型中的任意兩個(gè)模型對(duì)語(yǔ)音信號(hào)進(jìn)行識(shí)別,獲得兩個(gè)識(shí)別結(jié)果;比較所述兩個(gè)識(shí)別結(jié)果是否相同;若否,則通過(guò)第三個(gè)模型對(duì)所述語(yǔ)音信號(hào)進(jìn)行識(shí)別,獲得第三個(gè)識(shí)別結(jié)果;并比較第三個(gè)識(shí)別結(jié)果與前兩個(gè)識(shí)別結(jié)果中的一個(gè)是否相同;若是,則驗(yàn)證相同的識(shí)別結(jié)果是否為正確識(shí)別結(jié)果;若是,則輸出該識(shí)別結(jié)果。本發(fā)明的語(yǔ)音識(shí)別方法和裝置通過(guò)提高了語(yǔ)音識(shí)別準(zhǔn)確率,具有交互式學(xué)習(xí)的功能,提高了用戶使用滿意度。本發(fā)明的語(yǔ)音控制系統(tǒng),實(shí)現(xiàn)了對(duì)被控終端的遠(yuǎn)程控制,減輕了被控終端的負(fù)載壓力,用戶體驗(yàn)好。
【IPC分類】G10L15/26, G10L15/14
【公開號(hào)】CN105374357
【申請(qǐng)?zhí)枴緾N201510813323
【發(fā)明人】劉振宇, 陳貴, 潘洋, 趙艷濱, 宋思萌, 邵景銀, 周小璇
【申請(qǐng)人】青島海爾智能技術(shù)研發(fā)有限公司
【公開日】2016年3月2日
【申請(qǐng)日】2015年11月23日