欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

語音控制方法及裝置與流程

文檔序號:11459419閱讀:219來源:國知局
語音控制方法及裝置與流程

本發(fā)明涉及智能控制技術(shù)領域,尤其涉及一種語音控制方法及裝置。



背景技術(shù):

隨著技術(shù)的發(fā)展,利用miracast技術(shù),使用者不再需要尋找各種規(guī)格的線材與轉(zhuǎn)換器,亦毋須確認用于連接設備的正確接頭,就能將傳送端設備(智能手機、平板電腦、筆記本電腦、臺式機等)的畫面內(nèi)容分享給其他接收端設備(電視機、投影儀等)。在將傳送端設備的畫面內(nèi)容分享給接收端設備時,通過miracast協(xié)議的uibc(userinputbackchannel,用戶輸入反向信道)功能,接收端設備可以實現(xiàn)對傳送端設備分享的畫面內(nèi)容進行控制,其中,uibc定義如何將接收端設備的控制信號回送到傳送端設備,且uibc定義的接收端設備信號的控制信號有兩種,一種是通用鼠標、鍵盤信號,另一種是外設信號,外設信號由usb、wifi、藍牙等傳入。當接收端設備對傳送端設備分享的畫面內(nèi)容進行控制時,接收端設備首先需要生成這些控制信號,然后將它們傳送給傳送端設備,才能實現(xiàn)對傳送端設備的控制。然而上述控制信號都需要直接操作接收端設備或外設來生成,當不方便直接操作接收端設備或外設時,接收端設備就無法生成控制信號,也就無法將控制信號傳送到傳送端設備并實現(xiàn)對傳送端設備的控制。



技術(shù)實現(xiàn)要素:

本發(fā)明的主要目的在于提供一種語音控制方法及裝置,旨在解決當不方便直接操作接收端設備或外設時,而無法實現(xiàn)對傳送端設備的控制的問題。

為實現(xiàn)上述目的,本發(fā)明提供的一種語音控制方法,所述語音控制方法包括以下步驟:

接收端設備獲取用于控制傳送端設備的語音控制信號;

接收端設備將獲取的所述語音控制信號與預設語音指令進行匹配;

若匹配成功,則接收端設備根據(jù)uibc協(xié)議基于匹配成功的所述預設語音指令生成uibc報文,并將所述uibc報文傳送至傳送端設備,以供傳送端設 備根據(jù)接收到的所述uibc報文控制自身的行為。

可選地,所述預設語音指令的存儲形式為語音波形,所述接收端設備將獲取的所述語音控制信號與預設語音指令進行匹配的步驟包括:

接收端設備將獲取的所述語音控制信號及所述預設語音指令進行相應變換,以得到所述語音控制信號及所述預設語音指令的聲譜圖或特征向量;

接收端設備將所述語音控制信號的聲譜圖或特征向量與所述預設語音指令的聲譜圖或特征向量進行匹配。

可選地,所述預設語音指令的存儲形式為聲譜圖或特征向量,所述接收端設備將獲取的所述語音控制信號與預設語音指令進行匹配的步驟包括:

接收端設備將獲取的所述語音控制信號進行相應變換,以得到所述語音控制信號的聲譜圖或特征向量;

接收端設備將所述語音控制信號的聲譜圖或特征向量與所述預設語音指令進行匹配。

可選地,所述接收端設備根據(jù)uibc協(xié)議基于匹配成功的所述預設語音指令生成uibc報文的步驟包括:

接收端設備獲取所述預設語音指令與所述uibc報文中控制信號段的映射關系;

接收端設備根據(jù)所述映射關系確定匹配成功的所述預設語音指令對應的控制信號段;

接收端設備根據(jù)uibc協(xié)議將所述預設語音指令對應的控制信號段生成uibc報文。

可選地,所述接收端設備將獲取的所述語音控制信號與預設語音指令進行匹配的步驟之后,所述語音控制方法還包括:

若匹配失敗,則接收端設備提示用戶重新發(fā)出語音控制信號。

此外,為實現(xiàn)上述目的,本發(fā)明還提供一種語音控制裝置,所述語音控制裝置包括:

獲取模塊,用于獲取用于控制傳送端設備的語音控制信號;

匹配模塊,用于將獲取的所述語音控制信號與預設語音指令進行匹配;

生成模塊,用于若匹配成功,則根據(jù)uibc協(xié)議基于匹配成功的所述預設 語音指令生成uibc報文,并將所述uibc報文傳送至傳送端設備,以供傳送端設備根據(jù)接收到的所述uibc報文控制自身的行為。

可選地,所述預設語音指令的存儲形式為語音波形,所述匹配模塊包括:

處理單元,用于將獲取的所述語音控制信號及所述預設語音指令進行相應變換,以得到所述語音控制信號及所述預設語音指令的聲譜圖或特征向量;

匹配單元,用于將所述語音控制信號的聲譜圖或特征向量與所述預設語音指令的聲譜圖或特征向量進行匹配。

可選地,所述預設語音指令的存儲形式為聲譜圖或特征向量,所述處理單元,還用于將獲取的所述語音控制信號進行相應變換,以得到所述語音控制信號的聲譜圖或特征向量;

所述匹配單元,還用于將所述語音控制信號的聲譜圖或特征向量與所述預設語音指令進行匹配。

可選地,所述生成模塊包括:

獲取單元,用于獲取所述預設語音指令與所述uibc報文中控制信號段的映射關系;

確定單元,用于根據(jù)所述映射關系確定匹配成功的所述預設語音指令對應的控制信號段;

生成單元,用于根據(jù)uibc協(xié)議將所述預設語音指令對應的控制信號段生成uibc報文。

可選地,所述語音控制裝置還包括:

提示模塊,用于若匹配失敗,則提示重新發(fā)出語音控制信號。

本發(fā)明例通過在用戶不方便操作接收端設備或與接收端設備連接的外設設備時,發(fā)出語音控制信號,接收端設備在接收到用戶發(fā)出的語音控制信號后,將該語音控制信號與預設語音指令進行匹配,從而確定該語音控制信號對應的預設語音指令,接收端設備在確定語音控制信號對應的預設語音指令后,將所述預設語音指令生成uibc報文,并將所述uibc報文傳送至傳送端設備,從而實現(xiàn)對傳送端設備的控制,解決了當不方便直接操作接收端設備或外設時,而無法實現(xiàn)對傳送端設備的控制的問題,使得接收端設備對傳送端設備的控制更加方便。

附圖說明

圖1為本發(fā)明語音控制方法的第一實施例的流程示意圖;

圖2為圖1中將獲取的語音控制信號與預設語音指令進行匹配的步驟細化流程示意圖;

圖3為圖1中將獲取的語音控制信號與預設語音指令進行匹配的另一實施例的步驟流程示意圖;

圖4為圖1中根據(jù)uibc協(xié)議將匹配成功的預設語音指令生成uibc報文的步驟細化流程示意圖;

圖5為本發(fā)明語音控制裝置的第一實施例的功能模塊示意圖;

圖6為圖5中匹配模塊的細化功能模塊示意圖;

圖7為圖5中生成模塊的細化功能模塊示意圖。

本發(fā)明目的的實現(xiàn)、功能特點及優(yōu)點將結(jié)合實施例,參照附圖做進一步說明。

具體實施方式

應當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。

基于上述問題,本發(fā)明提供一種語音控制方法。

本發(fā)明的應用場景為用戶能把通過miracast認證的手機、平板電腦或筆記本等接收端設備的顯示屏的內(nèi)容以無線方式投射到支持miracast技術(shù)的接收端設備上,用戶在接收端設備上看到的內(nèi)容與傳送端設備上的內(nèi)容將會是一模一樣的。本發(fā)明中接收端設備及傳送端設備都具有uibc功能。所述uibc功能指的是用戶可以通過接收端設備實現(xiàn)對傳送端設備的控制。該功能包括兩種類型,一種是硬件無關型,如鼠標點擊、按鍵點擊、touch點擊、放大縮小等,另一種是hidc人機接口設備控制:包括紅外線、usb、藍牙、wifi、游戲桿、遙控器等。

參照圖1,圖1為本發(fā)明語音控制方法的第一實施例的流程示意圖。

在本實施例中,所述語音控制方法包括:

步驟s10,接收端設備獲取用于控制傳送端設備的語音控制信號;

本實施例中的接收端設備以支持miracast技術(shù)且具有uibc功能的無線投影系統(tǒng)為例進行說明,所述無線投影系統(tǒng)同現(xiàn)有的無線投影系統(tǒng)相比增設了語音輸入模塊。具體實施中也可以根據(jù)本發(fā)明核心思想將本發(fā)明應用到其他的支持miracast技術(shù)且具有uibc功能的接收端設備中。

無線投影系統(tǒng)在播放接收端設備的屏幕內(nèi)容時,所述接收端設備以通過miracast認證且具有uibc功能的筆記本為例,比如,筆記本當前屏幕顯示的內(nèi)容為一個ppt文檔,則所述無線投影系統(tǒng)的屏幕顯示的內(nèi)容也為該ppt文檔,若用戶需要觀看下一頁ppt文檔,需要進行翻頁操作,則用戶可以對著所述無線投影系統(tǒng)發(fā)出翻頁的語音控制信號。又如,筆記本當前屏幕顯示的內(nèi)容為一個電影,則所述無線投影系統(tǒng)的屏幕顯示的內(nèi)容也為該電影,此時,用戶需要對當前播放的電影內(nèi)容進行暫停,需要進行暫停操作,則用戶可以對著所述無線投影系統(tǒng)發(fā)出暫停的語音控制信號。所述無線投影系統(tǒng)在獲取用于控制筆記本的語音控制信號時,具體的,可以通過麥克風或者其他語音接收裝置接收用戶或其他語音播放設備發(fā)出的語音控制信號,然后將接收到的語音控制信號輸入至所述無線投影系統(tǒng)的語音輸入模塊,或者直接通過所述語音輸入模塊接收用戶或其他語音播放設備發(fā)出的語音控制信號,以供所述語音輸入模塊對所述語音控制信號進行相應的處理,例如,濾波處理,匹配處理等。

步驟s20,接收端設備將獲取的所述語音控制信號與預設語音指令進行匹配;

在本實施例中,所述無線投影系統(tǒng)預先存有所述預設語音指令,所述預設語音指令包括諸如“上滑”、“翻頁”、“暫?!钡日Z音指令,在獲取到用戶發(fā)出的語音控制信號后,將獲取的所述語音控制信號與所述預設語音指令一一進行匹配,直到所述語音控制信號與所述預設語音指令中的某個指令匹配成功為止,或者直到所述語音控制信號與所述預設語音指令中的所有指令進行匹配失敗為止。具體的,所述語音控制信號在與所述預設語音指令進行匹配時,按照各個預設語音指令的存儲順序依次與所述語音控制信號進行匹配。例如,用戶發(fā)出的語音控制信號為“翻頁”信號,無線投影系統(tǒng)中存儲的預設語音指令有“上滑”、“翻頁”、“暫?!闭Z音指令,且各個所述預設語音指 令的存儲順序依次為“上滑”、“翻頁”、“暫?!闭Z音指令,則在將所述“翻頁”信號與所述預設語音指令進行匹配時,首先將所述“翻頁”信號與“上滑”語音指令進行匹配,若匹配失敗,則繼續(xù)將所述“翻頁”信號與“翻頁”語音指令進行匹配,若匹配成功,則確定所述語音控制信號為所述“翻頁”語音指令,若匹配失敗,則繼續(xù)與所述預設語音指令的其他語音指令進行匹配,直到匹配成功為止或者直到所述預設語音指令都匹配失敗為止。

步驟s30,若匹配成功,則接收端設備根據(jù)uibc協(xié)議基于匹配成功的所述預設語音指令生成uibc報文,并將所述uibc報文傳送至傳送端設備,以供傳送端設備根據(jù)接收到的所述uibc報文控制自身的行為。

在將所述語音控制信號與預設的語音指令匹配成功時,根據(jù)uibc協(xié)議將匹配成功的所述預設語音指令生成uibc報文。所述uibc協(xié)議又也稱為wifi-display協(xié)議,該協(xié)議定義了各種控制指令對應的uibc報文的格式。由于所述uibc協(xié)議只定義了通用輸入的信息和人機接口設備類(hidc)的信息對應的uibc報文的格式,而所述通用輸入的信息和人機接口設備類(hidc)的信息都不包括語音信號輸入的信息,故在將所述預設語音指令生成uibc報文時,首先應將所述預設語音指令轉(zhuǎn)換為通用輸入的信息或者人機接口設備類的信息,然后根據(jù)所述通用輸入的信息或人機接口設備類(hidc)的信息對應的參數(shù)生成uibc報文,并將所述uibc報文傳送至傳送端設備,傳送端設備在接收到所述uibc報文后,根據(jù)所述uibc報文中的內(nèi)容控制自身的行為,例如所述報文中的內(nèi)容為對所述傳送端設備當前播放的視頻進行暫停處理,則所述傳送端設備在接收到該報文后立即對當前播放的視頻進行暫停播放。在將所述語音控制信號與預設的語音指令匹配失敗時,則提示重新發(fā)出語音控制信號,用戶在收到該提示后,可知道發(fā)出的語音控制信號控制發(fā)送端的行為失敗,然后可以重新發(fā)出語音控制信號,或重新使用語音播放設備發(fā)出語音控制信號,所述語音播放設備中預先錄有所述語音控制信號。

本實施例通過在用戶不方便操作接收端設備或與接收端設備連接的外設設備時,發(fā)出語音控制信號,接收端設備在接收到用戶發(fā)出的語音控制信號后,將該語音控制信號與預設語音指令進行匹配,從而確定該語音控制信號對應的預設語音指令,接收端設備在確定語音控制信號對應的預設語音指令后,將所述預設語音指令生成uibc報文,并將所述uibc報文傳送至傳送端 設備,從而實現(xiàn)對傳送端設備的控制,解決了當不方便直接操作接收端設備或外設時,而無法實現(xiàn)對傳送端設備的控制的問題,使得接收端設備對傳送端設備的控制更加方便。

進一步地,基于第一實施例提出本發(fā)明語音控制方法的第二實施例,參照圖2,在所述預設語音指令的存儲形式為語音波形時,所述步驟s20包括:

步驟s21,接收端設備將獲取的所述語音控制信號及所述預設語音指令進行相應變換,以得到所述語音控制信號及所述預設語音指令的聲譜圖或特征向量;

步驟s22,接收端設備將所述語音控制信號的聲譜圖或特征向量與所述預設語音指令的聲譜圖或特征向量進行匹配。

當所述預設語音指令的存儲形式為語音波形時,由于不同的語音波形對應的語音指令可能相同,而不同的用戶發(fā)出的相同的語音指令所對應的語音波形的差別可能很大,故直接通過將用戶發(fā)出的語音控制信號所對應的語音波形與預設語音指令對應的語音波形進行匹配時,很難匹配成功,需要對所述預設語音指令及所述語音控制信號進行相應的處理。具體的,可以對獲取的所述語音控制信號及所述預設語音指令進行相應變換,以得到所述語音控制信號及所述預設語音指令的聲譜圖或特征向量。當需要得到所述語音控制信號及所述預設語音指令的聲譜圖時,所述相應變換主要包括預加重處理、分幀處理、加窗處理、快速傅里葉變換處理及灰度級映射處理,經(jīng)過上述處理過程后,得到所述語音控制信號及所述預設語音指令的聲譜圖。當需要得到所述語音控制信號及所述預設語音指令的特征向量時,所述特征向量以所述語音控制信號及所述預設語音指令的mfcc(melfrequencycepstrumcoefficient,梅爾頻率倒譜系數(shù))為例,所述相應變換主要包括預加重處理、分幀處理、加窗處理、快速傅里葉變換處理、三角帶通濾波器進行濾波處理、計算每個濾波器組輸出的對數(shù)能量、經(jīng)離散余弦變換(dct)得到mfcc系數(shù)、譜加權(quán)處理、cms(cepstrummeansubtraction,倒譜均值減)處理及動態(tài)差分參數(shù)的提取(包括一階差分和二階差分)。在獲得所述語音控制信號及所述預設語音指令的聲譜圖或者特征向量后,將所述語音控制信號的聲譜圖或者特征向量依次與所述預設語音指令的聲譜圖或者特征向量進行匹配,直 到匹配成功為止或者與所有的預設語音指令都匹配失敗為止。

本實施例通過將語音控制信號及所述預設語音指令變換為相應的聲譜圖或者特征向量,然后將得到的聲譜圖或者特征向量進行匹配,從而提高了語音識別的準確性。

進一步地,基于第一實施例提出本發(fā)明語音控制方法的第三實施例,參照圖3,在所述預設語音指令的存儲形式為聲譜圖或特征向量時,所述步驟s20包括:

步驟s23,接收端設備將獲取的所述語音控制信號進行相應變換,以得到所述語音控制信號的聲譜圖或特征向量;

步驟s24,接收端設備將所述語音控制信號的聲譜圖或特征向量與所述預設語音指令進行匹配。

當所述預設語音指令的存儲形式為聲譜圖或特征向量時,由于語音信號的聲譜圖或者特征向量能夠直接表征語音指令的特性,故在將獲取的所述語音控制信號與預設語音指令進行匹配時,只需要將獲取的所述語音控制信號進行相應的變換,從而得到所述語音控制信號的聲譜圖或特征向量,具體的變換過程在上述實施例中已描述,此處不再贅述。當獲取到所述語音控制信號的聲譜圖或者特征向量時,將所述聲譜圖或者特征向量與各個所述語音指令依次進行匹配,直到匹配成功為止或者與所有的預設語音指令都匹配失敗為止。

本實施例通過將語音控制信號及所述預設語音指令變換為相應的聲譜圖或者特征向量,然后將得到的聲譜圖或者特征向量進行匹配,從而提高了語音識別的準確性。

進一步地,基于上述任一實施例提出本發(fā)明語音控制方法的第四實施例,參照圖4,所述根據(jù)uibc協(xié)議將匹配成功的所述預設語音指令生成uibc報文的步驟包括:

步驟s31,接收端設備獲取所述預設語音指令與所述uibc報文中控制信號段的映射關系;

步驟s32,接收端設備根據(jù)所述映射關系確定匹配成功的所述預設語音指 令對應的控制信號段;

步驟s33,接收端設備根據(jù)uibc協(xié)議將所述預設語音指令對應的控制信號段生成uibc報文。

在本實施例中,所述預設語音指令與所述uibc報文中控制信號段存在一個映射表,即不同的預設語音指令對應不同的控制信號段。所述控制信號段為控制傳送端設備行為對應的數(shù)據(jù)段。所述映射關系可以為所述預設語音指令與通用輸入的信息的映射關系,或者所述預設語音指令與人機接口設備類(hidc)的信息的對應關系,即將所述語音控制指令轉(zhuǎn)換為相應的通用輸入控制信號或者人機接口設備類(hidc)控制信號,然后根據(jù)uibc協(xié)議將所述通用輸入的信息或者人機接口設備類(hidc)的信息生成uibc報文,進一步地,可以在所述uibc協(xié)議中定義所述預設控制指令的控制信號段內(nèi)容,在將所述預設語音指令生成uibc報文時,則在將預設的語音指令生成uibc報文時即可直接根據(jù)所述uibc協(xié)議生成對應的uibc報文。

本實施例通過將所述預設語音指令轉(zhuǎn)換為uibc協(xié)議中定義的指令,從而使得所述預設語音指令能控制所述傳送端設備的行為,增加了uibc功能的反饋形式。

本發(fā)明進一步提供一種裝置語音控制裝置。

參照圖5,圖5為本發(fā)明語音控制裝置的第一實施例的功能模塊示意圖。

在本實施例中,所述語音控制裝置包括:獲取模塊10、匹配模塊20、生成模塊30及提示模塊40。

所述獲取模塊10,用于獲取用于控制傳送端設備的語音控制信號;

本實施例中的接收端設備以支持miracast技術(shù)且具有uibc功能的無線投影系統(tǒng)為例進行說明,所述無線投影系統(tǒng)同現(xiàn)有的無線投影系統(tǒng)相比增設了語音輸入模塊。具體實施中也可以根據(jù)本發(fā)明核心思想將本發(fā)明應用到其他的支持miracast技術(shù)且具有uibc功能的接收端設備中。

無線投影系統(tǒng)在播放接收端設備的屏幕內(nèi)容時,所述接收端設備以通過miracast認證且具有uibc功能的筆記本為例,比如,筆記本當前屏幕顯示的內(nèi)容為一個ppt文檔,則所述無線投影系統(tǒng)的屏幕顯示的內(nèi)容也為該ppt文檔,此時,用戶需要觀看下一頁ppt文檔,需要進行翻頁操作,則用戶可以 對著所述無線投影系統(tǒng)發(fā)出翻頁的語音控制信號。又如,筆記本當前屏幕顯示的內(nèi)容為一個電影,則所述無線投影系統(tǒng)的屏幕顯示的內(nèi)容也為該電影,此時,用戶需要對當前播放的電影內(nèi)容進行暫停,需要進行暫停操作,則用戶可以對著所述無線投影系統(tǒng)發(fā)出暫停的語音控制信號。所述無線投影系統(tǒng)在獲取用于控制筆記本語音控制信號時,具體的,可以通過麥克風或者其他語音接收裝置接收用戶或其他語音播放設備發(fā)出的語音控制信號,然后將接收到的語音控制信號輸入至所述無線投影系統(tǒng)的語音輸入模塊,或者直接通過所述語音輸入模塊接收用戶或其他語音播放設備發(fā)出的語音控制信號,以供所述語音輸入模塊對所述語音控制信號進行相應的處理,例如,濾波處理,匹配處理等。

所述匹配模塊20,用于將獲取的所述語音控制信號與預設語音指令進行匹配;

在本實施例中,所述無線投影系統(tǒng)預先存有所述預設語音指令,所述預設語音指令包括諸如“上滑”、“翻頁”、“暫?!钡日Z音指令,在獲取到用戶發(fā)出的語音控制信號后,將獲取的所述語音控制信號與所述預設語音指令一一進行匹配,直到所述語音控制信號與所述預設語音指令中的某個指令匹配成功為止,或者直到所述語音控制信號與所述預設語音指令中的所有指令進行匹配失敗為止。具體的,所述語音控制信號在與所述預設語音指令進行匹配時,按照各個預設語音指令的存儲順序依次與所述語音控制信號進行匹配。例如,用戶發(fā)出的語音控制信號為“翻頁”信號,無線投影系統(tǒng)中存儲的預設語音指令有“上滑”、“翻頁”、“暫?!闭Z音指令,且各個所述預設語音指令的存儲順序依次為“上滑”、“翻頁”、“暫?!闭Z音指令,則在將所述“翻頁”信號與所述預設語音指令進行匹配時,首先將所述“翻頁”信號與“上滑”語音指令進行匹配,若匹配失敗,則繼續(xù)將所述“翻頁”信號與“翻頁”語音指令進行匹配,若匹配成功,則確定所述語音控制信號為所述“翻頁”語音指令,若匹配失敗,則繼續(xù)與所述預設語音指令的其他語音指令進行匹配,直到匹配成功為止或者直到所述預設語音指令都匹配失敗為止。

所述生成模塊30,用于若匹配成功,則根據(jù)uibc協(xié)議基于匹配成功的所述預設語音指令生成uibc報文,并將所述uibc報文傳送至傳送端設備,以供傳送端設備根據(jù)接收到的所述uibc報文控制自身的行為。

在將所述語音控制信號與預設的語音指令匹配成功時,根據(jù)uibc協(xié)議將匹配成功的所述預設語音指令生成uibc報文。所述uibc協(xié)議協(xié)議又也稱為wifi-display協(xié)議,該協(xié)議定義了各個控制指令對應的uibc報文的格式。由于所述uibc協(xié)議只定義了通用輸入的信息和人機接口設備類(hidc)的信息對應的uibc報文的格式,而所述通用輸入的信息和人機接口設備類(hidc)的信息都不包括語音信號輸入的信息,故在將所述預設語音指令生成uibc報文時,首先應將所述預設語音指令轉(zhuǎn)換為通用輸入的信息或者人機接口設備類的信息,然后根據(jù)所述通用輸入的信息或人機接口設備類(hidc)的信息對應的參數(shù)生成uibc報文,并將所述uibc報文傳送至傳送端設備,傳送端設備在接收到所述uibc報文后,根據(jù)所述uibc報文中的內(nèi)容控制自身的行為,例如所述報文中的內(nèi)容為對所述傳送端設備當前播放的視頻進行暫停處理,則所述傳送端設備在接收到該報文后立即對當前播放的視頻進行暫停播放。

所述提示模塊,用于若匹配失敗,則提示用戶重新發(fā)出語音控制信號。

在將所述語音控制信號與預設的語音指令匹配失敗時,則提示用戶重新發(fā)出語音控制信號,用戶在收到該提示后,即可知道發(fā)出的語音控制信號控制發(fā)送端的行為失敗,然后可以重新發(fā)出語音控制信號,或重新使用語音播放設備發(fā)出語音控制信號,所述語音播放設備中預先錄有所述語音控制信號。

本實施例通過在用戶不方便操作接收端設備或與接收端設備連接的外設設備時,發(fā)出語音控制信號,接收端設備在接收到用戶發(fā)出的語音控制信號后,將該語音控制信號與預設語音指令進行匹配,從而確定該語音控制信號對應的預設語音指令,接收端設備在確定語音控制信號對應的預設語音指令后,將所述預設語音指令生成uibc報文,并將所述uibc報文傳送至傳送端設備,從而實現(xiàn)對傳送端設備的控制,解決了當不方便直接操作接收端設備或外設時,而無法實現(xiàn)對傳送端設備的控制的問題,使得接收端設備對傳送端設備的控制更加方便。

進一步地,基于第一實施例提出本發(fā)明語音控制裝置的第二實施例,參照圖6,所述匹配模塊20包括處理單元21及匹配單元22。

所述處理單元21,用于將獲取的所述語音控制信號及所述預設語音指令 進行相應變換,以得到所述語音控制信號及所述預設語音指令的聲譜圖或特征向量;

所述匹配單元22,用于將所述語音控制信號的聲譜圖或特征向量與所述預設語音指令的聲譜圖或特征向量進行匹配。

當所述預設語音指令的存儲形式為語音波形時,由于不同的語音波形對應的語音指令可能相同,而不同的用戶發(fā)出的相同的語音指令所對應的語音波形的差別可能很大,故直接通過將用戶發(fā)出的語音控制信號所對應的語音波形與預設語音指令對應的語音波形進行匹配時,很難匹配成功,需要對所述預設語音指令及所述語音控制信號進行相應的處理。具體的,可以對獲取的所述語音控制信號及所述預設語音指令進行相應變換,以得到所述語音控制信號及所述預設語音指令的聲譜圖或特征向量。當需要得到所述語音控制信號及所述預設語音指令的聲譜圖時,所述相應變換主要包括預加重處理、分幀處理、加窗處理、快速傅里葉變換處理及灰度級映射處理,經(jīng)過上述處理過程后,得到所述語音控制信號及所述預設語音指令的聲譜圖。當需要得到所述語音控制信號及所述預設語音指令的特征向量時,所述特征向量以所述語音控制信號及所述預設語音指令的mfcc(melfrequencycepstrumcoefficient,梅爾頻率倒譜系數(shù))為例,所述相應變換主要包括預加重處理、分幀處理、加窗處理、快速傅里葉變換處理、三角帶通濾波器進行濾波處理、計算每個濾波器組輸出的對數(shù)能量、經(jīng)離散余弦變換(dct)得到mfcc系數(shù)、譜加權(quán)處理、cms(cepstrummeansubtraction,倒譜均值減)處理及動態(tài)差分參數(shù)的提取(包括一階差分和二階差分)。在獲得所述語音控制信號及所述預設語音指令的聲譜圖或者特征向量后,將所述語音控制信號的聲譜圖或者特征向量依次與所述預設語音指令的聲譜圖或者特征向量進行匹配,直到匹配成功為止或者與所有的預設語音指令都匹配失敗為止。

進一步地,所述處理單元21,還用于將獲取的所述語音控制信號進行相應變換,以得到所述語音控制信號的聲譜圖或特征向量;

所述匹配單元22,還用于將所述語音控制信號的聲譜圖或特征向量與所述預設語音指令進行匹配。

當所述預設語音指令的存儲形式為聲譜圖或特征向量時,由于語音信號的聲譜圖或者特征向量能夠直接表征語音指令的特性,故在將獲取的所述語 音控制信號與預設語音指令進行匹配時,只需要將獲取的所述語音控制信號進行相應的變換,從而得到所述語音控制信號的聲譜圖或特征向量,具體的變換過程在上述實施例中已描述,此處不再贅述。當獲取到所述語音控制信號的聲譜圖或者特征向量時,將所述聲譜圖或者特征向量與各個所述語音指令依次進行匹配,直到匹配成功為止或者與所有的預設語音指令都匹配失敗為止。

本實施例通過將語音控制信號及所述預設語音指令變換為相應的聲譜圖或者特征向量,然后將得到的聲譜圖或者特征向量進行匹配,從而提高了語音識別的準確性。

進一步地,基于上述任一實施例提出本發(fā)明語音控制裝置的第三實施例,參照圖7,所述生成模塊30包括:獲取單元31、確定單元32及生成單元33。

所述獲取單元31,用于獲取所述預設語音指令與所述uibc報文中控制信號段的映射關系;

所述確定單元32,用于根據(jù)所述映射關系確定匹配成功的所述預設語音指令對應的控制信號段;

所述生成單元33,用于根據(jù)uibc協(xié)議將所述預設語音指令對應的控制信號段生成uibc報文。

在本實施例中,所述預設語音指令與所述uibc報文中控制信號段存在一個映射表,即不同的預設語音指令對應不同的控制信號段。所述控制信號段為控制傳送端設備行為對應的數(shù)據(jù)段。所述映射關系可以為所述預設語音指令與通用輸入的信息的映射關系,或者所述預設語音指令與人機接口設備類(hidc)的信息的對應關系,即將所述語音控制指令轉(zhuǎn)換為相應的通用輸入控制信號或者人機接口設備類(hidc)控制信號,然后根據(jù)uibc協(xié)議將所述通用輸入的信息或者人機接口設備類(hidc)的信息生成uibc報文,進一步地,可以在所述uibc協(xié)議中定義所述預設控制指令的控制信號段內(nèi)容,在將所述預設語音指令生成uibc報文時,則在將預設的語音指令生成uibc報文時即可直接根據(jù)所述uibc協(xié)議生成對應的uibc報文。

本實施例通過將所述預設語音指令轉(zhuǎn)換為uibc協(xié)議中定義的指令,從而使得所述預設語音指令能控制所述傳送端設備的行為,增加了uibc功能的反 饋形式。

上述本發(fā)明實施例序號僅僅為了描述,不代表實施例的優(yōu)劣。通過以上的實施方式的描述,本領域的技術(shù)人員可以清楚地了解到上述實施例方法可借助軟件加必需的通用硬件平臺的方式來實現(xiàn),當然也可以通過硬件,但很多情況下前者是更佳的實施方式?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)(如rom/ram、磁碟、光盤)中,包括若干指令用以使得一臺終端設備(可以是手機,計算機,服務器,空調(diào)器,或者網(wǎng)絡設備等)執(zhí)行本發(fā)明各個實施例所述的方法。

以上僅為本發(fā)明的優(yōu)選實施例,并非因此限制本發(fā)明的專利范圍,凡是利用本發(fā)明說明書及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效流程變換,或直接或間接運用在其他相關的技術(shù)領域,均同理包括在本發(fā)明的專利保護范圍內(nèi)。

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
乐清市| 承德县| 时尚| 建始县| 阜平县| 汝南县| 漯河市| 屏东县| 大方县| 依安县| 华阴市| 临沧市| 莱阳市| 泸溪县| 延津县| 遂川县| 金溪县| 华容县| 星子县| 武宣县| 噶尔县| 南阳市| 庐江县| 云梦县| 广水市| 新余市| 宜良县| 镇江市| 沂水县| 宁陕县| 湟中县| 库尔勒市| 甘肃省| 林西县| 南漳县| 微博| 太原市| 精河县| 老河口市| 溆浦县| 兴海县|