本發(fā)明涉及一種語(yǔ)音交互技術(shù)領(lǐng)域,尤其涉及一種語(yǔ)音尋向系統(tǒng)及方法。
背景技術(shù):
語(yǔ)音識(shí)別系統(tǒng)需要采集使用者的語(yǔ)音信號(hào)進(jìn)行識(shí)別,而環(huán)境中通常存在除語(yǔ)音外的噪聲,噪聲隨使用者的語(yǔ)音被采集后將嚴(yán)重影響語(yǔ)音識(shí)別的正確率,因此濾除噪聲是語(yǔ)音識(shí)別系統(tǒng)的重要技術(shù)問(wèn)題。
現(xiàn)有的噪聲濾除方案通常通過(guò)雙麥克風(fēng)系統(tǒng)分別采集語(yǔ)音樣本和噪聲樣本進(jìn)行濾波實(shí)現(xiàn)噪聲濾除,但是雙麥克風(fēng)系統(tǒng)只能用于語(yǔ)音聲源方向固定的掌上設(shè)備,當(dāng)用于桌面型設(shè)備時(shí),由于無(wú)法對(duì)聲源方向進(jìn)行定位,因而無(wú)法獲得好的噪聲濾除效果。
技術(shù)實(shí)現(xiàn)要素:
針對(duì)現(xiàn)有技術(shù)存在的問(wèn)題,現(xiàn)提供了一種應(yīng)用于桌面語(yǔ)音識(shí)別系統(tǒng)的語(yǔ)音尋向系統(tǒng)及方法。
具體的技術(shù)方案如下:
一種語(yǔ)音尋向系統(tǒng),包括:
圓形底板;
麥克風(fēng)陣列,包括至少八個(gè)mems麥克風(fēng),其中至少八個(gè)所述mems麥克風(fēng)呈圓周狀設(shè)置于所述圓形底板的正面上,所述圓形底板的對(duì)應(yīng)的圓心位置還設(shè)有一個(gè)mems麥克風(fēng),所述麥克風(fēng)陣列用以采集語(yǔ)音信號(hào);
識(shí)別模塊,與各個(gè)所述mems麥克風(fēng)連接,用以識(shí)別所述麥克風(fēng)陣列中離所述語(yǔ)音信號(hào)的聲源最近的mems麥克風(fēng)。
優(yōu)選的,相鄰兩個(gè)所述mems麥克風(fēng)之間的距離相等。
優(yōu)選的,還包括一支架,所述支架設(shè)置于所述圓形底板的背面,用以將所述圓形底板連接至一殼體內(nèi),所述支架與所述圓形底板之間設(shè)置有防震結(jié)構(gòu)。
優(yōu)選的,還包括:
處理模塊,與各個(gè)所述mems麥克風(fēng)連接,用以對(duì)所述語(yǔ)音信號(hào)進(jìn)行處理,以輸出聲音信號(hào)。
優(yōu)選的,還包括:
揚(yáng)聲器,與所述處理模塊連接,用以播放所述聲音信號(hào)。
優(yōu)選的,所述揚(yáng)聲器與所述麥克風(fēng)陣列之間的距離大于20厘米。
優(yōu)選的,呈圓周狀設(shè)置的所述mems麥克風(fēng)所在圓周的半徑大于80毫米。
優(yōu)選的,還包括:
與所述mems麥克風(fēng)數(shù)量適配的顯示模塊,所述顯示模塊與對(duì)應(yīng)的所述mems麥克風(fēng)連接,并且所述顯示模塊還與所述識(shí)別模塊連接,以及所述識(shí)別模塊還用以于確定所述離所述語(yǔ)音信號(hào)的聲源最近的mems麥克風(fēng)后,控制所述離聲源最近的mems麥克風(fēng)對(duì)應(yīng)的顯示模塊顯示相應(yīng)的信息。
一種語(yǔ)音尋向方法,包括:
步驟s1,麥克風(fēng)陣列中的多個(gè)mems麥克風(fēng)采集語(yǔ)音信號(hào);
步驟s2,識(shí)別多個(gè)麥克風(fēng)陣列中離所述語(yǔ)音信號(hào)的聲源最近的mems麥克風(fēng),以確定所述語(yǔ)音信號(hào)的方向;
其中,麥克風(fēng)陣列包括至少九個(gè)mems麥克風(fēng),其中至少八個(gè)所述mems麥克風(fēng)分布于一圓周上,另一個(gè)所述麥克風(fēng)設(shè)置于所述圓周對(duì)應(yīng)的圓心位置。
優(yōu)選的,于所述步驟s2之后,還包括:
步驟s3,控制與離所述語(yǔ)音信號(hào)的聲源最近的mems麥克風(fēng)對(duì)應(yīng)的顯示模塊顯示相應(yīng)的信息。
上述技術(shù)方案的有益效果是:
上述技術(shù)方案通過(guò)設(shè)置一麥克風(fēng)陣列采集一聲源發(fā)出的語(yǔ)音信號(hào),并且通過(guò)多個(gè)mems麥克風(fēng)識(shí)別出離聲源最近的mems麥克風(fēng),能夠?qū)φZ(yǔ)音信號(hào)的來(lái)源方向有一個(gè)較為準(zhǔn)確的判斷。
附圖說(shuō)明
圖1-圖2為本發(fā)明一種語(yǔ)音尋向系統(tǒng)的結(jié)構(gòu)示意圖;
圖3為本發(fā)明一種語(yǔ)音尋向方法的流程圖。
具體實(shí)施方式
需要說(shuō)明的是,在不沖突的情況下,下述技術(shù)方案,技術(shù)特征之間可以相互組合。
下面結(jié)合附圖對(duì)本發(fā)明的具體實(shí)施方式作進(jìn)一步的說(shuō)明:
本實(shí)施例提供了一種語(yǔ)音尋向系統(tǒng),如圖1所示,包括:
圓形底板1;
麥克風(fēng)陣列,包括至少八個(gè)mems(microelectromechanicalsystem,微機(jī)電系統(tǒng))麥克風(fēng)2,其中至少八個(gè)mems麥克風(fēng)2呈圓周狀設(shè)置于圓形底板1的正面上,圓形底板1的對(duì)應(yīng)的圓心位置還設(shè)有一個(gè)mems麥克風(fēng)2,麥克風(fēng)陣列用以采集語(yǔ)音信號(hào);
識(shí)別模塊,與各個(gè)mems麥克風(fēng)2連接,用以識(shí)別麥克風(fēng)陣列中離語(yǔ)音信號(hào)的聲源最近的mems麥克風(fēng)2。
例如,本實(shí)施例中的識(shí)別模塊可以通過(guò)識(shí)別語(yǔ)音信號(hào)強(qiáng)度確定麥克風(fēng)陣列2中哪一個(gè)mems麥克風(fēng)2距離語(yǔ)音信號(hào)的聲源最近。
進(jìn)一步的,可通過(guò)關(guān)閉除距離語(yǔ)音信號(hào)的聲源最近的mems麥克風(fēng)2外的其他mems麥克風(fēng)2,以防止環(huán)境中的噪音被拾取。
進(jìn)一步的,可通過(guò)關(guān)閉除距離語(yǔ)音信號(hào)的聲源最近的mems麥克風(fēng)2及距離語(yǔ)音信號(hào)的聲源最遠(yuǎn)的mems麥克風(fēng)2外的其他mems麥克風(fēng)2,從而實(shí)現(xiàn)一個(gè)雙麥克風(fēng)系統(tǒng),以分別拾取語(yǔ)音樣本和噪聲樣本,實(shí)現(xiàn)進(jìn)一步的濾波操作。其中,距離語(yǔ)音信號(hào)的聲源最遠(yuǎn)的mems麥克風(fēng)2可選擇圓形底板1上與距離語(yǔ)音信號(hào)的聲源最近的mems麥克風(fēng)2距離最遠(yuǎn)的mems麥克風(fēng)2。
圖1中的麥克風(fēng)陣列以9個(gè)mems麥克風(fēng)2進(jìn)行舉例,但是具體的mems麥克風(fēng)2的個(gè)數(shù)可以根據(jù)實(shí)際情況進(jìn)行設(shè)定。
本發(fā)明一個(gè)較佳的實(shí)施例中,相鄰兩個(gè)mems麥克風(fēng)2之間的距離相等。
本實(shí)施例中,可以通過(guò)等距離的mems麥克風(fēng)2提高判斷語(yǔ)音信號(hào)來(lái)源方向的精度。
本發(fā)明一個(gè)較佳的實(shí)施例中,還包括一支架,支架設(shè)置于圓形底板1的背面,用以將圓形底板連接至一殼體內(nèi),支架與圓形底板之間設(shè)置有防震結(jié)構(gòu)。
例如,本實(shí)施例中的防震結(jié)構(gòu)可以為橡膠墊,防止由于外部聲音產(chǎn)生的振動(dòng)造成mems麥克風(fēng)2諧振,從而影響拾音效果。
本發(fā)明一個(gè)較佳的實(shí)施例中,還包括:
處理模塊,與各個(gè)mems麥克風(fēng)2連接,用以對(duì)語(yǔ)音信號(hào)進(jìn)行處理,以輸出聲音信號(hào)。
本發(fā)明一個(gè)較佳的實(shí)施例中,還包括:
揚(yáng)聲器,與處理模塊連接,用以播放聲音信號(hào)。
上述實(shí)施例中,處理模塊能夠?qū)⒄Z(yǔ)音信號(hào)轉(zhuǎn)換為聲音信號(hào),由揚(yáng)聲器輸出聲音信號(hào),實(shí)現(xiàn)語(yǔ)音信號(hào)的播放。
本發(fā)明一個(gè)較佳的實(shí)施例中,揚(yáng)聲器與麥克風(fēng)陣列之間的距離大于20厘米。
本實(shí)施例中,20厘米可以為信號(hào)干擾的安全距離,將揚(yáng)聲器與麥克風(fēng)之間的距離設(shè)置為大于20厘米,避免語(yǔ)音信號(hào)和聲音信號(hào)之間的干擾。
本發(fā)明一個(gè)較佳的實(shí)施例中,呈圓周狀設(shè)置的mems麥克風(fēng)2所在圓周的半徑大于80毫米。
本實(shí)施例中,通過(guò)呈半徑大于80毫米的圓周狀設(shè)置的mems麥克風(fēng)2,能夠便于識(shí)別模塊對(duì)離聲源最近的mems麥克風(fēng)2進(jìn)行方向的識(shí)別。
本發(fā)明一個(gè)較佳的實(shí)施例中,如圖2所示,還包括:
與mems麥克風(fēng)2數(shù)量適配的顯示模塊3,顯示模塊3與對(duì)應(yīng)的mems麥克風(fēng)2連接,并且顯示模塊3還與識(shí)別模塊連接,以及識(shí)別模塊還用以于確定離語(yǔ)音信號(hào)的聲源最近的mems麥克風(fēng)2后,控制離聲源最近的mems麥克風(fēng)2對(duì)應(yīng)的顯示模塊3顯示相應(yīng)的信息。
例如,本實(shí)施例中的顯示模塊可以為led(lightemittingdiode,發(fā)光二極管)燈,確定離聲源最近的mems麥克風(fēng)2后識(shí)別模塊可以控制與該mems麥克風(fēng)適配的led燈點(diǎn)亮,能夠起到對(duì)用戶(hù)的提示作用,提高用戶(hù)的體驗(yàn)。
本實(shí)施例提供了一種語(yǔ)音尋向方法,如圖3所示,包括:
步驟s1,麥克風(fēng)陣列中的多個(gè)mems麥克風(fēng)采集語(yǔ)音信號(hào);
步驟s2,識(shí)別多個(gè)麥克風(fēng)陣列中離語(yǔ)音信號(hào)的聲源最近的mems麥克風(fēng),以確定語(yǔ)音方向。
其中,麥克風(fēng)陣列包括至少九個(gè)mems麥克風(fēng),其中至少八個(gè)mems麥克風(fēng)分布于一圓周上,另一個(gè)麥克風(fēng)設(shè)置于圓周對(duì)應(yīng)的圓心位置。
本發(fā)明一個(gè)較佳的實(shí)施例中,于步驟s2之后,還包括:
步驟s3,控制與離語(yǔ)音信號(hào)的聲源最近的mems麥克風(fēng)對(duì)應(yīng)的顯示模塊顯示相應(yīng)的信息。
本實(shí)施例中,通過(guò)將多個(gè)mems麥克風(fēng)進(jìn)行圓周布局的設(shè)置,確定哪個(gè)mems麥克風(fēng)與語(yǔ)音信號(hào)的聲源距離最近。
進(jìn)一步的,在確定與聲源最近的mems麥克風(fēng)后,該mems麥克風(fēng)適配的顯示模塊顯示相應(yīng)的信息,例如顯示模塊可以是led燈,在確定與聲源最近的mems麥克風(fēng)后,點(diǎn)亮該mems麥克風(fēng)適配的led燈。
綜上,上述技術(shù)方案通過(guò)設(shè)置一麥克風(fēng)陣列采集一聲源發(fā)出的語(yǔ)音信號(hào),并且通過(guò)多個(gè)mems麥克風(fēng)識(shí)別出離聲源最近的mems麥克風(fēng),能夠?qū)φZ(yǔ)音信號(hào)的來(lái)源方向有一個(gè)較為準(zhǔn)確的判斷。
通過(guò)說(shuō)明和附圖,給出了具體實(shí)施方式的特定結(jié)構(gòu)的典型實(shí)施例,基于本發(fā)明精神,還可作其他的轉(zhuǎn)換。盡管上述發(fā)明提出了現(xiàn)有的較佳實(shí)施例,然而,這些內(nèi)容并不作為局限。
對(duì)于本領(lǐng)域的技術(shù)人員而言,閱讀上述說(shuō)明后,各種變化和修正無(wú)疑將顯而易見(jiàn)。因此,所附的權(quán)利要求書(shū)應(yīng)看作是涵蓋本發(fā)明的真實(shí)意圖和范圍的全部變化和修正。在權(quán)利要求書(shū)范圍內(nèi)任何和所有等價(jià)的范圍與內(nèi)容,都應(yīng)認(rèn)為仍屬本發(fā)明的意圖和范圍內(nèi)。