本實用新型涉及信號處理技術(shù)領(lǐng)域,尤其涉及一種音頻信號處理系統(tǒng)。
背景技術(shù):
語音交互,已經(jīng)遍及我們生活的各個領(lǐng)域,如手機、電視、車載、空調(diào)等等領(lǐng)域。能夠進行正常語音交互的前提是準(zhǔn)確識別語音信號。以手機終端為例,由于環(huán)境噪聲的存在,手機終端的麥克風(fēng)在采集用戶的有效聲源信號的同時,也會采集到環(huán)境噪聲信號,這些環(huán)境噪聲信號會對有效聲源信號的準(zhǔn)確識別造成干擾,因此,需要對麥克風(fēng)采集到的語音信號進行降噪處理,降低噪聲對聲源信號的影響。
現(xiàn)有的一種較為常見的降噪處理方式是采用雙麥克風(fēng)進行降噪處理。雙麥克風(fēng)降噪主要思想是在終端上設(shè)置兩個麥克風(fēng),理想情況下主麥克風(fēng)采集的主麥克風(fēng)信號為帶環(huán)境噪聲的語音信號,輔麥克風(fēng)采集的輔麥克風(fēng)信號僅包括環(huán)境噪聲,且主、輔麥克風(fēng)采集的環(huán)境噪聲特性一致,兩者相減則得到純凈的聲源信號。
目前,在諸如手機終端等場景中,用戶在使用手機終端時,聲音源方位相對固定,從而雙麥克風(fēng)位置固定,即靠近用戶說話的位置處設(shè)置主麥克風(fēng),遠離用戶說話的位置設(shè)置輔麥克風(fēng)。但是,隨著各種智能交互產(chǎn)品的不斷問世,語音交互的場景發(fā)生了很大改變,聲音源相對智能交互產(chǎn)品的方位不再固定不變,此時,固定設(shè)置某個麥克風(fēng)作為主麥克風(fēng)、另一麥克風(fēng)作為輔麥克風(fēng)已經(jīng)不能靈活適應(yīng)智能語音交互場景的需求,很可能導(dǎo)致聲源信號的識別準(zhǔn)確性大大降低。
技術(shù)實現(xiàn)要素:
有鑒于此,本實用新型實施例提供一種音頻信號處理系統(tǒng),能夠自適應(yīng)語音交互場景,有助于提高語音識別結(jié)果的準(zhǔn)確性。
本實用新型實施例提供一種音頻信號處理系統(tǒng),包括:
背向設(shè)置的第一麥克風(fēng)陣列和第二麥克風(fēng)陣列,連接組件,控制器,以及降噪組件;其中,
所述第一麥克風(fēng)陣列和所述第二麥克風(fēng)陣列的設(shè)置間距大于預(yù)設(shè)距離;
所述控制器上設(shè)置有主麥克接口和輔麥克接口;
所述降噪組件的輸入端與所述控制器連接;
所述連接組件,用于使所述第一麥克風(fēng)陣列和所述第二麥克風(fēng)陣列與所述主麥克接口和所述輔麥克接口具有當(dāng)前的輸入連接關(guān)系;
所述控制器,用于對從所述主麥克接口接收到的第一音頻信號與從所述輔麥克接口接收到的第二音頻信號進行信號強度比較,根據(jù)比較結(jié)果通過所述連接組件保持或改變所述輸入連接關(guān)系。
可選地,所述連接組件包括切換開關(guān)。
可選地,所述控制器具體用于:
在確定所述第一音頻信號的信號強度小于所述第二音頻信號的信號強度時,向所述切換開關(guān)發(fā)送切換控制信號,以控制所述切換開關(guān)改變所述輸入連接關(guān)系。
可選地,所述第一麥克風(fēng)陣列和所述第二麥克風(fēng)陣為線性麥克風(fēng)陣列,所述第一麥克風(fēng)陣列和所述第二麥克風(fēng)陣列分別覆蓋180度的音頻采集范圍。
可選地,所述第一麥克風(fēng)陣列和所述第二麥克風(fēng)陣列設(shè)置在機器人機身上、距離地面相同高度的位置。
可選地,該系統(tǒng)還包括:
第一防塵防風(fēng)裝置和第二防塵防風(fēng)裝置;
所述第一麥克風(fēng)陣列安裝在所述第一防塵防風(fēng)裝置內(nèi),所述第二麥克風(fēng)陣列安裝在所述第二防塵防風(fēng)裝置內(nèi)。
可選地,該系統(tǒng)還包括:
語音識別組件和交互組件;
所述語音識別組件分別與所述降噪組件的輸出端和所述控制器連接,用于對降噪后的音頻信號進行語音識別,將語音識別結(jié)果輸入給所述控制器;
所述控制器還用于根據(jù)所述語音識別結(jié)果控制所述交互組件進行相應(yīng)的交互反饋。
本實用新型實施例提供的音頻信號處理系統(tǒng),該系統(tǒng)中包括背向間隔設(shè)置的第一麥克風(fēng)陣列和第二麥克風(fēng)陣列,連接組件,控制器,以及降噪組件,控制器上設(shè)置有主麥克接口和輔麥克接口。假設(shè)當(dāng)前連接組件使得第一麥克風(fēng)陣列和第二麥克風(fēng)陣列與主麥克接口和輔麥克接口具有某種輸入連接關(guān)系,在該輸入連接關(guān)系下,控制器對從主麥克接口接收到的第一音頻信號與從輔麥克接口接收到的第二音頻信號進行信號強度比較,以根據(jù)比較結(jié)果控制連接組件保持或改變輸入連接關(guān)系。也就是說,如果發(fā)現(xiàn)在該輸入連接關(guān)系下,從主麥克接口輸入的第一音頻信號的信號強度小于從輔麥克輸入的第二音頻信號的信號強度,則說明與主麥克接口連接的麥克風(fēng)陣列不應(yīng)該再連接在主麥克接口,應(yīng)該切換連接到輔麥克接口,從而切換兩個麥克風(fēng)陣列與主、輔麥克接口的連接關(guān)系,從而實現(xiàn)了根據(jù)音頻信號強度自適應(yīng)地切換主、輔麥克接口輸入信號,以自適應(yīng)當(dāng)前的智能語音交互場景,也保證了良好的降噪效果,有助于提高語音識別結(jié)果的準(zhǔn)確性。
附圖說明
為了更清楚地說明本實用新型實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本實用新型的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本實用新型實施例提供的音頻信號處理系統(tǒng)實施例一的結(jié)構(gòu)示意圖;
圖2為本實用新型實施例提供的音頻信號處理系統(tǒng)實施例二的結(jié)構(gòu)示意圖。
具體實施方式
為使本實用新型實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本實用新型實施例中的附圖,對本實用新型實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是本實用新型一部分實施例,而不是全部的實施例?;诒緦嵱眯滦椭械膶嵤├绢I(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本實用新型保護的范圍。
在本實用新型實施例中使用的術(shù)語是僅僅出于描述特定實施例的目的,而非旨在限制本實用新型。在本實用新型實施例和所附權(quán)利要求書中所使用的單數(shù)形式的“一種”、“所述”和“該”也旨在包括多數(shù)形式,除非上下文清楚地表示其他含義,“多種”一般包含至少兩種,但是不排除包含至少一種的情況。
應(yīng)當(dāng)理解,本文中使用的術(shù)語“和/或”僅僅是一種描述關(guān)聯(lián)對象的關(guān)聯(lián)關(guān)系,表示可以存在三種關(guān)系,例如,A和/或B,可以表示:單獨存在A,同時存在A和B,單獨存在B這三種情況。另外,本文中字符“/”,一般表示前后關(guān)聯(lián)對象是一種“或”的關(guān)系。
應(yīng)當(dāng)理解,盡管在本實用新型實施例中可能采用術(shù)語第一、第二、第三等來描述XXX,但這些XXX不應(yīng)限于這些術(shù)語。這些術(shù)語僅用來將XXX彼此區(qū)分開。例如,在不脫離本實用新型實施例范圍的情況下,第一XXX也可以被稱為第二XXX,類似地,第二XXX也可以被稱為第一XXX。
取決于語境,如在此所使用的詞語“如果”、“若”可以被解釋成為“在……時”或“當(dāng)……時”或“響應(yīng)于確定”或“響應(yīng)于檢測”。類似地,取決于語境,短語“如果確定”或“如果檢測(陳述的條件或事件)”可以被解釋成為“當(dāng)確定時”或“響應(yīng)于確定”或“當(dāng)檢測(陳述的條件或事件)時”或“響應(yīng)于檢測(陳述的條件或事件)”。
還需要說明的是,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的商品或者系統(tǒng)不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種商品或者系統(tǒng)所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的商品或者系統(tǒng)中還存在另外的相同要素。
圖1為本實用新型實施例提供的音頻信號處理系統(tǒng)實施例一的結(jié)構(gòu)示意圖,如圖1所示,該系統(tǒng)包括:
背向設(shè)置的第一麥克風(fēng)陣列1和第二麥克風(fēng)陣列2,連接組件3,控制器4,以及降噪組件5。
其中,為了保證第一麥克風(fēng)陣列1和第二麥克風(fēng)陣列2分別采集的音頻信號具有一定的區(qū)分度,第一麥克風(fēng)陣列1和第二麥克風(fēng)陣列2的設(shè)置間距需要大于預(yù)設(shè)距離,該預(yù)設(shè)距離可以根據(jù)實際應(yīng)用環(huán)境而設(shè)定。
第一麥克風(fēng)陣列1和第二麥克風(fēng)陣2具有相同的陣列結(jié)構(gòu),可選地,可以采用現(xiàn)有技術(shù)中已經(jīng)提供的任一陣列結(jié)構(gòu),比如可以為線性麥克風(fēng)陣列。
另外,為了保證這兩個麥克風(fēng)陣列作為一個整體能夠?qū)崿F(xiàn)音頻信號的全向采集即360度采集,同時,保證單個麥克風(fēng)陣列具有一定的聲音指向性,避免不相關(guān)環(huán)境噪聲對其采集音頻信號的過多干擾,可以設(shè)置令第一麥克風(fēng)陣列1和第二麥克風(fēng)陣列2分別覆蓋180度的音頻采集范圍。
本實施例中提供的上述音頻信號處理系統(tǒng)可以適用于多種智能交互產(chǎn)品中,本實施例中,以應(yīng)用在智能移動機器人中為例。此時,第一麥克風(fēng)陣列1和第二麥克風(fēng)陣列2可以設(shè)置在機器人機身上、距離地面相同高度的位置,比如:第一麥克風(fēng)陣列1和第二麥克風(fēng)陣列2可以設(shè)置在機器人頭部的前、后兩側(cè)。
當(dāng)該機器人被啟動語音交互功能后,第一麥克風(fēng)陣列1和第二麥克風(fēng)陣列2分別用于采集用戶交互語音。
如圖1所示,作為采集外部音頻信號的音頻采集器件的第一麥克風(fēng)陣列1和第二麥克風(fēng)陣列2通過一個連接組件3與控制器4連接。具體地,控制器4上設(shè)置有主麥克接口41和輔麥克接口42,連接組件3使得第一麥克風(fēng)陣列1和第二麥克風(fēng)陣列2與主麥克接口41和輔麥克接口42具有當(dāng)前的輸入連接關(guān)系。
其中,主麥克接口41和輔麥克接口42可以被視為是對這兩個麥克風(fēng)陣列分別采集的音頻信號的信號屬性的表征。具體來說,可以將從主麥克接口41輸入的音頻信號視為聲音源信號,即含有有效語音成分更多的信號,將從輔麥克接口42輸入的音頻信號視為噪聲信號。
其中,當(dāng)前的輸入連接關(guān)系可以是預(yù)先默認(rèn)設(shè)置的某個連接關(guān)系,也可以是上一次語音交互時所采用的連接關(guān)系。舉例來說,假設(shè)當(dāng)前的輸入連接關(guān)系是,連接組件3使得第一麥克風(fēng)陣列1與主麥克接口41連接,第二麥克風(fēng)陣列2與輔麥克接口42連接。那么此時,控制器4將從主麥克接口41接收到第一麥克風(fēng)陣列1采集的音頻信號,從輔麥克接口42接收到第二麥克風(fēng)陣列2采集的音頻信號。
在上述當(dāng)前的輸入連接關(guān)系下,此時如果用戶觸發(fā)了語音輸入,則第一麥克風(fēng)陣列1和第二麥克風(fēng)陣列2分別采集到音頻信號,并基于當(dāng)前的輸入連接關(guān)系,這兩個麥克風(fēng)陣列將各自采集到的音頻信號輸入控制器,此時,控制器4對從主麥克接口41接收到的第一音頻信號與從輔麥克接口42接收到的第二音頻信號進行信號強度比較,根據(jù)比較結(jié)果通過連接組件3保持或改變當(dāng)前的該輸入連接關(guān)系。
在上述舉例中,此時的第一音頻信號為第一麥克風(fēng)陣列1采集到的音頻信號,第二音頻信號為第二麥克風(fēng)陣列2采集到的音頻信號,控制器4可以通過對這兩個音頻信號分別進行一定的信號處理,比如放大、濾波等處理,求取這兩個音頻信號的信號強度,進行比較。
如果比較結(jié)果顯示第一音頻信號的信號強度大于第二音頻信號的信號強度,說明此時從主麥克接口41輸入的第一音頻信號確實為聲音源信號,從輔麥克接口42輸入的第二音頻信號為噪聲信號,當(dāng)前無需改變第一麥克風(fēng)陣列1與主麥克接口41的連接關(guān)系以及第二麥克風(fēng)陣列2與輔麥克接口42的連接關(guān)系。
相反地,如果比較結(jié)果顯示第一音頻信號的信號強度小于第二音頻信號的信號強度,說明此時從主麥克接口41輸入的第一音頻信號應(yīng)該視為噪聲信號,而從輔麥克接口42輸入的第二音頻信號應(yīng)該為聲音源信號,則需要改變第一麥克風(fēng)陣列1與主麥克接口41的連接關(guān)系以及第二麥克風(fēng)陣列2與輔麥克接口42的連接關(guān)系,改變?yōu)榈谝畸溈孙L(fēng)陣列1與輔麥克接口42連接,第二麥克風(fēng)陣列2與主麥克接口41連接。
其中,該輸入連接關(guān)系的改變可以是控制器4通過控制連接組件3來實現(xiàn)的,具體可選地,連接組件3可以實現(xiàn)為切換開關(guān),從而,控制器4可以在確定其從主麥克接口41收到的第一音頻信號的信號強度小于其從輔麥克接口42收到的第二音頻信號的信號強度時,向切換開關(guān)發(fā)送切換控制信號,以控制切換開關(guān)改變當(dāng)前的輸入連接關(guān)系。
本實施例中,可選地,控制器4可以使用各種應(yīng)用專用集成電路(AS IC)、數(shù)字信號處理器(DSP)、數(shù)字信號處理設(shè)備(DSPD)、可編程邏輯器件(PLD)、現(xiàn)場可編程門陣列(FPGA)、微中控元件、微處理器或其他電子元件實現(xiàn)。
在執(zhí)行完上述主、輔麥克接口的輸入音頻信號的切換控制后,可以基于雙麥克降噪原理,采用降噪組件5對輸入的兩路音頻信號進行降噪處理。
具體地,降噪組件5的輸入端與控制器4連接,控制器4可以將其不斷從主、輔麥克接口接收到的音頻信號輸入到降噪組件5的輸入端。具體來說,降噪組件5一般具有主信號輸入端和輔信號輸入端,主信號輸入端用于輸入主麥克接口41接收到的音頻信號,輔信號輸入端用于輸入輔麥克接口42接收到的音頻信號,以主信號輸入端和輔信號輸入端輸入的音頻信號做相減運算,完成降噪處理。該降噪處理過程僅為簡單示意性描述,實際的降噪處理過程可以參見現(xiàn)有技術(shù)的處理過程。
值得說明的是,在上述切換控制策略中,切換與否的依據(jù)是基于已經(jīng)通過主、輔麥克接口輸入的音頻信號的信號強度,該已經(jīng)輸入的音頻信號相對于一次語音交互過程中輸入的全部音頻信號而言,是非常短的,因此理想情況下,該部分音頻信號可以認(rèn)為只用于切換判定之用,對于后續(xù)的降噪、語音識別過程沒有影響,即不會輸入到后續(xù)組件中。
本實施例中,假設(shè)當(dāng)前連接組件使得第一麥克風(fēng)陣列和第二麥克風(fēng)陣列與主麥克接口和輔麥克接口具有某種輸入連接關(guān)系,在該輸入連接關(guān)系下,控制器對從主麥克接口接收到的第一音頻信號與從輔麥克接口接收到的第二音頻信號進行信號強度比較,以根據(jù)比較結(jié)果控制連接組件保持或改變輸入連接關(guān)系。也就是說,如果發(fā)現(xiàn)在該輸入連接關(guān)系下,從主麥克接口輸入的第一音頻信號的信號強度小于從輔麥克輸入的第二音頻信號的信號強度,則說明與主麥克接口連接的麥克風(fēng)陣列不應(yīng)該再連接在主麥克接口,應(yīng)該切換連接到輔麥克接口,從而切換兩個麥克風(fēng)陣列與主、輔麥克接口的連接關(guān)系,從而實現(xiàn)了根據(jù)音頻信號強度自適應(yīng)地切換主、輔麥克接口輸入信號,以自適應(yīng)當(dāng)前的智能語音交互場景,也保證了良好的降噪效果,有助于提高語音識別結(jié)果的準(zhǔn)確性。
圖2為本實用新型實施例提供的音頻信號處理系統(tǒng)實施例二的結(jié)構(gòu)示意圖,如圖2所示,在圖1所示實施例基礎(chǔ)上,可選地,該系統(tǒng)還包括:
第一防塵防風(fēng)裝置6和第二防塵防風(fēng)裝置7。其中,第一麥克風(fēng)陣列1安裝在第一防塵防風(fēng)裝置6內(nèi),第二麥克風(fēng)陣列2安裝在第二防塵防風(fēng)裝置7內(nèi)。
本實施例中,為了物理上盡量保證環(huán)境因素對語音識別結(jié)果的不利影響,在麥克風(fēng)陣列的組裝工藝上提供了第一防塵防風(fēng)裝置6和第二防塵防風(fēng)裝置7,以盡量降低環(huán)境因素對語音識別結(jié)果的不利影響。
其中,第一防塵防風(fēng)裝置6和第二防塵防風(fēng)裝置7中比如包括防風(fēng)棉、防塵網(wǎng)等結(jié)構(gòu),以降低風(fēng)聲、粉塵對麥克風(fēng)陣列的影響。
可選地,該系統(tǒng)還包括:語音識別組件8和交互組件9。
其中,語音識別組件8分別與降噪組件5的輸出端和控制器4連接,用于對降噪后的音頻信號進行語音識別,將語音識別結(jié)果輸入給控制器4。
控制器4還用于根據(jù)語音識別結(jié)果控制交互組件9進行相應(yīng)的交互反饋。
本實用新型實施例提供的音頻信號處理系統(tǒng)一般適用于智能語音交互的產(chǎn)品中,為了實現(xiàn)智能語音交互功能,在通過降噪組件5對輸入的音頻信號進行了降噪處理后,降噪后的音頻信號輸入給語音識別組件,以完成用戶輸入語音的語音識別處理。同時,為了實現(xiàn)基于語音的智能交互,以機器人為例,需要基于語音識別結(jié)果向用戶進行相應(yīng)的反饋。本實施例中,以機器人為例,該交互組件9比如可以是語音播放器,控制器4可以基于語音識別結(jié)果通過語音播放器向用戶反饋應(yīng)答語音;再比如可以是顯示屏,控制器4可以基于語音識別結(jié)果通過顯示屏向用戶反饋某種業(yè)務(wù)操作界面;再比如還可以是運動部件,控制器4可以基于語音識別結(jié)果通過控制運動部件使機器人執(zhí)行相應(yīng)的反饋動作,等等。
以上所描述的系統(tǒng)實施例僅僅是示意性的,其中所述作為分離部件說明的單元(諸如各種組件、裝置等)可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部模塊來實現(xiàn)本實施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性的勞動的情況下,即可以理解并實施。
通過以上的實施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到各實施方式可借助加必需的通用硬件平臺的方式來實現(xiàn),當(dāng)然也可以通過硬件。基于這樣的理解,上述技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分可以以產(chǎn)品的形式體現(xiàn)出來,該計算機產(chǎn)品可以存儲在計算機可讀存儲介質(zhì)中,如ROM/RAM、磁碟、光盤等,包括若干指令用以使得一臺計算機裝置(可以是個人計算機,服務(wù)器,或者網(wǎng)絡(luò)裝置等)執(zhí)行各個實施例或者實施例的某些部分所述的方法。
最后應(yīng)說明的是:以上實施例僅用以說明本實用新型的技術(shù)方案,而非對其限制;盡管參照前述實施例對本實用新型進行了詳細的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述各實施例所記載的技術(shù)方案進行修改,或者對其中部分技術(shù)特征進行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本實用新型各實施例技術(shù)方案的精神和范圍。