用于嘈雜環(huán)境中語音信號(hào)分離的頭戴式耳機(jī)的制作方法

文檔序號(hào)：2829191閱讀：1835來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：：用于嘈雜環(huán)境中語音信號(hào)分離的頭戴式耳機(jī)的制作方法
技術(shù)領(lǐng)域：
：本發(fā)明涉及一種用于從嘈雜的聲環(huán)境分離語音信號(hào)的電子通信設(shè)備。更具體地，本發(fā)明的一個(gè)實(shí)施例提供了一種用于生成語音信號(hào)的頭戴式耳機(jī)(headset)或耳塞(earpiece)。
背景技術(shù)：
：聲環(huán)境通常是嘈雜的，因此難于可靠地檢測(cè)期望的信息信號(hào)并對(duì)之產(chǎn)生影響。例如，一個(gè)人可以期望利用語音通信信道與另一個(gè)人進(jìn)行通信。所述信道例如可以由移動(dòng)無線手持裝置、步談機(jī)、雙向無線電裝置或其他通信設(shè)備來提供。為了改進(jìn)可用性，人們可以利用與上述通信設(shè)備相連的頭戴式耳機(jī)或耳塞。頭戴式耳機(jī)或耳塞通常具有一個(gè)或多個(gè)耳用揚(yáng)聲器和麥克風(fēng)。麥克風(fēng)通常在話筒吊桿(boom)上向人的嘴延伸，以提高麥克風(fēng)拾取人講話聲音的可能性。人在講話時(shí)，麥克風(fēng)接收人的語音信號(hào)并將其轉(zhuǎn)換成電子信號(hào)。麥克風(fēng)還會(huì)接收到來自各種噪聲源的聲音信號(hào)，因此在電子信號(hào)中還會(huì)包括噪聲成分。由于手持裝置可以使麥克風(fēng)距離人嘴幾英寸，而環(huán)境可具有許多無法控制的噪聲源，因此最后獲得的電子信號(hào)可以具有實(shí)質(zhì)的噪聲成分。這種實(shí)質(zhì)的噪聲導(dǎo)致令人不滿意的通信過程，并且可以導(dǎo)致通信設(shè)備無法有效地工作，從而增加電池的消耗。在一個(gè)特殊的實(shí)施例中，語音信號(hào)是在嘈雜的環(huán)境中生成的，語音處理方法用于使該語音信號(hào)與環(huán)境噪聲分離。這種語音信號(hào)處理在日常通信的許多領(lǐng)域都是非常重要的，因?yàn)樵谡鎸?shí)世界的條件下噪聲幾乎總是存在的。噪聲被定義為所有干擾或降低感興趣的語音信號(hào)的信號(hào)組合。真實(shí)世界中充滿多種噪聲源，包括單一的點(diǎn)噪聲源，點(diǎn)噪聲源通常會(huì)侵入多個(gè)聲音中，從而引起混響。除非與背景噪聲分開和隔離，否則將難以可靠而有效地使用期望的語音信號(hào)。背景噪聲可以包括由普通環(huán)境產(chǎn)生的多種噪聲信號(hào)、由其他人的背景談話產(chǎn)生的信號(hào)以及每個(gè)信號(hào)生成的反射和混響。當(dāng)使用者在經(jīng)常為嘈雜的環(huán)境中交談時(shí)，期望使用者的語音信號(hào)與背景噪聲分離。諸如蜂窩電話、揚(yáng)聲器電話、頭戴式耳機(jī)、無繩電話、電話會(huì)議、CB收音機(jī)、步談機(jī)、計(jì)算機(jī)電話應(yīng)用軟件、計(jì)算機(jī)和汽車語音指令應(yīng)用程序以及其他不用手的應(yīng)用程序、對(duì)講機(jī)和麥克風(fēng)系統(tǒng)等的語音通信媒介，可以利用語音信號(hào)處理來使期望的語音信號(hào)與背景噪聲分離。已經(jīng)創(chuàng)建了許多方法來使期望的聲音信號(hào)與背景噪聲信號(hào)分離，其中包括簡單的濾波處理?，F(xiàn)有技術(shù)的噪聲濾波器將具有預(yù)定特征的信號(hào)識(shí)別為白噪聲信號(hào)，并且從輸入信號(hào)中去除這種信號(hào)。盡管這些方法對(duì)于聲音信號(hào)的實(shí)時(shí)處理來說是足夠簡單和迅速的，但是它們并不能容易地適用于不同的語音環(huán)境，并且可能會(huì)導(dǎo)致要分解的語音信號(hào)產(chǎn)生實(shí)質(zhì)性衰減。預(yù)定假設(shè)的噪聲特征可能是包含過多的(over-inclusive)或包含過少的(under-inclusive)。因此，通過這些方法可以將人的語音的一部分視為“噪聲”，從而從輸出的語音信號(hào)中將該部分去除，并且通過這些方法可以將背景噪聲的一部分(例如音樂或談話)視為非噪聲，從而將該部分包含在輸入的語音信號(hào)中。在信號(hào)處理應(yīng)用程序中，通常利用傳感器(例如麥克風(fēng))來獲取一個(gè)或多個(gè)輸入信號(hào)。傳感器所提供的信號(hào)是許多信號(hào)源的混合信號(hào)?？偟膩碚f，信號(hào)源及其混合特征是未知的。除了信號(hào)源獨(dú)立性的一般統(tǒng)計(jì)假定之外，在不了解信號(hào)源的其他信息的情況下，信號(hào)處理問題在本領(lǐng)域中公知為“盲源分離(BSS)問題”。盲分離問題會(huì)以許多常見的形式出現(xiàn)。例如，眾所周知的是，即使在包含許多單個(gè)聲音源的環(huán)境中人們也可以將精力集中于單個(gè)聲音源，這一現(xiàn)象通常稱作“雞尾酒會(huì)效應(yīng)(cocktail-partyeffect)”。在從信號(hào)源到麥克風(fēng)的傳輸過程中，每個(gè)源信號(hào)都以時(shí)變方式被延遲和削弱，然后每個(gè)源信號(hào)又與其他被獨(dú)立延遲和削弱的源信號(hào)混合，從而包括了源信號(hào)本身的多徑版本(混響)，即，來自不同方向的被延遲的版本。接收所有這些聲信號(hào)的人能夠收聽聲音信號(hào)的特定集合，而過濾或忽略其他的干擾源(包括多徑信號(hào))?，F(xiàn)有技術(shù)中，在物理設(shè)備和這些設(shè)備的計(jì)算仿真方面，投入了相當(dāng)大的努力來解決雞尾酒會(huì)效應(yīng)。各種噪聲緩解技術(shù)被普遍采用，包括從在分析前對(duì)信號(hào)進(jìn)行簡單消除到用于噪聲譜的自適應(yīng)估計(jì)方案，其中用于噪聲譜的自適應(yīng)估計(jì)方案依賴于語音信號(hào)和非語音信號(hào)之間的正確辨別。這些技術(shù)的總的特征在第6,002,776號(hào)美國專利(該專利的內(nèi)容通過引用而并入本文)中進(jìn)行了描述。具體地，第6,002,776號(hào)美國專利描述了一種用于分離源信號(hào)的方案，其中兩個(gè)或兩個(gè)以上的麥克風(fēng)安裝在包含相等數(shù)量或更少數(shù)量的不同聲音源的環(huán)境中。第一模塊利用信息到達(dá)方向(direction-of-arrival)嘗試提取出原始的源信號(hào)，而信道之間的任何剩余的串?dāng)_都由第二模塊去除。這種配置在分離空間局部化的點(diǎn)聲音源并且該點(diǎn)聲音源具有清晰定義的到達(dá)方向時(shí)可能是有效的，但是這種配置在真實(shí)世界空間分布噪聲環(huán)境中卻不能分離出語音信號(hào)，因?yàn)閷?duì)于這種環(huán)境來說無法確定特定的信號(hào)到達(dá)方向。例如獨(dú)立分量分析(ICA)的方法提供了使語音信號(hào)和噪聲源分離的相對(duì)精確和靈活的方式。ICA是一種用于分離混合的源信號(hào)(分量)的技術(shù)，其中假定所述混合的源信號(hào)相互獨(dú)立。在最簡單的形式中，獨(dú)立分量分析對(duì)混合信號(hào)的權(quán)值進(jìn)行“非混合”矩陣運(yùn)算，例如將該矩陣與混合信號(hào)相乘，以產(chǎn)生分離的信號(hào)。對(duì)所述權(quán)值指定初始值，然后對(duì)所述權(quán)值進(jìn)行調(diào)整，以最大化信號(hào)的聯(lián)合熵，從而最小化信息冗余。該權(quán)值調(diào)整和熵增大過程重復(fù)進(jìn)行，直到信號(hào)的信息冗余減小到最小為止。由于這一技術(shù)不需要與每個(gè)信號(hào)的來源有關(guān)的信息，因此它被稱為“盲源分離”法。盲源分離問題指的將來自多個(gè)獨(dú)立信號(hào)源的混合信號(hào)進(jìn)行分離的思想。已經(jīng)開發(fā)了許多流行的ICA算法以優(yōu)化其性能，其中包括許多通過對(duì)僅在十年前存在的算法進(jìn)行重大修改而演變的算法。例如，A.J.Bell和TJSejnowski在NeuralComputation71129-1159(1995)中描述的成果、以及Bell，AJ.的第5,706,402號(hào)美國專利中描述的成果通常并不按照其取得專利的形式被使用。相反地，為了優(yōu)化該算法的性能，該算法通過多個(gè)不同的實(shí)體(entity)而經(jīng)歷了幾次重新定性。這種變化之一包括采用Amari，Cichocki，Yang(1996)中所描述的“自然梯度”。其他流行的ICA算法包括計(jì)算例如累積量的高階統(tǒng)計(jì)量的方法(Cardoso，1992；Comon，1994；HyvaerinenandOja，1997)。然而，許多公知的ICA算法并不能有效地分離真實(shí)環(huán)境中所記錄的信號(hào)，其中真實(shí)環(huán)境中固有地包括回聲(例如與反射有關(guān)的、由房間結(jié)構(gòu)引起的回聲)。需要強(qiáng)調(diào)的是，到目前為止所提到的方法局限于將由源信號(hào)的線性靜止混合產(chǎn)生的信號(hào)進(jìn)行分離。由于直接路徑信號(hào)(directpathsignal)與其回聲副本相加而導(dǎo)致的現(xiàn)象被稱作混響，并給人工語音增強(qiáng)和識(shí)別系統(tǒng)帶來了較多的問題。ICA算法可能需要能夠分離這些時(shí)延信號(hào)和回聲信號(hào)的長濾波器，因而排除了有效的實(shí)時(shí)應(yīng)用。公知的ICA信號(hào)分離系統(tǒng)通常采用作為神經(jīng)網(wǎng)絡(luò)的濾波器網(wǎng)絡(luò)，而從輸入到濾波器網(wǎng)絡(luò)中的任意數(shù)量的混合信號(hào)中分解出單獨(dú)的信號(hào)。也就是說，ICA網(wǎng)絡(luò)用于將一組聲音信號(hào)分成多個(gè)有序的信號(hào)集(其中每個(gè)信號(hào)都代表特定的聲音源)。例如，如果ICA網(wǎng)絡(luò)接收包括鋼琴音樂和人的談話的聲音信號(hào)，那么雙端口的ICA網(wǎng)絡(luò)便會(huì)將該聲音信號(hào)分成兩個(gè)信號(hào)其中一個(gè)信號(hào)主要包括鋼琴音樂，而另一個(gè)信號(hào)則主要包括談話。另一種現(xiàn)有的技術(shù)是基于聽覺場(chǎng)景分析來分離聲音。在這種分析中，有力的應(yīng)用是基于對(duì)聲音源存在的本質(zhì)的假設(shè)而實(shí)現(xiàn)的。假定聲音可以分解成例如音調(diào)和沖擊脈沖的較小元素，接著可以根據(jù)例如調(diào)和性和時(shí)間連續(xù)性的屬性將這些較小元素進(jìn)行分組?？梢岳脕韥碜詥蝹€(gè)麥克風(fēng)或來自多個(gè)麥克風(fēng)的信息來執(zhí)行聽覺場(chǎng)景分析。導(dǎo)致計(jì)算的聽覺場(chǎng)景分析或CASA的計(jì)算機(jī)器學(xué)習(xí)方法的可用性，使得聽覺場(chǎng)景分析的領(lǐng)域吸引了更多的注意力。盡管在科學(xué)上是有趣的，因?yàn)樗藢?duì)人的聽覺處理的理解，模型假設(shè)和計(jì)算技術(shù)仍然處于解決現(xiàn)實(shí)的雞尾酒會(huì)情況的初期。用于分離聲音的其他技術(shù)是通過對(duì)這些聲音源進(jìn)行空間分離而工作的。基于該原理的設(shè)備具有不同的復(fù)雜性。這種設(shè)備中最簡單的是具有較高選擇性和固定靈敏度模式的麥克風(fēng)。定向麥克風(fēng)(directionalmicrophone)例如被設(shè)計(jì)成對(duì)從特定方向發(fā)出的聲音具有最大的靈敏度，因而可用于使一個(gè)聲音源相對(duì)于其他聲音源增強(qiáng)。類似地，靠近說話者的嘴安裝的近講話麥克風(fēng)(close-talkingmicrophone)可以丟棄某些較遠(yuǎn)的聲音源。麥克風(fēng)陣列處理技術(shù)用于通過使用已察覺的空間分離技術(shù)來分離聲音源。這些技術(shù)并不實(shí)用，因?yàn)榧俣ㄖ辽僖粋€(gè)麥克風(fēng)只包含期望的信號(hào)，則將無法實(shí)現(xiàn)對(duì)競(jìng)爭的聲音源進(jìn)行充分的抑制，這在聲環(huán)境中是不可行的。被廣泛了解的用于線性麥克風(fēng)陣列處理的技術(shù)通常稱作“波束形成(beamforming)”。在該方法中，利用由麥克風(fēng)的空間差而引起的信號(hào)之間的時(shí)間差來增強(qiáng)信號(hào)。更具體地說，可以是這樣一種情況麥克風(fēng)之一將更直接地“注視(look)”語音源，而其他麥克風(fēng)則可能會(huì)產(chǎn)生相對(duì)衰減的信號(hào)。雖然可以實(shí)現(xiàn)某些衰減，但是波束形成儀并不能提供波長大于陣列的波長的頻率分量的相對(duì)衰減。這些技術(shù)是用于進(jìn)行以下操作的方法進(jìn)行空間濾波以朝聲音源控制波束，從而在其他方向清空。波束形成技術(shù)沒有對(duì)聲音源進(jìn)行假定，但是假定聲音源與傳感器或聲音信號(hào)本身之間的幾何關(guān)系是已知的，以便對(duì)信號(hào)去反響或定位聲音源。在穩(wěn)健的自適應(yīng)波束形成中一項(xiàng)公知的技術(shù)被稱作“廣義旁瓣對(duì)消(GSC)”，在發(fā)表于IEEETransactionsonSignalProcessing，vol47，No10，pp2677-2684，October1999的、Hoshuyama，O.、Sugiyama，A.以及Hirano，A.的題為“ARobustAdaptiveBeamformerforMicrophoneArrayswithaBlockingMatrixusingConstrainedAdaptiveFilters(采用約束自適應(yīng)濾波器的用于具有模塊化矩陣的麥克風(fēng)陣列的穩(wěn)健自適應(yīng)波束形成儀”的文章中對(duì)這項(xiàng)技術(shù)進(jìn)行了討論。GSC的目的在于從一組測(cè)量值x中過濾掉單個(gè)期望的源信號(hào)z_i，在發(fā)表于IEEETransactionAntennasandPropagation，vol30，no1，pp.27-34，Jan1982的、Griffiths、L.J.、Jim、以及C.W.的題為“Analternativeapproachtolinearconstrainedadaptivebeamforming(線性約束自適應(yīng)波束形成的可選方法)”的文章中對(duì)GSC原理進(jìn)行了更為全面的說明?？偟膩碚f，GSC預(yù)先定義獨(dú)立于信號(hào)的波束形成儀c對(duì)傳感器信號(hào)進(jìn)行過濾，以使得來自期望的信號(hào)源的直接路徑保持不失真，并且在理想情況下其他方向應(yīng)當(dāng)受到抑制。在大多數(shù)情況下，期望的信號(hào)源的位置必須通過附加的定位方法來預(yù)先確定。在低側(cè)路徑中，自適應(yīng)模塊矩陣B用來抑制來自期望信號(hào)z_i的所有分量，以使得B的輸出中僅存在噪聲分量。從這些方面可以看出，自適應(yīng)干擾消除器a通過使總的輸出功率E(z_i*z_i)的估計(jì)值最小，而推導(dǎo)出波束形成儀c的輸出中的剩余的噪聲分量的估計(jì)值。這樣，固定的波束形成儀c和干擾消除器a便共同完成干擾抑制。由于GSC要求將期望的說話者限制在有限的跟蹤區(qū)域內(nèi)，因此其適用性局限于對(duì)空間要求嚴(yán)格的場(chǎng)景中。另一項(xiàng)公知的技術(shù)是一類與聲音分離相關(guān)的有源消除算法。然而，該項(xiàng)技術(shù)需要“參考信號(hào)”，即僅來自一個(gè)信號(hào)源的信號(hào)。有源噪聲消除和回聲消除技術(shù)通過過濾僅包含噪聲的已知信號(hào)并將其從混合聲音中去除而廣泛采用該項(xiàng)技術(shù)，并且噪聲減少是相對(duì)于噪聲對(duì)混合信號(hào)的貢獻(xiàn)而言的。該方法假定被測(cè)信號(hào)中的一個(gè)信號(hào)有且僅有一個(gè)信號(hào)源組成，而這一假定在許多真實(shí)生活背景中是不現(xiàn)實(shí)的。不需要參考信號(hào)的有源消除技術(shù)被稱作“盲有源消除技術(shù)”并且主要對(duì)這一應(yīng)用感興趣。目前基于對(duì)聲處理(通過該處理多余的信號(hào)也到達(dá)麥克風(fēng))的潛在假定能夠?qū)崿F(xiàn)的程度，對(duì)上述技術(shù)進(jìn)行了分類。一類盲有源消除技術(shù)可以稱作“基于增益”的消除技術(shù)，或者也公知為“瞬時(shí)混合”消除技術(shù)其假定麥克風(fēng)同時(shí)接收各個(gè)信號(hào)源所產(chǎn)生的波形，但是各個(gè)信號(hào)源所產(chǎn)生的波形的相對(duì)增益是變化的。(定向麥克風(fēng)大多數(shù)常用于產(chǎn)生所需的增益差)。因而，基于增益的系統(tǒng)試圖通過將相對(duì)增益應(yīng)用于麥克風(fēng)信號(hào)中并去除該信號(hào)，但并不采用時(shí)延或其他濾波，從而消除不同的麥克風(fēng)信號(hào)中的不期望的信號(hào)源的副本。已經(jīng)提出了多種用于盲有源消除的基于增益的方法；參見Herault和Jutten(1986)、Tong等人(1991)、以及Molgedey和Schuster(1994)的文章。當(dāng)麥克風(fēng)在空間中隔開時(shí)(如在大多數(shù)聲應(yīng)用中那樣)，則會(huì)違反基于增益或瞬時(shí)混合的假定。該方法的簡單延伸包括時(shí)延因素，但是不包括任何其他濾波，并且該方法可在無回聲的條件下工作。然而，當(dāng)存在回聲和混響時(shí)，聲從聲源到麥克風(fēng)傳播的這一簡單模型的使用便會(huì)受到限制。目前已知的大多數(shù)真實(shí)的有源消除技術(shù)都是“卷積”消除技術(shù)聲從每個(gè)聲源到每個(gè)麥克風(fēng)傳播的效果被模擬為卷積濾波器。這些技術(shù)比基于增益的技術(shù)和基于延遲的技術(shù)更真實(shí)，因?yàn)樗鼈兠鞔_包含了麥克風(fēng)內(nèi)分離、回聲和混響的作用。它們還更具有一般性，因?yàn)樵诶碚撋显鲆婧脱舆t是卷積濾波的特殊情況。卷積盲消除技術(shù)已被許多研究人員描述過，其中包括Jutten等人(1992)、VanCompernolle和VanGerven(1992)、Platt和Faggin(1992)，Bell和Sejnowski(1995)、Torkkola(1996)、Lee(1998)以及Parra等人(2000)。在通過麥克風(fēng)陣列進(jìn)行多信道觀察時(shí)主要使用的數(shù)學(xué)模型、多信號(hào)源模型可以用公式表示為xi(t)=Σ1=0LΣi=1maij1(t)sj(t-1)+ni(t)]]>其中x(t)表示觀察到的數(shù)據(jù)，s(t)為被隱藏的源信號(hào)，n(t)為感覺的加性噪聲信號(hào)，a(t)為混合濾波器。參數(shù)m為信號(hào)源的數(shù)量，L為卷積階數(shù)并且其取決于環(huán)境聲學(xué)，t表示時(shí)間系數(shù)。第一個(gè)和是由于環(huán)境中的信號(hào)源的濾波而產(chǎn)生的，第二個(gè)和是由于不同信號(hào)源的混合而產(chǎn)生的。與ICA有關(guān)的大多數(shù)工作都集中于瞬時(shí)混合場(chǎng)景的算法上，其中第一個(gè)和被去除，而任務(wù)被簡化以對(duì)混合矩陣a求逆。在假定沒有混響時(shí)作出微小的修改，除了振幅因素和延遲之外，在不同的麥克風(fēng)位置記錄信號(hào)時(shí)，來源于點(diǎn)信號(hào)源的信號(hào)可以視為相同的。以上等式中所描述的問題被公知為多信道盲去卷積問題。在自適應(yīng)信號(hào)處理方面的代表性的成果包括Yellin和Weinstein(1996)，其中高階統(tǒng)計(jì)信息用來對(duì)傳感輸入信號(hào)中的共有信息進(jìn)行近似。ICA和BSS的擴(kuò)展對(duì)于卷積混合的成果包括Lambert(1996)、Torkkola(1997)、Lee等人(1997)以及Parra等人(2000)的文章?；谟糜诮鉀Q多信道盲去卷積問題的ICA和BSS算法，由于其在解決聲混合信號(hào)源的分離方面的潛力而逐漸受到歡迎。然而，在這些算法中仍然存在強(qiáng)大的假設(shè)，而這些假設(shè)限制了這些算法在現(xiàn)實(shí)情況中的適用性。最矛盾的假定之一是要求具有至少與待分離的信號(hào)源數(shù)量相同的傳感器。該假定在數(shù)學(xué)上是有意義的。然而，實(shí)際上信號(hào)源的數(shù)量通常是動(dòng)態(tài)變化的，而傳感器的數(shù)量卻需要固定。此外，設(shè)置大量的傳感器在許多應(yīng)用中是不實(shí)際的。在大多數(shù)算法中，統(tǒng)計(jì)的源信號(hào)模型適于保證適當(dāng)?shù)拿芏裙烙?jì)，從而可以分離大量的源信號(hào)。這一要求導(dǎo)致了繁重的計(jì)算，因?yàn)槌藶V波器的自適應(yīng)之外，源信號(hào)模型的自適應(yīng)也需要在線執(zhí)行。對(duì)于信號(hào)源之間統(tǒng)計(jì)獨(dú)立性的假定是非?，F(xiàn)實(shí)的假定，但是共同信息的計(jì)算是密集而困難的。需要對(duì)實(shí)際系統(tǒng)進(jìn)行好的近似。此外，通常不考慮傳感器噪聲，當(dāng)采用高端麥克風(fēng)時(shí)，這一點(diǎn)便成為有效的假定。然而，簡單的麥克風(fēng)是存在傳感器噪聲的，因此算法必須考慮到這一點(diǎn)，以達(dá)到合理的性能。最后，大多數(shù)ICA公式都暗自假定潛在的源信號(hào)在本質(zhì)上都來源于空間分布的點(diǎn)信號(hào)源，雖然這些點(diǎn)信號(hào)源具有其各自的回波和反射。這一假定對(duì)于強(qiáng)烈擴(kuò)散的噪聲源或空間分部的噪聲源(例如在可比較的聲壓水平上從多個(gè)方向發(fā)出的風(fēng)噪聲一樣)通常是無效的。對(duì)于這些類型的分布式噪聲場(chǎng)景，僅采用ICA方法來實(shí)現(xiàn)分離是不夠的。期望一種簡化的語音處理方法，該方法可以接近實(shí)時(shí)地使語音信號(hào)與背景噪聲分離，并且該方法不要求實(shí)質(zhì)的計(jì)算能力，但是仍然能夠產(chǎn)生相對(duì)精確的結(jié)果，并且可以靈活地適用于不同的環(huán)境。
發(fā)明內(nèi)容簡言之，本發(fā)明提供一種頭戴式耳機(jī)，其被構(gòu)造成在嘈雜的聲環(huán)境中產(chǎn)生從聽覺能夠區(qū)別的語音信號(hào)。所述頭戴式耳機(jī)將多個(gè)分開的麥克風(fēng)定位在用戶的嘴附近。所述麥克風(fēng)中的每一個(gè)都接收用戶的語音，并且還接收聲環(huán)境噪聲。包含噪聲和信息分量的麥克風(fēng)信號(hào)被接收到分離處理中。所述分離處理產(chǎn)生噪聲分量被充分減少的語音信號(hào)。然后對(duì)所述語音信號(hào)進(jìn)行處理，以便進(jìn)行傳輸。在一個(gè)實(shí)施例中，傳輸過程包括利用藍(lán)牙無線電裝置將所述語音信號(hào)發(fā)送到本地控制模塊。在更具體的實(shí)施例中，所述頭戴式耳機(jī)為可戴在耳朵上的耳塞。所述耳塞具有容納處理器和藍(lán)牙無線電裝置、并支撐吊桿的外殼。第一麥克風(fēng)定位于所述吊桿末端，而第二麥克風(fēng)以分開的方式定位于所述外殼上。每個(gè)麥克風(fēng)都產(chǎn)生電信號(hào)，所述電信號(hào)包含噪聲和信息分量。所述麥克風(fēng)信號(hào)被接納到所述處理器中，在所述處理器中利用分離處理對(duì)所述信號(hào)進(jìn)行處理。所述分離處理例如可以是盲信號(hào)源分離處理或獨(dú)立分量分析處理。所述分離處理產(chǎn)生噪聲分量被充分減少的語音信號(hào)，并且還可以產(chǎn)生指示噪聲分量的信號(hào)，所述噪聲分量用來對(duì)所述語音信號(hào)進(jìn)行進(jìn)一步的后處理。然后對(duì)所述語音信號(hào)進(jìn)行處理，以便通過所述藍(lán)牙無線電裝置進(jìn)行傳輸。所述耳塞還可以包括話音活動(dòng)檢測(cè)器，在語音可能出現(xiàn)時(shí)，所述話音活動(dòng)檢測(cè)器產(chǎn)生控制信號(hào)。該控制信號(hào)能夠根據(jù)語音出現(xiàn)的時(shí)間激活、調(diào)整或者控制所述處理，從而實(shí)現(xiàn)更有效和更實(shí)際的操作。例如，當(dāng)所述控制信號(hào)被關(guān)閉并且語音不存在時(shí)，獨(dú)立分量分析處理可以停止。有利地，本發(fā)明的頭戴式耳機(jī)產(chǎn)生高質(zhì)量的語音信號(hào)。此外，所述分離處理能夠以穩(wěn)定和可預(yù)見的方式工作，從而提高了整體有效性和效率。所述頭戴式耳機(jī)的結(jié)構(gòu)適于多種設(shè)備、處理和應(yīng)用。在附圖中示出、在下面的“具體實(shí)施方式”部分描述、或者由權(quán)利要求的范圍限定了其他方面和實(shí)施方案。圖1是根據(jù)本發(fā)明的無線頭戴式耳機(jī)的圖；圖2是根據(jù)本發(fā)明的頭戴式耳機(jī)的圖；圖3是根據(jù)本發(fā)明的無線頭戴式耳機(jī)的圖；圖4是根據(jù)本發(fā)明的無線頭戴式耳機(jī)的圖；圖5是根據(jù)本發(fā)明的無線耳塞的圖；圖6是根據(jù)本發(fā)明的無線耳塞的圖；圖7是根據(jù)本發(fā)明的無線耳塞的圖；圖8是根據(jù)本發(fā)明的無線耳塞的圖；圖9是在根據(jù)本發(fā)明的頭戴式耳機(jī)上執(zhí)行的處理的方框圖；圖10是在根據(jù)本發(fā)明的頭戴式耳機(jī)上執(zhí)行的處理的方框圖；圖11是根據(jù)本發(fā)明的語音檢測(cè)處理的方框圖；圖12是在根據(jù)本發(fā)明的頭戴式耳機(jī)上執(zhí)行的處理的方框圖；圖13是根據(jù)本發(fā)明的語音檢測(cè)處理的方框圖；圖14是在根據(jù)本發(fā)明的頭戴式耳機(jī)上執(zhí)行的處理的方框圖；圖15是根據(jù)本發(fā)明的分類處理的流程圖；圖16是根據(jù)本發(fā)明的改進(jìn)的ICA處理子模塊的一個(gè)實(shí)施方案的方框圖；以及圖17是根據(jù)本發(fā)明的改進(jìn)的ICA語音分離處理的一個(gè)實(shí)施方案的方框圖。具體實(shí)施例方式現(xiàn)在參照?qǐng)D1，圖1中示出了無線頭戴式耳機(jī)系統(tǒng)10。無線頭戴式耳機(jī)系統(tǒng)10具有與控制模塊14進(jìn)行無線通信的頭戴式耳機(jī)12。頭戴式耳機(jī)12被構(gòu)造成由使用者配戴或附在使用者身上。頭戴式耳機(jī)12具有束發(fā)帶(headband)17形式的外殼16。雖然頭戴式耳機(jī)12被示出為立體聲頭戴式耳機(jī)，但是應(yīng)當(dāng)理解，頭戴式耳機(jī)12可以采取可選的形式。束發(fā)帶17具有電子外殼23，用于容納所需的電子系統(tǒng)。例如，電子外殼23可以包括處理器25和無線電裝置27。無線電裝置27可以具有例如天線29的各種子模塊，以便能夠與控制模塊14進(jìn)行通信。電子外殼23通常容納例如電池或可再充電的電池的便攜式電源(未示出)。盡管在優(yōu)選實(shí)施方案的上下文中描述了頭戴式耳機(jī)系統(tǒng)，但是本領(lǐng)域的技術(shù)人員可以理解的是，所描述的用于從嘈雜的聲環(huán)境分離語音信號(hào)的技術(shù)同樣適用于在嘈雜環(huán)境或多噪聲環(huán)境中使用的各種電子通信設(shè)備。因此，僅以實(shí)施例的方式而不是以限定的方式描述了用于語音應(yīng)用的無線頭戴式耳機(jī)系統(tǒng)的示例性實(shí)施方案。電子外殼內(nèi)的電路耦合到一組立體聲耳用揚(yáng)聲器。例如，頭戴式耳機(jī)12具有設(shè)置用來為使用者提供立體聲的耳用揚(yáng)聲器19和耳用揚(yáng)聲器21。更具體地，每個(gè)耳用揚(yáng)聲器都被設(shè)置成靠在使用者的耳朵上。頭戴式耳機(jī)12還具有一對(duì)音頻麥克風(fēng)32和33形式的變換器。如圖1所示，麥克風(fēng)32靠近耳用揚(yáng)聲器19，而麥克風(fēng)33則位于耳用揚(yáng)聲器19上方。按照這種方式，當(dāng)使用者配戴頭戴式耳機(jī)12時(shí)，每個(gè)麥克風(fēng)都具有到達(dá)說話者嘴巴的不同的音頻路徑，并且麥克風(fēng)32總是更靠近說話者的嘴巴。因此，每個(gè)麥克風(fēng)都接收使用者的語音和周圍噪聲。由于麥克風(fēng)是分開的，因此每個(gè)麥克風(fēng)都將接收略微不同的周圍噪聲信號(hào)，以及說話者語音的稍微不同的版本。音頻信號(hào)中的這些小的差別能夠增強(qiáng)處理器25中的語音分離。此外，由于麥克風(fēng)32比麥克風(fēng)33更靠近說話者的嘴巴，因此來自麥克風(fēng)32的信號(hào)將總是首先接收期望的語音信號(hào)。這一已知的語音信號(hào)排序使得信號(hào)分離處理更加簡化和有效。雖然麥克風(fēng)32和33被示出靠近耳朵的揚(yáng)聲器，但是可以理解，許多其他的位置也是可以有用的。例如，一個(gè)麥克風(fēng)或兩個(gè)麥克風(fēng)都可以在吊桿上延伸?？蛇x地，麥克風(fēng)可以在不同方向上或者以例如陣列的分開配置方式位于使用者頭部的不同側(cè)。根據(jù)特定的應(yīng)用和物理限制，還可以理解，麥克風(fēng)可以朝向前方或朝向側(cè)面，可以是全方向的或定向的，或者具有其他的位置或物理限制，以使得至少兩個(gè)麥克風(fēng)中的每一個(gè)都將接收不同比例的噪聲和語音。處理器25接收來自麥克風(fēng)32的電子麥克風(fēng)信號(hào)和來自麥克風(fēng)33的原始麥克風(fēng)信號(hào)?？梢岳斫猓梢詫⑸鲜鲂盘?hào)進(jìn)行數(shù)字化、濾波或其他預(yù)處理。處理器25執(zhí)行將語音從噪聲分離的信號(hào)分離處理。在一個(gè)實(shí)施例中，信號(hào)分離處理為盲信號(hào)分離處理。在更特別的實(shí)施例中，信號(hào)分離處理為獨(dú)立分量分析處理。由于麥克風(fēng)32比麥克風(fēng)33更靠近說話者的嘴巴，因此來自麥克風(fēng)32的信號(hào)將總是首先接收期望的語音信號(hào)，并且該期望的語音信號(hào)在麥克風(fēng)32的記錄信道中比在麥克風(fēng)33的記錄信道中更響亮，這樣則有助于識(shí)別語音信號(hào)。信號(hào)分離處理的輸出為清晰的語音信號(hào)，并由無線電裝置27對(duì)其進(jìn)行處理和傳輸。盡管所述清晰的語音信號(hào)中已經(jīng)去除了噪聲的實(shí)質(zhì)部分，但是某些噪聲分量也有可能仍然存在于語音信號(hào)中。無線電裝置27將經(jīng)過調(diào)制的語音信號(hào)發(fā)送到控制模塊14。在一個(gè)實(shí)施例中，無線電裝置27遵守藍(lán)牙通信標(biāo)準(zhǔn)。藍(lán)牙是眾所周知的個(gè)人區(qū)域網(wǎng)通信標(biāo)準(zhǔn)，其使得電子設(shè)備能夠在短距離(通常小于30英尺)內(nèi)進(jìn)行通信。藍(lán)牙還使得能夠以足以支持音頻水平傳輸?shù)乃俾释ㄐ?。在另一個(gè)實(shí)施例中，無線電裝置27可以根據(jù)IEEE802.11標(biāo)準(zhǔn)或其他無線通信標(biāo)準(zhǔn)工作，如本文中所采用的，術(shù)語無線電通信是指這種無線通信標(biāo)準(zhǔn)。在另一個(gè)實(shí)施例中，無線電裝置27可以根據(jù)能夠?qū)崿F(xiàn)特定通信和安全通信的私有商業(yè)標(biāo)準(zhǔn)或軍事標(biāo)準(zhǔn)工作?？刂颇K14還具有配置用來與無線電裝置27通信的無線電裝置49。因此，無線電裝置49根據(jù)與無線電裝置27相同的標(biāo)準(zhǔn)工作，并且在與無線電裝置27相同的信道配置上工作。無線電裝置49接收來自無線電裝置27的經(jīng)調(diào)制的語音信號(hào)，并且利用處理器47來執(zhí)行對(duì)輸入信號(hào)的任何需要的操作?？刂颇K14被示為無線移動(dòng)設(shè)備38。無線移動(dòng)設(shè)備38包括圖形顯示器40、輸入鍵盤42以及其他的用戶控制裝置39。無線移動(dòng)設(shè)備38根據(jù)無線通信標(biāo)準(zhǔn)工作，例如CDMA、WCDMA、CDMA2000、GSM、EDGE、UMTS、PHS、PCM或其他通信標(biāo)準(zhǔn)。因此，無線電裝置45被構(gòu)造成根據(jù)所需的通信標(biāo)準(zhǔn)工作，并方便與無線基礎(chǔ)設(shè)施系統(tǒng)通信。這樣，控制模塊14便具有到無線通信公司的基礎(chǔ)設(shè)施的遠(yuǎn)程通信鏈路51和到頭戴式耳機(jī)12的本地?zé)o線鏈路50。在操作中，無線頭戴式耳機(jī)系統(tǒng)10作為用于放置和接收語音通信的無線移動(dòng)設(shè)備而工作。例如，用戶可以利用控制模塊14來撥打無線電話。處理器47和無線電裝置45合作建立到無線通信公司的基礎(chǔ)設(shè)施的遠(yuǎn)程通信鏈路51。一旦建立了具有無線通信公司的基礎(chǔ)設(shè)施的語音信道，用戶便可以使用執(zhí)行語音通信的頭戴式耳機(jī)12。當(dāng)用戶講話時(shí)，用戶的語音以及周圍噪聲一起被麥克風(fēng)32和麥克風(fēng)33接收。在處理器25處接收麥克風(fēng)信號(hào)。處理器25利用信號(hào)分離處理來產(chǎn)生清晰的語音信號(hào)。所述清晰的語音信號(hào)由無線電裝置27例如利用藍(lán)牙標(biāo)準(zhǔn)發(fā)送到控制模塊14。然后對(duì)接收的語音信號(hào)進(jìn)行處理和調(diào)制，以便進(jìn)行使用無線電裝置45實(shí)現(xiàn)的通信。無線電裝置45通過通信鏈路51而將語音信號(hào)傳送到無線基礎(chǔ)設(shè)施。這樣便可以將清晰的語音信號(hào)傳送給遠(yuǎn)程的收聽者。來自遠(yuǎn)程收聽者的語音信號(hào)通過無線基礎(chǔ)設(shè)施和通信鏈路51而發(fā)送到無線電裝置45。處理器47和無線電裝置49將接收的信號(hào)轉(zhuǎn)換并格式化成例如藍(lán)牙的本地?zé)o線電格式，并將引入的信號(hào)傳送到無線電裝置27。引入的信號(hào)然后被發(fā)送到耳用揚(yáng)聲器19和21，從而使本地用戶可以聽到遠(yuǎn)程用戶的語音。這樣便實(shí)現(xiàn)了全雙工語音通信系統(tǒng)。這種麥克風(fēng)配置使得從一個(gè)麥克風(fēng)到另一個(gè)麥克風(fēng)的期望的語音信號(hào)的延遲足夠大、以及/或者兩個(gè)被記錄的輸入信道間的期望的講話內(nèi)容充分不同，以便能夠分離期望的說話者的話音，例如在主麥克風(fēng)中的語音拾取更為理想。這樣便包括通過利用定向麥克風(fēng)或非限定排列的全向麥克風(fēng)來調(diào)制語音與噪聲的混合物。還應(yīng)當(dāng)根據(jù)預(yù)期的環(huán)境特征(例如預(yù)期的噪聲、可能的風(fēng)噪聲、生物力學(xué)設(shè)計(jì)考慮和來自擴(kuò)音器的回聲)來考慮和調(diào)整麥克風(fēng)的特定放置。一種麥克風(fēng)配置可以很好地處理噪聲情況和回聲。然而，噪聲/回聲消除任務(wù)通常需要遠(yuǎn)離主麥克風(fēng)的朝向的輔助麥克風(fēng)(聲音中心的麥克風(fēng)或者負(fù)責(zé)記錄包含實(shí)質(zhì)噪聲的聲音混合的麥克風(fēng))。如本發(fā)明中所使用的那樣，主麥克風(fēng)是距離目標(biāo)說話者最近的麥克風(fēng)。最佳的麥克風(fēng)配置可以是方向或位置(非線性麥克風(fēng)配置、麥克風(fēng)特征方向性模式)和麥克風(fēng)膜抵抗風(fēng)擾動(dòng)的聲屏蔽之間的折衷。在像蜂窩電話手持裝置和頭戴式耳機(jī)一樣的移動(dòng)應(yīng)用中，通過自適應(yīng)而細(xì)微地調(diào)整分離ICA濾波器的方向性模式(通過采用和選擇在最可能的設(shè)備/說話者嘴的配置范圍能夠?qū)е孪嗤恼Z音/噪聲信道輸出順序的麥克風(fēng)配置)，從而實(shí)現(xiàn)對(duì)于期望的說話者移動(dòng)的穩(wěn)健性。因此，麥克風(fēng)優(yōu)選設(shè)置在移動(dòng)設(shè)備的分割線上，并且不對(duì)稱地設(shè)置在硬件的每一側(cè)。這樣，當(dāng)使用移動(dòng)設(shè)備時(shí)，同一麥克風(fēng)總是被定位成最有效地接收大部分語音，而不考慮本發(fā)明的設(shè)備的位置，例如，主麥克風(fēng)被定位成最靠近說話者的嘴，而不考慮用戶對(duì)設(shè)備的定位。這種一致的、預(yù)先定義的定位使得ICA處理能夠具有更好的缺省值，并且更易于識(shí)別語音信號(hào)。在處理聲噪聲時(shí)，優(yōu)選采用定向麥克風(fēng)，因?yàn)槎ㄏ螓溈孙L(fēng)通?？梢垣@得更佳的初始SNR。然而，定向麥克風(fēng)對(duì)于風(fēng)噪聲更敏感，并且具有更高的內(nèi)部噪聲(低頻電子噪聲拾取)。該麥克風(fēng)的配置可適合于與全向麥克風(fēng)和定向麥克風(fēng)一起工作，但是為了去除風(fēng)噪聲而需要放棄對(duì)聲噪聲的去除。風(fēng)噪聲通常是由直接施加到麥克風(fēng)變換器薄膜的空氣的延伸力而引起的。高靈敏度的薄膜產(chǎn)生較大且有時(shí)飽和的電信號(hào)。該信號(hào)淹沒并經(jīng)常破壞麥克風(fēng)信號(hào)中的有用信息(包括任何講話內(nèi)容)。此外，由于風(fēng)噪聲十分強(qiáng)大，因此它可能會(huì)在信號(hào)分離處理中以及后期處理步驟中導(dǎo)致飽和和穩(wěn)定性問題。另外，發(fā)送的任何風(fēng)噪聲都會(huì)給收聽者帶來不愉快和不舒服的收聽感受。不幸的是，風(fēng)噪聲已成為便隨頭戴式耳機(jī)和耳塞式耳機(jī)的特別困難的問題。然而，無線頭戴式耳機(jī)的雙麥克風(fēng)配置提供了檢測(cè)風(fēng)的更有力的方式，并且是使風(fēng)噪聲的干擾影響最小的麥克風(fēng)配置或設(shè)計(jì)。由于無線頭戴式耳機(jī)具有兩個(gè)麥克風(fēng)，因此頭戴式耳機(jī)可以運(yùn)行能夠更精確地識(shí)別風(fēng)噪聲存在的處理。如上所述，可以配置兩個(gè)麥克風(fēng)，以使它們的輸入端口面向不同的方向，或者使它們的輸入端口被屏蔽，從而使每個(gè)麥克風(fēng)接收來自不同方向的風(fēng)。在這種配置中，風(fēng)的沖擊脈沖將使得面向風(fēng)的麥克風(fēng)中的動(dòng)態(tài)能級(jí)提高，而最低限度地影響另一個(gè)麥克風(fēng)。因而，當(dāng)頭戴式耳機(jī)僅在一個(gè)麥克風(fēng)檢測(cè)到較大的能量峰值時(shí)，頭戴式耳機(jī)可以確定該麥克風(fēng)正在受風(fēng)的影響。此外，可以對(duì)麥克風(fēng)信號(hào)進(jìn)行其他處理，以便進(jìn)一步確認(rèn)尖峰信號(hào)是由風(fēng)噪聲引起的。例如，風(fēng)噪聲通常具有低頻模式，并且當(dāng)在一個(gè)或兩個(gè)信道上都發(fā)現(xiàn)這種模式時(shí)，則表明存在風(fēng)噪聲。可選地，對(duì)于風(fēng)噪聲也可以考慮特定的機(jī)械設(shè)計(jì)或工程設(shè)計(jì)。一旦頭戴式耳機(jī)發(fā)現(xiàn)兩個(gè)麥克風(fēng)之一受到風(fēng)的影響，那么頭戴式耳機(jī)便可以運(yùn)行某個(gè)處理以最小化風(fēng)的影響。例如，該處理可以中斷來自受風(fēng)影響的麥克風(fēng)的信號(hào)，而僅處理另一個(gè)麥克風(fēng)的信號(hào)。在這種情況下，分離處理不再起作用，并且噪聲減小處理就像更為傳統(tǒng)的單麥克風(fēng)系統(tǒng)那樣工作。一旦麥克風(fēng)不再受風(fēng)的影響，那么頭戴式耳機(jī)便可以恢復(fù)正常的雙信道操作。在某些麥克風(fēng)配置中，離說話者較遠(yuǎn)的麥克風(fēng)接收有限水平的語音信號(hào)，從而使得其不能夠象單麥克風(fēng)輸入那樣工作。在這種情況下，不能使最靠近說話者的麥克風(fēng)失去作用或者降低它的重要性，即使在它受到風(fēng)的影響時(shí)。因而，通過將麥克風(fēng)配置成面向不同的風(fēng)方向，有風(fēng)的環(huán)境可能只在一個(gè)麥克風(fēng)中引起實(shí)質(zhì)噪聲。由于另一個(gè)麥克風(fēng)可能幾乎不受影響，因此它可以獨(dú)自用來為頭戴式耳機(jī)提供高質(zhì)量的語音信號(hào)，而另一個(gè)耳機(jī)則承受風(fēng)的攻擊。利用該處理，無線頭戴式耳機(jī)可以有利地用于有風(fēng)的環(huán)境中。在另一個(gè)實(shí)施例中，頭戴式耳機(jī)在外部具有機(jī)械按鈕，以使得用戶可以從雙信道模式切換到單信道模式。如果單獨(dú)的麥克風(fēng)為定向的，那么即使單個(gè)麥克風(fēng)操作也依然對(duì)風(fēng)噪聲非常敏感。然而，當(dāng)單獨(dú)的麥克風(fēng)為全向麥克風(fēng)時(shí)，雖然噪聲抑制將會(huì)惡化，但是也應(yīng)當(dāng)略微減輕風(fēng)噪聲偽跡(artifact)。在同時(shí)處理風(fēng)噪聲和聲噪聲時(shí)，信號(hào)質(zhì)量中存在固有的權(quán)衡關(guān)系(trade-off)。這種平衡中的一些可以由軟件來提供，同時(shí)可以響應(yīng)于用戶的喜好而作出某些決定，例如，通過使用戶在單信道操作和雙信道操作之間進(jìn)行選擇。在某些配置中，用戶還可以選擇采用哪個(gè)麥克風(fēng)來作為單信道輸入。圖2示出了有線頭戴式耳機(jī)系統(tǒng)75。有線頭戴式耳機(jī)系統(tǒng)75與先前描述的無線頭戴式耳機(jī)系統(tǒng)10類似，因此對(duì)系統(tǒng)75不再進(jìn)行詳細(xì)描述。有線頭戴式耳機(jī)系統(tǒng)75具有頭戴式耳機(jī)76，頭戴式耳機(jī)76具有如參照?qǐng)D1描述的那樣的一組立體聲耳用揚(yáng)聲器和兩個(gè)麥克風(fēng)。在頭戴式耳機(jī)系統(tǒng)75中，每個(gè)麥克風(fēng)被設(shè)置成靠近各自的耳塞式耳機(jī)。這樣，每個(gè)麥克風(fēng)都被設(shè)置成距說話者嘴的距離大約相同。因此，分離處理可以采用用于識(shí)別語音信號(hào)的更加完善的(sophisticated)方法和更加完善的BSS算法。例如，可能需要增大緩沖器的尺寸，以及需要采用附加的處理能力以更精確地測(cè)量信道間的分離程度。頭戴式耳機(jī)76還具有用于容納處理器的電子外殼79。然而，電子外殼79具有與控制模塊77相連的電纜81。因此，頭戴式耳機(jī)76通過電線81與控制模塊77通信。這樣，模塊化的電子裝置83不需要用于本地通信的無線電裝置。模塊化的電子裝置83具有處理器和用于建立與無線基礎(chǔ)設(shè)施系統(tǒng)通信的無線電裝置?，F(xiàn)在參照?qǐng)D3，其中示出了無線頭戴式耳機(jī)系統(tǒng)100。無線頭戴式耳機(jī)系統(tǒng)100與先前描述的無線頭戴式耳機(jī)系統(tǒng)10類似，因此對(duì)系統(tǒng)100不再進(jìn)行詳細(xì)描述。無線頭戴式耳機(jī)系統(tǒng)100具有束發(fā)帶102形式的外殼101。束發(fā)帶102保持電子外殼107，而電子外殼107具有處理器和本地?zé)o線電裝置111。本地?zé)o線電裝置111例如可以是藍(lán)牙本地?zé)o線電裝置。無線電裝置111被配置成與局域控制模塊通信。例如，如果無線電裝置111根據(jù)IEEE802.11標(biāo)準(zhǔn)工作，那么其相關(guān)的控制模塊則應(yīng)當(dāng)一般位于無線電裝置111的大約100英尺之內(nèi)。可以理解，所述控制模塊可以是無線移動(dòng)設(shè)備或者可以被構(gòu)造成供更加局部的使用。在特定的實(shí)施例中，頭戴式耳機(jī)100作為商業(yè)或工業(yè)應(yīng)用(例如快餐店中)的頭戴式耳機(jī)使用。控制模塊可以位于餐館的中心，并且使鄰近于餐館區(qū)域中的任何地方的員工彼此之間或者員工與消費(fèi)者之間能夠進(jìn)行通信。在另一個(gè)實(shí)施例中，無線電裝置111被構(gòu)造成用于廣域通信。在一個(gè)實(shí)施例中，無線電裝置111為能夠在幾英里范圍內(nèi)進(jìn)行通信的商業(yè)無線電裝置。這種配置將允許在發(fā)生緊急情況時(shí)第一急救者(first-responders)在特殊的地理區(qū)域中保持通信，而不必依賴任何特殊基礎(chǔ)設(shè)施的可用性。繼續(xù)描述該實(shí)施例，外殼102可以是頭盔的一部分或者其他緊急保護(hù)裝置。在另一個(gè)實(shí)施例中，無線電裝置111被構(gòu)造成在軍用信道上工作，而外殼102在軍用組件或頭戴式耳機(jī)中一體地形成。無線頭戴式耳機(jī)100具有單個(gè)非立體聲的耳用揚(yáng)聲器104。第一麥克風(fēng)106靠近耳用揚(yáng)聲器104設(shè)置，而第二麥克風(fēng)105則位于耳塞上方。這樣，麥克風(fēng)被隔開，但仍然使從說話者的嘴發(fā)出的聲音到達(dá)麥克風(fēng)。此外，麥克風(fēng)106將總是更靠近說話者的嘴，以便能夠簡化語音源的識(shí)別?？梢岳斫獾氖?，可以以可選的方式來放置麥克風(fēng)。在一個(gè)實(shí)施例中，一個(gè)麥克風(fēng)或兩個(gè)麥克風(fēng)都可以設(shè)置在吊桿上。圖4示出了無線頭戴式耳機(jī)系統(tǒng)125。無線頭戴式耳機(jī)系統(tǒng)125與先前描述的無線頭戴式耳機(jī)系統(tǒng)10類似，因此對(duì)系統(tǒng)125不再進(jìn)行詳細(xì)描述。無線頭戴式耳機(jī)系統(tǒng)125具有頭戴式耳機(jī)外殼，頭戴式耳機(jī)外殼具有一組立體聲揚(yáng)聲器131和127。第一麥克風(fēng)133附接在頭戴式耳機(jī)外殼上。第二麥克風(fēng)134位于電線136末端的第二外殼中。電線136連接到頭戴式耳機(jī)外殼上，并且與處理器電耦合。電線136可以包含夾子138，用于將第二外殼和麥克風(fēng)134固定在相對(duì)一致的位置。這樣，麥克風(fēng)133被設(shè)置成靠近用戶的一只耳朵，而第二麥克風(fēng)134可被放置在用戶的衣服上，例如，在胸部的中間。這種麥克風(fēng)配置使得麥克風(fēng)能夠間隔非常遠(yuǎn)，但仍然允許在說話者的嘴到每個(gè)麥克風(fēng)之間建立通信路徑。在優(yōu)選的使用中，第二麥克風(fēng)距離說話者的嘴總是比第一麥克風(fēng)133遠(yuǎn)，從而能夠簡化信號(hào)識(shí)別處理。然而，用戶可能會(huì)無意地將麥克風(fēng)放置在非?？拷彀偷牡胤?，從而導(dǎo)致麥克風(fēng)133遠(yuǎn)離。因此，用于頭戴式耳機(jī)125的分離處理可需要額外的技巧(sophistication)和處理、以及更強(qiáng)大的BSS算法，以解決麥克風(fēng)的不確定的布置安排。圖5示出了無線頭戴式耳機(jī)系統(tǒng)150。無線頭戴式耳機(jī)系統(tǒng)150被構(gòu)造成具有集成的吊桿麥克風(fēng)(boommicrophone)的耳塞式耳機(jī)。圖5從左手側(cè)151和右手側(cè)152示出了無線頭戴式耳機(jī)系統(tǒng)150。無線頭戴式耳機(jī)系統(tǒng)150具有附接到用戶耳朵上或環(huán)繞用戶耳朵的耳夾157。外殼153容納揚(yáng)聲器156。在使用時(shí)，耳夾157使外殼153靠著用戶的一只耳朵，從而將揚(yáng)聲器156放置在靠近用戶耳朵的地方。外殼還具有麥克風(fēng)吊桿(microphoneboom)155。麥克風(fēng)吊桿155可以具有各種長度，但是其通常在1到4英寸范圍內(nèi)。第一麥克風(fēng)160位于麥克風(fēng)吊桿155的末端。第一麥克風(fēng)160被構(gòu)造成具有通往說話者的嘴的相對(duì)直接的路徑。第二麥克風(fēng)161也位于外殼153上。第二麥克風(fēng)161可以設(shè)置在麥克風(fēng)吊桿155上與第一麥克風(fēng)160隔開的位置。在一個(gè)實(shí)施例中，第二麥克風(fēng)161被定位成具有通往說話者的嘴的較為間接的路徑。然而，可以理解，如果吊桿155足夠長，那么兩個(gè)麥克風(fēng)則可以設(shè)置在吊桿的同一側(cè)，以便具有通往說話者的嘴的相對(duì)直接的路徑。然而，如圖所示，第二麥克風(fēng)161位于吊桿155的外側(cè)，因?yàn)榈鯒U內(nèi)側(cè)可能會(huì)與用戶臉部接觸。還可以理解的是，可以在吊桿上或者在外殼的主體部分上進(jìn)一步向后設(shè)置麥克風(fēng)161。外殼153還容納處理器、無線電裝置和電源。電源通常為可再充電的電池形式，而無線電裝置可以遵循例如藍(lán)牙標(biāo)準(zhǔn)。如果無線頭戴式耳機(jī)系統(tǒng)150遵循藍(lán)牙標(biāo)準(zhǔn)，那么無線頭戴式耳機(jī)系統(tǒng)150則與本地藍(lán)牙控制模塊進(jìn)行通信。例如，本地藍(lán)牙控制模塊可以是被構(gòu)造成在無線通信基礎(chǔ)設(shè)施上工作的無線移動(dòng)設(shè)備。這樣便需要在控制模塊中提供相對(duì)較大、較復(fù)雜的電子設(shè)備來支持廣域的無線通信，而該電子設(shè)備可以配帶在腰帶上或者放在公文包中，從而使得外殼153中可以只容納更為緊湊的本地藍(lán)牙無線電裝置。然而，可以理解的是，隨著技術(shù)的進(jìn)步，廣域的無線電裝置也可以并入外殼153中。這樣，用戶便可以利用語音激活命令和指令來實(shí)現(xiàn)通信和控制。在一個(gè)特定的實(shí)施例中，用于藍(lán)牙頭戴式耳機(jī)的外殼大約為6cm×3cm×1.5cm。第一麥克風(fēng)160為噪聲消除定向麥克風(fēng)，并且噪聲消除端口與麥克風(fēng)拾取端口成180度。第二麥克風(fēng)也為定向噪聲消除麥克風(fēng)，并且其拾取端口與第一麥克風(fēng)160的拾取端口垂直。麥克風(fēng)之間隔開3-4cm。麥克風(fēng)之間不應(yīng)靠得太近，以便能夠分離低頻分量，但是也不應(yīng)離得太遠(yuǎn)，以避免高頻帶中的空間假頻現(xiàn)象。在可選的配置中，兩個(gè)麥克風(fēng)均為定向麥克風(fēng)，但是噪聲消除端口與麥克風(fēng)拾取端口成90度。在這種配置中，希望麥克風(fēng)之間的距離稍微大一些，例如為4cm。如果采用全向麥克風(fēng)，那么則可以將間距增大到約6cm，并且使噪聲消除端口與麥克風(fēng)拾取端口成180度。如果麥克風(fēng)的配置容許每個(gè)麥克風(fēng)中存在充分不同的信號(hào)混合，那么則可以采用全向麥克風(fēng)。麥克風(fēng)的拾取方式可以的全向的、定向的、心形線式的、8字形的或遠(yuǎn)聲場(chǎng)噪聲消除方式?？梢岳斫獾氖牵梢赃x擇其他配置以支持特殊的應(yīng)用和物理限制。在圖5的無線頭戴式耳機(jī)150中，麥克風(fēng)的位置與說話者的嘴之間的關(guān)系被恰當(dāng)?shù)叵薅?。在這種成脊?fàn)畹?、預(yù)先確定的物理配置中，無線頭戴式耳機(jī)可以采用廣義旁瓣消除器來濾掉噪聲，從而獲得相對(duì)清晰的語音信號(hào)。這樣，無線頭戴式耳機(jī)不再執(zhí)行信號(hào)分離處理，但是會(huì)根據(jù)揚(yáng)聲器以及將會(huì)產(chǎn)生噪聲的限定區(qū)域的限定位置，而在廣義旁瓣消除器中設(shè)置濾波器系數(shù)。圖6示出了無線頭戴式耳機(jī)系統(tǒng)175。無線頭戴式耳機(jī)系統(tǒng)175具有第一耳塞式耳機(jī)176和第二耳塞式耳機(jī)177。這樣，用戶可以將一個(gè)耳塞式耳機(jī)放在左耳上，而將另一個(gè)耳塞式耳機(jī)放在右耳上。第一耳塞式耳機(jī)176具有用于與用戶的一只耳朵相連的耳夾184。外殼181具有吊桿麥克風(fēng)182，而麥克風(fēng)183則位于吊桿麥克風(fēng)182的遠(yuǎn)端。第二耳塞式耳機(jī)具有用于附接到用戶的另一只耳朵上的耳夾189和外殼186，并且吊桿麥克風(fēng)187具有位于其遠(yuǎn)端的第二麥克風(fēng)188。外殼181容納有例如藍(lán)牙無線電裝置的本地?zé)o線電裝置，以便與控制模塊進(jìn)行通信。外殼186也具有例如藍(lán)牙無線電裝置的本地?zé)o線電裝置，以便與控制模塊進(jìn)行通信。耳塞式耳機(jī)176和177中的每一個(gè)都將麥克風(fēng)信號(hào)傳送到本地模塊。本地模塊具有用于執(zhí)行語音分離處理以使清晰的語音信號(hào)與噪聲分離的處理器。還可以理解，無線頭戴式耳機(jī)系統(tǒng)175可以被構(gòu)造成其中一個(gè)耳塞式耳機(jī)將麥克風(fēng)信號(hào)傳遞到另一個(gè)耳塞式耳機(jī)，并且另一個(gè)耳塞式耳機(jī)具有用于應(yīng)用分離算法的處理器。這樣便可以將清晰的語音信號(hào)發(fā)送到控制模塊。在可選的結(jié)構(gòu)中，處理器25與控制模塊14關(guān)聯(lián)。在這種配置中，無線電裝置27將從麥克風(fēng)32接收的信號(hào)以及從麥克風(fēng)33接收的信號(hào)發(fā)送出去。利用本地?zé)o線電裝置27將麥克風(fēng)信號(hào)發(fā)送到控制模塊，其中無線電裝置27可以是藍(lán)牙無線電裝置，并且上述麥克風(fēng)信號(hào)由控制模塊14接收。處理器47然后可以運(yùn)行信號(hào)分離算法，以產(chǎn)生清晰的語音信號(hào)。在可選的配置中，處理器包含在模塊化的電子裝置83中。這樣，麥克風(fēng)信號(hào)便通過電線81發(fā)送到控制模塊77，而控制模塊中的處理器則應(yīng)用信號(hào)分離處理。圖7示出了無線頭戴式耳機(jī)系統(tǒng)200。無線頭戴式耳機(jī)系統(tǒng)200為耳塞式耳機(jī)形式，并且具有用于連接或環(huán)繞用戶的耳朵的耳夾202。耳塞式耳機(jī)200具有外殼203，而外殼203具有揚(yáng)聲器208。外殼203還容納處理器和本地?zé)o線電裝置(例如藍(lán)牙無線電裝置)。外殼203還具有吊桿204，吊桿204容納有MEMS麥克風(fēng)陣列205。MEMS(微機(jī)電系統(tǒng))麥克風(fēng)是一種將多個(gè)麥克風(fēng)設(shè)置在一個(gè)或多個(gè)集成電路器件上的半導(dǎo)體器件。這些麥克風(fēng)的制造相對(duì)較便宜，并且具有穩(wěn)定的和一致的特性，從而使它們滿足頭戴式耳機(jī)應(yīng)用的需要。如圖7所示，幾個(gè)MEMS麥克風(fēng)可以沿著吊桿204設(shè)置?；诼暛h(huán)境，可以選擇特殊的MEMS麥克風(fēng)而作為第一麥克風(fēng)207和第二麥克風(fēng)206工作。例如，可以基于風(fēng)噪聲、或者基于對(duì)增大麥克風(fēng)之間的空間距離的要求來選擇特殊的麥克風(fēng)組。外殼203內(nèi)的處理器可以用來選擇和激活可用的MEMS麥克風(fēng)的特殊組。還可以理解，麥克風(fēng)陣列可以位于外殼203上的可選位置，或者可以用于補(bǔ)充較傳統(tǒng)的變換器類型的麥克風(fēng)。圖8示出了無線頭戴式耳機(jī)系統(tǒng)210。無線頭戴式耳機(jī)系統(tǒng)210具有耳塞式耳機(jī)外殼212，外殼212具有耳夾213。外殼212容納處理器和本地?zé)o線電裝置(例如藍(lán)牙無線電裝置)。外殼212具有吊桿205，吊桿205在其遠(yuǎn)端設(shè)有第一麥克風(fēng)216。電線219與外殼212中的電子設(shè)備相連，并且在其遠(yuǎn)端設(shè)有具有麥克風(fēng)217的第二外殼。夾子222可以設(shè)置于電線219上，以便將麥克風(fēng)217更穩(wěn)固地附著到用戶上。使用時(shí)，將第一麥克風(fēng)216定位成具有到說話者的嘴的相對(duì)直接的路徑，而將第二麥克風(fēng)217夾在某個(gè)位置，以使其具有到用戶的不同的直接音頻路徑。由于第二麥克風(fēng)217可以被固定在距離說話者嘴的適當(dāng)?shù)木嚯x處，因此在保持通往說話者嘴的聲音路徑的同時(shí)，可以使麥克風(fēng)216和217相對(duì)較遠(yuǎn)地隔開。在優(yōu)選的使用中，第二麥克風(fēng)217距離說話者的嘴總是比第一麥克風(fēng)216距離說話者的嘴要遠(yuǎn)，以便簡化信號(hào)識(shí)別處理。然而，用戶可能無意地將麥克風(fēng)放置在非常靠近嘴的位置，從而導(dǎo)致麥克風(fēng)216距離嘴更遠(yuǎn)。因此，用于頭戴式耳機(jī)210的分離處理可能需要額外的技巧和處理、以及更強(qiáng)大的BSS算法，以解決麥克風(fēng)的不確定的布置安排。圖9示出了用于在頭戴式耳機(jī)上實(shí)現(xiàn)通信的處理225。處理225具有用于產(chǎn)生第一麥克風(fēng)信號(hào)的第一麥克風(fēng)227和用于產(chǎn)生第二麥克風(fēng)信號(hào)的第二麥克風(fēng)229。雖然示出的方法225中具有兩個(gè)麥克風(fēng)，但是可以理解的是，可以采用兩個(gè)以上的麥克風(fēng)和麥克風(fēng)信號(hào)。麥克風(fēng)信號(hào)被接收到語音分離處理230中。語音分離處理230例如可以是盲信號(hào)分離處理。在較為特定的實(shí)施例中，語音分離處理230可以獨(dú)立分量分析處理。題為“多變換器配置中的目標(biāo)聲信號(hào)的分離”的第10/897,219號(hào)美國專利申請(qǐng)更加全面的闡述了用于產(chǎn)生語音信號(hào)的特定處理，而該申請(qǐng)的全部內(nèi)容被并入本文。語音分離處理230產(chǎn)生清晰的語音信號(hào)231。清晰的語音信號(hào)231被接收到傳輸子系統(tǒng)232中。傳輸子系統(tǒng)232例如可以是藍(lán)牙無線電裝置、IEEE802.11無線電裝置或有線連接。此外，可以理解的是，上述傳輸可以是傳輸?shù)骄钟驘o線電通信模塊，或者可以是傳輸?shù)接糜趶V域基礎(chǔ)設(shè)施的無線電裝置。這樣，發(fā)送的信號(hào)235具有指示清晰的語音信號(hào)的信息。圖10示出了用于在頭戴式耳機(jī)上實(shí)現(xiàn)通信的處理250。通信處理250具有用于為語音分離處理254提供第一麥克風(fēng)信號(hào)的第一麥克風(fēng)251。第二麥克風(fēng)252為語音分離處理254提供第二麥克風(fēng)信號(hào)。語音分離處理254產(chǎn)生清晰的語音信號(hào)255，而清晰的語音信號(hào)255被接收到傳輸子系統(tǒng)258中。傳輸子系統(tǒng)258例如可以是藍(lán)牙無線電裝置、IEEE802.11無線電裝置或有線連接。傳輸子系統(tǒng)將傳輸信號(hào)262發(fā)送到控制模塊或其他遠(yuǎn)程無線電裝置。清晰的語音信號(hào)255還被側(cè)音處理模塊256接收。側(cè)音處理模塊256將經(jīng)衰減的清晰的語音信號(hào)饋送回本地?fù)P聲器260。這樣，頭戴式耳機(jī)上的耳塞便為用戶提供更自然的音頻反饋。可以理解的是，側(cè)音處理模塊256可以調(diào)節(jié)響應(yīng)于本地聲環(huán)境而發(fā)送到揚(yáng)聲器260的側(cè)音信號(hào)的音量。例如，語音分離處理254還可以輸出指示噪聲音量的信號(hào)。在局部噪聲環(huán)境中，側(cè)音處理模塊256可以被調(diào)整為將高水平的清晰的語音信號(hào)作為反饋輸出給用戶?？梢岳斫獾氖?，在為側(cè)音處理信號(hào)設(shè)置衰減水平時(shí)也可以采用其他因素。用于無線通信頭戴式耳機(jī)的信號(hào)分離處理可以受益于穩(wěn)健而精確的語音活動(dòng)檢測(cè)器。圖11示出了特別穩(wěn)健而精確的語音活動(dòng)檢測(cè)(VAD)處理。VAD處理265具有兩個(gè)麥克風(fēng)，其中第一麥克風(fēng)位于無線頭戴式耳機(jī)上，以使它比第二麥克風(fēng)更靠近說話者的嘴，如方框266所示。每個(gè)麥克風(fēng)產(chǎn)生各自的麥克風(fēng)信號(hào)，如方框267所示。語音活動(dòng)檢測(cè)器監(jiān)測(cè)每個(gè)麥克風(fēng)信號(hào)中的能量水平，并且將測(cè)得的能量水平進(jìn)行比較，如方框268所述。在一個(gè)簡單的實(shí)現(xiàn)中，當(dāng)信號(hào)間的能量水平的差異超過預(yù)定的閾值時(shí)，監(jiān)測(cè)麥克風(fēng)信號(hào)。該閾值可以是固定的，或者可以根據(jù)聲環(huán)境而調(diào)整。通過比較能量水平的大小，語音活動(dòng)檢測(cè)器可以精確地確定能量峰值是否是由目標(biāo)用戶講話而引起的。通常，上述比較會(huì)導(dǎo)致下列情況(1)第一麥克風(fēng)信號(hào)具有比第二麥克風(fēng)信號(hào)高的能量水平，如方框269所示。信號(hào)的能量水平之間的差異超過預(yù)定的閾值。由于第一麥克風(fēng)更靠近說話者，因此能量水平的這一關(guān)系指示目標(biāo)用戶正在說話，如方框272所示；可以采用控制信號(hào)來指示出現(xiàn)了期望的語音信號(hào)；或者(2)第二麥克風(fēng)信號(hào)具有比第一麥克風(fēng)信號(hào)高的能量水平，如方框270所示。信號(hào)的能量水平之間的差異超過預(yù)定的閾值。由于第一麥克風(fēng)更靠近說話者，因此能量水平的這一關(guān)系指示目標(biāo)用戶不說話，如方框273所示；可以采用控制信號(hào)來指示該信號(hào)僅為噪聲。事實(shí)上，由于一個(gè)麥克風(fēng)更靠近用戶的嘴，因此在該麥克風(fēng)中的講話內(nèi)容將更加響亮，并且可以通過在兩個(gè)被記錄的麥克風(fēng)信道間附加較大的能量差，以跟蹤用戶的講話活動(dòng)。另外，由于BSS/ICA階段從其他信道中去除了用戶的語音，因此在BSS/ICA輸出級(jí)信道間的能量差會(huì)變得更大。圖13示出了利用BSS/ICA處理的輸出信號(hào)的VAD。VAD處理300具有兩個(gè)麥克風(fēng)，其中第一麥克風(fēng)位于無線頭戴式耳機(jī)上，以使它比第二麥克風(fēng)更靠近說話者的嘴，如方框301所示。每個(gè)麥克風(fēng)產(chǎn)生各自的麥克風(fēng)信號(hào)，該麥克風(fēng)信號(hào)被接收到信號(hào)分離處理中。信號(hào)分離處理產(chǎn)生噪聲占支配地位的信號(hào)以及包含講話內(nèi)容的信號(hào)，如方框302所示。語音活動(dòng)檢測(cè)器監(jiān)測(cè)每個(gè)信號(hào)中的能量水平，并且將測(cè)得的能量水平進(jìn)行比較，如方框303所述。在一個(gè)簡單的實(shí)現(xiàn)中，當(dāng)信號(hào)間的能量水平的差異超過預(yù)定的閾值時(shí)，監(jiān)測(cè)麥克風(fēng)信號(hào)。該閾值可以是固定的，或者可以根據(jù)聲環(huán)境而調(diào)整。通過比較能量水平的大小，語音活動(dòng)檢測(cè)器可以精確地確定能量峰值是否是由目標(biāo)用戶講話而引起的。通常，比較導(dǎo)致出現(xiàn)下列情況(1)講話內(nèi)容信號(hào)具有較高的能量水平，然后噪聲占支配地位的信號(hào)再具有較高的能量水平，如方框304所示。信號(hào)的能量水平之間的差異超過預(yù)定的閾值。由于預(yù)先確定講話內(nèi)容信號(hào)包含講話的內(nèi)容，因此能量水平的這一關(guān)系指示目標(biāo)用戶正在說話，如方框307所示；可以采用控制信號(hào)來指示出現(xiàn)了期望的語音信號(hào)；或者(2)噪聲占支配地位的信號(hào)具有較高的能量水平，然后講話內(nèi)容信號(hào)再具有較高的能量水平，如方框305所示。信號(hào)的能量水平之間的差異超過預(yù)定的閾值。由于預(yù)先確定講話內(nèi)容信號(hào)包含講話的內(nèi)容，因此能量水平的這一關(guān)系指示目標(biāo)用戶沒有在說話，如方框308所示；可以采用控制信號(hào)來指示信號(hào)僅為噪聲。在雙信道VAD的另一個(gè)實(shí)施例中，參照?qǐng)D11和圖13描述的處理均被采用。在這種配置中，VAD利用麥克風(fēng)信號(hào)進(jìn)行一種比較(圖11)，并利用信號(hào)分離處理的輸出進(jìn)行另一種比較(圖13)。位于麥克風(fēng)記錄級(jí)的信道和位于ICA階段的輸出級(jí)的信道之間的能量差的組合，可以用來提供穩(wěn)健的評(píng)估，以確定當(dāng)前被處理的幀是否包含期望的語音。雙信道語音檢測(cè)處理265與已知的單信道檢測(cè)器相比具有顯著的優(yōu)點(diǎn)。例如，通過擴(kuò)音器的語音可以使單信道檢測(cè)器指示語音存在，而雙信道語音檢測(cè)處理265將會(huì)理解擴(kuò)音器比目標(biāo)說話者還要遠(yuǎn)，因此不會(huì)在信道間引起較大的能量差，因此將指示該信號(hào)為噪聲。由于僅基于能量測(cè)量的信號(hào)信道VAD非常不可靠，因此其效用也大大受到限制，并且需要像過零速率或先驗(yàn)的期望的說話者講話時(shí)間和頻率模型等的附加標(biāo)準(zhǔn)對(duì)其進(jìn)行補(bǔ)充。然而，雙信道語音檢測(cè)處理265的穩(wěn)健性和準(zhǔn)確性使得VAD能夠在監(jiān)督、控制和調(diào)整無線頭戴式耳機(jī)的操作中擔(dān)任重要角色?？梢圆捎枚喾N方式來實(shí)施在其中VAD檢測(cè)數(shù)字語音樣本(不包含活動(dòng)的(active)語音)的機(jī)制。一種這樣的機(jī)制需要監(jiān)測(cè)較短的周期內(nèi)(周期長度通常在10到30msec范圍內(nèi))數(shù)字語音樣本的能量水平。如果信道間能量水平的差超過固定的閾值，那么則表明數(shù)字語音樣本為活動(dòng)的，否則表明它們是不活動(dòng)的?？蛇x地，VAD的閾值水平可以是自適應(yīng)的，并且背景噪聲能量可以被跟蹤。這一點(diǎn)也可以采用多種方式實(shí)現(xiàn)。在一個(gè)實(shí)施方案中，如果當(dāng)前周期中的能量充分大于特定的閾值(例如由舒適噪聲估計(jì)器(comfortnoiseestimator)作出的背景噪聲估計(jì))，那么則表明數(shù)字語音樣本為活動(dòng)的，否則表明它們是不活動(dòng)的(inactive)。在利用自適應(yīng)閾值水平的單信道VAD中，測(cè)量例如過零速率、頻譜傾斜、能量和頻譜動(dòng)態(tài)的語音參數(shù)，并將其與用于噪聲的值進(jìn)行比較。如果用于語音的參數(shù)與用于噪聲的參數(shù)明顯不同，那么則表明存在活動(dòng)的語音，即使數(shù)字語音樣本的能量水平較低。在當(dāng)前的實(shí)施方案中，可以在不同的信道間進(jìn)行比較，特別是可以將語音中心信道(例如，語音+噪聲或其他)與其他信道進(jìn)行比較，無論該其他信道是否是被分離的噪聲信道，是否是可以被增強(qiáng)或不可以被增強(qiáng)、或被分離(例如噪聲+語音)的噪聲中心信道、或者用于噪聲的存儲(chǔ)值或估計(jì)值。盡管測(cè)量數(shù)字語音樣本的能量對(duì)于檢測(cè)不活動(dòng)的語音來說可能是足夠的，但是相對(duì)于固定閾值的數(shù)字語音樣本頻譜動(dòng)態(tài)，在區(qū)分具有聲頻頻譜的長語音片段和長期背景噪聲時(shí)可能是有用的。在采用頻譜分析的VAD的示例性實(shí)施方案中，VAD利用Itakura或Itakura-Saito失真來執(zhí)行自相關(guān)，以便將基于背景噪聲的長期估計(jì)與基于數(shù)字語音樣本的周期的短期估計(jì)進(jìn)行比較。此外，如果得到語音編碼器的支持，那么則可以采用線譜對(duì)(LSP)來比較基于背景噪聲的長期LSP估計(jì)與基于數(shù)字語音樣本的周期的短期估計(jì)?？蛇x地，當(dāng)可以從另一軟件模塊獲得頻譜時(shí)，可以采用FFT方法。優(yōu)選地，應(yīng)當(dāng)在具有有源語音的數(shù)字語音樣本的活動(dòng)周期的末尾施加將尾響(hangover)應(yīng)用于。尾響跨接較短的不活動(dòng)片段，以確保靜止的拖尾、無聲的音(例如/s/)或低SNR轉(zhuǎn)換內(nèi)容被分類為活動(dòng)的?？梢愿鶕?jù)VAD的操作模式來調(diào)整尾響的量。如果較長活動(dòng)周期之后的周期明顯是不活動(dòng)的(即能量非常低，并且頻譜類似于測(cè)得的背景噪聲)，那么則可以減少尾響周期的長度。通常，跟隨活動(dòng)語音沖擊脈沖的、大約20到500msec范圍的不活動(dòng)的語音將由于尾響而被聲明為活動(dòng)語音。閾值可以在大約-100dBm到大約-30dBm的范圍內(nèi)可調(diào)，并具有在大約-60dBm和大約-50dBm之間的缺省值，并且閾值取決于語音質(zhì)量、系統(tǒng)效率和帶寬要求、或聽覺的閾值水平。可選地，閾值可以是自適應(yīng)的，以便為大于或等于噪聲(例如來自其他信道)值的某些固定值或可變值。在示例性實(shí)施方案中，VAD可以被構(gòu)造成工作在多個(gè)模式下，以便在語音質(zhì)量、系統(tǒng)效率和帶寬要求之間提供系統(tǒng)折衷。在一種模式中，VAD總是不起作用的，并且將所有數(shù)字語音樣本表明為活動(dòng)語音。然而，典型的電話交談具有60％的沉默內(nèi)容或不活動(dòng)的內(nèi)容。因此，如果數(shù)字語音樣本在這些周期內(nèi)受到活動(dòng)VAD的抑制，那么則可以實(shí)現(xiàn)高寬帶增益。此外，通過VAD、特別是自適應(yīng)VAD可以實(shí)現(xiàn)多種系統(tǒng)效率，例如節(jié)能、減少處理要求、提高語音重量或改善用戶界面?；顒?dòng)的VAD不但會(huì)檢測(cè)包含活動(dòng)語音的數(shù)字語音樣本，而且高質(zhì)量的VAD還可以檢測(cè)和利用數(shù)字語音(噪聲)樣本(已分離的或未分離的)的參數(shù)，其中包括范圍在噪聲和語音樣本之間的值、或者噪聲或語音的能量。因此，活動(dòng)的VAD、特別是自適應(yīng)VAD可以實(shí)現(xiàn)提高系統(tǒng)效率的多個(gè)附加特征，其中包括調(diào)制分離步驟和/或后處理(前處理)步驟。例如，將數(shù)字語音樣本識(shí)別為活動(dòng)語音的VAD可以接通或斷開分離處理或任何前/后處理步驟，或者可選地應(yīng)用不同的分離和/或處理技術(shù)，或應(yīng)用分離和處理技術(shù)的組合。如果VAD不識(shí)別活動(dòng)的語音，那么VAD還可以調(diào)制不同的處理，其中包括衰減或消除背景噪聲、估計(jì)噪聲參數(shù)、使信號(hào)和/或硬件參數(shù)標(biāo)準(zhǔn)化、或調(diào)制信號(hào)和/或硬件參數(shù)。圖12示出了通信處理275。通信處理275具有用于產(chǎn)生第一麥克風(fēng)信號(hào)278的第一麥克風(fēng)277，其中第一麥克風(fēng)信號(hào)278被接收到語音分離處理280中。第二麥克風(fēng)279產(chǎn)生第二麥克風(fēng)信號(hào)282，第二麥克風(fēng)信號(hào)282也被接收到語音分離處理280中。在一種配置中，語音活動(dòng)檢測(cè)器285接收第一麥克風(fēng)信號(hào)278和第二麥克風(fēng)信號(hào)282。可以理解的是，可以對(duì)麥克風(fēng)信號(hào)進(jìn)行濾波、數(shù)字化或其他處理。第一麥克風(fēng)277被定位成比麥克風(fēng)279更靠近說話者的嘴。這種預(yù)定的配置能夠簡化語音信號(hào)的識(shí)別，并改進(jìn)語音活動(dòng)的檢測(cè)。例如，雙信道語音活動(dòng)檢測(cè)器285可以執(zhí)行與參照?qǐng)D11或圖13描述的處理類似的處理。語音活動(dòng)檢測(cè)電路的總體設(shè)計(jì)是眾所周知的，因而對(duì)其不再進(jìn)行詳細(xì)描述。有利地，語音活動(dòng)檢測(cè)器285為雙信道語音活動(dòng)檢測(cè)器，如參照?qǐng)D11或圖13描述的那樣。這就意味著VAD285對(duì)于合理的SNR是特別穩(wěn)健而精確的，因此在通信處理275中VAD285可以確實(shí)地用作核心控制機(jī)構(gòu)。雙信道語音活動(dòng)檢測(cè)器285在檢測(cè)語音時(shí)，產(chǎn)生控制信號(hào)286。在通信處理275中，控制信號(hào)286可以有利地用于激活、控制或調(diào)節(jié)幾個(gè)處理。例如，語音分離處理280可以是自適應(yīng)的，并且可以根據(jù)特定的聲環(huán)境而學(xué)習(xí)。語音分離處理280還可以適用于特殊的麥克風(fēng)布置、聲環(huán)境或特殊的用戶語音。為了改善語音分離處理的適應(yīng)性，可以響應(yīng)于語音活動(dòng)控制信號(hào)286而激活學(xué)習(xí)處理288。這樣，在語音可能出現(xiàn)時(shí)，語音分離處理僅采用其適應(yīng)的學(xué)習(xí)處理。此外，在僅存在噪聲時(shí)(或者可選地在噪聲不存在時(shí))，不進(jìn)行學(xué)習(xí)處理，這樣可以節(jié)約處理和電池能量。出于說明的目的，語音分離處理將被描述為獨(dú)立分量分析(ICA)處理。總的來說，在期望的說話者沒有說話的任何時(shí)間間隔內(nèi)，ICA模塊不能夠執(zhí)行其主要的分離功能，因此可以將其關(guān)閉。可以基于對(duì)輸入信道間的能量大小的比較、或者基于期望的說話者的先驗(yàn)的知識(shí)(例如特定的頻譜特征)，由語音活動(dòng)檢測(cè)模塊285來監(jiān)測(cè)和控制這種“開”和“關(guān)”狀態(tài)。在不存在語音時(shí)，通過關(guān)閉ICA，ICA濾波器便不會(huì)不適當(dāng)?shù)貓?zhí)行自適應(yīng)處理，從而使這種自適應(yīng)僅在能夠?qū)崿F(xiàn)分離改進(jìn)時(shí)才執(zhí)行。即使在期望的說話者沉默的延長期之后，對(duì)ICA濾波器的自適應(yīng)的控制還允許ICA處理實(shí)現(xiàn)和保持較好的分離質(zhì)量，并且可以避免由用于解決ICA級(jí)不能解決的情況的徒勞的分離努力而引起的算法異常。各種ICA算法對(duì)無向性噪聲具有不同的穩(wěn)健程度或穩(wěn)定性，但是，在期望的說話者保持沉默(或者沒有噪聲)時(shí)關(guān)閉ICA級(jí)，為方法學(xué)增加了顯著的穩(wěn)健性或穩(wěn)定性。此外，在只存在噪聲時(shí)，由于ICA處理不起作用，因而可以節(jié)約處理和電池的能量。由于在用于ICA實(shí)現(xiàn)的一個(gè)實(shí)施例中采用了無限脈沖響應(yīng)濾波器，因此在理論上不能總是保證組合/學(xué)習(xí)過程的穩(wěn)定性。然而，與具有相同性能的FIR濾波器相比，IIR濾波器系統(tǒng)具有更理想的效率(即等價(jià)的ICAFIR濾波器要長得多，需要高得多的MIPS)，而且采用當(dāng)前的IIR濾波器結(jié)構(gòu)不存在白化失真，并且近似與閉環(huán)系統(tǒng)的極點(diǎn)配置有關(guān)的一組穩(wěn)定性檢驗(yàn)也包括在內(nèi)，從而觸發(fā)濾波器歷史的初始條件以及ICA濾波器的初始條件復(fù)位。由于過去的濾波器錯(cuò)誤(數(shù)字不穩(wěn)定性)的積累可以使IIR濾波本身導(dǎo)致非有界的輸出，因此可以采用在進(jìn)行有限精度編碼(finiteprecisioncoding)以檢驗(yàn)不穩(wěn)定性時(shí)所采用的技術(shù)的寬度。對(duì)ICA濾波級(jí)的輸入和輸出能量的明確評(píng)估用來檢測(cè)異常，并使濾波器和濾波歷史復(fù)位到監(jiān)督模塊所提供的值。在另一實(shí)施例中，話音活動(dòng)監(jiān)測(cè)器控制信號(hào)286用于設(shè)定音量調(diào)節(jié)289。例如，在沒有檢測(cè)到話音活動(dòng)時(shí)，語音信號(hào)281的音量可以充分降低。那么，當(dāng)檢測(cè)到話音活動(dòng)時(shí)，語音信號(hào)281的音量可以增大。也可以在任何后處理級(jí)的輸出進(jìn)行音量調(diào)節(jié)。這樣不僅可以提供更好的通信信號(hào)，而且可以節(jié)省有限的電池電量。噪聲估計(jì)處理290可以采用類似的方式來確定，當(dāng)沒有檢測(cè)到話音活動(dòng)時(shí)噪聲減少處理何時(shí)可以更主動(dòng)地(aggressively)執(zhí)行。由于噪聲估計(jì)處理290現(xiàn)在意識(shí)到何時(shí)信號(hào)僅為噪聲，因此它可以更準(zhǔn)確地表現(xiàn)噪聲信號(hào)的特征。這樣，噪聲處理可以更好地調(diào)整到實(shí)際的噪聲特征，并且可以更有效地應(yīng)用于沒有語音的周期。然后，當(dāng)檢測(cè)到話音活動(dòng)時(shí)，噪聲減少處理可以調(diào)整以使得對(duì)語音信號(hào)的不利影響較少。例如，某些噪聲減少處理被公知為在語音信號(hào)中創(chuàng)建不期望的假象，盡管它們?cè)跍p少噪聲方面可能非常有效。在語音信號(hào)不存在時(shí)可以執(zhí)行這些噪聲處理，而當(dāng)語音可能存在時(shí)可以使其失去作用或?qū)ζ溥M(jìn)行調(diào)整。在另一個(gè)實(shí)施例中，控制信號(hào)286可以用來調(diào)整某些噪聲減少處理292。例如，噪聲減少處理292可以是譜相減的處理。更具體地說，信號(hào)分離處理280產(chǎn)生噪聲信號(hào)296和語音信號(hào)281。語音信號(hào)281可以具有噪聲分量，并且由于噪聲信號(hào)296準(zhǔn)確地表現(xiàn)了噪聲的特征，因此譜相減處理292可以用于進(jìn)一步去除語音信號(hào)中的噪聲。然而，這種譜相減還用于降低剩余的語音信號(hào)中的能量水平。因此，當(dāng)控制信號(hào)指示語音存在時(shí)，噪聲減少處理則可以調(diào)整為通過對(duì)剩余的語音信號(hào)進(jìn)行相對(duì)較小的放大，以補(bǔ)償譜相減。這種較小水平的放大會(huì)使語音信號(hào)更自然、更一致。此外，由于噪聲減少處理290知道譜相減是如何有效地執(zhí)行的，因此可以相應(yīng)地調(diào)整放大的水平?？刂菩盘?hào)286還可以用來控制自動(dòng)增益控制(AGC)功能294。AGC應(yīng)用于語音信號(hào)281的輸出，并且用來使語音信號(hào)保持在可用的能量水平。由于AGC知道語音何時(shí)存在，因此AGC可以更精確地對(duì)語音信號(hào)施加增益控制。通過更精確地控制輸出的語音信號(hào)或使其正常化，可以更容易和更有效地應(yīng)用后處理功能。此外，可以降低在后處理和傳輸中飽和的風(fēng)險(xiǎn)?？梢岳斫?，控制信號(hào)可以有益地用來控制或調(diào)節(jié)通信系統(tǒng)中的包括其他的后處理295功能的幾個(gè)處理。在示例性的實(shí)施方案中，AGC可以是完全自適應(yīng)的或者具有固定的增益。優(yōu)選地，AGC支持大約-30dB到30dB范圍內(nèi)的完全自適應(yīng)操作模式?？梢元?dú)立建立缺省的增益值，并且缺省的增益值通常為0dB。如果采用自適應(yīng)增益控制，那么初始增益值便由該缺省增益來指定。AGC根據(jù)輸入信號(hào)281的功率水平來調(diào)整增益因素。具有較低能量水平的輸入信號(hào)281被放大到舒適的聲音水平，而高能量水平的信號(hào)則被衰減。乘法器將增益因素應(yīng)用于輸入信號(hào)，輸入信號(hào)然后便為輸出信號(hào)。通常為0dB的缺省增益被初始地應(yīng)用于輸入信號(hào)中。功率估計(jì)器估計(jì)增益調(diào)整信號(hào)的短期平均功率。優(yōu)選每進(jìn)行八次采樣便計(jì)算一次輸入信號(hào)的短期平均功率，對(duì)于8kHz的信號(hào)通常每1ms計(jì)算一次輸入信號(hào)的短期平均功率。剪輯邏輯(clippinglogic)對(duì)短期平均功率進(jìn)行分析，以識(shí)別幅度大于預(yù)定的剪輯閾值的、增益經(jīng)過調(diào)整的信號(hào)。剪輯邏輯控制AGC旁路開關(guān)，當(dāng)增益經(jīng)過調(diào)整的信號(hào)的幅度超過預(yù)定的剪輯閾值時(shí)，AGC旁路開關(guān)直接將輸入信號(hào)連接到媒體隊(duì)列。AGC旁路開關(guān)保持在開啟位置或旁路位置，直到AGC進(jìn)行自適應(yīng)，從而使增益經(jīng)過調(diào)整的信號(hào)的幅度落到剪輯閾值以下為止。在已描述的示例性實(shí)施方案中，雖然如果檢測(cè)到溢出或剪輯時(shí)AGC應(yīng)當(dāng)非?？焖俚剡M(jìn)行自適應(yīng)，但是AGC還是被設(shè)計(jì)成緩慢的進(jìn)行自適應(yīng)。從系統(tǒng)方面來看，如果VAD確定話音是非活動(dòng)的，那么AGC自適應(yīng)應(yīng)當(dāng)保持固定，或者被設(shè)計(jì)成使背景噪聲衰減或消除。在另一實(shí)施例中，控制信號(hào)286可以用來激活傳輸子系統(tǒng)291或使其不活動(dòng)。具體地，如果傳輸子系統(tǒng)291為無線電裝置，那么當(dāng)檢測(cè)到話音活動(dòng)時(shí)，無線電裝置則只需被激活或者被充分供電。這樣，當(dāng)沒有檢測(cè)到話音活動(dòng)時(shí)，則可以降低傳輸功率。由于本地?zé)o線電系統(tǒng)可能由電池來供電，因此節(jié)省傳輸功率可以提高頭戴式耳機(jī)系統(tǒng)的可用性。在一個(gè)實(shí)施例中，從傳輸系統(tǒng)291發(fā)送的信號(hào)為藍(lán)牙信號(hào)293，而藍(lán)牙信號(hào)293由控制模塊中的相應(yīng)的藍(lán)牙接收機(jī)接收。圖14示出了通信處理350。通信處理350具有用于向語音分離處理355提供第一麥克風(fēng)信號(hào)的第一麥克風(fēng)351。第二麥克風(fēng)352向語音分離處理355提供第二麥克風(fēng)信號(hào)。語音分離處理355產(chǎn)生相對(duì)清晰的語音信號(hào)356以及指示聲噪聲的信號(hào)357。雙信道話音活動(dòng)檢測(cè)器360從語音分離處理接收一對(duì)信號(hào)，以確定語音何時(shí)可能出現(xiàn)，并且在語音可能出現(xiàn)時(shí)產(chǎn)生控制信號(hào)361。話音活動(dòng)檢測(cè)器360執(zhí)行如參照?qǐng)D11或圖13所描述的VAD過程?？刂菩盘?hào)361可以用來激活或調(diào)整噪聲估計(jì)處理363。如果噪聲估計(jì)處理363知道信號(hào)357中何時(shí)可能不包含語音，那么噪聲估計(jì)處理363則可以更精確地描述噪聲的特征。噪聲減少處理365然后可以利用對(duì)聲噪聲特征的了解，而更全面、更精確地減少噪聲。由于來自語音分離處理的語音信號(hào)356可能具有某些噪聲分量，因此附加的噪聲減少處理365可以進(jìn)一步改善語音信號(hào)的質(zhì)量。這樣，傳輸處理368接收的信號(hào)便是噪聲分量較少的質(zhì)量較好的信號(hào)。還可以理解的是，控制信號(hào)361可以用來控制通信處理350的其他方面，例如噪聲減少處理或傳輸處理的激活，或者語音分離處理的激活。(已分離的或未分離的)噪聲樣本的能量可以用來調(diào)制輸出增強(qiáng)的話音的能量或遠(yuǎn)端用戶語音的能量。此外，VAD可以在本發(fā)明的處理之前、本發(fā)明的處理當(dāng)中以及本發(fā)明的處理之后調(diào)制信號(hào)的參數(shù)。總的來說，所描述的分離處理采用一組由至少兩個(gè)分開的麥克風(fēng)構(gòu)成的麥克風(fēng)組。在某些情況下，希望所述麥克風(fēng)具有通往說話者話音的相對(duì)直接的路徑。在這種路徑中，在不存在任何物理障礙的情況下，說話者的話音直接傳送到每個(gè)麥克風(fēng)。在其他情況下，所述麥克風(fēng)可以被放置成其中一個(gè)麥克風(fēng)具有相對(duì)直接的路徑，而另一個(gè)麥克風(fēng)遠(yuǎn)離說話者?？梢岳斫獾氖牵缈梢愿鶕?jù)預(yù)期的聲環(huán)境、物理限制和可用的處理功率來實(shí)現(xiàn)特定的麥克風(fēng)配置。對(duì)于需要更穩(wěn)健的分離的應(yīng)用來說，或者在配置約束使更多的麥克風(fēng)有用時(shí)，分離處理可以具有兩個(gè)以上的麥克風(fēng)。例如，在某些應(yīng)用中，說話者可以位于與一個(gè)或多個(gè)麥克風(fēng)屏蔽的位置是有可能的。在這種情況下，采用附加的麥克風(fēng)以提高至少兩個(gè)麥克風(fēng)具有通往說話者話音的相對(duì)直接的路徑的可能性。每個(gè)麥克風(fēng)都接收來自語音源和噪聲源的聲能量，并產(chǎn)生具有語音分量和噪聲分量的組合的麥克風(fēng)信號(hào)。由于每個(gè)麥克風(fēng)都與其他麥克風(fēng)隔開，因此每個(gè)麥克風(fēng)都將產(chǎn)生略有不同的組合信號(hào)。例如，噪聲和語音的相對(duì)容量可以發(fā)生變化，并且對(duì)于每個(gè)聲源來說，定時(shí)和延遲也可以發(fā)生變化。每個(gè)麥克風(fēng)所產(chǎn)生的組合信號(hào)被分量處理接收。分離處理對(duì)所接收的組合信號(hào)進(jìn)行處理，并產(chǎn)生語音信號(hào)和指示噪聲的信號(hào)。在一個(gè)實(shí)施例中，分離處理利用獨(dú)立分量分析(ICA)處理來產(chǎn)生上述兩個(gè)信號(hào)。ICA處理利用交叉濾波器(crossfilter)過濾掉所接收的組合信號(hào)，其中交叉濾波器優(yōu)選為具有非線性有界函數(shù)的無限脈沖響應(yīng)濾波器。非線性有界函數(shù)是具有可被快速計(jì)算出的預(yù)定的最大值和最小值的非線性函數(shù)，例如基于輸入值而輸出正值或負(fù)值的符號(hào)函數(shù)。在信號(hào)重復(fù)反饋之后，產(chǎn)生雙信道輸出信號(hào)，其中一個(gè)信道中噪聲占支配地位，因而它基本由噪聲分量組成，而另一個(gè)信道則包含噪聲和語音的組合?？梢岳斫?，根據(jù)本公開內(nèi)容可以采用其他的1CA濾波函數(shù)和處理?？蛇x地，本發(fā)明預(yù)期采用其他的源分離技術(shù)。例如，分離處理可以采用盲源分離(BSS)處理，或者利用一定程度的聲環(huán)境的先驗(yàn)知識(shí)的應(yīng)用特定自適應(yīng)濾波處理，以實(shí)現(xiàn)基本類似的信號(hào)分離。在頭戴式耳機(jī)配置中，麥克風(fēng)的相對(duì)位置可以是事先已知的，并且該位置信息在識(shí)別語音信號(hào)時(shí)是有用的。例如，在某些麥克風(fēng)配置中，其中一個(gè)麥克風(fēng)很可能距離說話者最近，而所有其他麥克風(fēng)則距離說話者較遠(yuǎn)。利用這一預(yù)定的位置信息，識(shí)別過程便能夠確定哪一個(gè)被分離的信道會(huì)是語音信號(hào)、以及哪一個(gè)是噪聲占支配地位的信號(hào)。采用該方法的優(yōu)點(diǎn)在于能夠識(shí)別哪一個(gè)是語音信道以及哪一個(gè)是噪聲占支配地位的信道，而基本不必首先對(duì)信號(hào)進(jìn)行處理。因此，該方法是有效的并且允許快速的信道識(shí)別，但是由于采用了更加確定的(defined)麥克風(fēng)配置，因此該方法較不靈活。在頭戴式耳機(jī)中，可以選擇麥克風(fēng)的配置，以使其中一個(gè)麥克風(fēng)幾乎總是最靠近說話者的嘴。識(shí)別處理可以仍然采用一個(gè)或多個(gè)確保信道被正常識(shí)別的其他識(shí)別處理。現(xiàn)在參照?qǐng)D15，其中示出了特定的分離處理400。處理400將變換器定位成接收聲信息和噪聲，并產(chǎn)生組合信號(hào)以進(jìn)一步處理，如處理402和404所示。如處理406所示，組合信號(hào)被處理到信道中。處理406通常包括一組具有自適應(yīng)濾波系數(shù)的濾波器。例如，如果處理406采用ICA處理，那么處理406便具有多個(gè)濾波器，并且其中每個(gè)濾波器都具有自適應(yīng)的、可調(diào)整的濾波系數(shù)。在執(zhí)行處理406時(shí)，將上述系數(shù)進(jìn)行調(diào)整以改善分離性能，如處理421所示，并且在濾波器中應(yīng)用和采用新的系數(shù)，如處理423所示。濾波系數(shù)的這種連續(xù)自適應(yīng)使得處理406即使在變化的聲環(huán)境中也能夠提供足夠的分離水平。處理406通常產(chǎn)生兩個(gè)信道，在處理408中對(duì)所述兩個(gè)信道進(jìn)行識(shí)別。特別地，一個(gè)信道被識(shí)別為噪聲占支配地位的信號(hào)，而另一個(gè)信道被識(shí)別為語音信號(hào)，其中語音信號(hào)可以是噪聲和信息的組合。如處理415所示，可以測(cè)量噪聲占支配地位的信號(hào)或組合信號(hào)，以檢測(cè)信號(hào)分離水平。例如，可以測(cè)量噪聲占支配地位的信號(hào)，以檢測(cè)語音分量的水平，并且可以響應(yīng)于測(cè)量結(jié)果來調(diào)整麥克風(fēng)的增益。在運(yùn)行處理400期間或者在該處理的準(zhǔn)備期間可以執(zhí)行測(cè)量和調(diào)整。這樣，在設(shè)計(jì)、測(cè)試或制造處理中，可以為上述處理選擇并預(yù)先確定期望的增益因素，從而使處理400免于在運(yùn)行處理中執(zhí)行測(cè)量和設(shè)定操作。此外，增益的適當(dāng)設(shè)置可以從例如高速數(shù)字示波器的精密電子測(cè)試裝置的使用中獲益，其中所述精密的電子測(cè)試裝置會(huì)非常有效地用于設(shè)計(jì)、測(cè)試或制造階段?？梢岳斫獾氖?，可以在設(shè)計(jì)、測(cè)試或制造階段進(jìn)行初始增益設(shè)置，并且在處理100的現(xiàn)場(chǎng)運(yùn)行期間，可以對(duì)增益設(shè)置進(jìn)行附加的調(diào)整。圖16說明了ICA或BSS處理功能的一個(gè)實(shí)施方案500。參照?qǐng)D16和17描述的ICA處理特別適于圖5、6和7中說明的頭戴式耳機(jī)的設(shè)計(jì)。這些結(jié)構(gòu)較好地限定并預(yù)先確定了麥克風(fēng)的定位，并允許從位于說話者嘴前方的相對(duì)較小的“氣泡(bubble)”中提取出兩個(gè)語音信號(hào)。分別從信道510和520接收輸入信號(hào)X1和X2。通常，這些信號(hào)中的每一個(gè)都可以來自至少一個(gè)麥克風(fēng)，但是可以理解的是，也可以采用其他的信號(hào)源。交叉濾波器W1和W2被應(yīng)用于每個(gè)輸入信號(hào)，以產(chǎn)生被分離的信號(hào)U1的信道530和被分離的信號(hào)U2的信道540。信道530(語音信道)包含占支配地位的期望的信號(hào)，信道540(噪聲信道)包含占支配地位的噪聲信號(hào)。應(yīng)當(dāng)理解，雖然采用術(shù)語“語音信道”和“噪聲信道”，但是“語音”和“噪聲”是可以基于愿望進(jìn)行互換的，例如愿望可以是一個(gè)語音和/或噪聲比其他語音和/或噪聲更令人想得到。此外，所述方法還可以用于使混合的噪聲信號(hào)與兩個(gè)以上的信號(hào)源分離。無限脈沖響應(yīng)濾波器優(yōu)選用于本發(fā)明的處理中。無限脈沖響應(yīng)濾波器是這樣一種濾波器其輸出信號(hào)作為輸入信號(hào)的至少一部分被饋送回濾波器中。有限脈沖響應(yīng)濾波器是這樣一種濾波器其輸出信號(hào)并不作為輸入而被反饋。交叉濾波器W12和W21可以具有在時(shí)間上稀疏分布的系數(shù)，以捕獲較長周期的時(shí)間延遲。在最簡單的形式中，交叉濾波器W12和W21為每個(gè)濾波器僅具有一個(gè)濾波系數(shù)的增益因素，例如，輸出信號(hào)和反饋輸入信號(hào)之間的時(shí)間延遲的延遲增益因素，以及對(duì)輸入信號(hào)進(jìn)行放大的幅度增益因素。在其他形式中，交叉濾波器可以各自具有數(shù)以十計(jì)、數(shù)以百計(jì)或數(shù)以千計(jì)的濾波系數(shù)。如下面所描述的那樣，輸出信號(hào)U1和U2可由后處理子模塊、降噪模塊或語音特征提取模塊進(jìn)一步處理。雖然已明確導(dǎo)出了ICA學(xué)習(xí)規(guī)則以實(shí)現(xiàn)盲源分離，但是其對(duì)于在聲環(huán)境中的語音處理的實(shí)際實(shí)施可以導(dǎo)致濾波方案的不穩(wěn)定行為。為了確保該系統(tǒng)的穩(wěn)定性，W12以及類似的W21的自適應(yīng)動(dòng)力學(xué)在第一位置必須是穩(wěn)定的(stable)。這種系統(tǒng)的增益余量在一般意義上是較低的，因而輸入增益的增大(其例如與非靜止語音信號(hào)沖突)可以導(dǎo)致不穩(wěn)定，從而導(dǎo)致權(quán)值系數(shù)的指數(shù)地增長。由于語音信號(hào)一般呈現(xiàn)零平均值的稀疏分布，因此符號(hào)函數(shù)將會(huì)在時(shí)間上出現(xiàn)頻繁振蕩，并導(dǎo)致不穩(wěn)定的行為。最后，由于快速收斂希望得到較大的學(xué)習(xí)參數(shù)，因此在穩(wěn)定性和性能之間存在固有的折衷，因?yàn)檩^大的輸入增益將使得系統(tǒng)更不穩(wěn)定。已知的學(xué)習(xí)規(guī)則不但導(dǎo)致出現(xiàn)不穩(wěn)定，而且往往由非線性符號(hào)函數(shù)而引起振蕩，尤其是在接近穩(wěn)定性極限時(shí)，從而導(dǎo)致濾波的輸出信號(hào)U1(t)和U2(t)產(chǎn)生混響。為了解決這些問題，W12和W21的自適應(yīng)規(guī)則需要保持穩(wěn)定。如果用于濾波系數(shù)的學(xué)習(xí)規(guī)則是穩(wěn)定的，并且從X到U的系統(tǒng)傳遞函數(shù)的閉環(huán)極點(diǎn)位于單位圓內(nèi)，那么廣泛的分析和經(jīng)驗(yàn)研究顯示出，系統(tǒng)在BIBO(有界輸入有界輸出)中是穩(wěn)定的。因此，總的處理方案的最后相應(yīng)目標(biāo)是在穩(wěn)定約束下的噪聲語音信號(hào)的盲源分離。因此，保證穩(wěn)定性的主要方法是適當(dāng)?shù)貙?duì)輸入進(jìn)行縮放。在該架構(gòu)中，基于引入的輸入信號(hào)的特征來調(diào)整縮放因數(shù)sc_fact。例如，如果輸入太高，那么將導(dǎo)致sc_fact增大，從而減小輸入幅度。在性能和穩(wěn)定性之間存在妥協(xié)。將輸入縮小sc_fact會(huì)降低SNR，從而導(dǎo)致分離性能降低。因而，輸入應(yīng)當(dāng)僅被縮放到保證穩(wěn)定性所需的程度。對(duì)于交叉濾波器來說，可以通過運(yùn)行在每個(gè)樣本都引起權(quán)值系數(shù)短期波動(dòng)的濾波器架構(gòu)，從而避免相關(guān)混響，來獲得附加的穩(wěn)定。該自適應(yīng)規(guī)則的濾波可以看作是時(shí)域平滑。在頻域中可以執(zhí)行進(jìn)一步的濾波器平滑，以加強(qiáng)相鄰頻率點(diǎn)上收斂的分離濾波的相干性。通過將K-tap濾波器零抽頭(zerotapping)為長度L，然后利用增強(qiáng)的時(shí)間支持對(duì)該濾波器進(jìn)行傅立葉變換，隨后再進(jìn)行傅立葉反變換，可以方便地實(shí)現(xiàn)這一點(diǎn)。由于已經(jīng)使濾波器有效地具有矩形時(shí)域窗口，因此在頻域中由正弦函數(shù)使其相應(yīng)地平滑。在規(guī)則的時(shí)間間隔內(nèi)可以完成該頻域平滑，以便周期地將被調(diào)整的濾波系數(shù)重新初始化為相干的解。以下等式為可以用于每個(gè)時(shí)間樣本t的ICA濾波器結(jié)構(gòu)的實(shí)施例，其中k為時(shí)間增量變量。U1(t)＝X1(t)+W12(t)U2(t)(等式1)U2(t)＝X2(t)+W21(t)U1(t)(等式2)ΔW12k＝-f(U1(t))×U2(t-k)(等式3)ΔW21k＝-f(U2(t))×U1(t-k)(等式4)函數(shù)f(x)為非線性有界函數(shù)，即具有預(yù)定的最大值和預(yù)定的最小值的非線性函數(shù)。f(x)優(yōu)選為可以快速接近由變量x的符號(hào)所決定的最大值或最小值的非線性有界函數(shù)。例如，符號(hào)函數(shù)f(x)是根據(jù)x的正負(fù)而取二進(jìn)制值1或-1的函數(shù)。示例性非線性有界函數(shù)包括但不限于(等式7)f(x)=tanh(x)=ex-e-xex+e-x]]>(等式8)(等式9)這些規(guī)則假定浮點(diǎn)精度是可用的，以執(zhí)行必要的計(jì)算。雖然浮點(diǎn)精度是優(yōu)選的，但是也可以采用定點(diǎn)運(yùn)算，尤其是當(dāng)用于具有最小化的計(jì)算處理能力的設(shè)備時(shí)。盡管能夠采用定點(diǎn)運(yùn)算，但是收斂到最佳ICA的解則更加困難。事實(shí)上，ICA算法是基于干擾源必須被消除的原則的。由于定點(diǎn)運(yùn)算在減去幾乎相等的數(shù)字時(shí)(或者在加上完全不同的數(shù)字時(shí))存在一定的不精確，因此ICA算法可能未顯示出最佳的收斂特性?？梢杂绊懛蛛x性能的另一個(gè)因素是濾波因數(shù)量化誤差效果。由于濾波系數(shù)的分辨率是有限的，因此濾波系數(shù)的自適應(yīng)將在某個(gè)點(diǎn)產(chǎn)生逐漸成增加的分離改進(jìn)，從而在確定收斂特性時(shí)需要進(jìn)行考慮。量化誤差效果取決于多個(gè)因素，但是主要為所采用的濾波長度和位分辨率的函數(shù)。前面提到的輸入縮放問題在防止數(shù)字溢出的有限精度計(jì)算中也是必不可少的。由于濾波處理中所涉及的卷積可能潛在地增加到大于可用分辨率范圍的數(shù)字，因此縮放因數(shù)必須保證濾波器的輸入足夠小，以防止這一情況出現(xiàn)。本處理的功能從至少兩個(gè)音頻輸入信道(例如麥克風(fēng))接收輸入信號(hào)。音頻輸入信道的數(shù)量可以增大到超過兩個(gè)信道的最小值。隨著輸入信道數(shù)量的增加，語音分離質(zhì)量通?？梢愿纳频捷斎胄诺赖臄?shù)量與音頻信號(hào)源的數(shù)量相等時(shí)的情形。例如，如果輸入的音頻信號(hào)的來源包括說話者、背景說話者、背景音樂來源以及由遠(yuǎn)處的公路噪聲和風(fēng)噪聲產(chǎn)生的一般的背景噪聲，那么四個(gè)信道的語音分離系統(tǒng)通常將勝過兩個(gè)信道的系統(tǒng)。當(dāng)然，采用的輸入信道越多，則需要的濾波器和計(jì)算功率就越多?？蛇x地，通常實(shí)現(xiàn)為少于信號(hào)源的總數(shù)量，只要存在用于期望的被分離信號(hào)和噪聲的信道即可。本處理的子模塊和處理可以用于分離輸入信號(hào)的兩個(gè)以上的信道。例如，在蜂窩電話應(yīng)用中，一個(gè)信道可以基本包含期望的語音信號(hào)，另一個(gè)信道可以基本包含來自一個(gè)噪聲源的噪聲信號(hào)，再一個(gè)信道可以基本包含來自另一個(gè)噪聲源的音頻信號(hào)。例如，在多用戶環(huán)境中，一個(gè)信道可以包括主要來自一個(gè)目標(biāo)用戶的語音，而另一個(gè)信道可以包括主要來自不同的目標(biāo)用戶的語音。第三個(gè)信道可以包括噪聲，并且對(duì)于進(jìn)一步處理兩個(gè)語音信道是有用的?？梢岳斫猓郊拥恼Z音信道或目標(biāo)信道可能是有用的。雖然某些應(yīng)用僅涉及期望的語音信號(hào)的一個(gè)源，但是在其他應(yīng)用中可能存在期望的語音信號(hào)的多個(gè)源。例如，遠(yuǎn)程會(huì)議應(yīng)用或音頻監(jiān)視應(yīng)用可能需要使多個(gè)說話者的語音信號(hào)與背景噪聲分離、以及使多個(gè)說話者的語音信號(hào)彼此分離。本處理不但可以用于使語音信號(hào)的一個(gè)源與背景噪聲分離，而且可以用于使一個(gè)說話者的語音信號(hào)與另一個(gè)說話者的語音信號(hào)分離。只要至少一個(gè)麥克風(fēng)具有到達(dá)說話者的相對(duì)直接的路徑，本發(fā)明則將容納多個(gè)信號(hào)源。如果無法獲得這種直接路徑，像兩個(gè)麥克風(fēng)都位于用戶的耳朵附近、并且通往嘴的直接的聲路徑被用戶的面頰封閉的頭戴式耳機(jī)應(yīng)用中那樣，本發(fā)明還是會(huì)起作用的，因?yàn)橛脩舻恼Z音信號(hào)仍被限制在合理小的空間區(qū)域中(圍繞嘴的語音氣泡)。本處理將聲音信號(hào)分散到至少兩個(gè)信道中，例如，其中一個(gè)信道中噪聲信號(hào)處于支配地位(噪聲支配的信道)，而另一個(gè)信道則是用于語音信號(hào)和噪聲信號(hào)的信道(組合信道)。如圖15所示，信道630為組合信道，而信道640為噪聲支配的信道。很可能噪聲支配的信道仍包含某些低水平的語音信號(hào)。例如，如果存在兩個(gè)以上的重要聲源并且僅有兩個(gè)麥克風(fēng)，或者如果兩個(gè)麥克風(fēng)距離較近，而聲源卻離地很遠(yuǎn)，那么單獨(dú)處理則不可能總是完全分離出噪聲。因此，經(jīng)處理的信號(hào)可能需要附加的語音處理，以去除剩余水平的背景噪聲和/或進(jìn)一步改善語音信號(hào)的質(zhì)量。這一點(diǎn)可以通過對(duì)已分離的輸出執(zhí)行單信道或多信道語音增強(qiáng)算法，例如使用具有利用噪聲支配輸出信道估計(jì)的噪聲譜的Wiener濾波器(由于第二個(gè)信道是只有噪聲占支配地位的信道，因此通常不需要VAD)來實(shí)現(xiàn)。Wiener濾波器還可以采用利用話音活動(dòng)檢測(cè)器檢測(cè)的非語音時(shí)間間隔，以便使由長時(shí)間支持的背景噪聲而降低的信號(hào)達(dá)到更好的SNR。此外，有界函數(shù)僅僅是相關(guān)熵計(jì)算的簡化近似，并且不可能總是完全降低信號(hào)的信息冗余。因此，在利用本分離處理將信號(hào)分離之后，可以執(zhí)行后處理以進(jìn)一步改善語音信號(hào)的質(zhì)量?；谠肼曋涞男诺乐械脑肼曅盘?hào)與組合信道中的噪聲信號(hào)具有類似的信號(hào)特征(signalsignature)這一合理假定，在語音處理功能中應(yīng)當(dāng)過濾掉組合信道中的、特征與噪聲支配的信道中的信號(hào)的特征類似的噪聲信號(hào)。例如，譜相減技術(shù)可用來執(zhí)行這種處理。噪聲信道中的信號(hào)的特征可被識(shí)別。與依賴于預(yù)定的噪聲特征假定的現(xiàn)有噪聲濾波器相比，所述語音處理更靈活，因?yàn)槠浞治鎏囟ōh(huán)境的噪聲特征并去除代表特定環(huán)境的噪聲信號(hào)。因此，在去除噪聲時(shí)較少地出現(xiàn)包含過多或包含過少的現(xiàn)象?？梢圆捎美鏦iener濾波和Kalman濾波的其他濾波技術(shù)來執(zhí)行語音后處理。由于ICA濾波的解僅收斂于真實(shí)解案的極限環(huán)(limitcycle)內(nèi)，因此濾波系數(shù)會(huì)保持自適應(yīng)，而不會(huì)導(dǎo)致較好的分離性能。已經(jīng)觀察到某些系數(shù)偏離到其分辨率極限。因此，包含期望的語音信號(hào)的ICA輸出的后處理版本通過如圖所示的HR反饋結(jié)構(gòu)而被反饋，收斂的極限環(huán)被克服，并且不會(huì)使ICA算法失去穩(wěn)定。該處理所帶來的有益之處是收斂大大加速。在對(duì)ICA處理作出一般解釋后，可獲得某些特定的特征用于頭戴式耳機(jī)或耳機(jī)設(shè)備。例如，對(duì)一般的ICA處理進(jìn)行調(diào)整以提供自適應(yīng)的復(fù)位機(jī)構(gòu)。如上所述，ICA處理具有可在操作處理中進(jìn)行自適應(yīng)的濾波器。由于這些濾波器進(jìn)行自適應(yīng)，因此整個(gè)處理最終會(huì)變得不穩(wěn)定，并且最后獲得的信號(hào)會(huì)變得失真或飽和。一旦輸出信號(hào)飽和，濾波器便需要復(fù)位，這樣會(huì)導(dǎo)致在生成的信號(hào)中出現(xiàn)令人煩惱的“毛刺(pop)”。在一種特別期望的配置中，ICA處理具有學(xué)習(xí)級(jí)和輸出級(jí)。學(xué)習(xí)級(jí)采用相對(duì)有效的ICA濾波配置，但其出僅用來“學(xué)習(xí)”輸出級(jí)。輸出級(jí)提供“光滑(smooth)”的功能，并且更慢地進(jìn)行自適應(yīng)以改變條件。這樣，學(xué)習(xí)級(jí)快速地進(jìn)行自適應(yīng)并調(diào)整輸出級(jí)的改變，而輸出級(jí)對(duì)改變具有慣性或抵抗。ICA復(fù)位處理監(jiān)視每個(gè)級(jí)的值，以及最后的輸出信號(hào)。由于學(xué)習(xí)級(jí)快速地執(zhí)行，因此，學(xué)習(xí)級(jí)比輸出級(jí)可能更經(jīng)常出現(xiàn)飽和。一旦出現(xiàn)飽和，學(xué)習(xí)級(jí)的濾波系數(shù)便被復(fù)位到缺省狀態(tài)，而學(xué)習(xí)ICA便以當(dāng)前采樣值來替換其濾波歷史。然而，由于學(xué)習(xí)ICA的輸出沒有直接與輸出信號(hào)相連，因此最后獲得的“假信號(hào)(glitch)”不會(huì)導(dǎo)致任何可察覺的或可聽到的失真。事實(shí)上，這種改變僅導(dǎo)致不同的濾波系數(shù)集被發(fā)送到輸出級(jí)。但是，由于輸出級(jí)相對(duì)較慢地發(fā)生改變，因此其也不會(huì)產(chǎn)生任何可察覺的或可聽到的失真。通過僅對(duì)學(xué)習(xí)級(jí)進(jìn)行復(fù)位，使得ICA處理在沒有由于復(fù)位而產(chǎn)生的實(shí)質(zhì)失真的情況下進(jìn)行。當(dāng)然，輸出級(jí)可能偶爾仍然需要復(fù)位，這會(huì)導(dǎo)致通常的“毛刺”。然而，這種情況在現(xiàn)在是相對(duì)較罕見的。此外，期望復(fù)位機(jī)構(gòu)產(chǎn)生穩(wěn)定的分離ICA濾波輸出，以使用戶感覺最后獲得的音頻信號(hào)中存在最小的失真和中斷。由于飽和檢驗(yàn)是根據(jù)一批立體聲緩沖器采樣來進(jìn)行評(píng)估的，并且在ICA濾波之后，緩沖器應(yīng)當(dāng)被選擇為如實(shí)用的那樣小，因?yàn)镮CA級(jí)的復(fù)位緩沖器將被丟棄，并且在當(dāng)前的采樣周期中沒有足夠的時(shí)間重新進(jìn)行ICA濾波。對(duì)于具有當(dāng)前記錄的輸出緩沖器值的兩個(gè)ICA濾波級(jí)，重新初始化過去的濾波歷史。后處理級(jí)將接收當(dāng)前記錄的語音信號(hào)+噪聲信號(hào)、以及當(dāng)前記錄的噪聲信道的信號(hào)，以作為參考。由于ICA緩沖器的尺寸可以減少到4ms，因此這樣使得在期望的說話者語音輸出中察覺不到不連續(xù)。當(dāng)ICA處理被啟動(dòng)或者被復(fù)位時(shí)，濾波器值或抽頭(tap)被復(fù)位為預(yù)定值。由于頭戴式耳機(jī)或耳機(jī)通常僅具有有限范圍的操作條件，因此可以選取抽頭的缺省值以解決期望的操作配置。例如，每個(gè)麥克風(fēng)與說話者的嘴之間的距離通常保持在較小的范圍內(nèi)，并且期望的說話者的話音頻率也可能在相對(duì)較小的范圍內(nèi)。利用這些約束以及實(shí)際的操作值，可以確定相當(dāng)精確的抽頭值的集合。通過認(rèn)真選擇缺省值，可以縮短ICA執(zhí)行期望的分離的時(shí)間。應(yīng)當(dāng)包括對(duì)濾波器抽頭范圍的明確約束，以約束可能的解決方案空間。這些約束可以來源于方向性考慮或者在先前的實(shí)驗(yàn)中通過收斂到最佳解決方案而獲得的實(shí)驗(yàn)值。還應(yīng)當(dāng)理解，缺省值可以在時(shí)間上以及根據(jù)環(huán)境條件進(jìn)行自適應(yīng)。還可以理解，通信系統(tǒng)可以具有一個(gè)以上的缺省值集合。例如，在非常嘈雜的環(huán)境中可以采用一個(gè)缺省值集合，而在較安靜的環(huán)境中則可以采用另一個(gè)缺省值集合。在另一個(gè)實(shí)施例中，可以為不同的用戶存儲(chǔ)不同的缺省值集合。如果提供一個(gè)以上的缺省值集合，那么則會(huì)包含監(jiān)督模塊，以確定當(dāng)前的操作環(huán)境，以及確定將采用哪個(gè)可用的缺省值。然后，當(dāng)收到復(fù)位命令時(shí)，監(jiān)督處理會(huì)將所選的缺省值引導(dǎo)至ICA處理，并將新的缺省值存儲(chǔ)在例如芯片上的閃存中。從初始狀態(tài)集合開始啟動(dòng)分離優(yōu)化的任何方法被用來加速收斂。對(duì)于任何給定的場(chǎng)景(scenario)，監(jiān)督模塊應(yīng)當(dāng)決定特定的初始狀態(tài)集合是否是適當(dāng)?shù)牟?shí)施該特定的初始狀態(tài)集合。頭戴式耳機(jī)中自然會(huì)出現(xiàn)聲回聲(echo)問題，因?yàn)榭臻g或設(shè)計(jì)的限制可使麥克風(fēng)定位成靠近耳部揚(yáng)聲器。例如，在圖17中，麥克風(fēng)32靠近耳部揚(yáng)聲器19。當(dāng)在耳部揚(yáng)聲器中播放來自遠(yuǎn)端用戶的語音時(shí)，該語音也會(huì)被麥克風(fēng)拾取，并產(chǎn)生回聲而返回到遠(yuǎn)端用戶。根據(jù)耳部揚(yáng)聲器的音量和麥克風(fēng)的位置，這種不期望的回聲可能是響亮而令人煩惱的。聲回聲可被認(rèn)為是干擾噪聲，并可采用相同的處理算法來去除。對(duì)一個(gè)交叉濾波器的濾波器約束反應(yīng)了需要從一個(gè)信道中去除期望的說話者語音，并限制了其解決方案的范圍。其他的交叉濾波器從擴(kuò)音器中去除任何可能的外部干擾和聲回聲。因此，通過給予足夠的自適應(yīng)靈活性以去除回聲，從而確定關(guān)于第二交叉濾波器抽頭的約束。對(duì)于該交叉濾波器來說，學(xué)習(xí)速度可能也需要改變，并且不同于噪聲抑制所需的學(xué)習(xí)速度。根據(jù)頭戴式耳機(jī)的設(shè)置，可以固定耳部揚(yáng)聲器相對(duì)于麥克風(fēng)的位置。為了去除耳部揚(yáng)聲器中的語音，可以提前學(xué)習(xí)和固定必要的第二交叉濾波器。另一方面，麥克風(fēng)的傳輸特性可隨著時(shí)間漂移或者隨著例如溫度的環(huán)境條件改變而漂移。麥克風(fēng)的位置在某種程度上可由用戶調(diào)整。所有這些方面都需要對(duì)交叉濾波系數(shù)進(jìn)行調(diào)整，以便更好地消除回聲。在自適應(yīng)處理中，可以將這些系數(shù)限制在固定的已學(xué)習(xí)的系數(shù)集合附近。與等式(1)至(4)中所描述的算法相同的算法可以用來去除聲回聲。在沒有回聲的情況下，輸出U1將是期望的近端用戶的語音。U2將是去除了近端用戶語音的噪聲參考信道。按照慣例，利用自適應(yīng)歸一化最小均方(NLMS)算法并將遠(yuǎn)端信號(hào)作為參考，從而在麥克風(fēng)信號(hào)中去除聲回聲。需要檢測(cè)近端用戶的沉默，然后假定麥克風(fēng)拾取的信號(hào)僅包含回聲。NLMS算法通過將遠(yuǎn)端信號(hào)作為濾波輸入、以及將麥克風(fēng)信號(hào)作為濾波輸出，從而建立聲回聲的線性濾波模型。當(dāng)檢測(cè)到遠(yuǎn)端用戶和近端用戶都在講話時(shí)，學(xué)習(xí)的濾波器便被凍結(jié)并被應(yīng)用于引入的遠(yuǎn)端信號(hào)，以生成回聲的估計(jì)。然后從麥克風(fēng)信號(hào)中減去該估計(jì)的回聲，并且隨著回聲被去除，最后獲得的信號(hào)被發(fā)送出去。上述方案的缺點(diǎn)在于需要較好地檢測(cè)近端用戶的沉默。如果用戶處于嘈雜的環(huán)境中，那么這一點(diǎn)便是難以實(shí)現(xiàn)的。上述方案還假定在引入的遠(yuǎn)端電信號(hào)-耳部揚(yáng)聲器-麥克風(fēng)拾取路徑中進(jìn)行線性處理。在將電信號(hào)轉(zhuǎn)換成聲音時(shí)，耳部揚(yáng)聲器很少是線性設(shè)備。當(dāng)以較高的音量驅(qū)動(dòng)揚(yáng)聲器時(shí)，非線性效應(yīng)則是明顯的。這樣會(huì)出現(xiàn)飽和，并且會(huì)產(chǎn)生諧波或失真。利用雙麥克風(fēng)配置，來自耳部揚(yáng)聲器的失真的聲信號(hào)將由兩個(gè)麥克風(fēng)拾取。第二交叉濾波器會(huì)將回聲估計(jì)為U2，而第一交叉濾波器則會(huì)從主麥克風(fēng)中去除該回聲。這樣便產(chǎn)生不含回聲的信號(hào)U1。該方案不需要遠(yuǎn)端信號(hào)-麥克風(fēng)這一路徑的模型為非線性。無論近端用戶是否是沉默的，學(xué)習(xí)規(guī)則(3-4)都會(huì)起作用。這樣可以去除雙講話檢測(cè)器，并且在整個(gè)對(duì)話處理中可以對(duì)交叉濾波器進(jìn)行更新。在第二麥克風(fēng)不可用的情況下，近端麥克風(fēng)信號(hào)和引入的遠(yuǎn)端信號(hào)可用作輸入X1和X2。可以仍然采用本專利中所描述的算法來去除回聲。當(dāng)遠(yuǎn)端信號(hào)X2不包含任何近端語音時(shí)，唯一的修改在于權(quán)值W21k全部設(shè)為零。因此將去除學(xué)習(xí)規(guī)則(4)。盡管在單一麥克風(fēng)設(shè)置的情況下，不會(huì)解決非線性問題，但是在整個(gè)對(duì)話處理中仍然可以更新交叉濾波器，并且不需要雙談話檢測(cè)器。在雙麥克風(fēng)或單一麥克風(fēng)的配置中，傳統(tǒng)回聲抑制方法可仍然用來去除任何殘留的回聲。這些方法包括聲回聲抑制和互補(bǔ)的梳狀濾波。在互補(bǔ)的梳狀濾波中，到達(dá)耳部揚(yáng)聲器的信號(hào)首先通過梳狀濾波器的頻帶。麥克風(fēng)與阻帶為第一濾波器的通帶的互補(bǔ)的梳狀濾波器耦合。在聲回聲抑制方面，當(dāng)檢測(cè)到近端用戶沉默時(shí)，麥克風(fēng)信號(hào)衰減6dB或者更多。通信處理通常具有后處理步驟，以從語音內(nèi)容信號(hào)中去除附加的噪聲。在一個(gè)實(shí)施例中，噪聲特征用來從語音信號(hào)中光譜地(spectrally)減去噪聲。相減的主動(dòng)性(aggressiveness)由過飽和因數(shù)(OSF)來控制。然而，譜相減的主動(dòng)應(yīng)用可以導(dǎo)致令人不舒適的或不自然的語音信號(hào)。為了降低需要的譜相減，通信處理可以對(duì)ICA/BSS處理的輸入進(jìn)行縮放。為了在話音+噪聲信道和僅存在噪聲的信道之間的每個(gè)頻率點(diǎn)對(duì)噪聲特征和幅度進(jìn)行匹配，左輸入信道和右輸入信道可相對(duì)于彼此進(jìn)行縮放，因此從噪聲信道中可以獲得話音+噪聲信道中的噪聲的盡可能接近的模型。在處理級(jí)進(jìn)行縮放而不是調(diào)節(jié)OSF(Over-SubtractionFactor，過量相減因數(shù))，通常會(huì)產(chǎn)生更好的話音質(zhì)量，因?yàn)镮CA級(jí)被迫去除盡可能多的無向性噪聲的定向分量。在特殊的實(shí)施例中，在需要減少附加的噪聲時(shí)，噪聲支配的信號(hào)可被更加放大。這樣，ICA/BSS處理便提供附加的分離，并且需要較少的后處理。實(shí)際的麥克風(fēng)可能存在頻率與靈敏度的失配，而ICA級(jí)可能會(huì)產(chǎn)生每個(gè)信道中高/低頻的不完全分離。因此，為了實(shí)現(xiàn)可能的最佳的語音質(zhì)量，在每個(gè)頻率點(diǎn)或頻率點(diǎn)的范圍內(nèi)對(duì)OSF進(jìn)行單獨(dú)縮放可能是必不可少的。此外，為了改進(jìn)感覺，可以強(qiáng)調(diào)或不強(qiáng)調(diào)所選擇的頻率點(diǎn)。還可以根據(jù)期望的ICA/BSS學(xué)習(xí)速度而調(diào)整來自麥克風(fēng)的輸入水平，以允許更有效地應(yīng)用后處理方法。ICA/BSS和后處理采樣緩沖器在多變化的幅度范圍內(nèi)逐漸發(fā)展。在高輸入水平下，ICA學(xué)習(xí)速度縮小是期望的。例如，在高輸入水平下，ICA濾波器值可以迅速改變，并且更快速地飽和或變得不穩(wěn)定。通過對(duì)輸入信號(hào)進(jìn)行縮放或衰減，學(xué)習(xí)速度可以適當(dāng)降低。也期望對(duì)后處理的輸入進(jìn)行縮小，以避免計(jì)算語音的粗略估計(jì)和導(dǎo)致失真的噪聲功率。為了避免ICA級(jí)中的穩(wěn)定性和溢出問題、以及為了從后處理級(jí)中的最大可能的動(dòng)態(tài)范圍中獲益，因而對(duì)ICA/BSS和后處理級(jí)的輸入數(shù)據(jù)進(jìn)行自適應(yīng)地縮放。在一個(gè)實(shí)施例中，通過適當(dāng)選擇較高的中間級(jí)輸出緩沖器分辨率(與DSP輸入/輸出分辨率相比而言)，可以在整體上增強(qiáng)聲音質(zhì)量。還可以利用輸入縮放來協(xié)助兩個(gè)麥克風(fēng)之間的幅度校準(zhǔn)。如前所述，期望兩個(gè)麥克風(fēng)可以正常匹配。盡管某些校準(zhǔn)可以動(dòng)態(tài)地執(zhí)行，但是在制造處理中也可以執(zhí)行其他校準(zhǔn)和選擇。應(yīng)當(dāng)對(duì)兩個(gè)麥克風(fēng)進(jìn)行校準(zhǔn)，以便與頻率和總的靈敏度匹配，從而使ICA和后處理級(jí)中的調(diào)諧最小。這樣可能需要對(duì)一個(gè)麥克風(fēng)的頻率響應(yīng)的進(jìn)行反相(inversion)，以獲得另一個(gè)麥克風(fēng)的頻率響應(yīng)。為此，可以采用本領(lǐng)域中公知的所有用于實(shí)現(xiàn)信道反相的技術(shù)，其中包括盲信道反相。通過對(duì)多個(gè)產(chǎn)品麥克風(fēng)中的麥克風(fēng)進(jìn)行適當(dāng)匹配，可以實(shí)現(xiàn)硬件校準(zhǔn)。可以考慮離線或在線調(diào)諧。在線調(diào)諧將會(huì)需要VAD的幫助，以便在僅存在噪聲的時(shí)間間隔中調(diào)整校準(zhǔn)設(shè)置，即，麥克風(fēng)的頻率范圍需要由白噪聲優(yōu)先激發(fā)為能夠校正所有頻率。雖然已經(jīng)公開了本發(fā)明的特殊的優(yōu)選實(shí)施方案和可選實(shí)施方案，但是可以理解的是，可以利用本發(fā)明的教導(dǎo)實(shí)施上述技術(shù)的各種修改和延伸。所有這些修改和延伸都被認(rèn)為包含在所附權(quán)利要求的真實(shí)精神和范圍之內(nèi)。權(quán)利要求1.一種頭戴式耳機(jī)，包括外殼；耳部揚(yáng)聲器；與所述外殼相連的第一麥克風(fēng)；與所述外殼相連的第二麥克風(fēng)；以及與所述第一麥克風(fēng)和所述第二麥克風(fēng)耦合的處理器，所述處理器執(zhí)行以下步驟從所述第一麥克風(fēng)接收第一語音信號(hào)加噪聲信號(hào)；從所述第二麥克風(fēng)接收第二語音信號(hào)加噪聲信號(hào)；將所述第一語音信號(hào)加噪聲信號(hào)以及所述第二語音信號(hào)加噪聲信號(hào)作為信號(hào)分離處理的輸入；產(chǎn)生語音信號(hào)；以及發(fā)送所述語音信號(hào)。2.如權(quán)利要求1所述的頭戴式耳機(jī)，進(jìn)一步包括無線電裝置，并且其中所述語音信號(hào)被發(fā)送到所述無線電裝置。3.如權(quán)利要求2所述的頭戴式耳機(jī)，其中所述無線電裝置根據(jù)藍(lán)牙標(biāo)準(zhǔn)工作。4.如權(quán)利要求1所述的頭戴式耳機(jī)，進(jìn)一步包括遠(yuǎn)程控制模塊，并且其中所述語音信號(hào)被發(fā)送到所述遠(yuǎn)程控制模塊。5.如權(quán)利要求1所述的頭戴式耳機(jī)，進(jìn)一步包括側(cè)音電路，其中所述語音信號(hào)被部分地發(fā)送到所述側(cè)音電路，并且在所述耳部揚(yáng)聲器中播放。6.如權(quán)利要求1所述的頭戴式耳機(jī)，進(jìn)一步包括第二外殼；位于所述第二外殼中的第二耳部揚(yáng)聲器；并且其中所述第一麥克風(fēng)位于所述第一外殼中，而所述第二麥克風(fēng)位于所述第二外殼中。7.如權(quán)利要求1所述的頭戴式耳機(jī)，其中所述耳部揚(yáng)聲器、所述第一麥克風(fēng)以及所述第二麥克風(fēng)位于所述外殼中。8.如權(quán)利要求7所述的頭戴式耳機(jī)，其中所述麥克風(fēng)中至少之一與另一個(gè)麥克風(fēng)被定位成朝向不同的風(fēng)向。9.如權(quán)利要求1所述的頭戴式耳機(jī)，其中所述第一麥克風(fēng)被定位成距離用戶嘴至少3英寸。10.如權(quán)利要求1所述的頭戴式耳機(jī)，其中所述第一麥克風(fēng)和所述第二麥克風(fēng)被構(gòu)造成MEMS麥克風(fēng)。11.如權(quán)利要求1所述的頭戴式耳機(jī)，其中所述第一麥克風(fēng)和所述第二麥克風(fēng)是從MEMS麥克風(fēng)的集合中選取的。12.如權(quán)利要求1所述的頭戴式耳機(jī)，其中所述第一麥克風(fēng)和所述第二麥克風(fēng)被定位成所述第一麥克風(fēng)的進(jìn)入端口與所述第二麥克風(fēng)的輸入端口正交。13.如權(quán)利要求1所述的頭戴式耳機(jī)，其中所述麥克風(fēng)之一與所述外殼隔開。14.如權(quán)利要求1所述的頭戴式耳機(jī)，其中所述信號(hào)分離處理為盲源分離處理。15.如權(quán)利要求1所述的頭戴式耳機(jī)，其中所述信號(hào)分離處理為獨(dú)立分量分析處理。16.一種無線頭戴式耳機(jī)，包括外殼；無線電裝置；耳部揚(yáng)聲器；與所述外殼相連的第一麥克風(fēng)；與所述外殼相連的第二麥克風(fēng)；以及處理器，其執(zhí)行以下步驟從所述第一麥克風(fēng)接收第一信號(hào)；從所述第二麥克風(fēng)接收第二信號(hào)；檢測(cè)話音活動(dòng)；響應(yīng)于對(duì)所述話音活動(dòng)的檢測(cè)而生成控制信號(hào)；利用信號(hào)分離處理生成語音信號(hào)；以及將所述語音信號(hào)發(fā)送到所述無線電裝置。17.如權(quán)利要求16所述的無線頭戴式耳機(jī)，其有且僅有一個(gè)外殼，其中所述無線電裝置、耳部揚(yáng)聲器、第一麥克風(fēng)、第二麥克風(fēng)以及處理器位于所述外殼中。18.如權(quán)利要求16所述的無線頭戴式耳機(jī)，其中所述第一麥克風(fēng)位于所述外殼中，而所述第二麥克風(fēng)位于第二外殼中。19.如權(quán)利要求16所述的無線頭戴式耳機(jī)，其中所述第一外殼和所述第二外殼連接在一起，以形成立體聲頭戴式耳機(jī)。20.如權(quán)利要求16所述的無線頭戴式耳機(jī)，其中所述第一麥克風(fēng)與所述外殼隔開，而所述第二麥克風(fēng)與所述第二外殼隔開。21.如權(quán)利要求16所述的無線頭戴式耳機(jī)，其中所述第一麥克風(fēng)與所述外殼隔開，并通過導(dǎo)線與所述外殼相連。22.如權(quán)利要求16所述的無線頭戴式耳機(jī)，其中所述處理進(jìn)一步執(zhí)行以下步驟響應(yīng)于所述控制信號(hào)而使所述信號(hào)分離處理不起作用。23.如權(quán)利要求16所述的無線頭戴式耳機(jī)，其中所述處理進(jìn)一步執(zhí)行以下步驟響應(yīng)于所述控制信號(hào)而調(diào)節(jié)所述語音信號(hào)的音量。24.如權(quán)利要求16所述的無線頭戴式耳機(jī)，其中所述處理進(jìn)一步執(zhí)行以下步驟響應(yīng)于所述控制信號(hào)而調(diào)整噪聲減少處理。25.如權(quán)利要求16所述的無線頭戴式耳機(jī)，其中所述處理進(jìn)一步執(zhí)行以下步驟響應(yīng)于所述控制信號(hào)而激活學(xué)習(xí)處理。26.如權(quán)利要求16所述的無線頭戴式耳機(jī)，其中所述處理進(jìn)一步執(zhí)行以下步驟響應(yīng)于所述控制信號(hào)而估計(jì)噪聲水平。27.如權(quán)利要求16所述的無線頭戴式耳機(jī)，進(jìn)一步包括所述處理器生成噪聲支配的信號(hào)的步驟，并且其中所述檢測(cè)步驟包括接收所述語音信號(hào)和所述噪聲支配的信號(hào)。28.如權(quán)利要求16所述的無線頭戴式耳機(jī)，其中所述檢測(cè)步驟包括接收所述第一信號(hào)和所述第二信號(hào)。29.如權(quán)利要求16所述的無線頭戴式耳機(jī)，其中所述無線電裝置根據(jù)藍(lán)牙標(biāo)準(zhǔn)工作。30.如權(quán)利要求16所述的無線頭戴式耳機(jī)，其中所述信號(hào)分離處理為盲源分離處理。31.如權(quán)利要求16所述的無線頭戴式耳機(jī)，其中所述信號(hào)分離處理為獨(dú)立分量分析處理。32.一種藍(lán)牙頭戴式耳機(jī)，包括外殼，其被構(gòu)造成將耳部揚(yáng)聲器定位成將聲音投射到佩帶者的耳朵中；位于所述外殼上的至少兩個(gè)麥克風(fēng)，其中每個(gè)麥克風(fēng)產(chǎn)生各自的傳感器信號(hào)；處理器，其被配置成接收所述傳感器信號(hào)，并且執(zhí)行分離處理以生成語音信號(hào)。33.一種無線頭戴式耳機(jī)系統(tǒng)，包括耳部揚(yáng)聲器；第一麥克風(fēng)，用于生成第一傳感器信號(hào)；第二麥克風(fēng)，用于生成第二傳感器信號(hào)；處理器；無線電裝置；所述處理器執(zhí)行以下步驟接收所述第一傳感器信號(hào)和所述第二傳感器信號(hào)；將所述第一傳感器信號(hào)和所述第二傳感器信號(hào)作為輸出而提供給信號(hào)分離處理；生成語音信號(hào)；以及發(fā)送所述語音信號(hào)。34.如權(quán)利要求33所述的無線頭戴式耳機(jī)，進(jìn)一步包括外殼，所述外殼容納所述耳部揚(yáng)聲器和所述兩個(gè)麥克風(fēng)。35.如權(quán)利要求33所述的無線頭戴式耳機(jī)，進(jìn)一步包括外殼，所述外殼容納所述耳部揚(yáng)聲器、并且僅容納所述兩個(gè)麥克風(fēng)之一。36.如權(quán)利要求33所述的無線頭戴式耳機(jī)，進(jìn)一步包括外殼，所述外殼容納所述耳部揚(yáng)聲器而不容納所述兩個(gè)麥克風(fēng)。37.如權(quán)利要求33所述的無線頭戴式耳機(jī)，其中所述處理器、所述第一麥克風(fēng)以及所述第二麥克風(fēng)位于同一外殼中。38.如權(quán)利要求33所述的無線頭戴式耳機(jī)，其中所述無線電裝置、所述處理器、所述第一麥克風(fēng)以及所述第二麥克風(fēng)位于同一外殼中。39.如權(quán)利要求33所述的無線頭戴式耳機(jī)，其中所述耳部揚(yáng)聲器和所述第一麥克風(fēng)位于同一外殼中，而所述第二麥克風(fēng)位于另一外殼中。40.如權(quán)利要求33所述的無線頭戴式耳機(jī)，進(jìn)一步包括用于定位第二耳部揚(yáng)聲器和所述耳部揚(yáng)聲器的部件，該部件通常形成立體聲頭戴式耳機(jī)。41.如權(quán)利要求33所述的無線頭戴式耳機(jī)，進(jìn)一步包括用于定位所述耳部揚(yáng)聲器的部件、以及用于容納所述第一麥克風(fēng)的獨(dú)立外殼。42.一種頭戴式耳機(jī)，包括外殼；耳部揚(yáng)聲器；第一麥克風(fēng)，其與所述外殼相連，并具有空間限定的音量，其中以該音量生成語音；第二麥克風(fēng)，其與所述外殼相連，并具有空間限定的音量，其中以該音量生成噪聲；以及與所述第一麥克風(fēng)和所述第二麥克風(fēng)耦合的處理器，所述處理器執(zhí)行以下步驟從所述第一麥克風(fēng)接收第一信號(hào)；從所述第二麥克風(fēng)接收第二信號(hào)；將所述第一信號(hào)和所述第二信號(hào)加上噪聲信號(hào)作為輸入而提供給廣義旁瓣對(duì)消器；生成語音信號(hào)；以及發(fā)送所述語音信號(hào)。全文摘要頭戴式耳機(jī)被構(gòu)造成在嘈雜的聲環(huán)境中產(chǎn)生聽覺上不同的語音信號(hào)。所述頭戴式耳機(jī)將一對(duì)分開的麥克風(fēng)定位在用戶的嘴附近。所述麥克風(fēng)中的每一個(gè)都接收用戶的語音，并且還接收聲環(huán)境噪聲。包含噪聲和信息分量的麥克風(fēng)信號(hào)被接收到分離處理中。所述分離處理產(chǎn)生具有基本減少了噪聲分量的語音信號(hào)。然后對(duì)所述語音信號(hào)進(jìn)行處理，以便進(jìn)行傳輸。在一個(gè)實(shí)施例中，傳輸過程包括利用藍(lán)牙無線電裝置將所述語音信號(hào)發(fā)送到本地控制模塊。文檔編號(hào)G10L21/02GK101031956SQ200580029832公開日2007年9月5日申請(qǐng)日期2005年7月22日優(yōu)先權(quán)日2004年7月22日發(fā)明者埃里克·維斯,杰里米·托曼,湯姆·戴維斯,布里安·莫邁耶申請(qǐng)人:索福特邁克斯有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：埃里克.維斯;杰里米.托曼;湯姆.戴維斯;布里安.莫邁耶
技術(shù)所有人：索福特邁克斯有限公司
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

matlab語音信號(hào)盲分離相關(guān)技術(shù)

語音信號(hào)分離相關(guān)技術(shù)

語音信號(hào)盲源分離相關(guān)技術(shù)

嘈雜環(huán)境下語音識(shí)別相關(guān)技術(shù)

語音信號(hào)處理相關(guān)技術(shù)

matlab語音信號(hào)處理相關(guān)技術(shù)

談?wù)務(wù)Z音信號(hào)編碼相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于嘈雜環(huán)境中語音信號(hào)分離的頭戴式耳機(jī)的制作方法