遠程會議設(shè)備以及聲音發(fā)出/采集設(shè)備的制作方法

文檔序號：7640820閱讀：357來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：遠程會議設(shè)備以及聲音發(fā)出/采集設(shè)備的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及具有麥克風(fēng)陣列和揚聲器陣列的設(shè)備，其用于對接收到的聲音和聲場進行再現(xiàn)，更具體地說，該技術(shù)用于指定說話者或聲源相對于麥克風(fēng)陣列的位置。
背景技術(shù)：
現(xiàn)有技術(shù)中，已經(jīng)提出了用于在發(fā)送器側(cè)接收聲音并且在發(fā)送
器側(cè)再現(xiàn)聲音的聲場的裝置(參見專利文獻1至3)。在這種設(shè)備中，由多個麥克風(fēng)拾取的聲音信號等被發(fā)送，并且在接收器側(cè)利用多個揚聲器對發(fā)送器側(cè)的聲場進行再現(xiàn)。這種設(shè)備具有這樣的優(yōu)點，即說話者的位置可由聲音指定。
在專利文獻1中，公開了一種立體聲信息的創(chuàng)造方法等，該方法通過發(fā)送由多個麥克風(fēng)陣列接收到的聲音信息，并隨后從數(shù)目與麥克風(fēng)陣列數(shù)目相同的揚聲器陣列輸出聲音信息，從而對發(fā)送源的聲場進行再現(xiàn)。
根據(jù)專利文件1所述的方法，毫無疑問地，可以在發(fā)送方對聲場本身進行發(fā)送，并通過聲音指定說話者位置。然而，卻存在必須使用大量線路資源的問題。因此，公開了用于指定說話者的位置信息并發(fā)送該信息的裝置等(例如，參見專利文獻2)。
在專利文獻2中，公開了這樣的設(shè)備在發(fā)送器側(cè)，麥克風(fēng)拾
取說話者的聲音，隨后根據(jù)由麥克風(fēng)獲取的說話者信息來產(chǎn)生說話者位置信息，并且隨后將說話者位置信息與聲音信息進行多路復(fù)用并發(fā) 送，同時在接收器側(cè)，根據(jù)發(fā)送過來的說話者位置信息來對揚聲器發(fā) 聲的位置進行改變，從而在接收器側(cè)對說話者的聲音和位置進行再現(xiàn)。
在專利文獻3中，提出了這樣一種會議設(shè)備由于讓所有說話者都分別握住麥克風(fēng)是不實際的，所以通過利用麥克風(fēng)控制部分來對輸入至各個麥克風(fēng)的聲音信號的相位進行位移和合成，從而指定說話者。在專利文獻3中，通過改變與說話者的座位位置對應(yīng)的相移模式，從而確定給出最大聲音的相位模式，并且隨后根據(jù)所確定的相移模式來指定說話者的位置。
在專利文獻4的談話會議設(shè)備(聲音發(fā)出/采集設(shè)備)中，從布置在上表面的揚聲器發(fā)出經(jīng)由網(wǎng)絡(luò)輸入的聲音信號，并且，將由布置在側(cè)表面的各個麥克風(fēng)(它們的前端被設(shè)置成朝向多個不同方向)所拾取的聲音信號經(jīng)由網(wǎng)絡(luò)發(fā)送至外部。
同樣，在專利文獻5的家庭廣播設(shè)備(聲音發(fā)出/采集設(shè)備)中，通過對來自麥克風(fēng)陣列的各個麥克風(fēng)的聲音采集信號分別進行延遲處理，來檢測說話者方向，并且降低從靠近該說話者的揚聲器發(fā)出來的聲音的音量。
專利文獻1:JP--A--2-114799
專利文獻2:JP--A--9-261351
專利文獻3:JP--A畫-10-145763
專利文獻4.-JP--A--8-298696
專利文獻5:JP—-A--11—5578
發(fā)明內(nèi)容
本發(fā)明所解決的問題
然而，在以上專利文獻中，存在以下問題。
在專利文獻1中的方法中，如上所述，存在必須使用大量線路資源的問題，等等。
在專利文獻2、 3中的方法中，可以根據(jù)從麥克風(fēng)獲取的說話者信息來產(chǎn)生說話者位置信息。但是，來自揚聲器的聲音會干擾位置檢觀U，該揚聲器輸出的聲音是從對面設(shè)備發(fā)送的。因此，存在這樣的問
題由于聲源被誤認為在不同于實際方向的其它方向上，所以麥克風(fēng)
陣列(專利文獻3中的照相機)會指向錯誤方向。
在專利文獻4中的設(shè)備中，由于麥克風(fēng)和揚聲器被放置成彼此緊密相鄰，所以來自揚聲器的許多迂回聲音會包含在各個麥克風(fēng)的聲音采集信號中。因此，在根據(jù)各個麥克風(fēng)的聲音采集信號來指定說話者方向并隨后選擇與有關(guān)方向?qū)?yīng)的聲音采集信號時，有時候會由于迂回聲音的存在而錯誤地檢測出說話者方向。
在專利文獻5中的設(shè)備中，通過對包含迂回聲音的聲音采集信號進行延遲處理來檢測說話者方向。因此，與專利文獻4類似，迂回聲音的影響不能被消除，因此有時候，說話者的方向被錯誤檢測。
因此，本發(fā)明的目的是提供一種即使從一個揚聲器發(fā)出聲音在麥克風(fēng)附近迂回并隨后被麥克風(fēng)檢測到時也能夠估計真實的聲源的遠程會議設(shè)備，所述揚聲器輸出的聲音是由對面設(shè)備發(fā)送的。并且，本發(fā)明的另一個目的是提供聲音發(fā)出/采集設(shè)備，它能夠通過去除迂回聲音的影響來精確地檢測說話者位置。
用于解決問題的裝置
在本發(fā)明中，用于解決上述問題的裝置被構(gòu)建如下。
(1)本發(fā)明的遠程會議設(shè)備包括揚聲器陣列，其包括向上或向下發(fā)出聲音的多個揚聲器；第一麥克風(fēng)陣列和第二麥克風(fēng)陣列，它們被布置成在所述揚聲器陣列的縱向方向上從所述揚聲器陣列兩側(cè) 拾取聲音；第一束產(chǎn)生部分，所述第一束產(chǎn)生部分通過分別以預(yù)定量的延遲對分別由所述第一麥克風(fēng)陣列的麥克風(fēng)拾取到的聲音信號進行延遲處理并對延遲后的聲音信號進行合成，從而產(chǎn)生多個第一聲音采集束，所述第一聲音采集束分別將焦點放置在事先在所述第一麥克風(fēng)陣列側(cè)確定的多個第一聲音采集區(qū)域上；第二束產(chǎn)生部分，所述第二束產(chǎn)生部分通過分別以預(yù)定量的延遲對分別由所述第二麥克風(fēng)陣列的麥克風(fēng)拾取到的聲音信號進行延遲處理并對延遲后的聲音信號進行合成，從而產(chǎn)生多個第二聲音采集束，所述第二聲音采集束分別將焦點放置在事先在所述第二麥克風(fēng)陣列側(cè)確定的多個第二聲音采集區(qū)域上；差信號計算部分，其計算分別朝向所述多個第一聲音采集區(qū)域和所述多個第二聲音采集區(qū)域產(chǎn)生的聲音采集束中那些與關(guān)于所述揚聲器陣列的中心線沿縱向方向處在相互對稱位置的聲音采集區(qū)域?qū)ο鄬?yīng)的聲音采集束的差信號；第一聲源位置估計部分，其選擇一對其中的差信號的信號強度較大的聲音采集區(qū)域；以及第二聲源位置估計部分，其從由所述第一聲源位置估計部分所選擇的所述聲音采集區(qū)域?qū)χ羞x擇與強度較大的聲音采集束相對應(yīng)的聲音采集區(qū)域，從而估計出聲源位置存在于所選擇的聲音采集區(qū)域中。
第一束產(chǎn)生部分和第二束產(chǎn)生部分產(chǎn)生第一和第二采聲音集束從而分別將焦點放置于對稱位置上的聲音采集區(qū)域中。并且，從對面設(shè)備發(fā)送過來并從揚聲器陣列輸出的聲音分別被幾乎對稱地輸出至一對麥克風(fēng)陣列的兩側(cè)。因此，可以這樣考慮，從揚聲器陣列輸出的聲音被大致平均地輸入至第一和第二采聲音集束，并且差信號計算部分計算了第一和第二采聲音集束之間的差信號，所以從揚聲器陣列輸出的聲音可被消除。同樣，即使在計算出聲音采集束的有效值之間的差值時，從揚聲器陣列輸出的聲音被大致平均地輸入至聲音采集束所指向的焦點，從而類似地可以消除從揚聲器陣列輸出的聲音。
并且，即使計算出這個差值，除了從揚聲器陣列輸出的聲音之外的輸入至麥克風(fēng)陣列的聲音也從不會消除。作為典型示例，當(dāng)說話者僅對一側(cè)的麥克風(fēng)陣列說話并且產(chǎn)生了指向說話者方向的聲音采集束時，說話者的聲音被輸入至一個聲音采集束中，但是該聲音不會被輸入至對面?zhèn)鹊穆曇舨杉小Ｓ谑?，說話者聲音本身或者反相的聲音仍保留在差值的計算中。并且，當(dāng)聲源出現(xiàn)在兩側(cè)時，這些信號彼此不同，因此在大多數(shù)情況下，輸入至一對麥克風(fēng)陣列的聲音不對稱。因此，即使計算出該差值，說話者的聲音仍保留下來。并且，即使在計算出有效值時，還是可以類似地提取出說話者聲音的存在。
第一聲源位置估計部分估計聲源位置可能存在于具有較大差信號的聲音采集區(qū)域?qū)χ械囊粋€聲音采集區(qū)域中。第二聲源位置估計部分對分別從聲音采集區(qū)域?qū)χ惺叭〉穆曇粜盘栠M行比較，并且估計聲源位置存在于哪一側(cè)。這樣，根據(jù)本發(fā)明，可以正確地估計聲源(包括說話者的聲音，下文同此)的位置，即使從揚聲器輸出的聲音可能會圍繞麥克風(fēng)迂回并且被該麥克風(fēng)拾取。
在這種情況下，可以通過實時地計算特定時段內(nèi)的峰值平方的時間平均值來獲取聲音信號的有效值。通過利用特定時段內(nèi)的峰值平方的時間平均值、FFT變換后的增益中的多個預(yù)定頻率增益的平方和等等，可以對差信號的信號強度進行比較。通過使用在預(yù)定時間(它長于計算有效值時所使用的時間)內(nèi)獲取的數(shù)據(jù)，可以根據(jù)有效值之間的差信號的時間平均值或者差信號的平方的時間平均值來計算出有效值的差信號的信號強度。這在以下說明中同樣正確。(2) 在本發(fā)明的遠程會議設(shè)備中，在發(fā)明(1)中，所述第一束產(chǎn)生部分和所述第二束產(chǎn)生部分在由所述第二聲源位置估計部分所選擇的所述聲音采集區(qū)域中進一步設(shè)置多個狹窄的聲音采集區(qū)域，從而產(chǎn)生多個分別將焦點放置在所述狹窄的聲音采集區(qū)域上的狹窄的聲音采集束。所述遠程會議設(shè)備還包括第三聲源位置估計部分，其估計出聲源位置存在于與所述多個狹窄的聲音采集區(qū)域相對應(yīng)的聲音采集束中其中的聲音信號的強度較大的一個聲音采集束的區(qū)域中。在本發(fā)明中，在由第二聲源位置估計部分估計出來的聲源位置所處的聲音采集區(qū)域中設(shè)置多個狹窄的聲音采集區(qū)域，隨后在狹窄的聲音采集區(qū)域中分別產(chǎn)生狹窄的聲音采集束。第三聲源位置估計部分在狹窄的聲音采集區(qū)域中選擇信號強度較大的區(qū)域。因此，相對于通過從頭開始逐步縮小聲源位置的范圍來精細地估計出聲源位置的情況，本發(fā)明可以在更短的時間內(nèi)估計出聲源位置。(3) 本發(fā)明的一種遠程會議設(shè)備包括揚聲器陣列，其包括向上或向下發(fā)出聲音的多個揚聲器；第一麥克風(fēng)陣列和第二麥克風(fēng)陣列，它們適于將多個麥克風(fēng)排列成沿所述揚聲器陣列的縱向方向在揚聲器陣列的中心線兩側(cè)相互對稱；差信號計算部分，其通過對由所述第一麥克風(fēng)陣列和所述第二麥克風(fēng)陣列的各個麥克風(fēng)中的放置在相互對稱的位置上的每對麥克風(fēng)所拾取的聲音信號進行相減，從而計算出差信號；第一束產(chǎn)生部分，所述第一束產(chǎn)生部分通過在調(diào)整延遲量的同時對所述差信號進行相互合成，從而產(chǎn)生多個第一聲音采集束，所述第一聲音采集束將焦點分別放置在處于相互對稱位置的多對預(yù) 定的聲音采集區(qū)域中；第一聲源位置估計部分，其從所述多對聲音采集區(qū)域中選擇出其中的差信號的信號強度較大的一對聲音采集區(qū)域；第二和第三束產(chǎn)生部分，其根據(jù)由所述第一和第二麥克風(fēng)陣列的每個麥克風(fēng)所拾取的所述聲音信號來產(chǎn)生聲音采集束，從而在由所述第一聲源位置估計部分所選擇的所述聲音采集區(qū)域?qū)χ械拿總€聲音采集區(qū)域中拾取聲音信號；以及第二聲源位置估計部分，其選擇出與一聲音信號相對應(yīng)的聲音采集區(qū)域，從而估計聲源位置存在于所選擇的聲音采集區(qū)域中，其中所述聲音信號是由所述第二束產(chǎn)生部分和第三束產(chǎn)生部分產(chǎn)生的聲音采集束所拾取的聲音信號中信號強度較大的聲音信號。在本發(fā)明中，首先，通過對由位于麥克風(fēng)陣列兩側(cè)的對稱位置上的一對麥克風(fēng)所拾取的聲音信號進行相減，從而計算出差信號，隨后利用該差信號來在多個預(yù)定方向上產(chǎn)生聲束。由于兩側(cè)的麥克風(fēng)陣列是關(guān)于揚聲器陣列左右對稱的，所以從揚聲器陣列迂回的聲音已經(jīng)從差信號中消除。第一聲源位置估計部分根據(jù)該差信號來估計聲源的位置?？梢酝ㄟ^從當(dāng)前產(chǎn)生出來的多個聲音采集束中選擇其信號強度較大的聲音采集束來執(zhí)行該估計。當(dāng)聲音采集束分別由第一和第二麥克風(fēng)陣列形成時，估計出聲源的位置是處于一對焦點位置中的一個位置上。根據(jù)本發(fā)明，在遠程會議設(shè)備中，即使從揚聲器輸出的聲音可能會圍繞麥克風(fēng)迂回并且被該麥克風(fēng)拾取，還是可以正確地估計出聲源的位置。(4)本發(fā)明的一種聲音發(fā)出/采集設(shè)備包括揚聲器，其沿著分別關(guān)于預(yù)定參考表面對稱的方向發(fā)出聲音；第一麥克風(fēng)陣列和第二麥克風(fēng)陣列，所述第一麥克風(fēng)陣列在所述預(yù)定參考表面的一側(cè)拾取聲音，所述第二麥克風(fēng)陣列在所述預(yù)定參考表面的另一側(cè)拾取聲音；聲音采集束信號產(chǎn)生部分，所述聲音采集束信號產(chǎn)生部分產(chǎn)生第一聲音采集束信號，從而根據(jù)所述第一麥克風(fēng)陣列的一個聲音采集信號分別從多個第一聲音采集區(qū)域中拾取聲音，并且所述聲音采集束信號產(chǎn)生部分產(chǎn)生第二聲音采集束信號，從而根據(jù)所述第二麥克風(fēng)陣列的聲音采集信號分別從被提供在與所述第一聲音采集區(qū)域關(guān)于所述預(yù)定參考表面對稱的位置上的多個第二聲音采集區(qū)域中拾取聲音；以及聲音采集束信號選擇部分，其將關(guān)于所述預(yù)定參考表面相互對稱的所述聲音采集束信號彼此相減、從構(gòu)成了信號電平最高的差信號的兩個聲音采集束信號中僅僅提取高頻分量、并且根據(jù)所述提取出來的高頻分量的結(jié)果，從所述兩個聲音采集束信號中選擇一個其信號電平較高的具有高頻分量的聲音采集束信號。
根據(jù)該結(jié)構(gòu)，由于第一聲音采集束信號和第二聲音采集束信號關(guān)于參考表面對稱，所以關(guān)于一平面對稱的聲音釆集束的迂回聲音的分量在垂直于參考表面的方向上具有相同的幅度。為此，這些迂回聲音分量被抵消并且因此抑制了包含在差信號中的迂回聲音分量。并且，由于相對于一平面的對稱關(guān)系，所以，從未指向聲源(說話者) 方向的一組聲音采集束信號得出的差信號的信號電平幾乎為0，而從其中一個聲音采集束信號指向聲源方向的一組聲音采集束信號得出的差信號的信號電平為高電平。因此，可以通過選擇高電平的差信號來選擇與參考表面平行的沿著麥克風(fēng)陣列的麥克風(fēng)排列方向的聲源的位置。隨后，通過比較從中檢測出差信號的兩個聲音采集束信號的信號電平來檢測與參考表面正交的方向上的聲源的位置。此時，可以通過僅利用高頻分量來消除從揚聲器迂回的聲音的影響。這是因為在該聲音發(fā)出/采集設(shè)備所連接的公共通信網(wǎng)絡(luò)中，高頻帶是受限的，并且聲音采集束信號的高頻分量僅由來自說話者的語音產(chǎn)生。
(5)在本發(fā)明的聲音發(fā)出/采集設(shè)備中，在發(fā)明(4)中，所述聲音采集束信號選擇部分包括差信號檢測部分，其將相互對稱的所述聲音采集束信號彼此相減，從而檢測出信號電平最高的差信號；高頻分量信號提取部分，所述高頻分量信號提取部分具有高通濾波器，所述高通濾波器僅僅使得所述差信號檢測部分從其中檢測出差信號的兩個聲音采集束信號的高頻分量分別通過，并且高頻分量信號提取部分從通過所述高頻濾波器的高頻分量信號中檢測出信號電平較高的高頻分量信號；以及選擇部分，其選擇與由所述高頻分量信號提取
部分所檢測到的高頻分量信號相對應(yīng)的聲音采集束信號，并且輸出所選擇的聲音采集束信號。
根據(jù)該結(jié)構(gòu)，差信號檢測部分、具有高通濾波器的高頻分量信號提取部分、以及選擇部分都作為上面提到的聲音采集束信號選擇部分的分立結(jié)構(gòu)。差信號檢測部分將對稱地產(chǎn)生的聲音采集束信號進行相減，并且檢測具有高電平的差信號。高頻分量信號提取部分從通過對從中檢測出差信號的聲音采集束信號施加高通處理而獲得的高頻分量信號中檢測出信號電平較高的高頻分量信號。選擇部分從在其中檢測出差信號的兩個聲音采集束信號中選擇與檢測出來的高頻分量信號相對應(yīng)的聲音采集束信號。
(6) 在本發(fā)明的聲音發(fā)出/采集設(shè)備中，在發(fā)明(4)中，第一麥克風(fēng)陣列和第二麥克風(fēng)陣列由這樣的麥克風(fēng)陣列構(gòu)成，其中多個麥克風(fēng)沿著所述預(yù)定參考表面分別成直線排列。
根據(jù)該結(jié)構(gòu)，麥克風(fēng)陣列被構(gòu)建成沿著預(yù)定參考表面。因此，當(dāng)將要根據(jù)來自各個麥克風(fēng)的聲音采集信號來產(chǎn)生聲音采集束信號時，可以對各個聲音采集信號僅施加諸如延遲處理等之類的簡單的信號處理。
(7) 在本發(fā)明的聲音發(fā)出/采集設(shè)備中，在發(fā)明(4)或(5)
中，所述揚聲器由沿著所述預(yù)定參考表面成直線排列的多個分立的揚聲器構(gòu)成。
根據(jù)該結(jié)構(gòu)，多個分立的揚聲器是沿著預(yù)定參考表面排列的。因此，可以更加容易地相對預(yù)定參考表面對稱地發(fā)出聲音。
(8) 在本發(fā)明的聲音發(fā)出/采集設(shè)備中，在發(fā)明(4)或(5) 中，進一步包括迂回聲音去除部分，其根據(jù)所述輸入聲音信號和由所述聲音采集束信號選擇部分所選擇的聲音采集束信號來執(zhí)行控制，以使得從所述揚聲器發(fā)出的聲音不包含在所述輸出聲音信號中。
根據(jù)該結(jié)構(gòu)，可以進一步從正從聲音采集束信號選擇部分輸出的聲音采集束信號中去除迂回聲音分量。
根據(jù)本發(fā)明，能夠精確地檢測出諸如說話者之類的聲源的方向并且能在該方向上有效地拾取聲音的聲音發(fā)出/采集設(shè)備可被構(gòu)建成與發(fā)出的聲音信號無關(guān)。

圖1A是示出了根據(jù)本發(fā)明第一實施例的遠程會議設(shè)備的外部透視圖的視圖。
圖IB是沿著箭頭線A-A看到的同一遠程會議設(shè)備的底視圖。圖1C是示出了同一遠程會議設(shè)備的使用模式的視圖。圖2A是解釋了同一遠程會議設(shè)備中的聲音發(fā)出束的視圖。圖2B是解釋了同一遠程會議設(shè)備中的聲音采集束的視圖。圖2C是解釋了設(shè)置在同一遠程會議設(shè)備的麥克風(fēng)陣列中的聲音采集區(qū)域的視圖。
圖4是同一遠程會議設(shè)備的發(fā)送部分的框圖。
圖5是同一遠程會議設(shè)備的第一束產(chǎn)生部分的框圖。
圖6是一遠程會議設(shè)備的接收部分的框圖。
圖7是根據(jù)本發(fā)明第二實施例的遠程會議設(shè)備的發(fā)送部分的框圖。
圖8是根據(jù)本發(fā)明第三實施例的遠程會議設(shè)備的發(fā)送部分的框圖。
圖9A是示出了根據(jù)本發(fā)明的聲音發(fā)出/采集設(shè)備的麥克風(fēng)/揚聲器裝置的平面圖。
圖9B是示出了由該聲音發(fā)出/采集設(shè)備創(chuàng)建的聲音采集束區(qū)域的視圖。
圖10是本實施例的聲音發(fā)出/采集設(shè)備的功能框圖。圖ll是示出了圖10中所示的聲音采集束選擇部分19的結(jié)構(gòu)的框圖。
圖12A是示出了兩個與會者A、 B在將本發(fā)明的聲音發(fā)出/采集設(shè)備700放置在桌子C上的同時舉行會議并且與會者A正在說話的情況的視圖。
圖12B是示出了與會者B正在說話的情況的視圖。
圖12C是示出了與會者A、 B中沒有人正在說話的情況的視圖。
具體實施例方式
<第一實施例>下文中將通過參考圖1A至1C對作為本發(fā)明第一實施例的遠程會議設(shè)備的結(jié)構(gòu)和使用模式進行說明。第一實施例的遠程會議設(shè)備提供了這樣一種設(shè)備利用揚聲器陣列來輸出從對面設(shè)備發(fā)送的聲音，從而在對面設(shè)備側(cè)再現(xiàn)說話者的位置，同時利用麥克風(fēng)陣列來拾取說話者的聲音，從而對說話者的位置進行檢測，并隨后將拾取到的聲音
和位置信息發(fā)送至對面設(shè)備。
圖1A至1C示出了該遠程會議設(shè)備的外部視圖和使用模式。圖 1A是遠程會議設(shè)備的外部透視圖，圖1B是遠程會議設(shè)備沿著箭頭線
A-A的底視圖。而圖1C是該遠程會議設(shè)備的使用模式的視圖。
如圖1A所示，遠程會議設(shè)備1具有長方體主體和支腳111。支腳111對遠程會議設(shè)備1的主體進行支撐并且將其提升至與安置表面相距預(yù)定距離。沿著長方體主體的縱向方向排成一排的多個揚聲器 SP1至SP4組成了揚聲器陣列SPA，該揚聲器陣列被向下地布置在遠程會議設(shè)備1的下表面。該揚聲器陣列SPA將聲音從遠程會議設(shè)備1 的下表面向下地輸出，隨后該聲音被會議桌的安置表面等反射，隨后該聲音到達會議的與會者(參見圖1C)。
同樣，如圖1A和1B所示，沿著縱向方向?qū)⑼ㄟ^排列麥克風(fēng)而組建的麥克風(fēng)陣列分別布置在主體的兩側(cè)表面(下文中，兩側(cè)表面被稱為右側(cè)表面(圖1B中的上面)和左側(cè)表面(圖1B中的下面))。也就是說，由麥克風(fēng)MR1至MR4組成的麥克風(fēng)陣列MR被布置在主體的右側(cè)表面，而由麥克風(fēng)ML1至ML4組成的麥克風(fēng)陣列ML被布置在主體的左側(cè)表面。遠程會議設(shè)備1拾取作為說話者的會議與會者的說話語音，并且利用這些麥克風(fēng)陣列MR、 ML來檢測說話者的位置。
雖然在圖1A中被省略，但其實遠程會議設(shè)備1的內(nèi)部布置有發(fā) 送部分2 (參見圖4)和接收部分3 (參見圖6)。發(fā)送部分2通過對麥克風(fēng)陣列MR、 ML所拾取的聲音進行處理來估計說話者(這不僅可以是人類的語音，也可以是物體產(chǎn)生的聲音。在后面的描述中也是如此)的位置，隨后將位置和麥克風(fēng)陣列MR、 ML所拾取的聲音進行多路復(fù)用，并發(fā)送聲音。接收部分3將從對面設(shè)備接收到的聲音作為來自揚聲器SP1至SP4的聲束來輸出。此處，在圖1B中，麥克風(fēng)陣列MR、 ML被布置在關(guān)于揚聲器陣列SPA的中心線IOI對稱的位置上。但是，在第一實施例中，這些陣列并非總是對稱布置的。即使麥克風(fēng)陣列MR、 ML被布置成左右不對稱，在發(fā)送部分2 (參見圖4)中還是可以執(zhí)行信號處理，從而以左右對稱的形式形成左右聲音采集區(qū)域(參見圖3)。
接下來，下文中將通過參考圖1C對遠程會議設(shè)備1的使用模式進行說明。在使用中通常將遠程會議設(shè)備1放置在會議桌100的中央。說話者998和/或說話者999坐在會議桌100的同一側(cè)或者兩側(cè)。揚聲器陣列SPA所輸出的聲音被會議桌反射并到達左右說話者。在這種情況下，由于揚聲器陣列SPA將聲音作為聲束輸出，所以聲音能夠精確定位至相對于左右說話者的特定位置。后面將會詳細描述揚聲器陣列SPA對聲音的聲束成形處理。
同樣，麥克風(fēng)陣列MR、 ML拾取說話者的聲音。與麥克風(fēng)陣列MR、 ML連接的信號處理部分(發(fā)送部分2)根據(jù)聲音輸入至各個麥克風(fēng)單元MR1至MR4、 ML1至ML4的時間差來檢測說話者的位置。
同樣，在圖1A和1C中，為了便于說明，揚聲器的個數(shù)和麥克風(fēng)的個數(shù)分別被設(shè)置為4個。但是，這些個數(shù)并不限于4，而是可以布置一個或者多個揚聲器和麥克風(fēng)。同樣，麥克風(fēng)陣列MR、 ML和揚聲器陣列SPA可以布置成多行而不是一行。為此，在以下說明中，利用下標i來表示揚聲器陣列的每個揚聲器以及麥克風(fēng)陣列的每個麥克風(fēng)，于是，例如，揚聲器SP1至SPN為SPi (i = l至N)而麥克風(fēng) ML1至MLN為MLi ( i=l至N) 。 SPi ( i = l至N)中i=l對應(yīng)于SP1。
隨后，下文中將參考圖2A、 2B來說明揚聲器陣列SPA對聲音的聲束成形處理，即麥克風(fēng)陣列MR、 ML分別形成的聲音發(fā)出束和聲音采集束。
圖2A是說明了聲音發(fā)出束的視圖。信號處理部分(接收部分3) 將聲音信號提供給揚聲器陣列SPA的各個揚聲器單元SP1至SPN。該信號處理部分以延遲時間DS1至DSN對從對面設(shè)備接收到的聲音信號進行延遲處理，如圖2A所示，并且將延遲后的信號提供到揚聲器單元SP1至SPN。在圖2A中，最靠近虛擬聲源位置(焦點FS)的揚聲器發(fā)出無延遲時間的聲音，將延遲模式給至各個揚聲器，以使得每個揚聲器都經(jīng)過與距離相對應(yīng)的延遲時間之后再發(fā)出聲音，這是因為揚聲器與虛擬聲源位置距離更遠。由于這種延遲模式，所以從各個揚聲
器單元SP1至SPN輸出的聲音都進行傳播，以形成與圖2A中的虛擬
聲源發(fā)出的聲音相同的波陣面。因此，作為用戶的與會者能夠聽到彷佛對面的說話者處在虛擬聲源位置一樣的聲音。
圖2B是解釋了聲音采集束的視圖。分別以延遲時間DM1至D麗對輸入至各個麥克風(fēng)單元MR1至MRN的聲音信號進行延遲，如圖2B 所示，并隨后對其進行合成。在圖2B中，由最遠離聲音采集區(qū)域(焦點FM)的麥克風(fēng)所拾取的聲音被無延遲地輸入至加法器，將延遲模式給至各個麥克風(fēng)所拾取的聲音信號，以使得每個聲音都經(jīng)過響應(yīng)于距離的更短延遲時間后輸入至加法器，這是因為聲音更靠近聲音采集區(qū)域。由于這種延遲模式，所以在聲波傳播中，各個聲音信號都與聲音采集區(qū)域(焦點FM)距離相等，并且在合成時產(chǎn)生了各個聲音信號，以使得聲音信號在聲音采集區(qū)域中相位加強，而聲音信號在其它區(qū)域中則由于相位差而相互抵消。這樣，由于輸入至多個麥克風(fēng)的聲音被延遲以使得在聲波傳播中各個聲音都與聲音采集區(qū)域距離相等，并且隨后將聲音合成，所以僅僅來自聲音采集區(qū)域的聲音會被拾取。
在本實施例的遠程會議設(shè)備中，麥克風(fēng)陣列MR、 ML分別同時對與多個聲音采集區(qū)域(圖3中為4個)相關(guān)的聲音采集束進行成形。于是，無論說話者處于聲音采集區(qū)域的什么位置，說話者的聲音都能被拾取，并且可以根據(jù)聲音可被拾取的聲音采集區(qū)域來對說話者的位置進行檢測。
接下來，下文中將參考圖3對由聲音采集束感測聲源位置以及用于從聲源位置采集聲音的操作進行說明。圖3是從頂部看過去的遠程會議設(shè)備和說話者的平面圖。也就是說，圖3是沿著圖1C中的箭頭線B-B看到的視圖，其說明了麥克風(fēng)陣列形成聲音采集束的一種模式。
《對聲源位置感測/排除了虛幻(Demon)聲源的聲音采集設(shè)備的說明>〉首先，下文中將說明遠程會議設(shè)備的聲源位置感測和聲音采集設(shè)備的原理。在該說明中，假設(shè)的是，聲束不是從揚聲器陣列SPA 輸出的。
在此，將在下文中對提供給右側(cè)表面上的麥克風(fēng)陣列MR的聲音
采集信號的處理進行說明。遠程會議設(shè)備1的發(fā)送部分2 (參見圖4) 形成了具有作為通過上述延遲合成產(chǎn)生的焦點的聲音采集區(qū)域411
至414的聲音采集束。這些多個聲音采集區(qū)域是通過假定使用了遠程會議設(shè)備1參與會議的說話者的位置來確定的。
可以這樣認為，說話者(聲源)出現(xiàn)在這些聲音采集區(qū)域411R 至414R中拾取到的聲音信號的電平最高的區(qū)域。例如如圖3所示，當(dāng)聲源999出現(xiàn)在聲音采集區(qū)域414R時，從聲音采集區(qū)域414R拾取到的聲音信號的電平高于從其它聲音采集區(qū)域411R至413R拾取到的聲音的電平。
類似地，對于左側(cè)表面的麥克風(fēng)陣列ML，所形成的四個系統(tǒng)聲音采集束與右側(cè)表面軸對稱，隨后從聲音采集區(qū)域411L至414L中檢測出拾取到的聲音的聲音信號電平最高的區(qū)域。在這種情況下，軸對稱線被設(shè)置成與揚聲器SPA的軸基本一致。
由此，說明了本實施例的遠程會議設(shè)備的聲源位置感測和聲音采集設(shè)備的原理。
在聲音不是從揚聲器陣列SPA發(fā)出并且麥克風(fēng)陣列MR、 ML并不拾取迂回聲音的情況下，可適當(dāng)?shù)馗鶕?jù)該原理進行聲源位置感測和聲音采集。遠程會議設(shè)備1雙向地發(fā)送/接收聲音信號，并且揚聲器陣列SPA發(fā)出的聲音與麥克風(fēng)陣列MR、 ML的聲音采集是并行進行的。
如圖2A所示，將延遲模式給至提供到揚聲器陣列SPA的各個揚聲器的聲音信號，于是，形成了與聲音從設(shè)置在揚聲器陣列后方的虛擬聲源位置到達的情況相同的波陣面。相反，以圖2B所示的模式對麥克風(fēng)陣列MR所拾取的聲音信號進行延遲并隨后進行合成，于是合成后的聲音信號的定時與從預(yù)定聲音采集區(qū)域到達的聲音信號的定時一致。
此處，當(dāng)揚聲器陣列的虛擬聲源位置與麥克風(fēng)陣列MR的多個聲音采集區(qū)域中的任何一個一致時，提供給揚聲器陣列SPA的各個揚聲器SP1至SPN的延遲模式與提供至麥克風(fēng)陣列MR拾取聲音信號所處
的聲音采集區(qū)域的延遲模式正好是相反的關(guān)系。因此，聲音信號從揚
聲器陣列SPA發(fā)出，隨后圍繞麥克風(fēng)陣列MR迂回，隨后被陣列拾取并在高電平進行合成。
在采用上述通用聲源檢測系統(tǒng)對聲音信號進行處理的情況下，存在這樣的問題，即在高電平合成的迂回聲音信號會被誤認為是實際并不存在的聲源(虛幻聲源)。
因此，除非該虛幻聲源被消除，否則從對面設(shè)備到達的聲音信
號會返回從而產(chǎn)生回聲。同樣，無法檢測并拾取真實聲源(說話者) 的聲音。
以上說明是關(guān)于麥克風(fēng)陣列MR的。但是可以類似地給出與麥克風(fēng)陣列ML相關(guān)的說明(這是因為麥克風(fēng)陣列MR、 ML是左右對稱的)。
也就是說，聲束被會議桌100反射并隨后左右對稱地進行輻射。因此，虛幻聲源也類似地在右側(cè)麥克風(fēng)陣列服和左側(cè)麥克風(fēng)陣列ML 上左右對稱地產(chǎn)生出來。
為此，即使通過相互比較左側(cè)聲音采集區(qū)域411L至414L和右側(cè)聲音采集區(qū)域411R至414R估計出音量電平可能為高電平并且可能存在聲源，但當(dāng)左右對應(yīng)區(qū)域中的音量電平同樣地為高電平時，聲源被確定為由揚聲器陣列SPA的迂回聲束產(chǎn)生的虛幻聲源。因此，該聲源從聲音采集的異議中去除。于是，可以從真實聲源檢測并采集聲音，并且可以防止由于迂回聲音而產(chǎn)生的回聲。
為此，遠程會議設(shè)備1的發(fā)送部分2將從左側(cè)麥克風(fēng)陣列ML的聲音采集區(qū)域411L至414L所拾取到的聲音信號的電平與從右側(cè)麥克風(fēng)陣列服的聲音采集區(qū)域411R至414R所拾取到的聲音信號的電平進行比較。于是，在具有基本相等的聲音信號電平的左右聲音采集區(qū) 域?qū)Ρ蝗コ笞笥衣曇舨杉瘏^(qū)域中的電平大不相同時，發(fā)送部分2 確定出聲源存在于電平較高的聲音采集區(qū)域中。
設(shè)備僅將具有較高電平的聲音信號發(fā)送至對面設(shè)備，并且還將指示了檢測出聲音信號的聲音采集區(qū)域的位置的位置信息添加至信號(數(shù)字信號)的子碼，等等。用于執(zhí)行上述虛幻聲源排除處理的信號處理部分(發(fā)送部分) 的結(jié)構(gòu)將在下文中進行說明。在這種情況下，將對圖3中狹窄的聲音
采集束431至434與圖7中的第二實施例的說明同時進行說明。
下面將說明甩于執(zhí)行上述虛幻聲源消除處理的信號處理部分
(發(fā)送部分)的結(jié)構(gòu)。在此情況下，將結(jié)合對圖7中的第二實施例的說明來對圖3中的窄聲音采集束431到434進行說明。《形成聲音采集束的發(fā)送部分的結(jié)構(gòu)〉〉
圖4是遠程會議設(shè)備1的發(fā)送部分2的結(jié)構(gòu)框圖。此處，粗線
箭頭表示多個系統(tǒng)中的聲音信號被發(fā)送，而細線箭頭表示一個系統(tǒng)中的聲音信號被發(fā)送。同樣，虛線箭頭表示指令輸入被發(fā)送。
圖4中的第一束產(chǎn)生部分231和第二束產(chǎn)生部分232對應(yīng)于形成了圖3中分別具有作為焦點的左右聲音采集區(qū)域411R至414R、 411L至414L的四個系統(tǒng)聲音采集束的信號處理部分。
右側(cè)麥克風(fēng)陣列MR的麥克風(fēng)單元MR1至MRN所拾取的聲音信號經(jīng)由A/D轉(zhuǎn)換器211輸入至第一束產(chǎn)生部分231。類似地，左側(cè)麥克風(fēng)陣列ML的麥克風(fēng)單元ML1至MLN所拾取的聲音信號經(jīng)由A/D轉(zhuǎn)換器212輸入至第二束產(chǎn)生部分232。
第一束產(chǎn)生部分231和第二束產(chǎn)生部分232分別形成了四個聲音采集束，分別從四個聲音采集區(qū)域411R至414R、 411L至414L拾取聲音，并且將拾取到的聲音信號輸出至差值計算電路22和選擇器 271、 272。
圖5是示出了第一束產(chǎn)生部分231的詳細結(jié)構(gòu)的視圖。第一束產(chǎn)生部分231具有與各個聲音釆集區(qū)域41j ( j = l至K)相對應(yīng)的多個延遲處理部分45j。為了在各個聲音采集區(qū)域41j ( j二l至K)中產(chǎn) 生具有焦點的聲音采集束輸出MBj,各個延遲處理部分45j根據(jù)延遲模式數(shù)據(jù)40j對每個麥克風(fēng)輸出的聲音信號進行延遲。延遲處理部分 45j接收存儲在ROM中的延遲模式數(shù)據(jù)40j，并且將延遲量分別設(shè)置為延遲46ji (j^至K， i-l至N)。
加法器47j ( j = l至K)對經(jīng)歷了延遲的數(shù)字聲音信號進行相加，并且輸出得到的信號來作為麥克風(fēng)束輸出MBj (j=l至K)。聲音采集束輸出MBj組成了分別將圖3所示的聲音采集區(qū)域41j引至焦點的聲音采集束。隨后，各個延遲處理部分45j計算的麥克風(fēng)束輸出MBj 被分別輸出至差值計算電路22，等等。圖5中還說明了第一束產(chǎn)生部分231，但是第二束產(chǎn)生部分232 同樣具有與上述結(jié)構(gòu)類似的結(jié)構(gòu)。在圖4中，差值計算電路22通過比較各個聲音采集區(qū)域中所拾取到的聲音信號中在左右對稱的位置上所拾取的聲音信號之間的音量電平，從而計算出差值。更具體的說，差值計算電路22計算差值￡>(411) = | -尸(411丄)|￡>(412) = I尸(412i )-尸(412丄)|，3) = I尸(413i )-尸(413丄)|D(414) = I尸(414i ) - P(414丄)|其中P(A)是聲音采集區(qū)域A的信號電平。差值計算電路22將這些計算出來的差值D(411)至D(414)輸出至第一估計部分251。在這種情況下，差值計算電路22可被構(gòu)建成通過對從左右聲音采集區(qū)域所拾取到的聲音信號的信號波形本身進行相減來輸出差值信號。同樣，差值計算電路22可被構(gòu)建成輸出音量電平值的相減值，這些音量電平值是這樣獲得的每隔預(yù)定時間周期，就對從左右聲音采集區(qū)域所拾取到的聲音信號的有效值在預(yù)定時間內(nèi)進行積分。當(dāng)差值計算電路22輸出差值信號時，可在差值計算電路22和第一估計部分251之間插入BPF241，以便使第一估計部分251中的估計變得容易。BPF 241被設(shè)置成使說話語音的頻率范圍中的1 kHz 至2kHz附近的頻帶通過，在該頻段中能夠很好地把握聲音采集束的指向性控制。這樣，從關(guān)于揚聲器陣列SPA的中心線左右對稱的左右聲音采集區(qū)域所拾取到的聲音采集信號的音量電平彼此相減。因此，來自揚聲器陣列SPA的左右對稱地圍繞左右麥克風(fēng)陣列ML、服迂回的聲音分量彼此抵消。結(jié)果就是，迂回聲音信號決不會被誤認為虛幻聲源。第一估計部分251對正從差值計算電路22輸入的差值的最大值進行選擇，隨后選擇最大差值所處的聲音采集區(qū)域?qū)Α榱藢⒙曇舨?集區(qū)域輸入至第二估計部分252，第一估計部分251將選擇信號輸出至選擇器271、 272，選擇信號使這些聲音采集區(qū)域中的聲音信號輸出至第二估計部分252。
選擇器271根據(jù)該選擇信號來選擇信號，于是，由第一估計部分251從第一束產(chǎn)生部分231所拾取的四個聲音采集區(qū)域的信號中選擇出來的聲音采集區(qū)域的信號可被作為聲束提供至第二估計部分 252和信號選擇部分26。同樣，選擇器272根據(jù)該選擇信號來選擇信號，于是，由第一估計部分251從第二束產(chǎn)生部分232所拾取的四個聲音采集區(qū)域的信號中選擇出來的聲音采集區(qū)域的信號可被作為束提供至第二估計部分252和信號選擇部分26。
第二估計部分252對由第一估計部分251估計出來的并且有選擇地從選擇器271、 272輸出的聲音采集區(qū)域的聲音信號進行接收。第二估計部分252對左右聲音采集區(qū)域中的輸入聲音信號進行比較，
隨后將較大電平的聲音信號確定為來自真實聲源的聲音信號。第二估計部分252將指示了真實聲源所處的聲音采集區(qū)域的方向和距離的信息作為位置信息2522輸出至多路復(fù)用部分28，并且指示信號選擇部分26將聲音信號從真實聲源有選擇地輸入至多路復(fù)用部分28。
多路復(fù)用部分28將從第二估計部分252輸入的位置信息2522 連同由信號選擇部分26所選擇的真實聲源的聲音信號261 —起進行多路復(fù)用，并且將多路復(fù)用后的信號發(fā)送至對面設(shè)備。
估計部分251、252每隔預(yù)定周期就重復(fù)地執(zhí)行聲源位置的估計。例如，每O. 5秒重復(fù)一次估計。在這種情況下，0. 5秒鐘時間內(nèi)的信號波形或幅度有效值可相互比較。如果通過按照這種方式每預(yù)定周期重復(fù)地估計聲源位置來改變了聲音采集區(qū)域，那么可以響應(yīng)于說話者的移動來采集聲音。
在這種情況下，當(dāng)真實聲源位置和由迂回產(chǎn)生的虛幻聲源位置彼此重疊時，左右信號波形之間的差值可作為聲音采集信號輸出至對面設(shè)備。這是因為，差信號僅僅消除虛幻聲源波形并且保留來自真實聲源的信號波形。
同樣，為了應(yīng)對說話者存在于兩個聲音采集區(qū)域的情況或者說話者移動的情況，可以考慮下文給出的模式。第一估計部分251按照差信號強度大小的順序選擇強度較大的兩個聲音采集區(qū)域，并且還輸出它們之間的強度比值。第二估計部分252比較信號強度最大的一對或者兩對，并且對真實聲源處于哪一側(cè)進行估計。由第一估計部分
251和第二估計部分252在一側(cè)通過指出的強度比值的權(quán)重所選擇出來的兩個聲音信號被信號選擇部分26多路復(fù)用，隨后信號選擇部分 26對得到的聲音信號進行合成，并隨后將合成后的信號作為輸出信號261輸出。這樣，如果在通過信號強度比值給出權(quán)重時兩個位置上的聲音信號總是被合成，那么和上面一樣地總是對說話者的移動進行交叉淡化，因此聲像的定位很自然地移動。《形成聲束的接收部分3的結(jié)構(gòu)〉>
接下來，下文中將參考圖6對接收部分3的內(nèi)部結(jié)構(gòu)進行說明。接收部分3包括聲音信號接收部分31，用于從對面設(shè)備接收聲音信號并且從聲音信號的子碼中分離出位置信息；參數(shù)計算部分32，用于根據(jù)聲音信號接收部分31所分離出來的位置信息來確定聲音信號所處的位置，并且計算用于在該位置中定位聲像的指向性控制參數(shù)；指向性控制部分33，用于根據(jù)從參數(shù)計算部分32輸入的參數(shù)來對所接收到的聲音信號的指向性進行控制；D/A轉(zhuǎn)換器34i (i^至N)，用于將其指向性受控的聲音信號轉(zhuǎn)換成模擬信號；以及放大器35i
(i^至N)，用于放大從D/A轉(zhuǎn)換器34i (i二l至N)輸出的模擬聲音信號。放大器35i所輸出的模擬聲音信號被提供至圖1A至1C所示的外部揚聲器SPi (i^至N)。
'聲音信號接收部分31是用于通過因特網(wǎng)、公用電話線等與對面設(shè)備保持通信的功能部分，其具有通信接口、緩沖存儲器等。聲音信號接收部分31從對面設(shè)備接收包含位置信息2522的聲音信號30作為子碼。聲音信號接收部分31將位置信息從接收到的聲音信號子碼中分離出來，并且將其輸入至參數(shù)計算部分32，并且將聲音信號輸入至指向性控制部分33。
參數(shù)計算部分32是一種計算部分，它計算用于指向性控制部分 33中的參數(shù)。參數(shù)計算部分32計算對分別提供至揚聲器的聲音信號的每個延遲量，從而在根據(jù)接收到的位置信息確定的位置中產(chǎn)生焦點，并且將指向性給至聲音信號從而使得聲音信號從該焦點發(fā)出。
指向性控制部分33根據(jù)由揚聲器SPi (i = l至N)的每個輸出系
統(tǒng)的參數(shù)計算部分32所設(shè)置的參數(shù)來對由聲音信號接收部分31所接收到的聲音信號進行處理。也就是說，分別并行地提供與揚聲器SPi (i^至N)相對應(yīng)的多個處理部分。每個處理部分都根據(jù)由參數(shù)技術(shù)部分32所計算出來的參數(shù)(延遲量參數(shù)等)來對聲音信號設(shè)置延遲量等，并且分別將延遲量輸出至D/A轉(zhuǎn)換器34i (i^至N)。
D/A轉(zhuǎn)換器34i Ol至N)把從每個輸出系統(tǒng)的指向性控制部分33輸出的數(shù)字聲音信號轉(zhuǎn)換成模擬信號，并且輸出該模擬信號。放大器35i (i^至N)分別放大從D/A轉(zhuǎn)換器34i (i二l至N)輸出的模擬信號，并且將放大后的信號輸出至揚聲器SPi (i二l至N)。
為了在對面設(shè)備中通過自身設(shè)備再現(xiàn)聲源的位置關(guān)系，上述接收部分3根據(jù)位置信息對從對面設(shè)備接收到的聲音信號執(zhí)行聲束成形處理，并且將來自布置在設(shè)備主體下表面的揚聲器陣列SPA的聲音信號輸出以再現(xiàn)指向性，從而使得聲音從虛擬聲源位置輸出。 <第二實施例>
接下來，下文中將參考圖7對根據(jù)第二實施例的遠程會議設(shè)備進行說明。該實施例是圖4中的第一實施例的應(yīng)用，在它們的說明中，相同的標號被賦予相同的部分。同樣，在說明聲音采集束時輔助性地參見了圖3。
在第一實施例中，在假設(shè)真實聲源存在于差信號較大的聲音采集區(qū)域?qū)χ械囊粋€聲音采集區(qū)域的基礎(chǔ)上，第二估計部分252對真實聲源存在于哪一側(cè)進行估計。在第二實施例中，第一束產(chǎn)生部分231 和第二束產(chǎn)生部分232具有詳細位置搜索束(窄束)產(chǎn)生功能2313、 2323，分別用于詳細地對第二估計部分252所估計的真實聲源所處的聲音采集區(qū)域進行搜索，從而精確地檢測出聲源位置。
如圖3所示，當(dāng)?shù)诙烙嫴糠?52估計真實聲源999存在于聲音采集區(qū)域414R時，這個第二估計部分252將估計出來的結(jié)果通知給第一束產(chǎn)生部分231。這樣，由于第二估計部分252估計了真實聲源存在于揚聲器陣列MR、ML的哪一側(cè)，所以僅將估計結(jié)果通知2523、2524之一輸入至第一和第二束產(chǎn)生部分231、 232中的一個。在估計出真實聲源存在于左側(cè)區(qū)域的情況下，第二估計部分252將估計出來的結(jié)果通知給第二束產(chǎn)生部分232。第一束產(chǎn)生部分231根據(jù)該通知來操作詳細位置搜索束產(chǎn)生功能2313，從而分別產(chǎn)生具有圖3所示的作為焦點的狹窄的聲音采集束431至434的窄束。因此，第一束產(chǎn)生部分231詳細地搜索了聲源 999的位置。同樣，第二實施例的設(shè)備配置有第三估計部分253和第四估計部分254。第三和第四估計部分253、 254從詳細位置搜索束產(chǎn)生功能2313、 2323所輸出的聲音采集束中按照信號強度的順序選擇強度較大的兩個聲音采集束。在這種情況下，僅僅估計部分253、 254以外的第二估計部分252進行了估計。在圖3的示例中，從指向狹窄的聲音采集區(qū)域431至434的聲音采集束中拾取聲音信號，并且真實聲源999存在于在聲音采集區(qū)域 434和聲音采集區(qū)域433之上延伸的部分。在這種情況下，第三估計部分253按照信號強度從大到小的順序選擇從聲音采集區(qū)域434、433 中拾取的聲音信號。第三估計部分253通過響應(yīng)于兩個所選擇的聲音信號的信號強度來按比例地對所選擇的聲音采集區(qū)域的焦點位置進行分配，從而估計出說話者的位置，并且將其輸出。同樣，第三估計部分253在給出權(quán)重的同時對兩個所選擇的聲音信號進行合成，并且將合成后的信號作為聲音信號輸出。于是，描述了右側(cè)區(qū)域中的第一束產(chǎn)生部分231 (詳細位置搜索束產(chǎn)生功能2313)和第三估計部分253。類似地對左側(cè)區(qū)域中的第二束產(chǎn)生部分232 (詳細位置搜索束產(chǎn)生功能2323)和第四估計部分 254進行構(gòu)建，并且它們執(zhí)行類似的處理操作。在某些情況下，當(dāng)說話者頻繁移動時，上述第二實施例中的設(shè) 備的詳細位置搜索功能中的處理跟不上該移動。因此，可以考慮這樣的情況，該功能應(yīng)該僅在從第二估計部分252輸出的說話者位置停留了預(yù)定時間時起作用。在這種情況下，當(dāng)從第二估計部分252輸出的說話者位置在預(yù)定時間內(nèi)移動時，即使布置了圖7所示的裝置，還是可以執(zhí)行與圖4中的第一實施例相類似的操作。在此，用于執(zhí)行窄化估計的估計部分253、 254分別對應(yīng)于本實施例的"第三聲源位置估計部分"。〈第三實施例〉接下來，下文中將參考圖8對根據(jù)本發(fā)明第三實施例的遠程會議設(shè)備的發(fā)送部分進行說明。圖8是該發(fā)送部分的框圖。本實施例的設(shè)備的發(fā)送部分2的不同點在于，A/D轉(zhuǎn)換器211、 212的輸出是差值計算電路22的輸入，布置了用于通過利用差值計算電路22的輸出信號來產(chǎn)生第二采集束的第三束產(chǎn)生部分237，提供了第四束產(chǎn)生部分238和第五束產(chǎn)生部分239，并且略去了選擇器271、 272。同樣的標號賦予同樣的部分，并且以上說明相應(yīng)地適用于余下的部分。于是，下文中將對本實施例的設(shè)備的不同點及重點進行說明。如圖8所示，A/D轉(zhuǎn)換器211、 212的輸出被直接輸入至差值計算電路22。因此，在第二實施例的設(shè)備中，相同編號的麥克風(fēng)陣列 MRi和麥克風(fēng)陣列MLi被布置在相互對稱的位置上。差值計算電路22 分別計算"(麥克風(fēng)陣列MRi的聲音信號)-(麥克風(fēng)陣列MLi的聲音信號)"(—1至N)。于是，和圖4中所示的設(shè)備一樣，可以消除從揚聲器陣列SPA迂回至麥克風(fēng)陣列MR、 ML附近并輸入麥克風(fēng)陣歹ij MR、 ML的聲音。此處，在第三實施例的設(shè)備中，必需在縱向上關(guān)于揚聲器陣列 SPA的中心線左右對稱地布置各個麥克風(fēng)陣列MR、 ML。差值計算電路 22被布置用于消除麥克風(fēng)之間的迂回聲音。在這種情況下，差值計算電路22總是在遠程會議設(shè)備1的麥克風(fēng)陣列MR、ML的工作期間執(zhí) 行計算。與第一束產(chǎn)生部分231和第二束產(chǎn)生部分232相同，第三束產(chǎn) 生部分237根據(jù)差值計算電路22的一簇輸出信號來輸出具有作為焦點的四個虛擬聲音采集區(qū)域的聲音采集束。虛擬聲音采集區(qū)域?qū)?yīng)于關(guān)于揚聲器陣列SPA的中心線101左右對稱地布置的聲音采集區(qū)域?qū)?(411R和411L、 412R和412L、 413R和413L、 414R禾卩414L:參見圖 3)。從第三束產(chǎn)生部分237輸出的聲音信號與第一實施例中的差信號D (411) 、 D (412) 、 D (413) 、 D (414)類似。在通過BPF 241 將差信號輸出至第一估計部分251時，與圖4所示的設(shè)備的第一估計部分251相類似地執(zhí)行聲源位置的估計。估計出來的結(jié)果2511、 2512 被輸出至第四束產(chǎn)生部分238和第五束產(chǎn)生部分239。隨后，下文中將對圖8中的第四束產(chǎn)生部分238和第五束產(chǎn)生部分239進行說明。A/D轉(zhuǎn)換器211、 212所輸出的數(shù)字聲音信號分別被直接輸入至第四束產(chǎn)生部分238和第五束產(chǎn)生部分239。第四束產(chǎn)生部分238和第五束產(chǎn)生部分239根據(jù)這些數(shù)字聲音信號來產(chǎn)生具有作為焦點的聲音采集區(qū)域(這些聲音采集區(qū)域是由從第一估計部分 251輸入的估計出來的結(jié)果所指示的)的聲音采集束，并且拾取該聲音采集區(qū)域的聲音信號。換句話說，第四束產(chǎn)生部分238和第五束產(chǎn) 生部分239所產(chǎn)生的聲音采集束對應(yīng)于第一實施例中的選擇器271、 272所選擇的聲音采集束。按照這樣的方式，第四束產(chǎn)生部分238和第五束產(chǎn)生部分239 僅輸出由第一估計部分251所指示的聲音采集束所拾取的一個系統(tǒng) 的聲音信號。第四束產(chǎn)生部分238和第五束產(chǎn)生部分239從各個聲音采集束的作為焦點的聲音采集區(qū)域中拾取的聲音信號被輸入至第二估計部分252中。隨后的操作類似于第一實施例中的操作。第二估計部分252對兩個聲音信號進行比較，隨后確定聲源存在于音量較大的聲音采集區(qū) 域中。第二估計部分252將指示了真實聲源所存在的聲音采集區(qū)域的方向和位置的信息作為位置信息2522輸出至多路復(fù)用部分28。同樣，第二估計部分252命令信號選擇部分26選擇性地將該真實聲源的聲音信號輸入至多路復(fù)用部分28。多路復(fù)用部分28將位置信息2522 與信號選擇部分26所選擇的真實聲源的聲音信號261進行多路復(fù)用，并且將這個多路復(fù)用后的信號發(fā)送至對面設(shè)備。此處，在圖8所示的第三實施例中，與第二實施例相同，如果估計在多級中執(zhí)行，那么可以首先在大范圍內(nèi)搜索聲源的位置，隨后可以再次進行搜索從而將范圍限制在狹小的范圍。在這樣的情況下，第二估計部分252輸出指令輸入2523、 2524，它們命令第四和第五束產(chǎn)生部分238、239在第一次搜索完成以后對更窄的范圍進行搜索。只有聲源所處一側(cè)的束產(chǎn)生部分采用該操作。當(dāng)束產(chǎn)生部分接收到該指令輸入時，它從內(nèi)部讀取與更窄的范圍相對應(yīng)的延遲模式，并且在ROM中重寫延遲模式40j。在第一和第三實施例中，第一估計部分251分別從左右聲音采集區(qū)域411R至414R、 411L至414L中一個接一個地選擇聲音采集區(qū) 域(41jR， 41JL)，隨后第二估計部分252對真實聲源存在于聲音采集區(qū)域41jR、 41JL中的哪一個進行估計。但是，并非總是需要提供第二估計部分。這是因為，例如，即使在由于真實聲源的對面不存在噪聲源(例如，僅在右側(cè)或者左側(cè)使用遠程會議設(shè)備，等等)而使得聲音采集區(qū) 域41jR、 41jL兩者中的聲音的合成信號(或差信號)作為聲音采集信號被原樣地輸出至對面設(shè)備的情況下，也不會產(chǎn)生問題。同樣，這些實施例中給出的數(shù)值等不應(yīng)被解釋為限制本發(fā)明。同樣，當(dāng)信號在結(jié)構(gòu)塊之間交換以實現(xiàn)以上附圖中的功能時，在某些情況下，與前述實施例類似的優(yōu)點可通過這樣的結(jié)構(gòu)實現(xiàn)，即這些塊的一些功能可由其它塊處理。〈第四實施例〉圖9A是示出了根據(jù)本發(fā)明第四實施例的聲音發(fā)出/采集設(shè)備 700的麥克風(fēng)/揚聲器裝置的平面圖，圖9B是示出了由圖9A所示的聲音發(fā)出/采集設(shè)備700創(chuàng)建的聲音采集束區(qū)域的視圖。圖10是本實施例的聲音發(fā)出/采集設(shè)備700的功能框圖。同樣，圖11是示出了圖IO所示的聲音采集束選擇部分19的結(jié)構(gòu)的框圖。本實施例的聲音發(fā)出/采集設(shè)備700包含框架101中的多個揚聲器SP1至SP3、多個麥克風(fēng)MIC11至MIC17、 MIC21至MIC27、以及圖 10中所示的功能部分。框架101大致為長方體形狀，它在一個方向上是狹長的。支腳 (未示出)被布置在框架101的長側(cè)(表面)的兩個端部。這些支腳將框架101的下表面提升至與安置地面相距預(yù)定距離，并且它們分別具有預(yù)定高度。在以下說明中，框架101的四個側(cè)表面中的稍長表面被稱為長表面，而稍短表面被稱為短表面。具有相同形狀的不定向分立揚聲器SP1至SP3被布置在框架101的下表面。沿著縱向以預(yù)定間隔布置這些分立揚聲器SP1至SP3。同樣，分立揚聲器SP1至SP3被布置成這樣，對分立揚聲器SP1至SP3 的中心線進行連接的直線被設(shè)置成沿著框架101的長表面，并且它們在水平方向上的位置與對短表面的中央進行連接的中心線800 —致。也就是說，對分立揚聲器SP1至SP3的中央進行連接的直線被設(shè)置在包含中心線800的垂直參考表面上。通過按照這種方式來排列/布置分立揚聲器SP1至SP3，構(gòu)建了揚聲器陣列SPAIO。在這樣的狀態(tài)中，當(dāng)揚聲器陣列SPA10的分立揚聲器SP1至SP3發(fā)出未經(jīng)相對延遲控制的聲音時，發(fā)出的聲音平均地傳播至兩個長表面。這時，傳播至兩個對立長表面的發(fā)聲沿著與參考表面正交的相互對稱的方向行進?？蚣?01的一個長表面上布置著具有相同規(guī)格的麥克風(fēng)MIC11 至MIC17。沿著縱向以預(yù)定間隔布置這些麥克風(fēng)MICll至MIC17，從而構(gòu)建麥克風(fēng)陣列MAIO。同樣，框架101的另一個長表面上布置著具有相同規(guī)格的麥克風(fēng)MIC21至MIC27。沿著縱向以預(yù)定間隔布置這些麥克風(fēng)MIC21至MIC27，從而構(gòu)建麥克風(fēng)陣列MA20。麥克風(fēng)陣列 MA10和麥克風(fēng)陣列MA20被布置成這樣，它們的排列坐標軸的垂直位置彼此一致。麥克風(fēng)陣列MA10的麥克風(fēng)MIC11至MIC17和麥克風(fēng)陣列MA20的麥克風(fēng)MIC21至MIC27分別被布置在關(guān)于參考表面對稱的位置上。具體地說，例如，麥克風(fēng)MIC11和麥克風(fēng)MIC21被放置成關(guān) 于參考表面對稱，類似地，麥克風(fēng)MIC17和麥克風(fēng)MIC27具有對稱關(guān) 系。在本實施例中，揚聲器陣列SPA10的揚聲器數(shù)被設(shè)置為3個，麥克風(fēng)陣列MA10和麥克風(fēng)陣列MA20的麥克風(fēng)數(shù)分別被設(shè)置為7個。但是，這些數(shù)目并不限于此，可以按照規(guī)范適當(dāng)?shù)卦O(shè)置揚聲器數(shù)和麥克風(fēng)數(shù)。同樣，揚聲器陣列的每個揚聲器間隔和麥克風(fēng)陣列的每個麥克風(fēng)間隔都可以設(shè)置成不相等。例如，可以在縱向上將揚聲器和麥克風(fēng)布置成在中央部位比較密集而向兩端逐漸疏散。于是，如圖10所示，本實施例的聲音發(fā)出/采集設(shè)備700在功能上包含輸入/輸出連接器11、輸入/輸出I/F 12、發(fā)聲指向性控制
部分13、 D/A轉(zhuǎn)換器14、發(fā)聲放大器15、揚聲器陣列SPA10 (揚聲器SP1至SP3)、麥克風(fēng)陣列MAIO、 MA20 (麥克風(fēng)MIC11至MIC17、 MIC21至MIC27)、聲音采集放大器16、 A/D轉(zhuǎn)換器17、聲音采集束產(chǎn)生部分181、 182、聲音采集束選擇部分19、和回聲消除部分20。輸入/輸出I/F 12將經(jīng)由輸入/輸出連接器11從其它聲音發(fā)出/ 采集設(shè)備輸入的輸入聲音信號從與網(wǎng)絡(luò)相對應(yīng)的數(shù)據(jù)格式(協(xié)議)轉(zhuǎn) 換成其它格式，并且將聲音信號經(jīng)由回聲消除部分20提供至發(fā)聲指向性控制部分13。并且，輸入/輸出1/F12將回聲消除部分20所產(chǎn)
生的輸出聲音信號轉(zhuǎn)換成與網(wǎng)絡(luò)相對應(yīng)的數(shù)據(jù)格式，并且經(jīng)由輸入/ 輸出連接器11將聲音信號發(fā)至網(wǎng)絡(luò)。這時，輸入/輸出I/F 12傳送聲音信號至網(wǎng)絡(luò)，該聲音信號是通過限制輸出聲音信號的頻帶而獲得的。這是因為包含全頻分量的聲音信號具有巨大的數(shù)據(jù)量，因此如果輸出聲音信號未經(jīng)處理就傳送至網(wǎng)絡(luò)，那么網(wǎng)絡(luò)上的傳輸速率將顯著降低；并且，除非預(yù)定的高頻分量(例如3. 5kHz或者更高的頻率分量)沒有傳播，否則就可以再現(xiàn)對面的聲音發(fā)出/采集設(shè)備的說話聲。因此，來自對面的聲音發(fā)出/采集設(shè)備的輸入聲音信號是這樣的聲音信號，其中不包含超過預(yù)定閾值的高頻分量。
發(fā)聲指向性控制部分13根據(jù)所指定的發(fā)聲指向性來對輸入聲音信號提供延遲處理、放大處理等(這些處理是針對揚聲器陣列SPA10 的揚聲器SP1至SP3的)，并且產(chǎn)生各個發(fā)聲信號。發(fā)聲指向性控制部分13將這些各個發(fā)聲信號輸出到分別提供給揚聲器SP1至SP3的 D/A轉(zhuǎn)換器14。 D/A轉(zhuǎn)換器14將各個發(fā)聲信號轉(zhuǎn)換成模擬格式，并且將信號分別輸出到發(fā)聲放大器15。發(fā)聲放大器15將各個發(fā)聲信號放大并且將信號提供至揚聲器SP1至SP3。
揚聲器SP1至SP3將所提供的各個發(fā)聲信號轉(zhuǎn)換成聲音并且將其發(fā)射至外部。這時，由于揚聲器SP1至SP3被布置在框架101的下表面，所以發(fā)出的聲音被放置著聲音發(fā)出/采集設(shè)備700的桌面反射，并且從與會者就座的設(shè)備側(cè)斜向上傳播。
作為麥克風(fēng)陣列MAIO、 MA20的麥克風(fēng)MIC11至MIC17、 MIC21至MIC27，可以采用不定向或者定向的麥克風(fēng)，但是希望的是采用定
向的麥克風(fēng)。各個麥克風(fēng)都從聲音發(fā)出/采集設(shè)備700外部拾取聲音，
隨后將聲音電轉(zhuǎn)換成聲音采集信號，隨后將聲音采集信號輸出到聲音
采集放大器16。聲音采集放大器16放大聲音采集信號，并且將放大后的信號提供至A/D轉(zhuǎn)換器17。 A/D轉(zhuǎn)換器17將聲音采集信號轉(zhuǎn)換成數(shù)字信號，并且將數(shù)字信號提供至聲音采集束產(chǎn)生部分181、 182。由布置在一個長表面上的麥克風(fēng)陣列MA10的麥克風(fēng)MIC11至MIC17 所拾取的聲音采集信號被輸入至聲音采集束產(chǎn)生部分181中，而由布置在另一個長表面上的麥克風(fēng)陣列MA20的麥克風(fēng)MIC21至MIC27所拾取的聲音采集信號被輸入至聲音采集束產(chǎn)生部分182中。
聲音采集束產(chǎn)生部分181將預(yù)定的延遲處理提供給來自麥克風(fēng) MIC11至MIC17的聲音采集信號，并且產(chǎn)生聲音采集束信號MB11至 MB14。如圖9B所示，對于聲音采集束信號MB11至MB14，具有預(yù)定的不同寬度的區(qū)域分別被設(shè)置為沿著它布置有麥克風(fēng)MIC11至MIC17 的長表面?zhèn)壬系穆曇舨杉瘏^(qū)域。
聲音采集束產(chǎn)生部分182將預(yù)定的延遲處理提供給來自麥克風(fēng) MIC21至MIC27的聲音采集信號，并且產(chǎn)生聲音采集束信號腿21至 MB24。如圖9B所示，對于聲音采集束信號MB21至MB24，具有預(yù)定的不同寬度的區(qū)域分別被設(shè)置為沿著它布置有麥克風(fēng)MIC21至MIC27 的長表面?zhèn)鹊穆曇舨杉瘏^(qū)域。
這時，所形成的聲音采集束信號MB11和聲音采集束信號MB21 是關(guān)于具有中心軸800的垂直表面(參考表面)的對稱束。類似地，聲音采集束信號MB12和聲音采集束信號MB22、聲音采集束信號MB13 和聲音采集束信號MB23、以及聲音采集束信號MB14和聲音采集束信號MB24是關(guān)于參考表面的對稱束。
聲音采集束選擇部分19從輸入聲音采集束信號MB11至MB14、 MB21至MB24中選擇最佳聲音采集束信號MB，并且將最佳聲音采集束信號MB輸出到回聲消除部分20。
圖11是示出了聲音采集束選擇部分19的主要結(jié)構(gòu)的框圖。
聲音采集束選擇部分19具有信號微分電路191、 BPF (帶通濾波器)192、全波整流電路193A、 193B、峰值檢測電路194A、 194B、電平比較器195A、 195B、信號選擇電路196、 198、以及HPF (高通濾波器)197。
信號微分電路191對聲音采集束信號MB11至MB14、MB21至MB24 中的關(guān)于參考表面對稱的聲音采集束信號之間的差值進行計算。具體地說，信號微分電路191計算聲音采集束信號MB11和認21的差值以產(chǎn)生差信號MS1，并且計算聲音采集束信號MB12和MB22的差值以產(chǎn) 生差信號MS2。并且，信號微分電路191計算聲音采集束信號MB13 和MB23的差值以產(chǎn)生差信號MS3，計算聲音采集束信號MB14和MB24 的差值以產(chǎn)生差信號MS4。在據(jù)此產(chǎn)生的差信號MS1至MS4中，由于作為信號源的聲音采集束信號是關(guān)于參考表面上的揚聲器陣列的軸對稱的，所以相互包含在聲音采集束信號中的迂回聲音分量被抵消。因此，產(chǎn)生了這樣的信號，其中來自揚聲器的迂回聲音分量被抑制。
BPF241是帶通濾波器，其具有在束特性中占主導(dǎo)的頻帶以及人類語音的主要分量的頻帶來作為通頻帶。BPF 241對差信號MS1至MS4 進行帶通濾波處理，并且將濾波后的信號輸出到全波整流電路193A。全波整流電路193A在全波范圍內(nèi)對差信號MS1至MS4進行整流(計算絕對值)，并且峰值檢測電路194A檢測經(jīng)過全波整流后的差信號 MS1至MS4的峰值，并且輸出峰值數(shù)據(jù)Psl至Ps4。電平比較器195A 對峰值數(shù)據(jù)Psl至Ps4進行比較，并將選擇指令數(shù)據(jù)給至信號選擇電路196，這些數(shù)據(jù)用于選擇與最高電平峰值數(shù)據(jù)Ps相對應(yīng)的差信號 MS。在這種情況下，利用了這樣的事實與說話者所處的聲音采集區(qū) 域相對應(yīng)的聲音采集束信號的信號電平高于與其它區(qū)域相對應(yīng)的聲音采集束信號的信號電平。
圖12A至12C是示出了這樣的情況的視圖，其中兩個與會者A、 B在將本實施例的聲音發(fā)出/采集設(shè)備700放置在桌子C上的同時舉行會議。圖12A示出了與會者A正在說話的情況，圖12B示出了與會者B正在說話的情況，圖12C示出了與會者A、 B中沒人說話的情況。
例如，如圖12A所示，當(dāng)與聲音采集束信號MB13相對應(yīng)的區(qū)域中的與會者A開始說話時，聲音采集束信號MB13的信號電平變得高于聲音采集束信號MBll、 MB12、 MB14、 MB21至MB24的信號電平。因此，通過用聲音采集束信號MB23減去聲音采集束信號MB13獲得的差信號MS3的信號電平變得高于差信號MS1、 MS2、 MS4的信號電平。于是，差信號MS3的峰值數(shù)據(jù)Ps3高于其它峰值數(shù)據(jù)Psl、 Ps2、 Ps4，隨后電平比較器195A檢測出峰值數(shù)據(jù)Ps3并且將用于選擇差信號 MS3的選擇指令數(shù)據(jù)提供至信號選擇電路196。相反，如圖12B所示，當(dāng)與聲音采集束信號MB21相對應(yīng)的區(qū)域中的與會者B開始說話時，電平比較器195A檢測出峰值數(shù)據(jù)Psl并且將用于選擇差信號MSl的選擇指令數(shù)據(jù)提供至信號選擇電路196。
在此，如圖12C所示，當(dāng)與會者A、 B中沒人說話時，一旦電平比較器195A檢測出所有的峰值數(shù)據(jù)Psl至Ps4都沒有到達預(yù)定閾值，它就立刻將先前的選擇指令數(shù)據(jù)提供至信號選擇電路196。
信號選擇電路196選擇兩個聲音采集束信號MBlx、 MB2x (x=l 至4)，它們組成了由所提供的選擇指令數(shù)據(jù)指示的差信號MS。例如，信號選擇電路196在圖12A中的情況下選擇組成差信號MS3的聲音采集束信號MB13、 MB23，而信號選擇電路196在圖12B中的情況下選擇組成差信號MS1的聲音采集束信號MBll、 MB21。
HPF 197執(zhí)行濾波處理從而僅僅使所選的聲音采集束信號MBlx、 MB2x的高頻分量通過，并且將該分量輸出到全波整流電路193B。由于提供了高頻分量通過處理(即對高頻分量之外的分量進行衰減)，所以如上所述，可以去除不包含高頻分量的輸入聲音信號(即迂回聲音的分量)。于是，形成了經(jīng)高通處理過的信號，其中僅包含來自自己的設(shè)備一側(cè)的說話者的聲音。全波整流電路193B在全波范圍內(nèi)對與聲音采集束信號MBlx、 MB2x相對應(yīng)的經(jīng)高通處理過的信號進行整流(計算絕對值)，并且峰值檢測電路194B檢測經(jīng)高通處理過的信號的峰值并輸出峰值數(shù)據(jù)Pbl、 Pb2。電平比較器195B對峰值數(shù)據(jù)Pbl、 Pb2進行比較，并將選擇指令數(shù)據(jù)給至信號選擇電路198，這些數(shù)據(jù) 用于選擇與較高電平的峰值數(shù)據(jù)Ps相對應(yīng)的聲音采集束信號Mbax "=1或2)。在這種情況下，利用了這樣的事實與說話者所處的聲音采集區(qū)域相對應(yīng)的聲音采集束信號的信號電平高于與參考表面對面的聲音采集區(qū)域相對應(yīng)的聲音采集束信號的信號電平。
例如，如圖12A所示，當(dāng)與聲音采集束信號MB13相對應(yīng)的區(qū)域中的與會者A開始說話時，聲音采集束信號MB13的信號電平變得高于聲音采集束信號MB23的信號電平。因此，聲音采集束信號MB13 的峰值數(shù)據(jù)Pbl變得高于聲音采集束信號MB23的峰值數(shù)據(jù)Pb2，電平比較器195B檢測出峰值數(shù)據(jù)Pbl并將用于選擇聲音采集束信號 MB13的選擇指令數(shù)據(jù)提供至信號選擇電路198。相反，如圖12B所示，當(dāng)與聲音采集束信號MB21相對應(yīng)的區(qū)域中的與會者B開始說話時，電平比較器195B檢測出峰值數(shù)據(jù)Pb2并將用于選擇聲音采集束信號 MB21的選擇指令數(shù)據(jù)提供至信號選擇電路198。在這種情況下，如圖 12C所示，當(dāng)說話者都不發(fā)聲并且兩個聲音采集束信號MBlx、 MB2x 的峰值數(shù)據(jù)Pbl、 Pb2都低于預(yù)定閾值時，電平比較器195B將先前的選擇指令數(shù)據(jù)提供至信號選擇電路198。
信號選擇電路198從聲音采集束信號MBlx、 MB2x中選擇具有較高信號電平的聲音采集束信號，其中聲音采集束信號MBlx、 MB2x是由信號選擇電路196根據(jù)電平比較器195B的選擇指令數(shù)據(jù)來選擇的，并且信號選擇電路198將這個信號作為聲音采集束信號MB輸出至回聲消除部分20。
例如，如上所述，在圖12A的情況中，信號選擇電路198根據(jù) 選擇指令數(shù)據(jù)來從聲音采集束信號MB13和聲音采集束信號MB23中選擇聲音采集束信號MB13，并且輸出該信號。相反，在圖12B的情況中，信號選擇電路198從聲音采集束信號MB11和聲音采集束信號 MB21中選擇聲音采集束信號MB21，并且輸出該信號。并且，在圖12A 的情況中，信號選擇電路198根據(jù)選擇指令數(shù)據(jù)在先前的聲音采集束信號是聲音采集束信號MB13時輸出聲音采集束信號MB13，并且在先前的聲音采集束信號是聲音采集束信號MB21時輸出聲音釆集束信號 MB21。根據(jù)這種處理的應(yīng)用，可以在不受從揚聲器到麥克風(fēng)的迂回聲
音的影響的情況下檢測出說話者方向，并且可以產(chǎn)生在該方向上能設(shè) 置指向性中心的聲音采集束信號MB。也就是說，可以以高S/N比拾
取來自說話者的語音。
34回聲消除部分20具有自適應(yīng)濾波器201和后置處理器22。自適應(yīng)濾波器201根據(jù)響應(yīng)于輸入聲音信號的所選聲音采集束信號MB的聲音采集指向性來產(chǎn)生偽迂回聲音信號。后置處理器22用從聲音采集束選擇部分19中輸出的聲音采集束信號MB減去偽迂回聲音信號，并且將相減后的信號作為輸出聲音信號輸出至輸入/輸出I/F12。由于執(zhí)行了這種回聲消除處理，所以可以執(zhí)行足夠的回聲去除，并且只有屬于自己的設(shè)備的說話者的語音能作為輸出聲音信號發(fā)送至網(wǎng)絡(luò)。
如上所述，可以通過利用本發(fā)明的結(jié)構(gòu)來在不受迂回聲音的影響的情況下檢測出說話者方向。于是，可以以高S/N比拾取說話者的語音，隨后可將該語音發(fā)送到對面的聲音發(fā)出/采集設(shè)備。
權(quán)利要求
1.一種遠程會議設(shè)備，其包括揚聲器陣列，其包括向上或向下發(fā)出聲音的多個揚聲器；第一麥克風(fēng)陣列和第二麥克風(fēng)陣列，它們被布置成在所述揚聲器陣列的縱向方向上從所述揚聲器陣列兩側(cè)拾取聲音；第一束產(chǎn)生部分，所述第一束產(chǎn)生部分通過分別以預(yù)定量的延遲對分別由所述第一麥克風(fēng)陣列的麥克風(fēng)拾取到的聲音信號進行延遲處理并對延遲后的聲音信號進行合成，從而產(chǎn)生多個第一聲音采集束，所述第一聲音采集束分別將焦點放置在事先在所述第一麥克風(fēng)陣列側(cè)確定的多個第一聲音采集區(qū)域上；第二束產(chǎn)生部分，所述第二束產(chǎn)生部分通過分別以預(yù)定量的延遲對分別由所述第二麥克風(fēng)陣列的麥克風(fēng)拾取到的聲音信號進行延遲處理并對延遲后的聲音信號進行合成，從而產(chǎn)生多個第二聲音采集束，所述第二聲音采集束分別將焦點放置在事先在所述第二麥克風(fēng)陣列側(cè)確定的多個第二聲音采集區(qū)域上；差信號計算部分，其計算分別朝向所述多個第一聲音采集區(qū)域和所述多個第二聲音采集區(qū)域產(chǎn)生的聲音采集束中那些與關(guān)于所述揚聲器陣列的中心線沿縱向方向處在相互對稱位置的聲音采集區(qū)域?qū)ο鄬?yīng)的聲音采集束的差信號；第一聲源位置估計部分，其選擇一對其中的差信號的信號強度較大的聲音采集區(qū)域；以及第二聲源位置估計部分，其從由所述第一聲源位置估計部分所選擇的所述聲音采集區(qū)域?qū)χ羞x擇與強度較大的聲音采集束相對應(yīng)的聲音采集區(qū)域，從而估計出聲源位置存在于所選擇的聲音采集區(qū)域中。
2. 如權(quán)利要求1所述的遠程會議設(shè)備，其中所述第一束產(chǎn)生部分和所述第二束產(chǎn)生部分在由所述第二聲源位置估計部分所選擇的所述聲音采集區(qū)域中進一步設(shè)置多個狹窄的聲音采集區(qū)域，從而產(chǎn)生多個分別將焦點放置在所述狹窄的聲音采集區(qū)域上的狹窄的聲音采集束，并且所述遠程會議設(shè)備還包括第三聲源位置估計部分，其估計出聲源位置存在于與所述多個狹窄的聲音采集區(qū)域?qū)?yīng)的聲音釆集束中其中的聲音信號的強度較大的一個聲音采集束的區(qū)域中。
3. —種遠程會議設(shè)備，其包括揚聲器陣列，其包括向上或向下發(fā)出聲音的多個揚聲器；第一麥克風(fēng)陣列和第二麥克風(fēng)陣列，它們適于將多個麥克風(fēng)排列成沿所述揚聲器陣列的縱向方向在揚聲器陣列的中心線兩側(cè)相互對稱；差信號計算部分，其通過對由所述第一麥克風(fēng)陣列和所述第二麥克風(fēng)陣列的各個麥克風(fēng)中的放置在相互對稱的位置上的每對麥克風(fēng)所拾取的聲音信號進行相減，從而計算出差信號；第一束產(chǎn)生部分，所述第一束產(chǎn)生部分通過在調(diào)整延遲量的同時對所述差信號進行相互合成，從而產(chǎn)生多個第一聲音采集束，所述第一聲音采集束將焦點分別放置在處于相互對稱位置的多對預(yù)定的聲音采集區(qū)域中；第一聲源位置估計部分，其從所述多對聲音采集區(qū)域中選擇出其中的差信號的信號強度較大的一對聲音采集區(qū)域；第二束產(chǎn)生部分，其根據(jù)由所述第一麥克風(fēng)陣列的每個麥克風(fēng) 所拾取的所述聲音信號來產(chǎn)生聲音采集束，從而在由所述第一聲源位置估計部分所選擇的所述聲音采集區(qū)域?qū)χ械拿總€聲音采集區(qū)域中拾取聲音信號；第三束產(chǎn)生部分，其根據(jù)由所述第二麥克風(fēng)陣列的每個麥克風(fēng) 所拾取的所述聲音信號來產(chǎn)生聲音采集束，從而在由所述第一聲源位置估計部分所選擇的所述聲音采集區(qū)域?qū)χ械拿總€聲音采集區(qū)域中拾取聲音信號；以及第二聲源位置估計部分，其選擇出與一聲音信號相對應(yīng)的聲音釆集區(qū)域，從而估計聲源位置存在于所選擇的聲音采集區(qū)域中，其中所述聲音信號是由所述第二束產(chǎn)生部分和第三束產(chǎn)生部分產(chǎn)生的聲音采集束所拾取的聲音信號中信號強度較大的聲音信號。
4. 一種聲音發(fā)出/采集設(shè)備，其包括揚聲器，其沿著分別關(guān)于預(yù)定參考表面對稱的方向發(fā)出聲音；第一麥克風(fēng)陣列和第二麥克風(fēng)陣列，所述第一麥克風(fēng)陣列在所述預(yù)定參考表面的一側(cè)拾取聲音，所述第二麥克風(fēng)陣列在所述預(yù)定參考表面的另一側(cè)拾取聲音；聲音采集束信號產(chǎn)生部分，所述聲音采集束信號產(chǎn)生部分產(chǎn)生第一聲音采集束信號，從而根據(jù)所述第一麥克風(fēng)陣列的一個聲音采集信號分別從多個第一聲音采集區(qū)域中拾取聲音，并且所述聲音采集束信號產(chǎn)生部分產(chǎn)生第二聲音采集束信號，從而根據(jù)所述第二麥克風(fēng)陣列的聲音采集信號分別從被提供在與所述第一聲音采集區(qū)域關(guān)于所述預(yù)定參考表面對稱的位置上的多個第二聲音采集區(qū)域中拾取聲音；以及聲音采集束信號選擇部分，其將關(guān)于所述預(yù)定參考表面相互對稱的所述聲音采集束信號彼此相減、從構(gòu)成了信號電平最高的差信號的兩個聲音采集束信號中僅僅提取高頻分量、并且根據(jù)所述提取出來的高頻分量的結(jié)果，從所述兩個聲音采集束信號中選擇一個其信號電平較高的具有高頻分量的聲音采集束信號。
5. 如權(quán)利要求4所述的聲音發(fā)出/采集設(shè)備，其中所述聲音采集束信號選擇部分包括差信號檢測部分，其將相互對稱的所述聲音采集束信號彼此相減，從而檢測出信號電平最高的差信號；高頻分量信號提取部分，所述高頻分量信號提取部分具有髙通濾波器，所述高通濾波器僅僅使得所述差信號檢測部分從其中檢測出差信號的兩個聲音采集束信號的高頻分量分別通過，并且高頻分量信號提取部分從通過所述高頻濾波器的高頻分量信號中檢測出信號電平較高的高頻分量信號；以及選擇部分，其選擇與由所述高頻分量信號提取部分所檢測到的高頻分量信號相對應(yīng)的聲音采集束信號，并且輸出所選擇的聲音采集束信號。
6. 如權(quán)利要求4或5所述的聲音發(fā)出/采集設(shè)備，其中所述揚聲器由沿著所述預(yù)定參考表面成直線排列的多個分立的揚聲器構(gòu)成。
7. 如權(quán)利要求4至6中任一權(quán)利要求所述的聲音發(fā)出/采集設(shè) 備，進一步包括迂回聲音去除部分，其根據(jù)所述輸入聲音信號和由所述聲音采集束信號選擇部分所選擇的聲音采集束信號來執(zhí)行控制，以使得從所述揚聲器發(fā)出的聲音不包含在所述輸出聲音信號中。
全文摘要
一種遠程會議設(shè)備，其包括揚聲器陣列和布置在揚聲器陣列兩側(cè)的麥克風(fēng)陣列。在各個麥克風(fēng)陣列前面關(guān)于揚聲器陣列中心線對稱地設(shè)置多個焦點。指向焦點輸出一簇聲音采集束。通過計算指向關(guān)于中心線對稱的焦點的聲音采集束之間的差，消除了從揚聲器陣列SPA進入麥克風(fēng)的聲音分量。另外，根據(jù)特定時段內(nèi)差值的波高度值的平方和來估計哪個所設(shè)置的焦點最近。另外，通過比較指向相互對稱的焦點的聲音采集束的波高度值的平方和可以判定說話者的位置。
文檔編號H04R3/00GK101310558SQ20068004234
公開日2008年11月19日申請日期2006年11月10日優(yōu)先權(quán)日2005年11月15日
發(fā)明者田中良, 石橋利晃, 鈴木智, 鵜飼訓(xùn)史申請人:雅馬哈株式會社

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：石橋利晃;鈴木智;田中良;鵜飼訓(xùn)史
技術(shù)所有人：雅馬哈株式會社
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機構(gòu)動力學(xué)與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

聲音采集設(shè)備相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

遠程會議設(shè)備以及聲音發(fā)出/采集設(shè)備的制作方法