信息處理系統(tǒng)和存儲介質(zhì)的制作方法
【專利摘要】[問題]提供了一種能夠在將用戶附近的空間與另一空間鏈接在一起時提供沉浸于第三空間中的感覺的信息處理系統(tǒng)和存儲介質(zhì)。[解決方案]該信息處理系統(tǒng)配備有:識別單元,其基于由置于特定用戶附近的多個傳感器檢測到的信號來識別第一對象和第二對象;標(biāo)識單元,其對由識別單元識別的第一對象和第二對象進行標(biāo)識;估計單元,其根據(jù)由所述多個傳感器中的任一傳感器檢測到的信號來估計特定用戶的位置;以及信號處理單元,其對從標(biāo)識單元標(biāo)識的第一對象和第二對象附近的傳感器所獲取的每個信號進行處理,使得聲音在從置于特定用戶附近的多個執(zhí)行器輸出時被定位在由估計單元估計的特定用戶的位置附近。
【專利說明】信息處理系統(tǒng)和存儲介質(zhì)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及信息處理系統(tǒng)和存儲介質(zhì)。
【背景技術(shù)】
[0002]在最近幾年,在數(shù)據(jù)通信領(lǐng)域已經(jīng)提出了各種技術(shù)。例如,下述專利文獻I提出了涉及機器對機器(M2M)解決方案的技術(shù)。具體地,在專利文獻I中所著述的遠(yuǎn)程管理系統(tǒng)使用互聯(lián)網(wǎng)協(xié)議(IP)多媒體子系統(tǒng)(IMS)平臺(IS),并且通過由裝置公開存在信息或者用戶與裝置之間的即時消息,實現(xiàn)被授權(quán)用戶客戶端(UC)與裝置客戶端之間的交互。
[0003]另一方面,在聲學(xué)【技術(shù)領(lǐng)域】中,正在開發(fā)各種類型的可以發(fā)出聲束的陣列揚聲器。例如,下述專利文獻2描述了如下陣列揚聲器:其中,構(gòu)成共同波前的多個揚聲器附接至機柜,并且所述陣列揚聲器控制從各個揚聲器發(fā)出的聲音的延遲量和電平。另外,下述專利文獻2描述了正在開發(fā)具有相同原理的陣列麥克風(fēng)。陣列麥克風(fēng)可以通過調(diào)節(jié)各個麥克風(fēng)的輸出信號的電平和延遲量來主動設(shè)置聲音獲取點,并且因此能夠更有效地獲取聲音。
[0004]引文列表
[0005]專利文獻
[0006]專利文獻1:JP 2006-279565A
[0007]專利文獻2:JP 2008-543137T
【發(fā)明內(nèi)容】
[0008]技術(shù)問題
[0009]然而,上述專利文獻I和專利文獻2沒有提及與以下技術(shù)或者通信方法有關(guān)的任何內(nèi)容:該技術(shù)或通信方法被理解為用于通過在大區(qū)域上安置多個圖像傳感器、麥克風(fēng)、揚聲器等來實現(xiàn)用戶身體的增強的裝置。
[0010]因此,本公開內(nèi)容提出了一種信息處理系統(tǒng)和存儲介質(zhì),所述信息處理系統(tǒng)和存儲介質(zhì)是新穎且改進的,并且可以在使得用戶周圍的空間與另一空間配合協(xié)作時提供被吸入(absorb)到第三空間中的感覺。
[0011]問題的解決方案
[0012]根據(jù)本公開內(nèi)容,提供了一種信息處理系統(tǒng),所述信息處理系統(tǒng)包括:識別單元,所述識別單元被配置成基于由布置在特定用戶周圍的多個傳感器檢測到的信號來識別第一目標(biāo)和第二目標(biāo);標(biāo)識單元,所述標(biāo)識單元被配置成對由所述識別單元識別的所述第一目標(biāo)和所述第二目標(biāo)進行標(biāo)識;估計單元,所述估計單元被配置成根據(jù)由所述多個傳感器中的任一傳感器檢測到的信號來估計所述特定用戶的位置;以及信號處理單元,所述信號處理單元被配置成以以下方式對從所述標(biāo)識單元標(biāo)識的所述第一目標(biāo)和所述第二目標(biāo)周圍的傳感器所獲取的信號中的每個信號進行處理:在從布置在所述特定用戶周圍的多個執(zhí)行器輸出時,所述信號被定位在由所述估計單元估計的所述特定用戶的位置附近。
[0013]根據(jù)本公開內(nèi)容,提供了一種信息處理系統(tǒng),所述信息處理系統(tǒng)包括:識別單元,所述識別單元被配置成基于由特定用戶周圍的傳感器檢測到的信號來識別第一目標(biāo)和第二目標(biāo);標(biāo)識單元,所述標(biāo)識單元被配置成對由所述識別單元識別的所述第一目標(biāo)和所述第二目標(biāo)進行標(biāo)識;以及信號處理單元,所述信號處理單元被配置成基于由多個傳感器獲取的信號來生成要從所述特定用戶周圍的執(zhí)行器輸出的信號,所述多個傳感器布置在由所述標(biāo)識單元標(biāo)識的所述第一目標(biāo)和所述第二目標(biāo)周圍。
[0014]根據(jù)本公開內(nèi)容,提供了一種存儲有程序的存儲介質(zhì),所述程序用于使計算機用作為:識別單元,所述識別單元被配置成基于由布置在特定用戶周圍的多個傳感器檢測到的信號來識別第一目標(biāo)和第二目標(biāo);標(biāo)識單元,所述標(biāo)識單元被配置成對由所述識別單元識別的所述第一目標(biāo)和所述第二目標(biāo)進行標(biāo)識;估計單元,所述估計單元被配置成根據(jù)由所述多個傳感器中的任一傳感器檢測到的信號來估計所述特定用戶的位置;以及信號處理單元,所述信號處理單元被配置成以以下方式對從所述標(biāo)識單元標(biāo)識的所述第一目標(biāo)和所述第二目標(biāo)周圍的傳感器所獲取的信號中的每個信號進行處理:在從布置在所述特定用戶周圍的多個執(zhí)行器輸出時,所述信號被定位在由所述估計單元估計的所述特定用戶的位置附近。
[0015]根據(jù)本公開內(nèi)容,提供了一種存儲有程序的存儲介質(zhì),所述程序用于使計算機用作為:識別單元,所述識別單元被配置成基于由特定用戶周圍的傳感器檢測到的信號來識別第一目標(biāo)和第二目標(biāo);標(biāo)識單元,所述標(biāo)識單元被配置成對由所述識別單元識別的所述第一目標(biāo)和所述第二目標(biāo)進行標(biāo)識;以及信號處理單元,所述信號處理單元被配置成基于由多個傳感器獲取的信號來生成要從所述特定用戶周圍的執(zhí)行器輸出的信號,所述多個傳感器布置在由所述標(biāo)識單元標(biāo)識的所述第一目標(biāo)和所述第二目標(biāo)周圍。
[0016]發(fā)明的有益效果
[0017]根據(jù)如上所述的本公開內(nèi)容,當(dāng)使得用戶周圍的空間能夠與另一空間配合協(xié)作時可以提供被吸入到第三空間中的感覺。
【專利附圖】
【附圖說明】
[0018]圖1是示出根據(jù)本公開內(nèi)容的實施方式的聲學(xué)系統(tǒng)的概述的圖。
[0019]圖2是示出根據(jù)本公開內(nèi)容的實施方式的聲學(xué)系統(tǒng)的系統(tǒng)配置的圖。
[0020]圖3是示出根據(jù)本實施方式的信號處理設(shè)備的配置的框圖。
[0021]圖4是示出根據(jù)本實施方式的聲學(xué)封閉面的形狀的圖。
[0022]圖5是示出根據(jù)本實施方式的管理服務(wù)器的配置的框圖。
[0023]圖6是示出根據(jù)本實施方式的聲學(xué)系統(tǒng)的基本處理的流程圖。
[0024]圖7是示出根據(jù)本實施方式的命令識別處理的流程圖。
[0025]圖8是示出根據(jù)本實施方式的聲音獲取處理的流程圖。
[0026]圖9是示出根據(jù)本實施方式的第三空間的聲場的構(gòu)建的圖。
[0027]圖10是示出用于構(gòu)建地點C的聲場的技術(shù)的圖。
[0028]圖11是示出根據(jù)本實施方式的管理服務(wù)器的另一配置的框圖。
[0029]圖12是示出聲學(xué)參數(shù)的測量的圖。
[0030]圖13是不出對在測量環(huán)境中多個麥克風(fēng)的布置與在收聽環(huán)境中多個揚聲器的布置進行相互比較的圖。
[0031]圖14是示出根據(jù)本實施方式的測量環(huán)境中的封閉面的形狀的圖。
[0032]圖15是示出聲場再現(xiàn)信號處理單元的配置的框圖,所述聲場再現(xiàn)信號處理單元執(zhí)行用于提供被吸入到地點C處的感覺的聲場構(gòu)建。
[0033]圖16A是示出在地點C處的脈沖響應(yīng)的測量的圖。
[0034]圖16B是示出根據(jù)本實施方式的使用由矩陣卷積單元執(zhí)行的脈沖響應(yīng)組的算術(shù)運算的圖。
[0035]圖17是示出根據(jù)本實施方式的聲場再現(xiàn)處理的流程圖。
[0036]圖18A是示出在地點B構(gòu)建的聲場是固定的情況的圖。
[0037]圖18B是示出在地點B構(gòu)建的聲場是可移動的情況的圖。
[0038]圖19A是示出在測量目標(biāo)空間中的測量的圖。
[0039]圖19B是示出在消聲室中的測量的圖。
[0040]圖19C是示出在再現(xiàn)目標(biāo)空間中的重建的圖。
[0041]圖20是示出根據(jù)本實施方式的聲學(xué)系統(tǒng)的另一系統(tǒng)配置的圖。
[0042]圖21是示出根據(jù)本實施方式的自治聲學(xué)系統(tǒng)的系統(tǒng)配置的示例的圖。
[0043]圖22是示出根據(jù)本實施方式的具有自治聲學(xué)系統(tǒng)的裝置的配置的框圖。
[0044]圖23是示出根據(jù)本實施方式的自治聲學(xué)系統(tǒng)的操作處理的流程圖。
[0045]圖24是示出在根據(jù)本實施方式的自治聲學(xué)系統(tǒng)中根據(jù)用戶的移動來改變操作裝置的圖。
[0046]圖25是示出在根據(jù)本實施方式的自治聲學(xué)系統(tǒng)中向多個用戶提供服務(wù)的情況的圖。
【具體實施方式】
[0047]下面,將參照附圖來詳細(xì)描述本公開內(nèi)容的優(yōu)選實施方式。注意,在本說明書和附圖中,具有基本相同的功能和結(jié)構(gòu)的元件用相同的附圖標(biāo)記來表示,并且省略重復(fù)描述。
[0048]描述將按照以下順序來進行。
[0049]1.根據(jù)本公開內(nèi)容的實施方式的聲學(xué)系統(tǒng)的概述
[0050]2.基本配置
[0051]2-1.系統(tǒng)配置
[0052]2-2.信號處理設(shè)備
[0053]2-3.管理服務(wù)器
[0054]3.操作處理
[0055]3-1.基本處理
[0056]3-2.命令識別處理
[0057]3-3.聲音獲取處理
[0058]4.第三空間的聲場的構(gòu)建
[0059]4-1.管理服務(wù)器的配置
[0060]4-2.聲場再現(xiàn)信號處理單元的配置
[0061]4-3.聲場再現(xiàn)處理
[0062]5.補充
[0063]6.結(jié)論
[0064]〈1.根據(jù)本公開內(nèi)容的實施方式的聲學(xué)系統(tǒng)的概述〉
[0065]首先,將參照圖1來描述根據(jù)本公開內(nèi)容的實施方式的聲學(xué)系統(tǒng)(信息處理系統(tǒng))的概述。圖1是示出根據(jù)本公開內(nèi)容的實施方式的聲學(xué)系統(tǒng)的概述的圖。如圖1所示,在根據(jù)本實施方式的聲學(xué)系統(tǒng)中,假定大量的傳感器和執(zhí)行器(例如麥克風(fēng)10、圖像傳感器(未示出)和揚聲器20)布置在諸如房間、房屋、樓宇、室外地點、地區(qū)和國家的世界各地的情況。
[0066]在圖1中所示的示例中,在用戶A當(dāng)前所處的室外區(qū)域“地點A”的道路等上,布置有多個麥克風(fēng)1A作為多個傳感器的不例,并且布置有多個揚聲器20A作為多個執(zhí)行器的示例。另外,在用戶B當(dāng)前所處的室內(nèi)區(qū)域“地點B”中,在墻壁、地板、天花板等上布置有多個麥克風(fēng)1B和多個揚聲器20B。注意,在地點A和B中,還可以布置運動傳感器和圖像傳感器(未示出)作為傳感器的示例。
[0067]這里,地點A和地點B可以通過網(wǎng)絡(luò)彼此連接,并且在地點A與B之間傳送和接收從地點A的各個麥克風(fēng)和各個揚聲器輸出的信號和輸入至地點A的各個麥克風(fēng)和各個揚聲器的信號,以及從地點B的各個麥克風(fēng)和各個揚聲器輸出的信號和輸入至地點B的各個麥克風(fēng)和各個揚聲器的信號。
[0068]以此方式,根據(jù)本實施方式的聲學(xué)系統(tǒng)通過布置在用戶周圍的多個揚聲器和多個顯示器來實時再現(xiàn)對應(yīng)于給定目標(biāo)(人物、地點、樓宇等)的語音或者圖像。另外,根據(jù)本實施方式的聲學(xué)系統(tǒng)能夠在用戶周圍實時再現(xiàn)通過布置在用戶周圍的多個麥克風(fēng)已經(jīng)獲取的用戶的語音。以此方式,根據(jù)本實施方式的聲學(xué)系統(tǒng)可以使得用戶周圍的空間能夠與另一空間配合協(xié)作。
[0069]另外,使用在室內(nèi)地點和室外地點各處布置的麥克風(fēng)10、揚聲器20、圖像傳感器等,可以在大區(qū)域上實質(zhì)上增強(augment)用戶的身體,例如嘴、眼睛、耳朵,從而實現(xiàn)新的通?目方法。
[0070]此外,由于麥克風(fēng)和圖像傳感器布置在根據(jù)本實施方式的聲學(xué)系統(tǒng)中的各處,所以用戶不必攜帶智能電話或移動電話終端。用戶使用語音或手勢來指定給定目標(biāo),并且可以與給定目標(biāo)周圍的空間建立連接。在下文中,將簡要描述根據(jù)本實施方式的聲學(xué)系統(tǒng)在位于地點A的用戶A想要與位于地點B的用戶B對話的情況下的應(yīng)用。
[0071](數(shù)據(jù)采集處理)
[0072]在地點A處,通過多個麥克風(fēng)10Α、多個圖像傳感器(未示出)、多個人體傳感器(未示出)等連續(xù)地執(zhí)行數(shù)據(jù)采集處理。具體地,根據(jù)本實施方式的聲學(xué)系統(tǒng)采集由麥克風(fēng)1A獲取的聲音、由圖像傳感器獲得的捕捉圖像、或者人體傳感器的檢測結(jié)果,并且基于所采集的信息來估計用戶的位置。
[0073]另外,根據(jù)本實施方式的聲學(xué)系統(tǒng)可以基于預(yù)先登記的多個麥克風(fēng)1A的位置信息和用戶的估計位置來選擇布置在可以充分獲取用戶語音的位置處的麥克風(fēng)組。另外,根據(jù)本實施方式的聲學(xué)系統(tǒng)執(zhí)行由所選擇的麥克風(fēng)獲取的音頻信號的流組的麥克風(fēng)陣列處理。特別地,根據(jù)本實施方式的聲學(xué)系統(tǒng)可以執(zhí)行延遲及求和陣列(delay-and-sumarray),其中,聲音獲取點被集中于用戶A的嘴上,并且可以形成陣列麥克風(fēng)的超級方向性。因此,諸如用戶A的喃喃自語的微弱發(fā)聲也可以被獲取。
[0074]另外,根據(jù)本實施方式的聲學(xué)系統(tǒng)基于用戶A的獲取的語音來識別命令,并且根據(jù)該命令來執(zhí)行操作處理。例如,當(dāng)位于地點A處的用戶A說“我想與B講話”時,“對用戶B的呼叫發(fā)起請求”被識別為命令。在這種情況下,根據(jù)本實施方式的聲學(xué)系統(tǒng)標(biāo)識用戶B的當(dāng)前位置,并且使得用戶B當(dāng)前所處的地點B與用戶A當(dāng)前所處的地點A相連接。通過該操作,用戶A能夠在電話中與用戶B講話。
[0075](對象分解處理)
[0076]對在電話通話期間由地點A處的多個麥克風(fēng)獲取的音頻信號(流數(shù)據(jù))執(zhí)行對象分解處理,諸如聲源分離(用戶A周圍的噪聲分量、用戶A周圍的人的談話等的分離)、去混響(dereverberat1n)以及噪聲/回聲處理。通過該處理,以下流數(shù)據(jù)被傳送至地點B:在該流數(shù)據(jù)中,S/N比高,并且混響感覺被抑制。
[0077]考慮到用戶A在移動時講話的情況,根據(jù)本實施方式的聲學(xué)系統(tǒng)可以通過連續(xù)地執(zhí)行數(shù)據(jù)采集來應(yīng)對這種情況。具體地,根據(jù)本實施方式的聲學(xué)系統(tǒng)基于多個麥克風(fēng)、多個圖像傳感器、多個人體傳感器等來連續(xù)地執(zhí)行數(shù)據(jù)采集,并且檢測用戶A的移動路徑或用戶A正在前進的方向。然后,根據(jù)本實施方式的聲學(xué)系統(tǒng)連續(xù)地更新對布置在移動用戶A周圍的適當(dāng)麥克風(fēng)組的選擇,并且連續(xù)地執(zhí)行陣列麥克風(fēng)處理,以使得聲音獲取點恒定地集中于移動用戶A的嘴上。通過該操作,根據(jù)本實施方式的聲學(xué)系統(tǒng)能夠應(yīng)對用戶A在移動時講話的情況。
[0078]另外,以與語音的數(shù)據(jù)流分開的方式,用戶A的移動方向和方向等被轉(zhuǎn)換為元數(shù)據(jù),并且與流數(shù)據(jù)一起被傳送至地點B。
[0079](對象合成)
[0080]另外,通過布置在位于地點B處的用戶B周圍的揚聲器來再現(xiàn)被傳送至地點B的流數(shù)據(jù)。此時,根據(jù)本實施方式的聲學(xué)系統(tǒng)通過多個麥克風(fēng)、多個圖像傳感器以及多個人體傳感器來在地點B處執(zhí)行數(shù)據(jù)采集,基于所采集的數(shù)據(jù)來估計用戶B的位置,并且通過聲學(xué)上封閉的表面來選擇用戶B周圍的適當(dāng)揚聲器組。通過所選擇的揚聲器組再現(xiàn)被傳送至地點B的流數(shù)據(jù),并且在聲學(xué)上封閉的表面內(nèi)的區(qū)域被控制為適當(dāng)?shù)穆晥?。在本公開內(nèi)容中,使得多個相鄰的揚聲器或多個相鄰的麥克風(fēng)的位置相連接以包圍對象(例如用戶)而形成的表面在概念上被稱為“聲學(xué)封閉面”。另外,“聲學(xué)封閉面”并不一定構(gòu)成完全封閉的表面,并且優(yōu)選地被配置成大致包圍目標(biāo)對象(例如用戶)。
[0081]另外,聲場可以由用戶B來適當(dāng)?shù)剡x擇。例如,在用戶B指定地點A作為聲場的情況下,根據(jù)本實施方式的聲學(xué)系統(tǒng)在地點B中重建地點A的環(huán)境。具體地,例如,基于聲音信息(作為實時獲取的周圍環(huán)境)和已經(jīng)預(yù)先獲取的與地點A相關(guān)的元信息來在地點B中重建地點A的環(huán)境。
[0082]另外,根據(jù)本實施方式的聲學(xué)系統(tǒng)可以使用布置在地點B處的用戶B周圍的多個揚聲器20B來控制用戶A的音頻圖像。換句話說,根據(jù)本實施方式的聲學(xué)系統(tǒng)可以通過形成陣列揚聲器(波束形成)來在用戶B的耳朵處或在聲學(xué)封閉面的外部重建用戶A的語音(音頻圖像)。另外,根據(jù)本實施方式的聲學(xué)系統(tǒng)可以使用用戶A的移動路徑或者方向的元數(shù)據(jù),在地點B處根據(jù)用戶A的實際移動使得用戶A的音頻圖像能夠在用戶B周圍移動。
[0083]以上已經(jīng)結(jié)合數(shù)據(jù)采集處理、對象分解處理和對象合成處理的各個步驟來描述了從地點A至地點B的語音通信的概述,但是當(dāng)然,在從地點B至地點A的語音通信中執(zhí)行類似的處理。因此,可以在地點A與地點B之間執(zhí)行雙向語音通信。
[0084]以上已經(jīng)描述了根據(jù)本公開內(nèi)容的實施方式的聲學(xué)系統(tǒng)(信息處理系統(tǒng))的概述。接下來,將參照圖2至圖5詳細(xì)描述根據(jù)本實施方式的聲學(xué)系統(tǒng)的配置。
[0085]<2.基本配置〉
[0086][2-1.系統(tǒng)配置]
[0087]圖2是示出根據(jù)本實施方式的聲學(xué)系統(tǒng)的整體配置的圖。如圖2所示,聲學(xué)系統(tǒng)包括信號處理設(shè)備1A、信號處理設(shè)備IB以及管理服務(wù)器3。
[0088]信號處理設(shè)備IA和信號處理設(shè)備IB以有線/無線的方式連接至網(wǎng)絡(luò)5,并且可以經(jīng)由網(wǎng)絡(luò)5彼此傳送或接收數(shù)據(jù)。管理服務(wù)器3連接至網(wǎng)絡(luò)5,并且信號處理設(shè)備IA和信號處理設(shè)備IB能夠向管理服務(wù)器3傳送數(shù)據(jù)或者接收來自管理服務(wù)器3的數(shù)據(jù)。
[0089]信號處理設(shè)備IA對通過布置在地點A處的多個麥克風(fēng)1A和多個揚聲器20A輸入或輸出的信號進行處理。信號處理設(shè)備IB對通過布置在地點B處的多個麥克風(fēng)1B和多個揚聲器20B輸入或輸出的信號進行處理。另外,當(dāng)沒有必要彼此區(qū)分信號處理設(shè)備IA和IB時,信號處理設(shè)備IA和IB統(tǒng)稱為“信號處理設(shè)備I”。
[0090]管理服務(wù)器3具有執(zhí)行用戶認(rèn)證處理并且管理用戶的絕對位置(當(dāng)前位置)的功能。另外,管理服務(wù)器3還可以管理表示地方或樓宇的位置的信息(例如IP地址)。
[0091]因此,信號處理設(shè)備I可以向管理服務(wù)器3傳送對于由用戶指定的給定目標(biāo)(人物、地方、樓宇等)的訪問目的地信息(例如IP地址)的查詢,并且可以獲取訪問目的地信息。
[0092][2-2.信號處理設(shè)備]
[0093]接下來,將詳細(xì)描述根據(jù)本實施方式的信號處理設(shè)備I的配置。圖3是示出根據(jù)本實施方式的信號處理設(shè)備I的配置的框圖。如圖3所示,根據(jù)本實施方式的信號處理設(shè)備I包括多個麥克風(fēng)10 (陣列麥克風(fēng))、放大/模擬-數(shù)字轉(zhuǎn)換器(ADC)單元11、信號處理單元13、麥克風(fēng)位置信息數(shù)據(jù)庫(DB) 15、用戶位置估計單元16、識別單元17、標(biāo)識單元18、通信接口(I/F) 19、揚聲器位置信息數(shù)據(jù)庫21、放大/數(shù)字-模擬轉(zhuǎn)換器(DAC)單元23以及多個揚聲器20 (陣列揚聲器)。以下將對這些部件進行描述。
[0094](陣列麥克風(fēng))
[0095]多個麥克風(fēng)10被布置遍布于如上所述的某一區(qū)域(地點)。例如,所述多個麥克風(fēng)10布置在諸如公路、電線桿、路燈、房屋、樓宇的外墻的室外地點,以及諸如地板、墻壁和天花板的室內(nèi)地點處。所述多個麥克風(fēng)10獲取環(huán)境聲音,并且將所獲取的環(huán)境聲音輸出至放大/ADC單元11。
[0096](放大/ADC單元)
[0097]放大/ADC單元11具有對從多個麥克風(fēng)10輸出的聲波進行放大的功能(放大器)和將聲波(模擬數(shù)據(jù))轉(zhuǎn)換為音頻信號(數(shù)字?jǐn)?shù)據(jù))的功能(ADC)。放大/ADC單元11將經(jīng)轉(zhuǎn)換的音頻信號輸出至信號處理單元13。
[0098](信號處理單元)
[0099]信號處理單元13具有處理由麥克風(fēng)10獲取并且通過放大/ADC單元11傳送的音頻信號,以及處理通過DAC/放大單元23由揚聲器20再現(xiàn)的音頻信號的功能。另外,根據(jù)本實施方式的信號處理單元13用作為麥克風(fēng)陣列處理單元131、高S/N處理單元133以及聲場再現(xiàn)信號處理單元135。
[0100]-麥克風(fēng)陣列處理單元
[0101]麥克風(fēng)陣列處理單元131執(zhí)行方向性控制,使得在對于從放大/ADC單元11輸出的多個音頻信號的麥克風(fēng)陣列處理中集中用戶的語音(聲音獲取位置集中于用戶的嘴)。
[0102]此時,麥克風(fēng)陣列處理單元131可以基于由用戶位置估計單元16估計的用戶位置或者向麥克風(fēng)位置信息數(shù)據(jù)庫15登記的麥克風(fēng)10位置來選擇麥克風(fēng)組,所述麥克風(fēng)組形成最適于采集用戶語音的、包圍用戶的聲學(xué)封閉面。然后,麥克風(fēng)陣列處理單元131對由所選擇的麥克風(fēng)組獲取的音頻信號執(zhí)行方向性控制。另外,麥克風(fēng)陣列處理單元131可以通過延遲及求和陣列處理和空值生成(null generat1n)處理來形成陣列麥克風(fēng)的超級方向性。
[0103]-高S/N處理單元
[0104]高S/N處理單元133具有處理從放大/ADC單元11輸出的多個音頻信號,以形成具有高清晰度和高S/N比的單聲道信號的功能。具體地,高S/N處理單元133執(zhí)行聲源分離,并且執(zhí)行去混響和噪聲消減。
[0105]另外,高S/N處理單元133可以被布置在麥克風(fēng)陣列處理單元131之后的級。另夕卜,通過高S/N處理單元133處理的音頻信號(數(shù)據(jù)流)被用于由識別單元17執(zhí)行的語音識別,并且通過通信I/F 19傳送至外部。
[0106]-聲場再現(xiàn)信號處理單元
[0107]聲場再現(xiàn)信號處理單元135通過多個揚聲器20對將要再現(xiàn)的音頻信號執(zhí)行信號處理,并且執(zhí)行控制使得聲場定位于用戶的位置周圍。具體地,例如,聲場再現(xiàn)信號處理單元135基于由位置估計單元16估計的用戶位置或者向揚聲器位置信息數(shù)據(jù)庫21登記的揚聲器20的位置來選擇最佳的揚聲器組,以形成包圍用戶的聲學(xué)封閉面。然后,聲場再現(xiàn)信號處理單元135將已進行信號處理的音頻信號寫入對應(yīng)于所選擇的揚聲器組的多個通道的輸出緩沖器中。
[0108]另外,聲場再現(xiàn)信號處理單元135將聲學(xué)封閉面內(nèi)的區(qū)域控制為適當(dāng)?shù)穆晥?。作為控制聲場的方法,例如,亥姆霍?基爾霍夫積分定理和瑞利積分定理是已知的,并且基于所述定理的波場合成(WFS) —般是已知的。另外,聲場再現(xiàn)信號處理單元135可以應(yīng)用在JP 4674505B和JP 4735108B中所公開的信號處理技術(shù)。
[0109]注意,對由麥克風(fēng)或揚聲器形成的聲學(xué)封閉面的形狀沒有特別限制,只要該形狀是包圍用戶的三維形狀,并且如圖4所示,該形狀的示例可以包括具有橢圓形狀的聲學(xué)封閉面40-1、具有圓柱形狀的聲學(xué)封閉面40-2以及具有多邊形形狀的聲學(xué)封閉面40-3。圖4中示出的示例示出了由布置在地點B處的用戶B周圍的多個揚聲器20B-1至20B-12形成的聲學(xué)封閉面的形狀作為示例。所述示例還適用于由多個麥克風(fēng)10形成的聲學(xué)封閉面的形狀。
[0110](麥克風(fēng)位置信息數(shù)據(jù)庫)
[0111]麥克風(fēng)位置信息數(shù)據(jù)庫15是存儲布置在所述地點處的多個麥克風(fēng)10的位置信息的存儲單元??梢灶A(yù)先登記多個麥克風(fēng)10的位置信息。
[0112](用戶位置估計單元)
[0113]用戶位置估計單元16具有估計用戶位置的功能。具體地,用戶位置估計單元16基于由多個麥克風(fēng)10獲取的聲音的分析結(jié)果、由圖像傳感器獲得的捕捉圖像的分析結(jié)果或者由人體傳感器獲得的檢測結(jié)果,來估計用戶相對于多個麥克風(fēng)10或者多個揚聲器20的位置。用戶位置估計單元16可以獲取全球定位系統(tǒng)(GPS)信息,并且可以估計用戶的絕對位置(當(dāng)前位置信息)。
[0114](識別單元)
[0115]識別單元17基于由多個麥克風(fēng)10獲取并且然后由信號處理單元13處理的音頻信號來分析用戶的語音,并且識別命令。例如,識別單元17對用戶的語音“我想與B講話”執(zhí)行形態(tài)分析(morphological analysis),并且基于用戶指定的給定目標(biāo)“B”和請求“我想與……講話”來識別呼叫發(fā)起請求命令。
[0116](標(biāo)識單元)
[0117]標(biāo)識單元18具有對由識別單元17識別的給定目標(biāo)進行標(biāo)識的功能。具體地,例如,標(biāo)識單元18可以決定訪問目的地信息,以用于獲取對應(yīng)于給定目標(biāo)的圖像和語音。例如,標(biāo)識單元18可以通過通信I/F 19將表示給定目標(biāo)的信息傳送至管理服務(wù)器3,并且從管理服務(wù)器3獲取對應(yīng)于給定目標(biāo)的訪問目的地信息(例如IP地址)。
[0118](通信I/F)
[0119]通信I/F 19是用于經(jīng)由網(wǎng)絡(luò)5向另一信號處理設(shè)備或管理服務(wù)器3傳送數(shù)據(jù),或者從另一信號處理設(shè)備或管理服務(wù)器3接收數(shù)據(jù)的通信模塊。例如,根據(jù)本實施方式的通信I/F 19向管理服務(wù)器3傳送對于與給定目標(biāo)相對應(yīng)的訪問目的地信息的查詢,并且將由麥克風(fēng)10獲取并且然后由信號處理單元13處理的音頻信號傳送至作為訪問目的地的另一信號處理設(shè)備。
[0120](揚聲器位置信息數(shù)據(jù)庫)
[0121]揚聲器位置信息數(shù)據(jù)庫21是存儲布置在所述地點處的多個揚聲器20的位置信息的存儲單元??梢灶A(yù)先登記多個揚聲器20的位置信息。
[0122](DAC/放大單元)
[0123]DAC/放大單元23具有將以下音頻信號(數(shù)字?jǐn)?shù)據(jù))轉(zhuǎn)換成聲波(模擬數(shù)據(jù))的功能(DAC):所述音頻信號(數(shù)字?jǐn)?shù)據(jù))被寫入通道的輸出緩沖器中,并將要分別通過多個揚聲器20再現(xiàn)。
[0124]另外,DAC/放大單元23放大經(jīng)轉(zhuǎn)換的聲波,并且通過多個揚聲器20來再現(xiàn)(輸出)聲波。
[0125](陣列揚聲器)
[0126]如上所述,多個揚聲器20被布置遍布于某一區(qū)域(地點)。例如,多個揚聲器20被布置在諸如道路、電線桿、路燈、房屋、樓宇外墻的室外地點,以及諸如地板、墻壁和天花板的室內(nèi)地點處。另外,所述多個揚聲器20再現(xiàn)從DAC/放大單元23輸出的聲波(語音)。
[0127]至此,已經(jīng)詳細(xì)描述了根據(jù)本實施方式的信號處理設(shè)備I的配置。接下來,將參照圖5來描述根據(jù)本實施方式的管理服務(wù)器3的配置。
[0128][2-3.管理服務(wù)器]
[0129]圖5是示出根據(jù)本實施方式的管理服務(wù)器3的配置的框圖。如圖5所示,管理服務(wù)器3包括管理單元32、搜索單元33、用戶位置信息數(shù)據(jù)庫35以及通信I/F 39。以下將描述上述部件。
[0130](管理單元)
[0131]管理單元32基于從信號處理設(shè)備I傳送的用戶標(biāo)識(ID)來管理與用戶當(dāng)前所處的位置(地點)相關(guān)聯(lián)的信息。例如,管理單元32基于用戶ID來識別用戶,并且將發(fā)送源的信號處理設(shè)備I的IP地址與所識別的用戶姓名等相關(guān)聯(lián)地存儲在用戶位置信息數(shù)據(jù)庫35中,作為訪問目的地信息。用戶ID可以包括姓名、個人標(biāo)識號或生物信息。另外,管理單元32可以基于所傳送的用戶ID來執(zhí)行用戶認(rèn)證處理。
[0132](用戶位置信息數(shù)據(jù)庫)
[0133]用戶位置信息數(shù)據(jù)庫35是根據(jù)管理單元32的管理來存儲與用戶當(dāng)前所處位置相關(guān)聯(lián)的信息的存儲單元。具體地,用戶位置信息數(shù)據(jù)庫35對用戶ID和訪問目的地信息(例如,對應(yīng)于用戶所處地點的信號處理設(shè)備的IP地址)彼此相關(guān)聯(lián)地進行存儲。另外,還可以不斷地更新每個用戶的當(dāng)前位置信息。
[0134](搜索單元)
[0135]搜索單元33根據(jù)來自信號處理設(shè)備I的訪問目的地(呼叫發(fā)起目的地)查詢,參照用戶位置信息數(shù)據(jù)庫35來搜索訪問目的地信息。具體地,搜索單元33基于例如訪問目的地查詢中所包括的目標(biāo)用戶的姓名,來從用戶位置信息數(shù)據(jù)庫35搜索相關(guān)聯(lián)的訪問目的地信息,并且提取訪問目的地信息。
[0136](通信I/F)
[0137]通信I/F 39是用于經(jīng)由網(wǎng)絡(luò)5向信號處理設(shè)備I傳送數(shù)據(jù)或者從信號處理設(shè)備I接收數(shù)據(jù)的通信模塊。例如,根據(jù)本實施方式的通信I/F 39從信號處理設(shè)備I接收用戶ID和訪問目的地查詢。另外,通信I/F 39響應(yīng)于訪問目的地查詢來傳送目標(biāo)用戶的訪問目的地信息。
[0138]至此,已經(jīng)詳細(xì)描述了根據(jù)本公開內(nèi)容的實施方式的聲學(xué)系統(tǒng)的部件。接下來,參照圖6至圖9,將詳細(xì)描述根據(jù)本實施方式的聲學(xué)系統(tǒng)的操作處理。
[0139]<3.操作流程〉
[0140][3-1.基本處理]
[0141]圖6是示出根據(jù)本實施方式的聲學(xué)系統(tǒng)的基本處理的流程圖。如圖6所示,首先,在步驟S103中,信號處理設(shè)備IA將位于地點A的用戶A的ID傳送至管理服務(wù)器3。信號處理設(shè)備IA可以從用戶A所擁有的諸如射頻識別(RFID)標(biāo)簽的標(biāo)簽或者從用戶A的語音來獲取用戶A的ID。另外,信號處理設(shè)備IA可以從用戶A(臉、眼睛、手等)讀取生物信息,并且獲取生物信息作為ID。
[0142]同時,在步驟S106中,信號處理設(shè)備IB類似地將位于地點B的用戶B的ID傳送至管理服務(wù)器3。
[0143]接下來,在步驟S109中,管理服務(wù)器3基于從每個信號處理設(shè)備I傳送的用戶ID來識別用戶,并且將例如發(fā)送源的信號處理設(shè)備I的IP地址與例如所識別的用戶姓名相關(guān)聯(lián)地登記為訪問目的地信息。
[0144]接下來,在步驟S112中,信號處理設(shè)備IB估計位于地點B的用戶B的位置。具體地,信號處理設(shè)備IB估計用戶B相對于布置在地點B處的多個麥克風(fēng)的位置。
[0145]接下來,在步驟S115中,信號處理設(shè)備IB基于用戶B的所估計的相對位置,對由布置在地點B的多個麥克風(fēng)獲取的音頻信號執(zhí)行麥克風(fēng)陣列處理,使得聲音獲取位置集中于用戶B的嘴。如上所述,信號處理設(shè)備IB為用戶B說出什么而做準(zhǔn)備。
[0146]另一方面,在步驟S118中,信號處理設(shè)備IA類似地對布置在地點A處的多個麥克風(fēng)所獲取的音頻信號執(zhí)行麥克風(fēng)陣列處理,使得聲音獲取位置集中于用戶A的嘴,并且信號處理設(shè)備IA為用戶A說出什么而做準(zhǔn)備。然后,信號處理設(shè)備IA基于用戶A的語音(發(fā)聲)來識別命令。這里,將繼續(xù)以用戶A說出“我想與B講話”為例進行描述,并且信號處理設(shè)備IA將該發(fā)聲識別為“向用戶B的呼叫發(fā)起請求”的命令。將在隨后將描述的[3-2.命令識別處理]中詳細(xì)描述根據(jù)本實施方式的命令識別處理。
[0147]接下來,在步驟S121中,信號處理設(shè)備IA將訪問目的地查詢發(fā)送至管理服務(wù)器3。當(dāng)命令是如上所述的“向用戶B的呼叫發(fā)起請求”時,信號處理設(shè)備IA查詢用戶B的訪問目的地信息。
[0148]接下來,在步驟S125中,管理服務(wù)器3響應(yīng)于來自信號處理設(shè)備IA的訪問目的地查詢來搜索用戶B的訪問目的地信息,并且然后,在之后的步驟S126,將搜索結(jié)果傳送至信號處理設(shè)備1A。
[0149]接下來,在步驟S127中,信號處理設(shè)備IA基于從管理服務(wù)器3接收到的用戶B的訪問目的地信息來標(biāo)識(確定)訪問目的地。
[0150]接下來,在步驟S128中,信號處理設(shè)備IA基于所標(biāo)識的用戶B的訪問目的地信息,例如對應(yīng)于用戶B當(dāng)前所處地點B的信號處理設(shè)備IB的IP地址,來執(zhí)行發(fā)起向信號處理設(shè)備IB的呼叫的處理。
[0151]接下來,在步驟S131中,信號處理設(shè)備IB輸出詢問用戶B是否應(yīng)答來自用戶A的呼叫的消息(呼叫通知)。具體地,例如,信號處理設(shè)備IB可以通過布置在用戶B周圍的揚聲器來再現(xiàn)相應(yīng)的消息。另外,信號處理設(shè)備IB基于布置在用戶B周圍的多個麥克風(fēng)所獲取的用戶B的語音來識別用戶B對呼叫通知的響應(yīng)。
[0152]接下來,在步驟S134中,信號處理設(shè)備IB將用戶B的響應(yīng)傳送至信號處理設(shè)備IAo這里,用戶B給出同意響應(yīng),并且因此,在用戶A(信號處理設(shè)備IA側(cè))與用戶B(信號處理設(shè)備IB側(cè))之間開始雙向通信。
[0153]具體地,在步驟S137中,為了開始與信號處理設(shè)備IB通信,信號處理設(shè)備IA執(zhí)行在地點A處獲取用戶A的語音的聲音獲取處理,并且將音頻流(音頻信號)傳送至地點B(信號處理設(shè)備IB側(cè))。將在隨后描述的[3-3.聲音獲取處理]中詳細(xì)描述根據(jù)本實施方式的聲音獲取處理。
[0154]然后,在步驟S140中,信號處理設(shè)備IB通過布置在用戶B周圍的多個揚聲器形成包圍用戶B的聲學(xué)封閉面,并且基于從信號處理設(shè)備IA傳送的音頻流來執(zhí)行聲場再現(xiàn)處理。注意,根據(jù)本實施方式的聲場再現(xiàn)處理能夠進一步構(gòu)建第三空間(地點C)的聲場,并且能夠向在電話中與位于另一空間的另一用戶講話的用戶提供被吸入到第三空間中的感覺。將在隨后描述的“4.第三空間的聲場的構(gòu)建”中詳細(xì)描述聲場再現(xiàn)處理。
[0155]在如上所述的步驟S137至S140中,已經(jīng)描述了單向通信作為示例,但是在本實施方式中,可以執(zhí)行雙向通信。因此,與如上所述的步驟S137至S140不同,信號處理設(shè)備IB可以執(zhí)行聲音獲取處理,并且信號處理設(shè)備IA可以執(zhí)行聲場再現(xiàn)處理。
[0156]至此,已經(jīng)描述了根據(jù)本實施方式的聲學(xué)系統(tǒng)的基本處理。通過以上所述的處理,通過使用布置在用戶A周圍的多個麥克風(fēng)和多個揚聲器,用戶A可以通過發(fā)出“我想與B講話”來與位于不同地方的用戶B在電話中講話,而無需攜帶移動電話終端、智能電話等。接下來,將參照圖7來詳細(xì)描述在步驟S118中所執(zhí)行的命令識別處理。
[0157][3-2.命令識別處理]
[0158]圖7是示出根據(jù)本實施方式的命令識別處理的流程圖。如圖7所示,首先,在步驟S203中,信號處理設(shè)備I的用戶位置估計單元16估計用戶的位置。例如,用戶位置估計單元16可以基于由多個麥克風(fēng)10獲取的聲音、由圖像傳感器獲得的捕捉圖像、存儲在麥克風(fēng)位置信息數(shù)據(jù)庫15中的麥克風(fēng)布置等,來估計用戶相對于每個麥克風(fēng)的位置和方向,以及用戶的嘴的位置。
[0159]接下來,在步驟S206中,信號處理單元13根據(jù)已經(jīng)估計的用戶的相對位置和方向以及用戶的嘴的位置來選擇形成包圍用戶的聲學(xué)封閉面的麥克風(fēng)組。
[0160]接下來,在步驟S209中,信號處理單元13的麥克風(fēng)陣列處理單元131對通過所選擇的麥克風(fēng)組獲取的音頻信號執(zhí)行麥克風(fēng)陣列處理,并且控制麥克風(fēng)的方向性集中于用戶的嘴。通過該處理,信號處理設(shè)備I可以為用戶說出什么而做準(zhǔn)備。
[0161]接下來,在步驟S212中,高S/N處理單元133對由麥克風(fēng)陣列處理單元131處理的音頻信號執(zhí)行諸如去混響或噪聲消減的處理,以提高S/N比。
[0162]接下來,在步驟S215中,識別單元17基于從高S/N處理單元133輸出的音頻信號來執(zhí)行語音識別(語音分析)。
[0163]然后,在步驟S218中,識別單元17基于所識別的語音(音頻信號)來執(zhí)行命令識別處理。對命令識別處理的具體內(nèi)容沒有特別的限制,但是例如,識別單元17可以通過對預(yù)先登記(獲知)的請求模式與所識別的語音進行比較來識別命令。
[0164]當(dāng)在步驟S218中沒有識別出命令(在步驟S218中為否)時,信號處理設(shè)備I重復(fù)執(zhí)行在步驟S203至S215中執(zhí)行的處理。此時,由于步驟S203和步驟S206也重復(fù)進行,所以信號處理單元13可以根據(jù)用戶的移動來更新形成包圍用戶的聲學(xué)封閉面的麥克風(fēng)組。
[0165][3-3.聲音獲取處理]
[0166]接下來,將參照圖8來詳細(xì)描述在圖6的步驟S137中執(zhí)行的聲音獲取處理。圖8是示出根據(jù)本實施方式的聲音獲取處理的流程圖。如圖8所示,首先,在步驟S308中,信號處理單元13的麥克風(fēng)陣列處理單元131對通過所選擇的/經(jīng)更新的麥克風(fēng)獲取的音頻信號執(zhí)行麥克風(fēng)陣列處理,并且控制麥克風(fēng)的方向性集中于用戶的嘴。
[0167]接下來,在步驟S312中,高S/N處理單元133對通過麥克風(fēng)陣列處理單元131處理的音頻信號執(zhí)行諸如去混響或噪聲消減的處理,以提高S/N比。
[0168]然后,在步驟S315中,通信I/F 19將從高S/N處理單元133輸出的音頻信號傳送至在步驟S126(參見圖6)中所識別的目標(biāo)用戶的訪問目的地信息所表示的訪問目的地(例如信號處理設(shè)備1B)。通過該處理,在地點A處的用戶A所發(fā)出的語音由布置在用戶A周圍的多個麥克風(fēng)獲取,并且然后被傳送至地點B。
[0169]至此,已經(jīng)詳細(xì)描述了根據(jù)本實施方式的命令識別處理和聲音獲取處理。接下來,將詳細(xì)描述根據(jù)本實施方式的聲場再現(xiàn)處理。
[0170]〈4.第三空間的聲場的構(gòu)建〉
[0171]如上所述,根據(jù)本實施方式的聲場再現(xiàn)處理(圖6中的步驟S140)能夠構(gòu)建第三空間(地點C)的聲場,并且能夠?qū)υ陔娫捴信c位于另一空間的另一用戶講話的用戶提供被吸入到第三空間中的感覺。在下文中,將參照圖9來描述用于向用戶提供被吸入到第三空間中的感覺的聲場構(gòu)建的概述。
[0172]圖9是示出根據(jù)本實施方式的第三空間的聲場的構(gòu)建的圖。如圖9所示,在位于地點A的用戶A與位于地點B的用戶B在電話中講話的情況下,根據(jù)本實施方式的聲學(xué)系統(tǒng)在地點A和B中的每個地點處構(gòu)建作為第三空間的地點C的聲場42。這里,例如,假定地點A、地點B和地點C彼此遠(yuǎn)離(遠(yuǎn)距離的地方)。在這種情況下,例如,位于東京(地點B)的用戶B可以與位于美國(地點A)的用戶A在電話中講話,同時被提供有被吸入到意大利(地點C)的空間中的感覺,意大利是用戶B將要與用戶A —起旅行的地方。
[0173]具體地,根據(jù)本實施方式的聲學(xué)系統(tǒng)可以利用在地點C處預(yù)先測量的聲學(xué)信息參數(shù)(參數(shù)的特征,例如脈沖響應(yīng))或者在地點C處獲取的聲學(xué)內(nèi)容(環(huán)境聲音)來構(gòu)建地點C的聲場42。注意,第三空間的聲學(xué)信息參數(shù)和聲學(xué)內(nèi)容可以在第三空間中預(yù)先獲取,并且可以在管理服務(wù)器中積累。
[0174](構(gòu)建地點C的聲場的技術(shù))
[0175]這里,將參照圖10來描述在位于地點A的用戶A與位于地點B的用戶B在電話中講話的情況下,在各個地點A和B處構(gòu)建地點C的聲場的技術(shù)。圖10是示出構(gòu)建地點C的聲場的技術(shù)的圖。在圖10中所示的實施方式中,將描述在與用戶A在電話中講話的用戶B所處的地點B處構(gòu)建地點C的聲場(提供被吸入到地點C處的感覺)的情況。
[0176]如圖10所示,技術(shù)I如下:對音頻圖像進行定位使得用戶A的語音出現(xiàn)在包圍用戶B的多個揚聲器20B所形成的聲學(xué)封閉面40B之外,并且進一步以能夠聽到用戶A的語音好像該語音在地點C處回響(echo)的方式,使用聲學(xué)信息參數(shù)來修改該音頻圖像。
[0177]這里,如圖10所示,在用戶A的音頻圖像位于聲學(xué)封閉面40之外的情況下,估計在位于聲學(xué)封閉面40B之外的用戶A所發(fā)出的語音穿過聲學(xué)封閉面40B時的波前。然后,以在聲學(xué)封閉面40B內(nèi)創(chuàng)建所估計的波前的方式來執(zhí)行從多個揚聲器20的再現(xiàn),從而定位音頻圖像。
[0178]另外,在估計用戶A在地點C處發(fā)出語音的情況下,可以存在如下情況:用戶A的語音可以到達聲學(xué)封閉面40B,并且包含由于地點C的建筑物或障礙物而引起的反射聲音(取決于不同材料和結(jié)構(gòu),反射的聲音不同)。因此,根據(jù)本實施方式的聲學(xué)系統(tǒng)通過使用已經(jīng)在地點C處預(yù)先測量的聲學(xué)信息參數(shù)(脈沖響應(yīng))修改用戶A的語音,來在地點B處構(gòu)建聲場42,在該聲場42中可以聽到用戶A的語音,好像該語音在地點C處回響。以此方式,可以更加豐富地向用戶B提供被吸入到地點C的感覺。
[0179]技術(shù)2如下:獲取位于聲學(xué)封閉面40內(nèi)的用戶B的語音,使用地點C的聲學(xué)信息參數(shù)來修改該語音,并且從形成聲學(xué)封閉面40的多個揚聲器20B再現(xiàn)經(jīng)處理的語音。也就是說,為了使位于聲學(xué)封閉面40內(nèi)的用戶B感覺地點C的聲場好像是用戶B正在實際感覺該聲場,為了對該用戶B更加豐富地提供被吸入到地點C的感覺,以及為了該用戶B感覺地點C的大尺寸的空間,除了修改與B在電話中講話的搭檔的語音(技術(shù)I)之外,感覺到用戶B他/她自己已經(jīng)發(fā)出的語音的改變(回聲定位)也是很重要的。因此,在技術(shù)2中,以能夠聽到用戶B已經(jīng)發(fā)出的語音好像該語音在地點C處回響的方式,在地點B處構(gòu)建聲場42。以此方式,用戶B可以更加豐富地體驗地點C的環(huán)境以及被吸入到地點C處的感覺。注意,隨后將參照圖16A和圖16B來描述用于實現(xiàn)技術(shù)2的具體方法。
[0180]技術(shù)3如下:通過再現(xiàn)在地點C處的聲學(xué)內(nèi)容(例如低語聲)以及來自形成包圍用戶B的聲學(xué)封閉面40的多個揚聲器20B的環(huán)境聲音,來增強地點C的環(huán)境和被吸入到地點C處的感覺。可以預(yù)先記錄或者可以實時獲取地點C的聲學(xué)內(nèi)容。
[0181]至此,已經(jīng)參照圖10描述了三種構(gòu)建用于提供被吸入到地點C處的的感覺的聲場的技術(shù)。在根據(jù)本實施方式的聲學(xué)系統(tǒng)中,可以使用所述三種技術(shù)中的一種技術(shù)來構(gòu)建聲場,或者可以結(jié)合使用兩種或更多種技術(shù)來構(gòu)建聲場。
[0182](地點C的指定)
[0183]另外,在本實施方式中,第三空間(地點C)可以適當(dāng)?shù)赜捎脩糁付?,或者可以是預(yù)先設(shè)定的地方。例如,當(dāng)位于地點A的用戶A說出“我想和用戶B(第一目標(biāo))在地點C(第二目標(biāo))處講話”時,布置在用戶A周圍的多個麥克風(fēng)10A(參見圖1)獲取發(fā)聲,并且該發(fā)聲被信號處理設(shè)備IA識別為命令。
[0184]接下來,信號處理設(shè)備IA將對用于與“用戶B”在電話中講話的訪問目的地信息和用于構(gòu)建指定地方的聲場的數(shù)據(jù)的請求傳送至管理服務(wù)器。然后,管理服務(wù)器將訪問目的地信息(這里,用戶B所處的地點B的信號處理設(shè)備IB的IP地址等)和用于構(gòu)建聲場的數(shù)據(jù)(這里,地點C的聲學(xué)信息參數(shù)和聲學(xué)內(nèi)容)傳送至信號處理設(shè)備1A。
[0185]另外,在信號處理設(shè)備IA與信號處理設(shè)備IB之間的通信被啟動的情況下(在用戶B對來自用戶A的呼叫發(fā)起給出同意響應(yīng)的情況下),用于構(gòu)建聲場的數(shù)據(jù)也被傳送至信號處理設(shè)備1B。以此方式,在地點A和地點B構(gòu)建地點C的聲場,并且位于不同地點的用戶A和用戶B可以共享被吸入到同一地方的感覺。
[0186]至此,已經(jīng)描述了用于向用戶提供被吸入到第三空間中的感覺的聲場構(gòu)建的概述。接下來,將參照圖11來描述積累第三空間的聲學(xué)信息參數(shù)和聲學(xué)內(nèi)容的管理服務(wù)器的配置。
[0187][4-1.管理服務(wù)器的配置]
[0188]圖11是示出根據(jù)本實施方式的管理服務(wù)器的另一配置的框圖。如圖11所示,管理服務(wù)器3’包括管理單元32、搜索單元34、用戶位置信息數(shù)據(jù)庫35、通信I/F 39、聲學(xué)信息參數(shù)數(shù)據(jù)庫36以及聲學(xué)內(nèi)容數(shù)據(jù)庫37。由于管理單元32、用戶位置信息數(shù)據(jù)庫35和通信I/F 39與參照圖5所描述的情況相同,所以將省略其描述。
[0189](搜索單元)
[0190]首先,搜索單元34以與上述的搜索單元33相同的方式,根據(jù)從信號處理設(shè)備I查詢的訪問目的地(呼叫發(fā)起目的地),參照用戶位置信息數(shù)據(jù)庫35搜索訪問目的地信息。具體地,搜索單元33基于例如訪問目的地查詢中所包括的目標(biāo)用戶的姓名來搜索相關(guān)聯(lián)的訪問目的地信息,并且從用戶位置信息數(shù)據(jù)庫35中提取訪問目的地信息。
[0191]另外,響應(yīng)于來自信號處理設(shè)備I的對用于構(gòu)建聲場的數(shù)據(jù)的請求,搜索單元34搜索指定地點的聲學(xué)信息參數(shù),并且從聲學(xué)信息參數(shù)數(shù)據(jù)庫36中提取聲學(xué)信息參數(shù)。另夕卜,響應(yīng)于來自信號處理設(shè)備I的對用于構(gòu)建聲場的數(shù)據(jù)的請求,搜索單元34搜索指定地點的聲學(xué)內(nèi)容,并且從聲學(xué)內(nèi)容數(shù)據(jù)庫37中提取聲學(xué)內(nèi)容。
[0192](聲學(xué)信息參數(shù))
[0193]聲學(xué)信息參數(shù)數(shù)據(jù)庫36是存儲已經(jīng)在各個地點處預(yù)先測量的聲學(xué)信息參數(shù)的存儲單元。可以通過在每個地點處從任意一個點或多個點((試圖要定位音頻圖像的一個或更多個位置)測量脈沖響應(yīng)來獲得聲學(xué)參數(shù)。另外,在測量脈沖響應(yīng)時通過使用時間延展脈沖(TSP)響應(yīng)、正弦掃頻方法、M序列響應(yīng)等來提高S/N比。
[0194]這里,將參照圖12來描述聲學(xué)信息參數(shù)的測量。圖12中所示的測量I描述了當(dāng)在參照圖10所描述的技術(shù)I中對位于聲學(xué)封閉面40之外的任何位置處的講話搭檔的語音進行修改時所使用的聲學(xué)信息參數(shù)(第一聲學(xué)參數(shù)信息)的測量。如圖12所示,布置在地點C處的均具有朝向外的方向性的多個麥克風(fēng)1C測量如何進行從聲源(揚聲器20C)至每個麥克風(fēng)1C的傳送(脈沖響應(yīng)),其中揚聲器20C被安裝在由多個麥克風(fēng)1C形成的封閉面43之外的任意位置處。
[0195]在圖12中所示的示例中,雖然在測量I中設(shè)置有揚聲器20C,但是示例不限于此,而是可以將多個揚聲器20C布置在封閉面43之外,并且可以測量從每個揚聲器20至每個麥克風(fēng)1C的傳送。以此方式,在技術(shù)I中能夠增加用戶A的聲源可被定位的位置的數(shù)目。
[0196]另外,圖12中所示的測量2描述了在參照圖10所描述的技術(shù)2中當(dāng)對位于聲學(xué)封閉面40內(nèi)的用戶他/她自己的語音進行修改時所使用的聲學(xué)信息參數(shù)(第二聲學(xué)參數(shù)信息)的測量。如圖12所示,布置在地點C處的均具有朝向外的方向性的多個麥克風(fēng)1C測量在地點C處的反射/回波的影響下從聲源(揚聲器20C)輸出的聲音(用于測量的信號)如何傳送至各個麥克風(fēng)10C,其中揚聲器20C被安裝在由多個麥克風(fēng)1C形成的封閉面43內(nèi)。在圖12所示的示例中,雖然在測量2中設(shè)置有揚聲器20C作為示例,但是本實施方式不限于此,而是可以將多個揚聲器20C布置在封閉面43之內(nèi),并且可以測量從每個揚聲器20至每個麥克風(fēng)1C的傳送。
[0197](聲學(xué)內(nèi)容)
[0198]聲學(xué)內(nèi)容數(shù)據(jù)庫37是存儲從各個地點獲取的聲學(xué)內(nèi)容的存儲單元。聲學(xué)內(nèi)容的示例包括已經(jīng)在每個地點處記錄(測量)的周圍環(huán)境的聲音(環(huán)境聲音、低語聲等)。
[0199]如圖12中所示的測量3執(zhí)行聲學(xué)內(nèi)容的測量,例如,布置在地點C處的均具有朝向外的方向性的多個麥克風(fēng)1C測量(記錄)周圍環(huán)境的聲音??梢悦總€小時、平日以及假日執(zhí)行對周圍聲音的測量。以此方式,根據(jù)本實施方式的聲學(xué)系統(tǒng)可以每個小時、平日以及假日構(gòu)建地點C的聲場。例如,可以在作為再現(xiàn)環(huán)境的地點B處來再現(xiàn)接近當(dāng)前時刻的聲音內(nèi)容。
[0200]注意,由圖12所示的多個麥克風(fēng)1C形成的封閉面43的尺寸可以大于收聽環(huán)境(再現(xiàn)環(huán)境)的聲學(xué)封閉面。在下文中,將參照圖13來給出描述。圖13是示出將多個麥克風(fēng)1C在測量環(huán)境(這里為地點C)中的布置與多個揚聲器20B在收聽環(huán)境(這里為地點B)中的布置彼此比較的圖。
[0201]如圖13所示,相對于由被設(shè)置為包圍用戶B的多個揚聲器20B所形成的聲學(xué)封閉面40,用于在地點C處測量的多個麥克風(fēng)1C被布置為形成封閉面43,封閉面43的尺寸大于聲學(xué)封閉面40的尺寸。
[0202]另外,如以上參照圖4所示的,在收聽環(huán)境(再現(xiàn)環(huán)境)的地點B處,三維聲學(xué)封閉面40-1、40-2和40-3各自由多個揚聲器20B-1至20B-12形成。因此,如圖14所示,在作為測量環(huán)境的地點C處,均具有朝向外的方向性的多個麥克風(fēng)10C-1至10C-12也可以形成三維封閉面43-1、43-2和40-3。
[0203]至此,已經(jīng)詳細(xì)描述了根據(jù)本實施方式的管理服務(wù)器3’的配置的各個部件。接下來,將描述在收聽環(huán)境(再現(xiàn)環(huán)境)的地點B側(cè)執(zhí)行的控制,該收聽環(huán)境使用技術(shù)I至3來構(gòu)建地點C的聲場(參見圖12)。在地點B側(cè),最佳聲場是由信號處理設(shè)備IB的聲場再現(xiàn)信號處理單元135(參見圖3)形成的。在下文中,將參照圖15來具體描述通過實現(xiàn)技術(shù)I至3來構(gòu)建聲場的聲場再現(xiàn)信號處理單元135的配置。
[0204][4-2.聲場再現(xiàn)信號處理單元的配置]
[0205]圖15是示出聲場再現(xiàn)信號處理單元135的配置的框圖,該聲場再現(xiàn)信號處理單元135執(zhí)行用于提供被吸入到地點C處的感覺的聲場構(gòu)建。另外,圖15示出了在這里涉及描述的信號處理設(shè)備IB的主要部件,并且省略其他部件。
[0206]如圖15所示,聲場再現(xiàn)信號處理單元135用作為卷積單元136、嘯叫消減單元(howling reduct1n unit) 137 和 139 以及矩陣卷積單元 138。
[0207](卷積單元)
[0208]卷積單元136具有實現(xiàn)以上所述的技術(shù)I (用戶A的音頻圖像的定位、用戶A的回聲語音的修改)的功能。具體地,通過通信I/F 19,使用地點C的聲學(xué)信息參數(shù)c (第一聲學(xué)信息參數(shù)),卷積單元136針對每個輸出揚聲器對從地點A的信號處理設(shè)備IA獲取(接收)的音頻信號b (用戶A的語音)執(zhí)行渲染(render)。另外,在這種情況下,考慮到用戶A的音頻圖像所定位的位置的參數(shù),卷積單元136可以使用對應(yīng)于定位位置的地點C的聲學(xué)信息參數(shù)c (脈沖響應(yīng))。注意,用戶A的音頻圖像所定位的位置的參數(shù)可以通過通信I/F19從信號處理設(shè)備IA或管理服務(wù)器3’傳送,或者可以基于用戶B所給出的指令通過信號處理設(shè)備IB來計算。另外,卷積單元136可以通過通信I/F 19從管理服務(wù)器3’獲取地點C的聲學(xué)信息參數(shù)c (脈沖響應(yīng))。
[0209]然后,如圖15所示,卷積單元136將經(jīng)過信號處理的音頻信號寫入輸出揚聲器(形成包圍用戶B的聲學(xué)封閉面40B的多個揚聲器20B)中的每個輸出揚聲器的輸出緩沖器。
[0210](嘯叫消減單元)
[0211]根據(jù)需要提供有嘯叫消減單元137和139,以避免分別在如圖15所示的麥克風(fēng)的放大/ADC單元11的后部和揚聲器的DAC/放大單元23的前部處由反饋引起的嘯叫,并且嘯叫消減單元137和139能夠配合操作。如上所述,在技術(shù)2中,使用聲學(xué)信息參數(shù)(脈沖響應(yīng))來對從布置在用戶B周圍的多個麥克風(fēng)1B獲取的聲音執(zhí)行渲染,并且從布置在用戶B周圍的多個揚聲器20B再現(xiàn)所述聲音。在這種情況下,由于每個麥克風(fēng)的位置接近揚聲器的位置,所以存在可能由于麥克風(fēng)和揚聲器的操作而發(fā)生過度振蕩的風(fēng)險。因此,在圖15中所示的示例中,提供有嘯叫消減單元137和139,并且執(zhí)行嘯叫消減處理。注意,為了防止過度振蕩,除了嘯叫消減單元137和139之外,聲場再現(xiàn)信號處理單元135還可以包括回波消除器。
[0212](矩陣卷積單元)
[0213]矩陣卷積單元138具有實現(xiàn)以上所述的技術(shù)2 (用戶B的回聲語音的修改)的功能。具體地,使用地點C的聲學(xué)信息參數(shù)c (第二聲學(xué)信息參數(shù);脈沖響應(yīng)組),矩陣卷積單元138針對每個輸出揚聲器對由在地點B處設(shè)置的多個麥克風(fēng)1B獲取的音頻信號(在聲學(xué)封閉面40B中生成的聲音)執(zhí)行渲染。以此方式,輸出用于在地點B處構(gòu)建以下聲場的音頻信號:在該聲場中,在地點B處在聲學(xué)封閉面40B中生成的聲音,例如用戶B他/她自己的語音,被感覺在地點C處回響。
[0214]這里,將參照圖16A和圖16B來具體描述實現(xiàn)根據(jù)本實施方式的技術(shù)2的方法。圖16A是示出在地點C處的脈沖響應(yīng)的測量的圖。如圖16A所示,首先,測量從每個揚聲器20C到每個麥克風(fēng)1C的脈沖響應(yīng),其中揚聲器20C被布置在地點C處并且面向封閉面43的外部,麥克風(fēng)1C也被布置在地點C處并且面向封閉面43的外部。
[0215]具體地,測量從封閉面43上的單個揚聲器到一個組的脈沖響應(yīng),該組包括同一封閉面43上的多個麥克風(fēng)。從頻率軸的角度來看,脈沖響應(yīng)也可以被看作是受地點C的建筑物/障礙物的空間聲學(xué)影響的傳遞函數(shù)。
[0216]這里,在圖16A所示的示例中,封閉面43上的各個麥克風(fēng)/揚聲器的位置用R1、
R2.....RN來表示。然后,如圖16A所示,測量從設(shè)置在Rl處的揚聲器(SP)到設(shè)置在Rl
處的麥克風(fēng)、到設(shè)置在R2處的麥克風(fēng).....以及到設(shè)置在RN處的麥克風(fēng)的各個傳遞函數(shù)。
隨后,測量從設(shè)置在R2處的揚聲器到設(shè)置在Rl處的麥克風(fēng)、到設(shè)置在R2處的麥克風(fēng).....以及到設(shè)置在RN處的麥克風(fēng)的各個傳遞函數(shù)。
[0217]接下來,當(dāng)從位于Rl處的揚聲器到位于Rl處的麥克風(fēng)的傳遞函數(shù)用R 11來表示,以及從位于Rl處的揚聲器到位于R2處的麥克風(fēng)的傳遞函數(shù)用R 12來表示時,使用傳遞函數(shù)R的矩陣可以表示成在圖16A中所示的表達式(I)。
[0218]在管理服務(wù)器3’等中積累矩陣數(shù)據(jù)作為聲學(xué)信息參數(shù),并且矩陣數(shù)據(jù)用于在地點B處構(gòu)建地點C的聲場。接下來,將參照圖16B來描述使用矩陣數(shù)據(jù)來在地點B處構(gòu)建地點C的聲場的情況。
[0219]圖16B是示出使用由矩陣卷積單元138執(zhí)行的脈沖響應(yīng)組的算術(shù)運算的圖。在圖16B所示的示例中,假定在地點B (再現(xiàn)環(huán)境)側(cè)的封閉面,所述封閉面在地點C處進行測量時具有基本上相同的尺寸和形狀。另外,假定以下情況:布置在地點B處的多個麥克風(fēng)1B的數(shù)量和多個揚聲器20B的數(shù)量也與在地點C處進行測量時相同,并且其布置位置與在地點C處進行測量時相同,為R1、R2、…、RN。然而,如圖16B所示,多個麥克風(fēng)1B和多個揚聲器20B面向聲學(xué)封閉面40B的內(nèi)部。
[0220]另外,如圖16B所示,由在地點B處的Rl、R2、...、RN位置處的各個麥克風(fēng)獲取的基于頻率軸的表達式由V1、V2.....VN來表示。另外,由在地點B處的R1、R2.....RN位置處的各個揚聲器輸出(再現(xiàn))的輸出信號(音頻信號)由Wl、W2、...、WN來表不。
[0221]在這種情況下,在地點B的聲學(xué)封閉面40B內(nèi)生成的聲音(用戶A的語音或噪聲)的波前到達聲學(xué)封閉面40B,并且由位于Rl、R2、...、RN處的面向內(nèi)部的麥克風(fēng)1B來獲取,并且各個麥克風(fēng)1B獲取聲音獲取信號V1、V2.....VN。
[0222]然后,矩陣卷積單元138使用VI,V2,...,VN的信號組(麥克風(fēng)輸入)和參照圖16A所描述的傳遞函數(shù)組的矩陣(表達式(I))來執(zhí)行圖16B中所示的表達式(2),并且計算從各個揚聲器20B輸出的W1、W2.....WN。
[0223]如上所述,矩陣卷積單元138使用地點C的聲學(xué)信息參數(shù)(傳遞函數(shù)組)來對多個麥克風(fēng)1B所獲取的音頻信號(V1、V2.....VN)執(zhí)行信號處理。另外,如圖15所示,矩陣卷積單元138將經(jīng)過信號處理的音頻信號(W1、W2.....WN)添加至各個輸出揚聲器的輸出緩沖器。
[0224](聲學(xué)內(nèi)容的添加)
[0225]如圖15所示,聲場再現(xiàn)信號處理單元135將通過通信I/F 19從管理服務(wù)器3’接收的地點C的聲學(xué)內(nèi)容d添加至各個輸出揚聲器的輸出緩沖器中的每個輸出緩沖器,并且因此實現(xiàn)了如上所述的技術(shù)3。
[0226]至此,已經(jīng)詳細(xì)描述了根據(jù)本實施方式的信號處理設(shè)備IB的聲場再現(xiàn)信號處理單元135的配置。接下來,將參照圖17來具體描述當(dāng)在地點B處構(gòu)建地點C的聲場時的聲場再現(xiàn)處理。
[0227][4-3.聲場再現(xiàn)處理]
[0228]圖17是示出根據(jù)本實施方式的聲場再現(xiàn)處理的流程圖。如圖17所示,首先,在步驟S403中,信號處理設(shè)備IB的用戶位置估計單元16(參見圖3)估計用戶B的位置。例如,用戶位置估計單元16可以基于從多個麥克風(fēng)1B獲取的聲音、由圖像傳感器獲得的捕捉圖像、以及存儲在揚聲器位置信息數(shù)據(jù)庫21中的揚聲器的布置來估計用戶B相對于每個揚聲器20B的相對位置、方向、嘴的位置以及耳朵的位置。
[0229]接下來,在步驟S406中,信號處理單元13基于所估計的用戶B的相對位置、方向、嘴的位置以及耳朵的位置來選擇形成包圍用戶的聲學(xué)封閉面的麥克風(fēng)/揚聲器組。
[0230]接下來,在步驟S407中,信號處理單元13的聲場再現(xiàn)信號處理單元135通過卷積單元136來對接收到的音頻信號b (在地點A處獲取的用戶A的語音)執(zhí)行圖10中所示的技術(shù)I的處理。具體地,如圖15所示,使用地點C的聲學(xué)信息參數(shù)C (第一聲學(xué)參數(shù)信息),卷積單元136針對每個所選擇的輸出揚聲器對從地點A的信號處理設(shè)備IA接收的音頻信號b執(zhí)行渲染。然后,卷積單元136將經(jīng)過技術(shù)I的處理的音頻信號寫入每個所選擇的輸出揚聲器的輸出緩沖器中。
[0231]接下來,在步驟S409中,聲場再現(xiàn)信號處理單元135通過矩陣卷積單元138對在地點B處使用所選擇的麥克風(fēng)組獲取的用戶B的語音執(zhí)行在圖10中所示的技術(shù)2的處理。具體地,使用地點C的聲學(xué)信息參數(shù)C (第二聲學(xué)信息參數(shù)),矩陣卷積單元138針對每個輸出揚聲器對形成包圍用戶B的聲學(xué)封閉面的麥克風(fēng)組(多個麥克風(fēng)10B)所獲取的音頻信號執(zhí)行渲染。然后,矩陣卷積單元138將經(jīng)過技術(shù)2的處理的音頻信號添加至每個所選擇的輸出揚聲器的輸出緩沖器。
[0232]接下來,在步驟S411中,如在圖10中所示的技術(shù)3的處理,聲場再現(xiàn)信號處理單元135將地點C的聲學(xué)內(nèi)容d添加至每個所選擇的輸出揚聲器的輸出緩沖器。
[0233]然后,在步驟S415中,信號處理設(shè)備IB通過DAC/放大單元23輸出來自上述步驟S406中所選擇的揚聲器組的每個輸出緩沖器的內(nèi)容。
[0234]如上所述,在根據(jù)本實施方式聲學(xué)系統(tǒng)中,使用在地點C處測量的第一聲學(xué)信息參數(shù)對在地點A處獲取的用戶A的語音進行渲染,并且利用地點C處的回聲從地點B的多個揚聲器20B再現(xiàn)用戶A的語音。另外,使用在地點C處所測量的第二聲學(xué)信息參數(shù)來對在地點B處所獲取的用戶B他/她自己的語音進行渲染,并且利用地點C處的回聲從地點B的多個揚聲器20B再現(xiàn)用戶B他/她自己的語音。此外,從地點B處的多個揚聲器20B再現(xiàn)在地點C處獲取的聲學(xué)內(nèi)容。
[0235]以此方式,當(dāng)一個地點(在這種情況下為地點B)與另一地點(在這種情況下為地點A)配合協(xié)作(在電話中講話)時,根據(jù)本實施方式的聲學(xué)系統(tǒng)可以提供被吸入到第三空間(在這種情況下為地點C)的感覺。用戶B能夠獲得好像用戶B與用戶A位于地點C的聲場感覺,并且能夠感覺到更加豐富的真實性。
[0236]另外,聲場再現(xiàn)信號處理單元135可以使用布置在用戶B周圍的揚聲器組來控制接收到的音頻信號(用戶A的語音)的音頻圖像。例如,如由多個揚聲器形成的陣列揚聲器(波束形成)一樣,聲場再現(xiàn)信號處理單元135可以在用戶B的耳朵處重建用戶A的聲音,并且可以在包圍用戶B的聲學(xué)封閉面之外重建用戶A的音頻圖像。
[0237]注意,步驟S403和S406的連續(xù)執(zhí)行使得信號處理單元13能夠根據(jù)用戶B的移動來更新形成包圍用戶B的聲學(xué)封閉面的揚聲器組。在下文中,將參照圖18A和圖18B來給出具體描述。
[0238]圖18A是示出在地點B處所構(gòu)建的聲場42是固定的情況的圖。如圖18A所示,假定如下情況:首先,選擇多個揚聲器20B (步驟S403和S406)以用于形成包圍用戶B的聲學(xué)封閉面40,并且構(gòu)建用于向用戶B提供被吸入到地點C處的感覺的聲場42。在這種情況下,當(dāng)用戶B在房間內(nèi)移動或者離開房間使得用戶B移動到聲學(xué)封閉面40之外時,用戶B不在聲場42中,并且因此,用戶B不能獲得被吸入到地點C處的感覺。
[0239]因此,如上所述,連續(xù)執(zhí)行步驟S403和S406,并且根據(jù)用戶B的移動來更新形成包圍用戶B的聲學(xué)封閉面的揚聲器組。圖18B是示出在地點B處所構(gòu)建的聲場42是可移動的情況的圖。
[0240]如圖18B所示,根據(jù)用戶B的移動來重新選擇(更新)形成包圍用戶B的聲學(xué)封閉面40’的揚聲器組(揚聲器20B’),并且通過更新的多個揚聲器20B來重新構(gòu)建聲場42’。
[0241]至此,已經(jīng)詳細(xì)描述了根據(jù)本實施方式的聲學(xué)系統(tǒng)的各個操作處理。接下來,將描述本實施方式的補充。
[0242]<5.補充描述〉
[0243][5-1.命令輸入的修改示例]
[0244]在上述實施方式中,命令是通過語音來輸入的,但是在根據(jù)本實施方式的聲學(xué)系統(tǒng)中輸入命令的方法不限于音頻輸入,而可以是另外的輸入方法。例如,根據(jù)本實施方式的信號處理設(shè)備I可以檢測布置在用戶周圍的每個開關(guān)(其是操作輸入部分的示例)上的用戶操作,并且可以識別諸如呼叫發(fā)起請求等的命令。另外,在這種情況下,信號處理設(shè)備I能夠使用設(shè)置在用戶附近的觸摸板等(操作輸入部分的示例)來接受呼叫發(fā)起目的地的指定(目標(biāo)用戶的姓名等),以及用戶將被吸入到的地方(地方的名稱)的指定。
[0245]另外,信號處理設(shè)備I的識別單元17可以基于由設(shè)置在用戶附近的成像單元獲得的圖像或者由紅外熱傳感器獲取的檢測結(jié)果來分析用戶的手勢,并且可以將該手勢識別為命令。例如,在用戶執(zhí)行打電話的手勢的情況下,識別單元17將該手勢識別為呼叫發(fā)起請求命令。另外,在這種情況下,信號處理設(shè)備I可以從設(shè)置在用戶附近的觸摸板等接受呼叫發(fā)起目的地的指定(目標(biāo)用戶的姓名等),以及用戶將被吸入到的地方(地方的名稱)的指定,或者可以基于語音分析來確定所述指定。
[0246]另外,在用戶與位于另一地點的另一用戶在電話中講話時感覺到難以聽到聲音的情況下(在從設(shè)置在用戶周圍的多個麥克風(fēng)10再現(xiàn)其他用戶的語音的情況下),用戶可以通過手勢發(fā)送對再現(xiàn)聲音的控制的請求。具體地,例如,識別單元17可以將使用戶張開的手靠近耳朵的手勢或者使雙手靠近頭頂以模仿兔子耳朵的手勢識別為增加音量的命令。
[0247]如上所述,在根據(jù)本實施方式的聲學(xué)系統(tǒng)中輸入命令的方法不限于音頻輸入,而可以是使用開關(guān)操作或手勢輸入的方法。
[0248][5-2.另一命令的示例]
[0249]在上述實施方式中,已經(jīng)描述了在將人指定為給定目標(biāo)并且將呼叫發(fā)起請求(呼叫請求)識別為命令的情況,但是根據(jù)本實施方式的聲學(xué)系統(tǒng)的命令并不限于呼叫發(fā)起請求(呼叫請求),而可以是另外的命令。例如,信號處理設(shè)備I的識別單元17可以識別以下命令:在用戶所處的空間中重建已被指定為給定目標(biāo)的地方、樓宇、節(jié)目、音樂片段等。
[0250]另外,根據(jù)本實施方式的聲學(xué)系統(tǒng)可以在用戶所處的空間中實時重建另一空間,或者重建所指定地方、樓宇等的過去空間(例如,在過去在著名劇場中進行的精彩的音樂會)。
[0251][5-3.大空間到小空間的轉(zhuǎn)換]
[0252]這里,以上描述的實施方式假定地點B(再現(xiàn)環(huán)境)側(cè)的封閉面和地點C(測量環(huán)境)側(cè)的封閉面具有彼此基本相同的尺寸和形狀的情況,但是本實施方式不限于此。例如,即使在再現(xiàn)環(huán)境側(cè)的封閉面的尺寸小于測量環(huán)境側(cè)的封閉面的尺寸的情況下,本實施方式也能夠在再現(xiàn)環(huán)境中重建測量環(huán)境的聲場(空間的延展)。
[0253]在執(zhí)行如上參照圖10所述的技術(shù)I和3之前,可以在信號處理設(shè)備I中對接收到的音頻信號(用戶A的音頻信號或聲音內(nèi)容)執(zhí)行從大空間到小空間的這樣的轉(zhuǎn)換處理。另外,通過實時執(zhí)行這樣的轉(zhuǎn)換處理,根據(jù)本實施方式的聲學(xué)系統(tǒng)可以解決在測量環(huán)境側(cè)與再現(xiàn)環(huán)境側(cè)之間的揚聲器的位置與麥克風(fēng)的位置的對應(yīng)關(guān)系的不一致的問題。
[0254]具體地,例如,聲場再現(xiàn)信號處理單元135可以利用JP 4775487B中公開的傳遞函數(shù)來使用信號處理。在JP 4775487B中,在測量環(huán)境的聲場中確定傳遞函數(shù)(脈沖響應(yīng)的測量數(shù)據(jù)),在重建環(huán)境中再現(xiàn)經(jīng)過基于傳遞函數(shù)的算術(shù)處理的音頻信號,并且在重建環(huán)境中重建測量環(huán)境的聲場(音頻圖像的混響、定位等)。在下文中,將參照圖19A至圖19C來描述使用傳遞函數(shù)(脈沖響應(yīng)的測量數(shù)據(jù))的信號處理。
[0255]圖19A是示出在測量目標(biāo)空間中的測量的圖。首先,如圖19A所示,在測量目標(biāo)空間(大空間)中,布置了形成大封閉面P的M個麥克風(fēng),并且執(zhí)行對Mch(M個揚聲器輸出通道)的測量。另外,M個麥克風(fēng)的位置分別用P1、P2.....PM來表示。然后,從布置在封閉面P的外部的各個揚聲器(SP)輸出測量信號,并且測量從各個揚聲器到布置在P1、P2.....PM處的各個麥克風(fēng)的脈沖響應(yīng)。在圖19A中用表達式(3)示出了這樣測得的脈沖響應(yīng)(傳遞函數(shù))。
[0256]接下來,參照圖19B,將描述在消聲室中的測量。如圖19B所示,在消聲室中,布置了形成大封閉面P的M個揚聲器,在封閉面P內(nèi)布置了形成小封閉面Q的N個麥克風(fēng),并且執(zhí)行對Nch(N個揚聲器輸出通道)的測量。這里,M個揚聲器的位置分別用與圖19A相同的位置P1、P2、...、PM來表示。另外,N個麥克風(fēng)的位置分別用Q1、Q2、...、QN來表示。
[0257]然后,由設(shè)置在圖19A的Pl處的麥克風(fēng)獲取的聲音(測量信號)被從設(shè)置在Pl
處的揚聲器輸出,并且測量在Q1、Q2.....QN處設(shè)置的各個麥克風(fēng)的脈沖響應(yīng)。接下來,由設(shè)置在圖19A的P2處的麥克風(fēng)獲取的聲音(測量信號)被從設(shè)置在P2處的揚聲器輸出,
并且測量在Ql、Q2.....QN處設(shè)置的每個麥克風(fēng)的脈沖響應(yīng)。以此方式,測量了從M個揚聲器到設(shè)置在Ql、Q 2、...、QN處的麥克風(fēng)的所有脈沖響應(yīng)。
[0258]將這樣測得的M個垂直矢量放入MXN矩陣運算中,并且因此被轉(zhuǎn)換成N個輸出。也就是說,將這樣測量的脈沖響應(yīng)(傳遞函數(shù))放入如圖19B中的表達式(4)所示的矩陣中(生成傳遞函數(shù)組的矩陣),并且以此方式,實現(xiàn)了從大空間(對于Mch的系數(shù))到小空間(對于Nch的系數(shù))的轉(zhuǎn)換。
[0259]接下來,參照圖19C,將描述再現(xiàn)目標(biāo)空間(小空間)的重建。如圖19C所示,形成包圍用戶B的小封閉面Q的N個揚聲器被布置在再現(xiàn)目標(biāo)空間中。這里,N個揚聲器的位置分別由Q1、Q2、...、QN來表示,這與圖19B的位置相同。
[0260]在這種情況下,當(dāng)設(shè)置在Ql、Q2.....QN處的各個揚聲器輸出所接收的音頻信號
(例如,用戶A的語音:音頻信號S)時,每個揚聲器的輸出由圖19C中所示的表達式(5)來確定。表達式(5)是使用表達式(3)和表達式(4)中所示的脈沖響應(yīng)(傳遞函數(shù))的算術(shù)運算。
[0261]以此方式,例如在用戶A的音頻圖像定位于封閉面Q之外的情況下,估計當(dāng)位于封閉面Q之外的用戶A所發(fā)出的語音穿過如圖19C所示的封閉面Q時的波前,并且在封閉面Q內(nèi)創(chuàng)建所估計的波前。在這種情況下,通過表達式(5)來轉(zhuǎn)換測量目標(biāo)空間中的麥克風(fēng)的數(shù)量與再現(xiàn)目標(biāo)空間中的揚聲器的數(shù)量之間的不一致,并且以此方式,根據(jù)本實施方式的聲學(xué)系統(tǒng)能夠在小封閉面Q中重建大封閉面P的聲場。
[0262][5-4.視頻構(gòu)建]
[0263]另外,在以上所述的實施方式中被吸入到第三空間中的感覺的提供是通過聲場構(gòu)建(聲場再現(xiàn)處理)來實現(xiàn)的,但是根據(jù)本實施方式的聲學(xué)系統(tǒng)不限于此,而是還可以使用視頻構(gòu)建。
[0264]例如,當(dāng)信號處理設(shè)備I從給定服務(wù)器接收到由布置在第三空間(地點C)處的多個圖像傳感器獲得的視頻,并且在地點B處再現(xiàn)由布置在地點A處的多個麥克風(fēng)獲取的語音時,信號處理設(shè)備I可以再現(xiàn)地點C的視頻,并且可以重建地點C的空間。
[0265]視頻的再現(xiàn)可以是使用全息圖再現(xiàn)的空間投影,并且可以是使用房間中的電視、顯示器或頭戴式顯示器的再現(xiàn)。以此方式,通過執(zhí)行視頻構(gòu)建和聲場構(gòu)建,可以向用戶提供被吸入到第三空間中的感覺,并且用戶可以感到更加豐富的真實性。
[0266][5-5.另一系統(tǒng)配置示例]
[0267]在根據(jù)參照圖1和圖2所述的實施方式的聲學(xué)系統(tǒng)的系統(tǒng)配置中,呼叫發(fā)起側(cè)(地點A)和呼叫目的地側(cè)(地點B) 二者均具有在用戶周圍的多個麥克風(fēng)和揚聲器,并且信號處理設(shè)備IA和IB執(zhí)行信號處理。然而,根據(jù)本實施方式的聲學(xué)系統(tǒng)的系統(tǒng)配置不限于圖1和圖2所示的配置,并且例如可以是如圖20所示的配置。
[0268]圖20是示出根據(jù)本實施方式的聲學(xué)系統(tǒng)的另一系統(tǒng)配置的圖。如圖13所示,在根據(jù)本實施方式的聲學(xué)系統(tǒng)中,信號處理設(shè)備1、通信終端7和管理服務(wù)器3通過網(wǎng)絡(luò)5彼此連接。
[0269]通信終端7包括:包括正常單個麥克風(fēng)和正常單個揚聲器的移動電話終端或智能電話,這是與根據(jù)本實施方式的布置有多個麥克風(fēng)和多個揚聲器的高級接口空間相對比的遺留接口 (legacy interface)。
[0270]根據(jù)本實施方式的信號處理設(shè)備I連接至正常通信終端7,并且可以從布置在用戶周圍的多個揚聲器再現(xiàn)從通信終端7接收到的語音。另外,根據(jù)本實施方式的信號處理設(shè)備I可以將由布置在用戶周圍的多個麥克風(fēng)獲取的用戶的語音傳送至通信終端7。
[0271]如上所述,基于根據(jù)本實施方式的聲學(xué)系統(tǒng),位于附近布置有多個麥克風(fēng)和多個揚聲器的空間中的第一用戶可以與攜帶正常通信終端7的第二用戶在電話中講話。也就是說,根據(jù)本實施方式的聲學(xué)系統(tǒng)的配置可以是:呼叫發(fā)起側(cè)和呼叫目的地側(cè)中的一個是根據(jù)本實施方式的設(shè)置有多個麥克風(fēng)和多個揚聲器的高級接口空間。
[0272][5-6.自治聲學(xué)系統(tǒng)]
[0273]如參照圖1至圖3所描述的,在以上所述的實施方式中,信號處理設(shè)備I控制布置在用戶周圍的多個麥克風(fēng)10和多個揚聲器20的輸入和輸出,但是根據(jù)本公開內(nèi)容的聲學(xué)系統(tǒng)的配置不限于此。例如,可以在用戶周圍布置多個自治麥克風(fēng)和揚聲器裝置,所述裝置可以彼此進行通信,可以通過確定所述裝置中的每一個來形成包圍用戶的聲學(xué)封閉面,并且因此,可以實現(xiàn)如上所述的聲場的構(gòu)建。在下文中,可以參照圖21至圖24來具體描述這樣的自治聲學(xué)系統(tǒng)。注意,在這里所描述的自治聲學(xué)系統(tǒng)中,將描述在用戶周圍布置多個裝置100的情況作為示例,該多個裝置100每個均包括一個麥克風(fēng)10和一個揚聲器20。
[0274](系統(tǒng)配置)
[0275]圖21是示出根據(jù)本實施方式的自治聲學(xué)系統(tǒng)的系統(tǒng)配置的圖。如圖21所示,根據(jù)本實施方式的自治聲學(xué)系統(tǒng)包括多個裝置100(100-1至100-4)、管理服務(wù)器3、用戶ID數(shù)據(jù)庫6、服務(wù)日志數(shù)據(jù)庫8以及用戶個人數(shù)據(jù)庫9。另外,如圖21所示,管理服務(wù)器3、用戶ID數(shù)據(jù)庫6、服務(wù)日志數(shù)據(jù)庫8和用戶個人數(shù)據(jù)庫9通過網(wǎng)絡(luò)5彼此連接。
[0276]-裝置
[0277]多個裝置100(100-1至100-4)被布置在諸如房間、房屋、樓宇、室外地點、地區(qū)和國家的世界各地。在圖21所示的示例中,示出了在諸如百貨公司或車站等公共地點的墻壁和地面上布置有多個裝置100的情況。另外,所述多個裝置100(100-1至100-4)可以經(jīng)由線纜或無線電彼此進行通信,并且報告彼此的能力。另外,所述多個裝置100(100-1至100-4)中的至少一個裝置100 (例如裝置100-1)可訪問網(wǎng)絡(luò)5。另外,所述裝置100均包括麥克風(fēng)10和揚聲器20。注意,隨后將參照圖22來描述根據(jù)本實施方式的裝置的配置。
[0278]-信息的報告
[0279]如上所述,多個裝置100 (100-1至100-4)相互報告彼此的能力(特征信息)。要報告的特征信息包括裝置ID、該裝置能夠提供的服務(wù)、該裝置的所有者ID、裝置借出屬性等。這里,所有者ID代表裝置100的所有者(即已經(jīng)安裝裝置100的人)的ID,并且估計圖21中所示的裝置100(100-1至100-4)中的每個裝置由個人或公司來安裝。另外,裝置借出屬性代表以下信息:該信息表示已經(jīng)安裝該裝置的個人或/公司預(yù)先允許借出(使用)的服務(wù)的屬性。
[0280]另外,定期地或根據(jù)需要地,自治地和分布式地執(zhí)行信息的報告。另外,根據(jù)本實施方式的報告信息的方法可以使用通常被稱為構(gòu)建網(wǎng)狀網(wǎng)絡(luò)的方法(IEEE 802.1ls中的信標(biāo))的過程。
[0281]另外,裝置100還可以包括多種類型的通信I/F。在這種情況下,每個裝置100定期檢查哪些通信I/F與哪些裝置通信,并且能夠與最大數(shù)量的裝置直接進行通信的通信I/F被以高優(yōu)先級激活。
[0282]另外,每個裝置100可以使用無線I/F將從附近裝置報告的信息轉(zhuǎn)發(fā)至位于若干跳(hop)之外的裝置,或者可以通過網(wǎng)絡(luò)5將該信息傳送至另外的裝置。
[0283]-管理服務(wù)器
[0284]如參照圖2和圖5所描述的,管理服務(wù)器3管理每個用戶的絕對位置(當(dāng)前位置)。可替選地,管理服務(wù)器3還可以是管理服務(wù)器3’,所述管理服務(wù)器3’積累參照圖11所描述的第三空間的聲學(xué)信息參數(shù)等。
[0285]-服務(wù)日志數(shù)據(jù)庫
[0286]服務(wù)日志數(shù)據(jù)庫8是彼此相關(guān)聯(lián)地存儲服務(wù)的內(nèi)容、有助于提供服務(wù)的裝置100、以及提供服務(wù)的用戶的存儲單元。以此方式,可以使用服務(wù)日志數(shù)據(jù)庫8來掌握以下內(nèi)容:哪些裝置用于哪種服務(wù)提供、向哪些用戶提供什么服務(wù)等。
[0287]另外,存儲在服務(wù)日志數(shù)據(jù)庫8中的服務(wù)日志可以在以后用作為對于已經(jīng)使用服務(wù)的用戶的計費信息,或者可以用作為對于已經(jīng)安裝了有助于服務(wù)提供的裝置100的人(個人/公司)的酬金信息。這里,酬金信息是在根據(jù)對裝置100的服務(wù)提供的貢獻率(頻率)等,向裝置100的所有者(已經(jīng)安裝裝置100的人)提供一部分使用費時所使用的信息。另外,存儲在服務(wù)日志數(shù)據(jù)庫8中的服務(wù)日志可以被傳送至用戶個人數(shù)據(jù)庫9作為用戶的動作的元數(shù)據(jù)。
[0288]-用戶個人數(shù)據(jù)庫
[0289]用戶個人數(shù)據(jù)庫9存儲從服務(wù)日志數(shù)據(jù)庫8傳送的用戶動作的元數(shù)據(jù)作為用戶持有的數(shù)據(jù)。可以以各種個性化服務(wù)等來使用用戶個人數(shù)據(jù)庫9中所存儲的數(shù)據(jù)。
[0290]-用戶ID數(shù)據(jù)庫
[0291]用戶ID數(shù)據(jù)庫6是彼此相關(guān)聯(lián)地存儲已登記的用戶的ID (姓名、標(biāo)識號或生物信息)以及允許向用戶提供的服務(wù)的存儲單元。當(dāng)裝置100執(zhí)行用戶認(rèn)證時使用用戶ID數(shù)據(jù)庫6。
[0292]至此,已經(jīng)參照圖21描述了根據(jù)本實施方式的自治聲學(xué)系統(tǒng)的系統(tǒng)配置。接下來,將參照圖22來描述根據(jù)本實施方式的裝置100 (信號處理設(shè)備)的配置。
[0293](裝置的配置)
[0294]圖22是示出根據(jù)本實施方式的裝置100的配置的框圖。如圖22所示,裝置100包括麥克風(fēng)10、放大/ADC單元11、信號處理單元200、識別單元17、標(biāo)識單元18、通信I/F19、用戶認(rèn)證單元25、用戶位置估計單元16、DAC/放大單元23以及揚聲器20。由于已經(jīng)參照圖3給出了麥克風(fēng)10、放大/ADC單元11、識別單元17、標(biāo)識單元18、通信I/F 19、用戶位置估計單元16、DAC/放大單元23和揚聲器20,所以這里將省略對它們的描述。
[0295]-信號處理單元
[0296]信號處理單元200包括高S/N處理單元210和聲場再現(xiàn)信號處理單元220。以與圖3所示的高S/N處理單元133相同的方式,高S/N處理單元210具有處理從放大/ADC單元11輸出的音頻信號,以形成具有高清晰度和高S/N比的單聲道信號的功能。具體地,高S/N處理單元210執(zhí)行聲源分離,并且執(zhí)行去混響和噪聲消減。通過高S/N處理單元210處理的音頻信號被輸出至識別單元17,并且經(jīng)歷語音分析以用于命令識別,并且通過通信I/F 19傳送至外部裝置。
[0297]聲場再現(xiàn)信號處理單元220對從揚聲器20再現(xiàn)的音頻信號執(zhí)行信號處理,并且執(zhí)行使聲場定位在用戶位置附近的控制。另外,聲場再現(xiàn)信號處理單元220與另一鄰近裝置100配合協(xié)作,并且控制從揚聲器20輸出的內(nèi)容(音頻信號),以形成包圍用戶的聲學(xué)封閉面。
[0298]-用戶認(rèn)證單元
[0299]用戶認(rèn)證單元25通過基于用戶ID通過通信I/F 19在網(wǎng)絡(luò)5上向用戶ID數(shù)據(jù)庫6發(fā)送查詢來執(zhí)行用戶認(rèn)證,該用戶ID是從諸如用戶擁有的RFID的標(biāo)簽獲取的。例如,在所獲取的用戶ID對應(yīng)于用戶ID數(shù)據(jù)庫6中預(yù)先登記的ID的情況下,用戶認(rèn)證單元25將該用戶認(rèn)證為允許提供服務(wù)的用戶。
[0300]至此,已經(jīng)詳細(xì)描述了根據(jù)本實施方式的裝置100的配置。接下來,參照圖23,將描述根據(jù)本實施方式的自治聲學(xué)系統(tǒng)的操作處理。
[0301](操作處理)
[0302]圖23是示出根據(jù)本實施方式的自治聲學(xué)系統(tǒng)的操作處理的流程圖。如圖23所示,首先,在步驟S503中,裝置100執(zhí)行預(yù)先準(zhǔn)備處理。具體地,裝置100和另外的裝置100彼此報告以上所述的特征信息,并且裝置100確認(rèn)能夠與該裝置100配合協(xié)作的裝置(其是值得?目任的)。
[0303]例如,裝置100-1可以基于從鄰近裝置100-2接收到的特征信息中所包括的所有者ID、借出屬性等來確認(rèn)鄰近裝置100-2是否值得信任。例如,已經(jīng)確認(rèn)是彼此值得信任的裝置啟動它們的執(zhí)行器,并且通過鄰近裝置的傳感器來捕捉輸出結(jié)果。以此方式,裝置能夠掌握通過組合裝置的特征可以執(zhí)行哪種配合??梢远ㄆ趫?zhí)行這樣的確認(rèn)過程。另外,通過確認(rèn)過程,每個裝置100能夠松散地掌握:在布置有多個鄰近裝置100(100-1至100-4)的空間中可以提供哪種服務(wù)。
[0304]接下來,在步驟S506中,在用戶進入布置有多個裝置100(100-1至100-4)的空間的情況下,裝置100執(zhí)行用戶認(rèn)證。例如,如圖21所示,在用戶擁有標(biāo)簽60例如RFID的情況下,在附近布置的裝置100-1至100-4可以接收從標(biāo)簽60報告的特征信息,并且可以檢測用戶的進入。然后,當(dāng)檢測到用戶的進入時,每個裝置100基于包含在從標(biāo)簽60報告的特征信息中的用戶ID,通過在網(wǎng)絡(luò)5上向用戶ID數(shù)據(jù)庫6發(fā)送請求來認(rèn)證該用戶是否是可以提供服務(wù)的用戶。
[0305]注意,在用戶不具有標(biāo)簽60的情況下,裝置100-1至100-4可以使用傳感器(麥克風(fēng)、相機、人體傳感器、熱傳感器等)來檢測用戶的進入。另外,裝置100-1至100-4可以通過分析傳感器的檢測結(jié)果來提取用戶的ID (生物信息等)。
[0306]另外,在圖21所示的實施方式中,裝置100-1至100-4中的裝置100_1擁有對用戶ID數(shù)據(jù)庫6的訪問路由。在這種情況下,可以如下執(zhí)行用戶認(rèn)證:已經(jīng)獲取用戶ID的裝置100-2、100-3或100-4將用戶ID傳送至裝置100-1,并且裝置100-1向用戶ID數(shù)據(jù)庫6發(fā)送請求。以此方式,沒有必要使全部多個裝置100-1至100-4均擁有對用戶ID數(shù)據(jù)庫6的訪問。
[0307]另外,通過裝置100-1至100-4中的一個裝置100執(zhí)行的用戶認(rèn)證的結(jié)果在附近布置的其他裝置100之間共享,并且裝置100-1至100-4可以掌握可以提供給用戶的服務(wù)。
[0308]接下來,在步驟S509中,裝置100識別來自用戶的命令(服務(wù)請求)。這里,裝置100可以向標(biāo)簽60通知可以提供給認(rèn)證用戶的服務(wù)的信息。標(biāo)簽60可以通知用戶使用諸如揚聲器或顯示單元的輸出裝置(未示出)在所述地方可以接收哪種服務(wù)。另外,標(biāo)簽60還根據(jù)用戶的命令輸入(通過麥克風(fēng)、陀螺儀、鍵觸摸等)來指定用戶當(dāng)前期望的服務(wù),并且向在附近布置的裝置100-1至100-4通知所述服務(wù)。
[0309]注意,在用戶不具有標(biāo)簽60的情況下,裝置100-1至100-4可以使用傳感器(麥克風(fēng)、相機、人體傳感器、熱傳感器等)來分析用戶的語音或手勢,并且可以識別用戶所期望的服務(wù)。
[0310]這里,除了以上所述的呼叫發(fā)起請求(呼叫請求)之外,由裝置100識別的命令還可以是請求重建已被指定為給定目標(biāo)的地方、樓宇、節(jié)目、音樂片段等的命令。
[0311]接下來,在步驟S512中,在所請求的服務(wù)是對用戶允許的服務(wù)的情況下,裝置100-1至100-4開始提供服務(wù)。具體地,例如,裝置100-1至100-4啟動傳感器(例如麥克風(fēng)10)和執(zhí)行器(例如揚聲器20)的操作,并且使裝置之間的通信路徑處于操作狀態(tài)。另夕卜,裝置100-1至100-4可以彼此配合協(xié)作,并且基于要提供的服務(wù)的類型和可用的通信資源的量來確定它們自己的操作。
[0312]另外,在裝置100具有多種類型的通信I/F的情況下,可以基于要提供的信息的量,根據(jù)需要來操作用于業(yè)務(wù)傳輸?shù)耐ㄐ臝/F。另外,裝置100可以根據(jù)需要來增大操作占空比,并且可以部分地消取消省電模式。另外,裝置100可以設(shè)置彼此的用于通信的傳送/接收時間段,從而轉(zhuǎn)變到可以穩(wěn)定地提供頻帶的狀態(tài)(IEEE 802.1ls的預(yù)約接入啟動)。
[0313]接下來,在步驟S515中,在完成由用戶指定的服務(wù)的情況下,裝置100完成服務(wù)的提供。具體地,例如,裝置100結(jié)束傳感器(例如麥克風(fēng)10)和執(zhí)行器(例如揚聲器20)的操作,并且使裝置之間的通信路徑處于停止?fàn)顟B(tài)。
[0314]接下來,在步驟S518中,裝置100向服務(wù)日志數(shù)據(jù)庫8通知在最近的服務(wù)提供中裝置100已經(jīng)貢獻的內(nèi)容。另外,裝置100還可以向服務(wù)日志數(shù)據(jù)庫8通知已經(jīng)被提供服務(wù)的用戶(認(rèn)證用戶)的信息。
[0315]至此,已經(jīng)參照圖23具體描述了根據(jù)本實施方式的自治聲學(xué)系統(tǒng)的操作處理。在下文中,將描述根據(jù)本實施方式的自治聲學(xué)系統(tǒng)的附加描述。
[0316](服務(wù)延續(xù))
[0317]即使在認(rèn)證用戶行走并且移動至另一地方的情況下,根據(jù)本實施方式的自治聲學(xué)系統(tǒng)也可以通過改變向用戶提供服務(wù)的裝置100 (進行操作的裝置100)來向用戶持續(xù)提供服務(wù)。例如,基于來自用戶所具有的標(biāo)簽60的無線電波強度以及來自每個裝置所具有的傳感器(麥克風(fēng)、相機、人體傳感器等)的輸入信號,來執(zhí)行這樣的改變處理。在下文中,將參照圖24給出描述。
[0318]圖24是示出在根據(jù)本實施方式的自治聲學(xué)系統(tǒng)中根據(jù)用戶的移動來改變操作裝置的圖。如圖24所示,這里假定用戶離開正在操作以用于向用戶提供服務(wù)的裝置100-1和裝置100-2,并且接近沒有執(zhí)行用于服務(wù)提供的操作的裝置100-5和100-6的情況。
[0319]在這種情況下,裝置100-5和100-6基于來自用戶所具有的標(biāo)簽60的無線電波強度或者來自裝置100-5和100-6中所包括的傳感器的輸入信號,而檢測到用戶已經(jīng)接近。然后,裝置100-5和100-6從鄰近安置的裝置100-2等接收用戶的ID和可以提供給用戶的服務(wù)的信息。
[0320]然后,裝置100-5和100-6基于接收到的信息而開始向用戶提供服務(wù)。另一方面,已經(jīng)執(zhí)行服務(wù)提供的裝置100-1和100-2在確定用戶移出裝置100-1和100-2的傳感器和執(zhí)行器可以提供服務(wù)的區(qū)域時結(jié)束服務(wù)提供,并且使裝置的操作和通信路徑停止。
[0321]以此方式,如果用戶在接收服務(wù)提供時移動,則在附近設(shè)置的裝置100可以接管用戶ID和服務(wù)的內(nèi)容,并且可以向用戶連續(xù)地提供服務(wù)。
[0322](到網(wǎng)絡(luò)5的訪問路由)
[0323]在參照圖21所描述的根據(jù)本實施方式的自治聲學(xué)系統(tǒng)中,裝置100-1至100_4中的至少一個裝置100 (這里是裝置100-1)具有到網(wǎng)絡(luò)5的接入路由。然而,根據(jù)本實施方式的自治聲學(xué)系統(tǒng)的配置不限于圖21中所示的示例,而是可以存在以下情況:裝置100-1至100-4處于封閉網(wǎng)絡(luò)中并且沒有到外部(網(wǎng)絡(luò)5)的訪問路由。
[0324]在這樣的情況下,裝置100-1至100-4可以使用例如用戶所具有的標(biāo)簽60作為到外部的訪問網(wǎng)關(guān)。也就是說,在裝置100-1至100-4在標(biāo)簽60出現(xiàn)的時間點處彼此報告特定信息的狀態(tài)下,裝置100-1至100-4在網(wǎng)絡(luò)5上通過標(biāo)簽60向用戶ID數(shù)據(jù)庫6發(fā)送查詢,并且執(zhí)行用戶認(rèn)證。
[0325](對多個用戶的服務(wù)提供)
[0326]接下來,將參照圖25來描述在多個用戶進入布置有裝置100-1至100_4的空間的情況下的服務(wù)提供。
[0327]圖25是示出在根據(jù)本實施方式的自治聲學(xué)系統(tǒng)中向多個用戶提供服務(wù)的情況的圖。如圖25所示,在多個用戶進入布置有裝置100-1至100-4的空間,并且每個用戶執(zhí)行服務(wù)請求的情況下,裝置100-1至100-4中的每一個提供多個服務(wù)。
[0328]在這種情況下,盡管參照圖21至圖24描述了對于每個用戶裝置100_1至100_4的操作,但是對于用戶I所具有的標(biāo)簽60而言,用戶2所具有的標(biāo)簽65被視為在附近布置的裝置之一。此外,對于用戶2所具有的標(biāo)簽65而言,用戶I所具有的標(biāo)簽60也被視為在附近布置的裝置之一。
[0329]因此,裝置100-1至100-4也利用標(biāo)簽60或標(biāo)簽65執(zhí)行特征信息的報告,并且確認(rèn)裝置是否值得信任。以此方式,標(biāo)簽60或標(biāo)簽65的特征可以用于服務(wù)提供。
[0330]例如,在裝置100-1至100-4處于封閉網(wǎng)絡(luò)中的情況下,裝置100-1至100-4從利用標(biāo)簽65的特征信息的報告掌握:標(biāo)簽65持有到外部網(wǎng)絡(luò)5的訪問路由。然后,在向具有標(biāo)簽60的用戶I提供服務(wù)時,裝置100-1至100-4將用戶2所具有的標(biāo)簽65用作為裝置之一,并且由此能夠連接至外部網(wǎng)絡(luò)5。
[0331]以此方式,不限于布置在用戶I周圍的裝置100-1至100-4,并且位于附近的用戶2所具有的標(biāo)簽65也可以向具有標(biāo)簽60的用戶I提供到外部網(wǎng)絡(luò)的訪問。
[0332]注意,在這樣的情況下,由標(biāo)簽65提供的服務(wù)的內(nèi)容可以被寫入服務(wù)日志數(shù)據(jù)庫8中,并且可以在隨后基于有助于向用戶I提供服務(wù)的事實對于具有標(biāo)簽65的用戶2執(zhí)行報酬時使用。
[0333]<6.結(jié)論〉
[0334]如上所述,在根據(jù)本實施方式的聲學(xué)系統(tǒng)中,可以在使得圍繞用戶的空間能夠與另一空間配合協(xié)作時提供被吸入到第三空間中的感覺。具體地,根據(jù)本實施方式的聲學(xué)系統(tǒng)能夠通過布置在用戶周圍的多個揚聲器和顯示器來再現(xiàn)與第一給定目標(biāo)(人物、地方、樓宇等)相對應(yīng)的語音和圖像。另外,在這種情況下,根據(jù)本實施方式的聲學(xué)系統(tǒng)能夠再現(xiàn)第二給定目標(biāo)(地方等)的空間,并且能夠提供被吸入到第二給定目標(biāo)和環(huán)境中的感覺。以此方式,使用在室內(nèi)地點和室外地點各處布置的麥克風(fēng)10、揚聲器20、圖像傳感器等,可以在大區(qū)域上實質(zhì)上增強用戶的身體,例如嘴、眼睛、耳朵,從而實現(xiàn)新的通信方法。
[0335]另外,由于在根據(jù)本實施方式的聲學(xué)系統(tǒng)中在各處布置有麥克風(fēng)和圖像傳感器,所以用戶不必攜帶智能電話或移動電話終端。用戶通過語音或手勢來指定給定目標(biāo),并且能夠與圍繞給定目標(biāo)的空間建立連接。
[0336]另外,用于實現(xiàn)這樣一種新的通信方法的聲學(xué)系統(tǒng)的配置可以通過控制多個麥克風(fēng)和多個揚聲器的信號處理設(shè)備來實現(xiàn)。另外,根據(jù)本實施方式的聲學(xué)系統(tǒng)可以實現(xiàn)為如下:例如每個自治麥克風(fēng)和每個自治揚聲器的裝置與另一鄰近裝置配合協(xié)作。
[0337]以上已經(jīng)參照附圖描述了本公開內(nèi)容的優(yōu)選實施方式,但是本發(fā)明并不限于上述示例。本領(lǐng)域技術(shù)人員可以在所附權(quán)利要求書的范圍內(nèi)發(fā)現(xiàn)各種替換和修改,并且應(yīng)當(dāng)理解,這些替換和修改將自然地歸入本發(fā)明的技術(shù)范圍內(nèi)。
[0338]例如,信號處理設(shè)備I的配置并不限于圖3中所示的配置,而配置可以是:不向信號處理設(shè)備I提供圖3所示的識別單元17和標(biāo)識單元18,而是在通過網(wǎng)絡(luò)連接至其的服務(wù)器側(cè)提供識別單元17和標(biāo)識單元18。在這種情況下,信號處理設(shè)備I通過通信I/F 19將從信號處理單元13輸出的音頻信號傳送至服務(wù)器。另外,服務(wù)器基于接收到的音頻信號來執(zhí)行命令識別和對給定目標(biāo)(人、地方、樓宇、節(jié)目、音樂片段等)進行標(biāo)識的處理,并且將識別結(jié)果和對應(yīng)于所標(biāo)識的給定對象的訪問目的地信息傳送至信號處理設(shè)備I。
[0339]此外,本技術(shù)還可以如下進行配置。
[0340](I) 一種信息處理系統(tǒng),包括:
[0341]識別單元,被配置成基于由布置在特定用戶周圍的多個傳感器檢測到的信號來識別第一目標(biāo)和第二目標(biāo);
[0342]標(biāo)識單元,被配置成對由所述識別單元識別的所述第一目標(biāo)和所述第二目標(biāo)進行標(biāo)識;
[0343]估計單元,被配置成根據(jù)由所述多個傳感器中的任一傳感器檢測到的信號來估計所述特定用戶的位置;以及
[0344]信號處理單元,被配置成以以下方式對從所述標(biāo)識單元所標(biāo)識的所述第一目標(biāo)和所述第二目標(biāo)周圍的傳感器獲取的信號中的每個信號進行處理:在從布置在所述特定用戶周圍的多個執(zhí)行器輸出時,所述信號被定位在由所述估計單元估計的所述特定用戶的位置附近。
[0345](2)根據(jù)⑴所述的信息處理系統(tǒng),
[0346]其中,所述第一目標(biāo)是給定的人并且所述第二目標(biāo)是給定的地方,以及
[0347]其中,所述信號處理單元對由所述給定的人周圍的傳感器獲取的信號以及由所述給定的地方周圍的傳感器獲取的信號進行處理。
[0348](3)根據(jù)⑴所述的信息處理系統(tǒng),
[0349]其中,所述第一目標(biāo)是給定的人并且所述第二目標(biāo)是給定的地方,以及
[0350]其中,所述信號處理單元對由所述給定的人周圍的傳感器實時獲取的信號以及由所述給定的地方周圍的傳感器預(yù)先已經(jīng)獲取并且已經(jīng)積累的信號進行處理。
[0351](4)根據(jù)⑴至(3)中任一項所述的信息處理系統(tǒng),
[0352]其中,所述第一目標(biāo)周圍的傳感器和所述第二目標(biāo)周圍的傳感器分散地布置在遠(yuǎn)距離的地方。
[0353](5)根據(jù)⑴至(4)中任一項所述的信息處理系統(tǒng),
[0354]其中,布置在所述特定用戶周圍的所述多個傳感器是麥克風(fēng),并且
[0355]其中,所述識別單元基于由所述麥克風(fēng)檢測到的音頻信號來識別所述第一目標(biāo)和所述第二目標(biāo)。
[0356](6)根據(jù)⑴至(4)中任一項所述的信息處理系統(tǒng),
[0357]其中,布置在所述特定用戶周圍的所述多個傳感器是圖像傳感器,并且
[0358]其中,所述識別單元基于由所述圖像傳感器獲得的捕捉圖像來識別所述第一目標(biāo)和所述第二目標(biāo)。
[0359](7)根據(jù)⑴至(6)中任一項所述的信息處理系統(tǒng),
[0360]其中,所述第一目標(biāo)周圍的傳感器與所述第二目標(biāo)周圍的傳感器是不同的類型。
[0361](8)根據(jù)⑴至(7)中任一項所述的信息處理系統(tǒng),
[0362]其中,所述信號處理單元執(zhí)行以下處理:基于對應(yīng)于所述第二目標(biāo)的參數(shù)的特征來修改由所述第一目標(biāo)周圍的傳感器獲取的信號,以及對由所述第二目標(biāo)周圍的傳感器獲取的信號執(zhí)行添加。
[0363](9)根據(jù)⑴至⑶中任一項所述的信息處理系統(tǒng),
[0364]其中,所述信號處理單元以以下方式對從所述第一目標(biāo)和所述第二目標(biāo)周圍的傳感器所獲取的信號中的每個信號進行處理:所述信號中的每個信號被定位在所述特定用戶的感覺器官附近。
[0365](10)根據(jù)⑴至(9)中任一項所述的信息處理系統(tǒng),
[0366]其中,所述第一目標(biāo)和所述第二目標(biāo)周圍的所述傳感器是麥克風(fēng),
[0367]其中,布置在所述特定用戶周圍的所述多個執(zhí)行器是多個揚聲器,并且
[0368]其中,基于所述多個揚聲器的各個位置和所估計的所述用戶的位置,所述信號處理單元以以下方式對由所述第一目標(biāo)和所述第二目標(biāo)周圍的所述麥克風(fēng)獲取的各個音頻信號進行處理:在從所述多個揚聲器輸出時,在所述特定用戶的位置附近形成聲場。
[0369](11)根據(jù)(10)所述的信息處理系統(tǒng),
[0370]其中,所述估計單元連續(xù)地估計所述特定用戶的位置,并且
[0371]其中,所述信號處理單元以以下方式對所述各個音頻信號進行處理:根據(jù)所述特定用戶的位置的改變,在所述特定用戶的位置附近形成聲場。
[0372](12) —種信息處理系統(tǒng),包括:
[0373]識別單元,被配置成基于由特定用戶周圍的傳感器檢測到的信號來識別第一目標(biāo)和第二目標(biāo);
[0374]標(biāo)識單元,被配置成對由所述識別單元識別的所述第一目標(biāo)和所述第二目標(biāo)進行標(biāo)識;以及
[0375]信號處理單元,被配置成基于由多個傳感器獲取的信號來生成要從所述特定用戶周圍的執(zhí)行器輸出的信號,所述多個傳感器布置在由所述標(biāo)識單元標(biāo)識的所述第一目標(biāo)和所述第二目標(biāo)周圍。
[0376](13)根據(jù)(12)所述的信息處理系統(tǒng),
[0377]其中,所述第一目標(biāo)是給定的人并且所述第二目標(biāo)是給定的地方,以及
[0378]其中,所述信號處理單元對由布置在所述給定的人周圍的多個傳感器獲取的信號以及由布置在所述給定的地方周圍的多個傳感器獲取的信號進行處理。
[0379](14)根據(jù)(12)所述的信息處理系統(tǒng),
[0380]其中,所述第一目標(biāo)是給定的人并且所述第二目標(biāo)是給定的地方,以及
[0381]其中,所述信號處理單元對由布置在所述給定的人周圍的多個傳感器實時獲取的信號以及由所述給定的地方周圍的傳感器預(yù)先已經(jīng)獲取并且已經(jīng)積累的信號進行處理。
[0382](15) 一種存儲有程序的存儲介質(zhì),所述程序用于使計算機用作為:
[0383]識別單元,被配置成基于由布置在特定用戶周圍的多個傳感器檢測到的信號來識別第一目標(biāo)和第二目標(biāo);
[0384]標(biāo)識單元,被配置成對由所述識別單元識別的所述第一目標(biāo)和所述第二目標(biāo)進行標(biāo)識;
[0385]估計單元,被配置成根據(jù)由所述多個傳感器中的任一傳感器檢測到的信號來估計所述特定用戶的位置;以及
[0386]信號處理單元,被配置成以以下方式對從所述標(biāo)識單元標(biāo)識的所述第一目標(biāo)和所述第二目標(biāo)周圍的傳感器所獲取的信號中的每個信號進行處理:在從布置在所述特定用戶周圍的多個執(zhí)行器輸出時,所述信號被定位在由所述估計單元估計的所述特定用戶的位置附近。
[0387](16) 一種存儲有程序的存儲介質(zhì),所述程序用于使計算機用作為:
[0388]識別單元,被配置成基于由特定用戶周圍的傳感器檢測到的信號來識別第一目標(biāo)和第二目標(biāo);
[0389]標(biāo)識單元,被配置成對由所述識別單元識別的所述第一目標(biāo)和所述第二目標(biāo)進行標(biāo)識;以及
[0390]信號處理單元,被配置成基于由多個傳感器獲取的信號來生成要從所述特定用戶周圍的執(zhí)行器輸出的信號,所述多個傳感器布置在由所述標(biāo)識單元標(biāo)識的所述第一目標(biāo)和所述第二目標(biāo)周圍。
[0391]附圖標(biāo)記列表
[0392]
[0226] KIAUB信號處理設(shè)備
[0393]3、3’管理服務(wù)器
[0394]5 網(wǎng)絡(luò)
[0395]6用戶ID數(shù)據(jù)庫
[0396]7通信終端
[0397]8服務(wù)日志數(shù)據(jù)庫
[0398]9用戶個人數(shù)據(jù)庫
[0399]10、10A、10B、10C 麥克風(fēng)
[0400]11放大/模擬-數(shù)字轉(zhuǎn)換器(ADC)單元
[0401]13,200信號處理單元
[0402]15麥克風(fēng)位置信息數(shù)據(jù)庫(DB)
[0403]16用戶位置估計單元
[0404]17識別單元
[0405]18標(biāo)識單元
[0406]19 通信接口(I/F)
[0407]20、20A、20B、20C 揚聲器
[0408]23數(shù)字-模擬轉(zhuǎn)換器(DAC) /放大單元
[0409]25用戶認(rèn)證單元
[0410]32管理單元
[0411]33、34搜索單元
[0412]35用戶位置信息數(shù)據(jù)庫
[0413]36聲學(xué)信息參數(shù)數(shù)據(jù)庫
[0414]37聲學(xué)內(nèi)容數(shù)據(jù)庫
[0415]40、40-1、40-2、40-3 聲學(xué)封閉面
[0416]42 聲場
[0417]43、43-1、43-2、43-3 封閉面
[0418]60、65 標(biāo)簽
[0419]100、100-1 至 100-4 裝置
[0420]131麥克風(fēng)陣列處理單元
[0421]133,210 高 S/N 處理單元
[0422]135,220聲場再現(xiàn)信號處理單元
[0423]136卷積單元
[0424]137、139嘯叫消減單元
[0425]138矩陣卷積單元
【權(quán)利要求】
1.一種信息處理系統(tǒng),包括: 識別單元,被配置成基于由布置在特定用戶周圍的多個傳感器檢測到的信號來識別第一目標(biāo)和第二目標(biāo); 標(biāo)識單元,被配置成對由所述識別單元識別的所述第一目標(biāo)和所述第二目標(biāo)進行標(biāo)識; 估計單元,被配置成根據(jù)由所述多個傳感器中的任一傳感器檢測到的信號來估計所述特定用戶的位置;以及 信號處理單元,被配置成以以下方式對從所述標(biāo)識單元所標(biāo)識的所述第一目標(biāo)和所述第二目標(biāo)周圍的傳感器獲取的信號中的每個信號進行處理:在從布置在所述特定用戶周圍的多個執(zhí)行器輸出時,所述信號被定位在由所述估計單元估計的所述特定用戶的位置附近。
2.根據(jù)權(quán)利要求1所述的信息處理系統(tǒng), 其中,所述第一目標(biāo)是給定的人并且所述第二目標(biāo)是給定的地方,以及 其中,所述信號處理單元對由所述給定的人周圍的傳感器獲取的信號以及由所述給定的地方周圍的傳感器獲取的信號進行處理。
3.根據(jù)權(quán)利要求1所述的信息處理系統(tǒng), 其中,所述第一目標(biāo)是給定的人并且所述第二目標(biāo)是給定的地方,以及 其中,所述信號處理單元對由所述給定的人周圍的傳感器實時獲取的信號以及由所述給定的地方周圍的傳感器預(yù)先已經(jīng)獲取并且已經(jīng)積累的信號進行處理。
4.根據(jù)權(quán)利要求1所述的信息處理系統(tǒng), 其中,所述第一目標(biāo)周圍的傳感器和所述第二目標(biāo)周圍的傳感器分散地布置在遠(yuǎn)距離的地方。
5.根據(jù)權(quán)利要求1所述的信息處理系統(tǒng), 其中,布置在所述特定用戶周圍的所述多個傳感器是麥克風(fēng),并且 其中,所述識別單元基于由所述麥克風(fēng)檢測到的音頻信號來識別所述第一目標(biāo)和所述第二目標(biāo)。
6.根據(jù)權(quán)利要求1所述的信息處理系統(tǒng), 其中,布置在所述特定用戶周圍的所述多個傳感器是圖像傳感器,并且 其中,所述識別單元基于由所述圖像傳感器獲得的捕捉圖像來識別所述第一目標(biāo)和所述第二目標(biāo)。
7.根據(jù)權(quán)利要求1所述的信息處理系統(tǒng), 其中,所述第一目標(biāo)周圍的傳感器與所述第二目標(biāo)周圍的傳感器是不同的類型。
8.根據(jù)權(quán)利要求1所述的信息處理系統(tǒng), 其中,所述信號處理單元執(zhí)行以下處理:基于對應(yīng)于所述第二目標(biāo)的參數(shù)的特征來修改由所述第一目標(biāo)周圍的傳感器獲取的信號,以及對由所述第二目標(biāo)周圍的傳感器獲取的信號執(zhí)行添加。
9.根據(jù)權(quán)利要求1所述的信息處理系統(tǒng), 其中,所述信號處理單元以以下方式對從所述第一目標(biāo)和所述第二目標(biāo)周圍的傳感器所獲取的信號中的每個信號進行處理:所述信號中的每個信號被定位在所述特定用戶的感覺器官附近。
10.根據(jù)權(quán)利要求1所述的信息處理系統(tǒng), 其中,所述第一目標(biāo)和所述第二目標(biāo)周圍的所述傳感器是麥克風(fēng), 其中,布置在所述特定用戶周圍的所述多個執(zhí)行器是多個揚聲器,并且 其中,基于所述多個揚聲器的各個位置和所估計的所述用戶的位置,所述信號處理單元以以下方式對由所述第一目標(biāo)和所述第二目標(biāo)周圍的所述麥克風(fēng)獲取的各個音頻信號進行處理:在從所述多個揚聲器輸出時,在所述特定用戶的位置附近形成聲場。
11.根據(jù)權(quán)利要求10所述的信息處理系統(tǒng), 其中,所述估計單元連續(xù)地估計所述特定用戶的位置,并且 其中,所述信號處理單元以以下方式對所述各個音頻信號進行處理:根據(jù)所述特定用戶的位置的改變,在所述特定用戶的位置附近形成聲場。
12.—種信息處理系統(tǒng),包括: 識別單元,被配置成基于由特定用戶周圍的傳感器檢測到的信號來識別第一目標(biāo)和第一目標(biāo); 標(biāo)識單元,被配置成對由所述識別單元識別的所述第一目標(biāo)和所述第二目標(biāo)進行標(biāo)識;以及 信號處理單元,被配置成基于由多個傳感器獲取的信號來生成要從所述特定用戶周圍的執(zhí)行器輸出的信號,所述多個傳感器布置在由所述標(biāo)識單元標(biāo)識的所述第一目標(biāo)和所述第二目標(biāo)周圍。
13.根據(jù)權(quán)利要求12所述的信息處理系統(tǒng), 其中,所述第一目標(biāo)是給定的人并且所述第二目標(biāo)是給定的地方,以及 其中,所述信號處理單元對由布置在所述給定的人周圍的多個傳感器獲取的信號以及由布置在所述給定的地方周圍的多個傳感器獲取的信號進行處理。
14.根據(jù)權(quán)利要求12所述的信息處理系統(tǒng), 其中,所述第一目標(biāo)是給定的人并且所述第二目標(biāo)是給定的地方,以及 其中,所述信號處理單元對由布置在所述給定的人周圍的多個傳感器實時獲取的信號以及由所述給定的地方周圍的傳感器預(yù)先已經(jīng)獲取并且已經(jīng)積累的信號進行處理。
15.一種存儲有程序的存儲介質(zhì),所述程序用于使計算機用作為: 識別單元,被配置成基于由布置在特定用戶周圍的多個傳感器檢測到的信號來識別第一目標(biāo)和第二目標(biāo); 標(biāo)識單元,被配置成對由所述識別單元識別的所述第一目標(biāo)和所述第二目標(biāo)進行標(biāo)識; 估計單元,被配置成根據(jù)由所述多個傳感器中的任一傳感器檢測到的信號來估計所述特定用戶的位置;以及 信號處理單元,被配置成以以下方式對從所述標(biāo)識單元標(biāo)識的所述第一目標(biāo)和所述第二目標(biāo)周圍的傳感器所獲取的信號中的每個信號進行處理:在從布置在所述特定用戶周圍的多個執(zhí)行器輸出時,所述信號被定位在由所述估計單元估計的所述特定用戶的位置附近。
16.一種存儲有程序的存儲介質(zhì),所述程序用于使計算機用作為: 識別單元,被配置成基于由特定用戶周圍的傳感器檢測到的信號來識別第一目標(biāo)和第一目標(biāo); 標(biāo)識單元,被配置成對由所述識別單元識別的所述第一目標(biāo)和所述第二目標(biāo)進行標(biāo)識;以及 信號處理單元,被配置成基于由多個傳感器獲取的信號來生成要從所述特定用戶周圍的執(zhí)行器輸出的信號,所述多個傳感器布置在由所述標(biāo)識單元標(biāo)識的所述第一目標(biāo)和所述第二目標(biāo)周圍。
【文檔編號】H04R1/40GK104488288SQ201380038607
【公開日】2015年4月1日 申請日期:2013年4月23日 優(yōu)先權(quán)日:2012年7月27日
【發(fā)明者】佐古曜一郎, 荒谷勝久, 迫田和之, 淺田宏平, 竹原充, 中村隆俊, 渡邊一弘, 丹下明, 花谷博幸, 甲賀有希, 大沼智也 申請人:索尼公司