用于隔離麥克風(fēng)音頻的方法、裝置和系統(tǒng)的制作方法
【專利說明】
[0001] 相關(guān)申請的交叉引用
[0002] 該申請涉及2012年12月28日提交的國際?(:1'申請如.?(^/1^12/072083,其完整 內(nèi)容出于所有目的而通過引用合并到該申請中。
技術(shù)領(lǐng)域
[0003] 本發(fā)明總體上涉及麥克風(fēng)音頻的隔離,更具體地說,涉及一種用于從麥克風(fēng)信號 移除噪聲以用于隔離音頻的方法、裝置和系統(tǒng)。
【背景技術(shù)】
[0004] -般在很多通信系統(tǒng)和內(nèi)容發(fā)布設(shè)備中需要噪聲抑制,以抑制噪聲,從而改進(jìn)通 信質(zhì)量和媒體理解??梢允褂酶鞣N技術(shù)來實現(xiàn)噪聲抑制,其中的一些可以分類為單個麥克 風(fēng)技術(shù)和陣列麥克風(fēng)技術(shù)。
[0005] 陣列麥克風(fēng)噪聲降低技術(shù)使用放置在不同位置處并且彼此分離達(dá)某最小距離的 多個麥克風(fēng)以形成波束。傳統(tǒng)上,波束用于拾取話音,其然后用于減少在波束外部所拾取的 噪聲的量。因此,陣列麥克風(fēng)技術(shù)可以抑制非平穩(wěn)噪聲。經(jīng)由噪聲抑制的麥克風(fēng)信號的隔 離可以例如用在零售廣告發(fā)放環(huán)境中,以識別顧客人口統(tǒng)計學(xué)和/或購買數(shù)量。
[0006] 然而,多個麥克風(fēng)自身也產(chǎn)生更多噪聲。此外,這些技術(shù)并不使用系統(tǒng)的配置參數(shù) 和已知的音頻信號以使得在此所描述的噪聲消除成為可能。
【發(fā)明內(nèi)容】
[0007] 本發(fā)明的實施例通過提供一種用于隔離麥克風(fēng)信號的方法、裝置和系統(tǒng)來解決現(xiàn) 有技術(shù)的缺陷。
[0008] 在本發(fā)明的實施例中,一種方法,包括:使用采用麥克風(fēng)陣列中的目標(biāo)麥克風(fēng)的至 少兩個麥克風(fēng)來記錄音頻;使用所述麥克風(fēng)陣列中的目標(biāo)麥克風(fēng)來確定用于源自其它麥克 風(fēng)的各個位置的音頻的衰減因子;確定用于源自所述麥克風(fēng)陣列中的其它麥克風(fēng)的各個位 置的音頻的延遲因子;以及實現(xiàn)所述確定的衰減因子和所述延遲因子,以用于從所述目標(biāo) 麥克風(fēng)所捕獲的音頻信號移除源自所述其它麥克風(fēng)的各個位置的音頻,以隔離所述目標(biāo)麥 克風(fēng)所捕獲的所述音頻信號。所述方法、裝置和系統(tǒng)還包括:處理所述目標(biāo)麥克風(fēng)的所述隔 離的音頻信號,以確定所述目標(biāo)麥克風(fēng)的所述隔離的音頻信號的音頻屬性;以及使用所述 音頻屬性來確定所述隔離的音頻信號中的各個音頻源。
[0009] 在本發(fā)明的替代性實施例中,一種裝置,包括:存儲器,用于存儲程序例程和數(shù)據(jù); 以及處理器,用于執(zhí)行所述程序例程。在該實施例中,所述裝置被配置為:使用包括麥克風(fēng) 陣列的至少兩個麥克風(fēng)來記錄音頻;使用所述麥克風(fēng)陣列中的目標(biāo)麥克風(fēng)以確定用于源自 所述麥克風(fēng)陣列中的其它麥克風(fēng)的各個位置的音頻的衰減因子;使用所述麥克風(fēng)陣列中的 目標(biāo)麥克風(fēng)以確定用于源自所述麥克風(fēng)陣列中的其它麥克風(fēng)的各個位置的音頻的延遲因 子;實現(xiàn)所述確定的衰減因子和所述延遲因子,以用于從所述目標(biāo)麥克風(fēng)所捕獲的音頻信 號移除源自所述麥克風(fēng)陣列中的所述其它麥克風(fēng)的各個位置的音頻,以隔離所述目標(biāo)麥克 風(fēng)所捕獲的所述音頻信號;處理所述目標(biāo)麥克風(fēng)的所述隔離的音頻信號,以確定所述目標(biāo) 麥克風(fēng)的所述隔離的音頻信號的音頻屬性;以及使用所述音頻屬性來確定所述目標(biāo)麥克風(fēng) 的所述隔離的音頻信號中的各個音頻源。
[0010] 在本發(fā)明的替代性實施例中,一種系統(tǒng),包括:至少兩個麥克風(fēng),包括麥克風(fēng)陣列; 至少一個音頻源;裝置,包括:存儲器,用于存儲程序例程和數(shù)據(jù);以及處理器,用于執(zhí)行所 述程序例程。在該系統(tǒng)中,所述裝置被配置為:使用包括麥克風(fēng)陣列的至少兩個麥克風(fēng)來記 錄音頻;使用所述麥克風(fēng)陣列中的目標(biāo)麥克風(fēng)以確定用于源自所述麥克風(fēng)陣列中的其它麥 克風(fēng)的各個位置的音頻的衰減因子;使用所述麥克風(fēng)陣列中的目標(biāo)麥克風(fēng)以確定用于源自 所述麥克風(fēng)陣列中的其它麥克風(fēng)的各個位置的音頻的延遲因子;實現(xiàn)所述確定的衰減因子 和所述延遲因子,以用于從所述目標(biāo)麥克風(fēng)所捕獲的音頻信號移除源自所述麥克風(fēng)陣列中 的所述其它麥克風(fēng)的各個位置的音頻,以隔離所述目標(biāo)麥克風(fēng)所捕獲的所述音頻信號;處 理所述目標(biāo)麥克風(fēng)的所述隔離的音頻信號,以確定所述目標(biāo)麥克風(fēng)的所述隔離的音頻信號 的音頻屬性;以及使用所述音頻屬性來確定所述目標(biāo)麥克風(fēng)的所述隔離的音頻信號中的各 個音頻源。
【附圖說明】
[0011] 通過結(jié)合附圖考慮以下詳細(xì)描述,可以容易地理解本發(fā)明的教導(dǎo),其中:
[0012] 圖1描述本發(fā)明的實施例可以應(yīng)用于的內(nèi)容發(fā)布系統(tǒng)的高級框圖;
[0013] 圖2描述本發(fā)明的實施例可以應(yīng)用于的用于提供店內(nèi)廣告發(fā)放的店內(nèi)廣告發(fā)放 網(wǎng)絡(luò)的尚級框圖;
[0014] 圖3描述根據(jù)本發(fā)明實施例的用于隔離麥克風(fēng)音頻的裝置的高級框圖;以及
[0015] 圖4描述根據(jù)本發(fā)明實施例的用于隔離麥克風(fēng)音頻的方法的流程圖。
[0016] 應(yīng)理解,附圖目的在于示出本發(fā)明的構(gòu)思,而并非一定是用于示出本發(fā)明的僅可 能的配置。為了促進(jìn)理解,已經(jīng)在可能的情況下使用相同標(biāo)號以指定附圖公用的相同要素。
【具體實施方式】
[0017] 本發(fā)明有利地提供一種用于隔離麥克風(fēng)音頻的方法、裝置和系統(tǒng)。雖然將在店內(nèi) 零售廣告發(fā)放網(wǎng)絡(luò)環(huán)境以及廣告發(fā)放內(nèi)容發(fā)布并且具體地用于隔離話音的收銀應(yīng)用的上 下文內(nèi)基本地描述本發(fā)明,但本發(fā)明的特定實施例不應(yīng)被看作限制本發(fā)明的范圍。本領(lǐng)域 技術(shù)人員應(yīng)理解并且通過本發(fā)明的教導(dǎo)所告知,本發(fā)明的構(gòu)思可以有利地應(yīng)用于期望隔離 任何音頻(例如語音)的任何環(huán)境(例如快餐餐館、銀行出納柜臺等)。
[0018] 可以通過使用專用硬件或能夠與適當(dāng)軟件關(guān)聯(lián)而執(zhí)行軟件的硬件來提供附圖所 示的各種要素的功能。當(dāng)由處理器提供時,可以由單個專用處理器、單個共享處理器或其中 一些可以共享的多個單獨處理器來提供功能。此外,明確使用術(shù)語"處理器"或"控制器"不 應(yīng)理解為排他地指代能夠執(zhí)行軟件的硬件,而是可以并非限制地隱含地包括數(shù)字信號處理 器("DSP")硬件、用于存儲軟件的只讀存儲器("R0M")、隨機(jī)存取存儲器("RAM")以及 非易失性存儲件。此外,在此陳述本發(fā)明原理、方面和實施例及其具體示例的所有聲明意圖 囊括其結(jié)構(gòu)和功能等同物。此外,無論結(jié)構(gòu)如何,都期望這些等同物包括目前已知的等同物 以及未來開發(fā)的等同物(即執(zhí)行相同功能的任何所開發(fā)的要素)。
[0019] 因此,例如,本領(lǐng)域技術(shù)人員應(yīng)理解,在此所呈現(xiàn)的框圖表示實施本發(fā)明原理的示 例性電路的構(gòu)思性視圖。相似地,應(yīng)理解,任何流程圖、流程示圖、狀態(tài)轉(zhuǎn)換圖、偽碼等表示 可以基本上在計算機(jī)可讀介質(zhì)中表示并且從而由計算機(jī)或處理器執(zhí)行的各種處理,而無論 是否明確示出該計算機(jī)或處理器。
[0020] 圖1描述本發(fā)明的實施例可以應(yīng)用于的內(nèi)容發(fā)布系統(tǒng)的高級框圖。圖1的內(nèi)容 發(fā)布系統(tǒng)100示例性地包括收銀廣告發(fā)放發(fā)布系統(tǒng),其示例性地包括一個服務(wù)器110、多 個接收設(shè)備(例如調(diào)諧/解碼部件(示例性地機(jī)頂盒(STB))) 及用于機(jī)頂盒 的各個顯示器130fl30n。如圖1所描述的那樣,顯示器130中的每一個均包括 各個麥克風(fēng)132fl32n以及至少一個揚(yáng)聲器133i_133n,并且位于各個收銀通道134fl34j9 附近。在圖1的內(nèi)容發(fā)布系統(tǒng)100中,顯示器130的麥克風(fēng)132包括麥克風(fēng)陣列。在如圖 1的系統(tǒng)100的系統(tǒng)中,麥克風(fēng)132典型地用于驗證內(nèi)容在顯示器130上的播出,并且可以 進(jìn)一步用于噪聲消除的目的。
[0021] 雖然在圖1的系統(tǒng)100中,多個機(jī)頂盒中的每一個示例性地連接到單個 各個顯示器,但在本發(fā)明的替代性實施例中,多個機(jī)頂盒的每一個可以連接到 多于單個的顯示器。也就是說,在本發(fā)明的替代性實施例中,多個收銀通道的顯示器可以受 控并且與單個機(jī)頂盒通信。此外,雖然圖在1的內(nèi)容發(fā)布系統(tǒng)100中,調(diào)諧/解碼部件示例 性地描述為機(jī)頂盒120,但在本發(fā)明的替代性實施例中,本發(fā)明的調(diào)諧/解碼部件可以包括 替代性調(diào)諧/解碼部件(例如集成到顯示器130中的調(diào)諧/解碼電路或其它獨立的調(diào)諧/ 解碼設(shè)備等)。更甚,本發(fā)明的接收設(shè)備可以包括能夠接收內(nèi)容(例如音頻、視頻和/或音 頻/視頻內(nèi)容)的任何設(shè)備。
[0022] 在本發(fā)明的一個實施例中,圖1的內(nèi)容發(fā)布系統(tǒng)100可以是店內(nèi)廣告發(fā)放網(wǎng)絡(luò)的 部分。例如,圖2描述用于提供店內(nèi)廣告發(fā)放的店內(nèi)廣告發(fā)放網(wǎng)絡(luò)200的高級框圖。在圖