自除了所校準的麥克風(即目標麥克風)之外的陣列中的所有其它麥克風的聲音的延遲 因子。方法400進入步驟408。
[0062] 在步驟408,實現(xiàn)所確定的衰減因子和延遲因子,以用于從目標麥克風所捕獲的音 頻信號移除源自麥克風陣列中的其它麥克風的各個位置的來自目標麥克風所捕獲的音頻 信號的音頻,以例如在本發(fā)明的一個實施例通過使用波束成形處理/技術(shù)來隔離目標麥克 風所捕獲的音頻信號。方法400進入步驟410。
[0063] 在步驟410,處理目標麥克風的隔離的音頻信號,以確定目標麥克風的隔離的音頻 信號的音頻屬性。例如并且如上所述,在本發(fā)明的一個實施例中,可以通過對隔離的音頻信 號執(zhí)行傅里葉變換來確定話音的音頻屬性(例如目標麥克風的所隔離的話音中的頻率、平 均幅度、最大幅度、第一幅度峰值的時間、幅度峰值的數(shù)量)。方法400然后進入步驟412。
[0064] 在步驟412,使用音頻屬性來確定目標麥克風的隔離的音頻信號中的各個音頻源。 如上所述,在本發(fā)明的一個實施例中,通過將標準機器學習技術(shù)應用于隔離的音頻信號并 且應用所確定的話音屬性來確定目標麥克風的隔離的音頻信號中的話音源。方法400可以 然后進入可選步驟414或416,或可以退出。
[0065] 在可選步驟414,標準機器學習技術(shù)應用于音頻的各個源中的至少一個的隔離的 音頻信號(例如話音),以確定話音的所述至少一個各個源的人口統(tǒng)計學信息(例如性別、 年齡、種族背景等)。
[0066] 在可選步驟416,目標廣告導向到所確定的各個音頻源中的至少一個。例如,如上 所述,在本發(fā)明的一個實施例中,目標廣告發(fā)放和廣告可以經(jīng)由例如目標顯示器呈現(xiàn)給所 識別/確定的消費者。
[0067] 已經(jīng)描述了用于隔離麥克風音頻的方法、裝置和系統(tǒng)的各個實施例(其目的是說 明,而不是限制),應注意,根據(jù)上述教導,本領(lǐng)域技術(shù)人員可以進行修改和變化。因此,應理 解,可以在處于本發(fā)明的范圍和精神內(nèi)的所公開的本發(fā)明特定實施例中進行改變。雖然前 面針對本發(fā)明的各個實施例,但可以在不脫離本發(fā)明的基本范圍的情況下設(shè)計本發(fā)明的其 它和另外實施例。
【主權(quán)項】
1. 一種方法,包括: 使用包括麥克風陣列的至少兩個麥克風來記錄音頻; 使用所述麥克風陣列中的目標麥克風,確定用于源自所述麥克風陣列中的其它麥克風 的各個位置的音頻的衰減因子; 使用所述麥克風陣列中的目標麥克風,確定用于源自所述麥克風陣列中的其它麥克風 的各個位置的音頻的延遲因子; 實現(xiàn)所述確定的衰減因子和所述延遲因子,以用于從所述目標麥克風所捕獲的音頻信 號移除源自所述麥克風陣列中的所述其它麥克風的各個位置的音頻,以隔離所述目標麥克 風所捕獲的所述音頻信號; 處理所述目標麥克風的所述隔離的音頻信號,以確定所述目標麥克風的所述隔離的音 頻信號的音頻屬性;以及 使用所述音頻屬性來確定所述目標麥克風的所述隔離的音頻信號中的各個音頻源。2. 如權(quán)利要求1所述的方法,其中,所述音頻屬性包括話音屬性,所述目標麥克風的所 述隔離的音頻信號中的各個話音源得以確定。3. 如權(quán)利要求2所述的方法,其中,所述處理包括:將傅里葉變換應用于所述目標麥克 風的所述隔離的音頻信號,以確定所述音頻信號中的話音的屬性。4. 如權(quán)利要求3所述的方法,其中,所述話音的屬性包括頻率、平均幅度、最大幅度、第 一幅度峰值的時間以及幅度峰值的數(shù)量中的至少一個。5. 如權(quán)利要求2所述的方法,其中,確定所述隔離的音頻信號中的各個話音源包括:將 機器學習技術(shù)應用于所述隔離的音頻信號,并且應用所確定的話音屬性。6. 如權(quán)利要求5所述的方法,其中,所述機器學習技術(shù)包括k均值聚類。7. 如權(quán)利要求2所述的方法,包括:將標準機器學習技術(shù)應用于所述各個話音源中的 至少一個的隔離的音頻信號,以確定所述至少一個各個話音源的人口統(tǒng)計學信息。8. 如權(quán)利要求7所述的方法,其中,所述標準機器學習技術(shù)包括線性回歸、判決樹、 AdaBoost?以及支持矢量機器或算法中的至少一個。9. 如權(quán)利要求7所述的方法,其中,所述人口統(tǒng)計學信息包括話音源的性別、年齡以及 種族背景中的至少一個。10. 如權(quán)利要求2所述的方法,包括:使用話音屬性來確定用于所述各個話音源的語音 紋。11. 如權(quán)利要求1所述的方法,其中,所述音頻特性包括與產(chǎn)品的購買關(guān)聯(lián)的可聽聲調(diào) 的音頻特性,并且從可聽聲調(diào)確定所購買的產(chǎn)品的數(shù)量。12. 如權(quán)利要求1所述的方法,包括:使用零售商所收集的信息以識別所述目標麥克風 的所述隔離的音頻信號中的所述各個音頻源。13. 如權(quán)利要求1所述的方法,包括:對于所確定的各個音頻源提供目標廣告發(fā)放。14.一種裝置,包括: 存儲器,用于存儲程序例程和數(shù)據(jù);以及 處理器,用于執(zhí)行所述程序例程; 所述裝置被配置為: 使用包括麥克風陣列的至少兩個麥克風來記錄音頻; 使用所述麥克風陣列中的目標麥克風以確定用于源自所述麥克風陣列中的其它麥克 風的各個位置的音頻的衰減因子; 使用所述麥克風陣列中的目標麥克風以確定用于源自所述麥克風陣列中的其它麥克 風的各個位置的音頻的延遲因子; 實現(xiàn)所述確定的衰減因子和所述延遲因子,以用于從所述目標麥克風所捕獲的音頻信 號移除源自所述麥克風陣列中的所述其它麥克風的各個位置的音頻,以隔離所述目標麥克 風所捕獲的所述音頻信號; 處理所述目標麥克風的所述隔離的音頻信號,以確定所述目標麥克風的所述隔離的音 頻信號的音頻屬性;以及 使用所述音頻屬性來確定所述目標麥克風的所述隔離的音頻信號中的各個音頻源。15. 如權(quán)利要求14所述的裝置,其中,所述裝置包括服務(wù)器和機頂盒中的至少一個的 集成音頻電路。16. -種系統(tǒng),包括: 至少兩個麥克風,包括麥克風陣列; 至少一個音頻源; 裝置,包括:存儲器,用于存儲程序例程和數(shù)據(jù);以及處理器,用于執(zhí)行所述程序例程, 所述裝置被配置為: 使用包括麥克風陣列的至少兩個麥克風來記錄音頻; 使用所述麥克風陣列中的目標麥克風以確定用于源自所述麥克風陣列中的其它麥克 風的各個位置的音頻的衰減因子; 使用所述麥克風陣列中的目標麥克風以確定用于源自所述麥克風陣列中的其它麥克 風的各個位置的音頻的延遲因子; 實現(xiàn)所述確定的衰減因子和所述延遲因子,以用于從所述目標麥克風所捕獲的音頻信 號移除源自所述麥克風陣列中的所述其它麥克風的各個位置的音頻,以隔離所述目標麥克 風所捕獲的所述音頻信號; 處理所述目標麥克風的所述隔離的音頻信號,以確定所述目標麥克風的所述隔離的音 頻信號的音頻屬性;以及 使用所述音頻屬性來確定所述目標麥克風的所述隔離的音頻信號中的各個音頻源。17. 如權(quán)利要求16所述的系統(tǒng),其中,所述至少兩個麥克風包括至少一個網(wǎng)絡(luò)音頻處 理器的麥克風。18. 如權(quán)利要求16所述的系統(tǒng),其中,所述至少兩個麥克風包括零售環(huán)境的收銀通道 中的麥克風。19. 如權(quán)利要求16所述的系統(tǒng),其中,所述至少一個音頻源包括掃描器。20. 如權(quán)利要求16所述的系統(tǒng),其中,所述至少一個音頻源包括出納員和消費者。
【專利摘要】一種用于隔離麥克風音頻的方法、裝置和系統(tǒng),包括:使用采用麥克風陣列中的目標麥克風的至少兩個麥克風來記錄音頻;使用所述麥克風陣列中的目標麥克風來確定用于源自其它麥克風的各個位置的音頻的衰減因子;確定用于源自所述麥克風陣列中的其它麥克風的各個位置的音頻的延遲因子;以及實現(xiàn)所述所確定的衰減因子和所述延遲因子,以用于從所述目標麥克風所捕獲的音頻信號移除源自所述其它麥克風的各個位置的音頻,以隔離所述目標麥克風所捕獲的所述音頻信號。所述方法、裝置和系統(tǒng)還包括:處理所述目標麥克風的所述隔離的音頻信號,以確定所述目標麥克風的所述隔離的音頻信號的音頻屬性;以及使用所述音頻屬性來確定所述隔離的音頻信號中的各個音頻源。
【IPC分類】G10L25/48
【公開號】CN105378838
【申請?zhí)枴緾N201380075966
【發(fā)明人】E.約安尼迪斯, G.C.赫萊因, C.迪奧特
【申請人】湯姆遜許可公司
【公開日】2016年3月2日
【申請日】2013年5月13日
【公告號】EP2997574A1, US20160049163, WO2014185883A1