欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

信號(hào)源分離的制作方法_2

文檔序號(hào):9278247閱讀:來(lái)源:國(guó)知局
br>[0048] 該B.P.可以使用離散變量來(lái)實(shí)現(xiàn)(例如,量化到達(dá)方向?yàn)橐唤M矢量)。離散因子 圖可以使用硬件加速器實(shí)施,例如如在US2012/0317065A1"PROGRAMMABLEPROBABILITY PROCESSING"描述,其在此引入作為參考。
[0049] 因子圖可以結(jié)合各種方面,包括結(jié)合到來(lái)估計(jì)的方向估計(jì)的源特性(例如,音調(diào)、 頻譜等)的隱藏(潛在)變量。因子圖跨越跨時(shí)間和頻率的變量,從而改進(jìn)到達(dá)估計(jì)的方 向,而這又提高了掩模的質(zhì)量,從而可以減少諸如音樂(lè)噪聲的偽像。
[0050] 因子圖/B.P.計(jì)算可以托管在用于處理多個(gè)傳聲器輸入的相同的信號(hào)處理芯片 上,從而提供了低功耗實(shí)施方式。低功率可使得電池操作的"打開(kāi)傳聲器"的應(yīng)用,諸如監(jiān) 測(cè)觸發(fā)字。
[0051] 在一些實(shí)現(xiàn)方式中,B.P.計(jì)算提供控制時(shí)域?yàn)V波器組的到達(dá)值的方向的預(yù)測(cè)估計(jì) (例如,用米特拉陷波濾波器實(shí)現(xiàn)),從而提供所述信號(hào)路徑上的低延遲(這對(duì)于諸如揚(yáng)聲 器電話的應(yīng)用是希望的)。
[0052] 應(yīng)用包括用于揚(yáng)聲器電話模式的信號(hào)處理,用于智能手機(jī)、助聽(tīng)器、汽車語(yǔ)音控 制、消費(fèi)電子產(chǎn)品(例如,電視、微波爐)控制和其他通信或自動(dòng)語(yǔ)音處理(例如,語(yǔ)音識(shí) 另1J)任務(wù)。
[0053] 一個(gè)或多個(gè)方面的優(yōu)點(diǎn)可以包括以下內(nèi)容。
[0054] 該方法可以利用間隔很近的傳聲器,以及不適于傳統(tǒng)波束形成方法的其他配置。
[0055] 機(jī)器學(xué)習(xí)和概率圖形建模技術(shù)可以提供高性能(例如,高級(jí)別的信號(hào)增強(qiáng)、輸出 信號(hào)的語(yǔ)音識(shí)別準(zhǔn)確度、虛擬輔助智能等)。
[0056] 該方法可降低自動(dòng)語(yǔ)音識(shí)別的錯(cuò)誤率,提高移動(dòng)電話(智能電話)在揚(yáng)聲器電話 模式中的清晰度,提高在呼叫模式中的清晰度,和/或改進(jìn)音頻輸入以口頭喚醒。該方法還 可以啟用智能傳感器處理,用于設(shè)備環(huán)保意識(shí)。該方法可以特別定制用于由風(fēng)噪聲引起的 信號(hào)衰減。
[0057] 在其中遠(yuǎn)程從設(shè)備執(zhí)行某些語(yǔ)音識(shí)別的客戶端-服務(wù)器的語(yǔ)音識(shí)別架構(gòu)中,該方 法可以較低的延遲改進(jìn)自動(dòng)語(yǔ)音識(shí)別(即在聽(tīng)筒中做更多,在空氣中較少)。
[0058] 該方法可以被實(shí)現(xiàn)為非常低功率的音頻處理器,它具有靈活的體系結(jié)構(gòu),其允許 例如軟件的算法整合。該處理器可以包括用于先進(jìn)算法的集成硬件加速器,例如,概率推理 引擎、低功率FFT、低延遲濾波器組、和梅爾頻率倒譜系數(shù)(MFCC)計(jì)算模塊。
[0059] 傳聲器的緊密間隔允許集成到非常小的封裝,例如,5X6X3毫米。
[0060] 本發(fā)明的其它特征和優(yōu)點(diǎn)從以下的描述以及權(quán)利要求是顯而易見(jiàn)的。
【附圖說(shuō)明】
[0061] 圖1是源分離系統(tǒng)的框圖;
[0062] 圖2A是智能電話應(yīng)用的圖;
[0063] 圖2B是汽車應(yīng)用的圖;
[0064] 圖3是到達(dá)計(jì)算的方向的框圖;
[0065] 圖4A-C是音頻處理系統(tǒng)的圖。
[0066] 圖5是流程圖。
【具體實(shí)施方式】
[0067]在一般情況下,本文描述的多個(gè)實(shí)施例針對(duì)接收音頻信號(hào)(例如,獲取聲信號(hào)), 并處理該信號(hào)以從特定源分離出(例如,提取,識(shí)別)信號(hào)的問(wèn)題,例如用于在通信系統(tǒng)上 通信所提取的音頻信號(hào)(例如,電話網(wǎng)絡(luò))或使用基于計(jì)算機(jī)的分析處理的目的(例如,自 動(dòng)語(yǔ)音識(shí)別和自然語(yǔ)言理解)。參照?qǐng)D2A-B,這些方法的應(yīng)用可用于個(gè)人計(jì)算設(shè)備,諸如使 用傳聲器110采集和處理用戶的語(yǔ)音信號(hào)的智能電話210,它具有多個(gè)元件112 (任選地包 括一種或多種其它多元件110A),或在處理駕駛員的語(yǔ)音信號(hào)的車輛250中。如下面進(jìn)一步 描述地,傳聲器傳遞信號(hào)到模數(shù)轉(zhuǎn)換器132,以及信號(hào)然后使用處理器212進(jìn)行處理,它實(shí) 現(xiàn)信號(hào)處理單元120并利用推理處理器140,這可以使用處理器212實(shí)施,或在一些實(shí)施例 中可以至少部分實(shí)施在專用電路或在遠(yuǎn)程服務(wù)器220中。通常,來(lái)自關(guān)注源的所需信號(hào)和 其他干擾信號(hào)被嵌入在所獲取的傳聲器信號(hào)中。干擾信號(hào)的示例包括來(lái)自其它揚(yáng)聲器的聲 音信號(hào)和/或環(huán)境噪聲,諸如車輛風(fēng)聲或道路噪聲。在一般情況下,在此描述的信號(hào)分離方 法應(yīng)被理解為在各種實(shí)施例中包括或?qū)嵤?duì)所接收或獲取的聲信號(hào)的信號(hào)增強(qiáng)、源分離、 降噪、非線性波束形成和/或其他修改。
[0068] 可用于從干擾信號(hào)分離所需源的信號(hào)的信息包括到達(dá)方向的信息,以及關(guān)注源的 信號(hào)和/或干擾信號(hào)的預(yù)期結(jié)構(gòu)信息。到達(dá)方向的信息包括涉及在源和多個(gè)物理分離的聲 學(xué)傳感器(例如,傳聲器元件)的每個(gè)之間的信號(hào)傳播時(shí)間上差異的相對(duì)相位或延遲信息。
[0069] 關(guān)于以下術(shù)語(yǔ),術(shù)語(yǔ)"傳聲器"一般用于例如指測(cè)量某點(diǎn)的聲音的理想化音響傳感 器,以及指?jìng)髀暺鞯膶?shí)際實(shí)施例,例如制造為微機(jī)電系統(tǒng)(MEMS),具有已通過(guò)聲學(xué)端口耦合 到聲學(xué)環(huán)境的移動(dòng)微型機(jī)械隔膜(diaphram)的元件。當(dāng)然,也可以使用其他的傳聲器技術(shù) (例如,基于光學(xué)的聲傳感器)。
[0070] 作為簡(jiǎn)單的例子,如果兩個(gè)傳聲器相距距離d,然后直接從源成90度到達(dá)它們之 間線路的信號(hào)將沒(méi)有相對(duì)相位或延遲地接收,而從遙遠(yuǎn)的源以0 =45度到達(dá)的信號(hào)具有1 =dsin0的路徑差,則傳播時(shí)間之差為1/c,其中c是聲音的速度(在20度的溫度下,343 米/秒)。因此,相距d= 3mm的傳聲器和入射角0 =45度的相對(duì)延遲大約是(dsin0)/ c= 6ms,以及波長(zhǎng)A對(duì)應(yīng)于相位差(J) = 2JT1/A= (2Jrd/A)sin0。例如,對(duì)于分離d = 3mm以及波長(zhǎng)A= 343mm(例如,1000赫茲信號(hào)的波長(zhǎng)),相位差巾= 0.038弧度,或傘 =2. 2度。應(yīng)當(dāng)認(rèn)識(shí)到:在隨時(shí)間變化的輸入信號(hào)中這樣小的延遲或相位差的估計(jì)可導(dǎo)致 具有相對(duì)高的誤差(估計(jì)噪聲)的時(shí)間和頻率的本地估計(jì)。注意:如果具有更大的分離,延 遲和相對(duì)相位增加,使得如果傳聲器元件相距d= 30mm而不是d= 3mm時(shí),則在以上示例 中的相位差將是巾=22度,而不是巾=2.2度。然而,如下面所討論地,緊密間隔可超過(guò) 更大相位差的傳聲器元件是有利的,其可以更容易地估計(jì)。還需要注意:在更高的頻率(例 如,超聲波),以45度角的入射角的lOOkHZ信號(hào)具有約巾= 220度,它可以甚至與廣告為 3mm傳感器分離更可靠的估計(jì)的相位差。
[0071] 如果到達(dá)方向具有兩個(gè)自由度(例如,方位角和仰角),那么需要三個(gè)傳聲器以確 定到達(dá)方向(理論上在兩個(gè)圖像的一個(gè)內(nèi),一個(gè)在傳聲器的平面的兩側(cè)中的任一側(cè))。
[0072] 應(yīng)當(dāng)理解:在實(shí)踐中,在多個(gè)傳聲器接收的信號(hào)的相對(duì)相位不一定遵循上面概述 的類型的理想化模型。因此,當(dāng)在本文中使用術(shù)語(yǔ)"到達(dá)方向信息"時(shí),應(yīng)廣義地理解為包括 體現(xiàn)從源位置到多個(gè)傳聲器元件的信號(hào)路徑的差異之間的信息,即使不按照上述引入的簡(jiǎn) 化模型。例如,如下文參照至少一個(gè)實(shí)施例所討論地,到達(dá)方向信息可以包括相對(duì)相位的圖 案,其是特定源在特定位置相對(duì)于傳聲器的簽名,即使該模式不遵循簡(jiǎn)化的信號(hào)傳播模型。 例如,從源到傳聲器的聲學(xué)路徑可能受到如下影響:聲端口的形狀、端口在設(shè)備的面上的凹 陷(例如,智能電話的面板)、設(shè)備主體的閉塞(例如,設(shè)備后面的源)、源的距離、反射(例 如,從房間壁)以及聲音傳播領(lǐng)域的技術(shù)人員將認(rèn)識(shí)到的其他因素。
[0073] 用于信號(hào)分離的另一個(gè)信息來(lái)源來(lái)自關(guān)注信號(hào)的結(jié)構(gòu)和/或干擾源的結(jié)構(gòu)。例 如在系統(tǒng)的操作期間,該結(jié)構(gòu)可以基于源的聲音產(chǎn)生方面的理解已知和/或可以根據(jù)經(jīng)驗(yàn) 確定。語(yǔ)音源的結(jié)構(gòu)的例子可包括方面:諸如在有聲語(yǔ)音中由于周期激勵(lì)的諧波頻譜結(jié)構(gòu) 的存在,在擦音和爆破音期間的寬帶噪聲狀激勵(lì),以及具有特定像言語(yǔ)特性的頻譜包絡(luò),例 如具有特征共振(即共振)峰。語(yǔ)音源也可具有時(shí)間結(jié)構(gòu),例如,根據(jù)語(yǔ)音的詳細(xì)語(yǔ)音內(nèi)容 (即,特定單詞口語(yǔ)的聲學(xué)語(yǔ)音結(jié)構(gòu)),或更一般地更粗的性質(zhì),包括聲學(xué)口語(yǔ)的節(jié)奏和特 性定時(shí)以及語(yǔ)音結(jié)構(gòu)。非語(yǔ)音聲源還可以具有公知的結(jié)構(gòu)。在汽車的示例中,道路噪聲可 以具有特征光譜形狀,其可以是驅(qū)動(dòng)條件的函數(shù),諸如轉(zhuǎn)速,或暴雨期間的雨刷可具有特性 的周期性性質(zhì)??蓱{經(jīng)驗(yàn)推斷的結(jié)構(gòu)可以包括揚(yáng)聲器的特定光譜特性(例如,關(guān)注的揚(yáng)聲 器或干擾揚(yáng)聲器的音調(diào)或整體光譜分布)或干擾噪聲源的光譜特性(例如,室內(nèi)的空氣調(diào) 節(jié)單元)。
[0074] 下面的一些實(shí)施例使用相對(duì)緊密間隔的傳聲器(例如,d彡3mm)。這種緊密的間 距可產(chǎn)生到達(dá)方向的相對(duì)不可靠的估算,作為時(shí)間和頻率的函數(shù)。該到達(dá)方向的信息可不 單獨(dú)足夠用于根據(jù)其到達(dá)方向分離期望信號(hào)。信號(hào)的結(jié)構(gòu)信息也可不單獨(dú)足夠用于根據(jù)它 的結(jié)構(gòu)或干擾信號(hào)的結(jié)構(gòu)分離期望信號(hào)。
[0075] -些實(shí)施例聯(lián)合使用到達(dá)方向信息和聲音結(jié)構(gòu)信息用于源分離。雖然方向信息和 結(jié)構(gòu)信息都不單獨(dú)足以足夠好的源分離,它們的協(xié)同作用提供了非常有效的源分離方法。 這種組合方法的優(yōu)點(diǎn)在于:不一定需要遠(yuǎn)隔(例如,30_)的傳聲器,因此可以使用具有多 個(gè)密切相隔(例如,1.5_,2. 5mm,3mm間距)集成傳聲器元件的集成設(shè)備。作為例子,在智 能手機(jī)應(yīng)用中,利用集成緊密間隔傳聲器元件可避免需要多個(gè)傳聲器和用于智能手機(jī)的屏 面的聲學(xué)端口的對(duì)應(yīng)開(kāi)口,例如在設(shè)備的最遠(yuǎn)角落或者在車輛中應(yīng)用中,可使用在頂篷或 后視鏡的單個(gè)傳聲器位置。當(dāng)多個(gè)獨(dú)立傳聲器分別安裝在系統(tǒng)中時(shí),減少傳聲器位置的數(shù) 量(每個(gè)都具有多個(gè)傳聲器元件的傳聲器設(shè)備的位置)可以減少互連電路的復(fù)雜性,并能 提供傳聲器元件之間可預(yù)測(cè)的幾何關(guān)系和難以實(shí)現(xiàn)的匹配機(jī)械和電特性。
[0076] 參照?qǐng)D1,音頻處理系統(tǒng)100的實(shí)施例使用上方所引入的技術(shù)的組合。具體而言, 該系統(tǒng)使用多元件傳聲器110,其感測(cè)在多個(gè)非常緊密間隔(例如,在毫米范圍)的點(diǎn)的聲 信號(hào)。示意性地,每個(gè)傳聲器元件112a_d經(jīng)由聲學(xué)端口 112a_d感測(cè)聲場(chǎng),使得每個(gè)元件感 測(cè)在不同位置的聲場(chǎng)(任選以及或代替基于端口的物理結(jié)構(gòu)的不同方向特性)。在圖1的 示意圖中,傳聲器元件示于線性陣列,但當(dāng)然元件的其它平面或三維布置也是有用的。
[0077] 該系統(tǒng)還使用推理系統(tǒng)136,例如使用置信傳播,其例如根據(jù)時(shí)間和頻率識(shí)別在一 個(gè)或多個(gè)傳聲器元件接收到的信號(hào)的分量,以從其他干擾信號(hào)分離期望的聲源的信號(hào)。請(qǐng) 注意:在下面的討論中,從緊密間隔的傳聲器接收多個(gè)信號(hào)和分離信號(hào)的方法一起描述,但 它們可以彼此獨(dú)立地使用,例如,使用具有更廣泛隔開(kāi)的推理組件,或具有多個(gè)緊密間隔元 件的傳聲器使用不同的方法來(lái)確定所需組件的時(shí)間-頻率圖。此外
當(dāng)前第2頁(yè)1 2 3 4 5 6 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
九龙城区| 新郑市| 高阳县| 汨罗市| 抚顺县| 离岛区| 四子王旗| 家居| 麻江县| 乌兰察布市| 株洲市| 朝阳县| 香格里拉县| 长丰县| 纳雍县| 贺兰县| 岚皋县| 嫩江县| 苏尼特右旗| 日照市| 舞钢市| 高雄县| 铜川市| 西充县| 宣城市| 昭通市| 新和县| 汕尾市| 改则县| 乌拉特前旗| 威信县| 叙永县| 临邑县| 五台县| 舒兰市| 南召县| 裕民县| 镇安县| 当阳市| 汕头市| 武宁县|