專利名稱:提高聲音清晰度的系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻再現(xiàn)應(yīng)用,其中期望的音頻信號(hào)以無污染的形式. 獲得并且干擾(例如環(huán)境噪聲)作為聲音信號(hào)出現(xiàn)。
背景技術(shù):
在聲音嘈雜的環(huán)境中,收聽者難以聽到所想要的聲音信號(hào)或"興 趣信號(hào)"。例如,在汽車?yán)锏氖謾C(jī)用戶通過他們的耳機(jī)可能難以聽清 所接收的語音信號(hào),因?yàn)槠嚨脑肼暺帘瘟伺d趣信號(hào)(即手機(jī)所接收 的語音信號(hào))。為了解決這一問題,過去曾經(jīng)進(jìn)行了許多嘗試。其中 一些簡(jiǎn)要地描述如下-
(a) 被動(dòng)噪聲衰減耳機(jī)用于耳機(jī)應(yīng)用的特定應(yīng)用場(chǎng)合,由將環(huán)
境聲音噪聲與收聽者的耳朵以物理方式隔離的大而笨重的耳罩提供無 源噪聲衰減。
(b) 放大放大輸入的感興趣的電信號(hào)以克服背景噪聲的強(qiáng)度。 如果控制不適當(dāng),可能導(dǎo)致有害的高聲輸出強(qiáng)度。并且,除非很好地 控制了放大工作,否則不能提供所希望的好處。
(C)過濾信號(hào)被靜態(tài)地過濾,使其更清晰。
(d) 簡(jiǎn)單自動(dòng)增益控制(AGC):興趣信號(hào)通過自動(dòng)增益控制系 統(tǒng),其中根據(jù)耳罩內(nèi)或耳罩外的噪聲強(qiáng)度測(cè)量調(diào)節(jié)增益。這種AGC增
益通常通過簡(jiǎn)單測(cè)量整體噪聲強(qiáng)度來控制。
(e) 主動(dòng)噪聲清除(ANC):產(chǎn)生抗噪聲(用開環(huán)或閉環(huán)伺服系 統(tǒng)產(chǎn)生的)并有聲地施加給噪聲信號(hào)。對(duì)于耳機(jī)的應(yīng)用,參見Bose, Amar等人的"Headphoning"(美國專利4,455,675, 1984年6月19日) Reduction in Headphone System", (Headwize技術(shù)論文庫,1999)。
(f)有時(shí)候,這些方法相結(jié)合耳機(jī)應(yīng)用的一個(gè)通常方案是將被動(dòng) 噪聲衰減耳機(jī)和ANC系統(tǒng)相結(jié)合(見Bose, Amar等人的"Headphoning", (美國專利4455675, 1984年6月19日))。
雖然在多種應(yīng)用中,這些方法是很有效的,并且能減少噪聲,但這 些方法并不總是是合適的。例如,ANC需要精確的噪聲基準(zhǔn)(reference), 該噪聲基準(zhǔn)有時(shí)可能得不到,并且其只在低頻下工作。被動(dòng)噪聲衰減只 有在具有足夠的隔音空間時(shí)才能有效地工作。過濾使信號(hào)頻率成分失 真。AGC系統(tǒng)沒有考慮人的聽力系統(tǒng)并產(chǎn)生次優(yōu)化結(jié)果。同時(shí),即使能 夠應(yīng)用這些方案的,也存在著由于這些方案的能量消耗過大而受到限制 的場(chǎng)合,所以需要小型化,低能量的技術(shù)。
Yoimg-cheol Park等人("具有心理聲學(xué)響度校正的高性能數(shù)字式 助聽器處理器",ICCE, International Conference on Consumer Electronics, 1997,頁313-313,XP010249998)公開了一種執(zhí)行非線性響度校正的數(shù)字 式助聽器處理器。Young-cheol Park等人處理輸入信號(hào)以調(diào)節(jié)其響度。
WO 98 47315 A在圖2中公開了一種噪聲減小裝置,其具有一個(gè)方 框,用來將輸入10變換成頻率域的窗式頻率變換方框32, 一個(gè)用于檢 測(cè)來自輸入10的聲音的聲音檢測(cè)34, 一個(gè)噪聲頻譜估計(jì)38和一個(gè)疊加 再合成單方框44。
美國專利5,388,185在圖2公開了一種自適應(yīng)處理聲音信號(hào)的系統(tǒng)。 在步驟30,語音信號(hào)樣本被置于時(shí)域中的四個(gè)重疊緩沖器的一個(gè)之中。 然后,每個(gè)緩沖器用Hamming窗(用于變換成頻率域)修正。在步驟 40、 50、 90,該系統(tǒng)執(zhí)行快速傅立葉變換(FFT)、頻譜修正和快速傅 立葉反變換(IFFT)。在步驟100,四個(gè)重疊緩沖器相加以重構(gòu)修改的 語音信號(hào)。
WO 00 65872 A在圖3公開了一種響度正常化控制系統(tǒng),其具有一 個(gè)將時(shí)域的聲音信號(hào)變換成頻率域的濾波器組電路42, 一個(gè)信號(hào)處理器 46和一個(gè)合成濾波器50 (圖3)。
ScheiderT等人("用于數(shù)字式助聽器的多通道壓縮策略",1977, IEEE, International Conference on Acoustics, Speech, and Signal Processing:
ICASSP-97,頁411-414, XP010226222, Munich Germany, Los Alamitos CA, USA, IEEE Comput., SOC, ISBN: 0-8186-7919-0)公開了一種壓縮系
統(tǒng),其使用了一個(gè)過采樣的、多相離散傅立葉變換(DFT)濾波器組和 一個(gè)合成濾波器組。
然而,還需要提供一種革新方法,使得可以克服干擾信號(hào)(諸如噪 聲)而提高信號(hào)清晰度。
因此,需要解決上面提到的這些問題并且還需要一種改進(jìn)的方法以 提高和/或取代現(xiàn)有的技術(shù)。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種提高信號(hào)質(zhì)量和信號(hào)清晰度的新穎方法 和系統(tǒng)。
根據(jù)本發(fā)明的一方面,提供了 一種克服干擾信號(hào)的提高信號(hào)清晰度 的系統(tǒng),其包括 一個(gè)分析濾波器組,用于將時(shí)域中的信息信號(hào)轉(zhuǎn)換成 轉(zhuǎn)換域中的多通道信息信號(hào); 一個(gè)信號(hào)處理器,用于處理分析濾波器組
的輸出,該信號(hào)處理器包括一個(gè)利用心理聲學(xué)模型計(jì)算動(dòng)態(tài)范圍的心理
聲學(xué)處理器,以提供克服干擾信號(hào)的可聽的信息信號(hào);和一個(gè)合成濾波 器組,用于混合信號(hào)處理器的輸出,以產(chǎn)生輸出信號(hào)。
本發(fā)明的信號(hào)清晰度增強(qiáng)(SIE)的設(shè)計(jì)使得減小了現(xiàn)有技術(shù)裝置 的不利因素和缺點(diǎn)。它可以用于噪聲信號(hào)相對(duì)于興趣信號(hào)很強(qiáng)的環(huán)境 中。這種環(huán)境導(dǎo)致能得到的動(dòng)態(tài)范圍非常有限。雖然可以利用以往系統(tǒng) 的簡(jiǎn)單動(dòng)態(tài)范圍壓縮方法將興趣信號(hào)映射到這個(gè)很小的動(dòng)態(tài)范圍中,但 是所得到信號(hào)的保真度和質(zhì)量可能受到影響。在這種情況下,施加使興 趣信號(hào)克服不良噪聲而可被聽見所需要的最小增益(因而更清晰),造 成了信號(hào)質(zhì)量的提高。因此本發(fā)明涉及確定和應(yīng)用這個(gè)最小增益。
根據(jù)本發(fā)明,SIE處理包括一個(gè)心理聲學(xué)模型,它在工作進(jìn)行中,
計(jì)算要使興趣信號(hào)克服不良噪聲而可被聽見所必須施加的最小放大值。 這樣得到較好的保真度和信號(hào)質(zhì)量。
根據(jù)本發(fā)明,信號(hào)清晰度增強(qiáng)(SIE)算法通過測(cè)量(1)外部干擾 (不良信號(hào)、噪聲)強(qiáng)度或(2)頭戴式耳機(jī)耳罩中的或耳道中的干擾 (不良信號(hào)、噪聲)強(qiáng)度,自適應(yīng)地調(diào)節(jié)興趣信號(hào)(電的)的增益和平 衡,以使興趣信號(hào)的清晰度和可聽性提高。這些強(qiáng)度測(cè)量是單獨(dú)利用頻 段級(jí)別或綜合利用本領(lǐng)域的已知技術(shù)來進(jìn)行,這些技術(shù)描述在Schneider, ToldA.的"自適應(yīng)動(dòng)態(tài)控制器"(MASc論文集,加拿大安大略省,滑 鐵盧大學(xué),1991) ; Schneider和Brennan的"用于數(shù)字助聽器的壓縮策 略"(Proc.ICASSP 1997,德國,慕尼黑);和Schmidt, John的"音頻 信號(hào)的動(dòng)態(tài)范圍壓縮裝置"(美國專利5832444號(hào))中已經(jīng)說明。
總的來說,通過利用本發(fā)明,使用者接收的信號(hào)的SNR (信噪比) 得到了提高,并且其不斷地適應(yīng)使用者的環(huán)境,提供的興趣信號(hào)強(qiáng)度是 令人舒適的。這樣就提高了信號(hào)清晰度,提高了感知信號(hào)質(zhì)量,并減少 使用者的疲勞。
為了提供最好的保真度,超微型的尺寸和最低的功率消耗,優(yōu)選地, SIE算法利用過釆樣濾波器組實(shí)現(xiàn),以將興趣信號(hào)和不良信號(hào)分成若干 個(gè)交疊的、相鄰的或不交疊的波段。在Schneider和Brennan的美國專利 6,236,731 "用于過濾信息信號(hào)并將信息信號(hào)分成不同波段的濾波器組結(jié) 構(gòu)和方法,特別是用于助聽器的音頻信號(hào)上述結(jié)構(gòu)和方法"中說明了一 種合適的過采樣濾波器組。有利地實(shí)現(xiàn)該設(shè)計(jì)的結(jié)構(gòu)組合了一個(gè)加權(quán)疊 加(WOLA)濾波器組、 一個(gè)可編程軟件DSP芯、 一個(gè)輸入-輸出處理 器和非易失存儲(chǔ)器。在Schneider和Brennan的美國專利6,240,192 "包
括應(yīng)用特定的集成電路和可編程數(shù)字信號(hào)處理器的數(shù)字助聽器中的過 濾裝置和方法"已說明了這種結(jié)構(gòu)。
在任何需要提高含有大量噪聲的所接收音頻信號(hào)的清晰度,同時(shí)要 保持高保真度和良好的信號(hào)質(zhì)量的場(chǎng)合,都可以使用本發(fā)明。本發(fā)明的 典型應(yīng)用包括用于呼叫中心的耳機(jī)、在噪聲環(huán)境(例如飛機(jī)、音樂會(huì)、 工廠等)中使用的移動(dòng)電話和其他微型/便攜式音頻裝置。
參考下面的說明書、權(quán)利要求和附圖可以進(jìn)一步理解本發(fā)明的其他 特征、方面和優(yōu)點(diǎn)。
下面將參考附圖描述本發(fā)明的實(shí)施例,其中 圖1示出了用于接收算法的典型情況;
圖2是將興趣信號(hào)的動(dòng)態(tài)范圍映射成可獲得的動(dòng)態(tài)范圍的示意圖; 圖3示出根據(jù)本發(fā)明的信號(hào)清晰度增強(qiáng)的基本操作。
圖4示出根據(jù)本發(fā)明的SIE處理的高電平框圖,包括期望信號(hào)活動(dòng) 性檢測(cè)器(DSAD)(或聲音活動(dòng)性檢測(cè)器(VAD));
圖5示出利用自適應(yīng)噪聲估計(jì)的S正的框圖6示出利用不同譜線的噪聲估計(jì)的SIE的框圖7示出直線壓縮的輸入/增益函數(shù);
圖8示出一個(gè)具有相結(jié)合的SIE和ANC的本發(fā)明的實(shí)施例; 圖9是一個(gè)說明結(jié)合左右噪聲層(noise floor)的曲線圖IO示出具有傳輸算法能力的二進(jìn)制組合系統(tǒng);
圖11示出具有共享傳輸(Tx)傳聲器的開環(huán)SIE的框圖12示出具有共享傳輸(Tx)傳聲器和方向處理的開環(huán)SIE的框圖。
具體實(shí)施例方式
下面將具體參考收聽者使用的耳機(jī)描述優(yōu)選實(shí)施例,本發(fā)明主要用 于耳機(jī),但并不是只能用于耳機(jī)。
應(yīng)用于音頻收聽的信號(hào)處理算法通常稱之為"接收算法"(Rx), 因?yàn)槭章犝呦胍牭浇邮盏囊纛l信號(hào)。本發(fā)明的信號(hào)清晰度增強(qiáng)(SIE) 處理的一種典型應(yīng)用是用于噪聲環(huán)境的耳機(jī)。圖1示意地示出了該元件 和興趣信號(hào)。收聽者101收聽通常來自電信號(hào)107的期望聲音和環(huán)境(周 圍)噪聲110的合成,環(huán)境噪聲是使興趣信號(hào)的清晰度降低的不良信號(hào)。 由耳機(jī)115提供的被動(dòng)衰減減少了可聽到的環(huán)境噪聲強(qiáng)度。
如果在耳道中興趣信號(hào)的強(qiáng)度遠(yuǎn)低于噪聲信號(hào)的強(qiáng)度,那末興趣信 號(hào)被淹沒而聽不到。收聽者還具有覺得舒適的最大信號(hào)強(qiáng)度(響度不舒 適級(jí)一LDL) 。 LDL可以是簡(jiǎn)單的基于頻率的對(duì)不舒適級(jí)的測(cè)量(如本
帶寬之內(nèi)的信號(hào)^度、、頻率成分、、信號(hào)持續(xù)時(shí)l^或其他;目關(guān)心理聲學(xué)參 數(shù)的心理聲學(xué)響度的復(fù)雜測(cè)量。噪聲信號(hào)和LDL均為頻率的函數(shù),兩
者強(qiáng)度的差別在于有效動(dòng)態(tài)范圍,有效動(dòng)態(tài)范圍也是頻率的函數(shù)。由于 不良信號(hào)(即噪聲)的強(qiáng)度,收聽者感受到減小的動(dòng)態(tài)范圍。以與頻率 相關(guān)的方式再映射興趣信號(hào),增加興趣信號(hào)的強(qiáng)度使之高于周圍的噪 聲,興趣信號(hào)就可以被聽到。然而,放大作用必須使信號(hào)強(qiáng)度不能超出
使收聽者感到舒適的最大信號(hào)強(qiáng)度(LDL)。解決的方法是在出現(xiàn)環(huán)境 噪聲的情況下,將原始興趣信號(hào)的動(dòng)態(tài)范圍映射成可用的信號(hào)動(dòng)態(tài)范 圍。這種信號(hào)處理被稱為動(dòng)態(tài)范圍壓縮。在圖2中示出了單一頻段的這 種映射,在圖2中,期望(原始)動(dòng)態(tài)范圍210及其噪聲層215,與具 有被環(huán)境噪聲增大了的噪聲層225的不純動(dòng)態(tài)范圍220相比較。因此, 動(dòng)態(tài)范圍壓縮的目的是有意地使興趣信號(hào)的動(dòng)態(tài)范圍失真,但同時(shí)使感 覺到的失真最小。
下面參考圖3來說明作為頻率函數(shù)的一種動(dòng)態(tài)范圍壓縮操作的形 式。圖3以頻率300比任意強(qiáng)度305的比例的曲線形式,示出了期望興 趣信號(hào)310和不良(環(huán)境)噪聲315的頻譜。注意,在一定頻率320之 上,興趣信號(hào)310的強(qiáng)度下降,趨近并低于不良噪聲315。在系統(tǒng)中, 興趣信號(hào)310有選擇地,即取決于頻率和輸入強(qiáng)度,作為輸入強(qiáng)度地函 數(shù)被放大為330,以便高于噪聲層而能夠被聽到。多個(gè)交疊或不交疊的 頻段有利地實(shí)現(xiàn)了這一操作,這些頻段可以被單獨(dú)處理或組成為通道一 起處理。為完整起見,圖3還示出了前述的響度不舒適級(jí)(LDL) 340。
在下面對(duì)優(yōu)選實(shí)施例的描述中,在一個(gè)或多個(gè)分析濾波器組和合成 濾波器組之間的路徑應(yīng)當(dāng)認(rèn)為具有N維(dimension)(平行路徑),這 是因?yàn)橥ㄟ^分析濾波器組得到N個(gè)子頻段,每個(gè)都需要單獨(dú)的路徑。由 于要單獨(dú)考慮和操作每個(gè)子頻段,這種考慮也適用于設(shè)置在該濾波器組 之間的任何功能框。雖然通常N〉二 16,本發(fā)明特別適用于N〉1的情 況。在某些實(shí)施例中,這些N個(gè)子頻段組成為K個(gè)通道中,其中每個(gè) 通道包括一個(gè)或多個(gè)相鄰的子頻段,然后處理每個(gè)通道,使得在這個(gè)通 道內(nèi)的所有子頻段得到相同的增益。
參考圖4,圖4示出本發(fā)明的一個(gè)實(shí)施例的框圖,第一聲音輸入裝
置(信號(hào)傳聲器)401接收興趣信號(hào)(通常是語音),并且將它傳遞到 第一 WOLA分析濾波器組405。第二聲音輸入裝置(噪聲傳聲器)402 接收可能參有興趣信號(hào)的環(huán)境噪聲并將它傳遞到第二 WOLA分析濾波
器組406。第二聲音輸入裝置402通常位于耳道內(nèi)(所謂的閉環(huán)裝置 (implementation))或耳道外面(所謂開環(huán)裝置)。每個(gè)濾波器組將輸 入信號(hào)分成N個(gè)子頻段。
這些裝置之間的任何差別在下面的描述中被指出。在閉環(huán)裝置中, 由于信號(hào)路徑(例如,將聲音傳輸?shù)侥V圃诙鷻C(jī)中的揚(yáng)聲器中的聲管) 聲音的原因,已經(jīng)包括了平衡。相反,在開環(huán)裝置中,由于頭戴式耳機(jī) 耳罩的衰減和頻率響應(yīng)以及聲音信號(hào)路徑的原因,包含從傳聲器到耳道 內(nèi)的傳遞函數(shù)模型。也可以包括輸出級(jí)的模型,使得在任何自適應(yīng)平衡 之前,可能出現(xiàn)在耳道中的興趣信號(hào)的強(qiáng)度能夠被逼近。
在開環(huán)裝置中,可以使用單獨(dú)或共享的環(huán)境噪聲傳聲器。在利用共 享傳聲器的情況下,可以使用同一個(gè)揚(yáng)聲器傳輸信號(hào)(例如,應(yīng)用耳機(jī) 中傳輸語音)。這就減少了成本并簡(jiǎn)化了機(jī)械結(jié)構(gòu)。在這種情況下,需 要有一個(gè)信號(hào)或噪聲活動(dòng)性(activity)檢測(cè)器,以確保噪聲頻譜估計(jì)不 包含任何傳輸信號(hào)。
在運(yùn)行中,包含在心理聲學(xué)處理方框430中的心理聲學(xué)模型以頻率 子頻段的方式或以組合的頻率子頻段(通道)方式接收興趣信號(hào)強(qiáng)度, 該頻率子頻段覆蓋由第一 (興趣信號(hào))WOLA分析濾波器組405產(chǎn)生的 期望信號(hào)頻譜。然后,使用這些相同頻段或組合頻段(通道)中的環(huán)境 噪聲強(qiáng)度,但被應(yīng)用于由第二 (環(huán)境噪聲)WOLA分析濾波器組產(chǎn)生的 環(huán)境噪聲頻譜的心理聲學(xué)處理方框430計(jì)算動(dòng)態(tài)范圍參數(shù)。這些計(jì)算出 的參數(shù)被送到多段壓縮器420,多段壓縮器又將他們施加到由第一 (興 趣信號(hào))WOLA分析濾波器組405得到的子頻段。然后多段壓縮器420 利用由心理聲學(xué)處理方框430提供的動(dòng)態(tài)范圍參數(shù)去平衡作為頻率函數(shù) 的信號(hào),從而改進(jìn)可聽見性或清晰度。利用與已知的動(dòng)態(tài)范圍壓縮技術(shù) 相結(jié)合的心理聲學(xué)模型,確保了輸出音頻克服環(huán)境噪聲而被清晰地聽 見,同時(shí)使感覺到的失真最小,并保持期望信號(hào)的質(zhì)量。期望信號(hào)活動(dòng) 性檢測(cè)器(DSAD)方框410接收來自WOLA分析濾波器405、 406的 輸出,并利用頻譜估計(jì)方框435將更新控制到噪聲頻譜的估計(jì)。以下說 明的該頻譜估計(jì)方框435為心理聲學(xué)處理方框430提供進(jìn)一步信息。多 段壓縮器420的輸出被提供給合成濾波器組450。合成濾波器組450將 多段壓縮器420的輸出轉(zhuǎn)換,以輸出一個(gè)時(shí)域音頻信號(hào)。
噪聲估計(jì)
對(duì)在心理聲學(xué)處理方框430中進(jìn)行的SIE信號(hào)處理的一個(gè)重要輸入 是由第二輸入裝置402提供的環(huán)境噪聲頻譜。本發(fā)明的SIE處理頻譜估 計(jì)方框435包括一種自適應(yīng)估計(jì)技術(shù)或頻譜差分技術(shù)。結(jié)合期望信號(hào)功 率檢測(cè)器(DSAD) 410,這些技術(shù)對(duì)要確定的環(huán)境噪聲頻譜提供精確的 不參雜的估計(jì)。在另一個(gè)優(yōu)選實(shí)施例中,環(huán)境噪聲是用共享的輸入傳聲 器獲得的(見下文)。
在開環(huán)的情況下,噪聲估計(jì)是由共享或單獨(dú)傳聲器完成的。共享或 單獨(dú)傳聲器上的DSAD或VAD以從共享或單獨(dú)傳聲器經(jīng)頻譜分析得到 的噪聲頻譜估計(jì)來控制更新。如果在共享或單獨(dú)傳聲器上檢測(cè)到語音 (或某些其他興趣信號(hào)),那末噪聲的頻譜估計(jì)不進(jìn)行更新(注意,在 開環(huán)情況下不使用頻譜差分和自適應(yīng)估計(jì))。
在閉環(huán)情況下,位于耳罩內(nèi)的傳聲器接收的是信號(hào)加噪聲的混合形 式。在這種情況下,我們需要將信號(hào)去除(這是已知的,因?yàn)槲覀冇须?形式的信號(hào))。這是利用頻譜差分和自適應(yīng)估計(jì)技術(shù)來實(shí)現(xiàn)的。
期望信號(hào)活動(dòng)性檢測(cè)器(DSAD)
DSAD410利用本領(lǐng)域共知的技術(shù),在不存在興趣信號(hào)時(shí)(即,在 期望信號(hào)暫?;蛑袛鄷r(shí))對(duì)信號(hào)頻譜采樣。這樣確保算法不把期望信 號(hào)(或在具有共享傳聲器的耳機(jī)應(yīng)用情況下,所傳輸?shù)恼Z音)當(dāng)作環(huán) 境噪聲的一部分。
在使用閉環(huán)裝置的實(shí)施例中,當(dāng)DSAD 410指示沒有期望興趣信
號(hào)出現(xiàn),噪聲頻譜圖像被更新,從而使得結(jié)果頻譜被興趣信號(hào)參雜得
最少。在利用開環(huán)裝置的另一個(gè)實(shí)施例中,DSAD 410可以有選擇地
監(jiān)控環(huán)境噪聲信號(hào),以確保傳輸語音或其他興趣信號(hào)不會(huì)參雜作為對(duì) 心理聲學(xué)模型的輸入所提供的噪聲頻譜。
在閉環(huán)裝置中,如果噪聲頻譜在某些預(yù)定的時(shí)間內(nèi)沒有被更新, 那末,輸出音頻可以在短時(shí)間內(nèi)有選擇地凈噪,使得在沒有期望信號(hào) 出現(xiàn)時(shí),噪聲頻譜能夠被更新。結(jié)合定時(shí)更新(需要時(shí))使用DSAD, 確保噪聲頻譜總是最新的,并且絕不參雜有期望信號(hào)頻譜。
自適應(yīng)噪聲估計(jì)
在本發(fā)明的一個(gè)優(yōu)選實(shí)施例中,利用采用了本領(lǐng)域已知技術(shù)的自
適應(yīng)噪聲估計(jì)來估計(jì)環(huán)境噪聲,但是,在過采樣的WOLA子頻段濾波 器組的情況下,也可以使用一種技術(shù),這種技術(shù)在由本申請(qǐng)人同一天 申請(qǐng)的一起尚待批準(zhǔn)的序列號(hào)為2,354,808的加拿大專利申請(qǐng)中己作了 說明,其名稱為"在過釆樣濾波器組中的子頻段自適應(yīng)處理",其美 國申請(qǐng)?zhí)枮閤xxxxxx,在此結(jié)合該專利公開的內(nèi)容作為參考。
圖5示出了具有自適應(yīng)估計(jì)的S正的框圖。雖然描述了時(shí)域技術(shù), 但本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)明白,變換(例如,頻率)域技術(shù)也是可能 的并且是有利的。電子形式的期望信號(hào)501被傳遞到第一分析濾波器 組503,該濾波器組產(chǎn)生多個(gè)如前面的實(shí)施例中的子頻段。然后每個(gè)子 頻段被乘法器505用從心理聲學(xué)模型507得到的函數(shù)G相乘。施加增 益的結(jié)果轉(zhuǎn)而傳遞到合成濾波器組509,該濾波器組轉(zhuǎn)換來自子頻段修 改的信號(hào)并將該輸出傳遞到驅(qū)動(dòng)接收器513的功率放大器511。物理位 置接近于接收器513的傳聲器520將其輸出送出到一個(gè)自適應(yīng)相關(guān)器 525,其中該輸出是參有包括環(huán)境噪聲的各種噪聲成分的期望信號(hào)。作 為噪聲信號(hào)的估計(jì),對(duì)自適應(yīng)相關(guān)器525的輸出被第二合成濾波器組 530分解成子頻段。來自第二合成濾波器組530的子頻段也被傳遞到心 理聲學(xué)模型框507。如上所述,自適應(yīng)估計(jì)也可以在轉(zhuǎn)換域中進(jìn)行。
自適應(yīng)噪聲估計(jì)不需要中斷興趣信號(hào)來估計(jì)噪聲。噪聲是利用從 傳聲器520得到的參雜信號(hào)和期望電輸入信號(hào)501 (興趣信號(hào))之間的 相關(guān)性連續(xù)地估計(jì)的。自適應(yīng)相關(guān)器525的輸出主要包含期望信號(hào)501 和期望信號(hào)加噪聲520之間不相關(guān)的信號(hào)成分。
利用頻譜差分的噪聲估計(jì)
頻譜差分是取興趣信號(hào)的變換域形式與環(huán)境噪聲的變換域形式的 過濾或未過濾形式之間的差。這個(gè)減法可以在頻段或頻段組進(jìn)行。這 種估計(jì)方法在閉環(huán)裝置(見下文)中特別有利,由于環(huán)境噪聲和S正 處理的興趣信號(hào)的聲學(xué)累加,在閉環(huán)裝置中環(huán)境噪聲信號(hào)也包含有興 趣信號(hào)。
采用對(duì)興趣信號(hào)的過濾能夠得到更精確的估計(jì)。當(dāng)濾波器具有與
輸出級(jí)(SIE平衡、放大器、揚(yáng)聲器和聲音)以及傳聲器的頻率響應(yīng)相 等或近似相等的頻率響應(yīng)時(shí),那么變換域中的減法對(duì)未參雜的(用興 趣信號(hào))環(huán)境噪聲提供了極佳的近似。這種過濾可以有選擇地包括對(duì) 于零輸出(null-out)變換器和其他差值的校準(zhǔn),并且可以用離線或在 線技術(shù)來實(shí)現(xiàn)。
和自適應(yīng)估計(jì)一樣,頻譜差分不需要中斷期望信號(hào)來估計(jì)噪聲一 一噪聲是利用兩個(gè)信號(hào)之間的頻譜差別連續(xù)地估計(jì)。圖6示出了這樣 一種系統(tǒng),其中引入了新的函數(shù)F' 605,該函數(shù)逼近分析濾波器組601 和接收器614之間的信號(hào)路徑的整體傳遞函數(shù)F 610。信號(hào)路徑包括一 個(gè)乘法器611 、 一個(gè)合成濾波器612、 一個(gè)功率放大器613和接收器614 本身。采樣傳聲器620將代表期望信號(hào)加任何引進(jìn)噪聲的信號(hào)送入第 二濾波器組625,第二濾波器組的輸出與作用在期望信號(hào)適當(dāng)子頻段的 函數(shù)F' 605的結(jié)果相結(jié)合,以產(chǎn)生噪聲估計(jì)630,噪聲估計(jì)630被輸 送到心理聲學(xué)模型635。然后來自心理聲學(xué)模型635的增益輸出與每個(gè) 子頻段在乘法器611中相乘。
圖6a示出N個(gè)子頻段被組合進(jìn)K個(gè)通道中的另一個(gè)實(shí)施例,并 且引進(jìn)另一個(gè)與耳機(jī)性能特性估計(jì)相關(guān)的函數(shù)。對(duì)于重復(fù)圖6中函數(shù) 的那些組件,不再加以說明。分析濾波器601、 625的N個(gè)輸出子頻段 被傳遞到頻段成組框603、 627,頻段成組框?qū)⑷舾蓚€(gè)頻段組合為單一 的通道,這樣僅僅進(jìn)一步處理k個(gè)通道(其中K<N)。頻段成組框603、 627的輸出分別傳遞到強(qiáng)度測(cè)量方框605、 628,在此每個(gè)通道的強(qiáng)度 被測(cè)量,其結(jié)果又傳遞到適當(dāng)?shù)膹?qiáng)度寄存器606、 629。心理聲學(xué)模型 635利用儲(chǔ)存在寄存器606、 629的通道的興趣信號(hào)和"信號(hào)+噪聲" 強(qiáng)度,來計(jì)算施加到每個(gè)頻段的增益。此外,這些增益以反饋的形式 被用來調(diào)節(jié)函數(shù)H(z)615,該函數(shù)利用模型640逼近耳機(jī)的傳遞函數(shù)。 函數(shù)H(z)的輸出用減法器630調(diào)節(jié)作為提交給心理聲學(xué)模型635的噪 聲強(qiáng)度。
心理聲學(xué)處理
可以使用心理聲學(xué)模型635的四個(gè)不同的方式以及其組合來計(jì)算 施加給變換信號(hào)域的增益。對(duì)該增益的計(jì)算要確保期望信號(hào)處理后的 形式總能克服環(huán)境噪聲而被聽見,并且總是能使收聽者感到舒適。在 所有情況下,LDL確定了動(dòng)態(tài)范圍的上限。
1) 動(dòng)態(tài)范圍的下限由一個(gè)頻段或頻段組合的環(huán)境噪聲的能量來確定。
2) 動(dòng)態(tài)范圍的下限由一個(gè)頻段或頻段組合的環(huán)境噪聲的強(qiáng)度乘以 0與l之間的可調(diào)節(jié)系數(shù)(X)建立。該系數(shù)控制低強(qiáng)度興趣信號(hào)被裝 置放大的量。較低的X可使興趣信號(hào)獲得較大動(dòng)態(tài)范圍,并改進(jìn)信號(hào). 質(zhì)量。X太低則意味著在低強(qiáng)度時(shí),興趣信號(hào)被環(huán)境噪聲所掩沒。
3) 動(dòng)態(tài)范圍的下限由復(fù)雜的心理聲學(xué)模型確定,該模型考慮興趣 信號(hào)和環(huán)境噪聲的強(qiáng)度、頻譜成分和頻譜性質(zhì),以計(jì)算在噪聲內(nèi)的最 小的可清晰聽到的強(qiáng)度,這在本領(lǐng)域內(nèi)已為人所知。
4) 動(dòng)態(tài)范圍的下限由一個(gè)通道內(nèi)的噪聲能量減去興趣信號(hào)的SNR
所確定。
在一個(gè)優(yōu)選實(shí)施例中,利用臨界頻段、頻率成分、信號(hào)持續(xù)時(shí)間 或其他相關(guān)的心理聲學(xué)參數(shù),以信號(hào)強(qiáng)度為基礎(chǔ),并利用感知信號(hào)響 度的在線估計(jì)來計(jì)算LDL。
多頻段壓縮器
在一個(gè)優(yōu)選實(shí)施例中,心理聲學(xué)模型的一個(gè)元件是多頻段動(dòng)態(tài)范 圍壓縮器。對(duì)于較小的有效動(dòng)態(tài)范圍的動(dòng)態(tài)范圍壓縮是利用若干種已 知的強(qiáng)度映射算法中的一種完成的。使用這些方法時(shí)可以結(jié)合査詢表 或其他已知的手段的輔助,以提供壓縮輸入對(duì)增益函數(shù)的形狀,在其 他情況下增益可以根據(jù)數(shù)學(xué)公式直接計(jì)算??赡艿膹?qiáng)度映射算法的例 子是
1) 直線壓縮法——其中輸入/增益函數(shù)是如圖7所示的直線。這里, 強(qiáng)度映射算法包括以分貝形式表示的用于壓縮區(qū)的數(shù)學(xué)公式-
增益二E靜X (1—E倍號(hào)/LDL)
2) 曲線壓縮法——輸入/增益函數(shù)不是直線,而是彎曲的,以便較 好地符合人的聽力系統(tǒng)中對(duì)響度增長(zhǎng)的感覺。這種方法的結(jié)果是改進(jìn)
了感知保真度,但是它必須依賴于復(fù)雜的公式,或者要從査詢表中提 取信息。
3)心理聲學(xué)模型包含在壓縮器中或與壓縮器一體,以使期望信號(hào)
能夠被聽見。對(duì)增益的時(shí)間變化以這樣的方式控制,使感覺的失真最 小,并且使興趣信號(hào)盡可能被聽見。
對(duì)于所有的強(qiáng)度映射算法,心理聲學(xué)模型通過確定要在噪聲內(nèi)聽 到什么聲音,來計(jì)算在給定(子頻段或)通道中使失真最小的強(qiáng)度。 這樣的信息帶來對(duì)期望信號(hào)質(zhì)量的客觀估計(jì),能夠計(jì)算出近似優(yōu)化的 壓縮參數(shù)。采用其他強(qiáng)度映射模式也是可行的。
通常的情況是,輸入的興趣信號(hào)不是完全沒有噪聲的。在這種情 況下,并非對(duì)整個(gè)動(dòng)態(tài)范圍進(jìn)行壓縮,對(duì)存在噪聲的信號(hào)的低強(qiáng)度擴(kuò) 展(增加動(dòng)態(tài)范圍)是有利的。這樣可以感覺到興趣信號(hào)中的噪聲減
小,并且使其聽不到。如果已經(jīng)知道興趣信號(hào)的噪聲層,前面參考圖2 描述的動(dòng)態(tài)范圍再映射可以進(jìn)一步減少該噪聲層的可聽見度,因?yàn)樗?br>
被環(huán)境噪聲所掩沒。
為了在所有環(huán)境中提供高感知保真度,可以執(zhí)行頻譜傾斜限制(tilt constraints)。這類限制防止本發(fā)明對(duì)聲音過度處理到這樣的程度,即 輸出音頻的均衡使得在以頻譜成形的噪聲環(huán)境中,輸出音頻令人不舒 服或質(zhì)量下降。在一個(gè)優(yōu)選實(shí)施例中,該限制是通過在壓縮器的不同 通道之間執(zhí)行最大的增益差而實(shí)現(xiàn)的。當(dāng)本發(fā)明中所用的處理試圖超 出最大增益差的閾值時(shí),在各通道中兼顧考慮以要求更極端的調(diào)節(jié)或 適應(yīng),并且施加或多或少的增益以滿足該限制。也可采用使用更復(fù)雜 手段的其他限制,例如語音質(zhì)量的目標(biāo)測(cè)量。
每個(gè)個(gè)人的是獨(dú)一無二的,并且因此每個(gè)個(gè)人的能夠確定并設(shè)置 他或她自己的LDL、期望收聽強(qiáng)度和響度的加大量。通過個(gè)性化處理, 心理聲學(xué)操作的關(guān)鍵特性是針對(duì)單個(gè)使用者進(jìn)行調(diào)節(jié)(與助聽器的調(diào) 節(jié)方式不同)。在一個(gè)優(yōu)選實(shí)施例中,這些參數(shù)作為心理聲學(xué)模型的 一部分,被非易失存儲(chǔ)器存儲(chǔ)。
使用者的SIE強(qiáng)度調(diào)節(jié)
SIE的使用者也許想要調(diào)節(jié)信號(hào)處理算法的靈敏度。因?yàn)榈蛷?qiáng)度的 聲音是聽不見的(不是因?yàn)楦邚?qiáng)度的聲音是可聽見的),調(diào)節(jié)這種控 制的使用者通常是調(diào)節(jié)強(qiáng)度,這種控制可以看作是高級(jí)音量控制。在 一個(gè)優(yōu)選實(shí)施例中,前面(心理聲學(xué)處理中)所述的參數(shù)"X"可以讓 使用者能調(diào)節(jié)控制SIE算法的靈敏度。也可以采用其他更先進(jìn)的實(shí)施 例,其中強(qiáng)度調(diào)節(jié)為心理聲學(xué)處理框提供一個(gè)參數(shù)輸入。并且這類更 先進(jìn)的實(shí)施例依賴于所采用的心理聲學(xué)處理的特定類型。
與主動(dòng)噪聲消除的結(jié)合
目前許多耳機(jī)都有主動(dòng)噪聲消除(ANC) 。 ANC技術(shù)的應(yīng)用是通 過產(chǎn)生主動(dòng)消除環(huán)境噪聲的抗噪聲(anti-noise),改善噪聲環(huán)境中的 信號(hào)清晰度。然而,由于己知的反饋系統(tǒng)的限制,ANC通常只對(duì)低頻 有效。通過將SIE發(fā)明與ANC結(jié)合,聲音的質(zhì)量和可感知度被增強(qiáng), 這是兩種方法中任何一種都不能單獨(dú)獲得的。圖8示出了這種結(jié)合。 興趣信號(hào)801進(jìn)入分析濾波器組805,由此子頻段通過乘法器807,然 后傳輸?shù)胶铣蔀V波器809,在此被轉(zhuǎn)換并傳遞到加法器812,加法器的 輸出通過反相器814、輸出級(jí)(放大器)816、使輸出與噪聲信號(hào)817 混合的第二加法器818,然后傳輸?shù)浇邮掌?20。興趣信號(hào)還輸入給心 理聲學(xué)模型框840,心理聲學(xué)模型框控制通過乘法器807的子頻段。心 理聲學(xué)模型框840的另一個(gè)輸入來自包含聲音延時(shí)825的一個(gè)反饋回 路,聲學(xué)延時(shí)825將用來驅(qū)動(dòng)接收器820的信號(hào)輸送到傳聲器830,傳 聲器830的輸出首先被放大到832,然后通過低通濾波器834被傳遞到 第一加法器812,并傳輸?shù)叫睦砺晫W(xué)模型框840。在某些實(shí)施例中,相 關(guān)ANC系統(tǒng)已經(jīng)具有用來采樣噪聲的傳聲器,這個(gè)傳聲器同時(shí)可以用 于信號(hào)清晰度增強(qiáng)以對(duì)耳道中的環(huán)境噪聲進(jìn)行采樣。這兩種技術(shù)的結(jié) 合使其每一種更精巧,因此減小了失真,同時(shí)可以提高質(zhì)量和感知性。
在另一個(gè)實(shí)施例中,SIE和ANC處理的結(jié)合是使用過采樣的 WOLA濾波器組作為對(duì)ANC系統(tǒng)的預(yù)均衡器實(shí)現(xiàn)的。可以利用這二者 結(jié)合的模擬或數(shù)字信號(hào)處理來實(shí)現(xiàn)ANC系統(tǒng)。在本領(lǐng)域,這種ANC 處理是眾所周知的,因此不再說明。WOLA測(cè)量耳道中的(閉環(huán)ANC)
預(yù)均衡的剩余噪聲或外部環(huán)境噪聲(開環(huán)ANC),并使用所得的頻譜 信息作為給預(yù)均衡器提供動(dòng)態(tài)范圍參數(shù)的心理聲學(xué)模型的輸入。
雙聲道操作
當(dāng)使用立體聲系統(tǒng)時(shí)(例如雙耳聲道耳機(jī)或頭戴式麥克風(fēng)),可 以包括用于SIE的聯(lián)合通道處理擴(kuò)展。考慮兩種情況
1) 每只耳朵外(開環(huán))或耳罩內(nèi)(閉環(huán))有一個(gè)傳聲器。在這種
情況下,如圖9所示,其中具有噪聲強(qiáng)度軸950,頻率軸960,右聲道 910和左聲道900的噪聲層通過某種方式(例如取每個(gè)通道的或每個(gè)通 道中的每個(gè)子頻段的左右側(cè)的最大強(qiáng)度或平均強(qiáng)度)結(jié)合,以提供結(jié) 合的噪聲層920。
2) 在耳罩中的一個(gè)或在裝置的其它地方只有一個(gè)傳聲器。在這種 情況下,只具有一個(gè)噪聲測(cè)量。
僅有一個(gè)噪聲測(cè)量對(duì)于SIE算法是很重要的,因?yàn)榱Ⅲw聲壓縮器 方式(可能具有獨(dú)立的噪聲測(cè)量)可以導(dǎo)致不需要的獨(dú)立通道調(diào)節(jié), 并因此降低感知的音頻質(zhì)量。當(dāng)使用者僅有一個(gè)環(huán)境噪聲測(cè)量時(shí),SIE 處理方式的左右兩側(cè)使用同樣的信息來。在立體聲興趣信號(hào)情況下, 兩個(gè)SIE處理裝置使用同樣的環(huán)境噪聲強(qiáng)度,以控制隨后的每個(gè)音頻 流的處理。
在圖IO所示的一個(gè)實(shí)施例中,雙聲道耳機(jī)1020、 1052與單聲道 信號(hào)1000—起使用。其典型的應(yīng)用是使用單聲道語音的移動(dòng)電話耳機(jī)。 結(jié)合器(combiner) 1072、心理聲學(xué)模型框1075和供給乘法器1007 的組合實(shí)現(xiàn)了一個(gè)單一SIE處理裝置被。經(jīng)過放大器1001的放大、數(shù) 字到模擬的轉(zhuǎn)換1003,輸入(期望的)信號(hào)1999被第一分析濾波器 1005分成子頻段,每個(gè)子頻段在乘法器1007與來自心理聲學(xué)模型框 1075的合適輸出相乘,然后被合成濾波器1013轉(zhuǎn)換為單頻段。這個(gè)"單 頻段"電信號(hào)經(jīng)其各自的低通濾波器1030、 1060,反相器1035、 1062, 加法器1015、 1050和放大器1017和、1051被送到輸出變換器1020、 1052,根據(jù)靠近其各自接收器1020、 1052的噪聲檢測(cè)傳聲器1022、 1055 的輸入,這些信號(hào)進(jìn)一步被單獨(dú)修正。心理聲學(xué)模型框1075也利用來 自噪聲檢測(cè)揚(yáng)聲器1022、 1055的信號(hào),噪聲檢測(cè)揚(yáng)聲器1022、 1055
的輸出經(jīng)過其各自的模-數(shù)轉(zhuǎn)換器1027、 1065傳遞到第二和第三分析濾 波器1040、 1070,其輸出子頻段在結(jié)合器1072被結(jié)合形成聯(lián)合頻譜圖 像,以便由心理聲學(xué)模型方塊1075處理,來產(chǎn)生用于乘法器1007中 的各個(gè)子頻段的合適增益控制信號(hào)。這種方式的優(yōu)勢(shì)在于,只用一個(gè) D/A轉(zhuǎn)換器1013將處理過的信號(hào)傳遞給兩個(gè)輸出轉(zhuǎn)換器1020、 1052。
包括簡(jiǎn)、1030、 1035、和1015 (或廳、1060、 1062和1050) 的反饋路徑實(shí)現(xiàn)了前述的ANC系統(tǒng)與SIE的結(jié)合。
共享噪聲傳聲器
本發(fā)明的另一個(gè)SIE實(shí)施例被用在圖11所示的幵環(huán)結(jié)構(gòu)中(通常 用在無線電通信頭戴式耳機(jī)中),其中用來接收傳輸?shù)?Tx)語音的傳 聲器1120也用來采樣環(huán)境噪聲——所謂的共享傳聲器技術(shù)。興趣信號(hào) 1101被第一分析濾波器組1103輸入到N個(gè)子頻段,并且子頻段被頻段 成組框1150組成K個(gè)通道。每個(gè)這些"興趣信號(hào)"通道的強(qiáng)度由強(qiáng)度 測(cè)量框1153來測(cè)量,并且該強(qiáng)度被存儲(chǔ)在合適的寄存器1155中。每個(gè) 子頻段還被乘法器1107修正,并且這些子頻段被合成濾波器組1110重 新組合成單頻段并傳輸?shù)揭纛l輸出1115。類似地,來自傳聲器1120的 環(huán)境噪聲的釆樣被第二合成濾波器1123分成N個(gè)子頻段,并且其結(jié)果 的子頻段被另一個(gè)頻段組合框1160組合成K個(gè)通道。每個(gè)這些噪聲通 道的強(qiáng)度由強(qiáng)度測(cè)量框1163測(cè)量并存儲(chǔ)在合適的寄存器1165中。心理 聲學(xué)模型框1140利用存儲(chǔ)在興趣信號(hào)寄存器和噪聲寄存器中的強(qiáng)度值 確定由乘法器1107施加到輸入的興趣信號(hào)1101的每個(gè)頻段的增益。聲 音活動(dòng)性檢測(cè)器1125監(jiān)控噪聲分析濾波器組1123的輸出并檢測(cè)傳輸信 號(hào)(聲音)的間隙。只有出現(xiàn)這種間隙時(shí),測(cè)量到的強(qiáng)度才被認(rèn)為是正 確的。因此,信號(hào)從聲音活動(dòng)性檢測(cè)器1125傳遞到強(qiáng)度寄存器1165指 示出何時(shí)沒有聲音活動(dòng)性。這種方式降低了成本和硬件的復(fù)雜性。
在另一個(gè)實(shí)施例中,用來恢復(fù)傳輸信號(hào)的算法也可以與圖1的開環(huán) 傳聲器共享SIE系統(tǒng)相結(jié)合。例如,在圖12中,本領(lǐng)域所共知的或尚 待批準(zhǔn)的處理算法已經(jīng)被用來減少傳輸信號(hào)的噪聲,但是用于該信號(hào)的 相同傳聲器也可以釆用圖11所示的技術(shù)被用于估計(jì)環(huán)境噪聲。在圖12 中,興趣信號(hào)1210的路徑類似于前述實(shí)施例中的路徑,即興趣信號(hào)1210
被第一方向?yàn)V波器組1213分成子頻段,每個(gè)子頻段被乘法器1215修改, 并且這些子頻段被合成濾波器組1217變換成單一頻段,并且被放大器 1219放大用于接收器1220。然而,相反的是,噪聲信號(hào)是從兩個(gè)揚(yáng)聲 器(所謂的前后揚(yáng)聲器)1201、 1207得到的,揚(yáng)聲器1201、 1207的輸 出被相應(yīng)的第二和第三分析濾波器組1203、 1209分成子頻段。兩組子 頻段被方向處理框1230利用,因在此不相關(guān),所以不作說明。同一組 子頻段信號(hào)被傳輸給期望信號(hào)活動(dòng)性檢測(cè)器(DSAD)框1240,框1240 的輸出傳輸給控制乘法器1215的心理聲學(xué)模型框1260。同時(shí),對(duì)應(yīng)距 離被傳輸信號(hào)最遠(yuǎn)的傳聲器的第三分析濾波器1209的輸出經(jīng)過傳遞函 數(shù)框1250,被傳遞給心理聲學(xué)模型框1260。期望能夠確定從Tx傳聲器 到輸出變換器的傳遞函數(shù)1250,以對(duì)耳道中的噪聲強(qiáng)度提供精確的估 計(jì),從而逼近閉環(huán)條件。
在另一個(gè)實(shí)施例中(圖12未示出),方向處理框提供一個(gè)輸出噪 聲估計(jì)以獲得包含較少傳輸語音的噪聲估計(jì),該輸出噪聲估計(jì)是使音束 偏離被傳輸?shù)男盘?hào)源而產(chǎn)生的。在又一個(gè)實(shí)施例中,可以從一個(gè)傳聲器 中減去方向輸出,以便獲得改進(jìn)的噪聲估計(jì)。
注意,諸如DSAD,自適應(yīng)噪聲估計(jì)或頻譜差分噪聲估計(jì)的前端處 理技術(shù)可以被用在任何開環(huán)結(jié)構(gòu)中。其他的前端處理(如方向處理)能 使某些語音和噪聲的分離,從而改進(jìn)性能。
以下說明本發(fā)明的其他特征和方面,以及相關(guān)的優(yōu)點(diǎn)
1) 提高了信號(hào)清晰度。同時(shí),保持了信號(hào)的保真度和質(zhì)量,并且 在噪聲環(huán)境中提高了感知質(zhì)量。
2) 對(duì)心理聲學(xué)模型和高保真度的,限制動(dòng)態(tài)范圍適應(yīng)方式的使用 意味著使用的動(dòng)態(tài)范圍的最大(其中動(dòng)態(tài)范圍是在噪聲之上的能聽見的 最小信號(hào)強(qiáng)度與最大允許信號(hào)強(qiáng)度之間的強(qiáng)度差)。這樣就得到極佳的 信號(hào)質(zhì)量和保真度。
3) 該設(shè)計(jì)可以利用適合直接安裝于頭戴式耳機(jī)中或其他便攜式音 頻應(yīng)用中的超低能量、次微型技術(shù)來實(shí)現(xiàn)(見Schneider和Brennan的美 國專利6,240,192號(hào),其名稱為"包括應(yīng)用特定的集成電路和可編程數(shù) 字信號(hào)處理器的數(shù)字助聽器中的過濾裝置和方法")。利用過采樣濾波 器組的實(shí)現(xiàn)(見Schneider和Brennan的美國專利6,236,731號(hào)中,其名
稱為"用于過濾信息信號(hào)并將信息信號(hào)分成不同波段的濾波器組結(jié)構(gòu)和 方法,特別是用于助聽器的音頻信號(hào)上述結(jié)構(gòu)和方法")為便攜式低能 量音頻應(yīng)用提供了理想的高保真和超低能量解決方案。
4) 當(dāng)與閉環(huán)、主動(dòng)噪聲消除(ANC)系統(tǒng)結(jié)合時(shí),可以利用一個(gè) 優(yōu)勢(shì),即兩者都需要有在接近輸出變換器的地方測(cè)量不良噪聲的裝置。 所以同一個(gè)傳聲器(位于輸出變換器的附近)既可以被用來測(cè)量產(chǎn)生"抗 噪"的信號(hào),也能提供剩余強(qiáng)度的測(cè)量,從該測(cè)量可以計(jì)算用于信號(hào)清 晰度增強(qiáng)(SIE)處理的輸入強(qiáng)度估計(jì)。這種結(jié)合方法比單獨(dú)使用兩種 方法之一效果要好,這是因?yàn)锳NC只限于對(duì)低頻有利(由于設(shè)計(jì)的考 慮),信號(hào)清晰度增強(qiáng)在高頻下有利。利用同一個(gè)傳聲器減少了成本, 并使系統(tǒng)簡(jiǎn)化。在很多收聽情況下,低頻噪聲占主要地位。這里,在低 頻下用ANC以減少噪聲增加了可用的動(dòng)態(tài)范圍,其結(jié)果是相對(duì)于單獨(dú) 使用一種方法(ANC或S正),保真度被提高。
5) 在興趣信號(hào)包含噪聲的情況下,興趣信號(hào)可以用心理聲學(xué)模型 和/或低強(qiáng)度擴(kuò)展來處理,使得噪聲強(qiáng)度有效地低于聲音信號(hào)強(qiáng)度(或在 應(yīng)用ANC時(shí),是剩余信號(hào)強(qiáng)度)。當(dāng)處理得當(dāng)時(shí),收聽者感知到很小 的噪聲。
6) 可以將單個(gè)傳聲器噪聲減少技術(shù)結(jié)合在興趣信號(hào)通道中,如在 加拿大的PCT申請(qǐng)Bernnan, Robert的PCT/CA98/00331 "用于減少噪 聲,特別時(shí)助聽器中的噪聲的方法和裝置"中所述。因?yàn)楸惶幚淼呐d趣 信號(hào)包含很少噪聲,這就為收聽者提供了更容易聽到的信號(hào)(相對(duì)于環(huán) 境噪聲),并減少長(zhǎng)時(shí)間的收聽疲勞。
7) 當(dāng)使用期望信號(hào)活動(dòng)性檢測(cè)器(DSAD)時(shí),就能夠?qū)崿F(xiàn)區(qū)分興 趣信號(hào)和環(huán)境噪聲(干擾)。這樣確保了噪聲信號(hào)估計(jì)不會(huì)參雜興趣信 號(hào),使聲音交流具有較高清晰度而更加清楚。
8) 在本發(fā)明的另一個(gè)實(shí)施例中,使用了自適應(yīng)濾波器使參雜信號(hào) (信號(hào)+噪聲)與未參雜電信號(hào)發(fā)生關(guān)系,以便能夠得到噪聲估計(jì)。這
對(duì)于參雜了興趣信號(hào)的噪聲信號(hào)提供了更可靠的估計(jì)。采用這種技術(shù)提 高了信號(hào)的保真度。
9) 在本發(fā)明的另一個(gè)實(shí)施例中,使用了頻譜差分技術(shù)估計(jì)環(huán)境噪 聲的頻譜內(nèi)容。這對(duì)于參雜了興趣信號(hào)的噪聲信號(hào)提供了更可靠的估 計(jì)。這種處理也提高了信號(hào)的保真度。
10) 利用壓縮器元件的多頻段處理(頻率范圍被單獨(dú)地處理,而不 一致地壓縮整個(gè)頻譜),可以對(duì)剩余動(dòng)態(tài)范圍進(jìn)行更精確地映射,并且
提高了整體感知音頻質(zhì)量,這在Schneider和Brennan的"用于數(shù)字助聽 器的壓縮策略"(Proc.ICASSP 1997,德國,慕尼黑)中已作了說明。相 互獨(dú)立地處理頻段使得產(chǎn)生高保真度壓縮具有更大的自由度。此外,通 過限制頻率范圍的相關(guān)對(duì)壓縮水平使得出現(xiàn)預(yù)定的最大頻率成形量,在 較寬范圍的噪聲環(huán)境中保持了信號(hào)質(zhì)量。這確保了頻率局域噪聲源可以 被更好地處理。
11) 使用多頻段和/或自適應(yīng)噪聲強(qiáng)度測(cè)量,能夠使設(shè)備平滑地處理 噪聲環(huán)境的任何變化。它還能防止不良失真,否則的話,在環(huán)境噪聲劇 烈變化時(shí)就會(huì)發(fā)生這種失真。見Schneider, Told A.的"自適應(yīng)動(dòng)態(tài)控制 器"(MASc論文集,加拿大,安大略省,滑鐵盧,滑鐵盧大學(xué),1991) 和Schneider和Brennan的"用于數(shù)字助聽器的壓縮策略"(Proc. ICASSP 1997,德國,慕尼黑)。
12) 本發(fā)明隱含有一個(gè)安全系統(tǒng)。信號(hào)處理不會(huì)使期望聲音放大超 過使用者的響度不舒適級(jí)(LDL)。這是設(shè)計(jì)的一個(gè)安全特征,有助于 在高噪聲環(huán)境中保護(hù)使用者的聽力。這與本發(fā)明提供的其他調(diào)節(jié)一起, 可以對(duì)特定使用者實(shí)現(xiàn)個(gè)性化的處理。
雖然已經(jīng)參考具體實(shí)施例,對(duì)本發(fā)明作了描述,但這種描述只是 對(duì)本發(fā)明的說明,而不應(yīng)理解為對(duì)本發(fā)明的限制。對(duì)本領(lǐng)域的技術(shù)人 員來說,還可以對(duì)本發(fā)明進(jìn)行各種更改,同時(shí)不脫離所附權(quán)利要求限 定的本發(fā)明的實(shí)質(zhì)和范圍。
權(quán)利要求
1.一種克服干擾信號(hào)的提高信號(hào)清晰度的系統(tǒng),所述系統(tǒng)包括第一輸入端,用于接收包括可能被環(huán)境噪聲污染的興趣信號(hào)的信息信號(hào);第二輸入端,用于接收包括所述環(huán)境噪聲的干擾信號(hào),所述第二輸入能基于連續(xù)方式接收所述干擾信號(hào),而不管所述興趣信號(hào)是否存在;分析濾波器組,用于通過所述第一輸入接收所述信息信號(hào),并將時(shí)域中的所述信息信號(hào)變換成變換域中的多個(gè)子帶信息信號(hào);信號(hào)處理器,用于接收并處理從所述分析濾波器組輸出的所述子帶信息信號(hào)和基于連續(xù)方式通過所述第二輸入接收的所述干擾信號(hào),所述信號(hào)處理器包括心理聲學(xué)處理器,其利用心理聲學(xué)模型計(jì)算動(dòng)態(tài)范圍,使得所述子帶信息信號(hào)能克服所述干擾信號(hào)而被聽見,和合成濾波器組,用于將從所述信號(hào)處理器輸出的所述可聽子帶信息信號(hào)組合,以產(chǎn)生具有信號(hào)清晰度被提高的所述興趣信號(hào)的輸出信號(hào)。
2. 如權(quán)利要求l所述的系統(tǒng),還包括分析濾波器組,用于將時(shí)域的 所述干擾信號(hào)變換成變換域的多個(gè)子帶干擾信號(hào)。
3. 如權(quán)利要求1或2所述的系統(tǒng),其中所述信號(hào)處理器還包括用于 估計(jì)所述環(huán)境噪聲的頻譜的噪聲估計(jì)電路,所述頻譜被提供給所述心理 聲學(xué)模型。
4. 如權(quán)利要求3所述的系統(tǒng),其中所述噪聲估計(jì)電路執(zhí)行自適應(yīng)噪 聲估計(jì)。
5. 如權(quán)利要求3所述的系統(tǒng),其中所述噪聲估計(jì)電路利用頻譜差分 技術(shù)執(zhí)行噪聲估計(jì)。
6. 如權(quán)利要求1或2所述的系統(tǒng),其中所述信號(hào)處理器包括-自適應(yīng)相關(guān)器,用于基于所述信息信號(hào)和所述干擾信號(hào)提供所述環(huán) 境噪聲的估計(jì)。
7. 如權(quán)利要求2所述的系統(tǒng),其中所述信號(hào)處理器包括噪聲估計(jì)電 路,其通過從所述子帶干擾信號(hào)中減去所述子帶信息信號(hào)執(zhí)行所述環(huán)境 噪聲的估計(jì),所述估計(jì)被提供給所述心理聲學(xué)模型。
8. 如權(quán)利要求1至5中任一項(xiàng)所述的系統(tǒng),其中所述信號(hào)處理器還 包括壓縮器,其基于所述心理聲學(xué)處理器提供的動(dòng)態(tài)范圍參數(shù)對(duì)所述子 帶信息信號(hào)進(jìn)行動(dòng)態(tài)范圍壓縮。
9. 如權(quán)利要求1至5中任一項(xiàng)所述的系統(tǒng),其中所述信號(hào)處理器還 包括電路,其為所述興趣信號(hào)的預(yù)定水平擴(kuò)展所述動(dòng)態(tài)范圍,使得所述 環(huán)境噪聲不被聽見。
10. 如權(quán)利要求1至5中任一項(xiàng)所述的系統(tǒng),其中所述心理聲學(xué)處 理器處理輸入信號(hào)以執(zhí)行低水平擴(kuò)展,使得接收所述輸出信號(hào)的使用者 感受到較少噪聲。
11. 如權(quán)利要求1至5中任一項(xiàng)所述的系統(tǒng),其中所述心理聲學(xué)處 理器基于響度不舒適級(jí)(LDL)計(jì)算所述動(dòng)態(tài)范圍,以使所述輸出信號(hào) 處于一響度舒適級(jí)。
12. 如權(quán)利要求ll所述的系統(tǒng),還包括持久數(shù)據(jù)存儲(chǔ)裝置,用于為 每個(gè)接收所述輸出信號(hào)的使用者存儲(chǔ)所述響度不舒適級(jí)(LDL)。
13. 如權(quán)利要求1至5中任一項(xiàng)所述的系統(tǒng),其中所述信號(hào)處理器 中的信號(hào)處理的靈敏度是可調(diào)的。
14. 如權(quán)利要求13所述的系統(tǒng),還包括存儲(chǔ)器,用于為每個(gè)接收所 述輸出信號(hào)的使用者存儲(chǔ)參數(shù),以控制所述信號(hào)處理的所述靈敏度。
15. 如權(quán)利要求1至5中任一項(xiàng)所述的系統(tǒng),其中所述信號(hào)處理器 還包括用來調(diào)節(jié)所述輸出信號(hào)的量的電路。
16. 如權(quán)利要求3至5中任一項(xiàng)所述的系統(tǒng),其中所述信號(hào)處理器 包括期望數(shù)字信號(hào)活動(dòng)性檢測(cè)器(DSAD),用于控制所述噪聲估計(jì)電 路,使得當(dāng)所述興趣信號(hào)不存在時(shí)所述頻譜被采樣。
17. 如權(quán)利要求1至5中任一項(xiàng)所述的系統(tǒng),還包括用于提高所述 輸出信號(hào)的清晰度的前端處理器。
18. 如權(quán)利要求17所述的系統(tǒng),其中所述前端處理器包括用于執(zhí)行 定向處理算法以提供噪聲估計(jì)的電路。
19. 如權(quán)利要求17所述的系統(tǒng),其中所述前端處理器包括用于減少 所述環(huán)境噪聲的電路。
20. 如權(quán)利要求1至5中任一項(xiàng)所述的系統(tǒng),還包括主動(dòng)噪聲消除 (ANC)電路,其通過將所述信號(hào)處理的結(jié)果反饋給所述信號(hào)處理器主動(dòng)地消除所述環(huán)境噪聲。
21. 如權(quán)利要求1至5中任一項(xiàng)所述的系統(tǒng),其中所述干擾信號(hào)包 括被所述興趣信號(hào)污染的所述環(huán)境噪聲。
22. 如權(quán)利要求1所述的系統(tǒng),其中所述分析濾波器組和所述合成 濾波器組由過采樣濾波器組實(shí)現(xiàn)。
23. 如權(quán)利要求2所述的系統(tǒng),其中用于所述信息信號(hào)的所述分析 濾波器組和用于所述干擾信號(hào)的所述分析濾波器組由過采樣濾波器組 實(shí)現(xiàn)。
24. 如權(quán)利要求1至5中任一項(xiàng)所述的系統(tǒng),其中所述信號(hào)處理器 執(zhí)行聽力輔助應(yīng)用。
25. 如權(quán)利要求21所述的系統(tǒng),其中所述信號(hào)處理器還包括用于估 計(jì)所述環(huán)境噪聲的頻譜的噪聲估計(jì)電路和期望數(shù)字信號(hào)活動(dòng)性檢測(cè)器(DSAD),所述期望數(shù)字信號(hào)活動(dòng)性檢測(cè)器用于控制所述噪聲估計(jì)電路,使得當(dāng)所述興趣信號(hào)不存在時(shí)所述頻譜被采樣。
26. 如權(quán)利要求1或2所述的系統(tǒng),其中所述信號(hào)處理器還包括用 于控制噪聲估計(jì)的期望數(shù)字信號(hào)活動(dòng)性檢測(cè)器(DSAD)。
27. —種克服干擾信號(hào)的提高信號(hào)清晰度的方法,所述方法包括 在第一輸入端處,接收包括可能被環(huán)境噪聲污染的興趣信號(hào)的信息信號(hào);在第二輸入端處,接收包括所述環(huán)境噪聲的干擾信號(hào),所述第二輸 入端能基于連續(xù)方式接收所述干擾信號(hào),而不管所述興趣信號(hào)是否存 在;在分析濾波器組處,將時(shí)域的所述信息信號(hào)變換成變換域的多個(gè)子 帶信息信號(hào);在信號(hào)處理器處,處理所述子帶信息信號(hào)和基于連續(xù)方式的所述干 擾信號(hào),包括利用心理聲學(xué)模型、使所述子帶信息信號(hào)能克服所述干擾 信號(hào)而被聽見的計(jì)算動(dòng)態(tài)范圍的步驟,和在合成濾波器組處,將所述可聽子帶信息信號(hào)組合,以產(chǎn)生具有 信號(hào)清晰度被提高的所述興趣信號(hào)的輸出信號(hào)。
28. 如權(quán)利要求27所述的方法,還包括以下步驟 在用于所述干擾信號(hào)的分析濾波器組處,將時(shí)域的所述干擾信號(hào)變換成變換域的多個(gè)子帶干擾信號(hào),從而所述處理步驟處理所述子帶信息信號(hào)和所述子帶干擾信號(hào)。
29. 如權(quán)利要求27或28所述的方法,其中所述處理步驟包括以下 步驟估計(jì)所述環(huán)境噪聲的頻譜,和 將所述頻譜提供給所述心理聲學(xué)模型。
30. 如權(quán)利要求29所述的方法,其中所述估計(jì)步驟執(zhí)行自適應(yīng)噪聲 估計(jì)。
31. 如權(quán)利要求29所述的方法,其中所述估計(jì)步驟利用頻譜差分技 術(shù)執(zhí)行噪聲估計(jì)。
32. 如權(quán)利要求27或28所述的方法,還包括 基于所述信息信號(hào)和所述干擾信號(hào)提供所述環(huán)境噪聲的估計(jì)。
33. 如權(quán)利要求28所述的方法,其中所述處理步驟包括以下步驟-通過從所述子帶干擾信號(hào)中減去所述子帶信息信號(hào)執(zhí)行所述環(huán)境噪聲的估計(jì),和將所述估計(jì)提供給所述心理聲學(xué)模型。
34. 如權(quán)利要求27或28所述的方法,其中所述處理步驟包括以下 步驟基于所述心理聲學(xué)處理器提供的動(dòng)態(tài)范圍參數(shù)對(duì)所述子帶信息信 號(hào)進(jìn)行動(dòng)態(tài)范圍壓縮。
35. 如權(quán)利要求27或28所述的方法,其中所述處理步驟包括以下' 為所述興趣信號(hào)的預(yù)定水平擴(kuò)展所述動(dòng)態(tài)范圍,使得所述環(huán)境噪聲 不被聽見。
36. 如權(quán)利要求27或28所述的方法,其中所述處理步驟包括以下 步驟執(zhí)行低水平擴(kuò)展,使得接收所述輸出信號(hào)的使用者感受到較少噪聲。
37. 如權(quán)利要求27或28所述的方法,其中所述處理步驟包括以下基于響度不舒適級(jí)(LDL)計(jì)算所述動(dòng)態(tài)范圍,以使所述輸出信號(hào) 處于一響度舒適級(jí)。
38. 如權(quán)利要求37所述的方法,還包括以下步驟 為每個(gè)接收所述輸出信號(hào)的使用者存儲(chǔ)所述響度不舒適級(jí)(LDL)。
39. 如權(quán)利要求27或28所述的方法,還包括以下步驟-調(diào)節(jié)所述信號(hào)處理器中的信號(hào)處理的靈敏度。
40. 如權(quán)利要求29所述的方法,還包括以下步驟 為每個(gè)接收所述輸出信號(hào)的使用者存儲(chǔ)參數(shù),以控制所述信號(hào)處理的所述靈敏度。
41. 如權(quán)利要求27或28所述的方法,其中所述處理步驟包括以下 步驟調(diào)節(jié)所述輸出信號(hào)的量。
42. 如權(quán)利要求29至31中任一項(xiàng)所述的方法,其中所述處理步驟 包括以下步驟控制所述噪聲估計(jì)電路,使得當(dāng)所述興趣信號(hào)不存在時(shí)所述頻譜被 采樣。
43. 如權(quán)利要求27或28所述的方法,還包括以下步驟 在前端處理器處,提高所述輸出信號(hào)的清晰度。
44. 如權(quán)利要求43所述的方法,其中所述提高清晰度的步驟包括以 下步驟執(zhí)行定向處理算法以提供噪聲估計(jì)。
45. 如權(quán)利要求43所述的方法,其中所述提高清晰度的步驟包括以 下步驟-減少所述環(huán)境噪聲。
46. 如權(quán)利要求27或28所述的方法,還包括以下步驟 通過將所述信號(hào)處理的結(jié)果反饋給所述信號(hào)處理器,主動(dòng)地消除所述環(huán)境噪聲。
47. 如權(quán)利要求27或28所述的方法,其中所述干擾信號(hào)包括被所 述興趣信號(hào)污染的所述環(huán)境噪聲。
48. 如權(quán)利要求27所述的方法,其中所述變換和所述組合步驟由過 釆樣濾波器組實(shí)現(xiàn)。
49. 如權(quán)利要求28所述的方法,其中用于所述信息信號(hào)的所述變換 步驟和用于所述干擾信號(hào)的所述變換步驟由過采樣濾波器組實(shí)現(xiàn)。
50. 如權(quán)利要求27或28所述的方法,還包括以下步驟 在所述信號(hào)處理器處,執(zhí)行聽力輔助應(yīng)用。
51. 如權(quán)利要求27所述的方法,還包括 估計(jì)所述環(huán)境噪聲的頻譜;和控制所述估計(jì)步驟,使得當(dāng)所述興趣信號(hào)不存在時(shí)所述頻譜被采樣。
52. 如權(quán)利要求27或28所述的方法,還包括 將所述信號(hào)處理的結(jié)果反饋給所述信號(hào)處理器,以主動(dòng)地消除所 述環(huán)境噪聲。
全文摘要
本發(fā)明公開了一種聲音清晰度增強(qiáng)(SIE)系統(tǒng)。該SIE系統(tǒng)利用心理聲學(xué)模型,并且優(yōu)選地,利用一個(gè)過取樣濾波器組,在其中低于環(huán)境噪聲的興趣信號(hào)被有選擇地放大作為輸入強(qiáng)度和頻率的函數(shù),以使該信號(hào)克服噪聲而可以被聽見,但是絕不會(huì)超過作為頻率函數(shù)的一個(gè)預(yù)定最大輸出強(qiáng)度。該SIE系統(tǒng)可以與主動(dòng)噪聲消除相結(jié)合。
文檔編號(hào)G10L21/0364GK101105941SQ200710006509
公開日2008年1月16日 申請(qǐng)日期2002年8月7日 優(yōu)先權(quán)日2001年8月7日
發(fā)明者D·庫德, P·歐利杰尼克, R·L·布倫南, T·施奈德 申請(qǐng)人:艾瑪復(fù)合信號(hào)公司