欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

多通道音頻中語音相關(guān)通道的縮放回避的方法和系統(tǒng)的制作方法

文檔序號:7848431閱讀:354來源:國知局
專利名稱:多通道音頻中語音相關(guān)通道的縮放回避的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及用于改善由多通道音頻信號確定的人類語音(例如對話)的可辨識度的系統(tǒng)和方法。在一些實施例中,本發(fā)明是ー種方法和系統(tǒng),其通過確定指示由語音通道確定的語音相關(guān)內(nèi)容與由非語音通道確定的語音相關(guān)內(nèi)容之間的相似程度的至少ー個衰減控制值,并響應于該衰減控制值對該非語音通道進行衰減,來對具有語音通道和非語音通 道的音頻信號進行濾波以改善由信號確定的語音可辨識度。
背景技術(shù)
貫穿本公開,包括在權(quán)利要求書中,術(shù)語“語音”用于廣義上指示人類語音。因此,由音頻信號確定的“語音”是指信號中在由揚聲器(或其他發(fā)聲換能器)再現(xiàn)信號時感知為人類語音(例如對話、獨白、歌聲或其他人類語音)的音頻內(nèi)容。根據(jù)本發(fā)明的典型實施例,由音頻信號確定的語音的可聽度相對于由信號確定的其他音頻內(nèi)容(例如樂器音樂或非語音聲音效果)得到改善,由此改善語音的可辨識度(例如,清楚性或理解容易度)。貫穿本公開,包括在權(quán)利要求書中,多通道音頻信號中的一通道的“語音增強內(nèi)容”這一表述是指增強由信號的另一通道(例如語音通道)確定的語音內(nèi)容的可辨識度或其他感知品質(zhì)的內(nèi)容(由該通道確定)。本發(fā)明的典型實施例假定多通道輸入音頻信號確定的語音的大部分由信號的中央通道確定。該假定與環(huán)繞聲音產(chǎn)品慣例一致,根據(jù)該慣例,大部分語音通常置于僅ー個通道(中央通道)中,大部分音樂、環(huán)境聲音和音效通?;旌系剿型ǖ乐?例如左通道、右通道、左環(huán)繞通道和右環(huán)繞通道以及中央通道)。因此,多通道音頻信號的中央通道將有時在這里稱為“語音”通道,信號的全部其它通道(例如左通道、右通道、左環(huán)繞通道和右環(huán)繞通道)有時在這里稱為“非語音”通道。類似地,由立體聲信號的左和右通道之和產(chǎn)生的“中央”通道(其語音被移位到中央)有時在這里稱為“語音”通道,通過從立體信號的左(或右)通道減去這樣的中央通道而產(chǎn)生的“側(cè)”通道將有時在這里稱為“非語音”通道。貫穿本公開,包括在權(quán)利要求書中,“對”信號或數(shù)據(jù)進行操作的表述(例如對信號或數(shù)據(jù)進行濾波、縮放或變換)用于廣義上指示直接對信號或數(shù)據(jù)進行操作,或者對信號或數(shù)據(jù)的處理變體(例如,在對其執(zhí)行操作之前已經(jīng)經(jīng)歷了初步濾波的信號變體)執(zhí)行操作。貫穿本公開,包括在權(quán)利要求書中,表述“系統(tǒng)”用于廣義上指示器件、系統(tǒng)或子系統(tǒng)。例如,實現(xiàn)解碼器的子系統(tǒng)可以稱為解碼器系統(tǒng),包括這樣的子系統(tǒng)的系統(tǒng)(例如,響應于多個輸入產(chǎn)生X個輸出信號的系統(tǒng),其中該子系統(tǒng)產(chǎn)生M個輸入,其它X-M個輸入從外部源接收)也可以稱為解碼器系統(tǒng)。貫穿本公開,包括在權(quán)利要求書中,第一值(“A”)對第二值(“B”)的“比”這ー表述廣義上用于表不A/B、或B/A、或A和B之一的縮放或偏移變體對A和B中的另ー個的縮放或偏移變體的比(例如(A+x) / (B + y),其中X和y表示偏移值)。貫穿本公開,包括在權(quán)利要求書中,信號通過發(fā)聲換能器(例如揚聲器)的“再現(xiàn)”這ー表述表示使換能器響應于信號產(chǎn)生聲音,包括通過進行任何所需的放大和/或其它信號處理。當在存在競爭聲音的情況下聽語音時(諸如在餐館中克服人群噪聲傾聽朋友說話),指示語音的音素內(nèi)容的部分聲學特征(語音提示(speech cue))被競爭聲音所掩蓋且不再可用于傾聽者來解碼訊息。隨著競爭聲音的水平相對于語音水平升高,正確接收的語音提示的數(shù)量降低且語音感知逐漸變得更難,直到在某競爭聲音水平下,語音感知過程中斷。雖然這種關(guān)系對于所有傾聽者有效,但是對于任意語音水平而言能容忍的競爭聲音水平對于所有傾聽者并不相同。有些傾聽者,例如由于年老而損失聽カ者(老年聾)或傾聽青 春期之后學會的語言者,與具有良好聽カ或運用母語的傾聽者相比,更不能容忍競爭聲音。存在競爭聲音時傾聽者理解語音的能力不同的事實暗示了新聞或娛樂音頻中環(huán)境聲音和背景音樂與語音混合的水平。損失聽力或運用外語的傾聽者通常喜歡與內(nèi)容產(chǎn)生者所提供的相比相對更低水平的非語音音頻。為了迎合這些特殊需要,已知對多通道音頻信號的非語音通道應用衰減(回避),而更小(或沒有)衰減應用到信號的語音通道,以改善信號所確定的語音的可辨識度。例如,PCT國際申請公開NO.W02010/011377,發(fā)明人為Hannes Muesch且轉(zhuǎn)讓給Dolby Laboratories Licensing Corporation (2010 年 I 月 28 日公開),公開了多通道音頻信號的非語音通道(例如,左通道和右通道)可以掩蓋信號的語音通道(例如,中央通道)中的語音到不再滿足期望水平的語音可辨識度的程度。W02010/011377描述了如何確定由回避電路應用到非語音通道的衰減函數(shù)以嘗試顯露語音通道中的語音,同時盡可能多地感知內(nèi)容創(chuàng)建者的意圖。W02010/011377中描述的技術(shù)基于如下假設非語音通道中的內(nèi)容從不增強語音通道確定的語音內(nèi)容的可辨識度(或者其它感知品質(zhì))。本發(fā)明部分地基于如下認識,即雖然該假設對于絕大多數(shù)多通道音頻內(nèi)容而言是正確的,但是并非總是有效。發(fā)明人意識到,當多通道音頻信號中的至少ー個非語音通道包括增強信號的語音通道確定的語音內(nèi)容的可辨識度(或其它感知品質(zhì))的內(nèi)容時,根據(jù)W02010/011377的方法對信號的濾波可能負面影響傾聽再現(xiàn)的濾波了的信號的聽眾的娛樂體驗。根據(jù)本發(fā)明的典型實施例,在內(nèi)容不符合W02010/011377的方法蘊含的假設吋,W02010/011377描述的方法的應用被暫停或被修改。需要ー種方法和系統(tǒng),用于在音頻信號的至少ー個非語音通道包括增強音頻信號的語音通道中的語音內(nèi)容的可辨識度的內(nèi)容的一般情況下,對多通道音頻信號進行濾波以改善語音可辨識度。

發(fā)明內(nèi)容
在第一類實施例中,本發(fā)明是ー種方法,用于對具有語音通道和至少ー個非語音通道的多通道音頻信號進行濾波,以改善信號所確定的語音的可辨識度。該方法包括步驟(a)確定指示多通道語音信號的語音通道確定的語音相關(guān)內(nèi)容與至少ー個非語音通道確定的語音相關(guān)內(nèi)容之間的相似程度的至少ー個衰減控制值;以及(b)響應于該至少一個衰減控制值,對該多通道音頻信號的至少ー個非語音通道進行衰減。典型地,該衰減步驟包括響應于該至少ー個衰減控制值,縮放用于該非語音通道的原始衰減控制信號(例如回避増益控制信號)。優(yōu)選地,該非語音通道被衰減從而改善由語音通道確定的語音的可辨識度,而沒有不期望地衰減由該非語音通道確定的語音增強內(nèi)容。在一些實施例中,步驟(a)確定的每個衰減控制值指示由音頻信號的語音通道確定的語音相關(guān)內(nèi)容與一個非語音通道確定的語音相關(guān)內(nèi)容之間的相似程度,步驟(b)包括響應于所述每個衰減控制值對該非語音通道進行衰減的步驟。在另ー些實施例中,步驟(a)包括從音頻信號的至少ー個非語音通道得到衍生非語音通道的步驟,該至少ー個衰減控制值指示由該語音通道確定的語音相關(guān)內(nèi)容與由該衍生非語音通道確定的語音相關(guān)內(nèi)容之間的相似程度。例如,該衍生非語音通道可以通過疊加或以另外的方式混合或組合音頻信號的至少兩個非語音通道而產(chǎn)生。相對于從不同非語音通道確定ー組衰減值的不同子集的成本和復雜度而言,從單個衍生非語音通道確定每個衰減控制值可以減小實施本發(fā)明某些實施例的成本和復雜度。在其中輸入音頻信號具有至少兩個非語音通道的實施例中,步驟(b)可以包括響應于該至少ー個衰減控 制值(例如,響應于衰減控制值的單個序列),對非語音通道(例如,從其已經(jīng)衍生出衍生非語音通道的每個非語音通道)的子集或者所有非語音通道進行衰減的步驟。在ー些第一類實施例中,步驟(a)包括產(chǎn)生指示衰減控制值的序列的衰減控制信號的步驟,每個衰減控制值指示由語音通道確定的語音相關(guān)內(nèi)容與由至少ー個非語音通道確定的語音相關(guān)內(nèi)容之間在不同時間(例如,在不同時間段中)的相似程度,步驟(b)包括如下步驟響應于該衰減控制信號縮放回避增益控制信號以產(chǎn)生縮放了的增益控制信號,以及應用該縮放了的增益控制信號以對該至少ー個非語音通道進行衰減(例如,將該縮放了的增益控制信號斷言到回避電路從而通過該回避電路來控制該至少ー個非語音通道的衰減)。例如,在一些這樣的實施例中,步驟(a)包括比較第一語音相關(guān)特征序列(指示由該語音通道確定的語音相關(guān)內(nèi)容)與第二語音相關(guān)特征序列(指示由該至少一個非語音通道確定的語音相關(guān)內(nèi)容)以產(chǎn)生該衰減控制信號,由該衰減控制信號指示的每個衰減控制值指示該第一語音相關(guān)特征序列和該第二語音相關(guān)特征序列之間在不同時間(例如,在不同時間段中)的相似程度。在一些實施例中,每個衰減控制值是增益控制值。 在ー些第一類實施例中,每個衰減控制值與音頻信號的至少ー個非語音通道指示增強由語音通道確定的語音內(nèi)容的可辨識度(或者另ー感知品質(zhì))的語音增強內(nèi)容的可能性單調(diào)相關(guān)。在另ー些第一類實施例中,每個衰減控制值被單調(diào)關(guān)聯(lián)到至少ー個非語音通道的預期語音增強值(例如,至少ー個非語音通道指示語音增強內(nèi)容的或然率的度量,乘以由至少ー個非語音通道確定的語音增強內(nèi)容將對由多通道信號確定的語音內(nèi)容提供的感知品質(zhì)增強的度量)。例如,當步驟(a)包括比較指示由語音通道確定的語音相關(guān)內(nèi)容的第一語音相關(guān)特征序列和指示由至少ー個非語音通道確定的語音相關(guān)內(nèi)容的第二語音相關(guān)特征序列的步驟時,第一語音相關(guān)特征序列可以是語音可能性值的序列,每個該語音可能性值表明在不同時間(例如,在不同時間段中)語音通道指示語音(而不是語音之外的音頻內(nèi)容)的可能性,第二語音相關(guān)特征序列也可以是語音可能性值的序列,每個該語音可能性值表明在不同時間(例如,在不同時間段中)至少ー個非語音通道指示語音的可能性。從音頻信號自動生成這種語音可能性值的序列的各種方法是已知的。例如,一種這樣的方法由 Robinson 和 Vinton 描述于 “Automated Speech/Other Discrimination for LoudnessMonitoring,,(Audio Engineering Society, Preprint number 6437of Conventionll8,2005年5月)中。備選地,預期語音可能性值的序列可以手工創(chuàng)建(例如,通過內(nèi)容創(chuàng)建器)且與多通道音頻信號一起傳輸?shù)浇K端用戶。在其中多通道音頻信號具有語音通道以及包括第一非語音通道和第二非語音通道的至少兩個非語音通道的第二類實施例中,本發(fā)明的方法包括步驟(a)確定至少ー個第一衰減控制值,該至少ー個第一衰減控制值指示由該語音通道確定的語音相關(guān)內(nèi)容與由該第一非語音通道確定的第二語音相關(guān)內(nèi)容之間的相似程度(例如,包括通過比較指示由該語音通道確定的語音相關(guān)內(nèi)容的第一語音相關(guān)特征序列和指示該第二語音相關(guān)內(nèi)容的第二語音相關(guān)特征序列);以及(10確定至少ー個第二衰減控制值,該至少ー個第二衰減控制值指示由該語音通道確定的語音相關(guān)內(nèi)容與由該第二非語音通道確定的第三語音相關(guān)內(nèi)容之間的相似程度(例如,包括通過比較指示由該語音通道確定的語音相關(guān)內(nèi)容的第三語音相關(guān)特征序列和指示該第三語音相關(guān)內(nèi)容的第四語音相關(guān)特征序列,其中該第三語音相關(guān)特征序列可以與步驟(a)的第一語音相關(guān)特征序列相同)。典型地,該方法包括響應于 該至少ー個第一衰減控制值對該第一非語音通道進行衰減(例如,縮放該第一非語音通道的衰減)和響應于該至少ー個第二衰減控制值對該第二非語音通道進行衰減(例如,縮放該第二非語音通道的衰減)的步驟。優(yōu)選地,每個非語音通道都被衰減從而改善由語音通道確定的語音的可辨識度,而沒有不期望地對任ー非語音通道確定的語音增強內(nèi)容進行衰減。在ー些第二類實施例中在步驟(a)中確定的該至少ー個第一衰減控制值是衰減控制值的序列,每個衰減控制值是用于縮放增益量的増益控制值,該增益量通過回避電路施加到第一非語音通道以改善由語音通道確定的語音的可辨識度,而沒有不期望地對由第一非語音通道確定的語音增強內(nèi)容進行衰減;且在步驟(b)中確定的該至少ー個第二衰減控制值是第二衰減控制值的序列,每個第二衰減控制值是用于縮放増益量的増益控制值,該增益量通過回避電路施加到第二非語音通道以改善由該語音通道確定的語音的可辨識度,而沒有不期望地對由第二非語音通道確定的語音增強內(nèi)容進行衰減。在第三類實施例中,本發(fā)明是ー種用于對具有語音通道和至少ー個非語音通道的多通道音頻信號進行濾波以改善由該信號確定的語音的可辨識度的方法。該方法包括步驟(a)比較語音通道的特性和非語音通道的特性以產(chǎn)生用于控制該非語音通道相對于該語音通道的衰減的至少ー個衰減值;以及(b)響應于至少ー個語音增強可能性值調(diào)節(jié)該至少ー個衰減值,以產(chǎn)生用于控制該非語音通道相對于該語音通道的衰減的至少ー個調(diào)節(jié)衰減值。典型地,該調(diào)節(jié)步驟為(包括)響應于ー個所述語音增強可能性值縮放每個所述衰減值以產(chǎn)生一個所述調(diào)節(jié)衰減值。典型地,每個語音增強可能性值表明(例如單調(diào)關(guān)聯(lián)到)非語音通道(或者從非語音通道或從輸入音頻信號的一組非語音通道衍生的非語音通道)指示語音增強內(nèi)容(增強由語音通道確定的語音內(nèi)容的可辨識度或其它感知品質(zhì)的內(nèi)容)的可能性。在一些實施例中,語音增強可能性值表明非語音通道的預期語音增強值(例如,非語音通道指示語音增強內(nèi)容的或然率的度量乘以由非語音通道確定的語音增強內(nèi)容將對由多通道音頻信號確定的語音內(nèi)容提供的感知品質(zhì)增強的度量)。在ー些第三類實施例中,至少ー個語音增強可能性值是由包括比較指示由語音通道確定的語音相關(guān)內(nèi)容的第一語音相關(guān)特征序列與指示由非語音通道確定的語音相關(guān)內(nèi)容的第二語音相關(guān)特征序列的步驟的方法確定的比較值(例如,差異值)的序列,每個比較值是在不同時間(例如在不同時間段中)第一語音相關(guān)特征序列和第二語音相關(guān)特征序列之間的相似程度。在典型的第三類實施例中,該方法還包括響應于該至少一個調(diào)節(jié)衰減值,對該非語音通道進行衰減的步驟。步驟(b)可包括響應于該至少ー個語音增強可能性值,縮放至少ー個衰減值(其典型地是回避增益控制信號或其它原始衰減控制信號,或者由其決定)。在ー些第三類實施例中,在步驟(a)中產(chǎn)生的每個衰減值是指示限制非語音通道中的信號功率對語音通道中的信號功率的比值不超過預定閾值所需的非語音通道衰減量的第一因子,其被單調(diào)關(guān)聯(lián)到語音通道指示語音的可能性的第二因子縮放。典型地,這些實施例中的調(diào)節(jié)步驟是(或包括)通過ー個所述語音增強可能性值縮放每個所述衰減值以產(chǎn)生ー個所述調(diào)節(jié)衰減值,其中所述語音增強可能性值是單調(diào)關(guān)聯(lián)到以下之一的因子非語音通道指示語音增強內(nèi)容(增強由多通道信號確定的語音內(nèi)容的可辨識度或其它感知品質(zhì) 的內(nèi)容)的可能性;以及非語音通道的預期語音增強值(例如,非語音通道指示語音增強內(nèi)容的或然率的度量乘以非語音通道中的語音增強內(nèi)容將對由多通道信號確定的語音內(nèi)容提供的感知品質(zhì)增強的度量)。在ー些第三類實施例中,在步驟(a)中產(chǎn)生的每個衰減值是指示足以使存在由非語音通道確定的內(nèi)容時由語音通道確定的語音的預測可辨識度超過預定閾值的非語音通道的衰減量(例如,最小量)的第一因子,其被與該語音通道指示語音的可能性單調(diào)相關(guān)的第二因子縮放。優(yōu)選地,存在由該非語音通道確定的內(nèi)容時由該語音通道確定的語音的預測可辨識度根據(jù)基于心理聲學的可辨識度預測模型來確定。典型地,這些實施例中的調(diào)節(jié)步驟是(或者包括)通過ー個所述語音增強可能性值縮放每個所述衰減值以產(chǎn)生一個所述調(diào)節(jié)了的衰減值,其中該語音增強可能性值是與以下之ー單調(diào)相關(guān)的因子該非語音通道指示語音增強內(nèi)容的可能性,以及該非語音通道的預期語音增強值。在ー些第三類實施例中,步驟(a)包括產(chǎn)生每個所述衰減值的步驟,包括通過如下步驟來進行確定該語音通道和該非語音通道中的每個的功率譜(指示作為頻率函數(shù)的功率),以及響應于每個所述功率譜執(zhí)行衰減值的頻率確定。優(yōu)選地,以此方式產(chǎn)生的衰減值確定將要應用到非語音通道的頻率成分的作為頻率函數(shù)的衰減。在一類實施例中,本發(fā)明是一種用于增強由多通道音頻輸入信號確定的語音的方法和系統(tǒng)。在一些實施例中,本發(fā)明的系統(tǒng)包括分析模塊(子系統(tǒng)),配置為分析該輸入多通道信號以產(chǎn)生衰減控制值;以及衰減子系統(tǒng)。該衰減子系統(tǒng)配置為由至少ー些衰減控制值掌控地應用回避衰減到該輸入信號的每個非語音通道以產(chǎn)生濾波音頻輸出信號。在ー些實施例中,該衰減子系統(tǒng)包括回避電路(由至少ー些衰減控制值掌控),其耦接且配置為應用衰減(回避)到該輸入信號的每個非語音通道以產(chǎn)生濾波音頻輸出信號。在應用到非語音通道的衰減由控制信號的當前值確定的意義上來說,該回避電路被控制值所掌控。在典型實施例中,本發(fā)明的系統(tǒng)是或者包括通用或?qū)S锰幚砥鳎溆密浖?或固件)編程和/或以其他方式配置為執(zhí)行本發(fā)明的方法的實施例。在一些實施例中,本發(fā)明的系統(tǒng)是通用處理器,耦接為接收指示音頻輸入信號的輸入數(shù)據(jù)且編程(用適當?shù)能浖?為通過執(zhí)行本發(fā)明的方法的實施例響應于該輸入數(shù)據(jù)產(chǎn)生指示音頻輸出信號的輸出數(shù)據(jù)。在另一些實施例中,本發(fā)明的系統(tǒng)通過適當?shù)嘏渲?例如,通過編程)一可配置音頻數(shù)字信號處理器(DSP)來實現(xiàn)。該音頻DSP可以是常規(guī)音頻DSP,其可配置(例如,可通過適當?shù)能浖蚬碳砭幊?,或者響應于控制?shù)據(jù)以其他方式配置)為對輸入音頻執(zhí)行多種操作中的任意操作。運行吋,已經(jīng)配置為執(zhí)行根據(jù)本發(fā)明的主動語音增強的音頻DSP耦接為接收音頻輸入信號,除了(包括)語音增強之外,該DSP典型地還對輸入音頻信號執(zhí)行多種操作。根據(jù)本發(fā)明的各種實施例,音頻DSP可在配置(例如編程)之后操作來執(zhí)行本發(fā)明的方法的實施例以通過對輸入音頻信號執(zhí)行該方法而響應于輸入音頻信號產(chǎn)生輸出音頻信號。本發(fā)明的各方面包括配置(例如編程)為執(zhí)行本發(fā)明的方法的任意實施例的系統(tǒng)、以及存儲用于實現(xiàn)本發(fā)明的方法的任意實施例的代碼的計算機可讀介質(zhì)(例如,盤)。


圖I是本發(fā)明的系統(tǒng)的實施例的框圖; 圖IA是本發(fā)明的系統(tǒng)的另一實施例的框圖;圖2是本發(fā)明的系統(tǒng)的另一實施例的框圖;圖2A是本發(fā)明的系統(tǒng)的另一實施例的框圖;圖3是本發(fā)明的系統(tǒng)的另一實施例的框圖;圖4是作為本發(fā)明的系統(tǒng)的實施例的音頻數(shù)字信號處理器(DSP)的框圖;以及圖5是計算機系統(tǒng)的框圖,包括計算機可讀存儲介質(zhì)504,其存儲用于對系統(tǒng)進行編程以執(zhí)行本發(fā)明的方法的實施例的計算機代碼。
具體實施例方式本發(fā)明的許多實施例在技術(shù)上是可行的。根據(jù)本公開,如何實現(xiàn)它們將對本領(lǐng)域普通技術(shù)人員變得顯然。本發(fā)明的系統(tǒng)、方法和介質(zhì)的實施例將參照圖1、1A、2、2A和3-5進行描述。發(fā)明人已經(jīng)發(fā)現(xiàn),一些多通道音頻內(nèi)容在語音通道和至少ー個非語音通道中具有不同但相關(guān)的語音內(nèi)容。例如,ー些舞臺表演的多通道音頻記錄被混合使得“干”語音(即沒有明顯回響的語音)被置于語音通道中(典型地,信號的中央通道C)且相同但具有顯著回響成分的語音(“濕”語音)被置于信號的非語音通道中。在典型情況中,干語音是來自舞臺表演者持有的靠近其嘴部的麥克風的信號,濕語音是來自置于聽眾中的麥克風的信號。濕語音與干語音相關(guān),因為它是劇場中的聽眾聽到的表演。但是它不同于干語音。典型地,濕語音相對于干語音被延遲,具有不同的波譜和不同的附加成分(例如,聽眾噪聲和回響)。根據(jù)干濕語音的相對水平,濕語音成分可能將干語音成分掩蓋到回避電路中非語音通道的衰減(例如,如在上面引用的W02010/011377描述的方法中那樣)不期望地使?jié)裾Z音信號衰減的程度。盡管干和濕語音成分可以描述為單獨實體,但是聆聽者感知上融合這兩種且將它們聽為單個語音流。衰減濕語音成分(例如,在回避電路中)可具有降低所融合的語音流的感知響度以及降低其圖景寬度的效果。本發(fā)明人已經(jīng)意識到,對于具有所述類型的干濕語音成分的多通道音頻信號,如果濕語音成分的水平在信號的語音增強處理期間不改變的話,通常感知上將更愉悅且將更有助于語音可辨識度。
本發(fā)明部分基于如下認識當多通道音頻信號的至少ー個非語音通道包括增強由信號的語音通道確定的語音內(nèi)容的可辨識度(或者其它感知品質(zhì))的內(nèi)容吋,使用回避電路對信號的非語音通道進行濾波(例如,根據(jù)W02010/011377的方法)會負面影響聆聽所再現(xiàn)的濾波信號的聽眾的娛樂體驗。根據(jù)本發(fā)明的典型實施例,多通道音頻信號的至少ー個非語音通道的衰減(在回避電路中)在非語音通道包括語音增強成分(增強由信號的語音通道確定的語音內(nèi)容的可辨識度或其它感知品質(zhì)的內(nèi)容)的時間期間被暫?;蛐薷摹T诜钦Z音通道不包括語音增強內(nèi)容(或者不包括滿足預定標準的語音增強內(nèi)容)的時間期間,非語音通道被正常衰減(衰減不暫停或修改)。回避電路中的常規(guī)濾波對其不合適的典型多通道信 號(具有語音通道)是包括至少ー個非語音通道的信號,該至少一個非語音通道承載與語音通道中的語音提示基本相同的語音提示。根據(jù)本發(fā)明的典型實施例,語音通道中語音相關(guān)特征的序列與非語音通道中語音相關(guān)特征的序列相比較。兩種特征序列的實質(zhì)相似性表明非語音通道(即,非語音通道中的信號)貢獻了理解語音通道中的語音有用的信息,且表明非語音通道的衰減應被避免。為了意識到檢查這種語音相關(guān)特征序列而不是信號本身之間的相似性的重要意義,重要的是認識到“干”和“濕”語音成分(由語音和非語音通道確定)不相同;指示這兩類語音成分的信號通常在時間上錯開,且已經(jīng)經(jīng)歷了不同的濾波處理并已經(jīng)添加有不同的外來成分。因此,兩種信號之間的直接比較將產(chǎn)生低相似度,無論非語音通道貢獻了與語音通道相同的語音提示(如在干和濕語音的情況中那樣),不相關(guān)的語音提示(如在語音和非語音通道中有兩種不相關(guān)的聲音[例如,語音通道中的目標談話和非語音通道中模糊不清的背景說話]的情況中那樣),還是根本沒有語音提示(例如,非語音通道承載音樂和效果)。通過將比較基于語音特征(如在本發(fā)明的優(yōu)選實施例中那樣),實現(xiàn)了一定水平的抽象化(abstraction),其減少了不相關(guān)信號方面的影響,諸如小量延遲、譜差異以及附加外部信號。因此,本發(fā)明的優(yōu)選實現(xiàn)一般產(chǎn)生至少兩個語音特征流ー個表示語音通道中的信號,至少ー個表示非語音通道中的信號。本發(fā)明的系統(tǒng)的第一實施例(125)將參照圖I來進行描述。響應于包括語音通道101 (中央通道C)以及兩個非語音通道102和103 (左通道L和右通道R)的多通道音頻信號,圖I的系統(tǒng)對非語音通道進行濾波以產(chǎn)生包括語音通道101以及濾波的非語音通道118和119 (濾波的左通道L’和右通道R’)的濾波多通道輸出音頻信號。備選地,非語音通道102和103之一或二者可以是多通道音頻信號的另ー類型的非語音通道(例如,5. I通道音頻信號的左后和/或右后通道),或者可以是從多通道音頻信號的非語音通道中的許多不同子集中的任意子集衍生出的衍生非語音通道(例如,是它們的組合)。備選地,本發(fā)明的系統(tǒng)的實施例可以實現(xiàn)為對多通道音頻信號的僅ー個非語音通道或者超過兩個非語音通道進行濾波。再次參照圖1,非語音通道102和103分別斷言到回避放大器117和116。運行吋,回避放大器116由從乘法元件114輸出的控制信號S3 (其指示控制值的序列,因此也稱為控制值序列S3)掌控,回避放大器117由從乘法元件115輸出的控制信號S4 (其指示控制值的序列,因此也稱為控制值序列S4)掌控。多通道輸入信號的每個通道的功率由一組功率評估器(104、105和106)測量且表達在對數(shù)標度上[dB]。這些功率評估器可以實施平滑機構(gòu),諸如泄露積分器,從而所測量的功率電平反映在句子或整段的持續(xù)時間上平均的功率電平。語音通道中的信號的功率電平從每個非語音通道中的功率電平扣除(通過減法元件107和108)以給出兩種信號類型之間的功率比值的度量。元件107的輸出是非語音通道103中的功率對語音通道101中的功率的比值的度量。元件108的輸出是非語音通道102中的功率對語音通道101中的功率的比值的度量。比較電路109確定對于每個非語音通道,為了使非語音通道的功率電平保持為比語音通道中的信號的功率電平低至少0dB,非語音通道必須衰減的分貝(dB)數(shù)(其中符號“ 9 ”也稱為手寫體西塔,指代預定閾值)。在電路109的一個實現(xiàn)中,加法元件120添加閾值9 (存儲于可以是寄存器的元件110中)到非語音通道103和語音通道101之間的功率電平差(或“余量”),加法元件121添加閾值0到非語音通道102和語音通道101之間的功率電平差。元件111-1和112-1分別改變加法元件120和121的輸出的符號。該符號改變操作將衰減值轉(zhuǎn)換為增益值。元件111和112將每個結(jié)果限制為等于或小于零(元件111-1的輸出被斷言到限制器111,元件112-1的輸出被斷言到限制器112)。從限制器111輸出的當前值Cl確定為了將非語音通道103的功率電平保持為比語音通道101的功率電平低
0dB (在多通道輸入信號的相關(guān)時間處或者相關(guān)時間窗中),必須應用到非語音通道103的以dB計的增益(負衰減)。從限制器112輸出的當前值C2確定為了將非語音通道102的功率電平保持為比語音通道101的功率電平低0 dB(在多通道輸入信號的相關(guān)時間處或者相關(guān)時間窗中),必須應用到非語音通道102的以dB計的增益(負衰減)。9的典型合適值為5dB。因為在對數(shù)標度(dB)上表達的度量和在線性標度上表達的相同度量之間有唯一關(guān)系,所以可以構(gòu)建與圖I的元件104、105、106、107、108和109等價的電路(或者被編程或以其他方式配置的處理器),其中功率、増益和閾值全部都在線性標度上表達。替選實現(xiàn)可以用與信號強度諸如信號的絕對值相關(guān)的度量來代替功率度量。從限制器111輸出的信號Cl是用于非語音通道103的原始衰減控制信號(用于回避放大器116的增益控制信號),其可以直接斷言到放大器116以控制非語音通道103的回避衰減。從限制器112輸出的信號C2是用于非語音通道102的原始衰減控制信號(用于回避放大器117的增益控制信號),其可以直接斷言到放大器117以控制非語音通道102的回避衰減。然而,根據(jù)本發(fā)明,原始衰減控制信號Cl和C2在乘法元件114和115中被縮放以產(chǎn)生用于通過放大器116和117來控制非語音通道的回避衰減的增益控制信號S3和S4。信號Cl響應于衰減控制值SI的序列被縮放,信號C2響應于衰減控制值S2的序列被縮放。每個控制值SI從處理元件134 (將在下面描述)的輸出斷言到乘法元件114的輸入,信號Cl (進而由其確定的每個“原始”増益控制值Cl)從限制器111斷言到元件114的另ー輸入。元件114響應于當前值SI縮放當前值Cl,將這些值乘到一起以產(chǎn)生當前值S3,其被斷言到放大器116。每個控制值S2從處理元件135 (將在下面描述)的輸出斷言到乘法元件115的輸入,信號C2 (進而由其確定的每個“原始”増益控制值C2)從限制器112斷言到元件115的另ー輸入。元件115響應于當前值S2縮放當前值C2,將這些值乘到一起以產(chǎn)生當前值S4,其被斷言到放大器117。根據(jù)本發(fā)明如下生成控制值SI和S2。在語音可能性處理元件130、131和132中,對于多通道輸入信號的每個通道生成語音可能性信號(圖I中的信號P、Q和T中的每個)。語音可能性信號P表示用于非語音通道102的語音可能性值的序列;語音可能性信號Q表示用于語音通道101的語音可能性值的序列;語音可能性信號T表示用于非語音通道103的語音可能性值的序列。語音可能性信號Q是與語音通道中的信號實際上表示語音的可能性單調(diào)相關(guān)的值。語音可能性信號P是與非語音通道102中的信號是語音的可能性單調(diào)相關(guān)的值。語音可能性信號T是與非語音通道103中的信號是語音的可能性單調(diào)相關(guān)的值。處理器130、131和132 (其通常彼此相同,但是在一些實施例中彼此不同)可以實現(xiàn)自動確定斷言到其的輸入信號表示語音的可能性的各種方法中的任意方法。在一實施例中,語音可能性處理器130、131和132彼此相同,處理器130產(chǎn)生信號P (根據(jù)非語音通道102中的信息),使得信號P表示語音可能性值的序列,每個語音可能性值與不同時間(或時間窗)處通道102中的信號是語音的可能性單調(diào)相關(guān)。處理器131產(chǎn)生信號Q (根據(jù)通道101中的信息),使得信號Q表示語音可能性值的序列,每個語音可能性值與不同時間(或時間窗)處通道101中的信號是語音的可能性單調(diào)相關(guān)。處理器132產(chǎn)生信號T (根據(jù)非語音通道103中的 信息),使得信號T表示語音可能性值的序列,每個語音可能性值與不同時間(或時間窗)處通道103中的信號是語音的可能性單調(diào)相關(guān)。處理器130、131和132中的每個通過實現(xiàn)(在相關(guān)的一個通道 102、101 和 IO3 上)Robinson 和 Vinton 在“Automated Speech/OtherDiscrimination for Loudness Monitoring” (Audio Engineering Society,Preprintnumber 6437 of Convention 118, 2005年5月)中描述的機構(gòu)來實現(xiàn)所述功能。替選地,信號P可以手工產(chǎn)生,例如由內(nèi)容創(chuàng)建者產(chǎn)生,并且與通道102中的音頻信號一起發(fā)送到終端用戶,處理器130可以簡單地從通道102提取這種先前創(chuàng)建的信號P(或者處理器130可以被去除,先前創(chuàng)建的信號P直接斷言到處理器134)。類似地,信號Q可以手工產(chǎn)生并與通道101中的音頻信號一起發(fā)送,處理器131可以簡單地從通道101提取這種先前創(chuàng)建的信號Q (或者處理器131可以被去除,先前創(chuàng)建的信號Q直接斷言到處理器134和135),信號T可以手工產(chǎn)生并與通道103中的音頻信號一起發(fā)送,處理器132可以簡單地從通道103提取這種先前創(chuàng)建的信號T(或者處理器132可以被去除,先前創(chuàng)建的信號T直接斷言到處理器 135)。在處理器134的典型實現(xiàn)中,由信號P和Q確定的語音可能性值成對比較以確定對于信號P的當前值序列中的每個,信號P和Q的當前值之間的差異。在處理器135的典型實現(xiàn)中,由信號T和Q確定的語音可能性值成對比較,以確定對于信號Q的當前值序列中的每個,確定信號T和Q的當前值之間的差異。結(jié)果,處理器134和135中的每個產(chǎn)生成對的語音可能性信號的差異值的時間序列。處理器134和135優(yōu)選實現(xiàn)為通過時間平均來平滑每個這樣的差異值序列,并且可選地縮放每個所得平均化差異值序列。平均化差異值序列的縮放可以是必需的,從而從處理器134和135輸出的所縮放的平均化值所在的范圍使得放大元件114和115的輸出對于掌控回避放大器116和117而言是有用的。在典型實現(xiàn)中,從處理器134輸出的信號SI是縮放了的平均化差異值的序列(這些縮放了的平均化差異值中的每個是信號P和Q的當前值之間的差異在不同時間窗中的縮放平均)。信號SI是用于非語音通道102的回避增益控制信號,用來縮放用于非語音通道102的獨立生成的原始回避增益控制信號Cl。類似地,在典型實現(xiàn)中,從處理器135輸出的信號S2是縮放了的平均化差異值的序列(這些縮放了的平均化差異值中的每個是信號T和Q的當前值之間的差異在不同時間窗中的縮放平均)。信號S2是用于非語音通道103的回避增益控制信號,用來縮放用于非語音通道103的獨立生成的原始回避增益控制信號C2。根據(jù)本發(fā)明響應于回避增益控制信號SI對原始回避增益控制信號Cl進行縮放可以通過將信號Cl的每個原始增益控制值乘以(在元件114中)信號SI的對應的一個縮放平均差異值以生成信號S3來進行。根據(jù)本發(fā)明響應于回避增益控制信號S2對原始回避増益控制信號C2進行縮放可以通過將信號C2的每個原始增益控制值乘以(在元件115中)信號S2的對應的一個縮放平均差異值以生成信號S4來進行。本發(fā)明的系統(tǒng)的另一實施例(125’)將參照圖IA來描述。響應于包括語音通道101(中央通道C)以及兩個非語音通道102和103 (左通道L和右通道R)的多通道音頻信號, 圖IA的系統(tǒng)對非語音通道進行濾波以產(chǎn)生包括語音通道101以及濾波了的非語音通道118和119 (濾波了的左通道L’和右通道R’)的濾波多通道輸出音頻信號。在圖IA的系統(tǒng)中(如圖I的系統(tǒng)中那樣),非語音通道102和103分別斷言到回避放大器117和116。運行吋,回避放大器117由從乘法元件115輸出的控制信號S4(其指示控制值的序列,因此也稱為控制值序列S4)掌控,回避放大器116由從乘法元件114輸出的控制信號S3 (其指示控制值的序列,因此也稱為控制值序列S3)掌控。圖IA的元件104、105、106、107、108、109 (包括元件 110、120、121、111—1、112—1、111 和 112)、114、115、130、131、132、134和135與圖I的相同編號的兀件相同,不再重復上面對它們的描述。圖IA的系統(tǒng)與圖I的系統(tǒng)的不同之處在于,用于縮放控制信號Cl (在限制器元件111的輸出處斷言)的是控制信號Vl (在乘法器214的輸出處斷言),而不是控制信號SI (在處理器134的輸出處斷言),用于縮放控制信號C2 (在限制器元件112的輸出處斷言)的是控制信號V2 (在乘法器215的輸出處斷言),而不是控制信號S2 (在處理器135的輸出處斷言)。在圖IA中,根據(jù)本發(fā)明響應于衰減控制值Vl的序列對原始回避增益控制信號Cl進行縮放可以通過將信號Cl的每個原始增益控制值乘以(在元件114中)對應的ー個衰減控制值Vl以產(chǎn)生信號S3來進行,根據(jù)本發(fā)明響應于衰減控制值V2的序列對原始回避增益控制信號C2進行縮放可以通過將信號C2的每個原始增益控制值乘以(在元件115中)對應的一個衰減控制值V2以產(chǎn)生信號S4來進行。為了產(chǎn)生衰減控制值Vl的序列,信號Q (在處理器131的輸出處斷言)被斷言到乘法器214的輸入,控制信號SI (在處理器134的輸出處斷言)被斷言到乘法器214的另ー個輸入。乘法器214的輸出是衰減控制值Vl的序列。衰減控制值Vl中的每個是由信號Q確定的語音可能性值之ー被對應的一個衰減控制值SI縮放后的值。類似地,為了產(chǎn)生衰減控制值V2的序列,信號Q (在處理器131的輸出處斷言)被斷言到乘法器215的輸入,控制信號S2 (在處理器135的輸出處斷言)被斷言到乘法器215的另ー個輸入。乘法器215的輸出是衰減控制值V2的序列。衰減控制值V2中的每個是由信號Q確定的語音可能性值之ー被對應的一個衰減控制值S2縮放后的值。圖I的系統(tǒng)(或圖IA的系統(tǒng))可以通過處理器(例如,圖5的處理器501)以軟件實現(xiàn),該處理器已被編程以實現(xiàn)所描述的圖I (或1A)的系統(tǒng)的操作。替選地,可以以硬件實現(xiàn),該硬件具有如圖I (或1A)所示地連接的電路元件。
在圖I (或圖1A)的實施例的變型中,根據(jù)本發(fā)明響應于回避增益控制信號SI (或VI)對原始回避增益控制信號Cl進行縮放(以產(chǎn)生用于掌控放大器116的回避增益控制信號)可以按非線性方式進行。例如,這種非線性縮放可以產(chǎn)生回避增益控制信號(代替信號S3),當信號SI (或VI)的當前值在閾值以下時,該回避增益控制信號導致放大器116沒有進行回避(即,通過放大器116應用等于ー的増益,因此通道103沒有衰減),當信號SI (或VI)的當前值超過閾值時,該回避增益控制信號導致該回避增益控制信號(代替信號S3)的當前值等于信號Cl的當前值(從而信號SI (或VI)不改變Cl的當前值)。替選地,可以進行信號Cl的其他線性或非線性縮放(響應于本發(fā)明的回避增益控制信號SI或VI)以產(chǎn)生用于掌控放大器116的回避增益控制信號。例如,信號Cl的這種縮放可以產(chǎn)生回避增益控制信號(代替信號S3),當信號SI (或VI)的當前值在閾值以下時,該回避增益控制信號導致放大器116沒有進行回避(S卩,放大器116應用等于ー的増益),當信號SI (或VI)的當前值超過閾值時,該回避增益控制信號導致該回避增益控制信號(代替信號S3)的當前值等于信號Cl的當前值乘以信號SI或Vl的當前值的乘積(或者由該乘積確定的某些其他值)。類似地,在圖I (或圖1A)的實施例的變型中,根據(jù)本發(fā)明響應于回避增益控制信
號S2 (或V2)對原始回避增益控制信號C2進行縮放(以產(chǎn)生用于掌控放大器117的回避增益控制信號)可以按非線性方式進行。例如,這種非線性縮放可以產(chǎn)生回避增益控制信號(代替信號S4),當信號S2 (或V2)的當前值在閾值以下時,該回避增益控制信號導致放大器117沒有進行回避(S卩,通過放大器117應用等于ー的増益,因此通道102沒有衰減),當信號S2 (或V2)的當前值超過閾值時,該回避增益控制信號導致該回避增益控制信號(代替信號S4)的當前值等于信號C2的當前值(從而信號S2或V2不改變C2的當前值)。替選地,可以進行信號C2的其他線性或非線性縮放(響應于本發(fā)明的回避增益控制信號S2或V2)以產(chǎn)生用于掌控放大器117的回避增益控制信號。例如,信號C2的這種縮放可以產(chǎn)生回避增益控制信號(代替信號S4),當信號S2 (或V2)的當前值在閾值以下時,該回避增益控制信號導致放大器117沒有進行回避(S卩,放大器117應用等于ー的増益),當信號S2 (或V2)的當前值超過閾值時,該回避增益控制信號導致該回避增益控制信號(代替信號S4)的當前值等于信號C2的當前值乘以信號S2或V2的當前值的乘積(或者由該乘積確定的某些其他值)。本發(fā)明的系統(tǒng)的另一實施例(225)將參照圖2來進行描述。響應于包括語音通道101 (中央通道C)以及兩個非語音通道102和103 (左通道L和右通道R)的多通道音頻信號,圖2的系統(tǒng)對非語音通道進行濾波以產(chǎn)生包括語音通道101以及濾波的非語音通道118和119 (濾波的左通道L’和右通道R’ )的濾波多通道輸出音頻信號。在圖2的系統(tǒng)中(如圖I的系統(tǒng)中那樣),非語音通道102和103分別斷言到回避放大器117和116。運行吋,回避放大器117由從乘法元件115輸出的控制信號S6 (其指示控制值的序列,因此也稱為控制值序列S6)掌控,回避放大器116由從乘法元件114輸出的控制信號S5 (其指示控制值的序列,因此也稱為控制值序列S5)掌控。圖2的元件114、115、130、131、132、134和135與圖I的相同編號的元件相同(且起相同的作用),不再重復上面對它們的描述。圖2的系統(tǒng)用ー組功率評估器201、202和203測量通道101、102和103每個中的信號的功率。與圖I中的對等物不同,功率評估器201、202和203中的每個測量信號功率在頻率上的分布(即,相關(guān)通道的一組頻帶中每個不同頻帶中的功率),產(chǎn)生用于每個通道的功率譜,而不是單個數(shù)字。每個功率譜的譜分辨率理想上匹配元件205和206實現(xiàn)的可辨識度預測模型(下面論述)的譜分辨率。功率譜被饋送到比較電路204中。電路204的目的是確定將要施加到每個非語音通道的衰減以確保非語音通道中的信號不把語音通道中的信號的可辨識度減弱到小于預定標準。該功能通過采用可辨識度預測電路(205和206)來實現(xiàn),可辨識度預測電路(205和206)根據(jù)語音通道信號(201)和非語音通道信號(202和203)的功率譜預測語音可辨識度。可辨識度預測電路205和206可以根據(jù)設計選擇和權(quán)衡實現(xiàn)合適的可辨識度預測模型。例子是 ANSI S3. 5-1997 (“Methods for Calculation of the SpeechIntelligibility Index”)中規(guī)范的語音可辨識度指數(shù)和Muesch & Buus語音識別靈敏/S〒吳M(“Using statistical decision theory to predict speecn intelligibility.I. Model structure” Journal of Acoustical Society of America, 2001, Vol. 109, p2896 — 2909)。清楚的是,當語音通道中的信號是語音之外的事物時,可辨識度預測模型的輸出沒有意義。盡管如此,在下面可辨識度預測模型的輸出將稱為預測語音可辨識度。感 知錯誤在后面的處理中通過用參數(shù)SI和S2縮放從比較單元204輸出的增益值來解決,參數(shù)SI和S2中的每個涉及語音通道中的信號指示語音的可能性。可辨識度預測模型的共同點在于,作為降低非語音信號水平的結(jié)果,它們預測提高或未改變的語音可辨識度。繼續(xù)圖2的處理流程,比較電路207和208比較預測可辨識度和預定標準值。如果元件205確定非語音通道103的水平低到使所預測的可辨識度超過標準,那么從電路209取得初始化為OdB的增益參數(shù)且提供到電路211,作為比較電路204的輸出C3。如果元件206確定非語音通道102的水平低到使所預測的可辨識度超過標準,那么從電路210取得初始化為OdB的增益參數(shù)且提供到電路212,作為比較電路204的輸出C4。如果元件205或206確定標準未得到滿足,則增益參數(shù)(元件209和210中的相關(guān)ー個中)下降固定量且可辨識度預測被重復。降低増益的合適階梯大小為ldB。繼續(xù)如剛才所述的迭代,直到所預測的可辨識度滿足或超過標準值。當然可能的是,語音通道中的信號使得即使在非語音通道中沒有信號時也不能達到標準可辨識度。這種情況的例子是非常低水平或有嚴格限制的帶寬的語音信號。如果發(fā)生這種情況,那么會造成如下情況施加到非語音通道的増益的任何進ー步減小不影響所預測的語音可辨識度,且標準永遠得不到滿足。在這種狀況下,元件205、207和209 (或元件206、208和210)形成的循環(huán)無限地繼續(xù),可以應用額外邏輯器(未示出)來中斷該循環(huán)。這樣的邏輯器的一種特別簡單的例子是對迭代次數(shù)進行計數(shù),一旦超過預定迭代次數(shù)就跳出循環(huán)。根據(jù)本發(fā)明響應于回避增益控制信號SI對原始回避增益控制信號C3進行縮放可以通過將信號C3的每個原始增益控制值乘以(在元件114中)信號SI的對應ー個縮放平均差異值以產(chǎn)生信號S5來進行。根據(jù)本發(fā)明響應于回避增益控制信號S2對原始回避增益控制信號C4進行縮放可以通過將信號C4的每個原始增益控制值乘以(在元件115中)信號S2的對應ー個縮放平均差異值以產(chǎn)生信號S6來進行。圖2的系統(tǒng)可以通過處理器(例如,圖5的處理器501)以軟件實現(xiàn),該處理器已被編程以實現(xiàn)所描述的圖2的系統(tǒng)的操作。替選地,可以以硬件實現(xiàn),該硬件具有如圖2所示地連接的電路元件。在圖2的實施例的變型中,根據(jù)本發(fā)明響應于回避增益控制信號SI對原始回避增益控制信號C3進行縮放(以產(chǎn)生用于掌控放大器116的回避增益控制信號)可以按非線性方式進行。例如,這種非線性縮放可以產(chǎn)生回避增益控制信號(代替信號S5),當信號SI的當前值在閾值以下時,該回避增益控制信號導致放大器116沒有進行回避(即,通過放大器116應用等于ー的増益,因此通道103沒有衰減),當信號SI的當前值超過閾值吋,該回避增益控制信號導致該回避增益控制信號(代替信號S5)的當前值等于信號C3的當前值(從而信號SI不改變C3的當前值)。替選地,可以進行信號C3的其他線性或非線性縮放(響應于本發(fā)明的回避增益控制信號SI)以產(chǎn)生用于掌控放大器116的回避增益控制信號。例如,信號C3的這種縮放可以產(chǎn)生回避增益控制信號(代替信號S5),當信號SI的當前值在閾值以下時,該回避增益控制信號導致放大器116沒有進行回避(S卩,放大器116應用等于ー的増益),當信號SI的當前值超過閾值時,該回避增益控制信號導致該回避增益控制信號(代替信號S5)的當前值等于信號C3的當前值乘以信號SI的當前值的乘積(或者由該乘積確 定的某些其他值)。類似地,在圖2的實施例的變型中,根據(jù)本發(fā)明響應于回避增益控制信號S2對原始回避增益控制信號C4進行縮放(以產(chǎn)生用于掌控放大器117的回避增益控制信號)可以按非線性方式進行。例如,這種非線性縮放可以產(chǎn)生回避增益控制信號(代替信號S6),當信號S2的當前值在閾值以下時,該回避增益控制信號導致放大器117沒有進行回避(S卩,通過放大器117應用等于ー的増益,因此通道102沒有衰減),當信號S2的當前值超過閾值吋,該回避增益控制信號導致該回避增益控制信號(代替信號S6)的當前值等于信號C4的當前值(從而信號S2不改變C4的當前值)。替選地,可以進行信號C4的其他線性或非線性縮放(響應于本發(fā)明的回避增益控制信號S2)以產(chǎn)生用于掌控放大器117的回避增益控制信號。例如,信號C4的這種縮放可以產(chǎn)生回避增益控制信號(代替信號S6),當信號S2的當前值在閾值以下時,該回避增益控制信號導致放大器117沒有進行回避(S卩,放大器117應用等于一的増益),當信號S2的當前值超過閾值時,該回避增益控制信號導致該回避增益控制信號(代替信號S6)的當前值等于信號C4的當前值乘以信號S2的當前值的乘積(或者由該乘積確定的某些其他值)。本發(fā)明的系統(tǒng)的另一實施例(225’)將參照圖2A來進行描述。響應于包括語音通道101 (中央通道C)以及兩個非語音通道102和103 (左通道L和右通道R)的多通道音頻信號,圖2A的系統(tǒng)對非語音通道進行濾波以產(chǎn)生包括語音通道101以及濾波的非語音通道118和119 (濾波的左通道L’和右通道R’)的濾波多通道輸出音頻信號。在圖2A的系統(tǒng)中(如圖2的系統(tǒng)中那樣),非語音通道102和103分別斷言到回避放大器117和116。運行吋,回避放大器117由從乘法元件115輸出的控制信號S6 (其指示控制值的序列,因此也稱為控制值序列S6)掌控,回避放大器116由從乘法元件114輸出的控制信號S5 (其指示控制值的序列,因此也稱為控制值序列S5)掌控。圖2A的元件201、202、203、204、114、115、130和134與圖2的相同編號的元件相同(且起相同的作用),不再重復上面對它們的描述。圖2A的系統(tǒng)與圖2的系統(tǒng)的不同之處在兩個主要方面。第一,該系統(tǒng)配置為從輸入音頻信號的兩個獨立非語音通道(102和103)產(chǎn)生(S卩,衍生)“衍生”非語音通道(L+R),且響應于該衍生非語音通道確定衰減控制值(V3)。作為對照,圖2的系統(tǒng)響應于輸入音頻信號中的一個非語音通道(通道102)確定衰減控制值SI,且響應于輸入音頻信號中的另ー個非語音通道(通道103)確定衰減控制值S2。運行吋,圖2A的系統(tǒng)響應于同一組衰減控制值V3對輸入音頻信號的每個非語音通道(通道102和103中的每個)進行衰減。運行吋,圖2的系統(tǒng)響應于衰減控制值S2對輸入音頻信號的非語音通道102進行衰減,且響應于ー組不同的衰減控制值(值SI)對輸入音頻信號的非語音通道103進行衰減。圖2A的系統(tǒng)包括加法元件129,其輸入耦接為接收輸入音頻信號的非語音通道102和103。衍生非語音通道(L + R)斷言在元件129的輸出處。語音可能性處理元件130響應于來自元件129的衍生非語音通道L + R斷言語音可能性信號P。在圖2A中,信號P指示用于衍生非語音通道的語音可能性值的序列。典型地,圖2A的語音可能性信號P是與衍生非語音通道中的信號是語音的可能性單調(diào)相關(guān)的值。圖2A的語音可能性信號Q(由處理器131產(chǎn)生)與上述圖2的語音可能性信號Q相同。圖2A的系統(tǒng)不同于圖2的系統(tǒng)的第二主要方面如下。在圖2A中,控制信號V3(在 乘法器214的輸出處斷言)用于(而不是在處理器134的輸出處斷言的控制信號SI)縮放原始回避增益控制信號C3 (在元件211的輸出處斷言),控制信號V3也用于(而不是在圖2的處理器135的輸出處斷言的控制信號S2)縮放原始回避增益控制信號C4(在元件212的輸出處斷言)。在圖2A中,根據(jù)本發(fā)明響應于由信號V3指示的衰減控制值的序列(將稱為衰減控制值V3)對原始回避增益控制信號C3進行縮放可以通過將信號C3的每個原始增益控制值乘以(在元件114中)對應的一個衰減控制值V3以產(chǎn)生信號S5來進行,根據(jù)本發(fā)明響應于衰減控制值V3的序列對原始回避增益控制信號C4進行縮放可以通過將信號C4的每個原始增益控制值乘以(在元件115中)對應的一個衰減控制值V3以產(chǎn)生信號S6來進行。運行吋,圖2A的系統(tǒng)如下產(chǎn)生衰減控制值V3的序列。語音可能性信號Q (在圖2A的處理器131的輸出處斷言)被斷言到乘法器214的輸入,衰減控制信號SI (在處理器134的輸出處斷言)被斷言到乘法器214的另ー輸入。乘法器214的輸出是衰減控制值V3的序列。衰減控制值V3中的每個是由信號Q確定的語音可能性值之ー被對應的一個衰減控制值SI縮放后的值。本發(fā)明的系統(tǒng)的另一實施例(325)將參照圖3來進行描述。響應于包括語音通道101 (中央通道C)以及兩個非語音通道102和103 (左通道L和右通道R)的多通道音頻信號,圖3的系統(tǒng)對非語音通道進行濾波以產(chǎn)生包括語音通道101以及濾波了的非語音通道118和119 (濾波了的左通道L’和右通道R’ )的濾波多通道輸出音頻信號。在圖3的系統(tǒng)中,三個輸入通道中的每個信號被濾波器組301 (用于通道101)、濾波器組302 (用于通道102)和濾波器組303 (用于通道103)分成其譜成分。譜分析可以用時域N通道濾波器組實現(xiàn)。根據(jù)ー實施例,每個濾波器組將頻率范圍分成1/3倍頻帶或者模仿推測發(fā)生在人內(nèi)耳中的濾波。從每個濾波器組輸出的信號包括N個子信號的事實通過使用粗線來示出。在圖3的系統(tǒng)中,非語音通道102和103中的信號的頻率成分分別被斷言到回避放大器117和116。運行吋,回避放大器117由從乘法元件115’輸出的控制信號S8 (其指示控制值的序列,因此也稱為控制值序列S8)掌控,回避放大器116由從乘法元件114’輸出的控制信號S7 (其指示控制值的序列,因此也稱為控制值序列S7)掌控。圖3的元件130、131、132、134和135與圖I的相同編號的元件相同(且起相同的作用),不再重復上面對它們的描述。圖3的過程可以視為旁枝過程。順著圖3所示的信號路徑,用于非語音通道102的濾波器組302中產(chǎn)生的N個子信號每個通過回避放大器117被ー組N個增益值中的ー員縮放,用于非語音通道103的濾波器組303中產(chǎn)生的N個子信號每個通過回避放大器116被ー組N個增益值中的ー員縮放。這些增益值的產(chǎn)生將稍后描述。接下來,縮放了的子信號重新組合成單個音頻信號。這可以經(jīng)由簡單累積(通過用于通道102的累積電路313且通過用于通道103的累積電路314)來進行。備選地,可 以使用匹配到分析濾波器組的合成濾波器組。該過程導致修改的非語音信號R’(118)和修改的非語音信號L’(119)?,F(xiàn)在描述圖3的過程的旁枝路徑,使每個濾波器組輸出可用于ー組對應的N功率評估器(304、305和306 )。用于通道101和102的所得功率譜用作優(yōu)化電路307的輸入,優(yōu)化電路307具有作為輸出的N維增益矢量C6。用于通道101和103的所得功率譜用作優(yōu)化電路308的輸入,優(yōu)化電路308具有作為輸出的N維增益矢量C5。優(yōu)化采用可辨識度預測電路(309和310 )和響度計算電路(311和312 )二者來發(fā)現(xiàn)最大化每個非語音通道的響度且同時維持通道101中的語音信號的預定水平的預測可辨識度的増益矢量。預測可辨識度的合適模型已經(jīng)參考圖2進行了描述。響度計算電路311和312可以根據(jù)設計選擇和折衷實現(xiàn)合適的響度預測模型。合適的模型的例子是美國國家標準ANSI S3. 4-2007 “Procedure forthe Computation of Loudness of Steady Sounds,,和德國標準 DIN 45631 “Berechnungdes LautstarkepegeIs und der Lautheit aus dem Gerauschspektrum”。取決于可獲得的計算資源和所強加的限制,優(yōu)化電路(307、308)的形式和復雜度可以大地改變。根據(jù)ー實施例,使用N個自由參數(shù)的迭代多維度約束優(yōu)化。每個參數(shù)表示施加到非語音通道的頻帶之一的増益。標準計數(shù),諸如跟蹤N維度搜索空間的最陡梯度,可以應用來發(fā)現(xiàn)最大值。在另ー實施例中,需要更少計算的方案將增益對頻率的函數(shù)約束為可能的増益對頻率的函數(shù)的小集合中的成員,諸如ー組不同的譜梯度或架濾波器(shelffilter)。采用該額外約束,優(yōu)化問題可以縮減到少量ー維優(yōu)化。在又一實施例中,在非常小的可能増益函數(shù)集合上進行窮舉搜索。該后一方案在期望恒定計算負載和捜索速度的實時應用中可能是特別合適的。本領(lǐng)域普通技術(shù)人員將容易意識到根據(jù)本發(fā)明的其他實施例可能加于優(yōu)化上的其他約束。ー個例子是將修改了的非語音通道的響度限制為不大于修改之前的響度。另ー個例子是對相鄰頻帶之間的增益差異施加限制以限制重構(gòu)濾波器組(313、314)中的短暫混淆的可能或者減小負面音質(zhì)修改的幾率。合意的約束既依賴于濾波器組的技術(shù)實現(xiàn),又依賴于可辨識度改善與音質(zhì)修改之間的所選折衷。為了圖示清楚,這些約束從圖3省略。根據(jù)本發(fā)明響應于回避增益控制信號S2對N維原始回避增益控制矢量C6進行縮放可以通過將矢量C6的每個原始增益控制值乘以(在元件115'中)信號S2的對應的ー個縮放平均差異值以產(chǎn)生N維回避增益控制矢量S8來進行。根據(jù)本發(fā)明響應于回避增益控制信號SI對N維原始回避增益控制矢量C5進行縮放可以通過將矢量C5的每個原始増益控制值乘以(在元件114'中)信號SI的對應的一個縮放平均差異值以產(chǎn)生N維回避増益控制矢量S7來進行。圖3的系統(tǒng)可以通過處理器(例如,圖5的處理器501)以軟件實現(xiàn),該處理器已被編程以實現(xiàn)所描述的圖3的系統(tǒng)的操作。替選地,可以以硬件實現(xiàn),該硬件具有如圖3所示地連接的電路元件。在圖3的實施例的變型中,根據(jù)本發(fā)明響應于回避增益控制信號SI對原始回避增益控制矢量C5進行縮放(以產(chǎn)生用于掌控放大器116的回避增益控制矢量)可以按非線性方式進行。例如,這種非線性縮放可以產(chǎn)生回避增益控制矢量(代替矢量S7),當信號SI的當前值在閾值以下時,該回避增益控制矢量導致放大器116沒有進行回避(S卩,通過放大器116應用等于ー的増益,因此通道103沒有衰減),當信號SI的當前值超過閾值吋,該回避增益控制矢量導致該回避増益控制矢量(代替矢量S7)的當前值等于矢量C5的當前值(從而信號SI不改變C5的當前值)。替選地,可以進行矢量C5的其他線性或非線性縮放(響應于本發(fā)明的回避增益控制信號SI)以產(chǎn)生用于掌控放大器116的回避增益控制矢量。例如,矢量C5的這種縮放可以產(chǎn)生回避增益控制矢量(代替矢量S7),當信號SI的當前值在閾值以下時,該回避增益控制矢量導致放大器116沒有進行回避(S卩,放大器116應用等于ー的増益),當信號SI的當前值超過閾值時,該回避增益控制矢量導致該回避增益控制矢量(代替矢量S7)的當前值等于矢量C5的當前值乘以信號SI的當前值的乘積(或者由該乘積確·定的某些其他值)。類似地,在圖3的實施例的變型中,根據(jù)本發(fā)明響應于回避增益控制信號S2對原始回避增益控制矢量C6進行縮放(以產(chǎn)生用于掌控放大器117的回避增益控制矢量)可以按非線性方式進行。例如,這種非線性縮放可以產(chǎn)生回避增益控制矢量(代替矢量S8),當信號S2的當前值在閾值以下時,該回避增益控制矢量導致放大器117沒有進行回避(S卩,通過放大器117應用等于ー的増益,因此通道102沒有衰減),當信號S2的當前值超過閾值吋,該回避增益控制矢量導致該回避增益控制矢量(代替矢量S8)的當前值等于矢量C6的當前值(從而信號S2不改變C6的當前值)。替選地,可以進行矢量C6的其他線性或非線性縮放(響應于本發(fā)明的回避增益控制信號S2)以產(chǎn)生用于掌控放大器117的回避增益控制矢量。例如,矢量C6的這種縮放可以產(chǎn)生回避增益控制矢量(代替矢量S8),當信號S2的當前值在閾值以下時,該回避增益控制矢量導致放大器117沒有進行回避(即,放大器117應用等于一的増益),當信號S2的當前值超過閾值時,該回避增益控制矢量導致該回避增益控制矢量(代替矢量S8)的當前值等于矢量C6的當前值乘以信號S2的當前值的乘積(或者由該乘積確定的某些其他值)。將從本公開對本領(lǐng)域普通技術(shù)人員而言變得顯然的是,圖1、1A、2、2A或3的系統(tǒng)(以及它們中的任一個的變型)可被如何修改以對具有語音通道和任意數(shù)量的非語音通道的多通道音頻輸入信號進行濾波。將為每個非語音通道設置回避放大器(或者其軟件等價物),且將產(chǎn)生回避增益控制信號(例如通過對原始回避增益控制信號進行縮放)以用于掌控每個回避放大器(或者其軟件等價物)。如所述,圖1、1A、2、2A或3的系統(tǒng)(以及它們的許多變型中的每個)可操作來執(zhí)行本發(fā)明的方法的實施例,本發(fā)明的方法的實施例用于對具有語音通道和至少ー個非語音通道的多通道音頻信號進行濾波以改善由該信號確定的語音的可辨識度。在第一類這樣的實施例中,該方法包括步驟(a)確定指示由音頻信號的語音通道確定的語音相關(guān)內(nèi)容與由至少ー個非語音通道確定的語音相關(guān)內(nèi)容之間的相似程度的至少ー個衰減控制值(例如,圖1、2或3的信號SI或S2或者圖IA或2A的信號V1、V2或V3);以及(b)響應于該至少一個衰減控制值,對音頻信號的至少ー個非語音通道進行衰減(例如,在圖1、1A、2、2A或3的元件114和放大器116中,或者元件115和放大器117中)。典型地,該衰減步驟包括響應于至少ー個衰減控制值對用于非語音通道的原始衰減控制信號(例如,圖I或IA的回避增益控制信號Cl或C2,或者圖2或2A的信號C3或C4)進行縮放。優(yōu)選地,非語音通道被衰減從而改善由語音通道確定的語音的可辨識度,而沒有不期望地對由非語音通道確定的語音增強內(nèi)容進行衰減。在ー些第一類實施例中,步驟(a)包括生成衰減控制信號(例如,圖1、2或3的信號SI或S2,或者圖IA或2A的信號VI、V2或V3)的步驟,衰減控制信號表示衰減控制值的序列,每個衰減控制值表示在不同時間(或在不同時間段中)由音頻信號的語音通道確定的語音相關(guān)內(nèi)容和由至少ー個非語音通道確定的語音相關(guān)內(nèi)容之間的相似程度,步驟(b)包括如下步驟響應于衰減控制信號對回避增益控制信號(例如,圖I或IA的信號Cl或C2,或者圖2或2A的信號C3或C4)進行縮放以產(chǎn)生縮放了的增益控制信號(例如,圖I或IA的信號S3或S4,或者圖2或2A的信號S5 或S6),并應用縮放了的增益控制信號來對非語音通道進行衰減(例如,將縮放了的增益控制信號斷言到圖1、1A、2或2A的回避電路116或117,以通過回避電路控制至少ー個非語音通道的衰減)。例如,在一些這樣的實施例中,步驟(a)包括比較指示由語音通道確定的語音相關(guān)內(nèi)容的第一語音相關(guān)特征序列(例如,圖I或2的信號Q)和指示由非語音通道確定的語音相關(guān)內(nèi)容的第二語音相關(guān)特征序列(例如,圖I或2的信號P)以生成衰減控制信號的步驟,由衰減控制信號表示的每個衰減控制值指示在不同時間(例如在不同時間段中)第一語音相關(guān)特征序列與第二語音相關(guān)特征序列之間的相似程度。在一些實施例中,每個衰減控制值是增益控制值。在ー些第一類實施例中,每個衰減控制值與非語音通道指示語音增強內(nèi)容的可能性單調(diào)相關(guān),語音增強內(nèi)容增強由語音通道確定的語音內(nèi)容的可辨識度(或者另ー種感知品質(zhì))。在另ー些第一類實施例中,每個衰減控制值與非語音通道的預期語音增強值單調(diào)相關(guān)(例如,非語音通道指示語音增強內(nèi)容的或然性的度量,乘以由非語音通道確定的語音增強內(nèi)容將對由多通道信號確定的語音內(nèi)容提供的感知品質(zhì)增強的度量)。例如,當步驟(a)包括比較(例如,在圖I或圖2的元件134或135中)指示由語音通道確定的語音相關(guān)內(nèi)容的第一語音相關(guān)特征序列和指示由非語音通道確定的語音相關(guān)內(nèi)容的第二語音相關(guān)特征序列的步驟時,第一語音相關(guān)特征序列可以是語音可能性值的序列,每個該語音可能性值表示在不同時間(例如,在不同時間段中)語音通道指示語音(而不是語音之外的音頻內(nèi)容)的可能性,第二語音相關(guān)特征序列也可以是語音可能性值的序列,每個該語音可能性值表示在不同時間(例如,在不同時間段中)非語音通道指示語音的可能性。如所述,圖1、1A、2、2A或3的系統(tǒng)(以及它們的許多變型中的每個)也可操作來實施本發(fā)明的方法的第二類實施例,本發(fā)明的方法的第二類實施例用于對具有語音通道和至少ー個非語音通道的多通道音頻信號進行濾波以改善由該信號確定的語音的可辨識度。在第二類實施例中,該方法包括步驟(a)比較語音通道的特性和非語音通道的特性以產(chǎn)生至少ー個衰減值(例如由圖I的信號Cl或C2確定的值,或者由圖2的信號C3或C4確定的值,或者由圖3的信號C5或C6確定的值)以用于控制非語音通道相對于語音通道的衰減;以及
(b)響應于至少ー個語音增強可能性值(例如,圖1、2或3的信號SI或S2)調(diào)節(jié)該至少一個衰減值以產(chǎn)生用于控制非語音通道相對于語音通道的衰減的至少ー個調(diào)節(jié)衰減值(例如,由圖I的信號S3或S4確定的值,或者由圖2的信號S5或S6確定的值,或者由圖3的信號S7或S8確定的值)。典型地,調(diào)節(jié)步驟是或者包括響應于ー個所述語音增強可能性值縮放(例如,在圖1、2或3的元件114或115中)每個所述衰減值以產(chǎn)生ー個所述調(diào)節(jié)衰減值。典型地,每個語音增強可能性值指示(例如,單調(diào)關(guān)聯(lián)到)非語音通道指示語音增強內(nèi)容(增強由語音通道確定的語音內(nèi)容的可辨識度或其他感知品質(zhì)的內(nèi)容)的可能性。在一些實施例中,語音增強可能性值指示非語音通道的預期語音增強值(例如,非語音通道指示語音增強內(nèi)容的或然率的度量乘以由非語音通道確定的語音增強內(nèi)容對多通道音頻信號確定的語音內(nèi)容提供的感知品質(zhì)增強的度量)。在ー些第二類實施例中,語音增強可能性值是由包括比較指示由語音通道確定的語音相關(guān)內(nèi)容的第一語音相關(guān)特征序列與指示由非語音通道確定的語音相關(guān)內(nèi)容的第二語音相關(guān)特征序列的步驟的方法確定的比較值(例如,差異值)的序列,每個比較值是第一語音相關(guān)特征序列和第二語音相關(guān)特征序列之間在不同時間(例如,在不同時間段中)的相似程度。在典型的第二類實施例中,該方法還包括響應于至少ー個調(diào)節(jié)衰減值對非語音通道進行衰減(例如在圖1、2或3的放大器116或117 中)進行衰減的步驟。步驟(b)可以包括響應于該至少ー個語音增強可能性值(例如由圖I的信號SI或S2確定的對應值)縮放該至少ー個衰減值(例如,由圖I的信號Cl或C2確定的每個衰減值),或者由回避增益控制信號或其他原始衰減控制信號確定的另ー衰減值。在圖I的系統(tǒng)運行來執(zhí)行第二類實施例吋,由信號Cl或C2確定的每個衰減值是指示限制非語音通道中的信號功率對語音通道中的信號功率的比率不超過預定閾值所需的非語音通道的衰減量的第一因子,其被與語音通道指示語音的可能性單調(diào)相關(guān)的第二因子縮放。典型地,這些實施例中的調(diào)節(jié)步驟是(或者包括)通過ー個語音增強可能性值(由信號SI或S2確定)縮放每個衰減值Cl或C2以產(chǎn)生一個調(diào)節(jié)了的衰減值(由信號S3或S4確定),其中語音增強可能性值是單調(diào)關(guān)聯(lián)到以下之一的因子非語音通道指示語音增強內(nèi)容(增強由多通道信號確定的語音內(nèi)容的可辨識度或其它感知品質(zhì)的內(nèi)容)的可能性;以及非語音通道的預期語音增強值(例如,非語音通道指示語音增強內(nèi)容的或然率的度量乘以非語音通道中的語音增強內(nèi)容將對由多通道信號確定的語音內(nèi)容提供的感知品質(zhì)增強的度量)。在圖2的系統(tǒng)操作來執(zhí)行第二類實施例時,由信號C3或C4確定的每個衰減值是指示足以使存在由非語音通道確定的內(nèi)容時由語音通道確定的語音的預測可辨識度超過預定閾值的非語音通道衰減量(例如,最小量)的第一因子,其被與語音通道指示語音的可能性單調(diào)相關(guān)的第二因子縮放。優(yōu)選地,存在由非語音通道確定的內(nèi)容時由語音通道確定的語音的預測可辨識度根據(jù)基于心理聲學的可辨識度預測模型來確定。典型地,這些實施例中的調(diào)節(jié)步驟是(或包括)通過ー個所述語音增強可能性值(由信號SI或S2確定)縮放每個所述衰減值以產(chǎn)生一個調(diào)節(jié)了的衰減值(由信號S5或S6確定),其中該語音增強可能性值是單調(diào)關(guān)聯(lián)到以下之一的因子非語音通道指示語音增強內(nèi)容的可能性;以及非語音通道的預期語音增強值。在圖3的系統(tǒng)運行來執(zhí)行第二類實施例吋,由信號Cl或C2確定的每個衰減值由以下步驟決定,所述步驟包括確定(在元件301、302或303中)語音通道101以及非語音通道102和103中的每個的功率譜,該功率譜指示作為頻率的函數(shù)的功率;以及執(zhí)行衰減值的頻域確定,由此確定將要應用到非語音通道的頻率成分的作為頻率的函數(shù)的衰減。在一類實施例中,本發(fā)明是一種用于增強由多通道音頻輸入信號確定的語音的方法和系統(tǒng)。在一些這樣的實施例中,本發(fā)明的系統(tǒng)包括分析模塊或子系統(tǒng)(例如圖I的元件 130-135、104-109、114 和 115,或者圖 2 的元件 130_135、201_204、114 和 115),配置為分析輸入多通道信號以產(chǎn)生衰減控制值;以及衰減子系統(tǒng)(例如圖I或圖2的放大器116和117)。該衰減子系統(tǒng)包括回避電路(由至少ー些衰減控制值來掌控),耦接且配置為應用衰減(回避)到輸入信號的每個非語音通道以產(chǎn)生濾波了的音頻輸出信號。在回避電路應用到非語音通道的衰減由控制值的當前值確定的意義上來說,回避電路由控制值掌控。在一些實施例中,語音通道(例如中央通道)功率對非語音通道(例如側(cè)通道和/或后通道)功率的比值用于確定應該應用多少回避(衰減)到每個非語音通道。例如,在圖I的實施例中,假定非語音通道包括增強由語音通道確定的語音內(nèi)容的語音增強內(nèi)容的可能性(在分析模塊中確定)沒有改變,則由回避放大器116和117中的每個應用的增益響應于在 分析模塊中確定的増益控制值(從元件114或元件115輸出)的降低而減小,増益控制值的降低指示語音通道101的功率相對于非語音通道(左通道102和右通道103)的功率的減小(在限制之內(nèi))(即,當語音通道功率相對于非語音通道的功率降低(在限制之內(nèi))時,相對于語音通道,回避放大器更多地衰減非語音通道)。在一些替選實施例中,圖I或圖2的分析模塊的修改變型獨立地處理輸入信號的每個通道的一個或更多子頻帶中的每個。具體而言,每個通道中的信號可經(jīng)過帶通濾波器組,產(chǎn)生三組n子帶{しL2、. . .、LJ、(C1, C2,, CJ和{も、R2、. . .、Rj。匹配的子帶被傳送到圖I (或圖2)的分析模塊的n個實例,濾波了的子信號(用于非語音通道的回避放大器的輸出,以及未濾波的語音通道子信號)被累積電路重新組合以產(chǎn)生濾波多通道音頻輸出信號。為了對每個子帶執(zhí)行由圖I的元件109所執(zhí)行的操作,可以為每個子帶選擇單獨閾值Qn (對應于元件109的閾值0)。好的選擇是其中Qn與對應的頻率區(qū)域中攜載的語音提示的平均數(shù)成比例的集合;即,在頻譜極端的帶比與主要語音頻率對應的帶分配更低的閾值。本發(fā)明的這種實現(xiàn)可以提供計算復雜度和性能之間非常好的折衷。圖4是系統(tǒng)420 (可配置音頻DSP)的框圖,系統(tǒng)420已配置成執(zhí)行本發(fā)明的方法的實施例。系統(tǒng)420包括可編程DSP電路422 (系統(tǒng)420的主動語音增強模塊),其耦接來接收多通道音頻輸入信號。例如,信號的非語音通道Lin和Rin可對應于參照圖1、1A、2、2A和3描述的輸入信號的通道102和103,該信號還可包括其他非語音通道(例如左后通道和右后通道),信號的語音通道Cin可以對應于參照圖I、1A、2、2A和3描述的輸入信號的通道101。響應于來自控制接ロ 421的控制數(shù)據(jù),電路422配置成執(zhí)行本發(fā)明的方法的實施例,以響應于音頻輸入信號產(chǎn)生語音增強多通道輸出音頻信號。為了對系統(tǒng)420進行編程,適當?shù)能浖耐獠刻幚砥鲾嘌缘娇刂平鹰?421,接ロ 421響應地將適當?shù)目刂茢?shù)據(jù)斷言到電路422以配置電路422來執(zhí)行本發(fā)明的方法。運行吋,已配置成執(zhí)行根據(jù)本發(fā)明的語音增強的音頻DSP (例如,圖4的系統(tǒng)420)耦接成接收N通道音頻輸入信號,除了語音增強之外(包括語音增強),該DSP典型地還對輸入音頻(或其處理變體)執(zhí)行多種操作。例如,圖4的系統(tǒng)可以實現(xiàn)為在處理子系統(tǒng)423中執(zhí)行其他操作(對電路422的輸出)。根據(jù)本發(fā)明的各種實施例,音頻DSP可在被配置(例如編程)之后操作來執(zhí)行本發(fā)明的方法的實施例,以響應于輸入音頻信號通過對輸入音頻信號執(zhí)行該方法來產(chǎn)生輸出音頻信號。在一些實施例中,本發(fā)明的系統(tǒng)是或者包括通用處理器,該通用處理器耦接成接收或產(chǎn)生指示多通道音頻信號的輸入數(shù)據(jù)。該處理器用軟件(或固件)編程和/或以其他方式配置(例如,響應于控制數(shù)據(jù))以對輸入數(shù)據(jù)執(zhí)行多種操作中的任意操作,包括本發(fā)明的方法的實施例。圖5的計算機系統(tǒng)是這樣的系統(tǒng)的ー個例子。圖5的系統(tǒng)包括通用處理器501,其被編程為對輸入數(shù)據(jù)執(zhí)行多種操作中的任意操作,包括本發(fā)明的方法的實施例。圖5的計算機系統(tǒng)還包括耦接到處理器501的輸入設備503 (例如,鼠標和/或鍵盤)、耦接到處理器501的存儲介質(zhì)504、 以及耦接到處理器501的顯示設備505。處理器501被編程為響應于通過輸入設備503的用戶操作輸入的指令和數(shù)據(jù)實施本發(fā)明的方法。計算機可讀存儲介質(zhì)504 (例如,光盤或其他有形物體)具有存儲于其上的計算機代碼,其適于對處理器501進行編程以執(zhí)行本發(fā)明的方法的實施例。運行時,處理器501執(zhí)行計算機代碼以根據(jù)本發(fā)明處理指示多通道音頻輸入信號的數(shù)據(jù),從而產(chǎn)生指示多通道音頻輸出信號的輸出數(shù)據(jù)。上述圖I、1A、2、2A或3的系統(tǒng)可以實現(xiàn)在通用處理器501中,輸入信號通道101、
102和103是指示中央(語音)以及左和右(非語音)音頻輸入通道(例如,環(huán)繞聲音信號的)的數(shù)據(jù),輸出信號通道118和119是指示語音強化的左和右音頻輸出通道(例如,語音增強的環(huán)繞聲音信號的)的輸出數(shù)據(jù)。常規(guī)數(shù)模轉(zhuǎn)換器(DAC)可對輸出數(shù)據(jù)進行操作以產(chǎn)生輸出音頻通道信號的模擬變體以供物理揚聲器再現(xiàn)。本發(fā)明的某些方面是ー種計算機系統(tǒng),其編程來執(zhí)行本發(fā)明的方法的任意實施例,還是ー種計算機可讀介質(zhì),其存儲計算機可讀代碼以用于實施本發(fā)明的方法的任意實施例。雖然本發(fā)明的特定實施例以及本發(fā)明的應用已經(jīng)描述于此,但是本領(lǐng)域普通技術(shù)人員將理解,所述實施例和應用的許多變型是可行的,而不偏離這里描述和主張的本發(fā)明的范圍。應理解,雖然已經(jīng)顯示和描述了本發(fā)明的某些形式,但是本發(fā)明不限于所描述和顯示的特定實施例和所述特定方法。
權(quán)利要求
1.一種對具有語音通道和至少一個非語音通道的多通道音頻信號進行濾波以改善由該信號確定的語音的可辨識度的方法,該方法包括以下步驟 Ca)確定至少一個衰減控制值,該至少一個衰減控制值指示由該語音通道確定的語音相關(guān)內(nèi)容與由該多通道音頻信號的至少一個非語音通道確定的語音相關(guān)內(nèi)容之間的相似程度;以及 (b)響應于該至少一個衰減控制值,對該多通道音頻信號的至少一個非語音通道進行衰減。
2.如權(quán)利要求I所述的方法,其中,在步驟(a)中確定的每個衰減控制值指示由該語音通道確定的語音相關(guān)內(nèi)容與由該音頻信號的一個非語音通道確定的語音相關(guān)內(nèi)容之間的相似程度,步驟(b)包括響應于所述每個衰減控制值對所述非語音通道進行衰減的步驟。
3.如權(quán)利要求I所述的方法,其中,步驟(a)包括從該音頻信號的該至少一個非語音通道衍生一個衍生非語音通道的步驟,該至少一個衰減控制值指示由該語音通道確定的語音相關(guān)內(nèi)容與由該衍生非語音通道確定的語音相關(guān)內(nèi)容之間的相似程度。
4.如權(quán)利要求3所述的方法,其中,該衍生非語音通道通過組合該多通道音頻信號的第一非語音通道和該多通道音頻信號的第二非語音通道而衍生。
5.如權(quán)利要求3所述的方法,其中,該多通道音頻信號具有至少兩個非語音通道,步驟(b)包括響應于該至少一個衰減控制值,對非語音通道中的一些但非全部進行衰減的步驟。
6.如權(quán)利要求3所述的方法,其中,所述多通道音頻信號具有至少兩個非語音通道,步驟(b)包括響應于該至少一個衰減控制值,對全部非語音通道進行衰減的步驟。
7.如權(quán)利要求I所述的方法,其中,步驟(b)包括響應于該至少一個衰減控制值,對該 非語音通道的原始衰減控制信號進行縮放。
8.如權(quán)利要求I所述的方法,其中,步驟(a)包括產(chǎn)生指示衰減控制值的序列的衰減控制信號的步驟,每個衰減控制值指示由該語音通道確定的語音相關(guān)內(nèi)容與由該多通道音頻信號的至少一個非語音通道確定的語音相關(guān)內(nèi)容之間在不同時間的相似程度,步驟(b)包括如下步驟 響應于該衰減控制信號對回避增益控制信號進行縮放以產(chǎn)生縮放了的增益控制信號;以及 應用該縮放了的增益控制信號以對該多通道音頻信號的至少一個非語音通道進行衰減。
9.如權(quán)利要求8所述的方法,其中,步驟(a)包括比較指示由該語音通道確定的語音相關(guān)內(nèi)容的第一語音相關(guān)特征序列與指示由該多通道音頻信號的該至少一個非語音通道確定的語音相關(guān)內(nèi)容的第二語音相關(guān)特征序列以產(chǎn)生該衰減控制信號的步驟,由該衰減控制信號指示的衰減控制值中的每個指示該第一語音相關(guān)特征序列和該第二語音相關(guān)特征序列之間在不同時間的相似程度。
10.如權(quán)利要求I所述的方法,其中,每個所述衰減控制值與該多通道音頻信號的該至少一個非語音通道指示增強由該語音通道確定的語音內(nèi)容的感知品質(zhì)的語音增強內(nèi)容的可能性單調(diào)相關(guān)。
11.一種對具有語音通道和至少一個非語音通道的多通道音頻信號進行濾波以改善由該信號確定的語音的可辨識度的方法,所述方法包括以下步驟(a)確定至少一個衰減控制值,該至少一個衰減控制值指示由該語音通道確定的語音相關(guān)內(nèi)容與由該非語音通道確定的語音相關(guān)內(nèi)容之間的相似程度;以及 (b)響應于該至少一個衰減控制值,對該非語音通道進行衰減。
12.如權(quán)利要求11所述的方法,其中,步驟(b)包括響應于該至少一個衰減控制值,對該非語音通道的原始衰減控制信號進行縮放。
13.如權(quán)利要求11所述的方法,其中,步驟(a)包括產(chǎn)生指示衰減控制值的序列的衰減控制信號的步驟,每個衰減控制值指示由該語音通道確定的語音相關(guān)內(nèi)容與由該非語音通道確定的語音相關(guān)內(nèi)容之間在不同時間的相似程度,步驟(b)包括如下步驟 響應于該衰減控制信號對回避增益控制信號進行縮放以產(chǎn)生縮放了的增益控制信號;以及 應用該縮放了的增益控制信號以對該非語音通道進行衰減。
14.如權(quán)利要求13所述的方法,其中,步驟(a)包括比較指示由該語音通道確定的語音相關(guān)內(nèi)容的第一語音相關(guān)特征序列與指示由該非語音通道確定的語音相關(guān)內(nèi)容的第二語音相關(guān)特征序列以產(chǎn)生該衰減控制信號的步驟,由該衰減控制信號指示的衰減控制值中的每個指示該第一語音相關(guān)特征序列和該第二語音相關(guān)特征序列之間在不同時間的相似程度。
15.如權(quán)利要求14所述的方法,其中,該第一語音相關(guān)特征序列是語音可能性值的序列,各個該語音可能性值指示在不同時間該語音通道指示語音的可能性,該第二語音相關(guān)特征序列是語音可能性值的另一序列,各個該語音可能性值指示在不同時間該非語音通道指示語音的可能性。
16.如權(quán)利要求13所述的方法,其中,每個所述衰減控制值是增益控制值。
17.如權(quán)利要求11所述的方法,其中,每個所述衰減控制值與該非語音通道指示增強由該語音通道確定的語音內(nèi)容的感知品質(zhì)的語音增強內(nèi)容的可能性單調(diào)相關(guān)。
18.一種對具有語音通道和至少兩個非語音通道的多通道音頻信號進行濾波的方法,該方法包括如下步驟 Ca)確定至少一個第一衰減控制值,該至少一個第一衰減控制值指示由該語音通道確定的語音相關(guān)內(nèi)容與由第一非語音通道確定的第二語音相關(guān)內(nèi)容之間的相似程度;以及 (b)確定至少一個第二衰減控制值,該至少一個第二衰減控制值指示由該語音通道確定的語音相關(guān)內(nèi)容與由第二非語音通道確定的第三語音相關(guān)內(nèi)容之間的相似程度。
19.如權(quán)利要求18所述的方法,其中,步驟(a)包括比較指示由該語音通道確定的語音相關(guān)內(nèi)容的第一語音相關(guān)特征序列和指示該第二語音相關(guān)內(nèi)容的第二語音相關(guān)特征序列的步驟,步驟(b)包括比較該第一語音相關(guān)特征序列和指示該第三語音相關(guān)內(nèi)容的第三語音相關(guān)特征序列的步驟。
20.如權(quán)利要求18所述的方法,還包括如下步驟 (c)響應于該至少一個第一衰減控制值,對該第一非語音通道進行衰減;以及 (d)響應于該至少一個第二衰減控制值,對該第二非語音通道進行衰減。
21.如權(quán)利要求20所述的方法,其中,步驟(c)包括響應于該第一衰減控制值縮放該第一非語音通道的衰減的步驟,步驟(d)包括響應于該第二衰減控制值縮放該第二非語音通道的衰減的步驟。
22.如權(quán)利要求18所述的方法,其中,在步驟(a)中確定的該至少一個第一衰減控制值是衰減控制值的序列,每個該衰減控制值是增益控制值,該增益控制值用于縮放應用到該第一非語音通道的回避增益的量以改善由該語音通道確定的語音的可辨識度,而沒有不期望地對由該第一非語音通道確定的語音增強內(nèi)容進行衰減,且 在步驟(b)中確定的該至少一個第二衰減控制值是第二衰減控制值的序列,每個該第二衰減控制值是增益控制值,該增益控制值用于縮放應用到該第二非語音通道的回避增益的量以改善由該語音通道確定的語音的可辨識度,而沒有不期望地對由該第二非語音通道確定的語音增強內(nèi)容進行衰減。
23.一種對具有語音通道和至少一個非語音通道的多通道音頻信號進行濾波以改善由該信號確定的語音的可辨識度的方法,所述方法包括如下步驟 (a)比較該語音通道的特性和該非語音通道的特性以產(chǎn)生用于控制該非語音通道相對于該語音通道的衰減的至少一個衰減值;以及 (b)響應于至少一個語音增強可能性值調(diào)節(jié)該至少一個衰減值以產(chǎn)生用于控制該非語音通道相對于該語音通道的衰減的至少一個調(diào)節(jié)了的衰減值。
24.如權(quán)利要求23所述的方法,其中,步驟(b)包括響應于一個所述語音增強可能性值縮放每個所述衰減值以產(chǎn)生一個所述調(diào)節(jié)了的衰減值。
25.如權(quán)利要求23所述的方法,其中,每個所述語音增強可能性值與該非語音通道指示增強由該語音通道確定的語音內(nèi)容的感知品質(zhì)的語音增強內(nèi)容的可能性單調(diào)相關(guān)。
26.如權(quán)利要求23所述的方法,其中,該至少一個語音增強可能性值是比較值的序列,該方法包括如下步驟 通過比較指示由該語音通道確定的語音相關(guān)內(nèi)容的第一語音相關(guān)特征序列和指示由該非語音通道確定的語音相關(guān)內(nèi)容的第二語音相關(guān)特征序列來確定該比較值的序列,其中每個該比較值是該第一語音相關(guān)特征序列和該第二語音相關(guān)特征序列之間在不同時間的相似程度。
27.如權(quán)利要求23所述的方法,還包括如下步驟 (c)響應于該至少一個調(diào)節(jié)了的衰減值,對該非語音通道進行衰減。
28.如權(quán)利要求23所述的方法,其中,步驟(b)包括響應于一個所述語音增強可能性值縮放每個所述衰減值以產(chǎn)生一個所述調(diào)節(jié)了的衰減值。
29.如權(quán)利要求23所述的方法,其中,在步驟(a)中產(chǎn)生的每個所述衰減值是指示將該非語音通道中的信號功率對該語音通道中的信號功率的比值限制為不超過預定閾值所需的該非語音通道的衰減量的第一因子,其被與該語音通道指示語音的可能性單調(diào)相關(guān)的第二因子縮放。
30.如權(quán)利要求23所述的方法,其中,在步驟(a)中產(chǎn)生的每個所述衰減值是指示足以使存在由該非語音通道確定的內(nèi)容時由該語音通道確定的語音的預測可辨識度超過預定閾值的該非語音通道的衰減量的第一因子,其被與該語音通道指示語音的可能性單調(diào)相關(guān)的第二因子縮放。
31.如權(quán)利要求23所述的方法,其中,在步驟(a)中每個所述衰減值的產(chǎn)生包括如下步驟 確定該語音通道的指示作為頻率函數(shù)的功率的功率譜和該非語音通道的指示作為頻率函數(shù)的功率的第二功率譜;以及 響應于該功率譜和該第二功率譜,執(zhí)行該衰減值的頻域確定。
32.一種增強由具有語音通道和至少一個非語音通道的多通道音頻輸入信號確定的語音的系統(tǒng),該系統(tǒng)包括 分析子系統(tǒng),配置為分析該多通道音頻輸入信號以產(chǎn)生衰減控制值,其中每個該衰減控制值指示由該語音通道確定的語音相關(guān)內(nèi)容與由該輸入信號的至少一個非語音通道確定的語音相關(guān)內(nèi)容之間的相似程度;以及 衰減子系統(tǒng),配置為由至少一些所述衰減控制值掌控地將回避衰減應用到每個所述非語音通道以產(chǎn)生濾波音頻輸出信號。
33.如權(quán)利要求32所述的系統(tǒng),其中,該衰減子系統(tǒng)配置為響應于該衰減控制值的至 少一子集縮放至少一個所述非語音通道的原始衰減控制信號。
34.如權(quán)利要求32所述的系統(tǒng),其中,該分析子系統(tǒng)配置為產(chǎn)生用于至少一個所述非語音通道的指示衰減控制值的序列的衰減控制信號,該序列中的每個所述衰減控制值指示由該語音通道確定的語音相關(guān)內(nèi)容與由該非語音通道確定的語音相關(guān)內(nèi)容之間在不同時間的相似程度,該衰減子系統(tǒng)配置為 響應于該衰減控制信號縮放回避增益控制信號以產(chǎn)生縮放了的增益控制信號;以及 應用該縮放了的增益控制信號以對該非語音通道進行衰減。
35.如權(quán)利要求34所述的系統(tǒng),其中,所述分析子系統(tǒng)配置為比較指示由該語音通道確定的語音相關(guān)內(nèi)容的第一語音相關(guān)特征序列和指示由該非語音通道確定的語音相關(guān)內(nèi)容的第二語音相關(guān)特征序列以產(chǎn)生衰減控制信號,由該衰減控制信號指示的每個該衰減控制值指示該第一語音相關(guān)特征序列和該第二語音相關(guān)特征序列之間在不同時間的相似程度。
36.如權(quán)利要求35所述的系統(tǒng),其中,該第一語音相關(guān)特征序列是語音可能性值的序列,每個該語音可能性值指示在不同時間該語音通道指示語音的可能性,該第二語音相關(guān)特征序列是另一語音可能性值的序列,每個該語音可能性值指示在不同時間該非語音通道指示語音的可能性。
37.如權(quán)利要求32所述的系統(tǒng),其中,所述系統(tǒng)包括處理器,該處理器用分析軟件編程為分析該多通道音頻輸入信號以產(chǎn)生該衰減控制值。
38.如權(quán)利要求37所述的系統(tǒng),其中,該處理器用衰減軟件編程為將該回避衰減應用到每個所述非語音通道以產(chǎn)生該濾波音頻輸出信號。
39.如權(quán)利要求32所述的系統(tǒng),其中,所述系統(tǒng)包括處理器,該處理器被配置為分析該多通道音頻輸入信號以產(chǎn)生該衰減控制值,且配置為將該回避衰減應用到每個所述非語音通道以產(chǎn)生該濾波音頻輸出信號。
40.如權(quán)利要求32所述的系統(tǒng),其中,所述系統(tǒng)是音頻數(shù)字信號處理器,該音頻數(shù)字信號處理器已被配置為分析該多通道音頻輸入信號以產(chǎn)生該衰減控制值,且配置為將該回避衰減應用到每個所述非語音通道以產(chǎn)生該濾波音頻輸出信號。
41.如權(quán)利要求32所述的系統(tǒng),其中,所述系統(tǒng)包括配置為實現(xiàn)所述分析子系統(tǒng)的第一電路和耦接到該第一電路且配置為實現(xiàn)該衰減子系統(tǒng)的附加電路。
42.如權(quán)利要求32所述的系統(tǒng),其中,所述系統(tǒng)包括音頻數(shù)字信號處理器,該音頻數(shù)字信號處理器包括配置為實現(xiàn)所述分析子系統(tǒng)的第一電路和耦接到該第一電路且配置為實現(xiàn)該衰減子系統(tǒng)的附加電路。
43.如權(quán)利要求32所述的系統(tǒng),其中,所述系統(tǒng)是配置為現(xiàn)實該分析子系統(tǒng)和該衰減子系統(tǒng)的數(shù)據(jù)處理系統(tǒng)。
44.一種增強由具有語音通道和至少一個非語音通道的多通道音頻輸入信號確定的語音的系統(tǒng),所述系統(tǒng)包括 分析子系統(tǒng),配置為分析該多通道音頻輸入信號以產(chǎn)生衰減控制值,其中每個該衰減控制值指示由該語音通道確定的語音相關(guān)內(nèi)容和由該輸入信號的至少一個非語音通道確定的語音相關(guān)內(nèi)容之間的相似程度;以及 衰減子系統(tǒng),配置為由至少一些該衰減控制值掌控地應用回避衰減到該輸入信號的至少一個非語音通道以產(chǎn)生濾波音頻輸出信號。
45.如權(quán)利要求44所述的系統(tǒng),其中,所述分析子系統(tǒng)配置為產(chǎn)生指示由該語音通道確定的語音相關(guān)內(nèi)容和由該音頻信號的一個非語音通道確定的語音相關(guān)內(nèi)容之間的相似程度的每個所述衰減控制值,所述衰減子系統(tǒng)配置為響應于該衰減控制值應用所述回避衰減到所述一個非語音通道。
46.如權(quán)利要求44所述的系統(tǒng),其中,該分析子系統(tǒng)配置為從該音頻信號的該至少一個非語音通道衍生出衍生非語音通道,且配置為產(chǎn)生指示由該語音通道確定的語音相關(guān)內(nèi)容和由該音頻信號的衍生非語音通道確定的語音相關(guān)內(nèi)容之間的相似程度的至少一些所述衰減控制值中的每個。
47.一種計算機可讀介質(zhì),其包括代碼,所述代碼用于對處理器進行編程以處理指示具有語音通道和至少一個非語音通道的多通道音頻信號的數(shù)據(jù),從而改善由該信號確定的語音的可辨識度,包括通過如下步驟來進行 (a)確定指示由該語音通道確定的語音相關(guān)內(nèi)容和由該非語音通道確定的語音相關(guān)內(nèi)容之間的相似程度的至少一個衰減控制值;以及 (b)響應于該至少一個衰減控制值,對該非語音通道進行衰減。
48.如權(quán)利要求47所述的計算機可讀介質(zhì),包括代碼,該代碼用于對處理器進行編程以響應于該至少一個衰減控制值對該非語音通道的指示原始衰減控制信號的數(shù)據(jù)進行縮放。
49.如權(quán)利要求47所述的計算機可讀介質(zhì),包括代碼,該代碼用于對處理器進行編程以 產(chǎn)生指示衰減控制值的序列的數(shù)據(jù),每個該衰減控制值指示由該語音通道確定的語音相關(guān)內(nèi)容和由該非語音通道確定的語音相關(guān)內(nèi)容之間在不同時間的相似程度;以及 響應于該衰減控制值的序列,對指示回避增益控制信號的數(shù)據(jù)進行縮放以產(chǎn)生指示縮放了的增益控制信號的數(shù)據(jù)。
50.如權(quán)利要求49所述的計算機可讀介質(zhì),包括代碼,該代碼用于對處理器進行編程以比較指示由該語音通道確定的語音相關(guān)內(nèi)容的第一語音相關(guān)特征序列和指示由該非語音通道確定的語音相關(guān)內(nèi)容的第二語音相關(guān)特征序列,以產(chǎn)生該衰減控制值的序列,從而每個該衰減控制值指示該第一語音相關(guān)特征序列與該第二語音相關(guān)特征序列之間在不同時間的相似程度。
51.如權(quán)利要求49所述的計算機可讀介質(zhì),其中,該第一語音相關(guān)特征序列是第一語音可能性值的序列,每個該第一語音可能性值指示在不同時間該語音通道指示語音的可能性,該第二語音相關(guān)特征序列是第二語音可能性值的序列,每個該第二語音可能性值指示在不同時間該非語音通道指示語音的可能性。
52.如權(quán)利要求47所述的計算機可讀介質(zhì),其中,每個所述衰減控制值與該非語音通道指示增強由該語音通道確定的語音內(nèi)容的感知品質(zhì)的語音增強內(nèi)容的可能性單調(diào)相關(guān)。
53.一種計算機可讀介質(zhì),其包括代碼,該代碼用于對處理器進行編程以處理指示具有語音通道和至少兩個非語音通道的多通道音頻信號的數(shù)據(jù),包括通過如下步驟來進行 (a)確定指示由該語音通道確定的語音相關(guān)內(nèi)容和由第一非語音通道確定的第二語音相關(guān)內(nèi)容之間的相似程度的至少一個第一衰減控制值;以及 (b)確定指示由該語音通道確定的語音相關(guān)內(nèi)容和由第二非語音通道確定的第三語音相關(guān)內(nèi)容之間的相似程度的至少一個第二衰減控制值。
54.如權(quán)利要求53所述的計算機可讀介質(zhì),包括代碼,該代碼用于對處理器進行編程以比較指示由該語音通道確定的語音相關(guān)內(nèi)容的第一語音相關(guān)特征序列和指示該第二語音相關(guān)內(nèi)容的第二語音相關(guān)特征序列,且比較該第一語音相關(guān)特征序列和指示該第三語音相關(guān)內(nèi)容的第三語音相關(guān)特征序列。
55.如權(quán)利要求53所述的計算機可讀介質(zhì),包括代碼,該代碼用于對處理器進行編程以響應于該第一衰減控制值對該至少一個第一非語音通道進行衰減,且響應于該至少一個第二衰減控制值對該第二非語音通道進行衰減。
56.如權(quán)利要求53所述的計算機可讀介質(zhì),其中,該至少一個第一衰減控制值是衰減控制值的序列,所述介質(zhì)包括代碼,該代碼用于對處理器進行編程以響應于該衰減控制值的序列對應用到該第一非語音通道的回避增益的量進行縮放,從而改善由該語音通道確定的語音的可辨識度,而沒有不期望地對由該第一非語音通道確定的語音增強內(nèi)容進行衰減。
57.一種計算機可讀介質(zhì),其包括代碼,該代碼用于對處理器進行編程以處理指示具有語音通道和至少一個非語音通道的多通道音頻信號的數(shù)據(jù),包括通過如下步驟來進行 Ca)比較該語音通道的特性和該非語音通道的特性以產(chǎn)生用于控制該非語音通道相對于該語音通道的衰減的至少一個衰減值;以及 (b)響應于至少一個語音增強可能性值調(diào)節(jié)該至少一個衰減值,以產(chǎn)生用于控制該非語音通道相對于該語音通道的衰減的至少一個調(diào)節(jié)了的衰減值。
58.如權(quán)利要求57所述的計算機可讀介質(zhì),包括代碼,該代碼用于對處理器進行編程以響應于一個所述語音增強可能性值縮放每個所述衰減值以產(chǎn)生一個所述調(diào)節(jié)了的衰減值。
59.如權(quán)利要求57所述的計算機可讀介質(zhì),其中,每個所述語音增強可能性值與該非語音通道指示增強由該語音通道確定的語音內(nèi)容的感知品質(zhì)的語音增強內(nèi)容的可能性單調(diào)相關(guān)。
60.如權(quán)利要求57所述的計算機可讀介質(zhì),其中,該至少一個語音增強可能性值是比較值的序列,所述介質(zhì)包括代碼,該代碼用于對處理器進行編程以通過比較指示由該語音通道確定的語音相關(guān)內(nèi)容的第一語音相關(guān)特征序列和指示由該非語音通道確定的語音相關(guān)內(nèi)容的第二語音相關(guān)特征序列來確定該比較值的序列,其中,每個該比較值是該第一語音相關(guān)特征序列和該第二語音相關(guān)特征序列之間在不同時間的相似程度。
61.如權(quán)利要求57所述的計算機可讀介質(zhì),其中,每個所述衰減值是指示將該非語音通道中的信號功率對該語音通道中的信號功率的比值限制為不超過預定閾值所需的該非語音通道的衰減量的第一因子,其被與該語音通道指示語音的可能性單調(diào)相關(guān)的第二因子縮放。
62.如權(quán)利要求57所述的計算機可讀介質(zhì),其中,每個所述衰減值是指示足以使存在由該非語音通道確定的內(nèi)容時由該語音通道確定的語音的預測可辨識度超過預定閾值的該非語音通道的衰減量的第一因子,其被與該語音通道指示語音的可能性單調(diào)相關(guān)的第二因子縮放。
63.如權(quán)利要求57所述的計算機可讀介質(zhì),包括代碼,該代碼用于對處理器進行編程以確定該語音通道的指示作為頻率函數(shù)的功率的功率譜和該非語音通道的指示作為頻率函數(shù)的功率的第二功率譜,且響應于該功率譜和該第二功率譜在頻域中確定每個所述衰減值。
64.一種計算機可讀介質(zhì),其包括代碼,該代碼用于對處理器進行編程以處理指示具有語音通道和至少ー個非語音通道的多通道音頻信號的數(shù)據(jù),包括通過以下步驟來進行 確定指示由該語音通道確定的語音相關(guān)內(nèi)容和由該多通道音頻信號的至少ー個非語音通道確定的語音相關(guān)內(nèi)容之間的相似程度的至少ー個衰減控制值;以及 響應于該至少一個衰減控制值,產(chǎn)生指示該多通道音頻信號的至少ー個衰減了的非語音通道的數(shù)據(jù),其中每個所述衰減了的非語音通道已經(jīng)響應于該至少ー個衰減控制值經(jīng)歷了衰減。
65.如權(quán)利要求64所述的計算機可讀介質(zhì),其中,每個所述衰減控制值指示由該語音通道確定的語音相關(guān)內(nèi)容與由該音頻信號的一個非語音通道確定的語音相關(guān)內(nèi)容之間的相似程度。
66.如權(quán)利要求64所述的計算機可讀介質(zhì),包括代碼,該代碼用于對處理器進行編程以處理指示該多通道音頻信號的數(shù)據(jù),包括通過如下步驟來進行 產(chǎn)生指示從該音頻信號的該至少一個非語音通道衍生的衍生非語音通道的數(shù)據(jù),并確定指示由該語音通道確定的語音相關(guān)內(nèi)容與由該衍生非語音通道確定的語音相關(guān)內(nèi)容之間的相似程度的該至少ー個衰減控制值。
全文摘要
一種用于對具有語音通道和至少一個非語音通道的多通道音頻信號進行濾波以改善由該信號確定的語音的可辨識度的方法和系統(tǒng)。在典型實施例中,該方法包括步驟確定指示由該語音通道確定的語音相關(guān)內(nèi)容與由該非語音通道確定的語音相關(guān)內(nèi)容之間的相似程度的至少一個衰減控制值,以及響應于該至少一個衰減控制值對該非語音通道進行衰減。典型地,該衰減步驟包括響應于該至少一個衰減控制值對該非語音通道的原始衰減控制信號(例如,回避增益控制信號)進行縮放。一些實施例是通用或?qū)S锰幚砥鳎密浖蚬碳幊毯?或以其他方式配置為執(zhí)行根據(jù)本發(fā)明的濾波。
文檔編號H04R5/04GK102792374SQ201180012782
公開日2012年11月21日 申請日期2011年2月28日 優(yōu)先權(quán)日2010年3月8日
發(fā)明者H·繆施 申請人:杜比實驗室特許公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
磐石市| 南江县| 汝阳县| 鄱阳县| 边坝县| 方正县| 新余市| 永定县| 石城县| 汉阴县| 永兴县| 凤凰县| 正宁县| 宁波市| 永州市| 安西县| 卢龙县| 西丰县| 湖口县| 冀州市| 郓城县| 福泉市| 固原市| 和政县| 宜宾县| 自治县| 惠东县| 阳信县| 桐乡市| 商河县| 曲麻莱县| 华蓥市| 榆社县| 厦门市| 沐川县| 石狮市| 梅州市| 湖州市| 开阳县| 崇信县| 天长市|