本發(fā)明涉及在商業(yè)分銷之前對(duì)音頻信號(hào)的處理以改進(jìn)如由消費(fèi)者所聽到的音質(zhì),且具體地涉及減少前響應(yīng)的聲響效應(yīng)。
背景技術(shù):
直到大約1995年,大多數(shù)人才認(rèn)為光盤(cd)的44.1khz采樣率是完全足夠的。自1995年以來,‘高解析’移動(dòng)已采用96khz、192khz或更高的采樣頻率,從而潛在地允許音頻帶寬為40khz、80khz或更大。自從44.1khz的cd采樣率允許近乎完美地再現(xiàn)高達(dá)20khz(這是普遍認(rèn)可的人耳聽覺的頻率上限)的音頻頻率以來,總是有一些關(guān)于為什么在帶寬擴(kuò)展中存在聲響優(yōu)勢(shì)的疑問。
作為對(duì)這一明顯悖論的可能解釋,已提出了卓越的時(shí)間分辨率,且j.r.stuart和p.g.craven的最近的一篇論文“ahierarchicalapproachtoarchivinganddistribution”(在音頻工程協(xié)會(huì)大會(huì)(洛杉磯,2014年10月11日[aes預(yù)印本編號(hào)9178])上呈現(xiàn))解釋了這個(gè)概念并引證了支持這種觀點(diǎn)的幾個(gè)神經(jīng)科學(xué)參考文獻(xiàn)。
根據(jù)這個(gè)觀點(diǎn),錄音和再現(xiàn)鏈的脈沖響應(yīng)在時(shí)間上應(yīng)盡可能緊湊。經(jīng)驗(yàn)表明,聲響前響應(yīng)是特別不期望的,且上文引用的參考文獻(xiàn)呈現(xiàn)了關(guān)于為什么產(chǎn)生這種情況的爭(zhēng)論。
要么已普遍使用提供44.1khz輸出的過采樣模擬-數(shù)位轉(zhuǎn)換器來產(chǎn)生在44.1khz處所存儲(chǔ)的許多現(xiàn)有錄音,要么對(duì)以更高采樣率產(chǎn)生的錄音明確地進(jìn)行下采樣以產(chǎn)生在44.1khz下所存儲(chǔ)的許多現(xiàn)有錄音。兩種情況下都需要濾波,并且直到最近才普遍認(rèn)為更好的是使用線性相位濾波。不幸的是,線性相位濾波總是引入前響應(yīng)。
在以諸如88.2khz或更高的采樣率產(chǎn)生的錄音的情況下,可以通過“變跡”來減少前響應(yīng),如在craven,p.g.的“antialiasfiltersandsystemtransientresponseathighsamplerates”(音頻工程學(xué)會(huì)雜志,第52卷,第3期,第216頁(yè)至242頁(yè),2004年3月)中所描述。
通常,88.2khz采樣系統(tǒng)將具有在40khz或稍高的頻率處陡然截止的抗混疊濾波器。論文中所提議的解決方案是‘變跡’,即,濾波器更平緩地在20khz或稍微更高的頻率處開始并逐漸減小大約40khz到零點(diǎn)。高于40khz的銳頻帶邊沿由此再現(xiàn)為無害的,因?yàn)樽冔E濾波器已去除了在將引發(fā)嗡嗡聲或前響應(yīng)的頻率處的信號(hào)能量。仍然有來自變跡濾波器自身的某些前響應(yīng)和/或后響應(yīng),但這在時(shí)間上會(huì)短得多,因?yàn)槠溥^渡帶(從20khz到40khz)要寬得多。
對(duì)于44.1khz錄音來說,情形要不利得多。對(duì)于這些錄音來說,已普遍認(rèn)為使用下采樣或抗混疊濾波器是理想的,其中響應(yīng)持平到20khz,然后到22.05khz的奈奎斯特頻率時(shí)銳截止到基本上零點(diǎn)。因此,變跡濾波器不可能將響應(yīng)平緩地逐漸減小直至銳截止濾波器的頻率時(shí)減小到零點(diǎn),除非變跡濾波器在更低的頻率(諸如,15khz)處開始逐漸減小,而所述頻率普遍認(rèn)為是不可接受的。有時(shí),有可能通過在20khz處開始滾降的濾波器來改進(jìn)聲音,但一般地存在這樣的危險(xiǎn):受約束的變跡器因此將簡(jiǎn)單地用一個(gè)幾乎一樣銳利且處于稍低頻率處的帶邊來代替另一個(gè)帶邊。
因此,需要一種改進(jìn)的或替代的技術(shù)來最小化前響應(yīng)的不期望的聲響效應(yīng),尤其是對(duì)于已以相對(duì)低的采樣率(諸如,44.1khz)存儲(chǔ)或?qū)⒁韵鄬?duì)低的采樣率(諸如,44.1khz)傳輸?shù)男盘?hào)來說。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明人已認(rèn)識(shí)到,可以不通過直接試圖減小前響應(yīng)的振幅來減小前響應(yīng)的可聽度,而是通過使用非最小相位零點(diǎn)引入在前響應(yīng)具有最多能量的頻率下的群延遲來減小前響應(yīng)的可聽度。
因此,根據(jù)本發(fā)明的第一方面,提供了一種減少在前響應(yīng)頻率下具有能量的前響應(yīng)的聲響效應(yīng)的方法,該方法包括通過使用數(shù)字非最小相位濾波器對(duì)數(shù)字音頻信號(hào)進(jìn)行濾波來引入在前響應(yīng)頻率下的群延遲,所述數(shù)字非最小相位濾波器具有包括位于單位圓外部的零點(diǎn)的z變換響應(yīng)。
該零點(diǎn)大致可以用來產(chǎn)生比低頻率(包括處于或接近0hz的頻率)下的群延遲更大的前響應(yīng)頻率下的群延遲。該零點(diǎn)不應(yīng)與在單位圓內(nèi)部的倒數(shù)位置處的另一個(gè)零點(diǎn)成對(duì)(如發(fā)生在常規(guī)線性相位濾波中),因?yàn)檫@種成對(duì)將使由該零點(diǎn)所提供的相位修正線性化,并使其在前響應(yīng)頻率附近提供額外延遲的手段是無效的。
在單位圓外部的零點(diǎn)將‘最大相位’元素引入到濾波器的傳遞函數(shù)中,所得群延遲由此使前響應(yīng)延遲使得其至脈沖響應(yīng)的主峰值的時(shí)間被減小且前響應(yīng)由此較難聽到。在幾個(gè)此類零點(diǎn)合作地作用的情況下,時(shí)間提前量可減小到零或可變成負(fù)數(shù);因此可將前響應(yīng)變換為后響應(yīng),所述后響應(yīng)較難聽到得多。
從檔案庫(kù)檢索到的信號(hào)可已經(jīng)包含前響應(yīng),在這種情況下,本發(fā)明將使現(xiàn)有前響應(yīng)延遲。可替代地或另外,可搶占式地使用本發(fā)明以使可在后續(xù)處理操作中引發(fā)前響應(yīng)的信號(hào)頻率分量延遲。在該情況下,根據(jù)本發(fā)明的濾波將搶占式地使將引發(fā)前響應(yīng)的信號(hào)頻率分量延遲,從而也使關(guān)于信號(hào)的更低頻率分量的前響應(yīng)延遲。由于線性濾波是可交換操作,所以兩種情形從數(shù)學(xué)上講是相同的。
通常,前響應(yīng)是由關(guān)于采樣率的改變所執(zhí)行的濾波操作引起的,通常在略低于‘參考’奈奎斯特頻率(對(duì)應(yīng)于‘參考’采樣率)的頻率下應(yīng)用陡峭截止濾波器(steep-cutfilter),所述‘參考’采樣率是所涉及的采樣率中的更低者??梢灶A(yù)料到由此產(chǎn)生的前響應(yīng)具有主要在所述參考奈奎斯特頻率的20%內(nèi)的能量。
可使用具有許多z平面零點(diǎn)的濾波器來執(zhí)行該方法,但本發(fā)明人已發(fā)現(xiàn),可常常使用具有在單位圓外部的少至3個(gè)的零點(diǎn)的濾波器來獲得顯著的聲響優(yōu)勢(shì),每個(gè)零點(diǎn)具有上文所引用的群延遲性質(zhì)。具體地,如果‘z’表示在等于兩倍的參考奈奎斯特頻率的采樣頻率下的一個(gè)樣本的時(shí)間提前量,那么優(yōu)選地濾波器包括至少三個(gè)z平面零點(diǎn),這些z平面零點(diǎn)具有倒數(shù),所述倒數(shù)的實(shí)部均小于-0.5。
在一些實(shí)施方案中,本發(fā)明的方法將應(yīng)用于已從更高頻率被下采樣的信號(hào)。在該情況下,適當(dāng)?shù)膮⒖疾蓸勇释ǔJ菙?shù)字音頻信號(hào)的采樣頻率。
有時(shí),將該方法應(yīng)用于已按2的倍數(shù)被上采樣的信號(hào)或可替代地應(yīng)用于將隨后按2的倍數(shù)被下采樣的信號(hào)是方便的。在該情況下,參考采樣率通常是數(shù)字音頻信號(hào)的采樣頻率的一半。
日益地,內(nèi)容經(jīng)母帶處理從而以‘2倍’采樣率(諸如,96khz)來遞送,但此類內(nèi)容常?;旌献远鄠€(gè)異構(gòu)源,其中一些異構(gòu)源是以‘1倍’參考采樣率(諸如,44.1khz或48khz)來錄音或處理的。音頻混合體的這些分量可包含在處于或略低于22.05khz或24khz的對(duì)應(yīng)參考奈奎斯特頻率處具有能量的前響應(yīng)。96khz采樣信號(hào)可因此具有此類前響應(yīng)連同在略低于48khz的信號(hào)奈奎斯特頻率處具有能量的另外的前響應(yīng)。在此類情況下,使用適當(dāng)定位在單位圓外部的另外的零點(diǎn)來根據(jù)本發(fā)明如此處理兩組前響應(yīng)可為有利的。當(dāng)然,如果未明確區(qū)分‘1倍’參考采樣率與信號(hào)采樣率,那么這個(gè)雙處理無多大關(guān)系,并且專注于其中‘1倍’前響應(yīng)具有不超過信號(hào)奈奎斯特頻率的60%的頻率的情形似乎是明智的。
接近于奈奎斯特頻率的z平面零點(diǎn)將產(chǎn)生在奈奎斯特頻率附近受到嚴(yán)重抑制的振幅響應(yīng)??赏ㄟ^將倒數(shù)位置處的極點(diǎn)也并入于z平面中來使振幅響應(yīng)完全變平,所述零點(diǎn)和所述極點(diǎn)結(jié)合形成濾波器的傳遞函數(shù)中的全通因子。
可替代地,可通過添加頻率稍低于零點(diǎn)頻率的極點(diǎn)來使振幅響應(yīng)在更低頻率下變平,所述極點(diǎn)被配置成在對(duì)耳朵重要的頻率范圍(諸如,0至16khz)上提供在某個(gè)公差(諸如,1db)內(nèi)平坦的振幅響應(yīng)。
可以通過與‘參考延遲’的比較來特征化由第一方面的濾波方法所產(chǎn)生的延遲,所述‘參考延遲’可以是在較低的比較頻率(諸如,500hz或0hz)下的延遲,或可替代地其可以是至濾波器的脈沖響應(yīng)中的最大峰值的延遲時(shí)間。通常,前響應(yīng)頻率下的延遲將超過參考延遲一個(gè)有限的幅度(例如,在前響應(yīng)頻率下的10個(gè)周期)。對(duì)于接近20khz的前響應(yīng)來說,這將是0.5ms的幅度。
根據(jù)本發(fā)明的第二方面,提供了一種適合接收第一數(shù)字音頻信號(hào)并供應(yīng)用于分發(fā)的第二數(shù)字音頻信號(hào)的母帶處理器,其中所述母帶處理器被配置成執(zhí)行本發(fā)明的第一方面的方法以減少在從第二信號(hào)再現(xiàn)的信號(hào)中的前響應(yīng)的聲響效應(yīng)以供聽眾試聽。
因此,由母帶處理器執(zhí)行第一方面的方法,所述母帶處理器從檔案庫(kù)接收音頻‘軌道’并在商業(yè)發(fā)布之前對(duì)它們進(jìn)行調(diào)節(jié)。檔案庫(kù)內(nèi)的軌道將常常具有前響應(yīng),該方法使這些前響應(yīng)延遲以便減少它們的聲響效應(yīng)。母帶處理器還可搶占式地使通過在聽眾的裝置中上采樣或下采樣所產(chǎn)生的前響應(yīng)延遲。
根據(jù)本發(fā)明的第三方面,提供了一種消費(fèi)者裝置,其具有適合接收數(shù)字音頻信號(hào)的輸入端,所述消費(fèi)者裝置被配置成根據(jù)本發(fā)明的第一方面的方法來處理接收到的數(shù)字音頻信號(hào)。
以這種方式,被設(shè)計(jì)成在家里傾聽的裝置可執(zhí)行第一方面的方法以根據(jù)本發(fā)明來改進(jìn)現(xiàn)有cd和尚未經(jīng)母帶處理的其他源的音質(zhì)。所述裝置還可執(zhí)行該方法以便在可產(chǎn)生前響應(yīng)的數(shù)字-模擬轉(zhuǎn)換之前預(yù)處理數(shù)字音頻信號(hào)。
應(yīng)注意,可以硬件(諸如,建置到adc或dac中的客制化邏輯)或軟件或兩者的組合來體現(xiàn)本發(fā)明。
根據(jù)本發(fā)明的第四方面,提供了一種錄音媒體,其輸送通過第一方面的方法處理的數(shù)字音頻信號(hào)。此類錄音將具有最小的固有前響應(yīng)和/或?qū)⑹骨绊憫?yīng)的產(chǎn)生延遲,否則就要在再現(xiàn)時(shí)聽到所述前響應(yīng)。
根據(jù)本發(fā)明的第五方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,其包括指令,所述指令在由信號(hào)處理器執(zhí)行時(shí)致使所述信號(hào)處理器執(zhí)行第一方面的方法。
此類程序產(chǎn)品可實(shí)施執(zhí)行本發(fā)明的母帶處理行為的數(shù)字信號(hào)處理器(dsp)??商娲?,所述程序產(chǎn)品可向現(xiàn)有dsp實(shí)施升級(jí)程序,這允許所述現(xiàn)有dsp執(zhí)行本發(fā)明的母帶處理行為??上蜃罱K用戶的消費(fèi)者裝置的處理能力提供類似的升級(jí)。實(shí)際上,可在移動(dòng)電話等等的軟件“應(yīng)用程序”中或在其升級(jí)程序中實(shí)施本發(fā)明。將此類升級(jí)程序“改裝”到現(xiàn)有裝置以便其可以實(shí)施本發(fā)明的這種能力是特別有利的特征。
如由本領(lǐng)域技術(shù)人員將了解,本發(fā)明提供用于減少音頻信號(hào)中的前響應(yīng)的聲響效應(yīng)的方法和裝置,并且所述方法和裝置可以在減少音頻信號(hào)中的現(xiàn)有前響應(yīng)的聲響效應(yīng)的背景下和/或通過采取搶占式行動(dòng)(預(yù)計(jì)到將由后續(xù)處理所引入的前響應(yīng))來這樣做。所述前響應(yīng)通過采用數(shù)字非最小相位濾波器被有效地延遲,所述數(shù)字非最小相位濾波器包括在其z變換響應(yīng)中位于單位圓外部的零點(diǎn)。進(jìn)一步的變化和修改將依據(jù)本公開變得為技術(shù)人員所顯而易見。
附圖說明
將參考附圖來詳細(xì)描述本發(fā)明的示例,在附圖中:
圖1示意性地說明完整的錄音和再現(xiàn)鏈;
圖2示出:在從88.2khz下采樣至44.1khz時(shí)由adobe'audition1.5'使用的濾波器的過渡帶(實(shí)線);以及在播放cd時(shí)arcamfmjdv139播放器的過渡帶(虛線);
圖3a示出:圖2的adobe下采樣濾波器的脈沖響應(yīng)(上軌跡),時(shí)間軸是指在88.2khz采樣率下的采樣周期;以及圖2的arcam重構(gòu)濾波器的脈沖響應(yīng)(下軌跡);
圖3b示出圖3a的adobe前響應(yīng)的更多細(xì)節(jié);
圖3c示出圖3a的adobe前響應(yīng)的一部分的頻譜;
圖4a示出3階iir低通濾波器的極點(diǎn)和零點(diǎn);
圖4b示出圖4a的濾波器的頻率響應(yīng);
圖4c示出:arcam脈沖響應(yīng)(上軌跡);以及在由圖4a的3階iir低通濾波器進(jìn)行預(yù)處理的情況下的arcam脈沖響應(yīng)(下軌跡),兩種arcam脈沖響應(yīng)均用5倍擴(kuò)大的垂直標(biāo)度來標(biāo)繪;
圖5a示出具有與圖4b相同的頻率響應(yīng)的最大相位3階iir低通濾波器的極點(diǎn)和零點(diǎn);
圖5b示出:在由圖4a的3階iir低通濾波器進(jìn)行預(yù)處理的情況下的arcam脈沖響應(yīng)(上軌跡);以及由圖5a的最大相位濾波器進(jìn)行預(yù)處理的情況下的arcam脈沖響應(yīng)(下軌跡),兩種arcam脈沖響應(yīng)均用10倍擴(kuò)大的垂直標(biāo)度來標(biāo)繪;
圖6a示出具有與圖5a的濾波器相同的零點(diǎn)的全通濾波器的極點(diǎn)和零點(diǎn);
圖6b示出‘a(chǎn)rcam’脈沖響應(yīng)(上軌跡)(也示于圖3a中)與由圖6a的全通濾波器預(yù)處理的arcam脈沖響應(yīng)(下軌跡)之間的比較,兩種脈沖響應(yīng)均用5倍擴(kuò)大的垂直標(biāo)度來標(biāo)繪;
圖7a示出12階全通濾波器的極點(diǎn)和大部分零點(diǎn),其中兩個(gè)零點(diǎn)在該圖的范圍外部;
圖7b示出adobe'audition1.5'下采樣濾波器的脈沖響應(yīng)(頂部軌跡)、adobe'audition1.5'下采樣濾波器、繼之以arcam重構(gòu)濾波器的脈沖響應(yīng)(中間軌跡)和adobe'audition1.5'下采樣濾波器、繼之以圖7a的12階全通濾波器、繼之以arcam重構(gòu)濾波器的脈沖響應(yīng)(底部軌跡);
圖8示出圖7a的12階全通濾波器的群延遲(實(shí)線)和圖6a的3階全通濾波器的群延遲(虛線)。在88.2khz采樣率下的采樣周期中校準(zhǔn)垂直軸;
圖9示出:在z=-1.5(即,處于半徑1.5)及頻率22.05khz的單個(gè)零點(diǎn)(實(shí)線)的采樣周期中的群延遲;以及在半徑1.5及20khz、16khz和11.025khz的頻率的零點(diǎn)的共軛對(duì)(虛線);
圖10a示出經(jīng)修改以在更高采樣率下操作的圖7a的全通濾波器的極點(diǎn)和大部分零點(diǎn)。其中兩個(gè)零點(diǎn)在該圖的范圍外部;以及
圖10b示出當(dāng)以88.2khz的采樣率操作時(shí)在圖10a的全通濾波器的采樣周期中的群延遲(τ)。
具體實(shí)施方式
圖1示出了示例錄音和再現(xiàn)鏈,其中由麥克風(fēng)1捕獲聲音、通過模擬-數(shù)字轉(zhuǎn)換器(adc)2將聲音轉(zhuǎn)換到數(shù)字形式和將所得信號(hào)存儲(chǔ)在檔案庫(kù)3中。在稍后的某個(gè)時(shí)間,從檔案庫(kù)檢索信號(hào),且信號(hào)可通過采樣率轉(zhuǎn)換器(src)4和另外的處理設(shè)備(p1)5,之后經(jīng)由物理媒體(諸如,光盤(cd))或者通過無形媒體(諸如,無線電廣播或互聯(lián)網(wǎng)傳輸)將信號(hào)分發(fā)6給聽眾。
聽眾的裝置7、8、9包括數(shù)字-模擬轉(zhuǎn)換器(dac)8和換能器9(諸如,耳機(jī)或揚(yáng)聲器)和可選地另外的處理設(shè)備(p2)7。
如稍后將描述,可提供根據(jù)本發(fā)明的處理設(shè)備,作為母帶處理裝置5中的p1或者聽眾的接收裝置7中的p2。在兩種情況下,將處理由adc2或src4產(chǎn)生的或由聽眾的dac8產(chǎn)生的前回響(pre-ring)。在一些實(shí)施方式中,根據(jù)本發(fā)明的處理設(shè)備可設(shè)置在兩個(gè)位置處。此外,在一些實(shí)施方案中,根據(jù)本發(fā)明的處理設(shè)備可設(shè)置在src(如果存在的話)前面或檔案庫(kù)前面。
cd使用44.1khz的采樣率,并且貫穿20世紀(jì)80年代和20世紀(jì)90年代許多公司在44.1khz下操作整個(gè)錄音鏈,也在44.1khz下進(jìn)行歸檔,使得未使用src4。最近以來,以更高的采樣率(諸如,用于1位'dsd'錄音的44.1khz、88.2khz、176.4khz、192khz或甚至2.8224mhz)運(yùn)行adc和檔案庫(kù)已成為一種趨勢(shì),因此這使得采樣率轉(zhuǎn)換器4成為必需,所述采樣率轉(zhuǎn)換器可以是一件單獨(dú)的硬件或者軟件數(shù)字音頻工作站(daw)的一部分。
采樣率轉(zhuǎn)換由于必要的濾波而具有產(chǎn)生前響應(yīng)的大潛在性。通過在44.1khz下運(yùn)行整個(gè)鏈規(guī)避不了這個(gè)問題,因?yàn)楣?yīng)44.1khz輸出的大多數(shù)商用adc將以更高的頻率在內(nèi)部操作、然后使用采樣率轉(zhuǎn)換過程來提供期望的輸出采樣率。
已知用于采樣率轉(zhuǎn)換的各種各樣的結(jié)構(gòu),選擇權(quán)取決于多種因素,諸如所涉及的頻率是呈簡(jiǎn)單整數(shù)比(諸如,2:1)還是更‘難’的比(諸如,48:44.1)。然而,無混疊下采樣至44.1khz始終需要在高于20khz處迅速截止的低通濾波器。對(duì)濾波器形狀的要求很大程度上并非取決于源信號(hào)的采樣頻率。這對(duì)于上采樣至任意新的采樣率也是成立的。因此,下采樣和上采樣/重構(gòu)兩者對(duì)數(shù)字低通濾波器產(chǎn)生要求,所述數(shù)字低通濾波器通稱為‘抗混疊’濾波器(當(dāng)下采樣時(shí))或‘重構(gòu)’濾波器(當(dāng)上采樣時(shí))。對(duì)兩種濾波器的技術(shù)要求不必非常不同。
關(guān)于以下各者分歧眾多:是否、何時(shí)將音頻下采樣至44.1khz或從44.1khz上采樣;低通濾波器應(yīng)提供實(shí)質(zhì)的‘阻帶’衰減,諸如在22.05khz處為90db;或是否可接受使用濾波器,諸如‘半帶’,該‘半帶’在88.2khz下操作并被配置成在22.05khz下提供6db衰減和在24.1khz下提供全衰減。從歷史上看,常常使濾波器的過渡帶與被認(rèn)為可接受的寬度一樣寬,以便最小化硬件橫向('fir')實(shí)施方式中的抽頭(tap)的數(shù)目。過渡帶因此大約為2khz寬(例如,從20khz到22.05khz),或可替代地大約為4khz寬(例如,從20khz到24.1khz)。最近的軟件實(shí)施方式已提供窄得多的過渡帶,例如新近的'adobeauditioncs5.5'daw提供具有大約為100hz寬(從低于奈奎斯特頻率的大約75hz開始)的過渡帶的src設(shè)施。
可能更典型的是早前的'adobeaudition1.5'daw,其提供具有大約為500hz寬(在21.5khz處開始)的過渡帶的濾波器。許多商業(yè)發(fā)行的錄音展現(xiàn)出近奈奎斯特噪聲頻譜,該頻譜表明可已在處理中的某個(gè)階段使用了濾波器(諸如,此濾波器)。圖2示出了adobe濾波器的過渡帶以及來自arcam的受好評(píng)的‘通用’光盤播放機(jī)在播放44.1khzcd時(shí)的模擬輸出的過渡帶。arcam響應(yīng)在奈奎斯特頻率下降低了大約6db,這表明可已使用‘半帶’濾波器執(zhí)行了初始1:2上采樣。在當(dāng)前可通過http://infinitewave.ca/resources.htm訪問的“采樣率轉(zhuǎn)換比較項(xiàng)目”中示出了過渡帶的其他圖。
圖3a中示出了adobe濾波器和arcam濾波器的脈沖響應(yīng),每個(gè)濾波器具有近似處于奈奎斯特頻率處的前回響和后回響。adobe濾波器具有更長(zhǎng)的前響應(yīng)和后響應(yīng),正如可從其更窄的過渡帶所預(yù)料到。仔細(xì)檢查發(fā)現(xiàn),arcam響應(yīng)在以兩條垂直線為邊界的區(qū)域外部基本上為零,這表明已使用具有在88.2khz下大約107個(gè)采樣周期的跨度的fir濾波器執(zhí)行了從44.1khz到88.2khz的第一上采樣。
adobe圖事實(shí)上是在將44.1khz流中的單脈沖上采樣至88.2khz時(shí)'adobeaudition1.5'的輸出,其中選擇“前/后濾波器”和“質(zhì)量=999”選項(xiàng)。調(diào)查發(fā)現(xiàn),當(dāng)使用audition從88.2khz下采樣至44.1khz時(shí),在內(nèi)部使用同一個(gè)濾波器。在前響應(yīng)的遙遠(yuǎn)‘尾部’(圖3b)中,我們看到‘拍頻’效應(yīng),并且在對(duì)尾部進(jìn)行窗口傅立葉變換(圖3c)時(shí),我們看到近似對(duì)應(yīng)于過渡帶的兩個(gè)邊緣的兩個(gè)不同頻率(21.5khz和22.05khz)。
為去除audition濾波器的前回響,可因此示出雙陷波濾波器,但這將是特定于audition1.5src的。我們期望更一般的方法,因?yàn)橐魳窓n案庫(kù)可包含使用各種各樣和可能未知的器材所制作/下采樣的44.1khz錄音。
通過濾波的前響應(yīng)抑制
假設(shè)前響應(yīng)在范圍20khz至22.05khz中具有能量,一種方法是衰減這個(gè)頻率范圍。具有以下z變換響應(yīng)的三階iir濾波器當(dāng)在44.1khz采樣率下操作時(shí)將區(qū)域20khz至22.05khz衰減20db:
這個(gè)iir濾波器具有如圖4a中所示的極點(diǎn)(叉號(hào))和零點(diǎn)(圓)及圖4b中所示的頻率響應(yīng)。圖4c示出了對(duì)單脈沖和使用以上濾波器所預(yù)處理的脈沖的arcam響應(yīng)。將看到,在以更大的后響應(yīng)和18khz處的1db的頻率響應(yīng)下垂的情況下,處理顯著減少了前響應(yīng)。
根據(jù)本發(fā)明,可如下通過將上文所示的最小相位濾波器替換為對(duì)應(yīng)的最大相位濾波器來進(jìn)一步減少前響應(yīng):
這個(gè)濾波器具有相同的極點(diǎn)但零點(diǎn)在單位圓外部,如圖5a中所示。頻率響應(yīng)與圖4b中所示的響應(yīng)無變化。圖5b在10倍擴(kuò)大的垂直標(biāo)度上比較兩種響應(yīng),結(jié)果表明,最大相位濾波器相對(duì)于最小相位濾波器將緊接在主脈沖前面的下降趨勢(shì)(downswing)減少4db,并且其將其他前響應(yīng)減少6db或更多。
在零點(diǎn)位于單位圓外部的情況下,現(xiàn)在可以調(diào)節(jié)在單位圓內(nèi)部的極點(diǎn)以便產(chǎn)生全通濾波器:
所述全通濾波器的極點(diǎn)和零點(diǎn)示于圖6a中。這個(gè)濾波器從零到奈奎斯特頻率具有平坦的頻率響應(yīng)(一些權(quán)威人士認(rèn)為這是非??扇〉男再|(zhì))。圖6b表明:即使這個(gè)濾波器在前響應(yīng)頻率處不提供衰減,其仍能夠顯著減少前響應(yīng)。
如下通過12階全通濾波器來提供對(duì)前響應(yīng)的更有力的抑制:
所述12階全通濾波器的極點(diǎn)和零點(diǎn)示于圖7a中。
參考圖7b,頂部軌跡僅僅示出了'adobeaudition1.5'濾波器的脈沖響應(yīng),而中間軌跡在arcamfmjdv139播放機(jī)的響應(yīng)中折疊以嘗試模型化信號(hào)鏈(諸如,圖1中所示的信號(hào)鏈)。遠(yuǎn)離中心峰值的回響可歸因于audition濾波器的銳過渡帶,且arcam響應(yīng)中的折疊由于其在奈奎斯特頻率下的~6db衰減而使這些回響略微減少,不過減少的程度太小以至在圖7b中看不到。
圖7b的底部軌跡包括用以上12階全通濾波器來處理44.1khz信號(hào)的效應(yīng)。前響應(yīng)已幾乎完全去除。發(fā)現(xiàn)這個(gè)處理可提供對(duì)許多商業(yè)發(fā)行的錄音的實(shí)質(zhì)聲響改進(jìn)。
圖8示出了圖6a的全通濾波器(3階)和圖7a的全通濾波器(12階)的群延遲。從圖3c想起,前響應(yīng)的頻譜能量主要在20khz以上,圖8的圖充分表明,這些全通濾波器的動(dòng)作是使前響應(yīng)延遲,因此將其轉(zhuǎn)換為后響應(yīng)。
為測(cè)量前響應(yīng)延遲,需要一個(gè)參考,因?yàn)榭傂盘?hào)的適度延遲不影響音頻質(zhì)量??赏茰y(cè),耳朵可將經(jīng)濾波的脈沖響應(yīng)或經(jīng)濾波的包絡(luò)響應(yīng)中的最高峰值用作參考。在實(shí)踐中,發(fā)現(xiàn),非最小相位零點(diǎn)各自在20khz附近具有比低音頻頻率下的群延遲更大的群延遲是有幫助的。我們注意到在0hz的頻率下的群延遲從數(shù)學(xué)上是定義明確的:圖9中標(biāo)繪了在范圍11.025khz至22.1khz內(nèi)具有各種頻率的非最小相位零點(diǎn)的正反相對(duì)群延遲頻率。將看到,接近0hz的群延遲為負(fù)值。
再次參考圖7a,可以推測(cè),最接近原點(diǎn)的兩個(gè)極點(diǎn)對(duì)(即,位于-0.12±0.06i和-0.4±0.16i(其中i=√-1)處))連同在倒數(shù)位置處的它們的對(duì)應(yīng)零點(diǎn)對(duì)
1/(-0.12±0.06i)=-6.46±3.43i
和
1/(-0.4±0.16i)=-2.15±0.87i
相對(duì)于處于低音頻頻率的群延遲對(duì)接近20khz的群延遲幾乎沒什么貢獻(xiàn)。計(jì)算證實(shí),實(shí)際上,這四個(gè)零點(diǎn)和四個(gè)極點(diǎn)可以刪除,同時(shí)對(duì)所述相對(duì)群延遲的影響僅為5%但保有濾波器復(fù)雜性的33%。
因此,在全通濾波器的情況下,在接近于奈奎斯特頻率的前響應(yīng)延遲中最有幫助的正是其實(shí)部的負(fù)值大于-0.5的極點(diǎn)連同其對(duì)應(yīng)的零點(diǎn)。在非為全通的濾波器的情況下,重要的正是零點(diǎn),因?yàn)榧词共淮嬖趯?duì)應(yīng)的極點(diǎn),零點(diǎn)仍可以提供有幫助的衰減。因此,一般而言,在減少前響應(yīng)中最有幫助的正是其倒數(shù)位于單位圓內(nèi)部且其實(shí)部小于-0.5的零點(diǎn)。
在一些情況下,通過以具有指數(shù)上升包絡(luò)的正弦波進(jìn)行饋送,有可能推斷出在濾波設(shè)備中存在非最小相位零點(diǎn)。例如,在圖6a中所表示的濾波器的情況下,由于位于-1.0086+0.2723i處的零點(diǎn),處于20.2khz頻率處且在每個(gè)采樣周期具有按1.045的倍數(shù)增加的包絡(luò)的正弦波將在理論上產(chǎn)生零輸出。
當(dāng)然,此類測(cè)試信號(hào)必須具有受限制的持續(xù)時(shí)間以便不引發(fā)過載,且必須注意不把處理延遲錯(cuò)認(rèn)為衰減。合適的測(cè)試信號(hào)可以以極低的振幅開始,且包含在增加的正弦波結(jié)束時(shí)作為時(shí)間參考的脈沖。測(cè)試可包括將對(duì)所述信號(hào)的響應(yīng)與對(duì)處于同一頻率但具有恒定的振幅的正弦波的響應(yīng)進(jìn)行比較。然而,以這種方式測(cè)試遠(yuǎn)在單位圓外部的零點(diǎn)是不切實(shí)際的,并且在極接近于其他零點(diǎn)的零點(diǎn)的情況下也可存在信噪比難度。在困難的情況下,可替代地使用諸如調(diào)頻激勵(lì)的技術(shù)來精確地捕獲設(shè)備的脈沖響應(yīng),然后將求根算法應(yīng)用于脈沖響應(yīng)。
在圖1中所描繪的情形中,可將根據(jù)本發(fā)明的處理設(shè)備設(shè)為母帶裝置5中的p1或者聽眾的接收裝置7中的p2。在兩種情況下,將處理由src4產(chǎn)生的或由聽眾的dac8產(chǎn)生的前回響。圖7b提供了以下論證:可以在單個(gè)操作中有效地抑制來自兩個(gè)裝置的前回響。當(dāng)發(fā)布新的錄音時(shí),為了有益于所有聽眾,把處理設(shè)在p1處將是顯而易見的。然而,設(shè)在p2處對(duì)已具有包含尚未處理的錄音的一批媒體6的聽眾是有價(jià)值的。
還發(fā)現(xiàn)該處理對(duì)于處于樣本頻率(諸如,96khz)處的‘高解析’錄音是有用的,所述‘高解析’錄音可包含具有更接近于48khz的頻率的前回響。已使用相同的濾波器結(jié)構(gòu)和系數(shù),但在96khz下被時(shí)控使得在范圍為44khz至48khz的頻率下實(shí)現(xiàn)大的群延遲。
與上文分開地,有時(shí)需要處理已被上采樣的信號(hào):例如,有證據(jù)表明,一些名義上的88.2khz或96khz商購(gòu)錄音已經(jīng)相應(yīng)地從44.1khz或48khz進(jìn)行上采樣,由此包含略高于20khz的前響應(yīng)。在這些情況下,我們必須區(qū)分所呈現(xiàn)的用于處理的信號(hào)的采樣頻率與‘參考’采樣頻率,所述‘參考’采樣頻率與產(chǎn)生了或?qū)㈦S后產(chǎn)生期望處理的前回響的過程有關(guān)。需要同樣注意‘z變換’:出于實(shí)施的目的,'z'必須表示呈現(xiàn)為用于處理的信號(hào)的一個(gè)樣本的時(shí)間提前量,但先前關(guān)于零點(diǎn)的位置所論述的標(biāo)準(zhǔn)假設(shè)'z'表示產(chǎn)生了或?qū)a(chǎn)生前響應(yīng)的過程的一個(gè)采樣周期。
對(duì)于參考采樣頻率是信號(hào)的采樣頻率的一半的情況來說,對(duì)已呈現(xiàn)的改進(jìn)濾波器的適當(dāng)修改是將z替換為z2通過量(throughout)及因此z2被替換為z4。圖7a中所示的極點(diǎn)和零點(diǎn)由此替換為圖10a中所示的極點(diǎn)和零點(diǎn),并且如果信號(hào)的采樣率是88.2khz,那么被示為圖8中的實(shí)線軌跡的群延遲通過反射被延長(zhǎng)大約22.05khz。如圖10b中所示。
可替代地通過單獨(dú)處理相應(yīng)地由奇數(shù)個(gè)樣本和偶數(shù)個(gè)樣本組成的子流來實(shí)施因此所修改的濾波器,并且這可為更經(jīng)濟(jì)的。
這些可能性并不詳盡,并且盡管將用數(shù)字化方法執(zhí)行處理,但不排除模擬媒體可介入。例如,圖1中的檔案庫(kù)3可以是模擬磁帶的庫(kù),其中一些模擬磁帶可包含前響應(yīng),因?yàn)橐咽褂迷?4.1khz下在內(nèi)部操作的數(shù)字效應(yīng)單元來處理信號(hào)。只要可以將模擬媒體假設(shè)為線性,母帶階段5處的處理在抑制這些前響應(yīng)方面便將和在全數(shù)字系統(tǒng)中一樣有效。