專(zhuān)利名稱(chēng)::瞬態(tài)檢測(cè)器以及用于支持音頻信號(hào)的編碼的方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及對(duì)音頻信號(hào)進(jìn)行操作的瞬態(tài)檢測(cè)器以及用于支持音頻信號(hào)的編碼的方法。
背景技術(shù):
:編碼器是一種能夠分析諸如音頻信號(hào)之類(lèi)的信號(hào)并以編碼的形式輸出信號(hào)的設(shè)備、電路或計(jì)算機(jī)程序。所得到的信號(hào)通常用于傳輸、存儲(chǔ)和/加密的目的。另一方面,解碼器是一種能夠反轉(zhuǎn)編碼器操作的設(shè)備、電路或計(jì)算機(jī)程序,因?yàn)槠浣邮站幋a的信號(hào)并輸出解碼的信號(hào)。在大多數(shù)現(xiàn)有技術(shù)的編碼器(例如音頻編碼器)中,在頻域中分析輸入信號(hào)的每個(gè)幀。這一分析的結(jié)果被量化和編碼,并且然后根據(jù)應(yīng)用進(jìn)行傳輸或存儲(chǔ)。在接收側(cè)(或者當(dāng)使用所存儲(chǔ)的編碼信號(hào)時(shí)),后面是合成過(guò)程的相應(yīng)解碼過(guò)程使得有可能在時(shí)域中恢復(fù)信號(hào)。編解碼器通常用于壓縮/解壓縮信息(例如音頻和視頻數(shù)據(jù))以便通過(guò)帶寬受限的通信信道進(jìn)行高效的傳輸。特別地,市場(chǎng)高度需要以低比特率傳輸和存儲(chǔ)音頻信號(hào),同時(shí)保持高的音頻質(zhì)量。例如,在傳輸資源或存儲(chǔ)受限的情況下,低比特率操作是必要的成本因素。例如在移動(dòng)通信系統(tǒng)中的流式傳輸和消息接發(fā)應(yīng)用中通常是這種情況。在圖1中示意性地示出使用音頻編碼和解碼的音頻傳輸系統(tǒng)的一般實(shí)例。整個(gè)系統(tǒng)基本上包括在發(fā)射側(cè)的音頻編碼器IO和發(fā)射模塊(TX)20以及在接收側(cè)的接收模塊(RX)30和音頻解碼器40。音頻信號(hào)可以被認(rèn)為是準(zhǔn)穩(wěn)態(tài)的,即短時(shí)間段的穩(wěn)態(tài)。例如,基于變換的音頻編解碼器將信號(hào)分成短時(shí)間段即幀,并且依賴(lài)于準(zhǔn)穩(wěn)態(tài)性來(lái)實(shí)現(xiàn)高效的壓縮。音頻信號(hào)可以包含在頻譜或振幅中的許多快速變化,即所謂的瞬態(tài)。期望檢測(cè)這些瞬態(tài),以使音頻編解碼器可以采取適當(dāng)?shù)膭?dòng)作來(lái)避免瞬態(tài)可能在例如基于變換的音頻編解碼器中引起的聽(tīng)得到的贗象(artifact)(例如前回聲效應(yīng),即在時(shí)間上的量化噪聲擴(kuò)散)。因?yàn)檫@個(gè)原因,所以結(jié)合音頻編解碼器來(lái)使用瞬態(tài)檢測(cè)器。瞬態(tài)檢測(cè)器分析音頻信號(hào),并且負(fù)責(zé)將所檢測(cè)到的瞬態(tài)用信號(hào)通知給編碼器。存在操作在時(shí)域中的瞬態(tài)檢測(cè)器以及操作在頻域中的瞬態(tài)檢測(cè)器。例如,瞬態(tài)檢測(cè)器通常作為到窗切換模塊的輸入而被包括在音頻編解碼器中[1、2]。
發(fā)明內(nèi)容然而,通常需要更高效的音頻編碼以及用于支持包括瞬態(tài)檢測(cè)器的音頻編碼的改進(jìn)的機(jī)制和實(shí)現(xiàn)方式。4本發(fā)明的一般目的是提供一種對(duì)音頻信號(hào)進(jìn)行操作的改進(jìn)的瞬態(tài)檢測(cè)器。還有一個(gè)目的是提供一種用于支持音頻信號(hào)的編碼的方法。這些和其他目的由所附的專(zhuān)利權(quán)利要求所限定的本發(fā)明來(lái)滿足。本發(fā)明人已認(rèn)識(shí)到,當(dāng)在時(shí)域中執(zhí)行瞬態(tài)檢測(cè)并且編解碼器基于重疊變換來(lái)操作時(shí),給定幀中的瞬態(tài)也將影響后一幀的編碼。因此,本發(fā)明的基本思想是提供一種瞬態(tài)檢測(cè)器,所述瞬態(tài)檢測(cè)器分析輸入音頻信號(hào)的給定幀n以基于給定幀n的音頻信號(hào)特性來(lái)確定后一幀n+l的瞬態(tài)拖尾(hangover)指示符,以及將所確定的瞬態(tài)拖尾指示符用信號(hào)通知給相關(guān)聯(lián)的音頻編碼器以實(shí)現(xiàn)后一幀n+l的適當(dāng)編碼。優(yōu)選地,當(dāng)幀n的音頻信號(hào)特性包括表示瞬態(tài)的特性時(shí),瞬態(tài)檢測(cè)器確定后一幀n+1的指示瞬態(tài)的瞬態(tài)拖尾指示符。實(shí)際上,因此有可能以下面的這種方式來(lái)配置瞬態(tài)檢測(cè)器如果檢測(cè)到瞬態(tài)并且用信號(hào)通知給當(dāng)前幀的編解碼器,則瞬態(tài)檢測(cè)器還將用信號(hào)通知與后一幀有關(guān)的瞬態(tài)拖尾。以這種方式可以確保,當(dāng)編解碼器基于重疊變換進(jìn)行操作時(shí)還對(duì)后一幀采取適當(dāng)?shù)木幋a動(dòng)作。本發(fā)明覆蓋瞬態(tài)檢測(cè)器以及用于支持音頻信號(hào)的編碼的方法這二者。當(dāng)閱讀下面對(duì)本發(fā)明的實(shí)施例的描述時(shí)將會(huì)認(rèn)識(shí)到由本發(fā)明提供的其他優(yōu)點(diǎn)。通過(guò)參考與附圖一起得到的下面的描述,將會(huì)最好地理解本發(fā)明連同其更多的目的和優(yōu)點(diǎn),其中圖1是示出使用了音頻編碼和解碼的音頻傳輸系統(tǒng)的一般實(shí)例的示意性框圖。圖2是示出根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的與音頻編碼器相關(guān)聯(lián)的新穎的瞬態(tài)檢測(cè)器的示意性框圖。圖3A-B是示出在給定輸入幀n中的瞬態(tài)可以如何影響后一幀的編碼的示意圖。圖4是根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的用于支持音頻信號(hào)的編碼的方法的示意性流程圖。圖5是示出可以如何將幀分成塊以用于功率計(jì)算目的的實(shí)例的示意圖。圖6是示出具有高通濾波的瞬態(tài)檢測(cè)器的實(shí)例的示意圖。圖7是示出根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的具有瞬態(tài)拖尾檢查的瞬態(tài)檢測(cè)器的實(shí)例的示意圖。圖8A-B是示出根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的瞬態(tài)的第一實(shí)例以及該瞬態(tài)的位置和/或窗函數(shù)對(duì)于拖尾指示的影響的示意圖。圖9A-B是示出根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的瞬態(tài)的第二實(shí)例以及該瞬態(tài)的位置和/或窗函數(shù)對(duì)于拖尾指示的影響的示意圖。圖10A-B是示出根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的瞬態(tài)的第三實(shí)例以及該瞬態(tài)的位置和/或窗函數(shù)對(duì)于拖尾指示的影響的示意圖。圖11是適合于全帶擴(kuò)展的示例性編碼器的框圖。圖12是適合于全帶擴(kuò)展的示例性解碼器的框圖。具體實(shí)施例方式在全部附圖中,相同的附圖標(biāo)記將被用于相應(yīng)的或類(lèi)似的元素。如先前所提到的那樣,期望檢測(cè)音頻信號(hào)中的瞬態(tài),以使音頻編解碼器可以采取適當(dāng)?shù)膭?dòng)作來(lái)避免瞬態(tài)可能在例如基于變換的音頻編解碼器以及更一般的是基于重疊變換來(lái)進(jìn)行操作的音頻編碼器中引起的聽(tīng)得到的贗象(例如前回聲效應(yīng))。前回聲通常在具有尖銳上升(attack)的信號(hào)開(kāi)始在緊接在低能量區(qū)域后的變換塊的末端附近時(shí)出現(xiàn)。一般來(lái)說(shuō),瞬態(tài)由音頻信號(hào)特性(例如在時(shí)域和/或頻域中測(cè)量的振幅和/或功率)中的突變來(lái)表征。優(yōu)選地,音頻編碼器被配置成在針對(duì)輸入幀檢測(cè)到瞬態(tài)時(shí)執(zhí)行尤其適于瞬態(tài)的基于變換的編碼(瞬態(tài)編碼模式)。存在許多用于編碼瞬態(tài)的不同的常規(guī)策略。然而,本發(fā)明人已認(rèn)識(shí)到,當(dāng)在時(shí)域中執(zhí)行瞬態(tài)檢測(cè)并且編解碼器基于重疊變換來(lái)操作時(shí),給定幀中的瞬態(tài)也將影響后一幀的編碼?;趯?duì)重疊變換編解碼器的操作的這一理解,引入新穎的瞬態(tài)檢測(cè)器。圖2是示出根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的與音頻編碼器相關(guān)聯(lián)的新穎的瞬態(tài)檢測(cè)器的示意性框圖。圖2的瞬態(tài)檢測(cè)器100基本上包括分析器110和信令模塊120。要被相關(guān)聯(lián)的音頻編碼器10編碼的音頻信號(hào)還作為到瞬態(tài)檢測(cè)器100的輸入而被傳送。一般地,瞬態(tài)檢測(cè)器在操作中用來(lái)檢測(cè)音頻信號(hào)的當(dāng)前輸入幀中的瞬態(tài),并且將所述瞬態(tài)用信號(hào)通知給音頻編碼器以用于當(dāng)前幀的適當(dāng)編碼。在該實(shí)例中,音頻編碼器io優(yōu)選地是使用了重疊變換的基于變換的編碼器。分析器110基于所接收的音頻信號(hào)來(lái)執(zhí)行合適的信號(hào)分析。優(yōu)選地,瞬態(tài)檢測(cè)器100分析音頻信號(hào)的給定幀n以基于所述給定幀n的音頻信號(hào)特性來(lái)在分析器110的新穎拖尾指示符模塊中確定后一幀n+l的瞬態(tài)拖尾指示符。信令模塊120在操作中用于將所確定的瞬態(tài)拖尾指示符用信號(hào)通知給相關(guān)聯(lián)的音頻編碼器10以實(shí)現(xiàn)后一幀n+l的適當(dāng)編碼??梢允褂萌魏魏线m的瞬態(tài)檢測(cè)量度,例如短期與長(zhǎng)期的能量比。因此有可能的是,瞬態(tài)檢測(cè)器100不僅用信號(hào)通知當(dāng)前幀n的瞬態(tài),而且還基于對(duì)當(dāng)前幀n的分析來(lái)用信號(hào)通知后一幀n+l的瞬態(tài)拖尾指示符。如在圖3A-B中所示出的那樣,當(dāng)編碼器基于重疊變換來(lái)操作時(shí),給定輸入幀中的瞬態(tài)可能影響后一幀的編碼。例如,基于變換的音頻編碼器通常圍繞時(shí)域到頻域的變換來(lái)建立,所述時(shí)域到頻域的變換例如是DCT(離散余弦變換)、改進(jìn)的離散余弦變換(MDCT)或不同于MDCT的重疊變換?;谧儞Q的音頻編碼器的共同特性是,它們對(duì)重疊采樣塊(即重疊幀)進(jìn)行操作。圖3A-B示出音頻信號(hào)的輸入幀,并且還示出被用作音頻編碼器的輸入的所謂的重疊幀。在圖3A中,示出兩個(gè)連續(xù)的音頻輸入幀幀n-l和幀n。與輸入幀n有關(guān)的基于變換的音頻編碼的輸入由幀n和n-l來(lái)形成。在該實(shí)例中,輸入幀n包括瞬態(tài),并且基于變換的音頻編碼的輸入將自然地包括該瞬態(tài)。在圖3B中,示出兩個(gè)連續(xù)的音頻輸入幀幀n和幀n+l。與輸入幀n+l有關(guān)的基于變換的音頻編碼的輸入由幀n和n+l來(lái)形成。如從圖3B中可以看到的那樣,幀n中的瞬態(tài)還將存在于用于與幀n+l有關(guān)的編碼的變換的輸入中。6應(yīng)該注意,用于編碼幀n的變換的輸入以及用于編碼幀n+l的變換的輸入是重疊的。因此,這是將這些較大的變換輸入塊稱(chēng)作重疊幀的原因。如果在時(shí)域中執(zhí)行瞬態(tài)檢測(cè)并且編解碼器利用重疊變換(例如改進(jìn)的離散余弦變換(MDCT))來(lái)操作,則輸入幀中的瞬態(tài)還將在后一幀中出現(xiàn)。因?yàn)樗矐B(tài)不僅在檢測(cè)到它的幀中被編碼,而且還在后一幀中被編碼,所以建議在瞬態(tài)檢測(cè)器中引入拖尾。拖尾意味著,如果檢測(cè)到瞬態(tài)并且用信號(hào)通知給當(dāng)前幀的編解碼器,則瞬態(tài)檢測(cè)器還應(yīng)該將在后一幀中檢測(cè)到瞬態(tài)用信號(hào)通知給編解碼器。以這種方式可以確保也對(duì)后一幀采取適當(dāng)?shù)木幋a動(dòng)作。當(dāng)將指示瞬態(tài)的拖尾指示符從瞬態(tài)檢測(cè)器100的信令模塊120用信號(hào)通知給音頻編碼器10時(shí),編碼器10執(zhí)行幀n+l的所謂的瞬態(tài)編碼;即使用適于編碼包括瞬態(tài)的重疊幀塊的所謂的瞬態(tài)編碼模式。在所謂的瞬態(tài)編碼模式中的適當(dāng)?shù)木幋a動(dòng)作例如可以是,減小變換的長(zhǎng)度以便以最差的頻率分辨率為代價(jià)來(lái)改進(jìn)時(shí)間分辨率。這例如可以通過(guò)下述操作來(lái)實(shí)現(xiàn)基于重疊幀來(lái)執(zhí)行時(shí)域混疊(TDA)以生成相應(yīng)的時(shí)域混疊幀,并且基于所述時(shí)域混疊幀來(lái)在時(shí)間上執(zhí)行分段以生成至少兩個(gè)段,所述段還被稱(chēng)為子幀?;谶@些段,然后可以執(zhí)行基于變換的頻譜分析以便為每個(gè)段獲得表示該段的頻率內(nèi)容的系數(shù)。應(yīng)該理解,即使瞬態(tài)檢測(cè)器100基于輸入幀n+l的音頻信號(hào)特性沒(méi)有檢測(cè)到瞬態(tài)(參見(jiàn)圖3B),也可以無(wú)論如何基于源自從幀n中檢測(cè)到的瞬態(tài)的拖尾而將瞬態(tài)拖尾指示用信號(hào)通知給音頻編碼器10。這違背了僅依賴(lài)于由瞬態(tài)檢測(cè)器基于所考慮的最近的輸入幀的音頻信號(hào)特性的常規(guī)瞬態(tài)檢測(cè)的現(xiàn)有技術(shù)中的主要趨勢(shì)。利用根據(jù)現(xiàn)有技術(shù)的瞬態(tài)檢測(cè)器,將檢測(cè)不到幀n+l的瞬態(tài)(圖3B),并且因此相關(guān)聯(lián)的音頻編碼器將不使用瞬態(tài)編碼模式,從而導(dǎo)致聽(tīng)得到的贗象(例如令人討厭的前回聲)。參考圖4的示例性示意性流程圖,可以把對(duì)高效音頻編碼的改進(jìn)的支持概括如下在步驟S1中,接收到音頻信號(hào)。在步驟S2中,分析給定幀n以基于所述給定幀n的音頻信號(hào)特性來(lái)確定后一幀n+l的瞬態(tài)拖尾指示符。在步驟S3中,將瞬態(tài)拖尾指示符用信號(hào)通知給相關(guān)聯(lián)的音頻編碼器以便相對(duì)于音頻信號(hào)的后一幀n+l實(shí)現(xiàn)適當(dāng)?shù)木幋a動(dòng)作。如上面所指示的那樣,優(yōu)選地,根據(jù)在正被分析的給定輸入幀n內(nèi)表示瞬態(tài)的音頻信號(hào)特性的存在來(lái)確定瞬態(tài)拖尾指示符的值。拖尾指示符的值可以以許多不同的方式來(lái)表示,所述不同的方式包括True/False、l/0、+l/-1以及許多其他等同的表示。為了更好地理解本發(fā)明,現(xiàn)在將描述信號(hào)分析和檢測(cè)機(jī)制的更詳細(xì)的實(shí)例。按塊的能量計(jì)算作為一個(gè)實(shí)例,瞬態(tài)檢測(cè)器可以基于音頻信號(hào)中的功率的波動(dòng)。例如,要被編碼的音頻幀可以被分成幾個(gè)塊,如在圖5中示出的那樣。在每個(gè)塊i中,計(jì)算短期功率Pst(i)??梢酝ㄟ^(guò)簡(jiǎn)單IIR濾波器來(lái)計(jì)算長(zhǎng)期功率Ph(i),Plt(i)=aPlt(i-l)+(l-a)Pst(i),其中a是遺忘因子。當(dāng)商Pd(i)/Ph(i-l)超過(guò)某一閾值時(shí),瞬態(tài)檢測(cè)器就用信號(hào)通知在塊i中發(fā)現(xiàn)瞬態(tài)。按照能量來(lái)表示;對(duì)于每個(gè)塊,執(zhí)行短期能量E(n)與長(zhǎng)期能量E^(n)之間的比較。每當(dāng)能量比超過(guò)某一閾值時(shí)就可以認(rèn)為瞬態(tài)被檢測(cè)到<formula>formulaseeoriginaldocumentpage8</formula>其中RATIO是可以被設(shè)置為某一合適的值(例如7.8dB)的能量比閾值。這僅是檢測(cè)量度的實(shí)例,并且本發(fā)明不限于此。高通濾波器和零交叉因?yàn)橐纛l幀的塊是短的,所以存在上述瞬態(tài)檢測(cè)器觸發(fā)穩(wěn)態(tài)信號(hào)的風(fēng)險(xiǎn),在這種情況下,低頻正弦函數(shù)的波動(dòng)看成是快速的功率變化。這一問(wèn)題可以通過(guò)在功率計(jì)算之前添加高通濾波器來(lái)避免,如圖6的實(shí)例中所示出的那樣。圖6的瞬態(tài)檢測(cè)器100包括高通濾波器113、塊能量計(jì)算模塊114、長(zhǎng)期平均模塊115以及閾值比較模塊116,以提供用于幀n的IsTransient(是瞬態(tài))指示。高通濾波器113除去低頻,從而導(dǎo)致僅較高頻率的功率計(jì)算。上述問(wèn)題的另一可能解決方案可以是,計(jì)算所分析的塊中的零交叉的數(shù)目。如果零交叉的數(shù)目少,則認(rèn)為信號(hào)僅包含低頻并且瞬態(tài)檢測(cè)器可以決定增加閾值或者將該塊認(rèn)為是無(wú)瞬態(tài)的。圖7是示出根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的具有瞬態(tài)拖尾檢查的瞬態(tài)檢測(cè)器的實(shí)例的示意圖。圖7的瞬態(tài)檢測(cè)器100包括高通濾波器113、塊能量計(jì)算模塊114、長(zhǎng)期平均模塊115、閾值比較模塊116、以及用于檢查瞬態(tài)拖尾的模塊112,以提供用于后一幀n+l的IsTransient拖尾指示。根據(jù)窗函數(shù)和/或位置的瞬態(tài)/拖尾檢測(cè)可選地,瞬態(tài)檢測(cè)器的信號(hào)分析器可以被配置成不僅依賴(lài)于瞬態(tài)的存在而且依賴(lài)于預(yù)定的窗函數(shù)和/或所述瞬態(tài)在正被分析的幀內(nèi)的位置來(lái)確定瞬態(tài)拖尾指示符的值。在音頻編碼器中的變換之前,音頻信號(hào)通常乘以窗函數(shù)。在基于改進(jìn)的離散余弦變換(MDCT)的編解碼器的情況下,窗函數(shù)常常是所謂的正弦窗,但是它也可以是Kaiser-Bessel窗或某一其他窗函數(shù)。窗函數(shù)通常在當(dāng)前幀的開(kāi)始以及前一幀的末端處具有最大值,而在當(dāng)前幀的末端和前一幀的開(kāi)始處接近于零。這意味著,在當(dāng)前幀的末端附近的瞬態(tài)將被窗函數(shù)抑制并且因此用信號(hào)通知給編碼器不大重要。如果瞬態(tài)被充分抑制,則不用信號(hào)通知編碼器檢測(cè)到瞬態(tài)甚至?xí)怯幸娴?。然而,?dāng)下一幀要被編碼時(shí),瞬態(tài)將處于前一幀的末端,即位于窗函數(shù)的最大值附近,并且用信號(hào)通知編碼器檢測(cè)到瞬態(tài)是必要的。所檢測(cè)到的在幀的末端附近的瞬態(tài)應(yīng)該因此導(dǎo)致拖尾被設(shè)置為1(或者等同的表示),而沒(méi)有用信號(hào)通知編碼器檢測(cè)到的瞬態(tài)。這樣,瞬態(tài)檢測(cè)器用信號(hào)通知在后一幀中檢測(cè)到瞬態(tài)。類(lèi)似地,如果在幀的開(kāi)始處檢測(cè)到瞬態(tài),則瞬態(tài)檢測(cè)器應(yīng)該用信號(hào)通知檢測(cè)到瞬態(tài),但是將拖尾設(shè)置為0(或者等同的表示),因?yàn)楫?dāng)下一幀被編碼時(shí)該瞬態(tài)將被窗函數(shù)抑制。位于幀的中心的瞬態(tài)將出現(xiàn)在當(dāng)前幀和后一幀二者中。因此應(yīng)該用信號(hào)通知"檢測(cè)到的瞬態(tài)"并且將拖尾設(shè)置為1。<table>tableseeoriginaldocumentpage9</column></row><table>表1:依賴(lài)于瞬態(tài)的位置的瞬態(tài)檢測(cè)器的判定優(yōu)選地關(guān)于窗函數(shù)來(lái)選擇"幀的開(kāi)始"、"幀的中心"以及"幀的末端"之間的精確邊界。還應(yīng)該理解,表1的1/0表示僅被用作實(shí)例。實(shí)際上,包括True/False和+1/-1的任何合適的表示都可以被用來(lái)指示拖尾/不拖尾。甚至有可能使用非二進(jìn)制表示,例如概率指示。換句話說(shuō),瞬態(tài)檢測(cè)器可以被配置成,如果在基于預(yù)定窗函數(shù)的加窗操作之后在幀n中表示瞬態(tài)的音頻信號(hào)特性是能檢測(cè)的,則確定后一幀n+l的指示瞬態(tài)的瞬態(tài)拖尾指示符。瞬態(tài)檢測(cè)器還可以被配置成,如果在基于窗函數(shù)的加窗操作之后在幀n中表示瞬態(tài)的音頻信號(hào)特性被抑制,則確定后一幀n+l的不指示瞬態(tài)的拖尾指示符。窗函數(shù)通常對(duì)應(yīng)于被用于在相關(guān)聯(lián)的音頻編碼器中對(duì)幀n進(jìn)行變換編碼、但是在時(shí)間上被向前移位了一個(gè)幀的窗函數(shù)(覆蓋至少兩個(gè)幀),如將在下面解釋的那樣。本發(fā)明引入了判定邏輯,其改變初步瞬態(tài)檢測(cè)以便調(diào)整判定來(lái)應(yīng)付重疊幀。這基于依賴(lài)于時(shí)間發(fā)生的某些瞬態(tài)不需要以特殊方式來(lái)處理這一事實(shí)。對(duì)于這樣的情況,本發(fā)明將不考慮初步判定,并且用信號(hào)通知不存在瞬態(tài)。一般來(lái)說(shuō),本發(fā)明將改變初步瞬態(tài)檢測(cè)以基于特定應(yīng)用來(lái)調(diào)整判定。圖8A-B是示出根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的瞬態(tài)的第一實(shí)例以及該瞬態(tài)的位置和/或窗函數(shù)對(duì)于拖尾指示的影響的示意圖。圖8A示出用作變換的輸入的幀n-l和幀n以及在應(yīng)用該變換之前所使用的一個(gè)示例性窗函數(shù)。在幀n(幀的中心)中存在瞬態(tài),并且在使用所選擇的窗函數(shù)的窗操作之后,在該特定實(shí)例中該瞬態(tài)仍是能檢測(cè)的。因此,瞬態(tài)檢測(cè)指示符TD被設(shè)置為值1。為了拖尾指示的目的,幀n被用作分析幀,但是如在圖8B中所示出的那樣,窗函數(shù)被向前移位了一個(gè)幀。在該特定實(shí)例中,在通過(guò)移位的窗函數(shù)進(jìn)行加窗之后幀n中的瞬態(tài)還是能檢測(cè)的,并且因此拖尾指示H0被設(shè)置為值1。圖9A-B是示出根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的瞬態(tài)的第二實(shí)例以及該瞬態(tài)的位置和/或窗函數(shù)對(duì)于拖尾指示的影響的示意圖。在使用所選擇的窗函數(shù)的窗操作之后,在圖9A的實(shí)例中,幀n(幀的開(kāi)始)中的瞬態(tài)是能檢測(cè)的。因此,瞬態(tài)檢測(cè)指示符TD被設(shè)置為值1。在圖9B的實(shí)例中,幀n中的瞬態(tài)被移位的窗函數(shù)抑制,并且因此拖尾指示HO被設(shè)置為值0。圖10A-B是示出根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的瞬態(tài)的第三實(shí)例以及該瞬態(tài)的位置和/或窗函數(shù)對(duì)于拖尾指示的影響的示意圖。在圖10A的實(shí)例中,幀n(幀的末端)中的瞬態(tài)被變換窗函數(shù)抑制,并且因此瞬態(tài)檢測(cè)指示符TD被設(shè)置為O。如在圖10B的實(shí)例中所示出的那樣,在通過(guò)移位的窗函數(shù)進(jìn)行加窗之后幀n中的瞬態(tài)是能檢測(cè)的,并且因此拖尾指示HO被設(shè)置為1。通過(guò)使瞬態(tài)檢測(cè)更進(jìn)一步適于所選擇的窗函數(shù)可以改進(jìn)上述構(gòu)思。在本發(fā)明的一個(gè)示例性實(shí)施例中,在短期能量除以長(zhǎng)期能量并將商與閾值比較之前,可以在當(dāng)前塊處通過(guò)窗函數(shù)來(lái)定標(biāo)短期能量。仍利用短期能量的未定標(biāo)的版本來(lái)更新長(zhǎng)期能量。如果由長(zhǎng)期能量除的所定標(biāo)的短期能量超過(guò)閾值,則瞬態(tài)檢測(cè)器用信號(hào)通知檢測(cè)到瞬態(tài)。類(lèi)似地,在移位了一個(gè)幀長(zhǎng)度的塊的位置(當(dāng)編碼下一幀時(shí)該塊的位置)處通過(guò)窗函數(shù)來(lái)定標(biāo)短期能量。如果由長(zhǎng)期能量除的所定標(biāo)的短期能量超過(guò)閾值,則瞬態(tài)檢測(cè)器將拖尾設(shè)置為l,否則設(shè)置為O。在本發(fā)明的一個(gè)優(yōu)選示例性實(shí)施例中,瞬態(tài)檢測(cè)器包括用于通過(guò)所選擇的窗函數(shù)來(lái)定標(biāo)幀n以產(chǎn)生第一定標(biāo)幀的裝置;用于基于所述第一定標(biāo)幀來(lái)確定幀n的瞬態(tài)指示符的裝置;用于通過(guò)在時(shí)間上向前移位了一個(gè)幀的窗函數(shù)來(lái)定標(biāo)幀n以產(chǎn)生第二定標(biāo)幀的裝置;以及用于基于所述第二定標(biāo)幀來(lái)確定后一幀n+l的瞬態(tài)拖尾指示符的裝置。在下文中,將關(guān)于適合于"ITU-TG.722.lfullbandcodecextension"(現(xiàn)在被重新命名為ITU-TG.719標(biāo)準(zhǔn))的特定示例性且非限制性編解碼器實(shí)現(xiàn)來(lái)描述本發(fā)明。在該特定實(shí)例中,編解碼器被呈現(xiàn)為低復(fù)雜性基于變換的音頻編解碼器,其優(yōu)選地以48kHz的采樣率操作,并且提供范圍從20Hz—直到20kHz的全音頻帶寬。編碼器以20ms的幀處理輸入16比特線性PCM信號(hào),并且編解碼器具有40ms的總延遲。編碼算法優(yōu)選地是基于具有自適應(yīng)時(shí)間分辨率、自適應(yīng)比特分配以及低復(fù)雜性格型矢量量化的變換編碼。另外,解碼器可以通過(guò)信號(hào)自適應(yīng)噪聲填充或帶寬擴(kuò)展來(lái)代替非編碼的頻譜分量。圖11是適合于全帶信號(hào)的示例性編碼器的框圖。通過(guò)瞬態(tài)檢測(cè)器來(lái)處理以48kHz采樣的輸入信號(hào)。根據(jù)對(duì)瞬態(tài)的檢測(cè),對(duì)輸入信號(hào)幀應(yīng)用高頻率分辨率或低頻率分辨率(高時(shí)間分辨率)變換。在穩(wěn)態(tài)幀的情況下,自適應(yīng)變換優(yōu)選地是基于改進(jìn)的離散余弦變換(MDCT)。對(duì)于非穩(wěn)態(tài)幀,使用(基于時(shí)域混疊和時(shí)間分段的)更高時(shí)間分辨率變換,而不需要附加延遲并且在復(fù)雜性方面具有非常小的開(kāi)銷(xiāo)。非穩(wěn)態(tài)幀優(yōu)選地具有等同于5ms幀的時(shí)間分辨率(盡管可以選擇任一任意的分辨率)。在某一個(gè)幀處檢測(cè)到的瞬態(tài)也將觸發(fā)在下一幀處的瞬態(tài)。瞬態(tài)檢測(cè)器的輸出是例如被表示為IsTransient的標(biāo)志。如果檢測(cè)到瞬態(tài),則該標(biāo)記被設(shè)置為值1或邏輯值TRUE或等同的表示,否則(如果沒(méi)有檢測(cè)到瞬態(tài))該標(biāo)志被設(shè)置為值O或邏輯值FALSE或等同的表示。將所獲得的頻譜系數(shù)分組成不等長(zhǎng)度的頻帶會(huì)是有益的。估計(jì)每個(gè)頻帶的范數(shù)(norm),并且所得到的包括所有頻帶的范數(shù)的頻譜包絡(luò)被量化和編碼。然后通過(guò)量化的范數(shù)來(lái)歸一化所述系數(shù)。量化的范數(shù)被進(jìn)一步基于自適應(yīng)頻譜加權(quán)而調(diào)整并且被用作比特分配的輸入。歸一化的頻譜系數(shù)是基于為每個(gè)頻帶分配的比特而量化和編碼的格型矢量。非編碼頻譜系數(shù)的大小被估計(jì)、編碼并且傳輸?shù)浇獯a器。優(yōu)選地,對(duì)編碼的頻譜系數(shù)以及編碼的范數(shù)二者的量化指數(shù)應(yīng)用霍夫曼編碼。10圖12是適合于全帶信號(hào)的示例性解碼器的框圖。用于指示幀配置(即穩(wěn)態(tài)或瞬態(tài))的瞬態(tài)標(biāo)志被首先解碼。頻譜包絡(luò)被解碼,并且在解碼器處使用相同的比特精確的范數(shù)調(diào)整和比特分配算法以便重新計(jì)算比特分配,這對(duì)解碼歸一化的變換系數(shù)的量化指數(shù)來(lái)說(shuō)是必需的。在解量化之后,優(yōu)選地通過(guò)使用根據(jù)所接收的頻譜系數(shù)(具有非零比特分配的頻譜系數(shù))而建立的頻譜填充碼本來(lái)重新生成低頻非編碼的頻譜系數(shù)(分配的零比特)。噪聲級(jí)調(diào)整指數(shù)可以被用來(lái)調(diào)整重新生成的系數(shù)的大小。優(yōu)選地使用帶寬擴(kuò)展來(lái)重新生成高頻非編碼的頻譜系數(shù)。解碼的頻譜系數(shù)和重新生成的頻譜系數(shù)被混合并且產(chǎn)生歸一化的頻譜。應(yīng)用解碼的頻譜包絡(luò),從而產(chǎn)生解碼的全帶頻譜。最后,應(yīng)用逆變換以恢復(fù)時(shí)域解碼信號(hào)。這優(yōu)選地通過(guò)對(duì)于穩(wěn)態(tài)模式應(yīng)用改進(jìn)的離散余弦逆變換(頂DCT)或者對(duì)于瞬態(tài)模式應(yīng)用更高時(shí)間分辨率變換的逆變換來(lái)執(zhí)行。適于全帶擴(kuò)展的算法基于自適應(yīng)變換編碼技術(shù)。它對(duì)輸入和輸出音頻的20ms幀進(jìn)行操作。因?yàn)樽儞Q窗(基本函數(shù)長(zhǎng)度)是40ms并且在連續(xù)輸入幀和輸出幀之間使用50%的重疊,所以有效先行緩沖器大小是20ms。因此,整個(gè)算法延遲是40ms,其是幀大小加上先行大小的和。在使用ITU-TG.719編解碼器中經(jīng)歷的所有其他附加延遲歸因于計(jì)算和/或網(wǎng)絡(luò)傳輸延遲。本發(fā)明的優(yōu)點(diǎn)包括低復(fù)雜性、時(shí)域計(jì)算(沒(méi)有所需的頻譜計(jì)算)以及/或者與基于拖尾值的重疊變換的兼容性。上述實(shí)施例僅作為實(shí)例而給出,并且應(yīng)該理解本發(fā)明不限于此。保留此處所公開(kāi)并且請(qǐng)求保護(hù)的基本潛在原理的進(jìn)一步的修改、變化和改進(jìn)都在本發(fā)明的范圍內(nèi)。參考文獻(xiàn)[1]IS0/IECJTC/SC29/WG11,CD11172-3,〃COD頂GOFMOVINGPICTURESANDASSOCIATEDAUDIOFORDIGITALSTORAGEMEDIAATUPTOABOUT1.5MBIT/s,Part3AUDI0",1993.[2]IS0/IEC13818-7,"MPEG-2AdvancedAudioCoding,AAC",1997.權(quán)利要求一種對(duì)音頻信號(hào)進(jìn)行操作的瞬態(tài)檢測(cè)器,其中所述瞬態(tài)檢測(cè)器包括-用于分析所述音頻信號(hào)的給定幀n以基于所述給定幀n的音頻信號(hào)特性來(lái)確定后一幀n+1的瞬態(tài)拖尾指示符的裝置;以及-用于將所述確定的瞬態(tài)拖尾指示符用信號(hào)通知給相關(guān)聯(lián)的音頻編碼器以實(shí)現(xiàn)所述后一幀n+1的適當(dāng)編碼的裝置。2.根據(jù)權(quán)利要求1所述的瞬態(tài)檢測(cè)器,其中,所述用于分析的裝置被配置成根據(jù)在所述給定幀n中表示瞬態(tài)的音頻信號(hào)特性的存在來(lái)確定所述后一幀n+l的所述瞬態(tài)拖尾指示符的值。3.根據(jù)權(quán)利要求2所述的瞬態(tài)檢測(cè)器,其中,所述用于分析的裝置被配置成,如果所述給定幀n的所述音頻信號(hào)特性包括表示瞬態(tài)的特性,則確定所述后一幀n+l的指示瞬態(tài)的瞬態(tài)拖尾指示符。4.根據(jù)權(quán)利要求2所述的瞬態(tài)檢測(cè)器,其中,所述用于分析的裝置被配置成還根據(jù)預(yù)定的窗函數(shù)來(lái)確定所述后一幀n+l的所述瞬態(tài)拖尾指示符的值。5.根據(jù)權(quán)利要求4所述的瞬態(tài)檢測(cè)器,其中,所述用于分析的裝置被配置成,如果在基于所述窗函數(shù)的加窗操作之后在所述給定幀n中表示瞬態(tài)的音頻信號(hào)特性是能檢測(cè)的,則確定所述后一幀n+l的指示瞬態(tài)的瞬態(tài)拖尾指示符。6.根據(jù)權(quán)利要求4所述的瞬態(tài)檢測(cè)器,其中,所述用于分析的裝置被配置成,如果在基于所述窗函數(shù)的加窗操作之后在所述給定幀n中表示瞬態(tài)的音頻信號(hào)特性被抑制,則確定所述后一幀n+l的不指示瞬態(tài)的拖尾指示符。7.根據(jù)權(quán)利要求4所述的瞬態(tài)檢測(cè)器,其中,所述窗函數(shù)對(duì)應(yīng)于被用于在所述相關(guān)聯(lián)的音頻編碼器中對(duì)所述音頻信號(hào)的幀n進(jìn)行變換編碼、但是在時(shí)間上被向前移位了一個(gè)幀的窗函數(shù)。8.根據(jù)權(quán)利要求7所述的瞬態(tài)檢測(cè)器,其中,所述相關(guān)聯(lián)的音頻編碼器基于重疊變換以及使用了用于對(duì)幀進(jìn)行編碼的至少兩個(gè)幀的相關(guān)聯(lián)的窗函數(shù)來(lái)操作。9.根據(jù)權(quán)利要求4所述的瞬態(tài)檢測(cè)器,其中,所述瞬態(tài)檢測(cè)器包括-用于通過(guò)所述窗函數(shù)來(lái)定標(biāo)所述給定幀n以產(chǎn)生第一定標(biāo)幀的裝置;-用于基于所述第一定標(biāo)幀來(lái)確定所述給定幀n的瞬態(tài)指示符的裝置;-用于通過(guò)在時(shí)間上向前移位一個(gè)幀的所述窗函數(shù)來(lái)定標(biāo)所述給定幀n以產(chǎn)生第二定標(biāo)幀的裝置;以及_用于基于所述第二定標(biāo)幀來(lái)確定所述后一幀n+l的瞬態(tài)拖尾指示符的裝置。10.根據(jù)權(quán)利要求2所述的瞬態(tài)檢測(cè)器,其中,所述用于分析的裝置被配置成還根據(jù)所述瞬態(tài)在所述給定幀n中的位置來(lái)確定所述后一幀n+l的所述瞬態(tài)拖尾指示符的值。11.根據(jù)權(quán)利要求io所述的瞬態(tài)檢測(cè)器,其中,所述用于分析的裝置被配置成,如果所述瞬態(tài)位于所述給定幀n的中心或末端,則確定所述后一幀n+l的指示瞬態(tài)的瞬態(tài)拖尾指示符。12.根據(jù)權(quán)利要求IO所述的瞬態(tài)檢測(cè)器,其中,所述用于分析的裝置被配置成,如果所述瞬態(tài)位于所述給定幀n的開(kāi)始,則確定所述后一幀n+l的不指示瞬態(tài)的瞬態(tài)拖尾指示符。13.根據(jù)在前權(quán)利要求中的任何一項(xiàng)所述的瞬態(tài)檢測(cè)器,其中,所述瞬態(tài)檢測(cè)器打算與使用了重疊變換的基于變換的音頻編碼器一起用于操作。14.根據(jù)權(quán)利要求1所述的瞬態(tài)檢測(cè)器,其中,如果指示瞬態(tài)的瞬態(tài)拖尾指示符被用信號(hào)通知,則所述后一幀n+l的所述適當(dāng)編碼包括瞬態(tài)編碼。15.—種支持音頻信號(hào)的編碼的方法,所述方法包括以下步驟_接收所述音頻信號(hào);_分析所述音頻信號(hào)的給定幀n以基于所述給定幀n的音頻信號(hào)特性來(lái)確定后一幀n+1的瞬態(tài)拖尾指示符;以及-將所述瞬態(tài)拖尾指示符用信號(hào)通知給相關(guān)聯(lián)的音頻編碼器以便相對(duì)于所述音頻信號(hào)的所述后一幀n+l實(shí)現(xiàn)適當(dāng)?shù)木幋a動(dòng)作。16.根據(jù)權(quán)利要求15所述的方法,其中,所述分析步驟包括根據(jù)在所述給定幀n中表示瞬態(tài)的音頻信號(hào)特性的存在來(lái)確定所述后一幀n+1的所述瞬態(tài)拖尾指示符的值的步驟。17.根據(jù)權(quán)利要求16所述的方法,其中,所述分析步驟包括如果所述給定幀n的所述音頻信號(hào)特性包括表示瞬態(tài)的特性則確定所述后一幀n+1的指示瞬態(tài)的瞬態(tài)拖尾指示符的步驟。18.根據(jù)權(quán)利要求16所述的方法,其中,所述分析步驟包括還根據(jù)預(yù)定的窗函數(shù)來(lái)確定所述后一幀n+l的所述瞬態(tài)拖尾指示符的值的步驟。19.根據(jù)權(quán)利要求18所述的方法,其中,所述窗函數(shù)對(duì)應(yīng)于被用于在所述相關(guān)聯(lián)的音頻編碼器中對(duì)所述音頻信號(hào)的幀n進(jìn)行變換編碼、但是在時(shí)間上被向前移位了一個(gè)幀的窗函數(shù)。20.根據(jù)權(quán)利要求16所述的方法,其中,所述分析步驟包括還根據(jù)所述瞬態(tài)在所述給定幀n中的位置來(lái)確定所述后一幀n+l的所述瞬態(tài)拖尾指示符的值的步驟。21.根據(jù)權(quán)利要求15所述的方法,其中,所述用信號(hào)通知所述瞬態(tài)拖尾指示符的步驟使所述音頻編碼器能夠在用信號(hào)通知指示瞬態(tài)的拖尾指示符時(shí)以適于編碼包括瞬態(tài)的幀的編碼模式來(lái)執(zhí)行對(duì)所述后一幀n+l的編碼。22.根據(jù)權(quán)利要求21所述的方法,其中,所述編碼動(dòng)作包括在用信號(hào)通知指示瞬態(tài)的拖尾指示符時(shí)減小變換長(zhǎng)度以改進(jìn)所述變換的時(shí)間分辨率。23.根據(jù)權(quán)利要求15所述的方法,其中,所述音頻編碼器是使用了重疊變換的基于變換的編碼器。全文摘要瞬態(tài)檢測(cè)器(100)分析(110)輸入音頻信號(hào)的給定幀n以基于給定幀n的音頻信號(hào)特性來(lái)確定后一幀n+1的瞬態(tài)拖尾指示符,以及將所述確定的瞬態(tài)拖尾指示符用信號(hào)通知(120)給相關(guān)聯(lián)的音頻編碼器(10)以實(shí)現(xiàn)后一幀n+1的適當(dāng)編碼。文檔編號(hào)G10L19/02GK101790756SQ200880104833公開(kāi)日2010年7月28日申請(qǐng)日期2008年8月25日優(yōu)先權(quán)日2007年8月27日發(fā)明者A·塔萊布,G·尤爾伯格申請(qǐng)人:愛(ài)立信電話股份有限公司