專利名稱:確定估計值的方法和裝置的制作方法
技術領域:
本發(fā)明涉及對包括音頻和/或視頻信息的信號進行編碼的編碼器,更具體而言,本發(fā)明涉及對該信號進行編碼的信息單元的需求的估計。
背景技術:
以下將介紹現(xiàn)有技術的編碼器。要被編碼的音頻信號在輸入端1000被輸入。該音頻信號首先被饋送到定標級1002,其中所謂的AAC放大級被執(zhí)行以確定音頻信號的電平。來自定標的邊信息被輸入到比特流格式器1004,如其通過塊1002和塊1004之間的箭頭所示。被定標的音頻信息然后被輸入到MDCT濾波器組1006。使用AAC編碼器,濾波器組實現(xiàn)具有50%重疊窗口的改進的離散余弦變換,其中窗長度由塊1008確定。
通常來講,塊1008的目的是使用相對短的窗口對瞬變信號加窗,以及使用相對長的窗口對趨于穩(wěn)定的信號加窗。這是為了,對于瞬變信號由于相對短的窗口而達到更高的時間分辨率(以頻率分辨率為代價),而對于趨于穩(wěn)定的信號由于較長的窗口而達到較高的頻率分辨率(以時間分辨率為代價),其中趨向于優(yōu)選為較長的窗口,因為它們會產生更高的編碼增益。在濾波器組1006的輸出端是時間上連續(xù)的頻譜值塊,其根據濾波器組的實現(xiàn)形式而可以是MDCT系數(shù)、傅立葉系數(shù)或子帶信號,其中每個子帶信號具有由濾波器組1006中相應子帶信道所確定的特定受限帶寬,并且每個子帶信號具有特定數(shù)量的子帶采樣值。
接下來例如介紹這種情況,其中濾波器組輸出時間上連續(xù)的MDCT頻譜系數(shù)塊,其通常來說表示在輸入端1000上要被編碼的音頻信號的連續(xù)短時頻譜。MDCT頻譜值塊然后被饋送到TNS處理塊1010(TNS=暫時噪聲成形),在該TNC處理塊中執(zhí)行暫時噪聲成形。TNS技術被用來形成每個變換窗口中量化噪聲的暫時形式。這通過將濾波過程應用到每個信道的頻譜數(shù)據的部分而實現(xiàn)。編碼是基于窗口執(zhí)行的。特別地,執(zhí)行以下步驟,以將TNS工具應用到頻譜數(shù)據的窗口上,即應用到頻譜值塊上。
首先,選擇TNS工具的頻率范圍。合適的選擇在于以濾波器覆蓋直到可能的最高定標因子頻帶的1.5kHz的頻率范圍。應當指出,該頻率范圍依賴于采樣速率,如其在AAC標準(ISO/IEC14496-32001(E))中所規(guī)定的。
隨后,執(zhí)行LPC計算(LPC=線性預測編碼),更準確地說,使用位于所選擇的目標頻率范圍中的頻譜MDCT系數(shù)。對于提高的穩(wěn)定性,從該過程中排除了對應于低于2.5kHz頻率的系數(shù)。普通LPC程序-如其在語音處理中已知的那樣-可以用于LPC計算,例如已知的Levinson-Durbin算法。為噪聲成形濾波器的最大允許階數(shù)執(zhí)行該計算。
作為LPC計算的結果,獲得期望的預測增益PG。此外,還獲得反射系數(shù),或部分自相關系數(shù)(Parcor-Koeffizient)。
如果預測增益沒有超過規(guī)定的閾值,就不采用TNS工具。在該情況中,控制信息被寫入比特流中,這樣解碼器知道沒有執(zhí)行過TNS處理。
但是,如果預測增益超過閾值,就采用TNS處理。
下一步,量化反射系數(shù)。通過從反射系數(shù)陣列的“尾部”除去絕對值小于閾值的所有反射系數(shù),確定所使用的噪聲成形濾波器的階數(shù)。剩余反射系數(shù)的數(shù)量位于噪聲成形濾波器的數(shù)量級。合適的閾值是0.1。
剩余的反射系數(shù)通常被轉換為線性預測系數(shù),其中該技術也被稱為“建立”程序。
所計算的LPC系數(shù)然后被用作編碼器噪聲成形濾波器系數(shù),即作為預測濾波器系數(shù)。該FIR濾波器用于在特定目標頻率范圍中濾波。解碼時使用自回歸濾波器,而在編碼時使用所謂的移動平均濾波器。最后,TNS工具的邊信息被輸入到比特流格式器,如其通過圖3中TNS處理塊1010和比特流格式器1004之中的箭頭所示。
然后,通過多個圖3未示出的可選工具,諸如長時預測工具、強度/耦合工具、預測工具、噪聲替換工具,直到最終到達中/邊編碼器1012。當要被編碼的音頻信號是多聲道信號-即具有左聲道和右聲道的立體聲信號-時,中/邊編碼器1012是活動的。至今為止,即在圖3的塊1012之前的處理方向上,左右立體聲聲道被互相分開地處理,即定標,被濾波器組變換,經過或不經過TNS處理等等。
在中/邊編碼器中,首先驗證中/邊編碼是否有意義,即是否能根本上產生編碼增益。當左右聲道趨于相似時,中/邊編碼將產生編碼增益,因為在這種情況中,中聲道-即左右聲道之和-幾乎等于左聲道或右聲道,除了被因子1/2定標之外,而邊聲道只具有非常小的值,因為其等于左右聲道的差值。因此,可以看出,當左聲道和右聲道幾乎相同時,差就幾乎為0,或者僅僅具有非常小的值,該值可以-希望的也是這樣-在隨后的量化器1014中被量化成0,并從而可以被非常有效地傳送,因為熵編碼器1016連接到量化器1014后面。
心理聲學模型1020在每個定標因子頻帶輸入可允許的干擾到量化器1014。量化器以迭代的方式工作,即首先調用外環(huán)迭代,外環(huán)迭代然后調用內環(huán)迭代。通常來講,從量化器步長啟動值出發(fā),首先執(zhí)行對量化器1014的輸入端上的值塊的量化。特別地,內環(huán)量化MDCT系數(shù),其中消耗特定數(shù)量的比特。外環(huán)使用定標因子計算失真和修改的系數(shù)能量,以便再次調用內環(huán)。該過程被迭代多次,直到滿足特定條件。其中,對于外環(huán)迭代中的每一次迭代,重建信號,以便計算由量化引入的干擾,并且將其與心理聲學模型1020所提供的可允許的干擾相比較。此外,定標因子從一個迭代到另一個迭代、更正確地說,對于外環(huán)迭代的每一次迭代,被放大一級。
當達到這樣的情形-即量化所引入的量化干擾低于心理聲學模型所確定的可允許干擾-時,并且當同時滿足比特要求-即沒有超過最大比特率-時,終止迭代、即分析-綜合方法,并且所獲得的定標因子被編碼、如在塊1014中所執(zhí)行的,并以編碼后的形式被輸入到比特流格式器1004,如在塊1014和塊1004之間所示的箭頭所示。量化后的值然后被輸入到熵編碼器1016,熵編碼器1016通常使用多個霍夫曼(Huffman)編碼表格為各個定標因子頻帶執(zhí)行熵編碼,以便將量化后的值變換成二進制格式。如已知的,在霍夫曼編碼形式的熵編碼中利用基于期望的信號統(tǒng)計學而建立的編碼表格,并且其中經常出現(xiàn)的值與較少出現(xiàn)的值相比較獲得更短的碼字。然后,熵編碼后的值被作為實際的主信息輸入到比特流格式器1004,比特流格式器1004然后根據特定比特流語法在輸出側輸出編碼音頻信號。
至今為止,音頻信號的數(shù)據縮減是已知的技術,其是一系列國際標準(例如ISO/MPEG-1,MPEG-2AAC,MPEG-4)的主題。
上述方法的共同點在于,輸入信號通過利用與感知相關的效應(心理聲學、心理光學)的所謂的編碼器被轉換成緊密的、數(shù)據縮減的表示。為此,通常在考慮感知模型的情況下執(zhí)行信號的頻譜分析并且量化相應的信號分量,然后以盡可能緊密的方式將其編碼成為所謂的比特流。
為了在實際量化之前估計信號的要被編碼的特定部分需要多少比特,可以使用所謂的感知熵(PE)。PE還提供關于對于編碼器而言對特定信號或其部分進行編碼有多困難的量度。
PE與實際需要的比特數(shù)量的偏離對于估計質量至關重要。
此外,感知熵或對于信息單元的需要的每個估計值可以被用于編碼信號,以估計信號是瞬變的還是穩(wěn)態(tài)的,因為瞬變信號比更為穩(wěn)定的信號需要更多比特來編碼。信號的瞬變特性的估計例如被用來執(zhí)行窗口長度確定,如圖3中塊1008所示。
在圖6中,感知熵被示為根據ISO/IEC IS13818-7(MPEG-2高級音頻編碼(AAC))計算。圖6中所示的等式被用來計算該感知熵,即頻帶方式的感知熵。在該等式中,參數(shù)pe表示感知熵。此外,width(b)表示相應頻帶b中的頻譜系數(shù)的數(shù)量。此外,e(b)是該頻帶中的信號能量。最后,nb(b)是與其匹配的掩蔽閾值,或者更通常來講,其是例如通過量化可以引入到信號中的可允許的干擾,這樣,人類收聽者仍然聽不到干擾或者只能聽到極小的干擾。
這些頻帶可以產生自心理聲學模型(圖3中的塊1020)的頻帶分割,或者涉及在量化中所使用的所謂定標因子頻帶(scfb)。心理聲學掩蔽閾值是量化誤差不應當超過的能量值。
圖6所示的圖解從而顯示了,這樣確定的感知熵如何好地用作對編碼所需比特數(shù)量的估計。為此,在對于每個單獨塊有不同比特率的AAC編碼器的例子中,根據所消耗的比特畫出相應感知熵。所使用的測試段包含音樂、語音和獨立樂器的典型混合。
理想地,點將沿著通過零點的直線聚集。點系列的具有與理想線的偏離的擴張說明了不精確的估計。
因此,圖6中所示概念的缺點在于偏離,其表示例如產生用于感知熵的太高的值,其反過來意味著,其通知量化器,需要比本來必需的更多比特。這導致了這樣的事實,即量化器量化的太精確,其沒有充分利用對于可允許干擾的量度,這導致縮減的編碼增益。另一方面,如果感知熵的值被確定得太小,則它通知量化器,需要比本來必需的更少的比特來編碼信號。這又導致這樣的事實,即量化器量化的太粗糙,這將直接導致信號中聽得見的干擾,只要不采取反措施。反措施可以是量化器還需要一個或多個另外的迭代環(huán),這可能增加編碼器的計算時間。
為了改善感知熵的計算,常數(shù)項、例如1.5可以被引入到對數(shù)表達式中,如圖7所示。于是,獲得更好的結果,即向上或向下更小的偏離,雖然仍然可以看到,當考慮對數(shù)表達式中的常數(shù)項時減少了這樣的情況,即感知熵表示對比特的太樂觀的需求。然而,另一方面,可以清楚地從圖7中看出,顯著表示了比特數(shù)量太大,這導致了這樣的事實,即量化器將始終太精確地量化,即,采用比本來更大的比特需求,這又導致減小的編碼增益。對數(shù)表達式中的常數(shù)是對于邊信息需要的比特的粗糙估計。
因此,將一個項插入對數(shù)表達式中實際上提供了頻帶方式感知熵的改善,如圖6所示,因為具有能量和掩蔽閾值之間非常小間距的頻帶被更容易考慮,因為即使對于傳送被量化為0的頻譜系數(shù)也需要一定數(shù)量的比特。
圖8中示出了感知熵的計算時間很長的另一計算。在圖8中,示出了這樣的情況,其中以線方式計算感知熵。然而,缺點就是線方式計算的計算花費較高。這里,不使用能量,而使用頻譜系數(shù)X(k),其中koffset(b)表示頻帶b的第一索引。當將圖8和圖7相比較時,在2000到3000比特之間的范圍內可以清楚地看到向上“偏移”的減小。因此,PE估計將更精確,即不是太悲觀地估計,而是樂觀地估計,使得與圖6和7所示的計算方法相比,編碼增益會提高,或量化器中的迭代數(shù)量減小。
然而,線方式計算感知熵的缺點在于評估圖8所示等式所需要的計算時間。
因此,如果編碼器運行在功能強大的PC或功能強大的工作站,則這種計算時間缺點就不算什么。但是,如果在便攜式設備-諸如UMTS蜂窩電話-中提供編碼器,則情況完全不同,這些便攜式設備一方面必須小和便宜,另一方面必須具有低電流需求,并且還必須快速工作,以便能夠對經由UMTS連接所傳送的音頻信號或視頻信號進行編碼。
發(fā)明內容
本發(fā)明的目的在于提供一種有效的并且精確的概念用于確定對用于編碼信號的信息單元的需求的估計。
通過權利要求1的裝置、權利要求12的方法或者權利要求13的計算機程序來實現(xiàn)該目的。
本發(fā)明基于這樣的認識出于計算時間的原因,必須堅持對信息單元的需求的估計值的頻帶方式的計算,但是為了獲得估計值的精確確定,必須考慮在要以頻帶方式計算的頻帶內的能量分布。
由此,量化器后面的熵編碼器被暗含地“引入”對信息單元需求的估計值的確定中。熵編碼使得對較小頻譜值傳輸需求的比特量少于用于較大頻譜值的傳輸?shù)谋忍亓俊l鼐幋a器在被量化為0的頻譜值可以被傳送時尤其有效。因為這通常經常發(fā)生,所以用于傳送被量化為0的頻譜線的碼字是最短的碼字,而用于傳送越大量化頻譜線的碼字就越長。此外,對于用于傳送被量化為0的頻譜值序列的尤為有效的概念,甚至可以使用行程編碼,這產生了這樣的結果,即在每個被量化為0的頻譜值的零運行的情況下,從平均上看,實質不需要一個比特。
已經發(fā)現(xiàn),如果頻帶中的能量分布偏離完全均勻的分布,則在現(xiàn)有技術中所使用的用于確定信息單元需求的估計值的頻帶方式的感知熵計算完全忽略了后面所接的熵編碼器的操作模式。
因此,根據本發(fā)明,為了減小頻帶方式計算的不精確性,考慮能量在頻帶內如何分布。
根據實施方式,可以基于實際振幅確定、或通過估計不被量化器量化為0的頻譜線而確定頻帶中能量分布的量度。該量度-其也被稱為“n1”,其中n1表示“有效線的數(shù)量”-出于計算時間效率的原因而是優(yōu)選的。然而,也可以考慮被量化為0的頻譜線的數(shù)量或更精細的劃分,其中考慮后面所接的熵編碼器的信息越多,該估計就越精確。如果基于霍夫曼碼表建立熵編碼器,則這些碼表的特性可以被非常好地集成,因為碼表不是基于信號統(tǒng)計學而在線計算的,但是因為碼表是獨立于實際信號而固定的。
但是,根據計算時間限制,在一種特別有效的計算的情況下,對于頻帶中能量分布的量度是通過確定在量化之后仍然存在的線-即有效線的數(shù)量-而執(zhí)行的。
本發(fā)明的優(yōu)點在于,確定對信息內容的需要的估計值,其比現(xiàn)有技術中更精確又更有效率。
此外,本發(fā)明可定標于各種應用,因為根據期望的估計值精確性,熵編碼器的更多特性可以被用于比特需求的估計,但是以提高的計算時間為代價。
以下將參考附圖來更詳細描述本發(fā)明的優(yōu)選實施例,其中圖1是根據本發(fā)明用于確定估計值的裝置的電路框圖;圖2是用于計算頻帶中能量分布的量度的設備的優(yōu)選實施例;圖2b是用于計算對比特的需求的估計值的設備的優(yōu)選實施例。
圖3是已知音頻編碼器的電路框圖;圖4是用于解釋頻帶中能量分布對確定估計值的影響的原理圖;圖5是根據本發(fā)明的估計值計算的框圖;圖6是根據ISO/IEC IS 13818-7(AAC)的估計值計算的框圖;圖7是用于具有常數(shù)項的估計值計算的框圖;圖8是用于具有常數(shù)項的線方式估計值計算的框圖。
具體實施例方式
接下來,參考圖1說明根據本發(fā)明的用于確定用于編碼信號的信息單元需求的估計值的裝置??梢允且纛l和/或視頻信號的信號經由輸入端100被輸入。優(yōu)選地,信號已經作為具有頻譜值的頻譜表示存在。但這并不是絕對必須的,因為通過相應的例如帶通濾波也可以執(zhí)行一些具有時間信號的計算。
信號被輸入到用于提供用于信號的頻帶的可允許干擾的量度的設備102??稍试S的干擾例如可以借助于心理聲學模型確定,如已經基于圖3(塊1020)所述。設備102還可用于也提供用于頻帶中的信號能量的量度。對頻帶方式計算的前提是,對其說明可允許干擾或信號能量的頻帶包含信號頻譜表示的至少2條或更多頻譜線。在典型的標準化音頻編碼器中,頻帶優(yōu)選地是定標因子頻帶,因為比特需求估計直接被量化器需要,以便確定發(fā)生的量化是否滿足比特標準。
設備102被構造以將頻帶中信號的可允許的干擾nb(b)以及信號能量e(b)饋送給用于計算比特需求的估計值的設備104。
根據本發(fā)明,用于計算比特需求的估計值的設備104被構造,以便除了可允許的干擾和信號能量之外還考慮頻帶中能量分布的量度nl(b),其中在頻帶中的能量分布偏離完全均勻的分布。對能量分布的量度在設備106中被計算,其中設備106需要至少一個頻帶,即音頻或視頻信號的被觀察頻帶作為帶通信號或者直接作為頻譜線的序列,以便能夠執(zhí)行例如頻帶的頻譜分析,從而獲得頻帶中能量分布的量度。
當然,音頻或視頻信號可以作為時間信號被輸入到設備106,其中設備106然后執(zhí)行頻帶濾波或頻帶中的分析??蛇x地,輸入到設備106的音頻或視頻信號可以已經在頻域中存在,例如作為MDCT系數(shù),或者作為在具有比MDCT濾波器組更少數(shù)量的通帶濾波器的濾波器組中的頻帶信號。
在一個優(yōu)選實施例中,用于計算的設備106被構造,以考慮頻帶中頻譜值的當前數(shù)值來計算估計值。
此外,用于計算能量分布的量度的設備可以被構造以確定一定數(shù)量的頻譜值作為能量分布的量度,其中這些頻譜值的數(shù)值大于或等于預定數(shù)值閾值,或者這些頻譜值的數(shù)值小于或等于該數(shù)值閾值,其中該數(shù)值閾值優(yōu)選地是估計的量化器級,其中該估計的量化器級在量化器中使得小于或等于該量化器級的值被量化為0。在該情況中,用于能量的量度是有效線的數(shù)量,即在量化之后依然存在的或者不等于0的線的數(shù)量。
圖2a顯示了用于計算用于頻帶中能量分布的量度的設備106的一個優(yōu)選實施例。在圖2a中,用于頻帶中能量分布的量度被表示為nl(b)。形狀因子ffac(b)已經是用于頻帶中能量分布的量度。如從塊106中可以看出的那樣,通過與信號能量e(b)除以頻帶寬度width(b)的4次方根或定標因子頻帶b中的線的數(shù)量加權,根據形狀因子ffac(b)確定用于頻譜分布的量度nl。在該情況中,應當指出,形狀因子還是表示能量分布量度的量的例子,而相反,nl(b)是表示用于與量化相關的線的數(shù)量的估計值的量的例子。
通過頻譜線的求絕對值以及隨后該頻譜線的求根以及隨后對頻帶中的頻譜線的“開方”數(shù)值加和來計算形狀因子ffac(b)。
圖2b顯示了用于計算估計值pe的設備104的一個優(yōu)選實施例,其中情況區(qū)別也被引入到圖2b中,即當能量與可允許干擾之比的底為2的對數(shù)大于常數(shù)因子c1或等于該常數(shù)因子時。在該情況中,取塊104中上面的方案,即頻譜分布的量度n1乘以對數(shù)表達式。
相反,如果確定信號能量與可允許干擾之比的底為2的對數(shù)小于值c1,則使用圖2b的塊104中下面的方案,其附加地還包括附加的常數(shù)c2和由常數(shù)c2和c1所計算的乘法常數(shù)c3。
接下來,借助于圖4a和圖4b,展示本發(fā)明的概念。圖4a顯示了頻帶,其中存在4條頻譜線,它們大小相同。因此,在該頻帶中的能量在頻帶上均勻分布。相反,圖4b顯示了這樣的情形,其中在頻帶中的能量駐留在一條頻譜線中,而其他3條頻譜線等于0。圖4b中所示的頻帶例如可以存在于量化之前,或者可以在量化之后獲得,如果圖4b中被設置為0的頻譜線在量化之前小于第一量化器級,并因此被量化器設置為0,即不“繼續(xù)存在”。
因此,圖4b中有效線的數(shù)量等于1,其中圖4b中的參數(shù)nl被計算成2的平方根。相反,圖4a中的值nl、即能量頻譜分布的量度被計算為4。這表示,如果頻譜能量的分布的量度更大,則能量的頻譜分布更加均勻。
應當指出,根據現(xiàn)有技術的感知熵的頻帶方式計算不確定這兩種情況之間的差別。特別地,如果在圖4a和4b中所示的兩個頻帶中存在相同的能量,就確定沒有差別。
但是,圖4b中所示的情況顯然可以由僅僅一條相關線以更少比特編碼,因為被設置為0的3條譜線可以非常有效地被傳送。通常,圖4b中所示情況的更簡單的可量化性基于這樣的事實,即在量化和無損編碼之后,更小的值、尤其是被量化為0的值需要更少的比特來傳送。
因此,根據本發(fā)明,考慮能量在頻帶中如何分布。如上所實現(xiàn)的那樣,這是通過將已知等式(圖6)中每個頻帶的線的數(shù)量替換成在量化之后不等于0的線的數(shù)量的估計來實現(xiàn)的。該估計在圖2a中示出。
此外,應當指出,圖2a中所示的形狀因子在編碼器的其他地方也被需要,例如在用于確定量化步長的量化塊1014中。當形狀因子已經在其他地方被計算時,對于比特估計就不必重新計算它,使得根據本發(fā)明的用于更好估計用于所需比特的量度的概念以最小的附加計算開銷實現(xiàn)。
如上所實現(xiàn)的那樣,X(k)是后來要被量化的譜系數(shù),而變量koffset(b)表示頻帶b中的第一索引。
如從圖4a和4b中看出的那樣,圖4a中的頻譜得到值nl=4,而圖4b中的頻譜得到值1.41。因此,借助于形狀因子,可以提供用于頻帶內頻譜場結構的特性的量度。
因此,改善的頻帶方式感知熵的計算的新公式是基于能量的頻譜分布的量度與對數(shù)表達式的乘積,該表達式中信號能量e(b)在分子上,可允許的干擾在分母上,其中根據需要,可以在對數(shù)中插入項,如圖7所示。該項例如同樣可以是1.5,但是也可以等于0,如圖2b中所示的情況,其中這例如可以根據經驗確定。
此時,應當再一次在圖5中表明,其中表示根據本發(fā)明所計算的感知熵,更準確地說相對于所需要的比特而畫出。顯然可以看出相對于圖6、7和8中的比較例子更高的精確度。根據本發(fā)明的改進的頻帶方式計算也相對于線方式計算一樣好。
根據情況,根據本發(fā)明的方法可以以硬件或軟件實現(xiàn)。可以在數(shù)字存儲介質、尤其是具有能夠和可編程計算機系統(tǒng)協(xié)同工作以執(zhí)行該方法的可電子讀取的控制信號的磁盤或CD上實現(xiàn)。通常,本發(fā)明因此還包括具有存儲在機器可讀載體上的程序代碼的計算機程序產品,其中當計算機程序產品在計算機上運行時,該程序代碼用來執(zhí)行根據本發(fā)明的方法。換句話說,本發(fā)明還可以被實現(xiàn)為具有程序代碼的計算機程序,其中當在計算機上運行計算機程序時,該程序代碼用來執(zhí)行該方法。
權利要求
1.一種用于確定對用于對包括音頻或視頻信息的信號進行編碼的信息單元的需求的估計值的裝置,其中所述信號包括多個頻帶,所述裝置包括設備(102),用于提供用于所述信號的頻帶的可允許干擾的量度和用于所述頻帶中的信號能量的量度,其中所述頻帶包括所述信號的譜表示的至少兩個頻譜值;設備(106),用于計算用于所述頻帶中的能量分布的量度,其中所述頻帶中的能量分布偏離完全均勻分布;以及設備(104),用于使用所述用于干擾的量度、用于能量的量度以及用于能量分布的量度來計算所述估計值。
2.如權利要求1所述的裝置,其中所述用于計算的設備(106)被構造,以考慮所述頻帶中頻譜值的數(shù)值用于計算所述用于能量分布的量度。
3.如權利要求1或2所述的裝置,其中所述用于計算用于能量分布的量度的設備(106)被構造,以確定一定量的頻譜值作為所述用于能量分布的量度,其中所述頻譜值的數(shù)值大于或等于預定數(shù)值閾值,或者所述頻譜值的數(shù)值小于或等于所述數(shù)值閾值。
4.如權利要求3所述的裝置,其中所述數(shù)值閾值是精確的或估計的量化器級,其中所述量化器級在量化器中使得小于或等于所述量化器級的值被量化為0。
5.如之前任何一個權利要求所述的裝置,其中所述用于計算的設備(106)被構造以根據以下等式計算形狀因子ffac(b)=Σk=kOffset(b)kOffset(b+1)-1|X(k)|,]]>其中X(k)是頻譜索引k的頻譜值,koffset是頻帶b中的第一頻譜值,ffac(b)是形狀因子。
6.如之前任何一個權利要求所述的裝置,其中所述用于計算的設備(106)被構造以考慮所述頻帶中的能量和所述頻帶的寬度之間的比的四次方根或所述頻帶內頻譜值的數(shù)量。
7.如之前任何一個權利要求所述的裝置,其中所述用于計算的設備(106)被構造以根據以下等式計算所述用于能量分布的量度nl(b)=ffac(b)(e(b)width(b))02S]]>ffac(b)=ΣK=Koffset(b)kOffset(b+1)-1|X(k)|]]>其中X(k)是頻譜索引k的頻譜值,koffset是頻帶b中的第一頻譜值,ffac(b)是形狀因子,nl(b)表示所述頻帶b中的能量分布的量度,e(b)是所述頻帶b中的信號能量,width(b)是所述頻帶的寬度。
8.如之前任何一個權利要求所述的裝置,其中所述用于計算估計值的設備(104)被構造以使用所述頻帶中的能量和所述頻帶中的干擾的商。
9.如之前任何一個權利要求所述的裝置,其中所述用于計算估計值的設備(104)被構造以通過使用以下表達式來計算所述估計值pe=Σbnl(b).log2(e(b)nb(b)+s)]]>其中pe是所述估計值,nl(b)表示在所述頻帶b中的能量分布的量度,e(b)是所述頻帶b中的信號能量,nb(b)是所述頻帶b中可允許的干擾,s是優(yōu)選地等于1.5的附加項。
10.如之前任何一個權利要求所述的裝置,其中所述用于計算估計值的設備(104)被構造以根據以下等式計算所述估計值pe=Σbnl(b)·log2(e(b)nb(b)+s)]]>其中nl(b)=ffac(b)(e(b)width(b))0.25,]]>并且ffac(b)=Σk=kOffset(b)kOffset(b-1)-1|X(k)|]]>其中pe是所述估計值,nl(b)表示所述頻帶b中的能量分布的量度,e(b)是所述頻帶b中的信號能量,nb(b)是所述頻帶b中可允許的干擾,s是優(yōu)選地等于1.5的附加項,X(k)是在頻譜索引k處的頻譜值,koffset是所述頻帶b中的第一頻譜值,ffac(b)是形狀因子,width(b)是所述頻帶的寬度。
11.如之前任何一個權利要求所述的裝置,其中所述信號作為具有頻譜值的頻譜表示被給出。
12.一種用于確定對用于對包括音頻或視頻信息的信號進行編碼的信息單元的需求的估計值的方法,其中所述信號包括多個頻帶,所述方法包括以下步驟提供(102)用于所述信號的頻帶的可允許干擾的量度和所述頻帶中的信號能量的量度,其中所述頻帶包括所述信號的譜表示的至少兩個頻譜值;計算(106)所述頻帶中的能量分布的量度,其中所述頻帶中的能量分布偏離完全均勻分布;以及使用所述用于干擾的量度、用于能量的量度和用于能量分布的量度來計算(104)所述估計值。
13.一種具有程序代碼的計算機程序,其中當在計算機上運行所述程序時用于執(zhí)行如權利要求12所述的用于確定對用于對信號進行編碼的信息單元的需求的估計值的方法。
全文摘要
為了確定對用于對信號進行編碼的信息單元的需求的估計值,除了用于頻帶的可允許的干擾以及頻帶的能量之外,還考慮頻帶中能量分布的量度(nl(b))。通過這個方法,獲得對信息單元的需求的更好估計值,使得能夠更有效地并且更精確地進行編碼。
文檔編號G10L19/025GK1938758SQ200580006799
公開日2007年3月28日 申請日期2005年2月17日 優(yōu)先權日2004年3月1日
發(fā)明者邁克爾·斯古格, 約翰尼斯·希爾皮爾特, 斯蒂芬·格耶爾斯博爾格爾, 麥克斯·紐恩朵夫 申請人:弗蘭霍菲爾運輸應用研究公司