專利名稱:用于視頻編碼的失真量化器模型的制作方法
背景技術(shù):
方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)字通信系統(tǒng),特別的涉及一種用于作為量化參數(shù)的函數(shù)模擬失真的系統(tǒng)和方法。
2、相關(guān)技術(shù)隨著個人計(jì)算機(jī)和INTERNET的出現(xiàn),對數(shù)字?jǐn)?shù)據(jù)的傳輸產(chǎn)生了巨大的需求,特別是數(shù)字視頻數(shù)據(jù)。然而,基于低容量通信信道,例如基于電話線,傳輸視頻數(shù)據(jù)的能力正面臨一個挑戰(zhàn)。
為了達(dá)到該目的,開發(fā)一種系統(tǒng),其中視頻信號的編碼表示分裂成可以獨(dú)立操作的視頻元素或目標(biāo)。例如MPEG-4是由使用一系列視頻目標(biāo)的運(yùn)動圖像專家組(MPEG)開發(fā)的一種壓縮標(biāo)準(zhǔn)。使用該技術(shù)不同的比特速率可被分配給不同的可視目標(biāo)。因此,與不重要的數(shù)據(jù)(例如背景特征)相比,較為重要的數(shù)據(jù)(例如,正面特征)可被編碼并且在較高比特速率上傳輸,因此具有較低失真。
因?yàn)閹挿浅氋F,一個重要的挑戰(zhàn)是有效的選擇比特速率,該速率滿足每個可視目標(biāo)的失真要求。理想的,被選擇的比特速率不高于必須確保用于可視目標(biāo)的失真不超過選擇的門限。不幸的是,因?yàn)樵谶@個編碼方案中可引入的參數(shù)的數(shù)目,預(yù)測相應(yīng)的比特速率的失真度是個復(fù)雜的問題。因此,選擇用于可視目標(biāo)的比特速率的過程依然是個挑戰(zhàn)。
在1999年12月第9卷第8號,用于視頻技術(shù)的電路和系統(tǒng)的IEEE學(xué)報里,Ronda等所著的題為“用于MPEG-4的速率控制和比特分配”的文章中提示了一種解決方案,該文章作為參考(在下文中的“Ronda”)。在Ronda中,提示了一種模型,其中失真D被定義為D(q)=a1q2+a2q+a3+N(0,σ2),
其中q是量化參數(shù),N是高斯分布,a1,a2,a3是失真模型參數(shù)(在MPEG-4系統(tǒng)中比特速率是q的函數(shù))。然而,與該模型相關(guān)的一個問題是它提供一個多項(xiàng)式平均值和恒定方差的高斯分布。因此,不考慮q的值,它采取一個恒定方差高斯分布,其中q的值通常是有誤差的,尤其是在低比特速率的情況中。
因此,需要存在這樣一個系統(tǒng),它可以在編碼系統(tǒng)中更精確地模擬失真。
發(fā)明概述本發(fā)明通過提供一種失真模型克服了上述問題,其中失真D(q)作為具有通用高斯分布的隨機(jī)變量計(jì)算,其中通用高斯分布是量化參數(shù)q的函數(shù)。
在第一個方面里,本發(fā)明提供一種用于確定滿足預(yù)先確定的質(zhì)量水平的量化參數(shù)q的方法,包括下列步驟提供一個失真模型D(q)=N(a1q2+a2q+a3,b1q2+b2q+b3),其中N是高斯分布,a1,a2,a3,b1,b2和b3是失真模型參數(shù);選擇一個目標(biāo)失真度;計(jì)算量化參數(shù)q,以便失真模型D(q)的上限小于等于目標(biāo)失真度。
在第二方面里,本發(fā)明提供一個質(zhì)量水平選擇能力的編碼系統(tǒng),包括一個用于選擇目標(biāo)失真度的系統(tǒng);一個失真模型,其中該失真模型作為量化參數(shù)的函數(shù)確定失真度,并且其中失真模型包括具有一個方差的高斯分布,該方差是量化參數(shù)的函數(shù);用于計(jì)算量化參數(shù)的系統(tǒng),因此失真度不會超過目標(biāo)失真度。
在第三方面里,本發(fā)明提供一個允許選擇失真度的視頻編碼器,包括一個用于選擇目標(biāo)失真度的選擇系統(tǒng);一個用于確定量化參數(shù)以便于確保與選擇的目標(biāo)失真度一致的系統(tǒng),其中該系統(tǒng)包括用于計(jì)算失真的一個算法,該失真使用具有量化參數(shù)的函數(shù)的方差的高斯分布。
在第四方面里,本發(fā)明提供一個存儲在可記錄媒體上的程序產(chǎn)品,當(dāng)該程序執(zhí)行時允許在編碼操作中選擇失真度,包括選擇目標(biāo)失真度的選擇系統(tǒng);用于確定量化參數(shù)以確保與選擇的目標(biāo)失真度一致的系統(tǒng),其中該系統(tǒng)包括用于計(jì)算失真的一個算法,該失真使用具有量化參數(shù)的函數(shù)的方差的高斯分布。
附圖簡要說明本發(fā)明的首選實(shí)施例將參考附圖在下文描述,其中相同符號表示相同元件附
圖1描述按照本發(fā)明一個優(yōu)選實(shí)施例的失真模型曲線附圖2描述按照本發(fā)明一個優(yōu)選實(shí)施例的具有質(zhì)量選擇系統(tǒng)的編碼系統(tǒng)發(fā)明的詳細(xì)描述綜述本發(fā)明提供一個選擇質(zhì)量通訊系統(tǒng),該系統(tǒng)允許用戶和/或系統(tǒng)選擇一個質(zhì)量水平(也就是失真)用于被傳輸?shù)臄?shù)據(jù)目標(biāo)。按照通信理論,通信信道特征在于具有在比特速率上的上限容量,該比特率可由具有可忽略的誤差速率調(diào)整。為了在有效的比特速率中傳輸壓縮的數(shù)據(jù)必須放棄某些信息,因此引起信號中的失真。通常,隨著比特速率的增加,失真減少,反之亦然。如同在速率原理中示例的一樣。因此,在比特速率和失真之間定義一個對應(yīng)允許更有效的使用通信信道,尤其是在例如電話線的低容量信道中。
比特速率R和失真D都是量化參數(shù)q的函數(shù)。在MPEG系統(tǒng)中,q可以從全部數(shù)目1,2,...,Q中選擇。調(diào)整q可以改變量化水平以及在比特流中DCT(離散余弦變換)數(shù)據(jù)塊的比特?cái)?shù)據(jù)速率。因此,因?yàn)槭д鍰是q的函數(shù),比特速率可以作為失真函數(shù)計(jì)算。然而,為了連接比特速率和失真,必須首先精確定義失真D和量化參數(shù)q之間的關(guān)系。本發(fā)明以下面描述的失真模型連接它們兩個。
失真模型按照當(dāng)前實(shí)施例,失真作為具有通用高斯分布的隨機(jī)變量被模擬,其中通用高斯分布是q的函數(shù),由下面通用定義給出D(q)=N(m(q),σ2(q)),其中N是高斯分布,m(q)是平均值,δ2(q)是方差。在優(yōu)選實(shí)施例中,平均值和方差是量化參數(shù)q的二階多項(xiàng)式函數(shù),定義為
m(q)=a1q2+a2q+a3,σ2(q)=b1q2+b2q+b3,其中a1,a2,a3,b1,b2和b3是例如可以通過公知的最大似然估計(jì)解決的失真模型參數(shù)。因此,D(q)=N(a1q2+a2q+a3,b1q2+b2q+b3)。該等式更精確的模擬了失真的行為,尤其是在大量化水平(也就是說小比特速率)的情況中。
顯示該模型的一個示例性的曲線10在附圖1中描述。如同所見的,曲線10包括一個取決于q的方差δ2(q)。特別的,由于q由1增加到Q,方差δ2(q)(也就是說可能的失真值的范圍)也在增加。這可以和Ronda(上述的)對照,Ronda提示了一個恒定方差。對于給定q,失真值的范圍包括一個上限,一個平均值m(q)14,以及一個下限16。上限12可以定義為Dupper(q)=a1q2+a2q+a3+λ*sqrt(b1q2+b2q+b3),其中λ是置信度常數(shù)(也就是3σ)。
選擇質(zhì)量因?yàn)榘凑毡景l(fā)明的失真模型精確定義為曲線16,可能選擇一個目標(biāo)質(zhì)量水平20,然后確定一個量化參數(shù)q確保與目標(biāo)質(zhì)量水平一致。例如,如附圖1中所示,目標(biāo)質(zhì)量水平20與曲線10的上限在點(diǎn)18相交,并與平均值m(q)14在點(diǎn)19相交。因此,對于目標(biāo)質(zhì)量水平20已知選擇量化參數(shù)值q1’將確保失真不超過曲線10的上限12。因此,可能選擇一個目標(biāo)質(zhì)量20并且確定一個值q,該值可確保失真不超過目標(biāo)質(zhì)量水平。
附圖2描述編碼系統(tǒng)30,該系統(tǒng)包括一個用于獲得選擇的質(zhì)量的系統(tǒng)31。編碼系統(tǒng)30可以包括任何類型的系統(tǒng)(也就是說,MEPG-4編碼器),該系統(tǒng)編碼用于基于通信信道傳輸?shù)臄?shù)字?jǐn)?shù)據(jù)。編碼系統(tǒng)30接收視頻數(shù)據(jù)42,例如以MEPG-4系統(tǒng)中的視頻目標(biāo),輸出利用適于滿足選擇的質(zhì)量(也就是失真)水平的比特速率編碼的比特流44。質(zhì)量系統(tǒng)31包括一個目標(biāo)失真選擇系統(tǒng)32,該系統(tǒng)允許用戶或者系統(tǒng)選擇一個視頻數(shù)據(jù)42必須與之一致的失真度。失真可以被選擇、測量并且在任何已知模式這實(shí)施,包括作為一個均方根(rms),其中rms(q)≈N(m(q),δ2(q))。
質(zhì)量系統(tǒng)31進(jìn)一步包括一個用于確定量化參數(shù)q的確定系統(tǒng)34,保證于選擇的目標(biāo)水平一致。Q確定系統(tǒng)34包括一個失真模型36,作為量化參數(shù)q的函數(shù)確定失真水平。更特別的,失真模型36包括一個具有方差的高斯分布,其中該方差是量化參數(shù)q的一個函數(shù)。用于這樣的模型的一個示例性實(shí)施例在上面描述了。模型36可作為計(jì)算輸入的q的失真的上限的算法實(shí)施。例如,如上所述,上限D(zhuǎn)upper可以定義為Dupper(q)=a1q2+a2q+a3+λ*sqrt(b1q2+b2q+b3).
為了確定適當(dāng)?shù)膓滿足選擇的失真度,可以使用一個迭帶算法38迭帶地測試一系列連續(xù)的q值,例如,直到D(q)的上限小于或者等于選擇的目標(biāo)失真水平。下面是用于迭帶算法38的偽碼,其中rms≈D輸入選擇的質(zhì)量水平rms0從31到1開始循環(huán)q如果rms(q)≤rms0,貝q’=q;結(jié)束一旦q’確定,比特速率計(jì)算系統(tǒng)40可被用于確定實(shí)現(xiàn)q’所必須的相關(guān)比特速率。如上所述,因?yàn)楸忍厮俾适莙的函數(shù),比特速率計(jì)算系統(tǒng)40可被容易的以任何已知方式實(shí)現(xiàn)。
可以理解,這里所描述的系統(tǒng)、函數(shù)、機(jī)構(gòu)和模型可以硬件、軟件或者硬件和軟件的結(jié)合實(shí)現(xiàn)。它們可以以任何類型的計(jì)算機(jī)系統(tǒng)或者適合于執(zhí)行這里描述的方法的其它裝置實(shí)現(xiàn)。一個典型的軟件和硬件結(jié)合可以是具有計(jì)算機(jī)程序的通用計(jì)算機(jī)系統(tǒng),當(dāng)該程序裝載并執(zhí)行時,控制該計(jì)算機(jī)系統(tǒng)以便執(zhí)行這里描述的方法。換句話說,使用一個特殊用途計(jì)算機(jī),它包括用于執(zhí)行本發(fā)明一個或多個功能任務(wù)的特殊硬件。本發(fā)明也可以在計(jì)算機(jī)產(chǎn)品中實(shí)現(xiàn),該產(chǎn)品包括實(shí)現(xiàn)這里描述的方法和功能的所有特征,當(dāng)裝入計(jì)算機(jī)系統(tǒng)時,它能夠執(zhí)行這些方法和功能。計(jì)算機(jī)程序、軟件程序、程序、程序產(chǎn)品或者軟件在本發(fā)明內(nèi)容中意味著以任何語言、編碼或者符號以及一系列指令的表示,其中一系列指令意味著使得具有信息處理能力的系統(tǒng)直接或者見解沿著下列步驟步驟執(zhí)行特定功能(a)轉(zhuǎn)換成另一種語言、碼字或者符號;和/或(b)在不同實(shí)質(zhì)形式中再現(xiàn)。
為了說明和解釋的目的,已經(jīng)出現(xiàn)了本發(fā)明優(yōu)選實(shí)施例的上述描述。它們不用于窮舉或者限制本發(fā)明為公開的精確形式,明顯的基于上述提示的任何改進(jìn)和變形都是可能的。這種對于本領(lǐng)域的技術(shù)人員來說是明顯的改進(jìn)和變形,應(yīng)該被包括在附加權(quán)利要求所定義的范圍內(nèi)。
權(quán)利要求
1.一種用于確定滿足預(yù)先確定的質(zhì)量水平的量化參數(shù)q的方法,包括下列步驟提供一個失真模型D(q)=N(a1q2+a2q+a3,b1q2+b2q+b3)[36],其中N是高斯分布,a1,a2,a3,b1,b2和b3是失真模型參數(shù);選擇一個目標(biāo)失真度[20];以及計(jì)算量化參數(shù)q,以便失真模型D(q)[36]的上限小于等于目標(biāo)失真度[20]。
2.權(quán)利要求1所述的方法進(jìn)一步包括基于計(jì)算的量化參數(shù)q確定比特速率。
3.權(quán)利要求1所述的方法,其中量化參數(shù)q從一系列連續(xù)的值1,2,3…Q中選擇,其中Q是一個整數(shù)。
4.權(quán)利要求3所述的方法,其中計(jì)算量化參數(shù)q的步驟包括從Q到1迭帶地測試一系列連續(xù)的值,直到D(q)的上限[12]小于或者等于選擇的目標(biāo)失真度[20]。
5.權(quán)利要求1所述的方法,其中失真模型D(q)以均方根RMS(q)表示。
6.權(quán)利要求1所述的方法,其中失真模型參數(shù)使用最大似然估計(jì)統(tǒng)計(jì)方法估計(jì)
7.權(quán)利要求1所述的方法,其中失真模型D(q)[36]的上限以D(q)=a1q2+a2q+a3+λ*sqrt(b1q2+b2q+b3)計(jì)算,其中λ是置信度常數(shù)。
8.一個具有品質(zhì)水平容量的編碼系統(tǒng)[30]包括一個用于選擇目標(biāo)失真度[20]的系統(tǒng)[32];一個失真模型[36],其中失真模型[36]作為量化參數(shù)的函數(shù)確定失真度,其中失真模型[36]包括具有方差的高斯分布,該方差為量化參數(shù)的函數(shù);以及用于計(jì)算量化參數(shù)以便失真度不超過目標(biāo)失真度[20]。
9.權(quán)利要求8所述的編碼系統(tǒng)[30]進(jìn)一步包括一個用于作為計(jì)算的量化參數(shù)的函數(shù)計(jì)算比特速率的系統(tǒng)[40]。
10.權(quán)利要求8所述的編碼系統(tǒng)[30],其中失真模型[36]定義為D(q)=N(a1q2+a2q+a3,b1q2+b2q+b3),其中q是量化參數(shù),N是高斯分布,a1,a2,a3,b1,b2和b3是失真模型參數(shù)。
11.權(quán)利要求8所述的編碼系統(tǒng)[30],其中失真度的上限[12]由失真模型定義Dupper(q)=a1q2+a2q+a3+λ*sqrt(b1q2+b2q+b3),其中λ是置信度常數(shù)。
12.權(quán)利要求10所述的編碼系統(tǒng)[30],進(jìn)一步包括一個用于估計(jì)失真模型參數(shù)的系統(tǒng)。
13.權(quán)利要求8所述的編碼系統(tǒng)[30],其中用于計(jì)算量化參數(shù)的系統(tǒng)[34]使用一個算法[38],該算法迭帶地測試整數(shù)量化參數(shù)值。
14.一個允許選擇失真度的視頻編碼器[30]包括一個用于選擇目標(biāo)失真度[20]的選擇系統(tǒng)[32];用于確定量化參數(shù)以便確保與選擇的目標(biāo)失真度一致的系統(tǒng)[34],其中系統(tǒng)[34]包括一個利用高斯分布用于計(jì)算失真的算法[38],高斯分布具有是量化參數(shù)函數(shù)的方差。
15.權(quán)利要求14所述的編碼系統(tǒng)[30],進(jìn)一步包括一個作為量化參數(shù)的函數(shù)用于選擇比特速率的系統(tǒng)[40]。
16.權(quán)利要求14所述的編碼系統(tǒng)[30],其中對于一個給定的量化水平q,失真Dupper的上限[12]按下式計(jì)算Dupper(q)=a1q2+a2q+a3+λ*sqrt(b1q2+b2q+b3),其中其中a1,a2,a3,b1,b2和b3是失真模型參數(shù),以及λ是置信度常數(shù)。
17.權(quán)利要求14所述的編碼系統(tǒng)[30],其中對于給定的量化度q失真D計(jì)算如下D(q)=N(a1q2+a2q+a3,b1q2+b2q+b3),其中N是高斯分布,a1,a2,a3,b1,b2和b3是失真模型參數(shù)。
18.一個存儲在一個可讀記錄介質(zhì)上的程序產(chǎn)品,其中當(dāng)執(zhí)行時允許在編碼操作中選擇一個失真度,包括一個用于選擇目標(biāo)失真度[20]的選擇系統(tǒng)[32];用于確定量化參數(shù)以便確保與選擇的目標(biāo)失真度一致的系統(tǒng)[34],其中系統(tǒng)[34]包括一個利用具有方差的高斯分布計(jì)算失真的算法,該方差是量化參數(shù)的函數(shù)。
全文摘要
一種允許選擇失真度的視頻編碼器(30)包括一個用于選擇目標(biāo)失真度的選擇系統(tǒng);一個用于確定量化參數(shù)q以確保與選擇的目標(biāo)失真度一致的系統(tǒng)(34),其中系統(tǒng)(34)包括用于使用高斯分別計(jì)算失真的算法,其中高斯分布具有是量化參數(shù)q的函數(shù)的方差。該算法基于失真模型D(q)=N(a
文檔編號H04N7/30GK1462557SQ02801414
公開日2003年12月17日 申請日期2002年4月23日 優(yōu)先權(quán)日2001年4月27日
發(fā)明者Y·彥, K·S·查拉帕利 申請人:皇家菲利浦電子有限公司