專利名稱:一種基于恰可察覺失真的多視點(diǎn)視頻碼率控制方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種多視點(diǎn)視頻碼率控制技術(shù),尤其是涉及一種基于恰可察覺失真的多視點(diǎn)視頻碼率控制方法。
背景技術(shù):
隨著多媒體技術(shù)的快速發(fā)展和應(yīng)用,具有3D (Three Dimensional)視覺功能的多視點(diǎn)視頻技術(shù)正越來越受到學(xué)術(shù)界和工業(yè)界的重視,3D多媒體已經(jīng)成為現(xiàn)在電子消費(fèi)市場的主要推動(dòng)力量。此外,伴隨著移動(dòng)手機(jī)支持立體顯示,3D多媒體進(jìn)入移動(dòng)設(shè)備已經(jīng)成為現(xiàn)實(shí)。多視點(diǎn)視頻編碼(mult1-view video coding,MVC)標(biāo)準(zhǔn)中采用了視差補(bǔ)償預(yù)測聯(lián)合運(yùn)動(dòng)補(bǔ)償預(yù)測去除各種冗余來提高編碼效率。但是多視點(diǎn)視頻技術(shù)要真正應(yīng)用于實(shí)踐,還有許多問題需要解決,多視點(diǎn)視頻編碼的碼率控制就是其中的問題之一。如果碼率控制問題得不到解決,則很難在恒定帶寬下傳輸多視點(diǎn)視頻流并獲得良好穩(wěn)定的接收端質(zhì)量,帶寬可變時(shí)這種情況還會(huì)更嚴(yán)重。因此,只有碼率控制問題得以解決,多視點(diǎn)視頻技術(shù)才有可能在實(shí)際中得到應(yīng)用。然而,MVC標(biāo)準(zhǔn)中尚未給出碼率控制方案,而已有的針對多視點(diǎn)視頻的碼率分配或碼率控制方法雖然都取得了一定的效果,但是對于如何更加準(zhǔn)確的根據(jù)人眼視覺系統(tǒng)(HumanVision System,HVS)的特性來進(jìn)行碼率控制仍然不是很清楚。眾所周知,恰可察覺失真(justnoticeable distortion, JND)考慮了空時(shí)對比敏感度、亮度適應(yīng)效應(yīng)、對比度掩模效應(yīng)等,是另一種常用的主觀質(zhì)量評價(jià)模型。在JND范圍內(nèi),人眼不能感覺到因?yàn)榭臻g/時(shí)間敏感度和掩蔽效應(yīng)而引起的像素周圍的一些變化。在視頻壓縮方法中,在運(yùn)動(dòng)估計(jì)和視覺質(zhì)量估計(jì)模型中經(jīng)常采用基于像素JND模型來避免額外的多余的耗費(fèi)。綜合上述,基于一種較為合適的JND模型來進(jìn)行碼率控制已經(jīng)非常迫切,它將根據(jù)不同的人眼視覺感知曲線在限定的碼率條件下盡可能用最少的碼率獲得最高的主觀質(zhì)量。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提供一種在保證碼率控制精度的前提下,能夠有效地提高視頻主觀質(zhì)量的基于恰可察覺失真的多視點(diǎn)視頻碼率控制方法。本發(fā)明解決上述技術(shù)問題所采用的技術(shù)方案為:一種基于恰可察覺失真的多視點(diǎn)視頻碼率控制方法,其特征在于包括以下步驟:①定義輸入的多視點(diǎn)視頻信號中當(dāng)前正在處理的視點(diǎn)視頻信號為當(dāng)前視點(diǎn)視頻
信號;②將當(dāng)前視點(diǎn)視頻信號劃分成多個(gè)圖像組,每個(gè)圖像組包括I幀、P幀和B幀三種類型的圖像;③給當(dāng)前視點(diǎn)視頻信號中的每個(gè)圖像組預(yù)分配目標(biāo)比特?cái)?shù),對于當(dāng)前視點(diǎn)視頻信號中的第i個(gè)圖像組,將預(yù)分配給其的目標(biāo)比特?cái)?shù)記為f(i,o),
權(quán)利要求
1.一種基于恰可察覺失真的多視點(diǎn)視頻碼率控制方法,其特征在于包括以下步驟: ①定義輸入的多視點(diǎn)視頻信號中當(dāng)前正在處理的視點(diǎn)視頻信號為當(dāng)前視點(diǎn)視頻信號; ②將當(dāng)前視點(diǎn)視頻信號劃分成多個(gè)圖像組,每個(gè)圖像組包括I幀、P幀和B幀三種類型的圖像; ③給當(dāng)前視點(diǎn)視頻信號中的每個(gè)圖像組預(yù)分配目標(biāo)比特?cái)?shù),對于當(dāng)前視點(diǎn)視頻信號中的第i個(gè)圖像組,將預(yù)分配給其的目標(biāo)比特?cái)?shù)記為f (i,O),
2.根據(jù)權(quán)利要求1所述的一種基于恰可察覺失真的多視點(diǎn)視頻碼率控制方法,其特征在于所述的步驟④-5中Y =0.75。
3.根據(jù)權(quán)利要求1或2所述的一種基于恰可察覺失真的多視點(diǎn)視頻碼率控制方法,其特征在于所述的步驟④-6中β =0.5。
4.根據(jù)權(quán)利要求3所述的一種基于恰可察覺失真的多視點(diǎn)視頻碼率控制方法,其特征在于所述的步驟c中當(dāng)前宏塊中坐標(biāo)位置為(x,y)的像素點(diǎn)的恰可察覺失真值JND (x, y, j,k)的獲取過程為: Cl、采用離散余弦變換將當(dāng)前宏塊分割成16個(gè)互不重疊的尺寸大小為4X4的DCT子塊,定義當(dāng)前宏塊中當(dāng)前正在處理的坐標(biāo)位置為(x’,y’)的DCT子塊為當(dāng)前DCT子塊,其中,O ≤ χ' <4, O ≤ γ' <4 ;c2、計(jì)算當(dāng)前DCT子塊中的每個(gè)像素點(diǎn)的恰可察覺失真值,將當(dāng)前DCT子塊中坐標(biāo)位置為(s, t)的像素點(diǎn)的恰可察覺失真值記為 ._(χ’,y’,S,t), ._(χ ',y' , s, t)=Τ(χ' , y ' , s, t) XbLum(x ' ,γ' )Xbe(x' , y ',s, t),其中,O 彡 s 彡 3,O 彡 t 彡 3,T(x / ,y' ,s,t)表示當(dāng)前DCT子塊中坐標(biāo)位置為(s,t)的像素點(diǎn)的視覺閾值,
全文摘要
本發(fā)明公開了一種基于恰可察覺失真的多視點(diǎn)視頻碼率控制方法,其通過根據(jù)人類視覺系統(tǒng)特性獲取恰可察覺失真值,在多視點(diǎn)視頻中定量地來進(jìn)行碼率控制,即對于I幀或P幀圖像,其量化參數(shù)根據(jù)前一個(gè)圖像組中的所有B幀的量化參數(shù)的平均值來確定,對于B幀圖像,通過計(jì)算預(yù)分配給其的目標(biāo)比特?cái)?shù),并通過計(jì)算預(yù)分配給其的各個(gè)宏塊的目標(biāo)比特?cái)?shù),結(jié)合恰可察覺失真值將宏塊的平均絕對誤差進(jìn)行修正,然后根據(jù)碼率-量化參數(shù)的二次模型求取宏塊的量化參數(shù),通過這種碼率控制方式使得本發(fā)明方法在精確的控制碼率和基本保持峰值信噪比不變的同時(shí),能夠獲得更高的主觀質(zhì)量,并且在以修正后的峰值信噪比為質(zhì)量標(biāo)準(zhǔn)時(shí),本發(fā)明方法減少了10.31%~32.13%左右的碼率。
文檔編號H04N13/00GK103096079SQ20131000706
公開日2013年5月8日 申請日期2013年1月8日 優(yōu)先權(quán)日2013年1月8日
發(fā)明者蔣剛毅, 鄭巧燕, 郁梅, 朱高鋒, 彭宗舉, 邵楓 申請人:寧波大學(xué)