專利名稱:視頻數(shù)據(jù)編碼裝置和視頻數(shù)據(jù)編碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻編碼技術(shù)領(lǐng)域,具體而言,涉及一種視頻數(shù)據(jù)編碼裝置和一種視頻數(shù)據(jù)編碼方法。
背景技術(shù):
隨著數(shù)字視頻采集和顯示技術(shù)的日新月異,以及網(wǎng)絡(luò)帶寬的持續(xù)增加,在許多應(yīng)用領(lǐng)域,如數(shù)字影院、影視后處理和家庭影院等,對(duì)高視覺(jué)質(zhì)量、高空間彩解析度(全高清、4K空間分辨率)視頻的需求越來(lái)越多。這些應(yīng)用本身對(duì)視頻編碼的主觀質(zhì)量要求極為嚴(yán)格。在這些應(yīng)用中主觀質(zhì)量是最主要的評(píng)判編碼系統(tǒng)優(yōu)劣的標(biāo)準(zhǔn)。同時(shí),隨著視頻空間分辨率的增加,任何微小的視覺(jué)上的瑕疵都極易被觀看者感覺(jué)到。所以對(duì)于這種高分辨率、高質(zhì)量的視頻編碼應(yīng)用而言,對(duì)編碼結(jié)果的主觀質(zhì)量要求很高,要求盡可能多的保存視頻中人眼可感知的細(xì)節(jié)。
現(xiàn)有的編碼標(biāo)準(zhǔn)MPEG4、H. 264/AVC、VCU Motion JPEG2000以及下一代視頻編碼標(biāo)準(zhǔn)HEVC,在視頻編碼時(shí)都采用率失真優(yōu)化模型(RD0)。編碼效果評(píng)判標(biāo)準(zhǔn)都是采用客觀評(píng)價(jià)標(biāo)準(zhǔn),峰值信噪比(PSNR)。這種策略未考慮人眼視覺(jué)特性,某些人眼易感知的細(xì)節(jié)會(huì)在編碼時(shí)被編碼算法丟棄掉?,F(xiàn)有基于這些視頻編碼標(biāo)準(zhǔn)設(shè)計(jì)開發(fā)的軟硬件視頻編碼系統(tǒng)都有各自的策略來(lái)保護(hù)人眼可感知的紋理細(xì)節(jié)。例如,使用基于人眼感知特性的量化矩陣;利用計(jì)算機(jī)視覺(jué)算法進(jìn)行圖像前景和背景分割,為前景區(qū)域提供更多的碼字;結(jié)合碼率控制算法調(diào)整碼字分配策略達(dá)到保護(hù)人眼可感知細(xì)微細(xì)節(jié)的目的。采用特殊的量化矩陣方法普適性差,很難應(yīng)用于大多數(shù)視頻序列。基于圖像前景和背景分割的方法,算法相對(duì)復(fù)雜,計(jì)算復(fù)雜度高。而基于碼率控制的方法獨(dú)立性差,而且一般都需要某些圖像分割的算法相配
口 ο因此需要一種算法復(fù)雜度較低且可適用于大多數(shù)視頻編碼系統(tǒng)的視頻數(shù)據(jù)編碼技術(shù),能夠顯著提升視頻編碼的視覺(jué)效果。
發(fā)明內(nèi)容
考慮到上述背景技術(shù),本發(fā)明的一個(gè)目的是提供一種能夠有效提升視頻編碼系統(tǒng)編碼主觀質(zhì)量的方案。為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供了一種視頻數(shù)據(jù)編碼裝置,包括獲取單元,用于基于輸入編碼幀的像素特征和預(yù)設(shè)規(guī)則獲取所述輸入編碼幀中每一編碼宏塊的量化系數(shù)調(diào)整量,并將所述量化系數(shù)調(diào)整量輸入到視頻編碼器;所述視頻編碼器,基于所述量化系數(shù)調(diào)整量對(duì)所述輸入編碼幀進(jìn)行編碼處理,得到編碼碼流。在該技術(shù)方案中,根據(jù)接收到的輸入編碼幀可分析出該輸入編碼幀的像素特征(即灰階特征),該灰階特征可以是每個(gè)灰階值、灰階平均值或方差等,根據(jù)這些特征和預(yù)設(shè)規(guī)則便能夠獲取在視頻編碼時(shí),相應(yīng)的編碼宏塊的量化系數(shù)應(yīng)如何調(diào)整才能夠提升視頻編碼的視覺(jué)效果,該預(yù)設(shè)規(guī)則可以是像素值越高,則對(duì)應(yīng)的量化系數(shù)調(diào)整量就越高,或者像素值的變化越大,則對(duì)應(yīng)的量化系數(shù)調(diào)整量就越高等,量化系數(shù)經(jīng)過(guò)調(diào)整之后,基于該量化系數(shù)獲取得到的視頻編碼的主觀質(zhì)量就可以得到很大提升,并且該量化系數(shù)調(diào)整策略可直接應(yīng)用于現(xiàn)有的編碼系統(tǒng)中,對(duì)已有的視頻編碼系統(tǒng)改動(dòng)較小。在上述技術(shù)方案中,優(yōu)選地,所述獲取單元用于計(jì)算所述編碼宏塊的像素值均值,根據(jù)人眼視覺(jué)特性曲線和所述編碼宏塊的像素值均值獲取第一量化系數(shù)調(diào)整值,將所述第一量化系數(shù)調(diào)整值作為所述量化系數(shù)調(diào)整量,或者用于計(jì)算所述編碼宏塊的像素值均值和方差,根據(jù)預(yù)置的編碼宏塊的量化系數(shù)調(diào)整量與編碼宏塊的像素值均值和方差的對(duì)應(yīng)關(guān)系,獲取與所述輸入編碼幀中每一編碼宏塊對(duì)應(yīng)的第二量化系數(shù)調(diào)整值,將所述第二量化系數(shù)調(diào)整值作為所述量化系數(shù)調(diào)整量。該技術(shù)方案列舉了預(yù)設(shè)規(guī)則中較優(yōu)的兩種方案。一種方案是根據(jù)人眼視覺(jué)特性曲線和編碼宏塊的像素值均值來(lái)獲取最終的量化系數(shù)調(diào)整量。在人眼視覺(jué)感知特性理論中,人眼能夠感知的視頻或圖像中的最細(xì)微的細(xì)節(jié)變化的空域特性是與細(xì)節(jié)所在區(qū)域的背景的亮度相關(guān)的,因此,為了提高視頻圖像編碼的主觀效果,可考慮人眼視覺(jué)感知特性和輸入編碼幀中編碼宏塊的背景亮度(即像素值)。即在人眼能夠感知較小的亮度變化的區(qū)域,減小編碼時(shí)的量化系數(shù)(量化系數(shù)調(diào)整量為負(fù));在人眼只能夠感知較大亮度變化的區(qū)域,增加編碼時(shí)的量化系數(shù)(量化系數(shù)調(diào)整量為正)。通過(guò)這種策略能夠一定程度的保護(hù)人眼敏感區(qū)域的人眼可感知的細(xì)節(jié)特征,從而能夠一定程度的提高視頻壓縮的主觀質(zhì)量。同時(shí),此方案更主要的作用是能夠有效的進(jìn)行碼率再分配,即減少人眼能夠感知較大亮度變化區(qū)域所需的編碼碼字;增加人眼能夠感知較小亮度變化區(qū)域所需的編碼的碼字,從而保證編碼幀的編碼后的大小在可控的范圍內(nèi)。這為兼容碼率控制算法提供必要的基礎(chǔ)。也就是說(shuō),此方案可以看做一種碼字分配策略,它是后續(xù)量化系數(shù)調(diào)整策略的基礎(chǔ)。另一種方案 是基于視頻圖像統(tǒng)計(jì)特性來(lái)獲取最終的量化系數(shù)調(diào)整量。利用輸入編碼圖像的局部統(tǒng)計(jì)特性,如宏塊的像素值的均值和方差,通過(guò)預(yù)先計(jì)算好的像素值均值和方差與編碼量化系數(shù)變化量之間的對(duì)應(yīng)關(guān)系得到量化系數(shù)的變化量,用于調(diào)整編碼時(shí)量化系數(shù)。此方案主要是考慮在相同亮度下(即相同像素值均值)人眼對(duì)不同強(qiáng)度的細(xì)節(jié)的感知能力是不同的,為了有效的保護(hù)人眼可感知的細(xì)節(jié)信息,需要根據(jù)圖像局部的像素值的亮度(均值)和變化(方差)來(lái)調(diào)整圖像編碼時(shí)的局部的量化系數(shù)。在上述任一技術(shù)方案中,優(yōu)選地,所述獲取單元用于計(jì)算所述編碼宏塊的像素值均值和方差,根據(jù)人眼視覺(jué)特性曲線和所述編碼宏塊的像素值均值獲取第一量化系數(shù)調(diào)整值,以及根據(jù)預(yù)置的編碼宏塊的量化系數(shù)調(diào)整量與編碼宏塊的像素值均值和方差的對(duì)應(yīng)關(guān)系,獲取與所述輸入編碼幀中每一編碼宏塊對(duì)應(yīng)的第二量化系數(shù)調(diào)整值,以及根據(jù)所述第一量化系數(shù)調(diào)整值和所述第二量化系數(shù)調(diào)整值獲取所述量化系數(shù)調(diào)整量。在分別獲取了第一量化系數(shù)調(diào)整值和第二量化系數(shù)調(diào)整值之后,可基于其中一個(gè)量化系數(shù)調(diào)整值來(lái)對(duì)輸入編碼幀的量化系數(shù)進(jìn)行調(diào)整,也可以按照預(yù)設(shè)組合策略結(jié)合第一量化系數(shù)調(diào)整值和第二量化系數(shù)調(diào)整值來(lái)獲取最終的量化系數(shù)調(diào)整量,使視頻編碼器基于該量化系數(shù)調(diào)整量對(duì)輸入編碼幀進(jìn)行編碼處理。只基于方案一的量化系數(shù)調(diào)整策略,能夠有效的控制編碼幀編碼后的編碼尺寸,同時(shí)在一定程度上提高視頻編碼后的主觀質(zhì)量。只基于方案二的量化系數(shù)調(diào)整策略,能夠顯著的提高視頻編碼后的主觀質(zhì)量,但不能有效的控制視頻幀編碼后的尺寸,即可能導(dǎo)致編碼后圖像尺寸過(guò)大。組合策略能夠有效兼顧編碼后的視頻主觀質(zhì)量和視頻大小,即方案一提供基準(zhǔn)量化系數(shù)調(diào)整量,方案二提供更精細(xì)的量化系數(shù)調(diào)整量。在上述技術(shù)方案中,優(yōu)選地,所述獲取單元包括計(jì)算子單元,用于根據(jù)人眼視覺(jué)特性曲線公式計(jì)算出與所述編碼宏塊中所述每一像素值對(duì)應(yīng)的人眼可見最小亮度變化值,其中,所述人眼視覺(jué)特性曲線公式為
權(quán)利要求
1.一種視頻數(shù)據(jù)編碼裝置,其特征在于,包括獲取單元,用于基于輸入編碼幀的像素特征和預(yù)設(shè)規(guī)則獲取所述輸入編碼幀中每一編碼宏塊的量化系數(shù)調(diào)整量,并將所述量化系數(shù)調(diào)整量輸入到視頻編碼器;所述視頻編碼器,基于所述量化系數(shù)調(diào)整量對(duì)所述輸入編碼幀進(jìn)行編碼處理,得到編碼碼流。
2.根據(jù)權(quán)利要求1所述的視頻數(shù)據(jù)編碼裝置,其特征在于,所述獲取單元用于計(jì)算所述編碼宏塊的像素值均值,根據(jù)人眼視覺(jué)特性曲線和所述編碼宏塊的像素值均值獲取第一量化系數(shù)調(diào)整值,將所述第一量化系數(shù)調(diào)整值作為所述量化系數(shù)調(diào)整量,或者用于計(jì)算所述編碼宏塊的像素值均值和方差,根據(jù)預(yù)置的編碼宏塊的量化系數(shù)調(diào)整量與編碼宏塊的像素值均值和方差的對(duì)應(yīng)關(guān)系,獲取與所述輸入編碼幀中每一編碼宏塊對(duì)應(yīng)的第二量化系數(shù)調(diào)整值,將所述第二量化系數(shù)調(diào)整值作為所述量化系數(shù)調(diào)整量。
3.根據(jù)權(quán)利要求1所述的視頻數(shù)據(jù)編碼裝置,其特征在于,所述獲取單元用于計(jì)算所述編碼宏塊的像素值均值和方差,根據(jù)人眼視覺(jué)特性曲線和所述編碼宏塊的像素值均值獲取第一量化系數(shù)調(diào)整值,以及根據(jù)預(yù)置的編碼宏塊的量化系數(shù)調(diào)整量與編碼宏塊的像素值均值和方差的對(duì)應(yīng)關(guān)系,獲取與所述輸入編碼幀中每一編碼宏塊對(duì)應(yīng)的第二量化系數(shù)調(diào)整值,以及根據(jù)所述第一量化系數(shù)調(diào)整值和所述第二量化系數(shù)調(diào)整值獲取所述量化系數(shù)調(diào)整量。
4.根據(jù)權(quán)利要求2或3所述的視頻數(shù)據(jù)編碼裝置,其特征在于,所述獲取單元包括計(jì)算子單元,用于根據(jù)人眼視覺(jué)特性曲線公式計(jì)算出與所述編碼宏塊中所述每一像素值對(duì)應(yīng)的人眼可見最小亮度變化值,其中,所述人眼視覺(jué)特性曲線公式為
5.根據(jù)權(quán)利要求3所述的視頻數(shù)據(jù)編碼裝置,其特征在于,所述獲取單元按照線性組合方式根據(jù)所述第一量化系數(shù)調(diào)整值和所述第二量化系數(shù)調(diào)整值獲取所述量化系數(shù)調(diào)整量。
6.一種視頻數(shù)據(jù)編碼方法,其特征在于,包括基于輸入編碼幀的像素特征和預(yù)設(shè)規(guī)則獲取所述輸入編碼幀中每一編碼宏塊的量化系數(shù)調(diào)整量;將所述量化系數(shù)調(diào)整量輸入至視頻編碼器,所述視頻編碼器基于所述量化系數(shù)調(diào)整量對(duì)所述輸入編碼幀進(jìn)行編碼處理,得到編碼碼流。
7.根據(jù)權(quán)利要求6所述的視頻數(shù)據(jù)編碼方法,其特征在于,所述獲取輸入編碼幀中每一編碼宏塊的量化系數(shù)調(diào)整量的步驟具體包括計(jì)算所述編碼宏塊的像素值均值,根據(jù)人眼視覺(jué)特性曲線和所述編碼宏塊的像素值均值獲取第一量化系數(shù)調(diào)整值,將所述第一量化系數(shù)調(diào)整值作為所述量化系數(shù)調(diào)整量;或者計(jì)算所述編碼宏塊的像素值均值和方差,根據(jù)預(yù)置的編碼宏塊的量化系數(shù)調(diào)整量與編碼宏塊的像素值均值和方差的對(duì)應(yīng)關(guān)系,獲取與所述輸入編碼幀中每一編碼宏塊對(duì)應(yīng)的第二量化系數(shù)調(diào)整值,將所述第二量化系數(shù)調(diào)整值作為所述量化系數(shù)調(diào)整量。
8.根據(jù)權(quán)利要求6所述的視頻數(shù)據(jù)編碼方法,其特征在于,所述獲取輸入編碼幀中每一編碼宏塊的量化系數(shù)調(diào)整量的步驟具體包括計(jì)算所述編碼宏塊的像素值均值和方差, 根據(jù)人眼視覺(jué)特性曲線和所述編碼宏塊的像素值均值獲取第一量化系數(shù)調(diào)整值,以及根據(jù)預(yù)置的編碼宏塊的量化系數(shù)調(diào)整量與編碼宏塊的像素值均值和方差的對(duì)應(yīng)關(guān)系,獲取與所述輸入編碼幀中每一編碼宏塊對(duì)應(yīng)的第二量化系數(shù)調(diào)整值;根據(jù)所述第一量化系數(shù)調(diào)整值和所述第二量化系數(shù)調(diào)整值獲取所述量化系數(shù)調(diào)整量。
9.根據(jù)權(quán)利要求7或8所述的視頻數(shù)據(jù)編碼方法,其特征在于,所述根據(jù)人眼視覺(jué)特性曲線和所述編碼宏塊的像素值均值獲取所述第一量化系數(shù)調(diào)整值的步驟具體包括根據(jù)人眼視覺(jué)特性曲線公式計(jì)算出與所述編碼宏塊中所述每一像素值對(duì)應(yīng)的人眼可見最小亮度變化值,其中,所述人眼視覺(jué)特性曲線公式為
10.根據(jù)權(quán)利要求8所述的視頻數(shù)據(jù)編碼方法,其特征在于,按照線性組合方式根據(jù)所述第一量化系數(shù)調(diào)整值和所述第二量化系數(shù)調(diào)整值獲取所述量化系數(shù)調(diào)整量。(rIJ70X1-—jnd(k) - ■=JL OV^VjJ
全文摘要
本發(fā)明提供了一種視頻數(shù)據(jù)編碼方法和一種視頻數(shù)據(jù)編碼裝置,其中視頻數(shù)據(jù)編碼裝置包括獲取單元,用于基于輸入編碼幀的像素特征和預(yù)設(shè)規(guī)則獲取所述輸入編碼幀中每一編碼宏塊的量化系數(shù)調(diào)整量,并將所述量化系數(shù)調(diào)整量輸入到視頻編碼器,其中所述視頻編碼器,基于所述量化系數(shù)調(diào)整量對(duì)所述輸入編碼幀進(jìn)行編碼處理,得到編碼碼流。通過(guò)本發(fā)明的技術(shù)方案,可對(duì)視頻編碼中的量化系數(shù)進(jìn)行調(diào)整,以提升視頻編碼系統(tǒng)的編碼的視覺(jué)效果。
文檔編號(hào)H04N7/26GK103051901SQ201310012079
公開日2013年4月17日 申請(qǐng)日期2013年1月14日 優(yōu)先權(quán)日2013年1月14日
發(fā)明者武宇文, 朱丹, 高永英, 葛永文, 胥曄 申請(qǐng)人:北京華興宏視技術(shù)發(fā)展有限公司