專利名稱:一種視頻壓縮編碼搜索算法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種視頻編碼方法,具體指一種在保證視頻編碼效率的前提下大幅度節(jié)減軟硬件實現(xiàn)中亞象素運動的部分運算量的算法。
背景技術(shù):
在現(xiàn)有視頻壓縮編碼的亞象素搜索算法中,廣泛使用的技術(shù)是基于空間域的全搜索算法或是全搜索的各種快速算法,這些算法在搜索窗內(nèi)以象素塊為單位查找最匹配塊,以均方差和或絕對差值和為判斷法則,其搜索過程中需要作多次濾波插值,并反復(fù)計算代價函數(shù),計算復(fù)雜度非常高。實驗顯示,進(jìn)入亞象素精度計算后,運動搜索過程的計算開銷往往要超出原整象素搜索的一倍以上。不僅如此,匹配的準(zhǔn)確度還取決于插值算法的精度,從一定程度上影響編碼效率。在傳統(tǒng)視頻編碼中,編碼圖象首先需要進(jìn)行空間域-頻域變換,在頻域中完成量化、熵編碼,然后再做頻域-空間域變換,回到空間域進(jìn)行運動搜索及存儲。這樣的全搜索算法在亞象素搜索中的計算復(fù)雜度高,花銷的時間和效率低下,還影響視頻編碼的精度。
發(fā)明內(nèi)容
本發(fā)明針對現(xiàn)有的搜索算法復(fù)雜度高,精度低的缺陷提出一種新穎的搜索算法,在頻域直接利用相位的相關(guān)性預(yù)測和搜索運動矢量,該算法在亞象素搜索過程中由于不需要回到空間域,不需做插值計算,避免計算代價函數(shù),從而極大削減視頻編碼中運動搜索帶來的計算開銷,適用于需要視頻內(nèi)容服務(wù)的嵌入式平臺。
目前被各視頻編碼標(biāo)準(zhǔn)普遍采用的是DCT變換,DCT域的亞象素運動搜索算法的算法流程如下 7)確定搜索窗為N,提取在x方向上以參考圖像整象素點F為起始的一維信號x1(n)及當(dāng)前圖像中對應(yīng)位置的x2(n); 8)根據(jù)DCT和DST變換公式,計算x1(n)和x2(n)的四個離散DCT/DST變換系數(shù); 9)計算在[1,N]區(qū)間的gmS,由DCT和DST變換公式、及滿足方程得到 10)根據(jù)gm的方程分析δ響應(yīng)的正負(fù)方向,得出mx的正負(fù)方向上的位移; 11)在y方向上重復(fù)以上步驟,得出y方向上的my的正負(fù)方向上的位移; 12)攜帶參數(shù)mx、my查詢表1,確定在亞象素空間位置圖中的匹配點,同時確定半象素運動矢量。
表1 m與運動矢量 上述gm的方程 上述所述的DCT和DST變換公式,定義如下的DCT和DST變換為 上式中, 上述所述的滿足方程 其中, 上述滿足方程能改寫為能夠證明Z(k)是一個正交矩陣,并且有λZT(k)Z(k)=I2,I2是一個2×2的單位矩陣;這樣可以解出方程從而可以解出gmC、gmS。
將
近似代替
將
近似代替
以進(jìn)一步降低計算量。
如果需要1/4象素精度的運動矢量,按6)中所得的運動矢量使用雙線性濾波器插值,在所得象素塊上重復(fù)1)-6)步驟。
從上述算法及公式能分析出gmC、gmS這兩個屬于頻域的變量包含了平動信息m,并從中提取出m,就能實現(xiàn)DCT域的運動搜索?;陬l域的快速運動搜索算法通過分析在頻域的相位來檢測物體運動信息,比起空間域的搜索算法,這種分析技術(shù)更接近物體運動的本質(zhì),擁有其極低的計算復(fù)雜度,本發(fā)明提出的基于頻域的亞象素運動搜索算法的計算復(fù)雜度大約是空間域亞象素全搜索算法的5%到2 0%之間,特別適用于嵌入式平臺或手持終端。
圖1為物體向右平動m時的δ響應(yīng)示意圖; 圖2為物體向左平動m時的δ響應(yīng)示意圖; 圖3為各標(biāo)準(zhǔn)測試序列下的計算性能復(fù)雜度比較; 圖4為亞象素空間位置示意圖。
具體實施方式
目前被各視頻編碼標(biāo)準(zhǔn)普遍采用的是DCT變換,DCT變換具有接近K-L變換的能量收斂性能,能夠?qū)⒋蟛糠帜芰考性谥绷骱偷皖l部分,在通過低通濾波器后,可以在高壓縮比下保證圖像質(zhì)量。針對這點,本發(fā)明主要從DCT變換域的相位來推算空間的平動,由于DCT變換的特殊性,在DCT域不再像傅立葉那樣有簡單的對應(yīng)關(guān)系。
有一維離散信號{x1(n)|n∈
}(N為搜索窗的大小),經(jīng)右移m后,形成信號{x2(n)|n∈
} 根據(jù)定義如下的DCT和DST變換式, 上式中, 容易證明,這四個變換滿足如下方程 其中, 將(8)中的方程改寫為可以證明,Z(k)是一個正交矩陣,并且有 λZT(k)Z(k)=I2(9) I2是一個2×2的單位矩陣。這樣,我們可以解出方程 從而可以解出gmC、gmS。
根據(jù)正弦函數(shù)的正交法則,有如下定律 其中,δ(n)是離散沖激函數(shù)。
根據(jù)式(8)、(10-12),可以得出關(guān)于gm的方程 我們看到,這兩個屬于頻域的變量包含了平動信息m。如果能夠找到快速算法解出gmC、gmS,并從中提取出m,就能實現(xiàn)DCT域的運動搜索。
分析式(13)、(14),當(dāng)m大于0,且位于搜索窗
時,總能在n=m處找到正的δ響應(yīng),同時在n=-m-1處找到負(fù)的δ響應(yīng);當(dāng)m<0,且位于搜索窗的負(fù)鏡象[-N,0)時,總能在n=m處找到負(fù)的δ響應(yīng),同時在n=-m-1處找到正的δ響應(yīng)。如圖1(a)、圖1(b)所示,灰色區(qū)域為搜索窗,如果在搜索窗
發(fā)現(xiàn)正的δ響應(yīng),則意味著物體有向右的平動,m>0;如果在搜索窗
發(fā)現(xiàn)負(fù)的δ響應(yīng),則意味著物體有向左的平動,m<0。下文表1顯示,當(dāng)僅知m的正負(fù)方向,不需求解m的具體取值即可確定亞象素運動矢量,大大降低了計算量。
在具體計算時,可將
近似代替
將
近似代替
以進(jìn)一步降低計算量。
在上文建立的各式基礎(chǔ)上,DCT域的亞象素運動搜索算法的算法流程如下第一步確定搜索窗為N,提取在x方向上以參考圖像整象素點F為起始的一維信號x1(n)及當(dāng)前圖像中對應(yīng)位置的x2(n); 第二步根據(jù)式(3-6),計算x1(n)和x2(n)的四個離散DCT/DST變換系數(shù); 第三步計算在[1,N]區(qū)間的gmS,由式(3-6)、(8)得到 第四步根據(jù)式(13)根據(jù)δ響應(yīng)的正負(fù)方向,得出mx的正負(fù)方向的位移; 第五步與上步驟同理,得出y方向上的my的正負(fù)方向位移; 第六步攜帶參數(shù)mx、my查詢表1,確定在亞象素空間位置示意圖中的匹配點, 同時確定半象素運動矢量。
表1 m與運動矢量 如果需要1/4象素精度的運動矢量,按6)中所得的運動矢量使用雙線性濾波器插值,在所得象素塊上重復(fù)1)-6)步驟。
實驗在H.264編碼平臺上進(jìn)行,使用的測試視頻編碼軟件的版本是JM8.6(JVT官方發(fā)布),編碼參數(shù)為量化參數(shù)=26、1幀參考圖像。使用的標(biāo)準(zhǔn)測試序列是大小為QCIF,長度均為100幀的Foreman、Container、News、Silent、Carphone。圖3是本文的算法與全搜索算法在亞象素搜索中的計算復(fù)雜度比較。由于各測試序列的圖像構(gòu)成各異,計算復(fù)雜度各不相同,為方便起見,將各個測試序列中的全搜索算法計算復(fù)雜度設(shè)為1,作為比較基準(zhǔn)。由圖3中可看出,本發(fā)明提出的基于頻域的亞象素運動搜索算法的計算復(fù)雜度大約是空間域亞象素全搜索算法的5%到20%之間。
對算法的編碼性能的測試數(shù)據(jù)下表所示,對于不同的圖像測試序列使用該算法編碼后圖像的峰值信噪比與全搜索算法相比,下降0.04到0.65dB。
下表為在不同測試序列下的編碼性能變化 基于頻域的快速運動搜索算法通過分析在頻域的相位來檢測物體運動信息,比起空間域的搜索算法,這種分析技術(shù)更接近物體運動的本質(zhì)。由于其極低的計算復(fù)雜度,特別適用于嵌入式平臺或手持終端。
在上述實施例中,僅對本發(fā)明進(jìn)行了示范性描述,但是本領(lǐng)域技術(shù)人員在不脫離本發(fā)明所保護(hù)的范圍和精神的情況下,可根據(jù)不同的實際需要設(shè)計出各種實施方式。
權(quán)利要求
1.一種視頻壓縮編碼搜索算法,其算法流程如下
1)確定搜索窗為N,提取在x方向上以參考圖像整象素點F為起始的一維信號x1(n)及當(dāng)前圖像中對應(yīng)位置的x2(n);
2)根據(jù)DCT和DST變換公式,計算x1(n)和x2(n)的四個離散DCT/DST變換系數(shù);
3)計算在[1,N]區(qū)間的gms,由DCT和DST變換公式、及滿足方程得到
4)根據(jù)gm方程分析δ響應(yīng)的正負(fù)方向,得出mx的正負(fù)方向上的位移;
5)在y方向上重復(fù)以上步驟,得出y方向上的my的正負(fù)方向上的位移;
6)攜帶參數(shù)mx、my查詢表1,確定在亞象素空間位置圖中的匹配點,同時確定半象素運動矢量。
表1m與運動矢量
2.要求1所述的視頻壓縮編碼搜索算法,其特征在于上述步驟4)中的gm方程為
3.權(quán)利要求1述的視頻壓縮編碼搜索算法,其特征在于上述步驟2)、3)中所述的DCT和DST變換公式為
上式中,
4.要求1所述的視頻壓縮編碼搜索算法,其特征在于上述步驟3)所述的滿足方程其中,
5.根據(jù)權(quán)利要求4述的視頻壓縮編碼搜索算法,其特征在于上述滿足方程能改寫為能夠證明Z(k)是一個正交矩陣,并且有λZT(k)Z(k)=I2,I2是一個2×2的單位矩陣;這樣能解出方程從而可以解出gmC、gmS。
6.根據(jù)權(quán)利要求2所述的視頻壓縮編碼搜索算法,其特征在于將
近似代替將
近似代替以進(jìn)一步降低計算量。
7.根據(jù)權(quán)利要求1所述的視頻壓縮編碼搜索算法,其特征在于當(dāng)需要1/4象素精度的運動矢量,按步驟6)中所得的運動矢量使用雙線性濾波器插值,在所得象素塊上重復(fù)步驟1)-6)。
全文摘要
本發(fā)明涉及一種視頻編碼方法,具體指一種在保證視頻編碼效率的前提下大幅度節(jié)減軟硬件實現(xiàn)中亞象素運動的部分運算量的算法。基于頻域的快速運動搜索算法通過分析在頻域的相位來檢測物體運動信息,比起空間域的搜索算法,這種分析技術(shù)更接近物體運動的本質(zhì),擁有其極低的計算復(fù)雜度,通過gmC、gmS這兩個屬于頻域的變量包含了平動信息m,并從中提取出m,就能實現(xiàn)DCT域的運動搜索。本發(fā)明提出的基于頻域的亞象素運動搜索算法的計算復(fù)雜度大約是空間域亞象素全搜索算法的5%到20%之間,特別適用于嵌入式平臺或手持終端。
文檔編號H04N7/32GK101583028SQ200810067220
公開日2009年11月18日 申請日期2008年5月14日 優(yōu)先權(quán)日2008年5月14日
發(fā)明者馬國強(qiáng) 申請人:深圳市融合視訊科技有限公司