基于支持向量機(jī)的avs到hevc優(yōu)化視頻轉(zhuǎn)碼方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及的是一種視頻信號(hào)處理領(lǐng)域的技術(shù),具體是一種基于支持向量機(jī)的 AVS到肥VC優(yōu)化視頻轉(zhuǎn)碼方法。
【背景技術(shù)】
[0002] 視頻轉(zhuǎn)碼技術(shù),是將已壓縮的碼流通過(guò)解碼再編碼得到符合要求的目標(biāo)碼流。隨 著多媒體技術(shù)和互聯(lián)網(wǎng)等的廣泛應(yīng)用和快速發(fā)展,在網(wǎng)絡(luò)上傳輸各種視頻數(shù)據(jù)已經(jīng)成為現(xiàn) 在網(wǎng)絡(luò)技術(shù)發(fā)展的趨勢(shì),目前已出現(xiàn)了多種視頻編碼標(biāo)準(zhǔn),包括MPEG- 4、MPEG- 2、H. 264、 AVS、肥VC等。由于視頻資源多種多樣,W及不同的終端設(shè)備的顯示能力、存儲(chǔ)能力、對(duì)碼流 的處理能力存在差異,在不同情境下用戶對(duì)視頻的需求也不盡相同,因此,如何能夠?qū)崿F(xiàn)高 效的轉(zhuǎn)碼,使之適應(yīng)于不同硬件設(shè)備W及網(wǎng)絡(luò)傳輸環(huán)境中,一直廣泛受到業(yè)界的關(guān)注。肥VC 是目前最新的視頻編碼標(biāo)準(zhǔn),壓縮效率比H. 264等標(biāo)準(zhǔn)提高了約50%,它將會(huì)得到越來(lái)越 廣泛的應(yīng)用。AVS是我國(guó)自主研發(fā)的標(biāo)準(zhǔn),具有與H. 264相當(dāng)?shù)木幋a性能和更低的編碼復(fù)雜 度,在視頻應(yīng)用領(lǐng)域具有重要的影響力。目前已有許多已壓縮的AVS碼流,它將于肥VC等 標(biāo)準(zhǔn)長(zhǎng)期共存,因此實(shí)現(xiàn)AVS到肥VC標(biāo)準(zhǔn)間的視頻轉(zhuǎn)換成為重要的研究方向。
[0003] 機(jī)器學(xué)習(xí)應(yīng)用于多個(gè)研究領(lǐng)域,包括人工智能、機(jī)器翻譯、數(shù)據(jù)挖掘、文字識(shí)別W 及商業(yè)領(lǐng)域等,隨著數(shù)字多媒體技術(shù)W及傳輸網(wǎng)絡(luò)等的發(fā)展,它也不斷的應(yīng)用于視頻捜索、 視頻分析W及視頻編轉(zhuǎn)碼等研究方向,目前將機(jī)器學(xué)習(xí)算法應(yīng)用于視頻轉(zhuǎn)碼領(lǐng)域的應(yīng)用也 在不斷增多。支持向量機(jī)是機(jī)器學(xué)習(xí)的一個(gè)重要的方法,從輸入碼流前面部分帖中提取出 解碼信息等,利用支持向量機(jī)學(xué)習(xí)出AVS信息和肥VC編碼模式之間的對(duì)應(yīng)關(guān)系,在后面編 碼的過(guò)程中,就直接根據(jù)解碼出的AVS的信息,預(yù)測(cè)出肥VC編碼的模式,而不需要進(jìn)行完全 迭代遍歷的過(guò)程,從而達(dá)到降低視頻轉(zhuǎn)換復(fù)雜度的目的。因此,通過(guò)利用支持向量機(jī)該種機(jī) 器學(xué)習(xí)方法,如何學(xué)習(xí)得到準(zhǔn)確的訓(xùn)練模型,實(shí)現(xiàn)準(zhǔn)確預(yù)測(cè)W降低視頻轉(zhuǎn)換的復(fù)雜度,提高 視頻轉(zhuǎn)碼的速率成為當(dāng)前研究的一個(gè)重要課題。
[0004] 經(jīng)過(guò)對(duì)現(xiàn)有技術(shù)的檢索發(fā)現(xiàn),中國(guó)專利文獻(xiàn)號(hào)CN104320667A公開(kāi)(公告)日 2015. 01. 28,公開(kāi)了一種多過(guò)程最優(yōu)化編碼系統(tǒng),包括若干個(gè)并行編碼器、前瞻緩沖器和二 次編碼器,前瞻緩沖器的輸入端與并行編碼器的輸出端連接,前瞻緩沖器的輸出端與二次 編碼器的輸入端連接,并公開(kāi)了其方法,包括第一編碼階段、最優(yōu)化選擇階段和第二編碼階 段3個(gè)步驟,第一編碼階段由若干個(gè)并行編碼器同時(shí)進(jìn)行編碼,前瞻緩沖器對(duì)第一編碼階 段所得到的結(jié)果進(jìn)行最優(yōu)化選擇W獲得最優(yōu)編碼路徑,二次編碼器根據(jù)最優(yōu)化選擇階段所 獲得的最優(yōu)編碼路徑第二次編碼,獲得最終而最優(yōu)的編碼結(jié)果。該技術(shù)性能、質(zhì)量、帶寬效 率更高,編碼/轉(zhuǎn)碼結(jié)果更好,非常易于配置并且非常靈活,既可用于高視頻質(zhì)量的4K和超 高清應(yīng)用,也可用于超高效帶寬的移動(dòng)視頻應(yīng)用。但該技術(shù)的輸入是原始碼流,沒(méi)有能夠利 用輸入為壓縮碼流時(shí)包含的編碼信息,且對(duì)于肥VC比較復(fù)雜的編碼器,編碼路徑多樣,實(shí) 現(xiàn)復(fù)雜度也會(huì)相對(duì)比較高。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明針對(duì)現(xiàn)有技術(shù)存在的上述不足,提出一種基于支持向量機(jī)的AVS到肥VC優(yōu) 化視頻轉(zhuǎn)碼方法,采用了簡(jiǎn)化的視頻轉(zhuǎn)碼框架,在訓(xùn)練階段將從AVS碼流提取出的特征向 量訓(xùn)練得到訓(xùn)練模型,然后在轉(zhuǎn)碼階段利用該模型對(duì)肥VC中的編碼單元?jiǎng)澐智闆r進(jìn)行區(qū) 域轉(zhuǎn)碼,同時(shí)結(jié)合快速模式選擇算法,減少了重編碼階段編碼單元?jiǎng)澐諻及模式選擇的復(fù) 雜度,大大提高了視頻轉(zhuǎn)碼速度,同時(shí)保證了有限了轉(zhuǎn)碼視頻質(zhì)量下降。
[0006] 本發(fā)明是通過(guò)W下技術(shù)方案實(shí)現(xiàn)的:
[0007] 本發(fā)明通過(guò)采集AVS碼流的特征向量,并利用支持向量機(jī)對(duì)其進(jìn)行學(xué)習(xí)并得到訓(xùn) 練模型,將提取出的AVS特征向量分為在肥VC中相應(yīng)位置的CU劃分或不劃分兩類,在轉(zhuǎn)碼 階段W訓(xùn)練模型預(yù)測(cè)CU是否需要?jiǎng)澐帧?br>[000引所述的AVS特征向量采集自AVS碼流,包括;宏塊編碼模式、運(yùn)動(dòng)向量和變換系數(shù) 等f(wàn)目息。
[0009] 所述的宏塊編碼模式是指;AVS中每個(gè)宏塊的模式信息。
[0010] 所述的運(yùn)動(dòng)向量是指;AVS中宏塊的平均運(yùn)動(dòng)向量大小。
[0011] 所述的變換系數(shù)是指;AVS編碼的離散余弦變換值CT)系數(shù)中非零系數(shù)的個(gè)數(shù)。
[0012] 所述的對(duì)應(yīng)關(guān)系是指;AVS特征向量與肥VC中編碼單元是否需要?jiǎng)澐滞ㄟ^(guò)學(xué)習(xí)得 到的訓(xùn)練模型,也即映射關(guān)系。
[001引所述的預(yù)測(cè),當(dāng)?shù)玫疆?dāng)前CU需要?jiǎng)澐謺r(shí),再在當(dāng)前肥VC的深度下分別進(jìn)行2NX2N模式和SKIP模式計(jì)算,并從該兩種模式中選擇出最優(yōu)預(yù)測(cè)模式,當(dāng)預(yù)測(cè)得到當(dāng)前CU不需要 進(jìn)行劃分,則按照肥VC標(biāo)準(zhǔn)編碼過(guò)程進(jìn)行最優(yōu)模式選擇。 技術(shù)效果
[0014] 與現(xiàn)有技術(shù)相比,本發(fā)明結(jié)合機(jī)器學(xué)習(xí)基本思想W及支持向量機(jī)學(xué)習(xí)方法,對(duì)視 頻學(xué)習(xí)得到訓(xùn)練模型并預(yù)測(cè)后續(xù)轉(zhuǎn)碼過(guò)程中肥VC編碼模式,從而降低了轉(zhuǎn)碼復(fù)雜度,提高 轉(zhuǎn)碼速度。整個(gè)轉(zhuǎn)碼過(guò)程分為兩個(gè)階段,即訓(xùn)練階段和轉(zhuǎn)碼階段。在訓(xùn)練階段,提取出AVS 特征向量和肥VC中相應(yīng)位置的CU劃分信息,根據(jù)支持向量機(jī)算法和工具訓(xùn)練得到兩者的 對(duì)應(yīng)關(guān)系,即訓(xùn)練模型;在轉(zhuǎn)碼階段,利用訓(xùn)練階段得到的模型,根據(jù)AVS的特征向量,對(duì)深 度為0和1時(shí)肥VC相應(yīng)位置CU是否劃分進(jìn)行預(yù)測(cè),若預(yù)測(cè)得到當(dāng)前CU需要?jiǎng)澐?,則對(duì)當(dāng) 前深度的CU只進(jìn)行SKIP和2化2N模式選擇,若預(yù)測(cè)得到當(dāng)前CU不需要?jiǎng)澐郑瑒t按照肥VC 標(biāo)準(zhǔn)過(guò)程對(duì)最優(yōu)模式進(jìn)行選擇。通過(guò)機(jī)器學(xué)習(xí)和快速模式選擇方法結(jié)合,可W自適應(yīng)的根 據(jù)每個(gè)序列自身的特征得到相應(yīng)訓(xùn)練模型,在保證轉(zhuǎn)碼視頻質(zhì)量下降有限的情況下,大大 減少了轉(zhuǎn)碼過(guò)程中的計(jì)算復(fù)雜度,從而提高了轉(zhuǎn)碼速度,節(jié)省了轉(zhuǎn)碼時(shí)間。
【附圖說(shuō)明】
[0015] 圖1是本發(fā)明轉(zhuǎn)碼框架圖;
[0016] 圖2是本發(fā)明流程圖。
【具體實(shí)施方式】
[0017] 下面對(duì)本發(fā)明的實(shí)施例作詳細(xì)說(shuō)明,本實(shí)施例在W本發(fā)明技術(shù)方案為前提下進(jìn)行 實(shí)施,給出了詳細(xì)的實(shí)施方式和具體的操作過(guò)程,但本發(fā)明的保護(hù)范圍不限于下述的實(shí)施 例。 實(shí)施例1
[001引如圖2所示,本實(shí)施例分為W下四個(gè)步驟:
[0019] 步驟一、采集AVS碼流的特征向量,具體為;采集AVS碼流中與對(duì)應(yīng)的肥VC中深度 為0和1時(shí)相應(yīng)位置CU劃分的信息。
[0020] 所述的AVS特征向量采集自AVS碼流,包括;宏塊編碼模式、運(yùn)動(dòng)向量和變換系數(shù) 等信息。
[0021] 所述的宏塊編碼模式是指;在AVS對(duì)應(yīng)的肥VC中深度為0時(shí),每個(gè)CU中包含有16 個(gè)宏塊,因此含有16個(gè)特征;在深度為1時(shí),每個(gè)CU中包含有4個(gè)宏塊,相應(yīng)的有4個(gè)模式 特征。
[002引所述的運(yùn)動(dòng)向量是指;AVS中運(yùn)動(dòng)向量是W8X8為單位,一個(gè)宏塊中包含4個(gè)運(yùn) 動(dòng)向量基本單元,每個(gè)運(yùn)動(dòng)向量分別取模,然后將一個(gè)宏塊中四個(gè)運(yùn)動(dòng)向量模的平均值作 為一個(gè)特征。同樣,深度為0時(shí)CU中含有16個(gè)運(yùn)動(dòng)特征,深度為1時(shí)含有4個(gè)運(yùn)動(dòng)特征。 運(yùn)動(dòng)向量模的平均值Vwg等于
【主權(quán)項(xiàng)】
1. 一種基于支持向量機(jī)的AVS到HEVC優(yōu)化視頻轉(zhuǎn)碼方法,其特征在于,通過(guò)采集AVS 碼流的特征向量,并利用支持向量機(jī)對(duì)其進(jìn)行學(xué)習(xí)并得到訓(xùn)練模型,將提取出的AVS特征 向量分為在HEVC中相應(yīng)位置的CU劃分或不劃分兩類,在轉(zhuǎn)碼階段以訓(xùn)練模型預(yù)測(cè)CU是 否需要?jiǎng)澐?,?dāng)?shù)玫疆?dāng)前CU需要?jiǎng)澐謺r(shí),再在當(dāng)前HEVC的深度下分別進(jìn)行2NX2N模式和 SKIP模式計(jì)算,并從這兩種模式中選擇出最優(yōu)預(yù)測(cè)模式,當(dāng)預(yù)測(cè)得到當(dāng)前CU不需要進(jìn)行劃 分,則按照HEVC標(biāo)準(zhǔn)編碼過(guò)程進(jìn)行最優(yōu)模式選擇。
2. 根據(jù)權(quán)利要求1所述的方法,其特征是,所述的AVS特征向量采集自AVS碼流,包括: 宏塊編碼模式、運(yùn)動(dòng)向量和變換系數(shù)。
3. 根據(jù)權(quán)利要求2所述的方法,其特征是,所述的宏塊編碼模式是指:AVS中每個(gè)宏 塊的模式信息;所述的運(yùn)動(dòng)向量是指:AVS中宏塊的平均運(yùn)動(dòng)向量大小;所述的變換系數(shù)是 指:AVS編碼的離散余弦變換系數(shù)中非零系數(shù)的個(gè)數(shù)。
4. 根據(jù)權(quán)利要求2或3所述的方法,其特征是,所述的宏塊編碼模式是指:在AVS對(duì)應(yīng) 的HEVC中深度為O時(shí),每個(gè)CU中包含有16個(gè)宏塊,因此含有16個(gè)特征;在深度為1時(shí),每 個(gè)CU中包含有4個(gè)宏塊,相應(yīng)的有4個(gè)模式特征;所述的運(yùn)動(dòng)向量是指:AVS中運(yùn)動(dòng)向量是 以8X8為單位,一個(gè)宏塊中包含4個(gè)運(yùn)動(dòng)向量基本單元,每個(gè)運(yùn)動(dòng)向量分別取模,然后將一 個(gè)宏塊中四個(gè)運(yùn)動(dòng)向量模的平均值作為一個(gè)特征,當(dāng)深度為〇時(shí)CU中含有16個(gè)運(yùn)動(dòng)特征, 深度為1時(shí)含有4個(gè)運(yùn)動(dòng)特征;所述的變換系數(shù)是指:AVS中DCT也是以8X8塊為單位,將 一個(gè)宏塊內(nèi)所有DCT系數(shù)中非零系數(shù)的個(gè)數(shù)作為一個(gè)特征,當(dāng)深度為O時(shí)含有16個(gè)DCT系 數(shù)特征,深度為1時(shí)含有4個(gè)DCT系數(shù)特征。
5. 根據(jù)權(quán)利要求1所述的方法,其特征是,所述的最優(yōu)預(yù)測(cè)模式是指:對(duì)2NX2N和 SKIP模式進(jìn)行率失真比較,選擇出的率失真代價(jià)最小的編碼模式。
6. 根據(jù)權(quán)利要求1所述的方法,其特征是,所述的最優(yōu)模式選擇是指:對(duì)HEVC中所有 的編碼模式進(jìn)行率失真的比較,從而選擇出率失真代價(jià)最小的過(guò)程。
【專利摘要】一種基于支持向量機(jī)的AVS到HEVC優(yōu)化視頻轉(zhuǎn)碼方法,通過(guò)采集AVS碼流的特征向量,并利用支持向量機(jī)對(duì)其進(jìn)行學(xué)習(xí)并得到訓(xùn)練模型,將提取出的AVS特征向量分為在HEVC中相應(yīng)位置的CU劃分或不劃分兩類,在轉(zhuǎn)碼階段以訓(xùn)練模型預(yù)測(cè)CU是否需要?jiǎng)澐?,?dāng)?shù)玫疆?dāng)前CU需要?jiǎng)澐謺r(shí),再在當(dāng)前HEVC的深度下分別進(jìn)行2N×2N模式和SKIP模式計(jì)算,并從這兩種模式中選擇出最優(yōu)預(yù)測(cè)模式,當(dāng)預(yù)測(cè)得到當(dāng)前CU不需要進(jìn)行劃分,則按照HEVC標(biāo)準(zhǔn)編碼過(guò)程進(jìn)行最優(yōu)模式選擇。本發(fā)明結(jié)合了機(jī)器學(xué)習(xí)基本思想,將整個(gè)轉(zhuǎn)碼過(guò)程分為了訓(xùn)練階段和轉(zhuǎn)碼階段,通過(guò)學(xué)習(xí)得到訓(xùn)練模型,預(yù)測(cè)HEVC中CU的劃分,并結(jié)合快速模式選擇算法,既提高了轉(zhuǎn)碼的速度,又保證了轉(zhuǎn)碼后視頻的整體視頻質(zhì)量。
【IPC分類】H04N19-103, H04N19-147, H04N19-40
【公開(kāi)號(hào)】CN104837019
【申請(qǐng)?zhí)枴緾N201510215888
【發(fā)明人】解蓉, 羅瑞, 張文軍, 張良
【申請(qǐng)人】上海交通大學(xué)
【公開(kāi)日】2015年8月12日
【申請(qǐng)日】2015年4月30日