欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種電視廣播媒體音視頻數(shù)據(jù)的壓縮方法與流程

文檔序號(hào):12628448閱讀:703來(lái)源:國(guó)知局
一種電視廣播媒體音視頻數(shù)據(jù)的壓縮方法與流程
本發(fā)明涉及一種電視廣播媒體音視頻數(shù)據(jù)的壓縮方法,屬于多媒體處理領(lǐng)域。
背景技術(shù)
:在電視廣播媒體的數(shù)據(jù)處理過(guò)程中,為方便音視頻文件的傳輸、充分利用帶寬,需要對(duì)音視頻數(shù)據(jù)進(jìn)行壓縮。然而音視頻數(shù)據(jù)中常包含一些沒(méi)有實(shí)際意義的空閑片段,所述空閑片段通常是畫(huà)面為與內(nèi)容不相干的純色且聲音為低于30分貝的底噪的片段??臻e片段的存在影響了壓縮后文件的大小?,F(xiàn)有技術(shù)中沒(méi)有提供一種方法能夠?qū)σ粢曨l中的空閑時(shí)間進(jìn)行識(shí)別和充分壓縮,音視頻數(shù)據(jù)壓縮率低。技術(shù)實(shí)現(xiàn)要素:為提高含有空閑時(shí)間的音視頻數(shù)據(jù)的壓縮率,本發(fā)明提出了一種電視廣播媒體音視頻數(shù)據(jù)的壓縮方法。本發(fā)明技術(shù)方案如下:一種電視廣播媒體音視頻數(shù)據(jù)的壓縮方法,步驟如下:(1)將由音頻流和視頻流所組成的原始音視頻數(shù)據(jù)文件以時(shí)長(zhǎng)2s為間隔分段成音視頻組,并按時(shí)間順序?yàn)橐粢曨l組中的音視頻片段標(biāo)定序號(hào);(2)建立數(shù)據(jù)頭信息;(3)使用BP神經(jīng)網(wǎng)絡(luò)依次對(duì)所述音視頻組中的音視頻片段進(jìn)行空閑識(shí)別,若識(shí)別為空閑片段則將記錄該片段的序號(hào)并將序號(hào)寫(xiě)入數(shù)據(jù)頭信息中;(4)將識(shí)別為空閑片段的音視頻片段使用時(shí)長(zhǎng)為2s、畫(huà)面為純黑色且聲音為無(wú)聲的音視頻片段替換;(5)將經(jīng)過(guò)替換后的音視頻組按序號(hào)順序重新組合為音視頻數(shù)據(jù)文件,并將組合后的音視頻數(shù)據(jù)文件壓縮為MPEG格式;步驟(3)中所述BP神經(jīng)網(wǎng)絡(luò)對(duì)音視頻片段進(jìn)行空閑識(shí)別的方法步驟為:(3-1)記該音視頻片段的音頻流碼率為x1,視頻流碼率為x2;將該音視頻片段轉(zhuǎn)換為RMVB格式,然后記RMVB格式下該片段的采樣率為x3,記RMVB格式下該片段的視頻流碼率與壓縮前的視頻流碼率之比為x4;計(jì)算該音視頻片段壓縮前的音頻流平均分貝值為x5;將x1、x2、x3、x4和x5作為一組輸入數(shù)據(jù)保存;(3-2)將所述輸入數(shù)據(jù)傳送至BP神經(jīng)網(wǎng)絡(luò)中進(jìn)行識(shí)別;該BP神經(jīng)網(wǎng)絡(luò)沿輸入至輸出方向依次設(shè)置有輸入層、預(yù)處理層、中間層和輸出層;所述輸入層包括用于輸入x1的輸入單元一、用于輸入x2的輸入單元二、用于輸入x3的輸入單元三、用于輸入x4的輸入單元四和用于輸入x5的輸入單元五;所述預(yù)處理層包括預(yù)處理單元一、預(yù)處理單元二、預(yù)處理單元三和預(yù)處理單元四;所述中間層包括中間單元一、中間單元二和中間單元三;所述輸出層包括輸出單元;所述輸入層、預(yù)處理層、中間層和輸出層分別為BP神經(jīng)網(wǎng)絡(luò)的第1層、第2層、第3層和第4層;所述輸入單元一、輸入單元二、輸入單元三、輸入單元四和輸入單元五分別為第1層的第1單元、第2單元、第3單元、第4單元和第5單元;所述預(yù)處理單元一、預(yù)處理單元二、預(yù)處理單元三和預(yù)處理單元四分別為第2層的第1單元、第2單元、第3單元和第4單元;所述中間單元一、中間單元二和中間單元三分別為第3層的第1單元、第2單元和第3單元;所述輸出單元為第4層的第1單元;設(shè)第l層第i單元的輸出值為偏置項(xiàng)為激活函數(shù)為第l層的單元總數(shù)為n(l),第l層第j單元的輸出值傳遞至第l+1層第i單元時(shí)的權(quán)值為則對(duì)于第1層:對(duì)于第2至4層:設(shè)和恒為0;BP神經(jīng)網(wǎng)絡(luò)根據(jù)輸入的數(shù)據(jù)判斷出該音視頻片段是否為空閑片段,結(jié)果由輸出層輸出。進(jìn)一步地:所述預(yù)處理層各單元的激活函數(shù)為:fi(l)(x)=e2x+8sin(x)3-1e2x+1-x,x≥0e2xsin(x),x<0.]]>進(jìn)一步地:所述中間層和輸出層各單元的激活函數(shù)為:fi(l)(x)=max(0,x+0.01ex)。進(jìn)一步地:BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法為:在背景噪聲分貝值低于30分貝的環(huán)境中錄制時(shí)長(zhǎng)1000s、畫(huà)面為純色的空閑音視頻數(shù)據(jù),并在背景噪聲分貝值為40分貝、45分貝、50分貝、60分貝和75分貝的環(huán)境中分別錄制時(shí)長(zhǎng)2000s的非空閑音視頻數(shù)據(jù),所述非空閑音視頻數(shù)據(jù)中的每一幀畫(huà)面都包括至少4個(gè)不同顏色,所述不同顏色是指在RGB顏色標(biāo)準(zhǔn)下紅、綠、藍(lán)三個(gè)通道的值至少有一個(gè)值有所不同;將錄制的空閑音視頻數(shù)據(jù)和非空閑音視頻數(shù)據(jù)各自以時(shí)長(zhǎng)2s為間隔分段成樣本片段,將來(lái)自空閑音視頻數(shù)據(jù)的樣本片段標(biāo)記為空閑片段,將來(lái)自非空閑音視頻數(shù)據(jù)的樣本片段標(biāo)記為非空閑片段;依次對(duì)所有樣本片段分別進(jìn)行如下處理:記樣本片段的音頻流碼率為x1,視頻流碼率為x2;將樣本片段轉(zhuǎn)換為RMVB格式,然后記RMVB格式下該片段的采樣率為x3,記RMVB格式下該片段的視頻流碼率與壓縮前的視頻流碼率之比為x4;計(jì)算該樣本片段壓縮前的音頻流平均分貝值為x5;將x1、x2、x3、x4和x5作為一組訓(xùn)練樣本輸入數(shù)據(jù)保存;使用訓(xùn)練樣本輸入數(shù)據(jù)結(jié)合各樣本片段原所對(duì)應(yīng)的空閑/非空閑標(biāo)記對(duì)BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練,訓(xùn)練時(shí)保持和恒為0。相對(duì)于現(xiàn)有技術(shù),本發(fā)明具有以下優(yōu)點(diǎn):(1)本發(fā)明利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)算法根據(jù)音視頻片段的特征信息識(shí)別出是否為空閑片段,并將空閑片段替換為純黑色且無(wú)聲的、便于被MPEG編碼算法識(shí)別和壓縮的純空閑音視頻片段,極大地方便了整個(gè)音視頻文件的壓縮,提高了壓縮率和壓縮速度;(2)本方法利用神經(jīng)網(wǎng)絡(luò)對(duì)音視頻數(shù)據(jù)進(jìn)行識(shí)別,具有非線(xiàn)性逼近能力強(qiáng)、判斷效率高和準(zhǔn)確率高的優(yōu)點(diǎn);(3)神經(jīng)網(wǎng)絡(luò)中引入了預(yù)處理層,由于在RMVB格式的壓縮過(guò)程中能夠盡可能地壓低采樣率和碼率,并且壓縮后的采樣率和視頻流碼率之間具有一定的相關(guān)性,因此預(yù)處理層中對(duì)部分權(quán)數(shù)進(jìn)行了強(qiáng)制設(shè)定,并將RMVB格式下該片段的采樣率x3和RMVB格式下該片段的視頻流碼率與壓縮前的視頻流碼率之比x4這兩種相關(guān)性較明顯但又無(wú)法完全合并的特征信息進(jìn)行了非完全性的合并處理,然后再將預(yù)處理層的結(jié)果輸出到中間層中,保證了后續(xù)的計(jì)算過(guò)程中x3和x4始終保有一定的相關(guān)性,從而提高了判斷結(jié)果的準(zhǔn)確性,同時(shí)也提高了訓(xùn)練的效率;(4)預(yù)處理層的激活函數(shù)設(shè)定充分考慮了x3和x4兩個(gè)特征信息非完全性合并處理在計(jì)算效率、微分求解難度和相關(guān)性保留方面的要求,具有求解、訓(xùn)練效率高和判斷準(zhǔn)確性高的優(yōu)點(diǎn)。附圖說(shuō)明圖1為本發(fā)明的流程示意圖。圖2為BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)示意圖。具體實(shí)施方式下面結(jié)合附圖詳細(xì)說(shuō)明本發(fā)明的技術(shù)方案:如圖1,一種電視廣播媒體音視頻數(shù)據(jù)的壓縮方法,步驟如下:(1)將由音頻流和視頻流所組成的原始音視頻數(shù)據(jù)文件以時(shí)長(zhǎng)2s為間隔分段成音視頻組,并按時(shí)間順序?yàn)橐粢曨l組中的音視頻片段標(biāo)定序號(hào);(2)建立數(shù)據(jù)頭信息;(3)使用BP神經(jīng)網(wǎng)絡(luò)依次對(duì)所述音視頻組中的音視頻片段進(jìn)行空閑識(shí)別,若識(shí)別為空閑片段則將記錄該片段的序號(hào)并將序號(hào)寫(xiě)入數(shù)據(jù)頭信息中;(4)將識(shí)別為空閑片段的音視頻片段使用時(shí)長(zhǎng)為2s、畫(huà)面為純黑色且聲音為無(wú)聲的音視頻片段替換;(5)將經(jīng)過(guò)替換后的音視頻組按序號(hào)順序重新組合為音視頻數(shù)據(jù)文件,并將組合后的音視頻數(shù)據(jù)文件壓縮為MPEG格式。步驟(3)中所述BP神經(jīng)網(wǎng)絡(luò)對(duì)音視頻片段進(jìn)行空閑識(shí)別的方法步驟為:(3-1)記該音視頻片段的音頻流碼率為x1,視頻流碼率為x2;將該音視頻片段轉(zhuǎn)換為RMVB格式,然后記RMVB格式下該片段的采樣率為x3,記RMVB格式下該片段的視頻流碼率與壓縮前的視頻流碼率之比為x4;計(jì)算該音視頻片段壓縮前的音頻流平均分貝值為x5;將x1、x2、x3、x4和x5作為一組輸入數(shù)據(jù)保存;(3-2)將所述輸入數(shù)據(jù)傳送至BP神經(jīng)網(wǎng)絡(luò)中進(jìn)行識(shí)別;如圖2,該BP神經(jīng)網(wǎng)絡(luò)沿輸入至輸出方向依次設(shè)置有輸入層、預(yù)處理層、中間層和輸出層;所述輸入層包括用于輸入x1的輸入單元一、用于輸入x2的輸入單元二、用于輸入x3的輸入單元三、用于輸入x4的輸入單元四和用于輸入x5的輸入單元五;所述預(yù)處理層包括預(yù)處理單元一、預(yù)處理單元二、預(yù)處理單元三和預(yù)處理單元四;所述中間層包括中間單元一、中間單元二和中間單元三;所述輸出層包括輸出單元;所述輸入層、預(yù)處理層、中間層和輸出層分別為BP神經(jīng)網(wǎng)絡(luò)的第1層、第2層、第3層和第4層;所述輸入單元一、輸入單元二、輸入單元三、輸入單元四和輸入單元五分別為第1層的第1單元、第2單元、第3單元、第4單元和第5單元;所述預(yù)處理單元一、預(yù)處理單元二、預(yù)處理單元三和預(yù)處理單元四分別為第2層的第1單元、第2單元、第3單元和第4單元;所述中間單元一、中間單元二和中間單元三分別為第3層的第1單元、第2單元和第3單元;所述輸出單元為第4層的第1單元;設(shè)第l層第i單元的輸出值為偏置項(xiàng)為激活函數(shù)為第l層的單元總數(shù)為n(l),第l層第j單元的輸出值傳遞至第l+1層第i單元時(shí)的權(quán)值為則對(duì)于第1層:對(duì)于第2至4層:設(shè)和恒為0;BP神經(jīng)網(wǎng)絡(luò)根據(jù)輸入的數(shù)據(jù)判斷出該音視頻片段是否為空閑片段,結(jié)果由輸出層輸出。所述預(yù)處理層各單元的激活函數(shù)為:fi(l)(x)=e2x+8sin(x)3-1e2x+1-x,x≥0e2xsin(x),x<0;]]>該激活函數(shù)的設(shè)定充分考慮了x3和x4兩個(gè)特征信息非完全性合并處理后在計(jì)算效率、微分求解難度和相關(guān)性保留方面的要求,具有求解、訓(xùn)練效率高和判斷準(zhǔn)確性高的優(yōu)點(diǎn);所述中間層和輸出層各單元的激活函數(shù)為:fi(l)(x)=max(0,x+0.01ex)。該BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法為:在背景噪聲分貝值低于30分貝的環(huán)境中錄制時(shí)長(zhǎng)1000s、畫(huà)面為純色的空閑音視頻數(shù)據(jù),并在背景噪聲分貝值為40分貝、45分貝、50分貝、60分貝和75分貝的環(huán)境中分別錄制時(shí)長(zhǎng)2000s的非空閑音視頻數(shù)據(jù),所述非空閑音視頻數(shù)據(jù)中的每一幀畫(huà)面都包括至少4個(gè)不同顏色,所述不同顏色是指在RGB顏色標(biāo)準(zhǔn)下紅、綠、藍(lán)三個(gè)通道的值至少有一個(gè)值有所不同;將錄制的空閑音視頻數(shù)據(jù)和非空閑音視頻數(shù)據(jù)各自以時(shí)長(zhǎng)2s為間隔分段成樣本片段,將來(lái)自空閑音視頻數(shù)據(jù)的樣本片段標(biāo)記為空閑片段,將來(lái)自非空閑音視頻數(shù)據(jù)的樣本片段標(biāo)記為非空閑片段;依次對(duì)所有樣本片段分別進(jìn)行如下處理:記樣本片段的音頻流碼率為x1,視頻流碼率為x2;將樣本片段轉(zhuǎn)換為RMVB格式,然后記RMVB格式下該片段的采樣率為x3,記RMVB格式下該片段的視頻流碼率與壓縮前的視頻流碼率之比為x4;計(jì)算該樣本片段壓縮前的音頻流平均分貝值為x5;將x1、x2、x3、x4和x5作為一組訓(xùn)練樣本輸入數(shù)據(jù)保存;使用訓(xùn)練樣本輸入數(shù)據(jù)結(jié)合各樣本片段原所對(duì)應(yīng)的空閑/非空閑標(biāo)記對(duì)BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練,訓(xùn)練時(shí)保持和恒為0。當(dāng)前第1頁(yè)1 2 3 
當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
精河县| 苏尼特左旗| 合川市| 乃东县| 九龙坡区| 夏津县| 两当县| 古田县| 织金县| 临清市| 浦城县| 太白县| 大连市| 盐池县| 南溪县| 河曲县| 新蔡县| 红原县| 遂溪县| 宜昌市| 乳山市| 沅陵县| 资中县| 漳平市| 瓮安县| 双桥区| 阜康市| 吴堡县| 繁峙县| 贵州省| 香格里拉县| 靖远县| 萨迦县| 申扎县| 微博| 广东省| 和田市| 米易县| 湄潭县| 卫辉市| 嘉祥县|