專利名稱:影像壓縮方法
技術(shù)領(lǐng)域:
本發(fā)明是有關(guān)于一種影像壓縮方法,尤指一種將各式影音媒體轉(zhuǎn)換為3GP影像時(shí),能夠確保影像轉(zhuǎn)換品質(zhì)、正確的顯示比例以及達(dá)到影像容量大小、占用頻寬的監(jiān)控的影像壓縮方法。
背景技術(shù):
在目前主力為2G(代)行動(dòng)電話的市場中,行動(dòng)電話的影音傳輸受限于傳輸頻寬及技術(shù)瓶頸,制作3GP影像的環(huán)節(jié)尚未受到重視,在3G行動(dòng)電話即將崛起取代傳統(tǒng)2G通信之后,Nokia和Apple公司針對(duì)行動(dòng)電話的使用環(huán)境、播放平臺(tái)制訂出適合手機(jī)播放的影像規(guī)格3GP,但是到目前為止,規(guī)格制訂出來了,卻沒有一套較為妥善、標(biāo)準(zhǔn)的制作流程,傳統(tǒng)的使用技巧僅僅單純的將來源影像、聲音直接的匯入3GP的壓縮軟件內(nèi)。不進(jìn)行任何的前置處理,因此壓縮出來的3GP常會(huì)面臨比例不正確、畫質(zhì)不佳、播放不流暢、無法正確播放的問題,誠屬美中不足之處。
發(fā)明內(nèi)容
為解決上述現(xiàn)有技術(shù)的缺點(diǎn),本發(fā)明的主要目的是提供一種影像壓縮方法,以期在將各式影音媒體轉(zhuǎn)換為3GP影像時(shí),能夠確保影像轉(zhuǎn)換品質(zhì)、正確的顯示比例以及達(dá)到影像容量大小、占用頻寬的監(jiān)控。
為達(dá)上述的目的,本發(fā)明的影像壓縮方法,其是應(yīng)用于可攜式裝置的影像壓縮及傳輸,包括下列步驟素材分離,將素材中的影音數(shù)據(jù)進(jìn)行影像、音頻及字幕的分離;裁切及尺寸變更,將該影像數(shù)據(jù)進(jìn)行裁切及尺寸變更,以得到每像素長寬正確顯示比例;幀速率變更,降低該影像數(shù)據(jù)的幀播放速率;素材重整,將裁切及變更后的影像數(shù)據(jù)與音頻及字幕予以重整;以及壓縮及傳輸,將重整后的影音數(shù)據(jù)壓縮后予以傳輸出去。
圖1為一示意圖,其繪示本發(fā)明一較佳實(shí)施例的影像壓縮方法的流程示意圖。
具體實(shí)施例方式
請(qǐng)參照?qǐng)D1,其繪示本發(fā)明一較佳實(shí)施例的影像壓縮方法的流程示意圖。如圖所示,本發(fā)明的影像壓縮方法,其是應(yīng)用于可攜式裝置的影像壓縮及傳輸,例如但不限于第三代手機(jī),且其傳輸速率是為128Kbps,其包括下列步驟素材分離,將素材中的影音數(shù)據(jù)進(jìn)行影像、音頻及字幕的分離(步驟1);裁切及尺寸變更,將該影像數(shù)據(jù)進(jìn)行裁切及尺寸變更,以得到每像素長寬正確顯示比例(步驟2);幀速率變更,降低該影像數(shù)據(jù)的幀播放速率(步驟3);素材重整,將裁切及變更后的影像數(shù)據(jù)與音頻及字幕予以重整(步驟4);以及壓縮及傳輸,將重整后的影音數(shù)據(jù)壓縮后予以傳輸出去(步驟5)。
于該步驟1中,該素材可為DVD、VCD或Flash等,其中包括影像、音頻及字幕數(shù)據(jù),在本步驟中將影像、音頻及字幕予以分離,以方便后續(xù)步驟的處理于該步驟2中,將分離出的該影像數(shù)據(jù)進(jìn)行裁切及尺寸變更,以得到每像素長寬正確顯示比例;其中,每像素長寬的正確顯示比例是為1∶1。在本實(shí)施例中是以目前最易取得的素材『DVD』為例加以說明,但若變更其它不同類型媒體(比方說VCD、Flash.....etc),其操作方式雷同于本說明,但需依其顯示比例作適當(dāng)?shù)牟们屑俺叽缱兏纯伞R阅壳芭_(tái)灣電視播放的NTSC規(guī)格來說,雖然一般的電視都是以4∶3的方式呈現(xiàn),其所使用的影像解析為720*480,并非標(biāo)準(zhǔn)640*480,這是因?yàn)槊肯袼氐娘@示比例并非以標(biāo)準(zhǔn)的1∶1的方式顯示。所以若要正確地在手機(jī)上顯示,應(yīng)當(dāng)先還原回正確的顯示比例。
以一般D1畫質(zhì)(720*480)要還原回VGA(640*480)顯示,首先需裁切左右兩側(cè)的8個(gè)像素(Pixel)的同步信號(hào),以得到702*480,再使用最佳的尺寸變更(ReSize)的方式,將702*480變更尺寸為640*480,如此,便可得到每像素長寬1∶1的正確顯示比例。其中,該尺寸變更是使用Lanczos算法執(zhí)行尺寸變更。
此外,于該步驟2中進(jìn)一步包括將640*480影像分辨率變更為587*480影像分辨率的步驟,以一般手機(jī)(圖未示)所制訂的顯示比例176*144而言,其長寬的比例是為1.222∶1,因此,適合壓縮手機(jī)影像的正確尺寸應(yīng)該為587*480,然要將640*480的尺寸變更為587*480,則左右兩側(cè)必須減去53個(gè)像素(Pixel),得到481*480影像分辨率,再將裁切完成的影像重新透過Lanczos算法變更尺寸成176*144,以得到最適合壓縮手機(jī)傳輸影像的比例及尺寸。其中,該Lanczos算法是為現(xiàn)有技術(shù),故在此不擬贅述。
于該步驟3中,一般電視可顯示連續(xù)動(dòng)畫的原理是以每秒鐘連續(xù)播放約20幀(frame)以上的單張圖片,人類的視覺就會(huì)誤認(rèn)為是動(dòng)態(tài)的影像,而以目前電視NTSC的規(guī)格,播放的幀速率(Frame Rate)為每秒鐘30幀(30 Frames Per Sec.),但依據(jù)3GP的制訂規(guī)格,3GP的幀速率是為15FPS以下,因此,要將30FPS的速率變換為適合3GP影像的播放速率,就必須降低播放的幀速率,但若變更幀速率的方式不當(dāng),則影片播放速度會(huì)變得時(shí)快時(shí)慢,因此等比例地降低影像的播放幀速率才能維持影片播放的流暢度。
以3GP制訂的規(guī)格而言,將壓縮的播放率轉(zhuǎn)換為15FPS或是10FPS是較理想的播放速率。將30FPS的NTSC影片,以每兩幀抽除一幀方式進(jìn)行幀轉(zhuǎn)換,可以得到15FPS的播放率,或以每三幀抽取兩幀的方式獲得10FPS的播放率。在本實(shí)施例中,是以每三幀抽取兩幀的方式獲得10FPS的播放率為例加以說明,但并非用以限制本發(fā)明的范疇。
于該步驟4中,將裁切及變更后的影像數(shù)據(jù)與音頻及字幕予以重整,以便進(jìn)行后續(xù)步驟的壓縮。
于該步驟5中,將重整后的影音數(shù)據(jù)壓縮后予以傳輸出去;其中,影像的比特率(Bit Rate)一向都是決定影像品質(zhì)的主要關(guān)鍵,行動(dòng)電話受限于傳輸頻寬,因此影像的比特率無法像DVD般高達(dá)將近10Mbps的比特率,甚至連VCD的1152Kbps的標(biāo)準(zhǔn)也無法達(dá)到。以3G行動(dòng)電話移動(dòng)中的傳輸速率而言,僅限定最高比特率128Kbps,但是若想在傳輸中能夠更順利的播放以及降低影像在手機(jī)儲(chǔ)存卡中所占用的容量,那么就必須降低影像的比特率;然而,若貿(mào)然的降低影像比特率而不進(jìn)行其它項(xiàng)目的調(diào)整,雖然仍可達(dá)成上述兩個(gè)目的,但畫質(zhì)會(huì)產(chǎn)生嚴(yán)重的衰退,甚至到無法觀賞的程度。
因此,理想的調(diào)整手段有以下幾項(xiàng)1.幀播放速率的改變,依據(jù)本發(fā)明步驟3中的方式,降低幀播放速率,例如將15FPS降低至10FPS,則在相同的畫質(zhì)條件下,約可節(jié)省約1/3的比特率及影像占用空間;2.壓縮前的前置調(diào)整,在進(jìn)入3GP壓縮程序前,調(diào)整原始畫質(zhì)的亮度、對(duì)比、色相、飽和度,透過些微程度的調(diào)整,可在肉眼無法察覺的情況下減少因比特率降低而產(chǎn)生的馬賽克毛邊現(xiàn)象;3.二次通道壓縮(Two-Pass Encode),將影像的壓縮進(jìn)行兩次,第一次對(duì)影像的動(dòng)態(tài)數(shù)據(jù)進(jìn)行分析,第二次執(zhí)行正式壓縮,因?yàn)橛械谝徊襟E針對(duì)畫質(zhì)的分析,因此在第二次壓縮時(shí),可對(duì)畫質(zhì)的維持及容量進(jìn)行更有效率的掌握;以及4.降低音頻的取樣頻率、壓縮比特率,除了影像之外,影響整體比特率和容量的還有聲音,以目前手機(jī)的播放品質(zhì)及揚(yáng)聲設(shè)備而言,降低聲音的取樣及壓縮比特率并不會(huì)對(duì)觀賞產(chǎn)生影響。
為達(dá)到上述降低影像的比特率且不會(huì)影響影音數(shù)據(jù)的播放品質(zhì),本發(fā)明的壓縮及傳輸步驟(步驟5)進(jìn)一步包括下列次步驟一壓縮前的前置調(diào)整步驟(步驟51);第一次通道壓縮分析(步驟52);降低音頻的取樣頻率、壓縮比特率步驟(步驟53);以及第二次通道壓縮(步驟54)。
其中于步驟51中,在進(jìn)入壓縮前,先調(diào)整影像數(shù)據(jù)的亮度、對(duì)比、色相、飽和度,透過些微程度的調(diào)整,可在肉眼無法察覺的情況下減少因比特率降低而產(chǎn)生的馬賽克毛邊現(xiàn)象。
于步驟52中,通過由執(zhí)行第一次通道壓縮分析以第一次取得影像動(dòng)態(tài)數(shù)據(jù)的分析。
于步驟53中,通過由降低音頻的取樣頻率、壓縮比特率以降低影音數(shù)據(jù)中的音頻的取樣及壓縮比特率并不會(huì)對(duì)影像觀賞產(chǎn)生影響。
于步驟54中,該第二次通道壓縮步驟依據(jù)步驟52中第一次信道壓縮分析的數(shù)據(jù)結(jié)果進(jìn)行實(shí)質(zhì)的壓縮。
通過由上述次步驟,以達(dá)到降低影像的比特率且不會(huì)影響影音數(shù)據(jù)的播放品質(zhì)的目的。其中,于該二次通道壓縮步驟中可使用壓縮工具進(jìn)行壓縮,例如但不限于Apple公司的QuickTime程序或Nokia公司的Multimedia Converter程序執(zhí)行數(shù)據(jù)的壓縮。
此外,本發(fā)明的影像壓縮方法其于該幀速率變更步驟(步驟3)之前進(jìn)一步包括一去交錯(cuò)的步驟(步驟21),其可將NTSC系統(tǒng)的交錯(cuò)式影像信號(hào)變更為循序式掃描。在電視規(guī)格制訂時(shí),因?yàn)榧夹g(shù)瓶頸及制作成本的考量,所以采用交錯(cuò)式的方法,每秒以60個(gè)圖場(field)組合成30個(gè)幀(Frame)(Non DropFrame)。因?yàn)槊總€(gè)圖場只有半個(gè)完整的畫面,因此在物體移動(dòng)時(shí),會(huì)出現(xiàn)抽絲的現(xiàn)象,而一般行動(dòng)電話主要是以循序式掃瞄(Progressive),因此要先將電視播放的影像由交錯(cuò)式變更為循序式掃瞄,這樣在壓縮成行動(dòng)電話使用的影像時(shí)畫面才不會(huì)出現(xiàn)抽絲的現(xiàn)象,而圖場交錯(cuò)的方式依各原始媒體于去交錯(cuò)的圖場選擇,需針對(duì)不同的交錯(cuò)方式來處理圖場,若圖場的處理方式選擇錯(cuò)誤,會(huì)產(chǎn)生播放跳頓的現(xiàn)象,以一般DVD而言,幾乎都是奇圖場優(yōu)先。
所以,經(jīng)由本發(fā)明的實(shí)施,其將各式影音媒體轉(zhuǎn)換為3GP影像時(shí),能夠確保影像轉(zhuǎn)換品質(zhì)、正確的顯示比例以及達(dá)到影像容量大小、占用頻寬的監(jiān)控,因此,確可改進(jìn)現(xiàn)有影像壓縮方法的缺點(diǎn)。
本發(fā)明所揭示的,乃較佳實(shí)施例,舉凡局部的變更或修飾而于本發(fā)明的技術(shù)思想而為熟習(xí)該項(xiàng)技藝的人所易于推知的,俱不脫本發(fā)明的專利權(quán)范疇。
權(quán)利要求
1.一種影像壓縮方法,其是應(yīng)用于可攜式裝置的影像壓縮及傳輸,其特征在于,包括下列步驟素材分離,將素材中的影音數(shù)據(jù)進(jìn)行影像、音頻及字幕的分離;裁切及尺寸變更,將該影像數(shù)據(jù)進(jìn)行裁切及尺寸變更,以得到每像素長寬正確顯示比例;幀速率變更,降低該影像數(shù)據(jù)的幀播放速率;素材重整,將裁切及變更后的影像數(shù)據(jù)與音頻及字幕予以重整;以及壓縮及傳輸,將重整后的影音數(shù)據(jù)壓縮后予以傳輸出去。
2.如權(quán)利要求1所述的影像壓縮方法,其特征在于,所述該素材是為DVD、VCD或Flash;而該可攜式裝置是為一第三代手機(jī),且其傳輸速率是為128Kbps。
3.如權(quán)利要求1所述的影像壓縮方法,其特征在于,所述該裁切及尺寸變更步驟中,每像素長寬的正確顯示比例是為1∶1。
4.如權(quán)利要求1所述的影像壓縮方法,其特征在于,所述該裁切及尺寸變更的步驟中,其是將NTSC的720*480影像分辨率裁切左右兩邊各8個(gè)像素后得到702*480影像分辨率,再使用最佳的尺寸變更方式將702*480尺寸變更為640*480影像分辨率,以得到長寬1∶1的正確顯示比例。
5.如權(quán)利要求4所述的影像壓縮方法,其特征在于,進(jìn)一步包括將640*480影像分辨率變更為587*480影像分辨率的步驟。
6.如權(quán)利要求5所述的影像壓縮方法,其特征在于,進(jìn)一步包括將587*480影像分辨率裁切左右兩邊各53個(gè)像素后得到481*480影像分辨率,再使用最佳的尺寸變更方式將481*480尺寸變更為176*144影像分辨率的步驟。
7.如權(quán)利要求1所述的影像壓縮方法,其特征在于,所述該裁切及尺寸變更步驟中,該尺寸變更是使用Lanczos算法執(zhí)行尺寸變更。
8.如權(quán)利要求1所述的影像壓縮方法,其特征在于,所述該幀播放速率是為每秒鐘播放10個(gè)幀,其是將每秒30個(gè)幀的播放速度等比例的降低影像的播放幀速率以維持影像數(shù)據(jù)播放的流暢度。
9.如權(quán)利要求1所述的影像壓縮方法,其特征在于,所述該壓縮及傳輸步驟中進(jìn)一步包括一壓縮前的前置調(diào)整步驟;一第一次通道壓縮分析步驟;一降低音頻的取樣頻率、壓縮比特率步驟;以及一第二次通道壓縮步驟;其中,在該壓縮前的前置調(diào)整步驟中,在進(jìn)入壓縮步驟前,調(diào)整影像數(shù)據(jù)的亮度、對(duì)比、色相、飽和度,透過些微程度的調(diào)整,可在肉眼無法察覺的情況下減少因比特率降低而產(chǎn)生的馬賽克毛邊現(xiàn)象;在該第一次通道壓縮分析步驟中,可將影像數(shù)據(jù)執(zhí)行第一次信道壓縮分析以第一次取得影像動(dòng)態(tài)數(shù)據(jù)的分析;在該降低音頻的取樣頻率、壓縮比特率步驟中,可降低影音數(shù)據(jù)中的音頻的取樣及壓縮比特率并不會(huì)對(duì)影像觀賞產(chǎn)生影響;而在該第二次通道壓縮步驟中,其可依據(jù)該第一次通道壓縮分析步驟中分析所得的數(shù)據(jù)結(jié)果進(jìn)行實(shí)質(zhì)的壓縮。
10.如權(quán)利要求1所述的影像壓縮方法,其特征在于,所述該幀速率變更步驟的前進(jìn)一步包括一去交錯(cuò)的步驟,其可將NTSC系統(tǒng)的交錯(cuò)式影像信號(hào)變更為循序式掃描,且其中該去交錯(cuò)的步驟中是以奇圖場為優(yōu)先。
全文摘要
本發(fā)明是關(guān)于一種影像壓縮方法,其是應(yīng)用于可攜式裝置的影像壓縮及傳輸,包括下列步驟素材分離,將素材中的影音數(shù)據(jù)進(jìn)行影像、音頻及字幕的分離;裁切及尺寸變更,將該影像數(shù)據(jù)進(jìn)行裁切及尺寸變更,以得到每像素長寬正確顯示比例;幀速率變更,降低該影像數(shù)據(jù)的幀播放速率;素材重整,將裁切及變更后的影像數(shù)據(jù)與音頻及字幕予以重整;以及壓縮及傳輸,將重整后的影音數(shù)據(jù)壓縮后予以傳輸出去。
文檔編號(hào)H04N7/26GK1956541SQ20051011806
公開日2007年5月2日 申請(qǐng)日期2005年10月25日 優(yōu)先權(quán)日2005年10月25日
發(fā)明者黃翊證 申請(qǐng)人:影騰媒體科技股份有限公司