一種視頻處理方法及裝置制造方法
【專利摘要】本發(fā)明公開了一種視頻處理方法及裝置,用于解決在現(xiàn)有視頻圖像的拍攝過程中,未能實(shí)時獲取所拍攝到的視頻圖像中的目標(biāo)圖像的問題。本發(fā)明實(shí)施例的方法包括:接收從外界獲取的視頻圖像,確定視頻圖像中的目標(biāo)區(qū)域;針對目標(biāo)區(qū)域確定后接收到的每幀視頻圖像,根據(jù)該目標(biāo)區(qū)域的參數(shù)信息,對該幀視頻圖像進(jìn)行剪裁處理和矯正處理,獲得該幀視頻圖像中該目標(biāo)區(qū)域內(nèi)的圖像并輸出。由于采用本發(fā)明實(shí)施例的方法僅輸出每幀視頻圖像中目標(biāo)區(qū)域內(nèi)的圖像,從而提高了用戶體驗(yàn),減少了后期需要的處理。
【專利說明】一種視頻處理方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及多媒體影音【技術(shù)領(lǐng)域】,特別涉及一種視頻處理方法及裝置。
【背景技術(shù)】
[0002]目前的視頻拍攝設(shè)備,一般都是通過光學(xué)變焦將需要拍攝的圖像景物進(jìn)行放大和縮小,并對拍攝到的圖像的品質(zhì)(如顏色、曝光、白平衡等)進(jìn)行調(diào)整,從而得到所需的視頻。
[0003]在視頻圖像的內(nèi)容處理方面,目前的視頻拍攝設(shè)備,都只是對拍攝到的圖像作等比例縮放,然而在視頻拍攝過程中,有時我們僅需要關(guān)注拍攝到的視頻圖像中的特定區(qū)域內(nèi)的圖像,而該視頻圖像中的其他區(qū)域內(nèi)的圖像(如場景圖像)并不是我們所關(guān)注的。由于目前的視頻拍攝設(shè)備缺少對場景的智能分析、分割和處理,拍攝到的視頻圖像中不僅包含所關(guān)注的目標(biāo)圖像,還包含不需要關(guān)注的場景圖像,使得拍攝到的圖像中,目標(biāo)圖像一般都不是能夠覆蓋視場的最好效果,從而增加了后期制作的復(fù)雜度,也降低了用戶體驗(yàn)。
[0004]例如,在會場錄制PPT (PowerPoint)演講內(nèi)容時,關(guān)注的是演講者播放的PPT的內(nèi)容。在拍攝過程中,如果視頻拍攝設(shè)備不是位于PPT所在位置的中央位置,拍攝到的視頻圖像中除了包含所關(guān)注的PPT圖像外,還包含不需要關(guān)注的場景圖像,使得拍攝到的PPT圖像一般都不是能夠覆蓋視場的最好效果。類似的,在拍攝舞臺劇等這些具有特定區(qū)域內(nèi)容的場景時,都存在上述問題。
[0005]綜上所述,在視頻圖像的拍攝過程中,未能實(shí)時獲取所拍攝到的視頻圖像中的目標(biāo)圖像。
【發(fā)明內(nèi)容】
[0006]本發(fā)明實(shí)施例提供了一種視頻處理方法及裝置,用于解決在現(xiàn)有視頻圖像的拍攝過程中,未能實(shí)時獲取所拍攝到的視頻圖像中的目標(biāo)圖像的問題。
[0007]本發(fā)明實(shí)施例提供了一種視頻處理方法,該方法包括:
[0008]接收從外界獲取的視頻圖像,確定所述視頻圖像中的目標(biāo)區(qū)域;
[0009]針對所述目標(biāo)區(qū)域確定后接收到的每幀視頻圖像,根據(jù)所述目標(biāo)區(qū)域的參數(shù)信息,對該幀視頻圖像進(jìn)行剪裁處理,獲得該幀視頻圖像中所述目標(biāo)區(qū)域內(nèi)的圖像并輸出。
[0010]本發(fā)明實(shí)施例提供了一種視頻處理裝置,該裝置包括:
[0011]目標(biāo)區(qū)域確定單元,用于接收從外界獲取的視頻圖像,確定所述視頻圖像中的目標(biāo)區(qū)域;
[0012]處理單元,用于針對所述目標(biāo)區(qū)域確定后接收到的每幀視頻圖像,根據(jù)所述目標(biāo)區(qū)域的參數(shù)信息,對該幀視頻圖像進(jìn)行剪裁處理,獲得該幀視頻圖像中所述目標(biāo)區(qū)域內(nèi)的圖像并輸出。
[0013]本發(fā)明實(shí)施例中,接收從外界獲取的視頻圖像,確定接收到的視頻圖像中的目標(biāo)區(qū)域;針對目標(biāo)區(qū)域確定后接收到的每幀視頻圖像,根據(jù)該目標(biāo)區(qū)域的參數(shù)信息,對該幀視頻圖像進(jìn)行剪裁處理,獲得該幀視頻圖像中該目標(biāo)區(qū)域內(nèi)的圖像并輸出。由于僅輸出每幀視頻圖像中目標(biāo)區(qū)域內(nèi)的圖像,從而提高了用戶體驗(yàn),減少了后期需要的處理。
【專利附圖】
【附圖說明】
[0014]圖1為本發(fā)明實(shí)施例提供的一種視頻處理方法流程示意圖;
[0015]圖2為本發(fā)明實(shí)施例提供的一種確定視頻圖像目標(biāo)區(qū)域方式的流程示意圖;
[0016]圖3A?圖3E為本發(fā)明實(shí)施例提供的以PPT拍攝場景為例進(jìn)行視頻處理的示意圖;
[0017]圖4為本發(fā)明實(shí)施例提供的另一種視頻處理方法流程示意圖;
[0018]圖5為本發(fā)明實(shí)施例提供的一種進(jìn)行移動檢測的流程示意圖;
[0019]圖6為本發(fā)明實(shí)施例提供的視頻處理過程的時間軸示意圖;
[0020]圖7為本發(fā)明實(shí)施例提供的一種視頻處理裝置的結(jié)構(gòu)示意圖;
[0021]圖8為本發(fā)明實(shí)施例提供的另一種視頻處理裝置的結(jié)構(gòu)示意圖;
[0022]圖9為圖8所示的裝置的數(shù)據(jù)流流程和處理示意圖。
【具體實(shí)施方式】
[0023]下面結(jié)合說明書附圖對本發(fā)明實(shí)施例作進(jìn)一步詳細(xì)描述。
[0024]參見圖1所示,本發(fā)明實(shí)施例提供的一種視頻處理方法,包括:
[0025]步驟11、接收從外界獲取的視頻圖像,確定接收到的視頻圖像中的目標(biāo)區(qū)域;
[0026]步驟12、針對目標(biāo)區(qū)域確定后接收到的每幀視頻圖像,根據(jù)該目標(biāo)區(qū)域的參數(shù)信息,對該幀視頻圖像進(jìn)行剪裁處理,獲得該幀視頻圖像中該目標(biāo)區(qū)域內(nèi)的圖像并輸出。
[0027]本發(fā)明實(shí)施例的目標(biāo)區(qū)域?yàn)橐曨l圖像中的部分區(qū)域,該部分區(qū)域內(nèi)的圖像為用戶感興趣的內(nèi)容;而本發(fā)明實(shí)施例確定出的目標(biāo)區(qū)域是由目標(biāo)直線構(gòu)成的四邊形區(qū)域。
[0028]本發(fā)明實(shí)施例中,先確定接收到的視頻圖像中的目標(biāo)區(qū)域,然后針對后續(xù)接收到的每幀視頻圖像,根據(jù)該目標(biāo)區(qū)域的參數(shù)信息,對每幀視頻圖像進(jìn)行剪裁處理,從而獲得每幀視頻圖像中該目標(biāo)區(qū)域內(nèi)的圖像,并輸出每幀視頻圖像中該目標(biāo)區(qū)域內(nèi)的圖像。采用本發(fā)明實(shí)施例的方法,僅輸出每幀視頻圖像中目標(biāo)區(qū)域內(nèi)的圖像,提高了用戶體驗(yàn),減少了后期需要的處理。
[0029]在實(shí)施中,步驟11中,確定接收到的視頻圖像中的目標(biāo)區(qū)域,包括以下兩種方式:
[0030]方式A、在接收到視頻圖像時,按照設(shè)定的算法,自動確定視頻圖像中的目標(biāo)區(qū)域,參見圖2所示,具體包括以下步驟:
[0031]步驟21、對視頻圖像進(jìn)行邊緣檢測,得到該視頻圖像中各區(qū)域的邊緣信息;
[0032]優(yōu)選的,本步驟可以采用Sobel算法、Canny算法、Roberts算法、Prewitt算法、Krisch算法等對視頻圖像進(jìn)行邊緣檢測。
[0033]步驟22、根據(jù)得到的邊緣信息,對該視頻圖像進(jìn)行直線搜索處理;
[0034]優(yōu)選的,本步驟可以采用Hough變換算法、Freeman算法,PCA-HT算法等對視頻圖像進(jìn)行直線搜索處理。
[0035]步驟23、從搜索出的直線中,確定出至少三條目標(biāo)直線;以及
[0036]步驟24、根據(jù)確定出的目標(biāo)直線,確定視頻圖像的目標(biāo)區(qū)域。
[0037]進(jìn)一步,步驟23中,從搜索出的直線中,確定出至少三條目標(biāo)直線,具體包括:
[0038]從搜索出的所有直線中,確定出能夠形成邊角的直線,并計(jì)算出形成邊角的直線之間的交點(diǎn);以及
[0039]將計(jì)算出的所有交點(diǎn)按照區(qū)域進(jìn)行分組,在至少一組交點(diǎn)中,選擇出與該視頻圖像的中心點(diǎn)距離最大的交點(diǎn),并將該交點(diǎn)所在的兩條直線作為目標(biāo)直線,其中,視頻圖像以自身中心點(diǎn)所在的水平線和垂直線劃分為四個區(qū)域。
[0040]在實(shí)施中,步驟22中對視頻圖像進(jìn)行直線搜索處理后,搜索出的直線有可能是斷續(xù)的且未形成邊角的短直線,需要將該些短直線向兩邊進(jìn)行延長,以確定延長后的短直線是否能夠形成邊角。
[0041]需要說明的是,由于所拍攝的場景中,用戶感興趣的區(qū)域的形狀有可能不同,從而根據(jù)拍攝到的視頻圖像確定出的交點(diǎn)的數(shù)量有可能不同,進(jìn)而確定出的目標(biāo)直線的數(shù)量有可能不同。例如,使用PPT演講的場景中,用戶感興趣的區(qū)域?yàn)樵揚(yáng)PT的內(nèi)容,該場景下,感興趣的區(qū)域?yàn)榫匦?,根?jù)拍攝到的視頻圖像,針對每組交點(diǎn),從該組交點(diǎn)中,選擇出與該視頻圖像的中心點(diǎn)距離最大的交點(diǎn),從而能夠確定出四個交點(diǎn),進(jìn)而確定出的四條目標(biāo)直線,該四條目標(biāo)直線框出來的四邊形即為確定的目標(biāo)區(qū)域;
[0042]又如,舞臺劇場景中,用戶感興趣的區(qū)域?yàn)樵撐枧_內(nèi)的區(qū)域,而舞臺的頂部一般為圓拱形,其他三條邊為直線,該場景下,感興趣的區(qū)域?yàn)橐贿吺乔€且其他三邊是直線的封閉圖形,根據(jù)拍攝到的視頻圖像,確定出三條目標(biāo)直線(即底邊和兩個側(cè)邊),根據(jù)確定出的三條目標(biāo)直線以及設(shè)定的顯示比例,能夠確定出另一條目標(biāo)直線,該四條目標(biāo)直線框出來的四邊形即為確定的目標(biāo)區(qū)域。優(yōu)選的,設(shè)定的顯示比例可以為16:9或4:3等常用的顯示比例。
[0043]作為一種實(shí)現(xiàn)方式,若步驟23中確定出三條目標(biāo)直線,則步驟24中根據(jù)確定出的目標(biāo)直線,確定目標(biāo)區(qū)域,包括:
[0044]從確定出的三條目標(biāo)直線中,選擇出兩條僅具有一個交點(diǎn)的目標(biāo)直線;
[0045]根據(jù)設(shè)定的顯示比例,分別確定選擇出的兩條目標(biāo)直線的端點(diǎn);
[0046]根據(jù)確定出的該兩條目標(biāo)直線的端點(diǎn),確定出同時通過該兩個端點(diǎn)的直線,并將確定出的直線作為第四條目標(biāo)直線;以及
[0047]將確定出的四條目標(biāo)直線圍成的四邊形作為目標(biāo)區(qū)域。
[0048]具體的,從確定出的三條目標(biāo)直線中,選擇出兩條僅具有一個交點(diǎn)的目標(biāo)直線,記為LI和L2 ;根據(jù)設(shè)定的顯示比例(如16:9或4:3)以及一條具有兩個交點(diǎn)的目標(biāo)直線(記為L3)的長度,能夠確定出LI和L2的長度,從而能夠確定出LI和L2的端點(diǎn);根據(jù)確定的LI的端點(diǎn)與L2的端點(diǎn)能夠確定出一條直線,并將確定出的直線作為第四條目標(biāo)直線;該四條目標(biāo)直線能夠圍成一個四邊形,即目標(biāo)區(qū)域。
[0049]作為另一種實(shí)現(xiàn)形式,若步驟23中確定出四條目標(biāo)直線,則步驟24中根據(jù)確定出的目標(biāo)直線,確定目標(biāo)區(qū)域,包括:
[0050]將確定出的四條目標(biāo)直線圍成的四邊形作為目標(biāo)區(qū)域。
[0051]在實(shí)施中,步驟21中,對視頻圖像進(jìn)行邊緣檢測,具體包括:
[0052]對視頻圖像進(jìn)行二值化處理和濾波處理,去除該視頻圖像中的干擾信息,并對處理后的視頻圖像進(jìn)行邊緣檢測。
[0053]方式B、在接收到視頻圖像時,根據(jù)用戶的指示命令,確定出目標(biāo)區(qū)域;具體如下:
[0054]接收用于指定視頻圖像中的目標(biāo)區(qū)域的指示命令,并根據(jù)該指示命令確定出目標(biāo)區(qū)域。
[0055]具體的,用戶可以根據(jù)自身需要,通過按鍵方式或者觸摸點(diǎn)擊方式在視頻圖像中選擇出目標(biāo)區(qū)域。
[0056]在實(shí)施中,步驟11中,在接收從外界獲取的視頻圖像之后,確定接收到的視頻圖像中的目標(biāo)區(qū)域之前,還包括:
[0057]對從外界獲取的視頻圖像進(jìn)行曝光控制和對焦控制。其中,對視頻圖像進(jìn)行對焦控制,能夠保證目標(biāo)區(qū)域的圖像是最清晰的;對視頻圖像進(jìn)行曝光控制,能夠保證目標(biāo)區(qū)域的曝光正常,不會出現(xiàn)太亮或者太暗的情況,從而避免了其他區(qū)域的亮度干擾。
[0058]優(yōu)選的,僅對接收到的視頻圖像的中央?yún)^(qū)域進(jìn)行曝光控制和對焦控制;
[0059]其中,視頻圖像的中央?yún)^(qū)域指的是把該視頻圖像分為3X3的方塊,最中心的那一個方塊即為中央?yún)^(qū)域。
[0060]需要說明的是,由于此時還未確定出目標(biāo)區(qū)域,先將目標(biāo)區(qū)域設(shè)定在該視頻圖像中央?yún)^(qū)域,因此,可以僅對接收到的視頻圖像的中央?yún)^(qū)域進(jìn)行曝光控制和對焦控制,以保證目標(biāo)區(qū)域的圖像的清晰度及正常曝光。
[0061]在實(shí)施中,優(yōu)選的,在步驟11之后,步驟12中對該幀視頻圖像進(jìn)行剪裁處理之前,該方法還包括:
[0062]根據(jù)設(shè)定的顯示比例,對確定出的目標(biāo)區(qū)域的大小進(jìn)行調(diào)整,并將調(diào)整后的目標(biāo)區(qū)域作為最終的目標(biāo)區(qū)域。
[0063]優(yōu)選的,設(shè)定的顯示比例可以為16:9或4:3等常用的顯示比例。
[0064]在實(shí)施中,步驟12具體包括:
[0065]針對目標(biāo)區(qū)域確定后接收到的每幀視頻圖像,根據(jù)該目標(biāo)區(qū)域的參數(shù)信息及設(shè)定的顯示比例,對該幀視頻圖像中該目標(biāo)區(qū)域內(nèi)的圖像進(jìn)行剪裁處理和矯正處理。
[0066]由于拍攝角度的問題,確定出的目標(biāo)區(qū)域有可能不是矩形形狀,因此需要該視頻圖像中目標(biāo)區(qū)域內(nèi)的圖像進(jìn)行矯正處理,得到矩形形狀的圖像并輸出。
[0067]優(yōu)選的,按照公式一對該幀視頻圖像中目標(biāo)區(qū)域內(nèi)的圖像進(jìn)行矯正處理:
X1 = C1X + c2y + c3xy + C4
[0068]<......公式一;
J' = C5X + C6J + C7X); + C8
[0069]其中,X' ,Y'為該幀視頻圖像中目標(biāo)區(qū)域內(nèi)的圖像矯正后的坐標(biāo)值,x,y為該幀視頻圖像中目標(biāo)區(qū)域內(nèi)的圖像的坐標(biāo)值,C1?C8為已知的參數(shù)值。
[0070]具體的,本發(fā)明實(shí)施例對目標(biāo)區(qū)域內(nèi)的圖像進(jìn)行矯正采用逆變換的方式,也就是說先擴(kuò)展出一片預(yù)留給輸出圖像的空間,對于輸出的每一像素點(diǎn),查找原圖像中最佳的點(diǎn),原圖像與矯正后的圖像兩圖之間的關(guān)系通過上述雙線性方程來模擬。
[0071]需要說明的是,C1?C8通過目標(biāo)區(qū)域內(nèi)的原圖像的四個邊角的坐標(biāo)值以及矯正后的該圖像的四個邊角的坐標(biāo)值(即設(shè)定的輸出圖像的四個邊角的坐標(biāo)值)確定,由于共有8組對應(yīng)關(guān)系,因此可以解得C1?C8這8個參數(shù)的值。優(yōu)選的,為了獲得更好的顯示效果,對于上述8組對應(yīng)關(guān)系中的非整數(shù)值,進(jìn)行權(quán)重計(jì)算。
[0072]進(jìn)一步,為了方便用戶對確定出的目標(biāo)區(qū)域進(jìn)行調(diào)整,步驟11中,在確定出目標(biāo)區(qū)域之后,對該幀視頻圖像進(jìn)行剪裁處理之前,該方法還包括:
[0073]將確定的目標(biāo)區(qū)域的參數(shù)信息,疊加到視頻圖像中進(jìn)行顯示,以使在視頻圖像中能夠顯示出確定的目標(biāo)區(qū)域;
[0074]若接收到調(diào)整指令,根據(jù)該調(diào)整指令調(diào)整目標(biāo)區(qū)域的大小,將調(diào)整后的目標(biāo)區(qū)域作為最終的目標(biāo)區(qū)域;
[0075]若未接收到調(diào)整指令,將確定的目標(biāo)區(qū)域作為最終的目標(biāo)區(qū)域。
[0076]相應(yīng)的,針對最終的目標(biāo)區(qū)域確定后接收到的每幀視頻圖像,根據(jù)該最終的目標(biāo)區(qū)域的參數(shù)信息,對該幀視頻圖像進(jìn)行剪裁處理,獲得該幀視頻圖像中該最終的目標(biāo)區(qū)域內(nèi)的圖像并輸出。
[0077]優(yōu)選的,用戶可以通過點(diǎn)擊觸摸屏、點(diǎn)擊按鍵或其他人機(jī)交互方式對目標(biāo)區(qū)域進(jìn)行調(diào)整。
[0078]為了降低功耗以及避免某些場景的干擾,優(yōu)選的,該方法還包括:
[0079]實(shí)時獲取振動幅度,針對當(dāng)前獲取到的振動幅度,進(jìn)行如下處理:
[0080]若當(dāng)前獲取到的振動幅度大于設(shè)定的第一閾值,重新確定目標(biāo)區(qū)域;
[0081]若當(dāng)前獲取到的振動幅度大于設(shè)定的第二閾值且不大于第一閾值,進(jìn)行防抖處理;
[0082]其中,第一閾值與第二閾值均為經(jīng)驗(yàn)值,且第一閾值大于第二閾值,第一閾值及第二閾值可以根據(jù)實(shí)際拍攝場景進(jìn)行設(shè)定。
[0083]具體的,若當(dāng)前獲取到的振動幅度大于設(shè)定的第一閾值,我們認(rèn)為拍攝位置已發(fā)生了較大變化或拍攝場景已發(fā)生了變化,因此需要重新確定目標(biāo)區(qū)域;若當(dāng)前獲取到的振動幅度大于設(shè)定的第二閾值且不大于第一閾值,我們認(rèn)為是拍攝裝置發(fā)生了微小的抖動,因此僅需進(jìn)行防抖處理即可,無需重新確定目標(biāo)區(qū)域。
[0084]進(jìn)一步,若當(dāng)前獲取到的振動幅度不大于第二閾值,則不執(zhí)行任何操作。
[0085]在實(shí)施中,本發(fā)明實(shí)施例可以采用加速度傳感器、位移傳感器等檢測裝置實(shí)現(xiàn)對振動幅度的檢測,以加速度傳感器為例,包括以下處理過程:
[0086]實(shí)時查詢加速度傳感器的三個坐標(biāo)軸(即三維空間上的三個坐標(biāo)軸)上的坐標(biāo)值;
[0087]當(dāng)至少一個坐標(biāo)值的變化值大于第一閾值時,重新確定目標(biāo)區(qū)域,即執(zhí)行步驟11?步驟12 ;
[0088]當(dāng)至少一個坐標(biāo)值的變化值大于第二閾值且不大于第一閾值時,進(jìn)行防抖處理。
[0089]進(jìn)一步,當(dāng)檢測到的三個坐標(biāo)值的變化值不大于第二閾值時,不執(zhí)行任何操作。
[0090]進(jìn)一步,在拍攝過程中,還需要同時進(jìn)行音頻的錄制,具體的,通過麥克風(fēng)接收外界的音頻信息,并將接收到的音頻信息進(jìn)行編碼處理,從而在視頻拍攝過程中,將外界的音頻同時錄制下來。
[0091]下面結(jié)合以下具體實(shí)施例對本發(fā)明實(shí)施例的視頻處理方法進(jìn)行詳細(xì)說明。
[0092]實(shí)施例一、以PPT拍攝的場景為例,對本發(fā)明實(shí)施例的視頻處理方法進(jìn)行詳細(xì)說明,其他拍攝場景與此類似,此處不再一一舉例說明。
[0093]由于用戶感興趣的區(qū)域(即PPT所在的位置)在拍攝過程的亮度相對于其他區(qū)域來說會比較亮,參見圖3A所示,首先針對拍攝到的視頻圖像進(jìn)行優(yōu)化處理,將用戶感興趣的區(qū)域從視頻圖像中分割開來,具體的:采用中值濾波進(jìn)行處理,為了消除干擾,對視頻圖像先進(jìn)行一次腐蝕處理(erode算法),然后進(jìn)行兩次膨脹處理(dilate算法),最后再進(jìn)行一次腐蝕處理,得到如圖3B所示的二值化圖像,從而將視頻圖像中與感興趣區(qū)域無關(guān)的邊緣都屏蔽掉了。
[0094]其次,對處理后的二值化圖像進(jìn)行邊緣檢測(本實(shí)施例采用Canny算法進(jìn)行邊緣檢測),把該二值化圖像中的邊緣檢測出來,得到如圖3C所示的視頻圖像。
[0095]再次,根據(jù)得到的邊緣信息,進(jìn)行直線搜索(本實(shí)施例使用霍夫變換進(jìn)行直線搜索),搜索出來的直線在圖中用較粗的線表示,把能形成邊角的直線做運(yùn)算,算出這些直線的交點(diǎn),這樣就得到了所有可能成為目標(biāo)區(qū)域的四個邊角的交點(diǎn),如圖3C所示,其中,搜索出來的目標(biāo)區(qū)域的邊緣直線有可能是未形成邊角的短直線,如圖3C中的粗直線,此時,需要將各短直線向兩邊延長,以確定延長后的短直線是否形成邊角;
[0096]然后,對該視頻圖像中各區(qū)域(以視頻圖像的中心線為界,將該視頻圖像劃分為四個區(qū)域)內(nèi)的交點(diǎn)進(jìn)行判斷,把每個區(qū)域內(nèi)距離該視頻圖像的中心位置最遠(yuǎn)的交點(diǎn)選定為最佳點(diǎn)(即目標(biāo)區(qū)域的邊角的交點(diǎn)),從而確定出目標(biāo)區(qū)域的四個邊角的交點(diǎn),從而確定出目標(biāo)區(qū)域的四條邊線(即目標(biāo)直線),通過以上方法,就從搜索出的直線中找到框出來的最優(yōu)化的四邊形作為目標(biāo)區(qū)域,如圖3D所示。
[0097]在進(jìn)行直線搜索時,會受到鏡頭畸變的影響,優(yōu)選的,若拍攝時使用廣角鏡頭,則先進(jìn)行鏡頭畸變的修正,再進(jìn)行直線搜索,從而降低了搜索的難度。
[0098]盡管經(jīng)過了閾值處理(即中值濾波處理),還是會出現(xiàn)一些不需要的直線,需要對搜索到的直線進(jìn)行刪減,從而將一部分與目標(biāo)區(qū)域無關(guān)的直線進(jìn)行刪除。這些無關(guān)的線段主要包括:圖像中央的直線以及短直線;
[0099]具體的,對于圖像中央的線段,可以通過與該視頻圖像的中心點(diǎn)的距離來判斷,例如,若某條直線到中心點(diǎn)的距離小于設(shè)定的距離閾值,則確定該直線是圖像中央的直線;若該直線到中心點(diǎn)的距離不小于該距離閾值,則確定該直線不是圖像中央的直線;
[0100]對于短直線,可以通過該直線的長度來判斷,例如,若某條直線的長度小于設(shè)定的長度閾值,則確定該直線是短直線;若該直線的長度不小于該長度閾值,則確定該直線不是短直線。
[0101]優(yōu)選的,按照設(shè)定的原則,對搜索到的直線進(jìn)行刪減,刪除掉圖像中央的直線和/或短直線。
[0102]優(yōu)選的,為了找到最佳的四個邊角,對搜索到的直線進(jìn)行分組,分為上下左右四組。
[0103]最后,根據(jù)設(shè)定的顯示比例,對后續(xù)接收到的每幀視頻圖像中目標(biāo)區(qū)域內(nèi)的圖像進(jìn)行剪裁處理和矯正處理,從而獲取到矩形形狀的感興趣區(qū)域內(nèi)的圖像,如圖3E所示,圖3E中的(X,y)為每幀視頻圖像中目標(biāo)區(qū)域內(nèi)的圖像的各像素點(diǎn)的坐標(biāo)值,采用公式一對該幀視頻圖像中目標(biāo)區(qū)域內(nèi)的圖像進(jìn)行矯正處理后,其各像素點(diǎn)的坐標(biāo)值為(X’,y’)。
[0104]進(jìn)一步,獲取到的矩形形狀的感興趣區(qū)域內(nèi)的圖像輸出到后端進(jìn)行處理,主要包括:圖像編碼、圖像傳輸?shù)忍幚怼?br>
[0105]實(shí)施例二、本實(shí)施例提供了一個優(yōu)選的視頻處理過程,參見圖4所示,包括以下步驟:
[0106]步驟41、根據(jù)接收到的視頻圖像,確定目標(biāo)區(qū)域的參數(shù)信息;
[0107]步驟42、將確定的目標(biāo)區(qū)域的參數(shù)信息疊加到當(dāng)前接收到的每幀視頻圖像中進(jìn)行顯示;
[0108]步驟43、用戶根據(jù)顯示結(jié)果,判斷是否需要進(jìn)行調(diào)整;
[0109]若是,執(zhí)行步驟44;
[0110]若否,執(zhí)行步驟45;
[0111]步驟44、接收用戶的調(diào)整指令,并根據(jù)該調(diào)整指令,對目標(biāo)區(qū)域的大小進(jìn)行調(diào)整,并執(zhí)行步驟45 ;
[0112]步驟45、用戶確定是否為目標(biāo)區(qū)域;
[0113]若是,執(zhí)行步驟46;
[0114]若否,返回步驟41;
[0115]步驟46、配置圖形矯正參數(shù),并輸出每幀視頻圖像中目標(biāo)區(qū)域內(nèi)的矯正后的圖像;
[0116]具體的,根據(jù)目標(biāo)區(qū)域(若進(jìn)行了調(diào)整,則為調(diào)整后的目標(biāo)區(qū)域;若未進(jìn)行調(diào)整,則為初始確定的目標(biāo)區(qū)域)的四個邊角的坐標(biāo)值、以及設(shè)定的顯示比例,配置圖形矯正參數(shù)。
[0117]步驟47、進(jìn)行后續(xù)錄影錄像流程。
[0118]實(shí)施例三、本實(shí)施例提供了一種移動檢測的過程,本實(shí)施例中使用加速度傳感器進(jìn)行檢測,參見圖5所示,包括:
[0119]步驟51、啟動移動檢測;
[0120]步驟52、實(shí)時查詢加速度傳感器提供的數(shù)據(jù)(即該加速度傳感器的X、Y、Z三個坐標(biāo)軸的坐標(biāo)值);
[0121]步驟53、根據(jù)查詢到的三軸坐標(biāo)值,判斷自身是否移動;
[0122]若是(即至少一個坐標(biāo)軸上的坐標(biāo)值的變化值大于第二閾值),執(zhí)行步驟54 ;
[0123]若否(即三個坐標(biāo)軸上的坐標(biāo)值均不大于第二閾值),返回步驟52 ;
[0124]步驟54、判斷是否是小抖動;
[0125]若是(即至少一個坐標(biāo)軸上的坐標(biāo)值的變化值大于第二閾值且不大于第一閾值),執(zhí)行步驟55 ;
[0126]若否(即至少一個坐標(biāo)軸上的坐標(biāo)值的變化值大于第一閾值),執(zhí)行步驟56 ;
[0127]步驟55、進(jìn)行防抖處理;
[0128]步驟56、重新啟動目標(biāo)區(qū)域的檢測。
[0129]在視頻錄制過程中,參見圖6所示,視頻幀1?L的時間內(nèi)為目標(biāo)區(qū)域的確定階段,視頻幀L?Μ的時間內(nèi)為防抖穩(wěn)定階段,抖動和移動的檢測采用加速度傳感器來實(shí)現(xiàn),若在視頻幀Μ內(nèi),確定任一坐標(biāo)軸的坐標(biāo)值出現(xiàn)比較大的變化,則認(rèn)為拍攝場景發(fā)生了變化,需要重新確定目標(biāo)區(qū)域,對應(yīng)時間軸上的視頻幀Μ?Ν。
[0130]上述方法處理流程可以用軟件程序?qū)崿F(xiàn),該軟件程序可以存儲在存儲介質(zhì)中,當(dāng)存儲的軟件程序被調(diào)用時,執(zhí)行上述方法步驟。
[0131]基于同一發(fā)明構(gòu)思,本發(fā)明實(shí)施例中還提供了一種視頻處理裝置,由于該裝置解決問題的原理與上述視頻處理方法相似,因此該裝置的實(shí)施可以參見方法的實(shí)施,重復(fù)之處不再贅述。
[0132]參見圖7所示,本發(fā)明實(shí)施例提供的一種視頻處理裝置,包括:
[0133]目標(biāo)區(qū)域確定單元71,用于接收從外界獲取的視頻圖像,確定視頻圖像中的目標(biāo)區(qū)域;
[0134]處理單元72,用于針對目標(biāo)區(qū)域確定后接收到的每幀視頻圖像,根據(jù)目標(biāo)區(qū)域的參數(shù)信息,對該幀視頻圖像進(jìn)行剪裁處理,獲得該幀視頻圖像中該目標(biāo)區(qū)域內(nèi)的圖像并輸出。
[0135]在實(shí)施中,目標(biāo)區(qū)域確定單元71包括目標(biāo)區(qū)域識別模塊711,其中:
[0136]目標(biāo)區(qū)域識別模塊711用于對視頻圖像進(jìn)行邊緣檢測,得到視頻圖像中各區(qū)域的邊緣信息;根據(jù)得到的邊緣信息,對視頻圖像進(jìn)行直線搜索處理;從搜索出的直線中,確定出至少三條目標(biāo)直線;以及根據(jù)確定出的目標(biāo)直線,確定目標(biāo)區(qū)域;或者,
[0137]接收用于指定所述視頻圖像中的目標(biāo)區(qū)域的指示命令,根據(jù)該指示命令確定出目標(biāo)區(qū)域。
[0138]進(jìn)一步,目標(biāo)區(qū)域識別模塊711根據(jù)以下步驟對視頻圖像進(jìn)行邊緣檢測:
[0139]對視頻圖像進(jìn)行二值化處理和濾波處理,去除視頻圖像中的干擾信息,并對處理后的視頻圖像進(jìn)行邊緣檢測。
[0140]進(jìn)一步,目標(biāo)區(qū)域識別模塊711根據(jù)以下步驟從搜索出的直線中,確定出至少三條目標(biāo)直線:
[0141]從搜索出的所有直線中,確定出能夠形成邊角的直線,并計(jì)算出形成邊角的直線之間的交點(diǎn);以及將計(jì)算出的所有交點(diǎn)按照區(qū)域進(jìn)行分組,在至少一組交點(diǎn)中,選擇出與視頻圖像的中心點(diǎn)距離最大的交點(diǎn),并將該交點(diǎn)所在的兩條直線作為目標(biāo)直線,其中,視頻圖像以自身中心點(diǎn)所在的水平線和垂直線劃分為四個區(qū)域。
[0142]優(yōu)選的,目標(biāo)區(qū)域確定單元71包括圖像處理模塊712,其中:
[0143]圖像處理模塊712用于在接收從外界獲取的視頻圖像之后,確定視頻圖像中的目標(biāo)區(qū)域之前,對視頻圖像進(jìn)行曝光控制和對焦控制。
[0144]在實(shí)施中,優(yōu)選的,目標(biāo)區(qū)域識別模塊711還用于:
[0145]根據(jù)設(shè)定的顯示比例,對目標(biāo)區(qū)域的大小進(jìn)行調(diào)整,并將調(diào)整后的目標(biāo)區(qū)域作為最終的目標(biāo)區(qū)域。
[0146]在實(shí)施中,優(yōu)選的,目標(biāo)區(qū)域識別模塊711還用于:
[0147]將確定的目標(biāo)區(qū)域的參數(shù)信息,疊加到視頻圖像中進(jìn)行顯示;
[0148]若接收到調(diào)整指令,根據(jù)調(diào)整指令調(diào)整目標(biāo)區(qū)域的大小,將調(diào)整后的目標(biāo)區(qū)域作為最終的目標(biāo)區(qū)域;
[0149]若未接收到調(diào)整指令,將確定的目標(biāo)區(qū)域作為最終的目標(biāo)區(qū)域。
[0150]在實(shí)施中,處理單元72具體用于:
[0151]根據(jù)目標(biāo)區(qū)域的參數(shù)信息及設(shè)定的顯示比例,對該幀視頻圖像中目標(biāo)區(qū)域內(nèi)的圖像進(jìn)行剪裁處理和矯正處理。
[0152]在實(shí)施中,為了降低功耗以及避免某些場景的干擾,優(yōu)選的,該裝置還包括:
[0153]移動檢測單元73,用于實(shí)時獲取振動幅度,針對當(dāng)前獲取到的振動幅度,進(jìn)行如下處理:若當(dāng)前獲取到的振動幅度大于設(shè)定的第一閾值,重新確定目標(biāo)區(qū)域;若當(dāng)前獲取到的振動幅度大于設(shè)定的第二閾值且不大于第一閾值,進(jìn)行防抖處理;其中,第一閾值大于第二閾值。
[0154]在實(shí)施中,為了實(shí)現(xiàn)圖像與聲音的同步,優(yōu)選的,該裝置還包括:
[0155]音頻編碼單元,用于接收外界的音頻信息,并將接收到的音頻信息進(jìn)行編碼處理,從而在視頻拍攝過程中,將外界的音頻同時錄制下來。
[0156]下面給出本發(fā)明實(shí)施例的一種優(yōu)選的硬件實(shí)現(xiàn)方式,其中,目標(biāo)區(qū)域確定單元71及處理單元72的功能由處理器完成,移動檢測單元73的功能由加速度傳感器完成,音頻編碼單元的功能可以由音頻編碼器完成。
[0157]本發(fā)明實(shí)施例提供的視頻處理裝置可以應(yīng)用于DV、手機(jī)、PAD、等具有錄影錄像功能的電子設(shè)備中。
[0158]下面結(jié)合優(yōu)選實(shí)施例,對本發(fā)明提供的視頻處理裝置進(jìn)行詳細(xì)說明。
[0159]參見圖8所示,本實(shí)施例提供的視頻處理裝置包括:
[0160]圖像處理模塊81,用于對圖像傳感器獲得的圖像進(jìn)行優(yōu)化處理;其中,優(yōu)化處理包括但不限于下列方式中的一種或多種:
[0161]處理對焦控制、白平衡控制、曝光控制、對比度增強(qiáng)、色彩調(diào)整、鏡頭矯正、圖像噪點(diǎn)處理、圖像邊緣增強(qiáng)及色彩空間轉(zhuǎn)換。
[0162]目標(biāo)區(qū)域識別模塊82,用于分離出目標(biāo)區(qū)域的邊緣信息,確定目標(biāo)區(qū)域的形狀,查找出最佳的構(gòu)成四邊形。
[0163]需要說明的是,本實(shí)施例中的圖像處理模塊81及目標(biāo)區(qū)域識別模塊82所實(shí)現(xiàn)的功能,分別與圖7所示的實(shí)施例中的目標(biāo)區(qū)域確定單元71圖像處理模塊711及目標(biāo)區(qū)域識別模塊711所實(shí)現(xiàn)的功能相同。
[0164]目標(biāo)區(qū)域圖形矯正和顯示比例校正模塊83,用于獲得目標(biāo)區(qū)域的參數(shù)信息后,對后續(xù)接收到的每幀視頻圖像進(jìn)行剪裁處理和矯正恢復(fù)處理,獲得矩形形狀的目標(biāo)區(qū)域輸出圖像,并傳輸?shù)酱鎯δK87進(jìn)行存儲;
[0165]其中,輸出圖像的最終大小可以進(jìn)行設(shè)定,如果設(shè)定了最終的輸出圖像大小,目標(biāo)區(qū)域圖形矯正和顯示比例校正模塊會根據(jù)設(shè)定的比例對圖像進(jìn)行縮放并輸出。
[0166]后端處理模塊84,用于從存儲模塊87中獲取目標(biāo)區(qū)域輸出圖像,對目標(biāo)區(qū)域輸出圖像進(jìn)行編碼處理,并將處理后的圖像傳輸?shù)酱鎯δK87進(jìn)行存儲。
[0167]需要說明的是,本實(shí)施例中的目標(biāo)區(qū)域圖形矯正和顯示比例校正模塊83及后端處理模塊84所實(shí)現(xiàn)的功能,與圖7所示的實(shí)施例中的處理單元72所實(shí)現(xiàn)的功能相同。
[0168]移動檢測模塊85,用于進(jìn)行自身移動的檢測,在確定移動為小抖動時,進(jìn)行防抖處理;在確定移動為拍攝場景變換時,觸發(fā)目標(biāo)區(qū)域識別模塊82重新識別目標(biāo)區(qū)域;在確定未發(fā)生移動時,不執(zhí)行操作,從而提高了對場景變換檢測的可靠性和進(jìn)行防抖動處理。
[0169]需要說明的是,本實(shí)施例中的移動檢測模塊85所實(shí)現(xiàn)的功能,與圖7所示的實(shí)施例中的移動檢測單元73所實(shí)現(xiàn)的功能相同。
[0170]音頻編碼模塊86,用于對接收到的外界的音頻信息進(jìn)行編碼處理,并將處理后的音頻信息保存于存儲模塊87,從而把外界的聲音同步錄制下來。
[0171]需要說明的是,圖8所示的實(shí)施例與圖7所示的實(shí)施例對視頻處理裝置的各模塊的劃分不同,上述兩個實(shí)施例只是為了說明視頻處理裝置所能實(shí)現(xiàn)的功能,并非對視頻處理裝置的模塊劃分的限定,本領(lǐng)域技術(shù)人員可以根據(jù)該視頻處理裝置所能夠?qū)崿F(xiàn)的功能進(jìn)行模塊的劃分。
[0172]圖8所示的實(shí)施例中,數(shù)據(jù)流的處理過程可參見圖9所示,圖9中上半部分為視頻圖像的處理過程,包括圖像獲取過程,對接收到的視頻圖像的優(yōu)化處理(即圖中的圖像處理部分)過程,目標(biāo)區(qū)域的識別過程(即圖中的目標(biāo)區(qū)域識別部分),目標(biāo)區(qū)域的確定過程(即圖中的目標(biāo)區(qū)域設(shè)定部分,包括自動確定和用戶確定兩種方式),以及目標(biāo)區(qū)域的圖像矯正過程(即圖中的目標(biāo)區(qū)域圖像矯正部分);圖9中下半部分為音頻處理過程,對接收到的音頻數(shù)據(jù)進(jìn)行編碼處理(即圖中的音頻編碼部分)。
[0173]下面給出本實(shí)施例的一種優(yōu)選的硬件實(shí)現(xiàn)方式,由于本發(fā)明實(shí)施例提供的視頻處理裝置需要對視頻信號進(jìn)行實(shí)時的處理,對數(shù)據(jù)帶寬和實(shí)時性要求比較高,因此,本發(fā)明實(shí)施例提供的視頻處理裝置可以為單片SoCXSystem on Chip,系統(tǒng)級芯片,也稱為片上系統(tǒng))或FPGA(Field Programmable Gate Array,現(xiàn)場可編程門陣列)電路,其中,該SoC或FPGA能夠?qū)崿F(xiàn)本發(fā)明實(shí)施例提供的視頻處理裝置的目標(biāo)區(qū)域確定單元71、處理單元72以及移動檢測單元73的功能。本發(fā)明實(shí)施例不對SoC或FPGA的具體結(jié)構(gòu)(如邏輯電路等)進(jìn)行限定,凡是能實(shí)現(xiàn)本發(fā)明實(shí)施例的視頻處理裝置中各模塊的功能的SoC或FPGA的硬件結(jié)構(gòu),均涵蓋于本發(fā)明實(shí)施例中。
[0174]以圖8所示的視頻處理裝置為例,該裝置中的圖像處理模塊81、目標(biāo)區(qū)域識別模塊82、目標(biāo)區(qū)域圖形矯正和顯示比例校正模塊83、后端處理模塊84、移動檢測模塊85、音頻編碼模塊86、以及存儲器87(包括存儲器接口)的功能可以通過在單片SoC或FPGA上實(shí)現(xiàn)。
[0175]本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲介質(zhì)(包括但不限于磁盤存儲器、CD-ROM、光學(xué)存儲器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
[0176]本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合。可提供這些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機(jī)器,使得通過計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
[0177]這些計(jì)算機(jī)程序指令也可存儲在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲器中,使得存儲在該計(jì)算機(jī)可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
[0178]這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
[0179]盡管已描述了本發(fā)明的優(yōu)選實(shí)施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對這些實(shí)施例作出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實(shí)施例以及落入本發(fā)明范圍的所有變更和修改。
[0180]顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進(jìn)行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。
【權(quán)利要求】
1.一種視頻處理方法,其特征在于,該方法包括: 接收從外界獲取的視頻圖像,確定所述視頻圖像中的目標(biāo)區(qū)域; 針對所述目標(biāo)區(qū)域確定后接收到的每幀視頻圖像,根據(jù)所述目標(biāo)區(qū)域的參數(shù)信息,對該幀視頻圖像進(jìn)行剪裁處理,獲得該幀視頻圖像中所述目標(biāo)區(qū)域內(nèi)的圖像并輸出。
2.如權(quán)利要求1所述的方法,其特征在于,確定所述視頻圖像中的目標(biāo)區(qū)域,具體包括: 對所述視頻圖像進(jìn)行邊緣檢測,得到所述視頻圖像中各區(qū)域的邊緣信息; 根據(jù)得到的邊緣信息,對所述視頻圖像進(jìn)行直線搜索處理; 從搜索出的直線中,確定出至少三條目標(biāo)直線;以及 根據(jù)確定出的目標(biāo)直線,確定所述目標(biāo)區(qū)域。
3.如權(quán)利要求2所述的方法,其特征在于,對所述視頻圖像進(jìn)行邊緣檢測,具體包括: 對所述視頻圖像進(jìn)行二值化處理和濾波處理,去除所述視頻圖像中的干擾信息,并對處理后的視頻圖像進(jìn)行邊緣檢測。
4.如權(quán)利要求2所述的方法,其特征在于,從搜索出的直線中,確定出至少三條目標(biāo)直線,具體包括: 從搜索出的所有直線中,確定出能夠形成邊角的直線,并計(jì)算出形成邊角的直線之間的交點(diǎn); 將計(jì)算出的所有交點(diǎn)按照區(qū)域進(jìn)行分組,在至少一組交點(diǎn)中,選擇出與所述視頻圖像的中心點(diǎn)距離最大的交點(diǎn),并將該交點(diǎn)所在的兩條直線作為目標(biāo)直線,其中,所述視頻圖像以自身中心點(diǎn)所在的水平線和垂直線劃分為四個區(qū)域。
5.如權(quán)利要求1所述的方法,其特征在于,確定所述視頻圖像中的目標(biāo)區(qū)域,具體包括: 接收用于指定所述視頻圖像中的目標(biāo)區(qū)域的指示命令,并根據(jù)所述指示命令確定出目標(biāo)區(qū)域。
6.如權(quán)利要求1?5任一項(xiàng)所述的方法,其特征在于,在接收從外界獲取的視頻圖像之后,確定所述視頻圖像中的目標(biāo)區(qū)域之前,還包括: 對所述視頻圖像進(jìn)行曝光控制和對焦控制。
7.如權(quán)利要求1?5任一項(xiàng)所述的方法,其特征在于,在確定出所述目標(biāo)區(qū)域之后,且在對該幀視頻圖像進(jìn)行剪裁處理之前,還包括: 根據(jù)設(shè)定的顯示比例,對所述目標(biāo)區(qū)域的大小進(jìn)行調(diào)整,并將調(diào)整后的目標(biāo)區(qū)域作為最終的目標(biāo)區(qū)域。
8.如權(quán)利要求1?5任一項(xiàng)所述的方法,其特征在于,在確定出所述目標(biāo)區(qū)域之后,對該幀視頻圖像進(jìn)行剪裁處理之前,還包括: 將確定的所述目標(biāo)區(qū)域的參數(shù)信息,疊加到所述視頻圖像中進(jìn)行顯示; 若接收到調(diào)整指令,根據(jù)所述調(diào)整指令調(diào)整所述目標(biāo)區(qū)域的大小,將調(diào)整后的目標(biāo)區(qū)域作為最終的目標(biāo)區(qū)域; 若未接收到調(diào)整指令,將確定的所述目標(biāo)區(qū)域作為最終的目標(biāo)區(qū)域。
9.如權(quán)利要求1?5任一項(xiàng)所述的方法,其特征在于,針對所述目標(biāo)區(qū)域確定后接收到的每幀視頻圖像,根據(jù)所述目標(biāo)區(qū)域的參數(shù)信息,對該幀視頻圖像進(jìn)行剪裁處理,具體包括: 根據(jù)所述目標(biāo)區(qū)域的參數(shù)信息及設(shè)定的顯示比例,對該幀視頻圖像中所述目標(biāo)區(qū)域內(nèi)的圖像進(jìn)行剪裁處理和矯正處理。
10.如權(quán)利要求1?5任一項(xiàng)所述的方法,其特征在于,所述方法還包括: 實(shí)時獲取振動幅度,針對當(dāng)前獲取到的振動幅度,進(jìn)行如下處理: 若當(dāng)前獲取到的振動幅度大于設(shè)定的第一閾值,重新確定所述目標(biāo)區(qū)域; 若當(dāng)前獲取到的振動幅度大于設(shè)定的第二閾值且不大于所述第一閾值,進(jìn)行防抖處理; 其中,所述第一閾值大于所述第二閾值。
11.一種視頻處理裝置,其特征在于,該裝置包括: 目標(biāo)區(qū)域確定單元,用于接收從外界獲取的視頻圖像,確定所述視頻圖像中的目標(biāo)區(qū)域; 處理單元,用于針對所述目標(biāo)區(qū)域確定后接收到的每幀視頻圖像,根據(jù)所述目標(biāo)區(qū)域的參數(shù)信息,對該幀視頻圖像進(jìn)行剪裁處理,獲得該幀視頻圖像中所述目標(biāo)區(qū)域內(nèi)的圖像并輸出。
12.如權(quán)利要求11所述的裝置,其特征在于,所述目標(biāo)區(qū)域確定單元包括目標(biāo)區(qū)域識別模塊,其中:所述目標(biāo)區(qū)域識別模塊用于:對所述視頻圖像進(jìn)行邊緣檢測,得到所述視頻圖像中各區(qū)域的邊緣信息;根據(jù)得到的邊緣信息,對所述視頻圖像進(jìn)行直線搜索處理;從搜索出的直線中,確定出至少三條目標(biāo)直線;以及根據(jù)確定出的目標(biāo)直線,確定所述目標(biāo)區(qū)域;或者接收用于指定所述視頻圖像中的目標(biāo)區(qū)域的指示命令,根據(jù)所述指示命令確定出目標(biāo)區(qū)域。
13.如權(quán)利要求12所述的裝置,其特征在于,所述目標(biāo)區(qū)域識別模塊根據(jù)以下步驟對所述視頻圖像進(jìn)行邊緣檢測: 對所述視頻圖像進(jìn)行二值化處理和濾波處理,去除所述視頻圖像中的干擾信息,并對處理后的視頻圖像進(jìn)行邊緣檢測。
14.如權(quán)利要求12所述的裝置,其特征在于,所述目標(biāo)區(qū)域識別模塊根據(jù)以下步驟從搜索出的直線中,確定出至少三條目標(biāo)直線: 從搜索出的所有直線中,確定出能夠形成邊角的直線,并計(jì)算出形成邊角的直線之間的交點(diǎn);以及將計(jì)算出的所有交點(diǎn)按照區(qū)域進(jìn)行分組,在至少一組交點(diǎn)中,選擇出與所述視頻圖像的中心點(diǎn)距離最大的交點(diǎn),并將該交點(diǎn)所在的兩條直線作為目標(biāo)直線,其中,所述視頻圖像以自身中心點(diǎn)所在的水平線和垂直線劃分為四個區(qū)域。
15.如權(quán)利要求11?14任一項(xiàng)所述的裝置,其特征在于,所述目標(biāo)區(qū)域確定單元包括圖像處理模塊,其中: 所述圖像處理模塊用于:在接收從外界獲取的視頻圖像之后,確定所述視頻圖像中的目標(biāo)區(qū)域之前,對所述視頻圖像進(jìn)行曝光控制和對焦控制。
16.如權(quán)利要求11?14任一項(xiàng)所述的裝置,其特征在于,所述目標(biāo)區(qū)域識別模塊還用于: 根據(jù)設(shè)定的顯示比例,對所述目標(biāo)區(qū)域的大小進(jìn)行調(diào)整,并將調(diào)整后的目標(biāo)區(qū)域作為最終的目標(biāo)區(qū)域。
17.如權(quán)利要求11?14任一項(xiàng)所述的裝置,其特征在于,所述目標(biāo)區(qū)域識別模塊還用于: 將確定的所述目標(biāo)區(qū)域的參數(shù)信息,疊加到所述視頻圖像中進(jìn)行顯示; 若接收到調(diào)整指令,根據(jù)所述調(diào)整指令調(diào)整所述目標(biāo)區(qū)域的大小,將調(diào)整后的目標(biāo)區(qū)域作為最終的目標(biāo)區(qū)域; 若未接收到調(diào)整指令,將確定的所述目標(biāo)區(qū)域作為最終的目標(biāo)區(qū)域。
18.如權(quán)利要求11?14任一項(xiàng)所述的裝置,其特征在于,所述處理單元具體用于: 根據(jù)所述目標(biāo)區(qū)域的參數(shù)信息及設(shè)定的顯示比例,對該幀視頻圖像中所述目標(biāo)區(qū)域內(nèi)的圖像進(jìn)行剪裁處理和矯正處理。
19.如權(quán)利要求11?14任一項(xiàng)所述的裝置,其特征在于,所述裝置還包括: 移動檢測單元,用于實(shí)時獲取振動幅度,針對當(dāng)前獲取到的振動幅度,進(jìn)行如下處理:若當(dāng)前獲取到的振動幅度大于設(shè)定的第一閾值,重新確定所述目標(biāo)區(qū)域;若當(dāng)前獲取到的振動幅度大于設(shè)定的第二閾值且不大于所述第一閾值,進(jìn)行防抖處理;其中,所述第一閾值大于所述第二閾值。
【文檔編號】G06T7/00GK104301596SQ201310292305
【公開日】2015年1月21日 申請日期:2013年7月11日 優(yōu)先權(quán)日:2013年7月11日
【發(fā)明者】賴欽偉 申請人:炬芯(珠海)科技有限公司