欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于生成圖像的初始超像素標(biāo)簽圖的方法和裝置與流程

文檔序號:11288939閱讀:467來源:國知局
用于生成圖像的初始超像素標(biāo)簽圖的方法和裝置與流程
本原理涉及一種用于從圖像序列生成當(dāng)前圖像的初始超像素標(biāo)簽圖的方法和裝置。特別地,本原理涉及一種用于使用快速標(biāo)簽傳播方案從圖像序列生成當(dāng)前圖像的初始超像素標(biāo)簽圖的方法和裝置。
背景技術(shù)
:超像素算法代表用于廣泛的計算機(jī)視覺應(yīng)用(分割、圖像解析、分類等)的非常有用的和越來越流行的預(yù)處理步驟。將相似的像素分組成所謂的超像素導(dǎo)致圖像基元的較大減少,即允許對圖像進(jìn)行完整描述的特征的較大減少,其為后續(xù)處理步驟帶來增加的計算效率或者考慮到更復(fù)雜的算法,這在像素級上會是計算上不可行的,并且為基于區(qū)域的特征創(chuàng)建空間支持。超像素算法將像素分組成超像素,“它們是局部的、連貫的,并且以感興趣的規(guī)模保留大部分分割所需的結(jié)構(gòu)”[1]。超像素應(yīng)該“在大小和形狀上大致均勻”[1]。用于視頻內(nèi)容的許多近來的超像素算法依賴于密集光流向量來將分割結(jié)果從一幀傳播到下一幀。對光流質(zhì)量對于過分割質(zhì)量的影響的評估表明,對于具有大的物體位移和相機(jī)運(yùn)動的視頻來說,其為不可或缺的。然而,歸因于高計算成本,高質(zhì)量的、密集光流的計算不適用于實(shí)時應(yīng)用。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的目的是提出一種用于從圖像序列生成當(dāng)前圖像的初始超像素標(biāo)簽圖的改進(jìn)的解決方案。根據(jù)本原理的一個方面,一種用于從圖像序列生成當(dāng)前圖像的初始超像素標(biāo)簽圖的方法包括:-確定當(dāng)前圖像中的特征;-追蹤所確定的特征回到先前圖像中;以及-基于所追蹤的特征,將關(guān)聯(lián)到先前圖像的超像素標(biāo)簽圖變換成當(dāng)前圖像的初始超像素標(biāo)簽圖。因此,一種計算機(jī)可讀存儲介質(zhì),具有其中存儲的用于從圖像序列生成當(dāng)前圖像的初始超像素標(biāo)簽圖的指令,當(dāng)所述指令由計算機(jī)執(zhí)行時,使得計算機(jī):-確定當(dāng)前圖像中的特征;-追蹤所確定的特征回到先前圖像中;以及-基于所追蹤的特征,將關(guān)聯(lián)到先前圖像的超像素標(biāo)簽圖變換成當(dāng)前圖像的初始超像素標(biāo)簽圖。計算機(jī)可讀存儲介質(zhì)是非臨時性的易失性或非易失性存儲介質(zhì),諸如例如硬盤、光盤或磁盤或磁帶、固態(tài)存儲設(shè)備等。因此存儲介質(zhì)有形地體現(xiàn)可由計算機(jī)或處理設(shè)備執(zhí)行的指令的程序,以執(zhí)行如在此描述的程序步驟。此外,在一個實(shí)施例中,一種用于從圖像序列生成當(dāng)前圖像的初始超像素標(biāo)簽圖的裝置包括:-特征檢測器,其被配置為確定當(dāng)前圖像中的特征;-特征追蹤器,其被配置為追蹤所確定的特征回到先前圖像中;以及-變換器,其被配置為基于所追蹤的特征,將關(guān)聯(lián)到先前圖像的超像素標(biāo)簽圖變換成當(dāng)前圖像的初始超像素標(biāo)簽圖。在另一實(shí)施例中,一種用于從圖像序列生成當(dāng)前圖像的初始超像素標(biāo)簽圖的裝置包括處理設(shè)備和存儲設(shè)備,所述存儲設(shè)備具有其中存儲的指令,當(dāng)所述指令由處理設(shè)備執(zhí)行時,使得所述裝置:-確定當(dāng)前圖像中的特征;-追蹤所確定的特征回到先前圖像中;以及-基于所追蹤的特征,將關(guān)聯(lián)到先前圖像的超像素標(biāo)簽圖變換成當(dāng)前圖像的初始超像素標(biāo)簽圖。為了對超像素標(biāo)簽圖進(jìn)行變換,對于當(dāng)前圖像和先前圖像從所確定的特征生成由三角形組成的網(wǎng)格。然后將當(dāng)前圖像的網(wǎng)格向后變形到先前圖像的網(wǎng)格上。為此目的,針對當(dāng)前圖像中的每個三角形,確定用于將該三角形變換成先前圖像中的對應(yīng)三角形的仿射變換的變換矩陣。使用所確定的變換矩陣,將當(dāng)前圖像中的每個像素的坐標(biāo)變換成先前圖像中的經(jīng)變換的坐標(biāo)。然后,在每個像素位置處,利用在對應(yīng)的經(jīng)變換的像素位置處關(guān)聯(lián)到先前圖像的標(biāo)簽圖的標(biāo)簽,對當(dāng)前圖像的超像素標(biāo)簽圖進(jìn)行初始化。所提出的解決方案使用在稀疏特征追蹤和基于網(wǎng)格的圖像變形的基礎(chǔ)上的快速標(biāo)簽傳播方案。歸因于處理成本的大幅降低,該方法顯著加快了傳播處理。同時,最終的超像素分割質(zhì)量與使用高質(zhì)量的、密集光流的方法相當(dāng)。在一個實(shí)施例中,將經(jīng)變換的坐標(biāo)剪裁到最近的有效像素位置。以這種方式,確保對于當(dāng)前圖像的超像素標(biāo)簽圖中的每個像素位置,從關(guān)聯(lián)到先前圖像的標(biāo)簽圖中分配的標(biāo)簽是明確的。在一個實(shí)施例中,在當(dāng)前圖像和先前圖像的每個角落處和每個邊界的中心處添加特征。這確保每個像素被三角形覆蓋。在一個實(shí)施例中,將與初始超像素標(biāo)簽圖中的主要大量超像素分離的像素分配給相鄰超像素。這保證了超像素的空間一致性。所描述的方法不僅適用于時間圖像序列。它同樣可以用于多視圖圖像的各個圖像并且甚至用于多視圖圖像的序列。附圖說明圖1a)-b)示出了兩個原始剪裁幀k和k+1;圖2a)-b)示出了在幀k+1中找到并且追蹤回到幀k中的稀疏特征;圖3a)-b)描繪了從特征點(diǎn)的三角測量中獲得并且通過所追蹤的特征的移動而形變的網(wǎng)格;圖4a)-b)圖示了通過根據(jù)用于幀k+1的初始化的網(wǎng)格的形變的仿射變換進(jìn)行的幀k的超像素標(biāo)簽圖的變形;圖5圖示了從幀k到幀k+1的被三角形覆蓋的標(biāo)簽信息的變形;圖6示出了作為每幀分割質(zhì)量的度量的2d邊界回憶;圖7描繪了關(guān)于超體素的數(shù)量繪制的3d欠分割誤差;圖8示出了關(guān)于每幀超像素的數(shù)量的3d欠分割誤差;圖9描繪了關(guān)于每幀超像素的數(shù)量的平均時間長度;圖10示意性地圖示了用于從圖像序列生成當(dāng)前圖像的初始超像素標(biāo)簽圖的方法的實(shí)施例;圖11示意性地描繪了根據(jù)本原理的用于從圖像序列生成當(dāng)前圖像的初始超像素標(biāo)簽圖的裝置的一個實(shí)施例;以及圖12示意性地圖示了根據(jù)本原理的用于從圖像序列生成當(dāng)前圖像的初始超像素標(biāo)簽圖的裝置的另一實(shí)施例。具體實(shí)施方式為了更好地理解,現(xiàn)在將參照附圖在下面的描述中更詳細(xì)地解釋一些實(shí)施例的原理。應(yīng)當(dāng)理解,所提出的解決方案不限于這些示例性實(shí)施例,并且在不脫離如所附權(quán)利要求中限定的本原理的范圍的情況下,也可以方便地組合和/或修改特定特征。針對兩個采樣視頻幀k(圖1a)中示出)和k+1(圖1b)中示出),用于快速標(biāo)簽傳播的當(dāng)前方法在圖1至圖4中可視化。在圖1中,原始幀被剪裁。在時間圖像序列的情況下,幀k和k+1是時間上連續(xù)的幀,盡管不一定是緊接連續(xù)的幀。在多視圖圖像的情況下,幀k和k+1是空間上相鄰的幀,盡管不一定是直接相鄰的幀。例如,在[3]和[4]中,代替如所進(jìn)行的計算密集光流,在當(dāng)前幀k與下一幀k+1之間僅追蹤一組稀疏特征,下一幀k+1的超像素標(biāo)簽圖需要被初始化。使用例如哈里斯角檢測器來針對幀k+1計算特征。在一個實(shí)施例中,使用[5]中描述的方法來選擇所謂的“良好”特征。使用例如kanade-lucas-tomasi(klt)特征追蹤器,這些特征被追蹤回到幀k。圖2示出了在幀k+1中找到的稀疏特征,在圖2b)中描繪,并被追蹤回到幀k,在圖2a)中描繪。如在[2]中提出的那樣,聚類過濾器消除可能的異常值。例如,使用delaunay三角測量,從幀k+1的特征生成網(wǎng)格,如圖3b)中所示。隨后,使用由klt特征追蹤器提供的信息,將網(wǎng)格(向后)變形到幀k的超像素標(biāo)簽圖上,如圖3a)中所示。在每個三角形中假設(shè)分段平面的情況下,使用仿射變換(具有變換矩陣)將每個三角形內(nèi)的標(biāo)簽從幀k(向前)變形到幀k+1上,如圖5中可見。使用三角形的三個追蹤特征點(diǎn)來確定幀k+1與k之間的每個三角形i的均勻坐標(biāo)中的變換矩陣ti,k+1:矩陣元素t1,i至t4,i確定旋轉(zhuǎn)、剪切和縮放,而元素t5,i至t6,i確定平移。使用該三角形的變換矩陣,可以將幀k+1中每個像素的均勻坐標(biāo)變換成幀k的坐標(biāo)將坐標(biāo)剪裁到最近的有效像素位置。這些用于查找?guī)琸的超像素標(biāo)簽圖中的標(biāo)簽,其在圖4a)中示出。針對幀k+1的生成的標(biāo)簽圖在圖4b)中示出。為了確保每個像素被三角形覆蓋,幀的四角處的特征和每個幀邊界的中間處的特征被插入和追蹤。有時在變形之后,由于變換,一些像素與主要大量的超像素分離。由于必須確保超像素的空間一致性,所以這些小部分被識別并分配給直接相鄰的超像素。由于在使用密集光流的情況下該步驟也是必需的,所以它不會產(chǎn)生額外的計算開銷。為了分析所提出的方法的性能,已經(jīng)執(zhí)行了一些基準(zhǔn)測量。結(jié)果呈現(xiàn)在圖6至圖9中。圖6示出了作為每幀分割質(zhì)量的度量的2d邊界回憶。圖7描繪了關(guān)于超體素的數(shù)量繪制的3d欠分割誤差。圖8示出了關(guān)于每幀超像素的數(shù)量的3d欠分割誤差。最后,圖9描繪了關(guān)于每幀超像素的數(shù)量的平均時間長度。為了比較而包括以下方法:·streamgbh(基于圖形的流式分層視頻分割),作為超體素算法的類別的代表[6];·四個版本的tsp(時間超像素):原始版本[3],利用horn&schunck[8]作為密集光流(w/hs),無光流(w/o光流),以及利用在此提出的方法(w/網(wǎng)格);·四個版本的tcs(時間一致超像素):原始版本[4],利用horn&schunck作為密集光流(w/hs),無光流(w/o光流),以及利用在此提出的方法(w/網(wǎng)格);·onlinevideoseeds,作為最先進(jìn)的方法,沒有利用光流信息[7]。從圖可以看出,所提出的基于網(wǎng)格的傳播方法產(chǎn)生相當(dāng)?shù)姆指钫`差,而平均時間長度僅略微降低。雖然2d邊界回憶對于方法tspw/網(wǎng)格而言保持不變,但是對于方法tcsw/網(wǎng)格而言它甚至是改進(jìn)的。為了在計算成本方面評估運(yùn)行時間性能改進(jìn),測量了基于密集光流的標(biāo)簽傳播和基于網(wǎng)格的傳播的平均運(yùn)行時間。因此,在原始版本的tsp和tcs以及horn&schunck實(shí)現(xiàn)方式中使用的標(biāo)簽傳播方法被用作參考。在具有32gb的ram的因特爾i7-3770k@3.50ghz上完成了性能基準(zhǔn)。結(jié)果總結(jié)在表1中。從表1可以看出,所提出的方法執(zhí)行超像素標(biāo)簽傳播任務(wù)比原始提出的方法快100倍以上,同時創(chuàng)建幾乎相同的分割質(zhì)量,如圖6至圖9中可見。標(biāo)簽傳播方法平均時間/幀tsp和tcs中使用的方法814.9毫秒horn&schunck114.3毫秒所提出的方法6.1毫秒表1-將超像素標(biāo)簽圖傳播到新的幀上所需的平均運(yùn)行時間圖10示意性地圖示了用于從圖像序列生成當(dāng)前圖像的初始超像素標(biāo)簽圖的方法的一個實(shí)施例。在第一步驟中,確定10當(dāng)前圖像中的特征。然后追蹤11所確定的特征回到先前圖像中?;谒粉櫟奶卣?,將與先前圖像相關(guān)聯(lián)的超像素標(biāo)簽圖變換12成當(dāng)前圖像的初始超像素標(biāo)簽圖。在圖11中示意性地描繪根據(jù)本原理的用于從圖像序列生成當(dāng)前圖像的初始超像素標(biāo)簽圖的裝置20的一個實(shí)施例。裝置20具有輸入端21,用于例如從網(wǎng)絡(luò)或外部存儲系統(tǒng)接收圖像序列。替選地,從本地存儲單元22取回圖像序列。特征檢測器23確定10當(dāng)前圖像中的特征。然后,特征追蹤器24追蹤11所確定的特征回到先前圖像中?;谒粉櫟奶卣?,變換器25將與先前圖像相關(guān)聯(lián)的超像素標(biāo)簽圖變換12成當(dāng)前圖像的初始超像素標(biāo)簽圖。所得到的初始超像素標(biāo)簽圖優(yōu)選地經(jīng)由輸出端26成為可用。其也可以存儲在本地存儲單元22上。輸出端26還可以與輸入端21組合成單個雙向接口。不同的單元23、24、25中的每一個可以被實(shí)現(xiàn)為不同的處理器。當(dāng)然,不同的單元23、24、25同樣可以完全或部分地組合成單個單元或者實(shí)現(xiàn)為在處理器上運(yùn)行的軟件。在圖12中示意性地示出根據(jù)本原理的用于從圖像序列生成當(dāng)前圖像的初始超像素標(biāo)簽圖的裝置30的另一個實(shí)施例。裝置30包括處理設(shè)備31和存儲設(shè)備32,存儲設(shè)備32存儲指令,當(dāng)指令被執(zhí)行時,使裝置執(zhí)行根據(jù)所描述的方法之一的步驟。例如,處理設(shè)備31可以是適應(yīng)于執(zhí)行根據(jù)所描述的方法之一的步驟的處理器。在實(shí)施例中,所述適應(yīng)包括:處理器被配置例如編程為以執(zhí)行根據(jù)所描述的方法之一的步驟。在此使用的處理器可以包括一個或多個處理單元,諸如微處理器、數(shù)字信號處理器或其組合。本地存儲單元22和存儲設(shè)備32可以包括易失性和/或非易失性存儲器區(qū)域,以及諸如硬盤驅(qū)動器和dvd驅(qū)動器的存儲設(shè)備。存儲器的一部分是可由處理設(shè)備31讀取的非臨時性程序存儲設(shè)備,其有形地體現(xiàn)可由處理設(shè)備31執(zhí)行的指令的程序,以執(zhí)行根據(jù)本原理在此描述的程序步驟。參考文獻(xiàn)[1]ren等人:“l(fā)earningaclassificationmodelforsegmentation”,ieeeinternationalconferenceoncomputervision(iccv)(2003),第10–17頁。[2]munderloh等人:“mesh-basedglobalmotioncompensationforrobustmosaickinganddetectionofmovingobjectsinaerialsurveillance”,ieeecomputersocietyconferenceoncomputervisionandpatternrecognition(cvpr)(2011),1stworkshopofaerialvideoprocessing(wavp),第1–6頁。[3]chang等人:“avideorepresentationusingtemporalsuperpixels”,ieeeconferenceoncomputervisionandpatternrecognition(cvpr)(2013),第2051–2058頁。[4]reso等人:“superpixelsforvideocontentusingacontour-basedemoptimization”,asianconferenceoncomputervision(accv)(2014),第1–16頁。[5]shi等人:“goodfeaturestotrack”,ieeeconferenceoncomputervisionandpatternrecognition(cvpr)(1994),第593-600頁。[6]xu等人:“streaminghierarchicalvideosegmentation”,europeanconferenceoncomputervision(eccv)(2012),第1-14頁。[7]vandenbergh等人:“onlinevideoseedsfortemporalwindowobjectness”,ieeeinternationalconferenceoncomputervision(iccv)(2013),第377–384頁。[8]horn等人:“determiningopticalflow”,artificialintelligence,vol.17(1981),第185–203頁。當(dāng)前第1頁12
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
女性| 桦南县| 庄河市| 昌图县| 清丰县| 鄂托克前旗| 东阿县| 衡南县| 铅山县| 三河市| 淳化县| 府谷县| 鄄城县| 平遥县| 吉首市| 乌兰县| 北票市| 汕尾市| 靖江市| 全南县| 兴和县| 麻阳| 武宁县| 平潭县| 唐山市| 绥芬河市| 华蓥市| 罗源县| 昌图县| 古浪县| 杨浦区| 曲沃县| 新疆| 雷州市| 周至县| 西藏| 清河县| 湟源县| 济宁市| 阿拉尔市| 金昌市|