欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于局部哈希特征的視頻目標(biāo)實(shí)時(shí)跟蹤方法

文檔序號(hào):10489776閱讀:668來源:國(guó)知局
一種基于局部哈希特征的視頻目標(biāo)實(shí)時(shí)跟蹤方法
【專利摘要】本發(fā)明公開了一種基于感知哈希特征的視頻目標(biāo)跟蹤方法,其特征在于,包括以下步驟:(1)讀取待跟蹤視頻序列的第一幀;(2)在圖像中畫一恰好將目標(biāo)包圍的矩形框,作為目標(biāo)框;(3)對(duì)視頻幀圖像進(jìn)行灰度化處理;(4)提取目標(biāo)框的局部哈希特征,并對(duì)特征進(jìn)行為運(yùn)算化處理;(5)讀取視頻下一幀,并采用同步驟(3)同樣的方式對(duì)圖像進(jìn)行灰度化處理;(6)在當(dāng)前幀中,采用倒金字塔候選框搜索方法在上一幀目標(biāo)相同位置附近獲取候選框;(7)采用同步驟(4)相同的方式,提取所有候選框的局部哈希特征;(8)計(jì)算所有候選框同上一幀目標(biāo)框的相似度,選取相似度最大的候選框作為新的目標(biāo)框,并重復(fù)步驟(5)~(7),直至視頻結(jié)束。
【專利說明】
一種基于局部哈希特征的視頻目標(biāo)實(shí)時(shí)跟蹤方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于圖像處理技術(shù)中的視頻目標(biāo)跟蹤領(lǐng)域,提出了一種基于局部哈希特征 的視頻目標(biāo)實(shí)時(shí)跟蹤方法。
【背景技術(shù)】
[0002] 視頻目標(biāo)跟蹤是連續(xù)確定視頻中目標(biāo)所在相對(duì)位置,并大致指示目標(biāo)大小的一種 技術(shù)。
[0003] 視頻目標(biāo)跟蹤技術(shù)涉及到計(jì)算機(jī)視覺處理、圖像序列處理、模式識(shí)別以及人工智 能等領(lǐng)域,且其應(yīng)用極其廣泛,比如在商業(yè)上的商場(chǎng)、賓館、住宅區(qū)的監(jiān)控;公共事業(yè)上的學(xué) 校、醫(yī)院、機(jī)場(chǎng)、車站等公共場(chǎng)所的監(jiān)控;軍事上一些基于機(jī)器視覺的制導(dǎo)系統(tǒng)、瞄準(zhǔn)系統(tǒng) 等。
[0004] 視頻目標(biāo)跟蹤按照學(xué)習(xí)模型的不同可大致分為兩類,分別為基于離線學(xué)習(xí)模型和 基于在線學(xué)習(xí)模型的跟蹤算法。
[0005] 基于離線學(xué)習(xí)模型的目標(biāo)跟蹤算法,需要大量同類物體的樣本進(jìn)行離線訓(xùn)練學(xué) 習(xí),且跟蹤的目標(biāo)受限于學(xué)習(xí)的目標(biāo),因此這種算法沒有被廣泛的應(yīng)用,只有在某些特定的 場(chǎng)合,如車輛跟蹤、人臉跟蹤中作為一種輔助檢測(cè)的手段。
[0006] 基于在線學(xué)習(xí)模型的跟蹤算法,是目前視頻跟蹤領(lǐng)域中的主流算法,其不需要離 線學(xué)習(xí)樣本,而是在跟蹤的過程中,學(xué)習(xí)更新模型的參數(shù),且其跟蹤的目標(biāo)也不限于某一特 定目標(biāo),只要在視頻初始階段給出跟蹤目標(biāo)的大致信息即可。算法模型會(huì)根據(jù)初始階段標(biāo) 記得到的大致信息進(jìn)行學(xué)習(xí)。在線學(xué)習(xí)算法的學(xué)習(xí)模型往往比較簡(jiǎn)單,所以學(xué)習(xí)過程也較 為快速。
[0007] 但是,基于在線學(xué)習(xí)模型的跟蹤算法,幾乎都只有在高性能的計(jì)算機(jī)上才能實(shí)現(xiàn) 實(shí)時(shí)跟蹤(即每秒至少處理15幀),這是因?yàn)檫@些算法一般采用HOG、Haar-like、LBP等較為 復(fù)雜的局部特征作為學(xué)習(xí)模型的學(xué)習(xí)特征,這些特征的提取、運(yùn)算需要花費(fèi)較多的時(shí)間,因 此這些算法不能很好的移植到一些實(shí)用的嵌入式系統(tǒng)中去。
[0008] 另外,目前絕大部分基于在線學(xué)習(xí)模型的跟蹤算法都屬于判別式跟蹤算法,這種 算法將跟蹤問題看成一個(gè)二分類問題,其需要在視頻的每幀圖像中選取一定的候選框,再 通過學(xué)習(xí)機(jī)從候選框中選出新的跟蹤結(jié)果。對(duì)于候選框的獲取方法,目前沒有較為簡(jiǎn)便的 方式,一般都是在跟蹤目標(biāo)附近全遍歷,搜索所有可能的候選框,這種方法可以獲得大量候 選框,但對(duì)于跟蹤而言,有許多候選框是冗余的,這會(huì)加重算法的運(yùn)算負(fù)擔(dān)。

【發(fā)明內(nèi)容】

[0009] 針對(duì)現(xiàn)有視頻目標(biāo)跟蹤技術(shù)中的特征較為復(fù)雜,運(yùn)算量較大的不足之處,本發(fā)明 提出了一種基于感知哈希特征的視頻目標(biāo)跟蹤方法,并對(duì)特征進(jìn)行位運(yùn)算化處理,實(shí)現(xiàn)了 快速、高效的視頻目標(biāo)跟蹤。
[0010] 本發(fā)明提出的基于感知哈希特征的視頻目標(biāo)跟蹤方法主要包括以下步驟:
[0011] (I)讀取待跟蹤視頻序列的第一幀;
[0012] (2)在圖像中畫一恰好將目標(biāo)包圍的矩形框,作為目標(biāo)框;
[0013] (3)對(duì)視頻幀圖像進(jìn)行灰度化處理;
[0014] (4)提取目標(biāo)框的局部哈希特征,并對(duì)特征進(jìn)行為運(yùn)算化處理;
[0015] (5)讀取視頻下一幀,并采用同步驟(3)同樣的方式對(duì)圖像進(jìn)行灰度化處理;
[0016] (6)在當(dāng)前幀中,采用倒金字塔候選框搜索方法在上一幀目標(biāo)相同位置附近獲取 候選框;
[0017] (7)采用同步驟(4)相同的方式,提取所有候選框的局部哈希特征;
[0018] (8)計(jì)算所有候選框同上一幀目標(biāo)框的相似度,選取相似度最大的候選框作為新 的目標(biāo)框,并重復(fù)步驟(5)~(7 ),直至視頻結(jié)束。
[0019 ]優(yōu)選地,對(duì)于步驟(4)具體包括以下內(nèi)容:
[0020] (4-1)感知哈希原理:
[0021] 感知哈希是從多媒體數(shù)據(jù)集到感知摘要集的一種單向映射,通過感知哈希函數(shù)將 龐大的多媒體對(duì)象映射為數(shù)據(jù)量較小、長(zhǎng)度較短的比特序列,將內(nèi)容相同或相近的多媒體 對(duì)象映射為數(shù)學(xué)相同或相近的哈希值。感知閾值理論告訴我們,人類要想能夠感知到不同 的事物,那么該事物所帶來的刺激就必須要超過人類的感知閾值,那些未能超過閾值的,則 均被認(rèn)為是相同"數(shù)據(jù)",由此可知,感知哈希是允許一定感知誤差的,它由傳統(tǒng)哈希發(fā)展而 來,不但具有傳統(tǒng)哈希簡(jiǎn)潔性、安全性的特點(diǎn),還極大地提高了哈希的魯棒性。
[0022]本發(fā)明,將感知哈希理論應(yīng)用到目標(biāo)跟蹤領(lǐng)域,并結(jié)合目標(biāo)跟蹤的特點(diǎn)與需求,提 出了基于感知哈希原理的局部哈希特征。局部哈希特征具有而局部哈希特征在跟蹤算法中 也能夠繼承其簡(jiǎn)潔性、魯棒性的特點(diǎn),因此,本發(fā)明可以實(shí)現(xiàn)快速、魯棒的跟蹤算法。
[0023] 感知哈希特征的提取原理如下:
[0024]
[0025] 其中
式中P(x,y)表示原圖在點(diǎn)(x,y)處的像素值,S(x,y)表 示哈希特征在點(diǎn)(x,y)處的結(jié)果值,w表示圖像的寬度,h表示圖像的高度。
[0026] 觀察圖2,可發(fā)現(xiàn)感知哈希特征提取的過程中,會(huì)刪去圖像中大部分的低頻信息, 只保留圖像中的高頻信息,即將圖像中目標(biāo)的邊緣、輪廓信息保留下來。
[0027] 同時(shí),原圖中每個(gè)像素都是由RGB三個(gè)通道的像素值組成,每個(gè)通道都存有一個(gè)長(zhǎng) 度為8位的像素值,而結(jié)果圖中每個(gè)像素都只是由一個(gè)通道的數(shù)據(jù)組成,且由一位的0或1表 示,這極大地減少了數(shù)據(jù)的信息量。
[0028] 傳統(tǒng)的基于感知哈希原理的跟蹤是一種模板匹配的方法,即將目標(biāo)框、候選框縮 小到8*8個(gè)像素大小,再比較候選框與上一幀目標(biāo)框的相似度,選出相似度最高的候選框作 為新的目標(biāo)框。這種方法雖然簡(jiǎn)單易實(shí)現(xiàn),但是跟蹤的效果較差,尤其是在跟蹤目標(biāo)出現(xiàn)形 變、部分遮擋時(shí),跟蹤效果極為不好。產(chǎn)生這種現(xiàn)象的原因是這種8*8的模板刪減了太多的 目標(biāo)特征信息,從而導(dǎo)致不同的候選框圖像卻可能產(chǎn)生相同的哈希序列。因此,這種方法雖 然有相當(dāng)好的簡(jiǎn)潔性,但卻不滿足跟蹤問題中所需求的魯棒性。
[0029] (4-2)局部哈希特征提取
[0030] 本發(fā)明為了解決傳統(tǒng)的基于感知哈希的跟蹤方法魯棒性較差的問題,在原有感知 哈希原理的基礎(chǔ)上,提出了一種基于圖像塊劃分的局部哈希特征。這種特征是在原目標(biāo)圖 像中提取出許多大小為8*8的局部子圖像塊,分別對(duì)每個(gè)子圖像塊提取感知哈希特征,便可 以得到局部哈希特征。
[0031] 本發(fā)明將局部子圖像塊的大小定為8*8原因,是為了更加符合機(jī)器運(yùn)算的規(guī)則,為 了更方便的使用機(jī)器運(yùn)算中快速的位運(yùn)算操作。在后文中,將會(huì)有更加詳細(xì)的關(guān)于使用位 運(yùn)算的方法。
[0032] 本發(fā)明在獲取局部子圖像塊的過程中,采用8*8模板在待提取特征圖像中平移,每 次平移均可獲得一個(gè)8*8的子圖像塊,對(duì)于大小為w · h的圖像,一共可獲取子圖像塊的個(gè)數(shù) 為:
[0033]
[0034] 其中,a為每次平移的步長(zhǎng),[·]為取整符號(hào)。
[0035]獲得多個(gè)子圖像塊后,用上述的哈希特征提取原理對(duì)子圖像塊提取哈希特征。 [0036] (4-3)位運(yùn)算化處理
[0037]觀察附圖3b,可發(fā)現(xiàn)每個(gè)局部哈希特征都是一個(gè)含有64個(gè)元素的矩陣,且矩陣元 素較為特殊,只含有〇或者1。
[0038]在機(jī)器運(yùn)算中,其對(duì)數(shù)據(jù)存儲(chǔ)的方式也是由0、1組成的二進(jìn)制序列。本發(fā)明利用局 部哈希特征矩陣元素只有〇、1的特點(diǎn),將每個(gè)局部哈希特征矩陣按行序排列成一個(gè)長(zhǎng)度為 64的向量。且在機(jī)器運(yùn)算中存在一種長(zhǎng)整型變量也是64位長(zhǎng)度,因此每個(gè)局部哈希特征都 可以用一個(gè)長(zhǎng)整型的變量來表示,原本需要64個(gè)變量存儲(chǔ)的特征,只需一個(gè)長(zhǎng)整型即可,這 在內(nèi)存儲(chǔ)存方面能夠有效的減少成本,也是局部子圖像塊的大小定為8*8的一個(gè)重要原因。 [0039 ]優(yōu)選地,對(duì)于步驟(6)具體包含以下內(nèi)容:
[0040] 在搜索候選框時(shí),傳統(tǒng)的候選框搜索策略是一種全遍歷方式,即在目標(biāo)周圍一定 范圍內(nèi)逐點(diǎn)遍歷圖像。這樣做的好處是,目標(biāo)周圍所有的候選框均可以被涵蓋,且不會(huì)被遺 漏。但是,在目標(biāo)跟蹤中,目標(biāo)框的位置發(fā)生微小變化,如果并不影響跟蹤結(jié)果,則目標(biāo)框附 近的數(shù)個(gè)候選框均可以作為新的目標(biāo)框。因此傳統(tǒng)的全遍歷搜索策略搜索出的許多候選框 其實(shí)是冗余的,這會(huì)導(dǎo)致算法的計(jì)算負(fù)擔(dān)極大加重,運(yùn)行時(shí)間增加,從而無法實(shí)現(xiàn)實(shí)時(shí)跟
[0041] 本發(fā)明為了在不影響跟蹤結(jié)果的前提下刪減冗余的候選框,提出了倒金字塔搜索 方法。此方法的思想來源于倒金字塔的結(jié)構(gòu)形式,至下而上,金字塔的橫截面積由小到大, 同時(shí)所使用的建筑材料的大小也由小到大。
[0042] 將這種思想運(yùn)用在候選框搜索中,則是以目標(biāo)的左上角為中心,由內(nèi)向外構(gòu)造不 同面積、互不重疊的矩形或矩形環(huán)區(qū)域,作為待搜索區(qū)域。且在不同搜索區(qū)域搜索時(shí),其搜 索步長(zhǎng)也因區(qū)域離中心點(diǎn)的距離大小而變化。
[0043] 如圖4所示,圖中紅色點(diǎn)為目標(biāo)框的中心點(diǎn),區(qū)域1、2、3互不重疊,區(qū)域1為矩形區(qū) 域,區(qū)域2和區(qū)域3是與區(qū)域1同中心點(diǎn)的矩形環(huán)。三個(gè)區(qū)域到中心點(diǎn)的距離依次增加,搜索 范圍也依次增加。
[0044] 在搜索區(qū)域中,沿x方向的搜索迭代公式:
[0045]
[0046]
[0047]
[0048] 上式中,i代表所在區(qū),i = 1,2,3。和分別表示沿X和y方向 的迭代步長(zhǎng)。
[0049] 由圖4可知,區(qū)域3所在位置離目標(biāo)框最遠(yuǎn),故新的目標(biāo)框位置位于區(qū)域3的可能性 最小,且其包含的區(qū)域面積最大,因此在區(qū)域3搜索時(shí),其搜索步長(zhǎng)選取較大的值。同理,在 區(qū)域2的搜索步長(zhǎng)比區(qū)域3小,區(qū)域1的搜索步長(zhǎng)最小。一般可?。?br>[0050]
[0051] 優(yōu)選地,對(duì)于步驟(8)包含以下內(nèi)容:
[0052] 在通過倒金字塔搜索方法搜索得到諸多候選框后,要想在其中選出當(dāng)前的目標(biāo), 則需要一種計(jì)算候選框與上一幀目標(biāo)框相似度的度量手段,分別計(jì)算每個(gè)候選框與上一幀 目標(biāo)框的相似度,然后在這些候選框中找到相似度最高的作為新的目標(biāo)框。
[0053] 一般的相似度計(jì)算方法都是基于距離的衡量方法,常用的距離衡量方法有歐式距 離、曼哈頓距離、切比雪夫距離、馬氏距離、漢明距離等。
[0054]漢明距離,是一種專門用來比對(duì)兩個(gè)序列相似度的衡量手段,對(duì)于漢明距離來說, 兩個(gè)等長(zhǎng)字符串Sl與S2之間的漢明距離為將其中一個(gè)變?yōu)榱硗庖粋€(gè)所需要作的最小替換 次數(shù),例如字符串"1111"與"1001"之間的漢明距離為2。
[0055]本發(fā)明在提取哈希特征時(shí)得到的是長(zhǎng)度為64位的二進(jìn)制序列,則比較兩個(gè)局部哈 希特征的相似度時(shí),可以采用漢明距離作為局部哈希特征的度量方式。這種度量方式計(jì)算 非常簡(jiǎn)便,且相似性度量的結(jié)果也較為準(zhǔn)確。
[0056]根據(jù)漢明距離的定義可知,漢明值H(x,y)是序列x、y中對(duì)應(yīng)位置不同的個(gè)數(shù)。本發(fā) 明在提取到局部哈希特征向量后,將其轉(zhuǎn)化為一個(gè)64位整型變量,因此X和y是兩個(gè)只含0、1 的序列,故對(duì)X和V梁取異或操作夾計(jì)筧兩個(gè)序列的晗明距離"
[0058]如上表所示,異或運(yùn)算的原理是相異為1,相同為0。
[0059] 例如,假設(shè)X和y是如下序列:
[0060] X = OOimOl 01011001 〇〇〇〇〇〇〇〇 11111111 〇〇〇〇〇〇〇〇 11111111 〇〇〇〇〇〇〇〇 11111111
[0061] y = 00110000 10110100 00000000 11111111 00000000 11111111 00000000 llllllllx和y異或的結(jié)果為:
[0062] Z = XAy
[0063] =00001101 11101101 00000000 00000000 00000000 00000000 00000000 00000000在統(tǒng)計(jì)異或結(jié)果序列中"Γ的個(gè)數(shù)時(shí),本發(fā)明采用移位和按位相與的方式進(jìn)行加 速計(jì)算。為方便解釋,假設(shè)結(jié)果序列為S(S = 00110011),序列中"Γ的個(gè)數(shù)為num(l),并設(shè)其 初始值為0,讓序列S與序列B(B = 00000001)按位相與,這樣做的目的是判斷序列S中最后一 位是否為"Γ。相與的結(jié)果z = 00000001,其在計(jì)算機(jī)中的值為1,即Z = I,故在num(l)上加Z; 然后,為了判斷序列S中倒數(shù)第二位是否為"1",將S右移一位,得到S'=00011001,再讓S'與 00000001按位相與,得到結(jié)果為z = 00000001,同樣在num(l)上再加Z。依次類推,直至整個(gè) 序列中所有位都經(jīng)過判斷。最終的ruim(l)即序列中"Γ的個(gè)數(shù),也即是兩個(gè)序列的漢明距 離。
[0064] 上述過程求取的是候選框與目標(biāo)框中對(duì)應(yīng)位置的子圖像塊的相似度,本發(fā)明在評(píng) 估候選框與目標(biāo)的整體相似度時(shí),采用子圖像塊相似度的均值作為衡量手段。即候選框與 目標(biāo)框整體的相似度s為:
[0065]
[0066] 其中m為子圖像塊的個(gè)數(shù),S1為候選框與目標(biāo)框的子圖像塊的相似度。
[0067] 與現(xiàn)有技術(shù)相比,本發(fā)明具有如下有益效果:
[0068] 1、本發(fā)明采用的局部哈希特征,提取方式簡(jiǎn)便,復(fù)雜度低,可以很好地運(yùn)用在一些 實(shí)時(shí)跟蹤場(chǎng)景中,尤其是對(duì)于一些嵌入式系統(tǒng),本發(fā)明都可以較好地實(shí)現(xiàn)實(shí)時(shí)跟蹤;
[0069] 2、本發(fā)明對(duì)特征進(jìn)行一系列位運(yùn)算處理,在機(jī)器中,位運(yùn)算是最快速最高效的運(yùn) 算方式,因此本發(fā)明運(yùn)算速度很快;
[0070] 3、本發(fā)明采用倒金字塔方法提取候選框,這種提取方式極大地減少了冗余的候選 框,提過算法本身效率。
【附圖說明】
[0071] 圖1是本發(fā)明流程圖;
[0072]圖2是原始圖像和提取的哈希特征結(jié)果圖;
[0073]圖3是某一 8*8局部圖像塊和對(duì)其提取的局部哈希特征結(jié)果;
[0074]圖4是倒金字塔搜索方法區(qū)域圖;
[0075] 圖5是跟蹤領(lǐng)域中經(jīng)典測(cè)試視頻David的第一幀。
【具體實(shí)施方式】
[0076] 為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì) 本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并 不用于限定本發(fā)明。此外,下面所描述的本發(fā)明各個(gè)實(shí)施方式中所涉及到的技術(shù)特征只要 彼此之間未構(gòu)成沖突就可以相互組合。
[0077]本發(fā)明的步驟流程如圖1所示,現(xiàn)以測(cè)試視頻David為例說明:
[0078] (1)獲取初始目標(biāo)框
[0079]在讀取David視頻的第一幀時(shí),由于算法本身并不知道其要跟蹤的目標(biāo)是什么,因 此需要提供交互界面,人為的給定待跟蹤目標(biāo)。
[0080] 如圖5所示,為David視頻第一幀,圖片中矩形框?yàn)槿藶闃?biāo)記得來。人機(jī)交互得到矩 形框的位置、大小信息后,便在圖像中顯示出這些信息。圖中四個(gè)數(shù)字分別表示矩形框左上 角坐標(biāo)(x,y)和矩形框的寬和高(w,h)。根據(jù)圖中給出的信息可知當(dāng)前矩形框左上角點(diǎn)的坐 標(biāo)為(129,80),寬和高為(64,78)。
[0081] (2)獲取初始目標(biāo)的局部子圖像塊
[0082] 相坦來聰前的曰e隹自」生件的獲取多個(gè)子圖像塊,子圖像塊的個(gè)數(shù)為:
[0083]
[0084] 這里w = 64,h = 78,并取迭代步長(zhǎng)a = 4。因此最終獲取的子圖像塊的個(gè)數(shù)為15X18 = 270個(gè)。
[0085] (3)獲取初始目標(biāo)的局部哈希特征
[0086] 得到目標(biāo)的子圖像塊后,便要獲取子局部圖像塊的哈希特征,獲取原理為:
[0087]
[0088]每個(gè)局部哈希特征都是一個(gè)大小為8*8的矩陣,且矩陣中的元素只含有0或者1。
[0089] 利用局部哈希特征矩陣與機(jī)器運(yùn)算中長(zhǎng)整型變量的相似之處,故將局部哈希特征 按位運(yùn)算的方式化為一個(gè)長(zhǎng)度為64位的長(zhǎng)整型變量,并存放于一個(gè)長(zhǎng)整型數(shù)組"hashValue
[270]"中,以圖3b中的局部哈希特征為例:
[0090] 首先設(shè)64位長(zhǎng)整型變量a = 0,并讓其與局部哈希特征中的第一位數(shù)相或,這樣便 將這個(gè)數(shù)存放在了 a的最末位,然后將a左移一位,并讓其與局部哈希特征中的第二位數(shù)相 或,依次類推直至將所有哈希特征值全部存入a中。
[0091] (4)候選框搜索
[0092] 當(dāng)讀取到視頻的第二幀時(shí),此時(shí)要在新的圖像中獲取一系列的候選框,作為新的 目標(biāo)框的候選。獲取候選的策略是采用倒金字塔候選框搜索方法。
[0093]已知在上一幀中目標(biāo)的位置為(129,80),根據(jù)視頻中連續(xù)兩幀之間目標(biāo)位置變化 比較小的原理,故在當(dāng)前幀中(129,80)附近尋找候選框。如圖4所示,以(129,80)為中心,分 別以10、20、40個(gè)像素為區(qū)域?qū)挾?,得?、2、3三個(gè)矩形環(huán)搜索區(qū)域。且在三個(gè)區(qū)域的搜索步 長(zhǎng)與搜索域到中心距離有關(guān),取Step(I) = 1,Step(2) = 2,Step(3) = 4。
[0094]對(duì)于傳統(tǒng)的全遍歷搜索策略,當(dāng)搜索范圍為40個(gè)像素時(shí),每幀圖像可得到約1600 個(gè)候選框,而采用倒金字塔搜索策略后,則可精減為約371個(gè)候選框。且對(duì)于目標(biāo)跟蹤這種 對(duì)實(shí)時(shí)性要求較高但容許部分誤差的情況,跟蹤效果并未有很大差別。
[0095] (5)獲取候選框局部哈希特征
[0096] 獲取候選框后,便要對(duì)候選框求取局部哈希特征,求取方式與步驟3相同。
[0097] 這里,對(duì)每個(gè)后候選框均獲取局部哈希特征,因此一共可獲得371個(gè)獨(dú)立的 "hashValue[270]"。其中每個(gè)hashValue[i]都是一個(gè)64位長(zhǎng)整型變量。
[0098] (6)相似度計(jì)算
[0099]在獲取候選框的局部哈希特征后,便要計(jì)算每個(gè)候選框與前一幀目標(biāo)框的相似 度,并選取最相似的作為新的目標(biāo)框。
[0100]因?yàn)楹蜻x框和目標(biāo)框的局部哈希特征"hashValUe[270]"中包含了兩百多子子圖 像塊的哈希特征,因此比較候選框與目標(biāo)框的相似度可轉(zhuǎn)換為比較每個(gè)對(duì)應(yīng)位置子圖像塊 的相似度,然后對(duì)所有子圖像塊的相似度求均值,從而得到候選框與目標(biāo)框整體的相似度。 [0101 ] -般的,當(dāng)相似度大于0.5,便認(rèn)為兩個(gè)序列存在相關(guān)性,當(dāng)相似度大于0.75便認(rèn) 為兩個(gè)序列有較高的相似度,當(dāng)相似度大于〇. 95便認(rèn)為兩個(gè)序列幾乎是相同序列。
[0102] (7)確定新的目標(biāo)框
[0103] 比較所有的候選框與目標(biāo)框的相似度,找出相似度最高的候選框,作為新的目標(biāo) 框。然后算法重復(fù)步驟4至步驟7,直至視頻結(jié)束。
[0104] 本領(lǐng)域的技術(shù)人員容易理解,以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以 限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含 在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1. 一種基于感知哈希特征的視頻目標(biāo)跟蹤方法,其特征在于,包括W下步驟: (1) 讀取待跟蹤視頻序列的第一帖; (2) 在圖像中畫一恰好將目標(biāo)包圍的矩形框,作為目標(biāo)框; (3) 對(duì)視頻帖圖像進(jìn)行灰度化處理; (4) 提取目標(biāo)框的局部哈希特征,并對(duì)特征進(jìn)行為運(yùn)算化處理; (5) 讀取視頻下一帖,并采用同步驟(3)同樣的方式對(duì)圖像進(jìn)行灰度化處理; (6) 在當(dāng)前帖中,采用倒金字塔候選框捜索方法在上一帖目標(biāo)相同位置附近獲取候選 框; (7) 采用同步驟(4)相同的方式,提取所有候選框的局部哈希特征; (8) 計(jì)算所有候選框同上一帖目標(biāo)框的相似度,選取相似度最大的候選框作為新的目 標(biāo)框,并重復(fù)步驟(5)~(7 ),直至視頻結(jié)束。2. 如權(quán)利要求1所述的方法,其特征在于,所述步驟(4)中提取目標(biāo)框的局部哈希特征 具體為:在原目標(biāo)圖像中提取出多個(gè)大小為8*8的局部子圖像塊,分別對(duì)每個(gè)子圖像塊提取 感知哈希特征,得到局部哈希特征。3. 如權(quán)利要求1或2所述的方法,其特征在于,所述步驟(4)中對(duì)特征進(jìn)行為運(yùn)算化處理 具體為:將每個(gè)局部哈希特征矩陣按行序排列成一個(gè)長(zhǎng)度為64的向量。4. 如權(quán)利要求1或2所述的方法,其特征在于,所述步驟(6)中倒金字塔候選框捜索方法 具體為目標(biāo)的左上角為中屯、,由內(nèi)向外構(gòu)造不同面積、互不重疊的矩形或矩形環(huán)區(qū)域, 作為待捜索區(qū)域,且在不同捜索區(qū)域捜索時(shí),其捜索步長(zhǎng)也因區(qū)域離中屯、點(diǎn)的距離大小而 變化。5. 如權(quán)利要求4所述的方法,其特征在于,在捜索區(qū)域中: 沿X方向的捜索迭代公式:上式中,i代表所在區(qū),i = 1,2,3。致巧(瑞;,斯和汾巧(0,誠(chéng)^,)分別表示沿X和y方向的迭代 步長(zhǎng)。6. 如權(quán)利要求1或2所述的方法,其特征在于,在所述步驟(8)中采用漢明距離作為局部 哈希特征的度量方式。7. 如權(quán)利要求6所述的方法,其特征在于,候選框與目標(biāo)框整體的相似度S為:其中m為子圖像塊的個(gè)數(shù),Si為候選框與目標(biāo)框的子圖像塊的相似度。8. 如權(quán)利要求2所述的方法,其特征在于,對(duì)于大小為W · h的圖像,一共可獲取子圖像 塊的個(gè)數(shù)為:其中,a為每次平移的步長(zhǎng),[·]為取整符號(hào)。9. 如權(quán)利要求5所述的方法,其特征在于,10. 如權(quán)利要求2所述的方法,其特征在于,感知哈希特征的提取方法如下:其中,式中P(x,y)表示原圖在點(diǎn)(x,y)處的像素值,S(x,y)表示哈 希特征在點(diǎn)(x,y)處的結(jié)果值,W表示圖像的寬度,h表示圖像的高度。
【文檔編號(hào)】G06T7/20GK105844669SQ201610182089
【公開日】2016年8月10日
【申請(qǐng)日】2016年3月28日
【發(fā)明人】韓守東, 陳永志, 劉甜甜, 陳陽
【申請(qǐng)人】華中科技大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
鄂托克前旗| 怀远县| 松潘县| 云和县| 兰州市| 福海县| 广水市| 河津市| 保靖县| 乌苏市| 乌拉特后旗| 夏邑县| 延边| 雷州市| 工布江达县| 冀州市| 巴林左旗| 中山市| 定西市| 平阴县| 温州市| 广西| 阿巴嘎旗| 万年县| 堆龙德庆县| 和顺县| 义乌市| 武宣县| 南澳县| 长兴县| 长海县| 丹巴县| 土默特左旗| 五原县| 黄大仙区| 县级市| 靖宇县| 家居| 始兴县| 都昌县| 焉耆|