欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

目標(biāo)跟蹤中基于多示例學(xué)習(xí)思想的訓(xùn)練樣本選擇方法與流程

文檔序號:11678602閱讀:245來源:國知局
目標(biāo)跟蹤中基于多示例學(xué)習(xí)思想的訓(xùn)練樣本選擇方法與流程
本發(fā)明涉及計算機(jī)視覺領(lǐng)域的目標(biāo)跟蹤技術(shù)。
背景技術(shù)
:雖然針對人臉、行人等特定物體的跟蹤算法已經(jīng)取得了一系列成功,但是由于對于一個任意物體缺乏足夠的先驗信息,同時物體的外觀在跟蹤過程中會因為形變、旋轉(zhuǎn)或者光照變化而發(fā)生劇烈改變等原因,對一般性物體的目標(biāo)跟蹤算法仍然面臨著諸多挑戰(zhàn)。因為對一般性目標(biāo)的跟蹤算法還不夠可靠,許多基于一般性跟蹤的應(yīng)用場景的發(fā)展受到限制。例如,智能手機(jī)的相機(jī)模塊中的目標(biāo)跟蹤功能,往往需要目標(biāo)具有較明顯的特征,或者只能實現(xiàn)對目標(biāo)的短時間跟蹤。雖然越來越多的研究者認(rèn)為,采用在線更新的分類器對于提升整個跟蹤算法的準(zhǔn)確性有重要意義。但是,卻很少有人關(guān)注如何選擇訓(xùn)練樣本的問題。如果采用傳統(tǒng)的監(jiān)督學(xué)習(xí)方法,需要每個樣本都有明確的類別。有時候斷定一個樣本屬于正樣本還是負(fù)樣本是比較困難的,即有的樣本并不是非正即負(fù)的,比如有的樣本是一種“弱標(biāo)記”樣本,同時包含目標(biāo)和背景的信息,其類別介于正樣本和負(fù)樣本之間。無論是認(rèn)為這些樣本是正的還是負(fù)的,都是不合適的。在目標(biāo)檢測領(lǐng)域,如果采用傳統(tǒng)的監(jiān)督學(xué)習(xí)算法,同樣需要解決弱標(biāo)記樣本問題。已經(jīng)有文獻(xiàn)對mil的相關(guān)應(yīng)用展開了研究,并取得了一定的成功。viola等人將mil用于人臉檢測,以解決訓(xùn)練樣本的類別模糊問題。相比于基于監(jiān)督學(xué)習(xí)來訓(xùn)練分類器的算法,他們的算法在檢測結(jié)果的準(zhǔn)確性上取得了更好的結(jié)果。受viola等人工作的啟發(fā),2011年,babenko等人基于mil的思想提出了一種miltrack跟蹤算法,提供了一種更新目標(biāo)的外觀模型的新思路。miltrack算法是一種boosting算法。boosting的核心思想是,通過選擇一組弱分類器(weakclassifiers),構(gòu)成一個強(qiáng)分類器(strongclassifier)。通常,這些最優(yōu)的弱分類器具有最好的分類能力。在mil中,樣本以包(bag)的形式表示,每個包是一個集合,含有多個樣本。為了應(yīng)用mil思想解決boosting問題,可以選擇一組弱分類器,使得關(guān)于包的對數(shù)似然函數(shù)最大。miltrack算法僅僅根據(jù)第一幀給出的目標(biāo)的位置,就可以對任意目標(biāo)進(jìn)行跟蹤,而不需要事先獲取大量的關(guān)于該目標(biāo)的先驗信息。除此之外,miltrack能夠適應(yīng)目標(biāo)外觀的變化,解決目標(biāo)的部分遮擋問題,并且只需要調(diào)節(jié)少量參數(shù)就可以獲得較為理想的效果。但是,該算法的計算量非常大,難以應(yīng)用到實時應(yīng)用中。在babenko等人工作的基礎(chǔ)上,許多研究人員對miltrack算法做出了改進(jìn),在實時性和準(zhǔn)確性上都取得了更好的成果。zhang等人通過加權(quán)的方式對miltrack進(jìn)行改進(jìn),提出了一種改進(jìn)的跟蹤算法(wmil)。在計算關(guān)于包的后驗概率時,他們考慮到包中不同的樣本具有不同的重要性,對最終的似然函數(shù)的貢獻(xiàn)也不同,于是根據(jù)樣本距離目標(biāo)中心的遠(yuǎn)近為他們賦予了不同的權(quán)重。wmil算法在跟蹤準(zhǔn)確性上有了明顯提升。zhu等人指出,單個分類器在進(jìn)行更新時,訓(xùn)練樣本的類別無法確定。因此他們通過采用灰度特征和lbp特征分別構(gòu)建了hg和hl兩個分類器,用這兩個分類器對訓(xùn)練樣本進(jìn)行分類。然后用一個分類器的分類結(jié)果來更新另一個分類器,實現(xiàn)了分類器的聯(lián)合更新,避免了由于訓(xùn)練樣本類別的不準(zhǔn)確造成的分類器錯誤更新。在評估樣本的似然性時,他們將這兩個分類器的分類評分加權(quán)求和,構(gòu)成了一個聯(lián)合的強(qiáng)分類器。另外,在基于mil思想選擇最具分類能力的弱分類器時,他們利用泰勒展開來近似關(guān)于包的對數(shù)似然函數(shù),大大提高了算法的運(yùn)行效率。為了優(yōu)化miltrack算法的特征選擇方案,zhang等人提出了odfs算法。他們選擇了一組最優(yōu)特征,使得對數(shù)似然函數(shù)相對于正樣本最速上升,同時相對于負(fù)樣本最速下降。由于每個特征對應(yīng)一個弱分類器,所以前面提到的算法的主要工作實際上是進(jìn)行特征的選擇。雖然有許多文獻(xiàn)討論了mil在目標(biāo)跟蹤中的應(yīng)用,但是大多數(shù)的重點(diǎn)在于如何通過篩選弱分類器,最終組成一個強(qiáng)分類器。在訓(xùn)練樣本的選擇問題上,他們的做法仍然是用采集到的全部正樣本去訓(xùn)練分類器,更新分類器中關(guān)于正樣本的信息,然后再基于更新了的分類器進(jìn)行下一步處理。真正涉及到如何基于mil的思想合理地選擇訓(xùn)練樣本的文獻(xiàn)很少,因此本發(fā)明重點(diǎn)關(guān)注在正樣本所屬類別無法確定的情況下,如何利用訓(xùn)練樣本對分類器進(jìn)行訓(xùn)練的問題。技術(shù)實現(xiàn)要素:本發(fā)明是為了解決目標(biāo)跟蹤中傳統(tǒng)監(jiān)督學(xué)習(xí)算法面臨的“弱標(biāo)記”樣本的缺陷,導(dǎo)致無法保證準(zhǔn)確對樣本進(jìn)行標(biāo)記的問題,從而提供一種目標(biāo)跟蹤中基于多示例學(xué)習(xí)思想的訓(xùn)練樣本選擇方法。目標(biāo)跟蹤中基于多示例學(xué)習(xí)思想的訓(xùn)練樣本選擇方法,它包括以下步驟:步驟一、在目標(biāo)跟蹤過程中,在當(dāng)前幀的跟蹤目標(biāo)的周圍設(shè)定區(qū)域內(nèi)采集圖像塊,并提取每個圖像塊的haar-like特征,作為正負(fù)樣本;并將所有的正樣本放入到一個正樣本集合中,將每個負(fù)樣本分別放入一個負(fù)樣本集合中,最終得到樣本集合x,x={x1,...,xn};其中,x1={x11,...,x1m}是一個正樣本包,{x2,...,xn}是負(fù)樣本包;步驟二、將x={x1,...,xn}={x1,...,xm}作為訓(xùn)練集,對訓(xùn)練集中的每個樣本進(jìn)行檢測,得到特征向量集合{v1,...,vm},其中m表示正負(fù)樣本的總個數(shù);在傳統(tǒng)監(jiān)督學(xué)習(xí)中,給每個樣本xi分配一個類別標(biāo)簽yi,yi的取值集合為{0,1},yi=0表示樣本xi為負(fù)樣本,即:背景;yi=1表示樣本xi為正樣本,即:目標(biāo);在多示例學(xué)習(xí)中,類別標(biāo)簽yi表示的是一個包的類別;則整個訓(xùn)練集表示為:{(x1,y1),...,(xn,yn)},此時n表示包的個數(shù);步驟三、采用負(fù)樣本包{(x2,y2),...,(xn,yn)}訓(xùn)練樸素貝葉斯分類器,更新y=0時的特征的均值和方差步驟四、迭代步驟,每次迭代從正樣本包中移除最差的樣本,直到正樣本包中剩余k個樣本,k<m;完成標(biāo)跟蹤中基于多示例學(xué)習(xí)思想的訓(xùn)練樣本選擇。步驟一中,正負(fù)樣本集合的形成過程具體為:按照訓(xùn)練樣本距離跟蹤目標(biāo)中心的距離的遠(yuǎn)近將樣本分類,假設(shè)x表示一個圖像塊,l(x)表示圖像塊x所處的位置,表示第t幀圖像中跟蹤目標(biāo)的位置;則在每一幀圖像t中,以當(dāng)前目標(biāo)所在的位置為中心,以p個像素點(diǎn)為搜索半徑,在形成的圓形的區(qū)域內(nèi)采集一組樣本組成正樣本集合即:以當(dāng)前目標(biāo)所在的位置為中心,在內(nèi)徑為r、外徑為s的圓環(huán)形區(qū)域內(nèi)采集一組樣本組成負(fù)樣本集合即:步驟三中樸素貝葉斯分類器為:其中,假設(shè)特征空間vn中的一個特征的先驗分布是獨(dú)立高斯分布的,即:和都屬于高斯分布,先驗概率p(y=1)和p(y=0)相等;是y=1時v中各個特征的均值和方差的集合,是y=0時的均值和方差的集合。步驟四中,每次迭代從正樣本包中移除最差的樣本,直到正樣本包中剩余k個樣本,具體為:步驟四一、令最優(yōu)正樣本集合用訓(xùn)練樸素貝葉斯分類器,更新y=1時的分類器參數(shù)步驟四二、迭代過程,每次的迭代過程為:步驟四二一、計算正樣本集合中每個樣本的似然函數(shù)并找到最大值將最大值對應(yīng)的樣本加入集合r;如果集合r為空集,將步驟四二一中找到的樣本加入集合r,作為r1,計數(shù)值c加1;如果集合r為非空集,則以為正樣本包,{x2,...,xn}為負(fù)樣本包,計算似然函數(shù)然后用rc替換步驟四二一中找到的樣本,重新計算似然函數(shù)比較和的大小,如果將rc從集合r中移除,然后步驟四二一中找到的樣本添加到r中,作為rc;否則,將rc從中移除,將步驟四二一中找到的樣本添加到r中,作為rc+1;步驟四三、完成迭代后,得到最優(yōu)正樣本集合計算正樣本集合中每個樣本的似然函數(shù),是通過公式:實現(xiàn)的;wj表示權(quán)重,表達(dá)式為:式中:τ為系數(shù);h(vij)是樣本xij的評分,hmax是包中似然性最大的樣本的評分;當(dāng)hmax-h(vij)很小時,wj≈1;當(dāng)hmax-h(vij)很大時,wj≈0;p(yi=1|xij)為后驗概率,采用公式:式中:α的值為1。本發(fā)明具有以下特點(diǎn)和顯著進(jìn)步:在跟蹤算法中,如果當(dāng)前跟蹤的位置產(chǎn)生了偏差,那么在其周圍采集到的正負(fù)樣本本身的類別信息就不準(zhǔn)確。但是可以合理地假設(shè)所有正樣本中一定包含一個最準(zhǔn)確的正樣本。同時假設(shè)跟蹤位置的偏差是輕微的,那么由于這些正樣本距離目標(biāo)中心較近,所以大部分正樣本的類別標(biāo)簽是準(zhǔn)確的。當(dāng)然,如果跟蹤的偏差很大,假設(shè)就不成立。但是這時跟蹤已經(jīng)失敗,很難再縮小偏差,因此沒有繼續(xù)跟蹤下去的必要了。負(fù)樣本因為距離目標(biāo)中心較遠(yuǎn),所以都是典型的負(fù)樣本。本發(fā)明采用了一種簡單有效的方式來排除樣本集合中較差的樣本,不需要調(diào)節(jié)大量的參數(shù),避免了由于樣本類別的不準(zhǔn)確導(dǎo)致的目標(biāo)漂移,提高了跟蹤準(zhǔn)確性。附圖說明圖1至圖5為本發(fā)明的實驗中目標(biāo)經(jīng)歷形變與姿態(tài)變化時的部分幀的跟蹤結(jié)果截圖;圖6至圖10為本發(fā)明的實驗中目標(biāo)經(jīng)歷平面內(nèi)旋轉(zhuǎn)與三維旋轉(zhuǎn)時的部分幀的跟蹤結(jié)果截圖;具體實施方式具體實施方式一、目標(biāo)跟蹤中基于多示例學(xué)習(xí)思想的訓(xùn)練樣本選擇方法,本發(fā)明提出了一種用于目標(biāo)跟蹤的基于多示例學(xué)習(xí)(multipleinstancelearning,mil)思想選擇訓(xùn)練樣本的方法,該算法的主要思路為:將所有正樣本放入一個正樣本包中,將對關(guān)于包的對數(shù)似然函數(shù)貢獻(xiàn)較小的樣本視為較差的樣本。采用迭代的方式,每次迭代從正樣本包中移除最差的樣本,直到正樣本包中剩余足夠數(shù)量的樣本。該發(fā)明的具體步驟為:輸入:訓(xùn)練集{(x1,y1),...,(xn,yn)},其中,x1={x11,...,x1m}是第1個樣本包,也是一個正樣本包,{x2,...,xn}是負(fù)樣本包,yi∈{0,1}是包的標(biāo)簽;1:利用數(shù)據(jù)集{(x2,y2),...,(xn,yn)}訓(xùn)練分類器,更新y=0時的特征的均值和方差2:初始化最優(yōu)正樣本集合n表示中樣本的個數(shù),n=m,移除的正樣本添加到集合r中,移除的正樣本的個數(shù)為c,c=0;3:循環(huán)條件:i=1到m-k;4:利用數(shù)據(jù)集訓(xùn)練分類器,更新y=1時的特征的均值和方差5:對于中的所有樣本由公式(3)計算其分類評分h(v);6:循環(huán)條件:j=1到n;7:以樣本集合x={x11,...,x1(j-1),x1(j+1),...x1n}作為一個正樣本包,{x2,...,xn}為負(fù)樣本包,利用公式(4)-(6)計算似然函數(shù)8:結(jié)束對j的循環(huán);9:找出中的最大值10:如果r為空集,將中的樣本x1k移除,同時將x1k添加到r中,作為r1,計數(shù)值c加1;11:如果r為非空,以為正樣本包,{x2,...,xn}為負(fù)樣本包,計算似然函數(shù)然后用rc替換中的樣本x1k,重新計算似然函數(shù)比較和的大小,如果將rc從r中移除,然后將x1k添加到r中,作為rc,計數(shù)值c保持不變;否則,將rc從由移除,將x1k添加到r中,作為rc+1,計數(shù)值c加1;12:結(jié)束對i的循環(huán):13:中剩余的樣本就是準(zhǔn)確的正樣本,利用數(shù)據(jù)集訓(xùn)練分類器,更新y=1時的特征的均值和方差輸出:分類器h的參數(shù)以及最優(yōu)正樣本集合步驟a、采集正負(fù)樣本,組成包。在該步驟中,在當(dāng)前幀的跟蹤目標(biāo)周圍采集圖像塊,提取這些圖像塊的haar-like特征,作為正負(fù)樣本。然后,將所有的正樣本放入到一個正樣本包中,而將每個負(fù)樣本放入一個負(fù)樣本包中,最終得到樣本包的集合x,x={x1,...,xn}。該階段具體步驟為:步驟a1、在目標(biāo)跟蹤中,通常按照訓(xùn)練樣本距離目標(biāo)中心的距離的遠(yuǎn)近將樣本分類。假設(shè)x表示一個圖像塊,l(x)表示圖像塊x所處的位置,表示第t幀圖像中跟蹤目標(biāo)的位置。那么在每一幀圖像t中,可以以當(dāng)前目標(biāo)所在的位置為中心,以p個像素點(diǎn)為搜索半徑,在一個圓形的區(qū)域內(nèi)采集一組樣本組成正樣本集合即:如果p=1,那么正樣本集合的元素個數(shù)就是1,這個正樣本就是跟蹤目標(biāo);如果p>1,那么正樣本集合由跟蹤目標(biāo)及其鄰近區(qū)域內(nèi)多個圖像塊組成。對于負(fù)樣本,可以在距離目標(biāo)中心稍遠(yuǎn)的位置進(jìn)行樣本采集。通常,在一個內(nèi)徑為r,外徑為s的環(huán)形區(qū)域內(nèi)采集一組樣本組成負(fù)樣本集合即:步驟a2、得到訓(xùn)練集之后,進(jìn)行特征檢測得到這些樣本的特征向量集合{v1,...,vn},其中n表示正負(fù)樣本的總個數(shù)。訓(xùn)練樣本可以用其特征向量vi(1≤i≤n)來表示。每個樣本xi分配一個類別標(biāo)簽yi,yi具有有限數(shù)量個取值,每個取值代表一種類別。在二分類問題中,yi的取值集合為{0,1},yi=0表示樣本xi為負(fù)樣本,即背景;yi=1表示樣本xi為正樣本,即目標(biāo)。為了將多示例學(xué)習(xí)用于目標(biāo)跟蹤,可以將每個樣本作為一個示例xij,每個示例xij屬于一個包xi。每個包xi是一個示例的集合,xi={xi1,...,xim},有一個類別標(biāo)簽yi。這樣,整個訓(xùn)練集可以表示為{(x1,y1),...,(xn,yn)},此時n表示包的個數(shù)。將這些樣本放入一個正樣本包x1和n-1個負(fù)樣本包{x2,...,xn}中,注意負(fù)樣本的個數(shù)也是n-1。步驟a3、分類器采用樸素貝葉斯分類器模型:其中,假設(shè)特征空間vn中的一個特征的先驗分布是獨(dú)立高斯分布的,即和都屬于高斯分布,而且,先驗概率p(y=1)和p(y=0)是相等的。為了表達(dá)特征向量的先驗分布,需要知道分布的均值和方差是y=1時v中各個特征的均值和方差的集合,是y=0時的均值和方差的集合。先驗分布的參數(shù)可以由訓(xùn)練集{(xij,yij),...}的均值和方差估計得到。但是估計分布參數(shù)是一個監(jiān)督學(xué)習(xí)的過程,訓(xùn)練集中的類別標(biāo)簽yij是一個樣本的標(biāo)簽,而不是包的標(biāo)簽。所以,用包的類別yi來代替樣本的類別yij。因為負(fù)樣本包中樣本的類別標(biāo)簽都是準(zhǔn)確的,所以可以直接用這些負(fù)樣本訓(xùn)練分類器,更新y=0時的分類器參數(shù)步驟b、迭代移除最差的樣本。在該步驟中,需要確定最優(yōu)正樣本集合都包含哪些樣本。采用迭代的方式,每次迭代從正樣本包中移除最差的樣本,直到正樣本包中剩余k(k<m)個樣本。該階段具體步驟為:步驟b1、首先,令最優(yōu)正樣本集合然后,用訓(xùn)練分類器,更新y=1時的分類器參數(shù)步驟b2、得到的分類器參數(shù)可能是不準(zhǔn)確的,但是因為中大部分樣本的類別是準(zhǔn)確的,所以該參數(shù)與最佳參數(shù)的差距不是很大。接著,每次從中移除一個樣本x1j,以剩下的n-1個樣本作為一個集合,計算對數(shù)似然函數(shù)似然函數(shù)的一般表達(dá)式為:其中,權(quán)重wj的表達(dá)式為:其中,系數(shù)τ用于控制公式(5)的變化率,令τ=0.5。h(vij)是包中任意一個樣本的評分,hmax是包中似然性最大的樣本的評分。當(dāng)hmax-h(vij)很小時,wj≈1;當(dāng)hmax-h(vij)很大時,wj≈0。要想計算需要知道p(yi|xi)的大小,即樣本包xi的類別為yi的后驗概率。由于包是由樣本組成的,所以這個概率可以用xi中樣本xij的后驗概率p(yij|xij)來表示。為了表示p(yij|xij),需要為每個樣本xij分配一個類別標(biāo)簽yij。但是,對于正樣本包,無法確定每個樣本xij的類別yij,所以用包的類別yi來代替yij,于是得到等式y(tǒng)ij=y(tǒng)i=1??梢杂胔(v)來表示一個樣本為正樣本的后驗概率:公式(6)是一個s型函數(shù)。h(v)前面的系數(shù)α用來調(diào)節(jié)s型函數(shù)的變化率,但是為了簡化算法,直接將α設(shè)為1。對于正樣本包中的任意一個樣本xij,可以由公式(6)計算其后驗概率p(yi=1|xij)。注意,每次移除的樣本是不同的。如果某個樣本x1k受背景干擾比較嚴(yán)重,那么其后驗概率p(y1=1|x1k)應(yīng)該比較低,其對整個包的概率p(y1=1|x1)的影響也就比較小,對應(yīng)的似然函數(shù)值就是最大的。雖然此時由得到的分類器參數(shù)不是十分準(zhǔn)確,但是在迭代的最初階段,那些較差的樣本對似然函數(shù)值的貢獻(xiàn)比較小,還是比較容易被識別出來的。由于每個樣本x只需要計算一次似然性h(v),所以尋找最大的的過程計算量并不大。步驟b3、不能直接將樣本x1k從中移除,需要保證每次移除的x1k都是中最差的,同時是已經(jīng)被移除的樣本組成的集合r中最好的。所以需要比較上一次迭代過程中,添加到r中的樣本rc,和x1k相比,哪個更好。通過比較這兩個樣本對包的似然函數(shù)的貢獻(xiàn)來判斷他們的好壞,如果含有rc而不含x1k的樣本包具有更大的似然函數(shù)值,那么rc要好于x1k,將rc添加到中,x1k放入r中,和r的樣本個數(shù)都保持不變;否則,x1k要好于rc,將x1k從中移除并放入r中。如果r是空的,直接跳過比較過程,將x1k從中移除并放入r中。一次循環(huán)結(jié)束,可以開始下一次循環(huán)。隨著循環(huán)次數(shù)的增加,由估計的分類器參數(shù)逐漸趨近于最佳參數(shù)。當(dāng)整個迭代過程結(jié)束時,就得到了最優(yōu)正樣本集合分類器的參數(shù)也得到了更新。表1為實驗中用到的10個測試序列的詳細(xì)情況,包括視頻的名稱,幀數(shù)以及影響跟蹤算法結(jié)果的因素。這些視頻序列一共有6523幀,最長的序列有1997幀,最短的序列有71幀。這些測試數(shù)據(jù)主要涉及目標(biāo)跟蹤在輕微的尺度變化、輕微的光照變化、非剛性形變、旋轉(zhuǎn)等方面面臨的挑戰(zhàn)。表1測試視頻序列視頻序列幀數(shù)描述dancer2150非剛性形變,平面內(nèi)旋轉(zhuǎn),三維旋轉(zhuǎn)david471光照變化,尺度變化,非剛性形變david2537平面內(nèi)旋轉(zhuǎn),三維旋轉(zhuǎn)deer71運(yùn)動模糊,平面內(nèi)旋轉(zhuǎn),背景混淆dog127尺度變化,非剛性形變,三維旋轉(zhuǎn)lemming1336三維旋轉(zhuǎn),尺度變化,遮擋rubik1997尺度變化,遮擋,平面內(nèi)旋轉(zhuǎn),三維旋轉(zhuǎn)sylvester1345光照變化,平面內(nèi)旋轉(zhuǎn),三維旋轉(zhuǎn)tiger2365光照變化,平面內(nèi)旋轉(zhuǎn),三維旋轉(zhuǎn),trans124光照變化,尺度變化,非剛性形變表2為本發(fā)明的實驗中所有算法的fps的測試結(jié)果。為了公平比較算法的性能,所有的算法的硬件環(huán)境相同:i5-4300y1.6ghz處理器,8gb內(nèi)存。所有的c/c++代碼都在msvisualstudio2013中運(yùn)行,matlab代碼都在matlab2015b中運(yùn)行。提出的算法的平均幀率為62.63,具有較好的執(zhí)行效率,滿足實時性的要求。類似于fct算法,稀疏表示的應(yīng)用使得特征向量的維度大大減少。同時,由于正樣本包中絕大多數(shù)樣本是準(zhǔn)確的,所以在移除樣本時,只需要進(jìn)行較少次數(shù)的循環(huán)。每次循環(huán)中,每個樣本的概率也只需要計算一次。表2幀率(fps)表3為本發(fā)明的實驗中中心定位偏差的測試結(jié)果。cle是一幀圖像中,算法輸出的目標(biāo)中心位置與目標(biāo)的實際中心位置的歐式距離,可以用兩者之間的像素點(diǎn)的個數(shù)來表示。因為某一幀的cle不具有太大意義,所以通常記錄視頻中各個幀的cle,然后計算他們的平均值,即得到平均中心定位偏差,用該平均值來評估算法在視頻中的性能。表3平均中心定位偏差(平均cle)(像素數(shù))注:加粗字體表示最優(yōu)結(jié)果,加粗傾斜字體表示次優(yōu)結(jié)果表4為本發(fā)明的實驗中第二個評價指標(biāo)成功率的測試結(jié)果。按照如下準(zhǔn)則定義對一幀圖像的跟蹤結(jié)果的重疊評分:其中,roit表示跟蹤到的目標(biāo)所在的圖像塊,roig表示實際的目標(biāo)所在的圖像塊,∩和∪分別表示兩個圖像塊的交集和并集,area(·)表示某個圖像塊內(nèi)的像素點(diǎn)的個數(shù)。以上公式計算了目標(biāo)的圖像塊和實際圖像塊的重疊區(qū)域的大小。設(shè)置一個重疊閾值τo,如果score大于該閾值,則認(rèn)為對當(dāng)前幀的跟蹤是成功的,否則,跟蹤失敗。對一個視頻序列,選擇閾值為0.5,統(tǒng)計其中跟蹤成功的圖像幀的比例,就得到了跟蹤成功率sr。cle側(cè)重衡量跟蹤位置的準(zhǔn)確性,而sr更注重跟蹤結(jié)果的重疊面積。因此,sr更適合評價算法在尺度變化方面的性能,是測試多尺度跟蹤算法的準(zhǔn)確性時需要考慮的重要指標(biāo)。表4成功率(sr)(%)注:加粗字體表示最優(yōu)結(jié)果,加粗傾斜字體表示次優(yōu)結(jié)果由表3和表4的測試結(jié)果可以看出,對于所有視頻序列,無論是sr還是平均cle,提出的算法都具有最優(yōu)或次優(yōu)的結(jié)果。另外,提出的算法在平均cle和sr方面的性能都優(yōu)于fct算法,說明了多示例學(xué)習(xí)有助于提升算法的準(zhǔn)確性。相比于其他算法,提出的算法在評價指標(biāo)的平均值方面具有最好的結(jié)果。圖1和圖2分別為本發(fā)明的實驗中,目標(biāo)經(jīng)歷形變與姿態(tài)變化時和目標(biāo)經(jīng)歷平面內(nèi)旋轉(zhuǎn)與三維旋轉(zhuǎn)時的部分幀的跟蹤結(jié)果截圖。具體結(jié)果分析如下:形變與姿態(tài)變化:在視頻序列“david”(見圖1)中,當(dāng)人在室內(nèi)走動時,背景光照發(fā)生了從暗到亮的變化(#100,#150),同時,人的表情也有輕微的改變(#300)。提出的算法、fct和kcf在這個視頻序列中有著較好的結(jié)果。fct算法表現(xiàn)出了較好的性能,因為fct采用了haar-like特征來表示圖像塊,而haar-like特征已經(jīng)證明在人臉檢測中十分有效。然而,mil算法在#200之后開始出現(xiàn)明顯的目標(biāo)偏移。mil算法雖然也采用了haar-like特征,但是當(dāng)背景光照強(qiáng)烈變化引起目標(biāo)外觀發(fā)生改變時,算法無法有效地組合弱分類器形成一個強(qiáng)分類器。對于視頻序列“deer”(見圖2),隨著鹿在視野中跑動,其外觀逐漸發(fā)生改變。同時,目標(biāo)周圍的鹿群由于具有相似的毛發(fā),加劇了跟蹤過程的難度。該視頻序列包含了快速運(yùn)動(運(yùn)動模糊,#10),背景混淆(#25,#55),平面內(nèi)旋轉(zhuǎn)(#25,#35)等多種挑戰(zhàn),只有提出的算法和wmil有較高的跟蹤準(zhǔn)確性。在快速跑動過程中,目標(biāo)外觀及其周圍的環(huán)境會發(fā)生快速改變,很難從背景中準(zhǔn)確分離出目標(biāo),當(dāng)某一幀跟蹤結(jié)果產(chǎn)生較大偏差,偏差便會逐漸累積,導(dǎo)致嚴(yán)重的漂移。fct、mil和odfs算法在完成前幾幀圖像的跟蹤之后,就逐漸偏移了正確的目標(biāo)。在視頻序列“trans”(見圖3)中,目標(biāo)主要經(jīng)歷了嚴(yán)重的非剛性形變。相比于其他算法,只有提出的算法在中心定位偏差和成功率上具有較好的性能。雖然目標(biāo)從一個機(jī)器人變形為汽車的過程中形狀發(fā)生了較大的改變,但是主要是機(jī)器人的四肢發(fā)生明顯變化。因此可以通過保留距離目標(biāo)中心較近的正樣本,排除靠近四肢的正樣本來合理選擇樣本,更新分類器以避免目標(biāo)漂移。所以提出的算法的跟蹤偏差遠(yuǎn)低于其他算法。除此之外,在視頻序列“dancer2”(圖4)和“dog”(圖5)中,提出的算法都能夠準(zhǔn)確地跟蹤目標(biāo)。所以,當(dāng)目標(biāo)經(jīng)歷姿態(tài)變化或者非剛性形變時,提出的算法具有良好的跟蹤準(zhǔn)確性。平面內(nèi)旋轉(zhuǎn)與三維旋轉(zhuǎn):在視頻序列“sylvester”(見圖6)中,目標(biāo)經(jīng)歷了光照變化和大幅度的旋轉(zhuǎn)。提出的算法、fct和kcf具有較低的跟蹤偏差。由于目標(biāo)的姿態(tài)變化是隨機(jī)的,毫無規(guī)律可循,所以難以直接在haar-like特征中選擇一組最優(yōu)的特征。boosting算法(如mil和wmil)最終都丟失了目標(biāo)(#1300)。在視頻序列后半部分(#1200),提出的算法的跟蹤結(jié)果逐漸優(yōu)于fct。這是因為樣本的選擇過程有效減少了目標(biāo)遭受大尺度旋轉(zhuǎn)場景下的不準(zhǔn)確的樣本的個數(shù)。在視頻序列“tiger2”(見圖7)中,玩具老虎呈現(xiàn)出各種造型,同時經(jīng)歷了不同方向的旋轉(zhuǎn)變化。另外,玩具老虎還常常被樹葉遮擋。當(dāng)目標(biāo)快速移動時,還會變得模糊難以辨認(rèn)。提出的算法、fct、mil、odfs和wmil都能夠準(zhǔn)確地跟蹤目標(biāo)。由于mil、odfs和wmil算法通過選擇最具分類能力的特征來構(gòu)建boosting分類器,而這種boosting分類器往往能夠很好地解決遮擋問題,所以他們具有較好的跟蹤效果。在視頻序列“rubik”(見圖8)中,背景顏色與目標(biāo)的差別較明顯,因而很容易通過檢測目標(biāo)的顏色來識別目標(biāo)。但是由于大多數(shù)跟蹤算法采用灰度圖作為輸入,所以要想準(zhǔn)確跟蹤目標(biāo)仍然具有一定的挑戰(zhàn)性。提出的算法和kcf都具有較好的性能。因為kcf采用了基于脊回歸的強(qiáng)分類器,所以當(dāng)其他算法無法從灰度圖中準(zhǔn)確地識別目標(biāo)時,kcf仍具有很好的分辨能力。在視頻序列“david2”(見圖9)和“l(fā)emming”(見圖10)中,提出的算法同樣能夠穩(wěn)定地跟蹤目標(biāo)。這說明了算法對于旋轉(zhuǎn)造成的目標(biāo)外觀的變化具有魯棒性。本發(fā)明具有以下特點(diǎn)和顯著進(jìn)步:在跟蹤算法中,如果當(dāng)前跟蹤的位置產(chǎn)生了偏差,那么在其周圍采集到的正負(fù)樣本本身的類別信息就不準(zhǔn)確。但是可以合理地假設(shè)所有正樣本中一定包含一個最準(zhǔn)確的正樣本。同時假設(shè)跟蹤位置的偏差是輕微的,那么由于這些正樣本距離目標(biāo)中心較近,所以大部分正樣本的類別標(biāo)簽是準(zhǔn)確的。當(dāng)然,如果跟蹤的偏差很大,假設(shè)就不成立。但是這時跟蹤已經(jīng)失敗,很難再縮小偏差,因此沒有繼續(xù)跟蹤下去的必要了。負(fù)樣本因為距離目標(biāo)中心較遠(yuǎn),所以都是典型的負(fù)樣本。本發(fā)明采用了一種簡單有效的方式來排除樣本集合中較差的樣本,不需要調(diào)節(jié)大量的參數(shù),避免了由于樣本類別的不準(zhǔn)確導(dǎo)致的目標(biāo)漂移,提高了跟蹤準(zhǔn)確性。當(dāng)前第1頁12
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
阿合奇县| 启东市| 平利县| 麻栗坡县| 阿坝| 本溪市| 安远县| 新干县| 广南县| 华蓥市| 利川市| 班戈县| 勐海县| 象州县| 垫江县| 舞阳县| 西城区| 福建省| 桑日县| 承德县| 长沙县| 平江县| 安吉县| 台州市| 陕西省| 叶城县| 翁牛特旗| 辉南县| 隆德县| 沐川县| 云霄县| 宝山区| 岳普湖县| 丘北县| 杂多县| 时尚| 茂名市| 常山县| 二手房| 东阿县| 淮滨县|