1.一種基于低秩稀疏的視頻目標跟蹤方法,其特征在于包括以下步驟:
S1:初始化參數(shù):
S11:給定圖像序列{I1,I2,…,IM},M為序列總數(shù);隨機選擇圖像序列中的一張圖像中的一個對象為目標,手動選定該目標的左上角p1(x1,y1),左下角p2(x2,y2)以及右上角p3(x3,y3),且用矩陣P表示,生成相應的矩形框確定該目標在圖像中的位置,記該目標矩形框的矢量形式為O,其寬和高分別為wi和he;
S12:壓縮S11中選定的圖像,設(shè)置壓縮后的圖像大小,寬為sz_w,高為sz_h,目標壓縮后將其用向量表示,定義x為目標壓縮后的圖像構(gòu)成的向量,其維度為sz_w*sz_h;
S13:初始化字典Dt
在目標矩形框O上,定義2*3維隨機矩陣RAND,RAND中的元素為隨機生成的且服從高斯分布;
設(shè)置正樣本數(shù)為Np,生成Np個RAND,令Ti=P+RANDi*δp(i=1,2...Np),得到Np正樣本框,其中Ti指第i個樣本框的坐標表示,δp是指正樣本框離目標距離,值越大表明離目標越遠,RANDi表示生成的第i個樣本框;
同樣的,設(shè)置負樣本數(shù)為Nn,生成Nn個RAND,令得到Nn負樣本框;其中Ti+p指第i+p個樣本框的坐標表示,δn是指負樣本框離目標距離,值越大表明離目標越遠;表示生成的第i+Np個樣本框;
定義Dt為t時刻的字典,將這Np+Nn個矩形框矢量化后得到第1時刻的字典D1;
S14:z為x在字典上的表示系數(shù);如果Dt為完備字典,則有x=Dtz,x、Dt已知,z為求解項,λ0是z的一范數(shù)前的系數(shù);求解目標矩形框O在字典Dt上的表示系數(shù)z0:
其中:x0是初始目標壓縮后的圖像構(gòu)成的向量;
S15:仿射參數(shù)設(shè)置為:σ0=[σ01,σ02,σ03,σ04,σ05,σ06];
S16:用w表示Dt每個向量的權(quán)值,w為Np+Nn維向量,wi(i=1,2...Np+Nn)為w的分量;設(shè)置wi(i=1,2...Np+Nn)初始值為設(shè)置權(quán)值的最小閾值為τ,0<τ<1;
S2:視頻跟蹤過程:
S21:利用粒子濾波方法進行狀態(tài)預測,在目標矩形框O的臨近區(qū)域內(nèi)隨機選取n個與目標矩形O大小相同或相近的粒子,作為下一圖像序列目標預測值候選者;
(1)將粒子作為目標候選框,將S15設(shè)置的仿射參數(shù)σ0=[σ01,σ02,σ03,σ04,σ05,σ06]作為高斯分布參數(shù),生成n個粒子,每個粒子有6個參數(shù);生成n*6維隨機矩陣T,令S=T*diag(σ0),生成n*6的仿射參數(shù)矩陣,代表n個粒子;
其中,
(2)利用S在Ii中截取圖片,其中S可以轉(zhuǎn)化為坐標矩陣,通過坐標矩陣截取n張圖片,每張圖片轉(zhuǎn)化為sz_w*sz_h維向量,這n張圖片在坐標矩陣P附近,與P的距離呈高斯分布,P為Ii-1時刻的目標圖片坐標;這些圖片作為粒子,構(gòu)成X0,X0為(sz_w*sz_h)*n維矩陣,作為下一圖像序列目標預測值候選者;
S22:構(gòu)建重建錯誤,剔除與目標差距較大的粒子:
首先,定義e0i=||X0i-Dz0||2(i=1,2...n),e0值越大,說明與目標的差距越大,X0i是矩陣X0的第i列向量,選出X0中e0最小的25個候選粒子構(gòu)成矩陣X,方法如下:
X=X0j(j∈co)
其中,
S23:Zt為X在字典Dt上的表示系數(shù)矩陣,有X=Dt×Zt;由于X是低秩,因此Zt也是低秩;由于25個候選粒子接近目標向量,因此Zt也是稀疏矩陣,因此求解Zt可以根據(jù)約束求解,約束設(shè)置如下:
其中||E||1,1=∑j(∑i|[E]ij|),
其中,||Zt||2,1項代表低秩稀疏,Z0為z0復制NP+Nn個后所組成的矩陣,||E||1,1為重建錯誤差表示計算X=Dt×Zt時,Dt×Zt的結(jié)果與X的誤差,誤差越小,表明用字典Dt恢復的圖像越接近原始圖像;λi(i=1,2,3)作為不同項的系數(shù);
S24:定義zio為zi正樣本系數(shù),為Np維向量,zib為zi負樣本系數(shù),為Nn維向量;設(shè)置差別分數(shù)Δz,Δz表示正樣本系數(shù)絕對值的總和減去負樣本系數(shù)絕對值總和,Δz計算方法如下:
Δzi=||zio||1-||zib||1(i=1,2...n)
其中i表示第i個粒子,將差別分數(shù)最小的向量作為目標向量,同時替換上一時刻目標表示系數(shù)z0,賦予z0新的值:
其中,||zio||1=(∑j(∑i|(zio)ij|)),||zib||1=(∑j(∑i|(zib)ij|));
z0即為新選出的目標在字典Dt上的表示系數(shù);
S25:字典更新;
目標跟蹤過程中,每一幀都要將權(quán)值進行更新,將權(quán)值閾值小于τ的向量進行更換,方法如下:
令wi←wi*exp(zoi)(i=1,2...Np+Nn),如果wi<τ,則令i0=argmin1≤i≤nai,
其中表示圖像t序列中字典Dt的第i0個分量,wi表示w的第i個分量,wi←wi*exp(zoi)(i=1,2...Np+Nn)表示將wi*exp(zoi)賦值給wi,同理,表示將z0賦值給
S26:重復S21~S25。
2.根據(jù)權(quán)利要求1所述的基于低秩稀疏的視頻目標跟蹤方法,其特征在于,S12中圖像的壓縮方法如下:
如果有min(wi,he)≤50,則取S11中選定的目標大小,取值如下:
sz_w=wi,sz_h=he
如果有min(wi,he)>50,則將S11中選定的圖像通過降采樣,降到原分辨率的一半,取值如下:
如果S11中選定的目標過大即max(wi,he)>64,則將將該目標大小通過降采樣設(shè)置為定值:
sz_w=32,sz_h=32。
3.根據(jù)權(quán)利要求1所述的基于低秩稀疏的視頻目標跟蹤方法,其特征在于,S13中,δn>>δp,δn>>δp表示δn遠大于δp。
4.根據(jù)權(quán)利要求1所述的基于低秩稀疏的視頻目標跟蹤方法,其特征在于,S15中,σ01、σ04的取值為0.01~0.05,σ02、σ03的取值為0.0001~0.0005,σ05、σ06的取值為1~5。