基于低秩稀疏的視頻目標(biāo)跟蹤方法與流程

文檔序號(hào)：11638835閱讀：321來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明主要涉及到數(shù)字圖像處理領(lǐng)域，特指一種低秩稀疏的視頻跟蹤方法。

背景技術(shù)：

運(yùn)動(dòng)目標(biāo)的跟蹤是視覺領(lǐng)域的一項(xiàng)重要課題。跟蹤任務(wù)是在目標(biāo)選定的情況下，估計(jì)后續(xù)幀中目標(biāo)狀態(tài)信息的過程。視頻圖像的運(yùn)動(dòng)跟蹤問題通常也被認(rèn)為是動(dòng)態(tài)狀態(tài)估計(jì)問題，根據(jù)應(yīng)用的不同，目標(biāo)的狀態(tài)信息一般為目標(biāo)的運(yùn)動(dòng)物理特征，如位置，大小等。雖然國(guó)內(nèi)外研究人員經(jīng)過多年研究提出了很多解決方案，但是對(duì)于光照變化，遮擋問題，運(yùn)動(dòng)模糊問題仍然不能很好的解決。當(dāng)今監(jiān)控視頻日益增多，對(duì)目標(biāo)跟蹤需求力度也在增大，需要自動(dòng)化跟蹤可疑目標(biāo)，對(duì)于工作人員不可能全部瀏覽完畢的巨大數(shù)據(jù)量進(jìn)行全面清查，得到目標(biāo)。

視頻目標(biāo)跟蹤方法總體分為兩類：統(tǒng)計(jì)跟蹤方法和確定性跟蹤方法。雖然確定性跟蹤方法近些年一直有新成果出現(xiàn)，但是仍然不能從根本上解決實(shí)時(shí)性問題。

統(tǒng)計(jì)跟蹤方法近些年受到越來越廣泛的關(guān)注，它是利用狀態(tài)空間和測(cè)量空間共同描述整個(gè)跟蹤系統(tǒng)目標(biāo)的動(dòng)態(tài)變化過程，對(duì)狀態(tài)的估計(jì)通過尋找在相應(yīng)測(cè)量條件下狀態(tài)的后驗(yàn)概率峰值完成。粒子濾波是統(tǒng)計(jì)跟蹤方法中最為典型的一種方案，通過對(duì)采樣粒子不斷轉(zhuǎn)移和預(yù)測(cè)并獲取樣本相應(yīng)特征測(cè)量以對(duì)樣本權(quán)重進(jìn)行更新。利用樣本近似對(duì)狀態(tài)空間后驗(yàn)概率密度進(jìn)行估計(jì)。

近幾年在視頻跟蹤領(lǐng)域國(guó)內(nèi)外研究人員對(duì)外觀模型進(jìn)行了大量研究，總體分為兩大類：產(chǎn)生式模型和判別式模型。

產(chǎn)生式模型首先通過學(xué)習(xí)目標(biāo)的外觀特征，然后利用學(xué)習(xí)到的目標(biāo)外觀特征搜索相關(guān)圖像區(qū)域，根據(jù)最小誤差準(zhǔn)則得到后續(xù)視頻幀中的目標(biāo)位置。較為典型的產(chǎn)生式外觀模型有基于稀疏表達(dá)的外觀模型，基于正交匹配的外觀模型，增量學(xué)習(xí)方法等等。產(chǎn)生式外觀模型問題在于，外觀特征的學(xué)習(xí)需要的訓(xùn)練樣本數(shù)目較多，為了降低計(jì)算復(fù)雜度，只能線下學(xué)習(xí)并假設(shè)目標(biāo)外觀在整個(gè)跟蹤過程中是不變的。產(chǎn)生式模型不能充分利用目標(biāo)附近的背景信息，不利于提升跟蹤效果。

判別式模型將跟蹤問題看做二進(jìn)制分類問題，其主要思想是將目標(biāo)從背景中分離出來。比較典型的判別式模型有利用支持向量機(jī)分類器的跟蹤，在線提升跟蹤算法，半監(jiān)督在線提升跟蹤算法，多實(shí)例學(xué)習(xí)跟蹤算法，壓縮跟蹤算法等。壓縮跟蹤算法具有較高的實(shí)用性和可靠性，但是有幾個(gè)方面問題限制了其實(shí)用性：首先，其無法適應(yīng)目標(biāo)多尺度變化對(duì)跟蹤效果的影響，導(dǎo)致目標(biāo)丟失的可能性加大。其次，目前各種判別式跟蹤方法在采集樣本時(shí)往往利用目標(biāo)位置在時(shí)間上的相關(guān)性，在固定的半徑區(qū)域內(nèi)選擇，沒有考慮目標(biāo)運(yùn)動(dòng)的速度和加速度信息，對(duì)于快速目標(biāo)移動(dòng)因素的適應(yīng)性較差；最后，目前各種判別式跟蹤方法，分類器學(xué)習(xí)參數(shù)值固定，當(dāng)目標(biāo)長(zhǎng)時(shí)間被遮擋時(shí)，分類器必然會(huì)將覆蓋物誤認(rèn)為是目標(biāo)從而導(dǎo)致目標(biāo)跟丟。

技術(shù)實(shí)現(xiàn)要素：

為了克服現(xiàn)有技術(shù)中存在的問題，本發(fā)明提出一種基于低秩稀疏的視頻目標(biāo)跟蹤方法，避免因?yàn)閳D像特征信息冗余導(dǎo)致的處理速度減慢等問題。該方法實(shí)時(shí)性強(qiáng)，能夠適應(yīng)目標(biāo)尺度變化，跟蹤結(jié)果魯棒性高。

本發(fā)明的技術(shù)方案是：

一種基于低秩稀疏的視頻目標(biāo)跟蹤方法，包含以下步驟：

S1：初始化參數(shù)：

S11：給定圖像序列{I₁,I₂,…,I_M}，M為序列總數(shù)；隨機(jī)選擇圖像序列中的一張圖像中的一個(gè)對(duì)象為目標(biāo)，手動(dòng)選定該目標(biāo)的左上角p₁(x₁,y₁)，左下角p₂(x₂,y₂)以及右上角p₃(x₃,y₃)，且用矩陣P表示，生成相應(yīng)的矩形框確定該目標(biāo)在圖像中的位置，記該目標(biāo)矩形框的矢量形式為O，其寬和高分別為wi和he。

S12：壓縮S11中選定的圖像，設(shè)置壓縮后的圖像大小，寬為sz_w,高為sz_h，目標(biāo)壓縮后將其用向量表示，定義x為目標(biāo)壓縮后的圖像構(gòu)成的向量，其維度為sz_w*sz_h。具體地，其壓縮方法如下：

如果有min(wi,he)≤50，則取S11中選定的目標(biāo)大小，取值如下：

sz_w＝wi，sz_h＝he

如果有min(wi,he)＞50，則將S11中選定的圖像通過降采樣，降到原分辨率的一半，取值如下：

如果S11中選定的目標(biāo)過大即max(wi,he)＞64，則將將該目標(biāo)大小通過降采樣設(shè)置為定值：

sz_w＝32，sz_h＝32。

S13：初始化字典D_t

在目標(biāo)矩形框O上，定義2*3維隨機(jī)矩陣RAND，RAND中的元素為隨機(jī)生成的且服從高斯分布。

設(shè)置正樣本數(shù)為N_p，生成N_p個(gè)RAND，令T_i＝P+RAND_i*δ_p(i＝1,2...N_p)，得到N_p正樣本框，其中T_i指第i個(gè)樣本框的坐標(biāo)表示，δ_p是指正樣本框離目標(biāo)距離，值越大表明離目標(biāo)越遠(yuǎn)，RAND_i表示生成的第i個(gè)樣本框。

同樣的，設(shè)置負(fù)樣本數(shù)為N_n，生成N_n個(gè)RAND，令得到N_n負(fù)樣本框。其中T_i+p指第i+p個(gè)樣本框的坐標(biāo)表示，δ_n是指負(fù)樣本框離目標(biāo)距離，值越大表明離目標(biāo)越遠(yuǎn)；表示生成的第i+N_p個(gè)樣本框。δ_n＞＞δ_p，δ_n＞＞δ_p表示δ_n遠(yuǎn)大于δ_p。

定義D_t為t時(shí)刻的字典，將這N_p+N_n個(gè)矩形框矢量化后得到第1時(shí)刻的字典D₁。

S14：z為x在字典上的表示系數(shù)。如果D_t為完備字典，則有x＝D_tz，x、D_t已知,z為求解項(xiàng)，λ₀是z的一范數(shù)前的系數(shù)。求解目標(biāo)矩形框O在字典D_t上的表示系數(shù)z₀：

其中：x⁰是初始目標(biāo)壓縮后的圖像構(gòu)成的向量。

S15：仿射參數(shù)設(shè)置為：σ₀＝[σ₀¹,σ₀²,σ₀³,σ₀⁴,σ₀⁵,σ₀⁶]。一般地，σ₀¹、σ₀⁴的取值為0.01～0.05，σ₀²、σ₀³的取值為0.0001～0.0005，σ₀⁵、σ₀⁶的取值為1～5。

S16：用w表示D_t每個(gè)向量的權(quán)值，w為N_p+N_n維向量，w_i(i＝1,2...N_p+N_n)為w的分量；設(shè)置w_i(i＝1,2...N_p+N_n)初始值為設(shè)置權(quán)值的最小閾值為τ，0<τ<1。

S2：視頻跟蹤過程：

S21：利用粒子濾波方法進(jìn)行狀態(tài)預(yù)測(cè)，在目標(biāo)矩形框O的臨近區(qū)域內(nèi)隨機(jī)選取n個(gè)與目標(biāo)矩形O大小相同或相近的粒子，作為下一圖像序列目標(biāo)預(yù)測(cè)值候選者。

(1)將粒子作為目標(biāo)候選框，將S15設(shè)置的仿射參數(shù)σ₀＝[σ₀¹,σ₀²,σ₀³,σ₀⁴,σ₀⁵,σ₀⁶]作為高斯分布參數(shù)，生成n個(gè)粒子，每個(gè)粒子有6個(gè)參數(shù)。生成n*6維隨機(jī)矩陣T，令S＝T*diag(σ₀)，生成n*6的仿射參數(shù)矩陣，代表n個(gè)粒子。

其中，

(2)利用S在I_i中截取圖片，其中S可以轉(zhuǎn)化為坐標(biāo)矩陣，通過坐標(biāo)矩陣截取n張圖片，每張圖片轉(zhuǎn)化為sz_w*sz_h維向量，這n張圖片在坐標(biāo)矩陣P附近，與P的距離呈高斯分布，P為I_i-1時(shí)刻的目標(biāo)圖片坐標(biāo)。這些圖片作為粒子，構(gòu)成X₀，X₀為(sz_w*sz_h)*n維矩陣，作為下一圖像序列目標(biāo)預(yù)測(cè)值候選者。

S22：構(gòu)建重建錯(cuò)誤，剔除與目標(biāo)差距較大的粒子：

首先，定義e₀ⁱ＝||X₀ⁱ-Dz₀||₂(i＝1,2...n)，e₀值越大，說明與目標(biāo)的差距越大，X₀ⁱ是矩陣X₀的第i列向量，選出X₀中e₀最小的25個(gè)候選粒子構(gòu)成矩陣X，方法如下：

X＝X₀^j(j∈co)

其中，

S23：Z_t為X在字典D_t上的表示系數(shù)矩陣，有X＝D_t×Z_t；由于X是低秩，因此Z_t也是低秩；由于25個(gè)候選粒子接近目標(biāo)向量，因此Z_t也是稀疏矩陣，因此求解Z_t可以根據(jù)約束求解，約束設(shè)置如下：

其中||E||_1,1＝∑_j(∑_i|[E]_ij|),

其中，||Z_t||_2,1項(xiàng)代表低秩稀疏，Z₀為z₀復(fù)制N_P+N_n個(gè)后所組成的矩陣，||E||_1,1為重建錯(cuò)誤差表示計(jì)算X＝D_t×Z_t時(shí)，D_t×Z_t的結(jié)果與X的誤差，誤差越小，表明用字典D_t恢復(fù)的圖像越接近原始圖像。λ_i(i＝1,2,3)作為不同項(xiàng)的系數(shù)，令λ₃＝1，λ₁、λ₂需要根據(jù)仿真結(jié)果確定其大小。

S24：定義z_io為z_i正樣本系數(shù)，為N_p維向量，z_i^b為z_i負(fù)樣本系數(shù)，為N_n維向量；設(shè)置差別分?jǐn)?shù)Δz，Δz表示正樣本系數(shù)絕對(duì)值的總和減去負(fù)樣本系數(shù)絕對(duì)值總和，Δz計(jì)算方法如下：

Δz_i＝||z_i^o||₁-||z_i^b||₁(i＝1,2...n)

其中i表示第i個(gè)粒子，將差別分?jǐn)?shù)最小的向量作為目標(biāo)向量，同時(shí)替換上一時(shí)刻目標(biāo)表示系數(shù)z₀，賦予z₀新的值：

其中，||Y||₁＝(∑_j(∑_i|Y_ij|))，如||z_i^o||₁＝(∑_j(∑_i|(z_i^o)_ij|))，||z_i^b||₁＝(∑_j(∑_i|(z_i^b)_ij|))。

z₀即為新選出的目標(biāo)在字典D_t上的表示系數(shù)。

S25：字典更新；

目標(biāo)跟蹤過程中，每一幀都要將權(quán)值進(jìn)行更新，將權(quán)值閾值小于τ的向量進(jìn)行更換，方法如下：

令w_i←w_i*exp(z_oⁱ)(i＝1,2...N_p+N_n)，如果w_i＜τ，則令i₀＝argmin_1≤i≤na_i，

其中表示圖像t序列中字典D_t的第i₀個(gè)分量，w_i表示w的第i個(gè)分量，w_i←w_i*exp(z_oⁱ)(i＝1,2...N_p+N_n)表示將w_i*exp(z_oⁱ)賦值給w_i，同理，表示將z₀賦值給

S26：重復(fù)S21～S25。

該方法具有如下優(yōu)點(diǎn)：利用l_2,1范數(shù)，實(shí)現(xiàn)圖像的稀疏以及低秩，減少原始高維特征即可對(duì)目標(biāo)進(jìn)行有效建模，使得本發(fā)明所述方法計(jì)算復(fù)雜度低，能夠?qū)崟r(shí)跟蹤目標(biāo)。

附圖說明

圖1為本發(fā)明的流程圖；

具體實(shí)施方式

下面結(jié)合附圖，對(duì)本發(fā)明作進(jìn)一步的說明。

S1：初始化參數(shù)：

如果有min(wi,he)≤50，則取S11中選定的目標(biāo)大小，取值如下：

sz_w＝wi，sz_h＝he

如果有min(wi,he)＞50，則將S11中選定的圖像通過降采樣，降到原分辨率的一半，取值如下：

如果S11中選定的目標(biāo)過大即max(wi,he)＞64，則將將該目標(biāo)大小通過降采樣設(shè)置為定值：

sz_w＝32，sz_h＝32。

S13：初始化字典D_t

在目標(biāo)矩形框O上，定義2*3維隨機(jī)矩陣RAND，RAND中的元素為隨機(jī)生成的且服從高斯分布。

設(shè)置正樣本數(shù)為20，生成20個(gè)RAND，令T_i＝P+RAND_i*δ_p(i＝1,2...20)，得到20個(gè)正樣本框，其中T_i指第i個(gè)樣本框的坐標(biāo)表示，δ_p是指正樣本框離目標(biāo)距離，值越大表明離目標(biāo)越遠(yuǎn)，RAND_i表示生成的第i個(gè)樣本框。

同樣的，設(shè)置負(fù)樣本數(shù)為30，生成30個(gè)RAND，令T_i+20＝P+RAND_i+20*δ_n(i＝1,2...30)，得到30個(gè)負(fù)樣本框。其中T_i+p指第i+p個(gè)樣本框的坐標(biāo)表示，δ_n是指負(fù)樣本框離目標(biāo)距離，值越大表明離目標(biāo)越遠(yuǎn)；RAND_i+20表示生成的第i+20個(gè)樣本框。δ_n＞＞δ_p，δ_n＞＞δ_p表示δ_n遠(yuǎn)大于δ_p。

定義D_t為t時(shí)刻的字典，將這50個(gè)矩形框矢量化后得到第1時(shí)刻的字典D₁。

其中：x₀是初始目標(biāo)壓縮后的圖像構(gòu)成的向量。

S15：仿射參數(shù)設(shè)置為：σ₀＝[0.03,0.0005,0.0005,0.03,1,1]。

S16：用w表示D_t每個(gè)向量的權(quán)值，w為50維向量，w_i(i＝1,2...50)為w的分量；設(shè)置w_i(i＝1,2...50)初始值為設(shè)置權(quán)值的最小閾值為τ＝0.6。

S2：視頻跟蹤過程：

(1)將粒子作為目標(biāo)候選框，將S15設(shè)置的仿射參數(shù)σ₀＝[0.03,0.0005,0.0005,0.03,1,1]作為高斯分布參數(shù)，生成400個(gè)粒子，每個(gè)粒子有6個(gè)參數(shù)。生成400*6維隨機(jī)矩陣T，令S＝T*diag(σ₀)，生成400*6的仿射參數(shù)矩陣，代表400個(gè)粒子。

其中，

(2)利用S在I_i中截取圖片，其中S可以轉(zhuǎn)化為坐標(biāo)矩陣，通過坐標(biāo)矩陣截取400張圖片，每張圖片轉(zhuǎn)化為sz_w*sz_h維向量，這400張圖片在坐標(biāo)矩陣P附近，與P的距離呈高斯分布，P為I_i-1時(shí)刻的目標(biāo)圖片坐標(biāo)。這些圖片作為粒子，構(gòu)成X₀，X₀為(sz_w*sz_h)*400維矩陣，作為下一圖像序列目標(biāo)預(yù)測(cè)值候選者。

S22：構(gòu)建重建錯(cuò)誤，剔除與目標(biāo)差距較大的粒子：

首先，定義e₀ⁱ＝||X₀ⁱ-Dz₀||₂(i＝1,2...400)，e₀值越大，說明與目標(biāo)的差距越大，X₀ⁱ是矩陣X₀的第i列向量，選出X₀中e₀最小的25個(gè)候選粒子構(gòu)成矩陣X，方法如下：

X＝X₀^j(j∈co)

其中，

其中||E||_1,1＝∑_j(∑_i|[E]_ij|),

S24：定義z_i^o為z_i正樣本系數(shù)，為20維向量，z_i^b為z_i負(fù)樣本系數(shù)，為30維向量；設(shè)置差別分?jǐn)?shù)Δz，Δz表示正樣本系數(shù)絕對(duì)值的總和減去負(fù)樣本系數(shù)絕對(duì)值總和，Δz計(jì)算方法如下：

Δz_i＝||z_i^o||₁-||z_i^b||₁(i＝1,2...400)

其中i表示第i個(gè)粒子，將差別分?jǐn)?shù)最小的向量作為目標(biāo)向量，同時(shí)替換上一時(shí)刻目標(biāo)表示系數(shù)z₀，賦予z₀新的值：

其中，||Y||₁＝(∑_j(∑_i|Y_ij|))，如||z_i^o||₁＝(∑_j(∑_i|(z_i^o)_ij|))，||z_i^b||₁＝(∑_j(∑_i|(z_i^b)_ij|))。

z₀即為新選出的目標(biāo)在字典D_t上的表示系數(shù)。

S25：字典更新；

目標(biāo)跟蹤過程中，每一幀都要將權(quán)值進(jìn)行更新，將權(quán)值閾值小于τ的向量進(jìn)行更換，方法如下：

令w_i←w_i*exp(z_oⁱ)(i＝1,2...50)，如果w_i＜τ，則令i₀＝argmin_1≤i≤na_i，

其中表示圖像t序列中字典D_t的第i₀個(gè)分量，w_i表示w的第i個(gè)分量，w_i←w_i*exp(z_oⁱ)(i＝1,2...50)表示將w_i*exp(zoⁱ)賦值給w_i，同理，表示將z₀賦值給

S26：重復(fù)S21～S25。

如上所述，本發(fā)明利用統(tǒng)計(jì)跟蹤方法粒子濾波進(jìn)行狀態(tài)估計(jì)。通過建立字典對(duì)目標(biāo)、粒子進(jìn)行低秩稀疏表示，使得計(jì)算復(fù)雜度大大降低。利用重建錯(cuò)誤預(yù)先刪除部分粒子，再計(jì)算差別分?jǐn)?shù)，最終選定下一幀目標(biāo)。本發(fā)明所述方法對(duì)視頻圖像中的目標(biāo)能夠?qū)崟r(shí)跟蹤、準(zhǔn)確性高、計(jì)算復(fù)雜度低，符合實(shí)際跟蹤中應(yīng)用的需要。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：劉煜;王咪;賴世銘;徐瑋;熊志輝;
技術(shù)所有人：中國(guó)人民解放軍國(guó)防科學(xué)技術(shù)大學(xué);
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

低秩稀疏分解相關(guān)技術(shù)

矩陣低秩稀疏分解相關(guān)技術(shù)

低秩表示和稀疏表示相關(guān)技術(shù)

低秩和稀疏相關(guān)技術(shù)

低秩稀疏矩陣相關(guān)技術(shù)

矩陣的低秩稀疏分解相關(guān)技術(shù)

稀疏低秩相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于低秩稀疏的視頻目標(biāo)跟蹤方法與流程