1.一種安防視頻中多場(chǎng)景多目標(biāo)識(shí)別和跟蹤方法,其特征在于,具體步驟包括:
(1)從視頻中采集含有目標(biāo)對(duì)象的圖像幀;
(2)提取出目標(biāo)對(duì)象的特征,包括目標(biāo)對(duì)象的顏色直方圖和哈希編碼;如果是一個(gè)目標(biāo)對(duì)象,則直接提取該目標(biāo)對(duì)象的顏色直方圖和哈希編碼,如果為兩個(gè)或以上目標(biāo)對(duì)象,則對(duì)目標(biāo)對(duì)象進(jìn)行編號(hào),提取編號(hào)后的每個(gè)目標(biāo)對(duì)象的顏色直方圖和哈希編碼;
(3)對(duì)后續(xù)視頻,通過(guò)與目標(biāo)對(duì)象的特征進(jìn)行匹配,檢測(cè)目標(biāo)對(duì)象,如果檢測(cè)到目標(biāo)對(duì)象,進(jìn)入步驟(4),否則,重復(fù)執(zhí)行步驟(3);
(4)對(duì)目標(biāo)對(duì)象進(jìn)行跟蹤。
2.根據(jù)權(quán)利要求1所述的一種安防視頻中多場(chǎng)景多目標(biāo)識(shí)別和跟蹤方法,其特征在于,所述步驟(3),檢測(cè)目標(biāo)對(duì)象,具體步驟包括:
a、運(yùn)動(dòng)區(qū)域檢測(cè):用幀差分法檢測(cè)視頻中運(yùn)動(dòng)區(qū)域,如果檢測(cè)到包含一群人的運(yùn)動(dòng)區(qū)域,進(jìn)入步驟b,如果檢測(cè)到僅包含一個(gè)人的區(qū)域,進(jìn)入步驟c;
b、用人群分割算法把檢測(cè)到包含一群人的運(yùn)動(dòng)區(qū)域分割為僅包含一個(gè)人的不同區(qū)域,即若干個(gè)單人區(qū)域;
c、提取僅包含一個(gè)人的區(qū)域的顏色直方圖和哈希編碼,與目標(biāo)對(duì)象的顏色直方圖和哈希編碼分別進(jìn)行匹配,分別得到巴氏距離和漢明距離,巴氏距離的權(quán)重為a,漢明距離的權(quán)重為b,用來(lái)表示僅包含一個(gè)人的區(qū)域與目標(biāo)對(duì)象的相似性;巴氏距離用來(lái)表示僅包含一個(gè)人的區(qū)域的顏色直方圖與目標(biāo)對(duì)象的顏色直方圖的相似性,漢明距離用來(lái)表示僅包含一個(gè)人的區(qū)域的哈希編碼與目標(biāo)對(duì)象的哈希編碼的相似性,a的取值范圍為60-80%,b的取值范圍為20-40%,a+b=100%;
d、當(dāng)僅包含一個(gè)人的區(qū)域與目標(biāo)對(duì)象的相似性大于等于閾值c時(shí),判定僅包含一個(gè)人的區(qū)域中含有目標(biāo)對(duì)象,將目標(biāo)對(duì)象區(qū)域用矩形框框出,否則,判定僅包含一個(gè)人的區(qū)域中不含有目標(biāo)對(duì)象;閾值c的取值范圍為70%-90%。
3.根據(jù)權(quán)利要求2所述的一種安防視頻中多場(chǎng)景多目標(biāo)識(shí)別和跟蹤方法,其特征在于,a=70%,b=30%,c=80%。
4.根據(jù)權(quán)利要求1所述的一種安防視頻中多場(chǎng)景多目標(biāo)識(shí)別和跟蹤方法,其特征在于,所述顏色直方圖,是指不同色彩在整幅圖像中所占的比例,即對(duì)彩色圖像色域值進(jìn)行區(qū)間劃分,對(duì)每個(gè)區(qū)間中的像素個(gè)數(shù)占比進(jìn)行統(tǒng)計(jì)。
5.根據(jù)權(quán)利要求1所述的一種安防視頻中多場(chǎng)景多目標(biāo)識(shí)別和跟蹤方法,其特征在于,所述哈希編碼,是通過(guò)以下步驟獲取的:
e、去除圖像的高頻分量;
f、將圖像尺寸被縮減到8×8,含有64個(gè)像素;
g、將8×8尺寸圖象轉(zhuǎn)化為灰度圖像,并計(jì)算出64個(gè)像素的平均灰度值;
h、將64個(gè)像素的平均灰度值與8×8尺寸圖象中每個(gè)像素灰度值相比較,如果像素的灰度值比平均灰度值小,該像素的編碼值為0,否則編碼值為1;
i、將所有像素灰度值與平均灰度值比較之后,得到的64位編碼為哈希編碼。
6.根據(jù)權(quán)利要求1所述的一種安防視頻中多場(chǎng)景多目標(biāo)識(shí)別和跟蹤方法,其特征在于,所述步驟(2),具體是指:根據(jù)坐標(biāo)點(diǎn)手動(dòng)確定采集圖像中的目標(biāo)對(duì)象區(qū)域,提取出目標(biāo)對(duì)象的特征,包括目標(biāo)對(duì)象的顏色直方圖和哈希編碼。
7.根據(jù)權(quán)利要求1所述的一種安防視頻中多場(chǎng)景多目標(biāo)識(shí)別和跟蹤方法,其特征在于,所述步驟(4),使用判別稀疏相似度圖法對(duì)目標(biāo)對(duì)象進(jìn)行跟蹤,具體是指:
J、初始判別模板集:假設(shè)Q(h,v)是目標(biāo)對(duì)象最小矩形區(qū)域的中心點(diǎn),所述最小矩形區(qū)域是包含某個(gè)目標(biāo)對(duì)象的最小矩形圖像區(qū)域;(h,v)是指Q(h,v)的坐標(biāo)值;在以Q(h,v)為中心的圓形區(qū)域內(nèi),該圓形區(qū)域半徑滿足的取值為正數(shù),且不大于最小矩形區(qū)域的較短的邊長(zhǎng)的二分之一,取p個(gè)樣本圖像區(qū)塊作為初始正模板庫(kù),Qi是第i個(gè)樣本圖像區(qū)塊的中心點(diǎn),1≤i≤p;從半徑滿足的環(huán)形區(qū)域中,采樣n個(gè)圖像區(qū)塊,得到初始負(fù)模板庫(kù),Qj是第j個(gè)圖像區(qū)塊的中心點(diǎn),和ω是環(huán)形區(qū)域的內(nèi)外半徑;ω不大于最小矩形區(qū)域的較短的邊長(zhǎng)的二分之一;
k、判別反向稀疏表示:判別稀疏相似度圖矩陣表示所有候選目標(biāo)對(duì)象和模板集之間的關(guān)系,如式(Ⅰ)所示:
式(Ⅰ)中,C為判別稀疏相似度圖矩陣,T為模板集,包括初始正模板庫(kù)及初始負(fù)模板庫(kù),Y為候選目標(biāo)對(duì)象。