本發(fā)明涉及一種安防視頻中多場景多目標(biāo)識(shí)別和跟蹤方法,屬于數(shù)字圖像處理和計(jì)算機(jī)視覺
技術(shù)領(lǐng)域:
。
背景技術(shù):
:視頻監(jiān)控網(wǎng)絡(luò)中的大規(guī)模目標(biāo)跟蹤已成為計(jì)算機(jī)視覺領(lǐng)域的研究熱點(diǎn),并且廣泛應(yīng)用于交通管理、數(shù)字監(jiān)控、智能城市等。然而,光線的變化和復(fù)雜的背景等因素會(huì)影響目標(biāo)跟蹤性能。為了實(shí)現(xiàn)高跟蹤精度,近年來研究人員提出大量的算法?;谀繕?biāo)模式匹配搜索的傳統(tǒng)方法將目標(biāo)對(duì)象跟蹤作為一個(gè)本地模式匹配優(yōu)化問題。作為目標(biāo)模式匹配追蹤算法的經(jīng)典方法,均值漂移算法具有快速收斂特性,適用于實(shí)時(shí)跟蹤,但是,對(duì)目標(biāo)的尺寸變化響應(yīng)弱限制了該方法的發(fā)展?;跒V波器理論的另一個(gè)傳統(tǒng)方法將目標(biāo)對(duì)象跟蹤轉(zhuǎn)化為貝葉斯理論架構(gòu),它使用先驗(yàn)概率來預(yù)測目標(biāo)對(duì)象的最大后驗(yàn)概率??柭鼮V波算法在處理線性、高斯和單一模型跟蹤任務(wù)時(shí)效果較好,而粒子濾波算法適用于非線性,非高斯的跟蹤。這些算法都有一定的有益效果,但是也存在自身的缺陷,需要根據(jù)實(shí)際應(yīng)用場合靈活配置。眾所周知,跟蹤精度在很大程度上取決于從目標(biāo)對(duì)象提取的特征,并且對(duì)特征的有效描述是目標(biāo)跟蹤的關(guān)鍵。如今安防視頻監(jiān)控網(wǎng)絡(luò)遍布,每天有大量的安防視頻數(shù)據(jù)被存儲(chǔ),但是很少有人對(duì)這些數(shù)據(jù)進(jìn)行分析和處理。一般來說,安防監(jiān)控視頻中感興趣的目標(biāo)往往是一個(gè)或者多個(gè)人,對(duì)視頻中的一個(gè)或多個(gè)行人目標(biāo)進(jìn)行識(shí)別和跟蹤具有很大的實(shí)用價(jià)值,其中同時(shí)對(duì)大數(shù)量的多個(gè)目標(biāo)進(jìn)行識(shí)別和跟蹤是研究人員的主要研究方向?,F(xiàn)階段,通過人員值守進(jìn)行安防監(jiān)控不僅浪費(fèi)人力,而且往往會(huì)忽視一些目標(biāo)。通過計(jì)算機(jī)輔助,對(duì)圖像進(jìn)行處理,進(jìn)行多目標(biāo)識(shí)別和跟蹤可以彌補(bǔ)人工觀察的缺陷,能夠?qū)崿F(xiàn)實(shí)時(shí)提示、預(yù)警和信息上傳,不僅節(jié)約資源,而且準(zhǔn)確、方便、快捷。技術(shù)實(shí)現(xiàn)要素:針對(duì)現(xiàn)有技術(shù)的不足,本發(fā)明提供了一種安防視頻中多場景多目標(biāo)識(shí)別和跟蹤方法;術(shù)語解釋判別反向稀疏表示,即DiscriminativeReverseSparseRepresentation。本發(fā)明的技術(shù)方案為:一種安防視頻中多場景多目標(biāo)識(shí)別和跟蹤方法,具體步驟包括:(1)從視頻中采集含有目標(biāo)對(duì)象的圖像幀;(2)提取出目標(biāo)對(duì)象的特征,包括目標(biāo)對(duì)象的顏色直方圖和哈希編碼;如果是一個(gè)目標(biāo)對(duì)象,則直接提取該目標(biāo)對(duì)象的顏色直方圖和哈希編碼,如果為兩個(gè)或以上目標(biāo)對(duì)象,則對(duì)目標(biāo)對(duì)象進(jìn)行編號(hào),提取編號(hào)后的每個(gè)目標(biāo)對(duì)象的顏色直方圖和哈希編碼;(3)對(duì)后續(xù)視頻,通過與目標(biāo)對(duì)象的特征進(jìn)行匹配,檢測目標(biāo)對(duì)象,如果檢測到目標(biāo)對(duì)象,進(jìn)入步驟(4),否則,重復(fù)執(zhí)行步驟(3);(4)對(duì)目標(biāo)對(duì)象進(jìn)行跟蹤。根據(jù)本發(fā)明優(yōu)選的,所述步驟(3),檢測目標(biāo)對(duì)象,具體步驟包括:a、運(yùn)動(dòng)區(qū)域檢測:用幀差分法檢測視頻中運(yùn)動(dòng)區(qū)域,如果檢測到包含一群人的運(yùn)動(dòng)區(qū)域,進(jìn)入步驟b,如果檢測到僅包含一個(gè)人的區(qū)域,進(jìn)入步驟c;由于圖像背景是復(fù)雜的,檢測到的運(yùn)動(dòng)區(qū)域中可能包含一群人;b、用人群分割算法把檢測到包含一群人的運(yùn)動(dòng)區(qū)域分割為僅包含一個(gè)人的不同區(qū)域,即若干個(gè)單人區(qū)域;c、提取僅包含一個(gè)人的區(qū)域的顏色直方圖和哈希編碼,與目標(biāo)對(duì)象的顏色直方圖和哈希編碼分別進(jìn)行匹配,分別得到巴氏距離和漢明距離,巴氏距離的權(quán)重為a,漢明距離的權(quán)重為b,用來表示僅包含一個(gè)人的區(qū)域與目標(biāo)對(duì)象的相似性;巴氏距離用來表示僅包含一個(gè)人的區(qū)域的顏色直方圖與目標(biāo)對(duì)象的顏色直方圖的相似性,漢明距離用來表示僅包含一個(gè)人的區(qū)域的哈希編碼與目標(biāo)對(duì)象的哈希編碼的相似性,a的取值范圍為60-80%,b的取值范圍為20-40%,a+b=100%;d、當(dāng)僅包含一個(gè)人的區(qū)域與目標(biāo)對(duì)象的相似性大于等于閾值c時(shí),判定僅包含一個(gè)人的區(qū)域中含有目標(biāo)對(duì)象,將目標(biāo)對(duì)象區(qū)域用矩形框框出,否則,判定僅包含一個(gè)人的區(qū)域中不含有目標(biāo)對(duì)象;閾值c的取值范圍為70%-90%。根據(jù)本發(fā)明優(yōu)選的,a=70%,b=30%,c=80%。根據(jù)本發(fā)明優(yōu)選的,所述顏色直方圖,是指不同色彩在整幅圖像中所占的比例,即對(duì)彩色圖像色域值進(jìn)行區(qū)間劃分,對(duì)每個(gè)區(qū)間中的像素個(gè)數(shù)占比進(jìn)行統(tǒng)計(jì)。根據(jù)本發(fā)明優(yōu)選的,所述哈希編碼,是通過以下步驟獲取的:e、去除圖像的高頻分量;f、將圖像尺寸被縮減到8×8,含有64個(gè)像素;g、將8×8尺寸圖象轉(zhuǎn)化為灰度圖像,并計(jì)算出64個(gè)像素的平均灰度值;h、將64個(gè)像素的平均灰度值與8×8尺寸圖象中每個(gè)像素灰度值相比較,如果像素的灰度值比平均灰度值小,該像素的編碼值為0,否則編碼值為1;i、將所有像素灰度值與平均灰度值比較之后,得到的64位編碼為哈希編碼??梢詼?zhǔn)確描述該圖像的特征。圖像可以被看作包含不同頻率分量的二維信號(hào),該信號(hào)的高頻分量代表變化劇烈的區(qū)域,如物體的邊緣,并且它可以很好地描述圖像的細(xì)節(jié)。低頻分量可以描述圖像的結(jié)構(gòu),哈希編碼主要利用圖像的低頻信息。根據(jù)本發(fā)明優(yōu)選的,所述步驟(2),具體是指:根據(jù)坐標(biāo)點(diǎn)手動(dòng)確定采集圖像中的目標(biāo)對(duì)象區(qū)域,提取出目標(biāo)對(duì)象的特征,包括目標(biāo)對(duì)象的顏色直方圖和哈希編碼。從而獲取目標(biāo)對(duì)象的特征模型。根據(jù)本發(fā)明優(yōu)選的,所述步驟(4),使用判別稀疏相似度圖法(DSSMap)對(duì)目標(biāo)對(duì)象進(jìn)行跟蹤,具體是指:J、初始判別模板集:假設(shè)Q(h,v)是目標(biāo)對(duì)象最小矩形區(qū)域的中心點(diǎn),所述最小矩形區(qū)域是包含某個(gè)目標(biāo)對(duì)象的最小矩形圖像區(qū)域;(h,v)是指Q(h,v)的坐標(biāo)值;在以Q(h,v)為中心的圓形區(qū)域內(nèi),該圓形區(qū)域半徑滿足的取值為正數(shù),且不大于最小矩形區(qū)域的較短的邊長的二分之一,取p個(gè)樣本圖像區(qū)塊作為初始正模板庫,Qi是第i個(gè)樣本圖像區(qū)塊的中心點(diǎn),1≤i≤p;從半徑滿足的環(huán)形區(qū)域中,采樣n個(gè)圖像區(qū)塊,得到初始負(fù)模板庫,Qj是第j個(gè)圖像區(qū)塊的中心點(diǎn),和ω是環(huán)形區(qū)域的內(nèi)外半徑;ω不大于最小矩形區(qū)域的較短的邊長的二分之一。k、判別反向稀疏表示:判別稀疏相似度圖矩陣表示所有候選目標(biāo)對(duì)象和模板集之間的關(guān)系,如式(Ⅰ)所示:argmin||T-YC||22+λΣi||ci||1s.t.ci≥0,i=1,2,3......(p+n).---(I)]]>式(Ⅰ)中,C為判別稀疏相似度圖矩陣,T為模板集,包括初始正模板庫及初始負(fù)模板庫,Y為候選目標(biāo)對(duì)象。在判別稀疏相似性映射算法中,跟蹤問題被看做是在候選區(qū)域中找出與目標(biāo)區(qū)域相似度最高的區(qū)域作為要跟蹤的目標(biāo)區(qū)域,在進(jìn)行相似度計(jì)算時(shí),使用判別反向稀疏相似度表示方法。此方法清晰地描述了候選區(qū)域與目標(biāo)區(qū)域之間的關(guān)系,并且它是基于多任務(wù)的反向稀疏表達(dá)公式中最優(yōu)化解決方案建立的。其中,基于多任務(wù)反向稀疏表達(dá)公式是對(duì)整個(gè)候選區(qū)域進(jìn)行多個(gè)子集的搜索并重建出具有最小誤差的多個(gè)樣本。采用APG算法通過多次迭代來得到最優(yōu)解決方案。在這個(gè)過程中,多個(gè)候選區(qū)域能夠同時(shí)進(jìn)行相似度的計(jì)算而不用一個(gè)接一個(gè)的單線程計(jì)算,因此顯著提高了跟蹤的效率。在此算法中,最終要在判別稀疏相似度映射中提取出判別信息,用來從候選區(qū)域中找出要跟蹤的目標(biāo)區(qū)域。在不斷的跟蹤評(píng)估過程中,與目標(biāo)對(duì)象最相似的候選對(duì)象加入正模板庫,與其差距過大的候選對(duì)象加入負(fù)模板庫,這種實(shí)時(shí)動(dòng)態(tài)更新正負(fù)模板庫的過程使得有足夠多的判別信息用于跟蹤,并且判別信息能夠被儲(chǔ)存在新的判別稀疏相似映射中,極大提高了跟蹤的準(zhǔn)確性,有良好的效果。本發(fā)明的有益效果為:本發(fā)明主要針對(duì)視頻圖像處理算法進(jìn)行設(shè)計(jì),對(duì)安防視頻進(jìn)行計(jì)算機(jī)自動(dòng)分析。在該方法中,顏色直方圖和哈希編碼作為目標(biāo)特征分占不同權(quán)重混合進(jìn)行檢測識(shí)別,避免單一特征檢測的誤差,并且動(dòng)態(tài)更新的判別稀疏相似度圖法保證了跟蹤結(jié)果的準(zhǔn)確性和抗干擾能力,最終實(shí)現(xiàn)對(duì)多場景多目標(biāo)的檢測、識(shí)別和跟蹤,明顯提高了準(zhǔn)確性和魯棒性,在復(fù)雜背景環(huán)境中也有良好的效果。該方法為后續(xù)的研究打下基礎(chǔ)。計(jì)算機(jī)輔助多目標(biāo)識(shí)別和跟蹤能夠彌補(bǔ)人工觀察的缺陷,在安防監(jiān)控工作中實(shí)現(xiàn)了實(shí)時(shí)信息提示,不僅節(jié)約資源,而且準(zhǔn)確、方便、快捷。附圖說明圖1為本發(fā)明一種安防視頻中多場景多目標(biāo)識(shí)別和跟蹤方法的流程示意圖。具體實(shí)施方式下面結(jié)合說明書附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步限定,但不限于此。實(shí)施例一種安防視頻中多場景多目標(biāo)識(shí)別和跟蹤方法,如圖1所示,具體步驟包括:(1)從視頻中采集含有目標(biāo)對(duì)象的圖像幀;一般來說,安防視頻中感興趣的目標(biāo)對(duì)象大多是一個(gè)或者多個(gè)人,就以人作為目標(biāo)對(duì)象對(duì)本發(fā)明具體實(shí)施進(jìn)行描述。確定好想要跟蹤的目標(biāo)對(duì)象后,采集含有目標(biāo)對(duì)象的圖像,包括視頻中想要跟蹤的目標(biāo)對(duì)象首次完整出現(xiàn)的那一幀的圖像以及接下來的49幀圖像。(2)采集目標(biāo)對(duì)象訓(xùn)練樣本集,提取出目標(biāo)對(duì)象的特征,具體步驟包括:步驟(1)獲取的圖像中包含目標(biāo)對(duì)象,可以是多個(gè)目標(biāo)對(duì)象,將需要識(shí)別和跟蹤的目標(biāo)對(duì)象框出,即人為確定目標(biāo)對(duì)象區(qū)域,并獲取目標(biāo)對(duì)象區(qū)域四個(gè)頂點(diǎn)的坐標(biāo);提取出目標(biāo)對(duì)象的特征,包括顏色直方圖和哈希編碼兩種特征,用于提取目標(biāo)對(duì)象顏色直方圖和哈希編碼的圖像是從提取到的每一幀(50幀)中根據(jù)頂點(diǎn)坐標(biāo)分割出的目標(biāo)對(duì)象區(qū)域圖像進(jìn)行畫幅統(tǒng)一,對(duì)應(yīng)位置像素色域值求和并平均得到的圖像。如果同時(shí)識(shí)別和跟蹤多個(gè)目標(biāo),需要對(duì)目標(biāo)進(jìn)行編號(hào),分別進(jìn)行處理,獲取每個(gè)目標(biāo)相應(yīng)的特征模型。得到每個(gè)目標(biāo)的顏色直方圖和哈希編碼分別作為目標(biāo)對(duì)象的顏色直方圖模型和哈希編碼模型。所述顏色直方圖,是指不同色彩在整幅圖像中所占的比例,即對(duì)彩色圖像色域值進(jìn)行區(qū)間劃分,對(duì)每個(gè)區(qū)間中的像素個(gè)數(shù)占比進(jìn)行統(tǒng)計(jì)。所述哈希編碼,是通過以下步驟獲取的:e、去除圖像的高頻分量;f、將圖像尺寸被縮減到8×8,含有64個(gè)像素;g、將8×8尺寸圖象轉(zhuǎn)化為灰度圖像,并計(jì)算出64個(gè)像素的平均灰度值;h、將64個(gè)像素的平均灰度值與8×8尺寸圖象中每個(gè)像素灰度值相比較,如果像素的灰度值比平均灰度值小,該像素的編碼值為0,否則編碼值為1;i、將所有像素灰度值與平均灰度值比較之后,得到的64位編碼為哈希編碼??梢詼?zhǔn)確描述該圖像的特征。圖像可以被看作包含不同頻率分量的二維信號(hào),該信號(hào)的高頻分量代表變化劇烈的區(qū)域,如物體的邊緣,并且它可以很好地描述圖像的細(xì)節(jié)。低頻分量可以描述圖像的結(jié)構(gòu),哈希編碼主要利用圖像的低頻信息。(3)對(duì)后續(xù)視頻,通過與目標(biāo)對(duì)象的特征進(jìn)行匹配,檢測目標(biāo)對(duì)象,如果檢測到目標(biāo)對(duì)象,進(jìn)入步驟(4),否則,重復(fù)執(zhí)行步驟(3);所述步驟(3),檢測目標(biāo)對(duì)象,具體步驟包括:a、運(yùn)動(dòng)區(qū)域檢測:用幀差分法檢測視頻中運(yùn)動(dòng)區(qū)域,如果檢測到包含一群人的運(yùn)動(dòng)區(qū)域,進(jìn)入步驟b,如果檢測到僅包含一個(gè)人的區(qū)域,進(jìn)入步驟c;由于圖像背景是復(fù)雜的,檢測到的運(yùn)動(dòng)區(qū)域中可能包含一群人;b、用人群分割算法把檢測到包含一群人的運(yùn)動(dòng)區(qū)域分割為僅包含一個(gè)人的不同區(qū)域,即若干個(gè)單人區(qū)域;c、提取僅包含一個(gè)人的區(qū)域的顏色直方圖和哈希編碼,與目標(biāo)對(duì)象的顏色直方圖和哈希編碼分別進(jìn)行匹配,分別得到巴氏距離和漢明距離,巴氏距離的權(quán)重為a,漢明距離的權(quán)重為b,用來表示僅包含一個(gè)人的區(qū)域與目標(biāo)對(duì)象的相似性;巴氏距離用來表示僅包含一個(gè)人的區(qū)域的顏色直方圖與目標(biāo)對(duì)象的顏色直方圖的相似性,漢明距離用來表示僅包含一個(gè)人的區(qū)域的哈希編碼與目標(biāo)對(duì)象的哈希編碼的相似性,a=70%,b=30%;d、當(dāng)僅包含一個(gè)人的區(qū)域與目標(biāo)對(duì)象的相似性大于等于閾值c時(shí),判定僅包含一個(gè)人的區(qū)域中含有目標(biāo)對(duì)象,將目標(biāo)對(duì)象區(qū)域用矩形框框出,否則,判定僅包含一個(gè)人的區(qū)域中不含有目標(biāo)對(duì)象;閾值c=80%。(4)對(duì)目標(biāo)對(duì)象進(jìn)行跟蹤。使用判別稀疏相似度圖法(DSSMap)對(duì)目標(biāo)對(duì)象進(jìn)行跟蹤,具體是指:J、初始判別模板集:假設(shè)Q(h,v)是目標(biāo)對(duì)象最小矩形區(qū)域的中心點(diǎn),所述最小矩形區(qū)域是包含某個(gè)目標(biāo)對(duì)象的最小矩形圖像區(qū)域;(h,v)是指Q(h,v)的坐標(biāo)值;在以Q(h,v)為中心的圓形區(qū)域內(nèi),該圓形區(qū)域半徑滿足的取值為正數(shù),且不大于最小矩形區(qū)域的較短的邊長的二分之一,取p個(gè)樣本圖像區(qū)塊作為初始正模板庫,Qi是第i個(gè)樣本圖像區(qū)塊的中心點(diǎn),1≤i≤p;從半徑滿足的環(huán)形區(qū)域中,采樣n個(gè)圖像區(qū)塊,得到初始負(fù)模板庫,Qj是第j個(gè)圖像區(qū)塊的中心點(diǎn),和ω是環(huán)形區(qū)域的內(nèi)外半徑;ω不大于最小矩形區(qū)域的較短的邊長的二分之一。k、判別反向稀疏表示:判別稀疏相似度圖矩陣表示所有候選目標(biāo)對(duì)象和模板集之間的關(guān)系,如式(Ⅰ)所示:argmin||T-YC||22+λΣi||ci||1s.t.ci≥0,i=1,2,3......(p+n).---(I)]]>式(Ⅰ)中,C為判別稀疏相似度圖矩陣,T為模板集,包括初始正模板庫及初始負(fù)模板庫,Y為候選目標(biāo)對(duì)象。在判別稀疏相似性映射算法中,跟蹤問題被看做是在候選區(qū)域中找出與目標(biāo)區(qū)域相似度最高的區(qū)域作為要跟蹤的目標(biāo)區(qū)域,在進(jìn)行相似度計(jì)算時(shí),使用判別反向稀疏相似度表示方法。此方法清晰地描述了候選區(qū)域與目標(biāo)區(qū)域之間的關(guān)系,并且它是基于多任務(wù)的反向稀疏表達(dá)公式中最優(yōu)化解決方案建立的。其中,基于多任務(wù)反向稀疏表達(dá)公式是對(duì)整個(gè)候選區(qū)域進(jìn)行多個(gè)子集的搜索并重建出具有最小誤差的多個(gè)樣本。采用APG算法通過多次迭代來得到最優(yōu)解決方案。在這個(gè)過程中,多個(gè)候選區(qū)域能夠同時(shí)進(jìn)行相似度的計(jì)算而不用一個(gè)接一個(gè)的單線程計(jì)算,因此顯著提高了跟蹤的效率。在此算法中,最終要在判別稀疏相似度映射中提取出判別信息,用來從候選區(qū)域中找出要跟蹤的目標(biāo)區(qū)域。在不斷的跟蹤評(píng)估過程中,與目標(biāo)對(duì)象最相似的候選對(duì)象加入正模板庫,與其差距過大的候選對(duì)象加入負(fù)模板庫,這種實(shí)時(shí)動(dòng)態(tài)更新正負(fù)模板庫的過程使得有足夠多的判別信息用于跟蹤,并且判別信息能夠被儲(chǔ)存在新的判別稀疏相似映射中,極大提高了跟蹤的準(zhǔn)確性,有良好的效果。當(dāng)前第1頁1 2 3