本發(fā)明涉及一種人體目標(biāo)識(shí)別方法,特別是一種基于立體視覺(jué)技術(shù)的人體目標(biāo)識(shí)別方法。
背景技術(shù):
隨著計(jì)算機(jī)存儲(chǔ)、運(yùn)算等方面性能的快速提高,人們逐步將計(jì)算機(jī)運(yùn)用到實(shí)現(xiàn)場(chǎng)景重構(gòu)、目標(biāo)識(shí)別、人機(jī)互動(dòng)等復(fù)雜功能,這不僅開(kāi)拓了計(jì)算機(jī)應(yīng)用領(lǐng)域的規(guī)模和研究方向,而且促進(jìn)了相關(guān)學(xué)科的快速發(fā)展。作為當(dāng)今活躍的研究領(lǐng)域,計(jì)算機(jī)視覺(jué)的實(shí)質(zhì)就是利用攝像機(jī)代替人眼,利用電腦代替大腦,對(duì)目標(biāo)進(jìn)行識(shí)別跟蹤,并做出相應(yīng)的圖形分析處理,生成適合儀器檢測(cè)或者人眼觀察的圖像。視頻技術(shù)能在一段時(shí)間內(nèi)連續(xù)傳輸圖像,包含更多細(xì)節(jié)信息,同時(shí)它具有直觀、具體、易處理等優(yōu)點(diǎn)。對(duì)視頻目標(biāo)的識(shí)別已成為圖像處理、模式識(shí)別、人機(jī)互動(dòng)等領(lǐng)域中的重要課題,被廣泛應(yīng)用于制造業(yè)、醫(yī)療診斷、軍事等領(lǐng)域中的各種智能系統(tǒng)中。
傳統(tǒng)的APC系統(tǒng)主要有壓力傳感系統(tǒng)和紅外遮擋系統(tǒng),隨著激光紅外技術(shù)的迅速發(fā)展,采用合適的熱釋紅外線探頭檢測(cè)人體發(fā)出的信號(hào),進(jìn)行識(shí)別計(jì)數(shù)。當(dāng)目標(biāo)走動(dòng)時(shí),紅外傳感器探測(cè)人體紅外光譜所造成的變化即得到人體目標(biāo)運(yùn)動(dòng)的過(guò)程,通過(guò)信號(hào)處理可以辨別目標(biāo),它們成本低,操作簡(jiǎn)單,但是具有識(shí)別統(tǒng)計(jì)結(jié)果不精確,應(yīng)用場(chǎng)所受限等諸多問(wèn)題。
同時(shí)圖像處理方法也可用于解決人體識(shí)別問(wèn)題。但大多數(shù)方法僅使用二維圖像的一些識(shí)別算法,比如選取人體的某些部分作為特征,試圖在圖像中獲得匹配,從而達(dá)到識(shí)別的目的。目前,人體識(shí)別常用的方法還有很多:基于人體模型、結(jié)構(gòu)元素的方法,該種方法對(duì)提取整個(gè)人的圖像信息有較高的要求,對(duì)運(yùn)動(dòng)變形的物體很難處理,并且對(duì)圖像采集的實(shí)時(shí)性要求高;基于小波變換和支持向量機(jī)的方法,該方法主要是基于小波模板的原理,需要根據(jù)不同的尺度大小來(lái)搜索整張圖像,計(jì)算量大。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種基于立體視覺(jué)技術(shù)的人體目標(biāo)識(shí)別方法。
實(shí)現(xiàn)本發(fā)明目的的技術(shù)解決方案為:一種基于立體視覺(jué)技術(shù)的人體目標(biāo)識(shí)別方法,包括以下步驟:
步驟1、由兩個(gè)攝像頭從兩個(gè)不同角度同時(shí)獲取同一個(gè)場(chǎng)景的圖片,形成立體圖像 對(duì);
步驟2、通過(guò)攝像機(jī)標(biāo)定確定攝像機(jī)內(nèi)部和外部參數(shù),確立成像模型;
步驟3、采用基于窗口的匹配算法,以其中一幅圖像的待匹配點(diǎn)為中心創(chuàng)建窗口,在另一幅圖像上創(chuàng)建相同的滑動(dòng)窗口,滑動(dòng)窗口沿著外極線以像素點(diǎn)為單位依次移動(dòng),計(jì)算窗口匹配測(cè)度,找到最佳匹配點(diǎn),通過(guò)視差原理得到目標(biāo)的三維幾何信息,生成深度圖像;
步驟4、采用一維最大熵閾值分割法,結(jié)合灰度特征區(qū)分頭部與肩部信息,識(shí)別人體目標(biāo)。
本發(fā)明與現(xiàn)有技術(shù)相比,其顯著優(yōu)點(diǎn):
(1)本發(fā)明于立體視覺(jué)技術(shù)的人體目標(biāo)識(shí)別方法計(jì)算量小,能夠運(yùn)用簡(jiǎn)單的圖像快速準(zhǔn)確的識(shí)別出人體目標(biāo);
(2)本發(fā)明在人群擁擠的情況下,能利用圖像的深度信息進(jìn)行識(shí)別,有效排除干擾,分辨運(yùn)動(dòng)目標(biāo)。
附圖說(shuō)明
圖1為本發(fā)明基于立體視覺(jué)技術(shù)的人體目標(biāo)識(shí)別方法流程框圖。
圖2為本發(fā)明實(shí)施例中原始深度圖。
圖3為本發(fā)明實(shí)施例中采用本發(fā)明方法處理后得到的人體目標(biāo)識(shí)別圖。
具體實(shí)施方式
結(jié)合圖1,本發(fā)明的基于立體視覺(jué)技術(shù)的人體目標(biāo)識(shí)別方法,包括以下步驟:
步驟1、立體圖像對(duì)的獲取:
兩個(gè)MTV-1881EX-3攝像頭平行放置,從兩個(gè)不同角度同時(shí)獲取同一個(gè)場(chǎng)景的圖片,形成立體圖像對(duì);
步驟2、通過(guò)攝像機(jī)標(biāo)定確定攝像機(jī)內(nèi)部和外部參數(shù),確立成像模型,具體為:
步驟2-1、對(duì)攝像機(jī)坐標(biāo)進(jìn)行標(biāo)定,定標(biāo)圖形為棋盤格,標(biāo)定原理如下:
假設(shè)z=0的世界坐標(biāo)系平面為模板平面,[r1 r2 r3]為攝像機(jī)坐標(biāo)系相對(duì)于世界坐標(biāo)系的旋轉(zhuǎn)矩陣,t為攝像機(jī)坐標(biāo)系相對(duì)于世界坐標(biāo)系的平移向量,[X Y 1]T為模板上點(diǎn) 的齊次坐標(biāo),[u υ 1]T為模板平面上的點(diǎn)投影到圖像平面上的齊次坐標(biāo),K表示攝像機(jī)內(nèi)參矩陣;
步驟2-2、設(shè)攝像機(jī)坐標(biāo)系Oxcyczc為固定在攝像機(jī)上的直角坐標(biāo)系,其原點(diǎn)O定義為攝像機(jī)的光心,xc,yc軸分別平行于圖像物理坐標(biāo)系的x,y軸,zc軸與光軸重合,即zc軸垂直于攝像機(jī)的成像平面,光心到圖像平面的距離OO1為攝像機(jī)的有效焦距f;
步驟2-3、設(shè)(xw,yw,zw)為三維世界坐標(biāo)系中某P點(diǎn)的三維坐標(biāo),(xc,yc,zc)為同一點(diǎn)P在攝像機(jī)坐標(biāo)系中的三維坐標(biāo),世界坐標(biāo)系中的點(diǎn)到攝像機(jī)坐標(biāo)系的變換由正交旋轉(zhuǎn)矩陣R和平移變換矩陣T表示為:
其中,R是3×3旋轉(zhuǎn)矩陣,平移矩陣
正交矩陣R是光軸相對(duì)于世界坐標(biāo)系坐標(biāo)軸的方向余弦組合,包含三個(gè)獨(dú)立的角度變量(歐拉角):繞x軸旋轉(zhuǎn)ψ角(偏航);繞y軸旋轉(zhuǎn)θ角(俯仰);繞z軸旋轉(zhuǎn)φ角(側(cè)傾),加上T的三個(gè)變量共六個(gè)參數(shù),稱為攝像機(jī)外部參數(shù);
步驟2-4、將世界坐標(biāo)系與攝像機(jī)坐標(biāo)系的剛性變換用齊次坐標(biāo)與矩陣形式簡(jiǎn)化為:
因此,世界坐標(biāo)系與攝像機(jī)坐標(biāo)系之間可以用一個(gè)矩陣M2來(lái)表示,只要已知M2就可以在兩個(gè)坐標(biāo)系之間進(jìn)行坐標(biāo)的轉(zhuǎn)換;
攝像機(jī)坐標(biāo)系到理想的圖像物理坐標(biāo)系的變換即針孔模型下的理想透視投影變換, 有下式成立:
x=f·xc/zc y=f·yc/zc
x、y分別為理想的圖像物理坐標(biāo)系的橫坐標(biāo)和縱坐標(biāo);
同樣用齊次坐標(biāo)和矩陣表示上式為:
理想圖像坐標(biāo)系到圖像像素坐標(biāo)系的轉(zhuǎn)換,用齊次坐標(biāo)表示有:
其中,u0、v0表示攝像機(jī)坐標(biāo)系的坐標(biāo);
其逆關(guān)系為:
將上述關(guān)系式代入,就可以得到世界坐標(biāo)系表示的P點(diǎn)坐標(biāo)與其投影P′的坐標(biāo)(u,υ)間的關(guān)系:
其中,α=f/dx=f sx/dy,β=f/dy;M1為內(nèi)部參數(shù)陣,M2為外部參數(shù)陣,M為3×4的矩陣,稱為投影矩陣,表征二維圖像坐標(biāo)與三維世界坐標(biāo)間的基本關(guān)系,已知物點(diǎn)的世界坐標(biāo)利用該矩陣就可以求出相應(yīng)的理想圖像坐標(biāo),反之,如果知道了M矩陣和像點(diǎn)的圖像坐標(biāo),就可以求出通過(guò)攝像機(jī)光心所對(duì)應(yīng)的一條空間射線;
得到二維圖像坐標(biāo)與三維世界坐標(biāo)間的基本關(guān)系,即完成了攝像機(jī)的標(biāo)定;攝像機(jī)獲得的圖像坐標(biāo)可以通過(guò)這個(gè)成像模型統(tǒng)一轉(zhuǎn)換為三維世界坐標(biāo)系上的坐標(biāo),即確定了攝像機(jī)所得圖像在三維世界坐標(biāo)系上的成像模型。
步驟3、采用基于窗口的匹配算法,以其中一幅圖像的待匹配點(diǎn)為中心創(chuàng)建窗口,在另一幅圖像上創(chuàng)建相同的滑動(dòng)窗口,滑動(dòng)窗口沿著外極線以像素點(diǎn)為單位依次移動(dòng),計(jì)算窗口匹配測(cè)度,找到最佳匹配點(diǎn),通過(guò)視差原理得到目標(biāo)的三維幾何信息,生成深度圖像;具體包括以下步驟:
步驟3-1、假定以右圖為基準(zhǔn),與背景做差,得到前景圖;
步驟3-2、視差的確定:
第一步,在前景圖中,假定以右圖為基準(zhǔn),計(jì)算每個(gè)像素在給定視差上同左圖對(duì)應(yīng)點(diǎn)的灰度差值;
第二步,在每個(gè)視差上,改為使用垂直于基線方向的窄條形窗口,采用基于窗口的匹配算法計(jì)算以每個(gè)像素為中心的窗口的灰度差值和,表達(dá)式如下:
式中,m*n為模板窗口的大小,γ為模板窗口的單位長(zhǎng)度,δ為模板窗口的單位寬度,Iright[xe+γ,ye+δ]為右視圖[xe+γ,ye+δ]坐標(biāo)處的灰度值,Ileft[xe+γ+d,ye+δ]為左視圖[xe+γ+d,ye+δ]坐標(biāo)處的灰度值,d為視差;
第三步,在所設(shè)定的視差范圍內(nèi),將d從最小視差取到最大視差,依次比較表達(dá)式的值,值最小所對(duì)應(yīng)點(diǎn)即為最佳匹配點(diǎn),所對(duì)應(yīng)的視差值作為該像素點(diǎn)的視差值;
步驟3-3、確定目標(biāo)的深度信息:
雙目測(cè)距主要是利用了目標(biāo)點(diǎn)在左右兩幅視圖上成像的橫向坐標(biāo)直接存在的差異(即視差)與目標(biāo)點(diǎn)到成像平面的距離Z存在著反比例的關(guān)系,當(dāng)攝像機(jī)的焦距已知的情況下,任意一點(diǎn)的深度信息,即該點(diǎn)在攝像機(jī)坐標(biāo)系下Z軸的坐標(biāo)值,設(shè)b為兩攝像頭 光學(xué)中心距離;目標(biāo)Q到攝像頭垂直距離為H;相同焦距為f,Q1、Q2為目標(biāo)Q在攝像機(jī)的成像點(diǎn);d為視差,假設(shè)兩個(gè)攝像機(jī)的光軸相互平行,由相似三角形推導(dǎo)可知:
H=(b×f))/d
得到的目標(biāo)Q到攝像頭垂直距離即為目標(biāo)的深度信息;
所以,立體視覺(jué)計(jì)數(shù)能夠利用兩臺(tái)或者兩臺(tái)以上有位置偏移的攝像機(jī)通過(guò)三角計(jì)算,獲得所在場(chǎng)景的深度信息,前提是要求場(chǎng)景中的點(diǎn)在左右圖像中都存在像點(diǎn);在左右視圖中,像點(diǎn)的位置是不同的,也就是視差,場(chǎng)景中的點(diǎn)離攝像機(jī)的距離不同,視差也是不同的,視差隨著離攝像頭的遠(yuǎn)近而變小變大;雙目立體視覺(jué)正是基于這種視差,利用三角運(yùn)算來(lái)確定物體到攝像機(jī)的距離。
步驟4、采用一維最大熵閾值分割法,結(jié)合灰度特征區(qū)分頭部與肩部信息,識(shí)別人體目標(biāo),具體為:
步驟4-1、將深度圖像劃分成L*L像素的小格子,L為正整數(shù),并以一個(gè)九宮格為單位,移動(dòng)時(shí)以從左到右,從上到下的順序,每比較一次,移動(dòng)一個(gè)L*L像素的小格子,若中間格子的平均灰度比周圍八鄰域平均灰度高,則確立中間格子為頭部目標(biāo)區(qū)域;
步驟4-2、對(duì)頭部目標(biāo)區(qū)域設(shè)定閾值并二值化,分割頭部目標(biāo);具體為:
采用一維最大熵閾值分割法分割頭部和非頭部區(qū)域,令pi表示圖像中灰度值為i的像素所占的比例,以灰度級(jí)t為閾值分割頭部和肩部區(qū)域,區(qū)域中高于t灰度級(jí)的像素點(diǎn)構(gòu)成頭部區(qū)域,低于灰度級(jí)t的像素點(diǎn)構(gòu)成非頭部區(qū)域,則非頭部區(qū)域和頭部區(qū)域的熵分別定義為:
HO=-Σi[pi/(1-pt)]lg[pi/(1-pt)]
其中:其中i表示像素的灰度值(0≤i≤255),Ht=-Σtpilgpi,HE=-Σipilgpi,當(dāng)熵函數(shù)值和取得最大時(shí),灰度級(jí)t可作為分割圖像的閾值:
t=arg{max{HB+Ho}}
步驟4-3、確定分割后的頭部區(qū)域的平均灰度和灰度方差:
其中M、N分別表示每個(gè)區(qū)域的行列數(shù),ε,∈分別表示單位行列數(shù),f(ε,∈)表示(ε,∈)點(diǎn)的灰度值,當(dāng)灰度方差大于設(shè)定的閾值,濾除該像素點(diǎn);
步驟4-4、根據(jù)人體頭部在不同視場(chǎng)高度下總像元寬度與視場(chǎng)高度的比值是否滿足設(shè)定的范圍濾除外形狹長(zhǎng)的偽目標(biāo)。
頭部的幾何特征主要有類橢圓性、頭部面積、長(zhǎng)寬度等;通過(guò)不斷的仿真測(cè)試可知在一定視場(chǎng)高度下頭部總像元寬度的范圍,同時(shí)由仿真可獲得w/h的范圍為[0.65,1.5],通過(guò)此類閾值判別,可以有效濾除外形狹長(zhǎng)的偽目標(biāo)。
下面結(jié)合具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步說(shuō)明。
實(shí)施例
結(jié)合圖2所示的原始深度圖像,對(duì)可見(jiàn)光情況下,人體頭發(fā)較黑且著深色衣服或者人體頭發(fā)顏色較淺則又容易和背景混淆時(shí)的人體運(yùn)動(dòng)目標(biāo)使用基于立體視覺(jué)算法進(jìn)行處理。
圖3為采用本發(fā)明方法處理后人體目標(biāo)頭肩部的分割圖像,可以明顯的看出,對(duì)可見(jiàn)光情況下運(yùn)動(dòng)目標(biāo)的處理結(jié)果為,當(dāng)人體頭發(fā)較黑且著深色衣服或者人體頭發(fā)顏色較淺則又容易和背景混淆時(shí),立體視覺(jué)技術(shù)輸出的深度圖像識(shí)別精度高,不易受光線以及背景的影響,明顯的區(qū)分出了目標(biāo)和背景。