專利名稱:行人目標(biāo)識別方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像識別領(lǐng)域,特別涉及一種行人目標(biāo)識別方法及系統(tǒng)。
背景技術(shù):
行人目標(biāo)識別是近年來計算機視覺領(lǐng)域備受關(guān)注的前沿方向和研究熱點之一。它在智能監(jiān)控系統(tǒng)(Intelligent Video Surveillance System)、駕駛員輔助系統(tǒng)(AdvancedDriver Assistance System)、行人保護(hù)系統(tǒng)(Pedestrian Protection System)、以及運動分析等眾多領(lǐng)域擁有廣泛的應(yīng)用前景。行人目標(biāo)識別屬于目標(biāo)檢測的一部分。由于人體固有的一些不確定性,如穿著不同服裝、姿勢和體型的變化、攜帶各種物品等,以及應(yīng)用場景的復(fù)雜性,人與人或人與環(huán)境之間的相互影響,使得人體目標(biāo)的識別和跟蹤成為目標(biāo)檢測領(lǐng)域中的一大難點。傳統(tǒng)的行人目標(biāo)識別方法通常為基于人體全局特征的方法。這類方法致力于找到一種特征,能夠完美地描述人體,并且盡量不受背景,光照,姿勢的影響,在各種條件下都能將行人和背景區(qū)分開。其中,應(yīng)用較為廣泛的人體全局特征包括邊緣方向梯度分布特征(H0G,Histograms of Oriented Gradients)、小波特征、shapelet 特征等。例如 Dalal 和 Triggs首先將輸入圖片分成若干塊,每塊再分成若干格子,對每個格子統(tǒng)計其中所有像素的梯度值在各個方向上的分布,得到特征向量,再把一個塊內(nèi)所有格子的特征向量串聯(lián)起來便得到了該塊的特征向量,最后通過連接所有塊的特征向量得到多達(dá)數(shù)千維的HOG特征。然而,傳統(tǒng)的行人目標(biāo)識別方法在根據(jù)上述HOG特征識別行人目標(biāo)時,由于HOG的維度較多,因此計算量過大,從而使得目標(biāo)識別效率比較低。
發(fā)明內(nèi)容
基于此,有必要提供一種能提高目標(biāo)識別效率的行人目標(biāo)識別方法。一種行人目標(biāo)識別方法,包括以下步驟采集視頻幀;提取所述視頻幀的HOG特征;提取視頻幀的包含了方向和強度信息的LBP特征;根據(jù)所述HOG特征和所述LBP特征識別所述視頻幀中的行人目標(biāo)。在其中一個實施例中,所述提取視頻幀的HOG特征的步驟包括使用積分圖計算視頻巾貞的HOG特征。在其中一個實施例中,所述提取所述視頻幀的HOG特征的步驟包括以16像素作為步進(jìn)提取所述視頻幀的HOG特征。在其中一個實施例中,所述根據(jù)所述HOG特征和所述LBP特征識別所述視頻幀中的行人目標(biāo)的步驟還包括將所述HOG特征和所述LBP特征輸入支持向量機;
通過支持向量機根據(jù)所述HOG特征和所述LBP特征識別所述視頻幀中的行人目標(biāo)。在其中一個實施例中,所述通過支持向量機根據(jù)所述HOG特征和所述LBP特征識別所述視頻幀中的行人目標(biāo)的步驟之后還包括通過所述支持向量機的核函數(shù)根據(jù)所述HOG特征和所述LBP特征計算所述視頻幀的信心指數(shù);通過輪廓匹配算法對信心指數(shù)低于閾值的視頻幀進(jìn)行識別。在其中一個實施例中,所述通過輪廓匹配算法對信心指數(shù)較低的視頻幀進(jìn)行識別 的步驟還包括根據(jù)預(yù)設(shè)的行人典型姿態(tài)模板集通過輪廓匹配算法對視頻幀進(jìn)行識別。在其中一個實施例中,所述通過支持向量機根據(jù)所述HOG特征和所述LBP特征識別所述視頻幀中的行人目標(biāo)的步驟之后還包括使用卡爾曼濾波模型對所述視頻幀中的行人目標(biāo)進(jìn)行預(yù)跟蹤,當(dāng)在連續(xù)預(yù)設(shè)個數(shù)的視頻幀中檢測到所述行人目標(biāo)時,將所述行人目標(biāo)標(biāo)記為有效行人目標(biāo)。此外,還有必要提供一種能提高目標(biāo)識別效率的行人目標(biāo)識別系統(tǒng)。一種行人目標(biāo)識別系統(tǒng),包括視頻幀采集模塊,用于采集視頻幀;HOG特征提取模塊,用于提取所述視頻幀的HOG特征;LBP特征提取模塊,用于提取所述視頻幀的包含了方向和強度信息的LBP特征;目標(biāo)識別模塊,用于根據(jù)所述HOG特征和所述LBP特征識別所述視頻幀中的行人目標(biāo)。在其中一個實施例中,所述HOG特征提取模塊還用于使用積分圖提取所述視頻幀的HOG特征。在其中一個實施例中,所述HOG特征提取模塊還用于以16像素作為步進(jìn)提取所述視頻幀的HOG特征。在其中一個實施例中,所述目標(biāo)識別模塊還用于將所述HOG特征和所述LBP特征輸入支持向量機,通過支持向量機根據(jù)所述HOG特征和所述LBP特征識別所述視頻幀中的行人目標(biāo)。在其中一個實施例中,所述目標(biāo)識別模塊還用于通過所述支持向量機的核函數(shù)根據(jù)所述HOG特征和所述LBP特征計算所述視頻幀的信心指數(shù),通過輪廓匹配算法對信心指數(shù)低于閾值的視頻幀進(jìn)行識別。在其中一個實施例中,所述目標(biāo)識別模塊還用于根據(jù)預(yù)設(shè)的行人典型姿態(tài)模板集通過輪廓匹配算法對視頻幀進(jìn)行識別。在其中一個實施例中,還包括卡爾曼濾波模塊,用于使用卡爾曼濾波對所述視頻幀中的行人目標(biāo)進(jìn)行預(yù)跟蹤,當(dāng)在連續(xù)預(yù)設(shè)個數(shù)的視頻幀中檢測到所述行人目標(biāo)時,將所述行人目標(biāo)標(biāo)記為有效目標(biāo)。采用了上述行人目標(biāo)識別方法和系統(tǒng)之后,在向支持向量機輸送視頻幀特征時,輸入了 HOG特征和包含了方向和強度信息的LBP特征,由于包含了方向和強度信息LBP特征的維度較少,因此提取該LBP特征的過程和支持向量機進(jìn)行識別的計算量較小,從而提高了行人目標(biāo)識別的效率。
圖I為一個實施例中行人目標(biāo)識別方法的流程圖;圖2為一個實施例中用于計算HOG特征的積分圖的示例圖;圖3為一個實施例中使用計算積分圖HOG特征的示例圖;圖4為一個實施例中計算LBP特征的過程示意圖;圖5為一個實施例中具有代表性的7個uniform LBP特征bin的示意圖;圖6為一個實施例中數(shù)個行人典型姿態(tài)模板的示例圖;圖7為一個實施例中采用多種特征進(jìn)行行人目標(biāo)識別的識別性能的對比圖;圖8 為一個實施例中采用 3780 維 H0G+1888 維 uniform LBP 和 1152 維 H0G+1024維包含了方向和強度信息的LBP特征進(jìn)行行人目標(biāo)識別的識別性能的對比圖;圖9為一個實施例中行人目標(biāo)識別系統(tǒng)的結(jié)構(gòu)示意圖;圖10為另一個實施例中行人目標(biāo)識別系統(tǒng)的結(jié)構(gòu)示意圖。
具體實施方式如圖I所示,一個實施例中,一種行人目標(biāo)識別方法,包括以下步驟步驟S102,采集視頻幀。 可通過路況監(jiān)控設(shè)備、攝像機采集路況視頻,并從路況視頻中提取視頻幀。步驟S104,提取視頻幀的HOG特征。HOG (Histograms of Oriented Gradients,梯度方向直方圖)特征表不局部圖像梯度的方向信息的統(tǒng)計值,用于描述視頻幀的局部目標(biāo)的表象和形狀。在本實施例中,提取像素為64X 128的視頻幀的HOG特征的過程為將視頻幀分割成8X8像素的格子(block),且以2X2格子作為一個區(qū)塊(cell)。用Sobel算子(離散性差分算子,傳統(tǒng)技術(shù)中,用于運算圖像亮度函數(shù)的梯度之近似值)計算每個格子的邊緣像素點的梯度特征,可根據(jù)下述公式計算Gx (X, y) = SobelxX I (x, y)Gy (X, y) = SobelyX I (x, y)其中,Sobelx和Sobely分別為水平和垂直方向的Sobel算子,分別用于檢測水平邊緣和垂直邊緣,Ι(χ, y)為像素坐標(biāo)(X,y)處的灰度值,Gx (X,y)和&(1,y)分別為每個格子的邊緣像素點的水平梯度特征和垂直梯度特征。然后計算梯度強度和梯度方向,可根據(jù)以下公式計算G(x, y)=(x, yf + Gy (x, yf
G (x, y)θ(χ, y) = arctan(-^-~-)
Gx(x^y)其中,G(x,y)為梯度強度,Gx (x,y)和6>,7)為前述的水平梯度特征和垂直梯度特征,Θ (X,y)為梯度方向。然后再根據(jù)預(yù)設(shè)的直方圖的維數(shù)通過下列公式計算梯度方向直方圖
權(quán)利要求
1.ー種行人目標(biāo)識別方法,包括以下步驟 米集視頻巾貞; 提取所述視頻幀的HOG特征; 提取視頻幀的包含了方向和強度信息的LBP特征; 根據(jù)所述HOG特征和所述LBP特征識別所述視頻幀中的行人目標(biāo)。
2.根據(jù)權(quán)利要求I所述的行人目標(biāo)識別方法,其特征在于,所述提取視頻幀的HOG特征的步驟包括 使用積分圖計算視頻幀的HOG特征。
3.根據(jù)權(quán)利要求I或2所述的行人目標(biāo)識別方法,其特征在于,所述提取所述視頻幀的 HOG特征的步驟包括 以16像素作為步進(jìn)提取所述視頻幀的HOG特征。
4.根據(jù)權(quán)利要求I所述的行人目標(biāo)識別方法,其特征在于,所述根據(jù)所述HOG特征和所述LBP特征識別所述視頻幀中的行人目標(biāo)的步驟還包括 將所述HOG特征和所述LBP特征輸入支持向量機; 通過支持向量機根據(jù)所述HOG特征和所述LBP特征識別所述視頻幀中的行人目標(biāo)。
5.根據(jù)權(quán)利要求4所述的行人目標(biāo)識別方法,其特征在于,所述通過支持向量機根據(jù)所述HOG特征和所述LBP特征識別所述視頻幀中的行人目標(biāo)的步驟之后還包括 通過所述支持向量機的核函數(shù)根據(jù)所述HOG特征和所述LBP特征計算所述視頻幀的信心指數(shù); 通過輪廓匹配算法對信心指數(shù)低于閾值的視頻幀進(jìn)行識別。
6.根據(jù)權(quán)利要求4所述的行人目標(biāo)識別方法,其特征在于,所述通過輪廓匹配算法對信心指數(shù)較低的視頻幀進(jìn)行識別的步驟還包括 根據(jù)預(yù)設(shè)的行人典型姿態(tài)模板集通過輪廓匹配算法對視頻幀進(jìn)行識別。
7.根據(jù)權(quán)利要求4所述的行人目標(biāo)識別方法,其特征在于,所述通過支持向量機根據(jù)所述HOG特征和所述LBP特征識別所述視頻幀中的行人目標(biāo)的步驟之后還包括 使用卡爾曼濾波模型對所述視頻幀中的行人目標(biāo)進(jìn)行預(yù)跟蹤,當(dāng)在連續(xù)預(yù)設(shè)個數(shù)的視頻幀中檢測到所述行人目標(biāo)時,將所述行人目標(biāo)標(biāo)記為有效行人目標(biāo)。
8.ー種行人目標(biāo)識別系統(tǒng),其特征在于,包括 視頻幀采集模塊,用于采集視頻幀; HOG特征提取模塊,用于提取所述視頻幀的HOG特征; LBP特征提取模塊,用于提取所述視頻幀的包含了方向和強度信息的LBP特征; 目標(biāo)識別模塊,用于根據(jù)所述HOG特征和所述LBP特征識別所述視頻幀中的行人目標(biāo)。
9.根據(jù)權(quán)利要求8所述的行人目標(biāo)識別系統(tǒng),其特征在于,所述HOG特征提取模塊還用于使用積分圖提取所述視頻幀的HOG特征。
10.根據(jù)權(quán)利要求8所述的行人目標(biāo)識別系統(tǒng),其特征在于,所述HOG特征提取模塊還用于以16像素作為步進(jìn)提取所述視頻幀的HOG特征。
11.根據(jù)權(quán)利要求8所述的行人目標(biāo)識別系統(tǒng),其特征在于,所述目標(biāo)識別模塊還用于將所述HOG特征和所述LBP特征輸入支持向量機,通過支持向量機根據(jù)所述HOG特征和所述LBP特征識別所述視頻幀中的行人目標(biāo)。
12.根據(jù)權(quán)利要求11所述的行人目標(biāo)識別系統(tǒng),其特征在于,所述目標(biāo)識別模塊還用于通過所述支持向量機的核函數(shù)根據(jù)所述HOG特征和所述LBP特征計算所述視頻幀的信心指數(shù),通過輪廓匹配算法對信心指數(shù)低于閾值的視頻幀進(jìn)行識別。
13.根據(jù)權(quán)利要求12所述的行人目標(biāo)識別系統(tǒng),其特征在于,所述目標(biāo)識別模塊還用于根據(jù)預(yù)設(shè)的行人典型姿態(tài)模板集通過輪廓匹配算法對視頻幀進(jìn)行識別。
14.根據(jù)權(quán)利要求11所述的行人目標(biāo)識別系統(tǒng),其特征在于,還包括卡爾曼濾波模塊,用于使用卡爾曼濾波對所述視頻幀中的行人目標(biāo)進(jìn)行預(yù)跟蹤,當(dāng)在連續(xù)預(yù)設(shè)個數(shù)的視頻幀中檢測到所述行人目標(biāo)時,將所述行人目標(biāo)標(biāo)記為有效目標(biāo)。
全文摘要
一種行人目標(biāo)識別方法,包括采集視頻幀;提取視頻幀的HOG特征;提取視頻幀的包含了方向和強度信息的LBP特征;根據(jù)所述HOG特征和所述LBP特征識別所述視頻幀中的行人目標(biāo)。此外,還提供了一種行人目標(biāo)識別系統(tǒng)。上述行人目標(biāo)識別方法和系統(tǒng)減少了輸入支持向量機的特征的維度,從而提高了識別效率。
文檔編號G06T7/20GK102663366SQ20121010893
公開日2012年9月12日 申請日期2012年4月13日 優(yōu)先權(quán)日2012年4月13日
發(fā)明者陳先開, 陳前, 馬穎東 申請人:中國科學(xué)院深圳先進(jìn)技術(shù)研究院