專利名稱:一種基于決策樹的多種人體姿態(tài)識別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及智能視覺監(jiān)控領(lǐng)域,實現(xiàn)智能監(jiān)控系統(tǒng)中人體姿態(tài)的自動識別, 屬于計算機視覺研究領(lǐng)域。
技術(shù)背景智能視覺監(jiān)控系統(tǒng)主要用于那些對安全要求敏感的場合,如銀行、機場、 倉庫等無人值守的重要部門,目前監(jiān)控攝像機在商業(yè)應(yīng)用中已經(jīng)普遍存在,但并沒有充分發(fā)揮其實時主動的監(jiān)控作用,因為它們通常是將攝像機的輸出結(jié)果 記錄下來,當(dāng)異常情況發(fā)生后,工作人員再通過視頻記錄的結(jié)果觀察發(fā)生的事實,但往往為時已晚,而我們需要的監(jiān)控系統(tǒng)應(yīng)該能夠每天連續(xù)24小時的實時 監(jiān)視,并自動分析攝像機捕捉的圖像數(shù)據(jù),當(dāng)發(fā)現(xiàn)具有異常行為的可疑人體時, 系統(tǒng)能向保衛(wèi)人員準(zhǔn)確及時的發(fā)出警報,從而避免犯罪的發(fā)生。目前,囯內(nèi)外的監(jiān)控系統(tǒng)大多都是針對正常行走的人體進行監(jiān)控的,而對 于哈腰與匍匐人體姿態(tài)的監(jiān)控識別研究較少,并且國內(nèi)外對人體姿態(tài)識別的研 究大多釆用對運動目標(biāo)提取特征后利用神經(jīng)網(wǎng)絡(luò)或支持向量機進行分類的方 法。此種方法的分類性能取決于所選特征的好壞,對作為非剛體的多方位人體 姿態(tài)識別難度較大,往往會存在所提取的特征向量只能用于一種方位人體姿態(tài) 識別的情況,此外,此種方法的分類器對樣本的數(shù)量要求較大,系統(tǒng)結(jié)構(gòu)較為 復(fù)雜,不便于理解和設(shè)計。決策樹,或稱多級分類器,是模式識別中進行分類的一種有效方法,對于 多類目標(biāo)識別問題,這種方法尤為方便。決策樹系統(tǒng)具有把復(fù)雜問題分解為多 個簡單分類問題的特點,它不是企圖用一種算法、 一個決策規(guī)則去把多個類別 目標(biāo)一次分開,而是釆用分級的形式,使分類問題逐步得到解決?;跊Q策樹 的分類模型具有以下獨特的優(yōu)點(1) 決策樹方法結(jié)構(gòu)簡單,生成便于人們理解的規(guī)則。(2) 決策樹模型效率高,對分類目標(biāo)較多的情況較為合適。(3) 決策樹算法的計算量相對來說不是很大,并且速度較快,可滿足實時 性要求。(4) 決策樹算法不需要局限在處理數(shù)值型數(shù)據(jù),在分支處可以采取靈活的 分類策略。(5) 決策樹方法具有較高的分類精確度,它是指在數(shù)據(jù)庫的各個對象中找 出共同特性,并按照分類模型把它們進行分類。由于決策樹具有多分枝結(jié)構(gòu),不同分枝可以采用不同的算法規(guī)則,利用這 一特點發(fā)明了基于決策樹的人體姿態(tài)識別系統(tǒng)。此系統(tǒng)具有把復(fù)雜分類問題分 解為多個簡單分類問題的特點,同時可以把人的經(jīng)驗知識加入其中,采取小樣 本就可設(shè)計實現(xiàn),因此,基于決策樹的人體姿態(tài)識別系統(tǒng)可以較好的完成多種 方位、多種人體姿態(tài)的識別任務(wù)。 發(fā)明內(nèi)容本發(fā)明的目的是要采用一種簡單的決策樹來完成人體直立、哈腰、匍旬姿 態(tài)的識別。本發(fā)明是釆取以下的技術(shù)方案來實現(xiàn)的 一種基于決策樹的多種人體姿態(tài)識別方法,包括 車輛與人體的區(qū)分;人體的判別;人體姿態(tài)的識別三個階段。 步驟l:對運動目標(biāo)進行預(yù)處理,應(yīng)用決策樹系統(tǒng)判斷目標(biāo)是否完全進入視 場內(nèi),完全進入后開始計算目標(biāo)特征量。決策樹系統(tǒng)利用矩形度與形狀復(fù)雜度 變化率對目標(biāo)進行車輛與人體的區(qū)分,用人體判別算法將人體目標(biāo)及姿態(tài)粗略 的估計出來。步驟2、對目標(biāo)進行雙腿和頭部搜索,從而完成人體判別,確定目標(biāo)為人體 后再進一步對姿態(tài)進行識別。步驟3、決策樹系統(tǒng)利用搜索到的人體腿部或頭部位置進行姿態(tài)識別,完成 人體直立、哈腰、匍匐三種姿態(tài)的識別。其中,應(yīng)用離心率區(qū)分識別匍旬人體與貓狗,避免對匍匍人體的誤識別, 改進的橫井法細化算法被用于雙腿搜索算法的設(shè)計,人體結(jié)構(gòu)也被用于頭部搜 索匹配算法的設(shè)計。具體而言,決策樹系統(tǒng)利用搜索運動的上下左右四個邊界點與整幅圖像邊 界的位置關(guān)系來判斷目標(biāo)是否完全進入視場內(nèi)。形狀復(fù)雜度變化率區(qū)分車輛與人體。由于車輛運動 為剛體運動,車輛的形狀趨近于矩形,且一般不發(fā)生變化,而人體運動為非剛體運動,形狀和車體形狀有一定差異,多幀之間形狀變化較大,利用此種差異 可將人體與車輛區(qū)分出來。決策樹系統(tǒng)利用寬高比將匍匐人體與直立、哈腰三種人體進行粗略估計,然 后利用人體判別算法判定人體,具體算法如下人體判別算法步驟S1:利用改進的橫井法細化算法對目標(biāo)進行細化。 人體判別算法步驟S2:對目標(biāo)進行雙腿搜索,搜索成功,則判別為人體。 人體判別算法步驟S3:如雙腿搜索失敗,則進行頭部匹配,匹配成功,判 別為人體。人體雙腿的搜索方法為先對目標(biāo)進行細化,然后從底部搜索同行分開的兩 點,并對其進行跟蹤,如兩條線段最終相交到一點,則確定找到雙腿。下、左、右四個邊界點,將人體頭部區(qū)域標(biāo)識出來,利用頭部矩形度進行匹配。 所說的改進的橫井法細化算法步驟為改進的橫井法細化算法S1:按從左到右、從上到下的順序,搜索1像素。 改進的橫井法細化算法S2:判別圖形表面像素,并加上標(biāo)記。設(shè)上下表面像素和左右表面像素的標(biāo)記分別為21和31。反復(fù)執(zhí)行步驟S1、 S2,直至掃描結(jié)東。改進的橫井法細化算法S3:判別線圖形端點,當(dāng)8鄰點中0像素的個數(shù)為7 時,此點為端點,不能去除,該點值改為41。改進的橫井法細化算法S4:搜索標(biāo)記為21或31的點,如果/(,',y + i) = /(/,/), 并且/(/,/-1) = 0朋"2) = o ,或者滿足= ,并且/(/-1,力=0朋#(/ + 2,力=0條件時,則把該點值改為41。否則判斷下一步。改進的橫井法細化算法S5:計算連接數(shù)臉。當(dāng)臉=0,2,3,4時,因不滿足保 持連接性條件,故不能去除,同樣加標(biāo)記41。當(dāng)臉=1時,滿足可去除條件,將 此l像素變?yōu)閛像素。改進的橫井法細化算法S6:最后一次掃描,將標(biāo)記為41的像素全部改為1像素。決策樹系統(tǒng)利用離心率進行匍匐人體與貓狗的識別,由于匍匐人體的離心率 較大,而狗的則較小,故利用離心率可提髙系統(tǒng)對匍匍人體的誤識率。決策樹系統(tǒng)利用搜索到的人體腿部或頭部位置進行姿態(tài)識別,完成人體直 立、哈腰、匍匐三種姿態(tài)的識別。至此,基于決策樹的多種人體姿態(tài)識別方法執(zhí)行完畢。決策樹系統(tǒng)結(jié)構(gòu)圖如圖2所示。首先,系統(tǒng)計算目標(biāo)的矩形度及形狀復(fù)雜 度變化率,以此將車輛與其他目標(biāo)區(qū)分出來,然后對車輛進行跟蹤。接著,決 策樹利用運動目標(biāo)的寬高比粗略估計出人體目標(biāo)及姿態(tài),進而利用雙腿搜索及 頭部匹配等條件判定人體。最后,利用搜索到的頭部及腿部位置對人體姿態(tài)進 行識別,通過多幀判別綜合判定的方法最終確定目標(biāo)種類及人體姿態(tài)。本發(fā)明專利的有益效果是解決了智能監(jiān)控系統(tǒng)中多種方位人體姿態(tài)識別 方法較為復(fù)雜的問題,實現(xiàn)了利用決策樹簡單的特點構(gòu)建人體識別系統(tǒng)的方法。
圖1運動目標(biāo)的預(yù)處理流程圖;圖2運動目標(biāo)識別決策樹;圖3人體判別流程圖;圖4匍甸人體識別流程圖;圖5頭部搜索匹配流程圖;圖6雙腿搜索流程圖;圖7人體比例結(jié)構(gòu)圖;圖8人體姿態(tài)識別示意圖。
具體實施方式
下面結(jié)合具體實施方式
對本發(fā)明做進 一 步的詳細說明。 具體實施例圖1為運動目標(biāo)的預(yù)處理流程圖,當(dāng)監(jiān)控系統(tǒng)檢測到運動目標(biāo)之后,先對 其進行跟蹤,然后對運動目標(biāo)進行提取和分割,接著對運動目標(biāo)進行預(yù)處理,預(yù)處理流程如圖l所示,主要包括以下6個部分(1) 對提取的目標(biāo)進行二值化處理。(2) 判斷目標(biāo)是否完全進入視場內(nèi)。(3) 計算隔幀目標(biāo)的復(fù)雜度變化率。(4) 計算目標(biāo)的慣性主軸角度。(5) 判斷目標(biāo)是否需要旋轉(zhuǎn),以方便提取其最小外接矩形。(6) 計算目標(biāo)的矩形度。圖2為運動目標(biāo)識別決策樹,圖3為人體判別流程圖,圖4為匍匍人體的識 別流程圖,圖5為頭部搜索匹配流程圖,圖6為雙腿搜索流程圖,圖7為人體 比例結(jié)構(gòu)圖,圖8為人體姿態(tài)識別示意圖。參照圖2至圖8所示,決策樹利用搜索目標(biāo)的四個邊界點來判斷目標(biāo)是否 完全進入視場內(nèi), 一旦確定目標(biāo)完全進入視場內(nèi)后,則進行初始化搡作,然后 利用決策樹對其分類。由于人體運動為非剛體運動,而車輛運動為剛體運動, 因此,決策樹首先利用矩形度及形狀復(fù)雜度變化率兩種特征量將人體與車輛區(qū) 分出來。接著,對人體目標(biāo)進行判定,判別方法為搜索人體的雙腿或進行頭部 匹配,人體雙腿搜索算法的設(shè)計利用了細化后的人體目標(biāo),具體步驟為(1) 利用改進的橫井法細化方法對運動目標(biāo)進行細化。(2) 從底部向上尋找左右兩邊的邊界點。 .(3)對左右兩個邊界點進行跟蹤。(4) 判斷每行所跟蹤的兩點是否相交。(5) 如果相交,確定雙腿長度是否符合一定的人體比例,此處比例為 0. 285H-0. 72H。(6) 如果符合,則判定找到雙腿。如果未搜索到雙腿,則接著進行頭部匹配,頭部匹配算法的具體步驟為(1) 確定目標(biāo)的外接矩形,并提取目標(biāo)。(2) 搜索目標(biāo)左右邊界最高點,確定頭部的偏向位置。(3) 利用人體比例結(jié)構(gòu)確定頭部所在空間。H)利用頭部長寬比進行匹配,匹配值確定為0.8-1.2。 (5)匹配成功,則判定找到頭部。如果雙腿搜索成功或頭部匹配成功,則確定運動目標(biāo)為人體。最后,利用 搜索到的人體腿部或頭部位置進行姿態(tài)識別,完成人體直立、哈腰、匍旬三種 姿態(tài)的識別。當(dāng)運動目標(biāo)為正面或背面哈腰人體時,頭部匹配失敗,由此而判 別出哈腰人體,解決了正面或背面哈腰人體較難判別這一難題。
上述具體實施方式
不以任何形式限制本發(fā)明的技術(shù)方案,凡是釆用等同替 換或等效變換的方式所獲得的技術(shù)方案均落在本發(fā)明的保護范圍。
權(quán)利要求
1、一種基于決策樹的多種人體姿態(tài)識別方法,包括以下步驟對運動目標(biāo)進行預(yù)處理,應(yīng)用決策樹系統(tǒng)判斷目標(biāo)是否完全進入視場內(nèi),完全進入后開始計算目標(biāo)特征量;車輛與人體的區(qū)分;是否為人體的判別;人體姿態(tài)的識別。
2、 根據(jù)權(quán)利要求l所述的基于決策樹的多種人體姿態(tài)識別方法,其特征在 于所述車輛與人體的區(qū)分是通過決策樹系統(tǒng)利用矩形度與形狀復(fù)雜度變化率對 目標(biāo)進行車輛與人體的區(qū)分,用人體判別算法將人體目標(biāo)及姿態(tài)粗略的估計出 來。
3、 根據(jù)權(quán)利要求l所述的基于決策樹的多種人體姿態(tài)識別方法,其特征在 于所述人體的判別是通過對目標(biāo)進行雙腿搜索和頭部搜索,從而完成人體判別, 并且利用離心率進行匍匐人體與貓狗的識別。
4、 根據(jù)權(quán)利要求1所述的基于決策樹的多種人體姿態(tài)識別方法,其特征在 于所述人體姿態(tài)的識別是通過決策樹系統(tǒng)利用搜索到的人體腿部或頭部位置進 行姿態(tài)識別,完成人體直立、哈腰、匍匐三種姿態(tài)的識別。
5、 根據(jù)權(quán)利要求l所述的基于決策樹的多種人體姿態(tài)識別方法,其特征在 于所述決策樹系統(tǒng)判斷目標(biāo)是否完全進入視場內(nèi)是決策樹系統(tǒng)利用搜索運動的 上下左右四個邊界點與整幅圖像邊界的位置關(guān)系來判斷目標(biāo)是否完全進入視場 內(nèi)。
6、 根據(jù)權(quán)利要求2所述的基于決策樹的多種人體姿態(tài)識別方法,其特征在 于所述人體判別算法的具體算法是步驟l:利用改進的橫井法細化算法對目標(biāo)進行細化;步驟2:對目標(biāo)進行雙腿搜索,搜索成功,則判別為人體;步驟3:如雙腿搜索失敗,則進行頭部匹配,匹配成功,判別為人體。
7、 根據(jù)權(quán)利要求6所述的基于決策樹的多種人體姿態(tài)識別方法,其特征在 于,所說的改進的橫井法細化算法步驟是步驟l:按從左到右、從上到下的順序,搜索l像素;步驟2:判別圖形表面像素,并加上標(biāo)記。設(shè)上下表面像素和左右表面像素 的標(biāo)記分別為21和31。反復(fù)執(zhí)行步驟S1、 S2,直至掃描結(jié)束;步驟3:判別線圖形端點,當(dāng)8鄰點中0像素的個數(shù)為7時,此點為端點, 不能去除,該點值改為41;步驟4:搜索標(biāo)記為21或31的點,如果/(w + ix(w'),并且— 1) = 0 ""d/(/j + 2) = 0 ,或者滿足/(; + W) = /(/,乂),并且— U) = 0 + 2,/) = 0條件時,則把該點值改為41。否則判斷下一步;步驟5:計算連接數(shù)M;,當(dāng)1 = 0,2,3,4時,因不滿足保持連接性條件,故不能去除,同樣加標(biāo)記41。當(dāng)臉=1時,滿足可去除條件,將此1像素變?yōu)?像素; 步驟6:最后一次掃描,將標(biāo)記為41的像素全部改為l像素。
8、根據(jù)權(quán)利要求6所述的基于決策樹的多種人體姿態(tài)識別方法,其特征在于,所述人體雙腿的搜索是先對目標(biāo)進行細化,然后從底部搜索同行分開的兩點,并對其進行跟蹤,如兩條線段最終相交到一點,則確定找到雙腿;所述的人體頭部匹配方法是利用人體比例結(jié)構(gòu)確定頭部位置,然后搜索上、下、左、右四個邊界點,將人體頭部區(qū)域標(biāo)識出來,利用頭部矩形度進行匹配。
全文摘要
本發(fā)明公布了一種基于決策樹的多種人體姿態(tài)識別方法,包括以下步驟對運動目標(biāo)進行預(yù)處理,判斷目標(biāo)是否完全進入視場內(nèi),完全進入后開始計算目標(biāo)特征量;利用矩形度與形狀復(fù)雜度變化率進行車輛與人體的區(qū)分,而目標(biāo)寬高比將人體目標(biāo)及姿態(tài)粗略的估計出來;對目標(biāo)進行雙腿和頭部搜索,從而完成人體判別,確定目標(biāo)為人體后再進一步對姿態(tài)進行識別;最后,利用人體腿部及頭部的位置進行直立、哈腰、匍匐三種姿態(tài)的識別。本發(fā)明能對直立、哈腰、匍匐三種人體姿態(tài)進行識別,在智能監(jiān)控、人體行為識別等方面具有重要應(yīng)用意義。
文檔編號G06K9/00GK101533467SQ20091003115
公開日2009年9月16日 申請日期2009年4月28日 優(yōu)先權(quán)日2009年4月28日
發(fā)明者盧文濤, 呂東岳, 龍 周, 徐貴力, 李文躍, 汪凌燕, 琦 蔣, 非 謝 申請人:南京航空航天大學(xué)