特定場景下的行人顏色提取方法
【專利摘要】本發(fā)明提供了一種特定場景下的行人顏色提取方法,首先使用公共行人樣本庫結(jié)合特定場景下采集到的行人樣本庫使用支持向量機(jī)訓(xùn)練出特定場景下的行人模型;然后對(duì)所述特定場景下拍攝的視頻流采用混合高斯模型進(jìn)行顏色建模和前景切割,得到能夠區(qū)分背景和前景的前景二值化圖。在前景二值化圖在原始圖像中標(biāo)示出的區(qū)域中使用支持向量機(jī)結(jié)合的預(yù)先訓(xùn)練好的行人的模型和梯度方向直方圖特征,不同縮放比下檢索行人,合并檢索出的相同行人目標(biāo),結(jié)合前景分割結(jié)果對(duì)合并結(jié)果準(zhǔn)確提取行人的全部區(qū)域,對(duì)該區(qū)域提取顏色直方圖,獲取顏色信息。本發(fā)明能夠自動(dòng)地從某一場景下的攝像頭拍攝的視頻流中檢測出行人,并提取出行人的顏色信息。
【專利說明】特定場景下的行人顏色提取方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種視頻流中行人顏色提取的方法,屬于計(jì)算機(jī)視覺、數(shù)字圖像處理領(lǐng)域。
【背景技術(shù)】
[0002]在計(jì)算機(jī)、處理器領(lǐng)域,隨著摩爾定律不斷地被科技進(jìn)步所證實(shí),微型計(jì)算機(jī)能力提升異常迅速,進(jìn)而越來越多的視頻監(jiān)控系統(tǒng)被運(yùn)用到城市的日常管理中去。一方面這些系統(tǒng)產(chǎn)生的監(jiān)控視頻包含了大量的有用信息,這些信息可以用于公安部門破案、交通部門指揮、規(guī)劃部門參考等等;但是另一方面,目前自動(dòng)化的從這些海量視頻中提取有用信息的技術(shù)手段還很欠缺。
【發(fā)明內(nèi)容】
[0003]本發(fā)明基于計(jì)算機(jī)視覺和數(shù)字圖像處理領(lǐng)域的最新進(jìn)展和當(dāng)下視頻監(jiān)控系統(tǒng)面臨的問題,提出了一種特定場景下的行人顏色提取的方法,用于從某一場景下的攝像頭拍攝的視頻流中檢測出行人,并提取出行人的顏色信息。
[0004]按照本發(fā)明提供的技術(shù)方案,所述的特定場景下的行人顏色提取方法首先使用公共行人樣本庫結(jié)合特定場景下采集到的行人樣本庫使用支持向量機(jī)訓(xùn)練出特定場景下的行人模型;然后對(duì)所述特定場景下拍攝的視頻流采用混合高斯模型進(jìn)行顏色建模和前景切害IJ,得到能夠區(qū)分背景和前景的前景二值化圖,在前景二值化圖在原始圖像中標(biāo)示出的區(qū)域中使用支持向量機(jī)結(jié)合的預(yù)先訓(xùn)練好的行人的模型和梯度方向直方圖特征,不同縮放比下檢索行人,合并檢索出的相同行人目標(biāo),結(jié)合前景分割結(jié)果對(duì)合并結(jié)果準(zhǔn)確提取行人的全部區(qū)域,對(duì)該區(qū)域提取顏色直方圖,獲取顏色信息。
[0005]進(jìn)一步的,所述公共行人樣本庫采用INRIA樣本庫,包含1805個(gè)64*128分辨率的行人圖片的正樣本,和1000張不包含行人的圖片;所述特定場景下采集到的行人樣本庫包括特定場景下采集的數(shù)目大于1805的正樣本,以及1000張?zhí)囟▓鼍暗牟话腥说膱D片;共計(jì)3610個(gè)正樣本,2000張不包含行人的圖片作為隨機(jī)選取負(fù)樣本的素材。
[0006]進(jìn)一步的,所述訓(xùn)練特定場景下的行人模型的方法為:
步驟1、在所述2000張不包含行人的圖片中隨機(jī)摘取3610個(gè)64*128分辨率的子圖片作為負(fù)樣本;
步驟2、分別計(jì)算正、負(fù)樣本的梯度方向直方圖特征值,存儲(chǔ)到正、負(fù)樣本特征值文件中;梯度方向特征值計(jì)算的參數(shù)為:最小格大小是6*6,塊大小是3*3個(gè)最小格,塊重疊程度為二分之一的塊大小,梯度方向直方圖的柱區(qū)間大小是20度,即把梯度按照O?360度區(qū)間上的18個(gè)區(qū)域進(jìn)行分類;
步驟3、分別將正、負(fù)樣本加上正、負(fù)標(biāo)記輸入進(jìn)SVM模型進(jìn)行訓(xùn)練,得到能夠代表行人特征的分類模型;
步驟4、從剩下的1000張不包含行人的特定場景下的圖片中隨機(jī)抽選出18050個(gè)64*128的負(fù)樣本,使用步驟3中產(chǎn)生的分類模型進(jìn)行分類得到臨時(shí)模型;
步驟5、將步驟4中得到的臨時(shí)模型分類成正結(jié)果的負(fù)樣本加入至步驟I中產(chǎn)生的負(fù)樣
本;
步驟6、循環(huán)執(zhí)行步驟2,3,4,5兩次,得到最終的分類模型。
[0007]本發(fā)明的優(yōu)點(diǎn)在于:該方法能夠利用計(jì)算機(jī)日益增長的強(qiáng)大計(jì)算能力,自動(dòng)地從某一場景下的攝像頭拍攝的視頻流中檢測出行人,并提取出行人的顏色信息,并可以分別得出行人上半身顏色,下半身顏色等具體部位信息。
【專利附圖】
【附圖說明】
[0008]圖1為算法整體流程圖。
【具體實(shí)施方式】
[0009]以下結(jié)合附圖和實(shí)施例對(duì)本發(fā)明進(jìn)行進(jìn)一步說明。
[0010]本發(fā)明首先使用公共行人樣本庫結(jié)合特定場景下采集到的行人樣本庫使用SVM訓(xùn)練出特定場景下的行人模型;然后對(duì)視頻流的背景采用混合高斯模型進(jìn)行顏色建模和前景切割,得到能夠區(qū)分背景和前景的前景二值化圖。在前景二值化圖在原始圖像中標(biāo)示出的區(qū)域中使用支持向量機(jī)結(jié)合的預(yù)先訓(xùn)練好的行人的模型和梯度方向直方圖特征,不同縮放比下檢索行人,合并檢索出的相同行人目標(biāo),結(jié)合前景分割結(jié)果對(duì)合并結(jié)果準(zhǔn)確提取行人的全部區(qū)域,對(duì)結(jié)果區(qū)域提取顏色直方圖,獲取顏色信息。
[0011]如圖1所示,整個(gè)算法分成兩個(gè)子過程:模型訓(xùn)練、行人分割及顏色提取。模型訓(xùn)練子過程是根據(jù)系統(tǒng)預(yù)先采集的樣本使用支持向量機(jī)進(jìn)行訓(xùn)練,得到特定場景下的行人模型;行人檢測及顏色提取子過程首先根據(jù)視頻流進(jìn)行背景建模,分割出前景,然后在前景中根據(jù)模型按照不同縮放比例檢索行人目標(biāo),最后根據(jù)前景和檢索出的行人目標(biāo)精確分割行人在在圖像中的全部區(qū)域,提取該區(qū)域的顏色信息即行人目標(biāo)的顏色信息。
[0012]I)模型訓(xùn)練。
[0013]a)訓(xùn)練樣本庫準(zhǔn)備。
[0014]首先選擇“INRIA”樣本庫作為基礎(chǔ)樣本庫,該樣本庫包含1805個(gè)從各種場景提取下的64*128分辨率的行人圖片的正樣本,和1000張不包含行人的照片;另外為了實(shí)現(xiàn)更好的行人檢測效果,還需要采集特定場合下的數(shù)目大于1805的正樣本,共計(jì)3610個(gè)正樣本;同時(shí)采集1000張?zhí)囟▓鼍暗牟话腥说恼掌灿?jì)2000張不包含行人的圖像作為隨機(jī)選取負(fù)樣本的素材。
[0015]b)模型訓(xùn)練。
[0016]1、在2000張INRIA不包含行人的圖片中隨機(jī)摘取3610個(gè)64*128分辨率的子圖片作為負(fù)樣本。
[0017]2、分別計(jì)算正負(fù)樣本的梯度方向直方圖特征值,存儲(chǔ)到正負(fù)樣本特征值文件中。梯度方向特征值計(jì)算的參數(shù)為:最小格大小是6*6,塊大小是3*3個(gè)最小格,塊重疊程度為二分之一的塊大小,梯度方向直方圖的柱區(qū)間大小是20度,即把梯度按照O?360度區(qū)間上的18個(gè)區(qū)域進(jìn)行分類。
[0018]3、分別將正負(fù)樣本加上正負(fù)標(biāo)記輸入進(jìn)SVM模型進(jìn)行訓(xùn)練,得到能夠代表行人特征的分類模型。
[0019]4、從剩下的1000張不包含行人的特定場景下的圖片中隨機(jī)抽選出18050個(gè)64*128的負(fù)樣本,使用步驟3中產(chǎn)生的分類模型進(jìn)行分類。
[0020]5、將步驟4中模型Ml分類成正結(jié)果的負(fù)樣本加入至步驟I中產(chǎn)生的負(fù)樣本。
[0021]6、循環(huán)執(zhí)行步驟2,3,4,5兩次,得到最終的分類模型M。
[0022]2)行人分割及顏色提取。
[0023]a)前景分割。
[0024]對(duì)原視頻圖像中的每幀圖像進(jìn)行建模分析,判定前景與背景的區(qū)域位置,具體包括采用混合高斯模型,結(jié)合圖像的顏色和梯度,對(duì)原視頻圖像中的每幀圖像進(jìn)行建模分析,判定前景與背景的區(qū)域位置。
[0025]根據(jù)所述前景與背景的區(qū)域位置對(duì)所述每幀圖像進(jìn)行二值化處理,建立用于標(biāo)記前景與背景區(qū)域位置的二值圖,包括:
為原視頻圖像的每幀圖像建立對(duì)應(yīng)的一幀分辨率相同的待處理圖像;
將所述待處理圖像中,對(duì)應(yīng)于相應(yīng)的原視頻圖像前景區(qū)域的像素賦予白色色值,將所述待處理圖像中,對(duì)應(yīng)于相應(yīng)的原視頻圖像背景區(qū)域的像素賦予黑色色值,獲得初級(jí)二值圖;
對(duì)所述初級(jí)二值圖進(jìn)行腐蝕運(yùn)算,去除噪聲;
對(duì)經(jīng)過去除噪聲處理的初級(jí)二值圖進(jìn)行膨脹運(yùn)算,獲得最終的用于標(biāo)記前景與背景區(qū)域位置的二值圖。
[0026]計(jì)算一個(gè)矩形,使之能夠把所有前景區(qū)域包括在內(nèi),記錄下矩形框的位置。
[0027]b)行人檢測。
[0028]檢測過程中經(jīng)常采用金字塔式的窮盡搜索法,我們?cè)O(shè)表示圖像尺寸,step表示縮放步長(每次縮放比例),winsize表示檢測窗口尺寸;分別將待檢測圖像以自然數(shù)(1,2, 3...)倍率進(jìn)行縮小(直到帶檢測圖像高小于128或者寬小于64停止),并在每一步縮小的圖像上進(jìn)行窮盡式搜索,即將搜索窗口按照I個(gè)像素為步進(jìn)在檢測圖像上滑動(dòng),并對(duì)每個(gè)位置的圖像使用分類模型進(jìn)行分類,得到的初步分類為行人的候選位置。
[0029]一個(gè)行人可能在不同的尺度上被檢測出多次,將重復(fù)檢測出的行人進(jìn)行合并得到最終檢測出的行人位置。
[0030]c)精確行人分割和顏色特征提取。
[0031]用前景分割得到的前景區(qū)域和行人檢測步驟檢測到的行人區(qū)域在待檢測圖像中進(jìn)行投影,可以得到行人在原始待檢測區(qū)域中的精確區(qū)域。
[0032]d)行人顏色及其他特征提取。
[0033]根據(jù)上一步驟中的到的行人在待檢測圖像中的精確區(qū)域,計(jì)算該區(qū)域的顏色直方圖,即可以得到行人的顏色信息。在能標(biāo)示行人的精確區(qū)域上,也可以提取其他任意已知的可以用于描述物體的圖像特征。
[0034]使用本發(fā)明精確的行人分割結(jié)果,可以提取處更多的其他能夠表現(xiàn)行人表面特征的特征值。為了實(shí)現(xiàn)上述目標(biāo),本發(fā)明的重點(diǎn)在于結(jié)合計(jì)算機(jī)視覺中最新的復(fù)雜場景下的前景檢測算法、行人檢測算法,組成能夠?qū)崿F(xiàn)上述目標(biāo)的行人顏色提取方法。本發(fā)明具有如下特點(diǎn): 1、準(zhǔn)確的分割出行人在圖像中所占的區(qū)域。
[0035]2、可以精確定位出行人上半身和下半身所占區(qū)域。
[0036]3、可以精確提取處行人全身的顏色成分和特殊區(qū)域的顏色成分。
[0037]4、結(jié)合原始圖像可以提取處行人區(qū)域的紋理特征。
[0038]5、提取顏色僅是本方法的一種應(yīng)用,本發(fā)明亦可以用于提取可以用于描述行人的其他特征。
【權(quán)利要求】
1.特定場景下的行人顏色提取方法,其特征是:首先使用公共行人樣本庫結(jié)合特定場景下采集到的行人樣本庫使用支持向量機(jī)訓(xùn)練出特定場景下的行人模型;然后對(duì)所述特定場景下拍攝的視頻流采用混合高斯模型進(jìn)行顏色建模和前景切割,得到能夠區(qū)分背景和前景的前景二值化圖;在前景二值化圖在原始圖像中標(biāo)示出的區(qū)域中使用支持向量機(jī)結(jié)合的預(yù)先訓(xùn)練好的行人的模型和梯度方向直方圖特征,不同縮放比下檢索行人,合并相同的檢索結(jié)果,合并檢索出的相同行人目標(biāo),結(jié)合前景分割結(jié)果對(duì)合并結(jié)果準(zhǔn)確提取行人的全部區(qū)域,對(duì)該區(qū)域提取顏色直方圖,獲取顏色信息。
2.如權(quán)利要求1所述特定場景下的行人顏色提取方法,其特征是,所述公共行人樣本庫采用INRIA樣本庫,包含1805個(gè)64*128分辨率的行人圖片的正樣本,和1000張不包含行人的圖片;所述特定場景下采集到的行人樣本庫包括特定場景下采集的數(shù)目大于1805的正樣本,以及1000張?zhí)囟▓鼍暗牟话腥说膱D片;共計(jì)3610個(gè)正樣本,2000張不包含行人的圖片作為隨機(jī)選取負(fù)樣本的素材。
3.如權(quán)利要求2所述特定場景下的行人顏色提取方法,其特征是,所述訓(xùn)練特定場景下的行人模型的方法為: 步驟1、在所述2000張不包含行人的圖片中隨機(jī)摘取3610個(gè)64*128分辨率的子圖片作為負(fù)樣本; 步驟2、分別計(jì)算正、負(fù)樣本的梯度方向直方圖特征值,存儲(chǔ)到正、負(fù)樣本特征值文件中;梯度方向特征值計(jì)算的參數(shù)為:最小格大小是6*6,塊大小是3*3個(gè)最小格,塊重疊程度為二分之一的塊大小,梯度方向直方圖的柱區(qū)間大小是20度,即把梯度按照O?360度區(qū)間上的18個(gè)區(qū)域進(jìn)行分類; 步驟3、分別將正、負(fù)樣本加上正、負(fù)標(biāo)記輸入進(jìn)SVM模型進(jìn)行訓(xùn)練,得到能夠代表行人特征的分類模型; 步驟4、從剩下的1000張不包含行人的特定場景下的圖片中隨機(jī)抽選出18050個(gè)64*128的負(fù)樣本,使用步驟3中產(chǎn)生的分類模型進(jìn)行分類得到臨時(shí)模型; 步驟5、將步驟4中得到的臨時(shí)模型分類成正結(jié)果的負(fù)樣本加入至步驟I中產(chǎn)生的負(fù)樣本; 步驟6、循環(huán)執(zhí)行步驟2,3,4,5兩次,得到最終的分類模型。
【文檔編號(hào)】G06K9/62GK103530879SQ201310481831
【公開日】2014年1月22日 申請(qǐng)日期:2013年10月15日 優(yōu)先權(quán)日:2013年10月15日
【發(fā)明者】韓建康, 毛續(xù)飛, 李向陽, 劉云浩 申請(qǐng)人:無錫清華信息科學(xué)與技術(shù)國家實(shí)驗(yàn)室物聯(lián)網(wǎng)技術(shù)中心