專(zhuān)利名稱(chēng):檢測(cè)視頻的圖像時(shí)間序列中的活動(dòng)對(duì)象的方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及計(jì)算機(jī)視覺(jué)和模式識(shí)別,尤其涉及檢測(cè)視頻中的諸如行人之類(lèi)的活動(dòng)對(duì)象。
背景技術(shù):
為了檢測(cè)和識(shí)別圖像中的對(duì)象,模式識(shí)別方法在計(jì)算機(jī)視覺(jué)領(lǐng)域中已取得了重大的成就,實(shí)例包括面部、機(jī)動(dòng)車(chē)和行人檢測(cè),可以參見(jiàn)例如Avidan,“Support vector tracking,”IEEE Conference onComputer Vision and Pattern Recognition,2001;Papageorgiou et al.,“A general framework for object detection,”International Conferenceon Computer Vision,1998;Rowley et al.,“Neural network-based facedetection,”IEEE Patt.Anal.Mach.Intell.,Volume 20,pages 22-38,1998;Schneiderman et al.,“A statistical method for 3D objectdetection applied to faces and cars,”International Conference onComputer Vision,2000;和Viola et al.“Rapid object detection using aboosted cascade of simple features,”IEEE Conference on ComputerVision and Pattern Recognition,2001。
這些方法一般利用機(jī)器學(xué)習(xí)能力,以根據(jù)大量的訓(xùn)練圖像構(gòu)造檢測(cè)器或過(guò)濾器。然后在輸入圖像上用過(guò)濾器進(jìn)行掃描,以便找出特征的模式,這種模式與目標(biāo)對(duì)象相符。那些系統(tǒng)對(duì)于面部檢測(cè)運(yùn)行得很好,但對(duì)行人檢測(cè)卻運(yùn)行得不太好,這可能是因?yàn)?,由于身體姿勢(shì)和服裝的變化而使行人的圖像變化較大,而面部在紋理和構(gòu)造方面相當(dāng)統(tǒng)一并且相對(duì)來(lái)說(shuō)動(dòng)作很少。因此,需要提供一種方法,能對(duì)時(shí)間排序的圖像序列以及對(duì)單個(gè)靜態(tài)圖像起作用。
在監(jiān)視應(yīng)用中,行人檢測(cè)甚至更為困難,在這些應(yīng)用中,圖像分辨率相對(duì)較低,例如,目標(biāo)對(duì)象可能只有總共約100-200個(gè)像素,例如5×20或10×20個(gè)像素。盡管利用更好的“圖像強(qiáng)度”的功能進(jìn)行行人檢測(cè)的改進(jìn)是一項(xiàng)很有價(jià)值的工作,然而,還是需要一種新的解決辦法。
眾所周知,人體動(dòng)作的模式(尤其像步行動(dòng)作那樣的擺動(dòng))與其他類(lèi)型的動(dòng)作不同,并且,動(dòng)作可以用來(lái)識(shí)別和檢測(cè)人,參見(jiàn)Cutleret al.,“Robust real-time periodic motion detectionAnalysis andapplications,”IEEE Patt.Anal.Mach.Intell.,Volume 22,pages781-796,2000;Lee,“Gait dynamics for recognition andclassification,”,MIT AI Lab.,Memo,AIM-2001-019,MIT,2001;Liu etal.,“Finding periodicity in space and time,”IEEE InternationalConference on Computer Vision,pages 376-383,1998;和Polana et al.,“Detecting activities,”Journal of Visual Communication and ImageRepresentation,June 1994。
與基于強(qiáng)度的方法相比,這些方法一般設(shè)法通過(guò)許多幀來(lái)跟蹤活動(dòng)對(duì)象,然后分析其動(dòng)作以尋找周期性或其他提示。檢測(cè)動(dòng)作“式樣”的過(guò)程是十分有效的,并且可以按多標(biāo)度分辨率對(duì)整個(gè)圖像進(jìn)行徹底的搜索。當(dāng)用圖像的大量數(shù)據(jù)組進(jìn)行訓(xùn)練后,這些過(guò)程可以達(dá)到高檢測(cè)率和很低的誤肯定率(false positive rate)。
人體動(dòng)作分析領(lǐng)域很廣,其歷史可以追溯到Hoffman等人的工作“The interpretation of biological motion,”Biological Cybernetics,pages 195-204,1982。大多數(shù)現(xiàn)有技術(shù)的系統(tǒng)都認(rèn)為一半問(wèn)題已經(jīng)解決,即已經(jīng)檢測(cè)了特定類(lèi)型的活動(dòng)對(duì)象(例如人),剩余的問(wèn)題只是要識(shí)別、分類(lèi)或分析該特定活動(dòng)對(duì)象的動(dòng)作的長(zhǎng)期模式。
近來(lái),人們對(duì)基于動(dòng)作的方法越來(lái)越感興趣,因?yàn)檫@些方法可能應(yīng)用到監(jiān)視問(wèn)題中。上述Cutler等人對(duì)該領(lǐng)域中的相關(guān)工作作了很好的綜述。他們描述了一種直接對(duì)圖像起作用的系統(tǒng)。他們的系統(tǒng)首先是要進(jìn)行對(duì)象的分割和跟蹤。將這些對(duì)象對(duì)準(zhǔn)對(duì)象的重心。然后,構(gòu)造一種2D格子,對(duì)其進(jìn)行周期分析。
對(duì)象檢測(cè)領(lǐng)域同樣很廣,盡管還不了解同時(shí)能利用強(qiáng)度和動(dòng)作信息進(jìn)行直接行人檢測(cè)的系統(tǒng)。在靜態(tài)強(qiáng)度圖像中,已利用一組例子通過(guò)先提取邊緣再匹配邊緣來(lái)檢測(cè)行人,參見(jiàn)Gavrila et al.,“Real-timeobject detection for“smart”vehicles,”IEEE International Conferenceon Computer Vision,pages 87-93,1999。他們的系統(tǒng)是一種高度優(yōu)化的系統(tǒng),并且似乎已成為機(jī)動(dòng)車(chē)中的內(nèi)裝候選系統(tǒng)。然而,在每一圖像誤肯定率為2的情況下,所公布的檢測(cè)率約為75%。其他相關(guān)工作包括上述Papageorgiou等人的工作。該系統(tǒng)利用基于過(guò)完全小波訓(xùn)練的支持矢量機(jī)來(lái)檢測(cè)行人。根據(jù)所公布的實(shí)驗(yàn)數(shù)據(jù),這種系統(tǒng)的誤肯定率大大高于相關(guān)面部檢測(cè)系統(tǒng)的誤肯定率。
因此,需要根據(jù)圖像時(shí)間序列直接提取動(dòng)作的短期模式和外觀信息,以便檢測(cè)諸如行人之類(lèi)的活動(dòng)對(duì)象的情況。
發(fā)明內(nèi)容
本發(fā)明提供了一種通過(guò)同時(shí)綜合圖像強(qiáng)度和動(dòng)作信息來(lái)檢測(cè)特定類(lèi)型的活動(dòng)對(duì)象的系統(tǒng)。通過(guò)一組組合圖像對(duì)一組過(guò)濾器進(jìn)行掃描。例如,過(guò)濾器是矩形的,并通過(guò)對(duì)視頻中的連續(xù)圖像應(yīng)用某些功能來(lái)獲得組合圖像。過(guò)濾器的掃描產(chǎn)生一些特征值??傆?jì)這些特征并進(jìn)行分類(lèi)。
訓(xùn)練分類(lèi)器,以便利用特定類(lèi)型的對(duì)象(比如行人)的動(dòng)作和外觀信息。過(guò)去的某些方法根據(jù)動(dòng)作信息構(gòu)成一些檢測(cè)器。其他檢測(cè)器基于外觀信息。然而,本發(fā)明則在單個(gè)檢測(cè)器中綜合了動(dòng)作和外觀信息。
圖1是一種根據(jù)本發(fā)明用于檢測(cè)活動(dòng)對(duì)象的方法的流程圖;圖2A是本發(fā)明所用的矩形過(guò)濾器的框圖;圖2B是本發(fā)明所用的矩形過(guò)濾器的框圖;圖2C是本發(fā)明所用的矩形過(guò)濾器的框圖;
圖2D是本發(fā)明所用的矩形過(guò)濾器的框圖;圖2E是本發(fā)明所用的矩形過(guò)濾器的框圖;圖2F是本發(fā)明所用的矩形過(guò)濾器的框圖;圖3A是本發(fā)明所用的組合圖像的框圖;圖3B是本發(fā)明所用的組合圖像的框圖;圖3C是本發(fā)明所用的組合圖像的框圖;圖3D是本發(fā)明所用的組合圖像的框圖;圖3E是本發(fā)明所用的組合圖像的框圖;圖3F是本發(fā)明所用的組合圖像的框圖;圖3G是本發(fā)明所用的組合圖像的框圖;和圖3H是本發(fā)明所用的組合圖像的框圖。
具體實(shí)施例方式
圖1示出了一種用于檢測(cè)時(shí)間排序的圖像序列101(即視頻)中的活動(dòng)對(duì)象105(例如行人)的方法100。所選圖像111從輸入視頻101中得到,例如相鄰對(duì)、重疊對(duì)、每間隔兩個(gè)的圖像等。功能102應(yīng)用120于所選圖像111,以產(chǎn)生組合圖像組121。將組合圖像分割成不同尺寸的檢測(cè)窗或“碎塊”,例如,整個(gè)圖像4個(gè)窗口(每個(gè)為圖像的1/4),等等。通過(guò)組合圖像組的檢測(cè)窗對(duì)過(guò)濾器200進(jìn)行掃描和評(píng)估,以確定130一些特征131,將這些特征總計(jì)140到累積分C 141中。對(duì)累積分進(jìn)行分類(lèi)150,以判斷特定檢測(cè)窗是否真的含有特定類(lèi)型的活動(dòng)對(duì)象,例如行人105。針對(duì)所有組合圖像的所有檢測(cè)窗重復(fù)151這一過(guò)程,然后針對(duì)視頻101中的所有圖像重復(fù)152這一過(guò)程。
過(guò)濾器、特征和分類(lèi)器如圖2A-2F中所示,我們的動(dòng)態(tài)行人檢測(cè)器采用了Viola等人于2002年7月22日所申請(qǐng)的美國(guó)專(zhuān)利申請(qǐng)系列號(hào)10/200,726“ObjectRecognition System”中所述的矩形過(guò)濾器200,該申請(qǐng)?jiān)诖俗鳛閰⒖肌?br>
圖2F示出了相對(duì)于封閉檢測(cè)窗201(本例組合圖像202中有8個(gè)檢測(cè)窗)的矩形過(guò)濾器200。應(yīng)當(dāng)注意,有幾萬(wàn)種其他簡(jiǎn)單的矩形過(guò)濾器結(jié)構(gòu)可以使用。這些過(guò)濾器可具有不同的尺寸,以便與檢測(cè)窗的尺寸匹配。對(duì)于兩個(gè)矩形過(guò)濾器情況,可從將陰影矩形中的像素的強(qiáng)度總和減去無(wú)陰影矩形中的像素的強(qiáng)度總和。對(duì)于三個(gè)矩形過(guò)濾器情況,可將無(wú)陰影矩形中的像素的總和乘以2,以計(jì)算出陰影像素的兩倍,依次類(lèi)推。利用根據(jù)本發(fā)明的過(guò)濾器,還可以使用其他組合功能。我們優(yōu)先選擇我們的過(guò)濾器的簡(jiǎn)單操作,因?yàn)檫@些過(guò)濾器與現(xiàn)有技術(shù)的更復(fù)雜的過(guò)濾器相比評(píng)估起來(lái)很快。
Viola等人使用了矩形過(guò)濾器,用于檢測(cè)單個(gè)圖像中的靜態(tài)面部。我們以?xún)煞N方式延伸了將他們的工作。第一,我們還使用了其內(nèi)部構(gòu)成是對(duì)角線排列的矩形過(guò)濾器,參見(jiàn)圖2E。對(duì)角線過(guò)濾器其優(yōu)點(diǎn)是適合于檢測(cè)象腿部動(dòng)作那樣的擺動(dòng)。此外,對(duì)角線過(guò)濾器對(duì)不同取向的對(duì)象也敏感。對(duì)角線的角度可以由過(guò)濾器內(nèi)的組成矩形的縱橫比來(lái)控制。第二,我們將過(guò)濾器應(yīng)用于時(shí)間移位圖像的組合,如下所述。取決于其設(shè)計(jì),這些矩形過(guò)濾器可以按不同比例、取向和縱橫比非常快地進(jìn)行評(píng)估,以測(cè)量區(qū)域平均值。盡管這些過(guò)濾器好像有些限制,然而,顯然它們提供了一些便于對(duì)特定活動(dòng)對(duì)象(比如行人)進(jìn)行精確檢測(cè)的有用信息。
形式上,我們的過(guò)濾器、特征和分類(lèi)器的操作定義如下(其他細(xì)節(jié)參見(jiàn)Viola等人的描述)。圖像特征hi(x)按 被賦予權(quán)重αj或βj,其中,過(guò)濾器fj(x)是圖像x(即檢測(cè)窗)的線性函數(shù),而θj是預(yù)定過(guò)濾器閾值。累積和C(x)按 被賦予值1或0,其中,hj是圖像x的多個(gè)特征,而T是預(yù)定分類(lèi)器閾值。同時(shí)考慮外觀和動(dòng)作的定義如下所述。
在現(xiàn)有技術(shù)中,動(dòng)作信息按不同方式(包括光流量和塊動(dòng)作估算)從圖像對(duì)中提取。塊動(dòng)作估算需要比較窗的規(guī)格,這決定了估算的比例。這與多比例對(duì)象檢測(cè)完全不兼容。在對(duì)象檢測(cè)情況下,光流量估算通常很耗時(shí),因?yàn)槊恳幌袼囟夹枰习倩蛏锨l操作。我們要求更快一些。
盡管已利用矩形過(guò)濾器確定分類(lèi)器的特征值描述了本發(fā)明,然而,應(yīng)當(dāng)理解還可以使用其他類(lèi)型的過(guò)濾器。例如,可以用其他線性或非線性過(guò)濾器(比如蓋博過(guò)濾器或高斯過(guò)濾器)來(lái)代替矩形過(guò)濾器。矩形過(guò)濾器的優(yōu)點(diǎn)在于,它們從計(jì)算角度上講評(píng)估起來(lái)很有效。然而,其他類(lèi)型的過(guò)濾器有可能捕捉到更復(fù)雜的動(dòng)作和外觀信息,因此也可能有其優(yōu)點(diǎn),參見(jiàn)Daugman,“Uncertainty Relation for Resolution inSpace,Spatial Frequency,and Orientation Optimized byTwo-Dimensional Visual Cortical Filters,”J.Opt.Soc.Am.A,vol 2,no 7,pp 1160-1169,July 1985。
組合圖像因此,如圖3A-3H中所示,我們的特征不同于Viola等人所述的那些特征,是對(duì)組合圖像組121進(jìn)行操作??梢酝ㄟ^(guò)對(duì)所選圖像111應(yīng)用不同的功能102來(lái)確定組合圖像組。例如,所選圖像組包括連續(xù)圖像對(duì)、不相交圖像對(duì)或重疊圖像對(duì)。此外,這個(gè)組還可以包括預(yù)定時(shí)間段上的每間隔9個(gè)的圖像,或者這個(gè)組還可以包括三個(gè)一組的圖像。在所選圖像111中還可能采用其他組合和時(shí)間排序。
功能102在應(yīng)用于所選圖像111時(shí),得到一個(gè)“組合”圖像。例如,該功能可以只選擇該組中的一個(gè)圖像,如圖3A。這一功能可以彼此減去該組中的所選圖像。在這種情況下,這樣的組合圖像稱(chēng)之為差或Δ圖像,如圖3B。組合圖像中差的絕對(duì)值的和為非零的區(qū)域(例如沿對(duì)象邊緣)相應(yīng)于動(dòng)作。如下所述,還可以確定動(dòng)作的幅度和方向。
可以通過(guò)對(duì)所選圖像111應(yīng)用其他功能102來(lái)確定動(dòng)作的方向。例如,該功能在做差操作之前可以對(duì)組中的圖像進(jìn)行“移位”。這種移位可以是線性的、旋轉(zhuǎn)的、按比例的或它們的組合,以檢測(cè)例如實(shí)質(zhì)上在圖像平面中的線性運(yùn)動(dòng)、環(huán)形運(yùn)動(dòng)或?qū)嵸|(zhì)上與圖像平面垂直的運(yùn)動(dòng)。圖3C和3D示出了上(U)和下(D)移位的圖像,圖3E和3F示出了左(L)和右(R)移位的圖像,圖3G示出了旋轉(zhuǎn)()的圖像,而圖3H示出了按比例(s)的移位。這組功能可表示為
a.I=It|It+1Δ=abs(It-It+1),U=abs(ItIt+1↑),D=abs(It-II+1↓),L=abs(It-It+1←),R=abs(It-It+1→),C=abs(It-It+1),s=abs(It-It+1s),其中,It和It+1是隨著時(shí)間的圖像,另外,箭頭表示線性移位操作,是旋轉(zhuǎn),而s表示按比例。移位可以是一個(gè)或多個(gè)像素。應(yīng)當(dāng)注意,其他差及其他移位操作也是可能的,只是上述例子針對(duì)我們的用途來(lái)說(shuō)計(jì)算起來(lái)簡(jiǎn)單快捷而已。
一種動(dòng)作特征根據(jù)fi=ri(Δ)-ri(S)對(duì)差圖像Δ與集合{U,L,R,D,,s}中的一個(gè)或多個(gè)移位圖像之間的絕對(duì)差值的和進(jìn)行比較,其中,S是{U,L,R,D,,s}之一,ri是檢測(cè)窗內(nèi)的和。這些特征提取出與特定區(qū)域正以給定方向移動(dòng)的可能性相關(guān)的信息。
另一種動(dòng)作特征根據(jù)fj=фj(S)對(duì)同一圖像內(nèi)的和進(jìn)行比較,其中,фj是像圖2A-2F中所示的例子那樣的過(guò)濾器。這些特征近似于測(cè)量動(dòng)作修剪。
另一種動(dòng)作特征按照f(shuō)k=rk(S)測(cè)量運(yùn)動(dòng)圖像之一的動(dòng)作幅度。
動(dòng)作幅度還可以由組中的圖像之間的時(shí)間差來(lái)確定。
我們還可以利用外觀特征,這些特征使用根據(jù)fm=ф(It)對(duì)組中單個(gè)圖像進(jìn)行操作的過(guò)濾器。
應(yīng)當(dāng)注意,一旦在圖像的某一區(qū)域中檢測(cè)到活動(dòng)對(duì)象,就有可能跟蹤后續(xù)圖像中的對(duì)象,以便更好地理解動(dòng)作的幅度和方向。由于活動(dòng)對(duì)象的位置是知道的,因此,只需要評(píng)估少部分后續(xù)圖像,這可以以快得多的幀速率來(lái)完成。
這些動(dòng)作特征以及外觀信息可以利用功能{It,Δ,U,D,L,R,,s}中的“綜合圖像”進(jìn)行快速評(píng)估。由于過(guò)濾器可以具有任何尺寸、縱橫比或取向,因此,只要它們符合檢測(cè)窗,就有很多種可能的動(dòng)作和外觀特征。過(guò)濾器還可以按不同的尺寸來(lái)定標(biāo)。所有這些都可以存儲(chǔ)在緩存器中以便快速處理。在訓(xùn)練期間,可以選擇最能區(qū)分肯定例子與否定例子的特征。
動(dòng)作特性131 Fj為 而累積分141為 圖像錐為了支持多比例檢測(cè),功能102{↑,↓,←,→,,s}根據(jù)檢測(cè)比例來(lái)定義。這就可以保證按比例不變的方式來(lái)測(cè)量動(dòng)作速率。比例不變性可以在訓(xùn)練期間通過(guò)按基本分辨率20×15像素定標(biāo)訓(xùn)練圖像來(lái)取得。檢測(cè)的比例不變性通過(guò)對(duì)圖像錐進(jìn)行操作來(lái)取得。最初,計(jì)算It和It+1的錐。{Δ,U,D,L,R,,s}的錐表示計(jì)算如下Δl=abs(Ilt-Ilt+1),Ul=abs(Ilt-Ilt+1↑),Dl=abs(Ilt-Ilt+1↓),Ll=abs(Ilt-Ilt+1←),Rl=abs(Ilt-Ilt+1→),1=abs(Ilt-Ilt+1),和sl=abs(Ilt-Ilt+1s),其中,Xl是指錐的第l級(jí)。從定標(biāo)為20×15訓(xùn)練圖像學(xué)習(xí)到的分類(lèi)器和特征按比例不變的方式對(duì)錐的每一級(jí)進(jìn)行操作。
訓(xùn)練訓(xùn)練過(guò)程利用Adaboost來(lái)選擇特征子集并構(gòu)造分類(lèi)器。Adaboost提供了一種有效學(xué)習(xí)算法和通用性能的強(qiáng)界限,參見(jiàn)Freund ea a1.,“A decision-theoretic generalization of on-line learning andapplication to boosting,”Computational Learning Theory,Eurocolt’95,pages 23-37.,Springer-Verlag,1995;Schapire et al.,“Boosting the marginA new explanation for the effectiveness ofvoting methods,”P(pán)roceedings of the Fourteenth InternationalConference on Machine Learning,1997;和Tieu et al.,“Boostingimage retrieval,”International Conference on Computer Vision,2000。
發(fā)明的效果本發(fā)明提供了一種用于檢測(cè)視頻序列中的活動(dòng)對(duì)象的方法。該方法利用了矩形過(guò)濾器,通過(guò)組合圖像對(duì)這種過(guò)濾器進(jìn)行掃描以確定組合圖像的特征??傆?jì)這些特征,以檢測(cè)諸如行人之類(lèi)的特定活動(dòng)對(duì)象。
盡管本發(fā)明利用幾例優(yōu)選實(shí)施方式進(jìn)行了描述,然而,應(yīng)當(dāng)理解,在本發(fā)明的思想和范圍內(nèi)可以作出其他不同的變動(dòng)和修改。因此,附屬權(quán)利要求書(shū)的目的在于,覆蓋本發(fā)明的真實(shí)思想和范圍內(nèi)的所有這些變化和修改。
權(quán)利要求
1.一種用于檢測(cè)視頻的圖像時(shí)間序列中的活動(dòng)對(duì)象的方法,包括從時(shí)間排序的圖像序列中選擇圖像;對(duì)所選圖像應(yīng)用一組功能,以產(chǎn)生一組組合圖像;在所述組合圖像組中的檢測(cè)窗上評(píng)估過(guò)濾器的線性組合,以確定該檢測(cè)窗的動(dòng)作和外觀特征;總計(jì)所述動(dòng)作和外觀特征,以確定累積分;和當(dāng)該累積分大于預(yù)定閾值時(shí),將該檢測(cè)窗分類(lèi)為含有活動(dòng)對(duì)象的檢測(cè)窗。
2.權(quán)利要求1的方法,其中,活動(dòng)對(duì)象是行人。
3.權(quán)利要求1的方法,其中,所選圖像是一對(duì)相鄰的圖像。
4.權(quán)利要求1的方法,其中,針對(duì)整個(gè)視頻重復(fù)進(jìn)行所述選擇、應(yīng)用、評(píng)估、總計(jì)和分類(lèi)。
5.權(quán)利要求1的方法,還包括將每一組合圖像分割成一組檢測(cè)窗;和針對(duì)每一檢測(cè)窗重復(fù)進(jìn)行所述評(píng)估、總計(jì)和分類(lèi)。
6.權(quán)利要求1的方法,其中,特定過(guò)濾器的內(nèi)部部件是矩形的并且是以對(duì)角線排列的。
7.權(quán)利要求6的方法,其中,使每一矩形過(guò)濾器的尺寸與相關(guān)的檢測(cè)窗匹配。
8.權(quán)利要求1的方法,其中,特定特征hj按 被評(píng)估為權(quán)重αj或βj,其中,特定過(guò)濾器fj(x)是檢測(cè)窗x的線性函數(shù),而θj是預(yù)定過(guò)濾器閾值。
9.權(quán)利要求8的方法,其中,特定累積和C(x)按 被賦予值1或0,其中,hj是檢測(cè)窗x的多個(gè)評(píng)估特征,而T是預(yù)定分類(lèi)器閾值。
10.權(quán)利要求1的方法,其中,特定組合圖像是所選圖像的差。
11.權(quán)利要求1的方法,其中,特定組合圖像是移位的所選圖像的差。
12.權(quán)利要求11的方法,其中,移位是線性的。
13.權(quán)利要求11的方法,其中,移位是旋轉(zhuǎn)的。
14.權(quán)利要求11的方法,其中,移位是按比例的。
15.權(quán)利要求1的方法,其中,所述功能組根據(jù)檢測(cè)窗的比例來(lái)定義。
16.權(quán)利要求1的方法,還包括確定活動(dòng)對(duì)象的動(dòng)作方向。
17.權(quán)利要求1的方法,還包括確定活動(dòng)對(duì)象的動(dòng)作幅度。
18.權(quán)利要求1的方法,其中,過(guò)濾器是矩形過(guò)濾器。
19.權(quán)利要求19的方法,其中,過(guò)濾器是線性的。
20.權(quán)利要求1的方法,其中,過(guò)濾器是非線性的。
全文摘要
一種方法檢測(cè)圖像時(shí)間序列中的活動(dòng)對(duì)象。從時(shí)間排序的圖像序列中選擇圖像。對(duì)所選圖像應(yīng)用一組功能,以產(chǎn)生一組組合圖像。對(duì)組合圖像組中的檢測(cè)窗應(yīng)用過(guò)濾器的線性組合,以確定檢測(cè)窗的動(dòng)作和外觀特征。總計(jì)動(dòng)作和外觀特征,以確定累積分,這使得可以將檢測(cè)窗分類(lèi)為含有活動(dòng)對(duì)象的檢測(cè)窗。
文檔編號(hào)G06K9/46GK1698069SQ20048000054
公開(kāi)日2005年11月16日 申請(qǐng)日期2004年5月31日 優(yōu)先權(quán)日2003年6月17日
發(fā)明者保羅·A·維奧拉, 邁克·J·瓊斯 申請(qǐng)人:三菱電機(jī)株式會(huì)社