專利名稱:分類器生成裝置和方法、視頻檢測裝置和方法及視頻監(jiān)控系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及目標識別領(lǐng)域,尤其涉及一種生成用于識別交互運動軌跡的分類器的裝置和方法、視頻檢測裝置和方法及視頻監(jiān)控系統(tǒng)。
背景技術(shù):
隨著技術(shù)的發(fā)展以及硬件設(shè)備價格的逐漸降低,大量的監(jiān)控攝像頭被安裝到各種場合,特別是那些對安全要求敏感的場合,如機場、社區(qū)、銀行、停車場、軍事基地等。動態(tài)場景的視覺監(jiān)控是近年來備受關(guān)注的前沿研究方向。例如,從攝像機捕捉的圖像序列中分析和理解運動目標的行為,并對異常行為進行報警。行為檢測是智能視覺監(jiān)控的重要功能。基于軌跡的事件檢測,能夠長時間分析目標的行為,從而可以有效的預(yù)測和判斷目標的行為。目前已經(jīng)有較多算法對基于軌跡的行為檢測進行了研究。例如,一種方法通過構(gòu)建4維直方圖來描述軌跡的特征,這種方式可以將不同長度的軌跡歸一化到相同的長度。而另一種方法通過訓練支持向量機來獲取異常軌跡檢測的模型。另外,也可以用多級聚類的方法獲取更準確的用于描述軌跡的模型。
發(fā)明內(nèi)容
上述方法能有效地對運動軌跡進行檢測,但目前類似的方法都只能分析獨立的軌跡,并不能對交互運動軌跡進行分析。本發(fā)明的目的是提供一種生成用于識別交互運動軌跡的分類器的裝置和方法、能夠?qū)换ミ\動軌跡進行檢測的視頻檢測裝置和方法及視頻監(jiān)控系統(tǒng)。本發(fā)明的一個實施例是一種用于生成用于識別交互運動軌跡的分類器的裝置,包括:軌跡提取部分,用于從分別多個視頻的每一個中提取至少兩個運動對象的交互運動軌跡;軌跡分類部分,用于根據(jù)運動對象之間的交互關(guān)系對每個視頻中的交互運動軌跡進行分類;軌跡估計部分,用于針對每個視頻的交互運動軌跡,根據(jù)相應(yīng)分類估計交互運動軌跡中包含的單運動對象運動軌跡的集合;特征生成部分,用于針對每個集合,生成包含描述集合的各個單運動對象運動軌跡的特征的特征向量;以及分類器生成部分,用于針對每個分類生成的相應(yīng)特征向量,生成用于識別對應(yīng)于分類的交互運動軌跡的分類器。本發(fā)明的另一個實施例是一種視頻檢測裝置,用于對視頻圖像中至少兩個運動對象的交互運動軌跡進行分析識別,視頻檢測裝置包括:軌跡提取部分,用于從待檢測視頻中提取至少兩個運動對象的交互運動軌跡;軌跡分類部分,用于根據(jù)所述運動對象之間的交互關(guān)系對所述交互運動軌跡進行分類;軌跡估計部分,用于根據(jù)相應(yīng)分類對所述交互運動軌跡中包含的單運動對象運動軌跡的集合進行估計;特征生成部分,用于生成包含描述集合的各個單運動對象運動軌跡的特征的特征向量;以及特征比較部分,用于將特征向量與預(yù)先建立的軌跡模型進行比較,以對所述交互運動軌跡進行識別。本發(fā)明的另一個實施例是一種視頻監(jiān)控系統(tǒng),包括:攝像機,用于產(chǎn)生監(jiān)控視頻,作為待檢測視頻;以及視頻檢測裝置,用于對待檢測視頻圖像中至少兩個運動對象的交互運動軌跡進行分析識別。所述視頻檢測裝置包括:軌跡提取部分,用于從待檢測視頻中提取至少兩個運動對象的交互運動軌跡;軌跡分類部分,用于根據(jù)所述運動對象之間的交互關(guān)系對所述交互運動軌跡進行分類;軌跡估計部分,用于根據(jù)相應(yīng)分類對所述交互運動軌跡中包含的單運動對象運動軌跡的集合進行估計;特征生成部分,用于生成包含描述所述集合的各個單運動對象運動軌跡的特征的特征向量;以及特征比較部分,用于將所述特征向量與預(yù)先建立的軌跡模型進行比較,以對所述交互運動軌跡進行識別。本發(fā)明的另一個實施例是一種生成用于識別交互運動軌跡的分類器的方法,包括:從多個視頻的每一個中提取至少兩個運動對象的交互運動軌跡;根據(jù)運動對象之間的交互關(guān)系對每個視頻中的交互運動軌跡進行分類;針對每個視頻的交互運動軌跡,根據(jù)相應(yīng)分類估計交互運動軌跡中包含的單運動對象運動軌跡的集合;針對每個集合,生成包含描述集合的各個單運動對象運動軌跡的特征的特征向量;以及針對每個分類生成的相應(yīng)特征向量,生成用于識別對應(yīng)于分類的交互運動軌跡的分類器。本發(fā)明的另一個實施例是一種視頻檢測方法,用于對視頻圖像中至少兩個運動對象的交互運動軌跡進行分析識別,該視頻檢測方法包括:從待檢測視頻中提取至少兩個運動對象的交互運動軌跡;根據(jù)運動對象之間的交互關(guān)系對交互運動軌跡進行分類;根據(jù)相應(yīng)分類對交互運動軌跡中包含的單運動對象運動軌跡的集合進行估計;生成包含描述集合的各個單運動對象運動軌跡的特征的特征向量;以及將特征向量與預(yù)先建立的軌跡模型進行比較,以對交互運動軌跡進行識別。在應(yīng)用本發(fā)明的實施例時,可以通過首先對交互運動軌跡按照不同的交互方式進行分類,然后對每種交互方式分別進行交互運動軌跡建模。在測試中,也可以首先對檢測出的交互運動軌跡按交互方式進行分類,然后可以根據(jù)交互軌跡的不同類別分別用不同的模型檢測該軌跡。從而,能夠有效地對視頻圖像中運動對象的交互運動軌跡進行檢測和分析。
參照下面結(jié)合附圖對本發(fā)明實施例的說明,會更加容易地理解本發(fā)明的以上和其它目的、特點和優(yōu)點。在附圖中,相同的或?qū)?yīng)的技術(shù)特征或部件將采用相同或?qū)?yīng)的附圖標記來表示。在附圖中不必依照比例繪制出單元的尺寸和相對位置。圖1是示出根據(jù)本發(fā)明實施例的分類器生成裝置的示例結(jié)構(gòu)的框圖。圖2是示出根據(jù)本發(fā)明實施例的具有不同分類的交互關(guān)系的交互運動軌跡的示意圖。圖3是示出根據(jù)本發(fā)明實施例的從交互運動軌跡估計出的單運動對象運動軌跡的集合的示意圖。圖4是示出根據(jù)本發(fā)明實施例的特征生成部分的示例性結(jié)構(gòu)的框圖。圖5是示出從交互運動軌跡得到描述該軌跡的特征向量的過程中的各步結(jié)果的示意圖。圖6是示出根據(jù)本發(fā)明實施例的生成用于識別運動軌跡的分類器的方法的流程圖。圖7是示出根據(jù)本發(fā)明實施例的視頻檢測裝置的示例性結(jié)構(gòu)的框圖。
圖8是示出根據(jù)本發(fā)明實施例的視頻檢測方法的流程圖。圖9是示出實現(xiàn)本發(fā)明的計算機的示例性結(jié)構(gòu)的框圖。
具體實施例方式下面參照附圖來說明本發(fā)明的實施例。應(yīng)當注意,為了清楚的目的,附圖和說明中省略了與本發(fā)明無關(guān)的、本領(lǐng)域技術(shù)人員已知的部件和處理的表示和描述。圖1是示出根據(jù)本發(fā)明實施例的分類器生成裝置100的示例性結(jié)構(gòu)的框圖。分類器生成裝置100可以包括:軌跡提取部分101、軌跡分類部分102、軌跡估計部分103、特征生成部分104和分類器生成部分105。軌跡提取部分101用于從多個視頻的每一個中提取至少兩個運動對象的交互運動軌跡。根據(jù)需要,可以在已捕獲的視頻中按照一定的時間間隔截取或人工選定多個視頻,以作為用于生成用于識別運動軌跡的分類器的視頻樣本。本申請研究發(fā)生交互的運動對象所形成的交互運動軌跡,其中,“運動對象的交互”指的是運動對象的合并以及分裂,當然,運動對象的運動軌跡也會相應(yīng)的發(fā)生交互(合并與分裂)而形成交互運動軌跡,所以每個視頻樣本包含的至少一部分圖像中同時存在兩個、甚至更多個運動對象。軌跡提取部分101從該多個視頻的每一個中提取至少兩個運動對象的交互運動軌跡。所提取運動軌跡的數(shù)目可以依視頻中的運動對象的數(shù)目決定?;蛘撸崛∵\動軌跡的數(shù)目可以依軌跡提取部分的預(yù)先設(shè)置決定,例如,根據(jù)訓練樣本的數(shù)量多寡,預(yù)先設(shè)定提取每個視頻中的前若干條軌跡或者全部軌跡。在一個實施例中,軌跡提取部分101可以首先對視頻圖像的場景中的運動對象進行檢測,并且對檢測出的運動對象進行跟蹤,以獲得每個運動對象的運動軌跡。例如,在視頻圖像中檢測運動對象的方法可以采用2009年12月3日在中國專利局提交的申請?zhí)枮?00910251356.1、發(fā)明名稱為“圖像處理設(shè)備和圖像處理方法”的中國專利申請中公開的技術(shù)。此外,可以使用“Pankaj Kumar,Surendra Ranganath,Kuntal Sengupta,and Huang Weimin〃 CooperativeMultitarget Tracking With Efficient Split and Merge Handling ".1EEEtransactions on circuits and systems for video technology, vol.16, n0.12,Dec.2006”中提到的方法來獲得運動對象的運動軌跡。該方法在給出軌跡坐標和時間信息的同時,能夠給出多條軌跡的交互信息,即多個運動對象的交互關(guān)系,諸如軌跡/運動對象的分裂以及合并的信息,進而可以獲得交互運動軌跡。當然,上述方法只是示例性的,軌跡提取部分101可以使用任何可行的方法來對運動對象的交互運動軌跡進行提取。需要注意的是,某些軌跡提取方法可能無法直接給出多條軌跡的交互信息,但本領(lǐng)域技術(shù)人員可進一步根據(jù)所提取到的軌跡形狀、具體時間點上軌跡間的距離來獲知多條軌跡的交互信息(運動對象的交互關(guān)系),并進一步獲得交互運動軌跡。軌跡分類部分102用于根據(jù)軌跡提取部分101所提取交互運動軌跡涉及的運動對象之間的交互關(guān)系對每個視頻的運動軌跡進行分類。所提取交互運動軌跡涉及的運動對象之間的交互關(guān)系包括,交互運動軌跡涉及的運動對象數(shù)目以及它們之間的合并和分裂的次數(shù)及順序。軌跡分類部分102將得到的所有交互運動軌跡進行分類。具體地,將交互運動軌跡按照其涉及的運動對象數(shù)目以及分裂和合并的次數(shù)和順序分為不同的交互運動軌跡種類。下面以兩個運動對象為例,解釋運動對象的運動軌跡、交互運動軌跡以及運動對象的合并和分裂的含義。如上面所說明的,要獲得運動對象的運動軌跡,首先要通過前景識別等技術(shù)識別出視頻圖像中的運動對象,然后在一定時間內(nèi)對該運動對象的運動進行跟蹤,以得到相應(yīng)的運動軌跡。在慣用技術(shù)中,所識別的運動對象以視頻圖像中的運動塊(motion blob)表示。而所獲得的運動軌跡至少包含運動塊的時間和位置信息。換句話說,運動軌跡描述運動塊在各個時間點在視頻圖像中的位置。在某些實施例中,所獲得的運動軌跡還包含運動塊的運動狀態(tài)信息,諸如速度信息和/或加速度信息。當原本分離的兩個運動塊,經(jīng)過各自的運動軌跡,在某一時刻匯合為一個運動塊,并在之后的時間里作為一個運動塊繼續(xù)運動時,稱這兩個運動塊“合并”,或者稱這兩個運動對象的運動軌跡合并。此外,當一個運動塊在某一時刻分離為兩個運動塊,且這兩個運動塊沿著各自的軌跡繼續(xù)運動時,稱這兩個運動塊“分裂”,或者稱這兩個運動對象的運動軌跡分裂。具有三個或三個以上運動對象時,也可以類似地對運動對象的“合并”和“分裂”進行定義。概括地說,運動塊的交互即表現(xiàn)為運動塊在運動過程中發(fā)生在某一時刻某一位置之后的數(shù)量的增加或減少。運動塊的“合并”即運動塊在某一時刻某一位置(匯合點)之后數(shù)量減少。而運動塊的“分裂”即運動塊在某一時刻某一位置(分離點)之后數(shù)量增加。若視頻中的某個運動對象自始至終的沒有發(fā)生分裂,也沒有和其它運動對象發(fā)生合并,則該運動對象的運動軌跡被稱為“獨立運動軌跡”,反之,則稱為“交互運動軌跡”。圖2是示出根據(jù)本發(fā)明實施例的具有不同分類的交互運動軌跡的示意圖。其示出的是在軌跡提取部分101中提取了兩個運動對象的交互運動軌跡的情況。圖2的(a)是具有“合并”關(guān)系的運動對象的交互運動軌跡的示意圖??梢钥闯?,在兩個運動對象的兩條軌跡的匯合點之后,運動對象數(shù)目減為一個,軌跡條數(shù)減為一條。圖2的(b)是具有“分裂”關(guān)系的運動對象的交互運動軌跡的示意圖??梢钥闯?,在軌跡的分離點之后,運動對象數(shù)目增加為兩個,一條軌跡變?yōu)閮蓷l軌跡。而圖2的(c)是具有“先合并再分裂”關(guān)系的運動對象的交互運動軌跡的示意圖。當然,交互運動軌跡的種類不限于此,也可以是合并和分裂的不同順序和次數(shù)的其它組合。回到圖1。軌跡估計部分103用于針對每個視頻的交互運動軌跡,根據(jù)相應(yīng)分類對運動軌跡中包含的單運動對象運動軌跡的集合進行估計。如前所述的,交互運動軌跡必然伴隨著運動對象和軌跡的合并或者分裂,在合并后或者分裂前的軌跡段實際上是復合了多個運動對象(因速度相同、位置接近而被檢測為一個運動對象)的運動軌跡,因此,可以對交互運動軌跡進行拆分,從而從中分離出多個可能的單運動對象運動軌跡,形成單運動對象運動軌跡的集合。對于不同分類的交互運動軌跡,其對應(yīng)的可能的單運動對象運動軌跡不同,拆分方式也不同,因此需要根據(jù)該分類對交互運動軌跡中包含的單運動對象運動軌跡進行估計,從而拆分出各個單運動對象運動軌跡,得到上述集合。圖3是示出根據(jù)本發(fā)明實施例的從交互運動軌跡估計出的單運動對象運動軌跡的集合的示意圖。圖3的(a)示出軌跡估計部分103對具有“合并”關(guān)系的運動對象的交互運動軌跡進行估計,從而得出的相對應(yīng)的單運動對象運動軌跡的集合。圖3的(b)示出軌跡估計部分103對具有“分裂”關(guān)系的運動對象的交互運動軌跡進行估計,從而得出的相對應(yīng)的單運動對象運動軌跡的集合。圖3的(c)示出軌跡估計部分103對具有“先合并再分裂”關(guān)系的運動對象的交互運動軌跡進行估計,從而得出的相對應(yīng)的單運動對象運動軌跡的集合。從某一特定種類的交互運動軌跡所能估計得出的單運動對象運動軌跡的集合可以是預(yù)先設(shè)定在軌跡估計部分103中的。軌跡估計部分103可以依據(jù)該設(shè)定來將特定種類的交互運動軌跡拆分為相應(yīng)的單運動對象運動軌跡集合。雖然如圖3的(a)-(c)所示,所估計(所預(yù)設(shè))的單運動對象運動軌跡集合包含了交互運動軌跡所有可能的拆分方式,但是可以理解:也可以只預(yù)設(shè)部分可能的拆分方式,作為將估計出的單運動對象運動軌跡。例如,根據(jù)具體的應(yīng)用場景,交互運動軌跡的所有可能拆分方式中,有一些拆分方式得到的單運動運動對象軌跡實際發(fā)生的概率非常低,那么就可以通過預(yù)設(shè)排除掉這樣的拆分方式,從而節(jié)約運算資源。特征生成部分104用于針對每個集合,生成包含描述集合的各個單運動對象運動軌跡的特征的特征向量。在一個實施例中,特征生成部分104首先對每個集合中的各個單運動對象運動軌跡進行特征描述,再將這些特征描述拼接起來,從而得到相應(yīng)交互運動軌跡的特征向量。例如,圖4是示出根據(jù)本發(fā)明實施例的特征生成部分104的示例性結(jié)構(gòu)的框圖。在圖4所示的實施例中,特征生成部分104可以包括擬合部分401以及拼接部分402。擬合部分401可以用于使用相同維數(shù)的特征來描述各個單運動對象運動軌跡。拼接部分402可以用于對每一個單運動對象運動軌跡的特征描述結(jié)果進行拼接,以使用拼接的結(jié)果來生成描述每個視頻的交互運動軌跡的特征的特征向量。拼接部分402可以采用本領(lǐng)域已知的各種特征向量的組合、拼接方法。使用相同維數(shù)的特征來描述各個單運動對象運動軌跡的優(yōu)點是使得能夠進行各運動軌跡之間的距離的測量,并且便于屬于特定種類的多個交互運動軌跡之間的比較。在一個實施例中,擬合部分401可以采用cubic B-spline曲線來擬合各單運動對象運動軌跡。利用cubic B-spline曲線去擬合單運動對象運動軌跡可以使每條單運動對象運動軌跡獲得相同維數(shù)的特征描述。關(guān)于cubic B-spline曲線,可以參見R.R.Sillito和 R.B.Fisher 的“Sem1-supervised Learning for Anomalous Trajectory Detection,,.BMVC 2008中的描述。對于交互運動軌跡,拼接部分402將每條單運動對象運動軌跡的cubic B-spline擬合結(jié)果進行拼接,并用拼接后的結(jié)果共同描述交互運動軌跡。在一個實施例中,cubicB-spline的擬合點為7,而經(jīng)過最簡單的向量拼接,拼接結(jié)果的維數(shù)為7 X單運動對象運動軌跡的條數(shù)。但拼接部分402可以采用本領(lǐng)域公知的任何向量拼接方法來獲得描述交互運動軌跡的特征向量。圖5是示出從交互運動軌跡得到描述該軌跡的特征向量的過程中的各步結(jié)果的示意圖。首先,軌跡估計部分103對交互運動軌跡進行估計,以從所估計的交互運動軌跡得到如圖3右側(cè)所示的估計的單運動對象運動軌跡,即圖5中所示單運動對象運動軌跡
1...η。然后,特征生成部分104中的擬合部分401使用相同維數(shù)的特征來描述各個單運動對象運動軌跡1...η,從而從單運動對象運動軌跡1...η得到分別描述單運動對象運動軌跡1...η的軌跡特征描述1...η。然后,拼接部分402對每一個單運動對象運動軌跡1...η的特征描述結(jié)果軌跡特征描述1...η進行拼接,從而根據(jù)軌跡特征描述1...η生成描述每個視頻的交互運動軌跡的特征的特征向量。回到圖1,分類器生成裝置100的分類器生成部分105針對每個分類生成的相應(yīng)特征向量,生成用于識別對應(yīng)于分類的交互運動軌跡的分類器。分類器生成部分105可以以已知的各種方式,利用在特征生成部分104中生成的運動軌跡的特征向量生成分類器。在一個實施例中,通過對每種分類的交互運動軌跡特征向量進行聚類來構(gòu)建描述交互運動軌跡的模型。例如,分類器生成部分105對不同分類的交互運動軌跡分別進行聚類,以構(gòu)建用于描述每個視頻中特定類型的交互運動軌跡的模型,從而生成識別運動軌跡的分類器。在一個實施例中,分類器生成部分105可以采用分層聚類的方法來構(gòu)建交互運動軌跡的模型。在每層的聚類過程中,例如,可以用TSC準則自動確定聚類中心的數(shù)量。在聚類結(jié)束后,可以用特征的均值和方差來描述每個聚類的模式。關(guān)于TSC準則,可以參見 W.M.Hu, X.J.Xiao, Z.Y.Fu 等人的 “A system for Learning Statistical MotionPatterns,,,IEEE Transactions on Pattern Analysis and Machine Intelligence,vol.28,pp.1450-1464,2006。當然,聚類方式不限于分層聚類,也可是其它任何可行的聚類方式。下面對根據(jù)本發(fā)明實施例的生成用于識別交互運動軌跡的分類器的方法進行描述。圖6是示出根據(jù)本發(fā)明實施例的生成用于識別交互運動軌跡的分類器的方法的流程圖。如圖6所示,在步驟S601中,從多個視頻的每一個中提取至少兩個運動對象的交互運動軌跡。所提取運動軌跡的數(shù)目可以依視頻中的運動對象的數(shù)目決定?;蛘?,所提取運動軌跡的數(shù)目可以依軌跡提取部分的預(yù)先設(shè)置決定。可以首先對視頻圖像的場景中的運動對象進行檢測,并且對檢測出的運動對象進行跟蹤,以獲得每個運動對象的運動軌跡。此外,可以使用各種方法來提取運動對象的運動軌跡,從而獲得運動軌跡的坐標和時間信息,乃至交互運動軌跡及其涉及的運動對象的交互關(guān)系。在步驟S602中,根據(jù)所提取交互運動軌跡涉及的運動對象之間的交互關(guān)系對每個視頻的交互運動軌跡進行分類。所提取交互運動軌跡涉及的運動對象之間的交互關(guān)系包括所提取交互運動軌跡涉及的運動對象數(shù)目以及它們之間的合并和分裂的次數(shù)及順序。將提取的所有交互運動軌跡進行分類可以包括:將交互運動軌跡按照涉及的運動對象數(shù)目、分裂和合并的次數(shù)以及順序分為不同的交互運動軌跡種類。在步驟S603中,針對每個視頻的交互運動軌跡,根據(jù)其相應(yīng)分類對交互運動軌跡中包含的單運動對象運動軌跡的集合進行估計。從某一特定種類的交互運動軌跡所能估計得出的單運動對象運動軌跡的集合可以是預(yù)先設(shè)定的。在步驟S603中,可以依據(jù)該設(shè)定來得到針對特定種類的交互運動軌跡的單運動對象運動軌跡集合。在步驟S604中,針對每個集合,生成包含描述該集合的各個單運動對象運動軌跡的特征的特征向量。在一個實施例中,可以首先對每個集合中的各個單運動對象運動軌跡進行特征描述,然后,再將這些特征描述拼接起來,從而得到相應(yīng)交互運動軌跡的特征向量。也就是說,用這些特征描述來形成特征向量。具體來說,在一個實施例中,可以使用相同維數(shù)的特征來描述各個單運動對象運動軌跡。然后,可以對每一個單運動對象運動軌跡的特征描述結(jié)果進行拼接,以使用拼接的結(jié)果來生成描述每個視頻的交互運動軌跡的特征的特征向量。在步驟S605中,針對每個分類生成的相應(yīng)特征向量,生成用于識別對應(yīng)于該分類的交互運動軌跡的分類器。可以以已知的各種方式,利用生成的交互運動軌跡的特征向量來生成分類器。在一個實施例中,通過對每種種類的交互運動軌跡進行聚類來構(gòu)建描述交互運動軌跡的模型。例如,可以對不同分類的交互運動軌跡分別進行聚類,以構(gòu)建用于描述每個視頻中的交互運動軌跡的模型,從而生成識別交互運動軌跡的分類器。例如,可以使用TSC準則采用分層聚類的方法來構(gòu)建交互運動軌跡的模型。下面說明根據(jù)本發(fā)明實施例的視頻檢測裝置700。圖7是示出根據(jù)本發(fā)明實施例的視頻檢測裝置700的示例性結(jié)構(gòu)的框圖。視頻檢測裝置700用于對視頻圖像中至少兩個運動對象的交互運動軌跡進行分析識別,其包括:軌跡提取部分701、軌跡分類部分702、軌跡估計部分703、特征生成部分704以及特征比較部分705。軌跡提取部分701用于從待檢測視頻中提取至少兩個運動對象的交互運動軌跡。軌跡提取部分701所提取的交互運動軌跡的數(shù)目可以依視頻中的運動對象的數(shù)目決定?;蛘?,所提取運動軌跡的數(shù)目可以依軌跡提取部分的預(yù)先設(shè)置決定。所提取的運動軌跡上的信息可以包括運動對象在某一時刻的位置信息。進一步地,所提取的交互運動軌跡上的信息還可以包括狀態(tài)信息,即,運動對象在某一時刻的運動信息,例如,速度和加速度信息。軌跡分類部分702用于根據(jù)所提取交互運動軌跡涉及的運動對象之間的交互關(guān)系對所提取交互運動軌跡進行分類。所提取交互運動軌跡涉及的運動對象之間的交互關(guān)系包括所提取交互運動軌跡涉及的運動對象的數(shù)目以及它們之間的合并和分裂的次數(shù)及順序。軌跡分類部分702將提取的所有交互運動軌跡按照其涉及的運動對象數(shù)目,分裂和合并的次數(shù)以及順序分為不同的交互運動軌跡種類。軌跡估計部分703用于根據(jù)相應(yīng)分類對所提取交互運動軌跡中包含的所有可能的單運動對象運動軌跡的集合進行估計。從某一特定種類的交互運動軌跡所能估計得出的單運動對象運動軌跡的集合可以是預(yù)先設(shè)定的。軌跡估計部分703可以依據(jù)該設(shè)定來得到針對特定種類的交互運動軌跡的單運動對象運動軌跡集合。特征生成部分704用于生成包含描述集合的各個單運動對象運動軌跡的特征的特征向量。在一個實施例中,特征生成部分704首先對每個集合中的各個單運動對象運動軌跡進行特征描述,再將這些特征描述拼接起來,從而得到相應(yīng)交互運動軌跡的特征向量。例如,在一個實施例中,特征生成部分704可以包括:用于使用相同維數(shù)的特征來描述各個單運動對象運動軌跡的擬合部分;以及用于對每一個單運動對象運動軌跡的特征描述結(jié)果進行拼接,以使用拼接的結(jié)果來生成描述每個視頻的交互運動軌跡的特征的特征向量的拼接部分。該特征生成部分704的擬合部分可以采用cubic B-spline曲線來擬合各單運動對象運動軌跡。軌跡提取部分701、軌跡分類部分702、軌跡估計部分703和特征生成部分704的功能和結(jié)構(gòu)分別與分類器生成裝置100中的軌跡提取部分101、軌跡分類部分102、軌跡估計部分103和特征生成部分104的功能和結(jié)構(gòu)相同。因此,省略其詳細描述。
特征比較部分705用于將特征向量與預(yù)先建立的交互軌跡模型進行比較,以對所提取的交互運動軌跡進行識別。在視頻檢測裝置700檢測過程中,在獲得待檢測運動軌跡所屬交互運動軌跡種類以及該運動軌跡的特征描述后,可以將該待檢測運動軌跡與預(yù)先構(gòu)建的交互運動軌跡的模型進行比較,以獲得該運動軌跡的檢測結(jié)果。比較可以通過多種方式進行。例如但不限于:在一個實施例中,具體進行這樣的比較過程:設(shè)待檢測交互運動軌跡的特征描述為V= IviI i = 1...η},其中,Vi為第i維特征,η為特征的維數(shù)。并且,設(shè)某一聚類的描述為{M = {Ave, Var}, Ave = {AveJ , Var ={VarJ },其中M表示模型,Ave和Var表示聚類的均值和方差,Avei和Vari分別為第i維特征向量的均值和方差。當且僅當所有維特征均滿足abs (V1-AVei) ^VariX λ時,待檢測交互運動軌跡與聚類模型相匹配。其中,λ為置信度系數(shù)。λ取值例如可以在I至4之間,優(yōu)選可以在I至3之間。更優(yōu)選地,可以取λ = 2.5??梢允褂酶鶕?jù)本發(fā)明實施例的視頻檢測裝置與攝像機以及其它可選裝置一起組成根據(jù)本發(fā)明的視頻監(jiān)控系統(tǒng),以應(yīng)用于各種對安全要求敏感的場合,諸如機場、銀行、停車場等。當視頻檢測裝置從攝像機所拍攝的視頻中檢測到符合預(yù)先生成的模型的交互運動軌跡時,將指示檢測到符合模型的交互運動軌跡的信號發(fā)送到相應(yīng)裝置,以進行進一步處理。例如,當視頻檢測裝置檢測到異常運動軌跡時,向警報器發(fā)出指示檢測到異常運動軌跡的信號,觸發(fā)警報器報警??梢岳斫?,在某些情況下難以預(yù)先生成完備的異常運動軌跡模型,因此可以預(yù)先建立正常的交互軌跡模型,當視頻檢測裝置從攝像機所拍攝的視頻中檢測到不符合預(yù)先生成的模型的運動軌跡時,則將該運動軌跡識別為異常運動軌跡。圖8是示出根據(jù)本發(fā)明實施例的視頻檢測方法的流程圖。
在步驟S801中,從待檢測視頻中提取至少兩個運動對象的交互運動軌跡。在步驟S802中,根據(jù)所提取交互運動軌跡涉及的運動對象之間的交互關(guān)系對所提取交互運動軌跡進行分類。在步驟S803中,根據(jù)相應(yīng)分類對交互運動軌跡中包含的單運動對象運動軌跡的集合進行估計。在步驟S804中,生成包含描述集合的各個單運動對象運動軌跡的特征的特征向量。圖8中所示的步驟S801至S804可以采用與圖6中所示的步驟S601至S604相同的實現(xiàn)方式。因此,在此省略其詳細說明。在步驟S805中,將特征向量與預(yù)先建立的交互軌跡模型進行比較,以對所提取的交互運動軌跡進行識別。在獲得待檢測交互運動軌跡所屬交互運動軌跡種類以及該交互運動軌跡的特征描述后,可以將該待檢測交互運動軌跡與預(yù)先構(gòu)建的交互運動軌跡的模型進行比較,以獲得該交互運動軌跡的檢測結(jié)果??梢圆捎酶鞣N比較方式進行比較。下文中,參考圖9描述實現(xiàn)本發(fā)明的數(shù)據(jù)處理設(shè)備的計算機的示例性結(jié)構(gòu)。圖9是示出實現(xiàn)本發(fā)明的計算機的示例性結(jié)構(gòu)的框圖。在圖9中,中央處理單元(CPU)901根據(jù)只讀存儲器(R0M)902中存儲的程序或從存儲部分908加載到隨機存取存儲器(RAM) 903的程序執(zhí)行各種處理。在RAM 903中,也根據(jù)需要存儲當CPU 901執(zhí)行各種處理時所需的數(shù)據(jù)。CPU 901、ROM 902和RAM 903經(jīng)由總線904彼此連接。輸入/輸出接口 905也連接到總線904。下述部件連接到輸入/輸出接口 905:輸入部分906,包括鍵盤、鼠標等;輸出部分907,包括顯示器,諸如陰極射線管(CRT)、液晶顯示器(LCD)等,以及揚聲器等;存儲部分908,包括硬盤等;以及通信部分909,包括網(wǎng)絡(luò)接口卡諸如LAN卡、調(diào)制解調(diào)器等。通信部分909經(jīng)由網(wǎng)絡(luò)諸如因特網(wǎng)執(zhí)行通信處理。根據(jù)需要,驅(qū)動器910也連接到輸入/輸出接口 905??刹鹦督橘|(zhì)911諸如磁盤、光盤、磁光盤、半導體存儲器等根據(jù)需要被安裝在驅(qū)動器910上,使得從中讀出的計算機程序根據(jù)需要被安裝到存儲部分908中。在通過軟件實現(xiàn)上述步驟和處理的情況下,從網(wǎng)絡(luò)諸如因特網(wǎng)或存儲介質(zhì)諸如可拆卸介質(zhì)911安裝構(gòu)成軟件的程序。本領(lǐng)域的技術(shù)人員應(yīng)當理解,這種存儲介質(zhì)不局限于圖9所示的其中存儲有程序、與方法相分離地分發(fā)以向用戶提供程序的可拆卸介質(zhì)911。可拆卸介質(zhì)911的例子包含磁盤、光盤(包含光盤只讀存儲器(⑶-ROM)和數(shù)字通用盤(DVD))、磁光盤(包含迷你盤(MD))和半導體存儲器?;蛘?,存儲介質(zhì)可以是ROM 902、存儲部分908中包含的硬盤等,其中存有程序,并且與包含它們的方法一起被分發(fā)給用戶。在前面的說明書中參照特定實施例描述了本發(fā)明。然而本領(lǐng)域的普通技術(shù)人員理解,在不偏離如權(quán)利要求書限定的本發(fā)明的范圍的前提下可以進行各種修改和改變。應(yīng)用示例:以在一些場合下對異常交互運動軌跡進行檢測為例,可以使用根據(jù)本發(fā)明實施例的裝置和方法預(yù)先對正常的交互運動軌跡進行建模,生成用于對交互運動軌跡進行分類的分類器。并可以使用根據(jù)本發(fā)明實施例的視頻檢測裝置識別異常交互運動軌跡,以便對可疑場景及時發(fā)出警報。此外,根據(jù)本發(fā)明實施例的視頻監(jiān)控系統(tǒng),可以使用攝像機進行視頻捕捉,再將視頻圖像送到視頻檢測裝置中進行檢測??蛇x擇地,當檢測到異常交互運動軌跡時,啟動警報裝置。
權(quán)利要求
1.一種用于生成用于識別交互運動軌跡的分類器的裝置,包括: 軌跡提取部分,用于從多個視頻的每一個中提取至少兩個運動對象的交互運動軌跡; 軌跡分類部分,用于根據(jù)所述運動對象之間的交互關(guān)系對每個所述視頻中的所述交互運動軌跡進行分類; 軌跡估計部分,用于針對每個所述視頻的所述交互運動軌跡,根據(jù)相應(yīng)分類估計所述交互運動軌跡中包含的單運動對象運動軌跡的集合; 特征生成部分,用于針對每個所述集合,生成包含描述所述集合的各個單運動對象運動軌跡的特征的特征向量;以及 分類器生成部分,用于針對每個所述分類生成的相應(yīng)特征向量,生成用于識別對應(yīng)于所述分類的交互運動軌跡的所述分類器。
2.根據(jù)權(quán)利要求1所述的用于生成用于識別交互運動軌跡的分類器的裝置,其中,所述運動對象之間的交互關(guān)系包括所述運動對象的數(shù)目以及所述運動對象之間的合并和分裂的次數(shù)及順序。
3.根據(jù)權(quán)利要求1或2所述的用于生成用于識別交互運動軌跡的分類器的裝置,其中,所述特征生成部分包括: 擬合部分,用于使用相同維數(shù)的特征來描述各個單運動對象運動軌跡; 拼接部分,用于對每一個單運動對象運動軌跡 的特征描述結(jié)果進行拼接,以使用拼接的結(jié)果來生成描述每個所述視頻的所述交互運動軌跡的特征的特征向量。
4.根據(jù)權(quán)利要求3所述的用于生成用于識別交互運動軌跡的分類器的裝置,其中,所述擬合部分采用cubic B-spline曲線來擬合各單運動對象運動軌跡。
5.根據(jù)權(quán)利要求3所述的用于生成用于識別交互運動軌跡的分類器的裝置,其中,所述分類器生成部分對不同分類的交互運動軌跡分別進行聚類,以構(gòu)建用于描述每個所述視頻中的交互運動軌跡的模型,從而生成識別交互運動軌跡的分類器。
6.一種視頻檢測裝置,用于對視頻圖像中至少兩個運動對象的交互運動軌跡進行分析識別,所述視頻檢測裝置包括: 軌跡提取部分,用于從待檢測視頻中提取至少兩個運動對象的交互運動軌跡; 軌跡分類部分,用于根據(jù)所述運動對象之間的交互關(guān)系對所述交互運動軌跡進行分類; 軌跡估計部分,用于根據(jù)相應(yīng)分類對所述交互運動軌跡中包含的單運動對象運動軌跡的集合進行估計; 特征生成部分,用于生成包含描述所述集合的各個單運動對象運動軌跡的特征的特征向量;以及 特征比較部分,用于將所述特征向量與預(yù)先建立的軌跡模型進行比較,以對所述交互運動軌跡進行識別。
7.根據(jù)權(quán)利要求6所述的視頻檢測裝置,其中,所述運動對象之間的交互關(guān)系包括所述運動對象的數(shù)目以及所述運動對象之間的合并和分裂的次數(shù)及順序。
8.根據(jù)權(quán)利要求6或7所述的視頻檢測裝置,其中,所述特征生成部分包括: 擬合部分,用于使用相同維數(shù)的特征來描述各個單運動對象運動軌跡; 拼接部分,用于對每一個單運動對象運動軌跡的特征描述結(jié)果進行拼接,以使用拼接的結(jié)果來生成描述所提取交互運動軌跡的特征的特征向量。
9.根據(jù)權(quán)利要求8所述的視頻檢測裝置,其中,所述擬合部分采用cubicB-spline曲線來擬合各單運動對象運動軌跡。
10.一種視頻監(jiān)控系統(tǒng),包括: 攝像機,用于產(chǎn)生監(jiān)控視頻,以作為待檢測視頻;以及 視頻檢測裝置,用于對所述待檢測視頻圖像中至少兩個運動對象的交互運動軌跡進行分析識別, 所述視頻檢測裝置包括: 軌跡提取部分,用于從所述待檢測視頻中提取至少兩個運動對象的交互運動軌跡; 軌跡分類部分,用于根據(jù)所述運動對象之間的交互關(guān)系對所述交互運動軌跡進行分類; 軌跡估計部分,用于根據(jù)相應(yīng)分類對所述交互運動軌跡中包含的單運動對象運動軌跡的集合進行估計; 特征生成部分,用于生成包含描述所述集合的各個單運動對象運動軌跡的特征的特征向量;以及 特征比較部分,用于將所述特征向量與預(yù)先建立的軌跡模型進行比較,以對所述交互運動軌跡進行識別。
11.根據(jù)權(quán)利要求10所述的視頻監(jiān)控系統(tǒng),其中,所述運動對象之間的交互關(guān)系包括所述運動對象的數(shù)目以及所述運動對象之間的合并和分裂的次數(shù)及順序。
12.根據(jù)權(quán)利要求10或11所述的視頻監(jiān)控系統(tǒng),其中,所述特征生成部分包括: 擬合部分,用于使用相同維數(shù)的特征來描述各個單運動對象運動軌跡; 拼接部分,用于對每一個單運動對象運動軌跡的特征描述結(jié)果進行拼接,以使用拼接的結(jié)果來生成描述所提取交互運動軌跡的特征的特征向量。
13.根據(jù)權(quán)利要求12所述的視頻監(jiān)控系統(tǒng),其中,所述擬合部分采用cubicB-spline曲線來擬合各單運動對象運動軌跡。
14.一種生成用于識別交互運動軌跡的分類器的方法,包括: 從多個視頻的每一個中提取至少兩個運動對象的交互運動軌跡; 根據(jù)所述運動對象之間的交互關(guān)系對每個所述視頻中的所述交互運動軌跡進行分類; 針對每個所述視頻的所述交互運動軌跡,根據(jù)相應(yīng)分類估計所述交互運動軌跡中包含的單運動對象運動軌跡的集合; 針對每個所述集合,生成包含描述所述集合的各個單運動對象運動軌跡的特征的特征向量;以及 針對每個所述分類生成的相應(yīng)特征向量,生成用于識別對應(yīng)于所述分類的交互運動軌跡的所述分類器。
15.一種視頻檢測方法,用于對視頻圖像中至少兩個運動對象的交互運動軌跡進行分析識別,所述視頻檢測方法包括: 從待檢測視頻中提取至少兩個運動對象的交互運動軌跡; 根據(jù)所述運動對象之間的交互關(guān)系對所述交互運動軌跡進行分類;根據(jù)相應(yīng)分類對所述交互運動軌跡中包含的單運動對象運動軌跡的集合進行估計; 生成包含描述所述集合的各個單運動對象運動軌跡的特征的特征向量;以及 將所述特征向量與預(yù)先建立的軌跡模型進行比較,以對所述交互運動軌跡進行識別。
16.根據(jù)權(quán)利要求15所述的視頻檢測方法,其中,所述運動對象之間的交互關(guān)系包括所述運動對象的數(shù)目以及所述運動對象之間的合并和分裂的次數(shù)及順序。
17.根據(jù)權(quán)利要求15或16所述的視頻檢測方法,其中,生成包含描述所述集合的各個單運動對象運動軌跡的特征的特征向量包括: 使用相同維數(shù)的特征來描述各個單運動對象運動軌跡;以及 對每一個單運動對象運動軌跡的特征描述結(jié)果進行拼接,以使用拼接的結(jié)果來生成描述所提取運動軌跡的特征的特征向量。
18.根據(jù)權(quán)利要求17所述的視頻檢測方法,其中,采用cubicB-spline曲線來擬合各單運動對象運動 軌跡。
全文摘要
提供一種分類器生成裝置和方法、視頻檢測裝置和方法及視頻監(jiān)控系統(tǒng)。生成用于識別交互運動軌跡的分類器的裝置包括軌跡提取部分,從多個視頻的每一個中提取至少兩個運動對象的交互運動軌跡;軌跡分類部分,根據(jù)該運動對象之間的交互關(guān)系對每個視頻的交互運動軌跡進行分類;軌跡估計部分,針對每個視頻的交互運動軌跡,根據(jù)相應(yīng)分類估計交互運動軌跡中包含的單運動對象運動軌跡的集合;特征生成部分,針對每個集合生成包含描述集合的各個單運動對象運動軌跡的特征的特征向量;及分類器生成部分,針對每個分類生成的相應(yīng)特征向量,生成用于識別對應(yīng)于分類的交互運動軌跡的分類器。利用本發(fā)明,能夠有效地對運動對象的交互運動軌跡進行檢測和分析。
文檔編號H04N7/18GK103093183SQ20111034454
公開日2013年5月8日 申請日期2011年10月27日 優(yōu)先權(quán)日2011年10月27日
發(fā)明者劉舟, 吳偉國 申請人:索尼公司