包括"或"具有"之類的表述用于表示某種特性、數(shù)字、步 驟、操作、要素及這些的一部分或者組合,并不能解釋為排除除此之外還存在一個或一個以 上的其他特性、數(shù)字、步驟、操作、要素及這些的一部分或組合的必然性或可能性。
[0040] 圖1為用于說明根據(jù)本發(fā)明的一個實施例的目標物跟蹤裝置100的構(gòu)成的模塊 圖。根據(jù)本發(fā)明的一個實施例的目標物跟蹤裝置100是一種用于在目標物被設置有多個攝 像機的區(qū)域(area)內(nèi)的特定攝像機所檢測到的情況下為了跟蹤所述目標物的移動而有效 地選擇需要進行搜索的其他攝像機的裝置。通常,一個攝像機可拍攝的區(qū)域有限,而人或汽 車等目標物則持續(xù)移動,因此為了跟蹤目標物的移動,需要通過相關區(qū)域內(nèi)的攝像機之間 的交接(handover)而持續(xù)觀察目標物。在一個實施例中,將目標物跟蹤裝置100構(gòu)成為由 存儲有特定區(qū)域內(nèi)的多個攝像機的位置信息以及從各個攝像機獲取的圖像數(shù)據(jù)的數(shù)據(jù)庫 (未圖示)等跟蹤特定目標物,然而本發(fā)明的實施例并非一定要局限于此,也可以構(gòu)成為利 用從特定區(qū)域內(nèi)的多個攝像機實時接收的圖像信息而實時跟蹤特定目標物。即,在本發(fā)明 的實施例中,請留意攝像機不僅為表不網(wǎng)絡攝像機、閉路電視監(jiān)控系統(tǒng)(CCTV)等物理攝像 機的含義,而且還是包含由相關攝像機拍攝或者獲取的圖像的含義。
[0041] 如圖所示,根據(jù)本發(fā)明的一個實施例的目標物跟蹤裝置100包括:輸入單元102、 預測路徑計算單元104、判斷單元106、以及輸出單元108。
[0042] 輸入單元102從用戶等接收要搜索的目標物的信息。如前所述,在本發(fā)明的實施 例中,所述目標物可以是特定的人、動物或車輛等可通過攝像機圖像識別的所有類型的被 攝體。并且,所述目標物的信息可包括所述目標物的圖像、所述目標物的觀測位置、觀測視 角(viewpoint)以及移動方向中的一種以上。
[0043] 在一個實施例中,用戶可從由搜索對象區(qū)域內(nèi)的特定攝像機拍攝的圖像的一個幀 中選擇要搜索的目標物的圖像。此時,所述目標物的圖像可選擇所述目標物的臉部或服裝 等能夠較好地識別相關目標物的特征的圖像,從而使后續(xù)的目標物跟蹤過程中可更加容易 地識別目標物。為此,輸入單元102可提供用于在畫面上選擇目標物的合適的用戶界面,而 用戶通過所述用戶界面選擇畫面上的特定區(qū)域,并可以執(zhí)行將選擇的區(qū)域的被攝體與背景 分離之類的作業(yè)。輸入單元102可構(gòu)成為將通過如上所述的作業(yè)獲取的目標物的圖像與相 關幀的拍攝視角、拍攝位置(拍攝相關目標物的GPS位置信息等)、目標物在相關圖像內(nèi)的 移動方向等信息一并存儲。
[0044] 預測路徑計算單元104搜索預計為目標物已從最初識別的地點移動到的地點。在 本發(fā)明的一個實施例中,預測路徑計算單元104利用兩個以上的位置預測模型來由輸入的 所述信息計算所述目標物的分別對應于各個預測模型的移動候選地點,并通過計算出的分 別對應于所述各個預測模型的移動候選地點之間的比較來確定所述目標物的移動預測地 點。此時,所述目標物的移動預測地點可以是判斷為似乎有可能搜索到所述目標物的攝像 機的位置信息。而且,所述攝像機的位置信息可以是包含攝像機的設置信息(視角、IP地 址、畫質(zhì)、設置位置等)、攝像機的產(chǎn)品信息(公司名、模型名、規(guī)格等)、類型(固定型、全方 位旋轉(zhuǎn)變焦(PTZ,Pan-Tilt-Zoom)或是否具有紅外線功能等)等信息的概念。對此進行如 下更為詳細的說明。
[0045] 預測路徑計算單元104可包括用于從由輸入單元102獲取的目標物的信息計算目 標物的移動預測地點的多個算法模型。而且在一個實施例中,預測路徑計算單元104可將 兩個以上的位置預測模型構(gòu)成為集成模型(ensemble model)。這是由于如果利用集成模型 則與只利用一個位置預測模型結(jié)果的時候相比可以導出可靠性和準確率更高的結(jié)果。
[0046] 所述算法模型例如可以是隱馬爾可夫模型(Hidden Marcov model :HMM)、高斯混 合模型(Gaussian Mixture Model :GMM)、決策樹(Decision Tree)等基于統(tǒng)計的方法,也 可以是單純的基于位置的模型,且還可以是其他方法。換言之,本發(fā)明的實施例并不局限于 特定算法模型。即,預測路徑計算單元104可構(gòu)成為通過考慮跟蹤嫌疑對象(目標物)的 移動方向圖案等而從前述的算法模型中利用合適的算法模型。此時,選擇的算法模型根據(jù) 學習成果必將成為對于互不相同的移動方向圖案的強有力的模型。
[0047] 作為所述算法模型之一的HMM是一種由基于時間序列的順序數(shù)據(jù)預測目標物的 下一位置的基于統(tǒng)計的預測模型。因此在具有行人向特定地點移動時想著到達目的地的最 短距離而移動的步行圖案的情況下,借助于HMM的預測結(jié)果想必不會從實際目標物(行人) 的移動方向上偏離較多。
[0048] 圖5為表示在根據(jù)本發(fā)明的一個實施例的預測路徑計算單元中用于將隱馬爾可 夫模型應用于目標物的數(shù)據(jù)建模的一例的狀態(tài)轉(zhuǎn)換圖。圖示的狀態(tài)轉(zhuǎn)換圖是通過學習由實 際行人以5秒為間隔發(fā)送GPS坐標而構(gòu)成的行人移動路徑(trajectory)數(shù)據(jù)而生成的圖, 作為學習成果找到的狀態(tài)為SI、S2、S3這三個。連接各個狀態(tài)的箭頭為轉(zhuǎn)換到下一狀態(tài)的 概率以及指向自身的概率。在各個狀態(tài)下觀測到的符號(symbol)為如圖6所示的八個方 向,而在各個狀態(tài)下將被觀測到的符號的概率如以下的表1。
[0049] [表 1]
[0050]
[0051] 并且,GMM是一種分別生成針對在各個狀態(tài)下將被觀測到的互不相同的移動方向 的正態(tài)分布,并基于此而預測下一位置的基于統(tǒng)計的預測模型。對于這一模型而言,針對各 個狀態(tài)的正態(tài)分布不受來自之前狀態(tài)的影響,因此在目標物驟然改變方向或者倒轉(zhuǎn)路徑而 走去的表現(xiàn)出不規(guī)則步行圖案的情況下的預測中比HMM更適合。
[0052] 正是這樣,各種位置預測算法模型存在各自的特征和優(yōu)缺點,在將多個算法模型 構(gòu)成為集成模型的情況下,可分散偏差(bias),并能夠克服區(qū)域最優(yōu)點(local optimum) 的局限。因此,可以比通過一種算法模型生成的結(jié)果表現(xiàn)出更高的準確率。在一個實施例 中,在這種集成模型中的結(jié)合使用投票(voting)方式,然而不是使用單純的多數(shù)投票方 式,而是使用加權(quán)多數(shù)投票方式(weighted majority voting)而將模型各自的加權(quán)值比重 置為不同。如前所述,根據(jù)特定步行圖案等目標物的特性而存在更加合適的算法,因此基于 此而取不同的加權(quán)值。例如,預測路徑計算單元104可通過作為"boosting"算法的一種的 自適應增強(adaboost)算法而結(jié)合集成模型。在使用"adaboost"的情況下,算法模型可 根據(jù)步行圖案等目標物的特性而表現(xiàn)出互補性的結(jié)果。
[0053] 預測路徑計算單元104將所述目標物的信息代入到各個算法模型,從而與各個 算法分別對應而導出一個以上的候選地點,并通過導出的候選地點之間的比較或競爭 (contention)而確定要搜索所述目標物的預測地點。
[0054] 在一個實施例中,預測路徑計算單元104可基于由上述各個預測模型選擇的候選 攝像機的頻數(shù)(各個攝像機分別對應的選擇次數(shù))而選擇判斷為似乎有可能搜索到所述目 標物的一個以上的攝像機。而且,根據(jù)實施例,在設定有各個預測模型分別對應的加權(quán)值等 的情況下,可一并考慮到這一點而反映在所述攝像機的選擇。具體而言,預測路徑計算單元 104可通過根據(jù)各個算法模型的候選地點之間的投票而確定要搜索所述目標物的候選地 點。例如,假設現(xiàn)在與發(fā)現(xiàn)目標物的地點的攝像機相鄰的攝像機有1號到6號的六個,且根 據(jù)三個互不相同的算法模型的分析結(jié)果,在1號