專利名稱:用于在線訓練分類器的裝置和在線訓練分類器的方法
技術(shù)領域:
本發(fā)明涉及目標識別領域,尤其涉及一種用于在線訓練分類器的裝置和在線訓練分類器的方法。
背景技術(shù):
當前,在計算機視覺、語音識別等圖像和語音檢測、定位中,Boosting算法在執(zhí)行檢測和識別任務時變得越來越流行。其中,主要使用離線訓練方法對分類器進行訓練。在離線訓練中,所有訓練數(shù)據(jù)必須提前給出,并且分類器的訓練和使用被完全分開。但是,離線 訓練的分類器難以適應各種實際的應用環(huán)境,可能導致運算量過大或檢測不準確的問題。因而,Oza提出了在線學習的概念并給出了理論證明,當在線學習的樣本無窮大時,在線學習的分類器的分類能力等同于離線訓練的分類器。參見N. Oza和S. Russell的Online bagging and boosting. In Proc. Artificial Intelligence and Statistics,pages 105-112,2001。但是Oza的方案中使用的特征是固定的,這就限制了分類的能力。Grabner等人給出了可以進行特征挑選的在線學習方案,引入了選擇器的概念,具體請參見H. Grabner和 H. Bischof. On-line boosting and vision. In Proc. CVPR, volume I, pages 260-267,2006。
發(fā)明內(nèi)容
在Grabner的方案中,針對每個特征只使用一個高斯模型對背景建模,一個高斯模型對目標建模。實際上,在例如視頻當中背景和目標都是多種多樣的,單一的高斯模型不能對樣本圖像很好地進行描述,造成選擇器模型的識別能力不適應于樣本圖像。此外,在Grabner的方案中,在線分類器的弱分類器數(shù)目是預先確定好的。實際上,預先不能很好的估計出任務的難度,所以弱分類器的數(shù)目可能不夠從而影響分類的性能,或者過多從而影響分類器的速度,造成選擇器模型的識別能力不適應于樣本圖像。總的來說,本發(fā)明的目的是提供一種用于在線訓練分類器的裝置和方法,其能夠適應于樣本圖像自動地更新用于生成分類器的選擇器模型。本發(fā)明的一個實施例是一種用于在線訓練分類器的裝置,包括確定部分,用于確定選擇器模型的識別能力是否適應樣本圖像;更新部分,用于在確定部分確定選擇器模型的識別能力不適應樣本圖像的情況下,根據(jù)樣本圖像更新選擇器模型;生成部分,用于根據(jù)樣本圖像,利用更新的選擇器模型選擇組成分類器的弱分類器,并組成分類器。本發(fā)明的另一個實施例是一種在線訓練分類器的方法,包括確定選擇器模型的識別能力是否適應樣本圖像;在確定選擇器模型的識別能力不適應樣本圖像的情況下,根據(jù)樣本圖像更新選擇器模型;以及根據(jù)樣本圖像,利用更新的選擇器模型選擇組成分類器的弱分類器并組成分類器。利用本發(fā)明,通過根據(jù)訓練樣本圖像自適應地更新用于生成分類器的選擇器模型,使得基于該選擇器模型生成的分類器的分類準確度提高,分類速度加快。具體來說,使用自適應的多高斯模型來對背景和目標進行建模,以提供最優(yōu)的特征描述。并且,通過根據(jù)進行檢測或者跟蹤等任務的難度的變化來調(diào)整弱分類器的數(shù)目,使得在保證分類性能的同時提高了分類速度。
參照下面結(jié)合附圖對本發(fā)明實施例的說明,會更加容易地理解本發(fā)明的以上和其它目的、特點和優(yōu)點。在附圖中,相同的或?qū)?應的技術(shù)特征或部件將采用相同或?qū)母綀D標記來表示。在附圖中不必依照比例繪制出單元的尺寸和相對位置。圖I是示出根據(jù)本發(fā)明實施例的分類器在線訓練裝置的結(jié)構(gòu)的框圖。圖2是示出根據(jù)本發(fā)明實施例的分類器在線訓練裝置的結(jié)構(gòu)的框圖。圖3是示出根據(jù)本發(fā)明實施例的在線訓練分類器的方法的流程圖。圖4是示出根據(jù)本發(fā)明實施例的在線訓練分類器的方法的流程圖。圖5是示出根據(jù)本發(fā)明實施例的在線訓練分類器的方法的流程圖。圖6是示出根據(jù)本發(fā)明實施例的在線訓練分類器的方法的流程圖。圖7是示出根據(jù)本發(fā)明實施例的在線訓練分類器的方法的流程圖。圖8是示出根據(jù)本發(fā)明實施例的在線訓練分類器的方法的流程圖。圖9是示出實現(xiàn)本發(fā)明的計算機的示例性結(jié)構(gòu)的框圖。
具體實施例方式下面參照附圖來說明本發(fā)明的實施例。應當注意,為了清楚的目的,附圖和說明中省略了與本發(fā)明無關(guān)的、本領域技術(shù)人員已知的部件和處理的表示和描述。圖I是示出根據(jù)本發(fā)明實施例的分類器在線訓練裝置100的結(jié)構(gòu)的框圖。如圖I所示,分類器在線訓練裝置100包括確定部分101、更新部分102和生成部分103。確定部分101用于確定選擇器模型的識別能力是否適應樣本圖像。更新部分102用于在確定部分101確定選擇器模型的識別能力不適應樣本圖像的情況下,根據(jù)樣本圖像更新選擇器模型。生成部分103用于根據(jù)樣本圖像,利用更新的選擇器模型選擇組成分類器的弱分類器,并組成分類器。此處,訓練用在線樣本圖像可以是經(jīng)過手動標注的輸入圖像,也可以是使用所訓練分類器的目標檢測/跟蹤裝置的檢測/跟蹤結(jié)果等。確定選擇器模型的識別能力是否適應樣本圖像主要是確定兩個方面。第一方面,選擇器模型的候選弱分類器的統(tǒng)計模型是否能夠準確地描述樣本圖像中的相應特征。候選弱分類器的統(tǒng)計模型可以諸如是擬合所有目標樣本中與該候選弱分類器相對應的特征的特征值分布概率的高斯模型以及擬合所有背景樣本中該特征的特征值分布概率的高斯模型。當然,候選弱分類器的統(tǒng)計模型也可以是任何其它能夠反映目標/背景樣本中與候選弱分類器相對應的特征的特征值分布概率的其它統(tǒng)計模型。第二方面,利用選擇器模型選擇的弱分類器組成的分類器對樣本圖像的識別能力是欠缺、恰好足夠還是過剩。這兩個方面都將影響使用基于該選擇器模型組成的分類器的檢測識別裝置的識別準確度和識別效率。下面說明第一方面。樣本的某個圖像特征分布的統(tǒng)計情況包括所有樣本中該特征的期望、方差和概率密度等。傳統(tǒng)地,分類器的在線訓練即根據(jù)在線樣本,在分類器中的弱分類器的原有統(tǒng)計模型的基礎上對其期望、方差等統(tǒng)計值進行調(diào)整。例如,在統(tǒng)計模型采用高斯模型的情況下,用在線樣本中的特征的特征值來自動更新各候選弱分類器使用的高斯模型。例如,可以采用Kalman濾波方法來更新某候選弱分類器(特征)對應的高斯模型的期望和方差。期望和方差等的當前值等于歷史值和當前輸入在線樣本中對應該弱分類器的特征的特征值的加權(quán)和。然而,在選擇器模型的識別能力不適應樣本圖像時,可能出現(xiàn)這種情況選擇器模型中的某個候選弱分類器的各個統(tǒng)計模型的期望都與提取自樣本圖像的與該候選弱分類 器相對應的特征的特征值具有較大偏離。在這種情況下,使用該特征值,采用例如Kalman濾波的方法對統(tǒng)計模型的期望進行更新將引入較大誤差,使得分類性能劣化。因此,當從樣本圖像的特征值中獲得這樣的特征值時,需要采用新的改進的方法對統(tǒng)計模型進行更新。在本實施例中,確定部分101可以計算選擇器模型的每個候選弱分類器的各個統(tǒng)計模型的期望與提取自樣本圖像的相應特征的偏離中的最小偏離,并將該最小偏離與預定閾值進行比較。當該最小偏離不超過預定閾值時,確定部分101可以確定該候選弱分類器的統(tǒng)計模型能夠較好地描述樣本圖像的特征。在這種情況下,使用該提取自樣本圖像的特征對原有統(tǒng)計模型的期望和方差進行更新。而當該最小偏離大于預定閾值時,確定部分101可以確定當前選擇器模型的候選弱分類器的統(tǒng)計模型不能足夠準確地描述樣本圖像,即,該選擇器模型的識別能力不適應樣本圖像。在確定部分101確定選擇器模型的每個候選弱分類器的各個統(tǒng)計模型的期望與提取自樣本圖像的相應特征的偏離中的最小偏離超過閾值,即超過預定程度的情況下,更新部分102可以根據(jù)樣本圖像采用改進的方式對選擇器模型進行更新。具體來說,更新部分102可以向選擇器模型的候選弱分類器添加根據(jù)與已有統(tǒng)計模型的期望具有較大偏離的相應特征獲得的統(tǒng)計模型。該新添加的統(tǒng)計模型的期望可以是該具有較大偏離的特征的特征值。在更新部分102對選擇器模型中的候選弱分類器的統(tǒng)計模型進行更新后,生成部分103根據(jù)樣本圖像,利用更新的選擇器模型從候選弱分類器中選擇組成分類器的弱分類器,并組成分類器。在本實施例中,對弱分類器中描述特定特征的統(tǒng)計模型的數(shù)目進行了擴展。根據(jù)樣本圖像自適應地增加描述特定特征的統(tǒng)計模型的數(shù)目,使得對圖像特征(尤其是復雜圖像)的描述更加準確。隨著使用大量在線樣本進行訓練,對于某個特征,可能建立了較多對其進行描述的統(tǒng)計模型。同時,在這些統(tǒng)計模型中,可能存在一些統(tǒng)計模型在較長時間內(nèi)未進行更新。由于長時間未被更新通常意味著這些統(tǒng)計模型對弱分類器的性能影響較小,所以當某個候選弱分類器的統(tǒng)計模型的數(shù)目超過預定數(shù)目時,可以選擇刪除在較長時間內(nèi)未進行更新的統(tǒng)計模型。
具體來說,在一個實施例中,在向候選弱分類器添加統(tǒng)計模型之前或之后,更新部分102可以從統(tǒng)計模型數(shù)目超過預定數(shù)目的候選弱分類器中選擇未更新時間較長的統(tǒng)計模型,并將其從相應候選弱分類器中刪除。其中,更新時間可以用樣本圖像的幀數(shù)來計算。例如,當超過T幀樣本圖像未進行更新時,可以認為該統(tǒng)計模型是可以刪除的統(tǒng)計模型。接下來,說明第二方面。根據(jù)Boosting方法得到的分類器由若干弱分類器組成。分類器的總的識別能力與其每一個弱分類器的識別能力和弱分類器的數(shù)目有關(guān)。在Grabner的方案中,用選擇器模型來構(gòu)造分類器,且每一個選擇器對應于若干候選弱分類器。在在線學習的過程中,根據(jù)樣本圖像從候選弱分類器中選擇一個弱分類器作為組成分類器的弱分類器。然而,在Grabner的方案中,在線分類器的弱分類器數(shù)目是預先確定好的,在識別難度較大的情況下,有可能不能提供足夠的識別能力。另外,在識別難度很小的情況下,有可能提供了過剩的識別能力,影響識別速度,降低了識別效率。`根據(jù)本發(fā)明的一個實施例,確定部分101可以根據(jù)樣本圖像,利用當前選擇器模型選擇用于組成分類器的弱分類器,并組成分類器。并且,確定部分101判斷所組成的分類器對樣本圖像的識別能力是不足夠、恰好足夠還是過剩。分類器的識別能力可以通過本領域技術(shù)人員所知的各種方法來進行判斷。例如,可以基于測試樣本進行測試,以獲得分類器識別的錯誤率來進行判斷。用測試樣本來測試分類器,例如,如果樣本A的類別為1,而識別出其為類別2,則計為一次錯誤。由于Boosting方法是迭代的,所以可以每次迭代或每隔若干迭代對分類器進行測試。當通過測試得到的錯誤率大于某個上限值時,則判斷分類器對樣本圖像的識別能力不足夠。當錯誤率小于某個下限值時,則認為分類器對樣本圖像的識別能力過剩。而當錯誤率落入上限值和下限值之間時,可以認為分類器的識別能力恰好合適。當確定部分101判斷出所組成的分類器對樣本圖像的識別能力不足夠時,更新部分102可以增加選擇器的數(shù)目。在一個實施例中,當更新部分102增加一個選擇器時,其可以在特征池中,在已有選擇器的候選弱分類器對應的特征之外,隨機的抽取預定數(shù)目的特征以構(gòu)造候選弱分類器。其后的操作,可以與Grabner方法中構(gòu)造選擇器模型的操作相同。而當確定部分101判斷出所組成的分類器對樣本圖像的識別能力過剩的情況下,更新部分102可以尋找能夠針對樣本圖像的足夠識別能力的較小或最小選擇器數(shù)目,并且從當前使用的選擇器模型中刪除該較小或最小選擇器數(shù)目的選擇器之外的選擇器。在一個實施例中,更新部分102可以根據(jù)弱分類器的重要性權(quán)重λ從高到低的順序計算前k個弱分類器組合的識別錯誤率。其中,k= 1,2,...,K,K為當前選擇器模型的選擇器總數(shù)。當所獲得的識別錯誤率小于某一預定閾值時,更新部分102找到能夠針對樣本圖像的足夠識別能力的較小或最小選擇器數(shù)目,即,得到小于預定閾值的錯誤率時較小或最小k值。之后,更新部分102可以刪除按照重要性權(quán)重λ從高到低的順序排序的第k+Ι到第K個選擇器。以上,只是一個尋找較小或最小選擇器數(shù)目的方法的例子。本領域的技術(shù)人員還能夠根據(jù)所具有的知識和經(jīng)驗,在不需要創(chuàng)造性勞動的情況下,想到各種尋找較小或最小選擇器數(shù)目的方法。
在減小選擇器數(shù)目之后,可以與Grabner方法中構(gòu)造選擇器模型的操作相同地構(gòu)造和訓練選擇器模型。當然,當確定部分101判斷出所組成的分類器對樣本圖像的識別能力恰好合適的情況下,更新部分102不對選擇器的數(shù)目進行增減。在更新部分102對選擇器模型進行更新后,生成部分103根據(jù)樣本圖像,利用更新的選擇器模型從候選弱分類器中選擇組成分類器的弱分類器,并組成分類器。分類器在線訓練裝置100可以只對上述第一和第二方面之一進行確定,并根據(jù)確定結(jié)果,使用相應的方式更新選擇器模型,以實現(xiàn)分類器的在線訓練。此外,分類器在線訓練裝置100也可以考慮上述兩個方面二者,從而進一步優(yōu)化分類器。下文中,參考圖2進行詳細說明。圖2是示出根據(jù)本發(fā)明實施例的分類器在線訓練裝置200的結(jié)構(gòu)的框圖。分類器在線訓練裝置200包括確定部分201、更新部分202、生成部分203以及評價部分204。與圖I中所示實施例相似,確定部分201確定選擇器模型的識別能力是否適應樣本圖像。例如,確定部分201計算選擇器模型的每個候選弱分類器的各個統(tǒng)計模型的期望與提取自樣本圖像的相應特征的偏離中的最小偏離,并且判斷最小偏離是否超過預定程度。然后,在確定部分201判斷偏離超過預定程度的情況下,更新部分202向候選弱分類器添加根據(jù)相應特征獲得的統(tǒng)計模型。
可選擇地,更新部分202可以在統(tǒng)計模型的添加之前或之后,候選弱分類器的統(tǒng)計模型數(shù)目超過預定數(shù)目的情況下,從統(tǒng)計模型數(shù)目超過預定數(shù)目的候選弱分類器中選擇未更新時間較長的統(tǒng)計模型,并將其從相應候選弱分類器中刪除。然后,由生成部分203根據(jù)樣本圖像,利用更新的選擇器模型選擇組成分類器的弱分類器,并組成分類器。確定部分201、更新部分202和生成部分203所進行的上述操作以在結(jié)合圖I的說明中進行了詳細說明,這里不再重復。在分類器在線訓練裝置200中,評價部分204判斷由生成部分203根據(jù)所更新的選擇器模型組成的分類器對樣本圖像的識別能力是不足、恰好還是過剩。當評價部分204判斷所組成的分類器對樣本圖像的識別能力不足夠時,更新部分202可以增加選擇器的數(shù)目。生成部分203可以響應于選擇器數(shù)目的增加,根據(jù)樣本圖像,利用更新的選擇器模型選擇組成分類器的弱分類器,并組成分類器。當評價部分204判斷所組成的分類器對樣本圖像的識別能力過剩時,更新部分202可以尋找能夠提供針對樣本圖像的足夠識別能力的較小或最小選擇器數(shù)目,并且從得到的所更新的選擇器模型中刪除該較小或最小選擇器數(shù)目的選擇器之外的選擇器。生成部分204可以響應于選擇器的刪除,根據(jù)樣本圖像,利用更新的選擇器模型選擇組成分類器的弱分類器,并組成分類器??蛇x擇地,也可以先對根據(jù)當前選擇器模型所組成的分類器的識別能力進行評價。在根據(jù)評價結(jié)果進行更新之后,在對選擇器中的候選弱分類器的統(tǒng)計模型是否能夠準確描述樣本圖像的特征進行確定,從而進一步進行更新,以得到最優(yōu)的分類器在線訓練裝置。下文中,參考圖3至圖8,描述根據(jù)本發(fā)明各實施例的在線訓練分類器的方法的流程。圖3至圖8是示出根據(jù)本發(fā)明各實施例的在線訓練分類器的方法的流程圖。
如圖3中所示,在步驟S301中,為選擇器模型提供在線訓練樣本圖像。在步驟S302中,確定選擇器模型的識別能力不適應樣本圖像。(如果選擇器模型的識別能力適應樣本圖像,則使用該樣本圖像進行傳統(tǒng)地選擇器模型中候選弱分類器的更新,此處不進行討論。)在步驟S303中,根據(jù)該樣本圖像對選擇器模型進行更新。然后,在步驟S304中,根據(jù)樣本圖像,利用更新的選擇器模型選擇組成分類器的弱分類器并組成分類器。在圖4至圖8中,示出更加具體的實現(xiàn)根據(jù)本發(fā)明實施例的分類器在線訓練方法的流程。在圖4所示的實施例中,在步驟S401中,向選擇器模 型輸入用于在線訓練的樣本圖像。用于在線訓練的樣本圖像可以是手工標記的圖像,或者是使用所訓練的分類器的目標檢測/跟蹤設備所輸出的檢測/跟蹤結(jié)果。接下來,在步驟S402中,計算選擇器模型的每個候選弱分類器的各個統(tǒng)計模型的期望與提取自樣本圖像的相應特征的偏離中的最小偏離,并且確定該最小偏離大于預定閾值TH1。(當最小偏離不大于預定閾值THl時,則使用樣本圖像對候選弱分類器進行傳統(tǒng)方式的更新。這里不進行詳細說明)。接下來,在步驟S403中,向候選弱分類器添加根據(jù)相應特征獲得的統(tǒng)計模型。然后,在步驟S404中,根據(jù)樣本圖像,利用更新的選擇器模型選擇組成分類器的弱分類器,并組成分類器??蛇x擇地,當存在超過預定時間(例如T幀樣本圖像)未更新的候選弱分類器的統(tǒng)計模型時,可以刪除該長時間未更新的統(tǒng)計模型。尤其是,可以在某候選弱分類器的統(tǒng)計模型過多時,選擇刪除長時間未進行更新的統(tǒng)計模型。下面參考圖5進行詳細說明。如圖5中所示,步驟S501至S503對應于圖4中的步驟S401至S403,在此不進行重復說明。在步驟S504中,判斷候選弱分類器中的統(tǒng)計模型數(shù)目是否大于一個預設值N。如果在步驟S504中,確定為否,則流程直接進行到步驟S507。這時,在步驟S507中進行的處理與在圖4的步驟S404中進行的處理相同,根據(jù)樣本圖像,利用更新的選擇器模型選擇組成分類器的弱分類器,并組成分類器。如果在步驟S504中確定為候選弱分類器中的統(tǒng)計模型數(shù)目大于預設數(shù)N,則處理進行到步驟S505,從統(tǒng)計模型數(shù)目超過預定數(shù)目N的候選弱分類器中選擇未更新時間大于時間閾值T的統(tǒng)計模型。接下來,在步驟S506中將該統(tǒng)計模型從相應的候選弱分類器中刪除。接下來,在步驟S507中,利用進行了統(tǒng)計模型的增加和刪除的更新后的選擇器模型選擇弱分類器并組成分類器。在圖5所示的實施例中,在向候選弱分類器中的某個弱分類器添加統(tǒng)計模型之后,根據(jù)統(tǒng)計模型的數(shù)目對長時間未進行更新的統(tǒng)計模型進行了刪除??蛇x擇地,可以在為候選弱分類器添加統(tǒng)計模型之前,進行判斷和刪除。在利用更新的選擇器模型組成分類器之后,可以進一步對所組成的分類器進行評價,判斷根據(jù)所更新的選擇器模型組成的分類器對樣本圖像的識別能力是否足夠。如圖6中所示。圖6中的步驟S601至步驟S604中的處理與圖4中的步驟S401至步驟S404中的處理相同,此處不進行重復描述。在步驟S605中,判斷根據(jù)更新的選擇器模型組成的分類器對樣本圖像的識別能力是否足夠。當在步驟S605中判斷為足夠時,結(jié)束處理。當在步驟S605中判斷為不足夠時,進行步驟S606中的處理。在步驟S606中,增加選擇器的數(shù)目。該新增加的選擇器中的候選弱分類器的相應特征可以從特征池中已用特征之外的其它特征中隨機選取。當在步驟S606中進行處理后,處理返回到步驟S604,重復在步驟S604中利用更新的選擇器模型選擇弱分類器并組成分類器的處理。在另一個實施例中(未示出),在步驟S605中,可以判斷根據(jù)更新的選擇器模型組成的分類器對樣本圖像的識別能力是否過剩。在步驟S605中判斷為識別能力過剩的情況下,在接下來的步驟中,尋找能夠提供針對樣本圖像的足夠識別能力的較小或最小選擇器數(shù)目,并且從更新的選擇器模型中刪除該較小或最小選擇器數(shù)目的選擇器之外的選擇器。然后,步驟返回到步驟S604,重復上述選擇和組成處理。 當然,在另外的實施例中,關(guān)于選擇器模型的識別能力是否適應樣本圖像,可以不對候選弱分類器中的統(tǒng)計模型是否能夠較好地描述特征進行評估,而是直接判斷根據(jù)樣本圖像,利用當前選擇器模型選擇的弱分類器所組成的分類器對樣本圖像的識別能力是不足、恰好足夠還是過剩。例如,在圖7中所示的實施例中,在步驟S702中,確定根據(jù)利用當前選擇器模型選擇的弱分類器所組成的分類器對在步驟S701中輸入的樣本圖像的識別能力不足夠。從而,接下來,執(zhí)行步驟S703中的處理。在步驟S703中,增加選擇器的數(shù)目,以對當前的選擇器模型進行更新。然后,在步驟S704中,利用更新的選擇器模型選擇弱分類器并組成分類器。在另一個實施例中,可以對根據(jù)利用當前選擇器模型選擇的弱分類器所組成的分類器對樣本圖像的識別能力是否過剩進行判斷。如圖8中所示,在步驟S802中,確定根據(jù)利用當前選擇器模型選擇的弱分類器所組成的分類器對在步驟S801中輸入的樣本圖像的識別能力過剩。然后,處理進行到步驟S803。在步驟S803中,尋找能夠提供針對樣本圖像的足夠識別能力的較小或最小選擇器數(shù)目。然后,在步驟S804中,從當前選擇器模型中刪除該較小或最小選擇器數(shù)目的選擇器之外的選擇器。接下來,在步驟S805中,利用更新的選擇器模型選擇弱分類器從而組成分類器。至此,圖8中的處理結(jié)束。在下文中,將以示例的方式描述使用根據(jù)本發(fā)明實施例的分類器在線訓練的具體實例。在針對視頻或音頻等可以用統(tǒng)計模型描述的信號的目標檢測的具體例子中,目標檢測裝置包括檢測分類器、在線學習模塊以及檢測模塊。檢測模塊利用檢測分類器來檢測輸入樣本中是否存在待檢測的目標。目標檢測裝置中的在線學習模塊使用在線樣本對檢測分類器進行在線訓練。其中,在線學習模塊可以以根據(jù)本發(fā)明實施例的分類器在線學習裝置100實現(xiàn)。在線樣本的例子例如是目標檢測裝置的輸出和/或手動標注的輸入樣本。在線學習模塊讀取在線樣本的檢測特征集,這些特征已經(jīng)在檢測模塊中計算得到。然后,在線學習模塊可以計算檢測分類器對在線樣本的損失。對于每一個弱分類器使用的特征,都建立和更新目標樣本特征值的高斯分布模型和誤檢樣本特征值的高斯分布模型。例如,用第η個在線樣本的特征值來自動更新各弱分類器使用的高斯模型。可以采用kalman濾波方法來更新其對應的高斯模型期望和方差。第η個在線樣本在第i個弱分類器對應的高斯模型指高斯模型的期望μ i, j與該樣本特征值ai>n最接近,且Iui^nI < α · σ μ為高斯模型的方差,α是預先確定的接近程度系數(shù)。當確定在線樣本對于某弱分類器的特征值與當前所有統(tǒng)計模型的期望偏差很大
時,例如彡α · σ . j, j = 1,2......Ji時(第i個弱分類器共有Ji個高斯模
型),增加一個新的以該樣本的特征值為期望的高斯模型。上述確定可以例如在根據(jù)本發(fā)明實施例的確定部分101中進行。當某分類器的高斯模型數(shù)目多于N,且包含的統(tǒng)計模型中有超過T幀未進行在線更新的模型存在時,刪除掉長時間未更新的模型。上述增加新的高斯模型和在高斯模型數(shù)目超過N且有模型長時間未更新時刪除模型的處理可以在根據(jù)本發(fā)明實施例的更新部分`102中進行。然后,在在線訓練模塊的根據(jù)本發(fā)明實施例的生成部分103中,在線挑選合適的特征。特征的挑選采用錯誤率最小的貝葉斯原則。由于目標和誤檢的特征值都有一個高斯分布,每個特征對應的目標高斯分布和背景高斯分布的重疊部分就代表了錯誤率。由機器學習挑出的特征的錯誤率可以得到弱分類器的參數(shù)和輸出,若干弱分類器的相加就是更新后的檢測分類器。另外,在確定部分101確定當前檢測分類器對在線樣本判斷不夠準確時,更新部分101可以增加弱分類器(在本實施例中為選擇器)的數(shù)目。在當前檢測分類器前若干個弱分類器已經(jīng)足夠準確時,更新部分101可以減少弱分類器的數(shù)目。使用上面的各實施例,描述了使用自適應的多高斯模型來對背景和目標進行建模,并且/或者采用可變長的分類器解決方案,隨著在視頻或語音中進行檢測或者跟蹤等任務的難度的變化來調(diào)整弱分類器的數(shù)目的用于在線訓練分類器的裝置和在線訓練分類器的方法。根據(jù)各實施例的方法和裝置能夠更加準確地描述樣本圖像,并且/或者在保證性能的同時兼顧速度。下文中,參考圖9描述實現(xiàn)本發(fā)明的數(shù)據(jù)處理設備的計算機的示例性結(jié)構(gòu)。圖9是示出實現(xiàn)本發(fā)明的計算機的示例性結(jié)構(gòu)的框圖。在圖9中,中央處理單元(CPU)901根據(jù)只讀存儲器(ROM)902中存儲的程序或從存儲部分908加載到隨機存取存儲器(RAM) 903的程序執(zhí)行各種處理。在RAM 903中,也根據(jù)需要存儲當CPU 901執(zhí)行各種處理時所需的數(shù)據(jù)。CPU 90KROM 902和RAM 903經(jīng)由總線904彼此連接。輸入/輸出接口 905也連接到總線904。下述部件連接到輸入/輸出接口 905 :輸入部分906,包括鍵盤、鼠標等;輸出部分907,包括顯示器,諸如陰極射線管(CRT)、液晶顯示器(LCD)等,以及揚聲器等;存儲部分908,包括硬盤等;以及通信部分909,包括網(wǎng)絡接口卡諸如LAN卡、調(diào)制解調(diào)器等。通信部分909經(jīng)由網(wǎng)絡諸如因特網(wǎng)執(zhí)行通信處理。根據(jù)需要,驅(qū)動器910也連接到輸入/輸出接口 905。可拆卸介質(zhì)911諸如磁盤、光盤、磁光盤、半導體存儲器等根據(jù)需要被安裝在驅(qū)動器910上,使得從中讀出的計算機程序根據(jù)需要被安裝到存儲部分908中。
在通過軟件實現(xiàn)上述步驟和處理的情況下,從網(wǎng)絡諸如因特網(wǎng)或存儲介質(zhì)諸如可拆卸介質(zhì)911安裝構(gòu)成軟件的程序。本領域的技術(shù)人員應當理解,這種存儲介質(zhì)不局限于圖9所示的其中存儲有程序、與方法相分離地分發(fā)以向用戶提供程序的可拆卸介質(zhì)911。可拆卸介質(zhì)911的例子包含磁盤、光盤(包含光盤只讀存儲器(⑶-ROM)和數(shù)字通用盤(DVD))、磁光盤(包含迷你盤(MD))和半導體存儲器。或者,存儲介質(zhì)可以是ROM 902、存儲部分908中包含的硬盤等,其中存有程序,并且與包含它們的方法一起被分發(fā)給用戶。在前面的說明書中參照特定實施例描述了本發(fā)明。然而本領域的普通技術(shù)人員理解,在不偏離如權(quán)利要求書限定的本發(fā)明的范圍的前提下可以進 行各種修改和改變。
權(quán)利要求
1.一種用于在線訓練分類器的裝置,包括 確定部分,用于確定選擇器模型的識別能力是否適應樣本圖像; 更新部分,用于在所述確定部分確定所述選擇器模型的識別能力不適應所述樣本圖像的情況下,根據(jù)所述樣本圖像更新所述選擇器模型;以及 生成部分,用于根據(jù)所述樣本圖像,利用更新的選擇器模型選擇組成所述分類器的弱分類器,并組成所述分類器。
2.如權(quán)利要求I所述的用于在線訓練分類器的裝置,其中所述確定部分被配置為 計算所述選擇器模型的每個候選弱分類器的各個統(tǒng)計模型的期望與提取自所述樣本圖像的相應特征的偏離中的最小偏離,并且 判斷所述最小偏離是否超過預定程度;以及 所述更新部分被配置為 在所述偏離超過預定程度的情況下,向所述候選弱分類器添加根據(jù)所述相應特征獲得的統(tǒng)計模型。
3.如權(quán)利要求2所述的用于在線訓練分類器的裝置,其中所述更新部分被進一步配置為 在所述添加前或添加后的統(tǒng)計模型數(shù)目超過預定數(shù)目的情況下,從所述統(tǒng)計模型數(shù)目超過預定數(shù)目的候選弱分類器中選擇未更新時間較長的統(tǒng)計模型;并且從相應候選弱分類器中刪除所選擇的統(tǒng)計模型。
4.如權(quán)利要求2或3所述的用于在線訓練分類器的裝置,還包括 評價部分,用于判斷根據(jù)所更新的選擇器模型組成的分類器對所述樣本圖像的識別能力不足夠, 其中所述更新部分進一步被配置為在所述識別能力不足夠的情況下,增加所述選擇器的數(shù)目,以及 所述生成部分進一步被配置為響應于選擇器數(shù)目的增加,根據(jù)所述樣本圖像,利用更新的選擇器模型選擇組成所述分類器的弱分類器,并組成所述分類器。
5.如權(quán)利要求2或3所述的用于在線訓練分類器的裝置,還包括 評價部分,用于判斷根據(jù)所更新的選擇器模型組成的分類器對所述樣本圖像的識別能力過剩; 其中所述更新部分進一步被配置為 在所述識別能力過剩的情況下,尋找能夠提供針對所述樣本圖像的足夠識別能力的較小或最小選擇器數(shù)目,并且 從所更新的選擇器模型中刪除所述較小或最小選擇器數(shù)目的選擇器之外的選擇器;以及 所述生成部分進一步被配置為響應于所述選擇器的刪除,根據(jù)所述樣本圖像,利用更新的選擇器模型選擇組成所述分類器的弱分類器,并組成所述分類器。
6.如權(quán)利要求I所述的用于在線訓練分類器的裝置,其中所述確定部分被配置為 根據(jù)所述樣本圖像,利用當前選擇器模型選擇組成所述分類器的弱分類器并組成所述分類器;和 判斷所組成的分類器對所述樣本圖像的識別能力不足夠,并且所述更新部分被配置為 在所述識別能力不足夠的情況下,增加所述選擇器的數(shù)目。
7.如權(quán)利要求I所述的用于在線訓練分類器的裝置,其中所述確定部分被配置為 根據(jù)所述樣本圖像,利用當前選擇器模型選擇組成所述分類器的弱分類器并組成所述分類器;并且 判斷所組成的分類器對所述樣本圖像的識別能力過剩,并且 所述更新部分被配置為 在所述識別能力過剩的情況下,尋找能夠提供針對所述樣本圖像的足夠識別能力的較小或最小選擇器數(shù)目;和 從當前選擇器模型中刪除所述較小或最小選擇器數(shù)目的選擇器之外的選擇器。
8.如權(quán)利要求2至5之一所述的用于在線訓練分類器的裝置,其中所述統(tǒng)計模型是高斯模型。
9.一種在線訓練分類器的方法,包括 確定選擇器模型的識別能力是否適應樣本圖像; 在確定所述選擇器模型的識別能力不適應所述樣本圖像的情況下,根據(jù)所述樣本圖像更新所述選擇器模型;以及 根據(jù)所述樣本圖像,利用更新的選擇器模型選擇組成所述分類器的弱分類器并組成所述分類器。
10.如權(quán)利要求9所述的在線訓練分類器的方法,其中所述確定包括 計算所述選擇器模型的每個候選弱分類器的各個統(tǒng)計模型的期望與提取自所述樣本圖像的相應特征的偏離中的最小偏離,以及判斷所述最小偏離是否超過預定程度;以及所述更新包括 在所述偏離超過預定程度的情況下,向所述候選弱分類器添加根據(jù)所述相應特征獲得的統(tǒng)計模型。
11.如權(quán)利要求10所述的在線訓練分類器的方法,其中所述更新還包括 在所述添加前或添加后的統(tǒng)計模型數(shù)目超過預定數(shù)目的情況下,從所述統(tǒng)計模型數(shù)目超過預定數(shù)目的候選弱分類器中選擇未更新時間較長的統(tǒng)計模型;以及從相應候選弱分類器中刪除所選擇的統(tǒng)計模型。
12.如權(quán)利要求10或11所述的在線訓練分類器的方法,還包括 判斷根據(jù)所更新的選擇器模型組成的分類器對所述樣本圖像的識別能力不足夠; 在所述識別能力不足夠的情況下,增加所述選擇器的數(shù)目;以及 重復所述選擇并且組成的步驟。
13.如權(quán)利要求10或11所述的在線訓練分類器的方法,還包括 判斷根據(jù)所更新的選擇器模型組成的分類器對所述樣本圖像的識別能力過剩; 在所述識別能力過剩的情況下,尋找能夠提供針對所述樣本圖像的足夠識別能力的較小或最小選擇器數(shù)目,并且 從所更新的選擇器模型中刪除所述較小或最小選擇器數(shù)目的選擇器之外的選擇器;以及重復所述選擇并且組成的步驟。
14.如權(quán)利要求9所述的在線訓練分類器的方法,其中所述確定包括 根據(jù)所述樣本圖像,利用當前選擇器模型選擇組成所述分類器的弱分類器并組成所述分類器;和 判斷所組成的分類器對所述樣本圖像的識別能力不足夠,并且 所述更新包括 在所述識別能力不足夠的情況下,增加所述選擇器的數(shù)目。
15.如權(quán)利要求9所述的在線訓練分類器的方法,其中所述確定包括 根據(jù)所述樣本圖像,利用當前選擇器模型選擇組成所述分類器的弱分類器并組成所述分類器;和 判斷所組成的分類器對所述樣本圖像的識別能力過剩,并且 所述更新包括 在所述識別能力過剩的情況下,尋找能夠提供針對所述樣本圖像的足夠識別能力的較小或最小選擇器數(shù)目;和 從所述當前選擇器模型中刪除所述較小或最小選擇器數(shù)目的選擇器之外的選擇器。
16.如權(quán)利要求10至13之一所述的在線訓練分類器的方法,其中所述統(tǒng)計模型是高斯模型。
全文摘要
提供一種用于在線訓練分類器的裝置和在線訓練分類器的方法。該用于在線訓練分類器的裝置包括確定部分,用于確定選擇器模型的識別能力是否適應樣本圖像;更新部分,用于在確定部分確定選擇器模型的識別能力不適應樣本圖像的情況下,根據(jù)樣本圖像更新選擇器模型;生成部分,用于根據(jù)樣本圖像,利用更新的選擇器模型選擇組成分類器的弱分類器,并組成分類器。本發(fā)明提供的用于在線訓練分類器的裝置和方法,能夠適應于樣本圖像自動地更新用于生成分類器的選擇器模型,使得基于該選擇器模型生成的分類器的分類準確度提高,分類速度加快。
文檔編號G06K9/62GK102955950SQ20111025665
公開日2013年3月6日 申請日期2011年8月16日 優(yōu)先權(quán)日2011年8月16日
發(fā)明者孟龍 申請人:索尼公司