本發(fā)明涉及用于圖像中的對象檢測的方法和設(shè)備。更具體而言,本發(fā)明涉及用于基于閾值可被更新的分類器來識別圖像中的對象的方法和設(shè)備。
背景技術(shù):
:近年來,圖像中的對象檢測/識別在圖像處理、計算機視覺和圖案識別領(lǐng)域中正獲得廣泛和重要的應(yīng)用,并且在其中起到了重要的作用。對象可以是人的臉部、手部、身體等中的任一種。自然圖像和視頻中的可靠的實時對象檢測是計算機視覺的長久夢想[對比文件1]。就檢測質(zhì)量而言,通用的對象檢測器在過去已經(jīng)獲得長足的進步。但是,這種進步部分地是由于使用更好的分類器函數(shù)、更多的訓練圖像以及多個特征集合導致的,而所有這些都導致了方法的運行時間增加?,F(xiàn)有技術(shù)的任意類別的對象檢測的實時系統(tǒng)因此仍未研究[對比文件2、3]。在相關(guān)技術(shù)中,對象檢測器還可被稱為分類器,該分類器執(zhí)行分類并由此檢測圖像中的對象。一般而言,分類器(還可被稱為對象檢測器,因此在本說明書上下文中可互換地使用)通常涉及一類對象(諸如人、動物、植物等),并且被用于檢測在要被檢測的圖像中是否存在這一類對象。在近期實踐中,用于同一類對象的至少一種分類器通常被級聯(lián)以被一起使用,這樣的級聯(lián)分類器還可等同于包含通常級聯(lián)的用于同一類對象的至少一個子分類器的分類器。因此,除非另外指出,否則本文中給出的涉及分類器的描述還可等同地應(yīng)用于單個分類器、級聯(lián)分類器以及具有至少一個級聯(lián)的子分類器的分類器。通常,在對象檢測期間,分類器需要閾值來確定輸入(諸如要被檢測的圖像或者其一部分)是真還是假。分類器的閾值在對象檢測期間通常是固定的,并且總是根據(jù)統(tǒng)計數(shù)據(jù)和經(jīng)驗被預先設(shè)定,或者通過向?qū)W習程序供給大量的訓練樣本(對象樣本和非對象樣本)而離線學習。在至少一個分類器被級聯(lián)以被使用或者具有至少一個子分類器的分類器被使用的情況下,級聯(lián)的分類器或子分類器各自的閾值也是固定的。在分類器的訓練集合大得足以能夠覆蓋不同背景和對象外觀的大多數(shù)變化時,固定閾值的使用是沒問題的。但是,當訓練集合小(在極端情況下,僅被給定一個對象樣本)時,將難以預先設(shè)定可以在大多數(shù)狀況下良好工作的合適的閾值。此外,為了適合于大多數(shù)情況,分類器的閾值必須被設(shè)定為更松散的值。因此,固定的且預先設(shè)定的閾值可能不夠準確以至于無法對于實際的和特定的輸入圖像有效地工作?,F(xiàn)有技術(shù)中已經(jīng)提出了一種在線更新分類器的提升級聯(lián)(boostedcascade)的方法,該方法通過使用在線學習來在線更新級聯(lián)的分類器各自的閾值[對比文件4、5],并且這樣的方法可被應(yīng)用于場景的視覺圖像或者被應(yīng)用于具有多個視頻幀的視頻序列。更具體而言,對于視頻幀的序列,可從上一視頻幀獲得多個否定樣本和肯定樣本以更新分類器的增幅級聯(lián),然后使用更新后的分類器來在下一幀中跟蹤目標。這意味著,該方法需要固定的背景以在線提供否定樣本,并且需要初始分類器來提供肯定樣本。然后,該方法可使用來自上一幀的正樣本和負樣本在線更新分類器以在下一幀中檢測對象。從上文描述可見,當前技術(shù)的分類器閾值的在線更新可在具有與要被檢測的圖像不同的場景的固定視覺圖像的固定狀況中使用,以從先前圖像幀來更新分類器的閾值,而不考慮要被檢測的圖像本身。此外,對于視頻幀序列的情況,這樣的方法可僅使用目標以及其在第一幀中的位置來預測目標在下一幀中的位置。視頻序列之間的以及基于先前幀的許多信息可被用于更新分類器的閾值。即,當前的更新方法 是使用不同于要被檢測的圖像的信息的其它信息來更新分類器的閾值。因此,盡管這樣的方法可被用于一組連續(xù)的和相關(guān)的圖像,但是其不能準確地被應(yīng)用于孤立的圖像或者一組不連續(xù)的且不相關(guān)的圖像,因為在這樣的情況中,分類器的閾值無法利用相關(guān)的和在前的圖像幀被有效地更新,甚至可能無法利用相關(guān)的和在前的圖像幀的信息。如上所述,仍需要如下的方法,該方法能夠基于分類器的被自適應(yīng)更新的閾值準確檢測孤立圖像中的或者一組不連續(xù)的且不相關(guān)的圖像中的每一個中的對象。[引文列表]1.Gonzalez,RafaelC.;RichardEugeneWoods(2007).DigitalImageProcessing.PrenticeHall.pp.407-413.ISBN013168728X,9780131687288.2.YichenWei,LitianTao,EfficientHistogram-BasedSlidingWindow,CVPR2010;3.C.H.Lampert.Detectingobjectsinlargeimagecollectionsandvideosbyefficientsubimageretrieval.InICCV,2009.4.H.Grabner,H.Bischof.On-lineboostingandvision.CVPR20065.H.Grabner,M.Grabner,andH.Bischof.Real-timetrackingviaon-lineboosting.BMVC2006技術(shù)實現(xiàn)要素:本發(fā)明是針對圖像中的對象的識別被開發(fā)的,并且旨在解決上述問題。在一個方面,提供了一種用于圖像中的對象檢測的設(shè)備,并且該設(shè)備包括判斷單元,被配置用于利用分類器判斷圖像中包含的多個子窗口中的每一個是否含有要被檢測的對象;閾值更新單元,被配置用于基于已被判斷為含有對象的預定數(shù)量的子窗口更新分類器的閾值, 并且更新后的閾值可隨后被判斷單元應(yīng)用于剩余的子窗口;以及收集單元,被配置用于收集多個子窗口中的已被判斷為含有對象的所有子窗口作為候選子窗口,以便基于候選子窗口來檢測圖像中的對象。在一種實現(xiàn)中,該判斷單元可包括被配置用于計算該分類器對于該子窗口的分類結(jié)果;以及被配置用于通過比較分類結(jié)果與分類器的閾值來確定該子窗口中是否含有該對象。在一種實現(xiàn)中,閾值更新單元可包括被配置用于將已被判斷為含有對象的預定數(shù)量的子窗口的分類結(jié)果進行排序的單元;以及被配置用于從排序的分類結(jié)果中選擇滿足預定條件的值以基于所選擇的值來更新分類器的閾值的單元。在一種實現(xiàn)中,選擇滿足預定條件的值可包括選擇排序的分類結(jié)果中的處于固定位置的結(jié)果。在另一種實現(xiàn)中,選擇滿足預定條件的值可包括選擇排序的分類結(jié)果的平均值。在一種實現(xiàn)中,排序的分類結(jié)果中的固定位置可以是排序的分類結(jié)果中的中間位置。在一種實現(xiàn)中,收集單元可進一步包括子窗口去除單元,被配置用于去除圖像中的其分類結(jié)果比更新后的閾值差的子窗口,從而剩余的子窗口將成為候選子窗口。在一種實現(xiàn)中,收集單元可進一步包括被配置用于組合具有相似位置的候選子窗口以確定最終的對象位置的單元。在一種實現(xiàn)中,該設(shè)備可進一步包括子窗口選擇單元,被配置用于從圖像中選擇子窗口,并且子窗口選擇單元可包括大小確定單元,被配置用于按照越來越大或者越來越小的順序來確定子窗口的大??;標記單元,用于通過由大小確定單元所確定的大小來標記輸入圖像中的每個位置是否可能含有所指定的對象;以及子窗口生成單元,被配置用于根據(jù)標記信息和所確定的大小來獲得所述圖像的一部分作為子窗口。在一種實現(xiàn)中,更新分類器的閾值可包括更新該分類器中包括的前預定數(shù)量的子分類器的閾值。在另一種實現(xiàn)中,更新分類器的閾值 可包括更新該分類器中包含的所有子分類器的閾值。在一種實現(xiàn)中,在該設(shè)備中,當預定數(shù)量的子窗口已被判斷為含有對象并且分類器的閾值已經(jīng)基于該預定數(shù)量的子窗口被更新時,當剩余子窗口中的另一預定數(shù)量的子窗口已被具有更新后的閾值的分類器判斷為含有對象時,該預定數(shù)量的子窗口以及該另一預定數(shù)量的子窗口的全部分類結(jié)果被排序,并且排序后的子窗口之中的預定數(shù)量的子窗口可被使用作為用于更新分類器的閾值的新的預定數(shù)量的子窗口。在另一種實現(xiàn)中,在該設(shè)備中,當預定數(shù)量的子窗口已被判斷為含有對象并且分類器的閾值已經(jīng)基于該預定的數(shù)量子窗口被更新時,將從中去除一些子窗口,并且當其余子窗口中的另一預定數(shù)量的子窗口已被具有更新后的閾值的分類器判斷為含有對象并且該預定數(shù)量的子窗口中的除了被去除的子窗口之外的子窗口與該另一預定數(shù)量的子窗口的總數(shù)量為該預定數(shù)量時,該預定數(shù)量的子窗口中的除了被去除的子窗口之外的子窗口和該另一固定數(shù)量的子窗口將全部作為用于更新分類器的閾值的新的預定數(shù)量的子窗口。在另一方面中,提供了一種用于圖像中的對象檢測的方法,該方法包括判斷步驟,用于利用分類器判斷圖像中包含的多個子窗口中的每一個是否含有要被檢測的對象;閾值更新步驟,用于基于已被判斷為含有對象的預定數(shù)量的子窗口更新分類器的閾值,并且更新后的閾值可隨后在判斷步驟中被用于剩余的子窗口;以及收集步驟,被配置用于收集多個子窗口中的已被判斷為含有對象的所有子窗口作為候選子窗口,以便基于候選子窗口來檢測圖像中的對象,其中該判斷步驟和閾值更新步驟依次對于該多個子窗口進行操作,直到該多個子窗口全部都被進行判斷為止。[技術(shù)效果]本發(fā)明的解決方案可有效地解決與一組不連續(xù)且不相關(guān)的圖像中的每一個中的對象檢測或者僅僅一個圖像中的對象檢測有關(guān)的問題。更特別地,本發(fā)明的解決方案可在對象檢測處理期間自適應(yīng)地更 新分類器的閾值,并且使得閾值對于特定檢測狀況更加準確和有效。在本發(fā)明中,在通過子窗口掃描和檢測來進行圖像的對象檢測期間,用于對象檢測的分類器的閾值參照要被檢測的圖像本身被在線更新,而不使用來自任何其他圖像的信息,因此在線更新的閾值將被有效地用于當前圖像。即,根據(jù)本發(fā)明,分類器的閾值的更新可專用于要被檢測的圖像本身,并且可通過該圖像的先前檢測結(jié)果來實現(xiàn),從而更新后的閾值可被更有效地應(yīng)用于圖像,并且識別準確度可被有效地提高。此外,由于分類器的閾值的更新是在執(zhí)行圖像檢測的同時被執(zhí)行,因此分類器不需要額外學習其他樣本,并且檢測過程可被進一步加速。從參照附圖的示例性實施例的以下描述,本發(fā)明的其它特征將變得清晰。附圖說明并入說明書中并且構(gòu)成說明書的一部分的附圖示出了本發(fā)明的實施例,并且與描述一起用于解釋本發(fā)明的原理。在附圖中,相似的附圖標記指示相似的項目。圖1示出了現(xiàn)有技術(shù)中的對象檢測的典型過程。圖2是示出可實現(xiàn)本發(fā)明的實施例的計算機系統(tǒng)的示例性硬件配置的框圖。圖3是示出根據(jù)實施例的對象檢測方法的流程圖。圖4是示出根據(jù)實施例的判斷步驟中的處理的流程圖。圖5是示出根據(jù)實施例的子窗口選擇處理中的處理的流程圖。圖6是示出根據(jù)實施例的閾值更新步驟中的處理的流程圖。圖7是示出根據(jù)實施例的收集步驟中的處理的流程圖。圖8是示出根據(jù)實施例的對象檢測設(shè)備的框圖。具體實施例描述下文將參照附圖詳細描述本發(fā)明的實施例。應(yīng)注意,在附圖中相似的附圖標記和字母指示相似的項目,并且因此一旦一個項目在一個附圖中被定義,則對于隨后的附圖無需再對其進行論述。為了有助于透徹地并且適當?shù)乩斫獗景l(fā)明,下文將首先解釋本公開的上下文中所使用的術(shù)語的含義。在本公開的上下文中,圖像可指的是多種圖像中的任一種,諸如彩色圖像、灰度圖像等,并且通常在其中可包含至少一個對象。應(yīng)指出,在本說明書的上下文中,圖像的類型未被具體限制,只要這樣的圖像可在分類器中經(jīng)受處理以便可檢測該圖像是否含有對象即可。在本說明書的上下文中,圖像含有對象指的是圖像中含有該對象的圖像。在本說明書的上下文中,子窗口通常對應(yīng)于當子窗口被放置在圖像上時圖像中的在該子窗口下面的與該子窗口對應(yīng)的子圖像區(qū)域,并且為了清楚起見,在本說明書的上下文中,子窗口將與圖像中的子圖像區(qū)域可交換地使用,因此圖像中包括的子窗口等同于圖像中包括的子圖像區(qū)域,并且分類器中的對于該子窗口的處理可指的是分類器中的對于該子圖像區(qū)域的處理。在說明書的上下文中,術(shù)語“在線”基本指的是分類器的閾值的更新處理可在對象檢測處理期間被實行。在說明書的上下文中,術(shù)語“自適應(yīng)”基本指的是分類器的閾值的更新是基于要被檢測的圖像自身的。在本公開中,術(shù)語“第一”、“第二”等僅僅用于區(qū)分元素或者步驟,而不是要指示時間順序、優(yōu)先選擇或者重要性。圖2是示出可實施本發(fā)明的實施例的計算機系統(tǒng)1000的示例性硬件配置的框圖。如圖2所示,計算機系統(tǒng)包括計算機1110。計算機1110包括處理單元1120、系統(tǒng)存儲器1130、不可移除非易失性存儲器接口1140、可移除非易失性存儲器接口1150、用戶輸入接口1160、網(wǎng)絡(luò)接口1170、視頻接口1190、和輸出外圍接口1195,它們通過系統(tǒng)總線1121連接。系統(tǒng)存儲器1130包括ROM(只讀存儲器)1131和RAM(隨機 存取存儲器)1132。BIOS(基本輸入輸出系統(tǒng))1133駐留在ROM1131中。操作系統(tǒng)1134、應(yīng)用程序1135、其它程序模塊1136和一些程序數(shù)據(jù)1137駐留在RAM1132中。不可移除非易失性存儲器1141(諸如硬盤)連接到不可移除非易失性存儲器接口1140。不可移除非易失性存儲器1141可存儲諸如操作系統(tǒng)1144、應(yīng)用程序1145、其它程序模塊1146以及一些程序數(shù)據(jù)1147。可移除非易失性存儲器(例如軟盤驅(qū)動器1151和CD-ROM驅(qū)動器1155)連接到可移除非易失性存儲器接口1150。例如,軟盤1152可插入軟盤驅(qū)動器1151,并且CD(光盤)1156可插入CD-ROM驅(qū)動器1155。諸如鼠標1161和鍵盤1162的輸入設(shè)備連接到用戶輸入接口1160。計算機1110可通過網(wǎng)絡(luò)接口1170連接到遠程計算機1180。例如,網(wǎng)絡(luò)接口1170可經(jīng)局域網(wǎng)1171連接到遠程計算機1180。可替換地,網(wǎng)絡(luò)接口1170可連接到調(diào)制解調(diào)器(調(diào)制器-解調(diào)器)1172,并且調(diào)制解調(diào)器1172經(jīng)廣域網(wǎng)1173連接到遠程計算機1180。遠程計算機1180可包括諸如硬盤的存儲器1181,其存儲遠程應(yīng)用程序1185。視頻接口1190連接到監(jiān)視器1191。輸出外圍接口1195連接到打印機1196和揚聲器1197。圖2所示的計算機系統(tǒng)僅是說明性的,并且決不打算限制本發(fā)明、其應(yīng)用或者使用。圖2所示的計算機系統(tǒng)可對于任一實施例被實現(xiàn)為孤立計算機,或者設(shè)備中的處理系統(tǒng),其中可去除一個或多個不必要的組件或者可添加一個或多個附加的組件。下文將參照附圖描述根據(jù)本發(fā)明的基本實施例的對象檢測方法,該附圖示出了根據(jù)本發(fā)明的基本實施例的方法中的處理。在本發(fā)明中,提出了新穎的用于通過自適應(yīng)地在線更新對象檢測器的閾值來進行對象檢測的方法,該方法可在小的訓練集合上甚至單個待檢測的圖像上 被有效和準確地實施。在本發(fā)明中,對象檢測器一開始被給予松散的閾值,該閾值可檢測處于各種背景的對象(但是具有許多虛警)。這樣的松散閾值可依照經(jīng)驗或者根據(jù)小的訓練集合(其遠小于目前使用的訓練集合)被設(shè)定。在利用這樣的對象檢測器檢測對象期間,本方法利用圖像中包含的先前部分的檢測結(jié)果自適應(yīng)地調(diào)整對象檢測器的閾值,以隨同檢測操作的進行一起快速且準確地確定最優(yōu)閾值,從而獲得圖像中包含的對象的準確檢測結(jié)果。上文所述的這樣的更新處理還可等同地應(yīng)用于級聯(lián)分類器或者具有級聯(lián)的子分類器的分類器,并且在這樣的情況中,級聯(lián)分類器或者級聯(lián)的子分類器中的每一個可如上所述在對象檢測期間被自適應(yīng)地更新。接下來,將參照圖3描述根據(jù)本發(fā)明的實施例的對象檢測方法,圖3示出了這種方法的流程圖。在本發(fā)明的步驟S301(還被稱為判斷步驟),利用分類器依次判斷圖像中包含的多個子窗口中的每一個是否含有要被檢測的對象。在本發(fā)明的步驟S302(還被稱為閾值更新步驟)中,每當預定數(shù)量的子窗口通過了該分類器時就更新分類器的閾值,并且更新后的閾值可隨后被在判斷步驟中被用于剩余的子窗口在本發(fā)明的步驟S303(還被稱為收集步驟)中,收集該多個子窗口中的通過了分類器的所有子窗口作為候選子窗口,以便基于候選子窗口來識別圖像中的對象。應(yīng)指出,對于要被檢測的圖像中的多個子窗口,從多個子窗口中的第一子窗口起,該判斷步驟和閾值更新步驟將對于多個子窗口依次執(zhí)行,直到所述多個子窗口全部被進行判斷為止。然后,將對于已經(jīng)被判斷為含有對象的子窗口執(zhí)行該收集步驟,以完成對象檢測。通常,根據(jù)本實施例的方法按照特定順序依次檢測圖像的多個子窗口中的每一個(例如,該特定順序是從右上角的子窗口到左下角的子窗口,但是該檢測序列不被特別限制,只要可遍歷整個圖像即可),當預定數(shù)量的子窗口已經(jīng)被判斷為含有對象,則用于檢測的分類器的 閾值將被更新,然后被用于隨后的子窗口的檢測。這樣的閾值更新和子窗口檢測可被重復進行,直到圖像中包含的所有子窗口已被進行判斷。然后,被判斷為含有對象的所有子窗口將被收集,從而圖像中包含的對象將被最終檢測到。通過這樣的方法,對象檢測中使用的對象檢測器的閾值可隨著檢測操作的進行一起被更新,并且具體地對于要被檢測的圖像本身被更新,從而與現(xiàn)有技術(shù)中的技術(shù)相比,本發(fā)明的方法不僅提高了對象檢測精度,而且還加速了檢測處理。應(yīng)指出,本發(fā)明的方法的步驟中描述的術(shù)語“分類器”應(yīng)被看做單個分類器、分類器的級聯(lián)以及具有級聯(lián)的子分類器的分類器中的任一種,并且可獲得類似的技術(shù)效果。下文,為了便于理解本發(fā)明的思想,將詳細描述該實施例的各個步驟中的處理。通常,根據(jù)該實施例的方法的判斷步驟可對于待檢測的圖像中包含的多個子窗口中的每一個被執(zhí)行,直到圖像中包含的所有子窗口已被處理為止,并且主要旨在判斷每個子窗口中是否含有指定的對象。判斷步驟可被以多種方式實現(xiàn),并且通常通過對象檢測器(即,分類器)被執(zhí)行。下文將參照圖4描述根據(jù)該實施例的方法的判斷步驟中的示例處理。應(yīng)指出,如圖4所示的處理僅是示例性的,并且任何其他的基于閾值的判斷處理也可被使用。如圖4所示,對于圖像中包含的每個子窗口,首先計算通過分類器處理該子窗口的分類結(jié)果(步驟S401),然后,通過比較分類結(jié)果與分類器的閾值來確定對象是否被包含在該子窗口中(步驟S402)。分類器結(jié)果可被以多種方式計算,因此可表現(xiàn)為多種形式。例如,諸如通過根據(jù)分類器的特征定義從所述子窗口提取特征,并且計算該子窗口的特征與分類器的特征之間的差值,可計算子窗口與分類器的特征之間的差值作為使用分類器對于子窗口的分類結(jié)果。特征提取和計算在本領(lǐng)域中是已知的,因此為了清楚起見在此被省略。當然,分類結(jié)果可被以任何其他方式實現(xiàn),并且可以是本領(lǐng)域中已知的任何其 他形式,只要其可與分類器的閾值進行比較即可。在已經(jīng)計算出分類器對于對象的分類結(jié)果之后,這樣的分類結(jié)果將與分類器的對于該對象的閾值進行比較以確定該子窗口是否含有該對象。通常,如果分類結(jié)果比對應(yīng)的閾值差(通常是大于該對應(yīng)閾值,當然如果需要的話也可以是其他形式),判斷所述子窗口中不含有指定的對象,即,分類器的確定將獲得為假的結(jié)果,或者子窗口未能通過該分類器;如果分類結(jié)果比對應(yīng)閾值好(通常是小于該對應(yīng)閾值,當然,如果需要的話也可以是其他形式),判斷所述子窗口中含有指定的對象,即,分類器的確定將獲得為真的結(jié)果,或者子窗口通過了該分類器。實際上,多個分類器的級聯(lián)通常被用于檢測子窗口是否包含對象,其中每個分類器具有其自己的對應(yīng)閾值,因此該級聯(lián)中包含的每個分類器的對于該子窗口的分類結(jié)果將被相應(yīng)地計算。應(yīng)指出,級聯(lián)中包含的不同分類器可具有不同的特征定義和特征提取方法,甚至是不同的計算方法。因此,對于子窗口的分類器結(jié)果與閾值之間的這種比較將對于級聯(lián)的分類器中的每個從第一個分類器開始執(zhí)行。當對于一個分類器,分類結(jié)果比對應(yīng)閾值差,則將判斷子窗口中不含有指定的對象,然后將直接確定子窗口未能通過分類器的級聯(lián),對于該級聯(lián)中的剩余分類器的處理將不再執(zhí)行。即,只要該級聯(lián)中包含的一個分類器獲得假結(jié)果,將判斷子窗口中未含有該對象。另一方面,當對于一個分類器,分類結(jié)果比對應(yīng)閾值好,則處理將進行至級聯(lián)中包含的下一分類器,然后對于隨后級聯(lián)的分類器重復進行如上所述的計算和比較。直到該級聯(lián)中包含的所有分類器的每個分類結(jié)果都比對應(yīng)閾值好,則將判斷所述子窗口中含有指定的對象。即指定的對象已經(jīng)通過了分類器的級聯(lián)。即,只有當級聯(lián)中包含的所有分類器都獲得真結(jié)果,才判斷子窗口中包含該對象??紤]到在本說明書的上下文中,分類器的級聯(lián)等同于包含具有各自閾值的至少一個子分類器的分類器,因此上述描述還可適合于包含 至少一個子分類器的分類器,更具體而言,當分類器中包括的所有子分類器對于該子窗口都獲得真結(jié)果,則將判斷該子窗口含有對象,即對象通過了該分類器,而只要分類器中包含的一個子分類器對于該子窗口獲得假結(jié)果,則將判斷子窗口不含有對象,即對象未能通過該分類器。當子窗口已經(jīng)通過了所述級聯(lián)中的所有分類器時,該子窗口將被認為是候選子窗口,并且將被根據(jù)該實施例的方法進一步處理。對于利用分類器的判斷處理,首先在整個圖像中獲得/選擇多個子窗口,并且可將該多個子窗口排序為子窗口序列,然后從所獲得的/選擇的子窗口序列中的第一子窗口開始,使得該多個子窗口中的每一個經(jīng)受分類器中的處理以確定該子窗口是否含有對象。所獲得的子窗口序列將以多種方式遍歷要被檢測的圖像,諸如從左上角到右下角自上而下地遍歷,從左上角到右下角自左到右地遍歷等,因此所獲得的多個子窗口可相應(yīng)地被排序。所獲得的子窗口的序列不被這樣限制,只要整個圖像可被子窗口遍歷即可。從圖像獲得的子窗口的形式可被以多種方式實現(xiàn)。通常,所獲得的子窗口可以是矩形形狀、方形形狀、圓形形狀等中的任一種。子窗口的形狀未被特別限制,只要由此獲得的所有子圖像區(qū)域可完全覆蓋圖像即可。通常,子窗口的大小在從圖像獲得這樣的子窗口期間是固定的。例如,從圖像的左上點開始,將從圖像依次選擇固定大小的子圖像區(qū)域,從而子圖像區(qū)域?qū)⒆鳛樽哟翱诮?jīng)受分類器中的處理。當然,子窗口的獲得還可從圖像的其他位置開始,只要整個圖像可被子窗口遍歷即可。圖像中選擇的相鄰的子窗口通常相互重疊,而重疊比未被特別限制,只要相鄰子窗口未完全重疊即可。在另一種實現(xiàn)中,相鄰的子窗口可不相互重疊,而是彼此緊鄰以使得在相鄰子窗口之間不存在任何空白部。通常,子窗口的數(shù)目越大,則速度越慢,但是圖像檢測的精度越高。在優(yōu)選實現(xiàn)中,為了進一步改進圖像中的對象檢測,子窗口可被以改進方式選擇。更具體而言,根據(jù)該實施例的改進的子窗口的選擇的思路在于,通過基于子窗口的分類結(jié)果自適應(yīng)地改變子窗口的大小以在這樣的選擇期間自適應(yīng)地設(shè)定子窗口的大小,從而對于圖像的不同部分可設(shè)定適當?shù)淖哟翱诖笮?。下文將參照圖5描述這種改進的子窗口的選擇。首先,按照越來越大或者越來越小的順序來確定子窗口的大小(步驟S501)。通常,子窗口的大小越小,所選擇的子窗口的數(shù)量越大。因此,按照越來越大或者越來越小的順序來選擇子窗口的方法可使得閾值更新單元更加有效。然后,關(guān)于從所述大小確定步驟獲得的特定大小,標記所述圖像中的位置是否可能包含所指定的對象(步驟S502)。如果一個子窗口通過分類單元判斷含有所指定的對象,則對應(yīng)的位置將被標記為真;否則,對應(yīng)的位置將被標記為假。在此處理中,每個位置的對于特定的子窗口大小的結(jié)果可被保留用于子窗口生成單元中的對于下一子窗口大小的處理操作。然后,根據(jù)標記信息以及確定的大小生成所述圖像的一部分作為子窗口(步驟S503)。當通過大小確定單元確定子窗口的大小時,該設(shè)備總是首先選擇被標記為真的位置。當被標記為真的所有位置都被以相同子窗口大小選擇時,其他被標記為假的位置將被選擇。該方法還可使得閾值更新單元更加有效。在這樣的子窗口選擇的一種實現(xiàn)中,從第一子窗口起,子窗口的大小將基于這樣的子窗口中的對象檢測結(jié)果被設(shè)定。當結(jié)果為假時,這樣的子窗口中可能不含有對象,子窗口的大小將保持用于后續(xù)的子窗口中,直到接下來的子窗口被確定為含有指定的對象。當預定數(shù)量的連續(xù)的子窗口的對象檢測結(jié)果為真時,即認為在這樣的由子窗口構(gòu)成的區(qū)域中可含有指定的對象時,將對于這樣的區(qū)域執(zhí)行子窗口選擇處理以對于這樣的區(qū)域重新設(shè)定適當?shù)淖哟翱诖笮?從較大向較小改變)以更準確地確定對象的位置,然后改變的子窗口大小被保持用于 后續(xù)窗口。然后,當對于預定數(shù)量的連續(xù)的子窗口,對象檢測結(jié)果為假時,即認為在這樣的由子窗口構(gòu)成的區(qū)域中可能不含有指定的對象時,將對于這樣的區(qū)域執(zhí)行子窗口選擇處理以對于這樣的區(qū)域重新設(shè)定適當?shù)淖哟翱诖笮?從較小向較大改變)以加速子窗口選擇,然后改變的子窗口大小被保持用于后續(xù)窗口。這樣的子窗口大小改變將重復進行,直到整個圖像可被選擇的子窗口覆蓋為止。通過這樣的處理,子窗口的大小/數(shù)量可對于圖像的不同部分被適當?shù)卦O(shè)定,從而對于可能包含指定的對象的部分,在這樣的部分中可選擇更加密集的子窗口,而對于可能不包含指定的對象的部分,在這樣的部分中可選擇更加稀疏的子窗口。通過這樣改進的子窗口獲得方法,對于要被檢測的圖像可自適應(yīng)地選擇更加有效和適當?shù)淖哟翱?,從而所選擇的子窗口序列可使得對象檢測更加準確,同時進一步加速對象檢測。下文,將參照圖6描述閾值更新步驟中的處理。原則上,更新處理在于在對于圖像中的多個子窗口的對象檢測期間,基于已經(jīng)通過了分類器的預定數(shù)量的子窗口更新該分類器的閾值,從而具有更新后的閾值的分類器可被用于圖像中的該多個子窗口中的除了該預定數(shù)量的子窗口之外的剩余子窗口。子窗口的預定數(shù)量可被操作員根據(jù)經(jīng)驗任意設(shè)定,例如可以是100。換句話說,從圖像中的多個子窗口中的第一子窗口開始,隨著依次對于每個子窗口執(zhí)行對象檢測,當要被檢測的圖像中的該多個子窗口中包含的預定數(shù)量的子窗口已經(jīng)通過了分類器(即,被分類器判斷為含有對象),則分類器的閾值將被從對應(yīng)于該預定數(shù)量的子窗口的分類結(jié)果確定的最優(yōu)閾值替代,然后具有最優(yōu)閾值的分類器將被用于處理剩余子窗口。在更新處理的步驟S601中,可將已經(jīng)通過了分類器的預定數(shù)量的子窗口各自的分類結(jié)果進行排序。通常,已經(jīng)通過了分類器的預定數(shù)量的子窗口各自的分類結(jié)果可 被以多種方式進行排序,優(yōu)選地被按照從較好結(jié)果到較差結(jié)果的順序進行排序,其中較好指的是子窗口更有可能含有圖像中的對象,而較差指的是子窗口不太可能含有圖像中的對象。例如,當分類結(jié)果例如是如上所述的差值時,差值越小,則分類結(jié)果越好,并且分類結(jié)果將按照差值的升序排序。當然,較好和較差的含義還可以是不同于上文的含義,并且分類結(jié)果可相應(yīng)地被排序。應(yīng)指出,這樣的排序處理不必須被包含于閾值更新步驟中,只要分類結(jié)果在閾值更新之前已被排序即可。當使用單個分類器時,預定數(shù)量的子窗口的分類結(jié)果將以列表的形式被排序,而當使用多個分類器的級聯(lián)時,預定數(shù)量的子窗口的分類結(jié)果將以矩陣的形式被排序,在這種情況中,排序?qū)⒒诩壜?lián)中的第一分類器的分類結(jié)果,而當?shù)谝环诸惼鞯姆诸惤Y(jié)果相同時,將按照級聯(lián)中的第二分類器的分類結(jié)果進行排序,諸如此類。在更新處理的步驟S602中,從經(jīng)排序的分類結(jié)果確定最優(yōu)值,以便根據(jù)該最優(yōu)值更新分類器的閾值。優(yōu)選地,將從經(jīng)排序的分類結(jié)果中選擇某一分類結(jié)果作為最優(yōu)值,并且參照所選擇的分類結(jié)果,相應(yīng)地更新分類器的對應(yīng)閾值。例如,當分類結(jié)果是例如如上確定的差值時,所選擇的最優(yōu)差值將被確定為分類器的更新后的閾值。這樣的某一分類結(jié)果的選擇可被以多種方式執(zhí)行。在一個方面,選擇經(jīng)排序的分類結(jié)果中的預定位置處的結(jié)果。優(yōu)選地,這樣的預定位置可以是經(jīng)排序的分類結(jié)果中的中間位置,或者經(jīng)排序的分類結(jié)果中的最后位置。例如,預定位置是經(jīng)排序的分類結(jié)果中的第100個位置。經(jīng)排序的序列中的第100個分類結(jié)果將被選擇作為最優(yōu)值以更新分類器的閾值。如果經(jīng)排序的序列的總數(shù)少于100個,則將不生成最優(yōu)閾值。當然,用戶可參照經(jīng)驗利用經(jīng)排序的分類結(jié)果中的任何其它位置。在另一方面,這樣的最優(yōu)值可從經(jīng)排序的分類結(jié)果中以數(shù)學方式獲得。例如,這樣的最優(yōu)值可以是預定數(shù)量的分類結(jié)果的數(shù)學統(tǒng)計值, 例如均值等。當實際上使用多個分類器的級聯(lián)執(zhí)行對象檢測時,級聯(lián)的分類器的閾值的更新可被以多種方式執(zhí)行。在一個方面中,分類器中包含的前預定數(shù)量的子分類器的閾值可被更新。例如,當分類器包括五個級聯(lián)的子分類器時,前三個子分類器的閾值可被更新。在另一方面中,分類器中包含的全部子分類器的全部閾值可被更新。應(yīng)指出,預定數(shù)量的子窗口已經(jīng)通過了分類器是這樣的閾值更新的觸發(fā)器。更具體而言,從要被檢測的圖像中的第一子窗口起,對于每一子窗口依次執(zhí)行對象檢測,并且一旦這樣的預定數(shù)量的子窗口已經(jīng)獲得肯定的分類結(jié)果,就執(zhí)行這樣的閾值更新處理。在閾值更新之后,對于圖像中的在該預定數(shù)量的子窗口之后的子窗口,可繼續(xù)進行閾值更新處理。在一種實現(xiàn)中,在分類器的閾值已經(jīng)基于所述預定數(shù)量的子窗口被更新之后,這樣的預定數(shù)量的分類結(jié)果可保留。當具有更新后的閾值的分類器被用于剩余子窗口的對象檢測,并且至少一個新的子窗口已經(jīng)通過了具有更新后的最優(yōu)閾值的分類器時,這樣的閾值更新將被再次執(zhí)行。在這樣的情況中,所述至少一個新的子窗口可被添加到先前的預定數(shù)量的子窗口中。此時,至少一個新加入的子窗口和先前的預定數(shù)量的子窗口的全部分類結(jié)果將進一步被以先前方式排序,諸如按升序方式排序,并且優(yōu)選地,這樣的分類處理可在閾值更新步驟中被執(zhí)行。在這樣的添加和排序之后的子窗口中的前預定數(shù)量的子窗口的分類結(jié)果可被用于獲得分類器的用以處理剩余的子窗口的新最優(yōu)閾值,并且在這樣的情況中,如前文描述的閾值更新步驟中的用于預定數(shù)量的子窗口的排序步驟可被省略。閾值的這種更新將依次進行,直到所有子窗口已被處理。應(yīng)指出,該至少一個新的子窗口的數(shù)量可由用戶根據(jù)經(jīng)驗設(shè)定,例如為1、5等。在另一種實現(xiàn)中,在分類器的閾值已經(jīng)基于這樣的預定數(shù)量的子窗口被更新之后,這樣的預定數(shù)量的分類結(jié)果可被進一步處理以去除 其中的一部分。例如,對應(yīng)于該預定數(shù)量的子窗口的分類結(jié)果中的比最優(yōu)值差的那些分類結(jié)果可被去除。優(yōu)選地,這樣的去除處理可在閾值更新步驟中執(zhí)行。然后,當已經(jīng)通過了具有更新后的最優(yōu)閾值的分類器的一些新的子窗口被添加從而使得候選子窗口的數(shù)量再次達到該預定數(shù)量時,再次執(zhí)行這樣的閾值更新。在這樣的情況中,該預定數(shù)量的子窗口中除了被去除的子窗口之外的子窗口和該新添加的子窗口全部作為獲得分類器的用于處理剩余的子窗口的新最優(yōu)閾值的基礎(chǔ)。這樣的閾值更新可依次進行,直到所有的子窗口已被處理。此外,這樣的更新處理可按多種方式與上述改進的子窗口選擇處理相結(jié)合。例如,這樣的更新處理可在圖像中的子窗口已通過可能基于初始閾值的上述改進的子窗口選擇處理被全部選擇之后被執(zhí)行,從而可對于改進的被選擇的子窗口執(zhí)行閾值更新,并且對象檢測的速度和精度可被提高。作為替代,這樣的更新處理可在正在通過上文所述的改進的子窗口選擇處理選擇圖像中的子窗口的同時被執(zhí)行。即,子窗口的選擇可隨著閾值更新一起進行。例如,在要被檢測的圖像可被劃分成預定數(shù)量的區(qū)域的情況下,對于每個區(qū)域,子窗口可如上所述地基于閾值被改進地選擇,并且閾值可隨后基于這樣選擇的子窗口被更新。這樣的選擇和更新處理可從第一區(qū)域到最后的區(qū)域依次執(zhí)行。因此,子窗口選擇和閾值更新可關(guān)于要被檢測的圖像被更適當?shù)貓?zhí)行,并且對象檢測的速度和精度可進一步提高。下文,將參照圖7描述收集步驟中的處理。在這樣的收集步驟的處理中,該多個子窗口中的通過了具有更新后的最優(yōu)閾值的分類器的所有子窗口被收集,從而可確定指定對象的最終位置并且可從該圖像檢測到對象。優(yōu)選地,在這樣的收集處理中可執(zhí)行子窗口去除步驟(S701)以加速對象檢測。更具體而言,在確定分類器的最優(yōu)閾值同時利用分類器處理了圖像中的所有子窗口之后,分類器的最終的最優(yōu)閾值可被 用于去除分類結(jié)果中的比該更新后的最終閾值差的那些子窗口,并且作為結(jié)果的子窗口被組合以檢測圖像中的對象。在一種實現(xiàn)中,在確定分類器的最優(yōu)閾值的同時利用分類器處理了圖像中的所有子窗口之后,將使用最終的最優(yōu)閾值來在分類器中對于圖像中的所有子窗口再次進行處理以重新確定每個子窗口是否含有指定的對象,類似于如前文所述的判斷步驟中的處理。因此,最終確定為不含有指定的對象的那些子窗口將被去除。在另一種實現(xiàn)中,這樣的去除處理還可僅針對在閾值的更新期間被確定為通過了分類器的那些子窗口,即,將從在閾值更新期間被確定為通過了分類器的那些子窗口中去除比最終的最優(yōu)閾值差的子窗口,并且這樣的去除處理將進一步加速對象檢測。當然,當如上所述的閾值更新步驟中的去除處理已在閾值更新處理期間執(zhí)行時,該子窗口去除處理可不再次執(zhí)行。應(yīng)指出,這樣的去除步驟不必須被包含在收集處理中,并且即使不包含這樣的去除步驟,這樣的收集處理仍可準確地檢測圖像中的指定的對象。這樣的情況由用于步驟S701的虛線框被說明。然后,在去除之后得到的子窗口可被組合(S702)。這樣的組合可被以多種方式執(zhí)行。在一種實現(xiàn)中,剩余的具有相似位置的候選子窗口可被組合以便確定指定對象的最終位置。許多最終的子窗口可處于相似位置,然后可將它們的平均位置和大小確定為最終的指定位置和大小。另一方面,當可能存在具有不同位置的多個子窗口時,這可能意味著圖像中存其他指定的對象,然后可如上所述地確定其他對象的位置。通過上述處理,可最終準確地確定圖像中的對象。圖8是示出了根據(jù)該實施例的對象檢測設(shè)備的框圖。對象檢測設(shè)備以及其中包含的單元可被硬件、固件、軟件中的任一種或者它們的任何組合實現(xiàn),只要對象檢測設(shè)備中的單元可實現(xiàn)上述對象檢測方法的對應(yīng)步驟的功能即可。對象檢測設(shè)備800可包括判斷單元801,被配置用于利用分類器判斷圖像中包含的多個子窗口中的每一個是否含有要被檢測的對象;閾值更新單元802,被配置用于基于已被判斷為含有該對象的預定數(shù)量的子窗口更新分類器的閾值,并且更新后的閾值可隨后被該判斷單元用于剩余的子窗口;以及收集單元803,被配置用于收集該多個子窗口中的已被判斷為含有該對象的所有子窗口作為候選子窗口,以便基于候選子窗口來檢測圖像中的對象。優(yōu)選地,該判斷單元801可包括被配置用于計算通過該分類器對于子窗口的分類結(jié)果的單元801-1,以及被配置用于通過比較分類結(jié)果與分類器的閾值來確定對象是否被包含在該子窗口中的單元801-2。優(yōu)選地,閾值更新單元802可包括被配置用于將已被判斷為含有該對象的預定數(shù)量的子窗口的分類結(jié)果進行排序的單元802-1;和被配置用于從排序的分類結(jié)果中選擇滿足預定條件的值以基于所選擇的值來更新分類器的閾值的單元802-2。優(yōu)選地,收集單元802可包括子窗口去除單元803-1,被配置用于去除圖像中的其分類結(jié)果比更新后的閾值差的子窗口,從而剩余的子窗口將成為候選子窗口,和子窗口組合單元803-2,被配置用于組合具有相似位置的候選窗口以確定最終對象位置。應(yīng)指出,如在收集步驟中那樣,這樣的子窗口去除單元對于收集單元也不是必須的,并且可從收集單元中省去。這樣的情況由用于單元803-1的虛線框說明。優(yōu)選地,該對象檢測設(shè)備800可進一步包括子窗口選擇單元804,被配置用于從圖像中選擇子窗口,并且子窗口選擇單元804可包括大小確定單元804-1,被配置用于按照越來越大或者越來越小的順序來確定子窗口的大小;標記單元804-2,被配置用于通過從大小確定單元得到的大小來標記所述輸入圖像中的每個位置是否可能包含所指定的對象;以及子窗口生成單元804-3,被配置用于根據(jù)標記信息和所確定的大小來獲得所述圖像的一部分作為子窗口。應(yīng)指出,這樣的子窗口選擇單元對于對象檢測設(shè)備也不是必須的,并且即使其不包含在對象檢測設(shè)備中,這樣的對象檢測設(shè)備仍可實現(xiàn)足夠改進的技術(shù)效果。 這樣的情況由用于單元804以及單元804-1、804-2和804-3的虛線框說明。應(yīng)指出,上述所述的單元可代表可表現(xiàn)為多種形式(諸如固件、硬件、軟件或者它們的任意組合)的并且實現(xiàn)前文已經(jīng)描述的方法中的對應(yīng)步驟的功能的任何組件。[有利效果]在本發(fā)明中,用于對象檢測的分類器的閾值參照要被檢測的圖像本身在該圖像的對象檢測期間被在線更新,從而更新后的閾值可被更有效地應(yīng)用于該圖像,并且識別精度可被有效地提高。此外,由于在執(zhí)行圖像檢測的同時執(zhí)行分類器的閾值的更新,因此分類器不需要額外地學習其他樣本,并且檢測處理可進一步加速。[實驗結(jié)果]為了說明本發(fā)明的進步,進行了一些實驗來示出根據(jù)本發(fā)明的方法的性能?!裢ㄟ^教練機檢測視頻教練機(Gibbon\SDC10452_capWin_458.bmp);視頻(Gibbon\SDC10453.avi)方法分類次數(shù)速度常規(guī)的滑動子窗口搜索方法多于120,000次0.24fps根據(jù)本發(fā)明的方法小于10,000次3.93fps從上文可見,很明顯根據(jù)本發(fā)明的方法可顯著加速圖像中的對象檢測。進一步在用戶注冊對象檢測(UROD)系統(tǒng)環(huán)境中評估本發(fā)明的性能。本發(fā)明的指定對象檢測方法被用于用戶給定的指定對象的一次樣本(one-shotsample),采樣器的級聯(lián)被創(chuàng)建以自適應(yīng)地檢測用戶注冊對象;并且用戶注冊對象將被使用所述分類器的級聯(lián)和所述對象檢測裝置從輸入視頻幀定位。在所述UROD系統(tǒng)中在分類器的級聯(lián)中存在兩個分類器。具有或者不具有所述對象檢測設(shè)備的UROD系統(tǒng)的 性能已被評估。比較本發(fā)明與3/E中的版本(其他方面沒有修改)方法查全率速度拒絕率速度舊方法90.83%1.12fps5.09%2.13fps本發(fā)明的方法92.35%2.76fps2.1%5.52fps測試結(jié)果顯示:●本發(fā)明的新方法可將計算加速約1.5倍,而精度沒有損失●本發(fā)明的新方法在UROD中比舊方法更好。[工業(yè)應(yīng)用性]本發(fā)明可被用于許多應(yīng)用。例如,本發(fā)明可被用于檢測和跟蹤圖像中的對象,諸如照相機中的笑容檢測,觀眾響應(yīng)系統(tǒng)或者自動照片注釋。利用本發(fā)明,這樣的應(yīng)用可被準確和快速地實現(xiàn)。應(yīng)指出,文中所述的方法和設(shè)備可被實現(xiàn)為軟件、固件、硬件或它們的任何組合。有些組件可例如被實現(xiàn)為在數(shù)字信號處理器或者微處理器上運行的軟件。其他組件可例如實現(xiàn)為硬件和/或?qū)S眉呻娐贰A硗?,可采用多種方式來實行本發(fā)明的方法和系統(tǒng)。例如,可通過軟件、硬件、固件或它們的任何組合來實行本發(fā)明的方法和系統(tǒng)。上文所述的該方法的步驟的順序僅是說明性的,并且除非另外具體說明,否則本發(fā)明的方法的步驟不限于上文具體描述的順序。此外,在一些實施例中,本發(fā)明還可具體化為記錄介質(zhì)中記錄的程序,包括用于實施根據(jù)本發(fā)明的方法的機器可讀指令。因此,本發(fā)明還涵蓋了存儲用于實施根據(jù)本發(fā)明的方法的程序的記錄介質(zhì)。雖然已經(jīng)參考示例實施例描述了本發(fā)明,應(yīng)當理解,本發(fā)明不限于公開的示例實施例。下面的權(quán)利要求的范圍將被給予最寬泛的解釋,以便包含所有這些修改以及等同結(jié)構(gòu)和功能。當前第1頁1 2 3