本發(fā)明涉及圖像處理領域,更具體地,本發(fā)明涉及一種視頻檢測方法以及使用該視頻檢測方法的視頻檢測裝置。
背景技術:
目前的視頻監(jiān)控往往依賴于工作人員人工的檢測和處理。因此,雖然很多場景有攝像頭覆蓋,但是由于沒有智能視頻監(jiān)控方法,所以需要大量人力來進行處理和監(jiān)視。智能視頻監(jiān)控可以根據(jù)捕獲的視頻數(shù)據(jù),自動地對場景中的對象進行識別,以便檢測出諸如人群聚集等安全事件,并且提供相應的提示甚至警報。
現(xiàn)有的視頻檢測方法通常依賴于對于監(jiān)控場景中的單個對象的識別和位置提取,然后根據(jù)場景中識別到的所有單個對象的統(tǒng)計結果,判斷是否存在諸如人群聚集等安全事件。然而,這樣的視頻檢測方法需要耗費大量時間和計算資源來執(zhí)行檢測,對于相對復雜的監(jiān)控場景將難以給出實時的和精確的檢測結果。
因此,希望提供一種視頻檢測方法以及使用該視頻檢測方法的視頻檢測裝置,其能夠以更低的處理復雜度、更高的檢測速度和檢測精度提供對于諸如人群聚集等安全事件的檢測。
技術實現(xiàn)要素:
鑒于上述問題,本發(fā)明提供一種基于背景建模和重建的視頻檢測方法以及使用該視頻檢測方法的視頻檢測裝置。
根據(jù)本發(fā)明的一個實施例,提供了一種視頻檢測方法,用于基于視頻信號檢測視頻信號中的事件,所述視頻檢測方法包括:獲取視頻信號;對于所述視頻信號中的每幀視頻圖像,獲取對應于所述每幀視頻圖像的第一背景圖像,所述第一背景圖像為不包括動態(tài)對象的背景圖像;計算所述當前幀之前的預定數(shù)目的幀的多個所述第一背景圖像的均值圖像,以生成第二背景圖像; 獲取當前幀的所述第一背景圖像與所述第二背景圖像的差圖像;比較所述差圖像中每個像素點的像素值與第一預定閾值,獲取二值圖像;以預定分塊網(wǎng)格將所述二值圖像等分為多個二值圖像塊,基于每個所述二值圖像塊中非零像素點的比例,獲得每個所述二值圖像塊的圖像塊值;在所述二值圖像上設置包括預定數(shù)目的所述二值圖像塊的圖像窗,求和所述圖像窗中的圖像塊值,獲得所述圖像窗的圖像窗值;以及在所述圖像窗值大于第二預定閾值的情況下,確定所述圖像窗中存在所述事件。
此外,根據(jù)本發(fā)明一個實施例的視頻檢測方法,還包括:在獲取對應于所述每幀視頻圖像的第一背景圖像之前,標定圖像采集模塊,以及經(jīng)由所述圖像采集模塊獲取所述視頻信號。
此外,根據(jù)本發(fā)明一個實施例的視頻檢測方法,還包括:在所述二值圖像上以預定步長移動所述圖像窗,以遍歷所述二值圖像;以及每次移動所述圖像窗,確定所述圖像窗中是否存在所述事件。
此外,根據(jù)本發(fā)明一個實施例的視頻檢測方法,其中所述事件為所述視頻圖像中存在人群聚集。
此外,根據(jù)本發(fā)明一個實施例的視頻檢測方法,其中生成第二背景圖像包括:每隔預定時間間隔,判斷當前幀的視頻圖像是否存在所述事件;并且如果不存在所述事件,則計算所述當前幀之前的所述預定數(shù)目的幀的多個所述第一背景圖像的均值圖像,作為所述第二背景圖像。
此外,根據(jù)本發(fā)明一個實施例的視頻檢測方法,其中所述基于第一預定閾值二值化所述差圖像,獲取二值圖像包括:比較所述差圖像中每個像素點的像素值與所述第一預定閾值,將所述像素值大于所述第一預定閾值的像素點的像素值取值為1,將其他像素點的像素值取值為0。
此外,根據(jù)本發(fā)明一個實施例的視頻檢測方法,其中所述基于每個所述二值圖像塊中非零像素點的比例,獲得每個所述二值圖像塊的圖像塊值包括:將其中非零像素點的比例大于等于第三預定閾值的二值圖像塊的初始圖像塊值取值為1,將其他二值圖像塊的初始圖像塊值取值為0;基于所述標定圖像采集模塊,確定每個所述二值圖像塊的圖像塊權重;以及將每個所述二值圖像塊的初始圖像塊值乘以每個所述二值圖像塊的圖像塊權重,獲得每個所述二值圖像塊的圖像塊值。
此外,根據(jù)本發(fā)明一個實施例的視頻檢測方法,其中所述圖像塊的尺寸 小于單個對象在所述視頻圖像中的對象尺寸,所述圖像窗的尺寸為所述圖像塊的尺寸的整數(shù)倍。
根據(jù)本發(fā)明的另一個實施例,提供了一種視頻檢測裝置,所述視頻檢測裝置包括:圖像采集模塊,用于采集所述視頻信號;視頻檢測模塊,用于基于所述視頻信號,檢測所述視頻信號中的事件,其中所述視頻檢測模塊進一步包括背景重建單元,用于對于所述視頻信號中的每幀視頻圖像,獲取對應于所述每幀視頻圖像的第一背景圖像,并且計算所述當前幀之前的預定數(shù)目的幀的多個所述第一背景圖像的均值圖像,生成第二背景圖像,其中,所述第一背景圖像為不包括動態(tài)對象的背景圖像;差圖像獲取單元,用于獲取所述第一背景圖像與所述第二背景圖像的差圖像;二值化單元,用于比較所述差圖像中每個像素點的像素值與所述第一預定閾值,以獲取二值圖像;圖像塊值計算單元,用于以預定分塊網(wǎng)格將所述二值圖像等分為多個二值圖像塊,基于每個所述二值圖像塊中非零像素點的比例,獲得每個所述二值圖像塊的圖像塊值;圖像窗值計算單元,用于在所述二值圖像上設置包括預定數(shù)目的所述二值圖像塊的圖像窗,求和所述圖像窗中的圖像塊值,獲得所述圖像窗的圖像窗值;事件檢測單元,用于基于所述圖像窗值與第二預定閾值,檢測所述視頻信號中的事件,其中,在所述圖像窗值大于第二預定閾值的情況下,所述事件檢測單元確定所述圖像窗中存在所述事件。
此外,根據(jù)本發(fā)明另一個實施例的視頻檢測裝置,其中在所述圖像采集模塊采集所述視頻信號之前,標定所述圖像采集模塊。
此外,根據(jù)本發(fā)明另一個實施例的視頻檢測裝置,其中所述圖像窗值計算單元在所述二值圖像上以預定步長移動所述圖像窗,以遍歷所述二值圖像,并且所述事件檢測單元在每次移動所述圖像窗時,確定所述圖像窗中是否存在所述事件。
此外,根據(jù)本發(fā)明另一個實施例的視頻檢測裝置,其中所述事件為所述視頻圖像中存在人群聚集。
此外,根據(jù)本發(fā)明另一個實施例的視頻檢測裝置,其中所述背景重建單元每隔預定時間間隔,判斷當前幀的視頻圖像是否存在所述事件;并且如果不存在所述事件,則計算所述當前幀之前的所述預定數(shù)目的幀的多個所述第一背景圖像的均值圖像,作為所述第二背景圖像。
此外,根據(jù)本發(fā)明另一個實施例的視頻檢測裝置,其中所述二值化單元 比較所述差圖像中每個像素點的像素值與所述第一預定閾值,將所述像素值大于所述第一預定閾值的像素點的像素值取值為1,將其他像素點的像素值取值為0。
此外,根據(jù)本發(fā)明另一個實施例的視頻檢測裝置,其中所述圖像塊值計算單元將其中非零像素點的比例大于等于第三預定閾值的二值圖像塊的初始圖像塊值取值為1,將其他二值圖像塊的初始圖像塊值取值為0;基于標定的所述圖像采集模塊,確定每個所述二值圖像塊的圖像塊權重;以及將每個所述二值圖像塊的初始圖像塊值乘以每個所述二值圖像塊的圖像塊權重,獲得每個所述二值圖像塊的圖像塊值。
此外,根據(jù)本發(fā)明另一個實施例的視頻檢測裝置,其中所述圖像塊值計算單元設置所述圖像塊的尺寸小于單個對象在所述視頻圖像中的對象尺寸,所述圖像窗值計算單元設置所述圖像窗的尺寸為所述圖像塊的尺寸的整數(shù)倍。
根據(jù)本發(fā)明的實施例的視頻檢測方法以及視頻檢測裝置,通過使用背景建模方法為每幀圖像重建背景從而獲得真實背景,計算每幀圖像的動態(tài)背景與真實背景的二值化差圖像,確定分塊的二值化差圖像上的滑動窗中是否出現(xiàn)聚集,實現(xiàn)以更低的處理復雜度、更高的檢測速度和檢測精度提供對于諸如人群聚集等安全事件的實時檢測。
要理解的是,前面的一般描述和下面的詳細描述兩者都是示例性的,并且意圖在于提供要求保護的技術的進一步說明。
附圖說明
通過結合附圖對本發(fā)明實施例進行更詳細的描述,本發(fā)明的上述以及其它目的、特征和優(yōu)勢將變得更加明顯。附圖用來提供對本發(fā)明實施例的進一步理解,并且構成說明書的一部分,與本發(fā)明實施例一起用于解釋本發(fā)明,并不構成對本發(fā)明的限制。在附圖中,相同的參考標號通常代表相同部件或步驟。
圖1是圖示根據(jù)本發(fā)明實施例的視頻檢測裝置的功能性框圖;
圖2A和2B是圖示根據(jù)本發(fā)明實施例的視頻檢測方法的流程圖;
圖3A和3B是圖示根據(jù)本發(fā)明實施例的視頻檢測方法中的第一背景圖像重建的示意圖;
圖4是具體圖示根據(jù)本發(fā)明實施例的視頻檢測方法中獲取第二背景圖像 的流程圖;
圖5是圖示根據(jù)本發(fā)明實施例的視頻檢測方法中的第二背景圖像重建的示意圖;
圖6是圖示根據(jù)本發(fā)明實施例的視頻檢測方法中的第一背景圖像和第二背景圖像的差圖像的示意圖;
圖7是圖示根據(jù)本發(fā)明實施例的視頻檢測方法中的二值圖像的示意圖;
圖8是具體圖示根據(jù)本發(fā)明實施例的視頻檢測方法中分塊二值圖像和計算圖像塊值的流程圖;
圖9是圖示根據(jù)本發(fā)明實施例的視頻檢測方法中的分塊二值圖像的示意圖;
圖10是圖示根據(jù)本發(fā)明實施例的視頻檢測方法中用于檢測聚集事件的圖像窗的第一示意圖;
圖11是圖示根據(jù)本發(fā)明實施例的視頻檢測方法中用于檢測聚集事件的圖像窗的第二示意圖;以及
圖12是圖示根據(jù)本發(fā)明實施例的視頻檢測方法中用于檢測聚集事件的圖像窗的第三示意圖。
具體實施方式
為了使得本發(fā)明的目的、技術方案和優(yōu)點更為明顯,下面將參照附圖詳細描述根據(jù)本發(fā)明的示例實施例。顯然,所描述的實施例僅僅是本發(fā)明的一部分實施例,而不是本發(fā)明的全部實施例,應理解,本發(fā)明不受這里描述的示例實施例的限制?;诒竟_中描述的本發(fā)明實施例,本領域技術人員在沒有付出創(chuàng)造性勞動的情況下所得到的所有其它實施例都應落入本發(fā)明的保護范圍之內(nèi)。
以下,將參考附圖詳細描述本發(fā)明的優(yōu)選實施例。
首先,將參照圖1描述根據(jù)本發(fā)明實施例的視頻檢測裝置。圖1是圖示根據(jù)本發(fā)明實施例的視頻檢測裝置的功能性框圖。如圖1所示,根據(jù)本發(fā)明實施例的視頻檢測裝置1包括圖像采集模塊10和視頻檢測模塊20。容易理解的是,圖1僅示出視頻檢測裝置1中與本發(fā)明密切相關的模塊,根據(jù)本發(fā)明實施例的視頻檢測裝置還可以包括其他模塊,諸如輸入輸出模塊、顯示模塊、通信模塊等。
具體地,所述圖像采集模塊10用于采集待檢測的視頻信號。在本發(fā)明的一個實施例中,所述圖像采集模塊10可以是包括能夠獲取被監(jiān)控場景的視頻數(shù)據(jù)的RGB攝像機。在本發(fā)明的另一個實施例中,所述圖像采集模塊10可以包括能夠獲取被攝體的深度信息的深度相機(深度攝像機)。所述圖像采集模塊10可以與其后的視頻檢測模塊20物理上分離,或者物理上位于同一位置甚至位于同一機殼內(nèi)部。在所述圖像采集模塊10與其后的視頻檢測模塊20物理上分離的情況下,所述圖像采集模塊10進一步經(jīng)由有線或者無線方式將圖像采集模塊10獲取的視頻數(shù)據(jù)發(fā)送給其后的模塊。在所述圖像采集模塊10與其后的視頻檢測模塊20物理上位于同一位置甚至位于同一機殼內(nèi)部的情況下,所述圖像采集模塊10經(jīng)由內(nèi)部總線將獲取的視頻數(shù)據(jù)發(fā)送給其后的模塊。所述視頻數(shù)據(jù)可以是RGB彩色視頻數(shù)據(jù)或者包括深度信息的RGBD視頻數(shù)據(jù)。在經(jīng)由有線或者無線方式或者經(jīng)由內(nèi)部總線發(fā)送所述視頻數(shù)據(jù)之前,可以將其預定格式進行編碼和壓縮為視頻數(shù)據(jù)包,以減少發(fā)送需要占用的通信量和帶寬。在本發(fā)明的又一實施例中,根據(jù)本發(fā)明實施例的視頻檢測裝置1也可以不包括所述圖像采集模塊10,而是經(jīng)由有線或者無線方式從其他電子設備接收用于監(jiān)控的視頻信號。
所述視頻檢測模塊20用于基于所述視頻信號,檢測所述視頻信號中的事件。在本發(fā)明的一個實施例中,根據(jù)本發(fā)明實施例的視頻檢測裝置1布置在諸如車站、廣場、商場等需要執(zhí)行視頻監(jiān)控的場所。所述視頻檢測模塊20檢測諸如人群聚集等安全事件。所述視頻檢測模塊20可以是所述視頻檢測裝置1的中央處理單元(CPU)??商娲?,所述視頻檢測模塊20還可以是所述視頻檢測裝置1的專用處理單元(諸如專用集成電路(ASIC)等)。也就是說,所述視頻檢測模塊20例如可以由諸如硬件、軟件、固件以及它們的任意可行的組合配置。
更具體地,所述視頻檢測模塊20包括背景重建單元21、差圖像獲取單元22、二值化單元23、圖像塊值計算單元24、圖像窗值計算單元25以及事件檢測單元26。如上所述,背景重建單元21、差圖像獲取單元22、二值化單元23、圖像塊值計算單元24、圖像窗值計算單元25以及事件檢測單元26可以由諸如硬件、軟件、固件以及它們的任意可行的組合配置。
所述背景重建單元21配置為對于所述視頻信號中的每幀視頻圖像,獲取對應于所述每幀視頻圖像的第一背景圖像,并且計算所述當前幀之前的預定 數(shù)目的幀的多個所述第一背景圖像的均值圖像,生成第二背景圖像。在此,所述第一背景圖像為不包括動態(tài)對象的背景圖像。
所述差圖像獲取單元22配置為獲取所述第一背景圖像與所述第二背景圖像的差圖像。
所述二值化單元23配置為比較所述差圖像中每個像素點的像素值與所述第一預定閾值,以獲取二值圖像。
所述圖像塊值計算單元24配置為以預定分塊網(wǎng)格將所述二值圖像等分為多個二值圖像塊,基于每個所述二值圖像塊中非零像素點的比例,獲得每個所述二值圖像塊的圖像塊值。
所述圖像窗值計算單元25配置為在所述二值圖像上設置包括預定數(shù)目的所述二值圖像塊的圖像窗,求和所述圖像窗中的圖像塊值,獲得所述圖像窗的圖像窗值。
所述事件檢測單元26配置為基于所述圖像窗值與第二預定閾值,檢測所述視頻信號中的事件。在所述圖像窗值大于第二預定閾值的情況下,所述事件檢測單元26確定所述圖像窗中存在所述事件。
以下,將進一步參照附圖具體描述由根據(jù)本發(fā)明實施例的視頻檢測裝置1執(zhí)行的視頻檢測方法。
圖2A和2B是圖示根據(jù)本發(fā)明實施例的視頻檢測方法的流程圖。如圖2A和2B所示,根據(jù)本發(fā)明實施例的視頻檢測方法包括以下步驟。
在步驟S201中,標定所述圖像采集模塊10。為確定空間物體表面某點的三維幾何位置與其在所述圖像采集模塊10采集的視頻圖像中對應點之間的相互關系,需要建立所述圖像采集模塊10成像的幾何模型。這些幾何模型參數(shù)就是所述圖像采集模塊10的參數(shù)。通過實驗與計算得到所述圖像采集模塊10的參數(shù),這個求解參數(shù)的過程為所述圖像采集模塊10的標定。在后續(xù)的圖像處理和事件檢測過程中,若干閾值參數(shù)也由標定步驟確定。在本發(fā)明的實施例中,可以采用基于離線或在線數(shù)據(jù)的傳統(tǒng)相機標定法、主動視覺相機標定方法、相機自標定法等。此后,處理進到步驟S202。
在步驟S202中,經(jīng)由所述圖像采集模塊10獲取視頻信號。如上所述,所述圖像采集模塊10可以是包括能夠獲取被監(jiān)控場景的視頻數(shù)據(jù)的RGB攝像機。所述圖像采集模塊10經(jīng)由有線或者無線方式或者經(jīng)由內(nèi)部總線發(fā)送所述視頻數(shù)據(jù)到所述視頻檢測模塊20用于視頻監(jiān)控。此后,處理進到步驟S203。
在步驟S203中,所述背景重建單元21獲取對應于每幀視頻圖像的第一背景圖像。所述第一背景圖像為不包括動態(tài)對象的背景圖像。在本發(fā)明的實施例中,需要基于背景重建將視頻圖像中的運動部分和靜止部分分開。靜止部分中包括靜止的人以及真實背景(例如,地面、建筑物等)。通過背景重建獲得的這種靜止的人以及真實背景的背景圖像在本說明書中稱為第一背景圖像或者動態(tài)背景。在本發(fā)明的實施例中,采用諸如高斯混合模型(GMM)、P2M方法等執(zhí)行第一背景圖像或者動態(tài)背景的重建。例如,在P2M方法中,每一個像素點由包含了局部壓縮描述的上下文特征表示,分類出潛在的背景像素點。并且P2M距離能夠一直自適應的有效且平滑地更新背景模型。P2M方法能魯棒地重構背景并且能避免現(xiàn)實中的噪聲帶來的影響。
圖3A和3B是圖示根據(jù)本發(fā)明實施例的視頻檢測方法中的第一背景圖像重建的示意圖。
如圖3A所示,在沒有進行第一背景圖像或者動態(tài)背景的重建之前,所述圖像采集模塊10獲取的視頻信號中包括多個動態(tài)對象301、302和303。通過執(zhí)行背景重建之后獲取如圖3B所示的第一背景圖像。
如圖3B所示,在第一背景圖像中,多個動態(tài)對象301、302和303被消除,第一背景圖像或者動態(tài)背景中僅包括靜止的人以及真實背景。
返回參照圖2A,在獲得第一背景圖像或者動態(tài)背景之后,處理進到步驟S204。
在步驟S204中,所述背景重建單元21計算所述當前幀之前的預定數(shù)目的幀的多個所述第一背景圖像的均值圖像,以生成第二背景圖像。在本發(fā)明的實施例中,所述第二背景圖像為真實背景圖像。具體地,當沒有聚集事件發(fā)生的時候,在步驟S203中重建獲得的第一背景圖像(動態(tài)背景)只包含了真實背景和很少一部分不動的對象。因此,通過計算不同時刻的沒有發(fā)生聚集時的第一背景圖像(動態(tài)背景)的平均,少部分的不動的對象就能被去除從而得到第二背景圖像(真實背景)。
參照圖4描述根據(jù)本發(fā)明實施例的視頻檢測方法中獲取第二背景圖像的流程。圖4是具體圖示根據(jù)本發(fā)明實施例的視頻檢測方法中獲取第二背景圖像的流程圖。如圖4所示,獲取第二背景圖像的流程包括以下步驟。
在步驟S401中,初始化背景圖像緩存,以第一幀視頻圖像的第一背景圖像作為初始的第二背景圖像。在本發(fā)明的實施例中,可以設置用于緩存N張 第一背景圖像的緩存區(qū)。此外,由于在視頻開始的時候通常被認為是正常的(沒有發(fā)生聚集),第一幀視頻圖像中大多數(shù)人是在正常的走動。因此,此時第一背景圖像(動態(tài)背景)中大部分都是真實背景,它足夠干凈的用來在真實背景生成前作為一個初始的第二背景圖像(真實背景)使用。此后,處理進到步驟S402。
在步驟S402中,等待下一個預定時間間隔T。此后,處理進到步驟S403。
在步驟S403中,判斷當前時刻是否存在聚集事件。在本發(fā)明的實施例中,步驟S403中的判斷依賴于將參照圖2B進一步描述的判斷過程。如果在步驟S403中獲得否定結果,即當前時刻不存在聚集事件,則處理進到步驟S404。
在步驟S404中,將當前時刻的第一背景圖像存儲到背景圖像緩存。也就是說,在所述背景圖像緩存中,僅存儲每隔預定時間間隔T的第一背景圖像,并且該當前時刻沒有聚集發(fā)生。在本發(fā)明的實施例中,如果第一背景圖像的緩存區(qū)已經(jīng)存儲N張第一背景圖像,那么此后最新生成的第一背景圖像(動態(tài)背景)將覆蓋最早存儲的第一背景圖像(動態(tài)背景)。此后,處理進到步驟S405。
在步驟S405中,以計算的均值圖像作為更新的第二背景圖像。在本發(fā)明的實施例中,均值圖像的計算以以下等式(1)表示:
其中Bdyc是當前存儲在緩存區(qū)中的第一背景圖像(動態(tài)背景)。M是Bdyc的數(shù)量。當緩存區(qū)是滿的時候,M=N。
也就是說,僅在該當前時刻沒有聚集發(fā)生時更新第二背景圖像。此后,處理可以返回步驟S402繼續(xù)執(zhí)行每隔預定時間間隔T更新第一背景圖像和第二背景圖像的處理過程。
相反地,如果在步驟S403中獲得肯定結果,即當前時刻存在聚集事件,則處理返回到步驟S402,等待下一個沒有聚集發(fā)生的時刻存儲第一背景圖像和更新第二背景圖像。
也就是說,考慮到一天中光線的緩慢變化,保持更新第二背景圖像(真實背景),即真實背景應當是最近的N個第一背景圖像(動態(tài)背景)的平均。用于平均的第一背景圖像(動態(tài)背景)選取方法是每隔預定時間間隔T,如果此時沒發(fā)生聚集則選擇此時的動態(tài)背景圖像。如果此時發(fā)生聚集,則放棄 本次更新。
圖5是圖示根據(jù)本發(fā)明實施例的視頻檢測方法中的第二背景圖像重建的示意圖。通過參照圖4描述的第二背景圖像重建,如圖5所示,通過例如14幀第一背景圖像(動態(tài)背景)的平均,獲得了移除了對象(人)而僅包括第二背景圖像(真實背景)的效果。
返回參照圖2A,在獲得第二背景圖像或者真實背景之后,處理進到步驟S205。
在步驟S205中,所述差圖像獲取單元22獲取當前幀的第一背景圖像與第二背景圖像的差圖像。在本發(fā)明的實施例,第一背景圖像與第二背景圖像的差圖像(即,動態(tài)背景與真實背景的差)用以下等式(2)表示:
Dn=|Breal-Bdycn| (2)
其中Dn是第n幀的差圖像,Breal是此時的第二背景圖像(真實背景),而Bdycn是第n幀的第一背景圖像(動態(tài)背景)。
圖6是圖示根據(jù)本發(fā)明實施例的視頻檢測方法中的第一背景圖像和第二背景圖像的差圖像的示意圖。如圖6所示,第一背景圖像和第二背景圖像的差圖像包括原始圖像中的靜態(tài)對象(人)601-604。
返回參照圖2A,在獲得第一背景圖像與第二背景圖像的差圖像,處理進到步驟S206。
在步驟S206中,所述二值化單元23比較所述差圖像中每個像素點的像素值與第一預定閾值,獲取二值圖像。在本發(fā)明的實施例,二值化差圖像中像素點(x,y)的二值化值Ib(x,y)用以下等式(3)表示:
其中,Id(x,y)是差圖像中像素點(x,y)的像素值,Th1是預先確定的第一預定閾值。
圖7是圖示根據(jù)本發(fā)明實施例的視頻檢測方法中的二值圖像的示意圖。與圖6所示的二值化處理之前的差圖像相比,如圖7所示的二值圖像噪聲更少了。此外,在該二值圖像中存在一些空洞和縫隙,這些空洞和縫隙通常來自于二值化和背景建模。它們可以是用隨后描述的圖像分塊策略和滑動圖像窗處理。
返回參照圖2B,在獲得第一背景圖像和第二背景圖像的二值化差圖像之 后,處理進到步驟S207。
在步驟S207中,所述圖像塊值計算單元24以預定分塊網(wǎng)格將二值圖像等分為多個二值圖像塊,獲得每個二值圖像塊的圖像塊值。參照圖8詳細描述根據(jù)本發(fā)明實施例的視頻檢測方法中分塊策略。
圖8是具體圖示根據(jù)本發(fā)明實施例的視頻檢測方法中分塊二值圖像和計算圖像塊值的流程圖。如圖8所示,根據(jù)本發(fā)明實施例的視頻檢測方法中分塊二值圖像和計算圖像塊值的流程包括以下步驟。
在步驟S801中,以預定分塊網(wǎng)格將二值圖像等分為多個二值圖像塊。在本發(fā)明的實施例中,所述二值圖像塊的尺寸小于單個對象(人)在所述視頻圖像中的對象尺寸。此后,處理進到步驟S802。
在步驟S802中,確定每個二值圖像塊中1像素的比例。此后,處理進到步驟S803。
在步驟S803中,確定在步驟S802中確定的二值圖像塊中1像素的比例是否大于第三預定閾值Th3。
如果在步驟S803中獲得肯定結果,即該二值圖像塊中1像素的比例大于第三預定閾值Th3,則處理進到步驟S804。在步驟S804中,將二值圖像塊的初始圖像塊值取值為1。
相反地,如果在步驟S803中獲得否定結果,即該二值圖像塊中1像素的比例不大于第三預定閾值Th3,則處理進到步驟S805。在步驟S805中,將二值圖像塊的初始圖像塊值取值為0。
在步驟S804之后,處理進到步驟S806。在步驟S806中,基于所述圖像采集模塊10的標定,確定每個二值圖像塊的圖像塊權重w。在本發(fā)明的實施例中,假設處于視頻圖像最底端的塊的權重w為1。權重w可以由以下等式(4)表示:
其中λcb是真實世界中一個單位長度在最底端的塊中所占的像素點數(shù)。λct是真實世界中一個單位長度在目標的塊中所占的像素點數(shù)。
在步驟S806中獲得每個二值圖像塊的圖像塊權重w之后,處理進到步驟S807。在步驟S807中,基于初始圖像塊值和圖像塊權重,獲得二值圖像塊的圖像塊值。
如此,通過參照圖8描述的分塊二值圖像和計算圖像塊值,覆蓋掉背景 重建中常常產(chǎn)生的空洞。此外,通過對每個二值圖像塊的值賦予了一個基于塊的縱坐標的權重,該權重是一個根據(jù)相機標定所得的補償參數(shù),抵消了透視的影響。
圖9是圖示根據(jù)本發(fā)明實施例的視頻檢測方法中的分塊二值圖像的示意圖。基于參照圖8描述的分塊二值圖像和計算圖像塊值,二值圖像塊901和902由于其中1像素的比例大于第三預定閾值,二值圖像塊901和902被取值為1。而二值圖像塊903和904由于其中1像素的比例小于第三預定閾值,二值圖像塊903和904被取值為0。此外,如圖9中箭頭所示,隨著二值圖像塊遠離視頻圖像最底端,其圖像塊權重w隨之增加。
返回參照圖2B,在步驟S207中獲得每個二值圖像塊的圖像塊值之后,所述圖像窗值計算單元25在二值圖像上設置包括預定數(shù)目的二值圖像塊的圖像窗,獲得圖像窗的圖像窗值。在本發(fā)明的實施例中,圖像窗的尺寸應為最少能被判斷為聚集的對象(人)所占的尺寸,通常取為4到6人所占的尺寸。為了方便隨后滑動,圖像窗的長寬分別設置一個二值圖像塊的大小的長寬的整數(shù)倍。所述圖像窗值計算單元25通過求和圖像窗中每個二值圖像塊的圖像塊值,獲得所述圖像窗的圖像窗值。這種簡單的數(shù)值累積運算,只用占用很少的處理資源。此后,處理進到步驟S209。
在步驟S209中,判斷所述圖像窗的圖像窗值是否大于第二預定閾值。
如果在步驟S209中獲得肯定結果,即所述圖像窗的圖像窗值大于第二預定閾值,處理進到步驟S210。在步驟S210中,判斷圖像窗中存在聚集事件。
相反地,如果在步驟S209中獲得否定結果,即所述圖像窗的圖像窗值不大于第二預定閾值,處理進到步驟S211。在步驟S211中,判斷圖像窗中不存在聚集事件。
在步驟S210和S211中確定圖像窗中是否存在距離事件之后,處理進到步驟S212。
在步驟S212中,判斷當前的圖像窗是否已經(jīng)遍歷整個二值圖像。
如果在步驟S212中獲得否定結果,則處理進到步驟S213。在步驟S213中,以預定步長移動圖像窗。從而進一步返回到步驟S208中,對于移動到新的位置的圖像窗執(zhí)行聚集檢測過程。
相反地,如果在步驟S212中獲得肯定結果,即當前的圖像窗已經(jīng)遍歷整個二值圖像,則結束對于當前幀視頻圖像的事件檢測。
以下,參照圖10到12進一步描述本發(fā)明實施例的視頻檢測方法的效果。
圖10是圖示根據(jù)本發(fā)明實施例的視頻檢測方法中用于檢測聚集事件的圖像窗的第一示意圖。如圖10所示,其圖像窗值大于第二預定閾值的圖像窗1001將被確定為存在聚集事件,而圖像窗值不大于第二預定閾值的圖像窗1002將被確定為不存在聚集事件,其中可能僅僅存在單個對象(人)。
圖11是圖示根據(jù)本發(fā)明實施例的視頻檢測方法中用于檢測聚集事件的圖像窗的第二示意圖。如圖11所示,圖像窗1101和1102中都存在對象之間的間隔。具體地,圖像窗1101中的對象間隔較小,其整體圖像窗值仍然會滿足大于第二預定閾值,其將被確定為存在聚集事件。而圖像窗1102中的對象間隔較大,完全屬于分開站立的對象(人),其整體圖像窗值仍然不會滿足大于第二預定閾值,其將被確定為不存在聚集事件。
圖12是圖示根據(jù)本發(fā)明實施例的視頻檢測方法中用于檢測聚集事件的圖像窗的第三示意圖。如圖12所示,即使在存在大量對象(人)聚集的情況下,聚集的人的面積遠大于圖像窗的尺寸。但這并不會影響根據(jù)本發(fā)明實施例的視頻檢測方法對聚集事件的檢測。隨著圖像窗1201到1206的滑動,每一部分的聚集人群都能夠被檢測出來。
以上,參照圖1到圖12描述了根據(jù)本發(fā)明實施例的視頻檢測方法以及使用該視頻檢測方法的視頻檢測裝置,其通過背景重建以及背景圖像分塊處理,能夠準確分辨動態(tài)背景和真實背景,并且能夠進一步判斷動態(tài)背景中是否形成聚集事件,從而以更低的處理復雜度、更高的檢測速度和檢測精度提供對于諸如人群聚集等安全事件的檢測。
根據(jù)本發(fā)明實施例的視頻檢測裝置中的各模塊可以通過根據(jù)本發(fā)明實施例的視頻檢測裝置中的處理器運行在存儲器中存儲的計算機程序指令來實現(xiàn),或者可以在根據(jù)本發(fā)明實施例的計算機程序產(chǎn)品的計算機可讀存儲介質中存儲的計算機指令被計算機運行時實現(xiàn)。
所述計算機可讀存儲介質可以是一個或多個計算機可讀存儲介質的任意組合,例如一個計算機可讀存儲介質包含用于隨機地生成動作指令序列的計算機可讀的程序代碼,另一個計算機可讀存儲介質包含用于進行人臉活動識別的計算機可讀的程序代碼。
所述計算機可讀存儲介質例如可以包括智能電話的存儲卡、平板電腦的存儲部件、個人計算機的硬盤、隨機存取存儲器(RAM)、只讀存儲器(ROM)、 可擦除可編程只讀存儲器(EPROM)、便攜式緊致盤只讀存儲器(CD-ROM)、USB存儲器、或者上述存儲介質的任意組合。
在上面詳細描述的本發(fā)明的示例實施例僅僅是說明性的,而不是限制性的。本領域技術人員應該理解,在不脫離本發(fā)明的原理和精神的情況下,可對這些實施例進行各種修改,組合或子組合,并且這樣的修改應落入本發(fā)明的范圍內(nèi)。