基于壓縮感知的視頻背景重建與突發(fā)群體事件預警平臺的制作方法
【專利摘要】本發(fā)明公開了一種基于壓縮感知的視頻背景重建與突發(fā)群體事件預警系統(tǒng),包括視頻輸入單元、基于壓縮感知的背景檢測模塊、變化檢測模塊、行人檢測和人數(shù)統(tǒng)計模塊、報表生成模塊和預警判斷模塊。此預警平臺以視頻采集裝置所采集的視頻數(shù)據(jù)為基礎,采用基于壓縮感知的視頻分析方法,通過L1范數(shù)最小化的優(yōu)化算法重建出警戒區(qū)域中的背景信息,進而可以檢測出視頻中的移動目標,而后采用行人識別算法來排除場景中車輛和動物等非人目標的影響,從而實現(xiàn)實時地統(tǒng)計出視頻畫面中的行人個數(shù),如果超過預先設定的最多允許人數(shù),實時觸發(fā)報警,警察等相關部門將在第一時間到達該區(qū)域維持秩序疏導人群,避免混亂或騷亂等不良事故的發(fā)生。
【專利說明】基于壓縮感知的視頻背景重建與突發(fā)群體事件預警平臺
【技術領域】
[0001] 本發(fā)明涉及一種基于壓縮感知的視頻背景重建與突發(fā)群體事件預警平臺,是一種 以視頻數(shù)據(jù)為基礎進行視頻分析進而對突發(fā)群體事件預警的系統(tǒng),屬于平安城市技術領 域。
【背景技術】
[0002] 當前我國正處于社會轉(zhuǎn)型期,既是經(jīng)濟發(fā)展關鍵時期,又是社會矛盾凸顯期。從國 際社會整體發(fā)展規(guī)律來看,人均國內(nèi)生產(chǎn)總值(GDP)在1 0 0 0 - 3 0 0 0美元區(qū)間, 是突發(fā)公共事件的高發(fā)期。《中華人民共和國突發(fā)事件應對法》解釋突發(fā)事件為突然發(fā)生, 造成或者可能造成嚴重社會危害,需要采取應急處置措施予以應對的自然災害、事故災難、 公共衛(wèi)生事件和社會安全事件。其中,社會安全事件主要包括各類恐怖襲擊事件,民族宗教 事件,經(jīng)濟安全事件,涉外突發(fā)事件和群體性事件等。突發(fā)性群體事件屬于突發(fā)公共事件 的社會安全事件,近年來已經(jīng)成為影響我國社會穩(wěn)定和公共安全的一個重要因素,其特點 是因人民內(nèi)部矛盾形成并積累到一定程度,一旦有適當?shù)恼T因,將迅速爆發(fā),而且沖突升級 快,對抗激烈,社會破壞力強,處置難度大。
[0003] 然而,我國目前還并沒有建立相應的自動突發(fā)群體預警機制,直轄市和省會一級 城市大多采用接群眾報警,或巡警定期巡街的方式來避免惡性突發(fā)群體事件的發(fā)生,即使 如此也很難保證時效性,因此有必要建立明察秋毫的社會監(jiān)控與預警機制,通過建立以預 警平臺為基礎的指揮中心,及早地對突發(fā)群體事件做出科學的判斷,根據(jù)突發(fā)事件的需要, 迅速啟動應急方案,快速進行現(xiàn)場處置,要在較短時間內(nèi)聚合各種有效資源,包括人力、物 力、財力等,綜合應用經(jīng)濟、法律、行政等手段。及早地防患于未然,為解決、防范社會問題提 供先決條件,奠定穩(wěn)固基礎。
[0004] 雖然目前國際上還沒有采用基于視頻的突發(fā)群體事件預警機制國家的相關報道, 但國內(nèi)外有些公司已經(jīng)開始從事智能監(jiān)控等相關產(chǎn)品的研發(fā),目前我國這方面的技術相對 國外落后。智能監(jiān)控是當今全球發(fā)展最快的技術之一。在這短短的幾十年的發(fā)展歷程中,伴 隨著新技術革命的不斷沖擊,它經(jīng)歷了這樣幾個階段:一對一監(jiān)視器,閉路電視監(jiān)控系統(tǒng), 微處理器監(jiān)視系統(tǒng),數(shù)字視頻監(jiān)控系統(tǒng),智能監(jiān)控系統(tǒng)。市場上的需求不斷提高對智能監(jiān)控 和其預警作用的需求。目前市場上的智能監(jiān)控產(chǎn)品大多由于背景重建技術的不成熟導致對 警戒區(qū)域的光線變化敏感,因而無法用于戶外。本發(fā)明具有如下優(yōu)勢:基于網(wǎng)絡攝像頭的視 頻采集平臺,確保異地實時監(jiān)控;算法的高效性,可以確保每個平臺實時支持多路視頻采集 終端;人數(shù)統(tǒng)計功能,自動區(qū)別車輛和動物等干擾;警戒區(qū)域報警功能,可以由用戶指定警 戒區(qū)域并設定最多容許人數(shù),一旦系統(tǒng)檢測區(qū)域中的人數(shù)過多立即啟動預警;自動生成報 表并存儲供用戶統(tǒng)計分析。
[0005] 本發(fā)明的應用框圖如圖1所示。本發(fā)明把在街頭、廣場、軍事禁區(qū)等敏感區(qū)域所采 集的視頻數(shù)據(jù)作為輸入數(shù)據(jù),實時地對采集節(jié)點的視頻數(shù)據(jù)進行處理,一旦檢測到敏感區(qū) 域的人數(shù)超過一定的數(shù)量,自動報警,同時在第一時間把預警信息發(fā)送給武警、公安和醫(yī)院 等相關部門。其中管理決策支持系統(tǒng)主要用于對本預警平臺進行管理和配置,例如用于設 定某敏感區(qū)域的最多允許人數(shù)和在視頻畫面中對某些特殊區(qū)域的特殊配置等。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明首次結(jié)合遠程視頻采集和現(xiàn)代先進圖像視頻處理的方式來實現(xiàn)突發(fā)群體 事件預警平臺。首先通過基于網(wǎng)絡 TCP/IP ((Transmission Control Protocol/Internet Protocol))協(xié)議獲取遠程視頻數(shù)據(jù)的采集,突發(fā)群體事件預警平臺,利用分布于城市街道、 廣場和敏感區(qū)域的視頻采集裝置,實時地處理采集到的視頻數(shù)據(jù),通過視頻的背景重建模 塊、構(gòu)建行人統(tǒng)計模型。不僅能夠?qū)崟r地自動對采集到的視頻進行人數(shù)統(tǒng)計,還可以智能監(jiān) 視由用戶指定的"警戒區(qū)域",警戒區(qū)域中所允許的人數(shù)由用戶指定,一旦檢測到人數(shù)超過 設定閾值,在第一時間把警報信號發(fā)送給公安、武警或醫(yī)院系統(tǒng)。維持安保或救護的人員就 會在第一時間趕到現(xiàn)場,從而避免群體性騷亂、暴亂的發(fā)生,有效地保護了公民的生命和財 產(chǎn)安全。如圖2所示,基于壓縮感知的視頻背景重建與突發(fā)群體事件預警平臺主要包括:視 頻輸入單元、基于壓縮感知的背景檢測模塊、變化檢測模塊、行人檢測和人數(shù)統(tǒng)計模塊、報 表生成模塊和預警判斷模塊。
[0007] 首次采用壓縮感知的理論來解決背景圖像的重建問題。視頻采集畫面的背景重建 是本發(fā)明的關鍵部分之一,能否重建背景圖像是檢測前景目標的前提也是關系本發(fā)明有效 性的一個關鍵因素,也是本發(fā)明的一個重要的技術創(chuàng)新點。背景重建技術傳統(tǒng)上采用高斯 統(tǒng)計的方式,一方面需要大量的樣本,效率低下,重建的背景精度低,于此相對比的是,基于 壓縮感知的背景圖像重建技術一方面提供了很好重建效果,同時可以保證實時信號處理。
[0008] 在背景重建步驟中,首次采用改進了的傳統(tǒng)的L1范數(shù)最小化優(yōu)化算法FISTA。壓 縮感知的本質(zhì)是基于信號的稀疏性,因而本質(zhì)上應該采用L0范數(shù)來求解,這里的L0也即 是求解信號的非〇個數(shù),在實際的應用中,這種組合問題是NP-hard (non-deterministic polynomial-time hard),因而經(jīng)常采用L1范數(shù)最小化來近似。一般來說,L1范數(shù)最小化 的算法比L2范數(shù)最小化的算法能更好的保護弱信號,但是還是做不到如L0范數(shù)最小化一 樣對強信號還是弱信號一致同仁。為了避免傳統(tǒng)L1范數(shù)最小化優(yōu)化算法對弱信號的歧視, 在實際的算法迭代中,這些弱信號經(jīng)常會被強置為〇,因而這里采用一種加權(quán)值的方法來解 決這個問題。
[0009] 構(gòu)建精確的行人統(tǒng)計模型。在采集的視頻場景中,可能會出現(xiàn)車,動物等干擾,需 要正確地排除干擾而檢測出行人數(shù)量?;谛腥私y(tǒng)計模型的相關性匹配方法有效地解決了 這個問題。這里把前景圖像的二進制圖像為待處理目標,構(gòu)建二進制圖像下的行人統(tǒng)計模 型,采用二維卷積的相關性匹配原理,在已檢測到的眾多亮度變化的目標中挑選出行人,從 而有效地排除車和動物等非行人的干擾。
[0010]
【專利附圖】
【附圖說明】 圖1為本發(fā)明的應用框圖 圖2為本發(fā)明總體系統(tǒng)框圖 圖3為基于壓縮感知理論的背景重建框圖 圖4為行人檢測處理流程框圖
【具體實施方式】 本發(fā)明首創(chuàng)性的提出了一種以壓縮感知為理論基礎的視頻背景圖像重建算法。傳統(tǒng) 的采樣信號或圖像的方法是著名的Nyquist采樣定理:采樣頻率必須大于等于信號最高 頻率的兩倍,才能很好的恢復原始信號。現(xiàn)代科學技術不斷需要采樣率更低、動態(tài)范圍更 大,很多情況下信號帶寬較大,采樣頻率達不到最高頻率的兩倍。在實際應用中,JPEG2000 (Joint Photographic Experts Group)、MPEG (Moving Picture Experts Group)等有損 壓縮標準在圖像、聲音和視頻等方面取得了巨大成功,人們認識到"扔"掉已獲取的大部分 數(shù)據(jù)并不會影響視覺和聽覺效果。這種有損壓縮是先對信號或圖像進行采樣,再進行壓縮、 傳輸、接收,最后解壓出原始的信號或圖像。壓縮后的數(shù)據(jù)遠遠少于采樣后的數(shù)據(jù),即進行 遠多于所需數(shù)據(jù)的采樣,如果最后的恢復需要K個數(shù)據(jù),采樣個數(shù)則是N個,N》K。這種 普遍存在的可壓縮現(xiàn)象引起了人們的思考:既然大部分獲得的數(shù)據(jù)都要"扔"掉,為什么還 要花費如此大的代價采集所有的數(shù)據(jù)?能否只采集那些最后不被"扔"掉的數(shù)據(jù)?壓縮感 知理論正是這樣一種高效的采樣理論。
[0011] 最近美國斯坦福大學的Donoho和CandSs從信號分解和逼近理論提出了壓縮 感知理論,它的核心思想為:對原始信號或圖像進行隨機投影,獲得少量觀測值,利用信號 或圖像具有稀疏性表示的先驗知識來進行重建。因此壓縮感知問題的求解是一個在滿足 獲得觀測值的條件下,尋求最稀疏解(即最少非零值)的過程,是個L0非凸優(yōu)化問題。但 L0 問題是一個典型的 NP-hard (non-deterministic polynomial-time hard)問題,不易 求解。對該問題的求解,常轉(zhuǎn)化為貪婪搜索、凸優(yōu)化問題和局部非凸優(yōu)化問題的求解。貪婪 算法中最經(jīng)典的是匹配追蹤MP(Matching Pursuit)算法,它在每一步迭代中,從原子庫中 尋找與剩余分量最為接近的原子作為匹配原子。但其有一個明顯的缺點:在已選原子組成 的子空間上,信號的擴展可能不是最好的,因為它不是一個正交投影。因此有學者提出了正 交匹配追蹤OMP (Orthogonal Matching Pursuit)算法,它在每一步迭代中都要對所選的 全部原子進行正交化處理。但這兩種算法在每步迭代中都要完成信號或信號分解的剩余分 量在過完備庫中的每個原子上的投影,計算量很大,收斂速度也比較慢。David L. Donoho 于 2006 年提出的逐步正交匹配追蹤 StOMP(Stagewise Orthogonal Matching Pursuit) 改善了這一狀況,它比OMP的收斂速度快。目前對于壓縮感知問題的求解,大多算法是基 于L1凸優(yōu)化問題的求解。最初的是基追蹤BP (Basis Pursuit)算法,它和MP算法的思想 基本一樣,同樣是在每次迭代時尋求最匹配的原子。迭代收縮IST(Iterative Shrinkage/ Threshold)是一種很簡單的算法,只要確定步長值和閾值就可求解,但該算法收斂速度慢。 基于L1的凸優(yōu)化算法是極其有效的,但它們進行重建所需的觀測值要比理論最小值多的 多,因此非凸優(yōu)化問題的求解也一直是研究的熱點。同時,也有些學者提出用Lp(0〈 p〈 1) 代替L1優(yōu)化算法來進行重建。目前壓縮感知理論已成功應用在了單像素相機、醫(yī)療成像例 如核磁共振成像MRI (Magnetic Resonance Imaging)、雷達(Radar)、模擬/信號轉(zhuǎn)換A/I (Analog-to-information)、信道估計和遙測等許多方面。
[0012] 本發(fā)明以壓縮感知為理論基礎,提出了一種全新的視頻背景重建方法。如圖3所 示,我們知道在長時間的視頻采集畫面內(nèi),每個像素的灰度值大多情況下顯示的是采集視 頻的背景圖像,只有出現(xiàn)目標的情況下會被前景畫面掩蓋。因而這里我們把前景畫面當作 稀疏信號來處理。這里我們默認選定30分鐘的視頻作為輸入,自適應的方式來重建背景畫 面。假設輸入視頻流包括K幅圖像XpX 2?ΧΚ每幅圖像包含mXn個像素,我們的目標是逐 點利用L1范數(shù)最小化的優(yōu)化算法來重建背景圖像B。假設?=1···πιΧη,我們采用下式來實 現(xiàn)對背景圖像的重建:
【權(quán)利要求】
1. 基于壓縮感知的視頻背景重建與突發(fā)群體事件預警平臺,包括視頻輸入單元、基于 壓縮感知的背景檢測模塊、變化檢測模塊、行人檢測和人數(shù)統(tǒng)計模塊、報表生成模塊和預警 判斷模塊。
2. 如權(quán)利要求1所述的基于壓縮感知的視頻背景重建與突發(fā)群體事件預警平臺,其 特征在于,基于壓縮感知的背景檢測模塊采用改進的加權(quán)L1范數(shù)最小化優(yōu)化算法FISTA (Fast Iterative Shrinkage Threshold Algorithm)實現(xiàn)視頻背景重建。
3. 如權(quán)利要求1所述的行人檢測和人數(shù)統(tǒng)計模塊,其特征在于,其中的前景圖像通過 設定一定的門限獲得,再利用形態(tài)學(morphological)中的腐蝕函數(shù)(corrosion)來消除 小且無意義的偽目標,保留前景圖像的二進制圖像中的結(jié)構(gòu)骨干信息,為后續(xù)采用相關性 匹配原理監(jiān)測行人做數(shù)據(jù)準備。
4. 如權(quán)利要求1所述的行人檢測和人數(shù)統(tǒng)計模塊,其特征在于,把前景圖像的二進制 圖像為待處理目標,構(gòu)建二進制圖像下的行人統(tǒng)計模型,采用二維卷積的相關性匹配原理, 在已檢測到的眾多亮度變化的目標中挑選出行人,從而有效地排除車和動物等非行人的干 擾。
【文檔編號】G06K9/00GK104299207SQ201310305492
【公開日】2015年1月21日 申請日期:2013年7月19日 優(yōu)先權(quán)日:2013年7月19日
【發(fā)明者】李峰 申請人:李峰