本發(fā)明涉及監(jiān)控技術(shù)領(lǐng)域,具體而言,涉及一種跌倒檢測方法及裝置。
背景技術(shù):
現(xiàn)有的跌倒檢測方法,通常采用背景建模方法從采集到的待測圖像中提取出前景圖像,并直接根據(jù)前景圖像建模判斷是否有人跌倒。然而,待測圖像中通常會存在很多干擾信息,提取到的前景圖像與實際要檢測的處于跌倒?fàn)顟B(tài)的人的圖像之間存在較大差距,導(dǎo)致最終得到的檢測結(jié)果并不準(zhǔn)確。
技術(shù)實現(xiàn)要素:
有鑒于此,本發(fā)明實施例的目的在于提供一種跌倒檢測方法及裝置,以改善上述問題。
為了達到上述目的,本發(fā)明實施例提供一種跌倒檢測方法,所述方法包括:
基于預(yù)設(shè)背景模型從采集到的待測圖像中提取出前景區(qū)域;
根據(jù)預(yù)設(shè)規(guī)則確定所述前景區(qū)域中的干擾區(qū)域;
刪除所述干擾區(qū)域,得到待測區(qū)域;
通過深度學(xué)習(xí)網(wǎng)絡(luò)模型對所述待測圖像中的所述待測區(qū)域進行處理,以檢測所述待測圖像中是否包括處于跌倒?fàn)顟B(tài)的人的圖像。
可選地,在上述方法中,所述前景區(qū)域包括至少一個運動目標(biāo)區(qū)域;根據(jù)預(yù)設(shè)規(guī)則確定所述前景區(qū)域中的干擾區(qū)域的步驟,包括:
根據(jù)所述至少一個運動目標(biāo)區(qū)域與所述待測圖像中的預(yù)設(shè)區(qū)域的相對位置關(guān)系確定所述至少一個運動目標(biāo)區(qū)域是否為干擾區(qū)域;和/或
根據(jù)所述至少一個運動目標(biāo)區(qū)域的尺寸確定所述至少一個運動目標(biāo)區(qū)域是否為干擾區(qū)域;和/或
根據(jù)所述待測圖像之前的圖像幀中的所述至少一個運動目標(biāo)區(qū)域與所述待測圖像中的所述至少一個運動目標(biāo)區(qū)域的相似度確定所述至少一個運動目標(biāo)區(qū)域是否為干擾區(qū)域。
可選地,在上述方法中,根據(jù)所述至少一個運動目標(biāo)區(qū)域與所述待測圖像中的預(yù)設(shè)區(qū)域的相對位置關(guān)系確定所述至少一個運動目標(biāo)區(qū)域是否為干擾區(qū)域的步驟,包括:
檢測所述至少一個運動目標(biāo)區(qū)域是否位于所述待測圖像的預(yù)設(shè)區(qū)域內(nèi);
若不位于所述預(yù)設(shè)區(qū)域內(nèi),則確定所述至少一個運動目標(biāo)區(qū)域為干擾區(qū)域。
可選地,在上述方法中,根據(jù)所述至少一個運動目標(biāo)區(qū)域的尺寸確定所述至少一個運動目標(biāo)區(qū)域是否為干擾區(qū)域的步驟,包括:
計算所述至少一個運動目標(biāo)區(qū)域的外接矩形的高度、寬度以及所述高度與寬度的比值;
在所述高度未達到預(yù)設(shè)高度、所述寬度未達到預(yù)設(shè)寬度或所述高度與寬度的比值未達到預(yù)設(shè)比值時確定所述至少一個運動目標(biāo)區(qū)域為干擾區(qū)域。
可選地,在上述方法中,所述預(yù)設(shè)高度等于所述預(yù)設(shè)寬度。
可選地,在上述方法中,所述預(yù)設(shè)比值為所述預(yù)設(shè)寬度與所述預(yù)設(shè)高度的比值。
可選地,在上述方法中,根據(jù)所述待測圖像之前的圖像幀中的所述至少一個運動目標(biāo)區(qū)域與所述待測圖像中的所述至少一個運動目標(biāo)區(qū)域的相似度確定所述至少一個運動目標(biāo)區(qū)域是否為干擾區(qū)域的步驟,包括:
計算所述待測圖像之前的預(yù)設(shè)數(shù)量幀圖像中的所述至少一個運動目標(biāo)區(qū)域與所述待測圖像中的所述至少一個運動目標(biāo)區(qū)域的相似度,得到所述預(yù)設(shè)數(shù)量個相似度;
在所述預(yù)設(shè)數(shù)量個相似度分別達到相似度閾值時,確定所述至少一個運動目標(biāo)區(qū)域為干擾區(qū)域。
可選地,在上述區(qū)域中,所述相似度通過歸一化互信息表征。
本發(fā)明實施例還提供一種跌倒檢測裝置,所述跌倒檢測裝置包括:
前景區(qū)域提取模塊,用于基于預(yù)設(shè)背景模型從采集到的待測圖像中提取出前景區(qū)域;
干擾區(qū)域確定模塊,用于根據(jù)預(yù)設(shè)規(guī)則確定所述前景區(qū)域中的干擾區(qū)域;
干擾區(qū)域刪除模塊,用于刪除所述干擾區(qū)域,得到待測區(qū)域;
跌倒檢測模塊,用于通過深度學(xué)習(xí)網(wǎng)絡(luò)模型對所述待測圖像中的所述待測區(qū)域進行處理,以檢測所述待測圖像中是否包括處于跌倒?fàn)顟B(tài)的人的圖像。
可選地,在上述裝置中,所述前景區(qū)域包括至少一個運動目標(biāo)區(qū)域;所述干擾區(qū)域確定模塊包括:
第一確定子模塊,用于根據(jù)所述至少一個運動目標(biāo)區(qū)域與所述待測圖像中的預(yù)設(shè)區(qū)域的相對位置關(guān)系確定所述至少一個運動目標(biāo)區(qū)域是否為干擾區(qū)域;和/或
第二確定子模塊,用于根據(jù)所述至少一個運動目標(biāo)區(qū)域的尺寸確定所述至少一個運動目標(biāo)區(qū)域是否為干擾區(qū)域;和/或
第三確定子模塊,用于根據(jù)所述待測圖像之前的圖像幀中的所述至少一個運動目標(biāo)區(qū)域與所述待測圖像中的所述至少一個運動目標(biāo)區(qū)域的相似度確定所述至少一個運動目標(biāo)區(qū)域是否為干擾區(qū)域。
本發(fā)明實施例提供的跌倒檢測方法及裝置,基于預(yù)設(shè)背景模型從采集到的待測圖像中提取出前景區(qū)域,剔除前景區(qū)域中的干擾區(qū)域得到待測區(qū)域,通過深度學(xué)習(xí)網(wǎng)絡(luò)模型對待測圖像中的待測區(qū)域進行處理,以檢測待測圖像中是否包括處于跌倒?fàn)顟B(tài)的人的圖像。通過上述設(shè)計,一方面,只需要對剔除干擾區(qū)域后的待測區(qū)域進行檢測,減少了需要檢測的信息量,提高了檢測效率。另一方面,通過深度學(xué)習(xí)網(wǎng)絡(luò)模型對剔除干擾區(qū)域后的待測區(qū)域進行檢測,能夠提高檢測結(jié)果的準(zhǔn)確性。
附圖說明
為了更清楚地說明本發(fā)明實施例的技術(shù)方案,下面將對實施例中所需要使用的附圖作簡單地介紹,應(yīng)當(dāng)理解,以下附圖僅示出了本發(fā)明的某些實施例,因此不應(yīng)被看作是對范圍的限定,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他相關(guān)的附圖。
圖1為本發(fā)明實施例提供的一種監(jiān)控系統(tǒng)的連接框圖。
圖2為本發(fā)明實施例提供的一種處理裝置的方框示意圖。
圖3為本發(fā)明實施例提供的一種跌倒檢測方法的流程示意圖。
圖4為本發(fā)明實施例提供的一種深度學(xué)習(xí)網(wǎng)絡(luò)模型的示意圖。
圖5為本發(fā)明實施例提供的一種跌倒檢測裝置的功能模塊框圖。
圖標(biāo):10-監(jiān)控系統(tǒng);100-處理裝置;110-跌倒檢測裝置;111-前景區(qū)域提取模塊;112-干擾區(qū)域確定模塊;113-干擾區(qū)域刪除模塊;114-跌倒檢測模塊;120-存儲器;130-處理器;140-檢測單元;150-通信單元;200-圖像采集裝置;300-網(wǎng)絡(luò)。
具體實施方式
為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例。通常在此處附圖中描述和展示的本發(fā)明實施例的組件可以以各種不同的配置來布置和設(shè)計。
因此,以下對在附圖中提供的本發(fā)明的實施例的詳細(xì)描述并非旨在限制要求保護的本發(fā)明的范圍,而是僅僅表示本發(fā)明的選定實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
應(yīng)注意到:相似的標(biāo)號和字母在下面的附圖中表示類似項,因此,一旦某一項在一個附圖中被定義,則在隨后的附圖中不需要對其進行進一步定義和解釋。
如圖1所示,是本發(fā)明實施例提供的一種監(jiān)控系統(tǒng)10的連接框圖,所述監(jiān)控系統(tǒng)10包括處理裝置100及圖像采集裝置200,所述處理裝置100與圖像采集裝置200可通過網(wǎng)絡(luò)300進行通信,以實現(xiàn)數(shù)據(jù)通訊或交互。所述網(wǎng)絡(luò)300可以是,但不限于,有線網(wǎng)絡(luò)或無線網(wǎng)絡(luò)。
其中,圖像采集裝置200指具有圖像或視頻采集功能的設(shè)備,例如,攝像機、攝像頭等。所述處理裝置100可以是獨立的裝置,例如服務(wù)器等,也可以是所述圖像采集裝置200中的子裝置。
如圖2所示,是本發(fā)明實施例提供的一種處理裝置100的方框示意圖。所述處理裝置100包括跌倒檢測裝置110、存儲器120、處理器130、檢測單元140以及通信單元150。
所述存儲器120、處理器130、檢測單元140以及通信單元150各元件相互之間直接或間接地電性連接,以實現(xiàn)數(shù)據(jù)的傳輸或交互。例如,這些元件相互之間可通過一條或多條通訊總線實現(xiàn)電性連接。所述跌倒檢測裝置110包括至少一個可以軟件或固件(firmware)的形式存儲于所述存儲器120中或固化在所述處理裝置100的操作系統(tǒng)中的功能模塊。其中,所述存儲器120可以是,但不限于,隨機存取存儲器(randomaccessmemory,ram),只讀存儲器(readonlymemory,rom),可編程只讀存儲器(programmableread-onlymemory,prom),可擦除只讀存儲器(erasableprogrammableread-onlymemory,eprom),電可擦除只讀存儲器(electricerasableprogrammableread-onlymemory,eeprom)等。
所述處理器130可以是一種集成電路芯片,具有信息處理能力。所述處理器130可以是通用處理器,包括中央處理器(centralprocessingunit,簡稱cpu)、網(wǎng)絡(luò)處理器(networkprocessor,簡稱np)等。還可以是數(shù)字信號處理器(dsp)、專用集成電路(asic)、現(xiàn)場可編程門陣列(fpga)或者其他可編程邏輯器件、分立門或者晶體管邏輯器件、分立硬件組件??梢詫崿F(xiàn)或者執(zhí)行本發(fā)明實施例中公開的各方法、步驟及邏輯框圖。通用處理器可以是微處理器或者該處理器也可以是任何常規(guī)的處理器等。
所述存儲器120可用于存儲軟件程序、模塊以及采集到的圖像信息,所述處理器130在接收到執(zhí)行指令后,執(zhí)行存儲在存儲器120中的軟件程序及模塊,從而執(zhí)行相應(yīng)的功能應(yīng)用及信息處理。
所述檢測單元140可以為圖像傳感器,所述通信單元150用于通過網(wǎng)絡(luò)300建立與外部設(shè)備(如圖像采集裝置200)之間的通信連接。
可以理解,圖2所示的結(jié)構(gòu)僅為示意,所述處理裝置100還可包括比圖2所示更多或更少的組件,或具有與圖2所示不同的配置。此外,圖2所示的各組件可采用硬件、軟件或其組合實現(xiàn)。
本發(fā)明實施例提供的跌倒檢測方法及裝置,可用于對監(jiān)控圖像進行檢測,以判斷監(jiān)控范圍內(nèi)是否有處于跌倒?fàn)顟B(tài)的人。
如圖3所示,是本發(fā)明實施例提供的一種跌倒檢測方法的流程示意圖,所述跌倒檢測方法可應(yīng)用于圖1所示的監(jiān)控系統(tǒng)10。下面將對圖3所示的具體流程及步驟作詳細(xì)闡述。
步驟s101,基于預(yù)設(shè)背景模型從采集到的待測圖像中提取出前景區(qū)域。
在本實施例中,所述預(yù)設(shè)背景模型可通過現(xiàn)有的多種方式建立,例如混合高斯背景建模、基于碼本(cookbook)背景建模及基于幀差背景建模等。
以混合高斯背景建模為例,對某一場景的監(jiān)控圖像,監(jiān)控圖像中在一段時間內(nèi)相對靜止的區(qū)域即為背景,所述背景中的每一像素點在一段時間內(nèi)可用高斯分布表示。對于擾動因素較多的情況,為了描述準(zhǔn)確,可以為每個像素建立多個模式,每個模式用一種高斯模型表示。也即,可通過多個(通常為3~5個)高斯模型的加權(quán)疊加來表示每一像素點。
采用該場景的一段幀數(shù)的監(jiān)控圖像來對上述模型進行訓(xùn)練,剔除該場景中的動態(tài)因素,從而得到該場景的背景圖像的混合高斯模型。
實施時,可將采集到的待測圖像的每一像素點與訓(xùn)練得到的混合高斯模型進行匹配,若匹配成功,則該像素點為背景像素點,若匹配失敗,則該像素點為前景像素點。匹配完成后,得到的各前景像素點組成所述前景區(qū)域?;谏鲜龇治隹芍?,最終得到的前景區(qū)域為待測圖像中可能發(fā)生變化的區(qū)域。
確定所述待測圖像中的前景區(qū)域后,可將該前景區(qū)域提取出來,剩余部分即為背景區(qū)域。為了便于后續(xù)處理,在本實施例中,可計算出所述前景區(qū)域的外接矩形,并將所述待測圖像中的所述外接矩形所在范圍作為所述前景區(qū)域提取出來進行后續(xù)處理。
由于監(jiān)控范圍內(nèi)有人跌倒的區(qū)域必然是采集到的監(jiān)控圖像中會發(fā)生變化的區(qū)域,若監(jiān)控圖像中某一區(qū)域在一段時間內(nèi)未發(fā)生變化,則說明該區(qū)域中沒有人運動,也就不會有人跌倒。因而,在本實施例中,將可能發(fā)生變化的區(qū)域作為前景區(qū)域提取出來,并僅對前景區(qū)域進行處理以檢測是否有處于跌倒?fàn)顟B(tài)的人的圖像,不會導(dǎo)致檢測結(jié)果不準(zhǔn)確。相對地,僅對前景區(qū)域進行處理可以降低后續(xù)檢測的數(shù)據(jù)處理量,大大提高了檢測效率。
然而,經(jīng)發(fā)明人研究發(fā)現(xiàn),采用背景建模提取前景區(qū)域的時候,除了所述目標(biāo)的狀態(tài)變化之外,光照變化等任何變化都會體現(xiàn)到前景區(qū)域中。也即,通過背景建模提取出的前景區(qū)域中可能包括需要檢測的目標(biāo)所在區(qū)域,也可能包括其他干擾發(fā)生的區(qū)域。若將其他干擾發(fā)生的區(qū)域從所述前景區(qū)域中剔除,可以進一步提高檢測的效率。并且,由于檢測前會剔除干擾區(qū)域,監(jiān)控場景除所述目標(biāo)的變化之外的其他變化因素不會對檢測結(jié)果造成影響,魯棒性更好。
步驟s102,根據(jù)預(yù)設(shè)規(guī)則確定所述前景區(qū)域中的干擾區(qū)域。
根據(jù)實際情況,一個監(jiān)控場景內(nèi)發(fā)生變化的地方可能有多處,各個變化的地方可能在該監(jiān)控場景的不同位置。因此,在本實施例中,所述前景區(qū)域包括至少一個運動目標(biāo)區(qū)域,所述運動目標(biāo)區(qū)域可理解為一個發(fā)生變化的區(qū)域。
可選地,所述前景區(qū)域中可以包括一個運動目標(biāo)區(qū)域、兩個運動目標(biāo)區(qū)域或多個運動目標(biāo)區(qū)域。通常,所述前景區(qū)域中會包括幾百個運動目標(biāo)區(qū)域,而所述幾百個運動目標(biāo)區(qū)域中大部分是干擾區(qū)域。因此,在實際應(yīng)用中,將前景區(qū)域中的干擾區(qū)域剔除能夠極大程度地降低數(shù)據(jù)處理量。
在本實施例中,所述步驟s102可通過多種方式實現(xiàn)。例如,所述步驟s102可包括第一子步驟:
根據(jù)所述至少一個運動目標(biāo)區(qū)域與所述待測圖像中的預(yù)設(shè)區(qū)域的相對位置關(guān)系確定所述至少一個運動目標(biāo)區(qū)域是否為干擾區(qū)域。
作為一種實施方式,所述第一子步驟可通過如下步驟實現(xiàn)。
檢測所述至少一個運動目標(biāo)區(qū)域是否位于所述待測圖像的預(yù)設(shè)區(qū)域內(nèi),若不位于所述預(yù)設(shè)區(qū)域內(nèi),則確定所述至少一個運動目標(biāo)區(qū)域為干擾區(qū)域。
經(jīng)發(fā)明人研究發(fā)現(xiàn),在所述前景區(qū)域中,人只可能在其中某一些區(qū)域活動,例如,地板。而在另一些區(qū)域(如,墻壁、床等),人不可能在其中活動,也就不可能發(fā)生跌倒。
因而,在本實施例中,可以預(yù)先確定人可能活動的區(qū)域作為所述預(yù)設(shè)區(qū)域。在提取出前景區(qū)域后,可以檢測前景區(qū)域中的運動目標(biāo)區(qū)域是否在該預(yù)設(shè)區(qū)域內(nèi)。也即,檢測前景區(qū)域中的運動目標(biāo)區(qū)域是否在人可能活動的區(qū)域內(nèi)。若不在,表明該運動目標(biāo)區(qū)域不可能是人的運動所導(dǎo)致的,也就不可能根據(jù)該運動目標(biāo)區(qū)域檢測到處于跌倒?fàn)顟B(tài)的人。因而,可以將該運動目標(biāo)區(qū)域作為干擾區(qū)域。
又例如,所述步驟s102可包括第二子步驟:
根據(jù)所述至少一個運動目標(biāo)區(qū)域的尺寸確定所述至少一個運動目標(biāo)區(qū)域是否為干擾區(qū)域。
作為一種實施方式,所述第二子步驟可以通過如下步驟實現(xiàn)。
首先,計算所述至少一個運動目標(biāo)區(qū)域的外接矩形的高度、寬度以及所述高度與所述寬度的比值。
然后,在所述高度未達到預(yù)設(shè)高度、所述寬度未達到預(yù)設(shè)寬度或所述高度與寬度的比值未達到預(yù)設(shè)比值時確定所述至少一個運動目標(biāo)區(qū)域為干擾區(qū)域。
在本實施例中,所述預(yù)設(shè)高度、預(yù)設(shè)寬度及預(yù)設(shè)比值的具體數(shù)值可根據(jù)需要檢測的目標(biāo)的實際情況進行設(shè)置,本實施例對此并不限制。以上述檢測室內(nèi)是否有人跌倒為例,可通過統(tǒng)計得到人的最小寬度(如,20cm),并將所述最小寬度作為所述預(yù)設(shè)寬度。由于無論人處于哪種狀態(tài),其高度必然不會小于其寬度,因而,為了確保干擾區(qū)域確定的準(zhǔn)確性,可將所述預(yù)設(shè)寬度作為所述預(yù)設(shè)高度,也即,所述預(yù)設(shè)高度等于所述預(yù)設(shè)寬度。
可選地,因為無論人處于何種狀態(tài),其高度與寬度的比值必然大于或等于寬度與高度的比值,所以,所述預(yù)設(shè)比值可以為所述預(yù)設(shè)寬度與統(tǒng)計得到的最小高度的比值。
又例如,所述步驟s102可包括第三子步驟:
根據(jù)所述待測圖像之前的圖像幀中的所述至少一個運動目標(biāo)區(qū)域與所述待測圖像中的所述至少一個運動目標(biāo)區(qū)域的相似度確定所述至少一個運動目標(biāo)區(qū)域是否為干擾區(qū)域。
作為一種實施方式,所述第二子步驟可通過如下步驟實現(xiàn)。
首先,計算所述待測圖像之前的預(yù)設(shè)數(shù)量幀圖像中的所述至少一個運動目標(biāo)區(qū)域與所述待測圖像中的所述至少一個運動目標(biāo)區(qū)域的相似度,得到預(yù)設(shè)數(shù)量個相似度。
其中,所述待測圖像之前的預(yù)設(shè)數(shù)量幀圖像是指所述圖像采集裝置200在所述待測圖像之前采集到的預(yù)設(shè)數(shù)量幀圖像。
為了便于描述,本實施例中約定所述待測圖像之前采集到的圖像為第一圖像,所述待測圖像為第二圖像。因而,上述步驟可理解為,選取預(yù)設(shè)數(shù)量幀第一圖像,計算每一幀第一圖像與所述第二圖像之間的相似度,得到預(yù)設(shè)數(shù)量個相似度。也即,最終得到的相似度的數(shù)量與選取的第一圖像的幀數(shù)相同。
在本實施例中,獲取所述預(yù)設(shè)數(shù)量幀第一圖像的方式有多種。作為一種實施方式,可以在所述待測圖像的采集時刻之前預(yù)設(shè)時間段內(nèi)選取所述預(yù)設(shè)數(shù)量幀第一圖像,所述預(yù)設(shè)數(shù)量幀第一圖像之間可以間隔一定時間。
為了確保檢測的準(zhǔn)確性,所述預(yù)設(shè)時間段可以為3~5分鐘。其中,選取的預(yù)設(shè)數(shù)量幀圖像中的每相鄰兩幀圖像之間的時間間隔可以相同,例如,分別選擇待測圖像之前1分鐘、2分鐘、3分鐘處的圖像幀作為所述第一圖像與所述第二圖像進行比較。選取的預(yù)設(shè)數(shù)量幀第一圖像中的每相鄰兩幀第一圖像之間的時間間隔也可以不同,本實施例對此不做限制。所述預(yù)設(shè)數(shù)量可根據(jù)需要進行靈活設(shè)定。為了檢測的準(zhǔn)確性及計算效率,可將所述預(yù)設(shè)數(shù)量設(shè)置為2~5個,例如,3個。
可選地,在本實施例中,第一圖像與第二圖像的相似度可通過多種信息表征。例如,可通過所述第一圖像與第二圖像的歸一化互信息表征。其中,所述第一圖像與第二圖像的歸一化互信息可通過所述第一圖像與第二圖像的互信息以及所述第一圖像和第二圖像各自的信息熵計算得到。當(dāng)計算得到歸一化互信息值越大,表明用于計算的兩幅圖像的相似度越大。
又例如,可基于上述歸一化互信息的計算方式進行改進,得到一種前背景隔離度量標(biāo)準(zhǔn)(foregroundbackgroundsegregatemeasure,fbsm),用于表征所述第一圖像和第二圖像中相同位置的運動目標(biāo)區(qū)域之間的相似度。所述第一圖像中的運動目標(biāo)區(qū)域flo和所述第二圖像中與所述運動目標(biāo)區(qū)域flo位置相同的運動目標(biāo)區(qū)域ref的fbsm值計算過程如下:
首先,通過運動目標(biāo)區(qū)域flo與運動目標(biāo)區(qū)域ref的聯(lián)合直方圖計算得到所述運動目標(biāo)區(qū)域flo與運動目標(biāo)區(qū)域ref的聯(lián)合概率分布:
其中,h(ri,fj)表示運動目標(biāo)區(qū)域ref和運動目標(biāo)區(qū)域flo的聯(lián)合直方圖,ri是運動目標(biāo)區(qū)域ref的第i級灰度值,fj是運動目標(biāo)區(qū)域flo的第j級灰度值,bin表示灰度級,p(ri,fj)表示運動目標(biāo)區(qū)域ref和運動目標(biāo)區(qū)域flo的聯(lián)合概率分布。
然后,根據(jù)所述運動目標(biāo)區(qū)域flo和運動目標(biāo)區(qū)域ref的聯(lián)合概率分布分別計算所述運動目標(biāo)區(qū)域ref的邊緣概率分布和所述運動目標(biāo)區(qū)域flo的邊緣概率分布。
其中,p(ri)表示運動目標(biāo)區(qū)域ref的邊緣概率分布,p(fj)表示運動目標(biāo)區(qū)域flo的邊緣概率分布。
最后,可根據(jù)運動目標(biāo)區(qū)域flo和運動目標(biāo)區(qū)域ref的聯(lián)合概率分布以及所述運動目標(biāo)區(qū)域flo和運動目標(biāo)區(qū)域ref各自的邊緣概率分布計算得到所述運動目標(biāo)區(qū)域flo和運動目標(biāo)區(qū)域ref的fbsm值。
詳細(xì)地,所述運動目標(biāo)區(qū)域flo和運動目標(biāo)區(qū)域ref的fbsm值可通過以下計算式計算得到:
當(dāng)計算得到的fbsm值越大,表明用于計算的運動目標(biāo)區(qū)域flo和運動目標(biāo)區(qū)域ref之間的相似度越大。
然后,在所述預(yù)設(shè)數(shù)量個相似度分別達到相似度閾值時,確定所述至少一個目標(biāo)區(qū)域為干擾區(qū)域。
其中,所述相似度閾值可根據(jù)需求進行靈活設(shè)定,通常會根據(jù)統(tǒng)計數(shù)據(jù)進行設(shè)定。
在本實施例中,針對每個運動目標(biāo)區(qū)域,當(dāng)用于計算的多個第一圖像中的該運動目標(biāo)區(qū)域與所述第二圖像中的該運動目標(biāo)區(qū)域的相似度均達到相似度閾值時,表明所述第二圖像與所述多個第一圖像都極為相似,而所述多個第一圖像是在所述第二圖像之前采集到的圖像,如此可知,待測圖像中的該運動目標(biāo)區(qū)域相對于之前的圖像中的該運動目標(biāo)區(qū)域變化不大,可以將其作為干擾區(qū)域。
又例如,所述步驟s102可以同時包括第一子步驟、第二子步驟或第三子步驟中的至少兩個子步驟。并且,在本實施例中,當(dāng)所述步驟s102包含的子步驟個數(shù)大于一個時,對各子步驟的執(zhí)行順序不作限定。
以所述步驟s102包括第二子步驟和第三子步驟為例,實施時,可以先針對所述前景區(qū)域執(zhí)行第一子步驟以確定第一干擾區(qū)域,再針對所述前景區(qū)域中除所述第一干擾區(qū)域之外的區(qū)域執(zhí)行第二子步驟,以確定第二干擾區(qū)域,并將所述第一干擾區(qū)域和第二干擾區(qū)域作為所述干擾區(qū)域。
也可以先針對所述前景區(qū)域執(zhí)行第二子步驟,以確定所述前景區(qū)域中的第三干擾區(qū)域,再針對所述前景區(qū)域中除所述第三干擾區(qū)域之外的區(qū)域執(zhí)行所述第一子步驟,以確定第四干擾區(qū)域,并將所述第三干擾區(qū)域和第四干擾區(qū)域作為所述干擾區(qū)域。
步驟s103,刪除所述干擾區(qū)域,得到待檢測區(qū)域。
在本實施例中,刪除所述前景區(qū)域中的所述干擾區(qū)域后,得到的待檢測區(qū)域即為所述待測圖像中可能包括處于跌倒?fàn)顟B(tài)的人的圖像。也即,在待測圖像中如果存在處于跌倒?fàn)顟B(tài)的人的圖像,那么,所述處于跌倒?fàn)顟B(tài)的人的圖像存在于所述待測區(qū)域中。
步驟s104,通過深度學(xué)習(xí)網(wǎng)絡(luò)模型對所述待測圖像中的所述待測區(qū)域進行處理,以檢測所述待測圖像中是否包括處于跌倒?fàn)顟B(tài)的人。
其中,所述深度學(xué)習(xí)網(wǎng)絡(luò)模型是訓(xùn)練好的深度學(xué)習(xí)網(wǎng)絡(luò)模型,訓(xùn)練是指對包含大量的人跌倒情形的圖像和其他非跌倒時(如,站立、坐、彎腰、蹲下等)的圖像進行匹配訓(xùn)練。如此,將所述待測圖像中的所述待測區(qū)域通過訓(xùn)練好的深度學(xué)習(xí)網(wǎng)絡(luò)模型進行處理,可以匹配出該待測區(qū)域的圖像是否包括處于跌倒?fàn)顟B(tài)的人。
需要說明的是,通過背景建模方法提取出的前景區(qū)域、確定干擾區(qū)域及刪除干擾區(qū)域的計算過程直接得到的通常是二值圖像,需要將該二值圖像映射到所述待測圖像中的對應(yīng)區(qū)域,再將待測圖像中的該區(qū)域作為所述待測區(qū)域。也即,所述待測區(qū)域是原始的待測圖像上除背景區(qū)域、干擾區(qū)域之外的區(qū)域。
在本實施例中,可通過多種訓(xùn)練好的深度學(xué)習(xí)網(wǎng)絡(luò)模型對所述待測圖像進行處理。例如圖4所示的深度學(xué)習(xí)網(wǎng)絡(luò)模型,所述深度學(xué)習(xí)網(wǎng)絡(luò)模型包括多層結(jié)構(gòu),其中,第一層為數(shù)據(jù)層data,包括進行訓(xùn)練所需的所有圖像數(shù)據(jù)信息(如,圖像數(shù)據(jù)的格式、每次可處理的圖像數(shù)據(jù)量及是否對圖像數(shù)據(jù)進行尺度變換等)。所述數(shù)據(jù)層data用于輸出圖像數(shù)據(jù)給第二層使用。
第二層為包括卷積層conv1及設(shè)置于所述卷積層conv1之后的非線性映射層relu1,所述卷積層conv1用于對輸入的圖像數(shù)據(jù)(即,所述待測圖像的待測區(qū)域)進行第一次卷積操作。其中,卷積所使用的卷積核可根據(jù)需求進行選擇。所述非線性映射層實現(xiàn)非線性映射的方式可以有多種,例如sigmoid、tanh、relu、leakyrelu、elu及maxout等。作為一種實施方式,本實施例中可選用relu,其數(shù)學(xué)表達式為f(x)=max(0,x),也即,針對卷積出來的結(jié)果,若小于0,則舍棄。
第三層包括卷積層conv2和非線性映射層relu2,其中,卷積層conv2用于對卷積層conv1的卷積結(jié)果進行第二次卷積操作,費線性映射層relu2用于對卷積層conv2的卷積結(jié)果進行非線性映射,具體實現(xiàn)過程與第二層類似。
第四層為池化層pool1,用于對第三層輸出的結(jié)果進行降采樣操作,以降低圖像大小,進而加快處理速度。通常,可采用maxpooling、averagepooling等方法進行池化,作為一種實施方式,本實施例采用maxpooling進行池化。
所述深度學(xué)習(xí)網(wǎng)絡(luò)模型的第五層、第六層均是卷及操作和非線性操作,其具體實現(xiàn)過程與第二層類似。第七層是池化層,其具體實現(xiàn)過程與第四層類似。
第八層包括全連接層ip1、非線性映射層relu5和隨機失活層drop,全連接層是一種特殊的卷積層,即在全連接層中,上一層的神經(jīng)元和下一層的每個神經(jīng)元都是有聯(lián)系的,而在卷積層中,上一層的神經(jīng)元并非和下一層的每個神經(jīng)元都有聯(lián)系。在全連接層ip1做好卷積操作后,還需通過非線性映射層relu5對卷積結(jié)果進行非線性映射,并對非線性映射的結(jié)果做隨機失活,以防止訓(xùn)練的網(wǎng)絡(luò)300出現(xiàn)過擬合現(xiàn)象。隨機失活的具體操作為隨機地關(guān)閉一些神經(jīng)元,讓其不再作用于下一層神經(jīng)元。
所述深度學(xué)習(xí)網(wǎng)絡(luò)模型的第九層為全連接層ip2,其具體實現(xiàn)過程與第八層的全連接層ip1類似,但在這一層不進行非線性映射和隨機失活。所述深度學(xué)習(xí)網(wǎng)絡(luò)模型的最后一層位偏差計算層loss,用于計算所述深度學(xué)習(xí)網(wǎng)絡(luò)模型計算出來的值與真實值的偏差,所述偏差通常可采用l0正則化、lasso、ridge等方法進行計算。
需要說明的是,圖4所示的深度學(xué)習(xí)網(wǎng)絡(luò)模型只是其中一種優(yōu)選方式,通過現(xiàn)有的其他深度學(xué)習(xí)網(wǎng)絡(luò)模型也可實現(xiàn)本實施例的檢測過程。圖4所示的深度學(xué)習(xí)網(wǎng)絡(luò)模型相對于現(xiàn)有的其他深度學(xué)習(xí)網(wǎng)絡(luò)模型,在保證準(zhǔn)確性的前提下減少層數(shù),大大降低了計算量,提高了檢測效率。
如圖5所示,是本發(fā)明實施例提供的一種跌倒檢測裝置110。所述跌倒檢測裝置110包括前景區(qū)域提取模塊111、干擾區(qū)域確定模塊112、干擾區(qū)域刪除模塊113以及跌倒檢測模塊114。
其中,所述前景區(qū)域提取模塊111用于基于預(yù)設(shè)背景模型從采集到的待測圖像中提取出前景區(qū)域。
在本實施例中,關(guān)于所述前景區(qū)域提取模塊111的描述具體可參考對圖3所示步驟s101的詳細(xì)描述,也即,所述步驟s101可由所述前景區(qū)域提取模塊111執(zhí)行。
所述干擾區(qū)域確定模塊112用于根據(jù)預(yù)設(shè)規(guī)則確定所述前景區(qū)域中的干擾區(qū)域。
在本實施例中,關(guān)于所述干擾區(qū)域確定模塊112的描述具體可參考對圖3所示步驟s102的詳細(xì)描述,也即,所述步驟s102可由所述干擾區(qū)域確定模塊112執(zhí)行。
所述干擾區(qū)域刪除模塊113用于刪除所述干擾區(qū)域,得到待測區(qū)域。
在本實施例中,關(guān)于所述干擾區(qū)域刪除模塊113的描述具體可參考對圖3所示步驟s103的詳細(xì)描述,也即,所述步驟s103可由所述干擾區(qū)域刪除模塊113執(zhí)行。
所述跌倒檢測模塊114用于通過深度學(xué)習(xí)網(wǎng)絡(luò)模型對所述待測圖像中的所述待測區(qū)域進行處理,以檢測所述待測圖像中是否包括處于跌倒?fàn)顟B(tài)的人的圖像。
在本實施例中,關(guān)于所述跌倒檢測模塊114的描述具體可參考對圖3所示步驟s104的詳細(xì)描述,也即,所述步驟s104可由所述跌倒檢測模塊114執(zhí)行。
可選地,在本實施例中,所述干擾區(qū)域確定模塊112可以包括第一確定子模塊和/或第二確定子模塊和/或第二確定子模塊,也即,可包括第一確定子模塊、第二確定子模塊或第三確定子模塊中的至少一個。
其中,所述第一確定子模塊用于根據(jù)所述至少一個運動目標(biāo)區(qū)域與所述待測圖像中的預(yù)設(shè)區(qū)域的相對位置關(guān)系確定所述至少一個運動目標(biāo)區(qū)域是否為干擾區(qū)域。
可選地,在本實施例中,所述第一確定子模塊根據(jù)所述至少一個運動目標(biāo)區(qū)域與所述待測圖像中的預(yù)設(shè)區(qū)域的相對位置關(guān)系確定所述至少一個運動目標(biāo)區(qū)域是否為干擾區(qū)域的方式可以包括:
檢測所述至少一個運動目標(biāo)區(qū)域是否位于所述待測圖像的預(yù)設(shè)區(qū)域內(nèi),若不位于所述預(yù)設(shè)區(qū)域內(nèi),則確定所述至少一個運動目標(biāo)區(qū)域為干擾區(qū)域。
其中,所述預(yù)設(shè)區(qū)域可以是預(yù)先劃定的監(jiān)控范圍內(nèi)人可能活動的區(qū)域。關(guān)于所述第一確定子模塊的描述具體可參考上述內(nèi)容中對相關(guān)步驟的詳細(xì)描述。
所述第二確定子模塊用于根據(jù)所述至少一個運動目標(biāo)區(qū)域的尺寸確定所述至少一個運動目標(biāo)區(qū)域是否為干擾區(qū)域。
可選地,在本實施例中,所述第二確定子模塊根據(jù)所述至少一個運動目標(biāo)區(qū)域的尺寸確定所述至少一個運動目標(biāo)區(qū)域是否為干擾區(qū)域的方式,可以包括:
計算所述至少一個運動目標(biāo)區(qū)域的外接矩形的高度、寬度以及所述高度與寬度的比值,在所述高度未達到預(yù)設(shè)高度、所述寬度未達到預(yù)設(shè)寬度或所述高度與寬度的比值未達到預(yù)設(shè)比值時確定所述至少一個運動目標(biāo)區(qū)域為干擾區(qū)域。
其中,所述預(yù)設(shè)高度可以等于所述預(yù)設(shè)寬度。在本實施例中,關(guān)于所述第二確定子模塊的描述具體可參考上述內(nèi)容中的相關(guān)描述。
所述第三確定子模塊用于根據(jù)待測圖像之前的圖像幀中的所述至少一個運動目標(biāo)區(qū)域與所述待測圖像中的所述至少一個運動目標(biāo)區(qū)域的相似度確定所述至少一個運動目標(biāo)區(qū)域是否為干擾區(qū)域。
可選地,在本實施例中,所述第三確定子模塊根據(jù)所述待測圖像之前的圖像幀中的所述至少一個運動目標(biāo)區(qū)域與所述待測圖像中的所述至少一個運動目標(biāo)區(qū)域的相似度確定所述至少一個運動目標(biāo)區(qū)域是否為干擾區(qū)域的方式,可以包括:
計算所述待測圖像之前的預(yù)設(shè)數(shù)量幀圖像中的所述至少一個運動目標(biāo)區(qū)域與所述待測圖像中的所述至少一個運動目標(biāo)區(qū)域的相似度,得到所述預(yù)設(shè)數(shù)量個相似度,在所述預(yù)設(shè)數(shù)量個相似度分別達到相似度閾值時,確定所述至少一個運動目標(biāo)區(qū)域為干擾區(qū)域。
在本實施例中,關(guān)于所述第三確定子模塊具體可參考上述內(nèi)容中的相關(guān)描述。
綜上所述,本發(fā)明實施例提供的跌倒檢測方法及裝置,基于預(yù)設(shè)背景模型從采集到的待測圖像中提取出前景區(qū)域,剔除前景區(qū)域中的干擾區(qū)域得到待測區(qū)域,通過深度學(xué)習(xí)網(wǎng)絡(luò)模型對待測圖像中的待測區(qū)域進行處理,以檢測待測圖像中是否包括處于跌倒?fàn)顟B(tài)的人。通過上述設(shè)計,一方面,只需要對剔除干擾區(qū)域后的待測區(qū)域進行檢測,減少了需要檢測的信息量,提高了檢測效率。另一方面,通過深度學(xué)習(xí)網(wǎng)絡(luò)模型對剔除干擾區(qū)域后的待測區(qū)域進行檢測,能夠提高檢測結(jié)果的準(zhǔn)確性。
在本發(fā)明實施例所提供的幾個實施例中,應(yīng)該理解到,所揭露的系統(tǒng)和方法,也可以通過其它的方式實現(xiàn)。以上所描述的系統(tǒng)和方法實施例僅僅是示意性的,例如,附圖中的流程圖和框圖顯示了根據(jù)本發(fā)明的多個實施例的系統(tǒng)、方法和計算機程序產(chǎn)品的可能實現(xiàn)的體系架構(gòu)、功能和操作。在這點上,流程圖或框圖中的每個方框可以代表一個模塊、程序段或代碼的一部分,所述模塊、程序段或代碼的一部分包含一個或多個用于實現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實現(xiàn)方式中,方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個連續(xù)的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或動作的專用的基于硬件的系統(tǒng)來實現(xiàn),或者可以用專用硬件與計算機指令的組合來實現(xiàn)。
另外,在本發(fā)明各個實施例中的各功能模塊可以集成在一起形成一個獨立的部分,也可以是各個模塊單獨存在,也可以兩個或兩個以上模塊集成形成一個獨立的部分。
所述功能如果以軟件功能模塊的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機可讀取存儲介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分或者該技術(shù)方案的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機,電子設(shè)備,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:u盤、移動硬盤、只讀存儲器(rom,read-onlymemory)、隨機存取存儲器(ram,randomaccessmemory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。需要說明的是,在本文中,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。
以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,對于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。