視頻監(jiān)控系統(tǒng)圖像獲取方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于多媒體技術(shù)領(lǐng)域,尤其涉及一種視頻監(jiān)控系統(tǒng)圖像獲取方法及裝置。
【背景技術(shù)】
[0002] 與文本信息相比,圖像、視頻包含的信息豐富,其以直觀、生動(dòng)和實(shí)時(shí)等優(yōu)點(diǎn)而廣 泛應(yīng)用于各行各業(yè)。
[0003] 對(duì)于大范圍區(qū)域的視頻監(jiān)控,理論上可以使用大量攝像機(jī)將監(jiān)控區(qū)域全面覆蓋, 這些攝像機(jī)在視域上互相重疊或者相鄰。這種攝像機(jī)布置方式的監(jiān)控系統(tǒng)成本較高;而且 也沒(méi)有必要,因?yàn)椴⒎撬械膮^(qū)域都需要監(jiān)控。因此,在實(shí)際監(jiān)控系統(tǒng)中,為了降低成本,通 常在重要區(qū)域布置攝像機(jī),每個(gè)攝像機(jī)僅覆蓋一塊需要監(jiān)控的區(qū)域。雖然這些攝像機(jī)視域 間會(huì)留下監(jiān)控盲區(qū),但每個(gè)攝像機(jī)并不孤立,目標(biāo)會(huì)通過(guò)盲區(qū)在不同攝像機(jī)視域間轉(zhuǎn)移。這 樣,通過(guò)合理的配置,少量攝像機(jī)就可構(gòu)成一個(gè)能覆蓋大片區(qū)域的監(jiān)控系統(tǒng),稱之為無(wú)重疊 視域多攝像機(jī)(Non-OverlappingMulti-Camera)監(jiān)控系統(tǒng)。
[0004] 無(wú)重疊視域多攝像機(jī)監(jiān)控系統(tǒng)是安全防范系統(tǒng)的主要組成部分,是一種防范能力 較強(qiáng)的綜合系統(tǒng)。隨著經(jīng)濟(jì)社會(huì)的發(fā)展,人們對(duì)安全監(jiān)控的需求層次提高,因此在各種重要 場(chǎng)合安裝大量的攝像機(jī),形成的無(wú)重疊視域多攝像機(jī)監(jiān)控系統(tǒng)每一時(shí)刻都會(huì)產(chǎn)生大量的圖 像、視頻數(shù)據(jù),圖像、視頻數(shù)據(jù)給人們的工作生活帶來(lái)極大便利的同時(shí),也使得從大量圖像、 視頻數(shù)據(jù)中快速準(zhǔn)確地尋找感興趣的目標(biāo)對(duì)象變得十分困難。
【發(fā)明內(nèi)容】
[0005] 為了克服現(xiàn)有技術(shù)難以快速準(zhǔn)確的從大量的圖像、視頻數(shù)據(jù)中尋找感興趣的目標(biāo) 對(duì)象,本發(fā)明一方面提供了一種視頻監(jiān)控系統(tǒng)圖像獲取方法。技術(shù)方案如下:
[0006] -種視頻監(jiān)控系統(tǒng)圖像獲取方法,其包括:
[0007] 獲取監(jiān)控視頻中的一個(gè)幀,即獲得該幀表示的圖像;
[0008] 按照預(yù)定噪聲去除規(guī)則去除所述圖像中的噪聲數(shù)據(jù);
[0009] 按照預(yù)定對(duì)象識(shí)別規(guī)則在所述去除噪聲數(shù)據(jù)的圖像中識(shí)別目標(biāo)對(duì)象;
[0010] 為所述幀添加標(biāo)簽,所述標(biāo)簽?zāi)芑谡Z(yǔ)義表達(dá)目標(biāo)對(duì)象的預(yù)定特征;
[0011] 對(duì)應(yīng)所述幀存儲(chǔ)所述標(biāo)簽。
[0012] 對(duì)應(yīng)地,本發(fā)明另一方面提供了一種視頻監(jiān)控系統(tǒng)圖像獲取裝置,其包括:
[0013] 獲取單元,所述獲取單元用于獲取監(jiān)控視頻的一個(gè)幀,即獲得該幀表示的圖像;
[0014] 去噪單元,所述去噪單元用于按照預(yù)定噪聲去除規(guī)則去除所述圖像中的噪聲數(shù) 據(jù);
[0015] 識(shí)別單元,所述識(shí)別單元用于按照預(yù)定對(duì)象識(shí)別規(guī)則在所述去除噪聲數(shù)據(jù)的圖像 中識(shí)別目標(biāo)對(duì)象;
[0016] 添加單元,所述添加單元用于為所述幀添加標(biāo)簽,所述標(biāo)簽?zāi)芑谡Z(yǔ)義表達(dá)目標(biāo) 對(duì)象的預(yù)定特征;
[0017] 存儲(chǔ)單元,所述存儲(chǔ)單元用于存儲(chǔ)所述幀對(duì)應(yīng)的標(biāo)簽。
[0018] 借由以上的技術(shù)方案,本發(fā)明的有益效果在于:本申請(qǐng)通過(guò)對(duì)提取的視覺(jué)底層特 征,按照預(yù)定的算法映射到便于人直觀理解的高層語(yǔ)義信息,并在此基礎(chǔ)上實(shí)現(xiàn)對(duì)視頻監(jiān) 控圖像數(shù)據(jù)的分類和標(biāo)注,較好的表達(dá)視頻監(jiān)控圖像數(shù)據(jù)的語(yǔ)義,減小甚至消除圖像底層 特征與人類豐富語(yǔ)義內(nèi)容之間的"語(yǔ)義鴻溝",實(shí)現(xiàn)視頻監(jiān)控圖像的快速、高效的獲取。
【附圖說(shuō)明】
[0019] 為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使 用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于 本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他 的附圖。
[0020] 圖1為本發(fā)明一實(shí)施例方法的流程示意圖;
[0021] 圖2為一視頻監(jiān)控圖像的示意圖;
[0022] 圖3為本發(fā)明另一實(shí)施例方法的流程示意圖;
[0023] 圖4為本發(fā)明一實(shí)施場(chǎng)景的示意圖;
[0024]圖5為本發(fā)明一實(shí)施例裝置的模塊結(jié)構(gòu)示意圖;
[0025]圖6為本發(fā)明另一實(shí)施例裝置的模塊結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0026] 下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;?本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他 實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0027] 在過(guò)去的三十幾年時(shí)間里,基于內(nèi)容的圖像檢索(ContentBasedImage Retrieval,CBIR)成為研究熱點(diǎn),其目的是找到一種高效的方法,可以在大容量的圖像數(shù)據(jù) 庫(kù)中,自動(dòng)完成圖像的檢索過(guò)程,并且能夠最大限度的減小圖像底層視覺(jué)特征與人類豐富 語(yǔ)義內(nèi)容之間的"語(yǔ)義鴻溝"。
[0028]當(dāng)前大量的基于內(nèi)容的圖像檢索思想都是使用顏色、紋理、形狀及區(qū)域等視覺(jué)底 層特征來(lái)獲得圖像內(nèi)容信息,衡量圖像之間的相似程度以實(shí)現(xiàn)基于內(nèi)容的檢索。然而,這些 所謂的圖像內(nèi)容信息反映的只是圖像的一些客觀統(tǒng)計(jì)特性,并不能真正被人類視覺(jué)理解, 人們判斷圖像的相似性并非建立在圖像的顏色、形狀的相似性上,而是主要根據(jù)圖像的含 義來(lái)判斷圖像是否符合自己的需要,這些圖像含義即是圖像的高層語(yǔ)義知識(shí)。
[0029] 此外,現(xiàn)有技術(shù)中基于顏色、紋理、形狀及區(qū)域等視覺(jué)底層特征獲得圖像內(nèi)容信息 不具有時(shí)空連續(xù)性。例如:基于顏色特征的檢索方法抽取的特征向量是顏色直方圖,雖然能 夠較好地反映圖像中各種顏色的頻率分布,但實(shí)際監(jiān)控系統(tǒng)的多個(gè)攝像機(jī)采集的監(jiān)控圖像 中,與目標(biāo)對(duì)象的顏色相同或相似的對(duì)象較多,從而導(dǎo)致檢索得到的并不是想要的;且由于 環(huán)境光照強(qiáng)度、拍攝角度、成像特性、對(duì)象遠(yuǎn)近等差異,不同攝像機(jī)采集到的同一對(duì)象的顏 色也會(huì)有差異。
[0030] 所以,理想的圖像檢索模式應(yīng)該是基于圖像高層語(yǔ)義特征的檢索。例如,用戶需 要查找"騎電動(dòng)車、戴頭盔的人",這就要求系統(tǒng)能夠自動(dòng)識(shí)別"電動(dòng)車"和"頭盔"等語(yǔ)義信 息。然而,目前的計(jì)算機(jī)視覺(jué)和圖像理解技術(shù)還不能自動(dòng)提取圖像的語(yǔ)義特征,只能借助圖 像的外觀輪廓和基于專業(yè)監(jiān)控人員個(gè)人知識(shí)水平的辨別。但是,這種查找方式費(fèi)時(shí)費(fèi)力, 且效率低下。實(shí)驗(yàn)表明,一名專業(yè)監(jiān)控人員在同時(shí)查看兩臺(tái)視頻監(jiān)控器的情況下,22min之 后將會(huì)錯(cuò)過(guò)95%的應(yīng)監(jiān)視目標(biāo)。此外,西方有句謗語(yǔ),"apictureisworthathousand words",一幅圖像本身包含的語(yǔ)義信息非常豐富,不同的人對(duì)同一幅圖像的語(yǔ)義理解不盡 相同,給出的查詢結(jié)果是基于不同的人的主觀認(rèn)識(shí),自然也就千差萬(wàn)別。
[0031] 解決這一問(wèn)題的方法是尋求有效地、具有一定語(yǔ)義意義的特征描述方法,并且該 方法可以將視覺(jué)底層特征映射到便于人直觀理解的高層語(yǔ)義。
[0032] CBIR的本質(zhì)是在提取視頻監(jiān)控圖像的視覺(jué)底層特征的基礎(chǔ)上,從圖像庫(kù)中找出與 查詢圖像相關(guān)或相似的對(duì)象。這實(shí)質(zhì)上蘊(yùn)含著一個(gè)前提:即語(yǔ)義相關(guān)的對(duì)象具有相似的視 覺(jué)底層特征。這就使得對(duì)視頻監(jiān)控圖像進(jìn)行語(yǔ)義信息分類、加注分類標(biāo)簽成為可能。
[0033] 本申請(qǐng)基于上述理論,通過(guò)實(shí)現(xiàn)基于內(nèi)容的圖像分類、加注分類標(biāo)簽來(lái)提取便于 人直觀理解的高層語(yǔ)義信息。具體地,本申請(qǐng)?zhí)峁┑囊环N實(shí)施方式的流程圖如圖1所示。
[0034] 該實(shí)施例可以包括:
[0035] S10 :獲取監(jiān)控視頻中的一個(gè)幀,即獲得該幀表示的圖像。
[0036] 本實(shí)施方式獲取監(jiān)控視頻的是單幀圖像。獲取的方式可以是通過(guò)單兵裝備攝像