基于Gist特征與極限學習機的場景分類方法
【技術領域】
[0001] 本發(fā)明涉及場景圖像特征提取方法以及極限學習機分類方法。具體的說,就是利 用提取圖像的GiSt全局特征,然后利用經(jīng)過樣本訓練的極限學習機對圖像分類的方法。
【背景技術】
[0002] 場景分類是計算機視覺圖片分類的重要分支。場景描述與理解的概念,在2006年 的MIT場景理解研討會上得到了進一步明確,同時會議上還指出,場景分類是一個新的有 前途的研宄方向,其主要應用在四個主要方面:圖像/視頻檢索,計算機視覺任務,移動機 器人以及圖像增強。
[0003] 基于視覺的場景分類方法大致可以劃分為3類:基于對象的場景分類、基于區(qū)域 的對象分類以及基于上下文的場景分類?;谝曈X的場景分類方法大部分都是以對象為單 位的,典型的基于對象的場景分類方法有分割、特征重組和對象識別等步驟。這種方法的弊 端是底層的錯誤會隨著處理的深入而被放大。另一種比較常見的場景分類方法則是基于區(qū) 域的。該類方法的關鍵在于如何將圖片可靠的分割成區(qū)域,并且要求每個區(qū)域都有其本身 的特征。此類方法面對分割時并不那么靈活,這在非約束的環(huán)境下尤為突出,因此,很少有 完全基于區(qū)域的場景分類方法?;谏舷挛牡膱鼍胺诸愂橇硪环N主流的場景分類方法,這 種方法的特點在于忽略了傳統(tǒng)的場景分類處理步驟,將輸入圖片作為一個特征,并提取可 以概括圖像統(tǒng)計或語義的低維特征。該類方法的目的即為提高場景分類的魯棒性。因為自 然圖片中很容易摻雜一些隨機噪聲,這類噪聲會對局部處理造成災難性的影響,而對于全 局圖像卻可以通過平均數(shù)來降低這種影響。基于上下文的方法,通過識別全局對象,而非場 景中的小對象集合或者準確的區(qū)域邊界,因此不需要處理小的孤立區(qū)域的噪聲和低級圖 片的變化,其解決了分割和目標識別分類方法遇到的問題。
[0004] Gist特征是一種生物啟發(fā)特征,該特征模擬人的視覺提取圖像中粗略但簡明扼要 的上下文信息。場景Gist(GG)特征是通過多尺度多方向的Gabor濾波器組對場景圖像濾 波后得到的輪廓信息。
[0005] 極限學習機是對單隱層前饋神經(jīng)網(wǎng)絡研宄中提出的一種新的單隱含層前饋神經(jīng) 網(wǎng)絡。該神經(jīng)網(wǎng)絡對于輸入層與隱含層間的連接權值及隱含層神經(jīng)元的偏置沒有任何要 求,且在訓練過程中這兩種參數(shù)無需調(diào)整,只需要設置隱含層神經(jīng)元的個數(shù),便可以獲得唯 一的最優(yōu)解。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明所要解決的問題是面向場景分類應用需要,設計一種高性能、高可擴展的 自主場景分類方法,為計算機視覺的進一步研宄和應用提供基礎。
[0007] 本發(fā)明中的場景分類算法包括場景特征提取和根據(jù)特征學習分類兩個過程。具體 的設計方案如下:
[0008] A圖像Gist特征提取
[0009] Gist特征是一種全局特征,包括了自然度,開放度,粗略度,展開度和崎嶇度五種 自然屬性??梢杂脕韺D像產(chǎn)生一個綜合的認知,避免了設置各種參數(shù)和門限。而且圖像 的Gist特征是基于Gabor小波提取的,研宄發(fā)現(xiàn)Gabor小波可以很好的模擬人的視覺神經(jīng) 細胞,在提取圖像信息時能發(fā)揮重要的作用。本發(fā)明采用Gabor小波對場景圖像進行卷積 操作,然后提取Gist向量作為場景圖像的特征描述,將此特征描述用于接下來的場景分類 當中,具體過程為:
[0010] -幅大小為rXc的灰度圖像f(x, y)用m尺度η方向的Gabor濾波器組進行濾 波,即分別同η。個通道的濾波器進行卷積,其中η。= mXn,再級聯(lián)卷積的結(jié)果,即為圖像 Gist(IG)特征,將一副大小為rXc的灰度圖像f(x, y)劃分成npXnp的規(guī)則網(wǎng)格,各網(wǎng)格 塊按行依次記作Pi,其中i = 1,. . .,ng;每個網(wǎng)格塊大小為r' X c',分別用η。個通道的濾波 器對圖像進行卷積濾波,則每個網(wǎng)格塊各通道濾波后,級聯(lián)的結(jié)果稱為塊Gist (PG)特征, 對Gp (Gp表示每個網(wǎng)格塊的Gist (PG)特征)塊各通道濾波結(jié)果取均值后按行組合的結(jié)果稱 為全局Gist (GG)特征,即(Ge是全局Gist (GG)特征)
【主權項】
1.基于Gist特征與極限學習機的場景分類方法,其特征在于包括 W下步驟;A圖像Gist特征提?。? 采用Gabor小波對場景圖像進行卷積操作,然后提取Gist向量作為場景圖像的特征描 述,將此特征描述用于接下來的場景分類當中,具體過程為: 一幅大小為rXc的灰度圖像f (X,y)用m尺度n方向的G油or濾波器組進行濾波,即 分別同n。個通道的濾波器進行卷積,其中n。= mXn,再級聯(lián)卷積的結(jié)果,即為圖像Gist特 征,將一副大小為rXc的灰度圖像f(x,y)劃分成npXnp的規(guī)則網(wǎng)格,各網(wǎng)格塊按行依次記 作Pi,其中i = 1,. . .,rv每個網(wǎng)格塊大小為r X C',分別用n。個通道的濾波器對圖像進行 卷積濾波,則每個網(wǎng)格塊各通道濾波后,級聯(lián)的結(jié)果稱為塊Gist特征,用護表示每個網(wǎng)格 塊的Gist特征,對護塊各通道濾波結(jié)果取均值后按行組合的結(jié)果為全局Gist特征,用G 6 表示全局Gist特征;
(1) 式中
' GG的維數(shù)為ncXrv B極限學習機對Gist特征進行學習完成圖像分類: 設P個不同的訓練樣本為(X。ti),其中Xi= [X。,X。,. . .,xJTe R巧t 1 = [tu,ti2,...,tjTG R-,i 二 i,2,...,n,學習網(wǎng)絡建模為;
其中,M是隱藏節(jié)點的個數(shù),g( ?)為激勵函數(shù),選用hardlim或hardlims, Wj = [w…Wj2,. . .,WjJTE Rn是輸入節(jié)點與第j個隱藏節(jié)點的連接權重,b j e R是第j個隱藏節(jié)點 的偏置,0 j= [ 0 jl, 0 j2, . . .,0 jm]Te Rm是輸出節(jié)點與第j個隱藏節(jié)點的連接權重,W j 'Xi 表示W(wǎng)j和X i的內(nèi)積; 輸入連接權重和隱層節(jié)點偏置(W,b)可隨機選擇,通過學習找到特定的= 1,2,...,M使得分類總誤差最?。? mini I e I |2,S. t. £ 1= t i_〇i,i = 1, 2, . . . , N 做其中,e ;= [e。,e。,...,ejT是第i個樣本輸出值與真實值間的差值;做式中,〇i是輸出值,是 Gist特征輸入后網(wǎng)絡輸出的值,ti是真實值,是類別的值; 假設合理訓練的隱層前饋神經(jīng)網(wǎng)絡SLFN能夠無誤差地逼近N個訓練樣本,式(3)改寫 為: H 0 = T 或 I IH 0 -T I I = 0 (4) 其中,
H稱為神經(jīng)網(wǎng)絡的隱層輸出矩陣,H的第i行對應于所有隱藏節(jié)點對第i個訓練輸入Xi 的輸出向量,而H中的第j列是第j個隱層節(jié)點對應于輸入樣本Xk,k = 1,2,. . .,N的輸出 向量; 求解如下線性方程組的廣義最小二乘獲得^ :
(6) 上述線性方程組的廣義最小二乘解為
(7) 其中H+=化巧)-咱T為隱層輸出矩陣H的Moore-Penrose廣義逆; 得到了 ^后,測試網(wǎng)絡就形成了,然后輸入測試圖片的Gist特征,進行測試分類,代入 H0 =0,求輸出值0,與各類設置的類別的標簽對比進行歸類,確定所屬類別。
【專利摘要】一種基于Gist特征與極限學習機的場景分類方法,先提取圖像的Gist特征,采用Gabor小波對場景圖像進行卷積操作,然后提取Gist向量作為場景圖像的特征描述,將此特征描述用于場景分類當中。本發(fā)明利用Gist特征對圖像產(chǎn)生一個綜合的認知、綜合描述了自然度,開放度,粗略度,展開度和崎嶇度五種自然屬性,相比較傳統(tǒng)的場景分類方法可以避免根據(jù)各種實際情況設置不同的參數(shù)和門限。解決了傳統(tǒng)分類中在變化情況較多條件下必須不斷調(diào)整分類門限的技術難題,運算速度快且具有很好的泛化能力,擴展性很好,隨著分類情況復雜度提高、規(guī)模的擴大表現(xiàn)出來的優(yōu)越性越好。
【IPC分類】G06K9-66, G06K9-46, G06K9-62
【公開號】CN104598920
【申請?zhí)枴緾N201410840024
【發(fā)明人】高穎慧, 王魯平, 李飚, 王平, 梁楹, 張路平, 趙明, 范明喆
【申請人】中國人民解放軍國防科學技術大學
【公開日】2015年5月6日
【申請日】2014年12月30日