基于隨機森林學習的rgb-d顯著物體檢測方法
【技術領域】
[0001] 本發(fā)明設及顯著性物體檢測領域,更具體地,設及一種基于隨機森林學習的RGB-D 顯著性物體檢測方法。 技術背景
[0002] 科技的發(fā)展和進步帶來了數據量的激增。一方面圖像、視頻等資源呈爆炸式增長, 給人類生活帶來了極大的便利。另一方面,運種增長也給信息處理帶來了新問題,那就是信 息冗余。對于任何信息處理設備,如果不依靠有效的方法去除視覺數據中的冗余部分,是難 W達到實時處理數據的效果的。模仿人類高層次認知W及處理復雜信息的過程,如目標識 另IJ,圖像分類,場景分析等,都依賴于大量數據的處理與學習。如何通過預處理提取數據的 最有效部分,去除冗余部分,從而使整個任務變得更高效,是一個值得研究的問題。
[0003] 人類感知系統(tǒng)具有獨特的特性。人類觀察一幅圖像或一段視頻時,會對最主要的 信息量大的區(qū)域產生注意力,并進一步對其進行分析處理。從生物學角度上講,注意力是通 過視網膜中的兩個部分共同作用產生的,那就是具有高分辨力的中央凹W及分辨力低的外 圍?;谶\種生理結構的視覺注意力可W指導人類區(qū)分場景中的重要部分W及進一步發(fā)現 細節(jié)信息。因此,研究者們希望智能系統(tǒng)(計算機)也能夠參照人類處理視覺信息的原理,仿 照運種高效的方法對海量數據進行處理,盡量消除或降低信息冗余,從而能夠抓住要點,方 便后續(xù)處理任務的進行。
[0004] 為了探尋視覺注意力的科學本質,并進一步模擬視覺注意力結構,科學家進行了 大量實驗與研究。屯、理學家研究了與行為相關的視覺注意力。神經生理學家詳細說明了神 經元如何自適應調整,W更好的表達目標。計算神經科學家建立了現實的神經網絡模型,試 圖來模擬和解釋注意力行為。根據W上各領域的研究,機器人科學家與計算機視覺學者試 圖設計合理的模型,來模擬生物視覺系統(tǒng)。他們的目的是,建立具有合理計算復雜度的智能 系統(tǒng),使它們能夠在一定程度上完成人類能夠完成的視覺任務,甚至人類很難完成的任務。 [000引在計算機視覺領域,與視覺注意力相一致的研究課題就是視覺顯著度的計算。為 了能讓計算機模仿人的視覺注意機制對圖像進行處理,需要建立一個有效的能在計算機上 實現的數學模型。然而,視覺的顯著度是視覺輸入信號的一個難W準確定義的特征屬性。信 號的顏色、紋理、位置等屬性,都是特征意義明顯的,對區(qū)域的顯著度有獨立或者禪合的貢 獻。從直觀角度上看,顯著度高的區(qū)域是指場景中一些與其鄰域和全局對比度高的區(qū)域。運 種強烈的對比度使得視覺系統(tǒng)能夠直接對突出的物體區(qū)域產生視覺注意力。排除屯、理層面 和主體自身的記憶、期望等因素,通常情況下,人類對對比度高的,或者具有語義含義的物 體或區(qū)域更容易產生視覺注意力。通用的顯著度計算模型都是基于特征對比度的計算和先 驗知識的利用,主要分為適用于場景驅動的自底向上的模型W及基于任務驅動的自頂向下 的模型。
【發(fā)明內容】
[0006] 本發(fā)明的目的是建立一種可w實現從圖像區(qū)域特征向顯著值的有效映射并將多 尺度分割中得到的多幅顯著圖有效融合成一幅顯著圖的方法。本發(fā)明的技術方案如下:
[0007] 一種基于隨機森林學習的RGB-D顯著物體檢測方法,包括下面的步驟:
[0008] 1)首先利用隨機森林的方法將圖像進行Μ個尺度的分割;
[0009] 2)提取區(qū)域特征,包括紋理濾波器響應、顏色直方圖特征和LBP算子特征;
[0010] 3)計算區(qū)域對比度描述子:圖像的顏色和紋理信息用一個特征向量來描述每一個 區(qū)域,用V來表示,對于區(qū)域RESm,把和它直接鄰接的幾個區(qū)域當作一個整體,并且計算其 顏色和紋理特征/,區(qū)域對比度描述子就定義成該區(qū)域特征和它的鄰域特征的差值,其中, 特征中包含的直方圖的差值會按分布差別度來計算。
[0011] 4)計算區(qū)域對比度和區(qū)域背景度量描述子,如表一所示,其中d(Xl,X2) = (|xi廣X21 ,...,I X 1 η - X 2 η I ),η是向量X 1和X 2的維度,II表示的是絕對值;
)是向量hi和h2的維度,Σ表示的是求和號。
[0012] 表一區(qū)域對比度和區(qū)域背景度量描述子特征組成
[0013]
[0014] 5)計算區(qū)域性質描述子,如表二所示:
[0015] 表二區(qū)域性質描述子特征組成
[0016]
[0017] 6)設計一個從大量訓練樣本中學習到的一個有效的區(qū)域顯著性估計器,訓練樣本 包括一個顯著性區(qū)域的集合W及相對應的顯著值,它們都是通過對事先標注了顯著區(qū)域的 圖像進行多尺度分割后,選擇不同區(qū)域來獲得的。如果獲得的一個區(qū)域所包含的像素超過 90%屬于顯著物體,本發(fā)明認為運是完全置信樣本,將它對應的顯著值設為1。如果獲得的 一個區(qū)域所包含的像素超過90%屬于背景,將它對應的顯著值設為0。兩個條件都不滿足的 區(qū)域,排除在外不參與訓練;對每一個區(qū)域用一個特征向量來表示,該特征向量包括區(qū)域對 比度,區(qū)域性質W及區(qū)域背景度量描述子。從訓練數據W及給定的顯著值中學習得到一個 隨機森林回歸器;
[0018] 7)對于一幅圖像,利用隨機森林回歸器獲得該圖像的多個區(qū)域的顯著圖{Ai, A2, ...,Am},需要一個合并器將它們融合到一起形成最終的顯著圖。
[0019] 本發(fā)明提出的基于隨機森林學習的RGB-D顯著物體檢測算法對于不同的場景類型 和物體尺寸都能準確定位顯著對象,并且給出與目標物體的真值幾乎相等的顯著性值。在 背景與顯著區(qū)域區(qū)分度較小時此方法依然可W很好地發(fā)揮作用。
【附圖說明】
[0020] 圖1本發(fā)明算法和其他算法對比的PR曲線圖
【具體實施方式】
[0021] 本發(fā)明將顯著值估計抽象成一個回歸問題。采用回歸森林回歸器將區(qū)域特征向量 映射成一個顯著值。本發(fā)明所提出的算法主要包括Ξ個步驟。首先,從粗到精,對圖像進行 多尺度的分割。然后,構建了一個隨機森林回歸器,其能夠實現從圖像區(qū)域特征向顯著值的 有效映射。最后,將從多尺度分割中得到的多幅顯著圖有效的融合成一幅顯著圖。技術方案 如下:
[0022] 首先,本發(fā)明所提出的算法利用超像素分割的方法將圖像進行分割。然后采用Ξ 種類型的特征來表示每個區(qū)域:區(qū)域對比度,區(qū)域性質和區(qū)域背景度量。該特征被送入一個 隨機森林回歸器f,得到一個顯著值。盡管將區(qū)域分別進行計算看起來忽略了相鄰區(qū)域的相 關性,但是,實際上有效的將運種關聯性考慮在內。在多個尺度上進行區(qū)域顯著值計算的更 精細分割中的相鄰區(qū)域在更粗糖的分割中有可能是屬于同一個區(qū)域的,運種內在的包含關 系有效的保持了空域的顯著值連貫性。運個隨機森林回歸器是通過在大量數據上訓練得來 的,能夠有效區(qū)分各種特征并加 W有效的組合。最后,將計算得到的每個區(qū)域的顯著圖通過 融合的方法得到最終的顯著圖。過程如下:
[0023] 8)首先利用隨機森林的方法將圖像進行Μ個尺度的分割,每一個分割S= {Si, S2, . . .,Sm}都包含Κι個區(qū)域R。Si是最精細的分割,包含了最多的區(qū)域。Sm是最粗糖的分割,包 含的區(qū)域數目最少。采用過分割后,= .!/?,',盡...,<;,其中Κι是分割產生的區(qū)域個數。
[0024] 9)其次從圖像中提取區(qū)域特征,本發(fā)明采用了紋理濾波器響應、顏色直方圖特征、 [00巧]LBP算子特征。
[0026] 10)