專利名稱:基于改進(jìn)概率主題模型的地點圖像識別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種圖像識別方法,尤其是一種基于改進(jìn)概率主題模型的地點圖像識別方法,用于室內(nèi)及室外地點圖像的識別。
背景技術(shù):
目前,隨著智能移動機器人走進(jìn)人們的日常生活,并在軍事、商場、醫(yī)院、家庭等各種領(lǐng)域發(fā)揮重要作用,人們對智能移動機器人系統(tǒng)的自動定位需求越來越迫切。移動機器人只有準(zhǔn)確地知道自身的位置以及所處的工作空間,才能安全有效地進(jìn)行自主運動,為人類服務(wù)。因此,自定位和位置估計成為自主移動機器人最重要的能力之一。視覺系統(tǒng)能夠為移動機器人提供最豐富的感知信息,同時也具有最接近人類的環(huán)境感知方式。因此,基于視覺的機器人自定位問題吸引了大量研究人員的參與,同時也取得了大量的研究成果?;谝曈X的機器人自定位根據(jù)使用的視覺特征信息的不同,可分為3種基于地標(biāo)特征的自定位方法、基于圖像外觀特征的自定位方法以及最近出現(xiàn)的基于地點識別的自定位方法。其中,基于地點或者場景識別的機器人視覺自定位方法使用人類能夠直接理解的高層語義信息如“門口”、“走廊”、“廚房”等作為視覺特征,非常適合于機器人在復(fù)雜環(huán)境中的自定位問題。2005年李桂芝,安成萬,楊國盛等.基于場景識別的移動機器人定位方法研究[J].機器人,2005,27 (2) :123-127使用多通道Gabor濾波器提取場景圖像的全局紋理特征,并使用支持向量機來分類識別室內(nèi)、走廊、門廳等場景,進(jìn)而實現(xiàn)機器人的邏輯定位,2008年Ullah M M,Pronobis A,Caputo B,et al. Towards robust place recognition for robot localization[C]//Proc of 2008IEEE ICRA. 2008 :530-537 使用 Harris 角點特征檢測子和SIFT特征描述子提取局部特征,并使用支持向量機作為分類器實現(xiàn)基于局部特征的地點識別。然而,機器人實際獲得的圖片常會出現(xiàn)拍攝角度、光照的不同,遮擋甚至背景混亂,以及因為人物及物體的位置變化而導(dǎo)致的高度動態(tài)變化等現(xiàn)象,這些固有的可變性導(dǎo)致地點圖像識別的過程充滿了不確定。為了更好地解決地點圖像識別過程中由于拍攝角度、光照的不同,以及人物和物體的高度動態(tài)變化所導(dǎo)致的不確定性問題,引入基于概率主題模型的圖像識別方法,并對原始概率主題模型進(jìn)行改進(jìn),降低算法復(fù)雜度的同時有效提聞識別性能。概率主題模型是一種流行的一種圖模型結(jié)構(gòu),它能夠?qū)嶋H問題進(jìn)行概率建模, 并對各種復(fù)雜相關(guān)的因素進(jìn)行刻畫。作為概率論和圖論相結(jié)合的產(chǎn)物,為解決地點圖像識別中的不確定性、復(fù)雜性提供了直觀而自然的方法。目前,概率主題模型在人工智能、自然語言處理、文本分類等領(lǐng)域已經(jīng)取得了很好的應(yīng)用效果,并逐漸引入到圖像識別領(lǐng)域中。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于概率主題模型的地點圖像識別方法,更好地解決地點圖像識別過程中由于拍攝角度、光照的不同,以及人物和物體的高度動態(tài)變化所導(dǎo)致的不確定性問題,并對原始概率主題模型進(jìn)行改進(jìn),降低算法復(fù)雜度的同時有效提高識別性能。為了達(dá)到上述目的,本發(fā)明所采用的技術(shù)方案是提供一種基于改進(jìn)概率主題模型的地點圖像識別方法,通過改進(jìn)的概率主題模型建立圖像的潛在主題分布,然后通過分類器來識別未知地點圖像,其特征包括以下步驟I)圖像獲取步驟,通過安裝在機器人上的標(biāo)準(zhǔn)攝像頭拍攝獲取訓(xùn)練圖像和測試圖2)圖像預(yù)處理步驟,將獲取的圖像進(jìn)行灰度化,并將其尺寸縮小至128X128像素;3)特征提取步驟,采用尺度不變特征提取算法(Scale-Invariant Features(SIFT))對圖像進(jìn)行局部特征提??;4)特征聚類步驟,將所有特征通過k-means算法進(jìn)行聚類,得到若干聚類中心;5)特征分配步驟,將每幅圖像的特征點在對應(yīng)的聚類中心上進(jìn)行投票,得出每幅圖像對應(yīng)于每個聚類中心的頻數(shù)表示向量;6)潛在主題建模步驟,以步驟5)中得出的圖像的頻數(shù)向量作為輸入特征變量,設(shè)定潛在主題個數(shù),采用改進(jìn)的概率主題模型對圖像進(jìn)行建模,學(xué)習(xí)模型,得到圖像的潛在主題分布向量;7)采用分類器識別未知地點圖像。所述步驟I)中訓(xùn)練圖像和測試圖像由安裝在機器人上的標(biāo)準(zhǔn)攝像頭按照固定路徑拍攝得到,圖像可包含光照、視角、尺度的變化以及人物和物體的動態(tài)變化。所述步驟3)中采用尺度不變特征提取算法(Scale-Invariant Features (SIFT)) 對圖像進(jìn)行局部特征提取包括圖像關(guān)鍵點檢測以及將關(guān)鍵點表示為128維的特征描述子。所述步驟6)中的概率主題模型為潛在Dirichlet分布模型(Latent Dirichlet Allocation, LDA),對原始LDA模型進(jìn)行改進(jìn),加入量化函數(shù)得到改進(jìn)模型Quantified LDA 模型(QLDA),對訓(xùn)練圖像和測試圖像進(jìn)行建模。改進(jìn)模型對于每幅圖像的模型生成過程如下對于每幅圖像X,選擇一個Dirichlet參數(shù)π , Ji服從參數(shù)為α的Dirichlet分布,g卩Ji Dirichlet ( α ),對于每幅圖像的每個特征χ」,選擇一個主題ζ」,服從參數(shù)π的離散分布,即Zj discrete O ),然后選擇一個特征Xj,服從參數(shù)β的概率分布,即Xj p(Xj| β), β是每幅圖像的不同特征對應(yīng)不同主題的概率,如果一幅圖像有m個特征,k個設(shè)定的主題,則β為mXk的矩陣;對于圖像的所有特征,統(tǒng)計并分析數(shù)據(jù)集中每幅圖像的特征分布,根據(jù)不同數(shù)據(jù)集的特征分布情況,建立對應(yīng)的量化函數(shù)QUP,對輸入特征進(jìn)行分級量化處理,使其服從Xj Q(Xj)分布,這樣每幅圖像的密度函數(shù)可表示為P(x \(Χ,β)= I ρ(π I )nj=1 Tj2j P(zj I ^)P(Xj I Zj, P)Q(Xj )dn ;分級量化的基本思想是統(tǒng)計平均每幅圖像的特征在各區(qū)間內(nèi)的密集程度,最密集且特征值較小的特征,區(qū)分度最低,作為非顯著特征忽略;比較密集且特征值較大的特征,區(qū)分度較高,保持不變;最稀疏且特征值最大的特征,區(qū)分度最高,作為顯著特征,近似處理為距離其最近的整十?dāng)?shù)(實驗顯示該處理可降低計算復(fù)雜度,且不會影響識別性能);具體的量化標(biāo)準(zhǔn)制定方法如下
統(tǒng)計輸入特征的最小值Xniin和最大值Xniax ;設(shè)定[a,b]區(qū)間的特征密度函數(shù)D(a,b),表示特征在[a,b]區(qū)間內(nèi)的密集程度, 表達(dá)式如下
權(quán)利要求
1. 一種基于改進(jìn)概率主題模型的地點圖像識別方法,其特征在于,通過改進(jìn)的概率主題模型建立圖像的潛在主題分布,然后通過分類器來識別未知地點圖像,包括以下步驟1.1.圖像獲取步驟,通過安裝在機器人上的標(biāo)準(zhǔn)攝像頭拍攝獲取訓(xùn)練圖像和測試
圖1.2.圖像預(yù)處理步驟,將獲取的圖像進(jìn)行灰度化,并將其尺寸縮?。?.3.特征提取步驟,采用尺度不變特征提取算法對圖像進(jìn)行局部特征提??;I. 4.特征聚類步驟,將所有特征通過k-means算法進(jìn)行聚類,得到若干聚類中心;I. 5.特征分配步驟,將每幅圖像的特征點在對應(yīng)的聚類中心上進(jìn)行投票,得出每幅圖像對應(yīng)于每個聚類中心的頻數(shù)表示向量;I. 6.潛在主題建模步驟,以步驟I. 5中得出的圖像的頻數(shù)向量作為輸入特征變量,設(shè)定潛在主題個數(shù),采用改進(jìn)的概率主題模型對圖像進(jìn)行建模,學(xué)習(xí)模型,得到圖像的潛在主題分布向量;I.7.采用分類器識別未知地點圖像;所述步驟I. 6中學(xué)習(xí)算法采用Variational推斷;估計模型參數(shù)U % β*),使整個圖像集的似然函數(shù)P ( X α *, β *)最大;與原始LDA相同,該似然函數(shù)不可求,須采用Variational推斷;利用Jensen不等式獲得一個可計算的下界來近似真實的似然函數(shù)值,然后估計參數(shù)來最大化這個下界;用L(y,Φ ;α,β)表示似然函數(shù)的近似下界,則有Iogp (X I α , β ) = L( Y , Φ ; α , β )+KL (q( π , ζ | Y , Φ) | | β ( π , ζ | χ, α , β ))其中 Iogp (χ I α,β )為似然函數(shù),q O , ζ | Y , Φ)為 Variational 分布,ρΟ , ζ |χ, α, β )為后驗概率密度函數(shù),KL(q(3 , ζ I Y , Φ) I |ρ( 3 , ζ |χ, α , β ))為 Variational 分布與后驗概率密度函數(shù)的Kullback-Leibler距離;由上,最大化下界L( Y,Φ ; α , β )使其接近似然函數(shù)logp(x| α,β)就可以轉(zhuǎn)變?yōu)楣烙媴?shù) U*,Φ*)使 KL(qU,z| Υ,Φ)||ρ(π,ζ χ,α, β))最小,即:(Y *, Φ*) = arg min (γ, $)KL(q( η , ζ Y, Φ)||ρ(π,ζ|χ, α, β))Yi和$〃的計算公式如下
2.根據(jù)權(quán)利要求I所述的基于改進(jìn)概率主題模型的地點圖像識別方法,其特征在于, 所述步驟I. I中訓(xùn)練圖像和測試圖像由安裝在機器人上的標(biāo)準(zhǔn)攝像頭按照固定路徑拍攝得到,圖像包含光照、視角、尺度的變化以及人物和物體的動態(tài)變化。
3.根據(jù)權(quán)利要求I所述的基于改進(jìn)概率主題模型的地點圖像識別方法,其特征在于, 所述的步驟I. 2的縮小尺寸為128 X 128像素。
4.根據(jù)權(quán)利要求I所述的基于改進(jìn)概率主題模型的地點圖像識別方法,其特征在于, 所述步驟I. 3中采用尺度不變特征提取算法對圖像進(jìn)行局部特征提取包括圖像關(guān)鍵點檢測以及將關(guān)鍵點表示為128維的特征描述子。
5.根據(jù)權(quán)利要求I所述的基于改進(jìn)概率主題模型的地點圖像識別方法,其特征在于, 所述步驟I. 7中分類器為最近鄰分類方法。
全文摘要
一種基于改進(jìn)概率主題模型的地點圖像識別方法,屬于圖像識別技術(shù)領(lǐng)域。目的在于更好地解決地點圖像識別中由于不同角度、光照,以及人物和物體的高度動態(tài)變化導(dǎo)致的不確定性問題。包括以下步驟圖像獲取步驟;圖像預(yù)處理步驟;特征提取步驟,采用SIFT算法對圖像進(jìn)行特征提取;特征聚類步驟,將所有特征聚類,得到若干聚類中心;特征分配步驟,將每幅圖像的特征在聚類中心上投票,得出對應(yīng)每個聚類中心的頻數(shù)向量;潛在主題建模步驟,采用改進(jìn)的概率主題模型學(xué)習(xí)圖像的潛在主題分布;采用分類器識別未知地點圖像。本發(fā)明在LDA模型中加入量化函數(shù),通過改進(jìn)LDA模型學(xué)習(xí)圖像的潛在主題,在保證實時性的前提下,可有效提高識別性能。
文檔編號G06K9/62GK102609719SQ20121001769
公開日2012年7月25日 申請日期2012年1月19日 優(yōu)先權(quán)日2012年1月19日
發(fā)明者傅金融, 李明愛, 楊婉露, 楊金福, 王鍇, 王陽麗 申請人:北京工業(yè)大學(xué)