一種基于空間關系的潛在狄利克雷模型自然場景圖像分類方法
【專利摘要】本發(fā)明公開了一種基于空間關系的潛在狄利克雷模型自然場景圖像分類方法,主要解決現有分類方法人工標記工作量較大和分類正確率較低的問題。其實現步驟是:分別建立自然場景圖像分類的訓練集和測試集;對圖像進行金字塔分塊;提取圖像塊集合的采樣點尺度不變特征集合,并生成字典;用字典對圖像塊尺度不變特征集合進行詞袋模型描述;用Gibbs采樣方法生成詞匯頻次向量的潛在語義主題模型,得到圖像的潛在語義主題分布,進而構建自然場景圖像分類模型;用分類模型對自然場景圖像進行分類。本發(fā)明采用了空間關系和潛在語義主題模型,豐富了圖像特征信息,避免了大量的人工標記工作,提高了分類正確率,可用于目標識別及車輛、機器人導航。
【專利說明】一種基于空間關系的潛在狄利克雷模型自然場景圖像分類方法
【技術領域】
[0001]本發(fā)明屬于圖像處理【技術領域】,特別涉及一種基于空間關系的潛在狄利克雷模型自然場景圖像分類方法。
【背景技術】
[0002]在過去的十年里,自然場景圖像分類已經成為圖像處理【技術領域】里一個很重要的研究主體。自然場景圖像分類有很廣泛的應用,如目標識別與檢測和智能車輛或機器人導航等領域。由于自然場景圖像類內差異性、照明條件差異性和圖像本身尺度差異性較大,使其仍然是具有挑戰(zhàn)性的問題。
[0003]自然場景圖像分類的分類方法大致可以分為兩類:一類是基于低層語義模型的自然場景圖像分類方法;一類是基于中層語義模型的自然場景圖像分類方法。早期的一些自然場景圖像分類方法大多數是應用低層信息建立模型的,這些方法采用全局統(tǒng)計信息,如運用全局的顏色或者紋理特征直方圖表示圖像。盡管這些方法的時間復雜性較低,但是它們通常應用于人為場景圖像和室內場景圖像分類,并且分類結果較差。近期關于自然場景圖像分類的方法都是基于中層語義模型的,它們彌補了高層語義信息和低層語義信息之間的鴻溝,并解決層次分類定義重疊問題,因此得到了廣泛應用。
[0004]由于圖像的語義大都通過區(qū)域對象來體現,采用基于區(qū)域的方法對圖像進行場景分類是一種合理有效的方法。但是在場景圖像分類訓練集中,往往不具體指定圖像區(qū)域和目標之間的對應關系,而且圖像區(qū)域之間往往存在著語義概念相關性,這給基于區(qū)域的有監(jiān)督學習算法造成了困難。圖像區(qū)域間的相關性是指同一幅圖像的一些圖像區(qū)域往往對應著相同的語義概念,且對應不同語義的圖像區(qū)域間往往也存在的關聯性。比如對一幅含有“天空”、“云彩”等語義概念的圖像進行分割后,某一圖像區(qū)域含有目標語義“天空”,與它相鄰的圖像區(qū)域也會包含有“天空”的概念,而且不同的語義概念“云彩”和“天空”具有較高的同時出現的頻率,它們對應的不同圖像區(qū)域之間也存在著語義相關性。Wang等人提出了一種結合底層視覺特征分布和區(qū)域間關系的圖像區(qū)域標注的概率模型,它有效地利用了圖像區(qū)域間的關系,對圖像區(qū)域進行標注。但是Wang等人提出的算法需要事先標記每一個圖像區(qū)域對應的語義概念,然后建立含有同一語義概念的圖像區(qū)域訓練集,需要大量人工標記。然而通常情況下并不能夠提供這樣的訓練集,而且該文中使用的表示概念類的高斯分布模型較為簡單,實驗測試也僅在較小的數據集上進行。為了減少生成中間語義所需的人工標記工作,一些采用文本主題模型的方法被用于自然場景圖像分類,這些方法主要以Lifeifei和Quelhas等人提出的自然場景圖像分類方法為代表。這些方法通常先提取圖像中的尺度不變特征,然后將圖像的尺度不變特征通過聚類生成一個字典來表示聚類中心,然后通過字典映射得到一個表示圖像的稀疏表示向量,最后應用文本分類中的概率潛在語義分析方法和潛在狄利克雷模型等主題分析方法來找出圖像的潛在語義主題分布,從而完成圖像的場景分類。[0005]上述方法或對人工標記的需求很大,或通常是根據圖像中視覺詞匯出現的總體情況來進行場景分類的,由于沒有考慮圖像的空間信息,因此往往不能得到準確率高的分類結果。
【發(fā)明內容】
[0006]本發(fā)明的目的在于針對上述已有方法的不足,提出一種基于空間關系的潛在狄利克雷模型自然場景圖像分類方法,以減少人工標記的需求,具有處理較大數據的能力,并通過引入圖像空間信息,提高分類正確率。
[0007]為實現上述目的,本發(fā)明的技術方案,一種基于空間關系的潛在狄利克雷模型自然場景圖像分類方法,其特征是:包括如下步驟:
[0008](I)分別建立自然場景圖像分類訓練集和圖像分類測試集;
[0009](2)用空間金字塔分塊方法分別對自然場景圖像分類訓練集和圖像分類測試集中的圖像進行圖像分塊,得到圖像塊集合P= {Pp P2,…,Pi,…,P丄其中Pi為圖像的第i個圖像塊,η為圖像的分塊總數;
[0010](3)提取訓練集中圖像的圖像塊集合P的采樣點尺度不變特征集合F,生成字典D:
[0011](3a)用網格采樣方法對訓練集中圖像的圖像塊集合P進行網格采樣,得到圖像的圖像塊網格采樣點集SP = (SP1, SP2,…,SPi, - ,SPJ,其中SPi為圖像第i個圖像塊的網格采樣點;
[0012](3b)用尺度不變特征提取方法對訓練集中圖像的圖像塊網格采樣點SP提取尺度不變特征,得到訓練集中圖像的圖像塊尺度不變特征集合F=的,F2,…,Fi,…,FJ,其中Fi為圖像第i個圖像塊的尺度不變特征;
[0013](3c)用K均值聚類算法分別對訓練集上圖像的圖像塊尺度不變特征集合F進行聚類,生成字典D= (D11D2,-,Di,-,DJ,其中DiS圖像第i個圖像塊生成的字典;
[0014](4)用字典D對訓練集中圖像的圖像塊尺度不變特征集合F進行詞袋模型描述,得到圖像的圖像塊對應的詞匯頻次W = (W1, W2,…,Wi,…,WJ,其中Wi為圖像第i個圖像塊對應的詞匯頻次向量;
[0015](5)用Gibbs采樣方法估計潛在狄利克雷模型中的隱參數,得到訓練集中圖像的潛在語義主題模型Z和潛在語義主題分布Θ ;
[0016](6)用圖像潛在語義主題模型Z生成測試集中圖像潛在語義主題分布Θ i ;
[0017](7)將訓練集中圖像的潛在語義主題分布Θ和其對應的類別I作為訓練數據,用支撐向量機SVM算法獲得自然場景分類模型E ;
[0018](8)根據自然場景分類模型E對測試圖像進行分類。
[0019]其中步驟(1)所述的分別建立自然場景圖像分類訓練集和圖像分類測試集,是先根據使用需要定義N個自然場景圖像類別,類別編號為I~N ;再在每個自然場景圖像類別中隨機選取50~100幅圖像組成自然場景圖像分類訓練集,其余圖像組成自然場景圖像分類測試集。
[0020]其中步驟(5)用Gibbs采樣方法估計潛在狄利克雷模型中的隱參數,得到訓練集中圖像的潛在語義主題模型Z和潛在語義主題分布Θ,按如下步驟進行:[0021](5a)將Wi對應詞匯被分配的潛在語義主題Zi賦值為I~T任意值,作為馬爾可夫鏈的初始狀態(tài),其中T為正整數;
[0022](5b)利用迭代公式I),分別計算圖像中第i個詞匯Wi被分配給主題I~T的概率 P(Zi = j I z_i, w):
【權利要求】
1.一種基于空間關系的潛在狄利克雷模型自然場景圖像分類方法,其特征是:包括如下步驟: (1)分別建立自然場景圖像分類訓練集和圖像分類測試集; (2)用空間金字塔分塊方法分別對自然場景圖像分類訓練集和圖像分類測試集中的圖像進行圖像分塊,得到圖像塊集合P=的,P2,-,Pi,…,PJ,其中Pi為圖像的第i個圖像塊,η為圖像的分塊總數; (3)提取訓練集中圖像的圖像塊集合P的采樣點尺度不變特征集合F,生成字典D: (3a)用網格采樣方法對訓練集中圖像的圖像塊集合P進行網格采樣,得到圖像的圖像塊網格采樣點集SP=ISPpSP2, - ,SPi,...,SP1J,其中SPi為圖像第i個圖像塊的網格采樣占.(3b)用尺度不變特征提取方法對訓練集中圖像的圖像塊網格采樣點SP提取尺度不變特征,得到訓練集中圖像的圖像塊尺度不變特征集合F= (F1, F2, -,Fi,…,FJ,其中Fi為圖像第i個圖像塊的尺度不變特征; (3c)用K均值聚類算法分別對訓練集上圖像的圖像塊尺度不變特征集合F進行聚類,生成字典D= (D1, D2,…,Di,…,DJ,其中Di為圖像第i個圖像塊生成的字典; (4)用字典D對訓練集中圖像的圖像塊尺度不變特征集合F進行詞袋模型描述,得到圖像的圖像塊對應的詞匯頻次W= (W1, W2,…,Wi,…,WJ,其中Wi為圖像第i個圖像塊對應的詞匯頻次向量; (5)用Gibbs采樣方法估計潛在狄利克雷模型中的隱參數,得到訓練集中圖像的潛在語義主題模型Z和潛在語義主題分布Θ ; (6)用圖像潛在語義主題模型Z生成測試集中圖像潛在語義主題分布Θi ; ⑵將訓練集中圖像的潛在語義主題分布Θ和其對應的類別I作為訓練數據,用支撐向量機SVM算法獲得自然場景分類模型E ; (8)根據自然場景分類模型E對測試圖像進行分類。
2.根據權利要求1所述的一種基于空間關系的潛在狄利克雷模型自然場景圖像分類方法,其特征是:其中步驟(1)所述的分別建立自然場景圖像分類訓練集和圖像分類測試集,是先根據使用需要定義N個自然場景圖像類別,類別編號為I~N ;再在每個自然場景圖像類別中隨機選取50~100幅圖像組成自然場景圖像分類訓練集,其余圖像組成自然場景圖像分類測試集。
3.根據權利要求1所述的一種基于空間關系的潛在狄利克雷模型自然場景圖像分類方法,其特征是:其中步驟(5)用Gibbs采樣方法估計潛在狄利克雷模型中的隱參數,得到訓練集中圖像的潛在語義主題模型Z和潛在語義主題分布Θ,按如下步驟進行: (5a)將Wi對應詞匯被分配的潛在語義主題Zi賦值為I~T任意值,作為馬爾可夫鏈的初始狀態(tài),其中T為正整數; (5b)利用迭代公式1),分別計算圖像中第i個詞匯Wi被分配給主題I~T的概率P(Zi = j I Z_J, w):
【文檔編號】G06K9/66GK103942573SQ201410055126
【公開日】2014年7月23日 申請日期:2014年2月18日 優(yōu)先權日:2014年2月18日
【發(fā)明者】王爽, 焦李成, 張雪, 陳陽平, 馬晶晶, 馬文萍, 侯彪 申請人:西安電子科技大學