一種用于圖像場景識別的特征提取方法

文檔序號：6632647閱讀：574來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種用于圖像場景識別的特征提取方法
【專利摘要】本發(fā)明涉及一種用于圖像場景識別的特征提取方法，包括在一組已知類別的訓(xùn)練圖像中挖掘信息和將待識別的測試圖像進行識別兩大步驟，其中第一步驟包括對圖像進行預(yù)處理；提取圖像的目標(biāo)特征；降低目標(biāo)特征的維度；執(zhí)行LDA模型訓(xùn)練算法；生成訓(xùn)練圖像的場景環(huán)境特征；特征組合；執(zhí)行SVM訓(xùn)練算法。第二步驟包括將測試圖像預(yù)處理；生成測試圖像的碼字；生成測試圖像的場景環(huán)境特征；提取測試圖像的目標(biāo)特征；降低測試圖像的目標(biāo)特征維度；測試圖像的特征組合；利用已訓(xùn)練的SVM分類器生成圖像類別。本發(fā)明減小了現(xiàn)有方法的計算量，擴展了應(yīng)用范圍并提高了識別準(zhǔn)確率。
【專利說明】一種用于圖像場景識別的特征提取方法

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于圖像場景識別技術(shù)，具體涉及一種用于圖像場景識別的特征提取方法。

【背景技術(shù)】
[0002] 圖像場景識別的目的是得到圖像的語義信息并給出其類別標(biāo)簽。它是計算機視覺、模式識別和機器學(xué)習(xí)等領(lǐng)域的重要研究內(nèi)容，在圖像庫管理、圖像檢索等實用領(lǐng)域也是不可或缺的技術(shù)?；谔卣鞔˙ag of Features)和主題模型的方法是近年來的研究熱潮，取得了很多新成果和進展。這類方法借鑒于自然語言處理過程，把圖像視為局部觀察量的集合并建立特征袋，利用特征袋建立主題模型，生成特征或直接生成類別。此外，圖像中的目標(biāo)識別技術(shù)也為圖像的場景識別帶來有利信息，這類方法通過識別圖像中的部分目標(biāo)來推斷圖像的場景類別。
[0003] 目前，主題模型技術(shù)尚存在一些缺點，主要體現(xiàn)在表達一幅待識別圖像需要對圖像的特征袋進行統(tǒng)計和推理，這種需要進行迭代的運算會加大圖像識別的計算量。主題模型方法往往對場景環(huán)境敏感，但是對于一些非場景環(huán)境敏感的圖像識別準(zhǔn)確率并不理想，例如室內(nèi)場景類和事件類。結(jié)合圖像中的目標(biāo)信息有利于彌補這一缺點，但是目前的目標(biāo) 識別技術(shù)難以和主題模型方法直接結(jié)合，例如Object Bank技術(shù)，其產(chǎn)生的特征本身具有極高的維度，這會沖淡主題模型方法所產(chǎn)生的特征在組合中占據(jù)的比例，并且由于維度災(zāi)難問題，識別算法運算量極大，在個人計算機、工作站平臺上只能使用線性分類器。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明的目的是通過公開一種基于LDA模型的主題特征提取方法，用該方法得到的主題環(huán)境特征描述圖像的場景環(huán)境。解決下列技術(shù)問題：表達一幅待識別圖像需要進行統(tǒng)計和推理，運算量較大；對于事件類和室內(nèi)場景識別準(zhǔn)確率差。
[0005] 通過公開一種Object Bank特征的降維方法，解決其維度過高，難以與主題特征結(jié) 合的技術(shù)問題。
[0006] 公開將環(huán)境主題特征和降維后的目標(biāo)特征進行結(jié)合組成特征向量進行識別的方法，提高識別準(zhǔn)確率。
[0007] 為實現(xiàn)所述目的，本發(fā)明提出的技術(shù)方案如下：本發(fā)明所述的一種用于圖像場景識別的特征提取方法，包括下列兩大步驟： 1.在一組已知類別的訓(xùn)練圖像中挖掘信息參閱圖1，輸入一組已知類別的訓(xùn)練圖像，每次選取一幅圖像，依次執(zhí)行"對圖像進行預(yù) 處理"、"提取圖像的目標(biāo)特征"步驟，直至選取完所有圖像后，執(zhí)行后續(xù)步驟"降低目標(biāo)特征的維度"、"執(zhí)行LDA模型訓(xùn)練算法"、"生成訓(xùn)練圖像的場景環(huán)境特征"、"特征組合"、"執(zhí)行 SVM訓(xùn)練算法"。其中"對圖像進行預(yù)處理"步驟與"提取圖像的目標(biāo)特征"為并行步驟，不分先后，"降低目標(biāo)特征的維度"與"執(zhí)行LDA模型訓(xùn)練算法"、"生成訓(xùn)練圖像的場景環(huán)境特征"為并行步驟，不分先后。
[0008] 本步驟中已知類別的訓(xùn)練圖像數(shù)量要求不低于每類50幅。
[0009] I. 1對圖像進行預(yù)處理 a.將圖像歸一化為PxP像素的正方形圖像。
[0010] b.通過滑動網(wǎng)格方法，將正方形圖像劃分為iV個有重疊的子塊。
[0011] c.對每個子塊分別計算128維的SIFT灰度尺度強度區(qū)域描述符。
[0012] 1.2提取圖像的目標(biāo)特征利用已公開的Object Bank算法提取圖像的目標(biāo)特征，具體為 a.圖像按照三層空間金字塔進行分塊，具體為在每一層上分別均分圖像為F , 22,43 個子圖像，每幅圖像共得到21個子圖像。
[0013] b.依次遍歷所有目標(biāo)，對于每個目標(biāo)，執(zhí)行如下操作：在每個子塊上，依次按照12 個尺度運行目標(biāo)濾波器，求得響應(yīng)值，每個尺度下響應(yīng)值的最大值作為輸出結(jié)果。
[0014] c.轉(zhuǎn)存并輸出結(jié)果，得到維度為12x21xiV。的一條目標(biāo)特征向量，其中if,為選用的目標(biāo)探測器的個數(shù)。
[0015] 1.3降低目標(biāo)特征的維度利用本發(fā)明公開的一種目標(biāo)特征降維算法對圖像的目標(biāo)特征進行降維，具體為 a.目標(biāo)特征輸入到含有個神經(jīng)元的一層神經(jīng)網(wǎng)絡(luò)，特征的每個維度對應(yīng)一個神經(jīng)元，該層網(wǎng)絡(luò)被叫做輸入層。神經(jīng)元的輸出為：

【權(quán)利要求】
1. 一種用于圖像場景識別的特征提取方法，其特征是包括下列兩大步驟：一. 在一組已知類別的訓(xùn)練圖像中挖掘信息輸入一組已知類別的訓(xùn)練圖像，每次選取一幅圖像，依次執(zhí)行"對圖像進行預(yù)處理"、 "提取圖像的目標(biāo)特征"步驟，直至選取完所有圖像后，執(zhí)行后續(xù)步驟"降低目標(biāo)特征的維度"、"執(zhí)行LDA模型訓(xùn)練算法"、"生成訓(xùn)練圖像的場景環(huán)境特征"、"特征組合"、"執(zhí)行SVM訓(xùn) 練算法"其中"對圖像進行預(yù)處理"步驟與"提取圖像的目標(biāo)特征"為并行步驟，不分先后， "降低目標(biāo)特征的維度"與"執(zhí)行LDA模型訓(xùn)練算法"、"生成訓(xùn)練圖像的場景環(huán)境特征"為并行步驟，不分先后，本步驟中已知類別的訓(xùn)練圖像數(shù)量要求不低于每類50幅；二. 將待識別的測試圖像進行識別其中"將測試圖像預(yù)處理"、"生成測試圖像的碼字"、"生成測試圖像的場景環(huán)境特征" 步驟與"提取測試圖像的目標(biāo)特征"、"降低測試圖像的目標(biāo)特征維度"步驟為并行步驟，不分先后。
2. 按照權(quán)利要求1所述的一種用于圖像場景識別的特征提取方法，其特征是具體步驟如下：一.在一組已知類別的訓(xùn)練圖像中挖掘信息輸入一組已知類別的訓(xùn)練圖像，每次選取一幅圖像，依次執(zhí)行"對圖像進行預(yù)處理"、 "提取圖像的目標(biāo)特征"步驟，直至選取完所有圖像后，執(zhí)行后續(xù)步驟"降低目標(biāo)特征的維度"、"執(zhí)行LDA模型訓(xùn)練算法"、"生成訓(xùn)練圖像的場景環(huán)境特征"、"特征組合"、"執(zhí)行SVM訓(xùn) 練算法"其中"對圖像進行預(yù)處理"步驟與"提取圖像的目標(biāo)特征"為并行步驟，不分先后， "降低目標(biāo)特征的維度"與"執(zhí)行LDA模型訓(xùn)練算法"、"生成訓(xùn)練圖像的場景環(huán)境特征"為并行步驟，不分先后，本步驟中已知類別的訓(xùn)練圖像數(shù)量要求不低于每類50幅， 1) .對圖像進行預(yù)處理 a. 將圖像歸一化為PxiM象素的正方形圖像； b. 通過滑動網(wǎng)格方法，將正方形圖像劃分為AT個有重疊的子塊； c. 對每個子塊分別計算128維的SIFT灰度尺度強度區(qū)域描述符； 2) .提取圖像的目標(biāo)特征利用已公開的Object Bank算法提取圖像的目標(biāo)特征，具體為 a. 圖像按照三層空間金字塔進行分塊，具體為在每一層上分別均分圖像為I2，22，42 個子圖像，每幅圖像共得到21個子圖像； b. 依次遍歷所有目標(biāo)，對于每個目標(biāo)，執(zhí)行如下操作：在每個子塊上，依次按照12個尺度運行目標(biāo)濾波器，求得響應(yīng)值，每個尺度下響應(yīng)值的最大值作為輸出結(jié)果； c. 轉(zhuǎn)存并輸出結(jié)果，得到維度為12x21x2^的一條目標(biāo)特征向量，其中Jfe為選用的目標(biāo)探測器的個數(shù)； 3) .降低目標(biāo)特征的維度利用本發(fā)明公開的一種目標(biāo)特征降維算法對圖像的目標(biāo)特征進行降維，具體為 a.目標(biāo)特征輸入到含有UmxJVe個神經(jīng)元的一層神經(jīng)網(wǎng)絡(luò)，特征的每個維度對應(yīng)一個神經(jīng)元，該層網(wǎng)絡(luò)被叫做輸入層，神經(jīng)元的輸出為：
其中，1
纟輸入層神經(jīng)元的閾值，為輸入的圖像數(shù)量，#表示網(wǎng)絡(luò)的第/個輸入，此處#的總數(shù)量與Ob ject Bank特征維度相同，表示第i層網(wǎng)絡(luò)的第j個神經(jīng)元的輸出； b. 輸入層神經(jīng)元的輸出結(jié)果再次輸入到含有SlxJV0個神經(jīng)元的一層，該層命名為中間層，其中每12個對應(yīng)同一圖像12個目標(biāo)檢測尺度的輸入層神經(jīng)元為一組，每組連接到一個的中間層神經(jīng)元，該層神經(jīng)元的輸出為：
c. 中間層神經(jīng)元的輸出結(jié)果再次輸入到含有目標(biāo)數(shù)個神經(jīng)元的一層，該層命名為輸出層，其中對應(yīng)每個目標(biāo)的21個空間金字塔子塊作為一組，輸入到一個輸出層神經(jīng)元，該層神經(jīng)元不設(shè)閾值，神經(jīng)元輸出為：
d. 輸出層上的輸出結(jié)果y=(y5'/_\…即為降維后的目標(biāo)特征； 4).行LDA模型訓(xùn)練算法 a. 取"對圖像進行預(yù)處理"步驟中得到的SIFT灰度尺度強度區(qū)域描述符，隨機選取其中的一部分作為聚類目標(biāo)執(zhí)行K均值聚類算法，求得聚類中心，此處隨機選取的數(shù)量要求總數(shù)不小于十萬個樣本，聚類中心計算為 Ci = 其中Ci表示對應(yīng)聚類號i的聚類中心，運算O0表示向量組的元素均值運算，表示所有當(dāng)前聚類號為i的樣本向量組成的向量組； b. 根據(jù)所求的聚類中心，計算每一幅"已知類別的訓(xùn)練圖像"中每一個子塊對應(yīng)的聚類號，稱為碼字，計算公式為： L = m^vEm.{R(Sam ,Ci)) M 其中表示任一樣本向量，運算f(-)表示歐幾里得距離二范數(shù)， c. 圖像依據(jù)其對應(yīng)的碼字，按照ID:C〇unt碼字：計數(shù)方式進行統(tǒng)計，利用已公開的 Gibbs Sampling算法，使用ID:Count訓(xùn)練一個LDA模型，采樣公式為
其中，假設(shè)表示第I個碼字對應(yīng)的主題變量；下標(biāo)-?表示剔除其中的第f項，所以表示從對應(yīng)的主題中剔除第g-項；Iitw表示主題i;中出現(xiàn)碼字^的次數(shù)；爲(wèi)是碼字 V的狄利克雷先驗；^表示圖像IB中出現(xiàn)主題z的次數(shù)是主題z的狄利克雷先驗，通過采樣可以根據(jù) 2值估計其LDA的模型參數(shù)Am和,
其中表示主題Jt中碼字?的概率表示圖像B中主題的概率，對fbr和匕t進行反復(fù)計算，直至每次計算結(jié)果不再改變， 5).生成訓(xùn)練圖像的場景環(huán)境特征圖像通過其ID:C〇unt和訓(xùn)練好的LDA模型，利用本發(fā)明公開的環(huán)境特征提取算法生成特征向量，具體為： a. 作出簡化假設(shè)如下，對于碼字為安的新圖像，ft.,不更新并且等于其均值，則新圖像主題的先驗概率公式被改進為
其中M是訓(xùn)練集圖像的數(shù)量，通過本發(fā)明提出的新圖像主題先驗概率改進公式，先驗概率可以被描述為一個JTxF維矩陣A，其中元素 Λ表示第J個碼字被分配給第i個主題的概率； b. 定義\=1(^)，其中A(;J)表示矩陣A的第J列，所以每幅圖像都被其碼字的統(tǒng) 計所定義，對于包含碼字= 的圖像，其環(huán)境特征向量為
6) .特征組合將"生成訓(xùn)練圖像的場景環(huán)境特征"步驟中得到的特征向量1與"降低目標(biāo)特征的維度"步驟中得到的特征向量y順次組合成一條向量； 7) 執(zhí)行SVM訓(xùn)練算法以"特征組合"步驟中得到的特征向量為訓(xùn)練樣本特征向量，以圖像已知的類別為類別標(biāo)簽，利用已公開LibSVM軟件包執(zhí)行SVM訓(xùn)練算法，得到一個訓(xùn)練好的SVM分類器；二.將待識別的測試圖像進行識別其中"將測試圖像預(yù)處理"、"生成測試圖像的碼字"、"生成測試圖像的場景環(huán)境特征" 步驟與"提取測試圖像的目標(biāo)特征"、"降低測試圖像的目標(biāo)特征維度"步驟為并行步驟，不分先后， 1) .將測試圖像預(yù)處理 a. 將圖像歸一化為PxP像素的正方形圖像； b. 通過滑動網(wǎng)格方法，將正方形圖像劃分為I個有重疊的子塊； c. 對每個子塊分別計算128維的SIFT灰度尺度強度區(qū)域描述符； 2) .生成測試圖像的碼字 a. 取"執(zhí)行LDA模型訓(xùn)練算法"步驟所求的聚類中心，并取"將測試圖像預(yù)處理"步驟中得到的SIFT灰度尺度強度區(qū)域描述符，計算待識別圖像中每一個區(qū)域描述符對應(yīng)的聚類號，稱為碼字，計算公式為：
其中表示任一樣本向量，運算AG灰示歐幾里得距離二范數(shù)； b. 圖像依據(jù)其對應(yīng)的碼字，按照ID:Count (碼字：計數(shù)）方式進行統(tǒng)計； 3) .生成測試圖像的場景環(huán)境特征圖像通過其ID:C〇unt和訓(xùn)練好的LDA模型，利用本發(fā)明公開的環(huán)境特征提取算法生成特征向量，具體為 a. 作出簡化假設(shè)如下，對于碼字為牙的新圖像，Pb不更新并且等于其均值 EiU，則新圖像主題的先驗概率公式被改進為
其中M是訓(xùn)練集圖像的數(shù)量，通過本發(fā)明提出的新圖像主題先驗概率改進公式，先驗概率F(z|w)可以被描述為一個JTxF維矩陣J1，其中元素表示第個碼字被分配給第i個主題的概率； b. 定義\- ，其中A(;J)表示矩陣Jk的第J列，所以每幅圖像都被其碼字的統(tǒng) 計所定義，對于包含碼字胃" = (W1的圖像，其環(huán)境特征向量為
4) .提取測試圖像的目標(biāo)特征利用已公開的Object Bank算法提取圖像的目標(biāo)特征，具體為 a. 圖像按照三層空間金字塔進行分塊，具體為在每一層上分別均分圖像為I3,23,43 個子圖像，每幅圖像共得到21個子圖像； b. 依次遍歷所有目標(biāo)，對于每個目標(biāo)，執(zhí)行如下操作：在每個子塊上，依次按照12個尺度運行目標(biāo)濾波器，求得響應(yīng)值，每個尺度下響應(yīng)值的最大值作為輸出結(jié)果； c. 轉(zhuǎn)存并輸出結(jié)果，得到維度為的一條目標(biāo)特征向量，其中為選用的目標(biāo)探測器的個數(shù)； 5) .降低測試圖像的目標(biāo)特征維度利用本發(fā)明公開的一種目標(biāo)特征降維算法對圖像的目標(biāo)特征向量進行降維，具體步驟又可分為： a. 目標(biāo)特征向量輸入到含有乂個神經(jīng)元的一層神經(jīng)網(wǎng)絡(luò)，特征的每個維度對應(yīng)一個神經(jīng)元，該層網(wǎng)絡(luò)被叫做輸入層，神經(jīng)元的輸出為：
其中，Gm為"降低目標(biāo)特征的維度"步驟運算得到的結(jié)果，χω表示網(wǎng)絡(luò)的第J個輸入，此處P的總數(shù)量與object Bank特征維度相同，f表示第I層網(wǎng)絡(luò)的第/個神經(jīng)元的輸出； b. 輸入層神經(jīng)元的輸出結(jié)果再次輸入到含有SlxJV0個神經(jīng)元的一層，該層命名為中間層，其中每12個對應(yīng)同一圖像12個目標(biāo)檢測尺度的輸入層神經(jīng)元為一組，每組連接到一個的中間層神經(jīng)元，該層神經(jīng)元的輸出為：
c. 中間層神經(jīng)元的輸出結(jié)果再次輸入到含有目標(biāo)數(shù)個神經(jīng)元的一層，該層命名為輸出層，其中對應(yīng)每個目標(biāo)的21個空間金字塔子塊作為一組，輸入到一個輸出層神經(jīng)元，該層神經(jīng)元不設(shè)閾值，神經(jīng)元輸出為：
d. 輸出層上的輸出結(jié)果y = 氣…/#·)即為降維后的目標(biāo)特征； 6) .測試圖像的特征組合將"生成測試圖像的場景環(huán)境特征"步驟中得到的向量1與"降低測試圖像的目標(biāo)特征維度"步驟中得到的向量--幌次組合成一條向量； 7).利用已訓(xùn)練的SVM分類器生成圖像類別以"測試圖像的特征組合"步驟中得到的特征向量為圖像的特征向量，利用"執(zhí)行SVM 訓(xùn)練算法"步驟中得到訓(xùn)練好的SVM分類器對圖像進行識別。
【文檔編號】G06K9/62GK104376326SQ201410603389
【公開日】2015年2月25日申請日期:2014年11月2日優(yōu)先權(quán)日:2014年11月2日
【發(fā)明者】臧睦君, 劉通, 宋偉偉, 李陽, 王珂申請人:吉林大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：臧睦君;劉通;宋偉偉;李陽;王珂;
技術(shù)所有人：吉林大學(xué);
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

圖像特征提取相關(guān)技術(shù)

特征提取與圖像處理相關(guān)技術(shù)

圖像特征提取方法相關(guān)技術(shù)

圖像紋理特征提取相關(guān)技術(shù)

圖像特征提取算法相關(guān)技術(shù)

圖像顏色特征提取相關(guān)技術(shù)

小波變換圖像特征提取相關(guān)技術(shù)

圖像特征提取算法代碼相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種用于圖像場景識別的特征提取方法