一種基于深度層次特征學(xué)習(xí)的海量圖像分類系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供了一種基于深度層次特征學(xué)習(xí)的海量圖像分類系統(tǒng),包括如下步驟:步驟a、輸入無標(biāo)簽和有標(biāo)簽圖像數(shù)據(jù),對(duì)無標(biāo)簽圖像數(shù)據(jù)進(jìn)行預(yù)處理,除干擾信息、保留關(guān)鍵信息;步驟b、將預(yù)處理之后的圖像進(jìn)行K-means特征學(xué)習(xí),得到本層的字典;步驟c、如本層為第N層,對(duì)本層的字典與帶標(biāo)簽圖像數(shù)據(jù)集進(jìn)行特征映射,得到深層次特征后進(jìn)行步驟e,否則對(duì)本層的字典與的無標(biāo)簽圖像數(shù)據(jù)進(jìn)行特征映射,得到深層次的特征;步驟d、根據(jù)深層次特征的相關(guān)性,將多個(gè)高相關(guān)性特征聚合為一個(gè)感受野,如本層為N-1層則進(jìn)行步驟e,否則作為下一層輸入信息送給步驟b;步驟e、在第N層中,將學(xué)到的特征輸入SVM分類器,進(jìn)行分類。
【專利說明】一種基于深度層次特征學(xué)習(xí)的海量圖像分類系統(tǒng)
發(fā)明領(lǐng)域
[0001]本發(fā)明屬于機(jī)器學(xué)習(xí)與圖像處理【技術(shù)領(lǐng)域】,涉及分布式平臺(tái)上的海量圖像處理,尤其涉及一種基于深度層次特征的海量圖像分類的實(shí)現(xiàn)方案。
【背景技術(shù)】
[0002]如今,隨著多媒體技術(shù)的發(fā)展,包括圖像、音頻、視頻等信息的多媒體數(shù)據(jù)大量涌現(xiàn),如何將大量的信息進(jìn)行分類,已經(jīng)成為多媒體技術(shù)研究中的熱點(diǎn)問題.圖像分類研究任務(wù)主要由預(yù)處理,特征提取和分類三個(gè)主要環(huán)節(jié)構(gòu)成,每個(gè)環(huán)節(jié)對(duì)圖像的分類效果都有重要的影響.隨著計(jì)算機(jī)軟硬件和國際互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,多媒體數(shù)據(jù)的數(shù)量也以驚人的速度增長,各行各業(yè)有越來越多的信息通過圖像的形式進(jìn)行表達(dá),這無疑又給圖像分類這一任務(wù)的各個(gè)環(huán)節(jié)帶來了巨大的挑戰(zhàn)。傳統(tǒng)的圖像分類是通過提取顏色、紋理以及形狀特征等在單機(jī)上進(jìn)行的,隨著圖像庫的不斷增大,復(fù)雜度不斷增高,單機(jī)的提取人為設(shè)計(jì)的特征已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足需求,使用并行處理無疑是一個(gè)好的解決方案。大數(shù)據(jù)處理平臺(tái)Hadoop作為Map-Reduce架構(gòu)的開源實(shí)現(xiàn),主要用于大規(guī)模數(shù)據(jù)集的并行計(jì)算,由于架構(gòu)簡(jiǎn)單,對(duì)數(shù)據(jù)密集型應(yīng)用能夠有效支持。本文正是在大數(shù)據(jù)處理平臺(tái)Hadoop的基礎(chǔ)上,設(shè)計(jì)并實(shí)現(xiàn)了基于深度層次特征學(xué)習(xí)的大規(guī)模圖像分類框架。
【發(fā)明內(nèi)容】
[0003]本發(fā)明要解決大規(guī)模圖像的快速分類問題,針對(duì)圖像分類的準(zhǔn)確度,提出一種基于深度層次特征學(xué)習(xí)的大規(guī)模圖像分類模型,研究實(shí)現(xiàn)在大數(shù)據(jù)處理平臺(tái)Hadoop的基礎(chǔ)上,提出并行化的深度層次特征學(xué)習(xí)模型,針對(duì)圖像的高維性質(zhì),將低層特征中的多個(gè)特征聚合為一個(gè)感受野,從而達(dá)到降維的目的。
[0004]為了實(shí)現(xiàn)上述目的本發(fā)明采用以下技術(shù)方案:
[0005]一種基于深度層次特征學(xué)習(xí)的海量圖像分類系統(tǒng),其特征在于包括如下步驟:
[0006]步驟a、輸入無標(biāo)簽和有標(biāo)簽的圖像數(shù)據(jù)(學(xué)術(shù)組織來建立的數(shù)據(jù)集),對(duì)無標(biāo)簽圖像數(shù)據(jù)進(jìn)行預(yù)處理,去除干擾信息、保留關(guān)鍵信息,作為第一層系統(tǒng)框架輸入信息送給下一步處理;預(yù)處理包括對(duì)多張圖片提取patches,同時(shí)對(duì)patches進(jìn)行正則化和白化;
[0007]步驟b、輸入信息采用K-means特征學(xué)習(xí)方法進(jìn)行,得到本層的系統(tǒng)框架的字典;
[0008]步驟C、如本層為第N層,對(duì)本層系統(tǒng)框架的字典與的帶標(biāo)簽圖像數(shù)據(jù)集進(jìn)行特征映射,得到深層次的特征后進(jìn)行步驟e,否則對(duì)本層系統(tǒng)框架的字典與的無標(biāo)簽圖像數(shù)據(jù)進(jìn)行特征映射,得到深層次的特征;
[0009]步驟d、根據(jù)深層次的特征的相關(guān)性,將多個(gè)高相關(guān)性特征聚合為一個(gè)感受野,如本層為N-1層系統(tǒng)框架則進(jìn)行步驟e,否則作為下一層系統(tǒng)框架的輸入信息送給步驟b,
[0010]步驟e、在第N層系統(tǒng)框架中,其學(xué)到的特征將輸入到SVM分類器中,進(jìn)行最后的分類。
[0011]上述技術(shù)方案中,步驟b具體為經(jīng)過步驟a處理后的圖像信息進(jìn)行并行化的深度層次特征學(xué)習(xí),在第一層系統(tǒng)框架中,預(yù)處理后的patches作為Map節(jié)點(diǎn)的輸入,采用
K-means特征學(xué)習(xí)方法進(jìn)行第一層系統(tǒng)框架的特征學(xué)習(xí),得到聚類中心,在Reduce節(jié)點(diǎn)上
對(duì)各個(gè)Map節(jié)點(diǎn)得到的聚類中心進(jìn)行綜合,得到第一層系統(tǒng)框架的聚類中心,即得到第一
層系統(tǒng)框架的字典,字典公式如下:
[0012]
【權(quán)利要求】
1.一種基于深度層次特征學(xué)習(xí)的海量圖像分類系統(tǒng),其特征在于包括如下步驟: 步驟a、輸入無標(biāo)簽和有標(biāo)簽的圖像數(shù)據(jù),對(duì)無標(biāo)簽圖像數(shù)據(jù)進(jìn)行預(yù)處理,去除干擾信息、保留關(guān)鍵信息,作為第一層系統(tǒng)框架輸入信息送給下一步處理;預(yù)處理包括對(duì)多張圖片提取patches,同時(shí)對(duì)patches進(jìn)行正則化和白化; 步驟b、輸入信息采用K-means特征學(xué)習(xí)方法進(jìn)行,得到本層的系統(tǒng)框架的字典; 步驟C、如本層為第N層,對(duì)本層系統(tǒng)框架的字典與的帶標(biāo)簽圖像數(shù)據(jù)集進(jìn)行特征映射,得到深層次的特征后進(jìn)行步驟e,否則對(duì)本層系統(tǒng)框架的字典與無標(biāo)簽圖像數(shù)據(jù)進(jìn)行特征映射,得到深層次的特征; 步驟d、根據(jù)深層次的特征的相關(guān)性,將多個(gè)高相關(guān)性特征聚合為一個(gè)感受野,如本層為N-1層系統(tǒng)框架則進(jìn)行步驟e,否則作為下一層系統(tǒng)框架的輸入信息送給步驟b ; 步驟e、在第N層系統(tǒng)框架中,其學(xué)到的特征將輸入到SVM分類器中,進(jìn)行最后的分類。
2.根據(jù)權(quán)利要求1所述的一種基于深度層次特征學(xué)習(xí)的海量圖像分類系統(tǒng),其特征在于:步驟b具體為經(jīng)過步驟a處理后的圖像信息進(jìn)行并行化的深度層次特征學(xué)習(xí),在第一層系統(tǒng)框架中,預(yù)處理后的patches作為Map節(jié)點(diǎn)的輸入,采用K_means特征學(xué)習(xí)方法進(jìn)行第一層系統(tǒng)框架的特征學(xué)習(xí),得到聚類中心,在Reduce節(jié)點(diǎn)上對(duì)各個(gè)Map節(jié)點(diǎn)得到的聚類中心進(jìn)行綜合,得到第一層系統(tǒng)框架的聚類中心,即得到第一層系統(tǒng)框架的字典,如公式(I)所示:
3.根據(jù)權(quán)利要求1所述的一種基于深度層次特征學(xué)習(xí)的海量圖像分類系統(tǒng),其特征在于:步驟c中將得到深層次的特征具體為,步驟b中得到的本層系統(tǒng)框架的字典給本層系統(tǒng)框架的每個(gè)Map節(jié)點(diǎn),同時(shí)輸入新的無標(biāo)簽的圖像數(shù)據(jù)集給每個(gè)Map節(jié)點(diǎn),對(duì)Map節(jié)點(diǎn)上的圖像數(shù)據(jù)集進(jìn)行特征學(xué)習(xí),將輸入圖像數(shù)據(jù)進(jìn)行特征映射得到深層次的特征,公式如下:
4.根據(jù)權(quán)利要求1所述的一種基于深度層次特征學(xué)習(xí)的海量圖像分類系統(tǒng),其特征在于:步驟d具體為步驟c中得到的深層次的特征的相關(guān)性,采用歐式距離作為圖像特征之間相似性度量方法,將低層特征中多個(gè)特征聚合為一個(gè)感受野,保證每個(gè)感受野中的特征是相似性最高的,如本層為N-1層系統(tǒng)框架則進(jìn)行步驟e,否則作為下一層系統(tǒng)框架的輸入信息送給步驟b。
5.根據(jù)權(quán)利要求1所述的一種基于深度層次特征學(xué)習(xí)的海量圖像分類系統(tǒng),其特征在于: 對(duì)patches進(jìn)行正則化采用以下方式進(jìn)行圖像塊的正則化:
6.根據(jù)權(quán)利要求1所述的一種基于深度層次特征學(xué)習(xí)的海量圖像分類系統(tǒng),其特征在于:采用PCA白化方法對(duì)經(jīng)過正則化的每個(gè)X(i)進(jìn)行減少像素間相關(guān)性的處理:
7.根據(jù)權(quán)利要求4所述的一種基于深度層次特征學(xué)習(xí)的海量圖像分類系統(tǒng),其特征在于:圖像特征之間相似性度量方法,具體為深層次的特征采用公式6來產(chǎn)生感受野,感受野擁有相同數(shù)目的最相似的特征,對(duì)不同的兩個(gè)圖像特征\和Zk,的相似度的計(jì)算如下:
【文檔編號(hào)】G06K9/62GK103955707SQ201410182971
【公開日】2014年7月30日 申請(qǐng)日期:2014年5月4日 優(yōu)先權(quán)日:2014年5月4日
【發(fā)明者】董樂, 呂娜, 封寧, 賀玲 申請(qǐng)人:電子科技大學(xué)