基于圖片自動(dòng)分類(lèi)的藝術(shù)類(lèi)圖片的定制化特征量提取算法
【專(zhuān)利摘要】本發(fā)明提供一種基于圖片自動(dòng)分類(lèi)的藝術(shù)類(lèi)圖片定制化特征量提取算法,包括圖片自動(dòng)分類(lèi)和特征量智能提取:圖片自動(dòng)分類(lèi)首先提取已分類(lèi)圖片庫(kù)的通用特征量,然后構(gòu)建出藝術(shù)類(lèi)圖片的待驗(yàn)證分類(lèi)模型,待驗(yàn)證分類(lèi)模型被驗(yàn)證滿(mǎn)足要求后可用于對(duì)未分類(lèi)圖片進(jìn)行自動(dòng)分類(lèi);特征量智能提取首先通過(guò)分類(lèi)模型對(duì)待分類(lèi)圖片庫(kù)進(jìn)行自動(dòng)分類(lèi),然后對(duì)不同類(lèi)別的藝術(shù)類(lèi)圖片進(jìn)行定制化特征量的智能提取以用于圖像搜索。本發(fā)明可實(shí)現(xiàn)對(duì)未分類(lèi)的藝術(shù)類(lèi)圖片進(jìn)行分類(lèi)精度高的自動(dòng)分類(lèi),比傳統(tǒng)的方法更能準(zhǔn)確反映圖片的特征,從而大大提高了藝術(shù)類(lèi)圖像的搜索精度。
【專(zhuān)利說(shuō)明】基于圖片自動(dòng)分類(lèi)的藝術(shù)類(lèi)圖片的定制化特征量提取算法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及藝術(shù)類(lèi)圖片特征量的智能提取算法,具體涉及一種基于圖片自動(dòng)分類(lèi)的藝術(shù)類(lèi)圖片的定制化特征量提取算法。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)尤其是移動(dòng)互聯(lián)網(wǎng)中多媒體內(nèi)容的日益豐富,單純以文字為基礎(chǔ)的搜索系統(tǒng)已不能滿(mǎn)足用戶(hù)對(duì)多媒體內(nèi)容的搜索?;趦?nèi)容的多媒體信息檢索一直是相關(guān)領(lǐng)域關(guān)注和研究的熱點(diǎn)和關(guān)鍵技術(shù)?;趦?nèi)容的多媒體信息檢索目前仍然存在大量的技術(shù)難點(diǎn)沒(méi)有得到有效解決,其中典型的難點(diǎn)之一就是如何彌合人腦與電腦對(duì)圖片解讀方式的巨大鴻溝。
[0003]數(shù)字化后的圖像數(shù)據(jù)的是一組天文數(shù)字級(jí)別的數(shù)組,以一幅256X256的低分辨率圖像為例,每個(gè)像素點(diǎn)的可能取值有256 (紅)X256 (綠)X256 (藍(lán))=16,777,216種,則這樣一副圖片的像素組合有16,777,216X256X256=1,099,511,627,776種;而一幅1024X1024的高清晰度圖像的像素組合更有高達(dá)16,777,216X1024X1024=17, 592,186,044,416種。此外,圖像的稍加處理或變換(如圖像的放大或縮小、局部圖、色彩變化、旋轉(zhuǎn)、對(duì)比度/亮度的增強(qiáng)或減弱、圖片內(nèi)物體交換位置,等等)在數(shù)字化上會(huì)引起巨大變化,會(huì)使視覺(jué)上相似的圖片在數(shù)字化的數(shù)據(jù)上截然不同。
[0004]在千萬(wàn)級(jí)數(shù)量的藝術(shù)類(lèi)圖片庫(kù)的范圍里,若采用傳統(tǒng)圖片識(shí)別方法,這樣做不僅效率低,不能保障正確性,還要浪費(fèi)大量的人力、物力,因此采用傳統(tǒng)人工識(shí)別方式進(jìn)行藝術(shù)圖片研究整理是不現(xiàn)實(shí)的。本發(fā)明針對(duì)不同獨(dú)特風(fēng)格的藝術(shù)類(lèi)圖片提出一種定制化特征量的提取算法。
【發(fā)明內(nèi)容】
[0005]有鑒于此,本發(fā)明提供一種基于圖片自動(dòng)分類(lèi)的藝術(shù)類(lèi)圖片的定制化特征量提取算法,針對(duì)不同類(lèi)別的藝術(shù)類(lèi)圖片進(jìn)行定制化特征提取,由于能更好地反映出圖片的特征而取得了更好的藝術(shù)類(lèi)圖片搜索效果。
[0006]本發(fā)明采用的技術(shù)方案具體為:基于圖片自動(dòng)分類(lèi)的藝術(shù)類(lèi)圖片的定制化特征量提取算法,包括圖片自動(dòng)分類(lèi)的步驟和特征量智能提取的步驟:所述圖片自動(dòng)分類(lèi)的步驟為首先提取已分類(lèi)的藝術(shù)類(lèi)圖片庫(kù)的通用特征量,然后根據(jù)所述通用特征量構(gòu)建出同一類(lèi)別的藝術(shù)類(lèi)圖片的待驗(yàn)證分類(lèi)模型,所述待驗(yàn)證分類(lèi)模型被驗(yàn)證滿(mǎn)足要求之后,用于對(duì)未分類(lèi)的藝術(shù)類(lèi)圖片進(jìn)行自動(dòng)分類(lèi);所述特征量智能提取的步驟為首先通過(guò)已驗(yàn)證滿(mǎn)足要求的分類(lèi)模型對(duì)未分類(lèi)的藝術(shù)類(lèi)圖片進(jìn)行自動(dòng)分類(lèi),然后對(duì)不同類(lèi)別的藝術(shù)類(lèi)圖片進(jìn)行定制化特征量的智能提取,最后將提取到的特征量存儲(chǔ)到特征量數(shù)據(jù)庫(kù)中,用于藝術(shù)類(lèi)圖片的搜索。
[0007]所述定制化特征量提取算法具體包含如下步驟:
[0008]步驟1、選取已分類(lèi)的藝術(shù)類(lèi)圖片庫(kù)的一部分作為圖片訓(xùn)練集,統(tǒng)一提取通用特征量,所述通用特征量包括顏色特征量、紋理特征量和形狀特征量;
[0009]步驟2、對(duì)所述通用特征量進(jìn)行分析,獲得同一類(lèi)別藝術(shù)類(lèi)圖片的共性,建立藝術(shù)類(lèi)圖片特征量與藝術(shù)類(lèi)圖片分類(lèi)之間的對(duì)應(yīng)關(guān)系,構(gòu)建待驗(yàn)證的分類(lèi)模型;
[0010]步驟3、選取已分類(lèi)的藝術(shù)類(lèi)圖片庫(kù)中除圖片訓(xùn)練集外的部分或全部作為圖片驗(yàn)證集,將所述待驗(yàn)證的分類(lèi)模型應(yīng)用到圖片驗(yàn)證集中,對(duì)所述待驗(yàn)證的分類(lèi)模型進(jìn)行驗(yàn)證,若驗(yàn)證誤差滿(mǎn)足預(yù)先設(shè)定的閾值,則得到已驗(yàn)證的分類(lèi)模型;否則重復(fù)步驟1-2,對(duì)所述待驗(yàn)證的分類(lèi)模型進(jìn)一步修正,直至驗(yàn)證誤差滿(mǎn)足預(yù)先設(shè)定的閾值;
[0011]步驟4、用所述已驗(yàn)證的分類(lèi)模型對(duì)未分類(lèi)的藝術(shù)類(lèi)圖片進(jìn)行分類(lèi),得出藝術(shù)類(lèi)圖片的類(lèi)別信息。
[0012]所述步驟2中的待驗(yàn)證的分類(lèi)模型的構(gòu)建具體為:
[0013]設(shè)圖片訓(xùn)練集P = {Po,Pl,...,Pn_J,F(xiàn)為圖片Pi的特征量提取函數(shù),圖片Pi的特征量fea(i) =F(Pi),其中η為所述圖片訓(xùn)練集中圖片的數(shù)量,i e {0,1,...,η_1};
[0014]提取每幅圖片Pi的特征量,構(gòu)成特征量矩陣FEA,則
[0015]
【權(quán)利要求】
1.基于圖片自動(dòng)分類(lèi)的藝術(shù)類(lèi)圖片的定制化特征量提取算法,其特征在于,包括圖片自動(dòng)分類(lèi)的步驟和特征量智能提取的步驟:所述圖片自動(dòng)分類(lèi)的步驟為首先提取已分類(lèi)的藝術(shù)類(lèi)圖片庫(kù)的通用特征量,然后根據(jù)所述通用特征量構(gòu)建出同一類(lèi)別的藝術(shù)類(lèi)圖片的待驗(yàn)證分類(lèi)模型,所述待驗(yàn)證分類(lèi)模型被驗(yàn)證滿(mǎn)足要求之后,用于對(duì)未分類(lèi)的藝術(shù)類(lèi)圖片進(jìn)行自動(dòng)分類(lèi);所述特征量智能提取的步驟為首先通過(guò)已驗(yàn)證滿(mǎn)足要求的分類(lèi)模型對(duì)未分類(lèi)的藝術(shù)類(lèi)圖片進(jìn)行自動(dòng)分類(lèi),然后對(duì)不同類(lèi)別的藝術(shù)類(lèi)圖片進(jìn)行定制化特征量的智能提取,最后將提取到的特征量存儲(chǔ)到特征量數(shù)據(jù)庫(kù)中,用于藝術(shù)類(lèi)圖片的搜索。
2.根據(jù)權(quán)利要求1所述的基于圖片自動(dòng)分類(lèi)的藝術(shù)類(lèi)圖片的定制化特征量提取算法,其特征在于,具體包含如下步驟: 步驟1、選取已分類(lèi)的藝術(shù)類(lèi)圖片庫(kù)的一部分作為圖片訓(xùn)練集,統(tǒng)一提取通用特征量,所述通用特征量包括顏色特征量、紋理特征量和形狀特征量; 步驟2、對(duì)所述通用特征量進(jìn)行分析,獲得同一類(lèi)別藝術(shù)類(lèi)圖片的共性,建立藝術(shù)類(lèi)圖片特征量與藝術(shù)類(lèi)圖片分類(lèi)之間的對(duì)應(yīng)關(guān)系,構(gòu)建待驗(yàn)證的分類(lèi)模型; 步驟3、選取已分類(lèi)的藝術(shù)類(lèi)圖片庫(kù)的除圖片訓(xùn)練集外的部分或全部作為圖片驗(yàn)證集,將所述待驗(yàn)證的分類(lèi)模型應(yīng)用到圖片驗(yàn)證集中,對(duì)所述待驗(yàn)證的分類(lèi)模型進(jìn)行驗(yàn)證,若驗(yàn)證誤差滿(mǎn)足預(yù)先設(shè)定的閾值,則得到已驗(yàn)證的分類(lèi)模型;否則重復(fù)步驟1-2,對(duì)所述待驗(yàn)證的分類(lèi)模型進(jìn)一步修正,直至驗(yàn)證誤差滿(mǎn)足預(yù)先設(shè)定的閾值; 步驟4、用所述已驗(yàn)證的分類(lèi)模型對(duì)未分類(lèi)的藝術(shù)類(lèi)圖片進(jìn)行分類(lèi),得出藝術(shù)類(lèi)圖片的類(lèi)別信息。
3.根據(jù)權(quán)利要求2所述的基于圖片自動(dòng)分類(lèi)的藝術(shù)類(lèi)圖片的定制化特征量提取算法,其特征在于,所述步驟2中待驗(yàn)證的分類(lèi)模型的構(gòu)建具體為: 設(shè)圖片訓(xùn)練集P = {Po, P1...,Pn-J,F(xiàn)為圖片Pi的特征量提取函數(shù),圖片Pi的特征量fea(i) =F(Pi),其中η為所述圖片訓(xùn)練集中圖片的數(shù)量,i e {0,1,...,η_1}; 提取每幅圖片Pi的特征量,構(gòu)成特征量矩陣FEA,則
4.根據(jù)權(quán)利要求3所述的基于圖片自動(dòng)分類(lèi)的藝術(shù)類(lèi)圖片的定制化特征量提取算法,其特征在于,所述待驗(yàn)證圖片分類(lèi)模型為多元線性回歸模型、級(jí)別回歸模型、人工神經(jīng)網(wǎng)絡(luò)或者決策樹(shù)中的一種。
5.根據(jù)權(quán)利要求3所述的基于圖片自動(dòng)分類(lèi)的藝術(shù)類(lèi)圖片的定制化特征量提取算法,其特征在于,所述降維處理具體為:通過(guò)計(jì)算圖片訓(xùn)練集P中向量的信息熵和皮爾森相關(guān)系數(shù),去除影響分類(lèi)模型穩(wěn)定性的信息熵小和強(qiáng)相關(guān)的向量,實(shí)現(xiàn)對(duì)特征量矩陣FEA的降維處理。
6.根據(jù)權(quán)利要求5所述的基于圖片自動(dòng)分類(lèi)的藝術(shù)類(lèi)圖片的定制化特征量提取算法,其特征在于,所述信息熵IV (cp的計(jì)算方法具體為: a)用等距分段的方法對(duì)特征量進(jìn)行分段; b)計(jì)算證據(jù)權(quán)重:
7.根據(jù)權(quán)利要求5所述的基于圖片自動(dòng)分類(lèi)的藝術(shù)類(lèi)圖片的定制化特征量提取算法,其特征在于,特征量之間的相關(guān)性用皮爾森相關(guān)系數(shù)P衡量,任意兩個(gè)連續(xù)變量X和I的皮爾森相關(guān)系數(shù)P為:
8.根據(jù)權(quán)利要求2所述的基于圖片自動(dòng)分類(lèi)的藝術(shù)類(lèi)圖片的定制化特征量提取算法,其特征在于,所述步驟4具體為:將所述已驗(yàn)證的圖片分類(lèi)模型應(yīng)用于未分類(lèi)的藝術(shù)類(lèi)圖片,對(duì)所述圖片集進(jìn)行自動(dòng)分類(lèi),確定分類(lèi)信息,根據(jù)所述分類(lèi)信息提取所述圖片的定制化特征量,所述定制化特征量的提取過(guò)程具體為: I)設(shè)匕為未分類(lèi)的藝術(shù)類(lèi)圖片,首先提取Px的通用特征量,組成向量{fx,o,...,fx,ffl-J ;然后通過(guò)所述降維規(guī)則對(duì)向量{fx,o,...,進(jìn)行降維處理,去除影響圖片穩(wěn)定性的分量,得到降維后的特征向量{fx,o,...,;最后用所述已驗(yàn)證的圖片分類(lèi)模型的得出Px的分類(lèi)信息Cpx: 如果得出的類(lèi)別信息Cpx與已知的圖片類(lèi)別信息C的誤差滿(mǎn)足預(yù)先設(shè)定的閾值要求,則可確定圖片Px的類(lèi)別信息Cx,并根據(jù)Cx對(duì)圖片Px進(jìn)行定制化特征量的提??;否則進(jìn)一步修訂步驟3確定的所述已驗(yàn)證的分類(lèi)模型; 2)根據(jù)所述圖片Px的類(lèi)別信息Cx對(duì)所述圖片Px提取定制化特征量,替換通用特征量,代入所述特征量矩陣FEA中,得到定制化特征量矩陣FEHMAS (5)所示:
【文檔編號(hào)】G06F17/30GK103761295SQ201410021554
【公開(kāi)日】2014年4月30日 申請(qǐng)日期:2014年1月16日 優(yōu)先權(quán)日:2014年1月16日
【發(fā)明者】賈志華, 楊子君, 那維, 楊昊, 楊晟, 葛儂 申請(qǐng)人:北京雅昌文化發(fā)展有限公司, 北京雅昌彩色印刷有限公司, 北京瑞天科技有限公司