欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于結(jié)構(gòu)特征的中國書畫印章圖像自動提取方法

文檔序號:6484291閱讀:276來源:國知局
專利名稱:一種基于結(jié)構(gòu)特征的中國書畫印章圖像自動提取方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種圖像提取領(lǐng)域,特別是關(guān)于一種基于結(jié)構(gòu)特征的中國書畫印章圖像自動提取方法。

背景技術(shù)
中國書畫作品是中國藝術(shù)文化中的重要組成部分。其中印章作為中國書畫"四絕"之一("四絕"即詩、書、畫、印),已經(jīng)成為文人書畫作品中不可分割的重要部分,它包含大量與作者相關(guān)的高層語義信息,具有相當(dāng)重要的藝術(shù)和文化價值。
20世紀(jì)90年代以來,隨著計算機技術(shù)和圖像處理技術(shù)的迅速發(fā)展,基于內(nèi)容的圖像檢索(CBIR,Content Based Image Retrieval)技術(shù)在數(shù)字圖像檢索領(lǐng)域得到廣泛的應(yīng)用。CBIR是圖像檢索中的主要技術(shù)之一,其利用圖像的低層視覺特征描述,如圖像的紋理、顏色、形狀及在空間的分布規(guī)律等特征對圖像進行區(qū)域分割和場景語義信息的提取,從而實現(xiàn)檢索。但是由于"語義鴻溝"的存在,使得CBIR技術(shù)的應(yīng)用受到很大限制,尤其在書畫作品的基于內(nèi)容的檢索方面表現(xiàn)的更為突出。這主要是由于藝術(shù)和文化的傳承性造成的,中國書畫作品中所使用的繪畫技法、畫面構(gòu)圖、顏色運用以及表現(xiàn)形式和主題等的相似性,使得書畫作品的低層視覺特征趨于一致,因此單純的利用低層視覺特征進行檢索很難滿足用戶需求。解決CBIR中“語義鴻溝”問題已經(jīng)成為現(xiàn)階段的研究焦點。
隨著中國書畫作品數(shù)字化的深入,大量的書畫作品被以數(shù)字圖像的形式保存下來,如何能夠通過圖像本身或者其草圖對書畫的數(shù)字圖像和相關(guān)信息進行檢索成為書畫數(shù)字化領(lǐng)域的核心課題之一。針對中國書畫作品的數(shù)字圖像檢索領(lǐng)域中的“語義鴻溝”問題,可以利用印章圖像中包含的高層語義信息進行輔助檢索,解決提取書畫作品語義信息的關(guān)鍵問題。由此可見,印章圖像提取是獲得上述高層語義信息的基礎(chǔ)。
在針對中國書畫的數(shù)字圖像研究領(lǐng)域,賓夕法尼亞州立大學(xué)的James.Wang等人在論文“Studying digital imagery of ancient paintings by mixtures of stochasticmodels”中采用了多尺度小波變換后的特征系數(shù)描述中國書畫的數(shù)字圖像的紋理特征,提出了二維多尺度隱馬爾科夫模型(2D-MHMMs)對于吳昌碩、唐寅、張大千等五位的中國書畫的數(shù)字圖像進行建模并構(gòu)建分類器,以實現(xiàn)對未知書畫圖像的自動分類,但這種方法缺乏可擴展性。
國內(nèi),中科院計算所的黃慶明等在論文“An effective method to detect andcategorize digitized traditional Chinese paintings”中基于Tamura等人提出的一組對應(yīng)人類視覺感知的紋理特征集,采用自相關(guān)紋理特征來描述中國書畫數(shù)字圖像的復(fù)雜程度,針對中國畫中工筆畫和寫意畫的特性提出使用邊緣大小直方圖來測量圖像邊緣的稀疏程度和粒度。而在另一篇論文“Visual Ontology Construction forDigitized Art Image Retrieval”中提出了將圖像分析和領(lǐng)域本體技術(shù)相結(jié)合的書畫圖像語義自動分類算法。
在印章的數(shù)字圖像研究領(lǐng)域,目前主要集中在對規(guī)范的公章或會計和法人印章上。針對書畫作品中印章圖像的研究,只有2008年婁海濤、鮑泓等提出的一種自動提取中國書畫作品中印章圖像的方法(專利號200710143946.3),該提取方法僅利用到印章圖像的顏色特征,不能有效的提取書畫作品中非紅色的印章圖像,且閥值多,提取率受印章圖像大小的限制,沒有充分利用印章圖像的結(jié)構(gòu)特征。目前國內(nèi)外對中國書畫作品中印章圖像自動提取的研究鮮有人涉足,特別是基于結(jié)構(gòu)特征的提取方法。
印章一般是由質(zhì)地較為堅硬的金、銀、銅、玉石等材料雕刻而成。將章料的底面(即“印面”)打磨平整,再在印面上雕刻文字或圖案,即為“印文”。使用時,將印面沾取印泥后鈐蓋在書畫作品上,形成印章圖像。因此,印章圖像的顏色即為印泥的顏色,通常呈現(xiàn)紅色,還有少數(shù)為藍色或其它顏色。印章圖像有陰陽文,陽文印(也稱朱文印)沒有底色,字體為印泥顏色;陰文印(也稱白文印)底色為印泥顏色,字體是白色,即背景顏色。印泥有厚薄、干濕,有蜜印、水印、油印之分,這些都能使同一印章的不同印文圖像發(fā)生變化;同一枚印章鈐蓋在不同的紙或絹上,鈐蓋時用力輕重的不同,不同的背景顏色和紋理等,都會使圖像發(fā)生變化;書畫作品在裝裱過程中,各種紙張或絹帛的伸縮延展也會導(dǎo)致印章圖像發(fā)生變化;再考慮到印泥新舊,紙絹的包漿(紙絹上的光澤)等因素,可以遇到的變化是很多的。歷代書畫家都對印章情有獨鐘,一位畫家往往擁有幾枚到幾十枚不同的印章。為配合書畫作品的意境或畫家個人的情趣,常會在一幅作品中的不同位置鈐蓋一枚或數(shù)枚不同的印章。此外,書畫作品中往往還鈐蓋有一枚或數(shù)枚收藏家的印章,且鈐蓋位置及其背景變化復(fù)雜,難以確定。故而針對書畫作品中印章圖像的自動提取較難實現(xiàn)。


發(fā)明內(nèi)容
針對上述問題,本發(fā)明的目的是提供一種基于結(jié)構(gòu)特征的中國書畫印章圖像自動提取方法。
為實現(xiàn)上述目的,本發(fā)明采取以下技術(shù)方案一種基于結(jié)構(gòu)特征的中國書畫印章圖像自動提取方法,其步驟包括1)對輸入圖像進行顏色分層;2)基于連通區(qū)域的圖像分割;3)基于印章結(jié)構(gòu)特征的圖像區(qū)域過濾;4)在輸入圖像中提取印章圖像。
所述步驟1)的對輸入圖像進行顏色分層,包括以下步驟i)將所述輸入圖像從RGB顏色空間轉(zhuǎn)換到CIE Lab顏色空間;ii)對轉(zhuǎn)換后的輸入圖像進行顏色分層,得到各顏色層圖像。
所述步驟2)的基于連通區(qū)域的圖像分割,包括以下步驟a)使用圖像濾波方法對所述各顏色層圖像進行噪聲處理;b)對顏色層圖像進行基于數(shù)學(xué)形態(tài)學(xué)的區(qū)域合并,形成孤立圖像的連通區(qū)域;c)基于所述連通區(qū)域外接矩形的圖像分割。
所述步驟3)的基于印章結(jié)構(gòu)特征的圖像區(qū)域過濾,包括以下步驟I)利用印章輪廓模板過濾分割后的圖像區(qū)域;II)利用邊緣檢測算法基于印章內(nèi)部結(jié)構(gòu)特征過濾印章圖像區(qū)域。
所述步驟2)中連通區(qū)域的計算方法,可使用種子填充算法、掃描線填充算法或邊填充算法。
所述步驟3)中的印章輪廓模板包括矩形模板、橢圓形模板、葫蘆形、瓦當(dāng)形或刀形。
本發(fā)明由于采取以上技術(shù)方案,其具有以下優(yōu)點1、本發(fā)明利用基于機器學(xué)習(xí)的中國書畫顏色分層分析模型,實現(xiàn)了書畫作品基于色層的同質(zhì)區(qū)域粒度級別的圖像分割,使一幅作品中的不同形狀、顏色和大小的印章分別歸屬到不同的色層,并形成相對孤立的圖像區(qū)域,因此可以對全部印章圖像同時進行提取。2、本發(fā)明在書畫顏色分層的基礎(chǔ)上提出了一種基于印章外部輪廓模板和內(nèi)部結(jié)構(gòu)復(fù)雜度的書畫印章提取方法,該提取方法能夠從整幅書畫作品或書畫作品局部圖像中準(zhǔn)確地自動提取出印章圖像的全部信息,據(jù)此可以實現(xiàn)一個利用印章圖像作為關(guān)鍵信息的基于內(nèi)容的中國書畫圖像檢索和語義標(biāo)注系統(tǒng),克服了現(xiàn)有提取方法中由于印章顏色、鈐蓋位置及其背景變化復(fù)雜而導(dǎo)致的印章提取困難的缺陷,為中國書畫作品的檢索、鑒定以及分類等奠定了基礎(chǔ)。



圖1是本發(fā)明的流程示意圖 圖2是本發(fā)明的基于書畫圖像顏色分層模型分層前的圖像 圖3是本發(fā)明的基于書畫圖像顏色分層模型分層后紅色圖層的二值圖 圖4是本發(fā)明的基于書畫圖像顏色分層模型分層后黃色圖層的二值圖 圖5是本發(fā)明的基于書畫圖像顏色分層模型分層后藍色圖層的二值圖 圖6是本發(fā)明的基于書畫圖像顏色分層模型分層后綠色圖層的二值圖 圖7是本發(fā)明的基于書畫圖像顏色分層模型分層后白色圖層的二值圖 圖8是本發(fā)明的基于書畫圖像顏色分層模型分層后黑色圖層的二值圖 圖9是本發(fā)明的基于書畫圖像顏色分層模型分層后雜色圖層的二值圖 圖10是本發(fā)明的基于書畫圖像顏色分層模型分層后紅色圖層圖像 圖11是本發(fā)明的基于書畫圖像顏色分層模型分層后黃色圖層圖像 圖12是本發(fā)明的基于書畫圖像顏色分層模型分層后藍色圖層圖像 圖13是本發(fā)明的基于書畫圖像顏色分層模型分層后綠色圖層圖像 圖14是本發(fā)明的基于書畫圖像顏色分層模型分層后白色圖層圖像 圖15是本發(fā)明的基于書畫圖像顏色分層模型分層后黑色圖層圖像 圖16是本發(fā)明的基于書畫圖像顏色分層模型分層后雜色圖層圖像 圖17是本發(fā)明中圖3所示紅色圖層去除噪聲后的二值圖 圖18是本發(fā)明中圖17所示二值圖連通區(qū)域偽彩色標(biāo)識圖像 圖19是本發(fā)明中數(shù)學(xué)形態(tài)學(xué)方法所使用的結(jié)構(gòu)元素 圖20是本發(fā)明中圖17所示二值圖膨脹后的效果 圖21是本發(fā)明中圖20所示圖像腐蝕后的效果圖 圖22是本發(fā)明中圖21所示圖像的分割區(qū)域圖像 圖23是本發(fā)明中所設(shè)計的矩形模板圖 圖24是本發(fā)明中圖23所示矩形模板圖的距離-角度關(guān)系圖 圖25是本發(fā)明中所設(shè)計的橢圓形模板圖 圖26是本發(fā)明中圖25所示橢圓模板圖的距離-角度關(guān)系圖 圖27是本發(fā)明中從圖22中選取的區(qū)域圖像 圖28是本發(fā)明中由圖27所示二值圖像生成的自適應(yīng)矩形模板圖的距離-角度關(guān)系圖 圖29是本發(fā)明中圖27所示二值圖像輪廓的距離-角度關(guān)系圖 圖30是本發(fā)明中圖27所示的二值圖像輪廓與其對應(yīng)矩形模板的差值曲線圖 圖31是本發(fā)明中圖5所示圖層中的區(qū)域圖像 圖32是本發(fā)明中圖27所示二值圖的邊緣圖 圖33是采用本發(fā)明方法從圖2中提取到的印章圖像 圖34是本發(fā)明選用的當(dāng)代畫家徐悲鴻的一幅奔馬圖 圖35是基于本發(fā)明方法從圖33所示實施例中提取的印章圖像
具體實施例方式 下面結(jié)合附圖和實施例對本發(fā)明進行詳細的描述。
雖然在中國書畫的數(shù)字圖像中進行印章圖像提取非常困難,但印章圖像本身的外部輪廓和內(nèi)部結(jié)構(gòu)特征仍有一定規(guī)律可循。印章圖像的外部輪廓主要體現(xiàn)在印章圖像的邊欄上。邊欄有矩形、圓形、橢圓形和異形之分。根據(jù)對從宋朝至清朝172名書畫家的3191款印章圖像的統(tǒng)計分析表明,印章圖像的外部輪廓特征多為矩形、圓形和橢圓形,其中矩形的占93.77%,圓形和橢圓的占5.14%,但印章圖像的大小規(guī)格不一,且一般印章圖像都不十分完整。
印章圖像除具有上述外部輪廓特征之外,其內(nèi)部結(jié)構(gòu)也因章法(布局)而具有一定的規(guī)律。其中,格欄一般可以分為田字格、日字格、井字格等,印文也有二字、四字、六字等之分,但實際情況遠比這復(fù)雜。印章章法注重結(jié)構(gòu),印文布局講究虛實結(jié)合。但由于文字體勢不同,往往要在簡單的印字上添加筆畫,在復(fù)雜的印字上減少筆畫,以達到講求平衡、老實、大方、端正的目的。綜上所述,可以利用以上特征對書畫作品中的印章圖像進行自動提取。
本發(fā)明通過常規(guī)方法獲取一幅包含印章信息的中國書畫作品或作品局部的數(shù)字圖像,利用圖像處理的組合方法,對中國書畫作品中的印章圖像進行識別,并逐個提取出來。
如圖1所示,印章圖像自動提取方法步驟如下 1、對書畫圖像進行顏色分層將數(shù)字化的中國書畫圖像輸入電腦,使用基于機器學(xué)習(xí)的書畫圖像顏色分層模型對書畫圖像進行顏色分層。
i)將輸入書畫圖像從RGB顏色空間轉(zhuǎn)換到CIE Lab顏色空間 計算機中圖像顏色的描述一般采用RGB顏色空間,本發(fā)明針對在CIE Lab顏色空間描述的中國書畫圖像顏色分層模型,將輸入的書畫圖像進行圖像空間的轉(zhuǎn)換。即借助XYZ顏色空間,將書畫圖像由RGB顏色空間轉(zhuǎn)換到CIE Lab顏色空間。從RGB到XYZ顏色空間的轉(zhuǎn)換依推薦標(biāo)準(zhǔn)不同而不同,本實例采用在標(biāo)準(zhǔn)光源D65(即色溫為6504°K的日光)下的轉(zhuǎn)換關(guān)系 其中,X、Y、Z和R、G、B分別為各自顏色空間中對應(yīng)顏色分量。再由XYZ顏色空間轉(zhuǎn)換到CIE Lab顏色空間 L=116f(Y/Y0)-16 a=500[f(X/X0)-f(Y/Y0)] b=200[f(Y/Y0)-f(Z/Z0)] 其中,L、a、b為CIE Lab顏色空間中的各分量,X0,Y0,Z0是XYZ國際坐標(biāo)制中參考白點的三色刺激值。在函數(shù)f(t)中,當(dāng)t>(6/29)3時,f(t)=t1/3;否則, 將圖像在CIE Lab空間中每個像素點的a和b分量使用其極坐標(biāo)(C*,hab)表示, hab=arctan(b/a) ii)對轉(zhuǎn)換后的書畫圖像進行顏色分層 本發(fā)明在書畫圖像顏色分層模型中定義了紅、黃、藍、綠、白、黑,共6個顏色集。書畫圖像顏色分層模型使用BP神經(jīng)網(wǎng)絡(luò)對上述顏色集進行分類。輸入書畫圖像各像素點的CIE Lab空間的分量(L,C*,hab)ij,其中i∈[1,h],j∈[1,w],i、j為整數(shù),h為書畫圖像垂直方向的最大像素數(shù)目,w為書畫圖像水平方向的最大像素數(shù)目。本步驟利用書畫圖像顏色分層模型中的三層BP神經(jīng)網(wǎng)絡(luò)進行逐像素點的網(wǎng)絡(luò)計算,輸出各像素點所屬的色層標(biāo)號,并用三位二進制表示其所屬的顏色層標(biāo)號,如顏色層1的三位二進制為001。BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)包括輸入層、隱層和輸出層。其中,訓(xùn)練函數(shù)選用Levenberg Marquardt的BP算法訓(xùn)練函數(shù)trainlm,隱層傳遞函數(shù)選用正切S型傳遞函數(shù)tansig。輸出層傳遞函數(shù)采用線性傳遞函數(shù)purelin,學(xué)習(xí)函數(shù)采用梯度下降動量學(xué)習(xí)規(guī)則learngdm,性能分析函數(shù)采用MSE。
之后根據(jù)各像素點所屬的色層標(biāo)號實現(xiàn)圖像分層,即根據(jù)輸出的各像素點所屬色層標(biāo)號構(gòu)造各層的掩碼矩陣maskn為色層標(biāo)號,本實施例中n=1,2,...,6,對應(yīng)6個顏色集。取像素點(i,j)的輸出outij,若outij=n,在掩碼矩陣中色層n對應(yīng)的元素maskij=1,反之maskij=0,掩碼矩陣mask在RGB空間中可以利用二值圖直觀表示。
如圖2~圖9所示,書畫圖像分層前與圖像分層后的各分層的二值圖的效果對比。如圖10~圖16所示,在RGB顏色空間中利用上述的各層二值圖像與原圖像按像素點做與運算,可以實現(xiàn)對圖像各顏色層的分層。
2、基于連通區(qū)域的圖像分割 對步驟1中分得的各顏色層圖像進行噪聲處理,針對處理后的各層圖像進行基于數(shù)學(xué)形態(tài)學(xué)的區(qū)域合并,計算各連通區(qū)域的外接矩形,對區(qū)域合并后的各層圖像進行分割。
a)對各顏色層圖像進行噪聲處理 如圖3~圖9所示,圖像分層后的各層圖像是由一些大小不等的孤立不連通的區(qū)域構(gòu)成的。一般在各層圖像上都包含有極小面積的圖像區(qū)域,即噪聲,究其原因可歸結(jié)為書畫作品的顏料、材質(zhì)、保存狀況以及包漿等因素。為提高基于印章結(jié)構(gòu)特征的圖像區(qū)域過濾的計算效率,可對分層后的各層圖像中顯然不可能為印章圖像的區(qū)域進行過濾。
考慮到印章圖像生成的過程,其特點在于顏色一致且連續(xù),加之印章圖像的顏色與背景顏色有差異,印章圖像必然為一個或一組孤立并連通的區(qū)域。又由于印章圖像一般具有一定結(jié)構(gòu),因此其連通區(qū)域的總像素數(shù)不可能太小,否則不能被識別為印章。綜上所述,本實施例選取8鄰域種子填充算法對各層二值圖進行連通區(qū)域標(biāo)識,設(shè)閥值為9,則連通區(qū)域面積小于9的圖像區(qū)域?qū)⒈蛔鳛樵肼暈V除。對書畫圖像的紅色圖層的噪聲處理結(jié)果如圖17所示。
本步驟中,噪聲處理除采用以上方法外,還可選用其它現(xiàn)有的圖像濾波方法或它們的組合,如自適應(yīng)濾波器、中值濾波器和高斯濾波器等,也可以根據(jù)實際需要自行設(shè)計圖像過濾方法。
b)對處理后的顏色層圖像進行基于數(shù)學(xué)形態(tài)學(xué)的區(qū)域合并 如圖18所示,書畫圖像右下角印章的邊框區(qū)域和印文區(qū)域被分割到3個不同的區(qū)域內(nèi),因此根據(jù)印章的結(jié)構(gòu)特征,印章的邊框區(qū)域和印文區(qū)域并不一定連通??紤]到印章的印文包含在印章邊框之內(nèi),則其連通區(qū)域的必然相鄰,于是可以使用數(shù)學(xué)形態(tài)學(xué)的方法對各層二值圖像中的上述連通區(qū)域進行合并,以達到屬于同一枚印章的圖像區(qū)域盡可能的落在同一連通區(qū)域內(nèi)的目的。如圖19所示,選取結(jié)構(gòu)元素S,對各層二值圖像進行膨脹,其邏輯方程為
其中,A為經(jīng)噪聲處理后的分層圖像。如圖20所示,3個不連通的印章區(qū)域利用上述操作實現(xiàn)合并。
針對膨脹后的圖像,可以再次利用結(jié)構(gòu)元素S進行腐蝕操作。其公式為 其中,A為經(jīng)膨脹處理后的分層圖像。如圖21所示,上述操作可以去除膨脹所得的非連接像素點,形成孤立圖像的連通區(qū)域。
c)基于連通區(qū)域外接矩形的圖像分割 針對各層二值圖像中基于數(shù)學(xué)形態(tài)學(xué)合并后的各連通區(qū)域,計算其外接矩形。求連通區(qū)域外接矩形,可以通過計算連通區(qū)域內(nèi)各像素點的最大和最小坐標(biāo)值imax、imin、jmax、jmin來進行,其中i∈[1,h],j∈[1,w],i、j為整數(shù),h為書畫圖像的垂直方向的最大像素數(shù)目,w為書畫圖像的水平方向的最大像素數(shù),可得連通區(qū)域的外接矩形的起點為(imin,jmin),水平和垂直跨度值分別為imax-imin,jmax-jmin。根據(jù)各連通區(qū)域的外接矩形和各層二值圖像之間存在的位置對應(yīng)關(guān)系,對圖像進行分割。以紅色圖層為例,在書畫圖像中分割提取得到16個圖像區(qū)域,部分圖像區(qū)域如圖22所示。
步驟a)和步驟c)中涉及到連通區(qū)域的計算方法,除使用到8鄰域種子填充算法外,還可以選用4鄰域種子填充算法、掃描線填充算法和邊填充方法等。
步驟c)中連通區(qū)域合并方法,除采用基于數(shù)學(xué)形態(tài)學(xué)的合并方法外,還可以采用其他現(xiàn)有的連通區(qū)域合并方法,或自行設(shè)計合并方法。對于數(shù)學(xué)形態(tài)學(xué)處理方法,除膨脹法和腐蝕法外,也可以根據(jù)實際情況自行選取不同的結(jié)構(gòu)元素來進行。
3、基于印章結(jié)構(gòu)特征的圖像區(qū)域過濾 對步驟2中分割后的圖像區(qū)域,利用印章圖像的外部輪廓模板進行匹配,濾除不符合印章圖像外部輪廓模板特征的圖像區(qū)域。再利用邊緣檢測方法提取剩余圖像的邊緣特征,計算剩余圖像區(qū)域的內(nèi)部結(jié)構(gòu)復(fù)雜度,濾除不滿足印章內(nèi)部結(jié)構(gòu)復(fù)雜度指標(biāo)的圖像區(qū)域。
I)利用印章輪廓模板過濾圖像區(qū)域 如圖22所示,可以發(fā)現(xiàn)印章圖像區(qū)域的輪廓多為矩形、圓形或橢圓形等規(guī)則形狀,而其它圖像區(qū)域則不具備這種規(guī)則的輪廓特征。這是由于中國書畫一般用毛筆繪制或書寫,非印章區(qū)域的書畫圖像輪廓一般為不規(guī)則形狀,由此可以利用印章的外部輪廓特征對圖像區(qū)域進行過濾。針對書畫圖像中印章的輪廓多為矩形、圓形或橢圓形等規(guī)則形狀的特性,分別設(shè)計了矩形模板和橢圓形模板,其中矩形模板的設(shè)計如下 如圖23所示,針對分割后的任意圖像區(qū)域,計算其最小外接矩形,設(shè)外接矩形的長、寬分別為H,W,中心為O。將O點作為坐標(biāo)系的原點,模板上的任意點(x,y)到原點O的線段長度為D,與x正半軸的夾角為θ,θ∈
,則有 θ=arctan(y/x) 則矩形模板中,長度D與夾角θ的關(guān)系如圖24所示。
如圖25所示,橢圓形模板通過計算圖像區(qū)域的最小外接矩形的內(nèi)切橢圓獲得。橢圓形模板上的各點到原點O的線段長度D和與x正半軸的夾角θ的計算方法同上,則在橢圓模板中,長度D與夾角θ的關(guān)系如圖26所示。印章輪廓模板除采用矩形模板和橢圓形模板外,也可根據(jù)需要設(shè)計葫蘆形、瓦當(dāng)形、刀形等其它模板。
由于印章輪廓的形狀、大小是根據(jù)圖像區(qū)域而變化的,因此利用上述方法可以針對不同形狀、大小的圖像區(qū)域生成其相應(yīng)的自適應(yīng)印章輪廓模板。如圖27所示,針對基于區(qū)域分割后的圖像區(qū)域,根據(jù)上述印章輪廓模板設(shè)計的方法生成該區(qū)域的二值圖像輪廓模板,其長度D與夾角θ的關(guān)系如圖28所示。二值圖像輪廓模板匹配的過程如下 依次選取二值圖像輪廓模板上的點(x,y),做點(x,y)到坐標(biāo)原點O的線段。假設(shè)線段上的各像素點與區(qū)域內(nèi)的二值圖像像素點的交集中,距離坐標(biāo)原點O最遠的像素點的坐標(biāo)為

則點

到原點O線段的長度D′和與x正半軸的夾角θ′,θ′∈
為 其中,D′和θ′的關(guān)系如圖29所示。計算二值圖像輪廓模板上的點(x,y)和二值圖像輪廓上的點

到原點O的距離差值ΔD ΔD=D-D′ 如圖30所示,通過距離差值ΔD可得矩形模板和圖27所示的二值圖像輪廓模板的差值曲線。
進一步根據(jù)距離差值ΔD和線段長度D計算二值圖像輪廓模板的相符率η 設(shè)通過實驗經(jīng)驗獲得的相符閥值為δ,本實例取δ=0.2。若二值圖像輪廓模板的相符率η不大于相符閥值δ,則認(rèn)為該二值圖像輪廓上的點

與對應(yīng)的二值圖像輪廓模板上的點(x,y)相符。再計算容錯率μ 其中num(η>δ)為二值圖像輪廓上與二值圖像輪廓不相符的點的像素數(shù)目。設(shè)通過實驗經(jīng)驗獲得的容錯閥值為ε,本實例取ε=0.2。若容錯率μ小于容錯閥值ε,則認(rèn)為該二值圖像所對應(yīng)的圖像區(qū)域符合印章輪廓模板,反之不符。最后,對不符合印章輪廓模板的圖像區(qū)域進行剔除。
2)基于印章內(nèi)部結(jié)構(gòu)特征過濾圖像區(qū)域 由于步驟1)中經(jīng)印章輪廓模板過濾后的剩余圖像區(qū)域,僅包含有具有印章輪廓特征的圖像區(qū)域。對這些圖像區(qū)域的分析表明,印章圖像區(qū)域因章法特性具有相對復(fù)雜的內(nèi)部結(jié)構(gòu),而如圖31所示,對于剩余圖像區(qū)域中的非印章區(qū)域一般不具備相應(yīng)的復(fù)雜內(nèi)部結(jié)構(gòu)。本發(fā)明提出了一種根據(jù)印章內(nèi)部結(jié)構(gòu)復(fù)雜程度判斷圖像區(qū)域是否為印章圖像的檢測方法,該方法給出了一個衡量印章內(nèi)部結(jié)構(gòu)復(fù)雜程度的描述算子——結(jié)構(gòu)復(fù)雜度。具體實施方法如下 首先利用邊緣提取方法提取各剩余圖像區(qū)域的邊緣信息,本實例采用Canny邊緣檢測算子進行印章圖像的邊緣提取,結(jié)構(gòu)復(fù)雜度SC表示為 SC=Edge/Dia 其中,Edge為邊緣提取后的圖像區(qū)域內(nèi)的像素點總和,Dia為圖像外接矩形的對角線長度。設(shè)復(fù)雜度閥值ω為通過大量實驗獲得的經(jīng)驗值,本實例當(dāng)中,ω取6.0。若結(jié)構(gòu)復(fù)雜度SC大于復(fù)雜度閥值ω時,其對應(yīng)的圖像區(qū)域為印章區(qū)域,反之為非印章區(qū)域。邊緣檢測方法,除本實施例中采用的Canny算子外,也可采用Sobel算子,Roberts算子和拉普拉斯算子等邊緣檢測算子,或根據(jù)實際情況自行設(shè)計其它邊緣檢測算法,以及對已有方法的改進。如圖32所示,實心灰色線段表示對角線。
4、提取印章圖像 如圖33所示,滿足印章外部輪廓的特征和內(nèi)部結(jié)構(gòu)特征的圖像區(qū)域即為印章圖像區(qū)域,根據(jù)印章圖像區(qū)域和書畫圖像之間存在的位置對應(yīng)關(guān)系,即根據(jù)印章圖像區(qū)域的外接矩形在書畫圖像中提取出印章圖像。
如圖34、圖35所示,本實施例對中國著名畫家徐悲鴻的《奔馬》中包含的兩枚印章圖像進行提取。在收集的大量書畫作品數(shù)字圖像的基礎(chǔ)上,隨機選擇了其中200幅作為樣本,并以50幅樣本為一組,共分成4組圖像建立實驗樣本庫。通過本發(fā)明的方法所建立的模型進行測試,提取率E達到81.72%。
綜上所述,本發(fā)明利用基于機器學(xué)習(xí)的中國書畫顏色分層分析模型,實現(xiàn)了書畫作品基于色層的同質(zhì)區(qū)域粒度級別的圖像分割。在此基礎(chǔ)上提出了一種基于印章輪廓模板和內(nèi)部結(jié)構(gòu)復(fù)雜度的書畫印章提取方法,該提取方法能夠從整幅書畫作品或書畫作品局部圖像中準(zhǔn)確地自動提取出印章圖像的全部信息,據(jù)此可以實現(xiàn)一個利用印章圖像作為關(guān)鍵信息的基于內(nèi)容的中國書畫圖像檢索和語義標(biāo)注系統(tǒng),為中國書畫作品的檢索、鑒定以及分類等奠定了基礎(chǔ)。
權(quán)利要求
1、一種基于結(jié)構(gòu)特征的中國書畫印章圖像自動提取方法,其步驟包括
1)對輸入圖像進行顏色分層;
2)基于連通區(qū)域的圖像分割;
3)基于印章結(jié)構(gòu)特征的圖像區(qū)域過濾;
4)在輸入圖像中提取印章圖像。
2、如權(quán)利要求1所述的一種基于結(jié)構(gòu)特征的中國書畫印章圖像自動提取方法,其特征在于所述步驟1)的對輸入圖像進行顏色分層,包括以下步驟
i)將所述輸入圖像從RGB顏色空間轉(zhuǎn)換到CIE Lab顏色空間;
ii)對轉(zhuǎn)換后的輸入圖像進行顏色分層,得到各顏色層圖像。
3、如權(quán)利要求1所述的一種基于結(jié)構(gòu)特征的中國書畫印章圖像自動提取方法,其特征在于所述步驟2)的基于連通區(qū)域的圖像分割,包括以下步驟
a)使用圖像濾波方法對所述各顏色層圖像進行噪聲處理;
b)對顏色層圖像進行基于數(shù)學(xué)形態(tài)學(xué)的區(qū)域合并,形成孤立圖像的連通區(qū)域;
c)基于所述連通區(qū)域外接矩形的圖像分割。
4、如權(quán)利要求2所述的一種基于結(jié)構(gòu)特征的中國書畫印章圖像自動提取方法,其特征在于所述步驟2)的基于連通區(qū)域的圖像分割,包括以下步驟
a)使用圖像濾波方法對所述各顏色層圖像進行噪聲處理;
b)對顏色層圖像進行基于數(shù)學(xué)形態(tài)學(xué)的區(qū)域合并,形成孤立圖像的連通區(qū)域;
c)基于所述連通區(qū)域外接矩形的圖像分割。
5、如權(quán)利要求1或2或3或4所述的一種基于結(jié)構(gòu)特征的中國書畫印章圖像自動提取方法,其特征在于所述步驟3)的基于印章結(jié)構(gòu)特征的圖像區(qū)域過濾,包括以下步驟
I)利用印章輪廓模板過濾分割后的圖像區(qū)域;
II)利用邊緣檢測算法基于印章內(nèi)部結(jié)構(gòu)特征過濾印章圖像區(qū)域。
6、如權(quán)利要求1或2或3或4所述的一種基于結(jié)構(gòu)特征的中國書畫印章圖像自動提取方法,其特征在于所述步驟2)中連通區(qū)域的計算方法,可使用種子填充算法、掃描線填充算法或邊填充算法。
7、如權(quán)利要求5所述的一種基于結(jié)構(gòu)特征的中國書畫印章圖像自動提取方法,其特征在于所述步驟2)中連通區(qū)域的計算方法,可使用種子填充算法、掃描線填充算法或邊填充算法。
8、如權(quán)利要求1或2或3或4或7所述的一種基于結(jié)構(gòu)特征的中國書畫印章圖像自動提取方法,其特征在于所述步驟3)中的印章輪廓模板包括矩形模板、橢圓形模板、葫蘆形、瓦當(dāng)形或刀形。
9、如權(quán)利要求5所述的一種基于結(jié)構(gòu)特征的中國書畫印章圖像自動提取方法,其特征在于所述步驟3)中的印章輪廓模板包括矩形模板、橢圓形模板、葫蘆形、瓦當(dāng)形或刀形。
10、如權(quán)利要求6所述的一種基于結(jié)構(gòu)特征的中國書畫印章圖像自動提取方法,其特征在于所述步驟3)中的印章輪廓模板包括矩形模板、橢圓形模板、葫蘆形、瓦當(dāng)形或刀形。
全文摘要
本發(fā)明涉及一種基于結(jié)構(gòu)特征的中國書畫印章圖像自動提取方法,其步驟包括1)對輸入圖像進行顏色分層;2)基于連通區(qū)域的圖像分割;3)基于印章結(jié)構(gòu)特征的圖像區(qū)域過濾;4)在輸入圖像中提取印章圖像。本發(fā)明利用基于機器學(xué)習(xí)的中國書畫顏色分層分析模型,實現(xiàn)了書畫作品基于色層的同質(zhì)區(qū)域粒度級別的圖像分割。在此基礎(chǔ)上提出了一種基于印章輪廓模板和內(nèi)部結(jié)構(gòu)復(fù)雜度的書畫印章提取方法,該提取方法能夠從整幅書畫作品或書畫作品局部圖像中準(zhǔn)確地自動提取出印章圖像的全部信息,據(jù)此可以實現(xiàn)一個利用印章圖像作為關(guān)鍵信息的基于內(nèi)容的中國書畫圖像檢索和語義標(biāo)注系統(tǒng),為中國書畫作品的檢索、鑒定以及分類等奠定了基礎(chǔ)。
文檔編號G06T7/40GK101533517SQ20091008237
公開日2009年9月16日 申請日期2009年4月15日 優(yōu)先權(quán)日2009年4月15日
發(fā)明者婁海濤, 胡正坤, 泓 鮑, 南 張, 王迪菲, 王真真 申請人:北京聯(lián)合大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
新绛县| 聂荣县| 甘洛县| 舒兰市| 册亨县| 磐石市| 龙井市| 阿克陶县| 丹巴县| 浙江省| 左权县| 萝北县| 明光市| 万全县| 太保市| 湾仔区| 南皮县| 稻城县| 蒙城县| 神池县| 闻喜县| 调兵山市| 宁晋县| 冕宁县| 平利县| 同德县| 炎陵县| 曲阳县| 南安市| 梅州市| 建昌县| 商洛市| 临泉县| 高雄市| 彩票| 昌江| 固始县| 太白县| 始兴县| 电白县| 鄂托克旗|