專利名稱:基于木材顯微圖像的針葉材樹(shù)種自動(dòng)識(shí)別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種顯微圖像的計(jì)算機(jī)識(shí)別技術(shù),尤其是針對(duì)針葉樹(shù)種木材切片顯微
圖像的自動(dòng)識(shí)別方法。
背景技術(shù):
針葉材早期的識(shí)別方法主要靠人工經(jīng)驗(yàn)和知識(shí),根據(jù)宏觀特征和微觀特征,通過(guò) 觀察、比較和分析逐步鑒定識(shí)別木材。后來(lái)出現(xiàn)的對(duì)分式檢索表和穿孔卡片檢索表使人們 可以借助相應(yīng)的工具來(lái)進(jìn)行木材識(shí)別,但是通過(guò)手工查閱和使用檢索表效率低下,而且檢 索表容易破損。計(jì)算機(jī)的出現(xiàn),特別是數(shù)據(jù)庫(kù)技術(shù)的廣泛應(yīng)用,人們將木材樹(shù)種名稱及構(gòu)造 特征等數(shù)據(jù)在計(jì)算機(jī)中存儲(chǔ),開(kāi)創(chuàng)了木材識(shí)別計(jì)算機(jī)檢索系統(tǒng)。該系統(tǒng)具有處理信息快、運(yùn) 行效率高、綜合功能強(qiáng)等特點(diǎn)。但由于計(jì)算機(jī)檢索時(shí)輸入的特征需要操作者憑印象進(jìn)行主 觀的描述,從而使這種識(shí)別方法仍具有很大的主觀色彩,尚需用戶本人對(duì)木材構(gòu)造特征有 清晰認(rèn)識(shí),限制了數(shù)據(jù)庫(kù)識(shí)別方法的應(yīng)用范圍。 經(jīng)檢索,涉及樹(shù)木生物學(xué)特征檢別的有CN1936552"紅木的近紅外光譜識(shí)別方法", 而借助計(jì)算機(jī)對(duì)木材顯微圖像匹配比對(duì)進(jìn)行針葉樹(shù)種識(shí)別的方法,至今未見(jiàn)報(bào)道。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)中,針葉樹(shù)種識(shí)別速度慢、查閱的紙質(zhì)材料和檢索表易破損、綜合能 力和運(yùn)算效率低、受鑒別者主觀影響大等不足,本發(fā)明要解決的問(wèn)題是提供一種借助于計(jì) 算機(jī)對(duì)針葉材顯微圖像中所隱含的生物學(xué)和統(tǒng)計(jì)特征采用圖像匹配比對(duì)進(jìn)行針葉樹(shù)種自 動(dòng)識(shí)別的方法。 解決上述問(wèn)題的技術(shù)方案是本自動(dòng)識(shí)別方法分為訓(xùn)練和識(shí)別兩部分,具體步驟 如下 一.訓(xùn)練 (1)基礎(chǔ)樣本材料的準(zhǔn)備收集針葉材樹(shù)種木材樣本,按常規(guī)方法制作切片,封固 和微顯拍攝,獲取顯微構(gòu)造的電子數(shù)碼圖像,存儲(chǔ); (2)預(yù)處理在給定切片顯微圖像的早晚材過(guò)渡部分選取一塊wXh像素的子區(qū) 域,w、h值為100-400,再進(jìn)行灰度轉(zhuǎn)換,將獲得的子區(qū)域轉(zhuǎn)換成256級(jí)灰度圖像;
(3)PCA特征提取對(duì)預(yù)處理后基礎(chǔ)樣本圖像采用PCA主要成分分析法去二階相關(guān) 和降維處理,降低參加后續(xù)ICA獨(dú)立成分分析中特征提取的向量維數(shù),提高ICA特征獲取的 效率; (4)ICA特征提取先進(jìn)行白化處理,即對(duì)輸入數(shù)據(jù)Y進(jìn)行線性變換,使變換后的數(shù) 據(jù)Y'的協(xié)方差矩陣是單位矩陣;后再計(jì)算分離矩陣,采用信息最大化法或互信息最小法 或極大似然估算法計(jì)算ICA模型;再構(gòu)造ICA獨(dú)立樹(shù)基圖像,將由PCA處理得到的"特征樹(shù)" 變換成一維行向量,并把所有的特征樹(shù)逐行疊置構(gòu)成一個(gè)矩陣,記為Y,將由計(jì)算分離矩陣 的ICA模型計(jì)算法訓(xùn)練出的W,再加上初始數(shù)據(jù)的白化處理的線性變換,得到解混合矩陣,并作用于Y得到獨(dú)立樹(shù)基圖像;最后重構(gòu)基礎(chǔ)樣本材料集,將原樣本木材圖像在ICA特征子 空間中重新表示;
二.識(shí)別 (1)待識(shí)別材料的準(zhǔn)備與步驟一訓(xùn)練(1)基礎(chǔ)樣本材料的準(zhǔn)備相同,將待識(shí)別材 料的針葉樹(shù)種木材進(jìn)行切片、封固、顯微拍攝、制作電子數(shù)碼圖像和計(jì)算機(jī)存儲(chǔ);
(2)預(yù)處理與步驟一訓(xùn)練(2)的預(yù)處理相同,將待識(shí)別材料顯微圖像選取wXh 像素子區(qū)域,轉(zhuǎn)換成256級(jí)灰度圖像; (3)待識(shí)別圖像的投影和重構(gòu)將待識(shí)別材料顯微圖像表示成一維行向量,先將
其在PCA特征空間中投影,再與混合矩陣作用,獲得待識(shí)別材料的ICA特征向量; (4)樹(shù)種的認(rèn)定將通過(guò)步驟一訓(xùn)練(1)基礎(chǔ)樣本材料的準(zhǔn)備和(2)預(yù)處理建立
的基礎(chǔ)樣本圖像的ICA系數(shù)向量作為木材圖像的特征向量,采用向量余弦的最近鄰分類器
進(jìn)行分類認(rèn)定,待識(shí)別材料特征向量與某一樣本的特征向量最鄰近的,則認(rèn)定該待識(shí)材料
為與該樣本材料相同的針葉樹(shù)種。 本發(fā)明的有益效果是在已存儲(chǔ)的針葉材橫切面顯微圖像數(shù)據(jù)庫(kù)中,對(duì)待識(shí)別針 葉材采用計(jì)算機(jī)相似度比對(duì)方法進(jìn)行樹(shù)種識(shí)別,具有不受鑒別者主觀影響、綜合能力和運(yùn) 算效率高、速度快和正確率較高的優(yōu)點(diǎn)。
具體實(shí)施例方式
本發(fā)明下面結(jié)合實(shí)施例予以闡明 木質(zhì)材料以其獨(dú)特的材料性能以及優(yōu)良的環(huán)境學(xué)特性深受人們喜愛(ài),廣泛用于人 類的生活當(dāng)中,發(fā)揮著重要的作用。由于樹(shù)種不同,木材的構(gòu)造就不一樣,材質(zhì)有差異,用途 也就不同。因此正確地識(shí)別木材的樹(shù)種就顯得特別重要,主要表現(xiàn)在l)根據(jù)各種木材具 有的不同化學(xué)、物理和力學(xué)性質(zhì),按其材質(zhì)特性,充分合理地使用木材資源;2)使木材在流 通中做到真材實(shí)料按質(zhì)論價(jià),這對(duì)于木材家具、家裝產(chǎn)業(yè)的健康發(fā)展意義重大;3)使木材 進(jìn)出口管理中防止非法木材交易和交易欺詐行為;4)對(duì)考古和歷史研究也具有重要意義。 如通過(guò)木材識(shí)別可以了解古代樹(shù)種的生長(zhǎng)、分布及利用,古代人們掌握材性和選材、用材的 科學(xué)性等情況。 針葉樹(shù)材顯微圖像顯示的主要是管胞,實(shí)際的顯微結(jié)構(gòu)中也是如此,管胞占木材 總體積89% 98%,管胞徑向排列整齊,其長(zhǎng)寬比在樹(shù)成熟期后是比較穩(wěn)定的。橫切面上 早晚材過(guò)渡情況對(duì)于針葉材樹(shù)種識(shí)別具有重要的意義,這部分是指樹(shù)木橫斷面年輪中顯示 的春夏生長(zhǎng)部到秋冬生長(zhǎng)部的過(guò)渡部分,具有獨(dú)特的季節(jié)生長(zhǎng)的對(duì)比性特征,因此作為選 取部分。這些具有細(xì)微差別的識(shí)別特征通過(guò)人的肉眼很難進(jìn)行區(qū)分,但計(jì)算機(jī)易計(jì)算,然后 用于針葉材樹(shù)種識(shí)別。 主成分分析(Principle Component Analysis, PCA)是一種經(jīng)典的線性數(shù)據(jù)降維 方法,它是在最小均方誤差意義下用較少的維數(shù)表示原數(shù)據(jù),具有簡(jiǎn)單、高效的特點(diǎn)。
獨(dú)立成分分析(Ind印endent Component Analysis, ICA)作為一種盲源分離技術(shù), 是基于信號(hào)的高階統(tǒng)計(jì)特性的分析方法。在ICA特征提取前先采用PCA進(jìn)行降維,可以有 效減少算法的運(yùn)行時(shí)間。由于采用了 ICA方法,它不但考慮了二階以上的統(tǒng)計(jì)特征,而且分 解得到的基向量在空間分布上更為局部化;而局部化特征對(duì)于針葉材樹(shù)種識(shí)別非常有利,
4因?yàn)橥粯?shù)種的管胞會(huì)受到樹(shù)齡、生長(zhǎng)環(huán)境等因素的影響,而局部特征可以降低這些影響。
下面詳細(xì)介紹本方法所采用的具體步驟
—、訓(xùn)練過(guò)程 1、材料準(zhǔn)備(樣本切片制作及計(jì)算機(jī)存儲(chǔ)) 木材切片的制作目前還沒(méi)有國(guó)家標(biāo)準(zhǔn)規(guī)定,但是在木材行業(yè)中有常規(guī)的做法,為 明確起見(jiàn),下面介紹本方法對(duì)木材切片的制作流程 1)取材將選定的木材切割成一塊小的長(zhǎng)方體試樣。 一般在樹(shù)干胸徑的邊材內(nèi)緣
處取材,不取近髓部,橫切面平整,至少有一個(gè)完整的年輪,年輪界限和長(zhǎng)邊平行。
2)軟化將試樣放入酒精和甘油的混合液中浸泡或加熱煮沸,直至軟化到能用刀
片切割。 3)切片切取的薄片厚度為10-200 ii m,切片的木材特征顯示清晰。
4)染色用蒸餾水清洗切片,加入蒸餾水,滴幾滴番紅溶液,放置2h以上。
5)做片 a)脫水與透明處理脫水采用酒精由低濃度至高濃度逐級(jí)浸泡方式,最后用無(wú)水
酒精浸泡至完全脫水,脫水后的切片進(jìn)行透明處理后放入二甲苯中保存; b)切片封固用中性樹(shù)脂膠將切片封固在玻片上,待樹(shù)脂膠干固后保存; 6)切片的計(jì)算機(jī)存儲(chǔ)(顯微攝像)用攝影顯微鏡對(duì)封固好的切片進(jìn)行顯微拍攝,
獲得木材顯微構(gòu)造的電子數(shù)碼圖像,保存于電腦文件中; 2、預(yù)處理 1)截取子區(qū)域 在給定針葉材橫切面顯微圖像的早晚材過(guò)渡部分宜選取一塊200X200(長(zhǎng)度和 寬度值為100-400)像素的區(qū)域。要求截取區(qū)域早材管胞占大部分(盡量不要靠近年輪線), 可含少量木射線,但不含斷裂、樹(shù)脂道。
2)灰度圖轉(zhuǎn)換 將上一步獲得的200X200像素子區(qū)域轉(zhuǎn)換為256級(jí)灰度圖像。切片顏色是為便
于觀察由切片制作時(shí)染色所致,并非木材本身的特征,它對(duì)樹(shù)種識(shí)別沒(méi)有意義。 3、PCA特征提取 對(duì)經(jīng)過(guò)預(yù)處理后樣本圖像采用PCA主成分分析方法進(jìn)行去二階相關(guān)和降維處理,
以降低參加后續(xù)ICA特征提取的向量的維數(shù),提高ICA特征獲取的效率。 設(shè)訓(xùn)練集共有m幅圖像,每個(gè)訓(xùn)練樣本Xi表示為lXn的行向量,記X二 [Xl,x2,-",
XJT G RmXn是由樣本向量組成的矩陣。作如下PCA操作C = PAPT,其中P = [Pl,P2,...,
pJ,P是特征向量陣,A是特征值對(duì)角陣。取前r個(gè)最大特征值,相應(yīng)的特征向量為= [Pl, p2, . . . , pr] G RmX、 一般我們?nèi) = m。令7 = P/X = [, y2 ,K , yra ] , Y是訓(xùn)練樣本集X在特征子空間^上的投影,稱Y 中的每一個(gè)元素(行向量)為"特征樹(shù)",或樣本的PCA特征。
4、 ICA特征提取
1)白化處理 為了提高ICA特征提取算法的效率,對(duì)輸入矩陣Y進(jìn)行白化處理。即對(duì)輸入數(shù)據(jù) Y進(jìn)行線性變換,使得變換后的數(shù)據(jù)Y',它的協(xié)方差矩陣是單位矩陣。采用協(xié)方差特征值分解,E(YY1) 二EDET,其中E是正交矩陣E(YY]的特征向量,D是它的特征值矩陣。白化處 理可通過(guò)式子Y' = ED—1/2EY實(shí)現(xiàn),其中,白化矩陣Wz定義為WZ = ED—1/2E。
2)計(jì)算分離矩陣 目前常用的ICA模型估計(jì)方法有信息最大化(Informax)法、互信息最小(負(fù)熵最 大化)法、極大似然估計(jì)法等。下面以Bell和Sejnowski提出的Informax算法為分離矩 陣W的求解方法作為說(shuō)明。 設(shè)X是n維隨機(jī)向量,定義分離矩陣W是nXn可逆矩陣,U = WX,且G = f(U) 是代表神經(jīng)元輸出的n維隨機(jī)向量,f = f》,其中f是可逆單調(diào)非線性的壓
縮函數(shù),它把實(shí)數(shù)映射到[O,l]之間。在Bell和Sejnowski提出的算法中,f為Sigmoid 函數(shù)fi(u) =l/(l+e—u)。算法通過(guò)將梯度上升準(zhǔn)則作用于G的熵值H(G)來(lái)改變分離 矩陣W,從而使向量x與G中的隨機(jī)向量因素g之間的互信息最大。矩陣改變規(guī)則如下 ^^^7『//((^^『=(/ + (7'^)『,其中,T表示矩陣轉(zhuǎn)置,I是單位矩陣,H(Y)是隨機(jī)向 量Y的熵,V^i/(y)是熵的梯度矩陣,該矩陣的第i行、第j列的元素是H(Y)關(guān)于W".的偏微 分。 3)構(gòu)造ICA獨(dú)立樹(shù)基圖像 將輸入數(shù)據(jù)經(jīng)過(guò)PCA處理得到的"特征樹(shù)"變換成一維行向量,并把所有的特征樹(shù) 逐行疊置構(gòu)成一個(gè)mXr的矩陣,記為Y。由上一步ICA模型的估計(jì)算法訓(xùn)練出W,再加上對(duì) 初始數(shù)據(jù)的白化變換,最后得到解混合矩陣W工=WZW。用W工對(duì)ICA輸入數(shù)據(jù)Y做線性變換 得到獨(dú)立樹(shù)基圖像U:U二 WJ。
4)重構(gòu)訓(xùn)練樣本集 將原樣本木材圖像在ICA特征子空間中重新表示由U = WJ,得7-^7W,又 因y =《X ,當(dāng)r不等于m時(shí),&不是方陣,從最小二乘意義上通過(guò)偽逆求X的估計(jì)f : & = [iffy = [if ]#^-1^/ = S[/ ,其中#是偽逆運(yùn)算,式中J5 = [if],,—1 。將i作為訓(xùn)練樣本集
的重構(gòu)樣本,用于樹(shù)種分類之中。
二、識(shí)別過(guò)程 1、材料準(zhǔn)備(待識(shí)別樣本切片制作及計(jì)算機(jī)存儲(chǔ)) 與訓(xùn)練中樣本切片材料準(zhǔn)備相同方法將待識(shí)別樣本材料的針葉樹(shù)種木材切片、封
固、顯微拍攝、制作電子數(shù)碼圖像和計(jì)算機(jī)存儲(chǔ)。 2、預(yù)處理 給定待識(shí)別針葉材橫切面顯微圖像,在其早晚材過(guò)渡部分也宜截取200X200像 素的子區(qū)域,選取部位的標(biāo)準(zhǔn)與訓(xùn)練樣本切片相同。經(jīng)轉(zhuǎn)換成256級(jí)灰度圖像后保存。以 下操作均是利用該圖像進(jìn)行識(shí)別。
3、待識(shí)別樣本的投影及重構(gòu) 將待識(shí)別樣本的針葉材圖像表示成一維行向量xtest,首先將其在PCA特征空間中 投影得到rte": rtest = if xtest ,然后與混合矩陣作用&,, = C,『"獲得待識(shí)別木材的ICA特征向量。 4、分類 將訓(xùn)練木材樣本圖像的ICA系數(shù)向量作為木材圖像的特征向量,并采用向量余弦的最近鄰分類器進(jìn)行分類。由于經(jīng)ICA學(xué)習(xí)后,所提取的特征向量的長(zhǎng)度是不同的,采用余 弦作為度量值比歐氏距離能使ICA取得更好的分類效果。 設(shè)b^t為待識(shí)別的木材圖像的特征向量,bt一為參與訓(xùn)練的已知樹(shù)種類別的木材
圖像的特征向量,則btest與bt一之間的余弦為:C:^:d。btest將被歸類到與之距離
最小的bt一所在的針葉材樹(shù)種類別。
權(quán)利要求
一種基于木材顯微圖像的針葉材樹(shù)種自動(dòng)識(shí)別方法,分為訓(xùn)練和識(shí)別兩部分,其特征是按如下步驟進(jìn)行一.訓(xùn)練(1)基礎(chǔ)樣本材料的準(zhǔn)備收集針葉材樹(shù)種木材樣本,按常規(guī)方法制作切片,封固和微顯拍攝,獲取顯微構(gòu)造的電子數(shù)碼圖像,存儲(chǔ);(2)預(yù)處理在給定切片顯微圖像的早晚材過(guò)渡部分選取一塊w×h像素的子區(qū)域,w、h值為100-400,再進(jìn)行灰度轉(zhuǎn)換,將獲得的子區(qū)域轉(zhuǎn)換成256級(jí)灰度圖像;(3)PCA特征提取對(duì)預(yù)處理后基礎(chǔ)樣本圖像采用PCA主要成分分析法去二階相關(guān)和降維處理,降低參加后續(xù)ICA獨(dú)立成分分析中特征提取的向量維數(shù),提高ICA特征獲取的效率;(4)ICA特征提取先進(jìn)行白化處理,即對(duì)輸入數(shù)據(jù)Y進(jìn)行線性變換,使變換后的數(shù)據(jù)Y′的協(xié)方差矩陣是單位矩陣;后再計(jì)算分離矩陣,采用信息最大化法或互信息最小法或極大似然估算法計(jì)算ICA模型;再構(gòu)造ICA獨(dú)立樹(shù)基圖像,將由PCA處理得到的“特征樹(shù)”變換成一維行向量,并把所有的特征樹(shù)逐行疊置構(gòu)成一個(gè)矩陣,記為Y,將由計(jì)算分離矩陣的ICA模型計(jì)算法訓(xùn)練出的W,再加上初始數(shù)據(jù)的白化處理的線性變換,得到解混合矩陣,并作用于Y得到獨(dú)立樹(shù)基圖像;最后重構(gòu)基礎(chǔ)樣本材料集,將原樣本木材圖像在ICA特征子空間中重新表示;二.識(shí)別(1)待識(shí)別材料的準(zhǔn)備與步驟一訓(xùn)練(1)基礎(chǔ)樣本材料的準(zhǔn)備相同,將待識(shí)別材料的針葉樹(shù)種木材進(jìn)行切片、封固、顯微拍攝、制作電子數(shù)碼圖像和計(jì)算機(jī)存儲(chǔ);(2)預(yù)處理與步驟一訓(xùn)練(2)的預(yù)處理相同,將待識(shí)別材料顯微圖像選取w×h像素子區(qū)域,轉(zhuǎn)換成256級(jí)灰度圖像;(3)待識(shí)別圖像的投影和重構(gòu)將待識(shí)別材料顯微圖像表示成一維行向量,先將其在PCA特征空間中投影,再與混合矩陣作用,獲得待識(shí)別材料的ICA特征向量;(4)樹(shù)種的認(rèn)定將通過(guò)步驟一訓(xùn)練(1)基礎(chǔ)樣本材料的準(zhǔn)備和(2)預(yù)處理建立的基礎(chǔ)樣本圖像的ICA系數(shù)向量作為木材圖像的特征向量,采用向量余弦的最近鄰分類器進(jìn)行分類認(rèn)定,待識(shí)別材料特征向量與某一樣本的特征向量最鄰近的,則認(rèn)定該待識(shí)材料為與該樣本材料相同的針葉樹(shù)種。
全文摘要
一種基于木材顯微圖像的針葉材樹(shù)種自動(dòng)識(shí)別方法,屬顯微圖像的計(jì)算機(jī)識(shí)別技術(shù),分為訓(xùn)練和識(shí)別兩部分,訓(xùn)練的具體步驟有基礎(chǔ)樣本材料的準(zhǔn)備、預(yù)處理、PCA特征提取和ICA特征提??;識(shí)別的具體步驟有待識(shí)別材料的準(zhǔn)備、預(yù)處理、待識(shí)別圖像的投影和重構(gòu)、樹(shù)種的認(rèn)定。本方法能對(duì)已存儲(chǔ)的針葉材橫切面顯微圖像數(shù)據(jù)庫(kù)中數(shù)據(jù)進(jìn)行訓(xùn)練,并對(duì)待識(shí)別針葉材采用計(jì)算機(jī)相似度比對(duì)方法進(jìn)行樹(shù)種識(shí)別,具有不受鑒別者主觀影響、綜合能力和運(yùn)算效率高、速度快和正確率較高的優(yōu)點(diǎn)。
文檔編號(hào)G01N1/28GK101702196SQ200910153869
公開(kāi)日2010年5月5日 申請(qǐng)日期2009年11月16日 優(yōu)先權(quán)日2009年11月16日
發(fā)明者張廣群, 汪杭軍, 祁亨年 申請(qǐng)人:浙江林學(xué)院