專利名稱:圖形分類方法及其裝置、以及能用計(jì)算機(jī)讀出的存儲(chǔ)媒體的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及那種例如適用于找出缺陷,對(duì)在缺陷種類等的圖形(pattern)分類中所用的圖形詞典進(jìn)行優(yōu)化處理的圖形分類方法及其裝置,以及能用計(jì)算機(jī)讀出的存儲(chǔ)媒體。
背景技術(shù):
LCD的玻璃基片的檢查和半導(dǎo)體晶片的檢查,對(duì)玻璃基片進(jìn)行攝像,取得其圖像數(shù)據(jù),從該圖像數(shù)據(jù)中例如提取缺陷的面積、形狀、濃淡值等圖形特征量,對(duì)該被提取的圖形特征量利用以下圖形分類方法來(lái)進(jìn)行檢查。
對(duì)根據(jù)已知圖形特征量及其分類范疇信息而編輯的圖形詞典預(yù)先進(jìn)行登記。在此,如果圖形特征量是適用于上述玻璃基片檢查的,那么就是例如面積、形狀、濃淡度等。分類范疇信息例如是圖形缺陷種類、灰塵、斑痕、焦點(diǎn)模糊、聚焦偏差等。
若輸入圖形分類對(duì)象的圖形特征量(輸入圖形),則對(duì)該圖形特征量和上述圖形詞典進(jìn)行圖形匹配處理。作為分類結(jié)果,輸出分類范疇、相似度或距離的數(shù)值信息。對(duì)輸入圖形進(jìn)行分類,使其屬于這樣的分類范疇,即其具有作為分類結(jié)果的數(shù)值信息中最適當(dāng)?shù)闹?若是相似度,則為1,若是距離,則是接近0的值),并且把作為分類結(jié)果的數(shù)值信息與某閾值相比較,若為閾值以下(或以上),則加以確定。
作為數(shù)值信息使用的相似度和距離,利用單純相似度和復(fù)合相似度作為相似度尺度。利用歐幾里德距離和市街地距離、馬哈朗諾比斯(マハラノビス)距離等作為距離尺度。
作為相似度尺度的單純相似度,把預(yù)先登記的特征量向量g和新提取的特征量向量g’所形成的角度的余弦(Cosine)定義為評(píng)價(jià)尺度s。
S=(g,g’)/(‖g‖·‖g’‖) ……(1)式中,(,)表示內(nèi)積。相似度s僅依存于特征量向量方向(即角度),不取決于該向量的大小。而且,相似度尺寸作為向距離尺度s’的變換,也常進(jìn)行以下距離變換s’=1。0-單純相似度 ………(2)復(fù)合相似度是考慮了多個(gè)學(xué)習(xí)特征量向量的分布狀態(tài)的相似度值。利用登記特征量向量的固有值λj和固有向量uj,對(duì)新提取的特征量向量g的評(píng)價(jià)尺度s定義如下s=∑j=1,rλj(gtuj)2/(λ1‖g‖2)……(3)因此,與單純類似法相比,能期待提高分類精度。但需要大量學(xué)習(xí)數(shù)據(jù)。
作為距離尺度,最一般的距離尺度,即歐幾里德距離d根據(jù)登記特征量向量g和新提取的特征量向量g’定義如下。d=(g-g′)2---(4)]]>市街地距離,其別名也可稱為曼哈頓距離,根據(jù)登記特征量向量g和新提取的特征量向量g’定義如下。
d=|g-g’| ……(5)若按照市街地距離,則能進(jìn)行高速的距離計(jì)算。
馬哈拉諾比斯距離D2與復(fù)合相似度一樣,是考慮了登記特征量向量數(shù)據(jù)的分散的距離,是現(xiàn)在最適合于圖形分類的距離之一。該馬哈拉諾比斯距離D2可由下式表示。
D2=dtV-1d ……(6)在上式中,假定分類范疇數(shù)據(jù)xi(=xi0、xi1、xi2、……、xip、i是分類范圍,p是特征量次元數(shù))的共同方差。協(xié)方差矩陣V的逆矩陣為V-1;與分類范疇平均值xi的差矩陣為d(=xi-xi);其轉(zhuǎn)置矩陣為dt。
哈馬拉諾比斯距離D2是分類范疇數(shù)據(jù)的各數(shù)據(jù)方差規(guī)范化的距離。如果分類范疇數(shù)據(jù)間為不相關(guān),那么,該馬哈朗諾比斯距離與歐幾里德距離等效。并且,如果在上式(6)中把差矩陣d作業(yè)分類范疇平均值差,那么,馬哈朗諾比斯距離變成分類范疇間的馬哈朗諾比斯泛距離。
例如,具有某分類范疇C的分類特征量xc1、xc2,在這些分類特征量xc1、xc2之間有正的相關(guān)的情況下,描繪出
圖1所示的等概率橢園。在圖1中某特征量數(shù)據(jù)A和B,其布置的位置離開分類范疇平均值G在歐幾里德距離尺度上距離相等。然而馬哈朗諾比斯距離D2在圖1所示的等概率橢園的軌跡上相等。特征量數(shù)據(jù)A和B不在同一等概率橢園軌跡上,特征量數(shù)據(jù)A的馬哈朗諾比斯距離接近分類范疇平均值G,所以,特征量數(shù)據(jù)A比特征量數(shù)據(jù)B更接近分類范疇平均值G。
即使在以上各種尺度中,也可把馬哈朗諾比斯距離稱為現(xiàn)在最適合圖形分類的距離尺度。并且,雖然馬哈朗諾比斯距離需要確保運(yùn)算處理量多,登記/學(xué)習(xí)的量大等,但隨著最近CPU的高速化,馬哈朗諾比斯距離在許多圖形分類裝置中的應(yīng)用日益增多。
作為分類結(jié)果的馬哈朗諾比斯距離等數(shù)值信息,其獲得的方法是對(duì)預(yù)先編輯的圖形詞典和輸入圖形進(jìn)行圖形匹配處理。在該圖形匹配處理中所使用的圖形詞典,尤其是馬哈朗諾比斯距離計(jì)算用圖形詞典如上述式(6)所示,具有分類范疇數(shù)據(jù)的共同方差·協(xié)方差矩陣V的逆矩陣V-1和分類范疇平均值xi作為構(gòu)成要素。這些構(gòu)成要素從預(yù)先登記在圖形詞典中的許多已知圖形特征量及其分類范疇信息中求出。
為了編制馬哈朗諾比斯距離計(jì)算用圖形詞典(逆矩陣V-1和分類范疇平均值xi),可單純使用登記圖形特征量及其分類范疇信息,或者,根據(jù)經(jīng)驗(yàn)利用試行錯(cuò)誤來(lái)選擇制作那種被認(rèn)為適合圖形分類的一部分圖形特征量。
例如,若利用所有的登記圖形特征量來(lái)編制馬哈朗諾比斯距離計(jì)算用圖形詞典,則經(jīng)常出現(xiàn)某一部分圖形特征量產(chǎn)生不良影響,造成圖形分類精度(圖形分類率)降低。
并且,可以從對(duì)登記圖形特征量進(jìn)行主成分分析而求得的、有用性強(qiáng)的圖形特征量中優(yōu)先利用對(duì)圖形分類率產(chǎn)生不良影響的圖形特征量,編制馬哈朗諾比斯距離計(jì)算用圖形詞典。但是,用主成分分析求得的有用性只不過(guò)表示有效地表現(xiàn)該圖形的圖形特征量,所以,與圖形分類率沒(méi)有直接關(guān)系。也就是說(shuō),即使有選擇地使用有用性強(qiáng)的圖形特征量,也不一定能提高圖形分類率。
作為影響馬哈朗諾比斯距離計(jì)算的主要原因,可以考慮登記圖形特征量的分布不是正規(guī)分布的情況,使登記圖形特征量的分布近似于一個(gè)或者多個(gè)正規(guī)分布,計(jì)算出對(duì)一個(gè)或者多個(gè)正規(guī)分布的馬哈朗諾比斯距離。但是,通常很難決定對(duì)作為多次元數(shù)據(jù)的圖形特征量分布進(jìn)行近似的多個(gè)正規(guī)分布。
發(fā)明的公開本發(fā)明的目的在于提供一種圖形分類方法及其裝置、存儲(chǔ)媒體,它對(duì)適合于圖形分類處理的馬哈朗諾比斯距離計(jì)算用圖形特征量進(jìn)行最佳搜索,對(duì)用于馬哈朗諾比斯距離計(jì)算的圖形特征量進(jìn)行加權(quán)的圖形特征量加權(quán)矩陣進(jìn)行搜索處理。
涉及本發(fā)明的圖形分類方法,其特征在于具有以下程序步從圖形分類對(duì)象中提取圖形特征量,把與上述圖形特征量相對(duì)應(yīng)的分類范疇信息登記/設(shè)定在圖形詞典中,根據(jù)上述圖形特征量和上述圖形詞典中所登記的馬哈朗諾比斯距離詞典,進(jìn)行圖形分類,根據(jù)上述圖形詞典中所存放的上述圖形分類范疇名稱和上述圖形特征量,進(jìn)行上述圖形詞典的優(yōu)化處理,編制上述馬哈朗諾比斯詞典。
涉及本發(fā)明的圖形分類裝置,其特征在于具有圖形詞典,用于存放從圖形分類對(duì)象中提取的圖形特征量,以及與該圖形特征量相對(duì)應(yīng)的分類范疇信息;分類裝置,用于根據(jù)上述圖形特征量以及上述圖形詞典中所登記的馬哈朗諾比斯詞典進(jìn)行圖形分類;以及圖形詞典優(yōu)化裝置,用于根據(jù)上述圖形詞典內(nèi)所存放的上述分類范疇名稱和上述圖形特征量而進(jìn)行優(yōu)化處理,編制馬哈朗諾比斯詞典。
涉及本發(fā)明的另一圖形分類裝置,其特征在于具有圖形獲取裝置,用于獲取圖形分類對(duì)象;圖形區(qū)域分出裝置,用于從上述圖形獲取裝置中送來(lái)的圖形分類對(duì)象中切出特定圖形區(qū)域;分類特征量提取裝置,用于從上述圖形區(qū)域分出裝置中送來(lái)的上述特定圖形區(qū)域中計(jì)算出對(duì)圖形分類有用的圖形特征量;詞典登記裝置,它把由上述分類特征量提取裝置計(jì)算出的上述圖形特征量以及與該圖形特征量相對(duì)應(yīng)的分類范疇信息登記/設(shè)定到圖形詞典內(nèi);特征量分類裝置,用于根據(jù)由上述分類特征量提取裝置計(jì)算出的上述圖形特征量以及在上述圖形詞典中登記的馬哈朗諾比斯詞典,進(jìn)行圖形分類;以及圖形詞典優(yōu)化裝置,用于根據(jù)上述圖形詞典內(nèi)所存放的上述分類范疇名稱以及上述圖形特征量,進(jìn)行優(yōu)化處理,編制上述馬哈朗諾比斯詞典。
涉及本發(fā)明的存儲(chǔ)媒體是能用計(jì)算機(jī)讀出的存儲(chǔ)媒體,其特征在于其中存儲(chǔ)了圖形分類方法的程序,用于把從圖形分類對(duì)象中提取的圖形特征量以及與該圖形特征量相對(duì)應(yīng)的分類范疇信息登記/設(shè)定到圖形詞典內(nèi),根據(jù)該圖形詞典內(nèi)所存放的上述分類范疇名稱和上述圖形特征量,進(jìn)行優(yōu)化處理,編制馬哈朗諾比斯詞典,根據(jù)該優(yōu)化后的上述圖形特征量以及上述圖形詞典內(nèi)所登記的上述馬哈朗諾比斯詞典,進(jìn)行圖形分類。
附圖的簡(jiǎn)要說(shuō)明圖1是用于說(shuō)明馬哈朗諾比斯距離的圖。
圖2是表示涉及本發(fā)明的圖形分類裝置的第1實(shí)施例的結(jié)構(gòu)框圖。
圖3是表示涉及本發(fā)明的圖形分類裝置的第1實(shí)施例的圖形詞典的數(shù)據(jù)結(jié)構(gòu)的模式圖。
圖4是表示涉及本發(fā)明的圖形分類裝置的第1實(shí)施例的優(yōu)化候選表的模式圖。
圖5是表示涉及本發(fā)明的圖形分類裝置的第1實(shí)施例的利用特征量加權(quán)矩陣的圖。
圖6是表示涉及本發(fā)明的圖形分類裝置的第1實(shí)施例的的圖形詞典優(yōu)化處理的流程圖。
圖7是表示涉及本發(fā)明的圖形分類裝置的第1實(shí)施例的馬哈朗諾比斯詞典優(yōu)化候選表初始化方法流程圖。
圖8是表示涉及本發(fā)明的圖形分類裝置的第1實(shí)施例的優(yōu)化候選表選擇和利用特征加權(quán)矩陣更改方法的流程圖。
圖9是表示涉及本發(fā)明的圖形分類裝置的第1實(shí)施例的優(yōu)化候選表更新方法的流程圖。
圖10是表示涉及本發(fā)明的圖形分類裝置的第2實(shí)施例中的方框結(jié)構(gòu)圖。
圖11是表示涉及本發(fā)明的圖形分類裝置的第2實(shí)施例中的馬哈朗諾比斯詞典中的優(yōu)化候選表的模式圖。
圖12是表示涉及本發(fā)明的圖形分類裝置的第2實(shí)施例中的利用特征量信息的模式圖。
圖13是表示涉及本發(fā)明的圖形分類裝置的第2實(shí)施例中的圖形詞典優(yōu)化處理的流程圖。
圖14是表示涉及本發(fā)明的圖形分類裝置的第2實(shí)施例中的優(yōu)化候選表的初始化方法及其選擇/更新方法的流程圖。
圖15是表示涉及本發(fā)明的圖形分類裝置的第2實(shí)施例中的優(yōu)化候選表的初始化方法及其選擇/更新方法變形例的流程圖。
圖16是表示涉及本發(fā)明的圖形分類裝置的第2實(shí)施例中的優(yōu)化候選表的初始化方法變形例的流程圖。
最佳實(shí)施例以下參照附圖,詳細(xì)說(shuō)明本發(fā)明第1實(shí)施例。
圖2是圖形分類裝置的方框結(jié)構(gòu)圖。當(dāng)圖形獲取裝置1適用于作為圖形分類對(duì)象的輸入圖形2,例如LCD的玻璃基片的檢查,把對(duì)玻璃基片進(jìn)行攝像而獲得的圖像數(shù)據(jù)作為輸入圖形2獲取。而且,如果圖形不僅是涉及缺陷提取的缺陷的形狀等,而且是顏色等作為數(shù)據(jù)能夠圖形化,那么無(wú)論是怎么樣的均可。
圖形區(qū)域分出裝置3從圖形獲取裝置1送來(lái)的輸入圖形2中把作為目標(biāo)的特定圖形區(qū)域分出來(lái)(提取)。圖形區(qū)域分出裝置3例如進(jìn)行各種濾波處理或2進(jìn)制處理中的至少一種處理,從輸入圖形2中提取特定的圖形區(qū)域,把該特定圖形區(qū)域獲取到分類特征量提取裝置4內(nèi)。
分類特征量提取裝置4從圖形區(qū)域分出裝置3送出來(lái)的特定圖形區(qū)域中計(jì)算出對(duì)圖形分類有用的圖形特征量,例如,如上所述如果是適用于玻璃基片檢查的,則計(jì)算出玻璃基片上的缺陷的面積、形狀、濃淡值等。分類特征量提取裝置4把計(jì)算出的圖形特征量分別獲取到詞典登記裝置5和特征量分類裝置17內(nèi)。
詞典登記裝置5把由分類特征量提取裝置4計(jì)算出的圖形特征量以及與該圖形特征量相對(duì)應(yīng)的分類范疇信息,例如圖形缺陷種類、灰塵、斑痕、焦點(diǎn)模糊、聚焦偏移等登記/設(shè)定到圖形詞典6內(nèi)。
在圖形詞典6內(nèi)如圖3的數(shù)據(jù)結(jié)構(gòu)模式圖所示,存放了多個(gè)登記圖形7(M=1、2、3、……)和馬哈朗諾比斯詞典8。各登記圖形7分別存放分類范疇名稱9和圖形特征量10。具有同一分類范疇名稱9的登記圖形7登記1個(gè)或多個(gè)。
馬哈朗諾比斯詞典8當(dāng)把分類范疇名稱9的數(shù)設(shè)定為C,把圖形特征量10的種類數(shù)設(shè)定為N時(shí),具有作為C×N的矩陣的平均值矩陣(d)11、作為N×N的矩陣的共同方差·協(xié)方差矩陣的逆矩陣(V-1)12、以及優(yōu)化候選表13。優(yōu)化候選表13如圖4所示,其要素有形成N×N的對(duì)角矩陣的多個(gè)利用特征量加權(quán)矩陣(1~K)14(參見(jiàn)圖5)、多個(gè)預(yù)測(cè)分類率(1~K)15、以及多個(gè)平均分類距離(1~K)16。在此,利用特征量加權(quán)矩陣(1~K)14是下述(7)式中的A,相當(dāng)于V-1的校正矩陣。并且,預(yù)測(cè)分類率(1~K)15是當(dāng)把圖形詞典中所登記的圖形作為未知圖形時(shí)的分類率。平均分類距離(1~K)16是在求出預(yù)測(cè)分類率時(shí)計(jì)算出的馬哈朗諾比斯距離的平均值。
特征分類裝置17根據(jù)由分類特征量提取裝置4計(jì)算的圖形特征量和圖形詞典6中所登記的馬哈朗諾比斯詞典8,進(jìn)行圖形分類。也就是說(shuō),特征量分類裝置17對(duì)馬哈朗諾比斯距離D2進(jìn)行運(yùn)算,得出其分類結(jié)果18。在此馬哈朗諾比斯距離D2用下式(7)進(jìn)行計(jì)算。
D2=dtAV-1Ad ……(7)而且,A是利用特征量加權(quán)矩陣14,對(duì)角要素以外是0的對(duì)角矩陣。
圖形詞典優(yōu)化裝置19存儲(chǔ)一種程序,該程序用于執(zhí)行圖6所示的圖形詞典優(yōu)化處理流程圖中所示的處理。并且,圖形詞典優(yōu)化裝置19通過(guò)執(zhí)行已存儲(chǔ)的程序而根據(jù)圖形詞典6內(nèi)所存放的分類范疇名稱9和圖形特征量10來(lái)進(jìn)行優(yōu)化處理,編制馬哈朗諾比斯詞典8。而且,進(jìn)行圖形詞典優(yōu)化處理所用的程序存儲(chǔ)在例如未示出的硬磁盤、軟磁盤或CD-ROM等中。
根據(jù)圖6所示的圖形詞典優(yōu)化處理流程圖,說(shuō)明圖形詞典優(yōu)化裝置19的具體動(dòng)作。
首先,圖形詞典優(yōu)化裝置19在#1步進(jìn)行登記圖形7的數(shù)M、分類范疇名稱9的數(shù),這些每個(gè)分類范疇名稱9的登記圖形數(shù)、優(yōu)化反復(fù)結(jié)束信息的取得/設(shè)定。
其次,圖形詞典優(yōu)化裝置19在#2步,編制一種利用除各登記圖形7外的全圖形特征量10的馬哈朗諾比斯詞典8中的平均值矩陣(d)11、共同方差·協(xié)方差矩陣的逆陣列(V-1)12,同時(shí)進(jìn)行馬哈朗諾比斯詞典8中的優(yōu)化候選表13的初始化。
具體來(lái)說(shuō),圖形詞典優(yōu)化裝置19根據(jù)圖7所示的馬哈朗諾比斯詞典(優(yōu)化候選表13)的初始化方法的流程圖,進(jìn)行優(yōu)化候選表13的初始化。具體內(nèi)容如下。
首先,圖形詞典優(yōu)化裝置19在#20步,對(duì)把‘1’設(shè)定在全特征量對(duì)角要素內(nèi)的利用特征量加權(quán)矩陣14進(jìn)行設(shè)定。
其次,圖形詞典優(yōu)化裝置19在#21步選擇登記(m)7。圖形詞典優(yōu)化裝置19在#22步判斷已選擇登記圖形(m)7的每個(gè)分類范疇的登記圖形7的數(shù)是否是2以上。
該判斷結(jié)果,如果登記圖形7的數(shù)為2以上,那么,圖形詞典優(yōu)化裝置19進(jìn)入#23步,選擇把登記圖形(m)7除外而編制的馬哈朗諾比斯詞典(平均值矩陣(d)11、共同方差·協(xié)方差矩陣的逆矩陣(V-1))12。
然后,圖形詞典優(yōu)化裝置19在#24步對(duì)登記圖形(n)7進(jìn)行圖形分類處理。圖形詞典優(yōu)化裝置19在#25步對(duì)分類結(jié)果進(jìn)行檢查,在#26步判斷關(guān)于全登記圖形7(M=1、2、3……)的分類處理是否已結(jié)束。
并且,如果關(guān)于全登記圖形7(M=1、2、3……)的分類處理已結(jié)束,那么,圖形詞典優(yōu)化裝置19在#27步把預(yù)測(cè)分類率15和平均分類距離16設(shè)定到優(yōu)化候選表13內(nèi)向上填滿。
然后,圖形詞典優(yōu)化裝置19在#28步設(shè)定n=0(僅在環(huán)的最初設(shè)定為起始值)、n=n+1。圖形詞典優(yōu)化裝置19在#29步對(duì)全特征量縱向進(jìn)行主成分分析,把從第1主成分的有用性最小起第n個(gè)特征量的對(duì)角要素設(shè)定為“0”,把其他特征量的對(duì)角要素設(shè)定為“1”,這樣的利用特征量加權(quán)矩陣14設(shè)定在優(yōu)化候選表13內(nèi)向上填滿。
然后,圖形詞典優(yōu)化裝置19在#30步在對(duì)優(yōu)化候選表13要素的設(shè)定全部結(jié)束之前反復(fù)進(jìn)行上述#21-#27步的處理。
并且,圖形詞典優(yōu)化裝置19在#31步判斷對(duì)優(yōu)化候選表13要素的設(shè)定全部結(jié)束時(shí),則轉(zhuǎn)移到下一步#32,利用預(yù)測(cè)分類率15來(lái)對(duì)優(yōu)化候選表13進(jìn)行分類。通過(guò)上述處理,馬哈朗諾比斯詞典優(yōu)化結(jié)束。
然后,圖形詞典優(yōu)化裝置19在圖6所示的#3步進(jìn)行在優(yōu)化中所使用的優(yōu)化表13的選擇和利用特征量加權(quán)矩陣14的更改。具體來(lái)說(shuō),優(yōu)化表13的要素選擇和利用特征量加權(quán)矩陣14的更改按以下方法。
圖形詞典優(yōu)化裝置19根據(jù)圖8所示的優(yōu)化候選表要素選擇和利用特征量加權(quán)矩陣更改方法的流程圖,進(jìn)行優(yōu)化候選表13的要素選擇和利用特征量加權(quán)矩陣14的更改。
首先,圖形詞典優(yōu)化裝置19在#40步利用偽隨機(jī)數(shù)來(lái)選擇優(yōu)化候選表13的要素,即利用特征量加權(quán)矩陣(1~K)14、多個(gè)預(yù)測(cè)分類率(1~K)15和多個(gè)平均分類距離(1~K)16。
然后,圖形詞典優(yōu)化裝置19在#41步利用新的偽隨機(jī)數(shù)來(lái)對(duì)利用特征量加權(quán)矩陣14的對(duì)角要素位置的值加上小的偽隨機(jī)數(shù)。
然后,圖形詞典優(yōu)化裝置19在#42步,如果利用特征量加權(quán)矩陣(1~K)14的對(duì)角要素位置的值集中在0-1的范圍內(nèi),那么使其與接近“0”或“1”的一方相一致。這樣利用特征量加權(quán)矩陣14被更改。
然后,圖形詞典優(yōu)化裝 19在圖6所示的#4步中選擇登記圖形(m)7,在下一步#5判斷已選擇的圖形(m)7的每個(gè)分類范疇的登記圖形7的數(shù)是否為2以上。
在#5步,如果登記圖形7的數(shù)為2以上,則圖形詞典優(yōu)化裝置19轉(zhuǎn)移到#6步,選擇那種把登記圖形(m)7除去而編制的馬哈朗諾比斯詞典(平均值陣列(d)11、共同方差·協(xié)方差矩陣的逆陣列(V-1))12。
然后,圖形詞典優(yōu)化裝置19在#7步對(duì)登記圖形(m)7進(jìn)行圖形分類處理,即利用上述式(7)進(jìn)行計(jì)算求出馬哈朗諾比斯距離D2。
然后,圖形詞典優(yōu)化裝置19在#8步對(duì)分類結(jié)果進(jìn)行合計(jì)。
并且,圖形詞典優(yōu)化裝置19在#9步判斷全登記圖形7(M=1、2、3……)是否結(jié)束。
該判斷結(jié)果如果是全登記圖形7(M=1、2、3……)結(jié)束,那么,圖形詞典優(yōu)化裝置19轉(zhuǎn)移到#10步,根據(jù)分類結(jié)果對(duì)優(yōu)化候選表13進(jìn)行更新。優(yōu)化候選表13的具體的更新方法如下。
圖形詞典優(yōu)化裝置19根據(jù)圖9所示的優(yōu)化候選表更新方法流程圖,對(duì)優(yōu)化候選表13進(jìn)行更新。
首先,圖形詞典優(yōu)化裝置19在#51步判斷在優(yōu)化候選表13內(nèi)是否已有相同的利用特征量加權(quán)矩陣14。
該判斷結(jié)果如果是已有相同的利用特征量加權(quán)矩陣14,那么,圖形詞典優(yōu)化裝置19在#52步計(jì)算出作為分類結(jié)果的預(yù)測(cè)分類率r。
然后,圖形詞典優(yōu)化裝置19在#53依次對(duì)優(yōu)化候選表13內(nèi)的預(yù)測(cè)分類率Rk(k為優(yōu)化候選表要素)15和上述預(yù)測(cè)分類率r進(jìn)行比較,在下一步#54判斷預(yù)測(cè)分類率Rk是否大于預(yù)測(cè)分類率r(Rk>r)。
該判斷結(jié)果如果是預(yù)測(cè)分類率Rk大于預(yù)測(cè)分類率r,那么,圖形詞典優(yōu)化裝置19在#55步把得到了預(yù)測(cè)分類率r的候選插入到優(yōu)化候選表要素k位置上。
然后,圖形詞典優(yōu)化裝置19在#56步把超過(guò)優(yōu)化候選表要素?cái)?shù)的候選例如從下位候選中消除。
然后,圖形詞典優(yōu)化裝置19在圖6所示的#11步中,根據(jù)優(yōu)化反復(fù)結(jié)束信息,判斷優(yōu)化反復(fù)是否結(jié)束。并且,如果優(yōu)化反復(fù)未結(jié)束,那么再次返回到#3步,如果優(yōu)化反復(fù)已結(jié)束,則轉(zhuǎn)移到#12步,選擇優(yōu)化候選表13中的預(yù)測(cè)分類率15的最大而且平均分類距離16的最小的利用特征量加權(quán)矩陣14作為最佳結(jié)果。
特征量分類裝置17根據(jù)分類特征量提取裝置4所計(jì)算出的圖形特征量以及圖形詞典6內(nèi)所登記的馬哈朗諾比斯詞典8,進(jìn)行圖形分類,即對(duì)式(7)所示的馬哈朗諾比斯距離D2進(jìn)行運(yùn)算,得出特征量的分類結(jié)果18。
在第1實(shí)施例中,具有一種圖形詞典優(yōu)化裝置19,用于根據(jù)圖形詞典6內(nèi)所存放的分類范疇名稱9和圖形特征量10,進(jìn)行優(yōu)化處理,編制馬哈朗諾比斯詞典8。所以,以圖形詞典6內(nèi)的各登記圖形7為對(duì)象,若把哪一種圖形特征量10用于編制馬哈朗諾比斯詞典8,則能進(jìn)行優(yōu)化搜索,確定是否能有效地作用于圖形分類率。并且,作為優(yōu)化搜索結(jié)果的精度,能確保圖形分類精度,使其超過(guò)至少利用全圖形特征量10而編制的馬哈朗諾比斯詞典8、以及優(yōu)先利用通過(guò)主成分分析等進(jìn)行預(yù)測(cè)的有效特征量而編制的馬哈朗諾比斯詞典8中的圖形分類精度。并且,當(dāng)假定圖形詞典6內(nèi)的登記圖形7的一部分被作為未知圖形而輸入時(shí),作為被輸出的分類結(jié)果,能保證該圖形分類精度約為預(yù)測(cè)分類率15左右。
圖10是涉及本發(fā)明第2實(shí)施例的圖形分類裝置的方框結(jié)構(gòu)圖。而且,在圖10中,對(duì)于和圖2相同的部分,標(biāo)注相同的符號(hào),其詳細(xì)結(jié)構(gòu)說(shuō)明從略。圖形詞典20如圖3的數(shù)據(jù)結(jié)構(gòu)模式圖所示具有多個(gè)登記圖形7(M=1、2、3……)、以及馬哈朗諾比斯詞典8。在本第2實(shí)施例中,馬哈朗諾比斯詞典8中的優(yōu)化候選表21如圖11所示,作為一次元信息把多個(gè)利用特征量信息22、多個(gè)預(yù)測(cè)分類率(1-K)15和多個(gè)平均分類距離(1-K)16作為要素。
利用特征量信息22的構(gòu)成要素值如圖12所示是0或1的正整數(shù),各構(gòu)成要素的值表示與該構(gòu)成要素相對(duì)應(yīng)的圖形特征量種類是否被利用于編制馬哈朗諾比斯詞典8。例如,構(gòu)成要素的值若為“0”,則表示圖形特征量種類未被利用于編制馬哈朗諾比斯詞典8;若為“1”,則表示圖形特征量種類被利用于編制馬哈朗諾比斯詞典8。
圖形詞典優(yōu)化裝置23利用圖形詞典6內(nèi)的登記圖形7的圖形特征量10及其分類范疇名稱9,進(jìn)行利用特征量信息的搜索處理,以便表示圖形特征量10是否被利用于計(jì)算馬哈朗諾比斯距離D2。
圖形詞典優(yōu)化裝置23利用圖形詞典6內(nèi)的登記圖形7的圖形特征量10及其分類范疇名稱9,進(jìn)行利用特征量信息的搜索處理,(該信息表示圖形特征量10是否被利用于計(jì)算馬哈朗諾比斯距離D2),編制馬哈朗諾比斯詞典8。
以下根據(jù)圖13所示的圖形詞典優(yōu)化裝置的流程圖,具體地說(shuō)明圖形詞典優(yōu)化裝置23的動(dòng)作。
首先,圖形詞典優(yōu)化裝置23在#60步進(jìn)行登記圖形7的數(shù)M、分類范疇名稱9的數(shù)、這些每個(gè)分類范疇名稱9的登記圖形數(shù)、優(yōu)化反復(fù)結(jié)束信息、在優(yōu)化中使用的圖形特征量10的種類的取得/設(shè)定。
然后,圖形詞典優(yōu)化裝置23在#61步進(jìn)行在優(yōu)化中使用的優(yōu)化候選表21的初始化、或者優(yōu)化候選表21的選擇和利用特征量信息22的更改。具體的優(yōu)化候選表21的初始化(#81步)或者優(yōu)化候選表21(#82步)的選擇和利用特征量信息22的更改(#81步和#82步)如下。
圖形詞典優(yōu)化裝置23根據(jù)圖14所示的優(yōu)化候選表21的初始化方法和該優(yōu)化候選表21的選擇/更新方法的流程圖,進(jìn)行在優(yōu)化中使用的優(yōu)化候選表21的初始化、或者優(yōu)化候選表21的選擇和利用特征量信息22的更改。
首先,圖形詞典優(yōu)化裝置23在#80步判斷是搜索的前半部分還是后半部分,如果是搜索的前半部分,那么就轉(zhuǎn)移到#81步,進(jìn)行隨機(jī)多起始搜索。在該隨機(jī)多起始搜索中,利用偽隨機(jī)數(shù)把指定個(gè)數(shù)的“1”設(shè)定到利用特征量信息22的要素內(nèi)。在該隨機(jī)多起始搜索中,對(duì)利用特征量信息22的數(shù)加以固定。
如果是搜索的后半部分,那么圖形詞典優(yōu)化裝置23就轉(zhuǎn)移到#82步,進(jìn)行局部搜索。在該局部搜索中,在#83步,利用偽隨機(jī)數(shù)來(lái)選擇優(yōu)化候選表21,在下一步#84中,進(jìn)行隨機(jī)選擇。
在該隨機(jī)選擇的一方,在#85步利用新的偽隨機(jī)數(shù)來(lái)選擇優(yōu)化候選表21,在下一步#86中,進(jìn)行利用特征量信息要素的部分更換或置換處理。
在隨機(jī)選擇的另一方,在#87步利用新的偽隨機(jī)數(shù)來(lái)更換利用特征量信息要素的“0”或“1”值。
也就是說(shuō),在搜索的后半部分的局部搜索中,對(duì)于隨機(jī)選擇的利用特征量信息22與其他隨機(jī)選擇的非利用特征量的置換,或者隨機(jī)選擇的特征量的利用的有無(wú),按一定概率進(jìn)行實(shí)施運(yùn)用,同時(shí),對(duì)圖形分類率進(jìn)行評(píng)價(jià),選擇出獲得良好圖形分類率的組合。
在上述#85-86步在不同的表要素之間進(jìn)行更換/置換處理,在#87步在由#83步選擇的同一表要素內(nèi)進(jìn)行更換處理。
按照以上那樣,進(jìn)行獲得良好圖形率的詞典優(yōu)化處理。
然后,圖形詞典優(yōu)化裝置23在圖13所示的#62步選擇登記圖形(m)7,在下一步#63判斷已選擇的登記圖形(m)7的每個(gè)分類范疇的登記圖形7的數(shù)是否為2以上。
在#63步,如果登記圖形7的數(shù)為2以上,那么,圖形詞典優(yōu)化裝置23就轉(zhuǎn)移到#64步,把登記圖形(m)7從馬哈朗諾比斯詞典12的編制對(duì)象中除掉。
然后,圖形詞典優(yōu)化裝置23在#65步僅利用已選擇的圖形特征量10來(lái)編制馬哈朗諾比斯詞典(平均值矩陣d、共同方差·協(xié)方差矩陣的逆矩陣V-1)8。
然后,圖形詞典優(yōu)化裝置23在#66步對(duì)登記圖形(m)7進(jìn)行圖形分類處理。也就是說(shuō),圖形詞典優(yōu)化裝置23利用式(7)計(jì)算求出馬哈朗諾比斯距離D2。
然后,圖形詞典優(yōu)化裝置23在#67步對(duì)分類結(jié)果進(jìn)行合計(jì)。
并且,圖形詞典優(yōu)化裝置23在#68步判斷全登記圖形7(M=1、2、3……)是否已結(jié)束。
該判斷結(jié)果如果是全登記圖形7(M=1、2、3……)尚未結(jié)束,那么圖形詞典優(yōu)化裝置23返回到#62步。
如果全登記圖形7(M=1、2、3……)已結(jié)束,那么圖形詞典優(yōu)化裝置23轉(zhuǎn)移到#69步,根據(jù)分類結(jié)果來(lái)對(duì)優(yōu)化候選表21進(jìn)行更新。
然后,圖形詞典優(yōu)化裝置23在#70步根據(jù)優(yōu)化反復(fù)結(jié)束信息,判斷優(yōu)化反復(fù)是否結(jié)束。如果優(yōu)化反復(fù)尚未結(jié)束,那么再次返回到#61步;如果已經(jīng)結(jié)束,那么就轉(zhuǎn)移到#71步,根據(jù)優(yōu)化候選表21中的預(yù)測(cè)分類率15的最大,而且平均分類距離16的最小的利用特征量信息22,編制馬哈朗諾比斯詞典(平均值矩陣d、共同方差·協(xié)方差矩陣的逆矩陣V-1)8。
特征量分類裝置17根據(jù)由分類特征量提取裝置4計(jì)算出的圖形特征量和圖形詞典6中所登記的馬哈朗諾比斯詞典8,對(duì)圖形分類,即式(7)所示的馬哈朗諾比斯距離D2進(jìn)行運(yùn)算,獲得特征量分類結(jié)果18。
在本第2實(shí)施例中利用圖形詞典6內(nèi)的登記圖形7的圖形特征量10及其分類范疇名稱9,進(jìn)行利用特征量信息的搜索處理,以便表示是否利用馬哈朗諾比斯距離D2計(jì)算中所用的圖形特征量10。例如,作為圖形特征量加權(quán)矩陣的對(duì)角要素限定于取“0”或“1”的整數(shù),作為圖形特征量加權(quán)信息設(shè)置了作為1次元信息的圖形詞典優(yōu)化裝置23。所以,能發(fā)揮與上述第1實(shí)施例相同的效果,同時(shí)作為馬哈朗諾比斯詞典8能僅限定于圖形分類特征量,其中利用必要的平均值矩陣(d)11以及共同方差·協(xié)方差矩陣的逆矩陣V-1的尺寸,能削減必要的存儲(chǔ)容量和運(yùn)算量。
而且,上述第2實(shí)施例也可以變形如下。
在圖15中圖形詞典優(yōu)化裝置23在#90步,對(duì)是否是搜索的初次前半部分或后半部分進(jìn)行判斷,若是初次,則轉(zhuǎn)移到#91步,判斷在前面是否進(jìn)行了優(yōu)化處理。
該判斷結(jié)果,如果是前面已進(jìn)行了優(yōu)化處理,那么圖形詞典優(yōu)化裝置23轉(zhuǎn)移到#92步,把優(yōu)化候選表21從以前已編制的優(yōu)化候選表21中復(fù)制下來(lái)。
如果以前沒(méi)有進(jìn)行優(yōu)化處理,那么,圖形詞典優(yōu)化裝置23轉(zhuǎn)移到#93步進(jìn)行上述隨機(jī)多起始搜索。
并且,圖形詞典優(yōu)化裝置23,如果上述#90步的判斷結(jié)果是搜索的前半部分,那么轉(zhuǎn)移到#93步,進(jìn)行隨機(jī)多起始搜索,如果是搜索的后半部分,那么轉(zhuǎn)移到#94步,進(jìn)行上述局部搜索。
在圖16中,圖形詞典優(yōu)化裝置23在#100步判斷是否為初次,若是初次,則轉(zhuǎn)移到#101步,進(jìn)行上述隨機(jī)多起始搜索。
然后,圖形詞典優(yōu)化裝置23在#102步僅利用已選擇的圖形特征量10,編制馬哈朗諾比斯詞典(平均值矩陣(d)11、共同方差·協(xié)方差矩陣的逆矩陣V-1)8。
然后,圖形詞典優(yōu)化裝置23在#103步選擇登記圖形(m)7。圖形詞典優(yōu)化裝置23在#104步對(duì)已選擇的登記圖形(m)7進(jìn)行圖形分類處理,即利用上述式(7),計(jì)算求出馬哈朗諾比斯距離D2。
然后,圖形詞典優(yōu)化裝置23在#105步對(duì)分類結(jié)果進(jìn)行合計(jì)。
并且,圖形詞典優(yōu)化裝置23在#106步判斷全登記圖形7(M=1、2、3……)是否結(jié)束。
該判斷結(jié)果,若是全登記圖形7(M=1、2、3……)結(jié)束,則圖形詞典優(yōu)化裝置23轉(zhuǎn)入#109步,根據(jù)分類結(jié)果進(jìn)行優(yōu)化候選表13的更新。
并且,若反復(fù)尚未結(jié)束,則圖形詞典優(yōu)化裝置23再次返回到#101步。
而且,圖15和圖16所示的優(yōu)化候選表21的初始化方法以及該優(yōu)化候選表21的選擇/更新方法的流程圖,也可以布置在上述圖7所示的馬哈朗諾比斯詞典8的優(yōu)化候選表的初始化處理后級(jí)來(lái)進(jìn)行。
作為局部搜索方法在預(yù)測(cè)分類率上位候選之間進(jìn)行GA(遺傳算法(=遺傳因子算法))中的遺傳因子交換處理,也就是說(shuō),也可以適當(dāng)更換作為對(duì)象的2組利用特征量間不同的特征量。另外,也可以和虛擬鍛練方法一樣,按一定概率允許圖形分類率降低的組合。這樣一來(lái),通過(guò)隨機(jī)選擇的特征量更換,很容易編制具有良好的圖形分類率的組合特征量的分類詞典。
若采用本發(fā)明,則能以圖形詞典內(nèi)的各登記圖形為對(duì)象,進(jìn)行優(yōu)化搜索,判斷在哪種圖形特征量用于編制馬哈朗諾比斯詞典時(shí)是否能有效地作用于圖形分類率,作為其優(yōu)化搜索結(jié)果,至少能確保圖形分類精度超過(guò)利用圖形特征量而編制的馬哈朗諾比斯詞典以及優(yōu)先利用以主成分分析等預(yù)測(cè)的有效特征量而編制的馬哈朗諾比斯詞典的圖形分類精度。
并且,當(dāng)假定圖形詞典內(nèi)的登記圖形的一部分被作為未知圖形而輸入時(shí),作為輸出的分類結(jié)果,能保證圖形分類精度為預(yù)測(cè)分類率程度。
對(duì)于應(yīng)作為馬哈朗諾比斯詞典編制的平均值矩陣(d)、以及共同方差·協(xié)方差矩陣的逆矩陣V-1的尺寸,僅限定于利用的圖形分類特征量的種類,能減少所需的存儲(chǔ)容量和運(yùn)算量。
本發(fā)明涉及對(duì)用于缺陷種類等圖形分類的圖形詞典進(jìn)行優(yōu)化的圖形分類方法及其裝置以及能用計(jì)算機(jī)讀出的存儲(chǔ)媒體。
權(quán)利要求
1.一種圖形分類方法,其特征在于,包括從圖形分類對(duì)象中提取圖形特征量,把與上述圖形特征量相對(duì)應(yīng)的分類范疇信息登記/設(shè)定在圖形詞典中的步驟;根據(jù)上述圖形特征量和上述圖形詞典中所登記的馬哈朗諾比斯詞典,進(jìn)行圖形分類的步驟,根據(jù)上述圖形詞典中所存放的上述圖形分類范疇名稱和上述圖形特征量,進(jìn)行上述圖形詞典的優(yōu)化處理,編制上述馬哈朗諾比斯詞典。
2.如權(quán)利要求1所述的圖形分類方法,其特征在于上述馬哈朗諾比斯詞典包括優(yōu)化候選表,其中以利用特征量加權(quán)矩陣和預(yù)測(cè)分類率或利用特征量信息和預(yù)測(cè)分類率為要素。
3.一種圖形分類裝置,其特征在于具有圖形詞典,用于存放從圖形分類對(duì)象中提取的圖形特征量,以及與該圖形特征量相對(duì)應(yīng)的分類范疇信息;分類裝置,用于根據(jù)上述圖形特征量以及上述圖形詞典中所登記的馬哈朗諾比斯詞典進(jìn)行圖形分類;以及圖形詞典優(yōu)化裝置,用于根據(jù)上述圖形詞典內(nèi)所存放的上述分類范疇名稱和上述圖形特征量進(jìn)行優(yōu)化處理,編制馬哈朗諾比斯詞典。
4.一種圖形分類裝置,其特征在于具有圖形獲取裝置,用于獲取圖形分類對(duì)象;圖形區(qū)域分出裝置,用于從上述圖形獲取裝置中送來(lái)的圖形分類對(duì)象中分出特定圖形區(qū)域;分類特征量提取裝置,用于從上述圖形區(qū)域分出裝置中送來(lái)的上述特定圖形區(qū)域中計(jì)算出對(duì)圖形分類有用的圖形特征量;詞典登記裝置,它把由上述分類特征量提取裝置計(jì)算出的上述圖形特征量以及與該圖形特征量相對(duì)應(yīng)的分類范疇信息登記/設(shè)定到圖形詞典內(nèi);特征量分類裝置,用于根據(jù)由上述分類特征量提取裝置計(jì)算出的上述圖形特征量以及在上述圖形詞典中登記的馬哈朗諾比斯詞典,進(jìn)行圖形分類;以及圖形詞典優(yōu)化裝置,用于根據(jù)上述圖形詞典內(nèi)所存放的上述分類范疇名稱以及上述圖形特征量,進(jìn)行優(yōu)化處理,編制上述馬哈朗諾比斯詞典。
5.權(quán)利要求4所述的圖形分類裝置,其特征在于上述圖形詞典優(yōu)化裝置具有一種進(jìn)行圖形特征量加權(quán)矩陣的搜索處理的功能,該圖形特征量加權(quán)矩陣?yán)蒙鲜鰣D形詞典內(nèi)的登記圖形的上述圖形特征量和上述分類范疇名稱,對(duì)上述馬哈朗諾比斯距離計(jì)算所用的上述圖形特征量進(jìn)行加權(quán)。
6.如權(quán)利要求3、4或5中任一項(xiàng)所述的圖形分類裝置,其特征在于上述馬哈朗諾比斯詞典包括優(yōu)化候選表。
7.一種能用計(jì)算機(jī)讀出的存儲(chǔ)媒體,其特征在于其中存儲(chǔ)了圖形分類方法的程序,用于把從圖形分類對(duì)象中提取的圖形特征量以及與該圖形特征量相對(duì)應(yīng)的分類范疇信息登記/設(shè)定到圖形詞典內(nèi),根據(jù)該圖形詞典內(nèi)所存放的上述分類范疇名稱和上述圖形特征量,進(jìn)行優(yōu)化處理,編制馬哈朗諾比斯詞典,根據(jù)該優(yōu)化后的上述圖形特征量以及上述圖形詞典內(nèi)所登記的上述馬哈朗諾比斯詞典,進(jìn)行圖形分類。
全文摘要
一種圖形分類方法,從圖形分類對(duì)象中提取圖形特征量,把與上述圖形特征量相對(duì)應(yīng)的分類范疇信息登記/設(shè)定在圖形詞典中,根據(jù)上述圖形特征量和上述圖形詞典中所登記的馬哈朗諾比斯詞典,進(jìn)行圖形分類,同時(shí),根據(jù)上述分類范疇名稱和上述圖形特征量,進(jìn)行上述圖形詞典的優(yōu)化處理,編制上述馬哈朗諾比斯詞典。
文檔編號(hào)G06K9/62GK1393002SQ01802891
公開日2003年1月22日 申請(qǐng)日期2001年9月21日 優(yōu)先權(quán)日2000年9月25日
發(fā)明者吉原隆史 申請(qǐng)人:奧林巴斯光學(xué)工業(yè)株式會(huì)社