欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

數(shù)據(jù)處理,圖像處理和圖像分類方法及設(shè)備,及存儲(chǔ)介質(zhì)的制作方法

文檔序號(hào):84607閱讀:374來(lái)源:國(guó)知局
專利名稱:數(shù)據(jù)處理,圖像處理和圖像分類方法及設(shè)備,及存儲(chǔ)介質(zhì)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)處理方法,圖像處理方法,圖像分類方法及設(shè)備,以及存儲(chǔ)介質(zhì)。
背景技術(shù)
作為一種數(shù)據(jù)處理方法,K-均值聚類(K-means Cluster)方法是到目前為止應(yīng)用非常廣泛的用以發(fā)現(xiàn)數(shù)據(jù)中的聚類的方法。K-均值聚類方法被應(yīng)用在很多領(lǐng)域,包括圖形,計(jì)算機(jī)視覺(jué),信號(hào)處理,壓縮,以及計(jì)算幾何(參見(jiàn)Anne-Claude Doux,Jean-Philippe Laurent,和Jean-Pierre Nadal,Symbolic Data Analysis with the K-Means Algorithm,Paris,F(xiàn)rance)。有很多發(fā)表的論文集中在如何加快該方法(參見(jiàn)BarbaraHohlt,Pthread Parallel K-means,CS267 Applications of ParallelComputing UC Berkeley December 14,2001;Jesse D.Hall John C.Hart,University of Illinois at Urbana-Champaign,GPU Acceleration ofIterative Clustering,June 4,2004)。但是本發(fā)明所提出的進(jìn)一步的問(wèn)題是如何更均勻地聚類數(shù)據(jù)。因此有必要開(kāi)發(fā)一種改進(jìn)的數(shù)據(jù)聚類方法以解決問(wèn)題。至于數(shù)據(jù)聚類方法的使用,研究如何在圖像處理甚至圖像分類中有效地使用該改進(jìn)的數(shù)據(jù)聚類方法也是有益的。

發(fā)明內(nèi)容本發(fā)明的一個(gè)目的是根據(jù)標(biāo)準(zhǔn)K-均值方法開(kāi)發(fā)一種新的數(shù)據(jù)聚類方法。
本發(fā)明的另一個(gè)目的是在圖像處理以及圖像分類中使用新的數(shù)據(jù)聚類方法。
本發(fā)明提供了一種數(shù)據(jù)處理方法,包括步驟輸入包括了數(shù)個(gè)數(shù)據(jù)元素的數(shù)據(jù)集;將該數(shù)據(jù)集聚類到聚類中,滿足以下的條件對(duì)于所述的數(shù)個(gè)數(shù)據(jù)元素的任一數(shù)據(jù)元素,所述任一數(shù)據(jù)元素和該任一數(shù)據(jù)元素所屬的聚類的中心之間的加權(quán)距離小于等于該任一數(shù)據(jù)元素和該任一數(shù)據(jù)元素不屬于的任一其它聚類的中心之間的加權(quán)距離,并且選擇加權(quán)因數(shù)和中心使得該聚類均勻;對(duì)于所聚類的數(shù)據(jù)集進(jìn)行后處理。
本發(fā)明還提供了一種圖像處理方法,包括步驟輸入包括數(shù)個(gè)圖像元素的圖像;將該圖像元素聚類到聚類中,滿足以下的條件對(duì)于所述的數(shù)個(gè)圖像元素的任一圖像元素,所述任一圖像元素和該任一圖像元素所屬的聚類的中心之間的加權(quán)距離小于等于該任一圖像元素和該任一圖像元素不屬于的任一其它聚類的中心之間的加權(quán)距離,并且選擇加權(quán)因數(shù)和中心使得該聚類均勻;對(duì)于所聚類的圖像元素進(jìn)行進(jìn)一步的處理。
本發(fā)明進(jìn)一步提供了一種圖像分類方法,包括步驟輸入有待分類的圖像,該圖像包括數(shù)個(gè)圖像元素;將該數(shù)個(gè)圖像元素聚類到聚類中,滿足以下條件對(duì)于所述的數(shù)個(gè)圖像元素的任一圖像元素,所述任一圖像元素和該任一圖像元素所屬的聚類的中心之間的加權(quán)距離小于等于該任一圖像元素和該任一圖像元素不屬于的任一其它聚類的中心之間的加權(quán)距離,并且事先確定加權(quán)因數(shù)和中心;從聚類中提取特征;使用所提取的特征對(duì)圖像進(jìn)行分類。
通過(guò)本發(fā)明,開(kāi)發(fā)了一種根據(jù)標(biāo)準(zhǔn)K-均值方法的新的數(shù)據(jù)聚類方法。
在圖像處理以及圖像分類中使用新的數(shù)據(jù)聚類方法產(chǎn)生了很好的性能。
從以下參照附圖對(duì)優(yōu)選實(shí)施例所作的說(shuō)明,本發(fā)明的其它特征和優(yōu)勢(shì)將明顯可見(jiàn),該附圖通過(guò)示例描述了本發(fā)明的原理。
圖1是標(biāo)準(zhǔn)K-均值聚類方法的流程圖;圖2的流程圖表示了根據(jù)本發(fā)明的一種新的數(shù)據(jù)聚類方法以及根據(jù)該新的數(shù)據(jù)聚類方法的數(shù)據(jù)處理方法的流程圖;圖3是本發(fā)明的數(shù)據(jù)處理設(shè)備;圖4表示使用了許多數(shù)據(jù)集的標(biāo)準(zhǔn)K-均值聚類方法的性能;圖5表示使用了許多數(shù)據(jù)集的本發(fā)明的新的數(shù)據(jù)聚類方法的性能;圖6表示根據(jù)本發(fā)明的一種圖像處理方法;圖7表示執(zhí)行圖6所示的圖像處理方法的圖像處理裝置;圖8表示根據(jù)本發(fā)明的圖像分類方法;圖9表示根據(jù)本發(fā)明的圖像分類設(shè)備,用以執(zhí)行圖8所示的圖像分類方法。
具體實(shí)施方式根據(jù)本發(fā)明,標(biāo)準(zhǔn)K-均值數(shù)據(jù)聚類方法被進(jìn)一步地開(kāi)發(fā)為一種新的數(shù)據(jù)聚類方法。
首先結(jié)合附圖1對(duì)作為一種舊的數(shù)據(jù)處理方法的標(biāo)準(zhǔn)K-均值聚類方法進(jìn)行簡(jiǎn)要的描述。
標(biāo)準(zhǔn)的K-均值數(shù)據(jù)聚類方法是一種迭代的非層級(jí)方法。其由J.B.MacQueen在1976年提出。
在步驟S10,輸入包括有待聚類的n個(gè)數(shù)據(jù)元素(例如,矢量)的數(shù)據(jù)集{v}(v1v2...vn),使用下面的方法得到k個(gè)聚類,其中k為一給定的數(shù)目,并且k小于n。
在步驟S11,給出了初始的k個(gè)中心數(shù)據(jù)元素(例如,矢量)(在任何方法中,例如,從數(shù)據(jù)集{v}中隨機(jī)地選擇k個(gè)數(shù)據(jù)元素)。
令m1m2...mk為這k個(gè)中心數(shù)據(jù)元素。
在步驟S12,將該數(shù)據(jù)集{v}聚類到k個(gè)聚類{v}1,{v}2...{v}k中。該k個(gè)聚類滿足條件對(duì)于{v}i中的任意數(shù)據(jù)元素v以及任意的j≠i,dis(v,mi)≤dis(v,mj)。
這里dis(v1,v2)意味著數(shù)據(jù)元素v1和數(shù)據(jù)元素v2之間的距離。其可以是任何類型的距離測(cè)量,例如,Euclidean距離。
在步驟s13,如下再次計(jì)算k個(gè)中心數(shù)據(jù)元素mi=mean({v}i),也就是數(shù)據(jù)集{v}i的均值。
在步驟s14,除非滿足某些條件,例如,所有的迭代的次數(shù)大于固定值或是在本次迭代中m1m2...mk沒(méi)有發(fā)生變化,否則進(jìn)行到步驟s12。
下面描述本發(fā)明的新的數(shù)據(jù)聚類方法。
本發(fā)明的目的在于非常均勻地聚類數(shù)據(jù),但是標(biāo)準(zhǔn)的K-均值算法不能做到。為了達(dá)到該目的,本發(fā)明介紹了一種新的數(shù)據(jù)聚類方法以及根據(jù)新的數(shù)據(jù)聚類方法的數(shù)據(jù)處理方法,如圖2所示,由圖3所示的數(shù)據(jù)處理設(shè)備30執(zhí)行。
在步驟s20,包括有數(shù)個(gè)數(shù)據(jù)元素vi(i=1..n)的數(shù)據(jù)集{v}由數(shù)據(jù)輸入裝置31輸入。
通過(guò)數(shù)據(jù)聚類裝置32,所輸入的數(shù)據(jù)集被如下聚類在步驟s21,給出了初始k個(gè)中心數(shù)據(jù)元素(例如,矢量),(在任何方法中,例如,從數(shù)據(jù)集{v}中隨機(jī)地選擇k個(gè)數(shù)據(jù)元素)。
令m1m2...mk為這k個(gè)中心數(shù)據(jù)元素(矢量)。
在步驟s22,給出了初始k個(gè)系數(shù)或是加權(quán)因數(shù)c1c2...ck。
對(duì)于i=1,2...k,令ci=1/k。
在步驟s23,數(shù)據(jù)集{v}被聚類到k個(gè)聚類{v}1,{v}2...{v}k中。該聚類滿足條件對(duì)于{v}i中的任意數(shù)據(jù)元素v,以及任意的j≠i,ci×dis(v,mi)≤cj×dis(v,mj)。
這里dis(v1,v2)意味著數(shù)據(jù)元素v1和數(shù)據(jù)元素v2之間的距離。其可以是任何類型的距離測(cè)量,例如,Euclidean距離。
在步驟S24,如下再次計(jì)算k個(gè)中心數(shù)據(jù)元素mi=mean({v}i),也就是數(shù)據(jù)集{v}i的均值。
在步驟s25,如下再次計(jì)算k個(gè)系數(shù)或加權(quán)因數(shù)c1c2...ckci=1-klog(1-ci)/(log(n)-log(numberof({v}i)))]]>其中,numberof({v}i)意味著數(shù)據(jù)集{v}i中的數(shù)據(jù)元素的數(shù)目。接著如下將k個(gè)系數(shù)或加權(quán)因數(shù)標(biāo)準(zhǔn)化ci=ci/Σj=1kcj]]>在步驟s26,除非滿足某些條件,例如,所有的迭代的次數(shù)大于一固定值或是在本次迭代中m1m2...mk不發(fā)生改變,否則進(jìn)行到步驟s23。
在步驟s27,聚類的數(shù)據(jù)集接受后處理裝置33的后處理,例如特征提取,數(shù)據(jù)分類等等。
對(duì)本發(fā)明的新的數(shù)據(jù)聚類方法的分析如下該新的數(shù)據(jù)聚類方法的關(guān)鍵點(diǎn)在于系數(shù)或是加權(quán)因數(shù)c1c2...ck以及得到該系數(shù)的方法。
通過(guò)該新的數(shù)據(jù)聚類方法,結(jié)果聚類非常均勻。
為了更清晰地描述該新的數(shù)據(jù)聚類方法,我們假定k=2。換句話說(shuō),我們將整個(gè)數(shù)據(jù)集{v}分成兩個(gè)聚類{v}1,{v}2。令c1和c2成為在一些迭代之后的系數(shù)或是加權(quán)因數(shù),c1′和c2′是經(jīng)過(guò)這次迭代之后的更新的系數(shù)或加權(quán)因數(shù)。
c1′=1-2log(1-c1)/(log(n)-log(numberof({v}1)))]]>c2′=1-2log(1-c2)/(log(n)-log(numberof({v}2)))]]>如果某些聚類的計(jì)數(shù),例如第一聚類的計(jì)數(shù)大于平均計(jì)數(shù)n/2,換句話說(shuō),numberof({v}1)>n/2,那么可以推出下面的表達(dá)式numberof({v}2)=n-numberof({v}1)<n-n/2=n/2
c1′=1-2log(1-c1)/(log(n)-log(numberof({v}1)))]]>>1-2log(1-c1)/(log(n)-log(n/2))]]>=1-2log(1-c1)/log(2)]]>=1-(1-c1)]]>=c1]]>c2′=1-2log(1-c2)/(log(n)-log(numberof({v}2)))]]><1-2log(1-c2)/(log(n)-log(n/2))]]>=1-2log(1-c2)/log(2)]]>=1-(1-c2)]]>=c2]]>對(duì)于聚類{v}2中的滿足c2×dis(v,m2)≤c1×dis(v,m1)的數(shù)據(jù)元素v,可以推出,c2′×dis(v,m2)<c2×dis(v,m2)≤c1×dis(v,m1)<c1′×dis(v,m1)。根據(jù)上述的推導(dǎo),數(shù)據(jù)元素v在本次迭代之后仍然屬于{v}2。
也就是說(shuō),較小聚類中的數(shù)據(jù)元素在本次迭代之后將仍屬于其聚類。
另一方面,{v}1中的數(shù)據(jù)元素v滿足c1×dis(v,m1)≤c2×dis(v,m2)。
如上所述,經(jīng)過(guò)上述迭代之后,c’2小于c2,并且c’1大于c1。對(duì)于{v}1中的某些數(shù)據(jù)元素v,可能發(fā)生下面的情況c2′×dis(v,m2)<c1′×dis(v,m1)因此經(jīng)過(guò)本次迭代之后,矢量v屬于{v}2而不是{v}1。
總而言之,可以得出結(jié)論在本次迭代之后,{v}1可能變小而{v}2可能變大,因此結(jié)果聚類就變得越來(lái)越均勻。
當(dāng)結(jié)果聚類變得越來(lái)越均勻時(shí),根據(jù)下面的公式,系數(shù)或加權(quán)因數(shù)c1c2...ck變化較小
limnumberof({v}i)->n/21-2log(1-ci)/(log(n)-log(numberof({v}i)))]]>=1-2log(1-ci)/(log(n)-log(n/2))]]>=1-2log(1-ci)/log(2)]]>=1-(1-ci)]]>=ci]]>這表明當(dāng)聚類變得均勻時(shí),系數(shù)或加權(quán)因數(shù)以及聚類都穩(wěn)定。并且其可以作為均勻聚類的標(biāo)準(zhǔn)。
新的數(shù)據(jù)聚類方法和標(biāo)準(zhǔn)K-均值聚類方法的比較如下所示標(biāo)準(zhǔn)K-均值方法不能使數(shù)據(jù)集的結(jié)果聚類為均勻的。通過(guò)使用本發(fā)明的數(shù)據(jù)聚類方法,結(jié)果聚類的尺寸將會(huì)變得越來(lái)越均勻,但是舊的方法并沒(méi)有追求這個(gè)目的。
另一方面,通過(guò)本發(fā)明的步驟,新的數(shù)據(jù)聚類方法可以使得結(jié)果聚類越來(lái)越均勻。
通過(guò)使用許多數(shù)據(jù)集,對(duì)標(biāo)準(zhǔn)K-均值聚類方法和本發(fā)明的新的數(shù)據(jù)聚類方法進(jìn)行比較。圖4和圖5可以清楚地描述兩種方法的結(jié)果之間的差距。圖4表示標(biāo)準(zhǔn)K-均值方法可以對(duì)輸入的數(shù)據(jù)進(jìn)行聚類。但是聚類的尺寸不均勻,參見(jiàn)圖4的直方圖。本發(fā)明的新的數(shù)據(jù)聚類方法同樣對(duì)輸入的數(shù)據(jù)進(jìn)行聚類。進(jìn)一步地聚類的尺寸幾乎相同,如圖5所示。
在圖4和圖5中,x軸表示聚類的指數(shù),y軸表示聚類尺寸。
根據(jù)以上的描述進(jìn)行總結(jié)如果聚類結(jié)果不均勻,一些結(jié)果聚類的尺寸可能相較于其他聚類而言很??;如果聚類結(jié)果均勻,根據(jù)信息理論,能越均勻,平均信息量越大。而平均信息量越大,則得到更多的信息,在均勻的情況下,可以帶來(lái)更多的信息,因此數(shù)據(jù)處理方法可以得到更好的性能。
根據(jù)以上的數(shù)據(jù)處理方法,本發(fā)明還開(kāi)發(fā)了一種通過(guò)使用本發(fā)明的數(shù)據(jù)聚類方法的圖像處理方法。在很多圖像處理方法中,例如,圖像識(shí)別,圖像分類,圖像編碼,圖像轉(zhuǎn)換等等,有待處理的圖像需要接受聚類處理。
圖6表示了根據(jù)本發(fā)明的圖像處理方法。圖7表示了執(zhí)行圖6所示的圖像處理方法的圖像處理設(shè)備70。在步驟s61,有待處理的圖像被圖像輸入裝置71輸入。所述輸入的圖像包括數(shù)個(gè)圖像元素{v}(v1v2...vn),例如,圖像的像素,用每個(gè)像素的r,g,b值表達(dá)為((r,g,b)}((r,g,b)1,(r,g,b)2,...(r,g,b)n)。在步驟s62,通過(guò)圖像元素聚類裝置72,數(shù)個(gè)圖像元素{v}(v1v2...vn)根據(jù)上述的新的數(shù)據(jù)聚類方法被聚類。從步驟s20到步驟s26,圖像元素被聚類到k個(gè)聚類{v}1,{v}2...{v}k。對(duì)于{v}i中的任意圖像元素v以及任意j≠i,ci×dis(v,mi)≤cj×dis(v,mj)。
這里dis(v1,v2)意味著圖像元素v1和v2,也就是,(r,g,b)1和(r,g,b)2之間的距離。其可以為任何類型的距離測(cè)量.例如,Euclidean距離。Mj為{v}i的中心。
較之標(biāo)準(zhǔn)的K-均值聚類方法,這樣聚類的圖像元素{(r,g,b)}((r,g,b)1,(r,g,b)2,...(r,g,b)n)將會(huì)更加均勻。并且在步驟s63,均勻的聚類隨后被用于由進(jìn)一步處理裝置73執(zhí)行的進(jìn)一步的處理,例如輸出,存儲(chǔ),圖像識(shí)別或圖像分類,并且?guī)?lái)圖像處理的較佳性能。
上述圖像處理的較佳性能將在以下根據(jù)本發(fā)明的圖像元素聚類方法開(kāi)發(fā)出來(lái)的圖像分類方法中得以示例性地顯示。
在以下的實(shí)施例中,新的圖像元素聚類方法用于圖像分類,以確定一個(gè)圖像是否屬于例如藍(lán)天圖像或非藍(lán)天圖像。本發(fā)明從圖像中得到顏色直方圖特征并且使用Fisher線性分類器以確定圖像的類別。新的圖像元素聚類方法用以將像素(表述為顏色空間值r,g,b)分配為均勻的聚類,為計(jì)算顏色直方圖特征做準(zhǔn)備。
本發(fā)明的圖像分類方法如圖8所示地被詳細(xì)描述并且如圖9所示地由圖像分類設(shè)備執(zhí)行。
作為一個(gè)可選的步驟,在步驟s81,優(yōu)選地由圖像輸入裝置91輸入的輸入圖像被重調(diào)尺寸到一個(gè)特殊的尺寸,例如19200像素。圖像的寬高比在重調(diào)尺寸之后沒(méi)有發(fā)生變化。
在步驟s82,重調(diào)尺寸的圖像中的像素由圖像元素聚類裝置92通過(guò)使用上面的新的圖像元素聚類方法進(jìn)行聚類。
本發(fā)明使用了矢量v=[r,g,b],其中r,g,以及b為顏色像素的r,g,和b顏色分量值。令像素集{v}由從重調(diào)尺寸的圖像像素得到的矢量組成。本發(fā)明使用上面的新的圖像元素聚類方法將像素集{v}聚類到k個(gè)聚類{v}i,{v}2...{v}k,對(duì)于{v}i中的任意v以及j≠i,滿足條件ci×dis(v,mi)≤cj×dis(v,mj)(如果聚類方法為標(biāo)準(zhǔn)k-均值聚類方法,則條件變?yōu)閐is(v,mi)≤ dis(v,mj)),其中m1m2...mk以及c1c2...ck為提前得到的。在下面的描述中將描述對(duì)于m1m2...mk以及c1c2...ck的訓(xùn)練方法。這里dis(v1,v2)意味著v1和v2之間的距離。其可以為任何類型的距離測(cè)量,在本方法中,使用了Euclidean距離。
在步驟s83,圖像特征提取裝置93提取圖像特征。
這里,提取出了名為imf(i)的k-dim特征,其中對(duì)于i=1,2,3...k-1,imf(i)=numberof({v}i),且numberof({v}i)意味著像素集{v}i的計(jì)數(shù)。
在步驟s84,圖像分類裝置94通過(guò)使用上面提取的特征對(duì)圖像進(jìn)行分類。
定義k-dim權(quán)重w(i)。并且“th”被定義為閾值。
如果Σi=1kimf(i)×w(i)≥th,]]>則該圖像為正片,否則不是。
計(jì)算下面參數(shù)m1m2...mk,c1c2...ck,w(i)(i=1,2,3...k-1)以及“th”的方法如下所述首先,描述計(jì)算m1m2...mk和c1c2...ck的方法。
在步驟s81選擇許多圖像并對(duì)其重調(diào)尺寸。
如在步驟s82所述,令像素集{v}由從重調(diào)尺寸后的圖像的像素中得到的矢量組成。
接著使用本發(fā)明的新的圖像元素聚類方法將像素集{v}聚類到k個(gè)聚類{v}1,{v}2...{v}k。并且也得到m1m2...mk和c1c2...ck。
下面描述計(jì)算w(i)(i=1,2,3...k-1)的方法。
1.得到許多藍(lán)天圖像和非藍(lán)天圖像;2.對(duì)于每個(gè)圖像,得到矢量imf(i)(i=1,2,3...k-1)。于是,對(duì)于上面的兩種圖像,得到兩種矢量。每一種都來(lái)自于對(duì)應(yīng)種類的圖像。
3.使用Fisher線性分類器訓(xùn)練兩種類型的矢量,得到權(quán)重矢量w(i)(i=1,2,3...k-1)。
獲得“th”的方法在下面進(jìn)行描述。
選擇“th”作為imf(i)和w(i)的內(nèi)積,標(biāo)準(zhǔn)是在先步驟中得到的Fisher線性分類器可以得到對(duì)于使用該閾值的訓(xùn)練集而言為最好的結(jié)果(真實(shí)率和錯(cuò)誤率之間的差值最大)。
下面的表格描述了使用上面兩種聚類方法的圖像分類算法的性能。該兩種方法意在確定藍(lán)天圖像或非藍(lán)天圖像。示例性地,k在此處取為64。
算法 返回率 錯(cuò)誤率使用標(biāo)準(zhǔn)k-均值 85.45% 20.00%使用新的聚類算法 88.80% 18.19%從結(jié)果我們可以得到,在圖像分類方法中使用了新的聚類方法可以得到比使用標(biāo)準(zhǔn)K-均值聚類方法更佳的性能。
接著解釋上面的返回率和錯(cuò)誤率。
當(dāng)在一種類別上適用時(shí),本發(fā)明使用兩個(gè)值來(lái)評(píng)估分類算法的能力。一個(gè)是所謂的“Recall”。假設(shè)n為一個(gè)類別中圖像的數(shù)目并且NTure表示由該算法正確分類到該類別中的圖像的數(shù)目。于是返回率r是NTure與n的比值。也就是r=NTrue/n另一個(gè)值稱為“錯(cuò)誤率”。假定不屬于一個(gè)類別的圖像的數(shù)目為m,且NFalse表示由該算法錯(cuò)誤分類到該類別中的圖像的數(shù)目,于是錯(cuò)誤率fr是NFalse與m的比值。也就是fr=NFalse/m
這兩個(gè)值被用來(lái)評(píng)估和比較使用標(biāo)準(zhǔn)K-均值聚類方法和本發(fā)明的新的數(shù)據(jù)聚類方法的圖像分類。
根據(jù)上面的描述,新的數(shù)據(jù)聚類方法對(duì)于圖像分類可以產(chǎn)生好的性能。
原因在于新的聚類算法可以得到均勻的聚類結(jié)果。
如果聚類結(jié)果不均勻,一些結(jié)果聚類的尺寸相較于其它的聚類可能會(huì)非常小。當(dāng)在圖像分類算法中使用了這樣的結(jié)果聚類時(shí),小尺寸聚類的對(duì)應(yīng)圖像特征imf(i)會(huì)非常小,甚至在某些輸入圖像中為零,這就意味著某些聚類沒(méi)有很好地使用,這將削弱該方法的性能。而當(dāng)聚類結(jié)果均勻時(shí),就不會(huì)存在這樣的問(wèn)題。
如果聚類結(jié)果均勻,圖像特征imf(i)一般也均勻。根據(jù)信息理論,能越均勻,平均信息量就越大。于是當(dāng)imf(i)取做能時(shí),均勻的imf(i)的平均信息量就大于不均勻的imf(i)的平均信息量,而當(dāng)平均信息量越大時(shí),就可以得到更多的信息,在均勻的情況下,imf(i)可以帶來(lái)更多的信息,因此算法可以得到更好的性能。
數(shù)據(jù)處理方法,圖像處理方法,以及圖像分類方法在以下圖像分類的例子中用數(shù)字進(jìn)行顯示。
從3470個(gè)樣本圖像中,在每個(gè)樣本圖像中隨機(jī)地選擇出100像素的(r,g,b)矢量作為樣本矢量。這樣就可以獲得總共347000個(gè)這樣的樣本矢量,其中的十個(gè)列舉如下79 127 176129 144 175163 178 2094 9 3880 102 1235 8 1321 32 6096 167 22163 124 18751 72 91... ...
首先,通過(guò)使用標(biāo)準(zhǔn)K-均值聚類方法將上面的347000個(gè)矢量聚類到64個(gè)聚類中。
K個(gè)中心m1m2...mk如下初始化(每一行為m,一共64個(gè)m)191 189 17661 76 4550 20 1081 132 189126 141 134215 170 10572 78 52132 136 16126 24 25201 186 189129 112 661 2 7217 227 22624 41 1194 35 102142 91 70137 136 13151 38 2995 25 1780 76 6525 20 274 39 6726 3 13155 152 16916 30 5192 187 183
103 70 5386 42 39119 120 11215 24 33140 152 14240 71 1176 81 1007 5 6129 150 135106 21 18111 69 53133 112 95185 90 70150 140 11529 27 4120 24 2587 128 1323 64 5696 131 15029 59 132197 186 18444 63 59152 137 13410 111 13985 70 2748 53 33118 105 70232 223 22890 99 192
13 0 369 47 34110 64 388 9 4208 201 149212 156 10598 23 1770 62 60104 73 55關(guān)于每個(gè)中心聚類的樣本矢量的數(shù)目分別為4452,3137,7247,8391,2195,5009,3871,6644,6968,7721,4963,11833,11702,2153,1636,5204,3171,7317,2407,8911,2280,2922,6106,14650,3793,8463,1417,2309,10856,4220,3031,1703,15665,7608,575,2857,2279,6504,10099,6840,7057,5951,5231,768,5064,5139,809,9136,4186,2428,3727,7242,8564,7131,3055,2838,4873,5180,8335,4602,5392,529,7597,3057根據(jù)上面聚類的樣本矢量,新中心(m1m2...mk)計(jì)算為185 181 16659 77 4151 19 1084 141 200121 132 136223 185 8475 86 50126 138 16829 27 21201 196 201133 126 551 2 3208 217 221
27 43 11310 35 99145 88 62135 130 13048 36 2886 29 1381 80 7025 15 2513 33 6826 8 10152 162 18119 28 7170 187 20195 65 5287 43 40113 114 11210 19 36148 155 14443 69 1276 85 1027 5 8124 162 127131 20 19121 69 55135 112 94196 95 48156 142 10531 31 4417 20 20
84 110 13110 68 5999 121 15434 68 138203 182 17745 56 65163 141 13516 101 16685 73 2346 51 36106 103 73237 232 22879 98 18114 2 268 47 33125 64 2810 12 7218 199 147208 146 9193 12 1267 59 62102 82 60關(guān)于每個(gè)新中心聚類的樣本矢量的數(shù)目分別為6362,3349,5698,6362,4167,4070,4209,6587,7925,7364,4382,12206,10393,2910,1674,5455,5339,6350,3018,8492,2708,3050,5854,9360,3060,9514,3447,2456,9596,4020,5536,1954,11003,7139,912,2594,2699,7312,7641,5975,6610,7343,6258,1068,5000,4502,2969,8094,5088,3093,3025,7680,9015,7634,3516,3196,5102,4461,7715,4226,5317,115,8348,4083經(jīng)過(guò)100次的重復(fù),最后一次的中心為
170 168 16761 74 3065 13 1095 151 209119 123 132230 177 4680 102 43117 135 17030 28 23187 188 194110 128 562 2 2208 212 21538 66 11311 41 125167 106 49138 129 11247 32 2182 37 1473 75 7119 19 2315 25 7534 12 8138 161 19519 31 8157 191 21783 61 48115 48 33100 105 110
9 17 41147 146 14638 56 1770 82 1005 4 10148 163 81190 34 39131 83 56126 106 86219 104 36165 118 9029 33 4314 13 1463 89 13816 57 7192 113 14519 80 165219 199 16647 54 77184 157 12625 123 203102 71 2244 46 4395 93 83234 233 23276 113 1811 4 365 45 35154 70 24
8 12 5230 193 108211 136 80122 16 1759 60 55100 79 60關(guān)于在最后一次獲得的每個(gè)中心聚類的樣本矢量的數(shù)目分別為9065,3734,3 522,4253,7488,2322,3513,6667,7144,8675,3393,12317,12737,3730,2305,4234,7960,6166,3891,8715,7125,2553,5892,7043,2965,5861,5406,2942,9125,3406,9250,2949,6622,5739,2127,1904,5322,7853,3491,5149,5962,8874,4849,2408,5364,2619,5420,5623,6599,1833,2770,8560,8710,8155,4342,4680,5367,2923,4498,3308,3518,1978,8145,5940其次,通過(guò)使用本發(fā)明的方法,將上面347000個(gè)矢量聚類到64個(gè)聚類中。
K個(gè)中心m1m2...mk如下初始化(每一行為一個(gè)m,共有64個(gè)m)191 189 17661 76 4550 20 1081 132 189126 141 134215 170 10572 78 52132 136 16126 24 25201 186 189129 112 661 2 7217 227 22624 41 119
4 35 102142 91 70137 136 13151 38 2995 25 1780 76 6525 20 274 39 6726 3 13155 152 16916 30 5192 187 183103 70 5386 42 39119 120 11215 24 33140 152 14240 71 1176 81 1007 5 6129 150 135106 21 18111 69 53133 112 95185 90 70150 140 11529 27 4120 24 2587 128 132
3 64 5696 131 15029 59 132197 186 18444 63 59152 137 13410 111 13985 70 2748 53 33118 105 70232 223 22890 99 19213 0 369 47 34110 64 388 9 4208 201 149212 156 10598 23 1770 62 60104 73 55加權(quán)因數(shù)c1c2...ck的每一個(gè)都被初始化為1/64,也就是,0.015625。
關(guān)于每個(gè)中心聚類的樣本矢量的數(shù)目分別為4452,3137,7247,8391,2195,5009,3871,6644,6968,7721,4963,11833,11702,2153,1636,5204,3171,7317,2407,8911,2280,2922,6106,14650,3793,8463,1417,2309,10856,4220,3031,1703,15665,7608,575,2857,2279,6504,10099,6840,7057,5951,5231,768,5064,5139,809,9136,4186,2428,3727,7242,8564,7131,3055,2838,4873,5180,8335,4602,5392,529,7597,3057根據(jù)上面聚類的樣本矢量,新的中心(m1m2...mk)計(jì)算為
185 181 16659 77 4151 19 1084 141 200121 132 136223 185 8475 86 50126 138 16829 27 21201 196 201133 126 551 2 3208 217 22127 43 11310 35 99145 88 62135 130 13048 36 2886 29 1381 80 7025 15 2513 33 6826 8 10152 162 18119 28 7170 187 20195 65 5287 43 40113 114 112
10 19 36148 155 14443 69 1276 85 1027 5 8124 162 127131 20 19121 69 55135 112 94196 95 48156 142 10531 31 4417 20 2084 110 13110 68 5999 121 15434 68 138203 182 17745 56 65163 141 13516 101 16685 73 2346 51 36106 103 73237 232 22879 98 18114 2 268 47 33125 64 28
10 12 7218 199 147208 146 9193 12 1267 59 62102 82 60加權(quán)因數(shù)c1c2...ck再次計(jì)算為0.015471,0.014912,0.016414,0.016746,0.014422,0.015679,0.015237,0.016229,0.016330,0.016555,0.015662,0.017636,0.017604,0.014398,0.014067,0.015749,0.014928,0.016435,0.014542,0.016890,0.014471,0.014809,0.016057,0.018285,0.015205,0.016766,0.013908,0.014487,0.017397,0.015380,0.014862,0.014113,0.018507,0.016522,0.013068,0.014777,0.014470,0.016185,0.017205,0.016290,0.016357,0.016006,0.015759,0.013311,0.015699,0.015726,0.013357,0.016951,0.015366,0.014554,0.015177,0.016413,0.016794,0.016379,0.014874,0.014768,0.015629,0.015741,0.016730,0.015528,0.015816,0.013002,0.016518,0.014874,關(guān)于每個(gè)新的中心聚類的樣本矢量的數(shù)目分別為6296,3510,5516,6224,4490,4102,4361,6673,7614,7173,4506,11965,10010,3267,1745,5518,5465,6233,3081,8301,3170,3141,5723,8299,3241,9701,3783,2550,9032,4037,5882,2141,10013,7183,1218,2711,2890,7409,7173,5656,6473,7261,6668,1255,4945,4406,3883,7670,5116,3226,2984,7541,8709,7774,3725,3543,5129,4300,7521,4084,5437,1714,8220,4413經(jīng)過(guò)100次的重復(fù),最后一次的中心為176 174 17458 70 4065 19 11123 165 207113 122 137
215 189 15184 100 43120 137 17020 18 20190 207 221118 137 652 1 1217 219 22156 71 9918 53 126167 109 58130 125 11736 24 17117 27 2165 69 7013 13 1215 30 6834 10 7150 157 17418 28 11157 184 21075 62 52103 65 47107 109 11012 17 36141 141 14541 56 1978 85 902 2 2
153 145 118220 124 44124 88 66121 105 90228 188 82152 117 9327 30 326 7 1486 98 11737 54 7787 113 15859 86 139190 191 19438 42 45172 161 14428 104 18584 52 2044 35 2898 96 84237 237 23687 134 20016 5 461 43 37136 78 315 6 4219 210 195193 144 104189 57 3953 53 55
87 80 68加權(quán)因數(shù)c1c2...ck為0.020386,0.013524,0.013216,0.015904,0.018817,0.014602,0.012724,0.017542,0.020310,0.020817,0.010569,0.013418,0.032077,0.013229,0.009845,0.012358,0.019450,0.014492,0.008763,0.018671,0.021267,0.010576,0.012992,0.020416,0.011769,0.018941,0.016793,0.013405,0.018815,0.011659,0.020423,0.011007,0.016835,0.021746,0.015626,0.010632,0.015364,0.016376,0.009660,0.014614,0.017199,0.013569,0.017204,0.012987,0.015573,0.012106,0.021543,0.018072,0.018799,0.008236,0.012332,0.015587,0.019748,0.018140,0.012617,0.014484,0.015205,0.011090,0.018991,0.018533,0.012981,0.008019,0.017797,0.019559,在最后一次獲得的關(guān)于每個(gè)中心聚類的樣本矢量的數(shù)目分別為5958,5219,5178,5502,5807,5351,5113,5681,5952,5997,4804,5262,6862,5180,4689,5064,5870,5337,4505,5793,6041,4805,5149,5962,4983,5821,5600,5203,5811,4968,5963,4871,5605,6082,5470,4814,5440,5555,4659,5352,5640,5222,5644,5148,5464,5029,6066,5739,5808,4409,5061,5461,5899,5741,5098,5339,5421,4883,5766,5781,5147,4368,5706,5882w(i)(i=1,2,3...k-1)和th如下計(jì)算根據(jù)上面獲得的m1m2...mk和c1c2...ck,獲得1001個(gè)藍(lán)天樣本的imf(i),其中的三個(gè)如下所列出的0 0 0 0 0 0 0 0 8 2 00 0 667 0 0 0 459 156 0 5170 11 79 0 103 438 62 507 3000 3480 908 0 346 0 391 1120 0436 38 63360 3066 584 0 561 19 847 286 206 10563 29 674 0 71 267 0 339 39 0 5560 0 0 4 0 0 0 0 0 0 00 0 0 0 0 93 226 78 0 30
77 811 128 1823 354 18 317 126 145 421152 0 249 0 241 946 324 365 540 1761426 997 1256 319 71 152 107 1 27 392205 3 673 66 782 21 24 1168 1383 012170 534 0 2 3 0 0 0 0 00 0 22 0 0 0 109 85 0 92 033 1130 102 1183 403 170 113 148 800 65145 0 1404 0 683 2654 0 924 340 631153 1227 1701 953 20 171 124 0 55209 259 0 498 8 190 36 0 62 2000 414獲得2469個(gè)非藍(lán)天樣本的imf(i),其中三個(gè)如下面所列出的0 0 0 0 0 0 0 0 0 0 60 0 0 0 0 0 301 12 0 009 556 1831 616 77 5 76 494 203 2319172 213 7 0 13 214 0 0 332 425143 715 987 0 733 95 2 0 53 94181 3629 0 20 58 453 1475 552 0 015990 116 106 0 0 0 0 0 0 0 00 0 196 0 0 0 91 94 0 1101 4 1949 132 3704 75 273 138 51 13178 225 0 152 0 732 634 9 326 25168 314 1047 2032 1230 2424 22 127 507 11113 56 192 490 0 26 36 33 493 150 177
0 0 0 0 0 0 0 0 0 0 00 0 0 0 0 0 48 0 0 41040 494 2533 470 0 0 93 649 34235 184 2 3 0 0 55 0 0 40881572 167 2057 105 41 1542 43 7 0 00 62 1982 0 1 0 0 884 1046 00 381通過(guò)Fisher訓(xùn)練獲得w(i)(i=1,2,3...k-1)如下-0.35227 3.3024 3.9073 -1.7244 -2.8985-2.4238 -58.575 -0.53182 4.3216 -12.966-0.78011 -2.9213 4.2854 5.5448 5.5226-5.2381 1.1366 1.4633 3.388 -0.16725-0.49971 2.7099 0.10198 0.92013 -0.310775.9307 1.879 0.43546 0.52366 0.300420.62112 3.2043 0.98369 -0.62325 -0.73779-0.59747 1.6149 0.30388 -0.64783 1.3017-0.28726 -0.13114 -0.42833 1.7196 3.97824.5136 0.4049 0.46941 2.9196 4.7745-1.7852 0.81059 2.398 -1.1094 5.21590.82322 0.83805 0.25749 -0.020983 0.1336-0.3263 0.080883 -0.00065881Th=17433根據(jù)上面的計(jì)算,下面給出分類的數(shù)字性例子給出一個(gè)藍(lán)天樣本,其特征為0 0 0 0 0 0 0 0 0 0 00 0 0 0 0 0 0 12 0 3090 530 62 26 2480 1051 167 142 0 152
101 179 0 968 0 257 713 0 685 360 195 20 192 19 176 22 670 2691 125820 169 491 2932 0 1216 0 0 121 4450 234該特征與w(i)的內(nèi)積為50384,其大于th并且分類為藍(lán)天。
給出一個(gè)非藍(lán)天樣本,其特征為0 0 0 0 0 20 0 14 0 0 00 0 0 0 0 9 0 190 0 57 01959 385 7 347 144 411 42 3 131 011 1 131 2041 247 164 5707 305 77 4867 0 0 0 97 3 145 0 1206 1323 490 0 1171 1047 625 140 0 265 10 19該特征與w(i)的內(nèi)積為901.8,其小于th并且分類為非藍(lán)天。
本發(fā)明還可以通過(guò)將存儲(chǔ)有執(zhí)行上述實(shí)施例的功能的軟件的程序編碼的存儲(chǔ)介質(zhì)(或記錄介質(zhì))提供給一系統(tǒng)或設(shè)備,以及提供該系統(tǒng)或設(shè)備的讀出并執(zhí)行存儲(chǔ)在存儲(chǔ)介質(zhì)中的程序碼的計(jì)算機(jī)(或CPU或MPU(微處理單元)),而實(shí)現(xiàn)。在這種情況下,從存儲(chǔ)介質(zhì)中讀出的程序編碼本身實(shí)現(xiàn)了上述實(shí)施例的功能。本發(fā)明并不局限于其中計(jì)算機(jī)執(zhí)行已經(jīng)讀出的程序碼,并且上述實(shí)施例的功能被實(shí)現(xiàn)的情況,以及其中運(yùn)行在計(jì)算機(jī)上的操作系統(tǒng)或類似執(zhí)行實(shí)際處理的部分或全部,使得上述實(shí)施例的功能得以實(shí)現(xiàn)的情況。
進(jìn)一步,本發(fā)明還包括這樣的安排,其中上述實(shí)施例的功能由從記錄介質(zhì)中讀出并寫入到包括在插在計(jì)算機(jī)上的功能擴(kuò)展卡或連接到計(jì)算機(jī)上的功能擴(kuò)展單元中的存儲(chǔ)器中的程序碼實(shí)現(xiàn),接著提供給該功能擴(kuò)展卡或功能擴(kuò)展單元的CPU或類似完成部分或者全部的實(shí)際處理,使得上述實(shí)施例的功能得以實(shí)現(xiàn)。
將本發(fā)明應(yīng)用在上述的存儲(chǔ)介質(zhì)上時(shí),對(duì)應(yīng)于在先描述的流程圖的程序碼存儲(chǔ)在該存儲(chǔ)介質(zhì)中。
雖然本發(fā)明的描述參考了示例性的實(shí)施例,應(yīng)當(dāng)理解的是本發(fā)明并不限于所披露的實(shí)施例。相反,本發(fā)明意在覆蓋包括在所附權(quán)利要求
的精神和范圍內(nèi)的各種修改和等同安排。對(duì)于隨后的權(quán)利要求
的范圍應(yīng)當(dāng)給與最為廣泛的解釋,從而包含所有這樣的修改和等同結(jié)構(gòu)和功能。
權(quán)利要求
1.一種數(shù)據(jù)處理方法,包括步驟輸入包括了數(shù)個(gè)數(shù)據(jù)元素的數(shù)據(jù)集;將該數(shù)據(jù)集聚類到聚類中,滿足以下的條件對(duì)于所述的數(shù)個(gè)數(shù)據(jù)元素的任一數(shù)據(jù)元素,所述任一數(shù)據(jù)元素和該任一數(shù)據(jù)元素所屬的聚類的中心之間的加權(quán)距離小于等于該任一數(shù)據(jù)元素和該任一數(shù)據(jù)元素不屬于的任一其它聚類的中心之間的加權(quán)距離,并且選擇加權(quán)因數(shù)和中心使得該聚類均勻;對(duì)于所聚類的數(shù)據(jù)集進(jìn)行后處理。
2.根據(jù)權(quán)利要求
1的數(shù)據(jù)處理方法,其中所述的距離為Euclidean距離。
3.根據(jù)權(quán)利要求
1的數(shù)據(jù)處理方法,其中聚類步驟被執(zhí)行數(shù)次。
4.根據(jù)權(quán)利要求
3的數(shù)據(jù)處理方法,其中在第一次執(zhí)行該聚類步驟時(shí),對(duì)加權(quán)因數(shù)和中心進(jìn)行初始化。
5.根據(jù)權(quán)利要求
3的數(shù)據(jù)處理方法,其中在每一次執(zhí)行聚類步驟結(jié)束時(shí),中心被重新計(jì)算為各個(gè)聚類的平均值,并且加權(quán)因數(shù)c1c2...ck由下面的表達(dá)式進(jìn)行重新計(jì)算ci=1-klog(1-ci)/(log(n)-log(numberof({v}i))),]]>其中{v}i意味著第i個(gè)聚類,numberof({v}i)意味著聚類{v}i中數(shù)據(jù)元素的數(shù)目,ci意味著對(duì)應(yīng)于聚類{v}i的加權(quán)因數(shù),n意味著在該數(shù)據(jù)集中數(shù)據(jù)元素的數(shù)目,k意味著聚類的數(shù)目。
6.根據(jù)權(quán)利要求
5的數(shù)據(jù)處理方法,其中c1c2...ck經(jīng)過(guò)下面的等式標(biāo)準(zhǔn)化ci=ci/Σj=1kcj.]]>
7.根據(jù)權(quán)利要求
5的數(shù)據(jù)處理方法,其中重新計(jì)算過(guò)的加權(quán)因數(shù)和中心用于下一次的聚類步驟。
8.一種數(shù)據(jù)處理設(shè)備,包括數(shù)據(jù)輸入裝置,用于輸入包括數(shù)個(gè)數(shù)據(jù)元素的數(shù)據(jù)集;數(shù)據(jù)聚類裝置,用于將該數(shù)據(jù)集聚類到聚類中,滿足以下的條件對(duì)于所述的數(shù)個(gè)數(shù)據(jù)元素的任一數(shù)據(jù)元素,所述任一數(shù)據(jù)元素和該任一數(shù)據(jù)元素所屬的聚類的中心之間的加權(quán)距離小于等于該任一數(shù)據(jù)元素和該任一數(shù)據(jù)元素不屬于的任一其它聚類的中心之間的加權(quán)距離,并且選擇加權(quán)因數(shù)和中心使得該聚類均勻;后處理裝置,用于對(duì)所聚類的數(shù)據(jù)集進(jìn)行后處理。
9.根據(jù)權(quán)利要求
8的數(shù)據(jù)處理設(shè)備,其中所述的距離為Euclidean距離。
10.根據(jù)權(quán)利要求
8的數(shù)據(jù)處理設(shè)備,其中的數(shù)據(jù)聚類裝置執(zhí)行數(shù)次聚類。
11. 根據(jù)權(quán)利要求
10的數(shù)據(jù)處理設(shè)備,其中在第一次聚類時(shí),數(shù)據(jù)聚類裝置對(duì)加權(quán)因數(shù)和中心進(jìn)行初始化。
12.根據(jù)權(quán)利要求
10的數(shù)據(jù)處理設(shè)備,其中在每一次執(zhí)行聚類步驟結(jié)束時(shí),聚類裝置重新計(jì)算中心為各個(gè)聚類的平均值,并且通過(guò)下面的表達(dá)式對(duì)加權(quán)因數(shù)c1c2...ck進(jìn)行重新計(jì)算ci=1-klog(1-ci)/(log(n)-log(numberof({v}i))),]]>其中{v}i意味著第i個(gè)聚類,numberof({v}i)意味著聚類{v}i中數(shù)據(jù)元素的數(shù)目,ci意味著對(duì)應(yīng)于聚類{v}i的加權(quán)因數(shù),n意味著在該數(shù)據(jù)集中數(shù)據(jù)元素的數(shù)目,k意味著聚類的數(shù)目。
13.根據(jù)權(quán)利要求
12的數(shù)據(jù)處理設(shè)備,其中數(shù)據(jù)聚類裝置經(jīng)過(guò)下面的等式對(duì)c1c2...ck進(jìn)行標(biāo)準(zhǔn)化ci=ci/Σj=1kcj.]]>
14.根據(jù)權(quán)利要求
12的數(shù)據(jù)處理設(shè)備,其中數(shù)據(jù)聚類裝置使用重新計(jì)算過(guò)的加權(quán)因數(shù)和中心用于下一次的聚類。
15.一種存儲(chǔ)介質(zhì),其上編碼有機(jī)器可讀的計(jì)算機(jī)程序碼用于圖像分類,該存儲(chǔ)介質(zhì)包括用于使處理器完成根據(jù)權(quán)利要求
1到7的任意一個(gè)的方法的指令。
16.一種圖像處理方法,包括步驟輸入包括數(shù)個(gè)圖像元素的圖像;將該圖像元素聚類到聚類中,滿足以下的條件對(duì)于所述數(shù)個(gè)圖像元素的任一圖像元素,所述任一圖像元素和該任一圖像元素所屬的聚類的中心之間的加權(quán)距離小于等于該任一圖像元素和該任一圖像元素不屬于的任一其它聚類的中心之間的加權(quán)距離,并且選擇加權(quán)因數(shù)和中心使得該聚類均勻;對(duì)于所聚類的圖像元素進(jìn)行進(jìn)一步的處理。
17.根據(jù)權(quán)利要求
16的圖像處理方法,其中的圖像元素vi為圖像的像素,表示為矢量(r,g,b)i,其中r,g,b為每個(gè)像素的紅色,綠色和藍(lán)色值。
18.根據(jù)權(quán)利要求
16的圖像處理方法,其中所述距離為Euclidean距離。
19.根據(jù)權(quán)利要求
16的圖像處理方法,其中的聚類步驟執(zhí)行數(shù)次。
20.根據(jù)權(quán)利要求
19的圖像處理方法,其中在第一次執(zhí)行聚類步驟時(shí),對(duì)加權(quán)因數(shù)和中心進(jìn)行初始化。
21.根據(jù)權(quán)利要求
19的圖像處理方法,其中在每一次執(zhí)行聚類步驟結(jié)束時(shí),中心重新計(jì)算為各個(gè)聚類的平均值,并且通過(guò)下面的表達(dá)式對(duì)加權(quán)因數(shù)c1c2...ck進(jìn)行重新計(jì)算ci=1-klog(1-ci)/(log(n)-log(numberof({v}i))),]]>其中{v}i意味著第i個(gè)聚類,numberof({v}i)意味著聚類{v}i中圖像元素的數(shù)目,ci意味著對(duì)應(yīng)于聚類{v}i的加權(quán)因數(shù),n意味著在該圖像中圖像元素的數(shù)目,k意味著聚類的數(shù)目。
22.根據(jù)權(quán)利要求
21的圖像處理方法,其中通過(guò)下面的等式對(duì)c1c2...ck進(jìn)行標(biāo)準(zhǔn)化ci=ci/Σj=1kcj.]]>
23.根據(jù)權(quán)利要求
21的圖像處理方法,其中重新計(jì)算過(guò)的加權(quán)因數(shù)和中心用于下一次的聚類步驟。
24.一種圖像處理設(shè)備,包括圖像輸入裝置,用于輸入包括數(shù)個(gè)圖像元素的圖像;圖像元素聚類裝置,用于將該圖像元素聚類到聚類中,滿足以下的條件對(duì)于所述的數(shù)個(gè)圖像元素的任一圖像元素,所述任一圖像元素和該任一圖像元素所屬的聚類的中心之間的加權(quán)距離小于等于該任一圖像元素和該任一圖像元素不屬于的任一其它聚類的中心之間的加權(quán)距離,并且選擇加權(quán)因數(shù)和中心使得該聚類均勻;進(jìn)一步處理裝置,用于對(duì)所聚類的圖像元素進(jìn)行進(jìn)一步的處理。
25.根據(jù)權(quán)利要求
24的圖像處理設(shè)備,其中圖像元素Vi為圖像的像素,表示為矢量(r,g,b)i,其中r,g,b為每個(gè)像素的紅色,綠色和藍(lán)色值。
26.根據(jù)權(quán)利要求
24的圖像處理設(shè)備,其中所述的距離為Euclidean距離。
27.根據(jù)權(quán)利要求
24的圖像處理設(shè)備,其中圖像元素聚類裝置執(zhí)行數(shù)次聚類。
28.根據(jù)權(quán)利要求
27的圖像處理設(shè)備,其中在第一次聚類時(shí),圖像元素聚類裝置對(duì)加權(quán)因數(shù)和中心進(jìn)行初始化。
29.根據(jù)權(quán)利要求
27的圖像處理設(shè)備,其中在每一次聚類結(jié)束時(shí),圖像元素聚類裝置重新計(jì)算中心為各個(gè)聚類的平均值,并且通過(guò)下面的表達(dá)式對(duì)加權(quán)因數(shù)c1c2...ck進(jìn)行重新計(jì)算ci=1-klog(1-ci)/(log(n)-log(numberof({v}i))),]]>其中{v}i意味著第i個(gè)聚類,numberof({v}i)意味著聚類{v}i中圖像元素的數(shù)目,ci意味著對(duì)應(yīng)于聚類{v}i的加權(quán)因數(shù),n意味著在該圖像中圖像元素的數(shù)目,k意味著聚類的數(shù)目。
30.根據(jù)權(quán)利要求
29的圖像處理設(shè)備,其中圖像元素聚類裝置經(jīng)過(guò)下面的等式對(duì)c1c2...ck進(jìn)行標(biāo)準(zhǔn)化ci=ci/Σj=1kcj.]]>
31.根據(jù)權(quán)利要求
29的數(shù)據(jù)處理設(shè)備,其中圖像元素聚類裝置使用重新計(jì)算過(guò)的加權(quán)因數(shù)和中心用于下一次的聚類。
32.一種存儲(chǔ)介質(zhì),其上編碼有機(jī)器可讀的計(jì)算機(jī)程序碼用以分類圖像,該存儲(chǔ)介質(zhì)包括用于使處理器完成根據(jù)權(quán)利要求
16到23的任意一個(gè)的方法的指令。
33.一種圖像分類方法,包括步驟輸入有待分類的圖像,該圖像包括數(shù)個(gè)圖像元素;將該圖像元素聚類到聚類中,滿足以下條件對(duì)于所述的數(shù)個(gè)圖像元素的任一圖像元素,所述任一圖像元素和該任一圖像元素所屬的聚類的中心之間的加權(quán)距離小于等于該任一圖像元素和該任一圖像元素不屬于的任一其它聚類的中心之間的加權(quán)距離,并且事先確定加權(quán)因數(shù)和中心;從聚類中提取特征;使用所提取的特征對(duì)圖像進(jìn)行分類。
34.根據(jù)權(quán)利要求
33的圖像分類方法,其中提取特征為k-dim特征imf(i),其中對(duì)于i=1,2,3...k-1,imf(i)=numberof({v}i);且numberof({v}i)意味著第i個(gè)聚類{v}i的計(jì)數(shù);k意味著聚類的數(shù)目。
35.一種圖像分類設(shè)備,包括圖像輸入裝置,用于輸入有待分類的圖像,該圖像包括數(shù)個(gè)圖像元素;圖像元素聚類裝置,用于將該圖像元素聚類到聚類中,滿足以下條件對(duì)于所述的數(shù)個(gè)圖像元素的任一圖像元素,所述任一圖像元素和該任一圖像元素所屬的聚類的中心之間的加權(quán)距離小于等于該任一圖像元素和該任一圖像元素不屬于的任一其它聚類的中心之間的加權(quán)距離,并且事先確定加權(quán)因數(shù)和中心;特征提取裝置,用于從聚類中提取特征;圖像分類裝置,用于使用所提取的特征對(duì)圖像進(jìn)行分類。
36.根據(jù)權(quán)利要求
35的圖像分類設(shè)備,其中由特征提取裝置提取的特征為k-dim特征imf(i),其中對(duì)于i=1,2,3...k-1,imf(i)=numberof({v}i);且numberof({v}i)意味著第i個(gè)聚類{v}i的計(jì)數(shù);k意味著聚類的數(shù)目。
37.一種存儲(chǔ)介質(zhì),其上編碼有機(jī)器可讀計(jì)算機(jī)程序碼用以分類圖像,該存儲(chǔ)介質(zhì)包括用于使處理器完成根據(jù)權(quán)利要求
33到34的任意一個(gè)的方法的指令。
專利摘要
本發(fā)明涉及一種數(shù)據(jù)處理方法,圖像處理方法,圖像分類方法及裝置,以及存儲(chǔ)介質(zhì)。通過(guò)本發(fā)明,基于標(biāo)準(zhǔn)K-均值方法提出了一種新的數(shù)據(jù)聚類方法。在圖像處理以及圖像分類中使用該新的數(shù)據(jù)聚類方法產(chǎn)生良好的性能。
文檔編號(hào)G06K9/62GK1996343SQ200610000338
公開(kāi)日2007年7月11日 申請(qǐng)日期2006年1月6日
發(fā)明者王健民, 紀(jì)新 申請(qǐng)人:佳能株式會(huì)社導(dǎo)出引文BiBTeX, EndNote, RefMan
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
乌拉特中旗| 宜兴市| 温泉县| 临城县| 商都县| 高州市| 滦平县| 光泽县| 沙田区| 扎囊县| 辽源市| 卢湾区| 公安县| 伊川县| 长兴县| 伊川县| 巴林左旗| 泰顺县| 闵行区| 拉萨市| 青神县| 会昌县| 理塘县| 余江县| 大方县| 准格尔旗| 凤冈县| 成都市| 芒康县| 洛南县| 肃北| 五原县| 手游| 大庆市| 闻喜县| 霸州市| 怀化市| 化隆| 义乌市| 正阳县| 永登县|