本發(fā)明涉及一種基于選取合適聚類數(shù)目的聚類算法的數(shù)字圖像處理方法,屬于聚類算法分割技術(shù)領(lǐng)域。
背景技術(shù):
在圖像處理領(lǐng)域中,圖像分割對(duì)于圖像的分類和處理是非常重要的。因此,我們需要將這些圖像劃分成不同的區(qū)域,并提取所感興趣的對(duì)象。在不同的圖像分割技術(shù)中,聚類是重要的方法之一,并且在灰度圖像的圖像分割上得到廣泛的應(yīng)用。目前有很多聚類算法:k-means聚類;Fuzzy c-means聚類;山峰聚類和ISODATA方法等。其中最常用的算法是k-means聚類算法。K-means算法是一種無監(jiān)督聚類算法,它具有直觀、快速和容易實(shí)現(xiàn)等特性。盡管這種算法是非常受歡迎的,它仍然具有一些缺陷。其中,最主要的是k-means聚類需要提前知道聚類數(shù),這將降低它的魯棒性和穩(wěn)定性。
圖像分割就是將圖像中有意義的特征或區(qū)域提取出來的一個(gè)過程。特別是在醫(yī)療領(lǐng)域,醫(yī)學(xué)研究者需要從背景中提取感興趣的區(qū)域。因此,我們需要將這些圖像劃分成不同的區(qū)域,并提取所感興趣的對(duì)象。同時(shí),在各區(qū)域內(nèi)的像素點(diǎn)應(yīng)具有較高的相似性,區(qū)域之間的像素點(diǎn)應(yīng)具有較高的差異性。圖像分割的應(yīng)用非常廣泛,它幾乎出現(xiàn)在有關(guān)于圖像處理的所有領(lǐng)域,是圖像處理中的一個(gè)基礎(chǔ)也是重要的步驟。
在不同的圖像分割技術(shù)中,聚類是重要的方法之一,并且在灰度圖像的圖像分割上得到廣泛的應(yīng)用。聚類是分組的一組物體進(jìn)入相似地特征類的處理過程。它已在許多領(lǐng)域被廣泛使用,包括在統(tǒng)計(jì)、機(jī)器學(xué)習(xí)、模式識(shí)別、數(shù)據(jù)挖掘和圖像處理等。在數(shù)字圖像處理中,分割在圖像描述和分類中是必不可少的。該技術(shù)通常用于許多消費(fèi)電子產(chǎn)品(即常規(guī)的數(shù)字圖像),或在一個(gè)特定的應(yīng)用領(lǐng)域,如醫(yī)學(xué)數(shù)字圖像。算法通?;谙嗨菩院吞厥庑?,其可分為不同的類別,如閾值、模板匹配、區(qū)域生長(zhǎng)、邊緣檢測(cè)、并群集。聚類算法已經(jīng)被應(yīng)用在各種領(lǐng)域,如工程、計(jì)算機(jī)和數(shù)學(xué)數(shù)字圖像分割技術(shù)。最近,聚類算法的應(yīng)用已被進(jìn)一步施加到醫(yī)療領(lǐng)域中,特別是在生物醫(yī)學(xué)圖像分析,其特征在于圖像是由醫(yī)學(xué)成像設(shè)備產(chǎn)生的。以前的研究證明,聚類算法能夠分割和確定在醫(yī)學(xué)圖像中感興趣的特定區(qū)域。在生物醫(yī)學(xué)圖像分割任務(wù)中,聚類算法通常被認(rèn)為是適合從已知的解剖信息中分割出感興趣的結(jié)構(gòu)。
基于最小化形式的目標(biāo)函數(shù)的聚類方法中,最廣泛使用的就是K-means聚類。K-means算法也被稱為K均值算法,是一種得到最廣泛使用的聚類算法。它將各個(gè)聚類子集內(nèi)的所有數(shù)據(jù)樣本的均值作為該聚類的代表點(diǎn),算法的主要思想是通過迭代過程把數(shù)據(jù)集劃分為不同的類別,使得評(píng)價(jià)聚類性能的準(zhǔn)則函數(shù)達(dá)到最優(yōu),從而使生成的每個(gè)聚類內(nèi)緊湊,并且類間是獨(dú)立的。這一算法不適合處理離散型屬性,但是對(duì)于連續(xù)型具有較好的聚類效果,用于圖像分割具有直觀、快速、易于實(shí)現(xiàn)的特點(diǎn)。盡管這種算法是非常受歡迎的,它仍然具有一些缺陷。首先,k-means聚類過程容易陷入局部極小。其次,它不適合用于處理具有離散屬性的數(shù)據(jù)。另外,它還有可能忽略一些小的聚類。值得注意的是k-means聚類需要提前知道聚類數(shù),這將降低它的魯棒性和穩(wěn)定性。
技術(shù)實(shí)現(xiàn)要素:
發(fā)明概述
針對(duì)現(xiàn)有技術(shù)的不足,本發(fā)明提供了一種基于選取合適聚類數(shù)目的聚類算法的數(shù)字圖像處理方法;
本發(fā)明介紹了一種最優(yōu)化準(zhǔn)則來解決聚類數(shù)目對(duì)最終分割圖像的影響。我們基于類內(nèi)像素差異和類間像素差異來定義一個(gè)公式。通過該標(biāo)準(zhǔn),可以用盡量少的聚類數(shù)目得到較好的分割結(jié)果。通過客觀的評(píng)估測(cè)試量度NU and F(I),我們驗(yàn)證了該標(biāo)準(zhǔn)性能的穩(wěn)定性。此外,本發(fā)明還改進(jìn)了傳統(tǒng)k-means算法中確定初始聚類中心的方法,利用分位數(shù)策略代替了隨機(jī)選擇的方法。使用分位數(shù)來確定初始聚類中心可以使分割圖像更穩(wěn)定,同時(shí)可以節(jié)省運(yùn)行時(shí)間。
發(fā)明詳述
術(shù)語解釋
1、分位數(shù),分位數(shù)即分位點(diǎn),拿四分位數(shù)為例,即統(tǒng)計(jì)學(xué)中,把所有數(shù)值由小到大排列并分成四等份,處于三個(gè)分割點(diǎn)位置的數(shù)值就是四分位數(shù)。在本發(fā)明中,設(shè)聚類數(shù)位K,即把要分割的圖像的所有像素由小到大排列分成K等份,求出每等份的中心值作為初始聚類中心。
2、K-means聚類,一種在數(shù)據(jù)集中尋找數(shù)據(jù)聚類的算法,讓差異性度量的成本函數(shù)(目標(biāo)函數(shù))達(dá)到最小。
本發(fā)明的技術(shù)方案如下:
一種基于選取合適聚類數(shù)目的聚類算法的數(shù)字圖像處理方法,具體步驟包括:
(1)輸入灰度圖像;
(2)設(shè)置需要迭代聚類數(shù)K的數(shù)目;K的初始值為2;
眾所周知,在傳統(tǒng)的k-means算法中迭代聚類數(shù)K是未知的。實(shí)際上,對(duì)于大多數(shù)的數(shù)字圖像和顯微圖像,把迭代聚類數(shù)K設(shè)置為2,這是不足以恰當(dāng)?shù)倪M(jìn)行圖像分割的。也有一些實(shí)驗(yàn)者根據(jù)自己的經(jīng)驗(yàn)來選擇k的值,例如,頭部醫(yī)學(xué)圖像包括的區(qū)域?yàn)檐浗M織,骨頭,脂肪和背景區(qū)域,所以他們把k的值設(shè)定為4。為了確定k的最優(yōu)值,本發(fā)明找到一種測(cè)量標(biāo)準(zhǔn),自動(dòng)地確定最優(yōu)的k值。在進(jìn)行聚類之前,設(shè)置k從2至16循環(huán),以代替一個(gè)固定假設(shè)值。提供了更直觀的趨勢(shì)以幫助我們分析。
(3)搜索初始聚類中心:使用分位數(shù)的概念尋找初始聚類中心;具體步驟包括:
A、將步驟(1)輸入的灰度圖像中的所有像素按照灰度值進(jìn)行升序排列,得到向量,即:所述灰度圖像的大小m*m為一個(gè)矩陣,將該矩陣轉(zhuǎn)換成1*m2的向量,再將1*m2的向量中的所有元素按從小到大的升序排列,得到所述向量;所述向量的分位數(shù)Pi通過式(Ⅰ)計(jì)算,i=1,2,...,K:
B、通過步驟A計(jì)算得到K個(gè)分位數(shù),包括P1,P2,...,Pi,P1,P2,...,Pi分別對(duì)應(yīng)著步驟A所述向量,P1,P2,...,Pi即為步驟(1)輸入的灰度圖像的初始聚類中心;
例如,K=4,計(jì)算得到四個(gè)分位點(diǎn):P1,P2,P3,P4,P1,P2,P3,P4四個(gè)值的結(jié)果為:12.5,37.5,62.5,87.5。這些值對(duì)應(yīng)著向量的初始聚類中心。
根據(jù)傳統(tǒng)K-均值聚類算法,需要從圖像中隨機(jī)選擇k個(gè)點(diǎn)作為初始聚類中心。然后該算法根據(jù)最小歐氏距離將數(shù)據(jù)點(diǎn)分配到各個(gè)聚類中。通過一定次數(shù)的迭代,它最大限度地減少?gòu)拿總€(gè)對(duì)象到聚類中心的距離之和,直至這些質(zhì)心不會(huì)再發(fā)生變化。但是,這種傳統(tǒng)的方法效率低,運(yùn)行時(shí)間比較久。而本發(fā)明尋找初始聚類中心是非常高效的,它相比隨機(jī)尋找的方法節(jié)省了運(yùn)行時(shí)間。在接下來的說明中,會(huì)進(jìn)行對(duì)比測(cè)試來驗(yàn)證它的效率。
(4)按照標(biāo)準(zhǔn)的k-means聚類步驟進(jìn)行圖像分割,輸出的分割圖像;
(5)采用最優(yōu)化準(zhǔn)則選出最優(yōu)分割結(jié)果,具體步驟包括:
①通過式(Ⅱ)求取輸出的分割圖像的類內(nèi)差異值Sin,類內(nèi)差異值Sin是指在一個(gè)聚類中所有像素的像素值之間的標(biāo)準(zhǔn)偏差:
式(Ⅱ)中,C1,C2,C3,......,Ci是指步驟(3)求取的初始聚類中心P1,P2,...,Pi對(duì)應(yīng)的聚類,n是當(dāng)前分割圖像中像素的數(shù)量,x代表在聚類Ci中每個(gè)像素的像素值,是第i個(gè)類中所有像素的像素值的平均值;
②通過式(Ⅲ)求取輸出的分割圖像的類間差異值Sout,類間差異值Sout是指i個(gè)初始聚類中心的像素值之間的標(biāo)準(zhǔn)偏差,其值越大越好。
式(Ⅲ)中,K是指聚類數(shù),Pi是指第i個(gè)初始聚類中心(的像素值),是所有初始聚類中心的平均像素值;
③通過式(Ⅳ)求取最優(yōu)化標(biāo)準(zhǔn)為G,如下所示:
④根據(jù)以上步驟依次求取K為2、3、4、5、6、7、8、9、10、11、12、13、14、15、16時(shí)對(duì)應(yīng)的最優(yōu)化標(biāo)準(zhǔn)為G,根據(jù)求取的對(duì)應(yīng)的最優(yōu)化標(biāo)準(zhǔn)G獲得最好的分割效果。
根據(jù)本發(fā)明優(yōu)選的,所述步驟(4),具體步驟包括:
a、初始化聚類中心Pi;
b、確定隸屬度矩陣uij:當(dāng)?shù)趈個(gè)像素點(diǎn)的像素值Xj屬于Ci時(shí),uij為1,否則為0;即:如果Pi是所有初始化聚類中心中最接近Xj的中心點(diǎn),則Xj屬于Ci;
c、通過式(Ⅴ)計(jì)算成本函數(shù)J:
當(dāng)計(jì)算得到的成本函數(shù)J低于0.005時(shí),則停止計(jì)算成本函數(shù),否則繼續(xù)計(jì)算成本函數(shù);
d、根據(jù)式(Ⅵ)獲取最優(yōu)聚類中心,即是聚類Ci的平均值:
式(Ⅵ)中,|Ci|即為Ci的大小;
e、輸出分割圖像。
本發(fā)明的有益效果為:
1、本發(fā)明提出了一個(gè)在分割圖像中可以決定聚類數(shù)目的最優(yōu)化準(zhǔn)則。它采用了類內(nèi)差異和類間差異的概念以較少的聚類數(shù)目可以獲得最佳的分割結(jié)果。實(shí)驗(yàn)結(jié)果表明,該準(zhǔn)則具有足夠的效率和穩(wěn)定性。此外,其他的評(píng)價(jià)方法也得到一致的結(jié)果。
2、本發(fā)明通過改進(jìn)尋找初始聚類中心方法的k-means算法也比傳統(tǒng)的k-means算法在運(yùn)行時(shí)間上更有優(yōu)勢(shì)。
附圖說明
圖1為本發(fā)明所述基于選取合適聚類數(shù)目的聚類算法的數(shù)字圖像處理方法的流程示意圖;
圖2為實(shí)施例中得到的不同K值下得到的最優(yōu)化標(biāo)準(zhǔn)為G的變化趨勢(shì)圖;
具體實(shí)施方式
下面結(jié)合說明書附圖和實(shí)施例對(duì)本發(fā)明做進(jìn)一步限定,但不限于此。
實(shí)施例
一種基于選取合適聚類數(shù)目的聚類算法的數(shù)字圖像處理方法,本實(shí)施例用南加州大學(xué)的USC-SIPI圖像測(cè)試庫(kù)來驗(yàn)證,如圖1所示,具體步驟包括:
(1)輸入灰度圖像;
(2)設(shè)置需要迭代聚類數(shù)K的數(shù)目;K的初始值為2;
眾所周知,在傳統(tǒng)的k-means算法中迭代聚類數(shù)K是未知的。實(shí)際上,對(duì)于大多數(shù)的數(shù)字圖像和顯微圖像,把迭代聚類數(shù)K設(shè)置為2,這是不足以恰當(dāng)?shù)倪M(jìn)行圖像分割的。也有一些實(shí)驗(yàn)者根據(jù)自己的經(jīng)驗(yàn)來選擇k的值,例如,頭部醫(yī)學(xué)圖像包括的區(qū)域?yàn)檐浗M織,骨頭,脂肪和背景區(qū)域,所以他們把k的值設(shè)定為4。為了確定k的最優(yōu)值,本發(fā)明找到一種測(cè)量標(biāo)準(zhǔn),自動(dòng)地確定最優(yōu)的k值。在進(jìn)行聚類之前,設(shè)置k從2至16循環(huán),以代替一個(gè)固定假設(shè)值。提供了更直觀的趨勢(shì)以幫助我們分析。
(3)搜索初始聚類中心:使用分位數(shù)的概念尋找初始聚類中心;具體步驟包括:
A、將步驟(1)輸入的灰度圖像中的所有像素按照灰度值進(jìn)行升序排列,得到向量,即:所述灰度圖像的大小m*m為一個(gè)矩陣,將該矩陣轉(zhuǎn)換成1*m2的向量,再將1*m2的向量中的所有元素按從小到大的升序排列,得到所述向量;所述向量的分位數(shù)Pi通過式(Ⅰ)計(jì)算,i=1,2,...,K:
B、通過步驟A計(jì)算得到K個(gè)分位數(shù),包括P1,P2,...,Pi,P1,P2,...,Pi分別對(duì)應(yīng)著步驟A所述向量,P1,P2,...,Pi即為步驟(1)輸入的灰度圖像的初始聚類中心;
K=4,計(jì)算得到四個(gè)分位點(diǎn):P1,P2,P3,P4,P1,P2,P3,P4四個(gè)值的結(jié)果為:12.5,37.5,62.5,87.5。這些值對(duì)應(yīng)著向量的初始聚類中心。
根據(jù)傳統(tǒng)K-均值聚類算法,需要從圖像中隨機(jī)選擇k個(gè)點(diǎn)作為初始聚類中心。然后該算法根據(jù)最小歐氏距離將數(shù)據(jù)點(diǎn)分配到各個(gè)聚類中。通過一定次數(shù)的迭代,它最大限度地減少?gòu)拿總€(gè)對(duì)象到聚類中心的距離之和,直至這些質(zhì)心不會(huì)再發(fā)生變化。但是,這種傳統(tǒng)的方法效率低,運(yùn)行時(shí)間比較久。而本發(fā)明尋找初始聚類中心是非常高效的,它相比隨機(jī)尋找的方法節(jié)省了運(yùn)行時(shí)間。在接下來的說明中,會(huì)進(jìn)行對(duì)比測(cè)試來驗(yàn)證它的效率。
(4)按照標(biāo)準(zhǔn)的k-means聚類步驟進(jìn)行圖像分割,輸出的分割圖像;具體步驟包括:
a、初始化聚類中心Pi;
b、確定隸屬度矩陣uij:當(dāng)?shù)趈個(gè)像素點(diǎn)的像素值Xj屬于Ci時(shí),uij為1,否則為0;即:如果Pi是所有初始化聚類中心中最接近Xj的中心點(diǎn),則Xj屬于Ci;
c、通過式(Ⅴ)計(jì)算成本函數(shù)J:
當(dāng)計(jì)算得到的成本函數(shù)J低于0.005時(shí),則停止計(jì)算成本函數(shù),否則繼續(xù)計(jì)算成本函數(shù);
d、根據(jù)式(Ⅵ)獲取最優(yōu)聚類中心,即是聚類Ci的平均值:
式(Ⅵ)中,|Ci|即為Ci的大??;
e、輸出分割圖像。
(5)采用最優(yōu)化準(zhǔn)則選出最優(yōu)分割結(jié)果,具體步驟包括:
①通過式(Ⅱ)求取輸出的分割圖像的類內(nèi)差異值Sin,類內(nèi)差異值Sin是指在一個(gè)聚類中所有像素的像素值之間的標(biāo)準(zhǔn)偏差:
式(Ⅱ)中,C1,C2,C3,......,Ci是指步驟(3)求取的初始聚類中心P1,P2,...,Pi對(duì)應(yīng)的聚類,n是當(dāng)前分割圖像中像素的數(shù)量,x代表在聚類Ci中每個(gè)像素的像素值,是第i個(gè)類中所有像素的像素值的平均值;
②通過式(Ⅲ)求取輸出的分割圖像的類間差異值Sout,類間差異值Sout是指i個(gè)初始聚類中心的像素值之間的標(biāo)準(zhǔn)偏差,其值越大越好。
式(Ⅲ)中,K是指聚類數(shù),Pi是指第i個(gè)初始聚類中心(的像素值),是所有初始聚類中心的平均像素值;
③通過式(Ⅳ)求取最優(yōu)化標(biāo)準(zhǔn)為G,如下所示:
④根據(jù)以上步驟依次求取K為2、3、4、5、6、7、8、9、10、11、12、13、14、15、16時(shí)對(duì)應(yīng)的最優(yōu)化標(biāo)準(zhǔn)為G,根據(jù)求取的對(duì)應(yīng)的最優(yōu)化標(biāo)準(zhǔn)G獲得最好的分割效果。如圖2所示,G值的變化趨勢(shì)就會(huì)像圖2所示的一樣。我們發(fā)現(xiàn)當(dāng)聚類數(shù)超過4之后G值的趨勢(shì)是趨于水平的。我們可以解釋為在K小于4時(shí),這些聚類不足以將圖像進(jìn)行良好的分類。而當(dāng)K大于4時(shí),G值幾乎收斂成一條直線,說明在K等于4之后,每幅分割圖像的分類效果不會(huì)有大的改變,即已經(jīng)有足夠的聚類數(shù)進(jìn)行分類了。因此當(dāng)k等于4時(shí),我們可以獲得最好的分割效果。
最優(yōu)化準(zhǔn)則:當(dāng)我們使用改進(jìn)的k-means聚類算法之前,要先設(shè)置迭代次數(shù)K來進(jìn)行實(shí)驗(yàn)。我們嘗試使用不同的K去得到不同的分割結(jié)果因?yàn)槲覀冃枰米顑?yōu)化準(zhǔn)則來評(píng)估哪個(gè)值可以給我們帶來最好的分割結(jié)果。許多準(zhǔn)則已經(jīng)開發(fā)用于確定k-means聚類的有效性,所有這些準(zhǔn)則都試圖去找到分割效果最好的聚類數(shù)。例如,Bezdek等人鑒于修改的Hubert統(tǒng)計(jì),Davies–Bouldin和Dunn指標(biāo)提出了聚類有效性的一些新的指標(biāo)。Milligan等人測(cè)試了很多程序去確定一個(gè)數(shù)據(jù)集中聚類的數(shù)目。Cooper等人測(cè)試了在聚類分析中聚類的數(shù)目對(duì)測(cè)量誤差的影響。
作為一個(gè)聚類算法,我們肯定希望在一個(gè)聚類中的所有聚類的類內(nèi)差異最小,同時(shí)一幅數(shù)字圖像所有類的類間差異最大。我們定義類內(nèi)差異值為Sin,它代表在一個(gè)類中所有像素的像素值之間的標(biāo)準(zhǔn)偏差。假設(shè)初始聚類中心為C1,C2,C3,......,Ci,則Sin定義為:
通過計(jì)算所有聚類中心之間的標(biāo)準(zhǔn)差得到它,被定義為:
考慮前面提到的類內(nèi)差異值和類間差異值,我們需要組合它們變成比值作為測(cè)量標(biāo)準(zhǔn)。因?yàn)槲覀兿M钚』悆?nèi)差異值,最大化類間差異值,所以我們應(yīng)該將類內(nèi)差異值放到分子上,把類間差異值放到分母上,公式為:
我們確定最優(yōu)化結(jié)果只需要找到比值的最小值。通過多次的實(shí)驗(yàn),我們發(fā)現(xiàn)當(dāng)使用我們的算法去分割圖像時(shí),Sin呈現(xiàn)一個(gè)逐漸下降的趨勢(shì),Sout首先增加然后逐漸趨于持平。但是Sin的變化快于Sout,這將會(huì)導(dǎo)致比值呈下降趨勢(shì)。如果結(jié)果是這樣的,我們則不能確定聚類的最佳數(shù)量。因此我們需要修改公式來解決這個(gè)問題,重新排列展示公式:
即式(IV)。
通過重排公式我們發(fā)現(xiàn),中間一項(xiàng)為2次冪,而常數(shù)K只是一次冪。因此如果它只乘以K,該公式將導(dǎo)致單調(diào)下降。為了解決這個(gè)問題,我們?cè)谠械墓缴显俪艘訩,使得后兩項(xiàng)的冪數(shù)相同。這樣就可以產(chǎn)生我們?cè)诒疚闹刑岢龅淖顑?yōu)化標(biāo)準(zhǔn)。
為了進(jìn)一步證明提出方法的能力和適用性,我們通過與Fuzzy C-means算法和OTSU算法的對(duì)比來檢驗(yàn)我們的方法。首先,我們使用被稱為歸一化度量(NU)的灰度圖像的客觀評(píng)價(jià)參數(shù)來比較分割結(jié)果。歸一化度量的公式:
NU=1-GU/C (Ⅷ)
f(x,y)為一幅灰度圖像,Zi是第i個(gè)分割區(qū)域,Ai是區(qū)域Zi的面積,C是歸一化參數(shù),GU是f(x,y)的歸一化量度。一個(gè)區(qū)域的特征一致性可以通過計(jì)算每個(gè)區(qū)域在所屬區(qū)域的方差來評(píng)價(jià)。因此,一個(gè)更好的分割結(jié)果應(yīng)該具有較大的NU值。我們分別使用Fuzzy C-means算法和改進(jìn)的k-means算法對(duì)原始圖像和分割圖像計(jì)算NU的值,把K的值分別設(shè)置為2,3,4。同時(shí),我們還增加了當(dāng)K等于2時(shí)OTSU算法的結(jié)果。
因?yàn)镺TSU輸出的是二值圖像,所以我們只能展示它兩個(gè)聚類時(shí)的結(jié)果。通過實(shí)驗(yàn)可以得出,NU的最大值是在k等于4時(shí)用改進(jìn)的k-means算法分割的結(jié)果。這個(gè)結(jié)論和之前通過最優(yōu)化準(zhǔn)則得到的結(jié)論一致。此外我們證明了在所有的聚類數(shù)目中用改進(jìn)的k-means算法都比fuzzy c-means有更好的分割結(jié)果。
為了局部和全局同時(shí)評(píng)價(jià)結(jié)果,我們又使用了Liu和Yang的評(píng)價(jià)函數(shù)。評(píng)價(jià)函數(shù)定義為:
其中I是用來被分割的圖像,k是聚類數(shù),Ai是第i個(gè)區(qū)域的面積,ei被定義為原始圖像和分割圖像在這個(gè)區(qū)域的每個(gè)像素點(diǎn)之間的特征向量的歐式距離總和。
該函數(shù)不會(huì)因?yàn)槿藶榈脑O(shè)置參數(shù)而對(duì)結(jié)論產(chǎn)生影響。F(I)的值越小就說明分割結(jié)果越好。我們還可以得出結(jié)論,即由我們的最優(yōu)化準(zhǔn)則產(chǎn)生的聚類數(shù)為4的分割圖像具有最小的F(I)值。驗(yàn)證結(jié)果也證實(shí),由我們的最優(yōu)化準(zhǔn)則選定的分割圖像是最好的分割結(jié)果。
此外,改進(jìn)的K-means算法比傳統(tǒng)的K-means算法在處理時(shí)間上更有效率。我們從數(shù)據(jù)庫(kù)中選擇了5幅圖像進(jìn)行測(cè)試。每個(gè)圖像的處理時(shí)間是聚類數(shù)k從2到6循環(huán)處理的總時(shí)間。實(shí)驗(yàn)結(jié)果證明了改進(jìn)的k-means算法相比傳統(tǒng)的k-means算法得到了更短的運(yùn)行時(shí)間。這個(gè)結(jié)果也說明了在改進(jìn)了新招初始聚類中心的方法后算法展現(xiàn)了更高的效率。