本申請涉及量子學,特別涉及一種改進的量子人工蜂群算法優(yōu)化k-means聚類問題方法。
背景技術(shù):
1、聚類是將數(shù)據(jù)樣本(或數(shù)據(jù)點)分成由相似樣本組成的簇,同時最大限度地提高簇內(nèi)樣本間的相似性和簇間的差異。聚類屬于機器學習中的無監(jiān)督學習,廣泛應用于圖像檢索、數(shù)據(jù)挖掘、客戶分類、對象識別和數(shù)據(jù)分析等領域。聚類算法可分為基于分區(qū)的、基于分層的方法和基于網(wǎng)格的、基于密度的方法。k-means是目前主要的分區(qū)聚類方法,因其計算簡單而廣受歡迎。然而,k-means對初始聚類中心敏感,導致聚類效果不穩(wěn)定,準確率低,這是該算法的缺點。
2、目前對k-means的優(yōu)化大都采用傳統(tǒng)的群智能算法,例如人工蜂群算法、粒子群優(yōu)化算法和蟻獅優(yōu)化算法等,但這些傳統(tǒng)的群智能算法仍存在搜索效率低、準確率不高、易陷入局部最優(yōu)等問題。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的是提供一種改進的量子人工蜂群算法優(yōu)化k-means聚類問題方法,以解決k-means對初始聚類中心敏感的缺點,能夠有效增強在聚類時的穩(wěn)定性、準確率和收斂速度。
2、為了實現(xiàn)上述發(fā)明的目的,采用如下技術(shù)方案:
3、一種改進的量子人工蜂群算法優(yōu)化k-means聚類問題,包括如下步驟:
4、s1、初始化改進的量子人工蜂群算法和k-means算法的參數(shù);
5、s2、基于量子編碼生成蜜源種群;
6、s3、對初始種群進行解空間變換并計算適應度值;
7、s4、雇傭蜂尋解階段;
8、s5、觀察蜂依概率選擇雇傭蜂進一步尋解;
9、s6、偵查蜂生成新蜜源階段;
10、s7、使種群線性減少,當達到改進的量子人工蜂群算法的最大迭代次數(shù)后跳出迭代,得到的優(yōu)化結(jié)果作為k-means的初始聚類中心;
11、s8、執(zhí)行k-means,將數(shù)據(jù)劃分到簇中,并更新每個簇中的聚類中心;
12、s9、達到k-means的終止條件,輸出最終聚類結(jié)果。
13、綜上所述,本發(fā)明提供了一種改進的量子人工蜂群算法優(yōu)化k-means聚類問題,克服了k-means對初始聚類中心敏感的缺點。通過引入兩種自適應旋轉(zhuǎn)角的量子旋轉(zhuǎn)門引導種群向更好的解決方案進化。通過引入的基于對稱函數(shù)和levy飛行的兩種移動開發(fā)策略提高了算法的挖掘能力。為了進一步提高新解質(zhì)量,在偵查蜂階段段動態(tài)調(diào)整了尋解方式。同時,通過引入線性種群減少策略,提高了種群空間的質(zhì)量,減少了算力資源。實驗結(jié)果表明在聚類問題中這些方法的使用有效提高了聚類時的效果。
1.一種改進的量子人工蜂群算法優(yōu)化k-means聚類問題方法,其特征在于,包括以下步驟:
2.如權(quán)利要求1所述的改進的量子人工蜂群算法優(yōu)化k-means聚類問題方法,其特征在于,所述步驟s1中,設置改進的量子人工蜂群算法的最大迭代次數(shù)tmax,迭代次數(shù)t=1,蜜源數(shù)量n,雇傭蜂數(shù)量p1,觀察蜂數(shù)量p2,偵查蜂數(shù)量p3,蜜源停止更新限制次數(shù)l,輸入數(shù)據(jù)集d,k-means算法的最大迭代次數(shù)maxcycle,聚類個數(shù)k。
3.如權(quán)利要求1所述的改進的量子人工蜂群算法優(yōu)化k-means聚類問題方法,其特征在于,所述步驟s2中,一個量子比特的狀態(tài)為:
4.如權(quán)利要求1所述的改進的量子人工蜂群算法優(yōu)化k-means聚類問題方法,其特征在于,所述步驟s3中,假設定義問題的解空間為ω=[xmin,xmax],解空間的轉(zhuǎn)換公式為:
5.如權(quán)利要求1所述的改進的量子人工蜂群算法優(yōu)化k-means聚類問題方法,其特征在于,所述步驟s4中,雇傭蜂使用一種基于迭代次數(shù)的自適應旋轉(zhuǎn)角的量子旋轉(zhuǎn)門搜索新的蜜源,自適應旋轉(zhuǎn)角的表達式為:
6.如權(quán)利要求1所述的改進的量子人工蜂群算法優(yōu)化k-means聚類問題方法,其特征在于,所述步驟s5中,具體包含以下步驟:
7.如權(quán)利要求1所述的改進的量子人工蜂群算法優(yōu)化k-means聚類問題方法,其特征在于,所述步驟s6中,具體包含以下步驟:
8.如權(quán)利要求1所述的改進的量子人工蜂群算法優(yōu)化k-means聚類問題方法,其特征在于,所述步驟s7中,具體包含以下步驟:
9.如權(quán)利要求1所述的改進的量子人工蜂群算法優(yōu)化k-means聚類問題方法,其特征在于,所述步驟s8中,根據(jù)相似性將所有數(shù)據(jù)依次劃分到與之相似性最大的某個簇中,相似性用歐式距離衡量,表達式為:
10.如權(quán)利要求1所述的改進的量子人工蜂群算法優(yōu)化k-means聚類問題方法,其特征在于,所述步驟s9中,比較更新前后的聚類中心,若目標函數(shù)收斂或者更新次數(shù)達到設定最大迭代次數(shù)maxcycle,則輸出聚類結(jié)果;否則,轉(zhuǎn)向步驟s8。