本公開涉及數(shù)據(jù)處理。更具體地,涉及一種評估指標(biāo)數(shù)據(jù)處理及評估方法、計(jì)算機(jī)設(shè)備、介質(zhì)及產(chǎn)品。
背景技術(shù):
1、在對例如裝備體系等對象進(jìn)行評估的方案中,通常需要結(jié)合多種不同數(shù)值范圍、不同量綱的評估指標(biāo)數(shù)據(jù)進(jìn)行綜合評估,綜合評估得到的評估結(jié)果由多種評估指標(biāo)數(shù)據(jù)加權(quán)聚合所得。由于評估指標(biāo)數(shù)據(jù)包含多種數(shù)值范圍和量綱,因此在對多種評估指標(biāo)數(shù)據(jù)進(jìn)行加權(quán)聚合前需要對各種評估指標(biāo)數(shù)據(jù)進(jìn)行歸一化處理。
2、聚類是一種常見的數(shù)據(jù)分析技術(shù),用于將數(shù)據(jù)劃分至不同的組,使得同一組內(nèi)數(shù)據(jù)之間相似度較高,而不同組之間的相似度較低。根據(jù)聚類的基本思想,可通過聚類算法實(shí)現(xiàn)對評估指標(biāo)數(shù)據(jù)的歸一化處理。相關(guān)技術(shù)中,對各種評估指標(biāo)數(shù)據(jù)進(jìn)行歸一化處理的方案存在會(huì)引入主觀誤差、客觀性不足、物理意義上的合理性不足等問題。
技術(shù)實(shí)現(xiàn)思路
1、本公開的目的在于提供一種評估指標(biāo)數(shù)據(jù)處理及評估方法、計(jì)算機(jī)設(shè)備、介質(zhì)及產(chǎn)品,以解決現(xiàn)有技術(shù)存在的問題中的至少一個(gè)。
2、為達(dá)到上述目的,本公開采用下述技術(shù)方案:
3、本公開第一方面提供一種評估指標(biāo)數(shù)據(jù)處理方法,包括:
4、獲取多個(gè)待評估目標(biāo)的評估指標(biāo)數(shù)據(jù);
5、根據(jù)不同聚類中心數(shù)量對應(yīng)的誤差平方和、部分聚類中心數(shù)量對應(yīng)的平均輪廓系數(shù)和預(yù)設(shè)的評估等級值數(shù)量確定k均值聚類算法的聚類中心數(shù)量,其中,所述k均值聚類算法的聚類中心數(shù)量小于等于預(yù)設(shè)的評估等級值數(shù)量;
6、根據(jù)所述k均值聚類算法的聚類中心數(shù)量,對所述多個(gè)待評估目標(biāo)的評估指標(biāo)數(shù)據(jù)進(jìn)行基于k均值聚類算法的分組歸一化,得到所述多個(gè)待評估目標(biāo)的評估指標(biāo)數(shù)據(jù)對應(yīng)的評估等級值。
7、可選地,所述根據(jù)不同聚類中心數(shù)量對應(yīng)的誤差平方和、部分聚類中心數(shù)量對應(yīng)的平均輪廓系數(shù)和預(yù)設(shè)的評估等級值數(shù)量確定k均值聚類算法的聚類中心數(shù)量包括:
8、在大于3的聚類中心數(shù)量中,將聚類中心數(shù)量對應(yīng)的誤差平方和的變化率由大到小排列的前n個(gè)聚類中心數(shù)量作為備選拐點(diǎn)值;
9、在n個(gè)備選拐點(diǎn)值中,篩選出滿足條件一和條件二的備選拐點(diǎn)值作為備選聚類中心數(shù)量,其中,
10、條件一為:sse(kn-1)-sse(kn)<[sse(2)-sse(3)]/2;
11、條件二為:kn≤m;
12、sse(·)表示聚類中心數(shù)量·對應(yīng)的誤差平方和;kn表示第n個(gè)備選拐點(diǎn)值,1≤n≤n;m為評估等級值數(shù)量,m>4;
13、計(jì)算各備選聚類中心數(shù)量對應(yīng)的平均輪廓系數(shù),將平均輪廓系數(shù)最大的備選聚類中心數(shù)量確定為k均值聚類算法的聚類中心數(shù)量。
14、可選地,所述備選拐點(diǎn)值的數(shù)量n的取值為2~4。
15、可選地,所述根據(jù)所述k均值聚類算法的聚類中心數(shù)量,對所述多個(gè)待評估目標(biāo)的評估指標(biāo)數(shù)據(jù)進(jìn)行基于k均值聚類算法的分組歸一化,得到所述多個(gè)待評估目標(biāo)的評估指標(biāo)數(shù)據(jù)對應(yīng)的評估等級值包括:
16、根據(jù)所述k均值聚類算法的聚類中心數(shù)量,對所述多個(gè)待評估目標(biāo)的評估指標(biāo)數(shù)據(jù)進(jìn)行基于所述k均值聚類算法的聚類,并判斷所述k均值聚類算法的聚類中心數(shù)量與所述評估等級值數(shù)量的關(guān)系:
17、若所述k均值聚類算法的聚類中心數(shù)量等于所述評估等級值數(shù)量,則將所述基于所述k均值聚類算法的聚類得到的聚類結(jié)果構(gòu)成的評估指標(biāo)數(shù)據(jù)分組,對應(yīng)為所述多個(gè)待評估目標(biāo)的評估指標(biāo)數(shù)據(jù)對應(yīng)的評估等級值;
18、若所述k均值聚類算法的聚類中心數(shù)量小于所述評估等級值數(shù)量,則將將所述基于所述k均值聚類算法的聚類得到的聚類結(jié)果中包含評估指標(biāo)數(shù)據(jù)最多的簇作為第一簇,并判斷由聚類中心數(shù)量由2增加至所述k均值聚類算法的聚類中心數(shù)量時(shí)對應(yīng)的平均輪廓系數(shù)是否為單調(diào)遞減:
19、若否,則將所述第一簇中的評估指標(biāo)數(shù)據(jù)劃分至多個(gè)第一子簇,將由所述聚類結(jié)果中除所述第一簇之外的其他簇和所述多個(gè)第一子簇構(gòu)成的評估指標(biāo)數(shù)據(jù)分組,對應(yīng)為所述多個(gè)待評估目標(biāo)的評估指標(biāo)數(shù)據(jù)對應(yīng)的評估等級值,所述第一子簇的數(shù)量設(shè)置為使得所述評估指標(biāo)數(shù)據(jù)分組的分組數(shù)量與所述評估等級值數(shù)量相等;
20、若是,則將所述聚類結(jié)果中的第二簇合并為一個(gè)簇并將聚類結(jié)果中的第三簇合并為一個(gè)簇,所述第二簇包含的評估指標(biāo)數(shù)據(jù)的數(shù)據(jù)值小于所述第一簇包含的評估指標(biāo)數(shù)據(jù)的數(shù)據(jù)值,所述第三簇包含的評估指標(biāo)數(shù)據(jù)的數(shù)據(jù)值大于所述第一簇包含的評估指標(biāo)數(shù)據(jù)的數(shù)據(jù)值,將所述第一簇中的評估指標(biāo)數(shù)據(jù)劃分至多個(gè)第一子簇,將由合并后的第二簇、合并后的第三簇和所述多個(gè)第一子簇構(gòu)成的評估指標(biāo)數(shù)據(jù)分組,對應(yīng)為所述多個(gè)待評估目標(biāo)的評估指標(biāo)數(shù)據(jù)對應(yīng)的評估等級值,所述第一子簇的數(shù)量設(shè)置為使得所述評估指標(biāo)數(shù)據(jù)分組的分組數(shù)量與所述評估等級值數(shù)量相等。
21、可選地,所述將所述第一簇中的評估指標(biāo)數(shù)據(jù)劃分至多個(gè)第一子簇的劃分方案為第j個(gè)第一子簇包含的評估指標(biāo)數(shù)據(jù)的數(shù)據(jù)值大于第(j-1)個(gè)第一子簇包含的評估指標(biāo)數(shù)據(jù)的數(shù)據(jù)值且各第一子簇包含的評估指標(biāo)數(shù)據(jù)數(shù)量差最小的劃分方案,j∈[2,j],j為第一子簇的數(shù)量。
22、本公開第二方面提供一種評估方法,包括:
23、獲取多個(gè)待評估目標(biāo)的多種評估指標(biāo)數(shù)據(jù);
24、對于所述多個(gè)待評估目標(biāo)的多種評估指標(biāo)數(shù)據(jù)中的每一種,分別執(zhí)行本公開第一方面提供的評估指標(biāo)數(shù)據(jù)處理方法,得到多個(gè)待評估目標(biāo)的每一種評估指標(biāo)數(shù)據(jù)對應(yīng)的評估等級值;
25、對一待評估目標(biāo)的每一種評估指標(biāo)數(shù)據(jù)對應(yīng)的評估等級值進(jìn)行加權(quán)聚合,得到該待評估目標(biāo)的評估等級值。
26、可選地,對于所述多種評估指標(biāo)數(shù)據(jù)中的每一種,預(yù)設(shè)的評估等級值數(shù)量相同。
27、本公開第三方面提供一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述程序時(shí),實(shí)現(xiàn)本公開第一方面或第二方面提供的方法。
28、本公開第四方面一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí),實(shí)現(xiàn)本公開第一方面或第二方面提供的方法。
29、本公開第五方面一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí),實(shí)現(xiàn)本公開第一方面或第二方面提供的方法。
30、本公開的有益效果如下:
31、本公開所述技術(shù)方案可實(shí)現(xiàn)對評估指標(biāo)數(shù)據(jù)的動(dòng)態(tài)分組歸一化,適用于具有各種分布特征的評估指標(biāo)數(shù)據(jù),可提升評估指標(biāo)數(shù)據(jù)歸一化的客觀性和物理意義上的合理性,從而保證對目標(biāo)進(jìn)行綜合評估的評估結(jié)果的可靠性。
1.一種評估指標(biāo)數(shù)據(jù)處理方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)不同聚類中心數(shù)量對應(yīng)的誤差平方和、部分聚類中心數(shù)量對應(yīng)的平均輪廓系數(shù)和預(yù)設(shè)的評估等級值數(shù)量確定k均值聚類算法的聚類中心數(shù)量包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述備選拐點(diǎn)值的數(shù)量n的取值為2~4。
4.根據(jù)權(quán)利要求1-3中任一項(xiàng)所述的方法,其特征在于,所述根據(jù)所述k均值聚類算法的聚類中心數(shù)量,對所述多個(gè)待評估目標(biāo)的評估指標(biāo)數(shù)據(jù)進(jìn)行基于k均值聚類算法的分組歸一化,得到所述多個(gè)待評估目標(biāo)的評估指標(biāo)數(shù)據(jù)對應(yīng)的評估等級值包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述將所述第一簇中的評估指標(biāo)數(shù)據(jù)劃分至多個(gè)第一子簇的劃分方案為第j個(gè)第一子簇包含的評估指標(biāo)數(shù)據(jù)的數(shù)據(jù)值大于第(j-1)個(gè)第一子簇包含的評估指標(biāo)數(shù)據(jù)的數(shù)據(jù)值且各第一子簇包含的評估指標(biāo)數(shù)據(jù)數(shù)量差最小的劃分方案,j∈[2,j],j為第一子簇的數(shù)量。
6.一種評估方法,其特征在于,包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,對于所述多種評估指標(biāo)數(shù)據(jù)中的每一種,預(yù)設(shè)的評估等級值數(shù)量相同。
8.一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述程序時(shí),實(shí)現(xiàn)如權(quán)利要求1-5中任一項(xiàng)所述的方法,或,實(shí)現(xiàn)如權(quán)利要求6或7所述的方法。
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,該程序被處理器執(zhí)行時(shí),實(shí)現(xiàn)如權(quán)利要求1-5中任一項(xiàng)所述的方法,或,實(shí)現(xiàn)如權(quán)利要求6或7所述的方法。
10.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,其特征在于,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí),實(shí)現(xiàn)如權(quán)利要求1-5中任一項(xiàng)所述的方法,或,實(shí)現(xiàn)如權(quán)利要求6或7所述的方法。