本發(fā)明涉及數(shù)據(jù)清理,具體涉及一種用于電控柜的全面自動化測試方法及系統(tǒng)。
背景技術(shù):
1、電控柜,全稱為電氣控制柜,通過集成多種電氣元件從而實現(xiàn)對設(shè)備的集中控制,即電控柜的全面自動化。為了發(fā)現(xiàn)設(shè)備的潛在故障點從而提高電控柜的可靠性和使用壽命,還需要對電控柜的性能進(jìn)行測試,現(xiàn)有方法通常通過軟件模擬檢測實現(xiàn)對電控柜的全面自動化測試。
2、當(dāng)前,在對電控柜進(jìn)行測試時,通常會獲取電控柜的大量運行數(shù)據(jù),然后利用軟件模擬進(jìn)行檢測,因此獲取的數(shù)據(jù)的質(zhì)量對于整個模擬檢測過程至關(guān)重要。由于采集數(shù)據(jù)時會受到環(huán)境等因素的干擾,獲取到的數(shù)據(jù)會存在噪聲,而在對數(shù)據(jù)進(jìn)行去噪時,現(xiàn)有技術(shù)通常采用無差別去噪,然而,考慮到仿真模型檢測所需的數(shù)據(jù)量較大,使用無差別去噪會造成效率低下,因此如何在大量的數(shù)據(jù)中,精準(zhǔn)且高效的篩選出存在噪聲的數(shù)據(jù)成為了模擬檢測過程中的關(guān)鍵問題。
技術(shù)實現(xiàn)思路
1、為了解決使用無差別去噪的方法對大量數(shù)據(jù)進(jìn)行去噪會造成效率低下,進(jìn)而影響到測試結(jié)果的準(zhǔn)確度的技術(shù)問題,本發(fā)明的目的在于提供一種用于電控柜的全面自動化測試方法及系統(tǒng),所采用的技術(shù)方案具體如下:
2、對于電控柜的任意一項性能參數(shù),獲取每個測試時段內(nèi)該性能參數(shù)的參數(shù)數(shù)據(jù)集,每個所述參數(shù)數(shù)據(jù)集中包括多個數(shù)據(jù)周期的參數(shù)時序數(shù)據(jù);
3、根據(jù)每個參數(shù)數(shù)據(jù)集中各個參數(shù)時序數(shù)據(jù)之間的相似情況,對所有的參數(shù)時序數(shù)據(jù)進(jìn)行聚類,得到聚類結(jié)果;根據(jù)每個參數(shù)數(shù)據(jù)集中所有參數(shù)時序數(shù)據(jù)的數(shù)值特征以及頻繁模式挖掘算法,對聚類結(jié)果中各個聚類簇中的參數(shù)時序數(shù)據(jù)進(jìn)行融合分析,得到每個參數(shù)數(shù)據(jù)集對應(yīng)的頻繁模式模型;
4、在所述頻繁模式模型中,基于各個項在所有參數(shù)時序數(shù)據(jù)中的分布情況、頻繁項集之間的相似情況,以及頻繁項集在頻繁模式模型中的位置,確定每個參數(shù)數(shù)據(jù)集的噪聲存在概率;根據(jù)每個參數(shù)數(shù)據(jù)集的噪聲存在概率、參數(shù)數(shù)據(jù)集中各個參數(shù)時序數(shù)據(jù)中數(shù)值的變化趨勢改變情況以及數(shù)值波動情況,得到每個參數(shù)數(shù)據(jù)集的數(shù)據(jù)質(zhì)量;
5、根據(jù)所有測試時段的參數(shù)數(shù)據(jù)集對應(yīng)的數(shù)據(jù)質(zhì)量,在所有參數(shù)數(shù)據(jù)集中篩選噪聲數(shù)據(jù)集并對噪聲數(shù)據(jù)集中的參數(shù)時序數(shù)據(jù)進(jìn)行去噪,得到所有測試時段對應(yīng)的高質(zhì)量數(shù)據(jù)集;基于所有性能參數(shù)對應(yīng)的所有高質(zhì)量數(shù)據(jù)集進(jìn)行電控柜的性能測試。
6、進(jìn)一步地,所述聚類結(jié)果的獲取方法包括:
7、在每個參數(shù)數(shù)據(jù)集中,對于任意兩個不同數(shù)據(jù)周期內(nèi)的參數(shù)時序數(shù)據(jù),基于數(shù)值之間的差異性以及數(shù)值的斜率值之間的差異情況,確定兩個參數(shù)時序數(shù)據(jù)之間的差異特征值;
8、將參數(shù)時序數(shù)據(jù)之間的差異特征值作為距離度量,基于預(yù)設(shè)k值對參數(shù)數(shù)據(jù)集中的所有參數(shù)時序數(shù)據(jù)進(jìn)行k-means聚類分析,得到所述聚類結(jié)果。
9、進(jìn)一步地,所述頻繁模式模型的獲取方法包括:
10、對于任意一個參數(shù)數(shù)據(jù)集,基于該參數(shù)數(shù)據(jù)集中的數(shù)值最大值以及數(shù)值最小值確定數(shù)值范圍,將所述數(shù)值范圍進(jìn)行均勻劃分,得到預(yù)設(shè)數(shù)量個區(qū)間范圍,將不同的區(qū)間范圍用不同的標(biāo)簽進(jìn)行標(biāo)記;
11、利用所述標(biāo)簽對每個參數(shù)時序數(shù)據(jù)中的每個數(shù)值進(jìn)行替換,得到每個參數(shù)時序數(shù)據(jù)對應(yīng)的標(biāo)簽序列;
12、獲取每個標(biāo)簽在該參數(shù)數(shù)據(jù)集中的出現(xiàn)頻率;在每個聚類簇中,根據(jù)所有標(biāo)簽的出現(xiàn)頻率以及每個聚類簇中標(biāo)簽序列的數(shù)量,得到每個聚類簇的重要程度指標(biāo),每個聚類簇中標(biāo)簽序列的數(shù)量和標(biāo)簽的出現(xiàn)頻率均與所述重要程度指標(biāo)呈正相關(guān);
13、在該參數(shù)數(shù)據(jù)集對應(yīng)的聚類結(jié)果中,基于fp-growth算法對每個聚類簇中的所有標(biāo)簽序列進(jìn)行分析,得到每個聚類簇對應(yīng)的頻繁模式樹;基于重要程度指標(biāo)對所有聚類簇對應(yīng)的頻繁模式樹進(jìn)行降序排列,得到排列序列,在所述排列序列中,將第一個頻繁模式樹作為目標(biāo)樹,將目標(biāo)樹后一個頻繁模式樹作為待分析樹,將待分析樹與目標(biāo)樹存在差異的部分添加到目標(biāo)樹中,得到新的目標(biāo)樹;將待分析樹后一個頻繁模式樹作為新的待分析樹,將新的待分析樹與新的目標(biāo)樹中存在差異的部分添加到新的目標(biāo)樹中,不斷確定新的目標(biāo)樹,直至對排列序列中的頻繁模式樹遍歷完成后停止,將此時新的目標(biāo)樹作為該參數(shù)數(shù)據(jù)集對應(yīng)的頻繁模式模型。
14、進(jìn)一步地,所述噪聲存在概率的獲取方法包括:
15、對于任意一個參數(shù)數(shù)據(jù)集,獲取對應(yīng)頻繁模式模型中的所有頻繁項集;頻繁項集內(nèi)各個項的出現(xiàn)頻率為項對應(yīng)的標(biāo)簽在參數(shù)數(shù)據(jù)集中的出現(xiàn)頻率;
16、對于任意一個頻繁項集,基于該頻繁項集中各個項的出現(xiàn)頻率,確定該頻繁項集的第一整體含噪因子,所述第一整體含噪因子與出現(xiàn)頻率呈負(fù)相關(guān);基于該頻繁項集對應(yīng)路徑在頻繁模式模型中的分叉點數(shù)量,確定該頻繁項集的第二整體含噪因子,所述第二整體含噪因子與所述分叉點數(shù)量呈負(fù)相關(guān);
17、將所有頻繁項集的第一整體含噪因子與第二整體含噪因子進(jìn)行融合并均值化處理,得到該參數(shù)數(shù)據(jù)集的第一含噪指標(biāo),所述第一整體含噪因子與第二整體含噪因子均與所述第一含噪指標(biāo)呈正相關(guān);
18、基于所有頻繁項集之間的相似情況,確定該參數(shù)數(shù)據(jù)集的第二含噪指標(biāo);
19、根據(jù)該參數(shù)數(shù)據(jù)集的第一含噪指標(biāo)與第二含噪指標(biāo),得到該參數(shù)數(shù)據(jù)集的噪聲存在概率,所述第一含噪指標(biāo)與第二含噪指標(biāo)均與所述噪聲存在概率呈正相關(guān)。
20、進(jìn)一步地,所述第二含噪指標(biāo)的獲取方法包括:
21、在所有的頻繁項集中,將項數(shù)相同的頻繁項集作為一類頻繁項集;
22、在任意一類頻繁項集中,將任意兩個頻繁項集進(jìn)行組合,得到所有不重復(fù)的組合;對于任意一個組合,基于兩個頻繁項集中相同位置的項的差異情況,確定該組合中頻繁項集的獨立程度值;
23、將所有類頻繁項集的所有組合對應(yīng)的獨立程度值的均值作為該參數(shù)數(shù)據(jù)集的第二含噪指標(biāo)。
24、進(jìn)一步地,所述數(shù)據(jù)質(zhì)量的獲取方法包括:
25、將噪聲存在概率大于或等于預(yù)設(shè)噪聲閾值的參數(shù)數(shù)據(jù)集作為目標(biāo)數(shù)據(jù)集,將噪聲存在概率小于預(yù)設(shè)噪聲閾值的參數(shù)數(shù)據(jù)集作為正常數(shù)據(jù)集,正常數(shù)據(jù)集的數(shù)據(jù)質(zhì)量設(shè)置為不小于1的固定值;
26、對于任意一個目標(biāo)數(shù)據(jù)集,基于該目標(biāo)數(shù)據(jù)集中各個參數(shù)時序數(shù)據(jù)的變化趨勢改變情況,確定該目標(biāo)數(shù)據(jù)集的第一質(zhì)量參數(shù);
27、在該目標(biāo)數(shù)據(jù)集對應(yīng)的每個參數(shù)時序數(shù)據(jù)中,基于每個數(shù)值與所有數(shù)值均值之間的偏差情況,得到每個數(shù)值的偏差因子,基于所有數(shù)值的偏差因子確定每個參數(shù)時序數(shù)據(jù)的整體質(zhì)量因子,且所述整體質(zhì)量因子與所述偏差因子呈負(fù)相關(guān);將所有參數(shù)時序數(shù)據(jù)的整體質(zhì)量因子進(jìn)行均值化處理,得到該目標(biāo)數(shù)據(jù)集的第二質(zhì)量參數(shù);
28、根據(jù)該目標(biāo)數(shù)據(jù)集的噪聲存在概率、第一質(zhì)量參數(shù)以及第二質(zhì)量參數(shù),得到該目標(biāo)數(shù)據(jù)集的數(shù)據(jù)質(zhì)量,所述噪聲存在概率、第一質(zhì)量參數(shù)以及第二質(zhì)量參數(shù),均與數(shù)據(jù)質(zhì)量呈負(fù)相關(guān),且所述數(shù)據(jù)質(zhì)量的取值為歸一化后的數(shù)值。
29、進(jìn)一步地,所述第一質(zhì)量參數(shù)的獲取方法包括:
30、獲取該目標(biāo)數(shù)據(jù)集中每個參數(shù)時序數(shù)據(jù)中的極值點數(shù)量,基于所有參數(shù)時序數(shù)據(jù)的極值點數(shù)量的和值在所有參數(shù)時序數(shù)據(jù)的數(shù)值總數(shù)中的占比,確定該目標(biāo)數(shù)據(jù)集的第一質(zhì)量參數(shù)。
31、進(jìn)一步地,所述高質(zhì)量數(shù)據(jù)集的獲取方法包括:
32、在所有參數(shù)數(shù)據(jù)集中,將數(shù)據(jù)質(zhì)量小于或等于預(yù)設(shè)質(zhì)量閾值的參數(shù)數(shù)據(jù)集作為噪聲數(shù)據(jù)集;
33、基于卡爾曼濾波方法對每個噪聲數(shù)據(jù)集中的所有參數(shù)時序數(shù)據(jù)進(jìn)行去噪,得到每個噪聲數(shù)據(jù)集對應(yīng)的去噪數(shù)據(jù)集;
34、將數(shù)據(jù)質(zhì)量大于預(yù)設(shè)質(zhì)量閾值的參數(shù)數(shù)據(jù)集與所有的去噪數(shù)據(jù)集,作為所有測試時段對應(yīng)的高質(zhì)量數(shù)據(jù)集。
35、進(jìn)一步地,所述基于所有性能參數(shù)對應(yīng)的所有高質(zhì)量數(shù)據(jù)集進(jìn)行電控柜的性能測試,包括:
36、建立與電控柜對應(yīng)的仿真測試模型,將所有性能參數(shù)對應(yīng)的所有高質(zhì)量數(shù)據(jù)集作為所述仿真測試模型的數(shù)據(jù)庫,進(jìn)行電控柜的性能測試,得到測試結(jié)果。
37、本發(fā)明還提出了一種用于電控柜的全面自動化測試系統(tǒng),所述系統(tǒng)包括:
38、存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機(jī)程序,所述處理器執(zhí)行所述計算機(jī)程序時可實現(xiàn)任意一項所述方法的步驟。
39、本發(fā)明具有如下有益效果:
40、本發(fā)明可以在利用仿真測試模型對電控柜進(jìn)行檢測時,準(zhǔn)確的從大量的數(shù)據(jù)中篩選出噪聲數(shù)據(jù),從而進(jìn)行針對性的去噪處理,有效提高效率,同時保證后續(xù)模型測試結(jié)果的準(zhǔn)確度。首先,針對任意一項性能參數(shù),需要獲取多個測試時段內(nèi)該性能參數(shù)的參數(shù)數(shù)據(jù)集,且參數(shù)數(shù)據(jù)集中包含了多個參數(shù)時序數(shù)據(jù),由于噪聲數(shù)據(jù)相較于正常數(shù)據(jù)而言,屬于偶然現(xiàn)象,因此可以基于數(shù)據(jù)之間的相似性,對每個參數(shù)數(shù)據(jù)集中的參數(shù)時序數(shù)據(jù)進(jìn)行聚類分析,得到聚類結(jié)果,此時各個聚類結(jié)果中各個聚類簇中的參數(shù)時序數(shù)據(jù)在一定程度上可以區(qū)分出參數(shù)數(shù)據(jù)集中的正常數(shù)據(jù)以及噪聲數(shù)據(jù)。進(jìn)一步地,基于參數(shù)數(shù)據(jù)集中所有參數(shù)時序數(shù)據(jù)的數(shù)值特征,以及頻繁模式挖掘算法,對聚類結(jié)果中各個聚類簇進(jìn)行融合分析,從而得到頻繁模式模型,此時的頻繁模式模型可以更加顯著的表征出正常數(shù)據(jù)與噪聲數(shù)據(jù)的區(qū)別。進(jìn)一步地,可以對頻繁模式模型進(jìn)行分析,分析數(shù)據(jù)間的關(guān)聯(lián)性和頻繁模式以及頻繁項集在頻繁模式模型中的位置分布,從而量化噪聲數(shù)據(jù)存在的可能性,得到參數(shù)數(shù)據(jù)集的噪聲存在概率,為后續(xù)評估參數(shù)數(shù)據(jù)集的質(zhì)量提供參考。進(jìn)一步地,由于噪聲數(shù)據(jù)在數(shù)據(jù)波動上以及趨勢變化上存在特征,所以綜合考慮參數(shù)時序數(shù)據(jù)的變化趨勢和數(shù)據(jù)波動情況,并結(jié)合噪聲存在概率,可以更加準(zhǔn)確地評估參數(shù)數(shù)據(jù)集的數(shù)據(jù)質(zhì)量。這有助于準(zhǔn)確識別并篩選出噪聲數(shù)據(jù)集,進(jìn)而對其進(jìn)行去噪處理,得到高質(zhì)量的數(shù)據(jù)集。最后,基于所有性能參數(shù)對應(yīng)的高質(zhì)量數(shù)據(jù)集進(jìn)行電控柜的性能測試,得到測試結(jié)果。本發(fā)明由于可以準(zhǔn)確的篩選出噪聲數(shù)據(jù)集,從而在大量的數(shù)據(jù)集中僅對噪聲數(shù)據(jù)集進(jìn)行去噪,可以提高數(shù)據(jù)去噪處理效率,同時確保測試結(jié)果的準(zhǔn)確性和可靠性。