本發(fā)明涉及數(shù)據(jù)處理,尤其涉及一種基于時(shí)頻域特征融合的工業(yè)時(shí)序數(shù)據(jù)增強(qiáng)方法及系統(tǒng)。
背景技術(shù):
1、為了挖掘數(shù)據(jù)中潛在的重要特征信息,當(dāng)前采用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等方法來對數(shù)據(jù)進(jìn)行分析處理,在這個(gè)過程中數(shù)據(jù)增強(qiáng)方法是在機(jī)器學(xué)習(xí)、深度學(xué)習(xí)領(lǐng)域中用來提高模型性能和泛化能力的可靠辦法,但現(xiàn)在主要是用于在計(jì)算機(jī)視覺任務(wù)中處理二維圖像數(shù)據(jù),而對于互聯(lián)網(wǎng)云端上傳采集的以上傳時(shí)間為索引序號的一維數(shù)據(jù)的數(shù)據(jù)增強(qiáng)方法則應(yīng)用并不廣泛。
2、現(xiàn)有的數(shù)據(jù)增強(qiáng)方案,大多是針對圖像二維數(shù)據(jù)的數(shù)據(jù)增強(qiáng)方法,通過圖像預(yù)處理中的抖動(dòng)、縮放、旋轉(zhuǎn)、排列、剪裁等方法,將原始數(shù)據(jù)進(jìn)行預(yù)處理,生成新的數(shù)據(jù),以提高機(jī)器學(xué)習(xí)、深度學(xué)習(xí)過程中訓(xùn)練數(shù)據(jù)的樣本豐富性。
3、現(xiàn)有針對圖像的數(shù)據(jù)增強(qiáng)方法,在應(yīng)用到工業(yè)制造領(lǐng)域中的時(shí)間序列數(shù)據(jù)時(shí),會(huì)面臨著執(zhí)行數(shù)據(jù)增強(qiáng)方法時(shí)導(dǎo)致數(shù)據(jù)變形、特征丟失等情況發(fā)生,影響對數(shù)據(jù)特性挖掘的準(zhǔn)確性。例如,翻轉(zhuǎn)或旋轉(zhuǎn)圖像以增強(qiáng)圖像數(shù)據(jù)并不會(huì)顯著破壞原始數(shù)據(jù)的含義。因此,如何提出一種適用于時(shí)間序列數(shù)據(jù)的數(shù)據(jù)增強(qiáng)方案,成為亟待解決的問題。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,有必要提供一種基于時(shí)頻域特征融合的工業(yè)時(shí)序數(shù)據(jù)增強(qiáng)方法,用以解決現(xiàn)有技術(shù)的上述缺陷。
2、為了解決上述問題,第一方面,本發(fā)明實(shí)施例提供一種基于時(shí)頻域特征融合的工業(yè)時(shí)序數(shù)據(jù)增強(qiáng)方法,包括:
3、s1,采集工業(yè)生產(chǎn)過程中的工業(yè)時(shí)序數(shù)據(jù),得到原始數(shù)據(jù)集;
4、s2,結(jié)合時(shí)間域內(nèi)的加權(quán)權(quán)重調(diào)整策略以及數(shù)據(jù)插值方法,對原始數(shù)據(jù)集中的工業(yè)時(shí)序數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理;
5、s3,將預(yù)處理后的擴(kuò)展數(shù)據(jù)隨機(jī)切片,并將切片數(shù)據(jù)與與原始數(shù)據(jù)的時(shí)間長度對齊;
6、s4,將經(jīng)過數(shù)據(jù)預(yù)處理并切片對齊后的工業(yè)時(shí)序數(shù)據(jù)轉(zhuǎn)換為頻域數(shù)據(jù),分別從工業(yè)時(shí)序數(shù)據(jù)和頻域數(shù)據(jù)中提取時(shí)域特征和頻域特征,并將所述時(shí)域特征和頻域特征進(jìn)行融合,得到數(shù)據(jù)增強(qiáng)后的工業(yè)時(shí)序數(shù)據(jù)。
7、優(yōu)選的,在采集工業(yè)生產(chǎn)過程中的工業(yè)時(shí)序數(shù)據(jù)時(shí),所述方法還包括:
8、基于香農(nóng)采樣定理和先驗(yàn)知識,確定工業(yè)時(shí)序數(shù)據(jù)的最優(yōu)采樣頻率;其中,所述工業(yè)時(shí)序數(shù)據(jù)包括電壓、電流、溫度、濕度和速度;
9、根據(jù)最優(yōu)采樣頻率,確定工業(yè)時(shí)序數(shù)據(jù)需要擴(kuò)增的數(shù)據(jù)容量。
10、優(yōu)選的,所述結(jié)合時(shí)間域內(nèi)的加權(quán)權(quán)重調(diào)整策略以及數(shù)據(jù)插值方法,對原始數(shù)據(jù)集中的工業(yè)時(shí)序數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,包括:
11、根據(jù)原始數(shù)據(jù)集中的工業(yè)時(shí)序數(shù)據(jù)的特性,為原始數(shù)據(jù)集中每個(gè)數(shù)據(jù)點(diǎn)分配權(quán)重值;
12、考慮每個(gè)數(shù)據(jù)點(diǎn)的權(quán)重值,對原始數(shù)據(jù)集中的工業(yè)時(shí)序數(shù)據(jù)進(jìn)行數(shù)據(jù)插值。
13、優(yōu)選的,在對原始數(shù)據(jù)集中的工業(yè)時(shí)序數(shù)據(jù)進(jìn)行數(shù)據(jù)插值之后,還包括:
14、對數(shù)據(jù)插值后的數(shù)據(jù)進(jìn)行優(yōu)化處理;所述優(yōu)化處理包括數(shù)據(jù)旋轉(zhuǎn)、數(shù)據(jù)抖動(dòng)、數(shù)據(jù)縮放和數(shù)據(jù)重排。
15、優(yōu)選的,所述將預(yù)處理后的擴(kuò)展數(shù)據(jù)隨機(jī)切片,并將切片數(shù)據(jù)與與原始數(shù)據(jù)的時(shí)間長度對齊,包括:
16、根據(jù)原始數(shù)據(jù)集中工業(yè)時(shí)序數(shù)據(jù)的時(shí)間長度,對預(yù)處理后的擴(kuò)展數(shù)據(jù)進(jìn)行隨機(jī)切片,得到與原始數(shù)據(jù)時(shí)間長度相同的切片數(shù)據(jù);
17、確保每個(gè)切片數(shù)據(jù)的標(biāo)簽與原始數(shù)據(jù)集中相應(yīng)時(shí)間段的標(biāo)簽一一對應(yīng)。
18、優(yōu)選的,步驟s4具體包括:
19、通過快速傅里葉變換,將經(jīng)過數(shù)據(jù)預(yù)處理并切片對齊后的工業(yè)時(shí)序數(shù)據(jù)轉(zhuǎn)換為頻域數(shù)據(jù);
20、從經(jīng)過數(shù)據(jù)預(yù)處理并切片對齊后的工業(yè)時(shí)序數(shù)據(jù)中提取時(shí)域特征,從所述頻域數(shù)據(jù)中提取頻域特征;
21、將所述時(shí)域特征和頻域特征進(jìn)行融合,得到數(shù)據(jù)增強(qiáng)的工業(yè)時(shí)序數(shù)據(jù)。
22、第二方面,本發(fā)明實(shí)施例提供一種基于時(shí)頻域特征融合的工業(yè)時(shí)序數(shù)據(jù)增強(qiáng)系統(tǒng),包括:
23、數(shù)據(jù)采集模塊,用于采集工業(yè)生產(chǎn)過程中的工業(yè)時(shí)序數(shù)據(jù),得到原始數(shù)據(jù)集;
24、數(shù)據(jù)預(yù)處理模塊,用于結(jié)合時(shí)間域內(nèi)的加權(quán)權(quán)重調(diào)整策略以及數(shù)據(jù)插值方法,對原始數(shù)據(jù)集中的工業(yè)時(shí)序數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理;
25、數(shù)據(jù)切片對齊模塊,用于將預(yù)處理后的擴(kuò)展數(shù)據(jù)隨機(jī)切片,并將切片數(shù)據(jù)與與原始數(shù)據(jù)的時(shí)間長度對齊;
26、時(shí)頻域特征融合模塊,用于將經(jīng)過數(shù)據(jù)預(yù)處理并切片對齊后的工業(yè)時(shí)序數(shù)據(jù)轉(zhuǎn)換為頻域數(shù)據(jù),分別從工業(yè)時(shí)序數(shù)據(jù)和頻域數(shù)據(jù)中提取時(shí)域特征和頻域特征,并將所述時(shí)域特征和頻域特征進(jìn)行融合,得到數(shù)據(jù)增強(qiáng)后的工業(yè)時(shí)序數(shù)據(jù)。
27、第三方面,本發(fā)明還提供了一種電子設(shè)備,包括存儲(chǔ)器和處理器,其中,
28、所述存儲(chǔ)器,用于存儲(chǔ)程序;
29、所述處理器,與所述存儲(chǔ)器耦合,用于執(zhí)行所述存儲(chǔ)器中存儲(chǔ)的所述程序,以實(shí)現(xiàn)如本發(fā)明第一方面實(shí)施例所述的基于時(shí)頻域特征融合的工業(yè)時(shí)序數(shù)據(jù)增強(qiáng)方法中的步驟。
30、第四方面,本發(fā)明還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),用于存儲(chǔ)計(jì)算機(jī)可讀取的程序或指令,所述程序或指令被處理器執(zhí)行時(shí)能夠?qū)崿F(xiàn)如本發(fā)明第一方面實(shí)施例所述的基于時(shí)頻域特征融合的工業(yè)時(shí)序數(shù)據(jù)增強(qiáng)方法中的步驟。
31、本發(fā)明提供的基于時(shí)頻域特征融合的工業(yè)時(shí)序數(shù)據(jù)增強(qiáng)方法及系統(tǒng),與現(xiàn)有技術(shù)相比,具有如下有益效果:
32、1)本發(fā)明通過結(jié)合時(shí)間域內(nèi)的加權(quán)權(quán)重調(diào)整和數(shù)據(jù)插值方法,提高了數(shù)據(jù)的密度和多樣性。通過隨機(jī)切片和對齊策略,本發(fā)明能夠在保持?jǐn)?shù)據(jù)長度的同時(shí),增加數(shù)據(jù)的多樣性,避免了傳統(tǒng)圖像數(shù)據(jù)增強(qiáng)方法直接應(yīng)用于時(shí)間序列數(shù)據(jù)時(shí)可能導(dǎo)致的數(shù)據(jù)變形和特征丟失問題。
33、2)本發(fā)明通過時(shí)頻域特征融合的方法進(jìn)行數(shù)據(jù)增強(qiáng),可以充分利用數(shù)據(jù)在時(shí)域和頻域上的信息,增強(qiáng)后的時(shí)序數(shù)據(jù)不僅包含了數(shù)據(jù)在時(shí)間軸上的動(dòng)態(tài)變化信息,還包含了數(shù)據(jù)在頻率分布上的靜態(tài)結(jié)構(gòu)信息,為后續(xù)數(shù)據(jù)分析、異常檢測等任務(wù)提供重要的數(shù)據(jù)支持。
1.一種基于時(shí)頻域特征融合的工業(yè)時(shí)序數(shù)據(jù)增強(qiáng)方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基于時(shí)頻域特征融合的工業(yè)時(shí)序數(shù)據(jù)增強(qiáng)方法,其特征在于,在采集工業(yè)生產(chǎn)過程中的工業(yè)時(shí)序數(shù)據(jù)時(shí),所述方法還包括:
3.根據(jù)權(quán)利要求1所述的基于時(shí)頻域特征融合的工業(yè)時(shí)序數(shù)據(jù)增強(qiáng)方法,其特征在于,所述結(jié)合時(shí)間域內(nèi)的加權(quán)權(quán)重調(diào)整策略以及數(shù)據(jù)插值方法,對原始數(shù)據(jù)集中的工業(yè)時(shí)序數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,包括:
4.根據(jù)權(quán)利要求3所述的基于時(shí)頻域特征融合的工業(yè)時(shí)序數(shù)據(jù)增強(qiáng)方法,其特征在于,在對原始數(shù)據(jù)集中的工業(yè)時(shí)序數(shù)據(jù)進(jìn)行數(shù)據(jù)插值之后,還包括:
5.根據(jù)權(quán)利要求1所述的基于時(shí)頻域特征融合的工業(yè)時(shí)序數(shù)據(jù)增強(qiáng)方法,其特征在于,所述將預(yù)處理后的擴(kuò)展數(shù)據(jù)隨機(jī)切片,并將切片數(shù)據(jù)與與原始數(shù)據(jù)的時(shí)間長度對齊,包括:
6.根據(jù)權(quán)利要求1所述的基于時(shí)頻域特征融合的工業(yè)時(shí)序數(shù)據(jù)增強(qiáng)方法,其特征在于,步驟s4具體包括:
7.一種基于時(shí)頻域特征融合的工業(yè)時(shí)序數(shù)據(jù)增強(qiáng)系統(tǒng),其特征在于,包括:
8.一種電子設(shè)備,
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,用于存儲(chǔ)計(jì)算機(jī)可讀取的程序或指令,所述程序或指令被處理器執(zhí)行時(shí)能夠?qū)崿F(xiàn)上述權(quán)利要求1至6中任意一項(xiàng)所述的基于時(shí)頻域特征融合的工業(yè)時(shí)序數(shù)據(jù)增強(qiáng)方法中的步驟。