本發(fā)明屬于時(shí)間序列預(yù)測(cè),具體說(shuō)是一種基于頻域的多尺度雙分支長(zhǎng)時(shí)間序列預(yù)測(cè)方法。
背景技術(shù):
1、時(shí)間序列預(yù)測(cè)是一項(xiàng)長(zhǎng)期存在且至關(guān)重要的任務(wù),其核心在于通過(guò)分析歷史觀測(cè)數(shù)據(jù)提取有用的模式,用于預(yù)測(cè)未來(lái)的事件和趨勢(shì)。準(zhǔn)確的時(shí)間序列預(yù)測(cè)能夠在多個(gè)領(lǐng)域?yàn)榻M織和個(gè)人提供重要的前瞻性信息,從而支持更有效的決策。尤其是長(zhǎng)時(shí)間序列預(yù)測(cè),它能夠揭示長(zhǎng)時(shí)間段內(nèi)的數(shù)據(jù)變化趨勢(shì),具有廣泛的應(yīng)用前景。例如,在金融市場(chǎng)中,長(zhǎng)時(shí)間序列預(yù)測(cè)可以幫助投資者識(shí)別長(zhǎng)期趨勢(shì),進(jìn)而優(yōu)化投資策略;在氣象學(xué)中,準(zhǔn)確的長(zhǎng)期天氣預(yù)測(cè)可以為農(nóng)業(yè)生產(chǎn)和防災(zāi)減災(zāi)提供寶貴的支持;在能源管理中,預(yù)測(cè)未來(lái)的能源需求可以幫助電力公司優(yōu)化電網(wǎng)運(yùn)營(yíng)和資源分配。因此,精確的預(yù)測(cè)結(jié)果對(duì)于決策支持系統(tǒng)尤為關(guān)鍵。
2、提取歷史時(shí)間序列中隱含的信息相當(dāng)復(fù)雜,現(xiàn)有的方法主要側(cè)重于提取時(shí)域特征。由于時(shí)間序列的復(fù)雜依賴特性以及時(shí)域中信息的稀疏表示,傳統(tǒng)方法常采用如多頭自注意力這樣的復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)和模塊來(lái)捕獲和利用這些信息。這些方法往往涉及大量的參數(shù)和計(jì)算,導(dǎo)致訓(xùn)練和推理時(shí)間較長(zhǎng)。相對(duì)地。在頻率域中,時(shí)間序列具有更緊湊的表示形式,且頻率域的方法直接促進(jìn)了基本頻域成分的識(shí)別和分析,能夠有效地捕獲時(shí)間序列中的長(zhǎng)期趨勢(shì)、季節(jié)性模式和周期性波動(dòng)。
3、然而,現(xiàn)有的基于頻域的方法均使用有限的頻域分辨率,這種固定的分辨率可能不足以同時(shí)捕捉到時(shí)間序列中存在的多種重要頻率成分,尤其是當(dāng)序列包含從低頻長(zhǎng)期趨勢(shì)到高頻短期波動(dòng)等多種動(dòng)態(tài)時(shí)。另一方面,許多模型要么側(cè)重于全局趨勢(shì)的長(zhǎng)期預(yù)測(cè),忽視了局部波動(dòng)的重要性;要么過(guò)分關(guān)注短期數(shù)據(jù)變化,而未能捕捉到驅(qū)動(dòng)時(shí)間序列長(zhǎng)期行為的關(guān)鍵周期性特征。這導(dǎo)致了對(duì)時(shí)間序列動(dòng)態(tài)的理解不完整。
技術(shù)實(shí)現(xiàn)思路
1、針對(duì)現(xiàn)有技術(shù)的不足,本發(fā)明公開(kāi)了基于頻域的多尺度雙分支長(zhǎng)時(shí)間序列預(yù)測(cè)方法,是一種同時(shí)建模全局和局部特征的多分辨率頻域模型,提高了長(zhǎng)時(shí)間序列預(yù)測(cè)的精度。首先,將時(shí)間序列數(shù)據(jù)根據(jù)不同的時(shí)間尺度劃分成包含不同長(zhǎng)度的時(shí)間片段,通過(guò)傅里葉變換得到每個(gè)時(shí)間片段的頻域表示。接著,利用雙分支信息提取器分別獲取時(shí)間序列的長(zhǎng)期周期信息和短期局部依賴。然后,將提取的特征片段拼接回原始序列的長(zhǎng)度,并通過(guò)復(fù)數(shù)全連接層將歷史窗口的頻域表示轉(zhuǎn)換為未來(lái)窗口的頻域表示,最終通過(guò)逆傅里葉變換得到時(shí)間序列預(yù)測(cè)結(jié)果。此外,本發(fā)明提出了一種新的對(duì)異常值不敏感的損失函數(shù),通過(guò)該損失函數(shù)訓(xùn)練神經(jīng)網(wǎng)絡(luò),能夠獲取更真實(shí)的預(yù)測(cè)結(jié)果。提出的方法充分考慮了時(shí)間序列在頻率域表示的緊湊性,克服了現(xiàn)有預(yù)測(cè)方法通常只考慮全局或局部單一信息的局限性,對(duì)長(zhǎng)時(shí)間序列預(yù)測(cè)領(lǐng)域具有重要的理論和實(shí)際意義。
2、本發(fā)明為實(shí)現(xiàn)上述目的所采用的技術(shù)方案是:
3、基于頻域的多尺度雙分支長(zhǎng)時(shí)間序列預(yù)測(cè)方法,執(zhí)行如下步驟構(gòu)建并優(yōu)化頻域預(yù)測(cè)模型,使其用于對(duì)歷史長(zhǎng)時(shí)的觀測(cè)序列數(shù)據(jù)進(jìn)行預(yù)測(cè),方法包括:
4、步驟1、采集歷史長(zhǎng)時(shí)的觀測(cè)序列數(shù)據(jù),分批次歸一化;
5、步驟2、將每個(gè)屬性變量的觀測(cè)序列數(shù)據(jù),劃分為尺度不等的多個(gè)時(shí)間片段的數(shù)據(jù)組合;
6、步驟3、將觀測(cè)序列數(shù)據(jù)從時(shí)間域轉(zhuǎn)換到頻域;
7、步驟4、構(gòu)建雙分支信息提取器,對(duì)每個(gè)尺度的頻域表示進(jìn)行處理和預(yù)測(cè);
8、步驟5、將所有尺度的預(yù)測(cè)結(jié)果加權(quán)平均,生成完整的預(yù)測(cè)結(jié)果;
9、步驟6、對(duì)預(yù)測(cè)結(jié)果進(jìn)行反歸一化;
10、步驟7、反復(fù)迭代以上步驟2-6,選用adam優(yōu)化器,以arctan函數(shù)的積分函數(shù)作為損失函數(shù),反向傳播調(diào)整模型參數(shù),優(yōu)化該頻域預(yù)測(cè)模型。
11、所述時(shí)間序列數(shù)據(jù)為關(guān)于同一工業(yè)過(guò)程的多個(gè)屬性變量的長(zhǎng)時(shí)間序列數(shù)據(jù)。
12、所述數(shù)據(jù)歸一化是采用z標(biāo)準(zhǔn)化方法,處理后的數(shù)據(jù)分布為標(biāo)準(zhǔn)正態(tài)分布。
13、所述尺度不等為設(shè)置時(shí)間尺度集合d={d1,d2,…,di,…,dm},其中每個(gè)時(shí)間尺度對(duì)應(yīng)不同長(zhǎng)度的時(shí)間片段。
14、所述頻域變換為對(duì)每個(gè)時(shí)間片段采用快速傅里葉變換fft。
15、所述雙分支信息提取器包括:通過(guò)迭代使用片段內(nèi)全連接層、片段間信息提取器、片段內(nèi)全連接層提取歷史時(shí)間片段內(nèi)和片段間的時(shí)序信息,生成深層頻域特征表示。
16、所述采用雙分支信息提取器對(duì)每個(gè)尺度的頻域表示進(jìn)行處理包括:
17、a.使用片段內(nèi)復(fù)數(shù)全連接層將每個(gè)尺度片段的頻域表示映射到隱含的特征空間,得到其中表示第i個(gè)尺度片段內(nèi)首個(gè)復(fù)數(shù)全連接層的輸出結(jié)果;
18、b.使用片段間復(fù)數(shù)全連接層挖掘全局周期信息,得到其中表示第i個(gè)尺度全局信息提取器的處理結(jié)果;
19、c.使用片段間復(fù)數(shù)卷積層挖掘短期時(shí)序動(dòng)態(tài)變化,得到其中表示第i個(gè)尺度局部信息提取器的處理結(jié)果;
20、d.再次使用片段內(nèi)復(fù)數(shù)全連接層提煉和加強(qiáng)每個(gè)片段的頻域特征表達(dá),分別得到全局信息和局部信息其中表示第i個(gè)尺度全局信息提取器的輸出結(jié)果,表示第i個(gè)尺度局部信息提取器的輸出結(jié)果。
21、所述對(duì)每個(gè)尺度的頻域表示進(jìn)行預(yù)測(cè)包括:
22、a.將每個(gè)片段的頻域表示轉(zhuǎn)換到時(shí)域中;
23、b.拼接各個(gè)片段的時(shí)域深層特征,拼接后長(zhǎng)度變?yōu)樵驾斎胄蛄虚L(zhǎng)度;
24、c.將處理后的時(shí)間序列通過(guò)fft轉(zhuǎn)換到頻域,得到全局信息時(shí)域特征的拼接結(jié)果局部信息時(shí)域特征的拼接結(jié)果
25、d.通過(guò)復(fù)數(shù)全連接層mlp,將歷史時(shí)間窗口的全局信息和局部信息深層頻域表征進(jìn)行預(yù)測(cè),得到未來(lái)時(shí)間窗口的頻域表示;
26、e.將全局信息和局部信息預(yù)測(cè)結(jié)果的頻域表示轉(zhuǎn)換到時(shí)域,得到基于全局信息的預(yù)測(cè)結(jié)果基于局部信息的預(yù)測(cè)結(jié)果
27、f.將全局信息和局部信息預(yù)測(cè)結(jié)果平均,得到該尺度下的預(yù)測(cè)結(jié)果。
28、所述反歸一化過(guò)程使用步驟1中使用的z標(biāo)準(zhǔn)化的均值和方差進(jìn)行z反標(biāo)準(zhǔn)化。
29、所述模型參數(shù)更新過(guò)程使用arctanloss:為arctan函數(shù)的積分函數(shù)和,加上平均絕對(duì)誤差mae和一個(gè)正則化約束項(xiàng),具體函數(shù)形式為:
30、
31、其中y和分別表示真實(shí)值和預(yù)測(cè)值,a,k,α,β,γ是超參數(shù),超參數(shù)使用是通過(guò)網(wǎng)格搜索法獲取的。
32、本發(fā)明具有以下有益效果及優(yōu)點(diǎn):
33、1.本發(fā)明方法在長(zhǎng)時(shí)間序列預(yù)測(cè)任務(wù)上與現(xiàn)有最優(yōu)方法相比,通過(guò)多尺度的片段劃分方式,使不同尺度的頻域特征互相補(bǔ)充。
34、2.本發(fā)明方法采用全局-局部雙分支提取器,同時(shí)建模全局周期信息和局部動(dòng)態(tài)關(guān)系,得到擁有更充分信息的預(yù)測(cè)結(jié)果。
35、3.本發(fā)明方法在模型訓(xùn)練的過(guò)程中,使用arctanloss損失函數(shù)指導(dǎo)參數(shù)更新,提升了神經(jīng)網(wǎng)絡(luò)訓(xùn)練的效果。并且本方法是參數(shù)量小,具備短時(shí)間內(nèi)快速預(yù)測(cè)的優(yōu)勢(shì)。
1.基于頻域的多尺度雙分支長(zhǎng)時(shí)間序列預(yù)測(cè)方法,其特征在于,執(zhí)行如下步驟構(gòu)建并優(yōu)化頻域預(yù)測(cè)模型,使其用于對(duì)歷史長(zhǎng)時(shí)的觀測(cè)序列數(shù)據(jù)進(jìn)行預(yù)測(cè),方法包括:
2.根據(jù)權(quán)利要求1所述的基于頻域的多尺度雙分支長(zhǎng)時(shí)間序列預(yù)測(cè)方法,其特征在于,所述時(shí)間序列數(shù)據(jù)為關(guān)于同一工業(yè)過(guò)程的多個(gè)屬性變量的長(zhǎng)時(shí)間序列數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的基于頻域的多尺度雙分支長(zhǎng)時(shí)間序列預(yù)測(cè)方法,其特征在于,所述數(shù)據(jù)歸一化是采用z標(biāo)準(zhǔn)化方法,處理后的數(shù)據(jù)分布為標(biāo)準(zhǔn)正態(tài)分布。
4.根據(jù)權(quán)利要求1所述的基于頻域的多尺度雙分支長(zhǎng)時(shí)間序列預(yù)測(cè)方法,其特征在于,所述尺度不等為設(shè)置時(shí)間尺度集合d={d1,d2,…,di,…,dm},其中每個(gè)時(shí)間尺度對(duì)應(yīng)不同長(zhǎng)度的時(shí)間片段。
5.根據(jù)權(quán)利要求1所述的基于頻域的多尺度雙分支長(zhǎng)時(shí)間序列預(yù)測(cè)方法,其特征在于,所述頻域變換為對(duì)每個(gè)時(shí)間片段采用快速傅里葉變換fft。
6.根據(jù)權(quán)利要求1所述的基于頻域的多尺度雙分支長(zhǎng)時(shí)間序列預(yù)測(cè)方法,其特征在于,所述雙分支信息提取器包括:通過(guò)迭代使用片段內(nèi)全連接層、片段間信息提取器、片段內(nèi)全連接層提取歷史時(shí)間片段內(nèi)和片段間的時(shí)序信息,生成深層頻域特征表示。
7.根據(jù)權(quán)利要求6所述的基于頻域的多尺度雙分支長(zhǎng)時(shí)間序列預(yù)測(cè)方法,其特征在于,所述采用雙分支信息提取器對(duì)每個(gè)尺度的頻域表示進(jìn)行處理包括:
8.根據(jù)權(quán)利要求6所述的基于頻域的多尺度雙分支長(zhǎng)時(shí)間序列預(yù)測(cè)方法,其特征在于,所述對(duì)每個(gè)尺度的頻域表示進(jìn)行預(yù)測(cè)包括:
9.根據(jù)權(quán)利要求1所述的基于頻域的多尺度雙分支長(zhǎng)時(shí)間序列預(yù)測(cè)方法,其特征在于,所述反歸一化過(guò)程使用步驟1中使用的z標(biāo)準(zhǔn)化的均值和方差進(jìn)行z反標(biāo)準(zhǔn)化。
10.根據(jù)權(quán)利要求1所述的基于頻域的多尺度雙分支長(zhǎng)時(shí)間序列預(yù)測(cè)方法,其特征在于,所述模型參數(shù)更新過(guò)程使用arctanloss:為arctan函數(shù)的積分函數(shù)和,加上平均絕對(duì)誤差mae和一個(gè)正則化約束項(xiàng),具體函數(shù)形式為: