本申請涉及地表溫度估算領(lǐng)域和機器學習領(lǐng)域,特別涉及一種基于機器學習的地表溫度估算方法。
背景技術(shù):
1、地表溫度作為土壤的一種物理屬性,對植物的生長、發(fā)育等生理過程有著重要的影響,是農(nóng)業(yè)災(zāi)損評估、生產(chǎn)決策的重要依據(jù)之一。由于當前進行地表溫度觀測的站點有限,觀測歷史較短,地表溫度觀測數(shù)據(jù)遠遠不能滿足應(yīng)用需求。農(nóng)業(yè)生產(chǎn)中常用近地面氣溫代替地表溫度進行研究,但地表溫度會受到植被覆蓋、輻射、土壤濕度等因素的影響,采用近地面氣溫代替地表溫度誤差較大。因此對地表溫度進行估算具有重要應(yīng)用需求。
2、當前地表溫度估算方法大多基于近地面氣象觀測數(shù)據(jù)采用線性回歸的方式進行,然而近地面氣象要素與地表溫度之間的關(guān)系非常復(fù)雜,并非線性關(guān)系,這類方法只能對單一站點或某一時間段進行擬合,具有時間和地域的局限性,且估算誤差普遍較大。當前尚缺少適用范圍廣、效果優(yōu)的地表溫度估算技術(shù)方案。
技術(shù)實現(xiàn)思路
1、針對現(xiàn)有技術(shù)中的上述不足,本發(fā)明提供一種基于機器學習的地表溫度估算方法解決了現(xiàn)有地表溫度估算方法僅對單一站點或某一時間段進行擬合,具有時間和地域的局限性,且估算誤差普遍較大的問題。
2、為了達到上述發(fā)明目的,本發(fā)明采用的技術(shù)方案為:一種基于機器學習的地表溫度估算方法,包括:
3、s1、收集近地面氣象觀測數(shù)據(jù),建立氣象資料數(shù)據(jù)庫;
4、s2、整合氣象資料數(shù)據(jù)庫中的氣象數(shù)據(jù),得到建模所需的樣本;
5、s3、對建模所需的樣本進行逐層遞進的三級情境劃分,分別建立各個情境的訓(xùn)練數(shù)據(jù)庫;
6、s4、結(jié)合各個情境的訓(xùn)練數(shù)據(jù)庫,為不同情境分別優(yōu)選模型的最優(yōu)自變量組合與算法;
7、s5、采用各個情境最優(yōu)的自變量組合和算法建立各情境的模型,通過交叉驗證對模型進行逐個測試,確定各個情境下的模型的最適參數(shù),完成模型訓(xùn)練;
8、s6、將待估算自變量輸入對應(yīng)情境的估算模型,進行地表溫度估算。
9、進一步地:s1中建立的氣象資料數(shù)據(jù)庫包括目標地區(qū)氣象站的長時間序列近地面氣象要素逐日觀測數(shù)據(jù),具體包括:地表溫度、日最高氣溫、日最低氣溫、日平均氣溫、日照時數(shù)和日降水量。
10、進一步地:s2中,描述樣本特征的變量包括日最高氣溫、日最低氣溫、日平均氣溫、日照時數(shù)、日降水量、氣象站編碼和日序;
11、氣象站編碼用于反映下墊面的差異;
12、日序用于反映年內(nèi)不同時間地表溫度與近地面氣象條件之間關(guān)系存在的差異。
13、進一步地:s3中,依次按照氣溫、日照和土壤濕度進行逐層遞進的三級情境劃分;
14、其中,對于劃分氣溫情境和日照情境的閾值的確定步驟,包括:
15、s31、將日最高氣溫、日最低氣溫、日平均氣溫、日照時數(shù)、日降水量、氣象站編碼與日序作為特征變量,將地表溫度逐日觀測數(shù)據(jù)作為目標變量,參考決策樹算法的聚類結(jié)果,確定劃分氣溫和日照情境的所有閾值分別的參考值;
16、s32、以各個閾值的參考值為基準,向上和向下每變化1個單位為一個預(yù)設(shè)值,氣溫上下各變化5個單位,日照時數(shù)上下各變化2個單位,形成每個閾值分別的預(yù)設(shè)值的數(shù)集 ai={ x1, x2,..., xn};
17、其中, i代表閾值, n為該閾值的預(yù)設(shè)值的個數(shù);
18、s33、計算所有閾值的預(yù)設(shè)值數(shù)集相乘的笛卡爾積,得到全部閾值配置組合;
19、s34、遍歷全部閾值配置組合劃分的各種情境,并代入機器學習模型進行建模;
20、s35、選取所有閾值配置組合中機器學習模型的均方根誤差最低者,作為最優(yōu)閾值配置組合;
21、s36、根據(jù)最優(yōu)閾值配置組合完成氣溫情境和日照情境的劃分;
22、對于土壤濕度情境的劃分,采用滑動窗口法,根據(jù)降水量數(shù)據(jù),劃分土壤干旱和濕潤情境。
23、進一步地:s4中,為每種情境分別優(yōu)選模型的最優(yōu)自變量組合的方法包括:
24、s401、采用窮舉法對自變量進行組合,得到不同自變量組合;
25、s402、以地表溫度為目標變量,遍歷所有自變量組合并結(jié)合該情境的訓(xùn)練數(shù)據(jù)庫代入機器學習模型進行擬合實驗;
26、s403、選取擬合實驗結(jié)果中均方根誤差最低的自變量組合作為最優(yōu)自變量組合。
27、進一步地:s4中,為每種情境分別優(yōu)選模型的最優(yōu)算法的方法包括:
28、s411、將最優(yōu)自變量組合分別代入不同的機器學習算法進行擬合實驗;
29、s412、選取擬合實驗結(jié)果中均方根誤差最低的機器學習算法作為最優(yōu)算法。
30、本發(fā)明的有益效果為:
31、1.地表溫度與近地面氣象條件間的響應(yīng)機制復(fù)雜是地表溫度估算的關(guān)鍵難點。相比運用廣泛的時間序列線性回歸方法,機器學習更擅長處理復(fù)雜的非線性關(guān)系和高維數(shù)據(jù),能夠更好地反映響應(yīng)機制,提高地表溫度估算精度;
32、2.本發(fā)明將氣象站編碼和日序納入估算模型輸入的自變量中,因此所構(gòu)建的模型能夠更好地應(yīng)用于不同的地區(qū)和不同的時間,提高模型的普適性。此外,在實際的應(yīng)用過程中,隨著納入數(shù)據(jù)庫中的觀測站點的增多,數(shù)據(jù)庫的擴大,模型的估算效果會進一步提高;
33、3.發(fā)明采用分情境估算的辦法,設(shè)置了“氣溫—日照—土壤濕度”三個層次10種情境的地表溫度估算模型,這也提高了整體的估算精度和實用性。
1.一種基于機器學習的地表溫度估算方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基于機器學習的地表溫度估算方法,其特征在于,s1中建立的氣象資料數(shù)據(jù)庫包括目標地區(qū)氣象站的長時間序列近地面氣象要素逐日觀測數(shù)據(jù),具體包括:地表溫度、日最高氣溫、日最低氣溫、日平均氣溫、日照時數(shù)和日降水量。
3.根據(jù)權(quán)利要求1所述的基于機器學習的地表溫度估算方法,其特征在于,s2中,描述樣本特征的變量包括日最高氣溫、日最低氣溫、日平均氣溫、日照時數(shù)、日降水量、氣象站編碼和日序;
4.根據(jù)權(quán)利要求1所述的基于機器學習的地表溫度估算方法,其特征在于,s3中,依次按照氣溫、日照和土壤濕度進行逐層遞進的三級情境劃分;
5.根據(jù)權(quán)利要求1所述的基于機器學習的地表溫度估算方法,其特征在于,s4中,為每種情境分別優(yōu)選模型的最優(yōu)自變量組合的方法包括:
6.根據(jù)權(quán)利要求1所述的基于機器學習的地表溫度估算方法,其特征在于,s4中,為每種情境分別優(yōu)選模型的最優(yōu)算法的方法包括: