本發(fā)明屬于水文氣象分析領(lǐng)域,具體涉及一種基于空間聚類的水庫(kù)流域暴雨特征因子辨識(shí)方法。
背景技術(shù):
水庫(kù)流域暴雨是影響水庫(kù)運(yùn)行的重要因素,準(zhǔn)確的暴雨預(yù)報(bào)結(jié)果可為水庫(kù)合理優(yōu)化安排運(yùn)行方式,充分發(fā)揮水庫(kù)的防洪、發(fā)電等綜合效益提供必要的數(shù)據(jù)基礎(chǔ)。為提升暴雨預(yù)報(bào)的準(zhǔn)確率,首先必須要全面分析與辨識(shí)影響水庫(kù)流域暴雨的特征因子,目前暴雨特征因子辨識(shí)多是針對(duì)某地區(qū)單一場(chǎng)次暴雨過(guò)程進(jìn)行分析,而暴雨過(guò)程的影響因子眾多,且不同因子間相互關(guān)聯(lián)的關(guān)系十分復(fù)雜,目前還尚未有統(tǒng)一的水庫(kù)流域暴雨特征因子辨識(shí)方法,極大地影響了水庫(kù)流域暴雨天氣形勢(shì)的分析,限制了暴雨預(yù)報(bào)的精度。為此,必須研發(fā)一種適用于不同天氣系統(tǒng)的水庫(kù)流域暴雨特征因子辨識(shí)方法,為準(zhǔn)確把握水庫(kù)流域暴雨天氣形勢(shì)、提升暴雨預(yù)報(bào)精度提供重要的技術(shù)支撐。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問(wèn)題是:針對(duì)現(xiàn)有技術(shù)的不足,提供一種基于空間聚類的水庫(kù)流域暴雨特征因子辨識(shí)方法。該方法可適用于不同天氣系統(tǒng)的水庫(kù)流域暴雨特征因子辨識(shí),所據(jù)原理清晰,操作方便,實(shí)用性強(qiáng)。
為解決上述技術(shù)問(wèn)題,本發(fā)明采用以下技術(shù)方案:
一種基于空間聚類的水庫(kù)流域暴雨特征因子辨識(shí)方法,包括下述具體步驟:
(1)獲取待分析水庫(kù)流域的歷史降水觀測(cè)數(shù)據(jù)以及相對(duì)應(yīng)的暴雨影響因子觀測(cè)數(shù)據(jù);
(2)將步驟(1)獲取的歷史觀測(cè)數(shù)據(jù)每一個(gè)暴雨影響因子作為數(shù)據(jù)空間的一維,所述水庫(kù)流域的歷史觀測(cè)數(shù)據(jù)則表述為高維空間的點(diǎn)據(jù)集合S:
S={Ri,xi1,xi2,…,xin},i=1,2,…,m;
其中:n為暴雨的影響因子個(gè)數(shù),m為歷史觀測(cè)數(shù)據(jù)時(shí)段長(zhǎng)度,Ri為第i個(gè)時(shí)段的降水量,xij為第i個(gè)時(shí)段第j個(gè)影響因子的觀測(cè)值;
(3)采用非監(jiān)督聚類方法將步驟(2)中所述高維空間的點(diǎn)據(jù)進(jìn)行聚類,計(jì)算暴雨點(diǎn)據(jù)的聚類準(zhǔn)確率C:
其中:G為聚類的類別數(shù);P為暴雨判別閾值,Ri>P的點(diǎn)據(jù)即為暴雨點(diǎn)據(jù),一般P的取值標(biāo)準(zhǔn)為12小時(shí)降水量30mm或者24小時(shí)降水量50mm;countB(Ri>P)為計(jì)算暴雨點(diǎn)據(jù)的個(gè)數(shù);countA(Ri>P)為暴雨點(diǎn)據(jù)所在的類別中所有點(diǎn)據(jù)的個(gè)數(shù);
(4)從步驟(2)中依次去掉一個(gè)暴雨影響因子,重新計(jì)算步驟(3)的聚類準(zhǔn)確率,根據(jù)重新計(jì)算的聚類準(zhǔn)確率變化來(lái)判斷所去掉的暴雨影響因子是否屬于暴雨特征因子;
(5)重復(fù)步驟(4),直至不能去掉任何一個(gè)暴雨影響因子,最終保留的因子即為該水庫(kù)流域的暴雨特征因子。
作為上述技術(shù)方案的進(jìn)一步改進(jìn):
所述步驟(4)中的判斷方法具體為:
(4.1)若重新計(jì)算的聚類準(zhǔn)確率C變大,則表明去掉該暴雨影響因子有利于提升暴雨辨識(shí)準(zhǔn)確率,也即該暴雨影響因子不屬于該水庫(kù)流域的暴雨特征因子,應(yīng)去掉;
(4.2)若重新計(jì)算的聚類準(zhǔn)確率C變小,則表明去掉該暴雨影響因子不利于提升暴雨辨識(shí)準(zhǔn)確率,也即該暴雨影響因子屬于該水庫(kù)流域的暴雨特征因子,應(yīng)保留。
優(yōu)選地,步驟(1)所述的暴雨影響因子包括K指數(shù)以及不同海拔高度的因子。
優(yōu)選地,所述不同海拔高度的因子包括氣溫、風(fēng)速、風(fēng)向、濕度以及云水含量。
與現(xiàn)有技術(shù)相比,本發(fā)明的優(yōu)點(diǎn)在于:
本發(fā)明的基于空間聚類的水庫(kù)流域暴雨特征因子辨識(shí)方法,可適用于所有不同暴雨天氣系統(tǒng)的特征因子辨識(shí),對(duì)準(zhǔn)確把握水庫(kù)流域暴雨天氣形勢(shì)、提升暴雨預(yù)報(bào)精度具有重要作用。其原理清晰,操作方便,具有很高的實(shí)用價(jià)值。
具體實(shí)施方式
下面結(jié)合具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步的說(shuō)明。
實(shí)施例1:
(1)獲取某水庫(kù)流域歷史降水觀測(cè)數(shù)據(jù)以及相對(duì)應(yīng)的暴雨影響因子觀測(cè)數(shù)據(jù),暴雨影響因子包括:K指數(shù)以及不同海拔高度的因子,如500hPa氣溫、500hPa風(fēng)速、500hPa風(fēng)向、500hPa濕度、500hPa云水含量、700hPa氣溫、700hPa風(fēng)速、700hPa風(fēng)向、700hPa濕度、700hPa云水含量等;
(2)將步驟(1)獲取的歷史觀測(cè)數(shù)據(jù)每一個(gè)暴雨影響因子作為數(shù)據(jù)空間的一維,水庫(kù)流域的歷史觀測(cè)數(shù)據(jù)則可以表述為高維空間的點(diǎn)據(jù)集合S:
S={Ri,xi1,xi2,…,xin},i=1,2,…,m;
其中:n為暴雨的影響因子個(gè)數(shù),m為歷史觀測(cè)數(shù)據(jù)時(shí)段長(zhǎng)度,Ri為第i個(gè)時(shí)段的降水量,xij為第i個(gè)時(shí)段第j個(gè)影響因子的觀測(cè)值;
(3)采用非監(jiān)督聚類方法將步驟(2)中高維空間的點(diǎn)據(jù)進(jìn)行聚類,計(jì)算暴雨點(diǎn)據(jù)的聚類準(zhǔn)確率C:
其中:G為聚類的類別數(shù);P為暴雨判別閾值,Ri>P的點(diǎn)據(jù)即為暴雨點(diǎn)據(jù),一般P的取值標(biāo)準(zhǔn)為12小時(shí)降水量30mm或者24小時(shí)降水量50mm;countB(Ri>P)為計(jì)算暴雨點(diǎn)據(jù)的個(gè)數(shù);countA(Ri>P)為暴雨點(diǎn)據(jù)所在的類別中所有點(diǎn)據(jù)的個(gè)數(shù);
(4)從步驟(2)中依次去掉一個(gè)暴雨影響因子,重新計(jì)算步驟(3)的聚類準(zhǔn)確率,并根據(jù)重新計(jì)算的聚類準(zhǔn)確率的變化來(lái)判斷所去掉的暴雨影響因子是否屬于暴雨特征因子,其判斷方法具體為:
(4.1)若重新計(jì)算的聚類準(zhǔn)確率C變大,則表明去掉該暴雨影響因子有利于提升暴雨辨識(shí)準(zhǔn)確率,也即該暴雨影響因子不屬于該水庫(kù)流域的暴雨特征因子,應(yīng)去掉;
(4.2)若重新計(jì)算的聚類準(zhǔn)確率C變小,則表明去掉該暴雨影響因子不利于提升暴雨辨識(shí)準(zhǔn)確率,也即該暴雨影響因子屬于該水庫(kù)流域的暴雨特征因子,應(yīng)保留;
(5)重復(fù)步驟(4)直至不能去掉任何一個(gè)暴雨影響因子,最終保留的因子即為該水庫(kù)流域的暴雨特征因子。
以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,本發(fā)明的保護(hù)范圍并不僅局限于上述實(shí)施例,凡屬于本發(fā)明思路下的技術(shù)方案均屬于本發(fā)明的保護(hù)范圍。應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明原理前提下的若干改進(jìn)和潤(rùn)飾,均應(yīng)視為本發(fā)明的保護(hù)范圍。