本發(fā)明涉及市政供水管網(wǎng)領(lǐng)域,尤其是涉及了一種基于超采樣數(shù)據(jù)增強(qiáng)和深度學(xué)習(xí)的管線漏損評(píng)估方法。
背景技術(shù):
1、供水工程中向用戶輸水和配水的管道系統(tǒng),稱供水/給水管網(wǎng)/管線,它包括輸水管渠、配水管網(wǎng)、加壓泵站、水塔、水池和管網(wǎng)附屬設(shè)施等。從水源地到水廠的管渠只起輸水作用,稱輸水管網(wǎng);自水廠出來(lái)的管道稱配水管網(wǎng)。配水管網(wǎng)中主要起輸水作用的管道稱干管,從干管分出起配水作用的管道稱支管,從支管接通用戶的稱用戶支管。爆管是指由于管道的結(jié)構(gòu)性損壞,管道漏水上升到地面,必須立即進(jìn)行維修的情況。引發(fā)管道爆管的原因較多,如管道相關(guān)因素原因、管道地理相關(guān)因素的原因、管道工藝相關(guān)因素的原因等。現(xiàn)實(shí)中,爆管事故發(fā)生以后,有時(shí)可能數(shù)日后才能被發(fā)現(xiàn),有時(shí)甚至無(wú)法發(fā)現(xiàn),這是因?yàn)楸芤鸬穆┧苯舆M(jìn)入到附近的排水管渠而無(wú)法到達(dá)地面。因此,對(duì)供水管網(wǎng)的漏損評(píng)估、監(jiān)測(cè)等,是特別重要的工作。
2、現(xiàn)階段管網(wǎng)評(píng)估廣泛應(yīng)用的健康度評(píng)估方案是基于模糊數(shù)學(xué)的層次分析法,它綜合考慮管線風(fēng)險(xiǎn)因素,利用專家知識(shí)賦予風(fēng)險(xiǎn)因素權(quán)重并量化管線風(fēng)險(xiǎn)評(píng)估結(jié)果,該方法可以評(píng)估管線健康度的相對(duì)高低,但引入專家知識(shí)帶來(lái)的主觀性限制了其跨地域、跨系統(tǒng)的實(shí)踐應(yīng)用。
技術(shù)實(shí)現(xiàn)思路
1、為了解決背景技術(shù)中所存在的問題,本發(fā)明提出了一種基于超采樣數(shù)據(jù)增強(qiáng)和深度學(xué)習(xí)的管線漏損評(píng)估方法。
2、一種基于超采樣數(shù)據(jù)增強(qiáng)和深度學(xué)習(xí)的管線漏損評(píng)估方法,包括步驟:
3、s100、獲取管線特征數(shù)據(jù),并將管線特征數(shù)據(jù)劃分為數(shù)值型特征數(shù)據(jù)和屬性型特征數(shù)據(jù);
4、s200、將數(shù)值型特征數(shù)據(jù)處理為模式類標(biāo)量,將屬性型特征數(shù)據(jù)處理為屬性類特征掩碼;
5、s300、將數(shù)值型特征數(shù)據(jù)與屬性型特征數(shù)據(jù)映射至統(tǒng)一的維度空間;
6、s400、組合管線特征并生成風(fēng)險(xiǎn)因素高階交互;
7、s500、使用殘差連接促進(jìn)層間信息交流并實(shí)現(xiàn)風(fēng)險(xiǎn)概率映射。
8、基于上述,在步驟s200中,在處理管線數(shù)值型特征數(shù)據(jù)時(shí),首先進(jìn)行混合高斯分布模式學(xué)習(xí),將生成數(shù)據(jù)的模式種類作為條件向量的一部分,約束生成的數(shù)值范圍,再為學(xué)習(xí)到的模式分配概率權(quán)重,并根據(jù)權(quán)重選擇生成樣本所屬的模式分類,最終生成模式類標(biāo)量;該過(guò)程通過(guò)如下公式表示,對(duì)于所有的數(shù)值型特征ci:
9、
10、其中,ci,j是第j項(xiàng)數(shù)值特征,μk是學(xué)習(xí)到的第k個(gè)模式的權(quán)重,ηk為學(xué)習(xí)到的第k個(gè)模式的高斯分布均值,φk為第k個(gè)模式的標(biāo)準(zhǔn)差,αi,j為其所屬的模式內(nèi)數(shù)據(jù)值。
11、基于上述,在步驟s200中,在處理管線屬性型特征數(shù)據(jù)時(shí),對(duì)于第i行的屬性類特征數(shù)據(jù)di,生成零填充的掩碼向量mi,其中mi的第k個(gè)元素表示類別k的掩碼;對(duì)每個(gè)類別k,根據(jù)該類別在列di中出現(xiàn)的次數(shù)n,計(jì)算概率函數(shù)p(di=k)=n/n,根據(jù)概率函數(shù)選擇類別k*,并將掩碼向量mi中對(duì)應(yīng)于k*的元素更新為1;將所有生成的屬性類特征掩碼進(jìn)行拼接,形成最終的離散量生成結(jié)果最終生成器生成的虛擬漏損樣本表示為如下公式:
12、
13、其中:為最終生成的第j個(gè)管線樣本特征,c為數(shù)值型特征的維度,為該生成樣本的數(shù)值型特征,n為類別總量,為該生成樣本的數(shù)值型特征的模式量,其為獨(dú)熱編碼,若計(jì)算所得的該值屬于學(xué)習(xí)到的模式3,則可得βi,j=[0,0,1]。
14、基于上述,在步驟s400中,構(gòu)建用于組合管線特征生成風(fēng)險(xiǎn)因素高階交互的表征學(xué)習(xí)層,過(guò)程如下:
15、
16、式中,em,ek分別為某管線的嵌入特征m,k,在單獨(dú)的注意力頭h中,使用內(nèi)積函數(shù)ψ(h)(·,·)來(lái)計(jì)算兩個(gè)特征之間的相似度,為將原始嵌入空間映射到新空間的變換矩陣,并通過(guò)相似度計(jì)算m,k之間的注意力分?jǐn)?shù)并將管線嵌入特征m更新為將所有頭注意力機(jī)制的計(jì)算結(jié)果拼接,最終得到管線高階交互表征
17、基于上述,在步驟s500中,通過(guò)殘差連接將多層表征學(xué)習(xí)層的結(jié)果聚合,并利用sigmoid函數(shù)輸出最終的二分類預(yù)測(cè)向量,該過(guò)程如下所示:
18、
19、式中,為第m個(gè)屬性特征生成的殘差表征,wres為待學(xué)習(xí)的殘差權(quán)重矩陣,wt為映射層權(quán)重矩陣,b為待學(xué)習(xí)的偏置量,為模型預(yù)測(cè)漏損風(fēng)險(xiǎn)結(jié)果。
20、基于上述,在步驟s500中,預(yù)測(cè)漏損風(fēng)險(xiǎn)結(jié)果即為管線漏損概率,將一定范圍內(nèi)的漏損概率的管線劃分為相同的管線健康度。
21、基于上述,健康度閾值為:
22、0至0.5:管線狀態(tài)健康;
23、0.5至0.75:管線狀態(tài)一般;
24、0.75至1:管線狀態(tài)危險(xiǎn)。
25、基于上述,包括步驟s600,通過(guò)shap分析不同風(fēng)險(xiǎn)因素的影響,公式為:
26、
27、式中,s是特征子集,丨s丨是s特征子集的數(shù)量(即大小),p是輸入特征總體的數(shù)量,x是管線樣本所有的特征集,xs是把特征子集s去掉之后剩余的特征集,f(xs∪i)表示包含特征i的模型輸出,f(xs)表示不包含特征i的模型輸出。
28、本發(fā)明相對(duì)現(xiàn)有技術(shù)具有突出的實(shí)質(zhì)性特點(diǎn)和顯著的進(jìn)步,具體的說(shuō),本發(fā)明以數(shù)據(jù)驅(qū)動(dòng)模型(即漏損評(píng)估模型)預(yù)測(cè)結(jié)果為管線健康度評(píng)估參考依據(jù),不需要依賴專家判斷或其他人工風(fēng)險(xiǎn)等級(jí)標(biāo)簽,在實(shí)踐中從管線數(shù)據(jù)中挖掘出的典型模式來(lái)學(xué)習(xí)知識(shí),通過(guò)深入分析管線屬性的特點(diǎn),并針對(duì)樣本不平衡的問題,采用了條件向量?jī)?yōu)化對(duì)抗神經(jīng)網(wǎng)絡(luò)技術(shù),以平衡數(shù)據(jù)庫(kù)中漏損管線與正常管線的樣本比例;通過(guò)探討管線風(fēng)險(xiǎn)因素之間的相互關(guān)系,利用多頭注意力機(jī)制來(lái)構(gòu)建風(fēng)險(xiǎn)特征之間的高階組合,克服了傳統(tǒng)模型在識(shí)別漏損管線方面的準(zhǔn)確性不足,顯著提高了模型的性能和可靠性。
1.一種基于超采樣數(shù)據(jù)增強(qiáng)和深度學(xué)習(xí)的管線漏損評(píng)估方法,其特征在于,包括步驟:
2.根據(jù)權(quán)利要求1所述的基于超采樣數(shù)據(jù)增強(qiáng)和深度學(xué)習(xí)的管線漏損評(píng)估方法,其特征在于:在步驟s200中,在處理管線數(shù)值型特征數(shù)據(jù)時(shí),首先進(jìn)行混合高斯分布模式學(xué)習(xí),將生成數(shù)據(jù)的模式種類作為條件向量的一部分,約束生成的數(shù)值范圍,再為學(xué)習(xí)到的模式分配概率權(quán)重,并根據(jù)權(quán)重選擇生成樣本所屬的模式分類,最終生成模式類標(biāo)量;該過(guò)程通過(guò)如下公式表示,對(duì)于所有的數(shù)值型特征ci:
3.根據(jù)權(quán)利要求1所述的基于超采樣數(shù)據(jù)增強(qiáng)和深度學(xué)習(xí)的管線漏損評(píng)估方法,其特征在于:在步驟s200中,在處理管線屬性型特征數(shù)據(jù)時(shí),對(duì)于第i行的屬性類特征數(shù)據(jù)di,生成零填充的掩碼向量mi,其中mi的第k個(gè)元素表示類別k的掩碼;對(duì)每個(gè)類別k,根據(jù)該類別在列di中出現(xiàn)的次數(shù)n,計(jì)算概率函數(shù)p(di=k)=n/n,根據(jù)概率函數(shù)選擇類別k*,并將掩碼向量mi中對(duì)應(yīng)于k*的元素更新為1;將所有生成的屬性類特征掩碼進(jìn)行拼接,形成最終的離散量生成結(jié)果最終生成器生成的虛擬漏損樣本表示為如下公式:
4.根據(jù)權(quán)利要求1所述的基于超采樣數(shù)據(jù)增強(qiáng)和深度學(xué)習(xí)的管線漏損評(píng)估方法,其特征在于:在步驟s400中,構(gòu)建用于組合管線特征生成風(fēng)險(xiǎn)因素高階交互的表征學(xué)習(xí)層,過(guò)程如下:
5.根據(jù)權(quán)利要求1所述的基于超采樣數(shù)據(jù)增強(qiáng)和深度學(xué)習(xí)的管線漏損評(píng)估方法,其特征在于:在步驟s500中,通過(guò)殘差連接將多層表征學(xué)習(xí)層的結(jié)果聚合,并利用sigmoid函數(shù)輸出最終的二分類預(yù)測(cè)向量,該過(guò)程如下所示:
6.根據(jù)權(quán)利要求1所述的基于超采樣數(shù)據(jù)增強(qiáng)和深度學(xué)習(xí)的管線漏損評(píng)估方法,其特征在于:在步驟s500中,預(yù)測(cè)漏損風(fēng)險(xiǎn)結(jié)果即為管線漏損概率,將一定范圍內(nèi)的漏損概率的管線劃分為相同的管線健康度。
7.根據(jù)權(quán)利要求6所述的基于超采樣數(shù)據(jù)增強(qiáng)和深度學(xué)習(xí)的管線漏損評(píng)估方法,其特征在于:健康度閾值為:
8.根據(jù)權(quán)利要求1所述的基于超采樣數(shù)據(jù)增強(qiáng)和深度學(xué)習(xí)的管線漏損評(píng)估方法,其特征在于:包括步驟s600,通過(guò)shap分析不同風(fēng)險(xiǎn)因素的影響,公式為: