本發(fā)明屬于天然氣生產(chǎn),涉及一種基于集成樹的智能氣井異常檢測方法及系統(tǒng)。
背景技術:
1、排水采氣工作量呈逐年遞增趨勢,平均每位技術人員全年需消耗9.3天進行參數(shù)調(diào)整,普遍存在氣井動態(tài)分析強度大、異常氣井判別及自動化措施調(diào)參不及時、措施制度調(diào)整效率低等問題,影響氣田措施有效率。因此有必須要結合氣井開發(fā)指標及生產(chǎn)參數(shù),開展氣井生產(chǎn)動態(tài)的智能分析及異常判識研究,建立有效的氣井動態(tài)分析大數(shù)據(jù)算法,降低人員管理工作量。
技術實現(xiàn)思路
1、本發(fā)明的目的在于解決現(xiàn)有技術中氣井管理工作量大,氣井異常判識不及時、措施制度調(diào)整有效率低的問題,提供一種基于集成樹的智能氣井異常檢測方法及系統(tǒng)。
2、為達到上述目的,本發(fā)明采用以下技術方案予以實現(xiàn):
3、本發(fā)明提出的一種基于集成樹的智能氣井異常檢測方法,包括如下步驟:
4、對時間序列形式的采氣數(shù)據(jù)進行轉(zhuǎn)換,獲取有效氣井數(shù)據(jù);
5、采用最大信息系數(shù)對有效氣井數(shù)據(jù)進行特征提取,獲取特征向量;
6、對特征向量進行處理,得到異常檢測模型,實現(xiàn)氣井異常檢測。
7、優(yōu)選地,對時間序列形式的采氣數(shù)據(jù)進行轉(zhuǎn)換前,先進行數(shù)據(jù)缺失值處理。
8、優(yōu)選地,利用集成樹算法對特征向量進行訓練,得到異常檢測模型。
9、優(yōu)選地,集成樹算法的學習目標函數(shù)如下:
10、
11、其中,l(yi,xi)是樣本xi的訓練損失,ω(fk)是正則項。
12、優(yōu)選地,集成樹算法的學習目標函數(shù)的損失函數(shù)如下:
13、
14、其中,ij為分類節(jié)點的特征集,ij={i∣q(xi=j)}。
15、優(yōu)選地,正則項ω(fk)的獲取方法如下:
16、
17、其中,t是樹模型中葉節(jié)點的總數(shù),wj是相應葉節(jié)點的權重,α和λ均是懲罰系數(shù)。
18、優(yōu)選地,葉節(jié)點為沒有子節(jié)點的節(jié)點。
19、本發(fā)明提出的一種基于集成樹的智能氣井異常檢測系統(tǒng),包括:
20、數(shù)據(jù)轉(zhuǎn)換模塊,所述數(shù)據(jù)轉(zhuǎn)換模塊用于對時間序列形式的采氣數(shù)據(jù)進行轉(zhuǎn)換,獲取有效氣井數(shù)據(jù);
21、特征提取模塊,所述特征提取模塊用于采用最大信息系數(shù)對有效氣井數(shù)據(jù)進行特征提取,獲取特征向量;
22、特征向量處理模塊,所述特征向量處理模塊用于對特征向量進行處理,得到異常檢測模型,實現(xiàn)氣井異常檢測。
23、一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,所述處理器執(zhí)行計算機程序時實現(xiàn)基于集成樹的智能氣井異常檢測方法的步驟。
24、一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)基于集成樹的智能氣井異常檢測方法的步驟。
25、與現(xiàn)有技術相比,本發(fā)明具有以下有益效果:
26、本發(fā)明提出的一種基于集成樹的智能氣井異常檢測方法,氣井數(shù)據(jù)是一種隨時間不斷變化的序列數(shù)據(jù),僅僅使用當前時刻數(shù)據(jù)無法捕捉歷史數(shù)據(jù)對當前決策的影響,也就無法通過上下文的信息判斷當前異常。因此,在設計異常檢測模型判之前,有必要將時間序列形式的采氣數(shù)據(jù)轉(zhuǎn)換為有效氣井數(shù)據(jù)。但是,維數(shù)的增加容易產(chǎn)生維度災難,大量冗余的信息使得模型訓練收斂困難,訓練速度降低。本發(fā)明采用最大信息系數(shù)過濾相關性較高的特征使得維數(shù)下降,使得保留的特征最大化保持相互獨立。而且最大信息系數(shù)相比于最常使用的pearson相關系數(shù),能克服最大線性局限性,可以找到更多相關類型的特征。再對氣井生產(chǎn)數(shù)據(jù)進行訓練,得到異常檢測模型,實現(xiàn)氣井異常檢測。本發(fā)明建立了一套快速、可靠的數(shù)據(jù)驅(qū)動智能異常檢測模型,不僅能識別點異常,而且能根據(jù)歷史數(shù)據(jù)發(fā)現(xiàn)上下文異常。在真實采氣數(shù)據(jù)集上測試結果與人工標注結果對比,結果表明提出的框架具有良好的性能,能夠解決現(xiàn)有技術中氣井異常判識不及時、措施制度調(diào)整有效率低的問題。
27、本發(fā)明提出的一種基于集成樹的智能氣井異常檢測系統(tǒng),通過將系統(tǒng)劃分為數(shù)據(jù)轉(zhuǎn)換模塊、特征提取模塊和特征向量獲取模塊,實現(xiàn)氣井異常檢測。采用模塊化思想使各個模塊之間相互獨立,方便對各模塊進行統(tǒng)一管理。
1.一種基于集成樹的智能氣井異常檢測方法,其特征在于,包括如下步驟:
2.根據(jù)權利要求1所述的基于集成樹的智能氣井異常檢測方法,其特征在于,對時間序列形式的采氣數(shù)據(jù)進行轉(zhuǎn)換前,先進行數(shù)據(jù)缺失值處理。
3.根據(jù)權利要求1所述的基于集成樹的智能氣井異常檢測方法,其特征在于,利用集成樹算法對特征向量進行訓練,得到異常檢測模型。
4.根據(jù)權利要求3所述的基于集成樹的智能氣井異常檢測方法,其特征在于,集成樹算法的學習目標函數(shù)如下:
5.根據(jù)權利要求4所述的基于集成樹的智能氣井異常檢測方法,其特征在于,集成樹算法的學習目標函數(shù)的損失函數(shù)如下:
6.根據(jù)權利要求4所述的基于集成樹的智能氣井異常檢測方法,其特征在于,正則項ω(fk)的獲取方法如下:
7.根據(jù)權利要求6所述的基于集成樹的智能氣井異常檢測方法,其特征在于,葉節(jié)點為沒有子節(jié)點的節(jié)點。
8.一種基于集成樹的智能氣井異常檢測系統(tǒng),其特征在于,包括:
9.一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,其特征在于,所述處理器執(zhí)行計算機程序時實現(xiàn)如權利要求1至7中任意一項所述的基于集成樹的智能氣井異常檢測方法的步驟。
10.一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)存儲有計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權利要求1至7中任意一項所述的基于集成樹的智能氣井異常檢測方法的步驟。