本發(fā)明屬于巖石力學領域,特別涉及一種基于機器學習的多元數(shù)據(jù)耦合地層壓力計算方法。
背景技術:
1、瓊東南盆地基底主要為印支期與燕山期花崗巖潛山(年齡:65ma)。瓊東南盆地花崗巖潛山的形成與演化受到印支期、燕山期和喜馬拉雅期多期構造運動影響,為其潛山風化殼和內部裂縫型儲層的形成提供了良好的條件。瓊東南潛山劃分為南部潛山帶、中部潛山帶和北部潛山帶3個潛山帶??傮w上,從南部潛山帶到北部潛山帶,埋藏深度、埋藏時間及現(xiàn)今海水深度都在減小,潛山發(fā)育部位在升高。
2、目前國內外對于砂泥巖地層的超壓研究已逐漸趨于成熟,近年在鶯瓊盆地實施地層壓力監(jiān)測已具備初步的基于壓力成因進行地層壓力監(jiān)測的手段,在常規(guī)巖性、常見壓力成因(欠壓實、流體膨脹、壓力傳導等)的地層中壓力監(jiān)測精度較高。然而,近年來基巖潛山逐漸成為勘探開發(fā)的熱點領域之一,對于瓊東南盆地基巖潛山特殊巖性地層壓力的評價技術手段較為有限,嚴重制約了地層壓力的評價精度。
3、目前,主要采用電測聲波和錄井dc指數(shù)進行潛山地層超壓的評價,但是這兩個參數(shù)不能精確指示潛山地層超壓,主要原因為:1)潛山地層骨架致密,聲波速度大小主要取決于巖石骨架和裂縫發(fā)育程度,孔隙流體超壓對聲波速度影響較小,采用電測聲波無法有效指示超壓;2)錄井dc、sigma指數(shù)主要用于沉積巖欠壓實成因超壓的現(xiàn)場定量監(jiān)測,但是在基巖地層中發(fā)現(xiàn)可指示超壓的存在,存在一些問題,即錄井參數(shù)變化的機理不明確,定量評價的結果精度較差。因此本發(fā)明提出一種基于機器學習的多元數(shù)據(jù)耦合地層壓力計算方法,綜合考慮鉆頭與潛山地層的相互作用,優(yōu)選或構建能夠有效表征潛山地層超壓的錄井數(shù)據(jù)體,為鶯瓊盆地及潛山地層壓力的準確評價提供理論依據(jù)。
技術實現(xiàn)思路
1、一種基于機器學習的多元數(shù)據(jù)耦合地層壓力計算方法,其特征在于,包括以下步驟:
2、s1:采集多口井的測-錄井數(shù)據(jù),測井參數(shù)主要包括聲波時差、密度,錄井參數(shù)主要包括gr、電阻率、鉆速、鉆柱轉速、mse、dc指數(shù)、鉆頭橫向功、鉆頭縱向功、鉆井液循環(huán)當量密度(ecd)、上覆巖層壓力當量密度(obg)。
3、s2:基于dc指數(shù)、鉆井效率-機械比能監(jiān)測、氣測輔助判斷、實測測壓數(shù)據(jù)等,模擬實際地層壓力。
4、s3:繪制測井數(shù)據(jù)與地層壓力值之間的交匯圖,利用一元線性回歸方法,得到地層壓力值與測井數(shù)據(jù)之間的一元擬合方程。
5、s4:繪制測井數(shù)據(jù)、錄井數(shù)據(jù)與地層壓力值之間的交匯圖,利用二元線性回歸方法得到地層壓力值與測-錄井參數(shù)之間的二元擬合方程。
6、s5:綜合地層壓力值與測-錄井參數(shù)之間的二元擬合方程,建立基于測井-錄井二元耦合數(shù)據(jù)的地層壓力計算模型。
7、s6:基于測井-錄井二元耦合數(shù)據(jù)的地層壓力計算模型,計算地層壓力,包括pp→den&dc、pp→den&mse、pp→vp&dc、pp→vp&mse。
8、s7:對s6得到的新地層壓力,利用程序進行綜合修正得到pp-修正。
9、s8:基于收集的測-錄井數(shù)據(jù)和pp-修正數(shù)據(jù),建立每口井的測-錄井參數(shù)熱力圖,得到測錄井參數(shù)與地層壓力之間的相關性大小。
10、s9:基于熱力圖展示的結果,利用代碼刪除存在強相關性的兩個參數(shù)的其中之一,得到消元后的測錄井參數(shù)數(shù)據(jù)集。
11、s10:基于消元后得到的數(shù)據(jù)集,利用機器學習算法上進行數(shù)據(jù)訓練,建立基于測錄井多元數(shù)據(jù)耦合的地層壓力計算模型。所述機器學習算法是隨機森林法、多元線性回歸法、決策樹法、支持向量機法。
12、在所述的s5中,其特征在于所述的基于測錄井二元數(shù)據(jù)耦合的地層壓力計算新方法的模型為:
13、pp=m×vp+n×錄井參數(shù)(dc、siga、mse、縱向功、橫向功)+o
14、pp=j×den+k×錄井參數(shù)(dc、siga、mse、縱向功、橫向功)+l
15、式中:m、n、o、j、k、l為系數(shù),需分區(qū)塊進行確定。
16、在所述的s6中,所述的pp→den&dc是指采用測井密度和錄井參數(shù)dc指數(shù),利用測井-錄井二元耦合數(shù)據(jù)的地層壓力計算模型計算的新地層壓力;所述的pp→den&mse是指采用測井密度和錄井參數(shù)mse,利用測井-錄井二元耦合數(shù)據(jù)的地層壓力計算模型計算的新地層壓力;所述的pp→vp&dc是指采用測井參數(shù)聲波時差和錄井參數(shù)dc指數(shù),利用測井-錄井二元耦合數(shù)據(jù)的地層壓力計算模型計算的新地層壓力;所述的pp→vp&mse是指采用測井參數(shù)聲波時差和錄井參數(shù)mse,利用測井-錄井二元耦合數(shù)據(jù)的地層壓力計算模型計算的新地層壓力。
17、在所述的s7中,首先識別并刪除異常值,再檢查數(shù)據(jù)集利用detect?outliers方法對存在空值和nan值的行進行刪除。再綜合幾個新的地層壓力結果,得到pp-修正。
18、在所述的s8中,所述的熱力圖展示結果主要通過顏色來區(qū)分相關性大小,顏色越重相關系數(shù)越大。
19、在所述的s9中,利用代碼刪除相關性(絕對值)在0.9以上的屬性。
20、在所述的s10中,綜合熱力圖和機器學習算法得到的結果,選出效果最好(預測相關系數(shù)最高)的模型。
21、本發(fā)明因而提供一種基于機器學習的測錄井多元數(shù)據(jù)耦合的地層壓力計算的系統(tǒng),其特征在于,其包括用于執(zhí)行如權利要求1至8任一項所述的方法中s2至s10步驟的模塊,具體地,包括數(shù)據(jù)錄入模塊,用于錄入來自s1步驟的數(shù)據(jù);數(shù)據(jù)處理模塊,用以執(zhí)行s2至s10步驟中的數(shù)據(jù)計算(具體地,包括二元數(shù)據(jù)擬合模塊,用以執(zhí)行s2至s6步驟中的數(shù)據(jù)計算;pp-修正模塊,用以執(zhí)行s7至s9步驟中的數(shù)據(jù)修正及強相關性消元;多元數(shù)據(jù)耦合模塊,用以輸出s10步驟得到的數(shù)據(jù)耦合模型);以及結果輸出模塊,用以輸出數(shù)據(jù)處理模塊得到的結果。上述可以通過計算語言編程得到相關的計算機程序來實現(xiàn)。
22、優(yōu)選地,其中多元數(shù)據(jù)耦合模塊中基于隨機森林法多元數(shù)據(jù)耦合地層壓力計算模塊的計算機程序如下:
23、
24、任選地,還包括結果顯示模塊,如通過屏幕或遠程終端顯示等。
25、與現(xiàn)有技術相比,本發(fā)明具有如下優(yōu)勢:本發(fā)明公開了一種基于機器學習的多元數(shù)據(jù)耦合地層壓力計算方法,充分利用測錄井數(shù)據(jù),通過多元數(shù)據(jù)擬合模塊建立基于測井-錄井多元數(shù)據(jù)耦合數(shù)據(jù)的地層壓力計算模型,利用測井數(shù)據(jù)評價消除裂縫發(fā)育程度對破巖效率的影響,進一步,根據(jù)錄井數(shù)據(jù)分析綜合考慮鉆頭與潛山地層的相互作用,構建了能夠有效表征潛山地層超壓的錄井數(shù)據(jù)體。本發(fā)明公開的一種基于機器學習的多元數(shù)據(jù)耦合地層壓力計算方法,通過pp-修正模塊,綜合熱力圖分析結果,消除強相關性參數(shù)的影響,以簡化數(shù)據(jù)模型,具有更高的適用性。本發(fā)明方法綜合考慮鉆頭與潛山地層的相互作用,建立了監(jiān)測潛山地層壓力的新方法,可實現(xiàn)潛山超壓的定量評價。
1.一種基于機器學習的測錄井多元數(shù)據(jù)耦合的地層壓力計算的方法,其特征在于,包括以下步驟:
2.如權利要求1所述的方法,其特征在于,在所述的s5中,所述的基于測錄井二元數(shù)據(jù)耦合的地層壓力計算模型為:
3.如權利要求1所述的方法,其特征在于,在所述的s6中,所述的pp→den&dc是指采用測井密度和錄井參數(shù)dc指數(shù),利用測井-錄井二元耦合數(shù)據(jù)的地層壓力計算模型計算的新地層壓力;所述的pp→den&mse是指采用測井密度和錄井參數(shù)mse,利用測井-錄井二元耦合數(shù)據(jù)的地層壓力計算模型計算的新地層壓力;所述的pp→vp&dc是指采用測井參數(shù)聲波時差和錄井參數(shù)dc指數(shù),利用測井-錄井二元耦合數(shù)據(jù)的地層壓力計算模型計算的新地層壓力;所述的pp→vp&mse是指采用測井參數(shù)聲波時差和錄井參數(shù)mse,利用測井-錄井二元耦合數(shù)據(jù)的地層壓力計算模型計算的新地層壓力。
4.如權利要求1所述的方法,其特征在于,在所述的s7中,首先識別并刪除異常值,再檢查數(shù)據(jù)集利用detect?outliers方法對存在空值和nan值的行進行刪除。再綜合幾個新的地層壓力結果,得到pp-修正。
5.如權利要求1所述的方法,其特征在于,在所述的s8中,所述的熱力圖展示結果主要通過顏色來區(qū)分相關性大小,顏色越重相關系數(shù)越大。
6.如權利要求1所述的方法,其特征在于,在所述的s9中,利用代碼刪除具有強相關性屬性(相關系數(shù)的絕對值在0.9以上)的參數(shù)。
7.如權利要求1所述的方法,其特征在于,在所述的s10中,其特征在于,所述的機器學習算法主要有隨機森林法。
8.一種基于機器學習的測錄井多元數(shù)據(jù)耦合的地層壓力計算的系統(tǒng),其特征在于,其包括用于執(zhí)行如權利要求1至8任一項所述的方法中s2至s10步驟的模塊,具體地,包括數(shù)據(jù)錄入模塊,用于錄入來自s1步驟的數(shù)據(jù);數(shù)據(jù)處理模塊,用以執(zhí)行s2至s10步驟中的數(shù)據(jù)計算(具體地,包括二元數(shù)據(jù)擬合模塊,用以執(zhí)行s2至s6步驟中的數(shù)據(jù)計算;pp-修正模塊,用以執(zhí)行s7至s9步驟中的數(shù)據(jù)修正及強相關性消元;多元數(shù)據(jù)耦合模塊,用以輸出s10步驟得到的數(shù)據(jù)耦合模型);以及結果輸出模塊,用以輸出數(shù)據(jù)處理模塊得到的結果;
9.如權利要求9所述的系統(tǒng),其特征在于,還包括結果顯示模塊。