基于相似數(shù)據(jù)樣式聚類的多點地質(zhì)統(tǒng)計學(xué)建模方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及儲層地質(zhì)建模技術(shù)領(lǐng)域,具體是指一種基于相似數(shù)據(jù)樣式聚類的多點 地質(zhì)統(tǒng)計學(xué)建模方法。
【背景技術(shù)】
[0002] 多點地質(zhì)統(tǒng)計學(xué)是相對于基于變差函數(shù)的兩點地質(zhì)統(tǒng)計學(xué)而言的。在兩點統(tǒng)計 里,儲集層相關(guān)性通過空間兩點協(xié)方差(變差函數(shù))進(jìn)行描述。在多點統(tǒng)計里,則是利用空 間多個點組合模式進(jìn)行描述??臻g多點組合樣式稱為數(shù)據(jù)樣板,如果在空間點賦予了值,則 為一個特定的空間多點組合模式,稱為數(shù)據(jù)事件。在建模時,對每一個未知點,估計在其處 滿足給定條件的數(shù)據(jù)事件出現(xiàn)的概率,隨后抽樣獲得未知點處值或者數(shù)據(jù)事件,即完成單 次模擬。一旦所有節(jié)點得到訪問,即完成一次模擬實現(xiàn)。
[0003] 基于多點地質(zhì)統(tǒng)計學(xué)建模算法對油田高效開發(fā)具有重要支持作用。Arpat在2003 年Stanford油藏預(yù)測中心會議上提出基于樣式的多點地質(zhì)統(tǒng)計學(xué)算法S頂PAT。S頂PAT是 一種完全不同于傳統(tǒng)建模的多點統(tǒng)計方法,它結(jié)合了計算機(jī)視覺及圖像處理方面的理論, 將地下儲集層建模作為儲集層圖像的恢復(fù)過程。采用相似性方法對地下儲集層進(jìn)行圖像恢 復(fù)和再現(xiàn)。數(shù)據(jù)事件與數(shù)據(jù)樣式之間的相似性由曼哈頓距離函數(shù)來表述:
[0004]
[0005] 其中,devT(U)表示待估點u處的數(shù)據(jù)事件,patT為訓(xùn)練圖像內(nèi)的數(shù)據(jù)樣式,η$ 數(shù)據(jù)事件的樣板框架包含的點的個數(shù),h是節(jié)點的向量。選擇訓(xùn)練圖像中最相似的數(shù)據(jù)樣 式替換待估點處數(shù)據(jù)事件。直至所有待估點都訪問并模擬,完成一次隨機(jī)模擬實現(xiàn)。
[0006] 隨著油田開發(fā)的不斷深入,地質(zhì)研究的精度越來越高,從而地質(zhì)模型的尺度越來 越小,例如很多開發(fā)中后期的老油田,地質(zhì)建模的精度達(dá)到平面網(wǎng)格劃分為10mX10m,縱向 0. 5m,甚至更小。目前普遍采用隨機(jī)模擬技術(shù)建立地質(zhì)模型,通常需要建立多個地質(zhì)模型實 現(xiàn)(如100個),甚至是三維模型。因此,地質(zhì)建模的效率逐漸成為關(guān)注的熱點問題。計算 熱點是程序代碼需要耗費大量時間運行的部分,通常是計算性能瓶頸。SIMPAT算法的計算 熱點主要是數(shù)據(jù)事件與數(shù)量龐大的樣式數(shù)據(jù)庫中所有數(shù)據(jù)樣式的相似性計算,因此,計算 性能成為普及基于數(shù)據(jù)樣式建模算法的瓶頸。
[0007] 因此,亟需研究一種針對S頂PAT算法的加速計算改進(jìn)方法,從而能高效地使用樣 式相似度匹配策略進(jìn)行多點地質(zhì)統(tǒng)計建模。
【發(fā)明內(nèi)容】
[0008] 本發(fā)明的目的在于提供一種基于相似數(shù)據(jù)樣式聚類的多點地質(zhì)統(tǒng)計學(xué)建模方法, 相比sniPAT算法,本發(fā)明大大提高了多點地質(zhì)統(tǒng)計學(xué)建模算法的效率。
[0009] 為實現(xiàn)上述目的,本發(fā)明采用以下技術(shù)方案:本發(fā)明基于相似數(shù)據(jù)樣式聚類的多 點地質(zhì)統(tǒng)計學(xué)建模方法,包括以下步驟:
[0010] 1)將數(shù)據(jù)樣板掃描訓(xùn)練圖像,得到由多個數(shù)據(jù)樣式組成的樣式數(shù)據(jù)庫;
[0011] 2)將樣式數(shù)據(jù)庫中的所有數(shù)據(jù)樣式進(jìn)行等間距取樣,得到降維數(shù)據(jù)樣式;將相同 的降維數(shù)據(jù)樣式對應(yīng)的數(shù)據(jù)樣式歸位同一類,得到相似數(shù)據(jù)樣式聚類;
[0012] 3)計算相似數(shù)據(jù)樣式聚類的數(shù)據(jù)樣式代表;
[0013] 4)構(gòu)建模擬實現(xiàn)的隨機(jī)路徑;
[0014] 5)遍歷隨機(jī)路徑中的待估點u,將數(shù)據(jù)樣板掃描模擬實現(xiàn)獲得待估點u處的數(shù)據(jù) 事件;
[0015] 6)將待估點u處的數(shù)據(jù)事件與數(shù)據(jù)樣式代表進(jìn)行相似性計算,得到與待估點u處 的數(shù)據(jù)事件最相似的數(shù)據(jù)樣式代表,再計算待估點u處的數(shù)據(jù)事件與最相似的數(shù)據(jù)樣式代 表對應(yīng)的相似數(shù)據(jù)樣式聚類中所有數(shù)據(jù)樣式進(jìn)行相似性計算,得到最相似數(shù)據(jù)樣式;
[0016] 7)最相似數(shù)據(jù)樣式替換待估點u處的數(shù)據(jù)事件;
[0017] 8)重復(fù)步驟5)至步驟7)的操作,直至隨機(jī)路徑中所有待估點都訪問完畢。
[0018] 優(yōu)選地,在步驟2)中,采用等間距取樣法對樣式數(shù)據(jù)庫中任一數(shù)據(jù)樣式的網(wǎng)格單 元進(jìn)行等間距取樣,得到降維數(shù)據(jù)樣式,等間距取樣的公式為
[0019] GThumPat(i,j,k) =Gp^CiXr,,jXrj,kXrk),
[0020] 其中IPat/IThMPat,rj=JPat/JThunPat,rk=KPat/KThMPat,GThunPat為降維數(shù)據(jù)樣式的 網(wǎng)格體,GPat為數(shù)據(jù)樣式的網(wǎng)格體,IPat、JPat、KPat表示數(shù)據(jù)樣式的數(shù)據(jù)載體網(wǎng)格體在X方向、 Y方向和Z方向的維度,IThMPat、JThuniPat、KThuniPat表示降維數(shù)據(jù)樣式的數(shù)據(jù)載體網(wǎng)格體在X方 向、Y方向和Z方向的維度,i、j、k分別表示數(shù)據(jù)樣式或降維數(shù)據(jù)樣式的數(shù)據(jù)網(wǎng)格體的網(wǎng)格 單元的X方向索引、Y方向索引、Z方向索引。
[0021] 進(jìn)一步地,在步驟3)中,對相似數(shù)據(jù)樣式聚類中所有數(shù)據(jù)樣式進(jìn)行點對點取平均 值得到數(shù)據(jù)樣式代表,數(shù)據(jù)樣式代表的節(jié)點計算公式為:
[0022]
[0023] 其中,Grapat為數(shù)據(jù)樣式代表的網(wǎng)格體,Gpat為相似數(shù)據(jù)樣式聚類中任一個數(shù)據(jù)樣式 的網(wǎng)格體,N是相似數(shù)據(jù)樣式聚類中數(shù)據(jù)樣式的總數(shù),i、j、k分別表示數(shù)據(jù)樣式或數(shù)據(jù)樣式 代表的數(shù)據(jù)載體網(wǎng)格體的網(wǎng)格單元的X方向索引、Y方向索引、Z方向索引。
[0024] 再進(jìn)一步地,在步驟6)中,待估點u處的數(shù)據(jù)事件與數(shù)據(jù)樣式代表之間、待估點u 處的數(shù)據(jù)事件與數(shù)據(jù)樣式之間的相似性通過曼哈頓距離函數(shù)來計算,曼哈頓距離函數(shù)為
[0025]
[0026]
[0027] 其中,其中,devT(u+ha)表示待估點u處的數(shù)據(jù)事件,repatT(ha)、patT(ha)分別 表示數(shù)據(jù)樣式代表、數(shù)據(jù)樣式。
[0028] 本發(fā)明的有益效果在于:本發(fā)明對樣式數(shù)據(jù)庫的所有數(shù)據(jù)樣式做了降維計算,把 相同的降維數(shù)據(jù)樣式所對應(yīng)的數(shù)據(jù)樣式歸為同一類即相似數(shù)據(jù)樣式聚類,并計算相似數(shù)據(jù) 樣式聚類的數(shù)據(jù)樣式代表,在模擬過程中,將待估點u處的數(shù)據(jù)事件與數(shù)據(jù)樣式代表進(jìn)行 相似性計算,再與最相似的數(shù)據(jù)樣式代表對應(yīng)的相似數(shù)據(jù)樣式聚類中所有數(shù)據(jù)樣式進(jìn)行相 似性計算,得到最相似數(shù)據(jù)樣式。而smpat算法在模擬過程中,需將待估點u處的數(shù)據(jù)事 件與樣式數(shù)據(jù)庫中所有數(shù)據(jù)樣式進(jìn)行相似性計算。因此,相比smPAT算法,本發(fā)明大大提 高了多點地質(zhì)統(tǒng)計學(xué)建模算法的效率。
【附圖說明】
[0029] 圖1為數(shù)據(jù)樣板掃描訓(xùn)練圖像建立樣式數(shù)據(jù)庫的原理圖;
[0030] 圖2為數(shù)據(jù)樣式進(jìn)行等間距取樣得到降維數(shù)據(jù)樣式的原理圖;
[0031] 圖3為相似數(shù)據(jù)樣式聚類、降維數(shù)據(jù)樣式和數(shù)據(jù)樣式代表的關(guān)系圖。
【具體實施方式】
[0032] 以下結(jié)合附圖和具體實施例對本發(fā)明作進(jìn)一步的詳細(xì)描述,但該實施例不應(yīng)該理 解為對本發(fā)明的限制。
[0033] 為了很好地理解本發(fā)明,下面給出相關(guān)術(shù)語解釋:
[0034] 1、網(wǎng)格單元C:沿著X方向、Y方向和Z方向上具有指定長(ISize)、寬(JSize)、高 (KSize)的矩形立方單元,網(wǎng)格單元C存儲具體數(shù)值代表其屬性。
[0035] 2、網(wǎng)格體G:由若干網(wǎng)格單元C構(gòu)成的三維結(jié)構(gòu)體,在X方向、Y方向和Z方向的維 度是IXJXK,本質(zhì)是三維矩陣。G(i,j,k)的含義是網(wǎng)格體中X方向的索引為i、Y方向索 引為j、Z方向索引為k的網(wǎng)格單元。
[0036] 3、訓(xùn)練圖像TI:是指先驗地質(zhì)概念模型,其采用網(wǎng)格體GTI作為數(shù)據(jù)載體,是能夠 表述實際儲層結(jié)構(gòu)、幾何形態(tài)及其分布模式的數(shù)字化模型。
[0037] 4、模擬實現(xiàn)R:是指模擬的模型結(jié)果,其采用網(wǎng)格體GR作為數(shù)據(jù)載體,是能夠表述 實際儲層結(jié)構(gòu)、幾何形態(tài)及其分布模式的數(shù)字化模型。
[0038] 5、數(shù)據(jù)樣板T:是指圍繞中心單元對稱的結(jié)構(gòu)體,其采用網(wǎng)格體&作為數(shù)據(jù)載體, 是能夠表述實際儲層結(jié)構(gòu)、結(jié)合形態(tài)及其分布模式的局部數(shù)字化模型,是基于樣式的多點 地質(zhì)統(tǒng)計學(xué)建模方法的基本結(jié)構(gòu)單元。
[0039] 6、數(shù)據(jù)樣式Pat:是指將數(shù)據(jù)樣板T為框架掃描訓(xùn)練圖像TI得到的局部空間數(shù)據(jù) 組合體,其采用網(wǎng)格體GPat作為數(shù)據(jù)載體。
[0040] 7、數(shù)據(jù)事件Dev:是指將數(shù)據(jù)樣板T為框架掃描模擬實現(xiàn)R得到的局部空間數(shù)據(jù) 組合體,其采用網(wǎng)格體GDJ乍為數(shù)據(jù)載體。
[0041] 6、樣式數(shù)據(jù)庫PatDB:是指將數(shù)據(jù)樣板T掃描訓(xùn)練圖像TI獲取的所有數(shù)據(jù)樣式 Pat的集合。
[0042] 8、降維數(shù)據(jù)樣式ThumPat:將樣式數(shù)據(jù)庫PatDB中的所有數(shù)據(jù)樣式Pat進(jìn)行等間 距取樣,得到降維數(shù)據(jù)樣式。
[0043] 9、相似數(shù)據(jù)樣式聚類PatC:將樣式數(shù)據(jù)庫PatDB中的所有數(shù)據(jù)樣式Pat進(jìn)行等