間 距取樣,得到降維數(shù)據(jù)樣式,然后將相同的降維數(shù)據(jù)樣式所對應(yīng)的數(shù)據(jù)樣式歸位同一類,得 到相似數(shù)據(jù)樣式聚類。
[0044] 10、數(shù)據(jù)樣式代表R印Pat:是采用點(diǎn)對點(diǎn)計算平均值方法對某一相似數(shù)據(jù)樣式聚 類PatC內(nèi)所有數(shù)據(jù)樣式Pat做計算處理,得到表示該相似數(shù)據(jù)樣式聚類PatC主要特點(diǎn)的 數(shù)據(jù)樣式。
[0045] 本發(fā)明提供一種基于相似數(shù)據(jù)樣式聚類的多點(diǎn)地質(zhì)統(tǒng)計學(xué)建模方法,包括以下步 驟:
[0046] 1)將數(shù)據(jù)樣板掃描訓(xùn)練圖像,得到由多個數(shù)據(jù)樣式組成的樣式數(shù)據(jù)庫,圖1所示;
[0047] 2)將樣式數(shù)據(jù)庫中的所有數(shù)據(jù)樣式進(jìn)行等間距取樣,得到降維數(shù)據(jù)樣式,如圖2 所示;將相同的降維數(shù)據(jù)樣式對應(yīng)的數(shù)據(jù)樣式歸位同一類,得到相似數(shù)據(jù)樣式聚類,如圖3 所示。其中,采用等間距取樣法對樣式數(shù)據(jù)庫中任一數(shù)據(jù)樣式的網(wǎng)格單元進(jìn)行等間距取樣, 得到降維數(shù)據(jù)樣式,等間距取樣的公式為
[0048] GThumPat(i,j,k) =Gp^CiXr,,jXrj,kXrk)
[0049] 其中IPat/IThMPat,rj=JPat/JThunPat,rk=KPat/KThMPat,GThunPat為降維數(shù)據(jù)樣式的 網(wǎng)格體,GPat為數(shù)據(jù)樣式的網(wǎng)格體,IPat、JPat、KPat表示數(shù)據(jù)樣式的數(shù)據(jù)載體網(wǎng)格體的X方向、 Y方向和Z方向的維度,IThMPat、JThuniPat、KThuniPat表示降維數(shù)據(jù)樣式的數(shù)據(jù)載體網(wǎng)格體的X方 向、Y方向和Z方向的維度,i、j、k分別表示數(shù)據(jù)樣式或降維數(shù)據(jù)樣式的數(shù)據(jù)載體網(wǎng)格體的 網(wǎng)格單元的X方向索引、Y方向索引、Z方向索引。
[0050] 3)計算相似數(shù)據(jù)樣式聚類的數(shù)據(jù)樣式代表,如圖3所示。其中,對相似數(shù)據(jù)樣式聚 類中所有數(shù)據(jù)樣式進(jìn)行點(diǎn)對點(diǎn)取平均值得到數(shù)據(jù)樣式代表,數(shù)據(jù)樣式代表的節(jié)點(diǎn)計算公式 為:
[0051]
[0052] 其中,Grapat為數(shù)據(jù)樣式代表的網(wǎng)格體,Gpat為相似數(shù)據(jù)樣式聚類中任一個數(shù)據(jù)樣式 的網(wǎng)格體,N是相似數(shù)據(jù)樣式聚類中數(shù)據(jù)樣式的總數(shù),i、j、k分別表示數(shù)據(jù)樣式或數(shù)據(jù)樣式 代表的數(shù)據(jù)載體網(wǎng)格體的網(wǎng)格單元的X方向索引、Y方向索引、Z方向索引。
[0053] 4)構(gòu)建模擬實(shí)現(xiàn)的隨機(jī)路徑;
[0054] 5)遍歷隨機(jī)路徑中的待估點(diǎn)u,將數(shù)據(jù)樣板掃描模擬實(shí)現(xiàn)獲得待估點(diǎn)u處的數(shù)據(jù) 事件;
[0055] 6)將待估點(diǎn)u處的數(shù)據(jù)事件與數(shù)據(jù)樣式代表進(jìn)行相似性計算,得到與待估點(diǎn)u處 的數(shù)據(jù)事件最相似的數(shù)據(jù)樣式代表,再計算待估點(diǎn)u處的數(shù)據(jù)事件與最相似的數(shù)據(jù)樣式代 表對應(yīng)的相似數(shù)據(jù)樣式聚類中所有數(shù)據(jù)樣式進(jìn)行相似性計算,得到最相似數(shù)據(jù)樣式。其中, 待估點(diǎn)u處的數(shù)據(jù)事件與數(shù)據(jù)樣式代表之間、待估點(diǎn)u處的數(shù)據(jù)事件與數(shù)據(jù)樣式之間的相 似性通過曼哈頓距離函數(shù)來計算,曼哈頓距離函數(shù)為
[0056] ,
[0057] :,
[0058] 其中,devT(u+ha)表示待估點(diǎn)u處的數(shù)據(jù)事件,repatT(ha)、patT(ha)分別表示數(shù) 據(jù)樣式代表、數(shù)據(jù)樣式。
[0059] 7)最相似數(shù)據(jù)樣式替換待估點(diǎn)u處的數(shù)據(jù)事件;
[0060] 8)重復(fù)步驟5)至步驟7)的操作,直至隨機(jī)路徑中所有待估點(diǎn)都訪問完畢。
[0061] 下面分別采用SmPAT算法和本發(fā)明算法對以兩幅二值圖像作為訓(xùn)練圖像計算 1〇〇個非條件模擬實(shí)現(xiàn),比較兩者算法的計算耗時來檢驗(yàn)本發(fā)明算法在提高建模效率方面 的改進(jìn)效果。其一是二維Largetrain河流相數(shù)字模型,其維度為250X250,網(wǎng)格單元尺寸 為lmXlm。另一個是三維fluvsim河流相數(shù)字模型,其維度為69X69X39,網(wǎng)格單元尺寸 是lmXlmXlm〇
[0062] 參見表1,采用SniPAT算法和本發(fā)明算法計算100個非條件模擬實(shí)現(xiàn)的計算耗 時對比:(1)以二維Largetrain河流相數(shù)字模型作為訓(xùn)練圖像,模擬實(shí)現(xiàn)的網(wǎng)格體維度 為250X250,數(shù)據(jù)樣板的維度為9X9,降維數(shù)據(jù)樣式的維度為5X5,SIMPAT的計算耗時 是5245秒,本發(fā)明算法的計算耗時是204秒,本發(fā)明算法的計算效率相比S頂PAT算法提 高25倍;(2)以三維fluvsim河流相數(shù)字模型作為訓(xùn)練圖像,模擬實(shí)現(xiàn)的網(wǎng)格體維度為 69X69X39,數(shù)據(jù)樣板的維度為11XIIX5,降維數(shù)據(jù)樣式的維度為5X5X3,S頂PAT的計 算耗時是96588秒,本發(fā)明算法的計算耗時是1498秒,本發(fā)明算法的計算效率相比S頂PAT 算法提高64倍。
[0063] 表1 S頂PAT算法和本發(fā)明算法計算100個模擬實(shí)現(xiàn)的計算耗時對比表
[0064]
[0065] 從表1可以看出,本發(fā)明大大提高了多點(diǎn)地質(zhì)統(tǒng)計學(xué)建模算法的效率。
[0066] 本說明書中未作詳細(xì)描述的內(nèi)容,屬于本專業(yè)技術(shù)人員公知的現(xiàn)有技術(shù)。
【主權(quán)項(xiàng)】
1. 一種基于相似數(shù)據(jù)樣式聚類的多點(diǎn)地質(zhì)統(tǒng)計學(xué)建模方法,其特征在于:包括以下步 驟: 1) 將數(shù)據(jù)樣板掃描訓(xùn)練圖像,得到由多個數(shù)據(jù)樣式組成的樣式數(shù)據(jù)庫; 2) 將樣式數(shù)據(jù)庫中的所有數(shù)據(jù)樣式進(jìn)行等間距取樣,得到降維數(shù)據(jù)樣式;將相同的降 維數(shù)據(jù)樣式對應(yīng)的數(shù)據(jù)樣式歸位同一類,得到相似數(shù)據(jù)樣式聚類; 3) 計算相似數(shù)據(jù)樣式聚類的數(shù)據(jù)樣式代表; 4) 構(gòu)建模擬實(shí)現(xiàn)的隨機(jī)路徑; 5) 遍歷隨機(jī)路徑中的待估點(diǎn)u,將數(shù)據(jù)樣板掃描模擬實(shí)現(xiàn)獲得待估點(diǎn)u處的數(shù)據(jù)事 件; 6) 將待估點(diǎn)u處的數(shù)據(jù)事件與數(shù)據(jù)樣式代表進(jìn)行相似性計算,得到與待估點(diǎn)u處的數(shù) 據(jù)事件最相似的數(shù)據(jù)樣式代表,再計算待估點(diǎn)u處的數(shù)據(jù)事件與最相似的數(shù)據(jù)樣式代表對 應(yīng)的相似數(shù)據(jù)樣式聚類中所有數(shù)據(jù)樣式進(jìn)行相似性計算,得到最相似數(shù)據(jù)樣式; 7) 最相似數(shù)據(jù)樣式替換待估點(diǎn)u處的數(shù)據(jù)事件; 8) 重復(fù)步驟5)至步驟7)的操作,直至隨機(jī)路徑中所有待估點(diǎn)都訪問完畢。2. 根據(jù)權(quán)利要求1所述的基于相似數(shù)據(jù)樣式聚類的多點(diǎn)地質(zhì)統(tǒng)計學(xué)建模方法,其特征 在于:在步驟2)中,采用等間距取樣法對樣式數(shù)據(jù)庫中任一數(shù)據(jù)樣式的網(wǎng)格單元進(jìn)行等間 距取樣,得到降維數(shù)據(jù)樣式,等間距取樣的公式為 GThumPat(i, J, k) = Gpat(IXr1, J-Xrj, kXrk), 其中 A= I Pat/IThunPat,rj= JPat/JThMPat,rk= KPat/KThunPat,GThunPa$降維數(shù)據(jù)樣式的網(wǎng)格 體,Gpat為數(shù)據(jù)樣式的網(wǎng)格體,I Pat、JPat、Kpat表示數(shù)據(jù)樣式的數(shù)據(jù)載體網(wǎng)格體的X方向、Y方 向和Z方向的維度,I ThuniPat、JThuniPat、KThMPat表示降維數(shù)據(jù)樣式的數(shù)據(jù)載體網(wǎng)格體的X方向、Y 方向和Z方向的維度,i、j、k分別表示數(shù)據(jù)樣式或降維數(shù)據(jù)樣式的數(shù)據(jù)載體網(wǎng)格體的網(wǎng)格 單元的X方向索引、Y方向索引、Z方向索引。3. 根據(jù)權(quán)利要求1所述的基于相似數(shù)據(jù)樣式聚類的多點(diǎn)地質(zhì)統(tǒng)計學(xué)建模方法,其特征 在于:在步驟3)中,對相似數(shù)據(jù)樣式聚類中所有數(shù)據(jù)樣式進(jìn)行點(diǎn)對點(diǎn)取平均值得到數(shù)據(jù)樣 式代表,數(shù)據(jù)樣式代表的節(jié)點(diǎn)計算公式為:其中,Grapat(i,j,k)為數(shù)據(jù)樣式代表,Gpat(i,j,k)為相似數(shù)據(jù)樣式聚類中任一個數(shù)據(jù)樣 式,N是相似數(shù)據(jù)樣式聚類中數(shù)據(jù)樣式的總數(shù),i、j、k分別表示數(shù)據(jù)樣式或數(shù)據(jù)樣式代表的 數(shù)據(jù)載體網(wǎng)格體的網(wǎng)格單元的X方向索引、Y方向索引、Z方向索引。4. 根據(jù)權(quán)利要求1所述的基于相似數(shù)據(jù)樣式聚類的多點(diǎn)地質(zhì)統(tǒng)計學(xué)建模方法,其特征 在于:在步驟6)中,待估點(diǎn)u處的數(shù)據(jù)事件與數(shù)據(jù)樣式代表之間、待估點(diǎn)u處的數(shù)據(jù)事件與 數(shù)據(jù)樣式之間的相似性通過曼哈頓距離函數(shù)來計算,曼哈頓距離函數(shù)為其中,devT(u+ha)表示待估點(diǎn)u處的數(shù)據(jù)事件,repatT(h a)、patT(ha)分別表示數(shù)據(jù)樣 式代表、數(shù)據(jù)樣式。
【專利摘要】本發(fā)明公開了一種基于相似數(shù)據(jù)樣式聚類的多點(diǎn)地質(zhì)統(tǒng)計學(xué)建模方法,它對樣式數(shù)據(jù)庫的所有數(shù)據(jù)樣式做了降維計算,把相同的降維數(shù)據(jù)樣式所對應(yīng)的數(shù)據(jù)樣式歸為同一類即相似數(shù)據(jù)樣式聚類,并計算相似數(shù)據(jù)樣式聚類的數(shù)據(jù)樣式代表,在模擬過程中,將待估點(diǎn)u處的數(shù)據(jù)事件與數(shù)據(jù)樣式代表進(jìn)行相似性計算,再與最相似的數(shù)據(jù)樣式代表對應(yīng)的相似數(shù)據(jù)樣式聚類中所有數(shù)據(jù)樣式進(jìn)行相似性計算,得到最相似數(shù)據(jù)樣式。而SIMPAT算法在模擬過程中,需將待估點(diǎn)u處的數(shù)據(jù)事件與樣式數(shù)據(jù)庫中所有數(shù)據(jù)樣式進(jìn)行相似性計算。因此,相比SIMPAT算法,本發(fā)明大大提高了多點(diǎn)地質(zhì)統(tǒng)計學(xué)建模算法的效率。
【IPC分類】G06F17/50
【公開號】CN105426626
【申請?zhí)枴緾N201510903204
【發(fā)明人】喻思羽, 李少華, 段太忠
【申請人】長江大學(xué)
【公開日】2016年3月23日
【申請日】2015年12月8日