本發(fā)明屬于地球物理和人工智能領(lǐng)域,具體涉及一種基于稀疏標(biāo)注的半監(jiān)督3d斷層識(shí)別方法。
背景技術(shù):
1、在地震勘探和地質(zhì)研究中,準(zhǔn)確識(shí)別地下斷層結(jié)構(gòu)對(duì)于建立地質(zhì)模型、提高資源勘探的成功率具有重要意義。傳統(tǒng)的斷層識(shí)別方法通常依賴地質(zhì)學(xué)家的經(jīng)驗(yàn)和人工判讀,不僅耗時(shí)長(zhǎng)且易受人為因素影響,同時(shí)在處理復(fù)雜地質(zhì)背景和噪聲環(huán)境時(shí),容易受到非斷層因素的干擾,難以實(shí)現(xiàn)高效的斷層識(shí)別。近年來(lái),深度學(xué)習(xí)方法的引入為斷層識(shí)別提供了新的可能性,能在多變或噪聲環(huán)境中提供更穩(wěn)健、更準(zhǔn)確的檢測(cè)。豐富的注釋對(duì)深度學(xué)習(xí)方法的準(zhǔn)確性至關(guān)重要,然而斷層復(fù)雜的三維分布使得完整的人工注釋幾乎不可能實(shí)現(xiàn)。合成數(shù)據(jù)的引入是基于深度學(xué)習(xí)的斷層檢測(cè)的一大突破。然而,合成數(shù)據(jù)與真實(shí)現(xiàn)場(chǎng)數(shù)據(jù)存在很大差異,尤其是在特征和斷層結(jié)構(gòu)方面,這使得僅在合成數(shù)據(jù)上訓(xùn)練的模型很難推廣到真實(shí)世界的場(chǎng)景中。
技術(shù)實(shí)現(xiàn)思路
1、為了克服現(xiàn)有技術(shù)的不足,本發(fā)明提供了一種基于稀疏標(biāo)注的半監(jiān)督3d斷層識(shí)別方法,該方法能夠基于現(xiàn)場(chǎng)數(shù)據(jù)的少量稀疏標(biāo)注的二維切片,通過(guò)合成數(shù)據(jù)全監(jiān)督學(xué)習(xí)、稀疏標(biāo)注噪聲學(xué)習(xí)以及無(wú)標(biāo)注數(shù)據(jù)半監(jiān)督學(xué)習(xí),實(shí)現(xiàn)對(duì)復(fù)雜地質(zhì)背景下三維地震斷層的準(zhǔn)確識(shí)別和高效泛化。
2、為實(shí)現(xiàn)上述目的,本發(fā)明采用以下技術(shù)方案:
3、步驟1:獲取帶有斷層標(biāo)注的合成地震數(shù)據(jù)以及無(wú)標(biāo)注的現(xiàn)場(chǎng)地震數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),并對(duì)部分現(xiàn)場(chǎng)數(shù)據(jù)進(jìn)行少量二維切片標(biāo)注,將訓(xùn)練數(shù)據(jù)分為全標(biāo)注數(shù)據(jù)、稀疏標(biāo)注數(shù)據(jù)以及無(wú)標(biāo)注數(shù)據(jù)三類;
4、步驟2:對(duì)全標(biāo)注數(shù)據(jù)進(jìn)行強(qiáng)增強(qiáng)處理,將hrnet作為學(xué)生模型的基礎(chǔ)架構(gòu),為適配3d地震數(shù)據(jù),對(duì)hrnet進(jìn)行三維擴(kuò)展,將增強(qiáng)后的全標(biāo)注數(shù)據(jù)輸入學(xué)生模型計(jì)算dice損失;
5、步驟3:對(duì)稀疏標(biāo)注數(shù)據(jù)進(jìn)行隨機(jī)裁剪處理,形成若干小立方體,對(duì)小立方體分別進(jìn)行強(qiáng)弱增強(qiáng)處理,分別輸入到學(xué)生模型以及與學(xué)生模型同結(jié)構(gòu)的教師模型,學(xué)生模型的輸出保持不變,對(duì)教師模型的輸出執(zhí)行輕微噪聲細(xì)化處理,根據(jù)抗噪稀疏損失函數(shù)對(duì)兩輸出計(jì)算損失;
6、步驟4:對(duì)無(wú)標(biāo)注數(shù)據(jù)進(jìn)行隨機(jī)裁剪處理,形成若干小立方體,小立方體分別進(jìn)行強(qiáng)弱增強(qiáng)處理,分別輸入到學(xué)生模型以及雙教師模型,學(xué)生模型的輸出保持不變,對(duì)雙教師模型的兩個(gè)輸出執(zhí)行穩(wěn)定性計(jì)算得到偽標(biāo)簽,進(jìn)而計(jì)算一致性損失;
7、步驟5:重復(fù)執(zhí)行步驟2-4,并使用它們累積的梯度來(lái)更新學(xué)生網(wǎng)絡(luò),隨即通過(guò)ema更新教師網(wǎng)絡(luò),直至達(dá)到規(guī)定的訓(xùn)練次數(shù);
8、步驟6:通過(guò)訓(xùn)練好的模型對(duì)未知地震數(shù)據(jù)進(jìn)行判斷,得到斷層識(shí)別結(jié)果。
9、進(jìn)一步地,所述的輕微噪聲細(xì)化處理通過(guò)將學(xué)生模型的預(yù)測(cè)值、教師模型的預(yù)測(cè)值以及原始稀疏標(biāo)簽的平均值作為新標(biāo)簽。
10、進(jìn)一步地,所述的抗噪稀疏損失函數(shù)通過(guò)結(jié)合mae損失函數(shù)和dice損失函數(shù)來(lái)有效抑制噪聲數(shù)據(jù)對(duì)模型的過(guò)擬合,并引入了一種專門設(shè)計(jì)的掩碼矩陣m解決稀疏標(biāo)簽的問(wèn)題,該矩陣對(duì)應(yīng)于未標(biāo)注體素的位置標(biāo)記為-1,對(duì)應(yīng)于稀疏標(biāo)注體素的位置標(biāo)記為1,在計(jì)算損失時(shí),僅考慮掩碼矩陣標(biāo)記為1的位置對(duì)應(yīng)體素的損失值,該損失函數(shù)表達(dá)式為:
11、
12、其中,yi′,yi分別是預(yù)測(cè)標(biāo)簽和真實(shí)標(biāo)簽在每個(gè)體素i的值,n代表樣本中體素的總數(shù),∈是一個(gè)小常數(shù),用來(lái)避免分母為零的情況。
13、進(jìn)一步地,所述穩(wěn)定性計(jì)算基于兩個(gè)參數(shù)不同,結(jié)構(gòu)相同的教師網(wǎng)絡(luò)來(lái)計(jì)算兩個(gè)輸出結(jié)果的穩(wěn)定性,并用交并比(iou)作為衡量穩(wěn)定性的標(biāo)準(zhǔn),其公式為:
14、
15、其中,w代表弱增強(qiáng)處理,分別表示兩個(gè)教師模型t1,t2的概率輸出,借助這一指標(biāo),可以判斷兩個(gè)預(yù)測(cè)結(jié)果的重疊程度,得分越大代表穩(wěn)定性越高,我們對(duì)所有未標(biāo)記樣本的穩(wěn)定性評(píng)分進(jìn)行排序,只取前50%的樣本輸出作為偽標(biāo)簽,只計(jì)算偽標(biāo)簽與學(xué)生模型輸出之間的一致性損失。
16、本發(fā)明的有益效果是:巧妙地利用了全標(biāo)注合成數(shù)據(jù)、稀疏標(biāo)注現(xiàn)場(chǎng)數(shù)據(jù)以及無(wú)標(biāo)注現(xiàn)場(chǎng)數(shù)據(jù),突破了目前現(xiàn)有深度學(xué)習(xí)斷層識(shí)別方法僅依賴合成數(shù)據(jù)的局限,并有效克服了合成數(shù)據(jù)難泛化、現(xiàn)場(chǎng)標(biāo)注工作量大、手工標(biāo)注存在誤差等問(wèn)題。通過(guò)這一綜合方法,不僅大幅提升了斷層識(shí)別的精度,也極大地增強(qiáng)了模型對(duì)不同工區(qū)的泛化能力。
1.一種基于稀疏標(biāo)注的半監(jiān)督3d斷層識(shí)別方法,其特征在于,包括以下步驟:
2.如權(quán)利要求1所述的基于稀疏標(biāo)注的半監(jiān)督3d斷層識(shí)別方法,其特征在于,所述的輕微噪聲細(xì)化處理通過(guò)將學(xué)生模型的預(yù)測(cè)值、教師模型的預(yù)測(cè)值以及原始稀疏標(biāo)簽的平均值作為新標(biāo)簽。
3.如權(quán)利要求1所述的基于稀疏標(biāo)注的半監(jiān)督3d斷層識(shí)別方法,其特征在于,所述的抗噪稀疏損失函數(shù)通過(guò)結(jié)合mae損失函數(shù)和dice損失函數(shù)來(lái)有效抑制噪聲數(shù)據(jù)對(duì)模型的過(guò)擬合,并引入了一種專門設(shè)計(jì)的掩碼矩陣m解決稀疏標(biāo)簽的問(wèn)題,該矩陣對(duì)應(yīng)于未標(biāo)注體素的位置標(biāo)記為-1,對(duì)應(yīng)于稀疏標(biāo)注體素的位置標(biāo)記為1,在計(jì)算損失時(shí),僅考慮掩碼矩陣標(biāo)記為1的位置對(duì)應(yīng)體素的損失值。
4.如權(quán)利要求1所述的基于稀疏標(biāo)注的半監(jiān)督3d斷層識(shí)別方法,其特征在于,所述穩(wěn)定性計(jì)算基于兩個(gè)參數(shù)不同,結(jié)構(gòu)相同的教師網(wǎng)絡(luò)計(jì)算輸出結(jié)果的穩(wěn)定性,并用交并比(iou)作為衡量穩(wěn)定性的標(biāo)準(zhǔn),借助這一指標(biāo),可以判斷兩個(gè)預(yù)測(cè)結(jié)果的重疊程度,得分越大代表穩(wěn)定性越高,我們對(duì)所有未標(biāo)記樣本的穩(wěn)定性評(píng)分進(jìn)行排序,只取前50%的樣本輸出作為偽標(biāo)簽,然后計(jì)算偽標(biāo)簽與學(xué)生模型輸出之間的一致性損失。