本發(fā)明涉及一種醫(yī)學影像處理技術(shù),具體來說是一種顯著性參考和解耦的食管腫瘤ct影像擴散分割方法。
背景技術(shù):
1、隨著醫(yī)學影像技術(shù)的飛速發(fā)展,ct(計算機斷層掃描)因其高分辨率、無創(chuàng)性和全面性,已成為診斷食管腫瘤的重要工具。食管腫瘤的影像分割技術(shù)對病灶的精確識別和定位至關(guān)重要,為臨床治療方案的制定提供了重要依據(jù)。然而,食管腫瘤的分割任務(wù)存在諸多挑戰(zhàn),包括腫瘤組織與周圍正常組織的信號相似性、腫瘤邊界的模糊性以及圖像偽影和噪聲的干擾。這些因素顯著增加了分割過程中的誤檢和漏檢風險,給傳統(tǒng)手工特征的分割方法帶來了極大的技術(shù)瓶頸。
2、近年來,深度學習的醫(yī)學圖像分割技術(shù)取得了顯著進展,尤其是卷積神經(jīng)網(wǎng)絡(luò)(cnn)在特征提取和目標分割方面展現(xiàn)了卓越的性能。然而,由于cnn?的局部感受野限制,其在處理長程依賴關(guān)系和復(fù)雜邊界區(qū)域時表現(xiàn)不足。此外,ct圖像中的偽影和噪聲進一步限制了模型對特征的準確捕捉,導致分割結(jié)果的精度和魯棒性下降。盡管一些研究引入了全局上下文建模技術(shù)以改進分割效果,但在高噪聲條件下仍難以滿足臨床需求。
3、擴散模型作為一種新興的生成式模型,在圖像生成與去噪任務(wù)中展現(xiàn)了優(yōu)異的性能,通過模擬前向噪聲添加與反向去噪過程,能夠逐步恢復(fù)圖像細節(jié)并消除噪聲。然而,擴散模型與醫(yī)學圖像分割任務(wù)的結(jié)合仍處于探索階段。針對上述問題,本發(fā)明提出了一種顯著性參考和解耦學習框架,通過將顯著性偽標注與擴散模型相結(jié)合,構(gòu)建分割與去噪解耦的多任務(wù)學習框架,有效提升了分割網(wǎng)絡(luò)在邊界識別、抗噪性和全局信息建模方面的能力,從而為食管腫瘤ct圖像的精準分割提供了創(chuàng)新性解決方案。
技術(shù)實現(xiàn)思路
1、針對現(xiàn)有技術(shù)的不足,本發(fā)明提出了一種顯著性參考和解耦的食管腫瘤ct影像擴散分割方法。通過顯著性偽標注的分割網(wǎng)絡(luò)與條件擴散模型的去噪網(wǎng)絡(luò)相結(jié)合,構(gòu)建一個分割與去噪任務(wù)解耦的多任務(wù)學習框架,顯著提升腫瘤區(qū)域分割精度。為了實現(xiàn)上述目的,本發(fā)明的技術(shù)方案如下:
2、一種顯著性參考和解耦的食管腫瘤ct影像擴散分割方法,其特征在于,包括以下步驟:
3、11)顯著性參考和解耦的食管腫瘤ct影像擴散分割網(wǎng)絡(luò)的準備工作:對食管腫瘤ct影像數(shù)據(jù)進行預(yù)處理,包括歸一化、裁剪、顯著性標簽生成及優(yōu)化步驟,確保輸入數(shù)據(jù)的一致性及顯著區(qū)域標注的準確性;
4、12)構(gòu)建顯著性參考和解耦的食管腫瘤ct影像擴散分割網(wǎng)絡(luò)的分割網(wǎng)絡(luò)和擴散網(wǎng)絡(luò):構(gòu)建輸入為預(yù)處理后的ct圖像及顯著性偽標簽的分割網(wǎng)絡(luò),網(wǎng)絡(luò)由多層編碼器、解碼器、跳躍連接模塊以及顯著性特征融合模塊組成;擴散模型,構(gòu)建輸入為加噪ct圖像及顯著性偽標簽的擴散網(wǎng)絡(luò);擴散網(wǎng)絡(luò)包含多層卷積模塊,完成正向添加和反向去噪操作;具體步驟如下:
5、121)構(gòu)建顯著性參考和解耦的食管腫瘤ct影像擴散分割網(wǎng)絡(luò)的分割網(wǎng)絡(luò),其步驟如下:
6、1211)構(gòu)建空間降采樣結(jié)構(gòu),空間降采樣結(jié)構(gòu)包括一個編碼器模塊,由4層下采樣單元組成,每層具體結(jié)構(gòu)如下:
7、12111)兩個3*3卷積層,步長設(shè)置為1,填充方式為same;
8、12112)每層卷積層后加入一個relu線性激活單元進行激活;
9、12113)一個最大池化層,核大小為2*2;
10、1212)構(gòu)建空間上采樣結(jié)構(gòu),空間上采樣結(jié)構(gòu)包括一個解碼器模塊,由4層上采樣單元組成,每層具體結(jié)構(gòu)如下:
11、12121)一個反卷積層,卷積核大小為2*2;
12、12122)兩個3*3卷積層,步長設(shè)置為1,填充方式為same;
13、12123)每層卷積層后加入一個relu線性激活單元進行激活;
14、1213)構(gòu)建降采樣結(jié)構(gòu)和上采樣結(jié)構(gòu)的交互結(jié)構(gòu),具體結(jié)構(gòu)如下:
15、12131)使用四個跳躍連接,將每層下采樣層的輸出的特征圖與上采樣層的輸出拼接起來;
16、12132)最后一層下采樣后再經(jīng)過兩個3*3卷積層;
17、1214)構(gòu)建顯著性融合模塊,其具體結(jié)構(gòu)如下:
18、12141)顯著性偽標簽通過跳躍連接嵌入解碼器每一層,融合公式如下:
19、,
20、其中,表示融合后的解碼器特征,表示融合前解碼器特征,表示顯著性偽標簽特征,λ=0.5表示顯著性特征的權(quán)重;
21、具體步驟如下:
22、ct影像經(jīng)過顯著性檢測網(wǎng)絡(luò)得到顯著性偽標簽;
23、顯著性偽標簽經(jīng)過四層編碼器結(jié)構(gòu),與分割網(wǎng)絡(luò)的編碼器結(jié)構(gòu)一致;
24、再通過跳躍連接把每個經(jīng)過編碼器層的顯著性偽標簽和分割網(wǎng)絡(luò)編碼器的輸入拼接起來;
25、122)構(gòu)建顯著性參考和解耦的食管腫瘤ct影像擴散分割網(wǎng)絡(luò)的擴散網(wǎng)絡(luò),其步驟如下:
26、1221)正向擴散過程:正向擴散過程逐步向輸入ct圖像添加高斯噪聲,使其從結(jié)構(gòu)化數(shù)據(jù)逐漸變?yōu)殡S機噪聲,具體公式如下:
27、,
28、其中=,表示信號強度;[0.0001,0.02],為每步添加噪聲的強度;n為正態(tài)分布;采用線性方差時間表,經(jīng)過t=1000步擴散,初始圖像轉(zhuǎn)變?yōu)橥耆S機噪聲;
29、1222)反向去噪過程:反向去噪通過神經(jīng)網(wǎng)絡(luò)預(yù)測噪聲并逐步還原圖像,公式如下:
30、,
31、其中是方差,代表擴散過程中的噪聲規(guī)模;是均值,表示從當前噪聲圖像預(yù)測出下一步的中心位置;
32、均值計算公式為:
33、,
34、其中,是神經(jīng)網(wǎng)絡(luò)預(yù)測的噪聲分布;是累計的信號強度;
35、反向生成從隨機噪聲開始,逐步去噪生成還原的圖像;
36、1223)顯著性參考和解耦的食管腫瘤ct影像擴散分割方法的擴散網(wǎng)絡(luò)采用unet的編碼器-解碼器架構(gòu),并結(jié)合時間嵌入和殘差塊進行設(shè)計,其具體結(jié)構(gòu)如下:
37、12231)編碼器通過逐層下采樣提取多尺度特征,編碼器模塊包含以下組件:
38、122311)卷積層,每層包含兩個3*3卷積操作,卷積核填充方式為same,每個卷積層后接批歸一化bn和一個relu線性激活單元;
39、122312)最大池化層,用于下采樣,池化核大小為2*2;
40、12232)解碼器模塊通過逐層上采樣逐步恢復(fù)圖像尺寸,包含以下組件:
41、122321)一個反卷積層,采用2*2大小的反卷積和,回復(fù)特征圖的空間分辨率;
42、122322)卷積層,每層包含兩個3*3卷積操作,卷積核填充方式為same,每個卷積層后接批歸一化bn和一個relu線性激活單元;
43、12233)時間嵌入模塊,時間嵌入貫穿整個編碼器核解碼器,負責將時間信息t映射為特征向量,通過線性層然后經(jīng)過注入每層卷積的特征圖中,確保模型對每一步噪聲的動態(tài)感知能力;
44、12234)跳躍連接結(jié)構(gòu),編碼器每層通過跳躍連接將對應(yīng)層的特征拼接到解碼器特征圖;
45、13)訓練顯著性參考和解耦的食管腫瘤ct影像擴散分割網(wǎng)絡(luò):確保分割與去噪任務(wù)的互補優(yōu)化,結(jié)合交叉熵損失函數(shù)、dice損失函數(shù)、均方誤差函數(shù)以及一致性損失設(shè)計聯(lián)合優(yōu)化策略;
46、14)對顯著性參考和解耦的食管腫瘤ct影像擴散分割網(wǎng)絡(luò)的測試與求解:通過訓練好的網(wǎng)絡(luò)推理未標注數(shù)據(jù),結(jié)合形態(tài)學操作提升分割邊界的精確度。
47、所述一種顯著性參考和解耦的食管腫瘤ct影像擴散分割方法模型的準備工作包括以下步驟:
48、21)數(shù)據(jù)歸一化:將ct圖像像素值歸一化到[0,1]區(qū)間,公式如下:
49、,
50、其中,和分別為輸入圖像像素值的最小值和最大值,是歸一化之后的ct圖像,是歸一化之前的ct圖像;
51、22)圖像裁剪:使用滑動窗口方法對ct圖像進行裁剪,窗口大小設(shè)置為256*256*64,步長為128,確保每次裁剪覆蓋整幅影像區(qū)域;
52、23)顯著性偽標注生成:采用resnet-50的顯著性檢測模型生成偽標簽,將顯著性得分高于0.5的像素標記為腫瘤區(qū)域,其余像素標記為背景;
53、24)顯著性偽標注優(yōu)化:對生成的顯著性偽標簽進行高斯模糊操作,模糊核大小為5*5,提升偽標注區(qū)域的連通性;
54、25)數(shù)據(jù)劃分:將處理后的數(shù)據(jù)按照7:3比例劃分為訓練集和驗證集,并保存為.nii格式,以供分割和擴散網(wǎng)絡(luò)的訓練。
55、所述訓練顯著性參考和解耦的食管腫瘤ct影像擴散分割網(wǎng)絡(luò)包括如下詳細步驟:
56、31)首先對數(shù)據(jù)進行預(yù)處理和加載,其中數(shù)據(jù)預(yù)處理與加載的詳細步驟如下:
57、311)將預(yù)處理后的ct圖像核顯著性標簽分別加載到數(shù)據(jù)加載器中;
58、312)輸入ct圖像進行歸一化處理,使其像素值分布再[0,1]區(qū)間;
59、313)顯著性偽標簽轉(zhuǎn)換為二值化形式,將顯著性偽標簽中大于0.5的像素值設(shè)為1,小于等于0.5的像素值設(shè)為0;
60、32)分割網(wǎng)絡(luò)正向傳播的詳細步驟如下:
61、321)將和作為輸入送到分割網(wǎng)絡(luò)的編碼器部分;
62、322)然后執(zhí)行編碼器結(jié)構(gòu);
63、第一層編碼器執(zhí)行一個3*3卷積操作,輸入通道為3,輸出通道為64,然后一個線性relu激活單元,然后執(zhí)行一個3*3卷積操作,輸入通道為64,輸出通道為64,然后經(jīng)過一個線性relu激活單元得到未下采樣的特征圖a1;
64、執(zhí)行最大池化操作,池化核大小為2*2,得到下采樣特征圖f1;
65、第二層編碼器執(zhí)行一個3*3卷積操作,輸入通道為64,輸出通道為128,然后一個線性relu激活單元,然后執(zhí)行一個3*3卷積操作,然后經(jīng)過一個線性激活單元relu,輸入通道為128,輸出通道為128,然后經(jīng)過一個線性relu激活單元得到未下采樣的特征圖a2;
66、執(zhí)行最大池化操作,池化核大小為2*2,得到下采樣特征圖f2;
67、第三層編碼器執(zhí)行一個3*3卷積操作,輸入通道為128,輸出通道為256,然后經(jīng)過一個線性relu激活單元,然后執(zhí)行一個3*3卷積操作,然后經(jīng)過一個線性relu激活單元,輸入通道為256,輸出通道為256,然后經(jīng)過一個線性relu激活單元得到未下采樣的特征圖a3;
68、執(zhí)行最大池化操作,池化核大小為2*2,得到下采樣特征圖f3;
69、第四層編碼器執(zhí)行一個3*3卷積操作,輸入通道為256,輸出通道為512,然后經(jīng)過一個線性relu激活單元,然后執(zhí)行一個3*3卷積操作,然后經(jīng)過一個線性relu激活單元,輸入通道為512,輸出通道為512,然后經(jīng)過一個線性relu激活單元得到未下采樣的特征圖a4;
70、執(zhí)行最大池化操作,池化核大小為2*2,得到下采樣特征圖f4;
71、通過跳躍連接將每一層輸出a1,a2,a3,a4傳遞到解碼器部分,進行多尺度融合;
72、323)執(zhí)行解碼器結(jié)構(gòu);
73、第一層解碼器對f4執(zhí)行一個反卷積操作,輸出特征圖u4;
74、然后將u4和a4拼接后執(zhí)行兩個3*3卷積層,每個卷積層后接一個線性relu激活單元,輸入通道為512,輸出通道為256,得到輸出特征圖d3;
75、第二層解碼器對d3執(zhí)行一個反卷積操作,輸出特征圖u3;
76、然后將u3和a3拼接后執(zhí)行兩個3*3卷積層,每個卷積層后接一個線性relu激活單元,輸入通道為512,輸出通道為256,得到輸出特征圖d2;
77、第三層解碼器對d2執(zhí)行一個反卷積操作,輸出特征圖u2;
78、然后將u2和a2拼接后執(zhí)行兩個3*3卷積層,每個卷積層后接一個線性relu激活單元,輸入通道為512,輸出通道為256,得到輸出特征圖d1;
79、第四層解碼器對d1執(zhí)行一個反卷積操作,輸出特征圖u1;
80、然后將u1和a1拼接后執(zhí)行兩個3*3卷積層,每個卷積層后接一個線性relu激活單元,輸入通道為512,輸出通道為256,得到最終輸出的分割概率圖;
81、33)擴散網(wǎng)絡(luò)正向傳播的詳細步驟如下:
82、331)執(zhí)行高斯噪聲添加操作;
83、根據(jù)擴散步數(shù)t向輸入ct圖像i添加噪聲,生成;
84、332)執(zhí)行編碼器結(jié)構(gòu):
85、經(jīng)過一個3*3卷積層,通道數(shù)從3轉(zhuǎn)為64;
86、經(jīng)過一個線性激活單元relu;
87、經(jīng)過一個3*3卷積層,通道數(shù)保持64;
88、經(jīng)過一個線性激活單元relu;
89、經(jīng)過一個2*2最大池化層,得到特征圖f1;
90、經(jīng)過一個3*3卷積層,通道數(shù)從64轉(zhuǎn)為128;
91、經(jīng)過一個線性激活單元relu;
92、經(jīng)過一個3*3卷積層,通道數(shù)保持128;
93、經(jīng)過一個線性激活單元relu;
94、經(jīng)過一個2*2最大池化層,得到特征圖f2;
95、經(jīng)過一個3*3卷積層,通道數(shù)從128轉(zhuǎn)為256;
96、經(jīng)過一個線性激活單元relu,得到特征圖a1;
97、經(jīng)過一個3*3卷積層,通道數(shù)保持256;
98、經(jīng)過一個線性激活單元relu,得到特征圖a2;
99、經(jīng)過一個2*2最大池化層,得到特征圖f3;
100、經(jīng)過一個3*3卷積層,通道數(shù)從256轉(zhuǎn)為512;
101、經(jīng)過一個線性激活單元relu,得到特征圖a3;
102、經(jīng)過一個3*3卷積層,通道數(shù)保持512;
103、經(jīng)過一個線性激活單元relu,得到特征圖a4;
104、經(jīng)過一個2*2最大池化層,得到特征圖f4;
105、333)通過跳躍連接把a1,a2,a3,a4,分別拼接f1,f2,f3,f4到解碼器;
106、334)執(zhí)行解碼器結(jié)構(gòu):
107、f4經(jīng)過2*2反卷積層,將空間尺寸擴大一倍;
108、和a4拼接后經(jīng)過一個3*3卷積層,通道數(shù)從1024到512;
109、經(jīng)過一個線性激活單元relu;
110、經(jīng)過一個3*3卷積層,通道數(shù)從512到256;
111、經(jīng)過一個線性激活單元relu,得到輸出特征圖u3;
112、u3經(jīng)過2*2反卷積層,將空間尺寸擴大一倍;
113、和a3拼接后經(jīng)過一個3*3卷積層,通道數(shù)從512到256;
114、經(jīng)過一個線性激活單元relu;
115、經(jīng)過一個3*3卷積層,通道數(shù)從256到128;
116、經(jīng)過一個線性激活單元relu,得到輸出特征圖u2;
117、f4經(jīng)過2*2反卷積層,將空間尺寸擴大一倍;
118、和a2拼接后經(jīng)過一個3*3卷積層,通道數(shù)從256到128;
119、經(jīng)過一個線性激活單元relu;
120、經(jīng)過一個3*3卷積層,通道數(shù)從128到64;
121、經(jīng)過一個線性激活單元relu,得到輸出特征圖u1;
122、f4經(jīng)過2*2反卷積層,將空間尺寸擴大一倍;
123、和a1拼接后經(jīng)過一個3*3卷積層,通道數(shù)從128到64;
124、經(jīng)過一個線性激活單元relu;
125、經(jīng)過一個3*3卷積層,通道數(shù)從64到1;
126、經(jīng)過一個線性激活單元relu,得到最終去噪圖像;
127、34)將去噪圖像輸入分割網(wǎng)絡(luò),得到優(yōu)化后的分割概率圖;
128、35)其中在分割網(wǎng)絡(luò)和擴散網(wǎng)絡(luò)正向傳播完成之后,進一步進行反向傳播與權(quán)重更新,具體步驟如下:
129、351)分別計算分割損失、去噪損失、一致性損失和總損失,具體步驟如下:
130、3511)計算分割損失,公式如下:
131、,
132、其中,為交叉熵損失,為dice損失,=0.5;
133、3512)計算去噪損失,公式如下:
134、,
135、其中,是期望值符號,代表真實噪聲,代表預(yù)測噪聲;
136、3513)執(zhí)行計算分割概率圖和去噪概率圖的一致性,公式如下:
137、,
138、其中是一致性損失,該損失項確保分割網(wǎng)絡(luò)和擴散網(wǎng)絡(luò)在輸出上的相互促進與協(xié)同;
139、3514)計算總損失:
140、綜合所有損失函數(shù),公式如下:
141、,
142、其中,=0.3,=0.1,是分割損失,是去噪損失,是一致性損失;
143、352)進行梯度計算和權(quán)重更新,具體步驟如下:
144、3521)梯度計算:
145、根據(jù)執(zhí)行反向傳播,計算梯度;
146、3522)優(yōu)化器設(shè)置:
147、使用adam優(yōu)化器,學習率設(shè)置為0.001,權(quán)重衰減因子設(shè)置為0.0001;
148、353)設(shè)置訓練終止條件,其中具體設(shè)置為:
149、3531)每輪訓練完成后在驗證集上評估具體模型性能,記錄dice系數(shù);
150、3532)若驗證集dice稀疏連續(xù)10次未提高,則終止訓練;
151、3533)若未達到訓練輪數(shù)上限,則繼續(xù)訓練。
152、所述測試與后處理包括以下操作步驟:
153、41)執(zhí)行分割網(wǎng)絡(luò)推理,具體步驟如下:
154、411)將測試ct圖像輸入訓練好的分割網(wǎng)絡(luò),生成擴散分割概率圖;
155、412)對分割概率圖應(yīng)用sigmoid激活函數(shù),將輸出歸一化到[0,1];
156、413)設(shè)置分割閾值t=0.5,對分割概率圖進行二值化操作,得到分割結(jié)果;
157、42)執(zhí)行擴散網(wǎng)絡(luò)推理,具體步驟如下:
158、421)將測試ct圖像添加高斯噪聲,生成噪聲圖像,噪聲強度根據(jù)擴散步數(shù)t設(shè)置;
159、422)使用訓練好的擴散網(wǎng)絡(luò)逐步反向推力,還原初始ct圖像;
160、423)輸入還原后的圖像到分割網(wǎng)絡(luò),生成優(yōu)化后的分割概率圖;
161、43)執(zhí)行分割結(jié)果融合操作,具體步驟如下:
162、融合分割網(wǎng)絡(luò)和去噪網(wǎng)絡(luò)的輸出,公式如下:
163、,
164、其中,=0.7,是權(quán)重,是最終輸出分割概率圖,是分割概率圖,是擴散分割概率圖;
165、44)執(zhí)行形態(tài)學后處理操作,具體步驟如下:
166、441)執(zhí)行膨脹操作,使用5*5的膨脹卷積對分割區(qū)域進行膨脹,填補小縫隙;
167、442)執(zhí)行腐蝕操作,使用3*3的腐蝕卷積對邊界區(qū)域進行腐蝕,去除孤立噪聲點;
168、45)進行連通域分析:
169、對二值分割結(jié)果進行連通域標記,保留面積大于500像素的連通域,將小于面積閾值的區(qū)域設(shè)為背景;
170、46)執(zhí)行邊界平滑操縱,操作如下:
171、使用高斯模糊,核大小為3*3對分割邊界進行平滑處理,減小鋸齒效應(yīng),優(yōu)化分割輪廓;
172、47)執(zhí)行輸出可視化結(jié)果和保存輸出結(jié)果操作,具體步驟如下:
173、471)將處理后的分割結(jié)果與原始ct圖像疊加,生成可視化的分割結(jié)果;
174、472)輸出結(jié)果保存為png或.nii格式文件,供臨床分析使用。
175、有益效果
176、本發(fā)明通過顯著性參考和解耦學習的多任務(wù)分割框架,將顯著性偽標簽與擴散模型相結(jié)合,顯著提升了食管腫瘤ct圖像分割的準確性和魯棒性。利用擴散模型的逐步去噪能力,解決了傳統(tǒng)分割網(wǎng)絡(luò)在高噪聲環(huán)境下邊界識別困難的問題,并通過顯著性偽標簽強化了腫瘤區(qū)域與背景組織的特征差異,降低了誤檢與漏檢的風險。同時,分割與去噪任務(wù)和解耦設(shè)計使得網(wǎng)絡(luò)能夠獨立優(yōu)化每個任務(wù),從而提高了整體分割性能和模型的泛化能力。本發(fā)明在提升分割精度的同時,具備高效的訓練與推理過程,能夠在復(fù)雜的臨床場景下提供穩(wěn)定、可靠的食管腫瘤分割結(jié)果,為后續(xù)的腫瘤診斷與治療規(guī)劃提供了重要的技術(shù)支持。