專利名稱:基于乳腺x線攝片的乳腺癌計(jì)算機(jī)輔助診斷方法及其系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于醫(yī)學(xué)圖像的計(jì)算機(jī)分析技術(shù)的應(yīng)用領(lǐng)域,具體涉及一種基于乳腺x線攝片的乳腺癌計(jì)算機(jī)輔助診斷方法及其系統(tǒng)。
背景技術(shù):
乳腺癌是中老年女性最常見的惡性腫瘤之一,在中國已居女性惡性腫瘤的首位,并且有逐年上升的趨勢。目前對乳腺癌的預(yù)防尚無良策,早期診斷是降低發(fā)病率和死亡率及提高乳腺癌治愈率的最有效途徑。研究表明,乳腺x線攝片(乳腺鉬靶x射線技術(shù))是一種有效的進(jìn)行早期臨床無癥狀乳腺癌的檢查方法,已被美國食品藥品管理局(Food and Drug Administrator,F(xiàn)DA)認(rèn)可的常規(guī)乳腺疾病普查方法。
受成像原理限制,在乳腺x線攝片中高密度的正常乳腺組織也會呈現(xiàn)與異常組織相近的高亮度,對于乳腺組織較致密的年輕亞洲女性其病灶則更加不易被發(fā)現(xiàn),容易造成漏診和誤診,并且乳腺癌的早期診斷很大程度上依賴于放射科醫(yī)師的經(jīng)驗(yàn)、專業(yè)能力、疲勞程度,主觀因素影響較大,尤其在乳腺疾病的普查活動(dòng)中,難以保證診斷的效率及準(zhǔn)確性。
乳腺癌的計(jì)算機(jī)輔助診斷(computer-aided diagnosis,CAD)方法及其系統(tǒng)結(jié)合了計(jì)算機(jī)強(qiáng)大的計(jì)算能力于乳腺x線攝片的自動(dòng)分析中,有效的提供給放射科醫(yī)師有價(jià)值的“第二意見”,在減輕診斷工作量、提高診斷效率和客觀性方面有難以比擬的優(yōu)勢。T.W.Freer等的研究結(jié)果表明,臨床中乳腺癌計(jì)算機(jī)輔助診斷方法及其系統(tǒng)的使用,明顯提高了早期惡性腫瘤的檢測率(具體參見T.W.Freer,et al.″Screening Mammography withComputer-aided DetectionProspective Study of 12,860 Patients in aCommunity Breast Center,″Radiology,220(3)781-786(2001).)。正因如此,乳腺癌的計(jì)算機(jī)輔助診斷方法及其系統(tǒng)正逐漸被世界范圍內(nèi)的醫(yī)療機(jī)構(gòu)接受并應(yīng)用到臨床實(shí)踐中。
通常,乳腺癌計(jì)算機(jī)輔助診斷方法及其系統(tǒng)包括乳腺腫塊的輔助診斷和微小鈣化灶的輔助診斷(具體參見David Gur.,Bin Zheng,Yuan HsiangChang,Computerized detection of masses and microcalcifications in digitalmammograms,United States Patent No.5,627,907)。輔助診斷是通過計(jì)算機(jī)對乳腺圖像進(jìn)行自動(dòng)地分析和處理,標(biāo)識出圖像中可疑腫塊或可疑微小鈣化灶的病變區(qū)域,并獲取已標(biāo)別可疑腫塊或可疑微小鈣化灶區(qū)域的一系列相關(guān)特征參數(shù),根據(jù)需要返回顯示給放射科醫(yī)師,提供輔助其診斷的參考意見。目前,計(jì)算機(jī)輔助診斷方法及其系統(tǒng)在微小鈣化灶可疑區(qū)域檢測方面具有高靈敏度和低假陽性率的特點(diǎn),已經(jīng)被放射科醫(yī)師接受和采用(具體參見R.F.Brem,J.W.Hoffmeister,G.Zisman,et al.“A computer-aided detectionsystem for evaluation of breast cancer by mammographic appearance and lesionsize,”AJR,Am.J.Roentgenol 184893-896(2005)),但在乳腺腫塊輔助診斷中的檢測效果很低,不被放射科醫(yī)師信賴。所以,如何設(shè)計(jì)一個(gè)乳腺癌計(jì)算機(jī)輔助診斷方法及其系統(tǒng)對乳腺x線攝片中可疑的乳腺癌腫塊區(qū)域進(jìn)行準(zhǔn)確定位,并且提取系列有效的區(qū)域相關(guān)特征參數(shù),準(zhǔn)確地和有效地輔助醫(yī)生進(jìn)行乳腺癌診斷成為我們研究的焦點(diǎn)。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供基于乳腺x線攝片的乳腺癌計(jì)算機(jī)輔助診斷方法,該方法提供給放射科醫(yī)師診斷的參考意見,有助于提高乳腺癌腫塊定位和診斷的效率和精準(zhǔn)度;本發(fā)明還提供了實(shí)現(xiàn)該方法的系統(tǒng)。
本發(fā)明提供的基于乳腺x線攝片的乳腺癌計(jì)算機(jī)輔助診斷方法,其步驟包括 步驟(1)輸入一幅待診斷的乳腺x線攝片; 步驟(2)在輸入的乳腺x線攝片上提取感興趣區(qū)域,得到初始可疑腫塊區(qū)域位置; 步驟(3)在感興趣區(qū)域內(nèi)分割出可疑腫塊,確定可疑腫塊的邊界; 步驟(4)計(jì)算已分割的可疑腫塊區(qū)域的相關(guān)特征值; 步驟(5)將計(jì)算得到的特征值輸入分類器中,對初始可疑腫塊區(qū)域進(jìn)行分析,確定最終可疑腫塊區(qū)域; 步驟(6)將最終可疑腫塊區(qū)域的分割結(jié)果定位在步驟(1)中輸入的待診斷的乳腺x線攝片上,并將步驟(4)中計(jì)算得到的腫塊區(qū)域的特征值,根據(jù)需要顯示給用戶。
本發(fā)明提供的基于乳腺x線攝片的乳腺癌計(jì)算機(jī)輔助診斷系統(tǒng),包括輸入模塊、感興趣區(qū)域提取模塊、可疑腫塊分割模塊、可疑腫塊區(qū)域特征提取模塊、分類診斷模塊和輸出模塊; 輸入模塊用于接收用戶輸入的待診斷的乳腺x線攝片,并傳送給感興趣區(qū)域提取模塊; 感興趣區(qū)域提取模塊用于提取輸入的乳腺x線攝片中的感興趣區(qū)域,得到初始可疑腫塊區(qū)域位置信息,并傳送給可疑腫塊分割模塊; 可疑腫塊分割模塊用于將感興趣區(qū)域提取模塊提取的感興趣區(qū)域中的可疑腫塊分割出來,得到可疑腫塊的邊界信息,并傳送給可疑腫塊區(qū)域特征提取模塊; 可疑腫塊區(qū)域特征提取模塊根據(jù)接收的可疑腫塊的邊界信息,計(jì)算得到相關(guān)特征值,并傳送給分類診斷模塊; 分類診斷模塊用于將計(jì)算得到的每個(gè)可疑腫塊區(qū)域的特征值輸入分類器中,對初始可疑腫塊區(qū)域進(jìn)行計(jì)算機(jī)自動(dòng)分類識別,確定最終可疑腫塊區(qū)域,并將結(jié)果傳送給輸出模塊,由輸出模塊將檢測的最終腫塊區(qū)域的分割結(jié)果定位在輸入的待診斷的乳腺x線攝片上,并將計(jì)算得到的區(qū)域相關(guān)特征值根據(jù)需要顯示給用戶。
本發(fā)明首先給系統(tǒng)輸入一待診斷的乳腺x線攝片,通過感興趣區(qū)域提取、可疑腫塊分割和可疑腫塊區(qū)域(包含可疑腫塊的區(qū)域)的特征提取,得到可疑腫塊的一系列相關(guān)特征值,然后將特征值輸入分類器對初始可疑腫塊區(qū)域進(jìn)行分類診斷,最后將計(jì)算機(jī)自動(dòng)檢測的最終可疑腫塊區(qū)域的分割結(jié)果定位在輸入的待診斷的乳腺x線攝片上,并將計(jì)算得到的系列相關(guān)特征值根據(jù)需要顯示給用戶??傊景l(fā)明方法通過一個(gè)基于乳腺x線攝片的乳腺癌計(jì)算機(jī)輔助診斷方法及其系統(tǒng)自動(dòng)地對可疑乳腺腫塊進(jìn)行檢測,提供可疑腫塊位置和形狀,并根據(jù)需要提供可疑腫塊的一系列相關(guān)特征參數(shù),從而提示放射科醫(yī)師需要重點(diǎn)關(guān)注的區(qū)域和區(qū)域相關(guān)重點(diǎn)參數(shù),在一定程度上提高了放射科醫(yī)師對乳腺癌診斷的準(zhǔn)確性和效率。
圖1為本發(fā)明基于乳腺x線攝片的乳腺癌計(jì)算機(jī)輔助診斷方法的流程圖; 圖2為本發(fā)明基于乳腺x線攝片的乳腺癌計(jì)算機(jī)輔助診斷系統(tǒng)的結(jié)構(gòu)示意圖; 圖3為本發(fā)明實(shí)施例中獲取候選邊界點(diǎn)的過程示意圖; 圖4為本發(fā)明實(shí)施例對可疑腫塊區(qū)域抽取的特征列表; 圖5為本發(fā)明實(shí)施例分類器訓(xùn)練過程示意圖。
具體實(shí)施例方式 下面結(jié)合附圖和實(shí)例對本發(fā)明作進(jìn)一步詳細(xì)的說明。
如圖1所示,本發(fā)明方法包括以下步驟 (1)輸入一幅待診斷的乳腺x線攝片。
(2)在輸入的乳腺x線攝片上提取感興趣區(qū)域,得到初始可疑腫塊區(qū)域位置。
對整幅圖像進(jìn)行分析,不僅存在大量冗余信息,還容易引入錯(cuò)誤。為了提高處理的速度和準(zhǔn)確性,需要將處理對象從整幅圖像縮小到若干小區(qū)域,即感興趣區(qū)域,這些感興趣區(qū)域的位置也是后續(xù)處理的初始可疑腫塊區(qū)域位置。
對于感興趣區(qū)域提取已有研究采用左右兩幅乳房圖像對比方法(具體參見F.F.Yin,M.L.Giger,Doi Kunio,and et al.“Computerized detection of massesin digital mammogramsanalysis of bilateral subtraction images,”MedicalPhysics,18955-963(1991).),高斯型的拉普拉斯(Laplacian of Gaussian,LoG)方法,高斯函數(shù)的差(Difference of Gaussian,DoG)方法(具體參見B.Zheng,Y.H.Chang,D.Gu.“Computerized detection of masses in digitizedmammograms using single-image segmentation and a multilayer topographicfeature analysis,”Acad.Radiol.,2959-966(1995).)等。
考慮到腫塊具有高亮度、近似于圓形以及由于和周圍組織的灰度差異而產(chǎn)生的對比度等特征,本發(fā)明方法采用模板匹配方法定位感興趣區(qū)域,即初始可疑腫塊區(qū)域。具體實(shí)現(xiàn)如下 (2.1)利用二維雙曲正割(sech)函數(shù)得到模板T,計(jì)算上述輸入乳腺x線攝片與模板T的相關(guān)度,得到相關(guān)度圖像; 采用二維雙曲正割(sech)函數(shù)生成大小為(2L+1)×(2L+1)的模板T 其中,以模板中心為原點(diǎn),x,y表示模板中的橫、縱坐標(biāo),取值范圍分別是[-L,L],L為正整數(shù)。α=輸入乳腺x線攝片最大灰度級-1,β=ln(2×α)/L×L。
將模板T在輸入的乳腺x線攝片上逐像素點(diǎn)移動(dòng),利用公式(2)計(jì)算模板T與模板T覆蓋的子圖像S的相關(guān)度cor(T,S) 其中,μst為子圖像S和模板T對應(yīng)像素灰度乘積的平均值,μt和μs為模板T和子圖像S內(nèi)像素灰度的平均值,σt和σs為模板T和子圖像S內(nèi)像素灰度的方差值。應(yīng)用這樣的方法,輸入乳腺x線攝片中每個(gè)像素點(diǎn)都會計(jì)算得到一個(gè)與模板T有關(guān)的相關(guān)度數(shù)值,相關(guān)度數(shù)值范圍為[-1,1]。之后對所有相關(guān)度進(jìn)行標(biāo)定,得到相關(guān)度圖像。其中,對小于0的相關(guān)度將其置為0;否則,用相關(guān)度數(shù)值乘以輸入乳腺x線攝片最大灰度級。
(2.2)利用選取閾值對上述相關(guān)度圖像進(jìn)行二值化處理,在二值化相關(guān)度圖像中提取所有連通區(qū)域并確定每個(gè)連通區(qū)域的中心; 選取一個(gè)合適閾值Tlow,將步驟(2.1)得到的相關(guān)度圖像進(jìn)行二值化處理,即若相關(guān)度圖像某一個(gè)像素點(diǎn)的相關(guān)度數(shù)值小于Tlow,則將該點(diǎn)賦值為0,否則賦為1。在相關(guān)度二值化圖像中,提取出若干個(gè)連通區(qū)域。對于每一個(gè)連通區(qū)域,取步驟(2.1)得到的相關(guān)度圖像中對應(yīng)區(qū)域內(nèi)具有最大相關(guān)度的點(diǎn)作為該連通區(qū)域的中心。
(2.3)以步驟(2.1)所述定義模板方法重新定義與步驟(2.1)中模板大小不同的模板,對步驟(2.2)提取的每個(gè)連通區(qū)域進(jìn)行多尺度分析; 按步驟(2.1)中所述定義模板方法,依照原模板尺寸2L+1的200%,33%,66%,重新定義得到3個(gè)模板。對于步驟(2.2)提取的每個(gè)連通區(qū)域,將各尺度模板中心移到連通區(qū)域的中心在原始輸入乳腺x線攝片上的位置,分別計(jì)算各尺度模板與原始輸入乳腺x線攝片圖像中相應(yīng)子圖像的相關(guān)度,將計(jì)算得到的3個(gè)相關(guān)度與步驟(2.1)得到的相關(guān)度中的最大值作為該連通區(qū)域的最終相關(guān)度,選取一個(gè)合適閾值Thigh(Thigh大于Tlow),將最終相關(guān)度小于Thigh的連通區(qū)域作為假陽性區(qū)域(計(jì)算機(jī)認(rèn)為的非腫塊區(qū)域)排除。
(2.4)利用面積和形狀規(guī)則對步驟(2.3)處理后剩余連通區(qū)域進(jìn)行篩選; 對于經(jīng)過步驟(2.3)多尺度分析方法中未被排除的連通區(qū)域,采用簡單的面積及形狀規(guī)則進(jìn)一步篩選。一般情況下面積較小(通常為5-30個(gè)像素大小)的連通區(qū)域,常常對應(yīng)的是乳腺鈣化灶,而長條形的區(qū)域常常對應(yīng)的是正常的腺體組織,將滿足這兩種情況的連通區(qū)域作為假陽性區(qū)域排除。
(2.5)感興趣區(qū)域提??; 經(jīng)過步驟(2.4)的區(qū)域篩選,對保留下來的連通區(qū)域,以其幾何中心為中心,在原始輸入乳腺圖像中截取(通常為125×125像素大小)正方形,提取的此正方形區(qū)域即感興趣區(qū)域或稱為初始可疑腫塊區(qū)域。
(3)在步驟(2)提取的感興趣區(qū)域中分割出可疑腫塊,確定可疑腫塊的邊界。
在提取出感興趣區(qū)域后,需要對感興趣區(qū)域中包含的可疑腫塊進(jìn)行分割,準(zhǔn)確確定其邊界。
對于可疑腫塊分割已有研究采用多層地形區(qū)域生長(具體參見B.Zheng,Y.H.Chang,D.Gu.“Computerized detection of masses in digitizedmammograms using single-image segmentation and a multilayer topographicfeature analysis,”Acad.Radiol.,2959-966(1995).),活動(dòng)輪廓模型(具體參見N.Karssemeijer,Segmentation of suspicious densities in digital mammograms,Med.Phys,vol.28259-266(2001).),基于多分辨率分析的分割(具體參見Liu,C.Babbs,and E.Delp,“Multiresolution Detection of Spiculated Lesions inDigital Mammograms,”IEEE Transactions on Image Processing,10(6)874 884(2001).)、基于模糊熵的閾值分割(具體參見S.Amr R.Abdel-Dayem,Mahmoud R.El-Sakka,“Fuzzy entropy based detection of suspicious masses indigital mammogram,”Images Proceedings of the 2005 IEEE Engineering inMedicine and Biology 27th Annual Conference,4017-4022(September,2005).)等。
本發(fā)明方法采用一種基于圖像梯度和動(dòng)態(tài)規(guī)劃方法的分割方法。具體實(shí)現(xiàn)如下 (3.1)利用感興趣區(qū)域圖像的梯度相關(guān)特征,確定可疑腫塊邊界上的候選邊界點(diǎn); 如圖3中左圖所示,對于步驟(2)中得到一個(gè)感興趣區(qū)域和一個(gè)給定的灰度閾值Thres1,可將該感興趣區(qū)域做二值化處理。在二值化后的感興趣區(qū)域中使用邊界追蹤法得到對應(yīng)的輪廓線1;采用閾值Thres2,重復(fù)上述過程,將得到輪廓線2;......采用閾值Thresi,重復(fù)上述過程,將得到輪廓線I;......采用閾值Thresn,重復(fù)上述過程,將得到輪廓線N。選用多個(gè)閾值,得到多個(gè)輪廓線(輪廓線組),輪廓線的密集程度與圖像梯度相關(guān),輪廓線密集處圖像梯度較大,輪廓線稀疏處圖像梯度較小。
以感興趣區(qū)域中心為端點(diǎn),從零度角開始,以等角度間隔按逆時(shí)針方向向外依次引R條射線,求得各條射線與輪廓線組的交點(diǎn)。若在同一射線上兩個(gè)相鄰交點(diǎn)間的歐氏距離小于Dmin,則稱這兩個(gè)交點(diǎn)連通。對存在大于Smin個(gè)連通的點(diǎn)集,以它們的中心作為一個(gè)候選邊界點(diǎn)代表此連通點(diǎn)集。在一條射線上,可能有多個(gè)候選邊界點(diǎn),也可能沒有候選邊界點(diǎn)。圖3中右圖為在原始感興趣區(qū)域中標(biāo)記的候選邊界點(diǎn)。
(3.2)由步驟(3.1)中得到的各條射線上的候選邊界點(diǎn)得到多條候選邊界線,利用動(dòng)態(tài)規(guī)劃方法選擇其中最優(yōu)的候選邊界線,即確定可疑腫塊邊界線; 理想情況下,若步驟(3.1)中的各條射線上有且僅有一個(gè)候選邊界點(diǎn),則順次連接各條射線上的候選邊界點(diǎn),將組成唯一的候選邊界線,即可疑腫塊邊界線。但實(shí)際情況下,一條射線上可能有多個(gè)候選邊界點(diǎn),每次在每條射線上選取一個(gè)候選邊界點(diǎn),順次連接各條射線上選取的候選邊界點(diǎn)組成一條候選邊界線,以此可以組成多條候選邊界線,根據(jù)實(shí)際邊界線會通過圖像灰度值變化大(即圖像梯度值大)的位置并且具有一定的光滑性的特點(diǎn),本發(fā)明方法利用動(dòng)態(tài)規(guī)劃方法,并設(shè)定代價(jià)函數(shù)確定各條候選邊界線的代價(jià),在所有候選邊界線中選擇一個(gè)最優(yōu)代價(jià)的候選邊界線作為最終的可疑腫塊邊界線。具體實(shí)現(xiàn)如下 設(shè)候選邊界線S{n1,n2,…nR},變量ni表示在第i條射線上選取的候選邊界點(diǎn)。若第i條射線沒有候選邊界點(diǎn),則根據(jù)第i-1條和第i+1條射線上的候選邊界點(diǎn)與感興趣區(qū)域中心間的距離進(jìn)行插值得到。候選邊界線S的代價(jià)函數(shù)C為候選邊界線上所有候選邊界點(diǎn)對應(yīng)的局部代價(jià)之和,即 局部代價(jià)C(ni)由內(nèi)部代價(jià)Cint(ni)和外部代價(jià)Cext(ni)組成 C(ni)=αCint(ni)+Cext(ni) (4) 其中α為常量,用于調(diào)節(jié)邊界線的光滑程度。
內(nèi)部代價(jià)Cint(ni)定義為候選邊界點(diǎn)ni和ni-1間的規(guī)范化距離 其中dist(ni,ni-1)、dist(O,ni)、dist(O,ni-1)分別表示候選邊界點(diǎn)ni和ni-1、感興趣中心O與ni、感興趣中心O與ni-1的距離,規(guī)范化距離越小,即候選邊界線越光滑,代價(jià)也越小。
外部代價(jià)Cext(ni)定義為候選邊界點(diǎn)ni處的連通點(diǎn)個(gè)數(shù),一個(gè)候選點(diǎn)所代表的連通點(diǎn)越多,表明此處的梯度越大,越有可能是真實(shí)邊界點(diǎn)。
Cext(ni)=-(ni處的連通點(diǎn)個(gè)數(shù)) (6) 根據(jù)上述代價(jià)函數(shù)得到各條候選邊界線的代價(jià),采用動(dòng)態(tài)規(guī)劃在所有候選邊界線中確定一個(gè)最優(yōu)的候選邊界線作為最終的可疑腫塊邊界線。
(4)對已分割的可疑腫塊計(jì)算其系列相關(guān)特征值,選用的特征一般可分為幾何特征、形態(tài)學(xué)特征、灰度特征以及紋理特征等幾類。
選擇的特征值應(yīng)該遵循以下幾個(gè)特點(diǎn) ①可識別性不同類對象的特征值有明顯差異; ②可靠性同類對象應(yīng)用相似的特征值; ③獨(dú)立性特征值之間不應(yīng)有強(qiáng)相關(guān)性; 根據(jù)以上規(guī)則,共提取可疑腫塊區(qū)域的25個(gè)特征,具體描述見圖4列表。
(5)將計(jì)算得到的特征值輸入分類器中,對初始可疑腫塊區(qū)域進(jìn)行計(jì)算機(jī)自動(dòng)分析,確定最終可疑腫塊區(qū)域。
可疑腫塊分類是乳腺腫塊自動(dòng)檢測的最后一個(gè)階段。對分割出邊界的可疑腫塊抽取出反映腫塊特性的特征值之后,運(yùn)用分類器判定該可疑腫塊為陽性(計(jì)算機(jī)認(rèn)為的真腫塊區(qū)域)或假陽性。分類器的選擇及設(shè)計(jì)很大程度上決定了腫塊檢測的準(zhǔn)確性。分類是模式識別理論的重要組成部分,通常可以采用線性分類、啟發(fā)式規(guī)則、統(tǒng)計(jì)分類、模糊分類、人工神經(jīng)網(wǎng)絡(luò)等方法將特征進(jìn)行分類。本發(fā)明方法采用一種改進(jìn)的k近鄰法對步驟(4)中提取特征進(jìn)行分類。
k近鄰法的基本規(guī)則是在全部樣本(除測試樣本)中找出k個(gè)與測試樣本特征向量距離最近(或最相似)的樣本,由這些樣本進(jìn)行投票表決,將測試樣本歸入樣本投票數(shù)最多的類別中。本發(fā)明方法采用的k近鄰法分類器首先對特征向量相似度函數(shù)和決策函數(shù)(decision index,簡稱DI)進(jìn)行了定義。
①相似度函數(shù)的定義 測試樣本YQ的特征向量記為V(YQ),樣本X除測試樣本)的特征向量記為V(X),則定義相似度函數(shù)為兩特征向量間歐幾里德距離平方的倒數(shù),即 ②決策函數(shù)的定義 在對測試樣本YQ進(jìn)行決策時(shí),原則上特征向量與之距離越近的樣本參與決策的影響應(yīng)該越大,而在原始的k近鄰法分類器中,簡單的投票法難以體現(xiàn)這種向量距離差異的影響,本發(fā)明方法對決策函數(shù)按照距離加權(quán)進(jìn)行定義。下述以決策測試樣本為腫塊類和正常類兩類為例。
用相似度由大到小排列的前k個(gè)樣本,如公式(8)所示計(jì)算測試樣本YQ的決策值。在與測試樣本YQ最近的前k個(gè)樣本中,腫塊類記為Mass,其樣本個(gè)數(shù)為M,正常類記為Norm,其樣本個(gè)數(shù)為N,Sim(YQ,X)是①中定義的測試樣本YQ與樣本X的相似度,Rnk(X)代表樣本X在相似度排列中的次序,XjMass表示第j個(gè)腫塊類樣本,j的取值范圍為[1,M],XlNorm表示第l個(gè)正常類樣本,l的取值范圍為[1,N]。
這種決策值計(jì)算方法既如簡單投票法一樣考慮到了與測試樣本臨近樣本的類別,又考慮到了它們與測試樣本相似度的次序,實(shí)驗(yàn)證明這種決策函數(shù)優(yōu)于原始k近鄰決策函數(shù)的計(jì)算方法。
對于分類器的運(yùn)用,首先要用訓(xùn)練數(shù)據(jù)對其進(jìn)行訓(xùn)練,得到適用于具體問題的分類器參數(shù),分類器訓(xùn)練過程包括收集分類器訓(xùn)練數(shù)據(jù)和獲取分類器參數(shù)兩個(gè)步驟,如圖5所示 (5.1)收集分類器訓(xùn)練數(shù)據(jù); 首先輸入一組已知診斷結(jié)果的乳腺x線攝片,應(yīng)用上述感興趣區(qū)域提取、可疑腫塊區(qū)域分割,和可疑腫塊區(qū)域的特征提取中步驟的處理,得到可疑腫塊的分割結(jié)果及一系列相關(guān)特征值,至此完成分類器訓(xùn)練數(shù)據(jù)的收集。
(5.2)獲取分類器參數(shù); 用計(jì)算得到的可疑腫塊的相關(guān)特征值及該可疑腫塊的實(shí)際診斷結(jié)果訓(xùn)練已設(shè)計(jì)的分類器,得到分類參數(shù),寫入分類器參數(shù)文件,至此完成分類器的訓(xùn)練過程。
(6)將最終可疑腫塊區(qū)域的分割結(jié)果定位在步驟(1)中輸入的待診斷的乳腺x線攝片上,并將步驟(4)中計(jì)算得到的腫塊區(qū)域的特征值,根據(jù)需要顯示給用戶。
如圖2所示,本發(fā)明輔助診斷系統(tǒng)包括輸入模塊100、感興趣區(qū)域提取模塊200、可疑腫塊分割模塊300、可疑腫塊區(qū)域特征提取模塊400、分類診斷模塊500和輸出模塊600。
輸入模塊100用于接收用戶輸入的待診斷的乳腺x線攝片,并傳送給感興趣區(qū)域提取模塊200。
感興趣區(qū)域提取模塊200提取輸入的乳腺x線攝片中的感興趣區(qū)域,按照上述步驟(2)所述的步驟得到初始可疑腫塊區(qū)域位置信息,傳送給可疑腫塊分割模塊300。
可疑腫塊分割模塊300按照上述步驟(3)所述的過程,將感興趣區(qū)域提取模塊200提取的感興趣區(qū)域中的可疑腫塊分割出來,得到可疑腫塊的邊界信息,傳送給可疑腫塊區(qū)域特征提取模塊400。
可疑腫塊區(qū)域特征提取模塊400根據(jù)接收的可疑腫塊的邊界信息,計(jì)算得到一系列區(qū)域相關(guān)特征值,如幾何特征、形態(tài)學(xué)特征、灰度特征以及紋理特征等幾類,并傳送給分類診斷模塊500。
分類診斷模塊500將計(jì)算得到的每個(gè)可疑腫塊區(qū)域的特征值輸入分類器中,對初始可疑腫塊區(qū)域進(jìn)行計(jì)算機(jī)自動(dòng)分類識別,確定最終可疑腫塊區(qū)域,并將結(jié)果傳送給輸出模塊600,由輸出模塊600將計(jì)算機(jī)自動(dòng)檢測的最終腫塊區(qū)域的分割結(jié)果定位在輸入的待診斷的乳腺x線攝片上,并將計(jì)算得到的區(qū)域相關(guān)特征值根據(jù)需要顯示給用戶。
實(shí)例 本發(fā)明提出的基于乳腺x線攝片的乳腺癌計(jì)算機(jī)輔助診斷方法及其系統(tǒng)中涉及到若干參數(shù),這些參數(shù)要針對具體處理的數(shù)據(jù)特點(diǎn)進(jìn)行綜合調(diào)節(jié)設(shè)定以達(dá)到整體系統(tǒng)的良好性能,此處列出針對本發(fā)明處理數(shù)據(jù)集合而設(shè)定的參數(shù) 步驟(2.1)利用二維雙曲正割(sech)函數(shù)得到的初始模板大小相關(guān)參數(shù)L=25; 步驟(2.2)對相關(guān)度圖像進(jìn)行二值化處理選取的閾值Tlow=0.5×輸入乳腺x線攝片最大灰度級; 步驟(2.3)多尺度分析中選取的閾值Thigh=0.6×輸入乳腺x線攝片最大灰度級; 步驟(3.1)以感興趣區(qū)域中心為端點(diǎn),從零度角開始,以等角度間隔按逆時(shí)針方向向外依次引R=64條射線,求得各條射線與輪廓線組的交點(diǎn)。若在同一射線上兩個(gè)相鄰交點(diǎn)間的歐氏距離小于Dmin=3,則稱這兩個(gè)交點(diǎn)連通。對存在大于Smin=10個(gè)連通的點(diǎn)集; 步驟(3.2)局部代價(jià)C(ni)由內(nèi)部代價(jià)Cint(ni)和外部代價(jià)Cext(ni)組成 C(ni)=αCint(ni)+Cext(ni) 其中用于調(diào)節(jié)邊界線的光滑程度的常量參數(shù)α=110。
本發(fā)明方法通過一個(gè)基于乳腺x線攝片的乳腺癌計(jì)算機(jī)輔助診斷系統(tǒng)自動(dòng)地對乳腺x線攝片中可疑乳腺腫塊區(qū)域進(jìn)行分析和處理,提供腫塊位置和腫塊形狀,并根據(jù)需要提供區(qū)域相關(guān)的一系列特征參數(shù),從而提示放射科醫(yī)師需要重點(diǎn)關(guān)注的區(qū)域和區(qū)域相關(guān)重點(diǎn)參數(shù),在一定程度上提高了放射科醫(yī)師對乳腺癌診斷的準(zhǔn)確性和效率。本發(fā)明的實(shí)現(xiàn)并不局限于上述實(shí)例所公開的范圍,可以采用不同于上述實(shí)例的方式實(shí)現(xiàn)上述技術(shù)方案。
權(quán)利要求
1.一種基于乳腺x線攝片的乳腺癌計(jì)算機(jī)輔助診斷方法,其步驟包括
步驟(1)輸入一幅待診斷的乳腺x線攝片;
步驟(2)在輸入的乳腺x線攝片上提取感興趣區(qū)域,得到初始可疑腫塊區(qū)域位置;
步驟(3)在感興趣區(qū)域內(nèi)分割出可疑腫塊,確定可疑腫塊的邊界;
步驟(4)計(jì)算已分割的可疑腫塊區(qū)域的相關(guān)特征值;
步驟(5)將計(jì)算得到的特征值輸入分類器中,對初始可疑腫塊區(qū)域進(jìn)行分析,確定最終可疑腫塊區(qū)域;
步驟(6)將最終可疑腫塊區(qū)域的分割結(jié)果定位在步驟(1)中輸入的待診斷的乳腺x線攝片上,并將步驟(4)中計(jì)算得到的腫塊區(qū)域的特征值,根據(jù)需要顯示給用戶。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于步驟(2)包括以下過程
步驟(2.1)利用二維雙曲正割函數(shù)得到模板,計(jì)算上述輸入乳腺x線攝片與該模板的相關(guān)度,得到相關(guān)度圖像;
步驟(2.2)相關(guān)度圖像某一個(gè)像素點(diǎn)的相關(guān)度數(shù)值小于選取閾值,則將該點(diǎn)賦值為0,否則賦為1;在二值化相關(guān)度圖像中提取所有連通區(qū)域,并提取步驟(2.1)得到的相關(guān)度圖像中對應(yīng)區(qū)域內(nèi)具有最大相關(guān)度的點(diǎn)作為該連通區(qū)域的中心;
步驟(2.3)利用二維雙曲正割函數(shù)得到與步驟(2.1)中模板大小不同的模板;對于步驟(2.2)提取的每個(gè)連通區(qū)域,將各尺度模板中心移到連通區(qū)域的中心在原始輸入乳腺x線攝片上的位置,分別計(jì)算各尺度模板與原始輸入乳腺x線攝片圖像中相應(yīng)子圖像的相關(guān)度,將計(jì)算得到的所有相關(guān)度中的最大值作為該連通區(qū)域的最終相關(guān)度,選取一個(gè)閾值將最終相關(guān)度小于閾值的連通區(qū)域作為假陽性區(qū)域排除;
步驟(2.4)對于步驟(2.3)中未被排除的連通區(qū)域,再排除5-30個(gè)像素大小的連通區(qū)域和長條形的連通區(qū)域;
步驟(2.5)經(jīng)過(2.4)的區(qū)域篩選,對保留下來的連通區(qū)域,以其幾何中心為中心,在原始輸入乳腺圖像中截取正方形,提取的此正方形區(qū)域即感興趣區(qū)域或稱為初始可疑腫塊區(qū)域。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于步驟(3)按照下述步驟在感興趣區(qū)域中分割可疑腫塊
步驟(3.1)獲取感興趣區(qū)域圖像的梯度特性相關(guān)的輪廓線組,之后以感興趣區(qū)域中心為端點(diǎn),從零度角開始,以等角度間隔按逆時(shí)針方向向外依次引若干條射線,求得各條射線與輪廓線組的交點(diǎn),以此獲取每條射線上的邊界候選點(diǎn);
步驟(3.2)由(3.1)中得到的各條射線上的候選邊界點(diǎn)得到多條候選邊界線,再選擇其中最優(yōu)的候選邊界線作為可疑腫塊邊界線。
4.根據(jù)權(quán)利要求1、2或3所述的方法,其特征在于步驟(5)中的分類器采用下述方法對原始k近鄰法中的特征向量相似度函數(shù)和決策函數(shù)進(jìn)行再定義
測試樣本YQ的特征向量記為V(YQ),除測試樣本外的樣本X的特征向量記為V(X),則定義相似度函數(shù)為兩特征向量間歐幾里德距離平方的倒數(shù),即
用相似度由大到小排列的前k個(gè)樣本,采用下式計(jì)算測試樣本YQ的決策值,其中,在與測試樣本YQ最近的前k個(gè)樣本中,腫塊類記為Mass,其樣本個(gè)數(shù)為M,正常類記為Norm,其樣本個(gè)數(shù)為N,Sim(YQ,X)是①中定義的測試樣本YQ與樣本X的相似度,Rnk(X)代表樣本X在相似度排列中的次序,XjMass表示第j個(gè)腫塊類樣本,j的取值范圍為[1,M],XlNorm表示第l個(gè)正常類樣本,l的取值范圍為[1,N],則
5.一種基于乳腺x線攝片的乳腺癌計(jì)算機(jī)輔助診斷系統(tǒng),包括輸入模塊(100)、感興趣區(qū)域提取模塊(200)、可疑腫塊分割模塊(300)、可疑腫塊區(qū)域特征提取模塊(400)、分類診斷模塊(500)和輸出模塊(600);
輸入模塊(100)用于接收用戶輸入的待診斷的乳腺x線攝片,并傳送給感興趣區(qū)域提取模塊(200);
感興趣區(qū)域提取模塊(200)用于提取輸入的乳腺x線攝片中的感興趣區(qū)域,得到初始可疑腫塊區(qū)域位置信息,并傳送給可疑腫塊分割模塊(300);
可疑腫塊分割模塊(300)用于將感興趣區(qū)域提取模塊(200)提取的感興趣區(qū)域中的可疑腫塊分割出來,得到可疑腫塊的邊界信息,并傳送給可疑腫塊區(qū)域特征提取模塊(400);
可疑腫塊區(qū)域特征提取模塊(400)根據(jù)接收的可疑腫塊的邊界信息,計(jì)算得到相關(guān)特征值,并傳送給分類診斷模塊(500);
分類診斷模塊(500)用于將計(jì)算得到的每個(gè)可疑腫塊區(qū)域的特征值輸入分類器中,對初始可疑腫塊區(qū)域進(jìn)行計(jì)算機(jī)自動(dòng)分類識別,確定最終可疑腫塊區(qū)域,并將結(jié)果傳送給輸出模塊(600),由輸出模塊(600)將檢測的最終腫塊區(qū)域的分割結(jié)果定位在輸入的待診斷的乳腺x線攝片上,并將計(jì)算得到的區(qū)域相關(guān)特征值根據(jù)需要顯示給用戶。
全文摘要
本發(fā)明公開了一個(gè)基于乳腺x線攝片的乳腺癌計(jì)算機(jī)輔助診斷方法及其系統(tǒng)。本發(fā)明首先給系統(tǒng)輸入一待診斷的乳腺x線攝片,通過感興趣區(qū)域提取模塊、可疑腫塊區(qū)域分割模塊和可疑腫塊區(qū)域的特征提取模塊的處理,得到有關(guān)于可疑腫塊區(qū)域的一系列相關(guān)特征值,然后將特征值輸入已訓(xùn)練的分類器對可疑腫塊區(qū)域進(jìn)行分類識別,最后將計(jì)算機(jī)自動(dòng)檢測的最終可疑腫塊區(qū)域的分割結(jié)果定位在輸入的待診斷的乳腺x線攝片上,并將計(jì)算得到的區(qū)域相關(guān)特征值根據(jù)需要顯示給放射科醫(yī)師,從而提示放射科醫(yī)師需要重點(diǎn)關(guān)注的區(qū)域和區(qū)域相關(guān)重點(diǎn)參數(shù)。本發(fā)明能在一定程度上提高放射科醫(yī)師對乳腺癌診斷的準(zhǔn)確性和效率,更客觀有效地輔助放射科醫(yī)師提出診斷意見和治療方案。
文檔編號G06F17/00GK101103924SQ20071005274
公開日2008年1月16日 申請日期2007年7月13日 優(yōu)先權(quán)日2007年7月13日
發(fā)明者宋恩民, 孌 姜, 金人超, 宏 劉, 許向陽 申請人:華中科技大學(xué)