基于深度學(xué)習(xí)的皮膚活檢圖像病理特性識(shí)別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及的是一種圖像處理技術(shù)領(lǐng)域的方法,具體是一種基于深度學(xué)習(xí)的皮膚 活檢圖像病理特性識(shí)別方法。
【背景技術(shù)】
[0002] 隨著信息技術(shù)在各個(gè)醫(yī)科中的廣泛應(yīng)用,數(shù)字化存儲(chǔ)的醫(yī)學(xué)圖像的獲取和處理變 得越來(lái)越容易,越來(lái)越大量的數(shù)字化醫(yī)學(xué)圖像被快速生成,這些圖像的特點(diǎn)可以歸納為數(shù) 據(jù)量大、分辨率高、當(dāng)中蘊(yùn)含的信息量大、增長(zhǎng)速度快、非結(jié)構(gòu)化且其特性不能被簡(jiǎn)單識(shí)別。 借助各個(gè)醫(yī)科專(zhuān)家的專(zhuān)業(yè)知識(shí)對(duì)數(shù)字化醫(yī)學(xué)圖像的信息進(jìn)行提取,需要花費(fèi)大量的人力成 本,同時(shí)提取信息的質(zhì)量受到專(zhuān)家主觀(guān)因素的影響,其穩(wěn)定性得不到保證。為了能從海量的 醫(yī)學(xué)圖像中獲取能對(duì)疾病診斷有支持作用的信息,需要借助計(jì)算機(jī)程序的自動(dòng)分析。各個(gè) 醫(yī)科的病理特性差異性較大,它們所對(duì)應(yīng)的圖像特征也有十分明顯的不同,如何用計(jì)算機(jī) 模型將這些特征進(jìn)行識(shí)別并區(qū)分出各種不同的病理特性,是一個(gè)具有挑戰(zhàn)性的問(wèn)題。
[0003] 經(jīng)對(duì)現(xiàn)有技術(shù)的文獻(xiàn)檢索發(fā)現(xiàn),Caicedo,J. C等人在《Artificial Intelligence in Medicine》Vol·5651 of the series Lecture Notes in Computer Science pp.126-135 (醫(yī)學(xué)中的人工智能,LNCS系列第5651卷,126-135頁(yè))中,闡述了使用詞袋的方法提取活 檢圖像的特征,然后使用核分類(lèi)器進(jìn)行病理特性的識(shí)別,他們把該方法應(yīng)用在肺癌的病變 組織的活檢圖像識(shí)別問(wèn)題中。近年來(lái)在活檢圖像的計(jì)算機(jī)輔助分析研究中發(fā)現(xiàn),活檢圖像 所反映出來(lái)的病理特性是一種復(fù)雜且抽象的概念,通過(guò)傳統(tǒng)計(jì)算機(jī)圖形學(xué)的特征提取方法 得到的特征難以表達(dá)這些概念,因而在此基礎(chǔ)上構(gòu)建的識(shí)別模型其效果也會(huì)受到影響。該 方法采用基于直方圖建立圖像特征字典的方法,屬于一種淺層的統(tǒng)計(jì)特征,難以表達(dá)復(fù)雜 的抽象概念,因此對(duì)于復(fù)雜的活檢圖像分析就會(huì)存在較大的誤差,影響到方法的有效性。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的在于克服現(xiàn)有技術(shù)中的不足,提出一種基于深度學(xué)習(xí)的皮膚活檢圖 像病理特性識(shí)別方法,從而大幅提升計(jì)算機(jī)對(duì)皮膚活檢圖像的病理特性識(shí)別的準(zhǔn)確性。
[0005] 本發(fā)明是通過(guò)以下技術(shù)方案實(shí)現(xiàn)的,本發(fā)明具體步驟如下:
[0006] S1.將原始的皮膚活檢圖像保存為一個(gè)256階的灰度矩陣,其中矩陣的維數(shù)為mX m;
[0007] S2.把以mXm灰度矩陣表示的皮膚活檢圖像按行拉伸成一個(gè)一維向量,使用3層的 堆疊自動(dòng)編碼器進(jìn)行重新表達(dá),得到m維的特征向量;
[0008] S3.構(gòu)建一個(gè)包括輸入層I、卷積層&、采樣層5:、卷積層C2、采樣層S 2、卷積層C3、采 樣層S3、卷積層C4、采樣層S 4的多層卷積神經(jīng)網(wǎng)絡(luò),對(duì)輸入的圖像進(jìn)行特征提取;
[0009] S4.把卷積神經(jīng)網(wǎng)絡(luò)的輸出與堆疊自動(dòng)編碼器的輸出組成的特征向量輸入到一個(gè) 標(biāo)準(zhǔn)的多路輸出神經(jīng)網(wǎng)絡(luò)中,對(duì)活檢圖像的病理特性做出判斷。
[0010] 其中,步驟S1中對(duì)于非正方形的皮膚活檢圖像,通過(guò)先縮放到小于等mXm像素,然 后再填充全白到m X m的像素矩陣的方式處理。
[0011] 進(jìn)一步地,步驟S2的具體方法為構(gòu)造隱含層Hi具有17 Xm個(gè)節(jié)點(diǎn),隱含層出具有11 X m個(gè)節(jié)點(diǎn),隱含層H3具有7 X m個(gè)節(jié)點(diǎn);輸入層-?、、H2-H3之間是全連接,采用標(biāo)準(zhǔn)的自 動(dòng)編碼器的訓(xùn)練方法進(jìn)行逐層訓(xùn)練,所有層的激活函數(shù)為sigmoid函數(shù),其表達(dá)式為 sig(x) - ;0
[0012] 進(jìn)一步地,步驟S3實(shí)現(xiàn)過(guò)程如下:
[0013] (1)輸入層的維數(shù)與圖像大小相等,為mXm;在卷積層心上進(jìn)行多通道卷積操作, 產(chǎn)生特征映射矩陣通過(guò)采樣層Si進(jìn)行區(qū)域元素求和、加權(quán)、加偏移,并通過(guò)sigmoid函數(shù)進(jìn) 行非線(xiàn)性化;
[0014] (2)通過(guò)&卷積層上進(jìn)行多通道卷積操作,產(chǎn)生特征映射矩陣通過(guò)采樣層&進(jìn)行區(qū) 域元素求和、加權(quán)、加偏移,并通過(guò)sigmoid函數(shù)進(jìn)行非線(xiàn)性化;
[0015] (3)通過(guò)C3卷積層上進(jìn)行多通道卷積操作,產(chǎn)生特征映射矩陣通過(guò)采樣層&進(jìn)行區(qū) 域元素求和、加權(quán)、加偏移,并通過(guò)sigmoid函數(shù)進(jìn)行非線(xiàn)性化;
[0016] (4)通過(guò)C4卷積層上進(jìn)行多通道卷積操作,產(chǎn)生特征映射矩陣通過(guò)采樣層S 4進(jìn)行區(qū) 域元素求和、加權(quán)、加偏移,并通過(guò)sigmoid函數(shù)進(jìn)行非線(xiàn)性化,此時(shí)得到了原始像素的一個(gè) 抽象非線(xiàn)性化特征表達(dá)向量;
[0017] 所述卷積層使用公式為:
[0018] (Cic)ab = sig(wicX conv(Aab,Kic)+bic) (4.1)
[0019] 所述采樣層使用公式為:
[0020] Sis = sig(WisXconv(Bab,ones( |Bab|,|Bab| )/4)+bis) (4.2)
[0021] 對(duì)于公式(4.1),匕。表示第c個(gè)卷積層的第i個(gè)通道的卷積結(jié)果;(Clc;)ab表示矩陣C lc 的第a行第b列的元素值;sig表示sigmoid函數(shù),其表達(dá)式為減(6($) = 。為輸入到第c 個(gè)卷積層第i個(gè)通道的加權(quán)值;X為四則運(yùn)算的乘號(hào);Aab是以卷積核為大小的滑動(dòng)窗口在原 圖像矩陣I上的滑動(dòng)值,其大小與卷積核一樣;k。為第c個(gè)卷積層的第i個(gè)通道的卷積核; conv為標(biāo)準(zhǔn)的矩陣卷積運(yùn)算;h。為第c個(gè)卷積層的第i個(gè)通道的偏移;
[0022] 對(duì)于公式(4.2),Sls表示第c個(gè)卷積層的第i個(gè)通道的采樣結(jié)果;sig函數(shù)和conv函 數(shù)的含義同公式(4.1) ;wls為上一個(gè)卷積層的第i個(gè)通道到第s個(gè)采樣層的加權(quán)值;Bab為上 一個(gè)卷積層的第i個(gè)通道結(jié)果的不重疊滑動(dòng)窗口的值;〇nes( X,y)是一個(gè)能夠產(chǎn)生X行y列的 全1矩陣的函數(shù);/為普通的除法;bls為上一個(gè)采用層的第i個(gè)通道到第s個(gè)采樣層的偏移。 [0023]進(jìn)一步地,步驟S4是指輸出網(wǎng)絡(luò)為一個(gè)標(biāo)準(zhǔn)的BP神經(jīng)網(wǎng)絡(luò),輸出向量是一個(gè)d維實(shí) 值向量,每一維的取值范圍在[0,1]之間,代表該活檢圖像具有某一病理特性的概率;該神 經(jīng)網(wǎng)絡(luò)的輸入層維數(shù)與卷積神經(jīng)網(wǎng)絡(luò)的輸出層維度一致,其維數(shù)記為V,隱含層采用1/2V個(gè) 計(jì)算節(jié)點(diǎn),其計(jì)算函數(shù)為.的=1%????.,輸出層有d個(gè)計(jì)算節(jié)點(diǎn),其計(jì)算函數(shù)為sig, 含義同公式(4.1)。
[0024]本發(fā)明所產(chǎn)生的有益效果為:
[0025] 1、本發(fā)明方法能夠通過(guò)對(duì)皮膚活檢圖像的視覺(jué)圖像特征進(jìn)行基于深度學(xué)習(xí)的建 模,并以此特征建立識(shí)別模型,降低不同皮膚病的病理特性識(shí)別的錯(cuò)誤率。
[0026] 2、本發(fā)明模型在進(jìn)行病理特性識(shí)別時(shí)僅需通過(guò)網(wǎng)絡(luò)進(jìn)行一次運(yùn)算,運(yùn)算的時(shí)間復(fù) 雜度低,提高了模型的實(shí)用性,也為病理特性的實(shí)時(shí)在線(xiàn)檢測(cè)提供了可能。
[0027] 3、本發(fā)明通過(guò)卷積神經(jīng)網(wǎng)絡(luò)和堆疊自動(dòng)編碼器結(jié)合的深度學(xué)習(xí)模型提取抽象概 念表達(dá),這種概念表達(dá)對(duì)圖像的色差、光照、放大倍數(shù)等因素有很強(qiáng)的適應(yīng)性,從而實(shí)現(xiàn)對(duì) 活檢圖像所體現(xiàn)的病理特性的本質(zhì)刻畫(huà)。
【附圖說(shuō)明】
[0028] 圖1為實(shí)施例中某一病人的皮膚科的皮膚活檢圖像。
【具體實(shí)施方式】
[0029]下面對(duì)本發(fā)明的實(shí)施例作詳細(xì)說(shuō)明,本實(shí)施例在以本發(fā)明技術(shù)方案為前提下進(jìn)行 實(shí)施,給出了詳細(xì)的實(shí)施方式和過(guò)程,但本發(fā)明的保護(hù)范圍不限于下述的實(shí)施例。
[0030] 本發(fā)明公開(kāi)了基于深度學(xué)習(xí)的皮膚活檢圖像病理特性識(shí)別方法,以下根據(jù)某醫(yī)院 皮膚科的皮膚活檢圖像數(shù)據(jù)庫(kù)SkinBio作為實(shí)施例對(duì)本發(fā)明技術(shù)方案進(jìn)行詳細(xì)描述。
[0031] SkinBio包含2000個(gè)病人的6000幅皮膚活檢圖像,圖像中包含了以下14種病理特 性,分另ll是:hyperkeratosis、parakeratosis、absent granular cell layer、Munro microabscess^nevocytic nests、hyperpigmentation of Basal cell layer、 infiltration of lymphocytes>thin prickle cell layer>basal cell liquefaction degeneration、horn cyst、hypergranulosis、follicular plug、papillomatosis、 retraction space。每幅圖像以jpg格式保存,圖像的大小是1536*1536。圖1為其中某一病 人的皮膚科的皮膚活檢圖像。
[0032]本發(fā)明實(shí)施的具體步驟如下:
[0033] S1.為了減低訓(xùn)練模型所需要的開(kāi)銷(xiāo),把1536X1536的原始圖像保存為一個(gè)256階 的灰度矩陣,其中矩陣的維數(shù)為150X150:即將SkinBio數(shù)據(jù)庫(kù)的圖像縮小為150*150