專利名稱:一種分布式自適應(yīng)肺結(jié)節(jié)計(jì)算機(jī)檢測方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種分布式自適應(yīng)肺結(jié)節(jié)計(jì)算機(jī)檢測方法,尤其涉及基于蟻群算法的特征選 擇以及基于遺傳算法的分布式自適應(yīng)肺結(jié)節(jié)檢測。
背景技術(shù):
目前,人們在肺結(jié)節(jié)檢測方面做了大量的工作。 一些學(xué)者從圖像增強(qiáng)、濾波、配準(zhǔn)等方 面檢測肺結(jié)節(jié)。S.Yamamoto等人使用一種可變N環(huán)濾波器應(yīng)用于二維和三維常規(guī)圖像檢測 肺結(jié)節(jié)。魏穎等人提出結(jié)合全局區(qū)域均值和局部邊界信息的水平集改進(jìn)算法,應(yīng)用于肺結(jié)節(jié) 檢測。Brown等人用先驗(yàn)的模糊模型來描述肺結(jié)節(jié)的解剖學(xué)結(jié)構(gòu),采用圖像基元配準(zhǔn)的方法 尋找肺結(jié)節(jié)。此外,還有一些學(xué)者從肺結(jié)節(jié)的特征提取、分類方面來檢測肺結(jié)節(jié)。Lilla Boroczky 等人采用遺傳算法對特征子集進(jìn)行選擇,再利用支持向量機(jī)構(gòu)造的分類器進(jìn)行分類檢測肺結(jié) 節(jié)。Arimea等人使用多閾值技術(shù)初選結(jié)節(jié),再使用基于規(guī)則、神經(jīng)網(wǎng)絡(luò)等方法除去假陽性結(jié) 節(jié)。但是,這些肺結(jié)節(jié)檢測方法都是基于感興趣區(qū)域ROI(Regions of Interest)樣本自身的特征, 沒有考慮ROI樣本總體的特征。而且,這些算法都是基于單一節(jié)點(diǎn)的肺結(jié)節(jié)檢測,處理的圖 像資源非常有限,無法利用分布式網(wǎng)絡(luò)的圖像資源來達(dá)到更好的檢測效果。
本發(fā)明描述一種分布式自適應(yīng)肺結(jié)節(jié)計(jì)算機(jī)檢測方法,其核心內(nèi)容包括基于蟻群算法的 特征選擇、基于遺傳算法的分布式參數(shù)尋優(yōu)。使用蟻群算法選擇有代表性的肺結(jié)節(jié)特征能夠 有效的減少分類檢測的工作量、工作時(shí)間。在分布式ROI分類中,各個(gè)節(jié)點(diǎn)使用蟻群算法進(jìn) 行分類,這樣既考慮ROI的個(gè)體特征,又考慮ROI樣本總體的特征,會提高檢測的漏診率。 同時(shí),各個(gè)節(jié)點(diǎn)中的參數(shù)由中心管理器通過遺傳算法尋優(yōu)獲得之后進(jìn)行統(tǒng)一設(shè)置,而不是系 統(tǒng)開發(fā)者根據(jù)自己的測試數(shù)據(jù)憑經(jīng)驗(yàn)設(shè)置,這就有效降低了參數(shù)設(shè)置的局限性。分布式系統(tǒng) 能夠綜合不同的數(shù)據(jù)來不斷調(diào)節(jié)這些參數(shù),會大大改善參數(shù)設(shè)置的合理性,從而提高檢測性 能。
發(fā)明內(nèi)容
本發(fā)明提供一種分布式肺結(jié)節(jié)檢測方法。 具體技術(shù)方案如下
5一種分布式自適應(yīng)肺結(jié)節(jié)檢測方法,其特征在于,包括
A、 中心管理器確定肺結(jié)節(jié)特征,所述確定肺結(jié)節(jié)特征具休包括-Al、中心管理器根據(jù)初始的實(shí)驗(yàn)數(shù)據(jù),使用蟻群算法確定分類規(guī)則;
A2、通過計(jì)算規(guī)則集合中各個(gè)肺結(jié)節(jié)特征之間的相關(guān)度,對規(guī)則集合進(jìn)行修改; A3、使用特征變量表示規(guī)則集合中選定的肺結(jié)節(jié)特征;
B、 中心管理器對肺結(jié)節(jié)檢測代理進(jìn)行感興趣區(qū)域的特征變量以及分類參數(shù)的初始化,初 始的參數(shù)通過遺傳算法獲得,所述分類參數(shù)滿足適應(yīng)度凼數(shù)值最大的條件;
C、 肺結(jié)節(jié)檢測代理進(jìn)行肺結(jié)節(jié)檢測,所述肺結(jié)節(jié)檢測具體包括 Cl、對肺部CT圖像進(jìn)行分割,獲得肺實(shí)質(zhì)圖像;
C2、根據(jù)感興趣區(qū)域形狀特征,使用基于Hessian矩陣的多尺度增強(qiáng)以及梯度熵的選擇 來完成感興趣區(qū)域的提??; —C3、計(jì)算感興趣區(qū)域的特征值,根據(jù)所述感興趣區(qū)域的特征值,使用蟻群算法對感興趣 區(qū)域進(jìn)行分類,輸出肺結(jié)節(jié)檢測結(jié)果;
D、 根據(jù)輸出的檢測結(jié)果,計(jì)算作為檢測指標(biāo)的敏感性以及假陽率,將檢測指標(biāo)反饋給中 心管理器,如果檢測指標(biāo)滿足要求,則所述肺結(jié)節(jié)檢測代理使用原有的分類參數(shù)繼續(xù)調(diào)節(jié); 如果檢測指標(biāo)不滿足要求,則使用遺傳算法尋找更加理想的分類參數(shù),使用蟻群算法對感興 趣區(qū)域重新進(jìn)行分類,輸出新的肺結(jié)節(jié)檢測結(jié)果,將所述更加理想的分類參數(shù)反饋給所述肺 結(jié)節(jié)檢測代理。
還包括使用圓形腫塊征、分葉征、棘狀突起征、結(jié)節(jié)征、空泡征、空洞征、支氣管征、 毛刺征、尖角征、索條征、模糊征、充血征、胸膜凹陷征、血管束集中征和衛(wèi)星病灶征這I-五個(gè)特征構(gòu)成分類規(guī)則中的初始集合;
對于一組實(shí)驗(yàn)數(shù)據(jù),計(jì)算規(guī)則的偏好值,將偏好值最大的規(guī)則依次移入到當(dāng)前規(guī)則集合 中,同時(shí)將此組實(shí)驗(yàn)數(shù)據(jù)中符合規(guī)則的訓(xùn)練實(shí)例依次移出,直到剩余的訓(xùn)練實(shí)例少于最大未 訓(xùn)練實(shí)例時(shí),結(jié)束當(dāng)前規(guī)則集合的構(gòu)建,在當(dāng)前規(guī)則集構(gòu)建完成時(shí),根據(jù)分類的敏感性和準(zhǔn) 確性增加集合中規(guī)則的信息素,模擬信息素的增加,由信息素的持久性系數(shù)決定集合外信息 素的殘留程度,模擬信息素的揮發(fā);
計(jì)算完所有組實(shí)驗(yàn)數(shù)據(jù)訓(xùn)練實(shí)例后,信息素的大小決定規(guī)則集合的構(gòu)建,信息素較大的 規(guī)則在集合中,根據(jù)規(guī)則集合中元素的相關(guān)性,除去相關(guān)元素,確定分類特征;
根據(jù)肺結(jié)節(jié)的三維空間特征,設(shè)置特征變量球形度,表示肺結(jié)節(jié)的圓形腫塊征;根據(jù)特 征點(diǎn)以及特征點(diǎn)的凸凹性,設(shè)置特征變量Na,,表示肺結(jié)節(jié)的分葉征;根據(jù)肺結(jié)節(jié)與胸膜相連接的點(diǎn)以及肺結(jié)節(jié)附近的胸膜的曲率,設(shè)置特征變量Nw^,,表示肺結(jié)節(jié)的胸膜凹陷征; 根據(jù)增強(qiáng)前后肺結(jié)節(jié)周長與面積的比,設(shè)置特征變量N崎鐘征,表示肺結(jié)節(jié)的血管集中征。
進(jìn)一歩,在各個(gè)肺結(jié)節(jié)檢測代理進(jìn)行工作前,中心管理器根據(jù)數(shù)據(jù)庫中己有的實(shí)驗(yàn)數(shù)據(jù), 使用遺傳算法確定分類的最優(yōu)參數(shù),并使用選定的特征變量以及該所述最優(yōu)參數(shù)初始化各個(gè) 肺結(jié)節(jié)檢測代理。
進(jìn)一步,在梯度熵選擇時(shí),根據(jù)切比雪夫不等式確定肺結(jié)節(jié)梯度熵分布區(qū)間,除去增強(qiáng) 獲得的感興趣區(qū)域中的血管交叉形成的區(qū)域;根據(jù)感興趣區(qū)域的特征變量值,肺結(jié)節(jié)檢測代 理使用基于螞蟻堆積尸體模型的LF算法對數(shù)據(jù)進(jìn)行分類,從生成的類中選出結(jié)節(jié)類和血管干 擾區(qū)域類,并使用這兩類中數(shù)據(jù)的均值表示結(jié)節(jié)和血管干擾區(qū)域;使用基于螞蟻找尋食物模 型的分類算法對數(shù)據(jù)進(jìn)行分類時(shí),將選出的兩類視為"食物",每個(gè)數(shù)據(jù)被分類后,類的中心 發(fā)生變化,蟻群算法中的參數(shù)由中心管理器統(tǒng)一設(shè)定。
一種分布式自適應(yīng)的肺結(jié)節(jié)檢測系統(tǒng),所述系統(tǒng)包括中心管理器和肺結(jié)節(jié)檢測代理裝置, 所述中心管理器通過網(wǎng)絡(luò)與所述肺結(jié)節(jié)檢測代理裝置相連接,其特征在于,包括
肺結(jié)節(jié)檢測代理裝置,使用最優(yōu)閾值分割方法獲得肺實(shí)質(zhì)圖像,使用基于Hessian矩陣的 多尺度增強(qiáng)以及梯度熵選擇來提取感興趣區(qū)域,計(jì)算感興趣區(qū)域的特征值,根據(jù)所述特征值, 使用基于螞蟻堆積尸體模型以及螞蟻找尋食物模型的數(shù)據(jù)分類算法進(jìn)行分類;
中心管理器,根據(jù)初始的實(shí)驗(yàn)數(shù)據(jù),使用蟻群算法確定分類規(guī)則,通過計(jì)算規(guī)則集合中 各個(gè)肺結(jié)節(jié)特征之間的相關(guān)度,對規(guī)則集合進(jìn)行修改,使用特征變量表示規(guī)則中選定的肺結(jié) 節(jié)特征;
所述中心管理器對肺結(jié)節(jié)檢測代理裝置進(jìn)行感興趣區(qū)域的特征變量以及分類參數(shù)的初始 化,初始的參數(shù)通過遺傳算法獲得,所述分類參數(shù)滿足適應(yīng)度函數(shù)值最大的條件;
所述中心管理器在肺結(jié)節(jié)檢測過程中,根據(jù)各個(gè)肺結(jié)節(jié)檢測代理裝置反饋的肺結(jié)節(jié)檢測 的敏感性與假陽率,使用遺傳算法調(diào)節(jié)分類算法中的參數(shù)。
還包括使用圓形腫塊征、分葉征、棘狀突起征、結(jié)節(jié)征、空泡征、空洞征、支氣管征、 毛刺征、尖角征、索條征、模糊征、充血征、胸膜凹陷征、血管束集中征和衛(wèi)星病灶征這十 五個(gè)特征構(gòu)成分類規(guī)則中的初始集合;
對于一組實(shí)驗(yàn)數(shù)據(jù),計(jì)算規(guī)則的偏好值,將偏好值最大的規(guī)則依次移入到當(dāng)前規(guī)則集合 中,同時(shí)將此組實(shí)驗(yàn)數(shù)據(jù)中符合規(guī)則的訓(xùn)練實(shí)例依次移出,直到剩余的訓(xùn)練實(shí)例少于最大未 訓(xùn)練實(shí)例時(shí),結(jié)束當(dāng)前規(guī)則集合的構(gòu)建,在當(dāng)前規(guī)則集構(gòu)建完成時(shí),根據(jù)分類的敏感性和準(zhǔn) 確性增加集合中規(guī)則的信息素,模擬信息素的增加,由信息素的持久性系數(shù)決定集合外信息
7素的殘留程度,模擬信息素的揮發(fā);
計(jì)算完所有組實(shí)驗(yàn)數(shù)據(jù)訓(xùn)練實(shí)例后,信息素的大小決定規(guī)則集合的構(gòu)建,信息素較大的 規(guī)則在集合中,根據(jù)規(guī)則集合中元素的相關(guān)性,除去相關(guān)元素,確定分類特征;
根據(jù)肺結(jié)節(jié)的二維空間特征,設(shè)置特征變量球形度,表示肺結(jié)節(jié)的圓形腫塊征根據(jù)特 征點(diǎn)以及特征點(diǎn)的凸凹性,設(shè)置特征變量N分噴,表示肺結(jié)節(jié)的分葉征;根據(jù)肺結(jié)節(jié)與胸膜相 連接的點(diǎn)以及肺結(jié)節(jié)附近的胸膜的曲率,設(shè)置特征變量N胸鵬陷征,表示肺結(jié)節(jié)的胸膜凹陷征; 根據(jù)增強(qiáng)前后肺結(jié)節(jié)周長與面積的比,設(shè)置特征變量NM^ffi,表示肺結(jié)節(jié)的血管集中征。
進(jìn)一步,在各個(gè)腫結(jié)節(jié)檢測代理裝置進(jìn)行工作前,中心管理器根據(jù)數(shù)據(jù)庫中已有的實(shí)驗(yàn) 數(shù)據(jù),使用遺傳算法確定分類的最優(yōu)參數(shù),并使用選定的特征變量以及該所述最優(yōu)參數(shù)初始 化各個(gè)肺結(jié)節(jié)檢測代理裝置。
進(jìn)一歩,在梯度熵選擇時(shí),根據(jù)切比雪夫不等式確定肺結(jié)節(jié)梯度熵分布區(qū)間,除去增強(qiáng) 獲得的感興趣區(qū)域中的血管交叉形成的區(qū)域;根據(jù)感興趣區(qū)域的特征變量值,肺結(jié)節(jié)檢測代 理裝置使用基于螞蟻堆積尸體模型的LF算法對數(shù)據(jù)進(jìn)行分類,從生成的類中選出結(jié)節(jié)類和血 管干擾區(qū)域類,并使用這兩類中數(shù)據(jù)的均值表示結(jié)節(jié)和血管干擾區(qū)域;使用基于螞蟻找尋食 物模型的分類算法對數(shù)據(jù)進(jìn)行分類時(shí),將選出的兩類視為"食物",每個(gè)數(shù)據(jù)被分類后,類的 中心發(fā)生變化,蟻群算法中的參數(shù)由中心管理器統(tǒng)一設(shè)定。
一種分布式自適應(yīng)的肺結(jié)節(jié)檢測方法,其特征在于,所述方法包括
使用最優(yōu)閾值分割方法獲得肺實(shí)質(zhì)圖像;
使用基于Hessian矩陣的多尺度增強(qiáng)以及梯度熵選擇來提取感興趣區(qū)域; 計(jì)算感興趣區(qū)域的特征值;
根據(jù)所述特征值,使用基于螞蟻堆積尸體模型以及螞蟻找尋食物模型的數(shù)據(jù)分類算法進(jìn) 行分類;
根據(jù)初始的實(shí)驗(yàn)數(shù)據(jù)使用蟻群算法確定分類規(guī)則,通過計(jì)算規(guī)則集合中各個(gè)肺結(jié)節(jié)特征 之間的相關(guān)度,對規(guī)則集合進(jìn)行修改,使用特征變量表示規(guī)則中選定的肺結(jié)節(jié)特征;
所述中心管理器對肺結(jié)節(jié)檢測代理進(jìn)行感興趣區(qū)域的特征變量以及參數(shù)的初始化,初始 化參數(shù)為使遺傳算法中適應(yīng)度函數(shù)值最大的參數(shù)值;
所述中心管理器在肺結(jié)節(jié)檢測過程中,根據(jù)各個(gè)肺結(jié)節(jié)檢測代理反饋的肺結(jié)節(jié)檢測的敏 感性與假陽率,使用遺傳算法調(diào)節(jié)分類算法中的參數(shù)。
一種分布式自適應(yīng)的肺結(jié)節(jié)檢測系統(tǒng),其特征在于,包括
用于使用最優(yōu)閾值分割方法獲得肺實(shí)質(zhì)圖像的裝置;用于使用基于Hessian矩陣的多尺度增強(qiáng)以及梯度熵選擇來提取感興趣區(qū)域的裝置; 用于計(jì)算感興趣區(qū)域的特征值的裝置;
用于根據(jù)所述特征值,使用基于螞蟻堆積尸體模型以及螞蟻找尋食物模型的數(shù)據(jù)分類算 法進(jìn)行分類的裝置;
用于根據(jù)初始的實(shí)驗(yàn)數(shù)據(jù)使用蟻群算法確定分類規(guī)則,通過計(jì)算規(guī)則集合中各個(gè)肺結(jié)節(jié) 特征之間的相關(guān)度,對規(guī)則集合進(jìn)行修改,使用特征變量表示規(guī)則中選定的肺結(jié)節(jié)特征的裝 置;
所述中心管理器對肺結(jié)節(jié)檢測代理裝置進(jìn)行感興趣區(qū)域的特征變量以及參數(shù)的初始化, 初始化參數(shù)為使遺傳算法中適應(yīng)度函數(shù)值最大的參數(shù)值;
所述中心管理器在肺結(jié)節(jié)檢測過程中,根據(jù)各個(gè)肺結(jié)節(jié)檢測代理裝置反饋的肺結(jié)節(jié)檢測 的敏感性與假陽率,使用遺傳算法調(diào)節(jié)分類算法中的參數(shù)。
圖1為本發(fā)明的分布式肺結(jié)節(jié)檢測系統(tǒng)的結(jié)構(gòu)圖; 圖2為本發(fā)明的特征選擇算法的流程圖; 圖3為本發(fā)明的計(jì)算特征變量N ^ff的流程圖。
具體實(shí)施例方式
本發(fā)明提出一種分布式自適應(yīng)肺結(jié)節(jié)計(jì)算機(jī)檢測方法及系統(tǒng)。
具體實(shí)施方案如下
1中心管理器的特征選擇
特征選擇由中心管理器根據(jù)數(shù)據(jù)庫中原有的數(shù)據(jù)確定,特征選擇算法的流程如圖2所示。 實(shí)驗(yàn)表明,隨著實(shí)驗(yàn)數(shù)據(jù)的增加,特征選擇的變化情況不大,所以在分布式肺結(jié)節(jié)檢測系統(tǒng) 中,特征變量初始化之后就不再改變。
1.1規(guī)則構(gòu)建
根據(jù)肺結(jié)節(jié)的CT影像學(xué)特點(diǎn),初選圓形腫塊征、分葉征、棘狀突起征、結(jié)節(jié)征、空泡征、
空洞征、支氣管征、毛刺征、尖角征、索條征、模糊征、充血征、胸膜凹陷征、血管束集中
征、衛(wèi)星病灶征十五個(gè)特征作為初始特征。分類規(guī)則應(yīng)具有如下形式
If〈條件land條件2......> then<class>
每一個(gè)條件元素由A產(chǎn)Vy表示,Ai代表第i個(gè)特征,Vg代表A沖的第j個(gè)值。在進(jìn)行規(guī)則 構(gòu)建之前要對各個(gè)特征值進(jìn)行離散化假設(shè)特征值=1時(shí),表示該特征存在;特征值=0時(shí), 表示各個(gè)特征不存在。
9初始規(guī)則集合N為空集,初選的15個(gè)特征構(gòu)成規(guī)則集合M,將數(shù)據(jù)分成m份,每隔一段時(shí) 間,取出一份數(shù)據(jù)作為訓(xùn)練實(shí)例。根據(jù)訓(xùn)練實(shí)例計(jì)算規(guī)則偏好值,將M中規(guī)則偏好值最大的 規(guī)則從M中移出,添加到N中,將符合規(guī)則的訓(xùn)練實(shí)例移出。重復(fù)剛才的工作,直到剩余的訓(xùn) 練實(shí)例少于最大未訓(xùn)練實(shí)例max uncovered case為至,結(jié)束當(dāng)前規(guī)則集合構(gòu)建,更新信息素。 對于當(dāng)前規(guī)則集合內(nèi)的規(guī)則,其信息素根據(jù)分類檢測的效果進(jìn)行聚集增加。對于當(dāng)前規(guī)則集 合外的規(guī)則,其信息素根據(jù)設(shè)定的信息素的持久性系數(shù)p揮發(fā)減少。當(dāng)m份訓(xùn)練實(shí)例都被計(jì)算
后,取信息素最大的前minnile(最小規(guī)則數(shù))條規(guī)則,構(gòu)建規(guī)則集合。
對于初始規(guī)則集合的所有條件元素的不同屬性的初始信息素相同,設(shè)第i個(gè)特征中第j個(gè)特
征值被選擇的初始信息素為^.^ = 0) = ^—。其中,a是特征的總數(shù)量,b,是能夠被特征Ai采
用的可能值數(shù)量。第i個(gè)特征菊個(gè)特征值(temiij)被添加到當(dāng)前規(guī)則集合的概率為
a , 一 ("
i二l 乂=1
若特征A被添加當(dāng)前規(guī)則集合中,則Xi為l,否則為0。此概率可以簡化為規(guī)則偏好值為
d (2)
如果termij的規(guī)則偏好值越大,則其越先被添加到當(dāng)前規(guī)則集合中。%為tern^與規(guī)則提取
相關(guān)的啟發(fā)式函數(shù)。啟發(fā)函數(shù)是基于信息理論的,對于term,j的^值包含元素信息熵的測量, 每個(gè)滿足Ai-V,j的term,j的信息熵為-
|4=。 = —4 = ^>log2 *| 4 = K》 (3)
式中,W是類的特征,k是類的數(shù)目,p(wlAi-V。是Ai二Vij的出現(xiàn)的概率。"信息熵"的 概念是在1948年由香農(nóng)提出的,熵越大,類的確定性越小,termij被添加到規(guī)則集合中的可能 性越小。由于k^2,貝1」0<//(『|4 =。^1,為了便于在公式(2)中使用,%定義為
",,=-1- (4)
增加當(dāng)前規(guī)則集合中每一個(gè)條件元素的信息素量,就相當(dāng)于增加螞蟻所訪問路徑上的信 息素。在規(guī)則發(fā)現(xiàn)的過程中,增加了term,j未來被其他螞蟻選擇的可能性,當(dāng)前規(guī)則集合中temiij 的信息素可以被更新為.-<formula>formula see original document page 11</formula>(5) 當(dāng)前規(guī)則集合外termi」的信息素可以被更新為
<formula>formula see original document page 11</formula> (6)
P為信息素的持久性系數(shù),Q為規(guī)則的質(zhì)量函數(shù),表示本次循環(huán)term,」信息素的增量,根據(jù) 使用當(dāng)前規(guī)則集合中的特征對訓(xùn)練數(shù)據(jù)進(jìn)行分類的結(jié)果構(gòu)建規(guī)則質(zhì)量函數(shù)Q:
。=(or"eMW'ri"vrty).Oocrarac:v) = ( --~^-) (7)
式中,sensitivity為敏感性,accuracy為準(zhǔn)確性,TP為真陽性結(jié)節(jié)數(shù)、FP為假陽性結(jié)節(jié)數(shù), TN為真陰性結(jié)節(jié)數(shù),F(xiàn)N為假陰性結(jié)節(jié)數(shù),《、 -為敏感性以及準(zhǔn)確性的控制參數(shù),由于醫(yī)生
更關(guān)注敏感性,所以a比P大一些。
1.2規(guī)則修改與特征選擇 規(guī)則修改的主要目標(biāo)是去除無關(guān)的元素,提高規(guī)則的質(zhì)量。這里計(jì)算規(guī)則集合中,各個(gè)temii 之間的相關(guān)度,即在肺結(jié)節(jié)巾,temip發(fā)生同時(shí),teraiq發(fā)生的經(jīng)驗(yàn)概率P(qlp)。如果該經(jīng)驗(yàn)概率 大于預(yù)先設(shè)定的相關(guān)度最大值maxcon,則這兩個(gè)條件元素相關(guān),將temiq移出規(guī)則集合,除去 相關(guān)元素的影響,達(dá)到簡化規(guī)則集合的目的。而且,在規(guī)則構(gòu)建時(shí),向當(dāng)前規(guī)則集合中添加 新的規(guī)則,將符合規(guī)則集合中條件元素的訓(xùn)練實(shí)例移出,這樣可以在一定程度上避免了元素 相關(guān)的問題。
初步確定的分類規(guī)則為:If <圓形腫塊征=1、分葉征=1、毛刺征=1、胸膜凹陷征=1、空泡 征=1、血管集中征=1> then <該1101為肺結(jié)節(jié)>
李惠民等人認(rèn)為除了圓形腫塊征的肺癌提示性中等,血管集中征的提示性較強(qiáng)以外,其余 特征的肺癌提示性強(qiáng)??紤]到檢測規(guī)則將產(chǎn)生的誤差,將maxcon設(shè)得大一些。通過計(jì)算可知, 各個(gè)temii之間的相關(guān)度小于預(yù)先設(shè)定得maxcon。所以,規(guī)則集合不改變。確定最終的選定特 征為圓形腫塊征、分葉征、毛刺征、胸膜凹陷征、空泡征、血管集中征。 1.3使用特征變量表示選定肺結(jié)節(jié)特征 *肺結(jié)節(jié)的圓形腫塊征 在二維圖像中,圓形腫塊征表現(xiàn)為病灶趨圓形,可以使用類圓度來表示。在三維圖像中, 圓形腫塊征表現(xiàn)為趨于類球形,3D后處理技術(shù)能立體、直接而有效地描述,但這樣會大大增 加算法的計(jì)算量,這里定義了不需三維重建就可以得出的三維特征變量。
類圓度S-Ri/Rc, R,為區(qū)域內(nèi)切圓的半徑,Re為區(qū)域外接圓的半徑,類圓度越大,表示圓形腫塊征越明顯<
定義i球形度=^7^。
其中,a,b,c為一組肺結(jié)節(jié)在X,Y,Z三個(gè)坐標(biāo)軸投影長度的最大值、中間值以及最小值。對 于肺結(jié)節(jié)的球形度的計(jì)算,首先對肺結(jié)節(jié)進(jìn)行分組,重心都在半徑較小的圓的范圍內(nèi)的一些 肺結(jié)節(jié)被歸為一組。組的概念是肺結(jié)節(jié)重建的基礎(chǔ),也是提取球形度特征的基礎(chǔ)。 *肺結(jié)節(jié)的分葉征
分葉征是指二維圖像上結(jié)節(jié)邊緣明顯高低不平的弧形,在本專利中定義變量N訓(xùn).ffi描述肺 結(jié)節(jié)的分葉征。
定義2 N似......
其中,肺結(jié)節(jié)邊緣相鄰的凸凹性為凹凸凹的三個(gè)特征點(diǎn)構(gòu)成一個(gè)向量,i為向量的個(gè)數(shù)。
Ch為三個(gè)點(diǎn)中兩個(gè)凹點(diǎn)的距離,d2為肺結(jié)節(jié)重心到兩個(gè)凹點(diǎn)構(gòu)成的直線的距離。
由此可以看出,邊緣特征點(diǎn)的檢測是計(jì)算N^tH的關(guān)鍵問題。特征點(diǎn)的檢測方法主要有兩
類,即角檢測法和多邊形逼近法,這里將這兩種方法綜合獲得特征點(diǎn)。首先,順時(shí)針計(jì)算邊
緣各點(diǎn)的曲率,曲率大于"的點(diǎn)構(gòu)成初始集合M。在44+1(4、 4+,eM)上,到44+1距離最大
的點(diǎn)為B,最大距離為maxd。如果maxc/〉/ ,則將B點(diǎn)放入集合M中。否則,將《,從集合中 除去,確定最終的特征點(diǎn)集合。
特征點(diǎn)被確定后需要確定特征點(diǎn)的凸凹性,設(shè)特征點(diǎn)為pi,p2, ... ,pn,pn+1=Pl,引入函數(shù)
為AA+l有向面積的兩倍。當(dāng)特征點(diǎn)是順時(shí)針走向時(shí),如果
xi+1義+1 1
S(p,—lPlPi+1)<=0,貝(Jp,點(diǎn)就是凸的;如果S(pwPipw)》0,則pi點(diǎn)就是凹的。
判斷特征點(diǎn)的凸凹性之后,就可以根據(jù)定義2計(jì)算N^ffi, N^tffi越大,肺結(jié)節(jié)的分葉征越 明顯,計(jì)算N洲-tt的算法流程如圖2所示。
肺結(jié)節(jié)的毛刺征
肺結(jié)節(jié)的毛刺征表現(xiàn)為肺結(jié)節(jié)邊緣向周圍伸展的、放射狀的、無分支的、直而有力的細(xì)短 線條影,本發(fā)明中使用傅立葉描述子來表示毛刺征。將ROI輪廓放在復(fù)平面上研究,輪廓上的每個(gè)點(diǎn)可以寫成Z, = 、 =0,1,......,/V-l),傅立葉
系數(shù)定義為力(幻=丄gz, exp(-^),k=-M,...,-l,0,l,...,2-l 。
先進(jìn)行傅立葉快速變換,然后計(jì)算歸一化的傅立葉系數(shù)NFD(k)c -0; * = 0;
WFO = j ^(A)小(l);l A = l,2,...,W/2;
、牟+ A = -1,-2,…,-7V/2 + 1;
S ll腳("ll小l
傅立葉描述子FF-^^-,傅立葉描述子越大,肺結(jié)節(jié)的毛刺征越明顯。
藝ll腦("ll
*肺結(jié)節(jié)的胸膜凹陷征 胸膜凹陷征表現(xiàn)為肺內(nèi)結(jié)節(jié)與鄰近胸膜之間的一條或幾條線狀影,定義變量Nws,ffi描述 肺結(jié)節(jié)的胸膜凹裕fc--------
i=0
$-義3 ^V胸膜ta陷征=J 0, <i > p并ilr, g p/ewra/
Xi為肺結(jié)節(jié)邊緣像素點(diǎn),d為肺結(jié)節(jié)重心到肺實(shí)質(zhì)邊緣的最小距離。《,為肺結(jié)節(jié)附近胸膜
像素點(diǎn)的曲率,肺結(jié)節(jié)在與d垂直的方向上的投影與胸膜邊緣相交的像素點(diǎn)為肺結(jié)節(jié)附近胸
膜像素點(diǎn),m為這些點(diǎn)的集合。/9j為肺結(jié)節(jié)邊緣與胸膜相接,相鄰像素點(diǎn)構(gòu)成的集合中點(diǎn)的
水
數(shù),n為集合數(shù)。Wl、 "2為胸膜凹陷征控制系數(shù),肺結(jié)節(jié)與胸膜相接時(shí),胸膜凹陷征明顯,
且"、/ 在不同的數(shù)量級,所以M,9t w2, Ml、 ^通過實(shí)驗(yàn)獲得。N胸,瞎越大,肺結(jié)節(jié)的胸
膜凹陷征越明顯。
參肺結(jié)節(jié)的空泡征
空泡征表現(xiàn)為肺結(jié)節(jié)內(nèi)的類圓形含氣腔,在肺窗上呈低密度影,使用變量空泡面積比(R) 來描述。
i =^L 。其中,Gl為使用最優(yōu)閾值分割算法得到肺結(jié)節(jié)內(nèi)空泡的面積,G2為肺結(jié)節(jié)內(nèi)(不
包括空泡區(qū)域)的面積。如果R越大,空泡征越明顯<
13當(dāng)空泡灰度值到肺結(jié)節(jié)灰度值的變化比較緩慢時(shí),G,的計(jì)算會產(chǎn)生一定誤差。在本專利 中,使用圖像的一些紋理特征來補(bǔ)充檢測肺結(jié)節(jié)的空泡征。
統(tǒng)計(jì)距向量// (z) = ^(z,—W7)"p(z,),其中/M^f^戶(z,) 。 z為灰度級,P (z,), i二0,l,2,…,L-l,為對應(yīng)的直方圖,L是灰度級數(shù)冃。均值附gz,p(z,)為平均亮度。標(biāo)準(zhǔn)方差
(T-7^-V^為平均對比亮度。平滑度^ =1-1/(1+^)為區(qū)域中亮度的相對平滑度。三階
距A (Z) = -m)^(Z,)為度量直方圖的斜率。
一致性f/ = U /720,)為度量一致性。統(tǒng)計(jì)距
向量乂=(>7,0",及,//3, 7)7 。
不變矩向量圖像f(x,y)的二維(p+q)階矩為Ww^ZZxW(x,力。相應(yīng)的中心矩定
X 少
義為 ^ZS(x —;)"(>' —^/",力,其中'^ = ~, ; = ~,歸一化(P+q)階中心矩
-r y 附oo 附oo
定義為H^-^f ,其中^ = , + 1。對平移、縮放、鏡像和旋轉(zhuǎn)都不敏感的二維不變矩的向
Am 2
量G=(g1; g2)T,其中g(shù)l=W20+W20, g2-(W20-W2。)2+4Wu2 肺結(jié)節(jié)的血管集中征
肺結(jié)節(jié)的血管集中征表現(xiàn)為周圍的血管向結(jié)節(jié)聚集,或血管在結(jié)節(jié)邊緣中斷或貫穿結(jié)節(jié),
血管集中征有助于肺癌的診斷被大多數(shù)醫(yī)生所認(rèn)同。在本專利中,定義變量N^射,ffi表示肺結(jié)
節(jié)的血管集中征。
3Qfc/一per/mefer 定義4 A/=~a of c/一area
入 'v逾麥種征 P6廠/V776^廠
s res
其中,perimeter為原始圖像巾肺結(jié)節(jié)的周長、area為原始圖像中肺結(jié)節(jié)的面積。對含肺結(jié) 節(jié)的正方形區(qū)域進(jìn)行小波增強(qiáng),增強(qiáng)后的肺結(jié)節(jié)周長與面積為addj)erimeter、 add—area。如果
W,管^征越大,則血管集中征越明顯。
2檢測代理的肺結(jié)節(jié)檢測
肺結(jié)節(jié)檢測包括肺實(shí)質(zhì)分割、增強(qiáng)提取ROI、 ROI的特征提取及分類三部分工作。在肺實(shí) 質(zhì)分割過程中,首先使用中值濾波除去噪聲,然后使用最優(yōu)閾值分割算法獲得初步的肺實(shí)質(zhì) 圖像,最后除去干擾區(qū)域并修補(bǔ)肺實(shí)質(zhì)圖像。在增強(qiáng)提取ROI過程中,先使用基于Hessian矩
14陣的多尺度增強(qiáng)算法進(jìn)行增強(qiáng)提取,再根據(jù)肺結(jié)節(jié)的梯度熵的分布區(qū)間來除去血管交叉形成 區(qū)域的影響。最后,計(jì)算ROI的特征值,根據(jù)這些特征值使用蟻群算法對ROI進(jìn)行分類。 2.1肺實(shí)質(zhì)分割
對中值濾波處理后的圖像,采用最優(yōu)閾值算法進(jìn)行分割,獲得肺實(shí)質(zhì)。在所得的二值圖 像中,肺實(shí)質(zhì)、氣管、軀干外區(qū)域都顯示為黑色,使用Sobd算子檢測出軀干,將軀干外區(qū)域 像素置反,除去軀干外區(qū)域影響,將周長小于指定閾值的黑色區(qū)域像素置反,除去氣管影響。 在修補(bǔ)肺實(shí)質(zhì)過程中,本發(fā)明使用3x3的圓形模板進(jìn)行開閉運(yùn)算,采用滾球算法,完成校正。
2.2增強(qiáng)提取ROI
在本發(fā)明中,使用基于Hessian矩陣多尺度增強(qiáng)濾波器來提取不同大小的ROI,提取的ROI 中包含-些交叉血管形成的區(qū)域,根據(jù)由切比雪夫不等式確定圓形肺結(jié)節(jié)的梯度熵分布區(qū)間, 除去交叉血管區(qū)域的影響。
2.2.1基于Hessian矩陣的多尺度增強(qiáng)算法
在使用高斯函數(shù)進(jìn)行濾波時(shí),不同的尺度參數(shù)針對不同大小的肺結(jié)節(jié)有最優(yōu)的增強(qiáng)效果。 在本發(fā)明中,使用高斯濾波以及基于Hessian矩陣的增強(qiáng)濾波器對不同大小的肺結(jié)節(jié)進(jìn)行增強(qiáng), 提取ROI。
*高斯函數(shù)的增強(qiáng)算法
作為一種時(shí)頻域內(nèi)的線性平滑濾波器,高斯濾波器被廣泛應(yīng)用于圖像處理領(lǐng)域。高斯濾 波器最重要的性質(zhì)是高斯濾波器的寬度(決定著濾波平滑程度)由尺度參數(shù)a表征。在設(shè)計(jì)高斯 濾波器時(shí),"的選擇是一個(gè)非常重要的問題。
對于肺部CT圖像而言,肺結(jié)節(jié)為圓形,其灰度值呈Ganssian分布,尺度為 ,可以表示為
J(x,力"xp(-41^)。在CT圖像中,如果肺結(jié)節(jié)的半徑為3cx。,則肺結(jié)節(jié)占了99.54%的高 2cr。
斯函數(shù)的面積。所以,對于半徑為r的肺結(jié)節(jié),用尺度為a。 =〃/3的高斯函數(shù)來近似表示。肺 結(jié)節(jié)與二維高斯函數(shù)G(x,y;ov)二 二 exp(-^^)巻積響應(yīng)在(0, O)處,i (0,0,cr》響應(yīng)
最強(qiáng)。當(dāng) 為定值,并且朋^,0,"/、。時(shí),R取極大值。此時(shí),(7f^ 為肺結(jié)節(jié)增強(qiáng)提取
的最佳尺度。
*基于Hessian矩陣濾波器的提取算法/C^)為二維的圖像,則在點(diǎn)(x,y)處的Hessian矩陣可以表示為H
,其中,fxx, fxy,
fvx,
yx, iyy
表示圖像的二階導(dǎo)數(shù),由二階導(dǎo)數(shù)構(gòu)成的Hessian矩陣的特征值和特征向量表示圖像
的本質(zhì)特征。對于給定的圓形肺結(jié)節(jié)模型構(gòu)造的Hessian,其特征值為斗=^ = -^ 。對于給
定的線狀血管模型/U,w-exp(-4)構(gòu)造Hessian矩陣,其特征值為一-冉,^ = 0。在暗色背景
下的亮色區(qū)域,二階偏導(dǎo)數(shù)的符號是負(fù)的,在設(shè)計(jì)圓形ROI濾波器時(shí)特征值的符號需要考慮
」41
在內(nèi),據(jù)此構(gòu)造圓形肺結(jié)節(jié)的濾波器為《=
Wl2 0,其它
,當(dāng)^<0, 4<0時(shí)
(w豐l)。
多尺度增強(qiáng)提取方案
由于病人的病情以及CT成像時(shí)位置情況不同,在CT圖像上肺結(jié)節(jié)的大小是不同的,肺
結(jié)節(jié)的半徑范圍為[r。,d,則高斯濾波器的尺度范圍為
3 "3
。為了增強(qiáng)提取在這個(gè)范圍內(nèi)
的所有對象,應(yīng)該先在這個(gè)范圍內(nèi)應(yīng)用高斯濾波器增強(qiáng),然后再應(yīng)用前面設(shè)計(jì)的濾波器進(jìn)行 增強(qiáng)。這兩個(gè)步驟要重復(fù)N次,得到N張不同尺度增強(qiáng)后的圖像。通過實(shí)驗(yàn)得知N-5比較合
適,在
3 、
范圍內(nèi),這W個(gè)不連續(xù)的平滑尺度設(shè)計(jì)為q=i, W^,
+ ,其中,r = (voL
、ww-1)。多尺度濾波器在每一個(gè)像素的輸出取W個(gè)濾波器輸
出的最大值,為了使濾波器在不同尺度下的輸出響應(yīng)可比較,要將輸出乘以C7/。
2.2.2除去血管交叉區(qū)域影響
二階的Hessian矩陣僅用主曲率,無法區(qū)分肺結(jié)節(jié)和血管交叉區(qū)域,這里使用梯度熵來除 去Hessian矩陣增強(qiáng)后,ROI中的血管交叉區(qū)域。 *梯度熵
在本發(fā)明中,將梯度熵作為判斷是ROI還是血管形成的交叉區(qū)域的度量。經(jīng)過Hessian 矩陣濾波器提取處理后,血管的交差區(qū)域也被當(dāng)作ROI提取。為了除去這樣的區(qū)域,計(jì)算增 強(qiáng)后圓形區(qū)域?qū)?yīng)的原始圖像中相應(yīng)區(qū)域灰度圖像的梯度熵。如果是類圓形肺結(jié)節(jié)區(qū)域,各 個(gè)方向梯度相同,梯度熵值較小;如果是血管的交叉形成的類圓形區(qū)域,各個(gè)方向的梯度有 較大差別,梯度熵值較大。計(jì)算增強(qiáng)后得到的所有類圓形結(jié)構(gòu)的梯度熵
16<formula>formula see original document page 17</formula>(8)
其中,選定的圓形區(qū)域中共有k個(gè)梯度級,P(i)是第i個(gè)梯度級出現(xiàn)的概率。 *由切比雪夫不等式確定ROI梯度熵分布區(qū)間
由于肺結(jié)節(jié)的梯度熵值較小,而線狀血管交叉形成的圓的梯度熵值較大,可以根據(jù)熵的 大小找出肺結(jié)節(jié)的ROI區(qū)域。將增強(qiáng)后的區(qū)域在原始灰度圖像中相應(yīng)區(qū)域的梯度熵與由切比雪 夫不等式學(xué)習(xí)到的肺結(jié)節(jié)的熵值區(qū)間進(jìn)行對比,如果當(dāng)前的梯度熵值在學(xué)習(xí)到的熵值區(qū)間內(nèi), 那么就認(rèn)為該圓形區(qū)域?yàn)榉谓Y(jié)節(jié),保留該區(qū)域。否則,除去該區(qū)域。
切比雪夫不等式給出了在隨機(jī)變量.Y的分布未知的情況下,只利用x的數(shù)學(xué)期望和方差
即可對義的概率分布進(jìn)行估值的方法。在訓(xùn)練階段,對于肺結(jié)節(jié)熵值&^2...、,用樣本的均 值r和方差一來估計(jì)總體的均值和方差。在檢測增強(qiáng)后的圓形ROI(熵值為y)時(shí),可以設(shè)定一
個(gè)閾值《。如果/7-#^>^// +《,則該ROI為肺結(jié)節(jié)的概率大于等于l-;,這樣指定了置
信概率就可以得出肺結(jié)節(jié)梯度熵的分布區(qū)間。 2.3基于蟻群模型的分類算法檢測肺結(jié)節(jié)
在提取完ROI之后,計(jì)算ROI的特征值。由于特征值有不同的數(shù)量級,所以需要對各特 征值進(jìn)行規(guī)一化處理,使用規(guī)一化后的ROI特征值進(jìn)行分類。目前,大多數(shù)的ROI分類算法 都是針對肺結(jié)節(jié)自身的特性,沒有考慮ROI總體的特性。如果是腫癌等疾病發(fā)病率高的地區(qū), 檢測出的ROI多為肺結(jié)節(jié);如果是肺癌等疾病發(fā)病率低的地區(qū),檢測出的ROI為假陽性結(jié)節(jié) 的可能性就大。本發(fā)明采用基于螞蟻堆積尸體模型及螞蟻找尋食物模型的蟻群分類算法對 ROI進(jìn)行分類,考慮ROI的總體特性,能提高ROI分類的性能。本發(fā)明首先用基于螞蟻堆積 尸體模型的數(shù)據(jù)分類(LF)算法獲得分類中心,再用基于螞蟻覓食模型的分類算法進(jìn)行分類。
2.3.1使用LF算法獲得分類中心
在LF分類算法中,首先將待分類數(shù)據(jù)隨機(jī)放置在一個(gè)二維網(wǎng)格中,每一個(gè)數(shù)據(jù)有一個(gè)隨機(jī) 的初始位置,每一只螞蟻能夠在網(wǎng)格上移動,并測量背負(fù)的數(shù)據(jù)在局部環(huán)境的群體相似度, 通過概率轉(zhuǎn)換函數(shù)將群體相似度轉(zhuǎn)換成螞蟻搬動數(shù)據(jù)的概率,螞蟻以這個(gè)概率拾起或放下數(shù)
據(jù),以達(dá)到分類的目的。但是,這樣的LF算法存在兩個(gè)致命的問題。 一是,在螞蟻算法結(jié)束 時(shí)還有一些數(shù)據(jù)沒有指定到某個(gè)堆中,同時(shí)還存在一些小堆。二是,如果數(shù)據(jù)被放置在一個(gè) 錯(cuò)誤的數(shù)據(jù)堆中,它就需要很長時(shí)間才能被螞蟻移動到正確的數(shù)據(jù)堆中。本發(fā)明提出使用LF 算法獲得分類中心,分類的工作由2.3.2中的算法完成,該方法避免了上述兩個(gè)問題。2.3.2基于螞蟻找尋食物模型的分類
從已經(jīng)分好的堆中選出能代表肺結(jié)節(jié)與干擾區(qū)域的特征值(肺結(jié)節(jié)類與干擾區(qū)域類特征值 的均值),將其視為"食物",將其它數(shù)據(jù)視為"螞蟻"。那么數(shù)據(jù)分類過程就可以看作是不同螞 蟻找尋不同食物的過程。在每個(gè)搜索周期,螞蟻根據(jù)到達(dá)不冋"食物"的信息素的多少來計(jì)算 轉(zhuǎn)移概率,決定下一次的轉(zhuǎn)移位置。在第t次分類過程中,數(shù)據(jù)x,到第j個(gè)分類中心的狀態(tài)轉(zhuǎn)移 概率
<formula>formula see original document page 18</formula>
其它
0,
初始時(shí)刻各個(gè)路徑上的信息素量相等,^切表示在第t次分類中數(shù)據(jù)Xi到第j個(gè)中心的 殘留信息素的多少。",,(0為路徑(i,j)的可見度,反映螞蟻在運(yùn)動過程中的一種先驗(yàn)性,一 般取為1/dij,其中<formula>formula see original document page 18</formula> p為數(shù)據(jù)的維數(shù)。"為路徑相 對重要性因子(一般取2),反映螞蟻在運(yùn)動過程中積累的信息素的相對重要程度。-路徑可見
度因子(一般取2),反映螞蟻在運(yùn)動過程中路徑可見性的重要程度。U為可選擇路徑的集合。
在每只螞蟻完成一次分類之后,兩類的特征值發(fā)生變化,每個(gè)數(shù)據(jù)到分類中心的信息素 的量按照下列規(guī)則進(jìn)行調(diào)整,即
<formula>formula see original document page 18</formula>
其中,P為信息素的持久性,表示信息素的殘留程度,Q為常量,A^o表示本次循環(huán)數(shù)
據(jù)i分到第類j的信息素增量。 3中心管理器的參數(shù)調(diào)節(jié) 3.1分布式系統(tǒng)中的參數(shù)調(diào)節(jié)
在對檢測結(jié)果進(jìn)行評價(jià)時(shí),根據(jù)敏感性(sensitivity=TP/(TP+FN))、假陽率(FPs-FP/scans, scans為CT掃描的總組數(shù))來衡量檢測結(jié)果。當(dāng)各個(gè)肺結(jié)節(jié)檢測代理檢測的敏感性大于等于",
FPs小于等于p時(shí),檢測的結(jié)果可以接受。由于醫(yī)學(xué)診斷更看重的是敏感性指標(biāo),有類似"寧 可錯(cuò)殺也決不放過"的思想,所以對敏感性的要求較為苛刻。
對于使用蟻群算法進(jìn)行分類,參數(shù)戶、Q的設(shè)定直接影響檢測的敏感性以及假陽率。將"肺結(jié)節(jié)"視為"食物r',如果其信息素公式中的兩個(gè)參數(shù)/v a越大,則其信息素影響越大,待
分類的ROI被分到肺結(jié)節(jié)類的可能性越大,敏感性越高,假陽率越高。將"非結(jié)節(jié)"視為"食物 2",如果其信息素公式屮的兩個(gè)參數(shù)/v g,越大,則其信息素影響越大,待分類的ROI被分
到非結(jié)節(jié)類的可能性越大,則敏感性越低,假陽率越低。根據(jù)醫(yī)生對肺部CT圖像的最終診 斷意見,判定肺結(jié)節(jié)檢測代理檢測的敏感性以及假陽率。如果這兩個(gè)指標(biāo)在可以接受的范圍 內(nèi),則不調(diào)節(jié)ROI分類算法中的參數(shù)。否則,將該時(shí)間段內(nèi)該節(jié)點(diǎn)檢測的數(shù)據(jù)提交給分布式 系統(tǒng)中的自適應(yīng)參數(shù)調(diào)節(jié)節(jié)點(diǎn),其將使用遺傳算法獲得最優(yōu)的參數(shù)反饋給這個(gè)結(jié)節(jié)檢測節(jié)點(diǎn)。
在本發(fā)明提出的肺結(jié)節(jié)檢測算法中,使用的是基于蟻群模型的分類算法。但是還有許多分 類算法,如非線性分類算法、支持向量機(jī)分類算法、神經(jīng)元網(wǎng)絡(luò)分類算法等。在這些算法中, 都存在有些決定分類效果的參數(shù),如非線性分類算法中的閾值,支持向量計(jì)算法中的懲罰因 素等,這些參數(shù)的選擇都是通過測試數(shù)據(jù)根據(jù)經(jīng)驗(yàn)得到。但是,如果在這些算法中,應(yīng)用本 發(fā)明的自適應(yīng)分布式思想,就能構(gòu)成自適應(yīng)的分布式肺結(jié)節(jié)檢測系統(tǒng),大大提高參數(shù)設(shè)置的 合理性以及肺結(jié)節(jié)檢測的效果。
3.2基于遺傳算法的自適應(yīng)參數(shù)確定
遺傳算法是模仿自然界生物進(jìn)化機(jī)制發(fā)展起來的隨機(jī)全局搜索和優(yōu)化方法,它借鑒了達(dá) 爾文的進(jìn)化論和孟德爾的遺傳學(xué)說。其本質(zhì)是一種高效、并行、全局搜索的方法,它能在搜 索過程中自動獲取和積累有關(guān)搜索空間的知識,并自適應(yīng)地控制搜索過程以求得最優(yōu)解。在 遺傳算法的每一代中,根據(jù)個(gè)體在問題域中的適應(yīng)度值和從自然遺傳學(xué)中借鑒來的再造方法 進(jìn)行個(gè)體選擇,產(chǎn)生一個(gè)新的近似解。這個(gè)過程導(dǎo)致群中個(gè)體的進(jìn)化,得到的新個(gè)體比原個(gè) 體更能適應(yīng)環(huán)境,就像自然界中的改造一樣。
本發(fā)明使用遺傳算法獲得最優(yōu)參數(shù)。當(dāng)各個(gè)代理檢測的結(jié)果不滿足敏感性或假陽率的條 件要求時(shí),將這些檢測數(shù)據(jù)發(fā)送到中心管理器。中心管理器通過對當(dāng)前反饋的數(shù)據(jù)以及中心 管理器存儲的數(shù)據(jù)進(jìn)行計(jì)算,使用遺傳算法獲得最優(yōu)參數(shù)。首先,隨機(jī)生成M個(gè)參數(shù)個(gè)體構(gòu) 成初始種群。接著,根據(jù)由分類的敏感性、假陽率構(gòu)成的適應(yīng)度函數(shù),經(jīng)過選擇、交叉以及 變異,生成新的個(gè)體。如果新個(gè)體數(shù)達(dá)到M,則說明已形成一個(gè)新的群體,進(jìn)行下一代的遺 傳。否則,繼續(xù)本代的繁殖、交叉和變異操作,直至新個(gè)體數(shù)達(dá)到M。最后,當(dāng)遺傳到指定 的一代時(shí),從中選擇出適應(yīng)函數(shù)值大的個(gè)體,作為最優(yōu)的參數(shù),使用這個(gè)參數(shù)進(jìn)行分類。在 這代中,個(gè)體的適應(yīng)函數(shù)值較第一個(gè)父代大很多,這體現(xiàn)了遺傳算法的尋優(yōu)能力。
3.2.1初始種群的生成利用隨機(jī)函數(shù)產(chǎn)生M個(gè)個(gè)體組成初始群體,也可以根據(jù)專家經(jīng)驗(yàn)選出M個(gè)個(gè)體作為初 始群體,后者尋優(yōu)速度更快,收斂到最優(yōu)個(gè)體的時(shí)間短。 一般來說,初始群體素質(zhì)都很差, 但是,在先驗(yàn)知識不多的情況下也不失為一個(gè)不錯(cuò)的選擇,同時(shí)還能保證個(gè)體的多樣性。所 以,本發(fā)明初始種群為隨機(jī)生成的。
3.2.2評估函數(shù)(適應(yīng)度函數(shù))的確定
適應(yīng)度函數(shù)是度量群體中各個(gè)個(gè)體在優(yōu)化計(jì)算中能達(dá)到或者接近于有助于找到最優(yōu)解的 優(yōu)良程度。適應(yīng)度較高的個(gè)體遺傳到下一代的概率就較大;而適應(yīng)度較低的個(gè)體遺傳到下一
代的概率就相對小一些。在本專利中,適應(yīng)度函數(shù)選為/(/v 0,、 a、 a):
/Go、 0、 p、 0)=——i——=-^- (12)
《、/>為使用當(dāng)前參數(shù)對中心管理器中的所有數(shù)據(jù)進(jìn)行分類獲得的漏診率、誤診率,Pt二l
—TP/(TP+FN) = 1 — sensitivity, P產(chǎn)FPscans/scans(FP十TN) = FPs [scans/(FP+TN)] 。 a 、 / 為漏診
率、誤診率調(diào)節(jié)參數(shù),這里取"=2,/ = 1。 3.2.3遺傳算子設(shè)計(jì)
遺傳算法中主要有三個(gè)算子選擇算子、交叉算子以及變異算子,每一個(gè)算子都有一些 不同的策略算法。本發(fā)明從中計(jì)算量、計(jì)算時(shí)間兩方面考慮,選擇了輪盤選擇算子、多點(diǎn)交 叉算子、基本位變異算子進(jìn)行計(jì)算。
20
權(quán)利要求
1.一種分布式自適應(yīng)肺結(jié)節(jié)檢測方法,其特征在于,包括A、中心管理器確定肺結(jié)節(jié)特征,所述確定肺結(jié)節(jié)特征具體包括A1、中心管理器根據(jù)初始的實(shí)驗(yàn)數(shù)據(jù),使用蟻群算法確定分類規(guī)則;A2、通過計(jì)算規(guī)則集合中各個(gè)肺結(jié)節(jié)特征之間的相關(guān)度,對規(guī)則集合進(jìn)行修改;A3、使用特征變量表示規(guī)則集合中選定的肺結(jié)節(jié)特征;B、中心管理器對肺結(jié)節(jié)檢測代理進(jìn)行感興趣區(qū)域的特征變量以及分類參數(shù)的初始化,初始的參數(shù)通過遺傳算法獲得,所述分類參數(shù)滿足適應(yīng)度函數(shù)值最大的條件;C、肺結(jié)節(jié)檢測代理進(jìn)行肺結(jié)節(jié)檢測,所述肺結(jié)節(jié)檢測具體包括C1、對肺部CT圖像進(jìn)行分割,獲得肺實(shí)質(zhì)圖像;C2、根據(jù)感興趣區(qū)域形狀特征,使用基于Hessian矩陣的多尺度增強(qiáng)以及梯度熵的選擇來完成感興趣區(qū)域的提??;C3、計(jì)算感興趣區(qū)域的特征值,根據(jù)所述感興趣區(qū)域的特征值,使用蟻群算法對感興趣區(qū)域進(jìn)行分類,輸出肺結(jié)節(jié)檢測結(jié)果;D、根據(jù)輸出的檢測結(jié)果,計(jì)算作為檢測指標(biāo)的敏感性以及假陽率,將檢測指標(biāo)反饋給中心管理器,如果檢測指標(biāo)滿足要求,則所述肺結(jié)節(jié)檢測代理使用原有的分類參數(shù)繼續(xù)調(diào)節(jié);如果檢測指標(biāo)不滿足要求,則使用遺傳算法尋找更加理想的分類參數(shù),使用蟻群算法對感興趣區(qū)域重新進(jìn)行分類,輸出新的肺結(jié)節(jié)檢測結(jié)果,將所述更加理想的分類參數(shù)反饋給所述肺結(jié)節(jié)檢測代理。
2. 如權(quán)利要求l所述的方法,其特征在于,還包括使用圓形腫塊征、分葉征、棘狀突起 征、結(jié)節(jié)征、空泡征、空洞征、支氣管征、毛刺征、尖角征、索條征、模糊征、充血征、胸 膜凹陷征、血管束集中征和衛(wèi)星病灶征這十五個(gè)特征構(gòu)成分類規(guī)則中的初始集合;對于一組實(shí)驗(yàn)數(shù)據(jù),計(jì)算規(guī)則的偏好值,將偏好值最大的規(guī)則依次移入到當(dāng)前規(guī)則集合 中,同時(shí)將此組實(shí)驗(yàn)數(shù)據(jù)中符合規(guī)則的訓(xùn)練實(shí)例依次移出,直到剩余的訓(xùn)練實(shí)例少于最大未 訓(xùn)練實(shí)例時(shí),結(jié)束當(dāng)前規(guī)則集合的構(gòu)建,在當(dāng)前規(guī)則集構(gòu)建完成時(shí),根據(jù)分類的敏感性和準(zhǔn) 確性增加集合中規(guī)則的信息素,模擬信息素的增加,由信息素的持久性系數(shù)決定集合外信息 素的殘留程度,模擬信息素的揮發(fā);計(jì)算完所有組實(shí)驗(yàn)數(shù)據(jù)訓(xùn)練實(shí)例后,信息素的大小決定規(guī)則集合的構(gòu)建,信息素較大的 規(guī)則在集合中,根據(jù)規(guī)則集合中元素的相關(guān)性,除去相關(guān)元素,確定分類特征;根據(jù)肺結(jié)節(jié)的三維空間特征,設(shè)置特征變量球形度,表示肺結(jié)節(jié)的圓形腫塊征;根據(jù)特 征點(diǎn)以及特征點(diǎn)的凸凹性,設(shè)置特征變量N^tf,表示肺結(jié)節(jié)的分葉征;根據(jù)腫結(jié)節(jié)與胸膜相 連接的點(diǎn)以及肺結(jié)節(jié)附近的胸膜的曲率,設(shè)置特征變量N u,Bffi,表示肺結(jié)節(jié)的胸膜凹陷征; 根據(jù)增強(qiáng)前后肺結(jié)節(jié)周長與面積的比,設(shè)置特征變量N 巾征,表示肺結(jié)節(jié)的血管集中征。
3. 如權(quán)利要求1所述的方法,其特征在于,在各個(gè)肺結(jié)節(jié)檢測代理進(jìn)行工作前,中心管 理器根據(jù)數(shù)據(jù)庫中已有的實(shí)驗(yàn)數(shù)據(jù),使用遺傳算法確定分類的最優(yōu)參數(shù),并使用選定的特征 變量以及該所述最優(yōu)參數(shù)初始化各個(gè)肺結(jié)節(jié)檢測代理。
4. 如權(quán)利要求l所述的方法,其特征在于,在梯度熵選擇時(shí),根據(jù)切比雪夫不等式確定 肺結(jié)節(jié)梯度熵分布區(qū)間,除去增強(qiáng)獲得的感興趣區(qū)域中的血管交叉形成的區(qū)域;根據(jù)感興趣 區(qū)域的特征變量值,肺結(jié)節(jié)檢測代理使用基于螞蟻堆積尸體模型的LF算法對數(shù)據(jù)進(jìn)行分類, 從生成的類中選出結(jié)節(jié)類和血管干擾區(qū)域類,并使用這兩類中數(shù)據(jù)的均值表示結(jié)節(jié)和血管干 擾區(qū)域;使用基于螞蟻找尋食物模型的分類算法對數(shù)據(jù)進(jìn)行分類時(shí),將選出的兩類視為"食 物",每個(gè)數(shù)據(jù)被分類后,類的中心發(fā)生變化,蟻群算法中的參數(shù)由中心管理器統(tǒng)設(shè)定。
5. —種分布式自適應(yīng)的肺結(jié)節(jié)檢測系統(tǒng),所述系統(tǒng)包括中心管理器和肺結(jié)節(jié)檢測代理裝 置,所述屮心管理器通過網(wǎng)絡(luò)與所述肺結(jié)節(jié)檢測代理裝置相連接,其特征在于,包括肺結(jié)節(jié)檢測代理裝置,使用最優(yōu)閾值分割方法獲得肺實(shí)質(zhì)圖像,使用基于Hessian矩陣的 多尺度增強(qiáng)以及梯度熵選擇來提取感興趣區(qū)域,計(jì)算感興趣區(qū)域的特征值,根據(jù)所述特征值,使用基于螞蟻堆積尸體模型以及螞蟻找尋食物模型的數(shù)據(jù)分類算法進(jìn)行分類;中心管理器,根據(jù)初始的實(shí)驗(yàn)數(shù)據(jù),使用蟻群算法確定分類規(guī)則,通過計(jì)算規(guī)則集合中 各個(gè)肺結(jié)節(jié)特征之間的相關(guān)度,對規(guī)則集合進(jìn)行修改,使用特征變量表示規(guī)則中選定的肺結(jié)節(jié)特征;所述中心管理器對肺結(jié)節(jié)檢測代理裝置進(jìn)行感興趣區(qū)域的特征變量以及分類參數(shù)的初始 化,初始的參數(shù)通過遺傳算法獲得,所述分類參數(shù)滿足適應(yīng)度函數(shù)值最大的條件;所述中心管理器在肺結(jié)節(jié)檢測過程中,根據(jù)各個(gè)肺結(jié)節(jié)檢測代理裝置反饋的肺結(jié)節(jié)檢測 的敏感性與假陽率,使用遺傳算法調(diào)節(jié)分類算法中的參數(shù)。
6. 如權(quán)利要求5所述的系統(tǒng),其特征在于,還包括使用圓形腫塊征、分葉征、棘狀突起 征、結(jié)節(jié)征、空泡征、空洞征、支氣管征、毛刺征、尖角征、索條征、模糊征、充血征、胸 膜凹陷征、血管朿集中征和衛(wèi)星病灶征這十五個(gè)特征構(gòu)成分類規(guī)則中的初始集合;對于一組實(shí)驗(yàn)數(shù)據(jù),計(jì)算規(guī)則的偏好值,將偏好值最大的規(guī)則依次移入到當(dāng)前規(guī)則集合 中,同時(shí)將此組實(shí)驗(yàn)數(shù)據(jù)中符合規(guī)則的訓(xùn)練實(shí)例依次移出,直到剩余的訓(xùn)練實(shí)例少于最大未訓(xùn)練實(shí)例時(shí),結(jié)束當(dāng)前規(guī)則集合的構(gòu)建,在當(dāng)前規(guī)則集構(gòu)建完成時(shí),根據(jù)分類的敏感性和準(zhǔn) 確性增加集合中規(guī)則的信息素,模擬信息素的增加,由信息素的持久性系數(shù)決定集合外信息 素的殘留程度,模擬信息素的揮發(fā);計(jì)算完所有組實(shí)驗(yàn)數(shù)據(jù)訓(xùn)練實(shí)例后,信息素的大小決定規(guī)則集合的構(gòu)建,信息素較大的 規(guī)則在集合中,根據(jù)規(guī)則集合中元素的相關(guān)性,除去相關(guān)元素,確定分類特征;根據(jù)肺結(jié)節(jié)的三維空間特征,設(shè)置特征變量球形度,表示肺結(jié)節(jié)的圓形腫塊征;根據(jù)特 征點(diǎn)以及特征點(diǎn)的凸凹性,設(shè)置特征變量Nw,表示肺結(jié)節(jié)的分葉征;根據(jù)肺結(jié)節(jié)與胸膜相 連接的點(diǎn)以及肺結(jié)節(jié)附近的胸膜的曲率,設(shè)置特征變量N w ,表示肺結(jié)節(jié)的胸膜凹陷征; 根據(jù)增強(qiáng)前后肺結(jié)節(jié)周長與面積的比,設(shè)置特征變量N皿鐘ff,表示肺結(jié)節(jié)的血管集屮征。
7. 如權(quán)利要求5所述的系統(tǒng),其特征在于,在各個(gè)肺結(jié)節(jié)檢測代理裝置進(jìn)行工作前,中 心管理器根據(jù)數(shù)據(jù)庫中已有的實(shí)驗(yàn)數(shù)據(jù),使用遺傳算法確定分類的最優(yōu)參數(shù),并使用選定的 特征變量以及該所述最優(yōu)參數(shù)初始化各個(gè)肺結(jié)節(jié)檢測代理裝置。
8. 如權(quán)利要求5所述的系統(tǒng),其特征在于,在梯度熵選擇時(shí),根據(jù)切比雪夫不等式確定 腫結(jié)節(jié)梯度熵分布區(qū)間,除去增強(qiáng)獲得的感興趣區(qū)域中的血管交叉形成的區(qū)域;根據(jù)感興趣 區(qū)域的特征變量值,肺結(jié)節(jié)檢測代理裝置使用基于螞蟻堆積尸體模型的LF算法對數(shù)據(jù)進(jìn)行分 類,從生成的類中選出結(jié)節(jié)類和血管干擾區(qū)域類,并使用這兩類中數(shù)據(jù)的均值表示結(jié)節(jié)和血 管干擾區(qū)域;使用基于螞蟻找尋食物模型的分類算法對數(shù)據(jù)進(jìn)行分類時(shí),將選出的兩類視為"食物",每個(gè)數(shù)據(jù)被分類后,類的中心發(fā)生變化,蟻群算法中的參數(shù)由中心管理器統(tǒng)一設(shè)定。
全文摘要
本發(fā)明涉及一種分布式自適應(yīng)肺結(jié)節(jié)計(jì)算機(jī)檢測方法及系統(tǒng),該分布式肺結(jié)節(jié)檢測系統(tǒng)由肺結(jié)節(jié)檢測代理和中心管理器兩部分組成。肺結(jié)節(jié)檢測代理完成肺實(shí)質(zhì)分割、增強(qiáng)提取感興趣區(qū)域、感興趣區(qū)域的特征提取及分類三部分工作。中心管理器使用特征變量表示選定的肺結(jié)節(jié)特征,并根據(jù)這些特征變量對肺結(jié)節(jié)檢測代理進(jìn)行感興趣區(qū)域的特征變量初始化,同時(shí)進(jìn)行分類參數(shù)的初始化。在肺結(jié)節(jié)檢測過程中,根據(jù)反饋的肺結(jié)節(jié)檢測的敏感性與假陽率,使用遺傳算法調(diào)節(jié)分類算法中的參數(shù)。
文檔編號G06K9/62GK101556650SQ200910010968
公開日2009年10月14日 申請日期2009年4月1日 優(yōu)先權(quán)日2009年4月1日
發(fā)明者周翰遜, 薛定宇, 薇 郭, 穎 魏 申請人:東北大學(xué)