專利名稱:用于乳房成像的自動診斷和決策支持的系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明一般地涉及用于為醫(yī)學成像提供自動診斷和決策支持的系統(tǒng)和方法,具體地說,涉及CAD(計算機輔助診斷)系統(tǒng)和在乳房成像上的應(yīng)用,它使用機器學習技術(shù),允許這樣的系統(tǒng)和應(yīng)用程序″學會″分析從對象病人的圖像數(shù)據(jù)和/或病人非圖像數(shù)據(jù)提取的參數(shù),以便在內(nèi)科醫(yī)生工作流程的不同方面協(xié)助內(nèi)科醫(yī)生,包括但是不限于,診斷醫(yī)療狀態(tài)(乳房腫瘤)和確定對象病人的有效的保健或診斷或治療途徑。
背景技術(shù):
今天,在大部分國家,利用乳房X線攝影對超過某個年齡(一般40歲)的婦女進行乳房癌癥篩選。若乳房X線攝影的結(jié)果可疑或有潛在癌乳房組織,則把病人送去作診斷檢查。作為另一方案,可以通過其它途徑,諸如體檢結(jié)果,其中作檢驗的內(nèi)科醫(yī)生通過病人臨床、病歷或其它手段,覺得或者識別出病人乳房有某些異常特征(例如,腫塊(masses)),或在病人具有極高癌癥風險的情況下,把病人送去作診斷檢查。
在診斷檢查中,將利用幾種成像形態(tài)成像,(包括乳房X線攝影(數(shù)字的或模擬的)、MRI或超聲)中的一種將病人的乳房成像,用于篩選或評定乳房組織解剖學異常的目的,包括微鈣化或乳房組織的腫塊,和不同的其它損害或潛在癌癥的異常。另外,為診斷目的研發(fā)了較新的技術(shù),包括層析X射線攝影合成、光學成像、應(yīng)變成像、核成像等,可以用來獲得病人乳房診斷圖像,由內(nèi)科醫(yī)生評定,確定乳房組織中特定的損害是良性的還是惡性的。
觀看診斷圖像之后,若內(nèi)科醫(yī)生相信,所述損害可能是惡性的,則進行活組織檢查,取出一片損害的組織進行分析。在確定是良性的還是惡性組織方面,這種處理被認為是″金科玉律″。但是,由于不同的原因最好把進行活組織檢查的次數(shù)減到最小。例如,活組織檢查程序會引起病人疼痛和疤痕,活組織檢查程序的時間和向病人提供結(jié)果之間的時間長(一般至少幾天),由于預(yù)測可能得到負面結(jié)果的可能性,病人承受嚴重的壓力。另一方面,活組織檢查程序允許內(nèi)科醫(yī)生準確診斷大百分數(shù)的患有乳房癌的病人。因而,一般在靈敏度和特異性之間維持某種折衷或平衡。
在醫(yī)學成象領(lǐng)域中,盡管可以使用不同的成像形態(tài)和系統(tǒng),用于產(chǎn)生解剖學結(jié)構(gòu)的診斷圖像,以篩選和評定醫(yī)療狀態(tài),但在乳房癌檢測方面,每一種診斷成像形態(tài)都具有它自己的優(yōu)點和缺點,而且成像形態(tài)的最優(yōu)選擇并非對于每個病人都是同樣的。理想的是,對于給定的病人,選定成像形態(tài)以便對所述病人使靈敏度和特異性最大化。對于每一個病人,對于這樣的目的可能會有一個或多個″最優(yōu)的″成像形態(tài)。不幸的是,由于成本,不可能利用多個成像形態(tài)給每個病人成像,然后選擇哪個形態(tài)會在靈敏度和特異性之間提供最優(yōu)的平衡。
診斷成像形態(tài)的選擇一般是由咨詢(referring)內(nèi)科醫(yī)生根據(jù)若干因素,例如,包括(i)可用性和成本;(ii)舒適程度和咨詢內(nèi)科醫(yī)生的經(jīng)驗;或(iii)內(nèi)科醫(yī)生的關(guān)于哪些成像形態(tài)在獲得病人信息方面是最優(yōu)的″直感″作出的。雖然所述第一因素是不可避免的,但是對于個體病人而言所述第二和第三因素可能導致對次最優(yōu)的選擇。
發(fā)明概要本發(fā)明的示范性實施例一般地包括用于為乳房成像提供自動診斷和決策支持的系統(tǒng)和方法。更具體地說,本發(fā)明的示范性實施例包括用于乳房成像的CAD(計算機輔助診斷)系統(tǒng)和應(yīng)用程序,所述系統(tǒng)和應(yīng)用程序執(zhí)行用于從對象病人的病人信息集合(包括圖像數(shù)據(jù)和/或非圖像數(shù)據(jù))提取和分析相關(guān)特征/參數(shù)的自動方法,以便在乳房治療工作流程的各個不同的方面向內(nèi)科醫(yī)生提供自動協(xié)助。例如,CAD系統(tǒng)可以提供乳房癌及其他有關(guān)狀態(tài)的自動診斷、在對象病人患有乳房癌和/或?qū)頃l(fā)展為乳房癌的風險方面提供評定,及其他自動的決策支持功能,以便協(xié)助內(nèi)科醫(yī)生根據(jù)病人的當前狀態(tài)確定有效的保健或診斷或治療途徑。
在本發(fā)明其它示范性實施例中,用于乳房成像的CAD系統(tǒng)和方法實現(xiàn)機器學習技術(shù),所述機器學習技術(shù)使用從一個或多個相關(guān)臨床領(lǐng)域的以前診斷的(標記了的)病例的數(shù)據(jù)庫和/或?qū)@樣的數(shù)據(jù)的專家解釋獲得的(學習的)訓練數(shù)據(jù),以便允許所述CAD系統(tǒng)″學習″適當和準確地分析病人數(shù)據(jù)并作出適當?shù)脑\斷和/或治療評定和判斷,以便協(xié)助內(nèi)科醫(yī)生的工作流程。
以下將描述本發(fā)明的這些及其他示范性實施例、特征和優(yōu)點,或者從結(jié)合附圖閱讀的對示范性實施例的以下詳細說明中將明白本發(fā)明的這些及其他示范性實施例、特征和優(yōu)點。
附圖的簡短說明
圖1是系統(tǒng)的方框示意圖,用于為按照本發(fā)明的一個示范性實施例的乳房成像提供自動診斷和決策支持;圖2是系統(tǒng)的方框示意圖,用于為按照本發(fā)明的另一個示范性實施例的乳房成像提供自動診斷和決策支持;圖3是系統(tǒng)的方框示意圖,用于為按照本發(fā)明的另一個示范性實施例的乳房成像提供自動診斷和決策支持;圖4是系統(tǒng)的方框示意圖,用于為按照本發(fā)明的另一個示范性實施例的乳房成像提供自動診斷和決策支持;圖5是示范性示意圖,舉例說明按照本發(fā)明的一個示范性實施例的分類方法。
示范性實施例的詳細說明一般說來,下面描述的本發(fā)明的示范性實施例包括用于為乳房成像提供自動診斷和決策支持的系統(tǒng)和方法。更具體地說,本發(fā)明的示范性實施例,如下面參照圖1-4描述的,例如,包括CAD(計算機輔助診斷)系統(tǒng)和用于乳房成像的應(yīng)用程序,這些系統(tǒng)和應(yīng)用程序?qū)崿F(xiàn)用于從對象病人的一組病人信息(包括圖像數(shù)據(jù)和/或非圖像數(shù)據(jù))提取和分析相關(guān)特征/參數(shù)的自動方法,以便在內(nèi)科醫(yī)生工作流程的不同方面向內(nèi)科醫(yī)生提供自動協(xié)助,例如,在內(nèi)科醫(yī)生工作流程中在關(guān)系到病人保健或診斷途徑和/或治療途徑方面必須作出決策的不同的方面向內(nèi)科醫(yī)生提供自動協(xié)助。已經(jīng)研發(fā)了不同的方法,試圖只利用來自圖像的信息向內(nèi)科醫(yī)生提供決策支持。但是,這些技術(shù)忽略這樣的事實,即,在以非圖像數(shù)據(jù)的形式的病人記錄中包含數(shù)量巨大的信息。如在下面詳細描述的,有利的是,按照本發(fā)明的示范性實施例的CAD系統(tǒng)和方法提供同時結(jié)合了成像的和非成像的數(shù)據(jù)的自動決策支持方法。這里,采用非成像的數(shù)據(jù),以便包括在圖像以外的病人記錄找到的全部信息,可以包括(但不限于)人口統(tǒng)計數(shù)據(jù)、病歷和物理的信息、內(nèi)科醫(yī)生記錄、試驗室結(jié)果、血液測試結(jié)果、蛋白代謝(proteomic)分析和遺傳檢定結(jié)果。例如,乳房成像的特定病例,發(fā)現(xiàn)了相同的圖像疑點的兩個婦女可能接受不同的治療,例如,若一個病人是年輕的婦女,沒有癌癥病歷或風險因素,而同時另一個病人是過了中年的曾經(jīng)作過乳房癌遺傳處理(諸如存在BRCA基因)和已知的乳房癌家族史的婦女。結(jié)合臨床和成像信息可以為內(nèi)科醫(yī)生提供最有價值的協(xié)助。
例如,給定一組為給定病人收集的信息,按照本發(fā)明的示范性實施例的CAD系統(tǒng)可以從這樣的病人信息提取和分析相關(guān)特征,以便自動地評定病人的當前狀態(tài)(例如,給定病歷、年齡等,診斷為一種疾病的幾率和置信度或患有特定疾病的可能性);自動地確定哪些附加的測試或特征(有的話)對提高診斷的置信度將是有用的;以及否則,在內(nèi)科醫(yī)生工作流程的其它方面向內(nèi)科醫(yī)生提供決策支持。
按照本發(fā)明的示范性CAD系統(tǒng)和應(yīng)用實現(xiàn)機器學習技術(shù),使用從在一個或多個相關(guān)臨床領(lǐng)域標記了的病例的數(shù)據(jù)庫和/或?qū)<覍@樣的數(shù)據(jù)的解釋獲得(學習)的訓練數(shù)據(jù),使得CAD系統(tǒng)能夠″學習″適當和準確地分析病人數(shù)據(jù),并協(xié)助內(nèi)科醫(yī)生工作流程作出適當?shù)脑\斷評定和決策。例如,在乳房成像乳房癌診斷方面,下面描述的示范性CAD系統(tǒng)可以進行″學習″,以便在乳房癌的篩選、診斷和/或腫瘤分類方面提供適當?shù)脑u定。為了舉例說明的目的,本發(fā)明的示范性實施例將特別參照乳房成像和乳房治療的內(nèi)科醫(yī)生工作流程進行描述。但是,應(yīng)當明白,本發(fā)明不限于任何特定的醫(yī)療領(lǐng)域。而是本發(fā)明可以更一般地應(yīng)用于任何醫(yī)療實踐領(lǐng)域,其中內(nèi)科醫(yī)生工作流程要求內(nèi)科醫(yī)生確定或評定病人的當前狀態(tài)并確定工作流程途徑,所述工作流程途徑將導致更準確地評定病人的當前狀態(tài),以便提供適當?shù)闹委?。本專業(yè)的普通技術(shù)人員將容易理解,按照本發(fā)明的示范性實施例的CAD系統(tǒng)提供協(xié)助內(nèi)科醫(yī)生工作流程的強大的工具。
應(yīng)當明白,這里描述的按照本發(fā)明的系統(tǒng)和方法可以以不同形式的硬件、軟件、固件、專用處理器或其組合實現(xiàn)。在本發(fā)明的一個示范性實施例中,這里描述的系統(tǒng)和方法是以作為應(yīng)用程序的軟件實現(xiàn)的,包括有形地包含在一個或多個程序存儲裝置(例如,軟盤、RAM、CDROM、DVD、ROM和閃存存儲器)上,并可通過包括適當?shù)捏w系結(jié)構(gòu)的任何裝置或機器執(zhí)行的程序指令。
還應(yīng)當明白,因為附圖中描繪的組成系統(tǒng)模塊和方法步驟,可以用軟件實現(xiàn),所以系統(tǒng)部件(或處理步驟的流程)之間的實際連接可以因應(yīng)用程序編程方式而不同。按照這里的教導,本專業(yè)普通技術(shù)人員能夠設(shè)計本發(fā)明的這些和類似的實現(xiàn)方案或配置。
圖1是按照本發(fā)明的示范性實施例的用于為乳房成像提供自動診斷和決策支持的系統(tǒng)的高層方框示意圖。更具體地說,圖1舉例說明CAD(計算機輔助診斷)系統(tǒng)(10),它實現(xiàn)用于分析對象病人的不同類型的病人信息(1)和(2),以便提供診斷評定和建議及其他決策支持的方法,以便在內(nèi)科醫(yī)生對所述對象病人的工作流程的不同方面協(xié)助內(nèi)科醫(yī)生。CAD系統(tǒng)(10)使用機器學習方法,使CAD系統(tǒng)(10)能夠連續(xù)學習分析病人信息(1,2)和連續(xù)提供更準確的診斷評定和/或判斷,以便在工作流程上協(xié)助內(nèi)科醫(yī)生。
CAD系統(tǒng)(10)的輸入包括不同的病人信息源,包括一個或多個成像形態(tài)的圖像數(shù)據(jù)(1)(例如,超聲圖像數(shù)據(jù)、乳房X線攝影、MRI等)和來自不同結(jié)構(gòu)的和/或非結(jié)構(gòu)的數(shù)據(jù)源的非圖像數(shù)據(jù)(2),包括在病人治療過程中收集的臨床數(shù)據(jù)及其他信息,諸如病史、家族史、人口統(tǒng)計信息、財政信息和任何其它有關(guān)的病人信息。CAD系統(tǒng)(10)實現(xiàn)用于從圖像數(shù)據(jù)(1)和非圖像數(shù)據(jù)(2)自動提取信息(特征)和以這樣一種方式結(jié)合所述提取的信息,使之適用于CAD系統(tǒng)(10)分析的方法。取決于由CAD系統(tǒng)(10)支持的診斷和決策支持功能,CAD系統(tǒng)(10),可以產(chǎn)生一個或多個輸出(11)、(12)和/或(13)。如下面解釋的,這些輸出可以在乳房癌的篩選、診斷和腫瘤分類方面提供內(nèi)科醫(yī)生工作流程協(xié)助。
在本發(fā)明的另一個示范性實施例中,CAD系統(tǒng)(10)可以從圖像數(shù)據(jù)(1)和(任選地)非圖像數(shù)據(jù)(2)提取和分析信息,以便自動地產(chǎn)生和輸出診斷(11)的幾率和(任選地)置信度,或者作為另一方案,輸出建議的治療,帶有所建議的治療的效果的幾率和(任選地)置信度,例如,所建議的治療將具有所需(有利的)效果的幾率??偲饋碚f,輸出(11)在本文中可以稱作″建議的幾率和置信度″。
更具體地說,舉例來說,為了診斷乳房癌的目的,CAD系統(tǒng)(10)可以包括自動地檢測和診斷(10)(或者表征)乳房組織中的懷疑的乳房損害,并例如輸出這樣的損害是惡性的幾率,連同這樣的診斷的任選的置信度。在所述示例中,CAD系統(tǒng)(10)可以從病人的篩選乳房X射線照片(圖像數(shù)據(jù))和臨床病歷信息(非圖像數(shù)據(jù))提取和分析相關(guān)特征,并提供惡性的當前估計和置信度。
作為另一方案,對于已知患有乳房癌的病人,例如,CAD系統(tǒng)(10)可以建議一種治療過程,在所述情況下,幾率和置信度(11)是指所述治療會帶來所需(有利的)效果的可能性,其范圍從病人治愈乳房癌到其唯一目的將是改善晚期乳房癌病人的生活品質(zhì)的純緩和性治療。更具體地說,CAD系統(tǒng)(10)除建議治療以外,還可以自動地提供所述治療將具有確定結(jié)局的幾率和/或置信度,并可能提供所述治療不具有確定的有害作用,諸如副作用的幾率和/或置信度。所述幾率可以指定為有利的和有害的可能結(jié)局上的分布,或在將來一個或多個時刻在有利的和有害的兩個可能結(jié)局上的一組分布,或?qū)聿煌臅r間可能的結(jié)局上的隨時間而改變的分布等。
在本發(fā)明的另一個示范性實施例中,CAD系統(tǒng)(10)可以自動地確定和指定一個或多個附加的測試、測量特征,若進行/獲得的話,則可能提高診斷的置信度(亦即,靈敏度分析)。例如,CAD系統(tǒng)(10)可以為每一個附加的測試、測量或特征確定和輸出″得分″(12),它提供會提高CAD系統(tǒng)(10)確定的評定或診斷的置信度的特定的成像形態(tài)或特征在潛在的有效性方面的某些量度或征兆。例如,假定CAD系統(tǒng)(10)從病人的篩選乳房X射線照片(圖像數(shù)據(jù))和臨床病歷信息(非圖像數(shù)據(jù))提取和分析相關(guān)特征,并提供檢測出來的損害是惡性的當前估計和置信度,CAD系統(tǒng)(10)可以進一步指出哪一種或多種成像形態(tài)最可能提供最大量附加信息,這些信息在確定所述損害是惡性還是良性方面將是有用的,或確定癌的范圍(腫瘤分類),或在已知患有乳房癌的病人做決定時,例如,在進行外科手術(shù)、放射治療、化學治療、激素治療或其組合(所謂″雞尾酒″治療)之間做出決定是最有用的。
在本發(fā)明的另一個示范性實施例中,CAD系統(tǒng)(10)可以識別和輸出(通過顯示或列出)一個或多個類似于當前病例(13)的示范性病例研究。例如,如上面指出和下面更詳細說明的,CAD系統(tǒng)(10)可以包括以前標記了的(診斷過的)病例的數(shù)據(jù)庫(或文庫),并且根據(jù)從輸入到CAD系統(tǒng)(10)的關(guān)于所述對象病人的病人信息提取的特征,CAD系統(tǒng)(10)可以為進行診斷協(xié)助而從所述文庫搜索和顯示最適當?shù)牟±?。換句話說,CAD系統(tǒng)(10)可以利用自動地提取的特征從所述訓練組提供一組類似的病例。
應(yīng)當理解,CAD系統(tǒng)(10)在內(nèi)科醫(yī)生工作流程的環(huán)境下顯示類似的病例的功能可以向所述內(nèi)科醫(yī)生提供重大的協(xié)助。例如,顯示類似的病例可以為沒有經(jīng)驗的用戶提供訓練。確實,新手用戶可以檢查其它病例,以便確定或者理解所述病例為何這樣說明的基礎(chǔ)或原因。另外,顯示類似的病例可以為有經(jīng)驗的用戶提供一種手段來確認CAD系統(tǒng)(10)的診斷結(jié)果。確實,除對于給定的狀態(tài)的診斷幾率以外,CAD系統(tǒng)(10)還可以顯示類似的病例,以便證明它的評定。另外,顯示類似的病例使評定預(yù)后和治療成為可能。更具體地說,通過研究類似的病例來看看其它病人對不同的治療選項如何響應(yīng),內(nèi)科醫(yī)生可以開始評定這些選項對于當前病人的功效。
鑒于上述,可以一般地把CAD系統(tǒng)(10)看作是一種自動系統(tǒng)、它可以通過提供病人當前狀態(tài)的評定(特定的疾病可能性的幾率)協(xié)助內(nèi)科醫(yī)生工作流程,并為對象病人(識別附加的測試(或特征))確定下一個最佳的健康治療或可以獲得的很可能減輕所述評定歧義性的診斷途徑。如上面指出的,應(yīng)當理解,CAD系統(tǒng)(10)實現(xiàn)一個或多個機器學習方法,以此學習所述信息,并通過在CAD系統(tǒng)(10)的訓練組中收集的數(shù)據(jù)來驅(qū)動決策。具體地說,如上面指出的,CAD系統(tǒng)(10)可以包括示范性診斷病例的文庫,由此獲得訓練數(shù)據(jù)來教會CAD系統(tǒng)(10)。與″專家系統(tǒng)″形成對照,后者是從一組專家口授規(guī)則并翻譯成代碼而研發(fā)和衍生的,CAD系統(tǒng)(10)學會提供準確的診斷決策,并根據(jù)從診斷病例學習的或從專門知識學習的訓練數(shù)據(jù)提供決策支持。
應(yīng)當理解,CAD系統(tǒng)(10)可以實現(xiàn)不同的機器學習方法。例如,CAD系統(tǒng)(10)可以使用2003年6月11目提交的題為″根據(jù)上下文信息進行實時特征靈敏度分析的系統(tǒng)和方法″的Zhou等人的美國專利申請序號10/702,984中描述的系統(tǒng)和方法,來確定哪些測試或特征對減少診斷的歧義性可能是最適當?shù)模錾暾埵枪餐D(zhuǎn)讓的并附此作參考。實質(zhì)上,Zhou的方法將建立處理模型,并確定每一個特征在減少歧義性方面的相對重要性。在這里可以實現(xiàn)這樣的方法,由此可以以一組一個或多個特征的形式來描述每一個成像形態(tài)或診斷途徑。然后,Zhou所描述的方法將用來確定哪些特征在診斷或評定的置信度方面很可能提供最大的改善。在CAD系統(tǒng)(10)中可以實現(xiàn)從大型病例訓練組學習的其它機器學習技術(shù)。例如,可以使用不同的機器學習技術(shù),諸如判決樹、SVM、神經(jīng)網(wǎng)絡(luò)或Bayesian網(wǎng)絡(luò)、或例如,結(jié)合這樣的多種方法的總體方法。或者,可以定義或訓練基于模型的算法,所述算法根據(jù)例如與特定類型的損害有關(guān)的不同因素的因果知識,例如專門檢測某些類型的損害。
應(yīng)當理解,即使在不存在可以用來描述這樣的判斷的各種特征或信息的情況下,CAD系統(tǒng)(10)也可以提供適當?shù)臎Q策支持。例如,若病人的病歷只包含篩選乳房X射線照片和有關(guān)病人人口統(tǒng)計信息(例如,年齡和種族),但是沒有臨床或家族信息,則CAD系統(tǒng)(10)能夠連同下一步應(yīng)該完成什么測試或程序的最佳的估計一起提供診斷的幾率和置信度。在這種情況下,所述推薦的程序甚至可以是采集病人的家族信息。當然,若提供更多信息,將改善系統(tǒng)的置信度。作為一個極端,考察給定的病人根本沒有信息的情況。在所述實例中,CAD系統(tǒng)(10)應(yīng)該可以向內(nèi)科醫(yī)生提供對病人采取初始的步驟的某些引導。在所述決策支持系統(tǒng)中可以使用于缺失/有噪音的數(shù)據(jù)學習和/或完成推理的不同的方法。
應(yīng)當理解,上述方法可以擴展到提供醫(yī)療狀態(tài)諸如乳房癌的自動篩選。在美國,當前有人提出建議,年齡在40以上的全部婦女都要逐年利用乳房X線攝影進行篩選。因為在乳房癌診斷的情況下,已經(jīng)在文獻中研究自動地用乳房X射線照片評定所述風險。在這方面,對于特定群體的子集或?qū)τ谠谒齻兊脑\斷乳房X射線照片有某些特定的發(fā)現(xiàn)的婦女,MRI或超聲波可能是較好的篩選工具。另外,對于某些婦女,在她們壽命的當前時刻發(fā)展乳房癌的風險可以是這樣小,以致于甚至可能不值得冒經(jīng)受電離化輻射的風險或成本去進行篩選。
相應(yīng)地,CAD系統(tǒng)(10)可以配置成作出決定,鑒于病人的臨床和家族史,在病人患有(或可能發(fā)展為)乳房癌的可能性方面,以及為了進一步診斷應(yīng)該給予所述病人什么篩選測試(若有)以便最佳地檢測可疑的損害或癌癥的風險。在所述病史過程中的任何一刻,例如,第一次篩選檢查之后或多次篩選和MRI測試之后,還可以推論出來這種可能性。利用上面描述的訓練組和利用機器學習技術(shù)可以做出這樣的決定。另外,對于篩選,CAD系統(tǒng)(10)可以產(chǎn)生和輸出上面討論的決策,包括疾病的可能性、來自訓練組的典型病例和對給定的病人將是最優(yōu)的篩選測試。在這種情況下,在篩選測試方面的決定可以是最感興趣的。確實,對于這樣的決定,篩選乳房X射線照片對分類可能不是有效的。另外,可能不必進行所述對比來糾正病人的診斷,而是糾正乳房可疑損害的識別,或乳房癌的風險足以保證進一步診斷測試。
在本發(fā)明的另一個示范性實施例中,CAD系統(tǒng)(10)可以在關(guān)于腫瘤治療的腫瘤分類的乳房成像方面提供協(xié)助。一般,腫瘤分類腫瘤分類處理涉及精確地確定損害的位置,并確定損害是單病灶還是多病灶。按照本發(fā)明的示范性實施例,給定從篩選和/或診斷測試獲得有關(guān)損害的信息,CAD系統(tǒng)(10)可以學習決定應(yīng)該用哪些測試來對損害進行腫瘤分類。例如,在一個訓練組中,從不同的形態(tài)腫瘤分類的結(jié)果可以和治療或跟蹤診視過程中實際發(fā)現(xiàn)的結(jié)果進行對比。相應(yīng)地,上面描述的機器學習方法可以用來使CAD系統(tǒng)(10)″學習″適當?shù)靥幚斫o定的病人的腫瘤分類。來自訓練組的典型病例也可以潛在地表明所述腫瘤分類的結(jié)果,或許甚至對于病人治療之后的帶有″類似的″病例的預(yù)后。
上面參照圖1討論的示范性CAD系統(tǒng)和方法為開發(fā)CAD系統(tǒng)提供一般的框架,所述系統(tǒng)可以支持一個或多個成像形態(tài)并在內(nèi)科醫(yī)生工作流程的不同方面提供協(xié)助而提供一個或多個功能?,F(xiàn)將參照圖2、3和4討論基于圖1框架的按照本發(fā)明的CAD系統(tǒng)和方法的示范性實施例,例如,用于在乳房成像內(nèi)科醫(yī)生工作流程上提供協(xié)助。圖2和3的示范性實施例描繪用于乳房成像的一個或多個超聲波成像形態(tài)的CAD系統(tǒng)和方法。圖4是CAD系統(tǒng)的示范性實施例,包括圖2和3的系統(tǒng),并提供其他功能,使多方式CAD系統(tǒng)可以使用于多個成像形態(tài)中的不同的乳房成像。
現(xiàn)參見圖2,方框示意圖舉例說明按照本發(fā)明另一個示范性實施例的用于為乳房成像提供自動診斷和決策支持的系統(tǒng)。具體地說,圖2的CAD系統(tǒng)(20)舉例說明用于實現(xiàn)圖1的CAD系統(tǒng)(10)的一個或多個示范性框架,用于支持超聲波(B型分析)乳房成像。一般,CAD系統(tǒng)(20)包括數(shù)據(jù)處理系統(tǒng)(21),數(shù)據(jù)處理系統(tǒng)(21)包括特征提取模塊(22)、特征組合模塊(23)、分類模塊(24)、診斷/工作流程協(xié)助模塊(25)和自動檢測模塊(29)。
自動檢測模塊(29)實現(xiàn)乳房組織超聲圖像數(shù)據(jù)(3)處理方法,以便在所述成像的乳房組織中檢測和分段潛在的損害。更具體地說,自動檢測模塊(29)實現(xiàn)一個或多個處理超聲圖像數(shù)據(jù)(3)以便自動地檢測損害及其他異常的解剖學結(jié)構(gòu),諸如乳房組織中的微量鈣化或腫塊等的傳統(tǒng)的方法。自動檢測模塊(29)自動地檢測和標記圖像數(shù)據(jù)中感興趣的特征區(qū)域,所述感興趣的特征區(qū)域被標識為潛在的損害、異常、疾病狀態(tài)等。
特征提取模塊(22)實現(xiàn)用于從超聲圖像數(shù)據(jù)(3)及其他病人非圖像數(shù)據(jù)源(4),諸如臨床、家族、病歷數(shù)據(jù)等提取相關(guān)參數(shù)的不同的方法(22-1,22-2,22-3,22-4),諸如下文中更詳細描述的,可以用來提供自動診斷和決策支持功能。特征組合模塊(23)以這樣的方式把所術(shù)提取的特征組合在一起,使之適合于輸入到分類模塊(24)供分析。
分類模塊(24)包括分類方法(24-1)(或分類引擎),后者利用一個或多個受過訓練的/通過建模器(24-2)動態(tài)適應(yīng)的分類模型分析所述組合的提取的參數(shù),以便產(chǎn)生用于提供診斷和決策支持的信息。診斷/工作流程協(xié)助模塊(25)包括一個或多個方法,用于實現(xiàn)諸如上面參照圖1所描述的功能(例如,提供診斷、提供一組類似于當前病例的病例、提供表示在改善診斷的置信度上很可能有好處的附加的測試或特征的得分等)。
CAD系統(tǒng)(20)還包括用戶接口(26)(例如,顯示在帶有鍵盤和鼠標輸入裝置的計算機監(jiān)視器上的圖形用戶接口),它使用戶選擇一個或多個所述診斷/工作流程協(xié)助模塊(25)支持的功能成為可能,并使系統(tǒng)向用戶再現(xiàn)和提供當前的處理結(jié)果成為可能。如下面描述的,可以用按照本發(fā)明的示范性實施例的一個或多個不同的方法,再現(xiàn)所述處理的結(jié)果并提供給用戶。
CAD系統(tǒng)(20)還包括倉庫(27),它保存從不同的來源衍生的信息的臨床領(lǐng)域知識庫。例如,臨床領(lǐng)域知識(27)可以包括從經(jīng)過分析/標記的病例(28)學習或自動地提取的與CAD系統(tǒng)(20)所支持的臨床領(lǐng)域有關(guān)的大型數(shù)據(jù)庫。臨床領(lǐng)域知識(27)可以包括由專家通過分析以前的斷言直接輸入的專家臨床知識,或與醫(yī)療團體或保險公司相聯(lián)系的規(guī)則/條例/指導方針有關(guān)的在所支持的臨床領(lǐng)域方面的信息。如下面詳細說明的,在倉庫(27)中的臨床領(lǐng)域知識可以通過數(shù)據(jù)處理系統(tǒng)(21)的不同方法(22,23,24和25)使用。
特征提取模塊(22)包括各種不同的方法,以便提取與所述超聲圖像數(shù)據(jù)的″檢測出來″區(qū)域相聯(lián)系的參數(shù),可以用來診斷潛在癌組織。這樣的特征包括與針刺狀(22-1)、聲影區(qū)(22-2)、高度/深度比率(22-3)和/或可以用來自動地分類乳房組織中的損害或異常的其它可能的圖像參數(shù)相聯(lián)系的參數(shù)。
在本發(fā)明其它示范性實施例中,數(shù)據(jù)處理系統(tǒng)(21)提取和分析來自對象病人的病人非圖像數(shù)據(jù)記錄(4)的相關(guān)參數(shù),后者可以與所述提取的圖像參數(shù)(22-1,22-3,22-3)配合使用,以便提供自動診斷。病人數(shù)據(jù)(4)可以包括來自多個結(jié)構(gòu)的和非結(jié)構(gòu)的數(shù)據(jù)源的在病人治療過程中收集的病人信息。一般,結(jié)構(gòu)的數(shù)據(jù)源包括例如財政(發(fā)票)、實驗室和藥房數(shù)據(jù)庫,其中病人信息一般保存在數(shù)據(jù)庫表中。非結(jié)構(gòu)的數(shù)據(jù)源例如包括波形數(shù)據(jù)、基于實驗室測試結(jié)果文檔的自由文本、醫(yī)生進展記錄、有關(guān)醫(yī)療程序的細節(jié)、處方藥物信息、放射性報告及其他專家報告。
病人非圖像數(shù)據(jù)(4)可以包括指示患有乳房癌的個人的數(shù)量龐大的有用數(shù)據(jù),或指示高度可能發(fā)展為乳房癌的個人的病歷。舉例來說,這樣的臨床信息可以在病歷和物理記錄中找到,其中關(guān)于個人以前已經(jīng)診斷為患有乳房癌的內(nèi)科醫(yī)生記錄。其它征兆,諸如乳房癌的家族史、抽煙的歷史、年齡、性別等也可以用來評定發(fā)展為或患有乳房癌的風險。相應(yīng)地,特征提取模塊(22)包括一個或多個數(shù)據(jù)提取方法(22-4),用于從病人非圖像數(shù)據(jù)(4)提取可能與檢定或診斷醫(yī)療狀態(tài)相關(guān)的病人數(shù)據(jù)。
應(yīng)當理解,任何適用的數(shù)據(jù)分析/數(shù)據(jù)挖掘方法都可以通過提取模塊(22-4)實現(xiàn),用于從病人數(shù)據(jù)(4)中提取相關(guān)參數(shù)。在本發(fā)明的一個示范性實施例中,病人數(shù)據(jù)提取方法(22-4)和特征組合方法(23)可以利用在共同轉(zhuǎn)讓和共同未決的2002年11月4目提交的題為″病人數(shù)據(jù)挖掘″的美國專利申請序號10/287,055中描述的數(shù)據(jù)挖掘方法和特征組合方法實現(xiàn),所述臨時申請要求2001年11月2目提交的美國臨時申請序號60/335,542的優(yōu)先級,此兩申請均全文附此作參考。簡而言之,美國專利序號10/287,055描述了數(shù)據(jù)挖掘方法,它利用包含在知識庫(例如,倉庫(27))的指定領(lǐng)域知識從臨床數(shù)據(jù)記錄提取相關(guān)信息,所述倉庫表達為有關(guān)所述病人在特定的時間(稱作元素(element))的概率性斷言,并在給定時段把涉及同一變量(領(lǐng)域特定判據(jù))的全部元素組合在一起,以便形成關(guān)于所述變量的單一的統(tǒng)一的概率性斷言。
在圖2的示范性實施例中,如上面指出的,數(shù)據(jù)處理系統(tǒng)(21)使用保存在倉庫(27)中的臨床領(lǐng)域知識數(shù)據(jù)來執(zhí)行特征提取(22)、特征組合(23)和模型構(gòu)建(24-2)的各種不同的方法。指定領(lǐng)域知識庫(27)可以包括指定疾病的領(lǐng)域知識。例如,指定疾病的領(lǐng)域知識可以包括影響疾病風險、疾病進展信息、復(fù)雜情況信息、與疾病有關(guān)的結(jié)局和變量、與疾病有關(guān)的測量和由醫(yī)療團體,諸如美國放射學家學會(ACR)建立的政策和指導方針。指定領(lǐng)域知識庫(27)還可以包括機構(gòu)專門領(lǐng)域知識。例如,這可以包括有關(guān)特定的醫(yī)院可用數(shù)據(jù)、醫(yī)院的文檔結(jié)構(gòu)、醫(yī)院的政策、醫(yī)院的指導方針和醫(yī)院的任何變動的信息。
臨床領(lǐng)域知識庫(27)可以從不同的來源衍生。例如,臨床領(lǐng)域知識庫(27)可以包括從經(jīng)過分析/標記的病例(28)的大型數(shù)據(jù)庫學習的知識。另外,臨床領(lǐng)域知識庫(27)可以包括專家從分析以前的斷言輸入的知識或例如,從保險公司公開的規(guī)則和條例輸入的知識。領(lǐng)域知識庫(27)中的數(shù)據(jù)可以編碼為一種輸入或作為產(chǎn)生所述系統(tǒng)可以理解的信息的程序。如上面指出的,領(lǐng)域?qū)<覕?shù)據(jù)可以通過從領(lǐng)域?qū)<依眠m當?shù)挠脩艚涌谑謩虞斎氆@得,或所述領(lǐng)域?qū)<覕?shù)據(jù)可以是自動地或通過編程輸入。
提取模塊(22-4)可以使用領(lǐng)域知識庫(27)中的相關(guān)數(shù)據(jù),提取相關(guān)參數(shù)并產(chǎn)生有關(guān)所述病人與某一時刻或時段有關(guān)的概率性斷言(元素)。提取過程所需要的領(lǐng)域知識一般是每一個來源特定的。例如,從文本來源的提取過程可以通過短語識別來進行,其中提供規(guī)則清單,指定感興趣的短語和可以由此抽取的推理。例如,若在醫(yī)生的記錄中有表述帶有″在左乳房有損害的跡象″的字樣,則為了從所述句子推斷病人患有或可能患有乳房癌,可以規(guī)定規(guī)則,指導所述系統(tǒng)查看詞組″損害″,若找到,則斷言病人以某個置信度可能患有乳房癌。從數(shù)據(jù)庫來源進行的提取過程可以通過查詢所述來源中的表進行,在所述情況下,所述領(lǐng)域知識需要對在數(shù)據(jù)庫的哪一個字段存在什么信息進行編碼。另一方面,所述提取處理過程可以涉及計算包含在數(shù)據(jù)庫中的復(fù)雜的信息函數(shù),在這種情況下,領(lǐng)域知識可以用程序的形式提供,所述程序進行這種計算,其輸出可以饋送到系統(tǒng)的余下部分。
由特征組合模塊(23)實現(xiàn)的方法可以是上面所附的專利申請所描述的方法。例如,特征組合方法可以從潛在沖突的斷言從同一/不同的來源產(chǎn)生每一個變量在給定時刻的統(tǒng)一的視圖。在本發(fā)明的不同的實施例中,這是利用在由所述元素表達的變量的統(tǒng)計方面的領(lǐng)域知識完成的。
建模器(24-2)建立由分類方法(24-1)實現(xiàn)的分類模型,它是受過訓練的(和可能動態(tài)地優(yōu)化的),以便分析所述提取的不同特征并提供診斷協(xié)助和在不同的水平上進行評定,依所述實現(xiàn)方案而定。應(yīng)當理解,所述分類模型可以是″黑匣子″,它不能向用戶解釋它們的預(yù)測(例如,若分類程序是利用神經(jīng)網(wǎng)絡(luò)構(gòu)建的,則情況便是如此)。所述分類模型可以是″白匣子″,它是以人可讀的形式出現(xiàn)的(例如,若分類程序是利用判決樹構(gòu)建的,則情況便是如此)。在其他實施例中,分類模型可以是″灰匣子″,它可以部分地解釋解決方案是如何衍生的(例如,″白匣子″和″黑匣子″類型分類程序的結(jié)合)。實現(xiàn)的分類模型的類型依賴于領(lǐng)域知識數(shù)據(jù)和模型建立過程(24-2)。模型建立過程的類型將根據(jù)所實現(xiàn)的分類方案而變化,這可能包括判決樹、支持矢量機器、Bayesian網(wǎng)絡(luò)、概率性推理等,以及本專業(yè)的普通技術(shù)人員已知的其他分類方法。
建模器/更新處理(24-2)使用臨床領(lǐng)域知識庫(27)中的數(shù)據(jù)來訓練分類模型,并可能動態(tài)地更新以前受過訓練的由所述分類處理(24-1)實現(xiàn)的分類模型。在本發(fā)明的一個示范性實施例中,″離線″實現(xiàn)建模器/更新處理(24-2),用于建立/訓練分類模型,所述分類模型進行學習,以便為工作流程協(xié)助而提供適當?shù)脑\斷評定和決策。在本發(fā)明的另一個示范性實施例中,建模器/更新處理(24-2)使用″連續(xù)″學習方法,它可以使用倉庫(27)中的領(lǐng)域知識數(shù)據(jù),后者用從新分析的病人數(shù)據(jù)衍生的附加的學習數(shù)據(jù)更新,或者優(yōu)化與相關(guān)狀態(tài)相聯(lián)系的分類模型。有利的是,,通過使分類處理(24-1)能夠隨著時間連續(xù)改善而無需成本高昂的人工干預(yù),連續(xù)學習功能增強CAD系統(tǒng)(20)的強健性。
診斷/工作流程協(xié)助模塊(26)可以提供一個或多個診斷和決策支持,起上面參照圖1所描述的的作用。例如,診斷/工作流程協(xié)助模塊(26)可以命令分類模塊(24)來將一個或多個在超聲圖像數(shù)據(jù)(4)檢測為惡性或良性的乳房損害分類,并根據(jù)一組從超聲圖像數(shù)據(jù)(3)和/或病人非圖像數(shù)據(jù)記錄(4)提取的特征,提供這樣的診斷的幾率和(任選地)所述診斷的置信度。分類引擎(25-1)可以利用一個或多個分類模型完成這樣的分類,這些分類模型受過訓練來分析從模塊(23)輸出的組合的特征。在另一個示范性實施例中,診斷/工作流程協(xié)助模塊(25)可以命令分類模塊(24)來確定可以獲得什么附加的圖像參數(shù)或特征(例如,從B型超聲圖像數(shù)據(jù)、其它成像模式和/或非圖像數(shù)據(jù)),并進一步分析,以便提高診斷的置信度。另外,診斷/工作流程協(xié)助模塊(25)可以命令分類模塊(23)根據(jù)提取的當前所述組特征獲得和顯示(通過用戶接口)一個或多個倉庫(27)中的類似的病人的病例。
現(xiàn)參見圖3,方框示意圖舉例說明按照本發(fā)明的另一個示范性實施例用于為乳房成像提供自動診斷和決策支持的系統(tǒng)。更具體地說,圖3舉例說明CAD系統(tǒng)(30),它支持附加的超聲波成像方法(除B型分析以外),用于提供乳房組織中的乳房損害的自動診斷,例如,以及其他決策支持功能來協(xié)助內(nèi)科醫(yī)生的工作流程。在一個示范性實施例中,圖3的CAD系統(tǒng)(30)包括上面參照圖2討論的CAD系統(tǒng)(20)的自動B型分析。圖3的CAD系統(tǒng)(30)舉例說明用于圖1的CAD系統(tǒng)(10)的一個或多個示范性框架,以便支持一個或多個超聲波成像方法,例如,包括B型、造影成像、和/或應(yīng)變成像等。
更具體地說,參見圖3,CAD系統(tǒng)(30)包括數(shù)據(jù)處理系統(tǒng)(31),數(shù)據(jù)處理系統(tǒng)(31)根據(jù)從一個或多個類型的超聲圖像數(shù)據(jù)(5)和/或病人非圖像數(shù)據(jù)(6)提取的不同的參數(shù),實現(xiàn)對乳房癌的自動分類(診斷),以及其他方法,以便協(xié)助內(nèi)科醫(yī)生為特定的病人決定治療或診斷途徑。一般,數(shù)據(jù)處理系統(tǒng)(31)包括特征提取模塊(32)、特征組合模塊(33)、分類模塊(34)和診斷/工作流程協(xié)助模塊(35)。另外,CAD系統(tǒng)(30)包括用戶接口(36),它使用戶與CAD系統(tǒng)(30)交互作用成為可能,以便選擇由診斷/工作流程協(xié)助模塊(35)支持的一個或多個功能(例如,為乳房癌提供自動診斷和診斷的置信度;確定什么附加的超聲成像形態(tài)或特征(例如,從B型超聲圖像數(shù)據(jù)、其它圖像模式和/或非圖像數(shù)據(jù))可以被獲得并被進一步分析以便提高診斷置信度;根據(jù)當前一組提取的特征,獲得和顯示倉庫(38)中的一個或多個類似病人的病例)。
特征提取模塊(32)實現(xiàn)不同的方法(32-1-32-5),用于從一個或多個不同方式的超聲圖像數(shù)據(jù)(5)和病人非圖像數(shù)據(jù)(6)提取相關(guān)參數(shù),可以對所述提取的相關(guān)參數(shù)進行分析,以便如這里所討論的,提供自動診斷及其他類型的決策支持。例如,特征提取模塊(32)包括自動B型分析模塊(32-1),它例如實現(xiàn)自動檢測(29)、針刺狀(23-1)、聲影區(qū)(23-2)和H/D比率(23-3)方法,如上面在圖2的系統(tǒng)(20)中描述的。另外,特征提取模塊(32)包括用于從超聲波測量提取相關(guān)參數(shù)的方法,包括應(yīng)變和彈性圖(32-2)、利用諸如聲流式傳輸(32-3)、3D超聲波成像(32-4)等技術(shù)的液體運動、和利用諸如造影灌注(32-5)等技術(shù)的血液運動。
不同的特征提取模塊可以利用本專業(yè)的普通技術(shù)人員眾所周知的方法實現(xiàn)。例如,對于超聲波應(yīng)變/彈性圖成像,可以實現(xiàn)以下專利所描述的系統(tǒng)和方法霍爾等人″超聲彈性成像″,2003年1月21日授予的美國專利No.6,508,768;Nightingale等人,″識別和表征改變剛度的區(qū)域用的方法和設(shè)備″,2002年4月16日授予的美國專利No.6,371,912;和Von Behren等人″應(yīng)變成像顯示用的系統(tǒng)和方法″,2003年5月6日授予的美國專利No.6,558,424,用于從包括應(yīng)變和彈性圖的超聲波測量提取相關(guān)參數(shù)。
另外,如在Trahey等人″實心腫決(腫塊)和充滿液體的包囊之間區(qū)分的方法和設(shè)備″1996年1月30目授予的美國專利No.5,487,387所描述的聲流式傳輸用的系統(tǒng)和方法,可以用來提取與液體運動有關(guān)的特征。另外,造影灌注用的系統(tǒng)和方法,如在Philips等人″雙處理超聲波造影介質(zhì)成像″,2003年10月14目授予的美國專利No.6,632,177所描述的,可以使用來提取與血液運動有關(guān)的特征。應(yīng)當明白,可以實現(xiàn)其它已知的技術(shù)。
特征組合模塊(33)以這樣一種方式把一組提取的特征組合,使之適合于輸入和由分類模塊(34)分析。分類模塊(34)包括分類方法(34-1),用于利用一個或多個受過訓練的/通過建模器(34-2)動態(tài)適應(yīng)的分類模型分析所述組合的提取的參數(shù),以便提供乳房癌的自動診斷及其他決策支持功能。CAD系統(tǒng)(30)還包括倉庫(37),后者保存信息的臨床領(lǐng)域知識庫,提供由建模器(34-2)使用的訓練數(shù)據(jù)來建立/訓練由分類方法(34-1)使用的分類模型。與所述臨床領(lǐng)域或CAD系統(tǒng)(30)所支持的領(lǐng)域有關(guān)的經(jīng)過分析/標記的病例(38)的大型數(shù)據(jù)庫可以用來獲得倉庫(37)中的訓練數(shù)據(jù)。可以通過數(shù)據(jù)處理系統(tǒng)(31)的不同的方法(32,33,34和35)來使用倉庫(37)中的臨床領(lǐng)域知識。
一般,除圖3的CAD系統(tǒng)(30)提供更多支持除B型超聲波以外的不同超聲波成像方法的不同框架之外,圖3的系統(tǒng)(30)的各種不同的部件基本上類似于上面討論的圖2的CAD系統(tǒng)(20)的部件,以便允許建立更完整的用于超聲波乳房成像的CAD系統(tǒng)。應(yīng)當理解,圖3中不同的模塊(32,33,34和35)可以實現(xiàn)與上面描述的圖2的CAD系統(tǒng)(20)的那些相應(yīng)的模塊(22,23,24和25)相同的或類似的方法。但是,分類模塊(24)和(34)中的不同的方法,諸如分類和模型構(gòu)建方法,將隨著決策支持功能的類型、各自CAD系統(tǒng)(20)和(30)所支持的特征提取方法和/或成像形態(tài)而變化。另外,除知識庫(27)和(37)中的訓練數(shù)據(jù)將隨著各自CAD系統(tǒng)(20)和(30)所支持的決策支持功能、特征提取方法和/或成像形態(tài)的類型而變化之外,臨床領(lǐng)域知識庫(37)類似于圖2的知識庫(27)。
現(xiàn)參見圖4,方框示意圖舉例說明按照本發(fā)明的另一個示范性實施例的用于為乳房成像提供自動診斷和決策支持的系統(tǒng)。更具體地說,在本發(fā)明的一個示范性實施例中,圖4舉例說明CAD系統(tǒng)(40),它是示范性CAD系統(tǒng)(20)和(30)的擴展,其中CAD系統(tǒng)(40)包括CAD系統(tǒng)(20)和(30)用于超聲波乳房成像的功能和方法,另外還包含使在多個成像形態(tài)中用于乳房成像的多方式CAD成為可能的方法和功能。
參見圖4,CAD系統(tǒng)(40)包括數(shù)據(jù)處理系統(tǒng)(41),后者實現(xiàn)用于提供乳房組織中乳房損害的自動診斷的方法,并通過從不同的病人信息源(7),包括例如對象病人的一個或多個不同類型的圖像數(shù)據(jù)(例如,MRI圖像數(shù)據(jù)(7a)、超聲圖像數(shù)據(jù)(7b)、乳房X線攝影圖像數(shù)據(jù)(7c))和非圖像數(shù)據(jù),諸如遺傳和/或蛋白代謝數(shù)據(jù)(7d)和臨床、病歷和/或物理的數(shù)據(jù)(7e),提取和分析參數(shù)來提供用于診斷和/或治療途徑的決策支持,以便協(xié)助內(nèi)科醫(yī)生工作流程。
一般,數(shù)據(jù)處理系統(tǒng)(41)包括特征提取模塊(42)、特征組合模塊(43)、分類模塊(44)和診斷/工作流程協(xié)助模塊(45)。另外,CAD系統(tǒng)(40)包括用戶接口(46),后者使用戶與CAD系統(tǒng)(40)交互作用成為可能,以便選擇一個或多個診斷/工作流程協(xié)助模塊(45)支持的功能(例如,為乳房癌提供自動診斷和診斷的置信度;確定什么附加的成像形態(tài)或特征可以被獲得并被進一步分析以便提高診斷置信度;根據(jù)當前一組提取的特征,獲得和顯示倉庫中的一個或多個類似病人的病例等)。
特征提取模塊(42)實現(xiàn)用于從所支持的成像形態(tài)提取圖像參數(shù)(42-1-42-2)的″n″特征提取方法和用于從非圖像數(shù)據(jù)源提取參數(shù)的其他特征或文本提取方法(42-3,42-4)。例如,特征提取模塊(42)可以包括用于從各種不同類型的超聲數(shù)據(jù)(如以上參考圖2和圖3所討論的)和其他成像形態(tài)提取和分析圖像參數(shù)的方法。特征組合模塊(43)把一組所提取的特征以這樣一種方式組合,即,使之適用于分類模塊(44)的輸入和分析。分類模塊(44)包括分類方法(44-1),以便利用受過訓練的/通過建模器(44-2)動態(tài)適應(yīng)的一個或多個分類模型分析組合的提取的參數(shù),以便提供各種決策支持功能。CAD系統(tǒng)(40)還包括倉庫(47),后者維持提供建模器(44-2)使用的訓練數(shù)據(jù)的臨床領(lǐng)域信息知識庫,以便構(gòu)建/訓練由分類方法(44-1)使用的分類模型。與CAD系統(tǒng)(40)所支持的一個或多個臨床領(lǐng)域有關(guān)的經(jīng)過分析/標記的病例的大型數(shù)據(jù)庫(48),可以用來獲得存儲在倉庫(47)中的訓練數(shù)據(jù)。倉庫(47)中的臨床領(lǐng)域知識可以通過數(shù)據(jù)處理系統(tǒng)(41)的不同的方法(42,43,44和45)使用。
應(yīng)當理解,圖4中的不同的模塊(42,43,44和45)可以實現(xiàn)與圖2的CAD系統(tǒng)(20)那些相應(yīng)的模塊(22,23,24和25)和/或圖3的CAD系統(tǒng)(30)的相應(yīng)的模塊(32,33,34和35)的相同或類似的方法,如上面描述的。但是,各種不同的方法,諸如分類模塊(44)的分類和模型構(gòu)建方法將會根據(jù)CAD系統(tǒng)(40)所支持的判斷支持功能的類型、特征提取方法和/或圖像形態(tài)而變化。另外,除了知識庫(47)中的訓練數(shù)據(jù)將會根據(jù)CAD系統(tǒng)(40)所支持的判斷支持功能的類型、特征提取方法和/或圖像形態(tài)而變化以外,臨床領(lǐng)域知識庫(47)類似于圖2和3的知識庫(27)和(37)。
現(xiàn)將參照圖5的示范性節(jié)點的示意圖描述按照本發(fā)明的示范性實施例用于評定診斷乳房癌的附加測試的可能價值的各種不同的機器學習方法。對于這些示范性實施例,假設(shè)訓練組由m個病例構(gòu)成并且每一個病例由n個從以前完成的測試中提取的特征構(gòu)成。每一種情況Ci(i=1,...,m)可以表達為特征矢量(f1,f2,...,fn)。
還假定,對于每一種情況Ci,實際的診斷(di)都是
而且有k個變量與在所述病人身上完成的不同的測試(Ti1,Ti2,Ti3,Ti4)對應(yīng),其中k個變量中的每一個都取集合{0,1}中的值,而且其中若所述相應(yīng)的測試就實際的診斷di而言預(yù)測正確,則k=1,否則,k=0。
另外,假定這樣的以前的信息是從訓練數(shù)據(jù)提取的,其中,基于示范性機器學習過程的下面描述的方法可以用來預(yù)測哪些測試將根據(jù)從病人的病史提取特征矢量提供準確的診斷。
在一個示范性實施例中,一種方法如下。首先,這樣確定來自特征空間的映射M為{(P1,P2,P3,P4)/Pi∈{0,1},使得對于每一個Ci,有M(Ci)=M(f1,f2,...,fn)=(Ti1,Ti2,Ti3,Ti4)。如圖5舉例說明的,所述處理利用人工神經(jīng)網(wǎng)絡(luò)技術(shù)完成。對于每一個新病人,映射M將提供描述向所述病人推薦的測試的相應(yīng)的二元輸出。
所述問題還可以看作是多病例分類問題,其中對于每一個病例C1,按照哪個測試給出正確的診斷來定義它的標記。例如,一個可能的方法如下。對于每一個測試,按照所述測試對于所述病例的準確性來標記全部訓練病例。然后,利用任何二元分類算法(例如,SVMs、判決框架、Bayesian網(wǎng)絡(luò)等)來訓練四個分類程序(每個測試一個)。當考慮新病人時,用所述四個分類程序測試所述病人的數(shù)據(jù),以便預(yù)測哪些測試將給出正確的診斷。
應(yīng)該指出,采用上述兩種方法時所述處理的結(jié)果可以是超過一個的測試。
另一個示范性方法如下。假定在訓練組中有m個病例。將利用以上描述的n種特征把新的病例與這m個病例對比。根據(jù)所述對比,選定最″類似″于當前病例的p個病例,其中相似性可以用各種不同的方法中的一種方法定義。例如,一種方法要考察n維特征空間中的歐幾里得距離。還可以使用其它眾所周知的距離量度。應(yīng)當理解,上述處理還可以用來從病例庫選擇示范病例供顯示。
一旦確定相似度并識別最″類似的″病例,就可以針對所述訓練組中k個測試中的每一個構(gòu)造分類程序。具體地說,舉例來說,可以利用例如下面信息集合中的每一個來構(gòu)造分類程序以便測試損害是良性的還是惡性的(i)當前信息和乳房X線照片;(ii)當前信息和超聲;(iii)當前信息和MRI等。
可以在不從p個病例之一學習的情況下構(gòu)造每一個分類程序(亦即,留一(leave-one-out)方法),然后利用該分類程序?qū)哿舻牟±M行分類。對p個病例中的每一個重復(fù)該過程,并對k個測試中的每一個重復(fù)整個處理過程。然后計算k個測試中的每一個的平均可能性,這將作為最有用的測試的得分。
應(yīng)當理解,按照本發(fā)明的其它示范性實施例,CAD系統(tǒng)可以是在分布式模型中實現(xiàn)的,其中所述CAD的不同的模塊/部件分布在通信網(wǎng)絡(luò)中。例如,CAD系統(tǒng)可以由ASP(應(yīng)用程序業(yè)務(wù)提供器)提供,以便通過應(yīng)用服務(wù)器提供CAD功能的遠程訪問服務(wù)。例如,用來識別類似的病例的病例數(shù)據(jù)庫可以位于中央位置。其優(yōu)點是,所述占用相當大的存儲器的大型病例數(shù)據(jù)庫不必駐留在每一個系統(tǒng)中。另外可以非常容易地更新所述病例。例如,所述中央位置可以在醫(yī)院內(nèi),或者它可以是中央數(shù)據(jù)庫,每一個人都可以利用這樣的系統(tǒng)訪問。另一個可能性是使用分布式數(shù)據(jù)庫,其中病例位于多個位置,但是搜索和訪問時就像它們是在一個位置一樣。那樣,可以搜索位于不同位置的病例以便找出類似的病例。除所述數(shù)據(jù)庫以外,CAD系統(tǒng)的其他部分,諸如分類程序,可以位于中央位置。
另外,鑒于上面的情況,應(yīng)當理解,可以以依據(jù)業(yè)務(wù)合同或SLA(業(yè)務(wù)級別協(xié)議)由第三方業(yè)務(wù)提供器提供的業(yè)務(wù)(例如,Web業(yè)務(wù))的形式來實現(xiàn)按照本發(fā)明的CAD系統(tǒng),以便根據(jù)不同的業(yè)務(wù)/付費方案中的一個,提供如這里描述的診斷支持及其他決策支持功能。例如,所述第三方業(yè)務(wù)提供器可以通過合同而有責任針對不同的臨床領(lǐng)域訓練、維持和更新分類模型,內(nèi)科醫(yī)生或保健組織可以在按使用次數(shù)計費的基礎(chǔ)上、逐年付訂閱費等″在線″訪問CAD系統(tǒng)。在這樣的情況下,可以實現(xiàn)本專業(yè)的普通技術(shù)人員已知的不同方法,來維持病人保密性,而另一種方法是利用安全加密、壓縮方案等通過通信信道來發(fā)送病人數(shù)據(jù)。本專業(yè)的普通技術(shù)人員可以容易地按照本發(fā)明想像出CAD系統(tǒng)的不同的體系結(jié)構(gòu)和實現(xiàn)方案,在這里任何東西都不應(yīng)該解釋為對本發(fā)明的范圍的限制。
盡管這里已經(jīng)參照附圖描述了本發(fā)明的說明性的實施例,但是顯然,本發(fā)明不限于那些精確的實施例,在不脫離本發(fā)明的范圍或精神的情況下,本專業(yè)技術(shù)人員可以對其作出其它不同的變化和修改。所有這樣的變化和修改將被包括在如后附的權(quán)利要求書所定義的本發(fā)明的范圍內(nèi)。
權(quán)利要求
1.一種用于為乳房成像提供自動診斷和決策支持的方法,所述方法包括從對象病人的異常的乳房組織的圖像數(shù)據(jù)獲得信息;從所述對象病人的非圖像數(shù)據(jù)記錄獲得信息;以及利用所述獲得的信息自動地診斷所述異常的乳房組織。
2.如權(quán)利要求1所述的方法,其中從圖像數(shù)據(jù)獲得信息的步驟包括自動地從超聲圖像數(shù)據(jù)提取一個或多個特征,所述一個或多個特征將用來自動地診斷所述異常的乳房組織。
3.如權(quán)利要求2所述的方法,其中所述超聲波數(shù)據(jù)是3D超聲波數(shù)據(jù)。
4.如權(quán)利要求2所述的方法,其中還包括在自動地提取之前,在所述超聲圖像數(shù)據(jù)中自動地檢測異常的乳房組織。
5.如權(quán)利要求2所述的方法,其中自動地從超聲圖像數(shù)據(jù)中提取一個或多個特征的步驟包括提取與所述異常的乳房組織的針刺狀、聲影區(qū)或高度/深度比率之一有關(guān)的特征和所述特征的任何組合。
6.如權(quán)利要求2所述的方法,其中自動地從超聲圖像數(shù)據(jù)中提取一個或多個特征的步驟包括提取與所述異常的乳房組織的聲學、彈性、灌注或3D特征之一有關(guān)的特征或所述特征的任何組合。
7.如權(quán)利要求2所述的方法,其中所述圖像數(shù)據(jù)包括超聲圖像數(shù)據(jù)、乳房X線攝影圖像數(shù)據(jù)、MRI圖像數(shù)據(jù)中的一個及其組合。
8.如權(quán)利要求1所述的方法,其中從非圖像數(shù)據(jù)記錄獲得信息的步驟包括自動地從結(jié)構(gòu)的和/或非結(jié)構(gòu)的數(shù)據(jù)源,包括所述對象病人的臨床、家族和/或病歷信息提取特征。
9.如權(quán)利要求1所述的方法,其中自動地診斷異常的乳房組織的步驟包括自動地確定診斷的幾率。
10.如權(quán)利要求9所述的方法,其中還包括自動地確定所述診斷幾率的置信度。
11.如權(quán)利要求10所述的方法,其中還包括自動地確定會提高所述診斷幾率的置信度的附加信息
12.如權(quán)利要求11所述的方法,其中自動地確定附加信息的步驟還包括確定所述附加信息在提高所述診斷的置信度方面的有效程度。
13.如權(quán)利要求1所述的方法,其中還包括自動地識別類似于當前診斷的一個或多個先前診斷的病例。
14.如權(quán)利要求13所述的方法,其中自動地識別一個或多個類似于當前診斷的先前診斷的病例的步驟包括利用所述獲得的信息來搜索具有類似于所述獲得的信息的特征的標記過的病例的文庫。
15.如權(quán)利要求14所述的方法,其中包括顯示所述識別的病例。
16.如權(quán)利要求1所述的方法,其中利用所述獲得的信息自動地診斷異常的乳房組織的步驟包括利用受過訓練以便分析所述獲得的信息的機器學習方法、基于模型的方法或機器學習和基于模型的方法的任何組合,對所述異常的乳房組織進行分類。
17.如權(quán)利要求16所述的方法,其中包括連續(xù)地或定期地利用專家數(shù)據(jù)和/或從多個病例研究學習來的數(shù)據(jù)對所述分類方法進行再訓練。
18.一種用于為乳房成像提供自動診斷和決策支持的方法,所述方法包括從對象病人的異常的乳房組織的超聲圖像數(shù)據(jù)獲得信息;自動地從所述超聲圖像數(shù)據(jù)提取特征,所述提取的特征包括以下特征中的至少兩個應(yīng)變、諸如聲流式傳輸?shù)囊后w運動、諸如造影灌注的血液運動和B型圖像;以及利用所述提取的特征自動地診斷所述異常的乳房組織。
19.如權(quán)利要求18所述的方法,其中所述超聲圖像數(shù)據(jù)包括3D超聲圖像數(shù)據(jù),并且還包括從所述3D超聲圖像數(shù)據(jù)提取特征。
20.一種用于為醫(yī)學成象提供自動診斷和決策支持的方法,所述方法包括從對象病人的病人數(shù)據(jù)自動地提取特征,所述病人數(shù)據(jù)包括圖像數(shù)據(jù)和非圖像數(shù)據(jù);以及通過分析從所述對象病人的所述病人數(shù)據(jù)提取的所述特征自動地確定所述對象病人的當前狀態(tài);以及根據(jù)確定的所述對象病人的當前狀態(tài),自動地在所述對象病人的保健或診斷或治療途徑方面,提供協(xié)助內(nèi)科醫(yī)生的工作流程的決策支持。
21.如權(quán)利要求20所述的方法,其中自動地確定所述對象病人的當前狀態(tài)的步驟包括自動地確定乳房癌的診斷幾率或?qū)戆l(fā)展為乳房癌的幾率。
22.如權(quán)利要求21所述的方法,其中自動地提供決策支持的步驟包括自動地確定會提高所述乳房癌診斷幾率的置信度的一個或多個附加特征。
23.如權(quán)利要求22所述的方法,其中自動地確定一個或多個附加特征的步驟還包括確定所述一個或多個附加特征中每一個在提高所述診斷置信度方面的有效程度。
24.如權(quán)利要求21所述的方法,其中自動地提供決策支持的步驟包括自動地確定會提高所述乳房癌診斷幾率的置信度的一個或多個附加的成像方法。
25.如權(quán)利要求24所述的方法,其中自動地確定一個或多個附加的成像方法的步驟還包括確定所述一個或多個附加的成像方法中每一個在提高所述診斷的置信度方面的有效程度。
26.如權(quán)利要求21所述的方法,其中自動地提供決策支持的步驟包括自動地識別一個或多個類似于當前病例的先前診斷的病例。
27.如權(quán)利要求26所述的方法,其中包括顯示所述識別的病例。
28.如權(quán)利要求20所述的方法,其中自動地確定所述對象病人的當前狀態(tài)的步驟包括自動地確定所述對象病人發(fā)展為乳房癌的可能性。
29.如權(quán)利要求20所述的方法,其中自動地提供決策支持的步驟包括自動地確定一個或多個診斷成像篩選測試,可以向所述對象病人提供所述一個或多個診斷成像篩選測試,以便進行檢測乳房癌或者提供所述對象病人發(fā)展為乳房癌的可能性的較好的評定。
30.如權(quán)利要求20所述的方法,其中自動地確定所述對象病人的當前狀態(tài)的步驟包括自動地評定乳房腫瘤的特性和位置。
31.如權(quán)利要求30所述的方法,其中自動地提供決策支持的步驟包括自動地確定可以用于對所述損害進行腫瘤分類的一個或多個診斷成像測試。
32.如權(quán)利要求31所述的方法,其中自動地確定可以用來對所述損害進行腫瘤分類的一個或多個診斷成像測試的步驟還包括提供關(guān)于所述診斷成像測試中每一個的有效程度。
33.如權(quán)利要求31所述的方法,其中自動地提供決策支持的步驟包括自動地識別一個或多個類似于當前病例的先前腫瘤分類病例。
34.如權(quán)利要求33所述的方法,其中還包括顯示所述識別的腫瘤分類病例。
35.如權(quán)利要求20所述的方法,其中提供決策支持以便協(xié)助內(nèi)科醫(yī)生工作流程的步驟包括建議治療方案。
36.如權(quán)利要求35所述的方法,其中還包括自動地提供所述治療將具有確定結(jié)局的幾率和/或置信度。
37.如權(quán)利要求35所述的方法,其中還包括自動地提供所述治療不會具有諸如副作用的確定的有害作用的幾率和/或置信度。
38.如權(quán)利要求36所述的方法,其中所述幾率是關(guān)于有利的和有害的兩種可能的結(jié)局的分布。
39.如權(quán)利要求38所述的方法,其中所述幾率是將來一個或多個時刻關(guān)于有利的和有害的兩種可能的結(jié)局的一組分布。
40.如權(quán)利要求38所述的方法,其中所述幾率是將來不同的時間關(guān)于可能的結(jié)局的隨時間而改變的分布。
全文摘要
提供用于乳房成像的CAD(計算機輔助診斷)系統(tǒng)和應(yīng)用,它實現(xiàn)從對象病人的病人信息集合(包括圖像數(shù)據(jù)和/或非圖像數(shù)據(jù))自動地提取和分析特征的方法,以便為內(nèi)科醫(yī)生工作流程的不同的方面提供決策支持,例如,乳房癌的自動診斷以及使關(guān)于例如乳房癌篩選和腫瘤分類的決策支持成為可能的其它自動決策支持功能。CAD系統(tǒng)實現(xiàn)機器學習技術(shù),后者使用一組從一個或多個相關(guān)臨床領(lǐng)域和/或?qū)@樣的數(shù)據(jù)的專家解釋的標記過的病人病例數(shù)據(jù)庫獲得(學習)的訓練數(shù)據(jù),以便允許CAD系統(tǒng)“學習”分析病人數(shù)據(jù)和作出適當?shù)脑\斷評定和決策、用于協(xié)助內(nèi)科醫(yī)生的工作流程。
文檔編號A61B8/00GK1839391SQ200480024033
公開日2006年9月27日 申請日期2004年6月25日 優(yōu)先權(quán)日2003年6月25日
發(fā)明者S·克里什南, R·B·勞, M·鄧達, G·馮 申請人:美國西門子醫(yī)療解決公司