專利名稱:為分類引入空間知識的制作方法
參照相關申請本申請要求美國臨時申請編號60/494,646的優(yōu)先權,該申請于2003年8月13日提交,并通過引用完全被包括在這里。
發(fā)明
背景技術:
領域本發(fā)明涉及機器分類領域,并且更具體地涉及為分類引入空間知識。
相關技術描述分類器用于將對象分類(即分隔)為兩個或更多類。分類器的例子如下。假定我們有一個對象集A,包含兩個對象組(即類),我們稱之為A+和A。如這里使用的術語“對象”指的是群集中的一個或者多個元素。分類器A是一個函數(shù)F,其根據(jù)該元素的組別,從A中取出每個元素并返回一個符號“+”或“-”。即,分類器可能是FUNCTIONF(A)→{-1,1},其中-1是表示A-的數(shù)字值,而+1是表示A+的數(shù)字值。分類器A+和A-可能表示兩個分離的群集。例如,A+表示肺中的結(jié)構(例如脈管,支氣管),而A-表示結(jié)節(jié)。只要函數(shù)F是從訓練數(shù)據(jù)(即已知分類的數(shù)據(jù))中訓練出來,就可以使用函數(shù)F預告新的和未見的數(shù)據(jù)的分類。例如,分類器可以在10000個我們已經(jīng)從醫(yī)生獲取讀數(shù)的已知對象中訓練。這通常被認為是一個“基本事實”?;诟鶕?jù)本基本事實的訓練,分類器可用來自動地診斷新的和未見的案例。
傳統(tǒng)的分類器根據(jù)假設將對象分類為類,該假設是同一類對象具有類似的特征,即,屬于特征空間中的同一分布。然而在許多應用中,由于如它們的空間位置等原因,屬于同一類的對象具有不同特征值。如在此使用的,術語“特征”是指一個或多個描述屬于一個特定類的對象的屬性。例如,結(jié)節(jié)可以用包括例如大小,直徑,球形度等等的一些屬性的矢量描述。該矢量可以包含屬性值,在此其術語為“特征值”。
上述問題的現(xiàn)有解決方案是使用一個更復雜的分類器,該分類器具有更多數(shù)量的自由度。一種產(chǎn)生該更復雜分類器的方法是使用內(nèi)核映射,將數(shù)據(jù)映射到一個更高維度的特征空間。即,函數(shù)K(即內(nèi)核)取出原始數(shù)據(jù),并將它映射到一個更高維度特征空間(即具有更多特征的特征空間),在該空間中,更容易實現(xiàn)尋找分類函數(shù)的任務。
例如,假設原始數(shù)據(jù)是一個分析一些特定數(shù)量特征的單個情形。因此,如果原始數(shù)據(jù)有10個特征,那么原始數(shù)據(jù)的矢量是一個10維特征空間。同樣假設我們有另1000個其它情形的類似數(shù)據(jù)。我們可產(chǎn)生一個類似函數(shù),該函數(shù)產(chǎn)生一個指出原始數(shù)據(jù)與這1000個情形的每一個有多么相似的值。因此,產(chǎn)生了一個1000維特征空間,它從該10維特征空間映射而來。
如在此使用的,術語“自由度”是指最終統(tǒng)計計算中可自由變化的值的數(shù)量。產(chǎn)生更復雜分類器的另一種方法是以連續(xù)或平行方式組合一些簡單分類器,每個簡單分類器使用不同特征集訓練。合并結(jié)果以形元素類器集合。
這些及其它類似的方法的缺點在于要求附加訓練例子,以補償用來獲得相同的一般化性能所需的大量自由度。如在此使用的,術語“一般化性能”是指分類器在新的和未見的數(shù)據(jù)上的性能。有許多原因會使一般化性能減低。例如,在分類的學習(即訓練)過程中,類似于回歸的情況,有過度適合訓練數(shù)據(jù)的潛在風險,從而導致對新的和未見的情況的不良預測性能。
發(fā)明內(nèi)容
本發(fā)明的第一典型方面,提供一種對圖像中的侯選進行分類的方法。該方法包括使用第一分類器分類圖像的第一侯選,其中第一分類器使用第一侯選的空間位置特有的訓練數(shù)據(jù)進行訓練;并且使用第二分類器分類圖像的第二侯選,其中第二分類器使用第二侯選的空間位置特有的訓練數(shù)據(jù)進行訓練;其中第一侯選的空間位置和第二侯選的空間位置互相排斥。
本發(fā)明的第二典型方面,提供一種對圖像上的結(jié)節(jié)進行自動檢測的方法。該方法包括獲取一個圖像;識別圖像上第一空間位置和第二空間位置,其中該第一空間位置與第二空間位置互相排斥;在第一空間位置識別第一侯選并在第二空間位置識別第二侯選;用第一分類器分類該第一侯選是否是結(jié)節(jié),其中第一分類器使用第一空間位置特有的訓練數(shù)據(jù)訓練;并且用第二分類器分類該第二侯選是否是結(jié)節(jié),其中第二分類器使用第二空間位置特有的訓練數(shù)據(jù)訓練;其中第一侯選的空間位置和第二侯選的空間位置互相排斥。
本發(fā)明的第三典型方面,提供一種機器可讀介質(zhì),其內(nèi)部存儲由處理器執(zhí)行的指令,以執(zhí)行對圖像中的侯選進行分類的方法。該方法包括使用第一分類器分類圖像的第一侯選,其中第一分類器使用第一侯選的空間位置特有的訓練數(shù)據(jù)訓練;和使用第二分類器分類圖像的第二侯選,其中第二分類器使用第二侯選的空間位置特有的訓練數(shù)據(jù)訓練;其中第一侯選的空間位置和第二侯選的空間位置互相排斥。
本發(fā)明的第四典型實施例,提供一種機器可讀介質(zhì),其內(nèi)部存儲由處理器執(zhí)行的指令,以執(zhí)行自動探測圖像中結(jié)節(jié)的方法。該方法包括獲取一個圖像;識別圖像上的第一空間位置和第二空間位置,其中該第一空間位置與第二空間位置互相排斥;在第一空間位置識別第一侯選并在第二空間位置識別第二侯選;用第一分類器分類該第一侯選是否是結(jié)節(jié),其中第一分類器使用第一空間位置特有的訓練數(shù)據(jù)訓練;和用第二分類器分類該第二侯選是否是結(jié)節(jié),其中第二分類器使用第二空間位置特有的訓練數(shù)據(jù)訓練;其中第一侯選的空間位置和第二侯選的空間位置互相排斥。
附圖講述結(jié)合附圖參考以下描述,可以更好地理解本發(fā)明,其中類似參考數(shù)字標識類似元素,其中
圖1根據(jù)本發(fā)明的一個實施例,描述一種基于對象空間位置分類對象的方法;和圖2A和圖2B根據(jù)本發(fā)明的一個實施例,描述結(jié)節(jié)分類后的示例性肺部CT掃描。
優(yōu)選實施例詳述下面描述本發(fā)明的說明性的實施例。為了說明清楚,說明中沒有描述一個實際實現(xiàn)的所有特征。當然可以理解,在任何此類實際實施例的研制中,必須做出許多實現(xiàn)所特有的決定,以達到開發(fā)者特定的目的,例如依從與系統(tǒng)相關和與商業(yè)相關的約束,這些在不同的實施例中將有所不同。此外,可以理解,這樣的研制可能復雜而耗時,但無論如何只是那些受益于本公開的本領域普通技術人員所從事的例行程序而已。
雖然本發(fā)明易受不同的修改和替換形式的影響,但附圖中通過例子顯示了其特定實施例,并在此詳細描述??梢岳斫?,無論如何,在此特定實施例的描述不是將本發(fā)明限制為所公開的特定形式,而相反,本發(fā)明將覆蓋所有附屬權利要求書中定義的本發(fā)明精神和范圍內(nèi)的修改,等價物和替換。
可以理解,在此描述的系統(tǒng)和方法可以以不同的硬件、軟件、固件、專用處理器或其組合的形式實現(xiàn)。特別地,當一個應用程序包含有確實嵌入到一個或多個程序存儲裝置(例如,硬盤,軟磁盤,RAM,ROM,CD ROM等等)中并且可由任何具有合適結(jié)構的裝置或機器、如由具有處理器、存儲器和輸入/輸出接口的通用數(shù)字計算機執(zhí)行的程序指令時,至少本發(fā)明的一部分可更好地實現(xiàn)。更進一步可理解,因為附圖中描述的一些系統(tǒng)組成部分和過程步驟更適合用軟件實現(xiàn),因此根據(jù)本發(fā)明編程的方式,系統(tǒng)模塊(或方法步驟的邏輯流)間的聯(lián)系可能不同。通過這里給出的教導,本領域普通技術人員能夠設想本發(fā)明的這些及類似的實現(xiàn)。
我們建議根據(jù)對象空間位置使用不同的分類器,而不是使用單個或復雜的分類器。這種方法背后的直覺是一些分類器可以比一個覆蓋整個特征空間的“通用”分類器更好地學習局部方案。使用局部分類器保證特定類的對象在那個特定類中有更高程度的類似性。使用局部分類器也導致存儲器、存儲裝置和性能的改進,尤其當分類器是基于內(nèi)核時。如在此使用的,術語“基于內(nèi)核的分類器”是指一個分類器,其中映射函數(shù)(即內(nèi)核)已經(jīng)被用來將原始訓練數(shù)據(jù)映射到一個分類任務可更容易實現(xiàn)的更高維數(shù)的空間。
現(xiàn)在參考圖1,說明根據(jù)本發(fā)明的一個實施例的、基于對象空間位置將對象進行分類的方法100。方法100獲取(在105)一個圖像。在一個實施例中,該圖像可從人體物理掃描中獲取,例如從計算機X線斷層造影(“CT”)、核磁共振成像(“MRT”)或超聲裝置中獲取。在另一個實施例中,該圖像可以從衛(wèi)星成像系統(tǒng)中獲取。應當理解,方法和設備的任何改變都可能用來獲取圖像,正如本領域技術人員所預見的那樣。
方法100識別(在110)圖像元素的空間位置。例如在一個肺部圖像中,可能的位置可以包括表示附著在肺壁上的元素的壁附著位置,表示附著在支氣管上的元素的支氣管分類器,和表示肺內(nèi)部元素的肺內(nèi)部分類器。也可使用人體的其它圖像,例如心臟圖像。對于另一個例子,衛(wèi)星圖像可分類為大陸類型(例如,山,沙漠,雨林)??梢酝ㄟ^如圖形用戶界面識別空間位置。還可以使用圖像上的不同位置的以前的知識來自動識別空間位置。應當理解,可以使用其它不同的自動方法(例如,模式匹配)來識別空間位置,正如本領域技術人員所預見的那樣。
為每個空間位置產(chǎn)生分類器(在115)。使用上述肺掃描的例子,可能的分類器可能包括表示附著在肺壁上的元素的壁附著分類器,表示附著在支氣管上的元素的支氣管分類器,和表示肺內(nèi)部的元素的肺內(nèi)部分類器。分類器可以使用前面已知的數(shù)據(jù)被訓練。例如,使用前面的肺掃描例子,分類器可以使用為特定空間位置所指定的元素訓練數(shù)據(jù)進行訓練。訓練數(shù)據(jù)可包括已知的和前面已驗證的數(shù)據(jù)。例如,醫(yī)生驗證的決定是否存在結(jié)節(jié)的案例可用作訓練數(shù)據(jù)。為訓練目的,不同的案例可被分成對應于不同分類器的空間位置。由此,訓練壁附著分類器將只利用附著于肺壁的元素的訓練數(shù)據(jù)。這種方法的優(yōu)點是,分類器可利用在特定位置處的元素的任何新穎性(已知和未知)。例如,分類支氣管中的元素與分類肺中的元素是不同的。
方法100識別侯選(在120)。如在此使用的,術語“侯選”是指圖像中被感興趣的元素(即結(jié)構)。因為分類器對于空間位置是唯一的,所以侯選的分類將比不考慮空間位置更準確。而且,使用這樣的“局部分類器”也導致存儲器、存儲裝置和性能比復雜的通用分類器要改進。可以使用本領域技術人員所知的各種方法和設備的任何一種來人工或自動識別侯選。例如,在癌癥篩選領域中,用計算機輔助自動識別可疑的被感興趣的區(qū)域是眾所周知的。
方法100利用與侯選所在的空間位置相關的合適的分類器,將侯選分類成標記(在125)。例如,在上述肺掃描的例子中,如果侯選位于肺內(nèi)部,則使用肺內(nèi)部分類器分類該侯選。該侯選可被標記為“結(jié)節(jié)”,表示圖像中的結(jié)構(即元素)是結(jié)節(jié),而“非結(jié)節(jié)”表示該結(jié)構不是結(jié)節(jié)。應當理解,可以使用各種標記的任何一種,正如本領域技術人員所預見的那樣。而且,侯選可用兩個以上的標記被分類。
應當理解,為容易識別,特定的標記能物理地標注在圖像上。例如,在上述肺掃描例子中,可以標注被識別為結(jié)節(jié)的侯選,因而人工觀察者(例如,醫(yī)生)可以容易地識別病理??墒褂貌煌臉俗㈩愋秃托螤?,以在某些分類器中進行區(qū)分,正如本領域技術人員所預見的那樣。標注的例子可以是圍繞每個已識別的結(jié)節(jié)的正方形或圓形。
圖2A和圖2B根據(jù)本發(fā)明的一個實施例,描述了在分類后標注的示例性肺部CT掃描。正方形標注是指壁附著結(jié)節(jié),而圓形標注是指肺內(nèi)部結(jié)節(jié)。
上述公開的特定實施例只為說明,因為本發(fā)明可用不同的但對受益于本文教導的本領域技術人員而言顯然是等效的方式來修改和實現(xiàn)。進一步,在此不局限于顯示的結(jié)構或設計細節(jié),而是局限于以下權利要求中的描述。因此很明顯,上述公開的特定實施例可能被改變或改進,并且所有這類變化都考慮在本發(fā)明的精神和范圍之內(nèi)。因此,在以下權利要求書中提出保護請求。
權利要求
1.一種對圖像中的侯選進行分類的方法,包括使用第一分類器分類圖像的第一侯選,其中第一分類器使用第一侯選的空間位置特有的訓練數(shù)據(jù)進行訓練;和使用第二分類器分類圖像的第二侯選,其中第二分類器使用第二侯選的空間位置特有的訓練數(shù)據(jù)進行訓練;其中第一侯選的空間位置和第二侯選的空間位置互相排斥。
2.如權利要求1所述的方法,進一步包括獲取圖像。
3.如權利要求2所述的方法,其中獲取圖像包括獲取至少人體中的一部分的CT,MRI或超聲圖像中的至少一個。
4.如權利要求2所述的方法,其中獲取圖像包括獲取衛(wèi)星圖像。
5.如權利要求1所述的方法,進一步包括識別圖像上的空間位置。
6.如權利要求5所述的方法,其中識別圖像上的空間位置包括提供用于人工識別圖像上的空間位置的圖形用戶界面。
7.如權利要求5所述的方法,其中識別圖像上的空間位置包括自動識別圖像上的空間位置。
8.如權利要求7所述的方法,其中自動識別圖像上的空間位置包括使用該空間位置的已知信息自動識別圖像上的空間位置。
9.如權利要求7所述的方法,其中自動識別圖像上的空間位置包括使用模式匹配自動識別圖像上的空間位置。
10.如權利要求5所述的方法,其中識別至少人體一部分的圖像上的空間位置。
11.如權利要求10所述的方法,其中識別至少人體一部分的圖像上的空間位置包括識別肺部圖像上的空間位置。
12.如權利要求11所述的方法,其中肺部圖像上的空間位置包括壁附著區(qū)域、肺內(nèi)部區(qū)域和支氣管區(qū)域。
13.如權利要求10所述的方法,其中識別至少人體一部分的圖像上的空間位置包括識別心臟圖像上的空間位置。
14.如權利要求1所述的方法,進一步包括識別圖像上的第一侯選和第二侯選。
15.如權利要求14所述的方法,其中識別圖像上的第一侯選和第二侯選包括提供用于人工識別圖像上的第一侯選和第二侯選的圖形用戶界面。
16.如權利要求14所述的方法,其中識別圖像上的第一侯選和第二侯選包括自動識別圖像上的第一侯選和第二侯選。
17.如權利要求16所述的方法,其中自動識別圖像上的第一侯選和第二侯選包括使用模式匹配自動識別圖像上的第一侯選和第二侯選。
18.如權利要求1所述的方法,其中分類第一侯選包括自動分類該第一侯選是否是結(jié)節(jié),和其中分類第二侯選包括自動分類該第二侯選是否是結(jié)節(jié)。
19.如權利要求1所述的方法,其中訓練數(shù)據(jù)包括醫(yī)生驗證的數(shù)據(jù)。
20.一種對圖像上的結(jié)節(jié)進行自動檢測的方法,包括獲取一個圖像;識別圖像上的第一空間位置和第二空間位置,其中第一空間位置和第二空間位置相互排斥;在第一空間位置識別第一侯選并在第二空間位置識別第二侯選;使用第一分類器分類該第一侯選是否是結(jié)節(jié),其中該第一分類器用第一空間位置特有的訓練數(shù)據(jù)進行訓練;和使用第二分類器分類該第二侯選是否是結(jié)節(jié),其中該第二分類器用第二空間位置特有的訓練數(shù)據(jù)進行訓練;其中第一侯選的空間位置和第二侯選的空間位置互相排斥。
21.如權利要求20所述的方法,進一步包括如果第一侯選是結(jié)節(jié),標識該第一侯選;和如果第二侯選是結(jié)節(jié),標識該第二侯選。
22.一種機器可讀介質(zhì),其內(nèi)部存儲由處理器執(zhí)行的指令以執(zhí)行分類圖像中侯選的方法,該方法包括使用第一分類器分類圖像的第一侯選,其中第一分類器使用第一侯選的空間位置特有的訓練數(shù)據(jù)進行訓練;和使用第二分類器分類圖像的第二侯選,其中第二分類器使用第二侯選的空間位置特有的訓練數(shù)據(jù)進行訓練;其中第一侯選的空間位置和第二侯選的空間位置互相排斥。
23.一種機器可讀介質(zhì),其內(nèi)部存儲由處理器執(zhí)行的指令以執(zhí)行自動探測圖像中結(jié)節(jié)的方法,該方法包括獲取一個圖像;識別圖像上第一空間位置和第二空間位置,其中該第一空間位置與第二空間位置互相排斥;在第一空間位置識別第一侯選并在第二空間位置識別第二侯選;用第一分類器分類該第一侯選是否是結(jié)節(jié),其中第一分類器使用第一空間位置特有的訓練數(shù)據(jù)進行訓練;和用第二分類器分類該第二侯選是否是結(jié)節(jié),其中第二分類器使用第二空間位置特有的訓練數(shù)據(jù)進行訓練;其中第一侯選的空間位置和第二侯選的空間位置互相排斥。
全文摘要
本發(fā)明提議基于對象空間位置使用不同的分類器。這種方法背后的直觀思想是多個分類器可以比一個覆蓋整個特征空間的“通用”分類器更好地學習局部概念。使用局部分類器保證了一個特定類的對象在該特定類具有更高程度的相似性。使用局部分類器還導致存儲器、存儲裝置和性能的改進,尤其當分類器基于內(nèi)核時。如在此使用的,術語“基于內(nèi)核的分類器”是指一個分類器,其中映射函數(shù)(即內(nèi)核)已經(jīng)被用來將原始訓練數(shù)據(jù)映射到一個分類任務可更容易實現(xiàn)的更高維數(shù)的空間。
文檔編號G06F19/00GK1833247SQ200480022882
公開日2006年9月13日 申請日期2004年8月13日 優(yōu)先權日2003年8月13日
發(fā)明者A·克里什南, G·馮, J·斯特克爾 申請人:美國西門子醫(yī)療解決公司