本發(fā)明涉圖像識別技術(shù)領(lǐng)域,尤其涉及一種基于條件隨機場的二維CT圖片中脂肪位置識別方法。
背景技術(shù):
現(xiàn)有技術(shù)中,對二維CT圖片中脂肪的位置進行識別一般使用馬爾科夫隨機場(Markov Random Fields,MRF)的方法。
MRF方法共包含四個步驟:
步驟一:對CT圖片中所有的像素點進行隨機分類,以完成脂肪位置檢測的初始化。像素點共分為三類:皮下脂肪P,內(nèi)臟脂肪N及其他區(qū)域Q。
步驟二:首先,統(tǒng)計每個像素點周圍八個像素點的種類的數(shù)量。例如,一個像素點A周圍的八個像素從左至右,從上至下的種類為[P,P,P,N,N,Q,Q,P]。所以,這個像素周圍共有4個P,2個N,2個Q。其次,對于像素點A,因為其周圍最多的像素類別為皮下脂肪P,所以將A的種類判斷為皮下脂肪P。再次,對CT圖片中所有的像素點進行以上的操作。至此,該CT圖片中所有像素點的種類都進行了更新。
步驟三:多次重復(fù)步驟二中的操作,對整個流程進行迭代,以不斷改進識別結(jié)果。迭代次數(shù)的選擇有兩種方案:一是人工給定一個次數(shù),如120次;二是不給定具體的迭代次數(shù),直到像素的分類不再變化(收斂)為止。
步驟四:當步驟三中的迭代完成時,對最終像素的分類進行可視化,得到脂肪位置的識別結(jié)果??蓪⑵は轮緲恕?nèi)臟脂肪標記為不同顏色,其他區(qū)域保持原始狀態(tài)不標記。
但是上述MRF方法只能應(yīng)用簡單的像素信息對CT圖片中脂肪的位置進行識別。當CT圖片質(zhì)量正常時,這些像素信息可以提供良好的識別信息,進而得到良好的脂肪位置檢測結(jié)果。當CT圖片具有大量噪音時,這些簡單的像素信息容易與噪音發(fā)生混淆,嚴重影響脂肪位置識別結(jié)果。
如果能提出一種適用于高噪聲CT圖片脂肪位置識別技術(shù),將是十分有意義的。
技術(shù)實現(xiàn)要素:
為解決上述問題,本發(fā)明提供了一種基于條件隨機場(CRF)的二維CT圖片中脂肪位置識別方法,包括如下步驟:
步驟一:確定若干張用于進行條件隨機場訓(xùn)練的、脂肪位置能被清晰識別的的原始CT圖像。
步驟二:對各個原始CT圖像的各個像素點進行最終特征向量提取,具體包含如下步驟:
步驟2.1:確定圖中各個像素點的四個特征向量,分別為:像素值、像素塊均值、方向梯度直方圖(HoG)、HoG塊。
步驟2.2:將各像素點的四個特征向量聯(lián)合組成一個向量,該向量為該像素點的最終特征向量。
步驟三:將各個像素點的最終特征向量作為該點的描述子來表達對應(yīng)原始CT圖片的信息。
步驟四:利用各個原始CT圖像中的描述子對分類器進行概率輸出訓(xùn)練。
步驟五:根據(jù)步驟四的訓(xùn)練,得到一個CRF模型。
步驟六:利用CRF模型對將待檢測脂肪位置的CT圖像進行脂肪位置識別。
進一步的,步驟2.1中,像素塊均值的計算方法為:以被計算像素點的坐標位置為中心,獲取覆蓋中心周圍N*N個像素點范圍內(nèi)所有的像素值,計算這些像素值的均值,其中,N為整數(shù)。
進一步的,步驟2.1中,HoG塊的獲取方法為:以被計算像素點的坐標位置為中心,獲取覆蓋中心周圍M*M個像素點范圍內(nèi)所有的方向梯度直方圖,這些方向梯度直方圖形成HoG塊,其中,M為整數(shù)。
進一步的,所述分類器為支持向量機。
進一步的,所述分類器為人工神經(jīng)網(wǎng)絡(luò)分類器。
進一步的,所述分類器為貝葉斯分類器。
本發(fā)明的有益效果為:
本發(fā)明利用CRF方法的思路,并結(jié)合多特征融合的方法,全新設(shè)計并實現(xiàn)了一套CRF識別模型,能夠有效地應(yīng)對高噪音CT圖片中脂肪位置的識別問題。
具體實施方式
本發(fā)明所述基于條件隨機場的二維CT圖片中脂肪位置識別方法包括如下步驟:
步驟一:確定若干張用于進行條件隨機場訓(xùn)練(CRF)的、脂肪位置能被清晰識別的的原始CT圖像。
本發(fā)明共使用超過5000張二維CT圖片進行系統(tǒng)訓(xùn)練。
步驟二:對各個原始CT圖像的各個像素點進行最終特征向量提取,具體為:
步驟2.1:確定圖中各個像素點的四個特征向量,分別為:像素值、像素塊均值、方向梯度直方圖(HoG)、HoG塊,下面對各個特征向量分別予以介紹。
1.像素值(Pixel Value):在一張X像素長,Y像素高的CT圖片中,(x,y)位置的Pixel Value可以定義為P(x,y)。P(x,y)是一個一維度長的特征向量。
2.像素塊(Pixel Block)均值:在一張X像素長,Y像素高的CT圖片中,(x,y)位置的Pixel Block均值可以定義為B(x,y)。B(x,y)以(x,y)位置為中心,首先覆蓋其周圍N*N(N為整數(shù),本實施例選取N=5,即5x5=25)個像素點范圍內(nèi)的所有像素信息P(x,y),然后計算這些像素的平均值,最終形成一個一維長度的特征向量。
3.方向梯度直方圖(Histogram of Oriented Gradient,HoG):在一張X像素長,Y像素高的CT圖片中,(x,y)位置的HoG可以定義為H(x,y)。首先將圖像分成小的連通區(qū)域,每個大小為L*L(L為整數(shù),本實施例選取L=3,即3x3=9)像素,稱為細胞單元(Cell)。然后采集Cell中各像素點的梯度的或邊緣的方向直方圖。其中,梯度可以通過原始圖片與[-1,0,1]和[-1,0,1]T的卷積計算得到。進一步,將梯度的方向劃分為L*L個通道,每個通道覆蓋360/(L*L)度(本實施例為40度),以建立直方圖(共覆蓋360度)。最后把這些直方圖組合起來即可得到一個L*L維長度的H(x,y)特征向量。
4.HoG塊(HoG Block):在一張X像素長,Y像素高的CT圖片中,(x,y)位置的HoG Block可以定義為HB(x,y)。HB(x,y)以(x,y)位置為中心,覆蓋其周圍M*M(M為整數(shù),本實施例選取M=5,即5x5=25)個Cell范圍內(nèi)的所有H(x,y),最終形成一個M*M*L*L(本實施例為225)維長度的特征向量。
前面所述的N、L、M的取值均為正整數(shù),大小不超過原始CT圖片的尺寸。
步驟2.2:將各像素點的四個特征向量聯(lián)合組成一個向量,該向量為該像素點的最終特征向量。
本發(fā)明將每個像素點的4個特征向量聯(lián)合為一個特征向量,以融合它們各自的優(yōu)勢。最終,得到一個1+1+L*L+M*M*L*L(本實施例為236)維度長的最終特征向量F(x,y)=[P(x,y),B(x,y),H(x,y),HB(x,y)]。
步驟三:將各個像素點的最終特征向量F(x,y)作為該點的描述子來表達對應(yīng)原始CT圖片的信息。
步驟四:利用各個原始CT圖像中的描述子對分類器進行概率輸出訓(xùn)練。
因為F(x,y)是一個高維度特征向量,所以本發(fā)明應(yīng)用支持向量機(Support Vector Machine,SVM)作為分類器。特別地,為了達到CRF條件概率計算的目的,本發(fā)明使用概率輸出SVM(Probability Output SVM,POSVM)作為條件概率計算的方法。
步驟五:根據(jù)步驟四的訓(xùn)練,得到一個CRF模型。
當然,還可以利用人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural,Network,ANN)分類器或貝葉斯(Bayesian)分類器代替支持向量機分類器,進行CRF模型設(shè)計,各個分類器的計算方法為現(xiàn)有技術(shù),在此不做贅述。
步驟六:利用CRF模型對將待檢測脂肪位置的CT圖像進行脂肪位置識別。
條件隨機場(Conditional Random Fields,CRF)是一種在MRF基礎(chǔ)上提出的判別式概率無向圖學(xué)習(xí)模型,是一種用于標注和切分有序數(shù)據(jù)的條件概率模型。與傳統(tǒng)的MRF方法相比,CRF不僅考慮相鄰像素之間的類別關(guān)系,而且考慮其他特征之間的條件概率關(guān)系。CRF模型比MRF模型包含了更多圖像信息,因此具有更強的物體識別能力。