專利名稱:在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息技術(shù)行業(yè)圖像處理技術(shù)領(lǐng)域,具體地涉及ー種在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法。
背景技術(shù):
目前人類對發(fā)音生理機(jī)理尚不明確,其中ー個重要原因是語音與器官間的運動關(guān)系缺乏有效的觀測和分析工具。目前針對口腔發(fā)音動態(tài)圖像研究的常用輔助手段有X光影像、超聲圖像及核磁共振突圖像等。這些醫(yī)學(xué)圖像具有分辨率低、成像模糊、噪聲嚴(yán)重的特點。盡管國內(nèi)外研究人員提出了很多從醫(yī)學(xué)圖像中自動提取和跟蹤人體器官運動輪廓的方法,但是由于人的發(fā)音器官種類較多、運動靈活多變、并且在視頻成圖像中相互遮擋嚴(yán)重,會出現(xiàn)幅度較寬的虛假輪廓等情況。申請人:發(fā)現(xiàn)傳統(tǒng)的圖像分析技術(shù)不適于低質(zhì)量醫(yī)學(xué)影像中的發(fā)音器官輪廓自動獲取,從低質(zhì)量醫(yī)學(xué)圖像中自動獲取發(fā)音器官輪廓目前任然是語音與視覺計算中的ー個挑戰(zhàn),特別是針對發(fā)音中的ー些舌位運動細(xì)節(jié)。
發(fā)明內(nèi)容
(一 )要解決的技術(shù)問題為解決上述的一個或多個問題,本發(fā)明提供了ー種在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法。( ニ )技術(shù)方案根據(jù)本發(fā)明的ー個方面,提供了ー種在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法。該 方法包括對于醫(yī)學(xué)圖像,利用唇部與背景的自動分割閾值,對醫(yī)學(xué)影像中嘴唇與背景區(qū)域進(jìn)行ニ值化,得到唇部輪廓;在唇部輪廓包含的面部范圍內(nèi),提取上牙齒輪廓、下牙齒輪廓、上頜輪廓和下頜輪廓;針對上頜輪廓和下頜輪廓之間圖像區(qū)域,獲取舌位輪廓的可靠邊緣點;以及由舌位輪廓的可靠邊緣點擬合出舌位邊緣輪廓。(三)有益效果從上述技術(shù)方案可以看出,本發(fā)明在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法具有以下有益效果(I)本發(fā)明能自動從影像背景中分割出發(fā)音人頭部、器官區(qū)域,整個過程自動完成,無需人工交互;(2)本發(fā)明針對低質(zhì)量醫(yī)學(xué)影像中舌位成像模糊、噪聲和遮擋嚴(yán)重的情況,能很好獲取發(fā)音過程的舌位輪廓及舌位運動細(xì)節(jié);(3)本發(fā)明能自動同時獲取包括唇、上下頜、牙齒、舌的運動輪廓,有利于直觀觀測和分析發(fā)音過程中的各發(fā)音器官運動特征。
圖I為本發(fā)明實施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法的流程圖。圖2是發(fā)音器官X光圖像;圖3是對于圖2所示X光圖像,由本發(fā)明實施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法中步驟A和步驟B得到的上唇輪廓、下唇輪廓、上牙齒輪廓、下牙齒輪廓、上頜輪廓、下頜輪廓及舌位初步輪廓的示意圖;圖4是本發(fā)明實施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法中擬合下頜輪廓曲線的不意圖;圖5是本發(fā)明在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法中擬合舌位輪廓的流程圖;圖6是本發(fā)明在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法中獲取舌位輪廓的可靠邊緣點步驟中0度方向的區(qū)域最大梯度估計的11X11大小的一個模板示意圖;
圖7是本發(fā)明在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法中基于隨機(jī)抽取一致性檢驗(RANSAC)和過控制點B樣條曲線擬合的舌部輪廓的示意圖;圖8是說話人發(fā)“Ban”音的X光圖像序列中,利用本發(fā)明實施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法所提取的上唇、下唇、上牙齒、下牙齒、上頜、下頜及舌位輪廓的效果圖;圖9是利用本發(fā)明實施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法提取超聲圖像中舌位輪廓的效果圖;圖10是本發(fā)明實施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法提取核磁共振圖像中舌部輪廓的效果圖。
具體實施例方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚明白,以下結(jié)合具體實施例,并參照附圖,對本發(fā)明進(jìn)ー步詳細(xì)說明。需要說明的是,在附圖或說明書描述中,相似或相同的部分都使用相同的圖號。且在附圖中,以簡化或是方便標(biāo)示。再者,附圖中未繪示或描述的實現(xiàn)方式,為所屬技術(shù)領(lǐng)域中普通技術(shù)人員所知的形式。另外,雖然本文可提供包含特定值的參數(shù)的示范,但應(yīng)了解,參數(shù)無需確切等于相應(yīng)的值,而是可在可接受的誤差容限或設(shè)計約束內(nèi)近似于相應(yīng)的值。本發(fā)明基于傳統(tǒng)的圖像處理方法,在發(fā)音器官輪廓提取與跟蹤的過程中,采用灰度直方圖及最大類間自動閾值提取方法,實現(xiàn)對嘴唇輪廓的自動提?。徊捎米赃m應(yīng)邊緣梯度方法,結(jié)合已知形狀的剛體輪廓投影匹配和曲線擬合技術(shù),提取出牙齒、上下頜輪廓;利用最大梯度估計的模糊圖像邊緣檢測算法,獲取發(fā)音過程中ロ腔內(nèi)部舌位邊緣點,并結(jié)合隨機(jī)抽樣一致性驗證(RANSAC)算法和B樣條曲線擬合方法,去除錯誤的舌位邊緣輪廓點,采用通過控制點的B樣條曲線技術(shù),擬合出發(fā)音過程的舌位輪廓。在本發(fā)明的一個示例性實施例中,提供了ー種在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法。圖I為本發(fā)明實施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法的流程圖。如圖I所示,該方法包括步驟A,對于醫(yī)學(xué)圖像,利用唇部與背景的自動分割閾值k,對醫(yī)學(xué)影像中嘴唇與背景區(qū)域進(jìn)行ニ值化,得到唇部輪廓;如圖2所示,嘴唇位于發(fā)音器官的外側(cè)部位,由于其背景為白色,在邊緣模糊處找到合適的灰度閾值即可區(qū)分出唇部輪廓。
采用以下公式,基于灰度直方圖的最大類間方差方法獲取醫(yī)學(xué)影像中唇部與背景的自動分割閾值
權(quán)利要求
1.ー種在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法,包括 對于醫(yī)學(xué)圖像,利用唇部與背景的自動分割閾值,對所述醫(yī)學(xué)影像中嘴唇與背景區(qū)域進(jìn)行ニ值化,得到唇部輪廓; 在所述唇部輪廓包含的面部范圍內(nèi),提取上牙齒輪廓、下牙齒輪廓、上頜輪廓和下頜輪廓; 針對所述上頜輪廓和所述下頜輪廓之間圖像區(qū)域,獲取舌位輪廓的可靠邊緣點;以及 由所述舌位輪廓的可靠邊緣點擬合出舌位邊緣輪廓。
2.根據(jù)權(quán)利要求I所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法,其中,采用以下公式,基于灰度直方圖的最大類間方差方法獲取醫(yī)學(xué)影像中唇部與背景的自動分割閾值
3.根據(jù)權(quán)利要求I所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法,其中,所述提取上牙齒輪廓、下牙齒輪廓、上頜輪廓和下頜輪廓的步驟包括 針對所述唇部輪廓范圍內(nèi)的面部區(qū)域求出自動分割閾值,得到上牙齒輪廓,下牙齒輪廓及下頜初步輪廓; 由所述下頜初步輪廓,采用剛體輪廓匹配和曲線擬合方法得到所述下頜輪廓; 對于所述上牙齒輪廓朝向頭內(nèi)部方向的口腔和鼻腔區(qū)域,計算出上頜區(qū)域的邊緣點;以及 根據(jù)所述上牙齒輪廓的尖部以及所述上頜區(qū)域的邊緣點,擬合所述上頜輪廓。
4.根據(jù)權(quán)利要求3所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法,其中,所述針對唇部輪廓范圍內(nèi)的面部區(qū)域求出自動分割閾值,得到上牙齒輪廓,下牙齒輪廓及下頜初步輪廓的步驟包括 計算所述唇部輪廓范圍內(nèi)的面部區(qū)域的梯度圖像,把該梯度圖像歸一化到
之間,獲得灰度圖像I ; 獲取該灰度圖像I的直方圖,得到該直方圖的最大類間方差閾值;以及以該最大類間方差閾值對所述唇部輪廓范圍內(nèi)的面部區(qū)域進(jìn)行ニ值化,落在(r-255]范圍內(nèi)的圖像輪廓為上牙齒、下牙齒和下頜的初步輪廓。
在所述落在(r-255]范圍內(nèi)的圖像輪廓中,與其他器官輪廓分開的部分為所述上牙齒的輪廓,剰余的部分為下牙齒和下頜的初步輪廓; 在所述下牙齒和下頜的初步輪廓中,下巴上部的輪廓為下牙齒輪廓,剰余的部分為所述下頜初步輪廓。
5.根據(jù)權(quán)利要求4所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法,其中,采用以下公式,得到直方圖的最大類間方差閾值
6.根據(jù)權(quán)利要求3所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法,其中,對于所述上牙齒輪廓朝向頭內(nèi)部方向的口腔和鼻腔區(qū)域,采用Sobel算子計算出上頜區(qū)域的邊緣點。
7.根據(jù)權(quán)利要求3所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法,其中,根據(jù)上牙齒輪廓的尖部以及上頜區(qū)域的邊緣點,采用B樣條曲線方法擬合上頜輪廓。
8.根據(jù)權(quán)利要求I所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法,其中,所述針對上頜輪廓和所述下頜輪廓之間圖像區(qū)域,獲取舌位輪廓的可靠邊緣點的步驟包括 對所述上頜輪廓和所述下頜輪廓之間口腔區(qū)域部分圖像進(jìn)行銳化處理,使亮的區(qū)域更亮,暗的區(qū)域更暗; 采用0度及45度方向的區(qū)域最大梯度估計算法,在口腔區(qū)域部分的灰度圖像中計算舌部運動區(qū)域內(nèi)各像素的梯度;以及 取舌部運動區(qū)域最大梯度值的2/3作為閾值,梯度大于該閾值的像素組成舌位初步邊緣輪廓。
9.根據(jù)權(quán)利要求8所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法,其中,采用以下公式,計算舌部運動區(qū)域中像素的梯度 M(x, y) = I (X, y) *Mi+a *1 (X, y) *M2 其中,I(x,y)為舌部區(qū)域圖像某像素,M1為0度的梯度算子,M2為45度算子,a為加權(quán)系數(shù),這里取值為0.5。最后,M(x,y)即為舌部區(qū)域的邊緣圖像,M(x,y)中值越大的像素越可能是舌的邊緣。
10.根據(jù)權(quán)利要求8所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法,其中,所述取舌部運動區(qū)域最大梯度值的2/3作為閾值,梯度大于該閾值的像素組成初歩舌位邊緣輪廓的步驟之后還包括 以所述舌位邊緣輪廓作為初步舌位輪廓,采用兩階段的中值過濾方法對進(jìn)行錯誤點排除。
11.根據(jù)權(quán)利要求I所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法,其中,所述由舌位輪廓的可靠邊緣點擬合出舌位邊緣輪廓包括 對于每個舌位輪廓的可靠邊緣點,執(zhí)行以下步驟n次,得到n個縱向距離采用通過控制點的B樣條曲線方法,隨機(jī)抽取6個點擬合出曲線,計算出每個點到曲線的縱向距離;對于每個舌位輪廓的可靠邊緣點,計算隨機(jī)抽樣得到的35個縱向距離的平均值;去除縱向距離平均值最大的2 3個舌位輪廓的可靠邊緣點;以及利用剰余的舌位輪廓的可靠邊緣點,采用通過控制點的B樣條曲線方法擬合出舌位邊緣輪廓。
12.根據(jù)權(quán)利要求I至11中任一項所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法,其中,所述醫(yī)學(xué)圖像為X光圖像、超聲圖像或核磁共振圖像。
全文摘要
本發(fā)明提供了一種在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法。該方法包括對于醫(yī)學(xué)圖像,利用唇部與背景的自動分割閾值,對醫(yī)學(xué)影像中嘴唇與背景區(qū)域進(jìn)行二值化,得到唇部輪廓;在唇部輪廓包含的面部范圍內(nèi),提取上牙齒輪廓、下牙齒輪廓、上頜輪廓和下頜輪廓;針對上頜輪廓和下頜輪廓之間圖像區(qū)域,獲取舌位輪廓的可靠邊緣點;以及由舌位輪廓的可靠邊緣點擬合出舌位邊緣輪廓。本發(fā)明能自動從影像背景中分割出發(fā)音人頭部、器官區(qū)域,整個過程自動完成,無需人工交互。
文檔編號G06T7/00GK102831606SQ20121027218
公開日2012年12月19日 申請日期2012年8月1日 優(yōu)先權(quán)日2012年8月1日
發(fā)明者陶建華, 楊明浩, 張大偉 申請人:中國科學(xué)院自動化研究所