在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法

文檔序號：6374325閱讀：387來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法
技術(shù)領(lǐng)域：
本發(fā)明涉及信息技術(shù)行業(yè)圖像處理技術(shù)領(lǐng)域，具體地涉及ー種在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法。
背景技術(shù)：
目前人類對發(fā)音生理機(jī)理尚不明確，其中ー個重要原因是語音與器官間的運動關(guān)系缺乏有效的觀測和分析工具。目前針對口腔發(fā)音動態(tài)圖像研究的常用輔助手段有X光影像、超聲圖像及核磁共振突圖像等。這些醫(yī)學(xué)圖像具有分辨率低、成像模糊、噪聲嚴(yán)重的特點。盡管國內(nèi)外研究人員提出了很多從醫(yī)學(xué)圖像中自動提取和跟蹤人體器官運動輪廓的方法，但是由于人的發(fā)音器官種類較多、運動靈活多變、并且在視頻成圖像中相互遮擋嚴(yán)重，會出現(xiàn)幅度較寬的虛假輪廓等情況。申請人:發(fā)現(xiàn)傳統(tǒng)的圖像分析技術(shù)不適于低質(zhì)量醫(yī)學(xué)影像中的發(fā)音器官輪廓自動獲取，從低質(zhì)量醫(yī)學(xué)圖像中自動獲取發(fā)音器官輪廓目前任然是語音與視覺計算中的ー個挑戰(zhàn)，特別是針對發(fā)音中的ー些舌位運動細(xì)節(jié)。

發(fā)明內(nèi)容
(一 )要解決的技術(shù)問題為解決上述的一個或多個問題，本發(fā)明提供了ー種在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法。( ニ )技術(shù)方案根據(jù)本發(fā)明的ー個方面，提供了ー種在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法。該方法包括對于醫(yī)學(xué)圖像，利用唇部與背景的自動分割閾值，對醫(yī)學(xué)影像中嘴唇與背景區(qū)域進(jìn)行ニ值化，得到唇部輪廓；在唇部輪廓包含的面部范圍內(nèi)，提取上牙齒輪廓、下牙齒輪廓、上頜輪廓和下頜輪廓；針對上頜輪廓和下頜輪廓之間圖像區(qū)域，獲取舌位輪廓的可靠邊緣點；以及由舌位輪廓的可靠邊緣點擬合出舌位邊緣輪廓。(三)有益效果從上述技術(shù)方案可以看出，本發(fā)明在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法具有以下有益效果(I)本發(fā)明能自動從影像背景中分割出發(fā)音人頭部、器官區(qū)域，整個過程自動完成，無需人工交互；(2)本發(fā)明針對低質(zhì)量醫(yī)學(xué)影像中舌位成像模糊、噪聲和遮擋嚴(yán)重的情況，能很好獲取發(fā)音過程的舌位輪廓及舌位運動細(xì)節(jié)；(3)本發(fā)明能自動同時獲取包括唇、上下頜、牙齒、舌的運動輪廓，有利于直觀觀測和分析發(fā)音過程中的各發(fā)音器官運動特征。

圖I為本發(fā)明實施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法的流程圖。圖2是發(fā)音器官X光圖像；圖3是對于圖2所示X光圖像，由本發(fā)明實施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法中步驟A和步驟B得到的上唇輪廓、下唇輪廓、上牙齒輪廓、下牙齒輪廓、上頜輪廓、下頜輪廓及舌位初步輪廓的示意圖；圖4是本發(fā)明實施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法中擬合下頜輪廓曲線的不意圖；圖5是本發(fā)明在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法中擬合舌位輪廓的流程圖；圖6是本發(fā)明在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法中獲取舌位輪廓的可靠邊緣點步驟中0度方向的區(qū)域最大梯度估計的11X11大小的一個模板示意圖；
圖7是本發(fā)明在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法中基于隨機(jī)抽取一致性檢驗(RANSAC)和過控制點B樣條曲線擬合的舌部輪廓的示意圖；圖8是說話人發(fā)“Ban”音的X光圖像序列中，利用本發(fā)明實施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法所提取的上唇、下唇、上牙齒、下牙齒、上頜、下頜及舌位輪廓的效果圖；圖9是利用本發(fā)明實施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法提取超聲圖像中舌位輪廓的效果圖；圖10是本發(fā)明實施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法提取核磁共振圖像中舌部輪廓的效果圖。
具體實施例方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚明白，以下結(jié)合具體實施例，并參照附圖，對本發(fā)明進(jìn)ー步詳細(xì)說明。需要說明的是，在附圖或說明書描述中，相似或相同的部分都使用相同的圖號。且在附圖中，以簡化或是方便標(biāo)示。再者，附圖中未繪示或描述的實現(xiàn)方式，為所屬技術(shù)領(lǐng)域中普通技術(shù)人員所知的形式。另外，雖然本文可提供包含特定值的參數(shù)的示范，但應(yīng)了解，參數(shù)無需確切等于相應(yīng)的值，而是可在可接受的誤差容限或設(shè)計約束內(nèi)近似于相應(yīng)的值。本發(fā)明基于傳統(tǒng)的圖像處理方法，在發(fā)音器官輪廓提取與跟蹤的過程中，采用灰度直方圖及最大類間自動閾值提取方法，實現(xiàn)對嘴唇輪廓的自動提?。徊捎米赃m應(yīng)邊緣梯度方法，結(jié)合已知形狀的剛體輪廓投影匹配和曲線擬合技術(shù)，提取出牙齒、上下頜輪廓；利用最大梯度估計的模糊圖像邊緣檢測算法，獲取發(fā)音過程中ロ腔內(nèi)部舌位邊緣點，并結(jié)合隨機(jī)抽樣一致性驗證(RANSAC)算法和B樣條曲線擬合方法，去除錯誤的舌位邊緣輪廓點，采用通過控制點的B樣條曲線技術(shù)，擬合出發(fā)音過程的舌位輪廓。在本發(fā)明的一個示例性實施例中，提供了ー種在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法。圖I為本發(fā)明實施例在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓方法的流程圖。如圖I所示，該方法包括步驟A，對于醫(yī)學(xué)圖像，利用唇部與背景的自動分割閾值k，對醫(yī)學(xué)影像中嘴唇與背景區(qū)域進(jìn)行ニ值化，得到唇部輪廓；如圖2所示，嘴唇位于發(fā)音器官的外側(cè)部位，由于其背景為白色，在邊緣模糊處找到合適的灰度閾值即可區(qū)分出唇部輪廓。
采用以下公式，基于灰度直方圖的最大類間方差方法獲取醫(yī)學(xué)影像中唇部與背景的自動分割閾值
權(quán)利要求
1.ー種在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法，包括對于醫(yī)學(xué)圖像，利用唇部與背景的自動分割閾值，對所述醫(yī)學(xué)影像中嘴唇與背景區(qū)域進(jìn)行ニ值化，得到唇部輪廓；在所述唇部輪廓包含的面部范圍內(nèi)，提取上牙齒輪廓、下牙齒輪廓、上頜輪廓和下頜輪廓；針對所述上頜輪廓和所述下頜輪廓之間圖像區(qū)域，獲取舌位輪廓的可靠邊緣點；以及由所述舌位輪廓的可靠邊緣點擬合出舌位邊緣輪廓。
2.根據(jù)權(quán)利要求I所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法，其中，采用以下公式，基于灰度直方圖的最大類間方差方法獲取醫(yī)學(xué)影像中唇部與背景的自動分割閾值
3.根據(jù)權(quán)利要求I所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法，其中，所述提取上牙齒輪廓、下牙齒輪廓、上頜輪廓和下頜輪廓的步驟包括針對所述唇部輪廓范圍內(nèi)的面部區(qū)域求出自動分割閾值，得到上牙齒輪廓，下牙齒輪廓及下頜初步輪廓；由所述下頜初步輪廓，采用剛體輪廓匹配和曲線擬合方法得到所述下頜輪廓；對于所述上牙齒輪廓朝向頭內(nèi)部方向的口腔和鼻腔區(qū)域，計算出上頜區(qū)域的邊緣點；以及根據(jù)所述上牙齒輪廓的尖部以及所述上頜區(qū)域的邊緣點，擬合所述上頜輪廓。
4.根據(jù)權(quán)利要求3所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法，其中，所述針對唇部輪廓范圍內(nèi)的面部區(qū)域求出自動分割閾值，得到上牙齒輪廓，下牙齒輪廓及下頜初步輪廓的步驟包括計算所述唇部輪廓范圍內(nèi)的面部區(qū)域的梯度圖像，把該梯度圖像歸一化到
之間，獲得灰度圖像I ; 獲取該灰度圖像I的直方圖，得到該直方圖的最大類間方差閾值；以及以該最大類間方差閾值對所述唇部輪廓范圍內(nèi)的面部區(qū)域進(jìn)行ニ值化，落在(r-255]范圍內(nèi)的圖像輪廓為上牙齒、下牙齒和下頜的初步輪廓。
在所述落在(r-255]范圍內(nèi)的圖像輪廓中，與其他器官輪廓分開的部分為所述上牙齒的輪廓，剰余的部分為下牙齒和下頜的初步輪廓；在所述下牙齒和下頜的初步輪廓中，下巴上部的輪廓為下牙齒輪廓，剰余的部分為所述下頜初步輪廓。
5.根據(jù)權(quán)利要求4所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法，其中，采用以下公式，得到直方圖的最大類間方差閾值
6.根據(jù)權(quán)利要求3所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法，其中，對于所述上牙齒輪廓朝向頭內(nèi)部方向的口腔和鼻腔區(qū)域，采用Sobel算子計算出上頜區(qū)域的邊緣點。
7.根據(jù)權(quán)利要求3所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法，其中，根據(jù)上牙齒輪廓的尖部以及上頜區(qū)域的邊緣點，采用B樣條曲線方法擬合上頜輪廓。
8.根據(jù)權(quán)利要求I所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法，其中，所述針對上頜輪廓和所述下頜輪廓之間圖像區(qū)域，獲取舌位輪廓的可靠邊緣點的步驟包括對所述上頜輪廓和所述下頜輪廓之間口腔區(qū)域部分圖像進(jìn)行銳化處理，使亮的區(qū)域更亮，暗的區(qū)域更暗；采用0度及45度方向的區(qū)域最大梯度估計算法，在口腔區(qū)域部分的灰度圖像中計算舌部運動區(qū)域內(nèi)各像素的梯度；以及取舌部運動區(qū)域最大梯度值的2/3作為閾值，梯度大于該閾值的像素組成舌位初步邊緣輪廓。
9.根據(jù)權(quán)利要求8所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法，其中，采用以下公式，計算舌部運動區(qū)域中像素的梯度 M(x, y) = I (X, y) *Mi+a *1 (X, y) *M2 其中，I(x，y)為舌部區(qū)域圖像某像素，M1為0度的梯度算子，M2為45度算子，a為加權(quán)系數(shù)，這里取值為0.5。最后，M(x，y)即為舌部區(qū)域的邊緣圖像，M(x，y)中值越大的像素越可能是舌的邊緣。
10.根據(jù)權(quán)利要求8所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法，其中，所述取舌部運動區(qū)域最大梯度值的2/3作為閾值，梯度大于該閾值的像素組成初歩舌位邊緣輪廓的步驟之后還包括以所述舌位邊緣輪廓作為初步舌位輪廓，采用兩階段的中值過濾方法對進(jìn)行錯誤點排除。
11.根據(jù)權(quán)利要求I所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法，其中，所述由舌位輪廓的可靠邊緣點擬合出舌位邊緣輪廓包括對于每個舌位輪廓的可靠邊緣點，執(zhí)行以下步驟n次，得到n個縱向距離采用通過控制點的B樣條曲線方法，隨機(jī)抽取6個點擬合出曲線，計算出每個點到曲線的縱向距離；對于每個舌位輪廓的可靠邊緣點，計算隨機(jī)抽樣得到的35個縱向距離的平均值；去除縱向距離平均值最大的2 3個舌位輪廓的可靠邊緣點；以及利用剰余的舌位輪廓的可靠邊緣點，采用通過控制點的B樣條曲線方法擬合出舌位邊緣輪廓。
12.根據(jù)權(quán)利要求I至11中任一項所述的在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法，其中，所述醫(yī)學(xué)圖像為X光圖像、超聲圖像或核磁共振圖像。
全文摘要
本發(fā)明提供了一種在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法。該方法包括對于醫(yī)學(xué)圖像，利用唇部與背景的自動分割閾值，對醫(yī)學(xué)影像中嘴唇與背景區(qū)域進(jìn)行二值化，得到唇部輪廓；在唇部輪廓包含的面部范圍內(nèi)，提取上牙齒輪廓、下牙齒輪廓、上頜輪廓和下頜輪廓；針對上頜輪廓和下頜輪廓之間圖像區(qū)域，獲取舌位輪廓的可靠邊緣點；以及由舌位輪廓的可靠邊緣點擬合出舌位邊緣輪廓。本發(fā)明能自動從影像背景中分割出發(fā)音人頭部、器官區(qū)域，整個過程自動完成，無需人工交互。
文檔編號G06T7/00GK102831606SQ20121027218
公開日2012年12月19日申請日期2012年8月1日優(yōu)先權(quán)日2012年8月1日
發(fā)明者陶建華, 楊明浩, 張大偉申請人:中國科學(xué)院自動化研究所

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：陶建華;楊明浩;張大偉
技術(shù)所有人：中國科學(xué)院自動化研究所
我是此專利的發(fā)明人

上一篇：變電站模型與調(diào)度主站cim模型的合并方法與系統(tǒng)的制作方法
上一篇：圖像處理裝置以及圖像處理方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

如何正確的發(fā)聲相關(guān)技術(shù)

輪廓度測量方法相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

在醫(yī)學(xué)影像中獲取發(fā)音器官輪廓的方法