欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于高層馬爾可夫模型的低質(zhì)漢字初始骨架連接算法的制作方法

文檔序號:6362481閱讀:277來源:國知局
專利名稱:一種基于高層馬爾可夫模型的低質(zhì)漢字初始骨架連接算法的制作方法
技術(shù)領域
本發(fā)明涉及計算機圖像處理技術(shù),尤其是涉及一種針對低質(zhì)漢字的初始骨架連接方法。
背景技術(shù)
由于低質(zhì)漢字受到多種降質(zhì)因素的影響,其骨架提取較理想漢字難,即使能夠提取其初始骨架,也難以避免的出現(xiàn)骨架間斷、個別筆畫的骨架缺失和不符合人類視覺等情況,如果對這些斷裂的骨架進行連接使其符合人類視覺,那么低質(zhì)骨架提取的問題就迎刃而解了?,F(xiàn)有連接骨架方法有兩種,一種是最短哈密爾頓路徑方法,另一種是奇異性分析方法。哈密爾頓路徑是天文學家哈密爾頓提出的,意思是對于一個給定的網(wǎng)絡,確定起點和終點后,如果存在一條路徑穿過這個網(wǎng)絡,就說這個網(wǎng)絡存在哈密爾頓路徑。最短哈密爾頓路徑方法連接骨架首先利用軟K主曲線得到第一主成分線段集,然后利用哈密爾頓方法將這些第一主成分線段集構(gòu)造成一條初始哈密爾頓路徑。設完全連通圖<7 = (I^E),F是頂點集合,它包含了已求得的fc段主成分線段的2Jt個端點。哈密爾頓路徑(Hamiltonian Path,HP )被定義為一條穿過該圖中所有頂點一次的一條開路徑。開路徑即為:已知路徑信息},若
V0^V1.,則稱該路徑為“開路徑”。所求的哈密爾頓路徑就是求一條開銷最小的最優(yōu)路徑,
即求滿足代價函數(shù)最小的路徑。代價函數(shù)定義 為:
ε(Ρ) = /(Ρ)+Αι(Ρ),0<Α€Λ(I)
其中表示當前所得的哈密爾頓路徑總長度,Jl為參數(shù),用戶根據(jù)實際情況設置,是懲罰項,它可以表示為兩條相鄰主成分線段間銳角的度數(shù)總和,即= a +蘆,如

圖1所示。最短哈密爾頓路徑只能提取“一筆畫”符號的骨架,而大多數(shù)漢字是由偏旁部首共同構(gòu)成的,同時該方法符合筆畫連接的基本規(guī)則(漢字的初始骨架段連接并不是尋找一條最短哈密爾頓路徑),也不能添加人們在漢字筆畫方面研究總結(jié)的先驗知識。另外,該方法連接的的骨架常含有人造噪聲,需要進一步處理。因此,該方法不適用于連接低質(zhì)漢字骨架。另外一種連接初始骨架方法是奇異性分析方法。有作者采用奇異性分析方法對小波極大模方法提取出的初始骨架進行連接。該方法的思路是:通過奇異性分析尋找到初始骨架片的終點(terminal points)、角點(corner points)、及分隔線點(divider points),從而在奇異區(qū)域(筆畫交叉或連接處屬于奇異區(qū)域)構(gòu)成一個多邊形,尋找到這個多邊形的中點,最連接中點形成骨架。圖2是奇異區(qū)域骨架連接的例子,S是多邊形的中心,A、C、E、G、I和K是終點,B、D、F、H、J是角點。這種方法并不適用于低質(zhì)漢字,首先該方法尋找的角點和分隔線點均是在輪廓上定義的點,而低質(zhì)漢字的輪廓無法精確定位,從而也沒有辦法找到角點和分隔線點;其次低質(zhì)漢字的初始骨架存在許多斷裂,需要考慮的情況種類太多,從而無法實現(xiàn)。因此,該方法不能用于連接低質(zhì)漢字的初始骨架。總之,迄今為止,低質(zhì)漢字骨架連接依然是一個挑戰(zhàn)性的問題,特別是對于稀疏、斷裂和帶噪聲的低質(zhì)漢字,大部分現(xiàn)有的骨架提取算法并不能提取出符合人類視覺的骨架,即得不到滿足“好”骨架標準的骨架。

發(fā)明內(nèi)容
發(fā)明目的
本發(fā)明的目的是解決低質(zhì)漢字初始骨架斷裂的情況,利用高層馬爾可夫模型(High-level MRF)模型進行初始骨架連接,從而解決低質(zhì)漢字骨架提取這一模式識別和數(shù)字圖像處理中的難點和熱點問題。技術(shù)解決方案
本發(fā)明綜合特征分析、優(yōu)化和隨機場理論,提出了一種新的低質(zhì)漢字初始骨架連接算法,這種算法即使在骨架嚴重斷裂的情況下,依然能夠獲得較好的骨架連接結(jié)果。本發(fā)明提出了一種基于高層馬爾可夫模型的初始骨架連接方法,這種方法能夠?qū)⒌唾|(zhì)漢字骨架提取轉(zhuǎn)化為優(yōu)化問題。眾所周知,大部分漢字的結(jié)構(gòu)都是規(guī)則的,即“橫平豎直”等,我們希望將這些先驗加入到優(yōu)化方法中,從而使得到的骨架既能夠保持原始漢字的拓撲結(jié)構(gòu)又符合人類的視覺。本發(fā)現(xiàn)是在得到低質(zhì)漢字初始`骨架基礎上進行骨架連接的,低質(zhì)漢字初始骨架由一些能夠保持原始漢字形狀特征的骨架片(線段)組成的。具體處理技術(shù)方案如下:
本發(fā)現(xiàn)利用高層馬爾可夫隨機場模型連接初始骨架,在此模型下盡可能多的加入漢字骨架和結(jié)構(gòu)的先驗信息(如角度差、平移差、端點距離)作為約束,從而使得這個標記問題得到最優(yōu)解。在MAP-MRF框架下,地點集合是初始骨架,對應的每一個元素則是初始骨架線段。假定初始骨架由》 個初始骨架線段組成,地點集定義為S =在S中的地點通
過一個鄰域系統(tǒng)與其它的地點相關(guān),S的一個鄰域系統(tǒng)定義為況=講“ VieS},況是鄰近
地點集i的集合。這里的鄰域系統(tǒng)是一個全局鄰域即所有的初始骨架線段都是相鄰的。在MRF框架下,優(yōu)化問題實際上就是一個標記問題,即通過最小化勢團能量尋找
標簽集/。這里,用尤表示標簽集,在離散情況下,一個標簽假定力M個標簽集的一個離散值:1 =CLilO。標記問題實際上就是有標簽集£中分配一個標簽給地點隼S里面每一個元素。集合叫做標簽集£在地點集S里的一個標記。吉布斯分布的能量_可以描述成幾個項之和,每個項由確定大小的勢能團描述,即:
- Σ K.ci)+ Σ f^ Y1⑵
其中,是單點勢能,巧€^石)是雙點勢能》是三點勢能。
本發(fā)明中,勢團能量定義的原則是懲罰不想得到的結(jié)果,將這些情況的勢團能量定義得比較大,將想要的得到的結(jié)果的勢團能量定義得比較小,通過這樣的理論體系就可以方便地加入先驗信息。兩個線段間的勢團能量定義為:
權(quán)利要求
1.一種基高層馬爾可夫模型(High-level MRF)的低質(zhì)漢字初始骨架連接算法,其特征在于: (1)將低質(zhì)漢字骨架提取轉(zhuǎn)化為優(yōu)化問題,用High-levelMRF建立兩線段間的勢團能量; (2)通過尋找場的最小能量,確定初始骨架線段的連接方案并獲得最終的漢字骨架。
2.如權(quán)利要求1(I)所述的低質(zhì)漢字初始骨架連接算法,其特征在于建立基于高層馬爾可夫模型的兩線段間的勢團能量為:
3.如權(quán)利要求1(2)所述的低質(zhì)漢字骨架連接算法,其特征在于: 首先計算出任意兩線段間能量,如果能量足夠小,小到我們給定的閥值Γ,我們連接這兩條線段,更新地點集和標簽集,計算所有線段對間的勢能團能量,直到遍歷完任意線段對,過程如下: 假設初始骨架由I 條線段組成,地點集為s=, (1)初始化:設s=,閥值為 T ; (2)任意線段i(ieS),計算i和任意線段的勢能團能量WCO,如果Uin<τ,判斷連接方式,連接線段方式有兩種:一是延長其中一條線段,二是連接兩線段端點增加一條線段,更新s和/ ; (3)重復步驟2直到任意兩線段間的勢能團能量; (4)輸出最終骨架。
全文摘要
本發(fā)明公開了一種基于高層馬爾可夫隨機場模型(HighLevelMRF)的低質(zhì)漢字初始骨架連接算法,涉及到一種計算機圖像處理技術(shù)。該算法綜合優(yōu)化和隨機場理論,采用高層馬爾可夫隨機場模型連接初始骨架,基于此模型可以盡可能的加入漢字骨架和結(jié)構(gòu)的先驗信息(如角度差、平移差、端點距離)作為約束,從而使得這個標記問題得到最優(yōu)解。本發(fā)明提出的算法即使在嚴重骨架斷裂情況下也能夠獲得好的骨架,提高了低質(zhì)漢字骨架的準確性,可以運用在中文信息處理、辦公室自動化、機器翻譯、人工智能等技術(shù)領域。
文檔編號G06K9/20GK103186782SQ20121000000
公開日2013年7月3日 申請日期2012年1月1日 優(yōu)先權(quán)日2012年1月1日
發(fā)明者廖志武, 胡紹湘, 侯顯玲 申請人:廖志武, 胡紹湘
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
博爱县| 翼城县| 阳曲县| 运城市| 星座| 岳池县| 德兴市| 长治县| 潮安县| 玉环县| 通道| 嘉荫县| 秦安县| 镇坪县| 颍上县| 阿鲁科尔沁旗| 平远县| 玉树县| 祥云县| 天全县| 凤山县| 故城县| 辰溪县| 淅川县| 永春县| 诸暨市| 西林县| 沁源县| 调兵山市| 大城县| 南召县| 顺义区| 阳朔县| 玛多县| 镇康县| 杭锦旗| 囊谦县| 宜丰县| 霞浦县| 桐柏县| 霍邱县|