專利名稱:一種基于書法圖像的可視化重現(xiàn)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計算機圖像及三維動畫技術(shù)領(lǐng)域:
,尤其涉及一種基于書法圖像的可視化重現(xiàn)方法。
背景技術(shù):
中國書法是中國文化的一種重要體現(xiàn)形式,提供一種新的方法讓人們更加深入地了解和熟悉中國書法,特別是讓中國書法藝術(shù)走出世界,讓世界了解中國書法藝術(shù)并愛上書法藝術(shù),而不僅讓她成為書法家的專利或特權(quán)就具備了重要的社會意義和學術(shù)意義。
目前對書法方面的應用開發(fā),得到了許多研究者的關(guān)注,但是書法圖像的可視化重現(xiàn)還是一個空白的領(lǐng)域。在現(xiàn)代數(shù)字圖像處理(麥特爾等著)公布的輪廓提取算法可以得到文字圖像的輪廓信息。在模式識別信件(Pattern Recognition Letters,135--12,1992)公布的細化方法可以得到形狀的骨架信息。在第10屆計算機圖像和應用太平洋會議論文集(Proc.Pacific Graphics 2002,Beijing,China,pp.439-441)公布的方法是臺灣國立大學開發(fā)的交互式觸覺系統(tǒng),當用戶拿著輸入設(shè)備,該設(shè)備可以模擬出寫字過程中的作用力從而給用戶以實際的感受。該系統(tǒng)主要通過建立以下基本模型來實現(xiàn)毛筆的3D模型,可以模擬毛的彈性特性;Ink-spreading模型模擬墨水在紙上的渲染效果。第九屆國際信息可視化會議論文集(Proceedings of the Ninth International Conference on InformationVisualisation,London,England,p.221-226)公布的方法通過采用一個參數(shù)化的VirtualBrush模型系統(tǒng)來合成具有真實感的中文書法創(chuàng)作,系統(tǒng)通過參數(shù)化的模型來模擬物理書寫筆劃的過程,其中參數(shù)化模型包括3D的毛筆幾何模型;筆毛的特性模型;筆劃中的墨水模型;并通過對一些常用中文字體風格楷體、隸書、行書等建立相互關(guān)系,實現(xiàn)了不同細節(jié)程度上模擬文字不同的筆觸效果,然后結(jié)合特定的人機界面技術(shù),可以讓用戶進行電子書法的創(chuàng)作。在2006國際多媒體和展覽會會議論文集(2006 International Conference 0nMultimedia & Expo,WEB BASED CHINESE CALLIGRAPHY LEARNING WITH 3-D VISUALIZATIONMETHOD,Toronto,Canada)公布了通過對文字的各個部首按照平滑度規(guī)則提取筆順,并結(jié)合書寫規(guī)則完成整個文字的筆順提取的方法。
書法可重視化過程的研究中的一個關(guān)鍵點就是通過對一幅離線的書法圖像提取文字的筆順和筆寬。對于筆順的提取,一直作為文字識別中的一個關(guān)鍵研究方向得到了廣泛的關(guān)注,早在1996年IEEE第13屆模式識別國際會議(Proc.13th Int’l Conf.Pattern Recognition,pp.150-154)公布的方法中首先假設(shè)在手寫體書寫過程中使用最小曲率,然后將問題轉(zhuǎn)換為旅行者問題來完成筆順的提取,這種方法在針對中文書法字多個部首的筆順提取上還有很大的局限性;還有學者提出了根據(jù)骨架的連通信息進行筆順提取,如《模式分析和機器學習學報》雜志2000年第22卷中(IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINEINTELLIGENCE,VOL.22,NO.9,pp.938-949,SEPTEMBER 2000)公布了對一筆完成的手寫文字圖像進行筆順提取的方法,該方法首先按照骨架上邊的性質(zhì)進行標注,然后通過利用標注信息對圖從起始點到終止點進行跟蹤來恢復時序信息,這種方法需要一個標注的過程,且運算量比較大。
發(fā)明內(nèi)容本發(fā)明的目的是提供一種基于書法圖像的可視化重現(xiàn)方法。
包括以下步驟。
1)對輸入的書法文字圖像進行字體輪廓提??;2)對字體輪廓使用細化算法,得到文字的骨架信息;3)字體結(jié)構(gòu)分析,假設(shè)G={g1,g2,...,gn}表示骨架圖,其中g(shù)i為子圖或者部首,子圖由一組互相之間有通路連接的基本筆劃組成,通過字體結(jié)構(gòu)分析算法來計算G中任何兩個子圖之間的位置關(guān)系得到文字的結(jié)構(gòu);4)對文字的各個部首按照平滑度規(guī)則提取筆順,并結(jié)合書寫規(guī)則完成整個文字的筆順提?。?)筆寬信息w的提取,對骨架點按照最大輪廓包圍度算法進行筆寬信息w的提?。?)可視化重現(xiàn)前臺播放引擎的實現(xiàn),其中包括書法書寫虛擬場景中毛筆模型、紙張模型、墨跡軌跡點模型的真實感顯示過程;所述的對輸入的書法文字圖像進行字體輪廓提取輪廓提取的算法通過掏空內(nèi)部點得到,如果原圖中有一點為黑,且它的8個相鄰點都是黑色時,則此點是內(nèi)部點,將該點刪除,并最終完成輪廓提取過程。
字體結(jié)構(gòu)分析,假設(shè)G={g1,g2,...,gn}表示骨架圖,其中g(shù)i為子圖,子圖由一組互相之間有通路連接的基本筆劃組成,通過字體結(jié)構(gòu)分析算法來計算G中任何兩個子圖之間的位置關(guān)系得到文字的結(jié)構(gòu)當文字圖像的骨架信息提取完,用G={g1,g2,...,gn}來定義骨架圖,其中g(shù)i為子圖,子圖是由一組互相之間有通路連接的基本筆劃組成,為獲取骨架圖中任意兩個子圖gk和gl之間的位置關(guān)系,其中g(shù)k是由a個筆劃組成,記作{s1,s2,...,sa},gl由b個筆劃組成,記作{s1,s2,...,sb},兩個子圖之間的位置關(guān)系通過一個二元組R={Rh,Rv}來表示,其中Rh和Rv分別表示水平方向和垂直方向的位置關(guān)系,子圖間的位置關(guān)系總共可以分為四類負X軸方向、正X軸方向、負Y軸方向、正Y軸方向,通過下面的公式來計算Rh,
Rh=T(hl,hr,其中T=1,if(hl>hr)0,if(hl=hr)-1,if(hl<hr)]]>,hl表示gk在gl負X軸方向的可能性,hr表示gk在gl幣X軸方向的可能性,Rv、hl和hb也通過類似Rh,hl和hr的方法來進行定義,h(統(tǒng)一代表hl,hr,ht,hb)通過下面的公式進行計算h=Σi=1,j=1i=a,j=bp(f1(si),f2(sj))a*b]]>,si∈gk,sj∈gl,其中p=0,if(f1(si)≥f2(sj))1,if(f1(si)<f2(sj)),]]>函數(shù)f1和f2根據(jù)不同的方向會有不同的函數(shù)定義,具體函數(shù)的定義參見下表中的詳細定義,
通過以上方法,分析出文字的字體結(jié)構(gòu)信息。
筆寬信息w的提取對骨架點按照最大輪廓包圍度算法進行筆寬信息w的提??;筆寬信息w按如下方法計算,d表示目標像素點到最外層的環(huán)的距離,且該環(huán)上的所有點都是黑色的點,該環(huán)上的數(shù)目用Tb來表示,Td+1表示為灰色環(huán)上黑點的數(shù)目,灰環(huán)是從目標點出發(fā)的第一個不是所有點都為黑色的環(huán)(見圖7),灰環(huán)上所有黑點的數(shù)目記作Td+1,Td+1=(2(d+1)-1)2-(2d-1)2=8d,因此,w公式計算為w=d+TbTd+1---1.]]>可視化重現(xiàn)前臺播放引擎的實現(xiàn),其中包括書法書寫虛擬場景中毛筆模型、紙張模型、墨跡軌跡點模型的真實感顯示過程客戶端可視化重現(xiàn)書寫過程重現(xiàn)過程在選擇特定的文字圖像后,書法數(shù)據(jù)提取引擎完成從后臺數(shù)據(jù)庫的文字筆順和筆寬信息的提取和重構(gòu),在客戶端播放模塊中裝載毛筆、紙張等模型,按照文字筆順的時序信息完成毛筆運動軌跡和墨跡軌跡點真實感顯示過程。
本發(fā)明的有益效果1.該方法根據(jù)書法圖像完成書法書寫過程的可視化再現(xiàn)的動畫,是計算機圖形和三維真實感顯示技術(shù)結(jié)合書法藝術(shù)的一個新應用;2.該方法在書法圖像的筆順提取方面采用文字的字體結(jié)構(gòu)分析,并結(jié)合了漢字本身的書寫規(guī)則來完成筆順的提取過程;3.該方法根據(jù)最大輪廓包圍度算法完成了對骨架點筆寬信息w的快速提??;4.該方法采用重建毛筆、紙張、墨點運動軌跡模型實現(xiàn)書法過程的可視化再現(xiàn),結(jié)果真實自然,具有較高的可信度。
圖1是基于書法圖像的可視化重現(xiàn)方法流程示意圖;圖2是本發(fā)明的客戶端播放模塊場景示意圖;圖3(a)是原始文字圖像示意圖;圖3(b)是原始文字圖像的輪廓示意圖;圖3(c)是圖像的骨架和字體結(jié)構(gòu)分析示意圖;圖4是播放引擎在書法書寫重現(xiàn)過程中的屏幕截圖;圖5(a)是原始文字圖像示意圖;圖5(b)是原始文字圖像的輪廓示意圖;圖5(c)是圖像經(jīng)細化算法后的骨架示意圖;圖5(d)是骨架的字體結(jié)構(gòu)分析示意圖;圖5(e)是筆順提取后線段的書寫順序的示意圖;圖6是播放引擎在書法書寫重現(xiàn)過程中的屏幕截圖,截圖的時間間隔為3秒/幅;圖7是筆寬信息提取示意圖;具體實施方式
一種基于書法圖像的可視化重現(xiàn)方法,其目的是根據(jù)輸入的一張書法文字圖像來實現(xiàn)書法書寫過程的動畫序列,具體實施的技術(shù)方案及步驟如下提取書法圖像的骨架信息,提取文字的筆順信息和筆寬信息。對于筆順的提取,我們采用了結(jié)合漢字文字結(jié)構(gòu)分析方法來進行筆順提取,并最后實現(xiàn)三維模型的構(gòu)建來虛擬可視化書寫的動畫重現(xiàn)過程。
測試圖像為書法文字圖像,我們離線地規(guī)整所有圖像并去掉噪聲,且每幅圖像中只包含一個獨立的文字。為了建立包含多種文字的重現(xiàn)樣本集,我們對100個文字圖像進行規(guī)整,書法文字圖像有不同作者不同年代的代表作,字體包括楷書、行楷、行書、草書等多種類型。圖1是本發(fā)明的詳細流程圖。根據(jù)圖1所示,方法流程主要由6個步驟步驟1對輸入的書法文字圖像進行字體輪廓提取;步驟2圖像細化在原始圖像使用圖像細化算法,將圖像中的粗線進行剝離,得到寬度為一個像素點的骨架信息。
步驟3字體結(jié)構(gòu)分析,分析字體結(jié)構(gòu)的過程如下當文字圖像的骨架信息提取完,可用G={g1,g2,...,gn}來定義骨架圖,其中g(shù)i為子圖,子圖是由一組互相之間有通路連接的基本筆劃組成,為獲取子圖gk和gl之間的位置關(guān)系,其中g(shù)k是由a個筆劃組成,計作{s1,s2,...,sa},gl由b個筆劃作成,可以記作{s1,s2,...,sb},兩個子圖之間的位置關(guān)系通過一個二元組R={rh,rv}來進行表示,其中Rh表示水平方向的位置關(guān)系,Rv表示垂直方向的位置關(guān)系,相互的位置關(guān)系總共可以分為四類負X軸方向、正X軸方向、負Y軸方向、正Y軸方向,通過下面的公式來計算Rh,Rh=T(hl,hr),其中T=1,if(hl>hr)0,if(hl=hr)-1,if(hl<hr)]]>,hl表示gk在gl負X軸方向的可能性,hr表示gk在gl正X軸方向的可能性,Rv、ht和hb也通過類似Rh,hlandhr的方法來進行定義,h(統(tǒng)一代表hl,hr,hl,hb)可以通過下面的公式進行計算h=Σi=1,j=1i=a,j=bp(f1(si),f2(sj))a*b]]>,si∈gk,sj∈gl,其中p=0,if(f1(si)≥f2(sj))1,if(f1(si)<f2(sj)),]]>函數(shù)f1和f2根據(jù)不同的方向會有不同的函數(shù)定義,具體函數(shù)的定義參見下表中的詳細定義,
步驟4得到文字的字體結(jié)構(gòu)后,利用漢字書寫規(guī)則對文字的每個子筆劃或部首使用平滑度算法來進行筆順重建;實驗結(jié)果證明,本方法在提取筆順在針對一些特殊風格的字體如行草或草書上,能夠有效提出字體結(jié)構(gòu)信息,有效地提高了筆順提取的正確率。
步驟5筆寬提取利用文字的輪廓使用最大輪廓包圍度算法進行筆寬計算,筆寬信息w按如下方法計算,d表示目標像素點到最外層的環(huán)的距離,且該環(huán)上的所有點都是黑色的點,該環(huán)上的數(shù)目用Tb來表示,Td+1表示為灰色環(huán)上黑點的數(shù)目,灰環(huán)是從目標點出發(fā)的第一個不是所有點都為黑色的環(huán)(見圖7),灰環(huán)上所有黑點的數(shù)目記作Td+1,Td+1=(2(d+1)-1)2-(2d-1)2=8d,因此,w公式計算為w=d+TbTd+1.]]>
步驟6選擇特定的文字圖像后,書法數(shù)據(jù)提取引擎完成從后臺數(shù)據(jù)庫的文字筆順和筆寬信息的提取和重構(gòu),在客戶端播放模塊中裝載毛筆、紙張模型,按照文字筆順的時序信息完成毛筆運動軌跡和墨跡軌跡點真實感顯示過程。
實施例1圖3(a)是輸入的原始書法文字圖像“靜”1)首先是對該文字圖像提取完輪廓,輪廓提取的結(jié)果如圖3(b)所示。
2)對文字輪廓運用細化算法,細化時將輪廓中的粗線進行逐層剝離,最后得到寬度僅為一個像素點的骨架信息,細化結(jié)果如圖3(c)中的點線所示。
3)按照骨架信息,可以得到該文字共有4個子圖組成,在圖3(c)中分別使用綠色、藍色、橘黃色,分別用g1,g2,g3來表示。對3個子圖使用字體結(jié)構(gòu)分析算法后,得到以下結(jié)果
從上表的結(jié)果中,分析出該字為左右結(jié)構(gòu),左邊則是上中下結(jié)構(gòu)。
4)結(jié)合書寫規(guī)則,按照先左后右,先上后下,即g1,g2,g3的先后次序逐個對3個子圖按照平滑度規(guī)則提取筆順;5)按照輪廓最大包圍度算法提取文字的筆寬,按照筆寬的定義公式1,逐個計算骨架上的寬度信息,然后將筆順和筆寬信息寫入數(shù)據(jù)庫,完成書法圖像預處理階段的任務(wù);6)用戶在客戶端進行播放時,首先選擇該文字圖像后,此時書法數(shù)據(jù)提取引擎會按照選定的文字從后臺數(shù)據(jù)庫進行文字筆順和筆寬信息的提取和重構(gòu),在客戶端播放模塊中裝載毛筆、紙張等模型,按照文字筆順的時序信息完成毛筆運動軌跡和墨跡軌跡點真實感顯示過程。
圖4是播放引擎在書法書寫重現(xiàn)過程中的屏幕截圖;實施例2圖5(a)是輸入的原始書法文字圖像“清”1)首先是對該文字圖像提取完輪廓,輪廓提取的結(jié)果如圖5(b)所示。
2)對文字輪廓運用細化算法,細化時將輪廓中的粗線進行逐層剝離,最后得到寬度僅為一個像素點的骨架信息,細化結(jié)果如圖5(c)所示。
3)按照骨架信息,可以得到該文字共有4個子圖組成,在圖5(d)中分別使用綠色、藍色、紫色、橘黃色,分別用g1,g2,g3,g4來表示。對4個子圖使用字體結(jié)構(gòu)分析算法后,得到以下結(jié)果
從上表的結(jié)果中,分析出該字為左右結(jié)構(gòu),左邊則是上中下結(jié)構(gòu)。
4)結(jié)合書寫規(guī)則,先左后右,先上后下,即g1,g2,g3,g4的先后次序逐個對4個子圖按照平滑度規(guī)則提取筆順,筆順提取后線段的書寫順序如圖5(e);5)按照輪廓最大包圍度算法提取文字的筆寬,按照筆寬的定義公式1,逐個計算骨架上的寬度信息,然后將筆順和筆寬信息寫入數(shù)據(jù)庫,完成書法圖像預處理階段的任務(wù);6)用戶在客戶端進行播放時,首先選擇該文字圖像后,此時書法數(shù)據(jù)提取引擎會按照選定的文字從后臺數(shù)據(jù)庫進行文字筆順和筆寬信息的提取和重構(gòu),在客戶端播放模塊中裝載毛筆、紙張等模型,按照文字筆順的時序信息完成毛筆運動軌跡和墨跡軌跡點真實感顯示過程。
圖6是播放引擎在書法書寫重現(xiàn)過程中的多個屏幕截圖,截圖的時間間隔為3秒/幅。
權(quán)利要求
1.一種基于書法圖像的可視化重現(xiàn)方法,其特征在于包括以下步驟1)對輸入的書法文字圖像進行字體輪廓提取;2)對字體輪廓使用細化算法,得到文字的骨架信息;3)字體結(jié)構(gòu)分析,假設(shè)G={g1,g2,...,gn}表示骨架圖,其中g(shù)i為子圖或者部首,子圖由一組互相之間有通路連接的基本筆劃組成,通過字體結(jié)構(gòu)分析算法來計算G中任何兩個子圖之間的位置關(guān)系得到文字的結(jié)構(gòu);4)對文字的各個部首按照平滑度規(guī)則提取筆順,并結(jié)合書寫規(guī)則完成整個文字的筆順提取;5)筆寬信息w的提取,對骨架點按照最大輪廓包圍度算法進行筆寬信息w的提?。?)可視化重現(xiàn)前臺播放引擎的實現(xiàn),其中包括書法書寫虛擬場景中毛筆模型、紙張模型、墨跡軌跡點模型的真實感顯示過程;
2.根據(jù)權(quán)利要求
1所述的一種基于書法圖像的可視化重現(xiàn)方法,其特征在于,所述的對輸入的書法文字圖像進行字體輪廓提取輪廓提取的算法通過掏空內(nèi)部點得到,如果原圖中有一點為黑,且它的8個相鄰點都是黑色時,則此點是內(nèi)部點,將該點刪除,并最終完成輪廓提取過程。
3.根據(jù)權(quán)利要求
1所述的一種基于書法圖像的可視化重現(xiàn)方法,其特征在于,所述的字體結(jié)構(gòu)分析,假設(shè)G={g1,g2,...,gn}表示骨架圖,其中g(shù)i為子圖,子圖由一組互相之間有通路連接的基本筆劃組成,通過字體結(jié)構(gòu)分析算法來計算G中任何兩個子圖之間的位置關(guān)系得到文字的結(jié)構(gòu)當文字圖像的骨架信息提取完,用G={g1,g2,...,gn}來定義骨架圖,其中g(shù)i為子圖,子圖是由一組互相之間有通路連接的基本筆劃組成,為獲取骨架圖中任意兩個子圖gk和gl之間的位置關(guān)系,其中g(shù)k是由a個筆劃組成,記作{s1,s2,...,sa},gl由b個筆劃組成,記作{s1,s2,...,sb},兩個子圖之間的位置關(guān)系通過一個二元組R={Rh,Rv}來表示,其中Rh和Rv分別表示水平方向和垂直方向的位置關(guān)系,子圖間的位置關(guān)系總共可以分為四類負X軸方向、正X軸方向、負Y軸方向、正Y軸方向,通過下面的公式來計算Rh,Rh=T(hl,hr),其中T=1,if(hl>hr)0,if(hl=hr)-1,if(hl<hr),]]>hl表示gk在gl負X軸方向的可能性,hr表示gk在gl正X軸方向的可能性,Rv、ht和hb也通過類似Rh,hl和hr的方法來進行定義,h(統(tǒng)一代表hl,hr,ht,hb)通過下面的公式進行計算h=Σi=1,j=1i=a,j=bp(f1(si),f2(sj))a*b,]]>si∈gk,sj∈gl,其中p=0,if(f1(si)≥f2(sj))1,if(f1(si)<f2(sj)),]]>函數(shù)f1和f2根據(jù)不同的方向會有不同的函數(shù)定義,具體函數(shù)的定義參見下表中的詳細定義,
通過以上方法,分析出文字的字體結(jié)構(gòu)信息。
4.根據(jù)權(quán)利要求
1所述的一種基于書法圖像的可視化重現(xiàn)方法,其特征在于,所述的筆寬信息w的提取對骨架點按照最大輪廓包圍度算法進行筆寬信息w的提??;筆寬信息w按如下方法計算,d表示目標像素點到最外層的環(huán)的距離,且該環(huán)上的所有點都是黑色的點,該環(huán)上的數(shù)目用Tb來表示,Td+1表示為灰色環(huán)上黑點的數(shù)目,灰環(huán)是從目標點出發(fā)的第一個不是所有點都為黑色的環(huán)(見圖7),灰環(huán)上所有黑點的數(shù)目記作Td+1,Td+1=(2(d+1)-1)2-(2d-1)2=8d,因此,w公式計算為w=d+TbTd+1---1.]]>
5.根據(jù)權(quán)利要求
1所述的一種基于書法圖像的可視化重現(xiàn)方法,其特征在于,所述的可視化重現(xiàn)前臺播放引擎的實現(xiàn),其中包括書法書寫虛擬場景中毛筆模型、紙張模型、墨跡軌跡點模型的真實感顯示過程客戶端可視化重現(xiàn)書寫過程重現(xiàn)過程在選擇特定的文字圖像后,書法數(shù)據(jù)提取引擎完成從后臺數(shù)據(jù)庫的文字筆順和筆寬信息的提取和重構(gòu),在客戶端播放模塊中裝載毛筆、紙張等模型,按照文字筆順的時序信息完成毛筆運動軌跡和墨跡軌跡點真實感顯示過程。
專利摘要
本發(fā)明公開了一種基于書法圖像的可視化重現(xiàn)方法,用來根據(jù)一輸入的書法文字圖像來產(chǎn)生對應書寫過程的動畫序列,其特征是輸入的書法文字圖像進行字體提取輪廓后應用細化算法,得到文字的骨架信息,然后通過字體結(jié)構(gòu)分析對文字進行部首切分,接著對文字的各個部首按照平滑度規(guī)則提取筆順,并結(jié)合書寫規(guī)則完成整個文字的筆順提取,然后使用輪廓最大包圍度算法提取文字的筆寬,最后由客戶端播放模塊中的播放引擎根據(jù)筆順和筆寬等信息重現(xiàn)書法文字的虛擬書寫過程。本發(fā)明提供的書法圖像可視化重現(xiàn)方法能夠根據(jù)一幅圖像快速產(chǎn)生文字的書寫過程的動畫序列,具有極大的創(chuàng)新性,在計算機輔助教學、影視制作等方面有較高的應用價值。
文檔編號G06F3/14GK1996347SQ200610053397
公開日2007年7月11日 申請日期2006年9月14日
發(fā)明者潘云鶴, 莊越挺, 吳英飛 申請人:浙江大學導出引文BiBTeX, EndNote, RefMan