專利名稱:計(jì)算機(jī)輔助書法牌匾設(shè)計(jì)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)多媒體技術(shù)領(lǐng)域,尤其涉及一種計(jì)算機(jī)輔助書法牌匾設(shè)計(jì)方法。
背景技術(shù):
中國(guó)的悠久歷史和燦爛文化留下了很多優(yōu)美的書法作品,如王羲之的《蘭亭序》、米芾的《苕溪詩(shī)卷》等。如果能利用這些古人的書法字,組成用戶需要的具有特定藝術(shù)風(fēng)格的牌匾,將是一項(xiàng)非常有意義的工作。
書法字的風(fēng)格特征提取以及書法字風(fēng)格相似性度量是計(jì)算機(jī)輔助書法牌匾設(shè)計(jì)的關(guān)鍵問(wèn)題?,F(xiàn)已有一些書法字風(fēng)格特征提取的方法被提出如《計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào)》第11期(2005 17(11)2565-2569)公布的方法將書法作品切成單個(gè)書法字,再提取書法字輪廓特征計(jì)算形狀相似度,顯示形狀相似的書法字。IEEE智能系統(tǒng)2005年會(huì)議論文集(IEEE Intelligent Systems.200520(3)32-39)中公布的方法層次參數(shù)化表示書法字,通過(guò)綜合推理機(jī)制產(chǎn)生新風(fēng)格書法字。AAAI2007年會(huì)議論文集(Proceedings of the 22nd AAAI Conference onArtificial Intelligence,Vancouver,20071578-1583.)公布的方法通過(guò)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)單一筆劃和書法字結(jié)體的優(yōu)美度,給出了書法字優(yōu)美度的評(píng)判機(jī)制,使計(jì)算機(jī)自動(dòng)產(chǎn)生的書法字更符合人的審美觀。IEEE多媒體博覽國(guó)際會(huì)議2006年會(huì)議論文集(Proceedings of the 2006 IEEE International Conference on Multimedia andExpo,Toronto,20062073-2076)中公布的方法通過(guò)對(duì)書法字進(jìn)行筆劃分析和結(jié)構(gòu)分析,自動(dòng)提取書法字的筆順和筆寬信息,可視化重現(xiàn)書法創(chuàng)作過(guò)程。國(guó)際多媒體建模會(huì)議2007年會(huì)議論文集(Proceedings of 13th International MultimediaModeling Conference,Singapore,2007354-363)中公布的方法提出了計(jì)算機(jī)輔助書法作品真?zhèn)舞b別的方法,能夠通過(guò)風(fēng)格學(xué)習(xí)得到書法家真跡模型,然后再利用真?zhèn)闻袆e規(guī)則對(duì)作品進(jìn)行判定。此外,在漢字OCR識(shí)別方面也有些字體分類的工作,如機(jī)器學(xué)習(xí)和控制國(guó)際會(huì)議2002年會(huì)議論文集(Proceedings of the 2002International Conference on Machine Learning and Cybernetics,Beijing,20021726-1729.)中公布的方法通過(guò)提取文檔圖像的紋理特征,然后比較該特征與字體模板特征,選擇距離最近的字體判為文檔的字體,從而達(dá)到對(duì)黑體、宋體、楷書等字體分類的目的。模式識(shí)別國(guó)際會(huì)議2006年會(huì)議論文集(Proceedings ofthe 18th International Conference on Pattern Recognition,Hong Kong,2006884-887.)中公布的方法將OCR識(shí)別中的字體分類技術(shù)引入到書法字字體分類的工作中,通過(guò)提取紋理特征和覆蓋橢圓長(zhǎng)軸方差進(jìn)行書法字字體分類。
上面這些方法均對(duì)特定應(yīng)用提取了書法字的一些特征,這對(duì)計(jì)算機(jī)輔助書法牌匾設(shè)計(jì)中書法字風(fēng)格特征定義和書法字風(fēng)格相似度的度量給了很好的啟示。但這些方法都只提取了書法字的單一底層特征,僅采用這些特征并不能很好地描述書法字風(fēng)格。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種計(jì)算機(jī)輔助書法牌匾設(shè)計(jì)方法,為解決以往單一書法字特征的局限性,該方法不僅融合了書法字內(nèi)容特征,也引入了書法字上下文特征,并利用反饋使產(chǎn)生的書法牌匾更具有藝術(shù)性。
計(jì)算機(jī)輔助書法牌匾設(shè)計(jì)方法包括以下步驟 (1)結(jié)合書法字內(nèi)容風(fēng)格特征和上下文風(fēng)格特征作為書法字風(fēng)格特征的表達(dá)方式; (2)基于書法字風(fēng)格特征表達(dá)方式,提取并融合書法字的內(nèi)容風(fēng)格特征和上下文風(fēng)格特征,并計(jì)算書法字之間的風(fēng)格相似度; (3)利用風(fēng)格一致性計(jì)算模型獲取書法牌匾候選集; (4)利用對(duì)等反饋傳遞算法改善書法風(fēng)格度量。
所述結(jié)合書法字內(nèi)容風(fēng)格特征和上下文風(fēng)格特征作為書法字風(fēng)格特征的表達(dá)方式指的是給定書法字Vi,將其風(fēng)格特征表示為<fi1,fi2>,其中fi1表示書法字的內(nèi)容風(fēng)格特征,fi2表示書法字的上下文風(fēng)格特征。
書法字內(nèi)容風(fēng)格特征指的是基于單個(gè)書法字視覺(jué)底層特征的風(fēng)格特征。對(duì)于書法字Vi,fi1=<Ci,Gi,Si>,其中Ci,Gi和Si分別表示書法字的形狀特征、方向特征和結(jié)體特征。
書法字上下文風(fēng)格特征反映了書法字在書法作品、書法家以及書體等上下文信息中的特征。
所述基于書法字風(fēng)格特征表達(dá)方式,提取并融合書法字的內(nèi)容風(fēng)格特征和上下文風(fēng)格特征,并計(jì)算書法字之間的風(fēng)格相似度包含如下步驟 (a)首先提取書法字的底層特征,包括書法字形狀特征、方向特征和結(jié)體特征。
形狀特征提取方法如下給定書法字Vi={pi1,pi2,...pim},pij表示第j個(gè)采樣點(diǎn),表示書法字有m個(gè)輪廓采樣點(diǎn),每個(gè)采樣點(diǎn)pij由二元組坐標(biāo)<x,y>組成,采用極坐標(biāo)系表示方式,將整個(gè)空間從方向上劃分為8個(gè)方向,然后在弦上按log2r平分為4份,r為覆蓋極坐標(biāo)系的圓的半徑,這樣,整個(gè)空間就被分為32份。對(duì)輪廓上一給定點(diǎn)pi,其屬性用以pi點(diǎn)為中心的坐標(biāo)系的32bin中落入每個(gè)bin的象素點(diǎn)個(gè)數(shù)wi(k)來(lái)描述,wi(k)=#{qj≠piqj∈bin(k)},k=0,1,2,...31,這樣書法字的每一個(gè)采樣點(diǎn)都有一個(gè)32維的特征向量用,書法字的形狀特征就由m*32維的向量構(gòu)成,由Ci=<pi1,1,pi1,2,...pi1,32,pi2,1,...pim,32>表示。
方向特征提取方法如下采用二維Gabor函數(shù),提取書法字紋理特征 其中z=(x,y),‖·‖表示為范式,σ為常量表示濾波器帶寬寬度,
u和v分別表示Gabor濾波器的方向和尺度。取u=0,1,2,....7和v=0,1,2,3構(gòu)成32個(gè)Gabor濾波器,每一個(gè)書法字都經(jīng)過(guò)32個(gè)濾波器變換,對(duì)每一個(gè)濾波器的變換結(jié)果求均值和方差,則32個(gè)濾波器得到64維的方向特征向量Gi=<μi1,σi1,μi2,σi2,...μi32,σi32>。
結(jié)體特征提取方法如下提取書法字的形狀、重心位置以及幾何矩分布等特征作為書法字結(jié)體特征。用表示形狀特征,height和width分別表示書法字的高和寬,
表示書法字的重心位置,定義如下的二階中心矩upq 其中M和N表示書法字寬度方向和高度方向的像素點(diǎn)個(gè)數(shù),則和反映了書法字在左右側(cè)和上下側(cè)的筆壓輕重比,和反映了書法字在左右側(cè)和上下側(cè)的墨跡主軸傾斜度。最后,綜合所有的書法字結(jié)體特征,構(gòu)成結(jié)體特征向量 (b)計(jì)算單一特征的風(fēng)格相似度,融合提取的書法字形狀特征、方向特征和結(jié)體特征,作為書法字的內(nèi)容風(fēng)格特征,并計(jì)算書法字內(nèi)容風(fēng)格相似度。
首先定義風(fēng)格隸屬向量其中aij反映了書法字Vi屬于第j類風(fēng)格的概率,K表示風(fēng)格類別數(shù)。
對(duì)單一特征Gi和Si分別訓(xùn)練多類概率SVM分類器進(jìn)行風(fēng)格區(qū)分,得到書法字Vi在方向特征和結(jié)體特征上的風(fēng)格隸屬向量和其中g(shù)ij,Sij為分類器得到的概率結(jié)果。形狀特征不同于方向特征和結(jié)體特征,其維數(shù)與輪廓點(diǎn)個(gè)數(shù)相關(guān),不易訓(xùn)練SVM分類器。因此,提出基于K參照點(diǎn)書法風(fēng)格相似度計(jì)算方法。針對(duì)每個(gè)漢字,取標(biāo)準(zhǔn)字作為形狀參照集M={M1,M2,M3,...MK},計(jì)算書法字Vi與參照字Mj的形狀相似度,dij=TMC(Vi,Mj),得到形狀風(fēng)格隸屬向量其中得到風(fēng)格隸屬向量后,書法字Vi和Vj的風(fēng)格相似度用余弦公式計(jì)算,其中基于形狀的風(fēng)格相似度為
書法字Vi與參照字Mj的形狀相似度計(jì)算如下先計(jì)算書法字輪廓中任意兩點(diǎn)的近似匹配程度,用Cij=C(mi,nj)表示,值越小則越近似 則輪廓點(diǎn)mi的匹配值用公式PMCi=min{C(pi,qj)j=0,1,2...m}進(jìn)行計(jì)算,最終兩個(gè)書法字Vi與Vj的形狀匹配值大小是它們的所有輪廓點(diǎn)的近似匹配值的總和,用TMC(Vi,Vj)表示。
對(duì)方向特征和結(jié)體特征進(jìn)行前期融合和后期融合,前期融合是指在分類器訓(xùn)練之間就將各特征進(jìn)行融合,最簡(jiǎn)單的方式是將各特征向量串連起來(lái)形成一個(gè)長(zhǎng)特征向量,然后再對(duì)該特征向量進(jìn)行分類器學(xué)習(xí);后期融合是指對(duì)各個(gè)特征向量分別訓(xùn)練分類器,對(duì)分類器結(jié)果再次訓(xùn)練分類器。兩種融合方法均能得到融合后的風(fēng)格隸屬向量
則書法字Vi和Vj的風(fēng)格相似度為
對(duì)于形狀特征采用Max融合方式或基于方差的融合方式,Max融合方式為 contentSIM(Vi,Vj)=max(cSIM(Vi,Vj),fSIM(Vi,Vj)) 基于方差的融合方式為利用公式
選擇具有較好風(fēng)格表達(dá)能力的特征
然后計(jì)算書法字Vi和Vj內(nèi)容風(fēng)格相似度為
(c)提取書法字的上下文風(fēng)格特征,并計(jì)算書法字上下文風(fēng)格相似度。
首先通過(guò)以下3種書法字上下文來(lái)定義書法字之間的上下文風(fēng)格相似度,設(shè)Vi,Vj為兩個(gè)書法字。
i.書法字是否屬于同一作品 若Vi,Vj屬于同一作品,則f1(Vi,Vj)=τ,否則為0。
ii.書法字是否屬于同一書體 若Vi,Vj屬于同一書體,則f2(Vi,Vj)=ζ,否則為0。
iii.書法字所屬書法家之間的流派關(guān)系 流派指的是后人學(xué)習(xí)前人風(fēng)格,形成風(fēng)格相似的書法家派系,如顏派書法等。
令f3(Vi,Vj)=g(ai,aj),其中ai,aj表示Vi,Vj的書法家。若ai,aj為同一書法家,則g(ai,aj)=υ;若ai,aj屬于同一流派,則g(ai,aj)=δ;否則為0。
可設(shè)τ=1.5,ζ=1,υ=1,δ=0.8,綜合所有上下文特征,得到書法字Vi和Vj的上下文風(fēng)格相似度為 (d)整合書法字內(nèi)容風(fēng)格和上下文風(fēng)格計(jì)算書法字風(fēng)格相似度。
利用公式SIM(Vi,Vj)=λ*contentSIM(Vi,Vj)+(1-λ)*contextSIM(Vi,Vj)計(jì)算書法字Vi和Vj的風(fēng)格相似度,其中0≤λ≤1。
所述利用風(fēng)格一致性計(jì)算模型獲取書法牌匾候選集指的是給定書法牌匾查詢字串,在書法字庫(kù)中查得符合查詢字串要求的書法字串V1,V2,...,Vn,通過(guò)公式計(jì)算該書法字串的風(fēng)格一致性值,最后按F(V1,V2,.....Vn)排序可得到書法牌匾候選集。
獲取書法牌匾候選集具體算法(GenerateTabletCandidate)步驟如下 輸入用戶查詢請(qǐng)求query=(q1,q2...qn),qi為組成查詢?cè)~query的字; 輸出書法牌匾候選集C; 步驟a1為每個(gè)字qi查詢書法數(shù)據(jù)庫(kù)得到標(biāo)注為qi的書法字集Ωi; 步驟a2對(duì)任意的組合ci=Vi1,Vi2,.....Vin,(Vij∈Ωj),計(jì)算s(ci)=F(Vi1,Vi2,.....Vin),將<ci,s(ci)>放入C; 步驟a3按s(ci)對(duì)C中的元素排序,返回C。
所述利用對(duì)等反饋傳遞算法改善書法風(fēng)格度量指的是利用用戶在書法牌匾候選集中的反饋信息,改善書法字風(fēng)格的相似性度量。對(duì)等反饋傳遞算法步驟如下 輸入用戶查詢請(qǐng)求query=(q1,q2...qn),qi為組成查詢?cè)~query的字; 輸出書法牌匾ci; 步驟b1根據(jù)用戶查詢請(qǐng)求獲取書法牌匾候選集,C=GenerateTabletCandidate(query); 步驟b2判斷書法牌匾候選集中的元素ci∈C,如果ci滿足用戶需求,則構(gòu)造潛在正例集VLR=<Vi1,Vi2,...Vin>(這里Vij∈ci),然后再調(diào)用對(duì)等反饋算法PeerFeedback(VLR)和反饋傳遞算法FeedbackTransfer(VLR),最后返回書法牌匾ci;如果ci不滿足用戶需求,則跳到步驟b3; 步驟b3根據(jù)用戶相關(guān)反饋信息得到反饋集<VR,VN,VLN>=UserFeedBack(C),然后再調(diào)用對(duì)等反饋算法PeerFeedback(<VR,VN,VLN>)和反饋傳遞算法FeedbackTransfer(<VR,VN,VLN>),跳到步驟b1。
其中對(duì)等反饋算法PeerFeedback依據(jù)的想法為專家鑒定評(píng)價(jià)書法風(fēng)格時(shí)常采用作品對(duì)比方法,因而書法字風(fēng)格隱含在書法字之間,風(fēng)格可由其他書法字來(lái)解釋。PeerFeedback算法采用對(duì)等索引表示書法字風(fēng)格,即用其它風(fēng)格相似的書法字來(lái)表示當(dāng)前書法字的風(fēng)格。用表示書法字Vi的對(duì)等索引,其中,skik是風(fēng)格關(guān)鍵字,對(duì)應(yīng)書法字Vk,權(quán)重wiK表示它們之間的風(fēng)格相似度。將P(Vi)看作文檔向量
則兩書法字的對(duì)等索引相似度為
結(jié)合內(nèi)容、上下文和對(duì)等索引的風(fēng)格相似度,書法字Vi和Vj的風(fēng)格相似度為 SIM(Vi,Vj)=(1+R(Vi,Vj))*(λ*contentSIM(Vi,Vj)+(1-λ)*contextSIM(Vi,Vj)) 對(duì)等索引可通過(guò)用戶相關(guān)反饋信息學(xué)習(xí)得到,由于組成書法牌匾的書法字要求風(fēng)格一致,于是當(dāng)候選集中牌匾ci=<Vi1,Vi2,...Vin>滿足用戶需求,則書法字Vi1,Vi2,...Vin構(gòu)成潛在正例集VLR;若牌匾ci中一半以上的書法字被選為正例,則剩下的書法字構(gòu)成潛在負(fù)例集VLN。如果候選集不能滿足用戶需求,用戶選擇風(fēng)格相似的字組成所需牌匾(選擇過(guò)程被稱為UserFeedBack),這些字作為正例,形成集合VR;用戶還可以明確選擇其它與正例中風(fēng)格不同的字作為反例,形成集合VN。
學(xué)習(xí)算法為 步驟c1收集反饋集VLR,VR,VN和VLN。
步驟c2對(duì)VLR或VR中任意兩個(gè)書法字Vi和Vj,若Vj不在P(Vi)中,則將Vj加到P(Vi),并初始化權(quán)重為1。否則,將P(Vi)中Vj對(duì)應(yīng)的權(quán)重加1。同樣,Vi也被加到P(Vj)中去。
步驟c3對(duì)VR中的書法字Vi和VN中的書法字Vj,若Vj在P(Vi)中,則將Vj對(duì)應(yīng)的權(quán)重減5,若減后結(jié)果小于1,則將Vj從P(Vi)中去除。同樣,將Vi從P(Vj)中去除或?qū)⑵湎鄳?yīng)的權(quán)重減5。
步驟c4對(duì)VLN中的書法字作與VN類似的處理,調(diào)整的權(quán)重值為2。
反饋傳遞算法FeedbackTransfer利用反饋信息更新書法作品之間和書法家之間的風(fēng)格相似度,從而更新書法字的上下文風(fēng)格特征。設(shè)庫(kù)中共有M幅書法作品和N個(gè)書法字,用N維向量W=[w1,w2,...,wN]表示書法作品,若wi=1,則表示作品含有第i個(gè)書法字,否則wi=0。設(shè)N×N矩陣R為書法字風(fēng)格相似度矩陣,其中rij表示書法字Vi與Vj被用戶指為風(fēng)格相似的程度,可由反饋得到。
于是兩書法作品Wi與Wj的相似度為 在反饋之前,rii=1,rij|j≠i=0,由于同一個(gè)書法字屬于不同的書法作品,則wik*wjk=0,于是SIM(Wi,Wj)=0。
設(shè)N×N矩陣G為書法作品風(fēng)格相似度矩陣,其中g(shù)ij=SIM(Wi,Wj),用M維向量A=[a1,a2,...aM]表示書法家,若ai=1,表示該書法家寫了第i幅書法作品,則兩書法家風(fēng)格相似度為 反饋可得到更新矩陣ΔR,若書法字Vi與Vj同屬VR或VLR,則ΔRij=1,若Vi與Vj分屬VR和VN,則ΔRij=-5,若Vi與Vj分屬VR和VLN,則ΔRij=-2,Ri+1=Ri+ΔR,則書法作品和書法家的風(fēng)格相似度更新公式為 這里反映了書法作品風(fēng)格相似度的變化,最后通過(guò)SIM(Wi,Wj)i+1和SIM(Ai,Aj)i+1更新書法字上下文風(fēng)格特征。
本發(fā)明所述的計(jì)算機(jī)輔助書法牌匾設(shè)計(jì)方法有如下的有益效果 1.本方法能克服單一特征作為風(fēng)格特征的局限,通過(guò)融合書法字底層特征和上下文特征來(lái)定義書法字風(fēng)格并計(jì)算風(fēng)格相似度。
2.本方法中的內(nèi)容風(fēng)格特征和上下文風(fēng)格特征均能通過(guò)計(jì)算機(jī)自動(dòng)提取,使得書法牌匾的生成具有實(shí)用性。
3.本方法通過(guò)反饋提高了系統(tǒng)性能,使產(chǎn)生的書法牌匾更符合人們的審美標(biāo)準(zhǔn),更具有藝術(shù)性。
圖1是計(jì)算機(jī)輔助書法牌匾設(shè)計(jì)方法框架圖; 圖2是本發(fā)明計(jì)算機(jī)輔助書法牌匾設(shè)計(jì)流程圖; 圖3是本發(fā)明產(chǎn)生的書法牌匾候選集示意圖; 圖4是本發(fā)明用戶對(duì)書法牌匾候選集進(jìn)行相關(guān)反饋示意圖; 圖5是本發(fā)明在書法牌匾候選集中進(jìn)行相關(guān)反饋后的結(jié)果圖; 圖6是本發(fā)明中用戶滿意的書法牌匾; 圖7是本發(fā)明設(shè)計(jì)的由蘇軾的書法字組成的“中國(guó)工程院”書法牌匾。
具體實(shí)施例方式 為了更好的理解本發(fā)明的技術(shù)方案,以下結(jié)合附圖1和附圖2對(duì)本發(fā)明作進(jìn)一步的描述。附圖1描述了本發(fā)明計(jì)算機(jī)輔助書法牌匾設(shè)計(jì)方法的框架圖和書法字庫(kù)建立的流程圖,附圖2描述了本發(fā)明中書法牌匾的產(chǎn)生過(guò)程。
書法字庫(kù)建立的具體步驟如下 1.掃描書法作品得到數(shù)字化后的書法作品頁(yè)面;(步驟101) 2.切分書法作品頁(yè)面獲取單個(gè)書法字圖像;(步驟102) 3.對(duì)單個(gè)書法字圖像進(jìn)行標(biāo)注,以便用戶提交查詢字串時(shí)可得到相關(guān)的書法字圖像;(步驟103); 4.結(jié)合書法字內(nèi)容風(fēng)格特征和上下文風(fēng)格特征作為書法字風(fēng)格特征的表達(dá)方式,即給定書法字Vi,將其風(fēng)格特征表示為<fi1,fi2>,其中fi1表示書法字的內(nèi)容風(fēng)格特征,fi2表示書法字的上下文風(fēng)格特征。
書法字內(nèi)容風(fēng)格特征指的是基于單個(gè)書法字視覺(jué)底層特征的風(fēng)格特征。對(duì)于書法字Vi,fi1=<Ci,Gi,Si>,其中Ci,Gi和Si分別表示書法字的形狀特征、方向特征和結(jié)體特征。
書法字上下文風(fēng)格特征反映了書法字在書法作品、書法家以及書體等上下文信息中的特征。
5.提取每一個(gè)書法字圖像的內(nèi)容風(fēng)格特征,包括形狀特征、方向特征和結(jié)體特征(步驟104)。具體過(guò)程如下 形狀特征提取方法如下給定書法字Vi={pi1,pi2,...pim},pij表示第j個(gè)采樣點(diǎn),表示書法字有m個(gè)輪廓采樣點(diǎn),每個(gè)采樣點(diǎn)pij由二元組坐標(biāo)<x,y>組成,采用極坐標(biāo)系表示方式,將整個(gè)空間從方向上劃分為8個(gè)方向,然后在弦上按log2r平分為4份,r為覆蓋極坐標(biāo)系的圓的半徑,這樣,整個(gè)空間就被分為32份。對(duì)輪廓上一給定點(diǎn)pi,其屬性用以pi點(diǎn)為中心的坐標(biāo)系的32bin中落入每個(gè)bin的象素點(diǎn)個(gè)數(shù)wi(k)來(lái)描述,wi(k)=#{qj≠piqj∈bin(k)},k=0,1,2,...31,這樣書法字的每一個(gè)采樣點(diǎn)都有一個(gè)32維的特征向量用,書法字的形狀特征就由m*32維的向量構(gòu)成,由Ci=<pi1,1,pi1,2,...pi1,32,pi2,1,...pim,32>表示。
方向特征提取方法如下采用二維Gabor函數(shù),提取書法字紋理特征 其中z=(x,y),‖·‖表示為范式,σ為常量表示濾波器帶寬寬度,
u和v分別表示Gabor濾波器的方向和尺度。取u=0,1,2,....7和v=0,1,2,3構(gòu)成32個(gè)Gabor濾波器,每一個(gè)書法字都經(jīng)過(guò)32個(gè)濾波器變換,對(duì)每一個(gè)濾波器的變換結(jié)果求均值和方差,則32個(gè)濾波器得到64維的方向特征向量Gi=<μi1,σi1,μi2,σi2,...μi32,σi32>。
結(jié)體特征提取方法如下提取書法字的形狀、重心位置以及幾何矩分布等特征作為書法字結(jié)體特征。用表示形狀特征,height和width分別表示書法字的高和寬,
表示書法字的重心位置,定義如下的二階中心矩upq 其中M和N表示書法字寬度方向和高度方向的像素點(diǎn)個(gè)數(shù),則和反映了書法字在左右側(cè)和上下側(cè)的筆壓輕重比,和反映了書法字在左右側(cè)和上下側(cè)的墨跡主軸傾斜度。最后,綜合所有的書法字結(jié)體特征,構(gòu)成結(jié)體特征向量 6.根據(jù)書法字所在的書法作品信息提取書法字的上下文風(fēng)格特征(步驟105)。
首先通過(guò)以下3種書法字上下文來(lái)定義書法字之間的上下文風(fēng)格相似度,設(shè)Vi,Vj為兩個(gè)書法字。
i.書法字是否屬于同一作品 若Vi,Vj屬于同一作品,則f1(Vi,Vj)=τ,否則為0。
ii.書法字是否屬于同一書體 若Vi,Vj屬于同一書體,則f2(Vi,Vj)=ζ,否則為0。
iii.書法字所屬書法家之間的流派關(guān)系 流派指的是后人學(xué)習(xí)前人風(fēng)格,形成風(fēng)格相似的書法家派系,如顏派書法等。
令f3(Vi,Vj)=g(ai,aj),其中ai,aj表示Vi,Vj的書法家。若ai,aj為同一書法家,則g(ai,aj)=υ;若ai,aj屬于同一流派,則g(ai,aj)=δ;否則為0。
可設(shè)τ=1.5,ζ=1,υ=1,δ=0.8,綜合所有上下文特征,得到書法字Vi和Vj的上下文風(fēng)格相似度為 7.基于書法字風(fēng)格特征表達(dá)方式,融合書法字的內(nèi)容風(fēng)格特征和上下文風(fēng)格特征,并計(jì)算書法字之間的風(fēng)格相似度。
首先定義風(fēng)格隸屬向量其中aij反映了書法字Vi屬于第j類風(fēng)格的概率,K表示風(fēng)格類別數(shù)。
對(duì)單一特征Gi和Si分別訓(xùn)練多類概率SVM分類器進(jìn)行風(fēng)格區(qū)分,得到書法字Vi在方向特征和結(jié)體特征上的風(fēng)格隸屬向量和其中g(shù)ij,sij為分類器得到的概率結(jié)果。形狀特征不同于方向特征和結(jié)體特征,其維數(shù)與輪廓點(diǎn)個(gè)數(shù)相關(guān),不易訓(xùn)練SVM分類器。因此,提出基于K參照點(diǎn)書法風(fēng)格相似度計(jì)算方法。針對(duì)每個(gè)漢字,取標(biāo)準(zhǔn)字作為形狀參照集M={M1,M2,M3,...MK},計(jì)算書法字Vi與參照字Mj的形狀相似度,dij=TMC(Vi,Mj),得到形狀風(fēng)格隸屬向量其中得到風(fēng)格隸屬向量后,書法字Vi和Vj的風(fēng)格相似度用余弦公式計(jì)算,其中基于形狀的風(fēng)格相似度為
書法字Vi與參照字Mj的形狀相似度計(jì)算如下先計(jì)算書法字輪廓中任意兩點(diǎn)的近似匹配程度,用Cij=C(mi,nj)表示,mi和ni表示書法字輪廓點(diǎn),值越小則越近似 則輪廓點(diǎn)mi的匹配值用公式PMCi=min{C(pi,qj)j=0,1,2...m}進(jìn)行計(jì)算,最終兩個(gè)書法字Vi與Vj的形狀匹配值大小是它們的所有輪廓點(diǎn)的近似匹配值的總和,用TMC(Vi,Vj)表示。
對(duì)方向特征和結(jié)體特征進(jìn)行前期融合和后期融合,前期融合是指在分類器訓(xùn)練之間就將各特征進(jìn)行融合,最簡(jiǎn)單的方式是將各特征向量串連起來(lái)形成一個(gè)長(zhǎng)特征向量,然后再對(duì)該特征向量進(jìn)行分類器學(xué)習(xí);后期融合是指對(duì)各個(gè)特征向量分別訓(xùn)練分類器,對(duì)分類器結(jié)果再次訓(xùn)練分類器。兩種融合方法均能得到融合后的風(fēng)格隸屬向量
則書法字Vi和Vj的風(fēng)格相似度為
對(duì)于形狀特征采用Max融合方式或基于方差的融合方式,Max融合方式為 contentSIM(Vi,Vj)=max(cSIM(Vi,Vj),fSIM(Vi,Vj)) 基于方差的融合方式為利用公式
選擇具有較好風(fēng)格表達(dá)能力的特征
然后計(jì)算書法字Vi和Vj內(nèi)容風(fēng)格相似度為
最終利用公式SIM(Vi,Vj)=λ*contentSIM(Vi,Vj)+(1-λ)*contextSIM(Vi,Vj)計(jì)算書法字Vi和Vj的風(fēng)格相似度,其中0≤λ≤1。
書法牌匾的產(chǎn)生過(guò)程的具體步驟如下所示 1.用戶提交書法牌匾查詢字串,系統(tǒng)根據(jù)建庫(kù)時(shí)書法字的標(biāo)注信息得到相匹配的書法字串;(步驟201) 2.系統(tǒng)通過(guò)風(fēng)格一致性模型得到書法牌匾候選集(步驟202) 在書法字庫(kù)中查得符合查詢字串要求的書法字串V1,V2,...,Vn,通過(guò)公式計(jì)算該書法字串的風(fēng)格一致性值,最后按F(V1,V2,.....Vn)排序可得到書法牌匾候選集。
獲取書法牌匾候選集具體算法(GenerateTabletCandidate)步驟如下 輸入用戶查詢請(qǐng)求query=(q1,q2...qn),qi為組成查詢?cè)~query的字; 輸出書法牌匾候選集C; 步驟1為每個(gè)字qi查詢書法數(shù)據(jù)庫(kù)得到標(biāo)注為qi的書法字集Ωi; 步驟2對(duì)任意的組合ci=Vi1,Vi2,.....Vin,(Vij∈Ωj),計(jì)算s(ci)=F(Vi1,Vi2,.....Vin), 將<ci,s(ci)>放入C; 步驟3按s(ci)對(duì)C中的元素排序,返回C。
3.用戶判斷系統(tǒng)返回的書法牌匾候選集中是否有滿意的書法牌匾(步驟203),并根據(jù)用戶判斷結(jié)果進(jìn)行如下的操作 a)如果書法牌匾候選集C中的元素ci∈C滿足用戶需求,則構(gòu)造潛在正例集VLR=<Vi1,Vi2,...Vin>(這里Vij∈ci)(步驟204),然后再調(diào)用對(duì)等反饋算法PeerFeedback(VLR)和反饋傳遞算法FeedbackTransfer(VLR)(步驟205),最后返回書法牌匾ci(步驟206)。
b)如果書法牌匾候選集中的元素均不能滿足用戶需求,則用戶進(jìn)行相關(guān)反饋,選擇風(fēng)格相似的字組成所需牌匾(選擇過(guò)程被稱為UserFeedBack),這些字作為正例,形成集合VR;用戶還可以明確選擇其它與正例中風(fēng)格不同的字作為反例,形成集合VN。同時(shí),若牌匾中一半以上的書法字被選為正例,則剩下的書法字構(gòu)成潛在負(fù)例集VLN。然后再調(diào)用對(duì)等反饋算法PeerFeedback(VLR)和反饋傳遞算法FeedbackTransfer(VLR)(步驟205),并返回到步驟202。
其中對(duì)等反饋算法PeerFeedback依據(jù)的想法為專家鑒定評(píng)價(jià)書法風(fēng)格時(shí)常采用作品對(duì)比方法,因而書法字風(fēng)格隱含在書法字之間,風(fēng)格可由其他書法字來(lái)解釋。PeerFeedback算法采用對(duì)等索引表示書法字風(fēng)格,即用其它風(fēng)格相似的書法字來(lái)表示當(dāng)前書法字的風(fēng)格。用表示書法字Vi的對(duì)等索引,其中,skik是風(fēng)格關(guān)鍵字,對(duì)應(yīng)書法字Vk,權(quán)重wiK表示它們之間的風(fēng)格相似度。將P(Vi)看作文檔向量
則兩書法字的對(duì)等索引相似度為
結(jié)合內(nèi)容、上下文和對(duì)等索引的風(fēng)格相似度,書法字Vi和Vj的風(fēng)格相似度為 SIM(Vi,Vj)=(1+R(Vi,Vj))*(λ*contentSIM(Vi,Vj)+(1-λ)*contextSIM(Vi,Vj)) 對(duì)等索引可通過(guò)用戶相關(guān)反饋信息學(xué)習(xí)得到,由于組成書法牌匾的書法字要求風(fēng)格一致,于是當(dāng)候選集中牌匾ci=<Vi1,Vi2,...Vin>滿足用戶需求,則書法字Vi1,Vi2,...Vin構(gòu)成潛在正例集VLR;若牌匾ci中一半以上的書法字被選為正例,則剩下的書法字構(gòu)成潛在負(fù)例集VLN。如果候選集不能滿足用戶需求,用戶選擇風(fēng)格相似的字組成所需牌匾(選擇過(guò)程被稱為UserFeedBack),這些字作為正例,形成集合VR;用戶還可以明確選擇其它與正例中風(fēng)格不同的字作為反例,形成集合VN。
學(xué)習(xí)算法為(1)收集反饋集VLR,VR,VN和VLN。(2)對(duì)VLR或VR中任意兩個(gè)書法字Vi和Vj,若Vj不在P(Vi)中,則將Vj加到P(Vi),并初始化權(quán)重為1。否則,將P(Vi)中Vj對(duì)應(yīng)的權(quán)重加1。同樣,Vi也被加到P(Vj)中去。(3)對(duì)VR中的書法字Vi和VN中的書法字Vj,若Vj在P(Vi)中,則將Vj對(duì)應(yīng)的權(quán)重減5,若減后結(jié)果小于1,則將Vj從P(Vi)中去除。同樣,將Vi從P(Vj)中去除或?qū)⑵湎鄳?yīng)的權(quán)重減5。(4)對(duì)VLN中的書法字作與VN類似的處理,調(diào)整的權(quán)重值為2。
反饋傳遞算法FeedbackTransfer利用反饋信息更新書法作品之間和書法家之間的風(fēng)格相似度,從而更新書法字的上下文風(fēng)格特征。設(shè)庫(kù)中共有M幅書法作品和N個(gè)書法字,用N維向量W=[w1,w2,...,wN]表示書法作品,若wi=1,則表示作品含有第i個(gè)書法字,否則wi=0。設(shè)N×N矩陣R為書法字風(fēng)格相似度矩陣,其中rij表示書法字Vi與Vj被用戶指為風(fēng)格相似的程度,可由反饋得到。
于是兩書法作品Wi與Wj的相似度為 在反饋之前,rii=1,rij|j≠i=0,由于同一個(gè)書法字屬于不同的書法作品,則wik*wjk=0,于是SIM(Wi,Wj)=0。
設(shè)N×N矩陣G為書法作品風(fēng)格相似度矩陣,其中g(shù)ij=SIM(Wi,Wj),用M維向量A=[a1,a2,...aM]表示書法家,若ai=1,表示該書法家寫了第i幅書法作品,則兩書法家風(fēng)格相似度為 反饋可得到更新矩陣ΔR,若書法字Vi與Vj同屬VR或VLR,則ΔRij=1,若Vi與Vj分屬VR和VN,則ΔRij=-5,若Vi與Vj分屬VR和VLN,則ΔRij=-2,Ri+1=Ri+ΔR,則書法作品和書法家的風(fēng)格相似度更新公式為 這里反映了書法作品風(fēng)格相似度的變化,最后通過(guò)SIM(Wi,Wj)i+1和SIM(Ai,Aj)i+1更新書法字上下文風(fēng)格特征。
實(shí)施例1 首先掃描書法作品并切割構(gòu)建含10000多幅書法字圖像的書法字庫(kù),并對(duì)每一個(gè)書法字圖像進(jìn)行了標(biāo)注,提取并融合了書法字圖像的內(nèi)容風(fēng)格特征(包括形狀特征、方向特征和結(jié)體特征)和上下文風(fēng)格特征,最終計(jì)算兩個(gè)書法字的風(fēng)格特征。
下面詳細(xì)說(shuō)明“浙江大學(xué)”書法牌匾的設(shè)計(jì)過(guò)程 (1)用戶向系統(tǒng)提交“浙江大學(xué)”查詢?cè)~; (2)系統(tǒng)根據(jù)風(fēng)格一致性計(jì)算模型計(jì)算得到書法牌匾候選集,如附圖3所示; (3)得到的書法牌匾候選集中沒(méi)有令用戶滿意的書法牌匾,用戶進(jìn)行相關(guān)反饋,對(duì)風(fēng)格相似的書法字圖像選左邊的選擇框,對(duì)風(fēng)格不相似的書法字圖像選右邊的選擇框,結(jié)果如附圖4所示; (4)在相關(guān)反饋時(shí),系統(tǒng)構(gòu)造反饋集,并依據(jù)該反饋集更新相關(guān)書法字圖像的對(duì)等索引和上下文風(fēng)格特征; (5)重新利用風(fēng)格一致性模型計(jì)算書法牌匾候選集,得到結(jié)果如附圖5所示,用戶再次判斷候選集中是否有滿意的書法牌匾,若有則返回,在該實(shí)施例中用戶選擇附圖5中的第一條書法牌匾作為滿意的書法牌匾如附圖6所示。
實(shí)施例2 附圖7給出了由本方法設(shè)計(jì)的由蘇軾的書法字組成的“中國(guó)工程院”書法牌匾。下面結(jié)合本發(fā)明的方法詳細(xì)說(shuō)明本實(shí)例實(shí)施的具體步驟,如下 (1)用戶向系統(tǒng)提交“中國(guó)工程院”查詢?cè)~,并指明書法字的作者“蘇軾”; (2)系統(tǒng)在書法字庫(kù)中查找作者為“蘇軾”,并且標(biāo)注為“中”、“國(guó)”、“工”、“程”或“院”的書法字; (3)系統(tǒng)根據(jù)風(fēng)格一致性計(jì)算模型計(jì)算得到書法牌匾候選集; (4)用戶查看書法牌匾候選集,如有滿意的書法牌匾,則直接選中返回,若無(wú)滿意的書法牌匾,則進(jìn)行相關(guān)反饋,對(duì)風(fēng)格相似的書法字圖像選左邊的選擇框,對(duì)風(fēng)格不相似的書法字圖像選右邊的選擇框; (5)系統(tǒng)根據(jù)反饋信息構(gòu)建反饋集,并依據(jù)該反饋集更新相關(guān)書法字圖像的對(duì)等索引和上下文風(fēng)格特征; (6)重新調(diào)用風(fēng)格一致性計(jì)算模型獲取書法牌匾候選集。
通過(guò)這些步驟的循環(huán)操作,最終得到如附圖7所示的“中國(guó)工程院”的書法牌匾。
權(quán)利要求
1.一種計(jì)算機(jī)輔助書法牌匾設(shè)計(jì)方法,其特征在于包括以下步驟
(1)結(jié)合書法字內(nèi)容風(fēng)格特征和上下文風(fēng)格特征作為書法字風(fēng)格特征的表達(dá)方式;
(2)基于書法字風(fēng)格特征表達(dá)方式,提取并融合書法字的內(nèi)容風(fēng)格特征和上下文風(fēng)格特征,并計(jì)算書法字之間的風(fēng)格相似度;
(3)利用風(fēng)格一致性計(jì)算模型獲取書法牌匾候選集;
(4)利用對(duì)等反饋傳遞算法改善書法風(fēng)格度量。
2.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)輔助書法牌匾設(shè)計(jì)方法,其特征是,所述的結(jié)合書法字內(nèi)容風(fēng)格特征和上下文風(fēng)格特征作為書法字風(fēng)格特征的表達(dá)方式是指給定書法字Vi,將其風(fēng)格特征表示為<fi1,fi2>,其中fi1表示書法字的內(nèi)容風(fēng)格特征,fi2表示書法字的上下文風(fēng)格特征;
書法字內(nèi)容風(fēng)格特征指的是基于單個(gè)書法字視覺(jué)底層特征的風(fēng)格特征,對(duì)于書法字Vi,fi1=<Ci,Gi,Si>,其中Ci,Gi和Si分別表示書法字的形狀特征、方向特征和結(jié)體特征;
書法字上下文風(fēng)格特征反映了書法字在書法作品、書法家以及書體等上下文信息中的特征。
3.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)輔助書法牌匾設(shè)計(jì)方法,其特征是,所述的基于書法字風(fēng)格特征表達(dá)方式,提取并融合書法字的內(nèi)容風(fēng)格特征和上下文風(fēng)格特征,并計(jì)算書法字之間的風(fēng)格相似度步驟為
(a)首先提取書法字的底層特征,包括書法字形狀特征、方向特征和結(jié)體特征;
形狀特征提取方法如下給定書法字Vi={pi1,pi2,...pim},pij表示第j個(gè)采樣點(diǎn),書法字有m個(gè)輪廓采樣點(diǎn),每個(gè)采樣點(diǎn)pij由二元組坐標(biāo)<x,y>組成,采用極坐標(biāo)系表示方式,將整個(gè)空間從方向上劃分為8個(gè)方向,然后在弦上按log2r平分為4份,r為覆蓋極坐標(biāo)系的圓的半徑,這樣,整個(gè)空間就被分為32份,對(duì)輪廓上一給定點(diǎn)pi,其屬性用以pi點(diǎn)為中心的坐標(biāo)系的32bin中落入每個(gè)bin的象素點(diǎn)個(gè)數(shù)wi(k)來(lái)描述,wi(k)=#{qj≠piqj∈bin(k)},k=0,1,2,...31,這樣書法字的每一個(gè)采樣點(diǎn)都有一個(gè)32維的特征向量用,書法字的形狀特征就由m*32維的向量構(gòu)成,由Ci=<pi1,1,pi1,2,...pi1,32,pi2,1,...pim,32>表示;
方向特征提取方法如下采用二維Gabor函數(shù),提取書法字紋理特征
其中z=(x,y),‖·‖表示為范式,σ為常量表示濾波器帶寬寬度,
u和v分別表示Gabor濾波器的方向和尺度,取u=0,1,2,....7和v=0,1,2,3構(gòu)成32個(gè)Gabor濾波器,每一個(gè)書法字都經(jīng)過(guò)32個(gè)濾波器變換,對(duì)每一個(gè)濾波器的變換結(jié)果求均值和方差,則32個(gè)濾波器得到64維的方向特征向量Gi=<μi1,σi1,μi2,σi2,...μi32,σi32>;
結(jié)體特征提取方法如下提取書法字的形狀、重心位置以及幾何矩分布等特征作為書法字結(jié)體特征,用表示形狀特征,height和width分別表示書法字的高和寬,
表示書法字的重心位置,定義如下的p+q階中心矩upq
其中M和N表示書法字寬度方向和高度方向的像素點(diǎn)個(gè)數(shù),則和反映了書法字在左右側(cè)和上下側(cè)的筆壓輕重比,和反映了書法字在左右側(cè)和上下側(cè)的墨跡主軸傾斜度,最后,綜合所有的書法字結(jié)體特征,構(gòu)成結(jié)體特征向量
(b)計(jì)算單一特征的風(fēng)格相似度,融合書法字形狀特征、方向特征和結(jié)體特征,作為書法字的內(nèi)容風(fēng)格特征,并計(jì)算書法字內(nèi)容風(fēng)格相似度;
首先定義風(fēng)格隸屬向量其中aij反映了書法字Vi屬于第j類風(fēng)格的概率,K表示風(fēng)格類別數(shù),對(duì)單一特征Gi和Si分別訓(xùn)練多類概率SVM分類器進(jìn)行風(fēng)格區(qū)分,得到書法字Vi在方向特征和結(jié)體特征上的風(fēng)格隸屬向量和其中g(shù)ij,sij為分類器得到的概率結(jié)果;形狀特征不同于方向特征和結(jié)體特征,其維數(shù)與輪廓點(diǎn)個(gè)數(shù)相關(guān),不易訓(xùn)練SVM分類器,因此,提出基于K參照點(diǎn)書法風(fēng)格相似度計(jì)算方法,針對(duì)每個(gè)漢字,取標(biāo)準(zhǔn)字作為形狀參照集M={M1,M2,M3,...MK},計(jì)算書法字Vi與參照字Mj的形狀相似度,dij=TMC(Vi,Mj),得到形狀風(fēng)格隸屬向量其中得到風(fēng)格隸屬向量后,書法字Vi和Vj的風(fēng)格相似度用余弦公式計(jì)算,其中基于形狀的風(fēng)格相似度為
書法字Vi與參照字Mj的形狀相似度計(jì)算如下
先計(jì)算書法字輪廓中任意兩點(diǎn)的近似匹配程度,用Cij=C(mi,nj)表示,mi和ni表示書法字輪廓點(diǎn),值越小則越近似
則輪廓點(diǎn)mi的匹配值用公式PMCi=min{C(pi,qj)j=0,1,2…m}進(jìn)行計(jì)算,最終兩個(gè)書法字Vi與Vj的形狀匹配值大小是它們的所有輪廓點(diǎn)的匹配值的總和,用TMC(Vi,Vj)表示;
對(duì)方向特征和結(jié)體特征進(jìn)行前期融合和后期融合,前期融合是指在分類器訓(xùn)練之間就將各特征進(jìn)行融合,最簡(jiǎn)單的方式是將各特征向量串連起來(lái)形成一個(gè)長(zhǎng)特征向量,然后再對(duì)該特征向量進(jìn)行分類器學(xué)習(xí),后期融合是指對(duì)各個(gè)特征向量分別訓(xùn)練分類器,對(duì)分類器結(jié)果再次訓(xùn)練分類器,兩種融合方法均能得到融合后的風(fēng)格隸屬向量
則書法字Vi和Vj的風(fēng)格相似度為
對(duì)于形狀特征采用Max融合方式或基于方差的融合方式,Max融合方式為
contentSIM(Vi,Vj)=max(cSIM(Vi,Vj),fSIM(Vi,Vj)) 5
基于方差的融合方式為利用公式
選擇具有較好風(fēng)格表達(dá)能力的特征
然后計(jì)算書法字Vi和Vj內(nèi)容風(fēng)格相似度為
(c)提取書法字的上下文風(fēng)格特征,并計(jì)算書法字上下文風(fēng)格相似度;
首先通過(guò)以下3種書法字上下文來(lái)定義書法字之間的上下文風(fēng)格相似度,設(shè)Vi,Vj為兩個(gè)書法字,
i.書法字是否屬于同一作品
若Vi,Vj屬于同一作品,則f1(Vi,Vj)=τ,否則為0;
ii.書法字是否屬于同一書體
若Vi,Vj屬于同一書體,則f2(Vi,Vj)=ζ,否則為0;
iii.書法字所屬書法家之間的流派關(guān)系
流派指的是后人學(xué)習(xí)前人風(fēng)格,形成風(fēng)格相似的書法家派系,如顏派書法等,令f3(Vi,Vj)=g(ai,aj),其中ai,aj表示Vi,Vj的書法家,若ai,aj為同一書法家,則g(ai,aj)=υ,若ai,aj屬于同一流派,則g(ai,aj)=δ,否則為0;
可設(shè)τ=1.5,ζ=1,υ=1,δ=0.8,綜合所有上下文特征,得到書法字Vi和Vj的上下文風(fēng)格相似度為
(d)整合書法字內(nèi)容風(fēng)格和上下文風(fēng)格計(jì)算書法字風(fēng)格相似度,利用公式
SIM(Vi,Vj)=λ*contentSIM(Vi,Vj)+(1-λ)*contextSIM(Vi,Vj) 8
計(jì)算書法字Vi和Vj的風(fēng)格相似度,其中0≤λ≤1。
4.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)輔助書法牌匾設(shè)計(jì)方法,其特征是,所述的利用風(fēng)格一致性計(jì)算模型獲取書法牌匾候選集是指給定書法牌匾查詢字串,在書法字庫(kù)中查得符合查詢字串要求的書法字串V1,V2,...,Vn,通過(guò)公式
計(jì)算該書法字串的風(fēng)格一致性值,最后按F(V1,V2,.....Vn)排序可得到書法牌匾候選集;
獲取書法牌匾候選集具體算法(GenerateTabletCandidate)步驟如下
輸入用戶查詢請(qǐng)求query=(q1,q2...qn),qi為組成查詢?cè)~query的字;
輸出書法牌匾候選集C;
步驟a1為每個(gè)字qi查詢書法數(shù)據(jù)庫(kù)得到標(biāo)注為qi的書法字集Ωi;
步驟a2對(duì)任意的組合ci=Vi1,Vi2,.....Vin,(Vij∈Ωj),按公式8,9計(jì)算s(ci)=F(Vi1,Vi2,.....Vin),將<ci,s(ci)>放入C;
步驟a3按s(ci)對(duì)C中的元素排序,返回C。
5.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)輔助書法牌匾設(shè)計(jì)方法,其特征是,所述的利用對(duì)等反饋傳遞算法改善書法風(fēng)格度量指的是利用用戶在書法牌匾候選集中的反饋信息,改善書法字風(fēng)格的相似性度量;
對(duì)等反饋傳遞算法步驟如下
輸入用戶查詢請(qǐng)求query=(q1,q2...qn),qi為組成查詢?cè)~query的字;
輸出書法牌匾ci;
步驟b1根據(jù)用戶查詢請(qǐng)求獲取書法牌匾候選集,C=GenerateTabletCandidate(query);
步驟b2判斷書法牌匾候選集中的元素ci∈C,如果ci滿足用戶需求,則構(gòu)造潛在正例集VLR=<Vi1,Vi2,...Vin>(這里Vij∈ci),然后再調(diào)用對(duì)等反饋算法PeerFeedback(VLR)和反饋傳遞算法FeedbackTransfer(VLR),最后返回書法牌匾ci;如果ci不滿足用戶需求,則跳到步驟b3;
步驟b3根據(jù)用戶相關(guān)反饋信息得到反饋集<VR,VN,VLN>=UserFeedBack(C),然后再調(diào)用對(duì)等反饋算法PeerFeedback(<VR,VN,VLN>)和反饋傳遞算法FeedbackTransfer(<VR,VN,VLN>),跳到步驟b1;
其中對(duì)等反饋算法PeerFeedback依據(jù)的想法為專家鑒定評(píng)價(jià)書法風(fēng)格時(shí)常采用作品對(duì)比方法,因而書法字風(fēng)格隱含在書法字之間,風(fēng)格可由其他書法字來(lái)解釋,PeerFeedback算法采用對(duì)等索引表示書法字風(fēng)格,即用其它風(fēng)格相似的書法字來(lái)表示當(dāng)前書法字的風(fēng)格,用表示書法字Vi的對(duì)等索引,其中,skik是風(fēng)格關(guān)鍵字,對(duì)應(yīng)書法字Vk,權(quán)重wiK表示它們之間的風(fēng)格相似度,將P(Vi)看作文檔向量
則兩書法字的對(duì)等索引相似度為
結(jié)合內(nèi)容、上下文和對(duì)等索引的風(fēng)格相似度,書法字Vi和Vj的風(fēng)格相似度為
SIM(Vi,Vj)=(1+R(Vi,Vj))*(λ*contentSIM(Vi,Vj)+(1-λ)*contextSIM(Vi,Vj)) 11
對(duì)等索引可通過(guò)用戶相關(guān)反饋信息學(xué)習(xí)得到,由于組成書法牌匾的書法字要求風(fēng)格一致,于是當(dāng)候選集中牌匾ci=<Vi1,Vi2,...Vin>滿足用戶需求,則書法字Vi1,Vi2,...Vin構(gòu)成潛在正例集VLR,若牌匾ci中一半以上的書法字被選為正例,則剩下的書法字構(gòu)成潛在負(fù)例集VLN,如果候選集不能滿足用戶需求,用戶選擇風(fēng)格相似的字組成所需牌匾(選擇過(guò)程被稱為UserFeedBack),這些字作為正例,形成集合VR;用戶還可以明確選擇其它與正例中風(fēng)格不同的字作為反例,形成集合VN;
學(xué)習(xí)算法為
步驟c1收集反饋集VLR,VR,VN和VLN;
步驟c2對(duì)VLR或VR中任意兩個(gè)書法字Vi和Vj,若Vj不在P(Vi)中,則將Vj加到P(Vi),并初始化權(quán)重為1,否則,將P(Vi)中Vj對(duì)應(yīng)的權(quán)重加1,同樣,Vi也被加到P(Vj)中去;
步驟c3對(duì)VR中的書法字Vi和VN中的書法字Vj,若Vj在P(Vi)中,則將Vj對(duì)應(yīng)的權(quán)重減5,若減后結(jié)果小于1,則將Vj從P(Vi)中去除,同樣,將Vi從P(Vj)中去除或?qū)⑵湎鄳?yīng)的權(quán)重減5;
步驟c4對(duì)VLN中的書法字作與VN類似的處理,調(diào)整的權(quán)重值為2;
反饋傳遞算法FeedbackTransfer利用反饋信息更新書法作品之間和書法家之間的風(fēng)格相似度,從而更新書法字的上下文風(fēng)格特征,設(shè)庫(kù)中共有M幅書法作品和N個(gè)書法字,用N維向量W=[w1,w2,...,wN]表示書法作品,若wi=1,則表示作品含有第i個(gè)書法字,否則wi=0,設(shè)N×N矩陣R為書法字風(fēng)格相似度矩陣,其中rij表示書法字Vi與Vj被用戶指為風(fēng)格相似的程度,可由反饋得到,于是兩書法作品Wi與Wj的相似度為
在反饋之前,rii=1,rij|j≠i=0,由于同一個(gè)書法字屬于不同的書法作品,則wik*wjk=0,于是SIM(Wi,Wj)=0,設(shè)N×N矩陣G為書法作品風(fēng)格相似度矩陣,其中g(shù)ij=SIM(Wi,Wj),用M維向量A=[a1,a2,...aM]表示書法家,若ai=1,表示該書法家寫了第i幅書法作品,則兩書法家風(fēng)格相似度為
反饋可得到更新矩陣ΔR,若書法字Vi與Vj同屬VR或VLR,則ΔRij=1,若Vi與Vj分屬VR和VN,則ΔRij=-5,若Vi與Vj分屬VR和VLN,則ΔRij=-2,Ri+1=Ri+ΔR,則書法作品和書法家的風(fēng)格相似度更新公式為
這里反映了書法作品風(fēng)格相似度的變化,最后通過(guò)SIM(Wi,Wj)i+1和SIM(Ai,Aj)i+1更新書法字上下文風(fēng)格特征。
全文摘要
本發(fā)明公開了一種計(jì)算機(jī)輔助書法牌匾設(shè)計(jì)的方法,其特征是首先結(jié)合書法字內(nèi)容風(fēng)格特征和上下文風(fēng)格特征作為書法字風(fēng)格特征的表達(dá)方式,然后基于該書法字風(fēng)格特征表達(dá)方式,提取并融合書法字的內(nèi)容風(fēng)格特征和上下文風(fēng)格特征,計(jì)算書法字之間的風(fēng)格相似度,接著利用風(fēng)格一致性計(jì)算模型獲取書法牌匾候選集,最后利用對(duì)等反饋傳遞算法改善書法風(fēng)格度量。該方法能克服單一特征作為書法字風(fēng)格特征的局限,通過(guò)融合書法字底層特征和上下文特征來(lái)定義書法字風(fēng)格并計(jì)算風(fēng)格相似度,而且內(nèi)容風(fēng)格特征和上下文風(fēng)格特征均能通過(guò)計(jì)算機(jī)自動(dòng)提取,使得書法牌匾的生成具有實(shí)用性,最后方法能通過(guò)反饋提高系統(tǒng)性能,使產(chǎn)生的書法牌匾更符合人們的審美標(biāo)準(zhǔn)。
文檔編號(hào)G06F17/50GK101236577SQ20081005979
公開日2008年8月6日 申請(qǐng)日期2008年2月29日 優(yōu)先權(quán)日2008年2月29日
發(fā)明者莊越挺, 魯偉明, 吳江琴 申請(qǐng)人:浙江大學(xué)