欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種文本無關(guān)筆跡鑒別的方法和裝置的制作方法

文檔序號:6471809閱讀:182來源:國知局

專利名稱::一種文本無關(guān)筆跡鑒別的方法和裝置的制作方法
技術(shù)領(lǐng)域
:本發(fā)明涉及計算枳3見覺領(lǐng)域,特別涉及一種文本無關(guān)筆跡鑒別的方法和裝置。
背景技術(shù)
:筆跡鑒別是以手寫筆跡樣本的書寫風(fēng)格來鑒別書寫人身份的一種技術(shù),是生物特征識別技術(shù)的一種。以往的筆跡識別是依靠筆跡專家采用專業(yè)鑒別手段來進行,除了鑒別結(jié)果受專家主觀看法影響外,人工大規(guī)模筆跡檢索往往效率低下,因此,計算機自動筆跡識別技術(shù)逐漸成為一門新興的研究領(lǐng)域,在司法、商務(wù)等領(lǐng)域具有廣泛的應(yīng)用。現(xiàn)有的計算機自動筆跡鑒別方法包括文本相關(guān)方法和文本無關(guān)方法。其中,文本無關(guān)方法要求筆跡樣本中含有較多的字符,但對文本內(nèi)容不做限定,這類方法適用面較廣,可用于不同文種筆跡。在現(xiàn)有技術(shù)中,文本無關(guān)方法基于紋理分析,具體操作過程包括對筆跡文本進行灰度掃描,采用人工方式將筆跡中的字符切分出來,獲得多個字符的灰度圖像;然后將每個字符圖像歸一化到一定大小,將一定數(shù)量的字符圖像拼接成一個128x128大小的紋理圖像塊;對紋理圖像塊進行濾波或小波分析,得到濾波圖像;將濾波圖像的統(tǒng)計特性作為描述筆跡風(fēng)才各的紋理特征,最后度量不同紋理特征距離,比較紋理特征距離獲得候選書寫者名單。在現(xiàn)有技術(shù)中,采用紋理分析方法將筆跡文本拼接成紋理塊,在拼接紋理塊時,字符拼接順序本身就影響了紋理的生成,而且字符歸一化也對筆跡紋理有一定破壞。字符拼接的次序?qū)嶋H影響了紋理特征的穩(wěn)定性,尤其在字符形態(tài)差別巨大的中文筆跡上表現(xiàn)更加突出,因此,現(xiàn)有技術(shù)筆跡鑒別性能差,鑒別正確率低,從而影響了筆跡鑒別方法的通用性
發(fā)明內(nèi)容為了提高對于多種文字筆跡的鑒別正確率和鑒別性能,本發(fā)明實施例提供了一種文本無關(guān)筆跡鑒別的方法和裝置。所述技術(shù)方案如下一種文本無關(guān)筆跡鑒別的方法,所述方法包括對查詢筆跡樣本進行預(yù)處理,得到查詢筆跡樣本邊緣圖像;從所述查詢筆跡樣本邊緣圖像中提取查詢筆跡樣本網(wǎng)格微結(jié)構(gòu)特征;計算所述查詢筆跡樣本網(wǎng)格微結(jié)構(gòu)特征與每個參考筆跡樣本網(wǎng)格微結(jié)構(gòu)特征在不同維度上的標(biāo)準(zhǔn)差;通過加權(quán)所述標(biāo)準(zhǔn)差,計算所述查詢筆跡樣本網(wǎng)格微結(jié)構(gòu)特征與所述每個參考筆跡樣本網(wǎng)格微結(jié)構(gòu)特征的特征間距離;對所述特征間距離進行比較排序,獲得所述查詢筆跡樣本書寫者候選列表。一種文本無關(guān)筆跡鑒別的裝置,所述裝置包括預(yù)處理模塊,用于對查詢筆跡樣本進行預(yù)處理,得到查詢筆跡樣本邊緣圖像;特征提取模塊,用于從所述查詢筆跡樣本邊緣圖像中提取查詢筆跡樣本網(wǎng)格微結(jié)構(gòu)特征;權(quán)值計算模塊,用于計算所述查詢筆跡樣本網(wǎng)格微結(jié)構(gòu)特征與每個參考筆跡樣本網(wǎng)格微結(jié)構(gòu)特征在不同維度上的標(biāo)準(zhǔn)差;距離計算模塊,用于通過加權(quán)所述標(biāo)準(zhǔn)差,計算不同維度上所述查詢筆跡樣本網(wǎng)格微結(jié)構(gòu)特征與每個參考筆跡樣本網(wǎng)格微結(jié)構(gòu)特征的特征間距離;比較模塊,用于對所述特征間距離進行排序,獲得所述查詢筆跡樣本書寫者候選列表。本發(fā)明實施例提供的技術(shù)方案的有益效果是本發(fā)明實施例通過對查詢筆跡樣本和多個參考筆跡樣本分別進行預(yù)處理,提取網(wǎng)格微結(jié)構(gòu)特征,比較查詢筆跡樣本網(wǎng)格微結(jié)構(gòu)特征與每個參考筆跡樣本網(wǎng)格微結(jié)構(gòu)特征的特征間距離大小,獲取查詢筆跡樣本的書寫人候選列表,提高了筆跡鑒別的正確率和鑒別性能,同時提高了筆跡鑒別方法的通用性。圖1是本發(fā)明實施例提供的文本無關(guān)筆跡鑒別的方法流程圖;圖2是本發(fā)明實施例1提供的文本無關(guān)筆跡鑒別的方法流程圖;圖3是本發(fā)明實施例1提供的預(yù)處理方法流程圖4是本發(fā)明實施例1提供的網(wǎng)格微結(jié)構(gòu)特征提取的方法流程圖5是本發(fā)明實施例1提供的鑒別正確率與網(wǎng)格大小關(guān)系示意圖6是本發(fā)明實施例l提供的網(wǎng)格窗口結(jié)構(gòu)示意圖7是本發(fā)明實施例1提供的局部微結(jié)構(gòu)提取的示意圖8是本發(fā)明實施例2提供的文本無關(guān)筆跡鑒別的裝置結(jié)構(gòu)圖。具體實施例方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖對本發(fā)明實施方式作進一步地詳細描述。參見圖1,本發(fā)明實施例提供了一種文本無關(guān)筆跡鑒別方法,包括101:對查詢筆跡樣本進行預(yù)處理,得到查詢筆跡樣本邊緣圖像;102:從查詢筆跡樣本邊緣圖像中提取查詢筆跡樣本網(wǎng)格微結(jié)構(gòu)特征;103:計算查詢筆跡樣本網(wǎng)格微結(jié)構(gòu)特征與每個參考筆跡樣本網(wǎng)格微結(jié)構(gòu)特征在不同維度上的標(biāo)準(zhǔn)差;104:通過加權(quán)標(biāo)準(zhǔn)差,計算查詢筆跡樣本網(wǎng)沖各微結(jié)構(gòu)特征與每個參考筆跡樣本網(wǎng);f^效結(jié)構(gòu)特征的特征間距離;105:對特征間距離進行比較排序,獲得查詢筆跡樣本書寫者候選列表。本發(fā)明實施例通過對查詢筆跡樣本和多個參考筆跡樣本分別進行預(yù)處理,提取網(wǎng)格微結(jié)構(gòu)特征,比較查詢筆跡樣本網(wǎng)格微結(jié)構(gòu)特征與每個參考筆跡樣本網(wǎng)格微結(jié)構(gòu)特征的特征間距離大小,獲取查詢筆跡樣本的書寫人候選列表,提高了筆跡鑒別的正確率和鑒別性能,同時提高了筆跡鑒別方法的通用性。實施例1為了實現(xiàn)文本無關(guān)筆跡的鑒別,本發(fā)明通過提取筆跡樣本的筆畫層次信息,對書寫人在書寫筆畫層次方面使用不同微結(jié)構(gòu)的習(xí)慣進行描述,突出筆跡風(fēng)格差異的本質(zhì),提出一種針對文本無關(guān)的筆跡鑒別方法,下面以一具體實施例詳纟曰描述。參見圖2,本發(fā)明實施例提供了一種文本無關(guān)筆跡鑒別方法,具體包括201:收集多個筆跡樣本,作為參考筆跡樣本,并對每個參考筆跡樣本進行預(yù)處理,得到參考筆跡樣本的邊緣圖像;該參考筆跡樣本可以為多文種筆跡樣本,例如中文、英文、藏文和維吾爾文等。參見圖3,預(yù)處理過程具體包括201a:分別對每個參考筆跡樣本進行灰度掃描,得到參考筆跡樣本的灰度圖像;在本發(fā)明實施例中,灰度掃描指的是將每個參考筆跡樣本在300dpi分辨率設(shè)置下進行掃描;灰度圖像為256階灰度的圖像文件;201b:對每個參考筆跡樣本的灰度圖像進行二值化,得到參考筆跡樣本的二值圖像,如果參考筆跡樣本中存在噪聲信息,對該參考筆跡樣本進行去噪處理;二值圖像指的是僅包含書寫時筆跡像素信息的黑、白二值圖像,其中所有黑像素點構(gòu)成書寫時的筆跡;二值化指的是將筆跡樣本的灰度圖像轉(zhuǎn)換為僅包含筆跡像素信息的黑、白二值圖像的過程,二值化的關(guān)鍵是找到合適的閾值來區(qū)分不同筆跡樣本的對象和背景,其中闊值由最大化對象和背景的類內(nèi)方差確定;二值化過程可以采用Ostu算法;該Ostu算法是利用最大類間方差法、判決分析最小二乘法推到得出,采用Ostu算法進行二值化具體為統(tǒng)計灰度圖像中不同灰度值的像素個數(shù),除以總像素個數(shù),得到概率密度函數(shù);然后以閾值為基準(zhǔn)將灰度級劃分為前景和背景兩類,并二值化為筆跡樣本對象和筆跡樣本背景,其中前景包括筆跡、格線、圖像等,背景包括紙張等;噪聲信息指的是除筆跡像素信息外,其它非筆跡《象素信息,包括格線、圖片、花紋和印刷字符等;去噪過程是一個附加過程,當(dāng)參考筆跡樣本中存在噪聲信息時,二值化4艮難完全去除非筆跡像素信息,需要對二值圖像進行去噪處理,可以采用連通域算法,對于圖片、花紋等可以采用人工去除;201c:對每個參考筆跡樣本的二值圖像進行邊緣檢測,得到參考筆跡樣本的邊緣圖像;邊緣圖像指的是通過對二值圖像進行邊緣檢測找出邊緣像素點,由邊緣像素點構(gòu)成的二值圖像;邊緣;險測可以采用以下方法利用梯度算子計算二值圖像的梯度信息,并以梯度最大的位置作為二值圖像邊緣,然后利用基于噪聲均方根估計的方法確定二值圖像邊緣的判決閾值,如果某像素點所在位置的梯度值大于該判決閾值,則該像素點為邊緣像素點,查找多個邊緣像素點最終獲得邊緣圖像;其中,判決闊值用于區(qū)分邊緣像素點和非邊緣像素點,一般以某一梯度值作為閾值;梯度算子可以采用Sobel算子獲取二值圖像的梯度信息。202:從每個參考筆跡樣本的邊緣圖像中,分別提取參考筆跡樣本的網(wǎng)格微結(jié)構(gòu)特征;網(wǎng)格微結(jié)構(gòu)特征是一種概率密度函數(shù)特征,或稱為直方圖特征,網(wǎng)格窗口微結(jié)構(gòu)特征可以表征書寫人在筆畫層次上的書寫習(xí)慣,包括筆畫結(jié)構(gòu)的連續(xù)變化和相互關(guān)聯(lián)。參見圖4,從邊緣圖像中提取網(wǎng)格微結(jié)構(gòu)特征的具體步驟如下202a:為每個參考筆跡樣本設(shè)定一個固定大小的網(wǎng)格窗口,標(biāo)定每個網(wǎng)格位置;具體地,假設(shè)設(shè)定一個大小為(2丄+1)x(2丄+1)的網(wǎng)格窗口;其中,丄表示網(wǎng)格窗口的中心網(wǎng)格到網(wǎng)格窗口的邊緣網(wǎng)格的水平或垂直距離;網(wǎng)格窗口中除中心網(wǎng)格以外的每個網(wǎng)格位置都用序號^來標(biāo)定,其中m是該網(wǎng)格位置與中心網(wǎng)格橫坐標(biāo)差和縱坐標(biāo)差的較大值,即表示了該網(wǎng)格位置到中心網(wǎng)格的距離,i是用來區(qū)分距中心網(wǎng)格相同距離上的8w個網(wǎng)格位置;同一附取值的8w個網(wǎng)才各位置,/人水平方向按照逆時針順序分別標(biāo)定為Om,lra,2m......8m-lm;這樣,(2丄+l)x(2i:+l)的網(wǎng)格窗口中除中心網(wǎng)格以外的網(wǎng)格位置均4皮標(biāo)記,標(biāo)記符號集為yjl^附^丄,02/S8m—1};網(wǎng)格越小,包含的信息也越少,不利于從中獲取筆跡風(fēng)格信息;如果網(wǎng)格太大,就會包括更多字符結(jié)構(gòu)信息,這些信息會妨礙提取筆跡風(fēng)格信息;如圖5所示,當(dāng)網(wǎng)格大小從9x9變化到21x21,即丄取4到10時,首選、前5選、前10選和前20選鑒別正確率的變化情況;參見圖6,本發(fā)明實施例使用一個9x9的網(wǎng)格窗口,即£=4,其中除中心網(wǎng)格以外的網(wǎng)格位置均已被標(biāo)定。202b:利用參考筆跡樣本的網(wǎng)格窗口遍歷該參考筆跡樣本的邊緣圖像,在遍歷過程中分別提取局部區(qū)域的各類局部微結(jié)構(gòu);局部微結(jié)構(gòu)指的是遍歷邊緣圖像過程中,網(wǎng)格窗口位于每一個邊緣像素點時,覆蓋的局部區(qū)域滿足一定位置關(guān)系的特殊的邊緣像素點對;能夠反映書寫人書寫筆畫的長短、粗細、方向、彎曲程度和筆畫間關(guān)聯(lián)等特征;本發(fā)明實施例中,局部微結(jié)構(gòu)包括位于同一筆跡邊緣圖像上且與中心網(wǎng)格距離相等的邊緣像素點對和位于同一筆跡邊緣圖像上且與中心網(wǎng)格距離不等但相互最臨近的邊緣像素點對;具體地,滿足以下三組條件的邊緣像素點集合分別組成三類不同的局部微結(jié)構(gòu),這三類局部微結(jié)構(gòu)是在所有局部微結(jié)構(gòu)中相對最有效的三類局部微結(jié)構(gòu);三組條件分別如下第一組條件記為條件組一,如下所示J1^附=/^丄,0^/</^8附(、j^與乂上的邊緣像素點在窗口內(nèi)連通第二組條件記為條件組二,如下所示'1《附=/一1"-1<^與/,上的邊緣像素點在窗口內(nèi)連通(2)/與/,上的邊緣像素點最近鄰第三組條件記為條件組三,如下所示'Km二卩一2《i一2-^與乂上的邊緣像素點在窗口內(nèi)連通(3)_/與/,上的邊緣像素點最近鄰每類局部^i:結(jié)構(gòu)可以用序號對</,乂>來表示,<D,>是指在網(wǎng)格位置^和/,上同時出現(xiàn)一對邊緣像素點,其中,lSm,"丄,0S/《8w-l,0S/S8/—1;滿足上述三組條件的<U>集合即為在網(wǎng)格窗口遍歷過程中所要考察的局部微結(jié)構(gòu),下面以一具體例子詳細描述按照上述三組條件提取局部微結(jié)構(gòu)的過程;參見圖7,圖中右側(cè)是一個參考筆跡樣本邊緣圖《象的一部分,其中包含一個手寫漢字"但";圖中左側(cè)是9x9網(wǎng)格窗口的放大示意圖,該9x9網(wǎng)格窗口位于右側(cè)邊緣圖像中灰框所在的位置,中心網(wǎng)格落在邊緣圖像中一個邊緣像素點上,其中灰黑色的網(wǎng)格上有邊緣像素點;滿足條件組一的局部樣i結(jié)構(gòu)包括〈l"6一、<32,112>、<43,173>、<93,103>、<203,233>、<64,224>、<104,154>、<154,164>、<164,174>和<264,314>;滿足條件組二的局部《效結(jié)構(gòu)包括〈、,32〉、〈6pl12〉、<32,43>、<112,173>、<142,203>、<142,233>、<43,64>、<93,104>、<103,154>、<103,164>、<103,174>、<173,224>、<203,264>和<233,314>;滿足條件組三的局部孩支結(jié)構(gòu)包4舌〈1,A〉、<6P173>、<32,64>、<112,224>、<142,264>和<142,314>;三類局部微結(jié)構(gòu)反映了局部區(qū)域內(nèi)筆畫的延展長度、延展方向和筆畫間的相互位置關(guān)系;202c:網(wǎng)格窗口的中心網(wǎng)格依次遍歷每個參考筆跡樣本的邊緣圖像上所有邊緣像素點,并分別統(tǒng)計各類局部微結(jié)構(gòu)出現(xiàn)的概率,得到網(wǎng)格微結(jié)構(gòu)特征;本發(fā)明實施例中有三類局部微結(jié)構(gòu),統(tǒng)計過程分為三個階段第一階段初始化用變量力矣^0,/,)11Sw《丄,O^《8m—1,1《"丄,O《/《8/—1}來i己錄不同局部孩i結(jié)構(gòu)在整幅邊緣圖像中出現(xiàn)的次數(shù),在遍歷開始之前,將變量族^(l義》的每一個變量W、,7,)均初始化為零,即令U》=0(4)對戶斤有的<^,乂>成立,其中l(wèi)《附,/《丄,0Sf《8m—1,0sy^8/—1;第二階段遍歷過程中當(dāng)網(wǎng)格窗口的中心網(wǎng)格移動到一個新的邊緣像素點時,在該網(wǎng)格窗口區(qū)域內(nèi)查找符合三組條件集合的邊緣像素點對;若出現(xiàn)滿足條件的局部微結(jié)構(gòu)《,y,>,令其對應(yīng)的記錄變量/z(。/,)作自加一運算,即WWX乂)+i(5)當(dāng)記錄完窗口區(qū)域內(nèi)的所有局部微結(jié)構(gòu),網(wǎng)格窗口中心再移動到下一個邊緣像素點位置;如此反復(fù),當(dāng)網(wǎng)格窗口中心遍歷完邊緣圖像中的所有邊緣像素點時,w^,y,)的值就是在整幅圖像中出現(xiàn)微結(jié)構(gòu)<^,/,>的次數(shù);第三階段遍歷結(jié)束后三個變量族{/(!,/,)}記錄了三類局部微結(jié)構(gòu)在邊緣圖像中出現(xiàn)的次數(shù);將三個變量族諷^,)}的各個元素相力口,得到三類局部微結(jié)構(gòu)出現(xiàn)的總次數(shù),記為if,即L£8m—m=l/=l,=oy=o分別用三類局部微結(jié)構(gòu)的出現(xiàn)次數(shù)除以總次數(shù)//,得到三類局部微結(jié)構(gòu)在整幅邊緣圖像中的出現(xiàn)概率,用p(、,乂)來表示局部微結(jié)構(gòu)〈i乂〉的出現(xiàn)概率值,即有威,》^1。(7)所有概率值滿足m=l/=1/=0_/=0由所有概率值共同組成的概率值族^(^,/,"就構(gòu)成了三類不同的局部微結(jié)構(gòu)在整幅邊緣圖像中出現(xiàn)的離散概率密度分布,該概率密度分布即為網(wǎng)格微結(jié)構(gòu)特征,反應(yīng)了書寫人在筆畫層次上的書寫習(xí)慣;本發(fā)明實施例中的網(wǎng)格微結(jié)構(gòu)特征是局部微結(jié)構(gòu)中邊緣像素點對出現(xiàn)在全局邊緣圖像的概率分布。203:將每個參考筆跡樣本的網(wǎng)格微結(jié)構(gòu)特征與相應(yīng)的參考筆跡樣本的書寫人信息存入數(shù)據(jù)庫;本發(fā)明實施例中該數(shù)據(jù)庫為參考筆跡特征庫。204:獲取數(shù)據(jù)庫中所有參考筆跡樣本的網(wǎng)格微結(jié)構(gòu)特征向量,并計算所有參考筆跡樣本在各個維度上的均值特征向量和標(biāo)準(zhǔn)差特征向量;網(wǎng)格微結(jié)構(gòu)特征可以拼接為一個高維向量,每個參考筆跡樣本的網(wǎng)格微結(jié)構(gòu)特征可以看作一個特征向量;假設(shè)數(shù)據(jù)庫中有AT個參考筆跡樣本,各個參考筆跡樣本的特征向量用v^來表示,其中i《"iv;假設(shè)提取出的參考筆跡樣本的網(wǎng)格^t結(jié)構(gòu)特征共有《維,特征向量Vr的第A維分量用《來表示,其中is^《;網(wǎng)格微結(jié)構(gòu)特征的維數(shù)與特征提取使用的網(wǎng)格窗口大小有關(guān),網(wǎng)格窗口越大,特征維數(shù)越高;假設(shè)參考筆跡樣本的網(wǎng)格維結(jié)構(gòu)特征在各個維度上的均值和標(biāo)準(zhǔn)差分別用W和^表示,其中is;5^《,則對于^維特征中的第A維,w個參考筆跡樣本在第;t維上的均值和標(biāo)準(zhǔn)差分別為"丄fi《(9)和<formula>formulaseeoriginaldocumentpage14</formula>標(biāo)準(zhǔn)差反映了參考筆跡樣本在某一維度上特征值的離散程度,如果該維度上的標(biāo)準(zhǔn)差越小,不同參考筆跡樣本在該維度上的特征值越集中,那么,同樣的特征值差異在該維度上就應(yīng)該得到更多的權(quán)重;反之,如果某一維度上的標(biāo)準(zhǔn)差越大,不同樣本在該維度上的特征值就越分散,此時,同等的特征值差異就需要更低的權(quán)重。205:對查詢筆跡樣本進行預(yù)處理,得到查詢筆跡樣本的邊緣圖像;預(yù)處理過程與201a201c所述方法相同,此處不贅述。206:從查詢筆跡樣本的邊緣圖像中,提取查詢筆跡樣本的網(wǎng)格微結(jié)構(gòu)特征;提取查詢筆跡樣本的網(wǎng)格孩支結(jié)構(gòu)特征的過程與202a~202c所述方法相同,此處不贅述。207:獲取查詢筆跡樣本的網(wǎng)格微結(jié)構(gòu)特征向量;假設(shè)查詢筆跡樣本的網(wǎng)格雀吏結(jié)構(gòu)特征向量為,其維數(shù)仍然為K,則第k維特征分量用《來表示。208:利用參考筆跡樣本的標(biāo)準(zhǔn)差加權(quán)算法,計算不同維度上查詢筆跡樣本與參考筆跡樣本的特征相似度,即查詢筆跡樣本與參考筆跡樣本特征間距離;特征相似度是關(guān)于特征間距離的一個函數(shù),特征相似度與特征間距離成反比關(guān)系,特征間距離越小,特征相似度越高;網(wǎng)格微結(jié)構(gòu)特征為一個高維特征向量,可以表示高維空間中的一個坐標(biāo)點,計算兩個筆跡樣本的特征相似度轉(zhuǎn)化為計算網(wǎng)格微結(jié)構(gòu)特征高維空間中兩點間的距離;常用的高維空間中兩點間的距離計算方法有曼哈頓距離、歐式距離、巴氏距離、卡方距離等,這些距離計算方法在計算各個維度上的差異值后直接合并這些差異值,沒有考慮各個維度的不同效力;而網(wǎng)格微結(jié)構(gòu)特征是一個高維特征,每一個維度的特征都代表一種局部微結(jié)構(gòu)的出現(xiàn)概率,反應(yīng)的是書寫人在這種局部微結(jié)構(gòu)上所體現(xiàn)的書寫習(xí)慣,不同的局部微結(jié)構(gòu)對書寫習(xí)慣的刻畫能力不同,具體地,如果不同書寫人都習(xí)慣使用或都不習(xí)慣使用某種局部微結(jié)構(gòu),則不同書寫人筆跡中出現(xiàn)該局部微結(jié)構(gòu)的概率就差不多,該維特征對筆跡風(fēng)格差異的描述能力就差;如;用,則不同書寫人筆跡中出現(xiàn)該局部微結(jié)構(gòu)的概率就差別較大,該維特征對筆跡風(fēng)格差異的描述能力就強;基于以上分析,筆跡風(fēng)格在不同局部微結(jié)構(gòu)上體現(xiàn)的程度不同,每個維度的特征相似度應(yīng)該有不同的權(quán)重,因此,本發(fā)明實施例不采用上述簡單的距離計算方法,而利用各個維度上的標(biāo)準(zhǔn)差對不同維度上的特征相似度進行不同權(quán)值的加權(quán),具體地,選用歐式距離,計算特征向量間的加權(quán)歐式距離距離為"WED.選用曼哈頓距離,計算特征向量間的加權(quán)曼哈頓距離為:^WMD=S選用卡方距離,計算特征向量間的加權(quán)卡方距離為:a—f(K)(11)(12)(13)本發(fā)明實施例中,可以使用這三種加權(quán)距離計算方法中的任意一種,經(jīng)過加權(quán)后,各個維度上的特征值差異對筆跡風(fēng)格的分辨力變得更加均衡,三種距離度量方法的性能差異也不再明顯。209:將查詢筆跡樣本與各個參考筆跡樣本的特征間距離進行排序,獲得查詢筆跡樣本的書寫者候選列表,選取特征間距離最小的參考筆跡樣本,對應(yīng)的書寫者為查詢筆跡樣本的最可能的書寫者;查詢筆跡樣本與某一參考筆跡樣本特征向量間的距離越小,說明查詢筆跡樣本與參考筆跡樣本的特征越相似,則該參考筆跡樣本的書寫人越可能是該查詢筆跡樣本的書寫者;本發(fā)明實施例中,W個參考筆跡樣本特征里必存在一個vRi滿足vR,.二argmi"(VQ,VRj,(14)而^是參考筆跡樣本庫中第!'個參考筆跡樣本的特征向量,那么,第,個參考筆跡樣本的書寫人就作為查詢筆跡樣本的首選書寫者;如果選取前若干個與查詢筆跡樣本特征有最小距離的參考筆跡樣本,這些選出的參考筆跡樣本所對應(yīng)的書寫人組成查詢筆跡樣本的前若干選候選書寫人列表。不同的距離度量方法對筆跡鑒別性能有一定影響,如表1所示,給出了在六種不同的距離度量方法下鑒別性能的變化情況,這六種距離度量分別為歐式距離、曼哈頓距離、卡方距離、加權(quán)歐式距離、加權(quán)曼哈頓距離和加權(quán)卡方距離。由表1可見,本發(fā)明實施例采用的加權(quán)距離度量的性能比原始版的性能有了很大的提高。在前面三種原始距離度量方法中,歐氏距離的性能遠遜于卡方距離和曼哈頓距離,而卡方距離比曼哈頓距離性能稍強。后面三種加權(quán)距離度量方法的性能相當(dāng),加權(quán)歐氏距離性能略差,加權(quán)卡方距離和加權(quán)曼哈頓距離性能最好。相比較而言,加權(quán)曼哈頓距離在多數(shù)情況下可取得最好的性能。表1不同距離度量方法對筆跡鑒別性能的影響<table>tableseeoriginaldocumentpage16</column></row><table>本發(fā)明實施例提出的筆跡鑒別方法獲得的最高鑒別正確率為95.4%,說明了本發(fā)明實施例提供的方法在中文筆跡鑒別上的有效性。采用本發(fā)明實施例提供的方法在英文、藏文和維吾爾文筆跡庫上進行實驗,如表2所示,給出了在中文、英文、藏文和維吾爾文四個不同的筆跡庫上使用該筆跡鑒別方法的鑒別正確率。表2基于網(wǎng)格微結(jié)構(gòu)特征的筆跡鑒別方法在不同文種筆跡庫上的性能<table>tableseeoriginaldocumentpage16</column></row><table>種筆跡上具有4艮好的鑒別性能,適用性廣,正確率高。本發(fā)明實施例通過對查詢筆跡樣本和多個參考筆跡樣本分別進行預(yù)處理,提取網(wǎng)格微結(jié)構(gòu)特征作為對筆跡風(fēng)格的量化特征,并將查詢筆跡樣本的網(wǎng)格微結(jié)構(gòu)特征與每個參考筆跡樣本的網(wǎng)格微結(jié)構(gòu)特征分別計算加權(quán)距離,以加權(quán)距離度量作為筆跡樣本間相似度的度量方法,通過比較查詢筆跡樣本與每個參考筆跡樣本特征間距離大小,將與查詢筆跡樣本特征距離最小的參考筆跡樣本所對應(yīng)的書寫者作為查詢筆跡樣本的首選候選書寫者,該方法通過提取筆畫層次信息,在筆畫層次上對書寫人的書寫習(xí)慣進行描述,提高了筆跡鑒別的正確率和鑒別性能,同時提高了筆跡鑒別方法的通用性。實施例2參見圖7,本發(fā)明實施例提供了一種文本無關(guān)筆跡鑒別的裝置,具體包括預(yù)處理模塊701,用于對收集到的多個參考筆跡樣本和需要鑒別的查詢筆跡樣本進行預(yù)處理,分別得到多個參考筆跡樣本邊緣圖像和查詢筆跡樣本邊緣圖像;預(yù)處理才莫塊701對筆跡樣本進行預(yù)處理的過程詳見步驟201a~201c,此處不贅述;特征提取模塊702,用于分別從預(yù)處理模塊701得到的每個參考筆跡樣本邊緣圖像和查詢筆跡樣本邊緣圖像中提取相應(yīng)的參考筆跡樣本網(wǎng)格微結(jié)構(gòu)特征和查詢筆跡樣本網(wǎng)格微結(jié)構(gòu)特征;特征提^^莫塊702提取網(wǎng)格微結(jié)構(gòu)特征的方法詳見步驟202a-202c,此處不贅述;存儲模塊703,用于存儲每個參考筆跡樣本的網(wǎng)格微結(jié)構(gòu)特征與相應(yīng)的參考筆跡樣本的書寫人信息;權(quán)值計算模塊704,用于計算存儲模塊703中每個參考筆跡樣本的網(wǎng)格微結(jié)構(gòu)特征向量在各個維度上的均值和標(biāo)準(zhǔn)差;均值和標(biāo)準(zhǔn)差的計算方法假設(shè)數(shù)據(jù)庫中有W個參考筆跡樣本,各個參考筆跡樣本的特征向量用來表示,其中is"^iv;假設(shè)提取出的參考筆跡樣本的網(wǎng)格微結(jié)構(gòu)特征共有K維,特征向量Vrw的第yt維分量用《來表示,其中h^^〖;網(wǎng)格微結(jié)構(gòu)特征的維數(shù)與特征提取使用的網(wǎng)格窗口大小有關(guān),網(wǎng)格窗口越大,特征維數(shù)越高;假設(shè)參考筆跡樣本的網(wǎng)格維結(jié)構(gòu)特征在各個維度上的均值和標(biāo)準(zhǔn)差分別用W和^表示,其中BA:《A:,則對于《維特征中的第yt維,iV個參考筆跡樣本在第A:維上的均值和標(biāo)準(zhǔn)差分別為"^Z《(15)和^:.f^VK(16)距離計算模塊705,用于利用參考筆跡樣本標(biāo)準(zhǔn)差加權(quán)算法,計算不同維度上查詢比較樣本與各個參考筆跡樣本的特征間距離;通過對不同維度上的標(biāo)準(zhǔn)差進行不同權(quán)值的加權(quán),計算不同維度上查詢比較樣本與各個參考筆跡樣本的特征間距離,特征間距離的三種計算方法如下加權(quán)歐式距離算法、加權(quán)曼哈頓距離算法和加權(quán)卡方距離算法分別為^WED二卄X"1(《(17)(18)和dy(VQ(19)"1(VQ+VR)CT本發(fā)明實施例中,可以使用這三種加權(quán)距離計算方法中的任意一種,經(jīng)過加權(quán)后,各個維度上的特征值差異對筆跡風(fēng)格的分辨力變得更加均衡,三種距離度量方法的性能差異也不再明顯;比較^^莫塊706,用于將查詢筆跡樣本與各個參考筆跡樣本的特征間距離進行比較排序,獲得查詢筆跡樣本的候選書寫者名單,選取特征間距離最小的,對應(yīng)的參考筆跡樣本的書寫人為查詢筆跡樣本的首選書寫者;查詢筆跡樣本與某一參考筆跡樣本特征向量間的距離越小,說明查詢筆跡樣本與參考筆跡樣本的特征越相似,則該參考筆跡樣本的書寫人越可能是該查詢筆跡樣本的書寫者;本發(fā)明實施例中,w個參考筆跡樣本特征里必存在一個vR,滿足二argmi"(VQ,VgJ,(20)而,是參考筆跡樣本庫中第!'個參考筆跡樣本的特征向量,那么,第/個參考筆跡樣本的書寫人就作為查詢筆跡樣本的首選書寫者;如果選取前若干個與查詢筆跡樣本特征有最小距離的參考筆跡樣本,這些選出的參考筆跡樣本所對應(yīng)的書寫人組成查詢筆跡樣本的前若干選候選書寫人列表。進一步地,預(yù)處理模塊701具體包括掃描單元7011,用于對多個參考筆跡樣本和查詢筆跡樣本進行灰度掃描,分別得到筆跡樣本的灰度圖像和查詢筆跡樣本的灰度圖像;二值化單元7012,用于對灰度圖像進行二值化,得到參考筆跡樣本的二值圖像和查詢筆跡樣本的二值圖像;去噪單元7013,用于在參考筆跡樣本和查詢筆跡樣本中存在噪聲信息的情況下,對參考筆跡樣本和查詢筆跡樣本進行去噪處理;其中,噪聲信息指的是除筆跡像素信息外,其它非筆跡像素信息,包括格線、圖片、花紋和印刷字符等;邊緣^r測單元7014,用于對二值圖像進行邊續(xù)J險測,得到參考筆跡樣本的邊緣圖像和查詢筆跡樣本的邊緣圖像。特征提取溪塊702具體包括網(wǎng)格設(shè)定單元7021,用于為每個參考筆跡樣本和查詢筆跡樣本分別設(shè)定一個固定大小的網(wǎng)格窗口,標(biāo)定每個網(wǎng)格位置;局部微結(jié)構(gòu)提取單元7022,用于利用參考筆跡樣本和查詢筆跡樣本各自的網(wǎng)格窗口遍歷相應(yīng)的邊緣圖像,在遍歷過程中分別提取局部區(qū)域的各類局部微結(jié)構(gòu);概率統(tǒng)計單元7023,用于利用網(wǎng)格窗口的中心網(wǎng)格依次遍歷相應(yīng)的邊緣圖像上所有邊緣像素點,并分別統(tǒng)計參考筆跡樣本和查詢筆跡樣本中各種局部孩史結(jié)構(gòu)出現(xiàn)的概率,得到參考筆跡樣本的網(wǎng)格微結(jié)構(gòu)特征和查詢筆跡樣本的網(wǎng)格微結(jié)構(gòu)特征。本發(fā)明實施例通過預(yù)處理模塊分別對多個參考筆跡樣本和查詢筆跡樣本預(yù)處理,分別得到多個參考筆跡樣本邊緣圖像和查詢筆跡樣本邊緣圖像,經(jīng)過特征提取模塊提取每個參考筆跡樣本和查詢筆跡樣本的網(wǎng)祐4鼓結(jié)構(gòu)特征,通過第二計算模塊的參考筆跡樣本標(biāo)準(zhǔn)差加權(quán)算法,得到查詢筆跡樣本與每個參考筆跡樣本在各個維度上的特征間距離,由比較模塊比較所有特征間距離并排序,獲取查詢筆跡樣本的候選書寫者,該方法通過提取筆畫層次信息,在筆畫層次上對書寫人的書寫習(xí)慣進行描述,提高了筆跡鑒別的正確率和鑒別性能,同時提高了筆跡鑒別方法的通用性。以上實施例提供的技術(shù)方案中的全部或部分內(nèi)容可以通過軟件編程實現(xiàn),其軟件程序存儲在可讀取的存儲介質(zhì)中,存儲介質(zhì)例如計算機中的硬盤、光盤或4欠盤。以上所述僅為本發(fā)明的較佳實施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。權(quán)利要求1.一種文本無關(guān)筆跡鑒別的方法,其特征在于,所述方法包括對查詢筆跡樣本進行預(yù)處理,得到查詢筆跡樣本邊緣圖像;從所述查詢筆跡樣本邊緣圖像中提取查詢筆跡樣本網(wǎng)格微結(jié)構(gòu)特征;計算所述查詢筆跡樣本網(wǎng)格微結(jié)構(gòu)特征與每個參考筆跡樣本網(wǎng)格微結(jié)構(gòu)特征在不同維度上的標(biāo)準(zhǔn)差;通過加權(quán)所述標(biāo)準(zhǔn)差,計算所述查詢筆跡樣本網(wǎng)格微結(jié)構(gòu)特征與所述每個參考筆跡樣本網(wǎng)格微結(jié)構(gòu)特征的特征間距離;對所述特征間距離進行比較排序,獲得所述查詢筆跡樣本書寫者候選列表。2.如權(quán)利要求l所述的方法,其特征在于,所述對查詢筆跡樣本進行預(yù)處理,得到查詢筆跡樣本邊緣圖像,具體為對所述查詢筆跡樣本進行灰度掃描,得到所述查詢筆跡樣本的灰度圖像;對所述灰度圖像進行二值化,得到所述查詢筆跡樣本的二值圖像,如果所述查詢筆跡樣本中存在噪聲信息,對所述查詢筆跡樣本進行去噪處理;對所述二值圖像進行邊緣檢測,得到所述查詢筆跡樣本的邊緣圖像。3.如權(quán)利要求l所述的方法,其特征在于,所述從所述查詢筆跡樣本邊緣圖像中提取查詢筆跡樣本網(wǎng)格微結(jié)構(gòu)特征,具體為為所述查詢筆跡樣本設(shè)定一個固定大小的網(wǎng)格窗口,標(biāo)定每個網(wǎng)格位置;利用所述查詢筆跡樣本的所述網(wǎng)格窗口遍歷所述邊緣圖像,在遍歷過程中分別提取局部區(qū)域的各類局部微結(jié)構(gòu);所述網(wǎng)格窗口的中心網(wǎng)格依次遍歷所述邊緣圖像上所有邊緣像素點,并分別統(tǒng)計所述查詢筆跡樣本中所述各類局部微結(jié)構(gòu)出現(xiàn)的概率,得到所述查詢筆跡樣本的網(wǎng)格微結(jié)構(gòu)特征。4.如權(quán)利要求3所述的方法,其特征在于,所述各類局部微結(jié)構(gòu)包括位于同一筆跡邊緣圖像上且與中心網(wǎng)格距離相等的邊緣像素點對;位于同一筆跡邊緣圖像上且與中心網(wǎng)格距離不等但相互最臨近的邊緣像素點對'5.如權(quán)利要求l所述的方法,其特征在于,所述通過加權(quán)所述標(biāo)準(zhǔn)差,計算所述查詢筆跡樣本網(wǎng)格微結(jié)構(gòu)特征與每個參考筆跡樣本網(wǎng)格微結(jié)構(gòu)特征的特征間距離,具體為將一個所述參考筆跡樣本網(wǎng)格微結(jié)構(gòu)特征和所述查詢筆跡樣本網(wǎng)格微結(jié)構(gòu)特征看作兩個高維特征向量;通過對所述標(biāo)準(zhǔn)差進行不同權(quán)值的加權(quán),利用標(biāo)準(zhǔn)差加權(quán)歐式距離算法<formula>formulaseeoriginaldocumentpage3</formula>利用標(biāo)準(zhǔn)差加權(quán)曼哈頓距離算法<formula>formulaseeoriginaldocumentpage3</formula>或或利用標(biāo)準(zhǔn)差加權(quán)卡方距離算法計算所述兩個高維特征向量在高維空間中的特征間距離,6.—種文本無關(guān)筆跡鑒別的裝置,其特征在于,所述裝置包括預(yù)處理模塊,用于對查詢筆跡樣本進行預(yù)處理,得到查詢筆跡樣本邊緣圖像;特征提^Mi塊,用于從所述查詢筆跡樣本邊緣圖像中提取查詢筆跡樣本網(wǎng)格4敖結(jié)構(gòu)特征;權(quán)值計算模塊,用于計算所述查詢筆跡樣本網(wǎng)格^f數(shù)結(jié)構(gòu)特征與每個參考筆跡樣本網(wǎng)格微結(jié)構(gòu)特征在不同維度上的標(biāo)準(zhǔn)差;距離計算模塊,用于通過加權(quán)所述標(biāo)準(zhǔn)差,計算不同維度上所述查詢筆跡樣本網(wǎng)格微結(jié)構(gòu)特征與每個參考筆跡樣本網(wǎng)格微結(jié)構(gòu)特征的特征間距離;比較模塊,用于對所述特征間距離進行排序,獲得所述查詢筆跡樣本書寫者候選列表。7.如權(quán)利要求6所述的裝置,其特征在于,所述預(yù)處理模塊具體包括掃描單元,用于對所述查詢筆跡樣本進行灰度掃描,得到所述查詢筆跡樣本的灰度圖像;二值化單元,用于對所述灰度圖像進行二值化,得到所述查詢筆跡樣本的二值圖像;去噪單元,用于在所述查詢筆跡樣本中存在噪聲信息時,對所述查詢筆跡樣本進行去噪處理;邊緣檢測單元,用于對所述二值圖像進行邊緣檢測,得到所述查詢筆跡樣本的邊緣圖像。8.如權(quán)利要求6所述的裝置,其特征在于,所述特征提取模塊具體包括網(wǎng)格設(shè)定單元,用于為所述查詢筆跡樣本設(shè)定一個固定大小的網(wǎng)格窗口,標(biāo)定每個網(wǎng)格位置;局部微結(jié)構(gòu)提取單元,用于利用所述查詢筆跡樣本的所述網(wǎng)格窗口遍歷所述邊緣圖像,在遍歷過程中分別提取局部區(qū)域的各類局部微結(jié)構(gòu);概率統(tǒng)計單元,用于利用所述網(wǎng)格窗口的中心網(wǎng)才^i次遍歷所述邊緣圖像上所有邊緣像素點,并分別統(tǒng)計所述查詢筆跡樣本中所述各類局部微結(jié)構(gòu)出現(xiàn)的概率,得到所述查詢筆跡樣本的網(wǎng)格微結(jié)構(gòu)特征。9.如權(quán)利要求6所述的裝置,其特征在于,所述距離計算模塊,用于通過加權(quán)所述標(biāo)準(zhǔn)差,計算不同維度上所述查詢筆跡樣本網(wǎng)格微結(jié)構(gòu)特征與每個參考筆跡樣本網(wǎng)格微結(jié)構(gòu)特征的特征間距離,具體為將一個所述參考筆跡樣本網(wǎng)格^L結(jié)構(gòu)特征和所述查詢筆跡樣本網(wǎng)格微結(jié)構(gòu)特征看作兩個高維特征向量;通過對所述標(biāo)準(zhǔn)差進行不同權(quán)值的加權(quán),距離計算模塊利用標(biāo)準(zhǔn)差加權(quán)歐式距離算法利用標(biāo)準(zhǔn)差加權(quán)曼哈頓距離算法利用標(biāo)準(zhǔn)差加權(quán)卡方距離算法<formula>formulaseeoriginaldocumentpage5</formula>計算所述兩個高維特征向量在高維空間中的特征間距離全文摘要本發(fā)明公開了一種文本無關(guān)筆跡鑒別的方法和裝置,屬于計算機視覺領(lǐng)域。所述方法包括對查詢筆跡樣本進行預(yù)處理,得到查詢筆跡樣本邊緣圖像;從查詢筆跡樣本邊緣圖像中提取查詢筆跡樣本網(wǎng)格微結(jié)構(gòu)特征;計算查詢筆跡樣本網(wǎng)格微結(jié)構(gòu)特征與每個參考筆跡樣本網(wǎng)格微結(jié)構(gòu)特征在不同維度上的標(biāo)準(zhǔn)差;通過加權(quán)標(biāo)準(zhǔn)差,計算查詢筆跡樣本網(wǎng)格微結(jié)構(gòu)特征與每個參考筆跡樣本網(wǎng)格微結(jié)構(gòu)特征的特征間距離;對特征間距離進行比較排序,獲得查詢筆跡樣本書寫者候選列表。所述裝置包括預(yù)處理模塊、特征提取模塊、權(quán)值計算模塊、距離計算模塊、比較模塊。本發(fā)明通過比較網(wǎng)格微結(jié)構(gòu)特征間距離獲取書寫候選人,提高了筆跡鑒別的正確率和鑒別性能。文檔編號G06K9/64GK101452532SQ20081024009公開日2009年6月10日申請日期2008年12月18日優(yōu)先權(quán)日2008年12月18日發(fā)明者丁曉青,劉長松,彭良瑞,馳方,昕李申請人:清華大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
交城县| 南投市| 乃东县| 桂东县| 辽中县| 和顺县| 和硕县| 台山市| 深水埗区| 鄂尔多斯市| 楚雄市| 德州市| 静海县| 和田县| 洛川县| 拜泉县| 牡丹江市| 卫辉市| 汤阴县| 深水埗区| 大理市| 仙居县| 灵寿县| 利川市| 阿合奇县| 英吉沙县| 灯塔市| 会宁县| 浦东新区| 吴堡县| 灵武市| 河东区| 谢通门县| 闽清县| 庐江县| 大化| 平远县| 藁城市| 广德县| 奈曼旗| 济宁市|