專利名稱:用于從圖像中提取文本筆劃圖像的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像處理領(lǐng)域,更具體地涉及用于從圖像中提取文本筆劃圖像的方法和裝置。
背景技術(shù):
在當(dāng)今的信息處理領(lǐng)域中存在大量的視頻文件。存在對這些視頻文件進(jìn)行有效地檢索的需要。對于視頻標(biāo)注、視頻搜索等,視頻中的文本信息是準(zhǔn)確又簡單的線索。因此,如何準(zhǔn)確地提取并且識別視頻中所包含的文本信息,對后續(xù)的視頻標(biāo)注、視頻檢索非常重要。已知的一些提取文筆筆劃的技術(shù),存在速度慢、噪聲大、對筆劃尺度不敏感等缺點(diǎn)。 需要能夠解決上述問題的用于從圖像中提取文本筆劃圖像的方法和裝置。
發(fā)明內(nèi)容
在下文中給出關(guān)于本發(fā)明的簡要概述,以便提供關(guān)于本發(fā)明的某些方面的基本理解。應(yīng)當(dāng)理解,這個(gè)概述并不是關(guān)于本發(fā)明的窮舉性概述。它并不是意圖確定本發(fā)明的關(guān)鍵或重要部分,也不是意圖限定本發(fā)明的范圍。其目的僅僅是以簡化的形式給出某些概念,以此作為稍后論述的更詳細(xì)描述的前序。本發(fā)明的目的在于,提供一種用于從圖像中提取文本筆劃圖像的方法和裝置。根據(jù)本發(fā)明的一個(gè)方面,提供了一種用于從圖像中提取文本筆劃圖像的方法,包括獲取圖像的邊緣信息和梯度信息;對所獲取的邊緣信息和梯度信息進(jìn)行預(yù)定的加強(qiáng)處理,從而強(qiáng)化圖像中與文本有關(guān)的邊緣信息和梯度信息;以及獲得與經(jīng)強(qiáng)化的邊緣信息和梯度信息相對應(yīng)的文本筆劃圖像。根據(jù)本發(fā)明的另一個(gè)方面,提供了一種用于從圖像中提取文本筆劃圖像的裝置,包括信息獲取單元,用于獲取圖像的邊緣信息和梯度信息;強(qiáng)化單元,用于對所獲取的邊緣信息和梯度信息進(jìn)行預(yù)定的加強(qiáng)處理,從而強(qiáng)化圖像中與文本有關(guān)的邊緣信息和梯度信息;以及筆劃圖像獲得單元,用于獲得與經(jīng)強(qiáng)化的邊緣信息和梯度信息相對應(yīng)的文本筆劃圖像。另外,本發(fā)明的實(shí)施例還提供了用于實(shí)現(xiàn)上述方法的計(jì)算機(jī)程序。此外,本發(fā)明的實(shí)施例還提供了至少計(jì)算機(jī)可讀介質(zhì)形式的計(jì)算機(jī)程序產(chǎn)品,其上記錄有用于實(shí)現(xiàn)上述方法的計(jì)算機(jī)程序代碼。通過以下結(jié)合附圖對本發(fā)明的最佳實(shí)施例的詳細(xì)說明,本發(fā)明的這些以及其他優(yōu)點(diǎn)將更加明顯。
參照下面結(jié)合附圖對本發(fā)明實(shí)施例的說明,會更加容易地理解本發(fā)明的以上和其它目的、特點(diǎn)和優(yōu)點(diǎn)。附圖中的部件只是為了示出本發(fā)明的原理。在附圖中,相同的或類似的技術(shù)特征或部件將采用相同或類似的附圖標(biāo)記來表示。圖I是示出根據(jù)本發(fā)明實(shí)施例的用于從圖像中提取文本筆劃圖像的方法的流程圖;圖IA是示意性地示出階躍信號、脈沖信號、與索貝爾算子對應(yīng)的信號、利用索貝爾算子提取階躍信號的提取結(jié)果、利用索貝爾算子提取脈沖信號的提取結(jié)果、對階躍信號的提取結(jié)果取絕對值后得到的信號、對脈沖信號的提取結(jié)果取絕對值后得到的信號、以及相應(yīng)的經(jīng)偏移的信號的示意圖;圖2是示出根據(jù)本發(fā)明實(shí)施例的通過利用索貝爾算子從圖像中提取文本筆劃圖像的方法的流程圖;圖3是示出待處理的原始圖像;圖4A-圖4H是示出用索貝爾算子卷積后得到的圖像; 圖5A-圖是示出通過對經(jīng)索貝爾算子處理后的圖像向相對方向偏移并合成偏移后的圖像所得到的四張圖像;圖6A-圖6D是示出通過對經(jīng)索貝爾算子處理后的圖像向相反方向偏移并合成偏移后的圖像所得到的四張圖像;圖7是示出整合后所得到的細(xì)筆劃圖像;圖8是示出整合后所得到的粗筆劃圖像;圖9是示出通過過濾處理得到的粗筆劃圖像;圖10是示出根據(jù)本發(fā)明實(shí)施例的用于從圖像中提取文本筆劃圖像的裝置的框圖;圖11是示出根據(jù)本發(fā)明實(shí)施例的通過利用索貝爾算子從圖像中提取文本筆劃圖像的裝置的框圖;以及圖12示出了可以用于實(shí)施本發(fā)明的用于從圖像中提取文本筆劃圖像的方法和裝置的計(jì)算設(shè)備的舉例的結(jié)構(gòu)圖。
具體實(shí)施例方式下面參照附圖來說明本發(fā)明的實(shí)施例。在本發(fā)明的一個(gè)附圖或一種實(shí)施方式中描述的元素和特征可以與一個(gè)或更多個(gè)其它附圖或?qū)嵤┓绞街惺境龅脑睾吞卣飨嘟Y(jié)合。應(yīng)當(dāng)注意,為了清楚的目的,附圖和說明中省略了與本發(fā)明無關(guān)的、本領(lǐng)域普通技術(shù)人員已知的部件和處理的表示和描述。以下參照圖I來描述根據(jù)本發(fā)明實(shí)施例的用于從圖像中提取文本筆劃圖像的方法。圖I是示出根據(jù)本發(fā)明實(shí)施例的用于從圖像中提取文本筆劃圖像的方法的流程圖。如圖I所示,在步驟S102中,可以獲取圖像的邊緣信息和梯度信息。優(yōu)選地,可以對代表圖像的邊緣信息和梯度信息的階躍信號或脈沖信號進(jìn)行分析,并根據(jù)分析結(jié)果來提取邊緣信息和梯度信息。在圖像中,細(xì)筆劃的圖像數(shù)據(jù)可以呈現(xiàn)為脈沖信號,粗筆劃的圖像數(shù)據(jù)和類似于粗筆劃的大尺度對象可以呈現(xiàn)為階躍信號??梢詫γ}沖信號進(jìn)行分析,并根據(jù)其分析結(jié)果來提取細(xì)筆劃的邊緣信息和梯度信息。此外,可以對階躍信號進(jìn)行分析,并根據(jù)其分析結(jié)果來提取粗筆劃的邊緣信息和梯度信息,并提取類似于粗筆劃的大尺度對象的邊緣信息和梯度 目息。以下參照圖IA來描述利用索貝爾算子提取階躍信號的過程和利用索貝爾算子提取脈沖信號的過程,以及通過偏移處理和合成處理執(zhí)行加強(qiáng)處理的過程。圖i示出了階躍信號,圖ii示出脈沖信號,圖iii和圖iv示出與索貝爾算子對應(yīng)的信號,圖V示出利用索貝爾算子提取階躍信號的提取結(jié)果,圖Vi示出利用索貝爾算子提取脈沖信號的提取結(jié)果,圖Vii示出對階躍信號的提取結(jié)果取絕對值后得到的信號,圖Viii示出對脈沖信號的提取結(jié)果取絕對值后得到的信號,以及圖ix和圖X相應(yīng)的經(jīng)偏移的信號的示意圖。應(yīng)理解,圖IA中的坐標(biāo)及大小僅是示意性的而非限制性的,并且僅旨在示出相關(guān)信號處理的原理。 如圖IA所示,通過利用索貝爾算子(如圖iii所示)提取階躍信號(如圖i所示),可以獲得單一的谷狀信號(如圖V所示),而通過利用索貝爾算子(如圖iv所示)提取脈沖信號(如圖ii所示),可以獲得谷狀信號和峰狀信號結(jié)合的信號(如圖Vi所示)??梢?,通過利用索貝爾算子來提取階躍信號和脈沖信號,可以相應(yīng)獲得差異較大的兩種信號(如圖V和圖vi所示)。然后,通過稍后描述的強(qiáng)化處理(例如,包括偏移處理和合成處理)可以強(qiáng)化階躍信號和脈沖信號,從而提取與脈沖信號對應(yīng)的細(xì)筆劃的圖像數(shù)據(jù)以及與階躍信號對應(yīng)的粗筆劃的圖像數(shù)據(jù)。例如,可以對利用索貝爾算子提取出的脈沖信號中的谷狀信號(如圖Vi所示)取絕對值(即,取谷狀信號的大小),得到另一峰狀信號(如圖Viii所示)。然后將該另一峰狀信號和原峰狀信號部分(即,利用索貝爾算子提取到的峰狀信號)向相對方向偏移,并將偏移后的該另一峰狀信號和原峰狀信號相疊加(如圖X所示),從而可以再次加強(qiáng)與該脈沖信號對應(yīng)的細(xì)筆劃的圖像數(shù)據(jù)。此外,可以對利用索貝爾算子提取出的階躍信號中的谷狀信號(如圖V所示)取絕對值,得到又一峰狀信號(如圖Vii所示)。然后偏移該又一峰狀信號(如圖ix所示)??蛇x地,可以基于預(yù)定的過濾條件過濾掉類似于粗筆劃的大尺度對象的邊緣信息和梯度信息,而只留下粗筆劃的邊緣信息和梯度信息。具體的過濾處理將稍后描述??蛇x地,可以根據(jù)圖像的清晰程度或在需要的情況下,對如圖3所示的原始圖像進(jìn)行濾波。例如,可以利用低通濾波器對原始圖像進(jìn)行濾波,以抑制圖像中的噪聲。低通濾波器例如可以是高斯濾波器,但是低通濾波器不限于此,而可以是本領(lǐng)域技術(shù)人員已知的任何適當(dāng)?shù)牡屯V波器。在步驟S104中,可以對所獲取的邊緣信息和梯度信息進(jìn)行預(yù)定的加強(qiáng)處理,從而強(qiáng)化圖像中與文本有關(guān)的邊緣信息和梯度信息??梢曰诟鞣N方法來對邊緣信息和梯度信息進(jìn)行加強(qiáng)處理。優(yōu)選地,可以通過二值化處理和整合處理來對邊緣信息和梯度信息進(jìn)行加強(qiáng)。此處的整合處理可以為求交集處理、求最大值處理或求平均處理。優(yōu)選地,整合處理可以為求交集處理,這將稍后詳細(xì)描述。在步驟S106中,可以獲得與經(jīng)強(qiáng)化的邊緣信息和梯度信息相對應(yīng)的文本筆劃圖像。
以下參照圖2-圖9來描述根據(jù)本發(fā)明實(shí)施例的通過利用索貝爾算子從圖像中提取文本筆劃圖像的方法。圖2是示出根據(jù)本發(fā)明實(shí)施例的通過利用索貝爾算子從圖像中提取文本筆劃圖像的方法的流程圖,圖3是示出待處理的原始圖像,圖4A-圖4H是示出用索貝爾算子卷積后得到的圖像,圖5A-圖是示出通過對圖像向相對方向偏移并合成偏移后的圖像所得到的四張圖像,圖6A-圖6D是示出通過對圖像向相反方向偏移并合成偏移后的圖像所得到的四張圖像,圖7是示出整合后所得到的細(xì)筆劃圖像,圖8是示出整合后所得到的粗筆劃圖像,以及圖9是示出通過過濾處理得到的粗筆劃圖像。如圖2所示,在步驟S202中,可以對要處理的圖像(如圖3所示的原始圖像)進(jìn)行平滑(例如,低通濾波)。步驟S202為可選步驟。換句話說,在圖像比較清晰的情況下或者根據(jù)需要,可以不對如圖3所示的圖像進(jìn)行平滑(例如,低通濾波)。此處,圖3所示的原始圖像作為要處理的圖像。在圖3中,希望提取出的文本筆劃包括圖像右上角處的FUJITSU以及圖像正下方的日文字。其中,F(xiàn)UJITSU是細(xì)筆劃文字, 日文字是粗筆劃文字。要注意,圖3僅是示例。實(shí)際上,在一些圖像中可能僅包含細(xì)筆劃文字或粗筆劃文字。在步驟S204中,可以利用索貝爾(Sobel)算子與平滑后的圖像卷積。在不進(jìn)行步驟S202的平滑處理的情況下,可以直接利用索貝爾算子與要處理的圖像(如圖3所示的原始圖像)卷積。具體地,利用索貝爾算子對所處理圖像在多個(gè)方向上進(jìn)行卷積。換句話說,利用用于獲取圖像在多個(gè)方向上的邊緣信息和梯度信息的多個(gè)索貝爾算子卷積核分別與圖像的圖像數(shù)據(jù)進(jìn)行卷積計(jì)算。例如,利用索貝爾算子對對所處理圖像在四個(gè)方向上進(jìn)行卷積。優(yōu)選地,這四個(gè)方向包括水平方向、垂直方向以及兩個(gè)對角方向。卷積后的圖像如圖4A-4H所示。選擇這四個(gè)方向的原因在于,這四個(gè)方向與常見筆劃“一” “丨” “)” 分別對應(yīng)。例如,所利用的索貝爾算子卷積核為
ShSv
I I 2 III I II οI -I
0 0020-2
-I -2-1IO-I
SfdSid
ο I I I2I I 2I II ο
-10110-1
-2 -IOO-I-2
其中,Sh為與水平方向關(guān)聯(lián)的索貝爾算子卷積核,Sv為與垂直方向關(guān)聯(lián)的索貝爾算子卷積核,Srd為與第一對角方向關(guān)聯(lián)的索貝爾算子卷積核,Sld為與第二對角方向關(guān)聯(lián)的索貝爾算子卷積核。第一對角方向?yàn)閺挠疑辖堑阶笙陆堑膶蔷€方向,第二對角方向?yàn)閺淖笊辖堑接蚁陆堑膶蔷€方向。在這里,由于卷積的結(jié)果有正有負(fù),因此可以利用兩層圖像來存儲卷積結(jié)果。一層用來存正脈沖響應(yīng)圖像,另外一層用來存負(fù)脈沖響應(yīng)圖像。換句話說,將針對各個(gè)方向的卷積計(jì)算的結(jié)果劃分為針對各個(gè)方向的正脈沖響應(yīng)圖像數(shù)據(jù)和負(fù)脈沖響應(yīng)圖像數(shù)據(jù)。在本文中僅給出四個(gè)方向的例子,但這不是說只可以在四個(gè)方向上進(jìn)行卷積計(jì)算。在需要高精度的情況下或者根據(jù)其他需要,可以利用更多方向的索貝爾算子卷積核所處理圖像進(jìn)行卷積,例如8個(gè)方向。更多方向的卷積計(jì)算可以帶來更精確的結(jié)果。索貝爾算子的定義以及與圖像數(shù)據(jù)進(jìn)行卷積處理可基于任何合適的現(xiàn)有技術(shù)。 通過對如圖3所示的原始圖像進(jìn)行卷積,可以獲得如圖4A-圖4H所示的用索貝爾算子卷積核卷積后的圖像。具體地,圖4A示出包含水平方向的正脈沖響應(yīng)圖像數(shù)據(jù)的圖像,圖4B示出包含水平方向的負(fù)脈沖響應(yīng)圖像數(shù)據(jù)的圖像。圖4C示出包含垂直方向的正脈沖響應(yīng)圖像數(shù)據(jù)的圖像,圖4D示出包含垂直方向的負(fù)脈沖響應(yīng)圖像數(shù)據(jù)的圖像。圖4E示出包含從右上角到左下角的對角線方向的正脈沖響應(yīng)圖像數(shù)據(jù)的圖像,圖4F示出包含從右上角到左下角的對角線方向的負(fù)脈沖響應(yīng)圖像數(shù)據(jù)的圖像。圖4G示出包含從左上角到右下角的對角線方向的正脈沖響應(yīng)圖像數(shù)據(jù)的圖像,圖4H示出包含從左上角到右下角的對角線方向的負(fù)脈沖響應(yīng)圖像數(shù)據(jù)的圖像。接下來,在步驟S206中,利用預(yù)先估計(jì)的筆劃寬度將正脈沖響應(yīng)圖像數(shù)據(jù)和負(fù)脈沖響應(yīng)圖像數(shù)據(jù)偏移并合成偏移后的圖像,如圖5A-5D以及圖6A-6D所示??梢詫τ卺槍Ω鱾€(gè)方向的正脈沖響應(yīng)圖像數(shù)據(jù)和負(fù)脈沖響應(yīng)圖像數(shù)據(jù)執(zhí)行向相對方向移位并相加的計(jì)算,以獲得針對各個(gè)方向的第一合成圖像數(shù)據(jù)。此外,可以對于針對各個(gè)方向的正脈沖響應(yīng)圖像數(shù)據(jù)和負(fù)脈沖響應(yīng)圖像數(shù)據(jù)執(zhí)行向相反方向移位并相加的計(jì)算,以獲得針對各個(gè)方向的第二合成圖像數(shù)據(jù)。例如,向相對方向移位并相加的計(jì)算可以基于以下公式(I)Ih(x, y) = (Ih_p()Sitive (X, y_w/2)+Ih_negative(x,y+w/2))/2,Iv(x, y) = (Iv_positive(x-w/2,y)+Iv_negative(x+w/2,y))/2,Ird(x, y) = (Ird_positive(x+w/2, y-w/2)+Ird_negative(x_w/2, y+w/2))/2,以及Ild (x,y) = (Ild_positive (x_w/2,y-w/2) +Ild_negative (x+w/2,y+w/2)) /2 ;此外,向相反方向移位并相加的計(jì)算可以基于以下公式(2):Ih,(x,y) = (Ih-positive (x, Y+w/2)+Ih_negative(x, y-w/2) )/2,I/ (x,y) = (Iv
-positive
(x+w/2, y) +Iv_negative(x-w/2, y))/2,Ir/ (x, y) = (Ird_positive(x_w/2, y+w/2)+Ird_negative(x+w/2, y-w/2))/2,以及I1/ (x, y) = (lid-positive(x+w/2, y+w/2)+Ild_negative(x-w/2, y-w/2))/2 ;其中,X表示像素的橫坐標(biāo),y表示像素的縱坐標(biāo),Ih(X,y)、Iv(X,y)、Ird(x, y)和IldU,y)分別表示針對像素的橫向、縱向以及兩個(gè)對角線方向這四個(gè)方向的第一合成圖像數(shù)據(jù),其中,包含第一合成圖像數(shù)據(jù)的圖像如圖5A- 所示。
圖5A示出包含數(shù)據(jù)Ih(x,y)的圖像,圖5B示出包含數(shù)據(jù)Iv(x,y)的圖像,圖5C示出包含數(shù)據(jù)Ird(X,y)的圖像,圖5D示出包含數(shù)據(jù)Ild(X,y)的圖像。Ih’(X,y)、I/ (X,y)和Iri’ (x, y)、I1/ (x, y)分別表示針對像素的橫向、縱向以及兩個(gè)對角線方向這四個(gè)方向的第二合成圖像數(shù)據(jù)。其中,包含第二合成圖像數(shù)據(jù)的圖像如圖6A-6D所示。圖6A示出包含數(shù)據(jù)V (X,y)的圖像,圖6B示出包含數(shù)據(jù)I/ (x, y)的圖像,圖6C示出包含數(shù)據(jù)Iri’ (x,y)的圖像,圖6D示出包含數(shù)據(jù)I1/ (x, y)的圖像。Ih-positive (X,Y)、!v-positive (X,iO、Ird-positive (X,iO 和 Ild-positive (X,iO 分力丨J表不針對像
素的橫向、縱向以及兩個(gè)對角線方向這四個(gè)方向的正脈沖響應(yīng)圖像數(shù)據(jù)。其中,包含正脈沖相應(yīng)圖像數(shù)據(jù)的圖像如圖4A、4C、4E和4G所示。 Ih-negative (X,Y)、Iv-negative (X,Υ)、Ird-negative (X,Y)和工 Id-negative
(x,y)分別表示針對像
素的橫向、縱向以及兩個(gè)對角線方向這四個(gè)方向的負(fù)脈沖響應(yīng)圖像數(shù)據(jù)。其中,包含負(fù)脈沖相應(yīng)圖像數(shù)據(jù)的圖像如圖4B、4D、4F和4H所示。上述處理中涉及的w為預(yù)先估計(jì)的筆劃寬度。例如,可以根據(jù)經(jīng)驗(yàn)來估計(jì)w的值,或者可以通過對圖像進(jìn)行目測來估計(jì)w的值。此外,上述公式I和2只是給出了針對像素的橫向、縱向以及兩個(gè)對角線方向這四個(gè)方向的圖像數(shù)據(jù)進(jìn)行合成處理的一個(gè)具體例子,而并不構(gòu)成對本發(fā)明的限制。實(shí)際上,任何用于加強(qiáng)筆劃的合適的合成處理都是適用的。應(yīng)理解,進(jìn)行向相對方向移位以及向相反方向移位的原因在于,對于一個(gè)非特定圖像不一定容易確定哪個(gè)方向的移位可以達(dá)到對筆劃加強(qiáng)的效果。為此,通過嘗試性地分別進(jìn)行向相對方向移位以及向相反方向移位總是可以達(dá)到筆劃加強(qiáng)的效果。如果可以事先確定哪個(gè)方向的移位可以達(dá)到對筆劃加強(qiáng)的效果,則不一定同時(shí)執(zhí)行向相對方向移位以及向相反方向移位,即,只需要向相對方向移位和向相反方向移位之一。在本文所給出的圖像示例中,向相對方向的移位可以達(dá)到對筆劃加強(qiáng)的效果,如圖5A- 所示。向相反方向的移位不能達(dá)到對筆劃加強(qiáng)的效果,如圖6A-6D所示。在步驟S208中,可以對在步驟S206中合成后的圖像進(jìn)行高閾值的二值化處理和整合處理。例如,可以利用預(yù)先設(shè)定的高閾值分別對針對各個(gè)方向的第一合成圖像數(shù)據(jù)和第二合成圖像數(shù)據(jù)進(jìn)行高閾值的二值化處理。對經(jīng)過高閾值的二值化處理的針對各個(gè)方向的第一合成圖像數(shù)據(jù)進(jìn)行整合處理,并對經(jīng)過高閾值的二值化處理的針對各個(gè)方向的第二合成圖像數(shù)據(jù)進(jìn)行整合處理。此處的整合處理可以為求交集處理、求最大值處理或求平均處理之一。如果整合處理為求交集處理,則可以通過如下公式來進(jìn)行求交集處理了 output-thin ^h-binarized-highU^v-binarized-highU^rd-binarized-hi ghUI Id-binarized-high
Γ0081! T,= T,UT,UT,UT,
Lwwo j 丄 output-thin 丄 h-binarized_highu 丄 v-binarized_highu 丄 rd-binarized_highu 丄 ld-binarized-high其中,IQUtput-thiii 為求父集后的弟'一'細(xì)毛劃圖像數(shù)據(jù),Ih-biiwized-high、I v-binarized-high^
Ird—binarized—high 矛口 -^ld-binarized-high
分別為對第一合成圖像數(shù)據(jù)Ih(x,y)、Iv(χ,y)、Ird(χ y)和Ild(χ,y)進(jìn)行高閾值的二值化后得到的二值化圖像數(shù)據(jù)。其中,I’ _ut-thin為求交集后的第二細(xì)筆劃圖像數(shù)據(jù),I’
h-binarized-high、I v-binarized-high、I rd~binarized-high 矛口 I ld-binarized-high 分別
為對第二合成圖像數(shù)據(jù)V (χ,y)、I/ (χ,y)、Ir/ (χ,y)和I1/ (χ,y)進(jìn)行高閾值的二值化后得到的二值化圖像數(shù)據(jù)。在步驟S210,可以獲得細(xì)筆劃圖像數(shù)據(jù)。即,獲得Uput_thin和I ’ _^ωη。在步驟S212中,可以對合成后的圖像進(jìn)行低閾值的二值化處理和整合處理。例如,可以利用預(yù)先設(shè)定的小于上述高閾值的低閾值分別對針對各個(gè)方向的第一合成圖像數(shù)據(jù)和第二合成圖像數(shù)據(jù)進(jìn)行低閾值的二值化處理。對經(jīng)過低閾值的二值化處理的針對各個(gè)方向的第一合成圖像數(shù)據(jù)進(jìn)行整合處理,并對經(jīng)過第二二值化處理的針對各個(gè)方向的第二合成圖像數(shù)據(jù)進(jìn)行整合處理。此處的整合處理可以為求交集處理、求最大值處理或求平均處理之一。如果整合處理為求交集處理。例如,可以通過如下公式來進(jìn)行求交集處理了 output-thick Ih-binarized-lowUIv-binarized-lowU^rd-binarized-IowU 了 Id-binar ized-lowI output-thick I h-binarized-IowUI v-binarized-IowUI rd-binarized-low U I Id-binarized-low其中,!。utput-thick為求父集后的弟一粗毛劃圖像數(shù)據(jù),Ih-bimrized-lcw、ly-binarized-low'
Ird-binarized-low 矛口 lid-binarized-low
分別為對第一合成圖像數(shù)據(jù)Ih(χ,y)、Ιν(χ,y)、Ird(χ y)和Ild(χ,y)進(jìn)行低閾值的二值化后得到的二值化圖像數(shù)據(jù)。其中,I’ _ut-thic;k為求交集后的第二粗筆劃圖像數(shù)據(jù),I’
h-binarized-low、 I v-binarized-low、 I rd-binarized-low 矛口 I Id-binarized-low 分別為
對第二合成圖像數(shù)據(jù)V (χ,y)、I/ (χ,y)、Ir/ (χ,y)和I1/ (χ,y)進(jìn)行低閾值的二值化后得到的二值化圖像數(shù)據(jù)。容易理解,正如上述的,如果可以事先確定哪個(gè)方向的移位可以達(dá)到對筆劃加強(qiáng)的效果,則不一定同時(shí)執(zhí)行向相對方向移位以及向相反方向移位,以便得到第一合成圖像數(shù)據(jù)和第二合成圖像數(shù)據(jù)。也即,只需要在可以達(dá)到對筆劃加強(qiáng)的效果的方向上(例如相對方向或者相反方向)進(jìn)行移位并得到相應(yīng)的合成圖像數(shù)據(jù),相應(yīng)地,上述的二值化處理和整合處理也只需要針對該合成圖像數(shù)據(jù)執(zhí)行即可。在步驟S214,可選地,根據(jù)預(yù)定的過濾條件對在步驟S212中處理后的數(shù)據(jù)進(jìn)行過濾。具體地,利用預(yù)定過濾條件分別對第一粗筆劃圖像數(shù)據(jù)和第二粗筆劃圖像數(shù)據(jù)中的與連通域相關(guān)的數(shù)據(jù)進(jìn)行過濾處理,以獲得滿足預(yù)定過濾條件的第一連通域圖像數(shù)據(jù)和第二連通域圖像數(shù)據(jù)。在此處利用預(yù)定過濾條件對第一粗筆劃圖像數(shù)據(jù)和第二粗筆劃圖像數(shù)據(jù)進(jìn)行過濾處理的原因在于,在步驟S212中獲得的第一粗筆劃圖像數(shù)據(jù)和第二粗筆劃圖像數(shù)據(jù)除了包含粗筆劃之外,還可能包含其他物體的邊緣數(shù)據(jù),例如,圖像中的人體邊緣數(shù)據(jù)或其他類似于粗筆劃的邊緣數(shù)據(jù)。通過利用預(yù)定過濾條件對第一粗筆劃圖像數(shù)據(jù)和第二粗筆劃圖像數(shù)據(jù)進(jìn)行過濾處理,可以更加準(zhǔn)確地獲得與粗筆劃對應(yīng)的連通域圖像數(shù)據(jù)。其中,預(yù)定過濾條件可以是以下條件之一 (1)連通域內(nèi)的像素的灰度方差小于預(yù)定方差閾值,(2)連通域的內(nèi)邊緣到外邊緣的像素極性一致,以及(3)連通域的大小在預(yù)定大小閾值內(nèi);或者過濾條件可以是上述(I)、(2)和(3)中兩項(xiàng)或多項(xiàng)的任意結(jié)合。這里,連通域是指由通過步驟S212的處理獲得的粗筆劃圖像數(shù)據(jù)所代表的邊緣所構(gòu)成的封閉區(qū)域。對于過濾條件(I),即,連通域內(nèi)的像素的灰度方差小于預(yù)定方差閾值,具體地,首先,可以在步驟S212中處理過的圖像中找到與連通域相關(guān)的坐標(biāo)信息。然后,基于坐標(biāo)信息并基于如圖3所示的原始圖像,來確定連通域的灰度方差,并判斷該連通域內(nèi)的灰度方差是否小于預(yù)定方差閾值。在連通域內(nèi)的灰度方差小于預(yù)定方差閾值的情況下,保留該連通域,即,認(rèn)為該連通域與粗筆劃關(guān)聯(lián)。否則,過濾掉該連通域。對于過濾條件(2),即,連通域的內(nèi)邊緣到外邊緣的像素極性一致,具體地,首先,可以在步驟S212中處理過的圖像中找到與連通域相關(guān)的坐標(biāo)信息。然后,基于坐標(biāo)信息并基于如圖3所示的原始圖像,來確定連通域的內(nèi)邊緣到外邊緣的像素極性是否一致。在連通域內(nèi)的內(nèi)邊緣和外邊緣的像素極性一致的情況下,保留該連通域,即,認(rèn)為該連通域與粗筆劃關(guān)聯(lián)。否則,過濾掉該連通域。這里所說的像素的極性可以理解為一個(gè)內(nèi)邊緣像素的灰度和與該內(nèi)邊緣像素相鄰的外邊緣像素的灰度之間的關(guān)系。例如,二值化圖像中像素的灰度被設(shè)置為是“O”或“255”,則如果兩個(gè)像素的灰度值都為“O”或者都為“255”,認(rèn)為這兩個(gè)像素的極性一致,反之則認(rèn)為極性不一致。當(dāng)然,也可以根據(jù)實(shí)際需要來設(shè)定像素極性為一致的其他合適條件,在此不再贅述。 對于過濾條件(3),S卩,連通域的大小在預(yù)定大小閾值內(nèi),具體地,如果連通域的大小在預(yù)定閾值內(nèi),則保留該連通域,即,認(rèn)為該連通域與粗筆劃關(guān)聯(lián)。否則,過濾掉該連通域。容易理解,粗筆劃圖像雖然相對于細(xì)筆劃圖像要大,但是一般具有比較通用的上限,可以據(jù)此上限來設(shè)定上述的預(yù)定閾值。如果連通域的尺寸過大,則可以認(rèn)為該連通域所對應(yīng)的不是粗筆劃而是非筆劃對象,例如,在絕大多數(shù)情況下粗筆劃尺寸不會占據(jù)整個(gè)圖像的尺寸的一半甚至更多。當(dāng)然,在特殊情況下粗筆劃尺寸的確很大,則只需要調(diào)整上述的預(yù)定閾值的大小即可反映這種情況。其中,上述的預(yù)定方差閾值和預(yù)定大小的閾值可以根據(jù)預(yù)先通過實(shí)驗(yàn)獲取的經(jīng)驗(yàn)值來確定,或者可以根據(jù)對圖像樣本的目測來確定。當(dāng)然,也可以根據(jù)任何其他適當(dāng)方法來確定。也可以結(jié)合過濾條件(I)、(2)和(3)中的兩項(xiàng)或全部的任意組合來執(zhí)行過濾。接下來,在步驟S216中,獲得分別與第一連通域圖像數(shù)據(jù)和第二連通域圖像數(shù)據(jù)相對應(yīng)的第一粗筆劃邊緣圖像數(shù)據(jù)和第二粗筆劃邊緣圖像數(shù)據(jù)。在步驟S218中,獲得分別與第一細(xì)筆劃圖像數(shù)據(jù)和第二細(xì)筆劃圖像數(shù)據(jù)相對應(yīng)的第一細(xì)筆劃圖像(如圖7所示)和第二細(xì)筆劃圖像(未示出),并獲得分別與第一粗筆劃邊緣圖像數(shù)據(jù)和第二粗筆劃邊緣圖像數(shù)據(jù)相對應(yīng)的第一粗筆劃圖像(如圖9所示)和第二粗筆劃圖像(未示出)。應(yīng)理解,在不執(zhí)行步驟S214的情況下,也可以得到粗筆劃圖像。換句話說,可以基于步驟S212獲得的1--,-和I’-put-thw來得到第一粗筆劃圖像(如圖8所示)和第二粗筆劃圖像。在本文中,盡管通過上述步驟可以得到第二細(xì)筆劃圖像和第二粗筆劃圖像,但由于向相反方向的移位不能達(dá)到對筆劃加強(qiáng)的效果,因此沒有具體示出相應(yīng)得到的第二細(xì)筆劃圖像、第二粗筆劃圖像。可選地,可以基于文本筆劃的精度、文本筆劃的召回率、或者文本筆劃的精度和文本筆劃的召回率的折中,來篩選第一細(xì)筆劃圖像和第二細(xì)筆劃圖像中的一個(gè)作為最終的細(xì)筆劃圖像。也可以基于文本筆劃的精度、文本筆劃的召回率、或者文本筆劃的精度和文本筆劃的召回率的折中,來篩選第一粗筆劃圖像和第二粗筆劃圖像中的一個(gè)作為最終的粗筆劃圖像。在本文的示例中,由于相對方向的移位可以達(dá)到對筆劃加強(qiáng)的效果,因此,基于文本筆劃的精度、文本筆劃的召回率、或者文本筆劃的精度和文本筆劃的召回率的折中,可以得到第一細(xì)筆劃圖像和第一粗筆劃圖像作為最終的筆劃提取結(jié)果。本文中所提到的文本筆劃的精度可以理解為實(shí)際檢測到的正確筆劃的數(shù)量與實(shí)際檢測到的筆劃的數(shù)量之比,文本筆劃的召回率可以理解為實(shí)際檢測的正確筆劃的數(shù)量與實(shí)際存在的正確筆劃的數(shù)量之比。上述以索貝爾算子為例描述了從圖像中提取文本筆劃圖像的方法。但這僅是以示例的方式描述從圖像中提取文本筆劃圖像的方法??梢允褂玫乃阕硬痪窒抻诖?,而可以是Robert算子、Prewitt算子、Laplace算子、log算子、Canny算子或者其他任意的適當(dāng)算子。此外,盡管在步驟S208和S212中描述了先進(jìn)行二值化處理再進(jìn)行整合處理,但實(shí)際上也可以先進(jìn)行整合處理再進(jìn)行二值化處理。 上述提到的高閾值和低閾值可以根據(jù)經(jīng)驗(yàn)來確定,或者通過若干次的試驗(yàn)來確定。但這僅是示例,可以通過任意適當(dāng)?shù)姆椒▉泶_定高閾值和低閾值。以下參照圖10來描述根據(jù)本發(fā)明實(shí)施例的用于從圖像中提取文本筆劃圖像的裝置 400。圖10是示出根據(jù)本發(fā)明實(shí)施例的用于從圖像中提取文本筆劃圖像的裝置400的框圖。裝置400例如可以執(zhí)行上述參照圖I描述的用于從圖像中提取文本筆劃圖像的方法。具體地,裝置400包括信息獲取單元402,可以用于獲取所述圖像的邊緣信息和梯度信息;強(qiáng)化單元404,可以用于對所獲取的邊緣信息和梯度信息進(jìn)行預(yù)定的加強(qiáng)處理,從而強(qiáng)化所述圖像中與文本有關(guān)的邊緣信息和梯度信息;以及筆劃圖像獲得單元406,可以用于獲得與經(jīng)強(qiáng)化的邊緣信息和梯度信息相對應(yīng)的文本筆劃圖像??蛇x地,裝置400可以包括篩選單元(未示出)。篩選單元可以被配置為對所提取出的多個(gè)文本筆劃圖像進(jìn)行篩選。信息獲取單元402可以被配置為對代表圖像的邊緣信息和梯度信息的階躍信號或脈沖信號進(jìn)行分析,根據(jù)分析結(jié)果來提取邊緣信息和梯度信息。在圖像中,細(xì)筆劃的圖像數(shù)據(jù)可以呈現(xiàn)為脈沖信號,粗筆劃的圖像數(shù)據(jù)和類似于粗筆劃的大尺度對象可以呈現(xiàn)為階躍信號??梢詫γ}沖信號進(jìn)行分析,并根據(jù)其分析結(jié)果來提取細(xì)筆劃的邊緣信息和梯度信息。此外,可以對階躍信號進(jìn)行分析,并根據(jù)其分析結(jié)果來提取粗筆劃的邊緣信息和梯度信息,并提取類似于粗筆劃的大尺度對象的邊緣信息和梯度 目息??蛇x地,裝置400還可以包括降噪單元(未示出)。降噪單元可以被配置為根據(jù)圖像的清晰程度或在需要的情況下,對原始圖像進(jìn)行濾波以降噪。例如,可以利用低通濾波器對圖像進(jìn)行濾波,以抑制原始圖像中的噪聲。低通濾波器例如可以是高斯濾波器,但是低通濾波器不限于此,而可以是本領(lǐng)域技術(shù)人員已知的任何適當(dāng)?shù)牡屯V波器。強(qiáng)化單元404也可以被配置為基于各種方法來對邊緣信息和梯度信息進(jìn)行加強(qiáng)處理。優(yōu)選地,可以通過二值化處理和整合處理來對邊緣信息和梯度信息進(jìn)行加強(qiáng)。此處的整合處理可以為求交集處理、求最大值處理或求平均處理之一。優(yōu)選地,整合處理可以為求交集處理,這將稍后詳細(xì)描述。
以下參照圖11來描述根據(jù)本發(fā)明實(shí)施例的通過利用索貝爾算子從圖像中提取文本筆劃圖像的裝置400’。圖11是示出根據(jù)本發(fā)明實(shí)施例的通過利用索貝爾算子從圖像中提取文本筆劃圖像的裝置400’的框圖。裝置400’可以執(zhí)行以上參照圖2-圖9描述的根據(jù)本發(fā)明實(shí)施例的通過利用索貝爾算子從圖像中提取文本筆劃圖像的方法。具體地,類似于裝置400,裝置400’包括信息獲取單元402’、強(qiáng)化單元404’、以及筆劃圖像獲得單元406’??蛇x地,裝置400’也可以包括篩選單元和降噪單元(均未示出)。篩選單元可以被配置為基于文本筆劃的精度和文本筆劃的召回率中的至少一個(gè),篩選所述第一細(xì)筆劃圖像和所述第二細(xì)筆劃圖像中的一個(gè)作為最終的細(xì)筆劃圖像和/或篩選所述第一粗筆劃圖像和所述第二粗筆劃圖像中的一個(gè)作為最終的粗筆劃圖像。具體的篩選處理已參照圖2-圖9進(jìn)行描述,在此不再重復(fù)。 降噪單元可以被配置為對原始圖像(即要處理的圖像)進(jìn)行濾波以降噪。具體的降噪處理已參照圖2-圖9進(jìn)行描述,在此不再重復(fù)。其中,信息獲取單元402’可以包括卷積運(yùn)算子單元4022和劃分子單元4024。卷積運(yùn)算子單元4022被配置為利用用于獲取圖像在多個(gè)方向上的邊緣信息和梯度信息的多個(gè)索貝爾算子卷積核分別與所述圖像的圖像數(shù)據(jù)進(jìn)行卷積計(jì)算。劃分子單元4024被配置為將針對各個(gè)方向的卷積計(jì)算的結(jié)果劃分為針對各個(gè)方向的正脈沖響應(yīng)圖像數(shù)據(jù)和負(fù)脈沖響應(yīng)圖像數(shù)據(jù)。強(qiáng)化單元404’可以包括第一合成圖像獲得子單元4042和/或第二合成圖像獲得子單元4044。第一合成圖像獲得子單元4042可以被配置為對于針對各個(gè)方向的正脈沖響應(yīng)圖像數(shù)據(jù)和負(fù)脈沖響應(yīng)圖像數(shù)據(jù)執(zhí)行向相對方向移位并相加的計(jì)算,以獲得針對各個(gè)方向的第一合成圖像數(shù)據(jù)。第二合成圖像獲得子單元4044可以被配置為對于針對各個(gè)方向的正脈沖響應(yīng)圖像數(shù)據(jù)和負(fù)脈沖響應(yīng)圖像數(shù)據(jù)執(zhí)行向相反方向移位并相加的計(jì)算,以獲得針對各個(gè)方向的第二合成圖像數(shù)據(jù)。所述筆劃圖像獲得單元406’可以包括第一二值化處理子單元4062、第一細(xì)筆劃圖像獲得子單元4064、第二細(xì)筆劃圖像獲得子單元4066、第二二值化處理子單元4068、第一粗筆劃圖像獲得子單元40610和第二粗筆劃圖像獲得子單元40612。第一二值化處理子單元4062可以被配置為利用預(yù)先設(shè)定的第一閾值分別對針對各個(gè)方向的第一合成圖像數(shù)據(jù)和第二合成圖像數(shù)據(jù)進(jìn)行第一二值化處理。第一細(xì)筆劃圖像獲得子單元4064可以被配置為對經(jīng)過第一二值化處理的針對各個(gè)方向的第一合成圖像數(shù)據(jù)進(jìn)行整合處理以獲得第一細(xì)筆劃圖像數(shù)據(jù),從而獲得與所述第一細(xì)筆劃圖像數(shù)據(jù)相對應(yīng)的第一細(xì)筆劃圖像。第二細(xì)筆劃圖像獲得子單元4066可以被配置為對經(jīng)過第一二值化處理的針對各個(gè)方向的第二合成圖像數(shù)據(jù)進(jìn)行整合處理以獲得對應(yīng)的第二細(xì)筆劃圖像數(shù)據(jù),從而獲得與第二細(xì)筆劃圖像數(shù)據(jù)相對應(yīng)的第二細(xì)筆劃圖像。第二二值化處理子單元4068可以被配置為利用預(yù)先設(shè)定的小于第一閾值的第二閾值分別對針對各個(gè)方向的第一合成圖像數(shù)據(jù)和第二合成圖像數(shù)據(jù)進(jìn)行第二二值化處理。第一粗筆劃圖像獲得子單元40610可以被配置為對經(jīng)過第二二值化處理的針對各個(gè)方向的第一合成圖像數(shù)據(jù)進(jìn)行整合處理以獲得第一粗筆劃邊緣圖像數(shù)據(jù),從而獲得與所述第一粗筆劃邊緣圖像數(shù)據(jù)相對應(yīng)的第一粗筆劃圖像。第二粗筆劃圖像獲得子單元40612可以被配置為對經(jīng)過第二二值化處理的針對各個(gè)方向的第二合成圖像數(shù)據(jù)進(jìn)行整合處理以獲得對應(yīng)的第二粗筆劃邊緣圖像數(shù)據(jù),從而獲得與所述第二粗筆劃邊緣圖像數(shù)據(jù)相對應(yīng)的第二粗筆劃圖像。根據(jù)需要,筆劃圖像獲得單元406可以只包括第一二值化處理子單元4062、第一細(xì)筆劃圖像獲得子單元4064和第二細(xì)筆劃圖 像獲得子單元4066,或者只包括第二二值化處理子單元4068、第一粗筆劃圖像獲得子單元40610和第二粗筆劃圖像獲得子單元40612。換句話說,根據(jù)需要,筆劃圖像獲得單元406可以被配置為只獲得細(xì)筆劃圖像或者只獲得粗筆劃圖像,例如在待處理圖像只存在粗筆劃或者細(xì)筆劃的文本信息,或者只需要提取粗筆劃或者細(xì)筆劃的文本信息的情形。而且,如上述所述,如果可以事先確定哪個(gè)方向的移位可以達(dá)到對筆劃加強(qiáng)的效果,則強(qiáng)化單元404’可以包括第一合成圖像獲得子單元4042和第二合成圖像獲得子單元4044中與該方向上的處理對應(yīng)的合成圖像獲得子單元之一,相應(yīng)地,筆劃圖像獲得單元406’可以只包括與該方向上的處理對應(yīng)的第一細(xì)筆劃圖像獲得子單元4064和第二細(xì)筆劃圖像獲得子單元4066中之一,以及包括與該方向上的處理對應(yīng)的第一粗筆劃圖像獲得子單元40610和第二粗筆劃圖像獲得子單元40612中之一。裝置400’例如可以被配置成執(zhí)行以上參照圖2-圖9描述的根據(jù)本發(fā)明實(shí)施例的通過利用索貝爾算子從圖像中提取文本筆劃圖像的方法。為了簡明,在此不再具體描述第一二值化處理子單元4062、第一細(xì)筆劃圖像獲得子單元4064、第二細(xì)筆劃圖像獲得子單元4066、第二二值化處理子單元4068、第一粗筆劃圖像獲得子單元40610和第二粗筆劃圖像獲得子單元40612的具體處理過程。此外,可選地,筆劃圖像獲得單元406’還可以包括過濾子單元(未示出)。過濾子單元可以被配置為利用預(yù)定過濾條件分別對第一粗筆劃邊緣圖像數(shù)據(jù)和第二粗筆劃邊緣圖像數(shù)據(jù)中的與連通域相關(guān)的數(shù)據(jù)進(jìn)行過濾處理,以獲得滿足預(yù)定過濾條件的第一連通域圖像數(shù)據(jù)和第二連通域圖像數(shù)據(jù)。預(yù)定過濾條件包括以下條件中的至少之一所述連通域內(nèi)的像素的灰度方差小于預(yù)定方差閾值;所述連通域的內(nèi)邊緣到外邊緣的像素極性一致;以及所述連通域的大小在預(yù)定大小閾值內(nèi)。關(guān)于預(yù)定過濾條件已參照圖2-圖9進(jìn)行描述,在此不再重復(fù)。通過根據(jù)本發(fā)明實(shí)施例的用于從圖像中提取文本筆劃圖像的方法和裝置可以實(shí)現(xiàn)以下技術(shù)效果中的至少之一速度快、提取筆畫的同時(shí)可以抑制噪聲、對筆畫尺度不敏感、由于所處理視頻的質(zhì)量較差。此外,根據(jù)本發(fā)明實(shí)施例的用于從圖像中提取文本筆劃圖像的方法和裝置對文本的顏色、文本背景對比度等先驗(yàn)知識沒有要求。以上結(jié)合具體實(shí)施例描述了本發(fā)明的基本原理,但是,需要指出的是,對本領(lǐng)域的普通技術(shù)人員而言,能夠理解本發(fā)明的方法和裝置的全部或者任何步驟或者部件,可以在任何計(jì)算裝置(包括處理器、存儲介質(zhì)等)或者計(jì)算裝置的網(wǎng)絡(luò)中,以硬件、固件、軟件或者它們的組合加以實(shí)現(xiàn),這是本領(lǐng)域普通技術(shù)人員在閱讀了本發(fā)明的說明的情況下運(yùn)用他們的基本編程技能就能實(shí)現(xiàn)的。因此,本發(fā)明的目的還可以通過在任何計(jì)算裝置上運(yùn)行一個(gè)程序或者一組程序來實(shí)現(xiàn)。所述計(jì)算裝置可以是公知的通用裝置。因此,本發(fā)明的目的也可以僅僅通過提供包含實(shí)現(xiàn)所述方法或者裝置的程序代碼的程序產(chǎn)品來實(shí)現(xiàn)。也就是說,這樣的程序產(chǎn)品也構(gòu)成本發(fā)明,并且存儲有這樣的程序產(chǎn)品的存儲介質(zhì)也構(gòu)成本發(fā)明。顯然,所述存儲介質(zhì)可以是任何公知的存儲介質(zhì)或者將來所開發(fā)出來的任何存儲介質(zhì)。在通過軟件和/或固件實(shí)現(xiàn)本發(fā)明的實(shí)施例的情況下,從存儲介質(zhì)或網(wǎng)絡(luò)向具有專用硬件結(jié)構(gòu)的計(jì)算機(jī),例如圖12所示的通用計(jì)算機(jī)1200安裝構(gòu)成該軟件的程序,該計(jì)算機(jī)在安裝有各種程序時(shí),能夠執(zhí)行各種功能等等。在圖12中,中央處理單元(CPU) 1201根據(jù)只讀存儲器(ROM) 1202中存儲的程序或從存儲部分1208加載到隨機(jī)存取存儲器(RAM) 1203的程序執(zhí)行各種處理。在RAM 1203中,也根據(jù)需要存儲當(dāng)CPU 1201執(zhí)行各種處理等等時(shí)所需的數(shù)據(jù)。CPU 120UR0M 1202和RAM1203經(jīng)由總線1204彼此鏈路。輸入/輸出接口 1205也鏈路到總線1204。
下述部件鏈路到輸入/輸出接口 1205 :輸入部分1206(包括鍵盤、鼠標(biāo)等等)、輸出部分1207(包括顯示器,比如陰極射線管(CRT)、液晶顯示器(LCD)等,和揚(yáng)聲器等)、存儲部分1208 (包括硬盤等)、通信部分1209 (包括網(wǎng)絡(luò)接口卡比如LAN卡、調(diào)制解調(diào)器等)。通信部分1209經(jīng)由網(wǎng)絡(luò)比如因特網(wǎng)執(zhí)行通信處理。根據(jù)需要,驅(qū)動器1210也可鏈路到輸入/輸出接口 1205。可拆卸介質(zhì)1211比如磁盤、光盤、磁光盤、半導(dǎo)體存儲器等等根據(jù)需要被安裝在驅(qū)動器1210上,使得從中讀出的計(jì)算機(jī)程序根據(jù)需要被安裝到存儲部分1208中。在通過軟件實(shí)現(xiàn)上述系列處理的情況下,從網(wǎng)絡(luò)比如因特網(wǎng)或存儲介質(zhì)比如可拆卸介質(zhì)1211安裝構(gòu)成軟件的程序。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,這種存儲介質(zhì)不局限于圖12所示的其中存儲有程序、與設(shè)備相分離地分發(fā)以向用戶提供程序的可拆卸介質(zhì)1211??刹鹦督橘|(zhì)1211的例子包含磁盤(包含軟盤(注冊商標(biāo)))、光盤(包含光盤只讀存儲器(⑶-ROM)和數(shù)字通用盤(DVD))、磁光盤(包含迷你盤(MD)(注冊商標(biāo)))和半導(dǎo)體存儲器?;蛘撸鎯橘|(zhì)可以是ROM 1202、存儲部分1208中包含的硬盤等等,其中存有程序,并且與包含它們的設(shè)備一起被分發(fā)給用戶。本發(fā)明還提出一種存儲有機(jī)器可讀取的指令代碼的程序產(chǎn)品。指令代碼由機(jī)器讀取并執(zhí)行時(shí),可執(zhí)行上述根據(jù)本發(fā)明實(shí)施例的方法。相應(yīng)地,用于承載上述存儲有機(jī)器可讀取的指令代碼的程序產(chǎn)品的存儲介質(zhì)也包括在本發(fā)明的公開中。存儲介質(zhì)包括但不限于軟盤、光盤、磁光盤、存儲卡、存儲棒等。本領(lǐng)域的普通技術(shù)人員應(yīng)理解,在此所例舉的是示例性的,本發(fā)明并不局限于此。在本說明書中,“第一”、“第二”以及“第N個(gè)”等表述是為了將所描述的特征在文字上區(qū)分開,以清楚地描述本發(fā)明。因此,不應(yīng)將其視為具有任何限定性的含義。作為一個(gè)示例,上述方法的各個(gè)步驟以及上述設(shè)備的各個(gè)組成模塊和/或單元可以實(shí)施為軟件、固件、硬件或其組合,并作為相應(yīng)設(shè)備中的一部分。上述裝置中各個(gè)組成模塊、單元通過軟件、固件、硬件或其組合的方式進(jìn)行配置時(shí)可使用的具體手段或方式為本領(lǐng)域技術(shù)人員所熟知,在此不再贅述。作為一個(gè)示例,在通過軟件或固件實(shí)現(xiàn)的情況下,可以從存儲介質(zhì)或網(wǎng)絡(luò)向具有專用硬件結(jié)構(gòu)的計(jì)算機(jī)(例如圖12所示的通用計(jì)算機(jī)1200)安裝構(gòu)成該軟件的程序,該計(jì)算機(jī)在安裝有各種程序時(shí),能夠執(zhí)行各種功能等。
在上面對本發(fā)明具體實(shí)施例的描述中,針對一種實(shí)施方式描述和/或示出的特征可以以相同或類似的方式在一個(gè)或更多個(gè)其他實(shí)施方式中使用,與其他實(shí)施方式中的特征相組合,或替代其他實(shí)施方式中的特征。應(yīng)該強(qiáng)調(diào),術(shù)語“包括/包含”在本文使用時(shí)指特征、要素、步驟或組件的存在,但并不排除一個(gè)或更多個(gè)其他特征、要素、步驟或組件的存在或附加。此外,本發(fā)明的方法不限于按照說明書中描述的時(shí)間順序來執(zhí)行,也可以按照其他的時(shí)間順序地、并行地或獨(dú)立地執(zhí)行。因此,本說明書中描述的方法的執(zhí)行順序不對本發(fā)明的技術(shù)范圍構(gòu)成限制。關(guān)于包括以上實(shí)施例的實(shí)施方式,還公開下述附記附記附記I. 一種用于從圖像中提取文本筆劃圖像的方法,包括 獲取所述圖像的邊緣信息和梯度信息;對所獲取的邊緣信息和梯度信息進(jìn)行預(yù)定的加強(qiáng)處理,從而強(qiáng)化所述圖像中與文本有關(guān)的邊緣信息和梯度信息;以及獲得與經(jīng)強(qiáng)化的邊緣信息和梯度信息相對應(yīng)的文本筆劃圖像。附記2.根據(jù)附記I所述的方法,其中,所述獲取所述圖像的邊緣信息和梯度信息的步驟包括對代表所述圖像的邊緣信息和梯度信息的階躍信號或脈沖信號進(jìn)行分析,根據(jù)分析結(jié)果來提取所述邊緣信息和所述梯度信息。附記3.根據(jù)附記2所述的方法,其中所述獲取所述圖像的邊緣信息和梯度信息的步驟包括利用用于獲取圖像在多個(gè)方向上的邊緣信息和梯度信息的多個(gè)索貝爾算子卷積核分別與所述圖像的圖像數(shù)據(jù)進(jìn)行卷積計(jì)算,以及將針對各個(gè)方向的卷積計(jì)算的結(jié)果劃分為針對各個(gè)方向的正脈沖響應(yīng)圖像數(shù)據(jù)和負(fù)脈沖響應(yīng)圖像數(shù)據(jù);所述強(qiáng)化所述圖像中與文本有關(guān)的邊緣信息和梯度信息的步驟包括對于針對各個(gè)方向的正脈沖響應(yīng)圖像數(shù)據(jù)和負(fù)脈沖響應(yīng)圖像數(shù)據(jù)執(zhí)行向相對方向移位并相加的計(jì)算,以獲得針對各個(gè)方向的第一合成圖像數(shù)據(jù),和/或?qū)τ卺槍Ω鱾€(gè)方向的正脈沖響應(yīng)圖像數(shù)據(jù)和負(fù)脈沖響應(yīng)圖像數(shù)據(jù)執(zhí)行向相反方向移位并相加的計(jì)算,以獲得針對各個(gè)方向的第二合成圖像數(shù)據(jù);所述獲得與經(jīng)強(qiáng)化的邊緣信息和梯度信息相對應(yīng)的文本筆劃圖像的步驟包括利用預(yù)先設(shè)定的第一閾值分別對針對各個(gè)方向的第一合成圖像數(shù)據(jù)和/或第二合成圖像數(shù)據(jù)進(jìn)行第一二值化處理,對經(jīng)過第一二值化處理的針對各個(gè)方向的第一合成圖像數(shù)據(jù)進(jìn)行整合處理以獲得第一細(xì)筆劃圖像數(shù)據(jù),從而獲得與所述第一細(xì)筆劃圖像數(shù)據(jù)相對應(yīng)的第一細(xì)筆劃圖像,和/或?qū)?jīng)過第一二值化處理的針對各個(gè)方向的第二合成圖像數(shù)據(jù)進(jìn)行整合處理以獲得對應(yīng)的第二細(xì)筆劃圖像數(shù)據(jù),從而獲得與所述第二細(xì)筆劃圖像數(shù)據(jù)相對應(yīng)的第二細(xì)筆劃圖像;和/或利用預(yù)先設(shè)定的小于第一閾值的第二閾值分別對針對各個(gè)方向的第一合成圖像數(shù)據(jù)和/或第二合成圖像數(shù)據(jù)進(jìn)行第二二值化處理,對經(jīng)過第二二值化處理的針對各個(gè)方向的第一合成圖像數(shù)據(jù)進(jìn)行整合處理以獲得第一粗筆劃邊緣圖像數(shù)據(jù),從而獲得與所述第一粗筆劃邊緣圖像數(shù)據(jù)相對應(yīng)的第一粗筆劃圖像,和/或?qū)?jīng)過第二二值化處理的針對各個(gè)方向的第二合成圖像數(shù)據(jù)進(jìn)行整合處理以獲得對應(yīng)的第二粗筆劃邊緣圖像數(shù)據(jù),從而獲得與所述第二粗筆劃邊緣圖像數(shù)據(jù)相對應(yīng)的第二粗筆劃圖像。附記4.根據(jù)附記3所述的方法,其中,所述整合處理包括求交集處理、求最大值處理和求平均處理之一。附記5.根據(jù)附記3或4所述的方法,其中,在所述利用用于獲取圖像在多個(gè)方向上的邊緣信息和梯度信息的多個(gè)索貝爾算子卷積核分別與所述圖像的圖像數(shù)據(jù)進(jìn)行卷積計(jì)算的步驟包括利用用于獲取圖像的橫向、縱向以及兩個(gè)對角線方向這四個(gè)方向上的邊緣信息和梯度信息的四個(gè)索貝爾算子卷積核分別與所述圖像的圖像數(shù)據(jù)進(jìn)行卷積計(jì)算。附記6.根據(jù)附記3至5中任一項(xiàng)所述的方法,其中,所述向相對方向移位并相加 的計(jì)算基于以下公式Ih(x, y) = (Ih-positive(x y-w/2)+Ih_negative(x, y+w/2))/2,Iv(x, y) = (Iv_positive(x_w/2,y)+Iv_negative (x+w/2,y) )/2,Ird(x, y) = (Ird_positive(x+w/2, y-w/2)+Ird_negative(x_w/2, y+w/2))/2,以及Ild(x, y) = (Iid-positive(x-w/2, y-w/2)+Ild_negative(x+w/2, y+w/2))/2 ;并且其中,所述向相反方向移位并相加的計(jì)算基于以下公式V (x, y) = (Ih-positive(x, y+w/2)+Ih_negative(x, y-w/2))/2,I/ (x, y) = (Iv
-positive
(x+w/2, y) +Iv_negative(x-w/2, y))/2,Ir/ (x, y) = (Ird_positive(x_w/2, y+w/2)+Ird_negative(x+w/2, y-w/2))/2,以及I1/ (x, y) = (lid-positive(x+w/2, y+w/2)+Ild_negative(x-w/2, y-w/2))/2 ;其中,X表示像素的橫坐標(biāo),y表示所述像素的縱坐標(biāo),Ih(X,y)、Iv(x, y)、Ird(x, y)和IldU,y)分別表示針對所述像素的橫向、縱向以及兩個(gè)對角線方向這四個(gè)方向的第一合成圖像數(shù)據(jù),Ih,(X,y)、I/ (x, y)和Ir/ (x, y)、I1/ (x, y)分別表示針對所述像素的橫向、縱向以及兩個(gè)對角線方向這四個(gè)方向的第二合成圖像數(shù)據(jù),Ih-positive (X,Y)、ly-positive iO、Ird-positive iO 和 I Id-positive (X,iO 分力ll表不針對所
述像素的橫向、縱向以及兩個(gè)對角線方向這四個(gè)方向的正脈沖響應(yīng)圖像數(shù)據(jù),以及!h-negative (X,Y)、!v-negative (X,iO、Ird-negative (X,iO 和 I ld-negat ive (X,iO 分力ll 表不針對所
述像素的橫向、縱向以及兩個(gè)對角線方向這四個(gè)方向的負(fù)脈沖響應(yīng)圖像數(shù)據(jù),W為預(yù)先估計(jì)的筆劃寬度。附記7.根據(jù)附記3至6中任一項(xiàng)所述的方法,其中,所述獲得分別與所述第一粗筆劃邊緣圖像數(shù)據(jù)和所述第二粗筆劃邊緣圖像數(shù)據(jù)相對應(yīng)的第一粗筆劃圖像和第二粗筆劃圖像的步驟包括利用預(yù)定過濾條件分別對所述第一粗筆劃邊緣圖像數(shù)據(jù)和所述第二粗筆劃邊緣圖像數(shù)據(jù)中的連通域數(shù)據(jù)進(jìn)行過濾處理,以獲得滿足所述預(yù)定過濾條件的第一連通域圖像數(shù)據(jù)和第二連通域圖像數(shù)據(jù);以及獲得分別與所述第一連通域圖像數(shù)據(jù)和所述第二連通域圖像數(shù)據(jù)相對應(yīng)的第一粗筆劃圖像和第二粗筆劃圖像。附記8.根據(jù)附記7所述的方法,其中,所述預(yù)定過濾條件包括以下條件中的至少之一所述連通域內(nèi)的像素的灰度方差小于預(yù)定方差閾值;所述連通域的內(nèi)邊緣到外邊緣的像素極性一致;以及所述連通域的大小在預(yù)定大小閾值內(nèi)。附記9.根據(jù)附記3至8中任一項(xiàng)所述的方法,還包括基于文本筆劃的精度和文本筆劃的召回率中的至少一個(gè),篩選所述第一細(xì)筆劃圖像和所述第二細(xì)筆劃圖像中的一個(gè)作為最終的細(xì)筆劃圖像和/或篩選所述第一粗筆劃圖像和所述第二粗筆劃圖像中的一個(gè)作為最終的粗筆劃圖像。 附記10. —種用于從圖像中提取文本筆劃圖像的裝置,包括信息獲取單元,用于獲取所述圖像的邊緣信息和梯度信息;強(qiáng)化單元,用于對所獲取的邊緣信息和梯度信息進(jìn)行預(yù)定的加強(qiáng)處理,從而強(qiáng)化所述圖像中與文本有關(guān)的邊緣信息和梯度信息;以及筆劃圖像獲得單元,用于獲得與經(jīng)強(qiáng)化的邊緣信息和梯度信息相對應(yīng)的文本筆劃圖像。附記11.根據(jù)附記10所述的裝置,其中,所述信息獲取單元被配置為對代表所述圖像的邊緣信息和梯度信息的階躍信號或脈沖信號進(jìn)行分析,根據(jù)分析結(jié)果來提取所述邊緣信息和所述梯度信息。附記12.根據(jù)附記11所述的裝置,其中所述信息獲取單元包括卷積運(yùn)算子單元,用于利用用于獲取圖像在多個(gè)方向上的邊緣信息和梯度信息的多個(gè)索貝爾算子卷積核分別與所述圖像的圖像數(shù)據(jù)進(jìn)行卷積計(jì)算,以及劃分子單元,用于將針對各個(gè)方向的卷積計(jì)算的結(jié)果劃分為針對各個(gè)方向的正脈沖響應(yīng)圖像數(shù)據(jù)和負(fù)脈沖響應(yīng)圖像數(shù)據(jù);所述強(qiáng)化單元包括第一合成圖像獲得子單元,用于對于針對各個(gè)方向的正脈沖響應(yīng)圖像數(shù)據(jù)和負(fù)脈沖響應(yīng)圖像數(shù)據(jù)執(zhí)行向相對方向移位并相加的計(jì)算,以獲得針對各個(gè)方向的第一合成圖像數(shù)據(jù),和/或第二合成圖像獲得子單元,用于對于針對各個(gè)方向的正脈沖響應(yīng)圖像數(shù)據(jù)和負(fù)脈沖響應(yīng)圖像數(shù)據(jù)執(zhí)行向相反方向移位并相加的計(jì)算,以獲得針對各個(gè)方向的第二合成圖像數(shù)據(jù);所述筆劃圖像獲得單元包括第一二值化處理子單元,用于利用預(yù)先設(shè)定的第一閾值分別對針對各個(gè)方向的第一合成圖像數(shù)據(jù)和/或第二合成圖像數(shù)據(jù)進(jìn)行第一二值化處理;第一細(xì)筆劃圖像獲得子單元,用于對經(jīng)過第一二值化處理的針對各個(gè)方向的第一合成圖像數(shù)據(jù)進(jìn)行整合處理以獲得第一細(xì)筆劃圖像數(shù)據(jù),從而獲得與所述第一細(xì)筆劃圖像數(shù)據(jù)相對應(yīng)的第一細(xì)筆劃圖像;和/或第二細(xì)筆劃圖像獲得子單元,用于對經(jīng)過第一二值化處理的針對各個(gè)方向的第二合成圖像數(shù)據(jù)進(jìn)行整合處理以獲得對應(yīng)的第二細(xì)筆劃圖像數(shù)據(jù),從而獲得與第二細(xì)筆劃圖像數(shù)據(jù)相對應(yīng)的第二細(xì)筆劃圖像;和/或第二二值化處理子單元,用于利用預(yù)先設(shè)定的小于第一閾值的第二閾值分別對針對各個(gè)方向的第一合成圖像數(shù)據(jù)和/或第二合成圖像數(shù)據(jù)進(jìn)行第二二值化處理;第一粗筆劃圖像獲得子單元,用于對經(jīng)過第二二值化處理的針對各個(gè)方向的第一合成圖像數(shù)據(jù)進(jìn)行整合處理以獲得第一粗筆劃邊緣圖像數(shù)據(jù),從而獲得與所述第一粗筆劃邊緣圖像數(shù)據(jù)相對應(yīng)的第一粗筆劃圖像;和/或第二粗筆劃圖像獲得子單元,用于對經(jīng)過第二二值化處理的針對各個(gè)方向的第二合成圖像數(shù)據(jù)進(jìn)行整合處理以獲得對應(yīng)的第二粗筆劃邊緣圖像數(shù)據(jù),從而獲得與所述第二粗筆劃邊緣圖像數(shù)據(jù)相對應(yīng)的第二粗筆劃圖像。附記13.根據(jù)附記12所述的裝置,其中,所述整合處理包括求交集處理、求最大值處理和求平均處理之一。
附記14.根據(jù)附記12或13所述的裝置,其中,所述卷積運(yùn)算子單元被配置為利用用于獲取圖像的橫向、縱向以及兩個(gè)對角線方向這四個(gè)方向上的邊緣信息和梯度信息的四個(gè)索貝爾算子卷積核分別與所述圖像的圖像數(shù)據(jù)進(jìn)行卷積計(jì)算。附記15.根據(jù)附記12至14中任一項(xiàng)所述的裝置,其中,所述向相對方向移位并相加的計(jì)算基于以下公式Ih(x, y) = (Ih_positive(x, y-w/2)+Ih_negative(x,y+w/2))/2,Iv(x, y) = (Iv_positive(x_w/2,y)+Iv_negative (x+w/2,y) )/2,Ird(x, y) = (Itd_positive(x+w/2,y-w/2)+Ird_negative(x_w/2,y+w/2))/2,以及Ild(x,y) = (Ild_positive(x_w/2,y-w/2) +Ild_negative(x+w/2, y+w/2))/2 ;并且其中,所述向相反方向移位并相加的計(jì)算基于以下公式Ih,(x, y) = (Ih_positive(x,y+w/2)+Ih_negative(x,y-w/2))/2,I/ (x, y) = (Iv_positive (x+w/2,y)+Iv_negative(x-w/2,y) )/2,Ir/ (x, y) = (Ird_positve(x_w/2, y+w/2)+Ird_negative(x+w/2, y_w/2))/2,以及I1/ (x, y) = (Iid-postive(x+w/2, y+w/2)+Ild_negative(x-w/2, y-w/2))/2 ;其中,X表示像素的橫坐標(biāo),y表示所述像素的縱坐標(biāo),Ih(X,y)、Iv(x, y)、Ird(x, y)和IldU,y)分別表示針對所述像素的橫向、縱向以及兩個(gè)對角線方向這四個(gè)方向的第一合成圖像數(shù)據(jù),Ih’(X,y)、I/ (x, y)和Iri’ (x, y)、I1/ (x, y)分別表示針對所述像素的橫向、縱向以及兩個(gè)對角線方向這四個(gè)方向的第二合成圖像數(shù)據(jù),Ih-positive Y)、!v-positive (X,iO、Ird-positive (X,iO 和 Ild-positive (X,iO 分力丨」表不針對所
述像素的橫向、縱向以及兩個(gè)對角線方向這四個(gè)方向的正脈沖響應(yīng)圖像數(shù)據(jù),以及 Ih—negative (X,Y)、Iv—negative (X,Υ)、Ird—negative (X,Y)和工 Id-negative
(x,y)分別表示針對所
述像素的橫向、縱向以及兩個(gè)對角線方向這四個(gè)方向的負(fù)脈沖響應(yīng)圖像數(shù)據(jù),w為預(yù)先估計(jì)的筆劃寬度。附記16.根據(jù)附記12至15中任一項(xiàng)所述的裝置,其中,所述筆劃圖像獲得單元還包括過濾子單元,用于利用預(yù)定過濾條件分別對所述第一粗筆劃邊緣圖像數(shù)據(jù)和所述第二粗筆劃邊緣圖像數(shù)據(jù)中的連通域數(shù)據(jù)進(jìn)行過濾處理,以獲得滿足所述預(yù)定過濾條件的第一連通域圖像數(shù)據(jù)和第二連通域圖像數(shù)據(jù)。
附記17.根據(jù)附記16所述的裝置,其中,所述預(yù)定過濾條件包括以下條件中的至少之一所述連通域內(nèi)的像素的灰度方差小于預(yù)定方差閾值;所述連通域的內(nèi)邊緣到外邊緣的像素極性一致;以及所述連通域的大小在預(yù)定大小閾值內(nèi)。附記18.根據(jù)附記12至17中任一項(xiàng)所述的裝置,還包括篩選單元,用于基于文本筆劃的精度和文本筆劃的召回率中的至少一個(gè),篩選所述第一細(xì)筆劃圖像和所述第二細(xì)筆劃圖像中的一個(gè)作為最終的細(xì)筆劃圖像和/或篩選所述第一粗筆劃圖像和所述第二粗筆劃圖像中的一個(gè)作為最終的粗筆劃圖像。
附記19. 一種存儲有機(jī)器可讀取的指令代碼的程序產(chǎn)品,所述指令代碼由機(jī)器讀取并執(zhí)行時(shí),可執(zhí)行如附記1-9中任一項(xiàng)所述的用于從圖像中提取文本筆劃圖像的方法。附記20. —種承載有如附記19所述的程序產(chǎn)品的存儲介質(zhì)。盡管上面已經(jīng)通過對本發(fā)明的具體實(shí)施例的描述對本發(fā)明進(jìn)行了披露,但是,應(yīng)該理解,本領(lǐng)域的技術(shù)人員可在所附權(quán)利要求的精神和范圍內(nèi)設(shè)計(jì)對本發(fā)明的各種修改、改進(jìn)或者等同物。這些修改、改進(jìn)或者等同物也應(yīng)當(dāng)被認(rèn)為包括在本發(fā)明的保護(hù)范圍內(nèi)。
權(quán)利要求
1.一種用于從圖像中提取文本筆劃圖像的方法,包括 獲取所述圖像的邊緣信息和梯度信息; 對所獲取的邊緣信息和梯度信息進(jìn)行預(yù)定的加強(qiáng)處理,從而強(qiáng)化所述圖像中與文本有關(guān)的邊緣彳目息和梯度彳目息;以及 獲得與經(jīng)強(qiáng)化的邊緣信息和梯度信息相對應(yīng)的文本筆劃圖像。
2.根據(jù)權(quán)利要求I所述的方法,其中,所述獲取所述圖像的邊緣信息和梯度信息的步驟包括 對代表所述圖像的邊緣信息和梯度信息的階躍信號或脈沖信號進(jìn)行分析,根據(jù)分析結(jié)果來提取所述邊緣信息和所述梯度信息。
3.根據(jù)權(quán)利要求2所述的方法,其中 所述獲取所述圖像的邊緣信息和梯度信息的步驟包括 利用用于獲取圖像在多個(gè)方向上的邊緣信息和梯度信息的多個(gè)索貝爾算子卷積核分別與所述圖像的圖像數(shù)據(jù)進(jìn)行卷積計(jì)算,以及 將針對各個(gè)方向的卷積計(jì)算的結(jié)果劃分為針對各個(gè)方向的正脈沖響應(yīng)圖像數(shù)據(jù)和負(fù)脈沖響應(yīng)圖像數(shù)據(jù); 所述強(qiáng)化所述圖像中與文本有關(guān)的邊緣信息和梯度信息的步驟包括 對于針對各個(gè)方向的正脈沖響應(yīng)圖像數(shù)據(jù)和負(fù)脈沖響應(yīng)圖像數(shù)據(jù)執(zhí)行向相對方向移位并相加的計(jì)算,以獲得針對各個(gè)方向的第一合成圖像數(shù)據(jù),和/或 對于針對各個(gè)方向的正脈沖響應(yīng)圖像數(shù)據(jù)和負(fù)脈沖響應(yīng)圖像數(shù)據(jù)執(zhí)行向相反方向移位并相加的計(jì)算,以獲得針對各個(gè)方向的第二合成圖像數(shù)據(jù); 所述獲得與經(jīng)強(qiáng)化的邊緣信息和梯度信息相對應(yīng)的文本筆劃圖像的步驟包括 利用預(yù)先設(shè)定的第一閾值分別對針對各個(gè)方向的第一合成圖像數(shù)據(jù)和/或第二合成圖像數(shù)據(jù)進(jìn)行第一二值化處理,對經(jīng)過第一二值化處理的針對各個(gè)方向的第一合成圖像數(shù)據(jù)進(jìn)行整合處理以獲得第一細(xì)筆劃圖像數(shù)據(jù),從而獲得與所述第一細(xì)筆劃圖像數(shù)據(jù)相對應(yīng)的第一細(xì)筆劃圖像,和/或?qū)?jīng)過第一二值化處理的針對各個(gè)方向的第二合成圖像數(shù)據(jù)進(jìn)行整合處理以獲得對應(yīng)的第二細(xì)筆劃圖像數(shù)據(jù),從而獲得與所述第二細(xì)筆劃圖像數(shù)據(jù)相對應(yīng)的第二細(xì)筆劃圖像;和/或 利用預(yù)先設(shè)定的小于第一閾值的第二閾值分別對針對各個(gè)方向的第一合成圖像數(shù)據(jù)和/或第二合成圖像數(shù)據(jù)進(jìn)行第二二值化處理,對經(jīng)過第二二值化處理的針對各個(gè)方向的第一合成圖像數(shù)據(jù)進(jìn)行整合處理以獲得第一粗筆劃邊緣圖像數(shù)據(jù),從而獲得與所述第一粗筆劃邊緣圖像數(shù)據(jù)相對應(yīng)的第一粗筆劃圖像,和/或?qū)?jīng)過第二二值化處理的針對各個(gè)方向的第二合成圖像數(shù)據(jù)進(jìn)行整合處理以獲得對應(yīng)的第二粗筆劃邊緣圖像數(shù)據(jù),從而獲得與所述第二粗筆劃邊緣圖像數(shù)據(jù)相對應(yīng)的第二粗筆劃圖像。
4.根據(jù)權(quán)利要求3所述的方法,其中,所述整合處理包括求交集處理、求最大值處理和求平均處理之一。
5.根據(jù)權(quán)利要求3或4所述的方法,其中,在所述利用用于獲取圖像在多個(gè)方向上的邊緣信息和梯度信息的多個(gè)索貝爾算子卷積核分別與所述圖像的圖像數(shù)據(jù)進(jìn)行卷積計(jì)算的步驟包括 利用用于獲取圖像的橫向、縱向以及兩個(gè)對角線方向這四個(gè)方向上的邊緣信息和梯度信息的四個(gè)索貝爾算子卷積核分別與所述圖像的圖像數(shù)據(jù)進(jìn)行卷積計(jì)算。
6.根據(jù)權(quán)利要求3至5中任一項(xiàng)所述的方法,其中,所述向相對方向移位并相加的計(jì)算基于以下公式 Ih (X,y) — (Ih—positive (X,y_W/2)+Ih-negative (X,Y+w/2) ) /2, Iv(x,y) = (Iy-positive (x-w/2, y)+I v-negative(x+w/2, y))/2,Ird(x,y) = (Ird-Positive(x+w/2, y-w/2)+Ird_negative(x-w/2, y+w/2))/2,以及Ild(x,y) = (Iid-p0Sitive(x-w/2, y-w/2)+Ild_negative(x+w/2, y+w/2))/2 ; 并且其中,所述向相反方向移位并相加的計(jì)算基于以下公式 Ih(X,y) — (Ih-positive (X,y+W/2)+Ih-negative (X,y_W/2) )/2, Iv (x,y) — (Iv_positive (x+w/2,y)+Iv_negative (x_w/2,y))/2,Ir/ (x, y) = (Ird_positive (x-w/2,y+w/2)+Ird_negative (x+w/2,y-w/2) )/2,以及I1/ (x, y) = (Ild_positive(x+w/2, y+w/2)+Ild_negative(x-w/2, y-w/2))/2 ; 其中,x表示像素的橫坐標(biāo),y表示所述像素的縱坐標(biāo),Ih(x,y)、Iv(x,y)、Ird(x, y)和Ild(x,y)分別表示針對所述像素的橫向、縱向以及兩個(gè)對角線方向這四個(gè)方向的第一合成圖像數(shù)據(jù), Ih’(x,y)、Iv’(x, y)和Ird’(x, y)、Ild’ (x, y)分別表示針對所述像素的橫向、縱向以及兩個(gè)對角線方向這四個(gè)方向的第二合成圖像數(shù)據(jù), Ih-positive (x, y)、 I v-positive (x, y)、I rd-positive(x, y)和 I ld-positive (x, y)分別表示針對所述像素的橫向、縱向以及兩個(gè)對角線方向這四個(gè)方向的正脈沖響應(yīng)圖像數(shù)據(jù),以及 I h-negative (X,y)、Iv—negative (X,Y)、!rd—negative (X,Y)矛口工 Id-negative(x, y)分別表示針對所述像素的橫向、縱向以及兩個(gè)對角線方向這四個(gè)方向的負(fù)脈沖響應(yīng)圖像數(shù)據(jù),w為預(yù)先估計(jì)的筆劃覽度。
7.根據(jù)權(quán)利要求3至6中任一項(xiàng)所述的方法,其中,所述獲得分別與所述第一粗筆劃邊緣圖像數(shù)據(jù)和所述第二粗筆劃邊緣圖像數(shù)據(jù)相對應(yīng)的第一粗筆劃圖像和第二粗筆劃圖像的步驟包括 利用預(yù)定過濾條件分別對所述第一粗筆劃邊緣圖像數(shù)據(jù)和所述第二粗筆劃邊緣圖像數(shù)據(jù)中的連通域數(shù)據(jù)進(jìn)行過濾處理,以獲得滿足所述預(yù)定過濾條件的第一連通域圖像數(shù)據(jù)和第二連通域圖像數(shù)據(jù);以及 獲得分別與所述第一連通域圖像數(shù)據(jù)和所述第二連通域圖像數(shù)據(jù)相對應(yīng)的第一粗筆劃圖像和第二粗筆劃圖像。
8.根據(jù)權(quán)利要求7所述的方法,其中,所述預(yù)定過濾條件包括以下條件中的至少之一 所述連通域內(nèi)的像素的灰度方差小于預(yù)定方差閾值; 所述連通域的內(nèi)邊緣到外邊緣的像素極性一致;以及 所述連通域的大小在預(yù)定大小閾值內(nèi)。
9.根據(jù)權(quán)利要求3至8中任一項(xiàng)所述的方法,還包括 基于文本筆劃的精度和文本筆劃的召回率中的至少一個(gè),篩選所述第一細(xì)筆劃圖像和所述第二細(xì)筆劃圖像中的一個(gè)作為最終的細(xì)筆劃圖像和/或篩選所述第一粗筆劃圖像和所述第二粗筆劃圖像中的一個(gè)作為最終的粗筆劃圖像。
10.一種用于從圖像中提取文本筆劃圖像的裝置,包括信息獲取單元,用于獲取所述圖像的邊緣信息和梯度信息; 強(qiáng)化單元,用于對所獲取的邊緣信息和梯度信息進(jìn)行預(yù)定的加強(qiáng)處理,從而強(qiáng)化所述圖像中與文本有關(guān)的邊緣信息和梯度信息;以及 筆劃圖像獲得單元,用于獲得與經(jīng)強(qiáng)化的邊緣信息和梯度信息相對應(yīng)的文本筆劃圖像。
全文摘要
本發(fā)明提供一種用于從圖像中提取文本筆劃圖像的方法和裝置。根據(jù)本發(fā)明的一個(gè)方面,提供了一種用于從圖像中提取文本筆劃圖像的方法,包括獲取圖像的邊緣信息和梯度信息;對所獲取的邊緣信息和梯度信息進(jìn)行預(yù)定的加強(qiáng)處理,從而強(qiáng)化圖像中與文本有關(guān)的邊緣信息和梯度信息;以及獲得與經(jīng)強(qiáng)化的邊緣信息和梯度信息相對應(yīng)的文本筆劃圖像。
文檔編號G06K9/00GK102810155SQ20111015767
公開日2012年12月5日 申請日期2011年5月31日 優(yōu)先權(quán)日2011年5月31日
發(fā)明者桂天宜, 皆川明洋, 勝山裕, 孫俊, 堀田悅伸, 直井聰 申請人:富士通株式會社