專利名稱:一種數(shù)字圖像識別的方法、裝置及爬蟲服務(wù)器的制作方法
技術(shù)領(lǐng)域:
本申請涉及圖像處理領(lǐng)域,特別涉及一種數(shù)字圖像識別的方法、裝置及爬蟲服務(wù)
O
背景技術(shù):
互聯(lián)網(wǎng)爬蟲(簡稱爬蟲)通常充當(dāng)為搜索引擎服務(wù)器收集數(shù)據(jù)的角色,爬蟲主要用于利用機(jī)器抓取或下載網(wǎng)頁,然后對網(wǎng)頁內(nèi)包含或隱藏的數(shù)據(jù)進(jìn)行提取或識別,整理為搜索引擎服務(wù)器能接受的格式或數(shù)據(jù)結(jié)構(gòu),供搜索引擎服務(wù)器建立索引。因此,爬蟲的很重要的一項工作,就是對網(wǎng)頁內(nèi)的數(shù)據(jù)進(jìn)行結(jié)構(gòu)化抽取與識別,以店鋪的垂直搜索的應(yīng)用場景而為例,“店名”、“地址”、“電話”、“地圖坐標(biāo)”和“評論”等,都是需要爬蟲抽取的信息。而數(shù)據(jù)中的電話號碼(包括公司、企業(yè)或個人的電話號碼),是垂直生活搜索領(lǐng)域內(nèi)的一種關(guān)鍵信息,包含準(zhǔn)確的電話信息,對數(shù)據(jù)的質(zhì)量與有效性的貢獻(xiàn)很大。如果抽取到其他方面的信息比較完整,唯獨缺少電話信息,就會使得數(shù)據(jù)本身的完整性相對缺失。電話號碼,本質(zhì)上是一個由數(shù)字組成的字串,現(xiàn)在普遍的保護(hù)措施都是將其以圖片形式展現(xiàn),即不影響用戶閱讀,也因為電話號碼本身比較短小,在網(wǎng)頁內(nèi)所占的面積也很小,所以作為圖片傳輸也不會影響網(wǎng)絡(luò)開銷。而對于爬蟲而言,就需要具備文字識別(OCR)的技術(shù)基礎(chǔ),因此,電話號碼(即數(shù)字)的圖像識別技術(shù),就成為爬蟲涉及到的系統(tǒng)中至關(guān)重要的一項技術(shù)。OCR是計算機(jī)模式識別中的一個分支,而只針對數(shù)字(“0” “9”的任意字符)的圖像識別技術(shù)又是OCR中的一個特殊分支。在現(xiàn)有技術(shù)中,有一種數(shù)字識別方法是求差法,主要實現(xiàn)過程為獲得“0” “9”各字符的模型圖像,并將待識別圖像與各模型圖像分別做差,求待識別圖像與各模型圖像之間不同的像素個數(shù),個數(shù)較少者的模型圖像對應(yīng)的字符就是待識別圖像中的數(shù)字字符。該方法對非幾何形變的圖像有很出色的識別精度,但是如果圖像噪聲比較嚴(yán)重,而噪聲祛除的效果不佳,就可能導(dǎo)致后續(xù)的識別結(jié)果不準(zhǔn)確,同時求差法因為不能適應(yīng)具有幾何形變的圖像,例如扭曲或縮放,所以也不能適應(yīng)爬蟲對海量網(wǎng)站的數(shù)據(jù)識別需求?,F(xiàn)有技術(shù)中還有另外一種圖像識別技術(shù)主要采用神經(jīng)網(wǎng)絡(luò)的方式,首先需要選擇待識別圖像的特征,并對待識別圖像的特征進(jìn)行描述,再選擇一些人工識別的樣本作為機(jī)器學(xué)習(xí)的對象,機(jī)器學(xué)習(xí)輸出圖像的模式(識別的規(guī)則或規(guī)律),而對待識別圖像只要套用這個機(jī)器學(xué)習(xí)的模式,就可以獲得待識別圖像中包括的數(shù)字字符。但是采用神經(jīng)網(wǎng)絡(luò)的方式對數(shù)字圖像進(jìn)行識別,也存在一定的問題該方式雖然對單個數(shù)字字符的識別率比求差法更高(能達(dá)到96% 98% ),但是在實際應(yīng)用中的電話號碼一般都至少包括8位,手機(jī)號碼的數(shù)字更多,那么因此,神經(jīng)網(wǎng)絡(luò)對于整串?dāng)?shù)字的識別率還是不夠準(zhǔn)確。例如,按照單字符96% 98%的準(zhǔn)確率來講,8位電話號碼(固定電話)的準(zhǔn)確率約為-J2. 85. 1%,11位電話號碼(手機(jī))的準(zhǔn)確率約為63. 8% 80. 1%,12位電話號碼(區(qū)號+固定電話)的準(zhǔn)確率約為61. 3% 78.5%。而在實際應(yīng)用中,當(dāng)數(shù)字圖像的識別準(zhǔn)確率不高時,爬蟲服務(wù)器在執(zhí)行數(shù)字圖像的識別過程之后所提供的識別結(jié)果很可能就是錯誤的,如果需要獲取準(zhǔn)確率更高的識別結(jié)果,可能就需要在爬蟲服務(wù)器上重復(fù)執(zhí)行數(shù)字圖像的識別過程,以比較識別結(jié)果來確定出正確的數(shù)字字符,這種重復(fù)執(zhí)行的操作就會使得爬蟲服務(wù)器的運行性能下降??傊壳靶枰绢I(lǐng)域技術(shù)人員迫切解決的一個技術(shù)問題就是如何能夠創(chuàng)新的提出一種圖像識別的方法,以解決現(xiàn)有技術(shù)中基于求差法或者神經(jīng)網(wǎng)絡(luò)的數(shù)字圖像識別技術(shù)準(zhǔn)確率不夠高導(dǎo)致的爬蟲服務(wù)器運行性能下降的技術(shù)問題。
發(fā)明內(nèi)容
本申請所要解決的技術(shù)問題是提供一種數(shù)字圖像識別的方法,用以解決現(xiàn)有技術(shù)中基于求差法或者神經(jīng)網(wǎng)絡(luò)的數(shù)字圖像識別技術(shù)準(zhǔn)確率不夠高導(dǎo)致的服務(wù)器運行性能下降的技術(shù)問題。本申請還提供了一種數(shù)字圖像識別的裝置,用以保證上述方法在實際中的實現(xiàn)及應(yīng)用。為了解決上述問題,本申請公開了一種數(shù)字圖像識別的方法,包括將待識別數(shù)字圖像切割為多個包括單個數(shù)字字符的子圖像;對所述多個包括單個數(shù)字字符的子圖像依次執(zhí)行基于拓?fù)湫畔⒌淖R別處理,所述基于拓?fù)湫畔⒌淖R別處理具體包括對待識別的子圖像進(jìn)行細(xì)化,得到細(xì)化后的細(xì)化子圖像;獲取所述細(xì)化子圖像的拓?fù)湫畔ⅲ灰罁?jù)所述拓?fù)湫畔念A(yù)置的數(shù)據(jù)庫中匹配得到所述待識別的子圖像對應(yīng)的數(shù)字。優(yōu)選的,所述對所述多個包括單個數(shù)字字符的子圖像依次執(zhí)行基于拓?fù)湫畔⒌淖R別處理之后,還包括將所述待識別圖像對應(yīng)的數(shù)字串在當(dāng)前界面上進(jìn)行展示。優(yōu)選的,所述獲取所述細(xì)化子圖像的拓?fù)湫畔?,具體包括獲取所述細(xì)化子圖像中各個頂點所連接的邊的個數(shù);記錄所述各個頂點之間的連通關(guān)系;當(dāng)所述細(xì)化子圖像的連通圖中包括閉合的環(huán)時,記錄所述環(huán)的中心點的位置信
肩、ο優(yōu)選的,所述對所述多個包括單個數(shù)字字符的子圖像依次執(zhí)行基于拓?fù)湫畔⒌淖R別處理之后,還包括當(dāng)在預(yù)置的數(shù)據(jù)庫中匹配不到某個細(xì)化子圖像對應(yīng)的數(shù)字時,就將該細(xì)化子圖像所對應(yīng)的拓?fù)湫畔⒈4嬷了鲱A(yù)置的數(shù)據(jù)庫中。優(yōu)選的,所述預(yù)置的數(shù)據(jù)庫用于保存各個數(shù)字字符的模型,所述模型在所述預(yù)置的數(shù)據(jù)庫中的保存方式與所述拓?fù)湫畔⑾嗥ヅ?。本申請公開了一種數(shù)字圖像識別的裝置,包括切割子圖像模塊和圖像識別模塊, 所述切割子圖像模塊,用于將待識別圖像切割為多個包括單個數(shù)字字符的子圖像;所述圖像識別模塊,用于對所述多個包括單個數(shù)字字符的子圖像依次執(zhí)行基于拓?fù)湫畔⒌淖R別處理,所述圖像識別模塊具體包括細(xì)化子模塊,用于對待識別的子圖像進(jìn)行細(xì)化,得到細(xì)化后的細(xì)化子圖像;獲取拓?fù)湫畔⒆幽K,用于獲取所述細(xì)化子圖像的拓?fù)湫畔ⅲ?br>
匹配子模塊,用于依據(jù)所述拓?fù)湫畔念A(yù)置的數(shù)據(jù)庫中匹配得到所述待識別的子圖像對應(yīng)的數(shù)字。優(yōu)選的,所述裝置還包括展示模塊,用于將所述待識別圖像對應(yīng)的數(shù)字串在當(dāng)前界面上進(jìn)行展示。優(yōu)選的,所述獲取拓?fù)湫畔⒆幽K,具體包括獲取度子模塊,用于獲取所述細(xì)化子圖像中各個頂點所連接的邊的個數(shù);記錄連通關(guān)系子模塊,用于記錄所述各個頂點之間的連通關(guān)系;記錄位置信息子模塊,用于當(dāng)所述細(xì)化子圖像的連通圖中包括閉合的環(huán)時,記錄所述環(huán)的中心點的位置信息。優(yōu)選的,還包括保存模塊,用于當(dāng)在預(yù)置的數(shù)據(jù)庫中匹配不到某個細(xì)化子圖像對應(yīng)的數(shù)字時,就將該細(xì)化子圖像所對應(yīng)的拓?fù)湫畔⒈4嬷了鲱A(yù)置的數(shù)據(jù)庫中。本申請公開了一種爬蟲服務(wù)器,包括包括前述實施例中任一實施例所述的裝置。與現(xiàn)有技術(shù)相比,本申請包括以下優(yōu)點在本申請實施例中,采用獲取數(shù)字字符所呈現(xiàn)出的只有一個像素的連通圖的拓?fù)湫畔ⅲ瑥念A(yù)置的數(shù)據(jù)庫中獲取到與該拓?fù)湫畔⑵ヅ涞臄?shù)字字符的模型,就可以通過獲得各個數(shù)字字符的拓?fù)湫畔?,與預(yù)先保存的數(shù)字字符的模型進(jìn)行匹配,進(jìn)而獲得當(dāng)前待識別圖像中的數(shù)字字符。采用本實施例可以降低在實際應(yīng)用中的成本,同時可以適應(yīng)適應(yīng)各種網(wǎng)站的各種包括數(shù)字字符的圖像,還能進(jìn)一步提高在數(shù)字圖像識別上的準(zhǔn)確率。而同時,當(dāng)本申請實施例在爬蟲服務(wù)器上執(zhí)行時,也可以提升爬蟲服務(wù)器的運行性能。當(dāng)然,實施本申請的任一產(chǎn)品并不一定需要同時達(dá)到以上所述的所有優(yōu)點。
為了更清楚地說明本申請實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1為了各個數(shù)字字符“3”在不同場景下共同特征的示意圖;圖2是本申請的一種數(shù)字圖像識別的方法實施例1的流程圖;圖3是數(shù)字字符“4”做了細(xì)化之后的一個示意圖;圖4是本申請的一種數(shù)字圖像識別的方法實施例2的流程圖;圖5是為數(shù)字字符“4”的頂點及度的示意圖;圖6是圖5所示的數(shù)字字符4的閉合環(huán)的示意圖;圖7是預(yù)置的數(shù)據(jù)庫中保存各個數(shù)字字符的模型圖的一個具體實例示意圖;圖8是本申請的一種數(shù)字圖像識別的裝置實施例1的結(jié)構(gòu)框圖;圖9是本申請的一種數(shù)字圖像識別的裝置實施例2的結(jié)構(gòu)框圖。
具體實施例方式下面將結(jié)合本申請實施例中的附圖,對本申請實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例僅僅是本申請一部分實施例,而不是全部的實施例?;诒旧暾堉械膶嵤├绢I(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本申請保護(hù)的范圍。本申請可用于眾多通用或?qū)S玫挠嬎阊b置環(huán)境或配置中。例如個人計算機(jī)、服務(wù)器計算機(jī)、手持設(shè)備或便攜式設(shè)備、平板型設(shè)備、多處理器裝置、包括以上任何裝置或設(shè)備的分布式計算環(huán)境等等。本申請可以在由計算機(jī)執(zhí)行的計算機(jī)可執(zhí)行指令的一般上下文中描述,例如程序模塊。一般地,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對象、組件、數(shù)據(jù)結(jié)構(gòu)等等。也可以在分布式計算環(huán)境中實踐本申請,在這些分布式計算環(huán)境中,由通過通信網(wǎng)絡(luò)而被連接的遠(yuǎn)程處理設(shè)備來執(zhí)行任務(wù)。在分布式計算環(huán)境中,程序模塊可以位于包括存儲設(shè)備在內(nèi)的本地和遠(yuǎn)程計算機(jī)存儲介質(zhì)中。本申請的主要思想依據(jù)介紹如下參考在實際生活中的人眼識別數(shù)字的方式可知,以數(shù)字字符“3”為例,不管該字符是以下哪種存在方式3、3、3,還是3,人眼都能夠判定出所看到的數(shù)字即是“3”,可見在人眼識別過程中,各個“3”之間的差異是被人眼忽略的, 而共同點才是被人眼認(rèn)可的,參考圖1所示,示出了各個數(shù)字字符“3”在不同場景下共同特征的示意圖。因此,對于數(shù)字字符在識別過程中起到重要作用的,其實是數(shù)字字符中的頂點和頂點之間的連接關(guān)系,只要一個數(shù)字字符在其呈現(xiàn)的形態(tài)中保留了頂點和頂點之間的連接關(guān)系,那么即便一個數(shù)字字符所呈現(xiàn)的圖像扭曲或者變形了,也不會影響對該數(shù)字字符的識別?;谏鲜鲈恚旧暾埖闹饕枷胫豢梢园?,首先對待識別圖像進(jìn)行預(yù)處理過程,即是將待識別圖像切割為多個包括單個數(shù)字字符的子圖像,然后依次對待識別的各個子圖像進(jìn)行細(xì)化,得到細(xì)化后的細(xì)化子圖像;再按照獲取到的所述細(xì)化子圖像的拓?fù)湫畔?,從預(yù)置的數(shù)據(jù)庫中匹配得到所述待識別圖像對應(yīng)的數(shù)字。需要說明的是,在本申請實施例中,當(dāng)待識別圖像切割為多個子圖像時,可以按照對一副子圖像依次細(xì)化、獲取拓?fù)湫畔⒉⑦M(jìn)行匹配得到該子圖像對應(yīng)的數(shù)字的方式,依次對各個子圖像執(zhí)行基于拓?fù)湫畔⒌淖R別方法;也可以先后對多個子圖像進(jìn)行細(xì)化,得到多個細(xì)化后的子圖像之后,再依次獲取各個細(xì)化后的子圖像的拓?fù)湫畔?,然后依?jù)這多個拓?fù)湫畔臄?shù)據(jù)庫中依次匹配得到多個數(shù)字。上述兩種方式均可實現(xiàn)本申請,因此本申請不做限定。采用本申請實施例可以依據(jù)待識別圖像中的數(shù)字字符本身所具有的連通關(guān)系對數(shù)字進(jìn)行識別,依據(jù)連通圖示意出的拓?fù)湫畔⒌筋A(yù)置的數(shù)據(jù)庫中去匹配,與數(shù)據(jù)庫中某個數(shù)字字符的模型圖的拓?fù)湫畔⒁恢录纯烧J(rèn)為識別出了該數(shù)字字符,采用本申請實施例的方式可以提升對包括數(shù)字字符圖像的識別的準(zhǔn)確率,當(dāng)本申請實施例的方法或裝置應(yīng)用于爬蟲服務(wù)器時,可以對爬蟲抓取的網(wǎng)頁上包括了數(shù)字字符的圖片進(jìn)行識別,以準(zhǔn)確的識別出所抓取到的網(wǎng)頁上圖片中的各種數(shù)字字符,在實際應(yīng)用中可以使得爬蟲服務(wù)器準(zhǔn)確地提供各種數(shù)字信息,例如固定電話或者手機(jī)號碼,門牌號等等。參考圖2,示出了本申請一種數(shù)字圖像識別的方法實施例1的流程圖,可以包括以下步驟步驟201 將待識別圖像切割為多個包括單個數(shù)字字符的子圖像。在本實施例中,所述待識別圖像為一副包括了數(shù)字字符的原始圖像,該原始圖像可以由爬蟲服務(wù)器從互聯(lián)網(wǎng)上獲取。所述待識別圖像包括的數(shù)字字符可以有多個,這個時候在對待識別圖像進(jìn)行切割時,則按照其包括的數(shù)字字符的個數(shù)多少切割為對應(yīng)個數(shù)的子圖像,每一副子圖像都對應(yīng)的包括了一個數(shù)字字符。需要說明的是,本步驟在對待識別圖像進(jìn)行切割過程中,需要先對該待識別圖像進(jìn)行預(yù)處理,即是消除待識別圖像中的色彩差異,使得原待識別圖像成為只有黑白兩色的灰度圖像,同時去除一些可能存在的噪點,包括在該圖像中孤立存在的點等,這樣處理的目的是去除有可能會影響數(shù)字字符識別的一些噪聲,所述噪聲指圖像中有效內(nèi)容以外的內(nèi)容,在本申請中,指被有意添加的冗余像素信息,該冗余像素信息可以干擾爬蟲服務(wù)器對圖像的有效識別。因為本步驟采用現(xiàn)有技術(shù)實現(xiàn),所以不再介紹詳細(xì)過程,具體可參見現(xiàn)有技術(shù)中對待識別圖像的預(yù)處理過程。步驟202 對所述多個包括單個數(shù)字字符的子圖像依次執(zhí)行基于拓?fù)湫畔⒌淖R別處理,所述基于拓?fù)湫畔⒌淖R別處理具體包括對待識別的子圖像進(jìn)行細(xì)化;得到細(xì)化后的細(xì)化子圖像;獲取所述細(xì)化子圖像的拓?fù)湫畔?;并依?jù)所述拓?fù)湫畔念A(yù)置的數(shù)據(jù)庫中匹配得到所述待識別的子圖像對應(yīng)的數(shù)字。在執(zhí)行步驟202時,所述子圖像已經(jīng)是僅僅包括數(shù)字字符且去除了噪聲的灰度圖像,再對子圖像執(zhí)行細(xì)化過程。所述細(xì)化指數(shù)學(xué)形態(tài)學(xué)中圖像“退化”的一種典型算法,其目的主要是將原始圖像轉(zhuǎn)換為僅有一個像素粗度的圖像,并保持原始圖像的連通性不變??梢詤⒖紙D3所示,為對數(shù)字字符“4”做了細(xì)化之后的一個示意圖。對子圖像做了細(xì)化之后,子圖像中的數(shù)字字符所呈現(xiàn)的線條僅僅包括了一個像素粗度,并且數(shù)字字符呈現(xiàn)出的連通性保持不變。因此此時可以對該子圖像遍歷獲取其拓?fù)湫畔?,這里的拓?fù)湫畔⒅傅氖窃撟訄D像中的各個頂點及其之間的連接關(guān)系。因為只要一個數(shù)字字符的頂點所在位置及頂點之間的連接關(guān)系不變,那么不管該字符進(jìn)行了何種扭曲或變形,都能區(qū)分出該字符。得到某個子圖像的拓?fù)湫畔⒅?,再將這些拓?fù)湫畔⒌筋A(yù)置的數(shù)據(jù)庫中進(jìn)行匹配,該預(yù)置的數(shù)據(jù)庫用于保存各個數(shù)字字符(0 9)的拓?fù)湫畔?,其保存形式可以有多種,例如采用矩陣的形式保存,或者采用結(jié)構(gòu)圖的形式呈現(xiàn)各個數(shù)字字符的拓?fù)湫畔⒕伞P枰f明的是,所述預(yù)置的數(shù)據(jù)庫用于保存各個數(shù)字字符的模型,所述模型在所述預(yù)置的數(shù)據(jù)庫中的保存方式與所述拓?fù)湫畔⑾嗥ヅ?。?dāng)預(yù)置的數(shù)據(jù)庫中采用矩陣形式保存子圖像的拓?fù)湫畔r,那么在獲取子圖像的拓?fù)湫畔r也需要按照矩陣形式,這樣才能使得后續(xù)匹配時能夠找到已經(jīng)保存過的矩陣,確定出子圖像中包括的數(shù)字字符。步驟203 當(dāng)在預(yù)置的數(shù)據(jù)庫中匹配不到某個細(xì)化子圖像對應(yīng)的數(shù)字時,就將該細(xì)化子圖像所對應(yīng)的拓?fù)湫畔⒈4嬷了鲱A(yù)置的數(shù)據(jù)庫中。在實際應(yīng)用中,在數(shù)據(jù)庫中保存的拓?fù)湫畔⑴c獲取到的子圖像的拓?fù)湫畔⒌男问狡ヅ涞那闆r下,數(shù)據(jù)庫中也不存在某個子圖像的對應(yīng)的數(shù)字字符,此時就說明數(shù)據(jù)庫中還未保存當(dāng)前獲取到的拓?fù)湫畔?yīng)的數(shù)字字符的模型,此時就需要將當(dāng)前獲取到的拓?fù)湫畔⒁酝瑯拥谋4嫘问奖4嬷了鰯?shù)據(jù)庫中,以方便后續(xù)對于該數(shù)字字符的匹配。本實施例中,采用獲取數(shù)字字符所呈現(xiàn)出的只有一個像素的連通圖的拓?fù)湫畔ⅲ?從預(yù)置的數(shù)據(jù)庫中獲取到與該拓?fù)湫畔⑵ヅ涞臄?shù)字字符的模型,就可以通過獲得各個數(shù)字字符的拓?fù)湫畔?,與預(yù)先保存的數(shù)字字符的模型進(jìn)行匹配,進(jìn)而獲得當(dāng)前待識別圖像中的數(shù)字字符。采用本實施例可以降低在實際應(yīng)用中的成本,同時可以適應(yīng)各種網(wǎng)站的各種包括數(shù)字字符的圖像,還能進(jìn)一步提高在數(shù)字圖像識別上的準(zhǔn)確率。而同時,當(dāng)本申請實施例在爬蟲服務(wù)器上執(zhí)行時,也可以提升爬蟲服務(wù)器的運行性能。參考圖4,示出了本申請一種數(shù)字圖像識別的方法實施例2的流程圖,可以包括以下步驟步驟401 將待識別圖像切割為多個包括單個數(shù)字字符的子圖像。步驟402 對任意一個待識別的子圖像進(jìn)行細(xì)化,得到細(xì)化后的細(xì)化子圖像。在本實施例中,所述包括單個數(shù)字字符的子圖像有多個,本步驟僅僅選擇任一個待識別的子圖像進(jìn)行細(xì)化,從而得到一副細(xì)化子圖像。步驟403 獲取所述細(xì)化子圖像中各個頂點所連接的邊的個數(shù)。在細(xì)化子圖像中,只有一個像素粗細(xì)的圖像且存在連通性,因此,可以遍歷該細(xì)化子圖像中的所有像素點,以找出所述細(xì)化子圖像中的各個頂點,同時,依據(jù)頂點之間的連接關(guān)系獲取各個頂點的度。所述“度”為該頂點所連接的“邊”的個數(shù),這里的度所涉及到的領(lǐng)域為數(shù)學(xué)形態(tài)學(xué)中的圖論分支。參考圖5所示,為數(shù)字字符“4”的頂點及度的示意圖。在圖5中,數(shù)字字符4分別有5個頂點A、B、C、D和E。其中,A頂點的度為2,B頂點的度為2, C頂點的度為4,D頂點的度為1,E頂點的度也為1。各個頂點的度可以采用表1示意表權(quán)利要求
1.一種數(shù)字圖像識別的方法,其特征在于,該方法包括將待識別數(shù)字圖像切割為多個包括單個數(shù)字字符的子圖像;對所述多個包括單個數(shù)字字符的子圖像依次執(zhí)行基于拓?fù)湫畔⒌淖R別處理,所述基于拓?fù)湫畔⒌淖R別處理具體包括對待識別的子圖像進(jìn)行細(xì)化,得到細(xì)化后的細(xì)化子圖像;獲取所述細(xì)化子圖像的拓?fù)湫畔?;依?jù)所述拓?fù)湫畔念A(yù)置的數(shù)據(jù)庫中匹配得到所述待識別的子圖像對應(yīng)的數(shù)字。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對所述多個包括單個數(shù)字字符的子圖像依次執(zhí)行基于拓?fù)湫畔⒌淖R別處理之后,還包括將所述待識別圖像對應(yīng)的數(shù)字串在當(dāng)前界面上進(jìn)行展示。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取所述細(xì)化子圖像的拓?fù)湫畔?,具體包括獲取所述細(xì)化子圖像中各個頂點所連接的邊的個數(shù);記錄所述各個頂點之間的連通關(guān)系;當(dāng)所述細(xì)化子圖像的連通圖中包括閉合的環(huán)時,記錄所述環(huán)的中心點的位置信息。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對所述多個包括單個數(shù)字字符的子圖像依次執(zhí)行基于拓?fù)湫畔⒌淖R別處理之后,還包括當(dāng)在預(yù)置的數(shù)據(jù)庫中匹配不到某個細(xì)化子圖像對應(yīng)的數(shù)字時,就將該細(xì)化子圖像所對應(yīng)的拓?fù)湫畔⒈4嬷了鲱A(yù)置的數(shù)據(jù)庫中。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述預(yù)置的數(shù)據(jù)庫用于保存各個數(shù)字字符的模型,所述模型在所述預(yù)置的數(shù)據(jù)庫中的保存方式與所述拓?fù)湫畔⑾嗥ヅ洹?br>
6.一種圖像識別的裝置,其特征在于,該裝置包括切割子圖像模塊和圖像識別模塊,所述切割子圖像模塊,用于將待識別圖像切割為多個包括單個數(shù)字字符的子圖像;所述圖像識別模塊,用于對所述多個包括單個數(shù)字字符的子圖像依次執(zhí)行基于拓?fù)湫畔⒌淖R別處理,所述圖像識別模塊具體包括細(xì)化子模塊,用于對待識別的子圖像進(jìn)行細(xì)化,得到細(xì)化后的細(xì)化子圖像;獲取拓?fù)湫畔⒆幽K,用于獲取所述細(xì)化子圖像的拓?fù)湫畔?;匹配子模塊,用于依據(jù)所述拓?fù)湫畔念A(yù)置的數(shù)據(jù)庫中匹配得到所述待識別的子圖像對應(yīng)的數(shù)字。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述裝置還包括展示模塊,用于將所述待識別圖像對應(yīng)的數(shù)字串在當(dāng)前界面上進(jìn)行展示。
8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述獲取拓?fù)湫畔⒆幽K,具體包括獲取度子模塊,用于獲取所述細(xì)化子圖像中各個頂點所連接的邊的個數(shù);記錄連通關(guān)系子模塊,用于記錄所述各個頂點之間的連通關(guān)系;記錄位置信息子模塊,用于當(dāng)所述細(xì)化子圖像的連通圖中包括閉合的環(huán)時,記錄所述環(huán)的中心點的位置信息。
9.根據(jù)權(quán)利要求6所述的裝置,其特征在于,還包括保存模塊,用于當(dāng)在預(yù)置的數(shù)據(jù)庫中匹配不到某個細(xì)化子圖像對應(yīng)的數(shù)字時,就將該細(xì)化子圖像所對應(yīng)的拓?fù)湫畔⒈4嬷了鲱A(yù)置的數(shù)據(jù)庫中。
10.一種爬蟲服務(wù)器,其特征在于,所述爬蟲服務(wù)器包括如權(quán)利要求6-9任一項所述的裝置ο
全文摘要
本發(fā)明提供了一種數(shù)字圖像識別的方法、裝置及爬蟲服務(wù)器,所述方法包括將待識別圖像切割為多個包括單個數(shù)字字符的子圖像;對所述多個包括單個數(shù)字字符的子圖像依次執(zhí)行基于拓?fù)湫畔⒌淖R別處理,所述基于拓?fù)湫畔⒌淖R別處理具體包括對待識別的子圖像進(jìn)行細(xì)化,得到細(xì)化后的細(xì)化子圖像;獲取所述細(xì)化子圖像的拓?fù)湫畔?;并依?jù)所述拓?fù)湫畔念A(yù)置的數(shù)據(jù)庫中匹配得到所述待識別的子圖像對應(yīng)的數(shù)字。采用本發(fā)明可以降低在實際應(yīng)用中的成本,同時可以適應(yīng)適應(yīng)各種網(wǎng)站的各種包括數(shù)字字符的圖像,還能進(jìn)一步提高在數(shù)字圖像識別上的準(zhǔn)確率。而同時,當(dāng)本發(fā)明實施例在爬蟲服務(wù)器上執(zhí)行時,也可以提升爬蟲服務(wù)器的運行性能。
文檔編號G06K9/64GK102385707SQ20101027045
公開日2012年3月21日 申請日期2010年8月30日 優(yōu)先權(quán)日2010年8月30日
發(fā)明者孫翔 申請人:阿里巴巴集團(tuán)控股有限公司