基于光學(xué)字符識(shí)別的圖像中字符識(shí)別方法及裝置制造方法
【專利摘要】本發(fā)明涉及一種基于光學(xué)字符識(shí)別的圖像中字符識(shí)別方法及裝置,所述方法在一個(gè)實(shí)施例中包括以下步驟:將所述圖像灰度化轉(zhuǎn)化為灰度圖像;滑動(dòng)讀取圖像的窗口,循環(huán)截取預(yù)設(shè)范圍的所述灰度圖像直到所述圖像被完全截??;根據(jù)預(yù)設(shè)的計(jì)算方法計(jì)算得到的第一閥值對(duì)當(dāng)前所述截取的預(yù)設(shè)范圍的圖像進(jìn)行二值化直到所述灰度圖像被完全二值化;將所述二值化的灰度圖像的灰度值離散分布通過離散傅里葉變換變換到頻域,通過高斯濾波對(duì)所述頻域中的點(diǎn)值進(jìn)行調(diào)整;再將所述頻域中距離中心距離小于預(yù)設(shè)值的點(diǎn)值均置為零,得到處理圖像;將所述處理圖像中的字符串進(jìn)行識(shí)別,生成目標(biāo)字符串。根據(jù)發(fā)明中的方法及裝置,可以更準(zhǔn)確的識(shí)別圖像中的字符串。
【專利說(shuō)明】基于光學(xué)字符識(shí)別的圖像中字符識(shí)別方法及裝置
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及光學(xué)字符識(shí)別領(lǐng)域,特別涉及一種基于光學(xué)字符識(shí)別的圖像中字符識(shí) 別方法及裝置。
【背景技術(shù)】
[0002] 圖像中的字符的識(shí)別技術(shù)越來(lái)越重要,通過掃描識(shí)別影像直接獲取影像中的字 符,減少字符輸入的麻煩操作。光學(xué)字符識(shí)別技術(shù)已經(jīng)應(yīng)用到諸如車牌識(shí)別、證件信息識(shí) 另IJ、取詞翻譯等?,F(xiàn)有技術(shù)中沒有對(duì)于圖像中有明顯摩爾紋等明顯陰影的字符識(shí)別的有效 方法,對(duì)于不清晰的圖像中的字符識(shí)別也就成為亟待解決的問題。
【發(fā)明內(nèi)容】
[0003] 有鑒于此,本發(fā)明提供一種基于光學(xué)字符識(shí)別的圖像中字符識(shí)別方法及裝置,可 以更準(zhǔn)確的識(shí)別圖像中的字符串。
[0004] 一種基于光學(xué)字符識(shí)別的圖像中字符識(shí)別方法,所述方法用于讀取圖像中的字符 串,所述方法包括以下步驟:
[0005] 將所述圖像灰度化轉(zhuǎn)化為灰度圖像;
[0006] 滑動(dòng)讀取圖像的窗口,循環(huán)截取預(yù)設(shè)范圍的所述灰度圖像直到所述圖像被完全截 ??;
[0007] 根據(jù)預(yù)設(shè)的計(jì)算方法計(jì)算得到的第一閥值對(duì)當(dāng)前所述截取的預(yù)設(shè)范圍的圖像進(jìn) 行二值化直到所述灰度圖像被完全二值化;
[0008] 將所述二值化的灰度圖像的灰度值的離散分布通過離散傅里葉變換變換到頻域, 通過高斯濾波對(duì)所述頻域中的點(diǎn)值進(jìn)行調(diào)整;
[0009] 再將所述頻域中距離中心距離小于預(yù)設(shè)值的點(diǎn)值均置為零,得到處理圖像;以及
[0010] 將所述處理圖像中的字符串進(jìn)行識(shí)別,生成目標(biāo)字符串。
[0011] 一種基于光學(xué)字符識(shí)別的圖像中字符識(shí)別裝置,所述裝置用于讀取圖像中的字符 串,所述裝置包括以下模塊:
[0012] 二值化模塊,用于根據(jù)灰度化將所述圖像轉(zhuǎn)化為灰度圖像,滑動(dòng)讀取圖像的窗口, 循環(huán)截取預(yù)設(shè)范圍的所述圖像直到所述圖像被完全截取,根據(jù)預(yù)設(shè)的計(jì)算方法計(jì)算得到的 第一閥值將當(dāng)前所述截取的圖像進(jìn)行二值化;
[0013] 濾波模塊,用于將所述二值化的灰度圖像的灰度值的離散分布通過離散傅里葉變 換變換到頻域,通過高斯濾波對(duì)所述頻域中的點(diǎn)值進(jìn)行調(diào)整;
[0014] 截?cái)嗄K,用于再將所述頻域中距離中心距離小于預(yù)設(shè)值的點(diǎn)值均置為零,得到 處理圖像;以及
[0015] 識(shí)別模塊,用于將所述處理圖像中的字符串進(jìn)行識(shí)別,生成目標(biāo)字符串。
[0016] 根據(jù)上述實(shí)施例的方法及裝置,通過先對(duì)圖像預(yù)處理,減少較明顯陰影的影響,有 效識(shí)別圖像中的字符串。
[0017] 為讓本發(fā)明的上述和其他目的、特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉較佳實(shí)施例, 并配合所附圖式,作詳細(xì)說(shuō)明如下。
【專利附圖】
【附圖說(shuō)明】
[0018] 圖1為一種電子裝置的結(jié)構(gòu)框圖。
[0019] 圖2為第一實(shí)施例提供的基于光學(xué)字符識(shí)別的圖像中字符識(shí)別方法流程圖。
[0020] 圖3為第二實(shí)施例提供的基于光學(xué)字符識(shí)別的圖像中字符識(shí)別方法流程圖。
[0021] 圖4為第三實(shí)施例提供的基于光學(xué)字符識(shí)別的圖像中字符識(shí)別方法流程圖。
[0022] 圖5為第四實(shí)施例提供的基于光學(xué)字符識(shí)別的圖像中字符識(shí)別方法流程圖。
[0023] 圖6為第五實(shí)施例提供的基于光學(xué)字符識(shí)別的圖像中字符識(shí)別方法流程圖。
[0024] 圖7為第六實(shí)施例提供的基于光學(xué)字符識(shí)別的圖像中字符識(shí)別方法流程圖。
[0025] 圖8為第七實(shí)施例提供的基于光學(xué)字符識(shí)別的圖像中字符識(shí)別裝置結(jié)構(gòu)框圖。
[0026] 圖9為第八實(shí)施例提供的基于光學(xué)字符識(shí)別的圖像中字符識(shí)別裝置結(jié)構(gòu)框圖。
[0027] 圖10為第九實(shí)施例提供的基于光學(xué)字符識(shí)別的圖像中字符識(shí)別裝置結(jié)構(gòu)框圖。
[0028] 圖11為第十實(shí)施例提供的基于光學(xué)字符識(shí)別的圖像中字符識(shí)別裝置結(jié)構(gòu)框圖。
[0029] 圖12為第十一實(shí)施例提供的基于光學(xué)字符識(shí)別的圖像中字符識(shí)別裝置結(jié)構(gòu)框 圖。
[0030] 圖13為第十二實(shí)施例提供的基于光學(xué)字符識(shí)別的圖像中字符識(shí)別裝置結(jié)構(gòu)框 圖。
【具體實(shí)施方式】
[0031] 為更進(jìn)一步闡述本發(fā)明為實(shí)現(xiàn)預(yù)定發(fā)明目的所采取的技術(shù)手段及功效,以下結(jié)合 附圖及較佳實(shí)施例,對(duì)依據(jù)本發(fā)明的【具體實(shí)施方式】、結(jié)構(gòu)、特征及其功效,詳細(xì)說(shuō)明如后。
[0032] 本發(fā)明實(shí)施例涉及一種基于光學(xué)字符識(shí)別的圖像中字符識(shí)別方法及裝置,其可用 于一種電子裝置中。
[0033] 圖1為上述電子裝置的結(jié)構(gòu)框圖。如圖1所示,電子裝置100包括一個(gè)或多個(gè)(圖 中僅示出一個(gè))處理器102、存儲(chǔ)器104、RF (Radio Frequency,射頻)模塊106、網(wǎng)絡(luò)模塊 108、傳感器110、攝像模塊112、輸入模塊114、顯示模塊116、。本領(lǐng)域普通技術(shù)人員可以理 解,圖1所示的結(jié)構(gòu)僅為示意,其并不對(duì)電子裝置1〇〇的結(jié)構(gòu)造成限定。例如,電子裝置1〇〇 還可包括比圖1中所示更多或者更少的組件,或者具有與圖1所示不同的配置。上述的電 子裝置100的具體實(shí)例包括但并不限于手持式計(jì)算機(jī)、移動(dòng)電話、媒體播放器、車載設(shè)備、 個(gè)人數(shù)字助理及前述裝置的各種組合。
[0034] 本領(lǐng)域普通技術(shù)人員可以理解,相對(duì)于處理器102來(lái)說(shuō),所有其他的組件均屬于 外設(shè),處理器102與這些外設(shè)之間通過多個(gè)外設(shè)接口 124相耦合。外設(shè)接口 124可基于以下 標(biāo)準(zhǔn)實(shí)現(xiàn):通用異步接收 / 發(fā)送裝置(Universal Asynchronous Receiver/Transmitter, UART)、通用輸入 / 輸出(General Purpose Input Output, GPI0)、串行外設(shè)接口(Serial Peripheral Interface, SPI)、內(nèi)部集成電路(Inter-Integrated Circuit,I2C),但不并限 于上述標(biāo)準(zhǔn)。在一些實(shí)例中,外設(shè)接口 124可僅包括總線;在另一些實(shí)例中,外設(shè)接口 124 還可包括其他元件,如一個(gè)或者多個(gè)控制器,例如用于連接液晶顯示面板的顯示控制器或 者用于連接存儲(chǔ)器的存儲(chǔ)控制器122。此外,這此控制器還可以從外設(shè)接口 124中脫離出 來(lái),而集成于處理器102內(nèi)或者相應(yīng)的外設(shè)內(nèi)。
[0035] 存儲(chǔ)器104可用于存儲(chǔ)軟件程序以及模塊,如本發(fā)明實(shí)施例中的基于光學(xué)字符識(shí) 別的圖像中字符識(shí)別方法/裝置對(duì)應(yīng)的程序指令/模塊,處理器102通過運(yùn)行存儲(chǔ)在存儲(chǔ) 器104內(nèi)的軟件程序以及模塊,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理,即實(shí)現(xiàn)上述的基于 光學(xué)字符識(shí)別的圖像中字符識(shí)別方法。存儲(chǔ)器104可包括高速隨機(jī)存儲(chǔ)器,還可包括非易 失性存儲(chǔ)器,如一個(gè)或者多個(gè)磁性存儲(chǔ)裝置、閃存、或者其他非易失性固態(tài)存儲(chǔ)器。在一些 實(shí)例中,存儲(chǔ)器104可進(jìn)一步包括相對(duì)于處理器102遠(yuǎn)程設(shè)置的存儲(chǔ)器,這些遠(yuǎn)程存儲(chǔ)器可 以通過網(wǎng)絡(luò)連接至電子裝置100。上述網(wǎng)絡(luò)的實(shí)例包括但不限于互聯(lián)網(wǎng)、企業(yè)內(nèi)部網(wǎng)、局域 網(wǎng)、移動(dòng)通信網(wǎng)及其組合。
[0036] RF模塊106用于接收以及發(fā)送電磁波,實(shí)現(xiàn)電磁波與電信號(hào)的相互轉(zhuǎn)換,從而與 通訊網(wǎng)絡(luò)或者其他設(shè)備進(jìn)行通訊。RF模塊106可包括各種現(xiàn)有的用于執(zhí)行這些功能的電 路元件,例如,天線、射頻收發(fā)器、數(shù)字信號(hào)處理器、加密/解密芯片、用戶身份模塊(SM) 卡、存儲(chǔ)器等等。RF模塊106可與各種網(wǎng)絡(luò)如互聯(lián)網(wǎng)、企業(yè)內(nèi)部網(wǎng)、無(wú)線網(wǎng)絡(luò)進(jìn)行通訊或 者通過無(wú)線網(wǎng)絡(luò)與其他設(shè)備進(jìn)行通訊。上述的無(wú)線網(wǎng)絡(luò)可包括蜂窩式電話網(wǎng)、無(wú)線局域網(wǎng) 或者城域網(wǎng)。上述的無(wú)線網(wǎng)絡(luò)可以使用各種通信標(biāo)準(zhǔn)、協(xié)議及技術(shù),包括但并不限于全球 移動(dòng)通信系統(tǒng)(Global System for Mobile Communication, GSM)、增強(qiáng)型移動(dòng)通信技術(shù) (Enhanced Data GSM Environment, EDGE),寬帶碼分多址技術(shù)(wideband code division multiple access, W-CDMA),碼分多址技術(shù)(Code division access, CDMA)、時(shí)分多址技 術(shù)(time division multiple access, TDMA),無(wú)線保真技術(shù)(Wireless, Fidelity,WiFi) (如美國(guó)電氣和電子工程師協(xié)會(huì)標(biāo)準(zhǔn)IEEE802. 11a,IEEE 802. lib, IEEE802. llg和/或 IEEE 802. lln)、網(wǎng)絡(luò)電話(Voice over internet protocal, VoIP)、全球微波互聯(lián)接入 (Worldwide Interoperability for Microwave Access,Wi_Max)、其他用于郵件、即時(shí)通訊 及短消息的協(xié)議,以及任何其他合適的通訊協(xié)議,甚至可包括那些當(dāng)前仍未被開發(fā)出來(lái)的 協(xié)議。
[0037] 網(wǎng)絡(luò)模塊108用于接收以及發(fā)送網(wǎng)絡(luò)信號(hào)。上述網(wǎng)絡(luò)信號(hào)可包括無(wú)線信號(hào)或者有 線信號(hào)。在一個(gè)實(shí)例中,上述網(wǎng)絡(luò)信號(hào)為WiFi信號(hào),由于WiFi的工作頻率也處于射頻的頻 段內(nèi),此時(shí)網(wǎng)絡(luò)模塊可具有與RF模塊106類似的硬件結(jié)構(gòu),即可包括天線、射頻收發(fā)器、數(shù) 字信號(hào)處理器、加密/解密芯片等元件。在一個(gè)實(shí)例中,上述網(wǎng)絡(luò)信號(hào)為有線網(wǎng)絡(luò)信號(hào)。此 時(shí),網(wǎng)絡(luò)模塊108可包括處理器、隨機(jī)存儲(chǔ)器、轉(zhuǎn)換器、晶體振蕩器等元件。
[0038] 傳感器110的實(shí)例包括但并不限于:光傳感器、運(yùn)行傳感器、及其他傳感器。具體 地,光傳感器可包括環(huán)境光傳感器及接近傳感器,其中,環(huán)境光傳感器可以感測(cè)環(huán)境光的明 暗,進(jìn)而處理器102執(zhí)行的一些模塊可利用環(huán)境光傳感器的輸出來(lái)自動(dòng)調(diào)節(jié)顯示的輸出。 接近傳感器可在電子裝置100移動(dòng)到耳邊時(shí),關(guān)閉顯示輸出。作為運(yùn)動(dòng)傳感器的一種,重力 加速度傳感器可檢測(cè)各個(gè)方向上(一般為三軸)加速度的大小,靜止時(shí)可檢測(cè)出重力的大 小及方向,可用于識(shí)別手機(jī)姿態(tài)的應(yīng)用(比如橫堅(jiān)屏切換、相關(guān)游戲、磁力計(jì)姿態(tài)校準(zhǔn))、振 動(dòng)識(shí)別相關(guān)功能(比如計(jì)步器、敲擊)等;至于電子裝置100還可配置的陀螺儀、氣壓計(jì)、濕 度計(jì)、溫度計(jì)等其他傳感器,在此不再贅述。
[0039] 攝像模塊112用于拍攝照片或者視頻。拍攝的照片或者視頻可以存儲(chǔ)至存儲(chǔ)器 104內(nèi),并可通過RF模塊106發(fā)送。攝像模塊112具體可包括鏡頭模組、影像感測(cè)器以及閃 光燈等組件。鏡頭模組用于對(duì)被拍攝的目標(biāo)成像,并將所成的像映射至影像感測(cè)器中。影 像感測(cè)器用于接收來(lái)自鏡頭模組的光線,實(shí)現(xiàn)感光,以記錄圖像信息。具體地,影像感測(cè)器 可基于互補(bǔ)金屬氧化物半導(dǎo)體(Complementary Metal Oxide Semiconductor,CMOS)、電荷 奉禹合元件(Charge-coupled Device,CCD)或者其他影像感測(cè)原理實(shí)現(xiàn)。閃光燈用于在拍攝 時(shí)進(jìn)行曝光補(bǔ)償。一般來(lái)說(shuō),用于電子裝置100的閃光燈可為發(fā)光二極體(Light Emitting Diode, LED)閃光燈。
[0040] 輸入單元114可用于接收輸入的字符信息,以及產(chǎn)生與用戶設(shè)置以及功能控制有 關(guān)的鍵盤、鼠標(biāo)、操作桿、光學(xué)或者軌跡球信號(hào)輸入。具體地,輸入單元114可包括按鍵以及 觸控表面。按鍵例如可包括用于輸入字符的字符按鍵,以及用于觸發(fā)控制功能的控制按鍵。 控制按鍵的實(shí)例包括"返回主屏"按鍵、開機(jī)/關(guān)機(jī)按鍵、拍照鍵等等。觸控表面可收集用 戶在其上或附近的觸摸操作(比如用戶使用手指、觸筆等任何適合的物體或附件在觸控表 面上或在觸控表面附近的操作),并根據(jù)預(yù)先設(shè)定的程序驅(qū)動(dòng)相應(yīng)的連接裝置??蛇x的,觸 控表面可包括觸摸檢測(cè)裝置和觸摸控制器兩個(gè)部分。其中,觸摸檢測(cè)裝置檢測(cè)用戶的觸摸 方位,并檢測(cè)觸摸操作帶來(lái)的信號(hào),將信號(hào)傳送給觸摸控制器;觸摸控制器從觸摸檢測(cè)裝置 上接收觸摸信息,并將它轉(zhuǎn)換成觸點(diǎn)坐標(biāo),再送給處理器102,并能接收處理器102發(fā)來(lái)的 命令并加以執(zhí)行。此外,可以采用電阻式、電容式、紅外線以及表面聲波等多種類型實(shí)現(xiàn)觸 控表面。除了觸控表面,輸入單元114還可以包括其他輸入設(shè)備。上述的其他輸入設(shè)備包 括但不限于物理鍵盤、軌跡球、鼠標(biāo)、操作桿等中的一種或多種。
[0041] 顯示模塊116用于顯示由用戶輸入的信息、提供給用戶的信息以及電子裝置100 的各種圖形用戶接口,這些圖形用戶接口可以由圖形、文本、圖標(biāo)、視頻和其任意組合來(lái)構(gòu) 成。在一個(gè)實(shí)例中,顯示模塊116包括一個(gè)顯示面板。顯示面板例如可為一個(gè)液晶顯示面 板(Liquid Crystal Display,LCD)、有機(jī)發(fā)光二極管(Organic Light-Emitting Diode Display,0LED)顯不面板、電泳顯不面板(Electro-Phoretic Display, EPD)等。進(jìn)一步地, 觸控表面可設(shè)置于顯示面板上從而與顯示面板構(gòu)成一個(gè)整體。在另一些實(shí)施例中,顯示模 塊116還可包括其他類型的顯示裝置,例如包括一個(gè)投影顯示裝置。相比于一般的顯示面 板,投影顯示裝置還需要包括一些用于投影的部件例如透鏡組。
[0042] 第一實(shí)施例
[0043] 圖2為本實(shí)施例提供的一種基于光學(xué)字符識(shí)別的圖像中字符識(shí)別方法流程圖,如 圖2所示,本實(shí)施例的方法包括以下步驟:
[0044] 步驟S101、將所述圖像轉(zhuǎn)化為灰度圖像。
[0045] 所述圖像可以是任何帶有字符串的圖像。可以知道的是,圖像可以由多種采樣顏 色組成。多種顏色會(huì)影響光學(xué)字符識(shí)別對(duì)字符的識(shí)別。所述灰度圖像表示每個(gè)像素只有一 個(gè)采樣顏色的圖像,也就是黑白圖像。
[0046] 步驟S102、滑動(dòng)讀取圖像的窗口,截取預(yù)設(shè)范圍的所述灰度圖像直到所述圖像被 完全截取。
[0047] 本實(shí)施例中采用局部自適應(yīng)閾值二值化算法。所述局部自適應(yīng)閾值二值化每次二 值化僅截圖圖像的一部分。通過滑動(dòng)掃描圖像的窗口截取部分圖像。所述預(yù)設(shè)范圍為根據(jù) 當(dāng)前圖像的大小進(jìn)行設(shè)定的范圍。例如,用一個(gè)SW*SW的正方形滑動(dòng)窗口截取所述圖像。其 中SW的值根據(jù)當(dāng)前使用的掃描窗口而定。通過滑動(dòng)所述窗口截取圖像中像素點(diǎn),直至將所 述圖像中的像素點(diǎn)完全截取。
[0048] 步驟S103、根據(jù)預(yù)設(shè)的計(jì)算方法計(jì)算得到的第一閥值對(duì)當(dāng)前所述截取的預(yù)設(shè)范圍 的圖像進(jìn)行二值化直到所述灰度圖像被完全二值化。
[0049] 在一個(gè)實(shí)例中,所述預(yù)設(shè)的計(jì)算方法可以是以下算法:其中每次基于窗口中的像 素來(lái)計(jì)算所述第一閾值T,灰度值高于T的變?yōu)榘咨叶戎档陀赥的變?yōu)楹谏?。所述灰?值指黑白圖像中點(diǎn)的顏色深度,范圍一般從0到255,白色為255,黑色為0,故黑白圖片也稱 灰度圖像。局部閾值確定的具體算法是,滑動(dòng)窗口每次截取圖片中的SW*SW范圍內(nèi)的像素 點(diǎn),對(duì)這些像素點(diǎn)計(jì)算它們的平均值m以及標(biāo)準(zhǔn)差s,所述算法依據(jù)如下公式計(jì)算第一閾值 T :
[0050]
【權(quán)利要求】
1. 一種基于光學(xué)字符識(shí)別的圖像中字符識(shí)別方法,所述方法用于讀取圖像中的字符 串,其特征在于,所述方法包括以下步驟: 將所述圖像轉(zhuǎn)化為灰度圖像; 滑動(dòng)讀取圖像的窗口,截取預(yù)設(shè)范圍的所述灰度圖像直到所述圖像被完全截??; 根據(jù)第一閥值對(duì)當(dāng)前所述截取的預(yù)設(shè)范圍的圖像進(jìn)行二值化直到所述灰度圖像被完 全二值化; 將所述二值化的灰度圖像的灰度值離散分布變換到頻域,通過濾波對(duì)所述頻域中的點(diǎn) 值進(jìn)行調(diào)整; 將所述頻域中距離中心距離小于預(yù)設(shè)值的點(diǎn)值均置為零,得到處理圖像;以及 將所述處理圖像中的字符串進(jìn)行識(shí)別,生成目標(biāo)字符串。
2. 如權(quán)利要求1所述的基于光學(xué)字符識(shí)別的圖像中字符識(shí)別方法,其特征在于,所述 將所述二值化的灰度圖像的灰度值離散分布變換到頻域,通過濾波對(duì)所述頻域中的點(diǎn)值進(jìn) 行調(diào)整具體為: 通過離散傅里葉變換將所述二值化的灰度圖像的灰度值離散分布變換到頻域; 通過高斯濾波對(duì)所述頻域中的點(diǎn)值進(jìn)行調(diào)整。
3. 如權(quán)利要求1所述的基于光學(xué)字符識(shí)別的圖像中字符識(shí)別方法,其特征在于,在所 述根據(jù)光學(xué)字符識(shí)別進(jìn)行識(shí)別所述圖像中字符串之后還包括: 計(jì)算所述圖像中字符串頂部與圖像頂部的距離,若所述距離小于第二閥值則將所述字 符串刪除; 計(jì)算所述圖像中字符串底部與圖像底部的距離,若所述距離小于所述第二閥值則將所 述字符串刪除。
4. 如權(quán)利要求1所述的基于光學(xué)字符識(shí)別的圖像中字符識(shí)別方法,其特征在于, 若所述圖像包括至少兩張字符串圖像時(shí),將所述相鄰兩張圖像字符串段落進(jìn)行從上至 下遍歷進(jìn)行多行匹配; 計(jì)算單行匹配成功的行數(shù)占總行數(shù)的比例; 若所述比例超過第三閥值,則判斷此次多行匹配成功; 比較所有匹配成功的多行匹配的行數(shù),行數(shù)最多的所述多行匹配為最終匹配段,將所 述最終匹配段刪除; 將刪除最終匹配段之后的相鄰段字符串進(jìn)行拼接。
5. 如權(quán)利要求1所述的基于光學(xué)字符識(shí)別的圖像中字符識(shí)別方法,其特征在于,若所 述圖像中字符串為代碼,所述方法還包括,在所述光學(xué)字符識(shí)別的識(shí)別引擎庫(kù)中根據(jù)所述 代碼設(shè)置白名單。
6. 如權(quán)利要求1所述的基于光學(xué)字符識(shí)別的圖像中字符識(shí)別方法,其特征在于,在所 述根據(jù)光學(xué)字符識(shí)別進(jìn)行識(shí)別所述圖像中字符串之后還包括: 根據(jù)所述圖像中字符串的包圍盒的信息計(jì)算圖像中字符串的行高與字符串的寬度計(jì) 算得到所述圖像中字符串的之間的空白數(shù); 根據(jù)所述計(jì)算得到的字符之間的空白數(shù),調(diào)整所述目標(biāo)字符串的格式。
7. 如權(quán)利要求6所述的基于光學(xué)字符識(shí)別的圖像中字符識(shí)別方法,其特征在于,在所 述根據(jù)光學(xué)字符識(shí)別進(jìn)行識(shí)別所述圖像中字符串,生成目標(biāo)字符串之后還包括, 將所述格式調(diào)整之后的目標(biāo)字符串進(jìn)行1?殼。
8. 如權(quán)利要求1所述的基于光學(xué)字符識(shí)別的圖像中字符識(shí)別方法,其特征在于,當(dāng)所 述圖像中的字符串包括代碼與英文,在所述根據(jù)光學(xué)字符識(shí)別進(jìn)行識(shí)別所述圖像中字符串 之后還包括: 計(jì)算當(dāng)前行的字符串為代碼的概率; 若所述概率超過第四閥值,判斷為代碼,則對(duì)所述判斷為代碼的區(qū)域作標(biāo)記。
9. 一種基于光學(xué)字符識(shí)別的圖像中字符識(shí)別裝置,所述裝置用于讀取圖像中的字符 串,其特征在于,所述裝置包括以下模塊: 二值化模塊,用于將所述圖像轉(zhuǎn)化為灰度圖像,滑動(dòng)讀取圖像的窗口,截取預(yù)設(shè)范圍的 所述圖像直到所述圖像被完全截取,根據(jù)第一閥值將當(dāng)前所述截取的圖像進(jìn)行二值化; 濾波模塊,用于將所述二值化的灰度圖像的灰度值離散分布變換到頻域,通過濾波對(duì) 所述頻域中的點(diǎn)值進(jìn)行調(diào)整; 截?cái)嗄K,用于將所述頻域中距離中心距離小于預(yù)設(shè)值的點(diǎn)值均置為零,得到處理圖 像;以及 識(shí)別模塊,用于將所述處理圖像中的字符串進(jìn)行識(shí)別,生成目標(biāo)字符串。
10. 如權(quán)利要求9所述的基于光學(xué)字符識(shí)別的圖像中字符識(shí)別裝置,其特征在于,所述 濾波模塊,具體用于通過離散傅里葉變換將所述二值化的灰度圖像的灰度值離散分布變換 到頻域,通過高斯濾波對(duì)所述頻域中的點(diǎn)值進(jìn)行調(diào)整。
11. 如權(quán)利要求9所述的基于光學(xué)字符識(shí)別的圖像中字符識(shí)別裝置,其特征在于,在識(shí) 別模塊之后還包括: 去殘模塊,用于去除所述圖像中殘缺的字符串; 所述去殘模塊包括: 第一計(jì)算單元,用于計(jì)算所述圖像中字符串頂部與圖像頂部的距離; 刪除單元,用于若所述距離小于第二閥值則將所述字符串刪除; 所述第一計(jì)算單元還用于計(jì)算所述圖像中字符串底部與圖像底部的距離; 所述刪除單元還用于若所述距離小于所述第二閥值則將所述字符串刪除。
12. 如權(quán)利要求9所述的基于光學(xué)字符識(shí)別的圖像中字符識(shí)別裝置,其特征在于, 拼接模塊,用于若所述圖像包括至少兩段字符串時(shí),將所述圖像中的字符串進(jìn)行拼接 輸出; 所述拼接模塊包括: 匹配單元,用于若所述圖像包括至少兩張字符串圖像時(shí),將所述相鄰兩張圖像字符串 段落進(jìn)行從上至下遍歷進(jìn)行多行匹配; 第二計(jì)算單元,用于計(jì)算單行匹配成功的行數(shù)占總行數(shù)的比例; 判斷單元,用于根據(jù)第三閥值判斷此次多行匹配是否成功,若超過所述第三閥值則判 斷匹配成功,若未超過所述第三閥值則判斷失??; 刪除單元,用于比較所有匹配成功的多行匹配的行數(shù),行數(shù)最多的所述多行匹配為最 終匹配段,將所述最終匹配段刪除; 拼接單元,用于將刪除最終匹配段之后的相鄰段字符串進(jìn)行拼接。
13. 如權(quán)利要求9所述的基于光學(xué)字符識(shí)別的圖像中字符識(shí)別裝置,其特征在于,所述 圖像中的字符串為代碼,所裝置還包括, 設(shè)置模塊,用于在所述光學(xué)字符識(shí)別的識(shí)別引擎庫(kù)中根據(jù)所述代碼設(shè)置白名單。
14. 如權(quán)利要求9所述的基于光學(xué)字符識(shí)別的圖像中字符識(shí)別裝置,其特征在于,在所 述識(shí)別模塊之后還包括: 格式調(diào)整模塊,用于將識(shí)別模塊獲得的所述目標(biāo)字符串的格式進(jìn)行調(diào)整; 所述格式調(diào)整模塊包括: 第二計(jì)算單元,用于根據(jù)所述圖像中字符串的包圍盒的信息計(jì)算圖像中字符串的行高 與字符串的寬度并進(jìn)一步得到所述圖像中字符串的之間的空白數(shù); 調(diào)整單元,用于根據(jù)所述計(jì)算得到的字符之間的空白數(shù),調(diào)整所述目標(biāo)字符串的格式。
15. 如權(quán)利要求14所述的基于光學(xué)字符識(shí)別的圖像中字符識(shí)別裝置,其特征在于,在 所述格式調(diào)整模塊之后還包括, 1?殼|旲塊,用于將所述格式調(diào)整之后的目標(biāo)字符串進(jìn)行1?殼。
16. 如權(quán)利要求9所述的基于光學(xué)字符識(shí)別的圖像中字符識(shí)別裝置,其特征在于,當(dāng)所 述圖像中的字符串包括代碼與英文,在所述識(shí)別模塊之后還包括: 標(biāo)記模塊,用于標(biāo)記所述圖像生成的字符串中的代碼部分; 所述標(biāo)記模塊包括: 第三計(jì)算單元,用于計(jì)算當(dāng)前行的字符串為代碼的概率; 標(biāo)記單元,用于若所述概率超過第四閥值,判斷為代碼,則對(duì)所述判斷為代碼的區(qū)域作 記。
【文檔編號(hào)】G06K9/00GK104268512SQ201410475608
【公開日】2015年1月7日 申請(qǐng)日期:2014年9月17日 優(yōu)先權(quán)日:2014年9月17日
【發(fā)明者】李德斌, 王巨宏, 許勇, 全琦, 黃志斌, 楊大威, 譚志鵬, 吳現(xiàn), 楊言 申請(qǐng)人:清華大學(xué), 騰訊科技(深圳)有限公司