個(gè)初始位置中,選取與所述預(yù)設(shè)模板的匹配分值最大的初始位置,作為 優(yōu)選初始位置;
[0072] 將所述優(yōu)選初始位置與所述預(yù)設(shè)模板的匹配分值作為所述預(yù)設(shè)模板的指定匹配 分值,將所述指定匹配分值與所述預(yù)設(shè)模板的特征向量的維數(shù)之間的商作為所述預(yù)設(shè)模板 的優(yōu)選匹配分值;
[0073] 從所述多種預(yù)設(shè)模板中,選取優(yōu)選匹配分值最大的預(yù)設(shè)模板,作為優(yōu)選預(yù)設(shè)模 板;
[0074] 根據(jù)所述優(yōu)選預(yù)設(shè)模板的特征向量和所述優(yōu)選預(yù)設(shè)模板對(duì)應(yīng)的優(yōu)選初始位置,對(duì) 所述字符框集合進(jìn)行分割。
[0075] 本公開的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:
[0076] 本實(shí)施例提供的方法和裝置,通過在提取到原始圖像的字符框集合時(shí),并未直接 按照字符框集合中字符框的位置進(jìn)行分割,而是獲取多種預(yù)設(shè)模板的特征向量,根據(jù)該字 符框集合中每個(gè)字符框的位置,找出與每種預(yù)設(shè)模板最匹配的優(yōu)選初始位置及相應(yīng)的優(yōu)選 匹配分值,根據(jù)確定的多個(gè)優(yōu)選匹配分值,找出與該字符框集合最為匹配的優(yōu)選預(yù)設(shè)模板, 從而確定該字符框集合中字符框的分布方式,則根據(jù)該優(yōu)選預(yù)設(shè)模板對(duì)字符框集合進(jìn)行分 割時(shí),能夠提高字符分割的準(zhǔn)確率,對(duì)分割后的字符進(jìn)行字符識(shí)別時(shí),能夠提高識(shí)別準(zhǔn)確 率。
[0077] 應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性的,并不能限制本 公開。
【附圖說明】
[0078] 此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本公開的實(shí)施 例,并與說明書一起用于解釋本公開的原理。
[0079] 圖1是根據(jù)一示例性實(shí)施例示出的一種字符分割方法的流程圖;
[0080] 圖2是根據(jù)一示例性實(shí)施例示出的一種字符分割方法的流程圖;
[0081] 圖3A是根據(jù)一示例性實(shí)施例示出的第一直線和字符框集合的示意圖;
[0082] 圖3B是根據(jù)一示例性實(shí)施例示出的第二直線和字符框集合的示意圖;
[0083] 圖3C是根據(jù)一示例性實(shí)施例示出的一種字符區(qū)域的示意圖;
[0084] 圖3D是根據(jù)一示例性實(shí)施例示出的另一種字符區(qū)域的示意圖;
[0085] 圖3E是根據(jù)一示例性實(shí)施例示出的另一種字符區(qū)域的示意圖;
[0086] 圖3F是根據(jù)一示例性實(shí)施例示出的另一種字符區(qū)域的示意圖;
[0087] 圖3G是根據(jù)一示例性實(shí)施例示出的一種窗口示意圖;
[0088] 圖4是根據(jù)一示例性實(shí)施例示出的一種字符分割裝置的框圖;
[0089] 圖5是根據(jù)一示例性實(shí)施例示出的一種用于字符分割裝置的框圖。
【具體實(shí)施方式】
[0090] 為使本公開的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,下面結(jié)合實(shí)施方式和附圖,對(duì) 本公開做進(jìn)一步詳細(xì)說明。在此,本公開的示意性實(shí)施方式及其說明用于解釋本公開,但并 不作為對(duì)本公開的限定。
[0091] 本公開實(shí)施例提供一種字符分割方法和裝置,以下結(jié)合附圖對(duì)本公開進(jìn)行詳細(xì)說 明。
[0092] 圖1是根據(jù)一示例性實(shí)施例示出的一種字符分割方法的流程圖,如圖1所示,字符 分割方法用于處理裝置中,包括以下步驟:
[0093] 在步驟101中,提取原始圖像的字符區(qū)域,該字符區(qū)域內(nèi)包括字符框集合,該字符 框集合包括多個(gè)尺寸相同的字符框。
[0094] 在步驟102中,獲取多種預(yù)設(shè)模板的特征向量,每種預(yù)設(shè)模板的特征向量用于確 定對(duì)應(yīng)的字符分布方式。
[0095] 在步驟103中,對(duì)于每種預(yù)設(shè)模板,從該字符區(qū)域中,選取多個(gè)初始位置,對(duì)于選 取的每個(gè)初始位置,根據(jù)該字符框集合中每個(gè)字符框與該初始位置之間的距離和該預(yù)設(shè)模 板的特征向量,計(jì)算該初始位置與該預(yù)設(shè)模板的匹配分值,從該多個(gè)初始位置中,選取與該 預(yù)設(shè)模板的匹配分值最大的初始位置,作為優(yōu)選初始位置。
[0096] 其中,該匹配分值用于表示在該字符框集合中,在該初始位置之后的字符框的分 布方式與該預(yù)設(shè)模板之間的匹配程度。
[0097] 在步驟104中,將該優(yōu)選初始位置與該預(yù)設(shè)模板的匹配分值作為該預(yù)設(shè)模板的指 定匹配分值,將該指定匹配分值與該預(yù)設(shè)模板的特征向量的維數(shù)之間的商作為該預(yù)設(shè)模板 的優(yōu)選匹配分值。
[0098] 在步驟105中,從該多種預(yù)設(shè)模板中,選取優(yōu)選匹配分值最大的預(yù)設(shè)模板,作為優(yōu) 選預(yù)設(shè)模板。
[0099] 在步驟106中,根據(jù)該優(yōu)選預(yù)設(shè)模板的特征向量和該優(yōu)選預(yù)設(shè)模板對(duì)應(yīng)的優(yōu)選初 始位置,對(duì)該字符框集合進(jìn)行分割。
[0100] 本實(shí)施例提供的方法,通過在提取到原始圖像的字符框集合時(shí),并未直接按照字 符框集合中字符框的位置進(jìn)行分割,而是獲取多種預(yù)設(shè)模板的特征向量,根據(jù)該字符框集 合中每個(gè)字符框的位置,找出與每種預(yù)設(shè)模板最匹配的優(yōu)選初始位置及相應(yīng)的優(yōu)選匹配分 值,根據(jù)確定的多個(gè)優(yōu)選匹配分值,找出與該字符框集合最為匹配的優(yōu)選預(yù)設(shè)模板,從而根 據(jù)該優(yōu)選預(yù)設(shè)模板,確定該字符框集合中字符框的分布方式,根據(jù)該優(yōu)選預(yù)設(shè)模板對(duì)字符 框集合進(jìn)行分割時(shí),能夠提高字符分割的準(zhǔn)確率,對(duì)分割后的字符進(jìn)行字符識(shí)別時(shí),能夠提 高識(shí)別準(zhǔn)確率。
[0101] 在另一實(shí)施例中,該提取原始圖像的字符區(qū)域,包括:
[0102] 對(duì)該原始圖像進(jìn)行檢測(cè),得到第一字符框集合,該第一字符框集合中包括多個(gè)字 符框;
[0103] 根據(jù)該第一字符框集合中每個(gè)字符框的尺寸,對(duì)該第一字符框集合中的多個(gè)字符 框進(jìn)行過濾,得到第二字符框集合,使得該第二字符框集合中多個(gè)字符框的尺寸相同;
[0104] 根據(jù)該第二字符框集合中每個(gè)字符框的指定坐標(biāo)點(diǎn)的位置,進(jìn)行直線擬合,得到 第一直線,并將該第二字符框集合中,該指定坐標(biāo)點(diǎn)位于該第一直線上的字符框組成第三 字符框集合;
[0105] 對(duì)該原始圖像進(jìn)行旋轉(zhuǎn)變換,得到第一圖像,使得在該第一圖像中,由該第一直線 旋轉(zhuǎn)后形成的第二直線位于水平方向;
[0106] 根據(jù)該第二直線在該第一圖像中的位置以及由該第三字符框集合旋轉(zhuǎn)后形成的 第四字符框集合在該第一圖像中的位置,從該第一圖像中,提取該字符區(qū)域,使得該字符區(qū) 域包括該第四字符框集合。
[0107] 在另一實(shí)施例中,該從該字符區(qū)域中,選取多個(gè)初始位置,包括:
[0108] 以第一預(yù)設(shè)閾值為步長(zhǎng),從該字符區(qū)域中,選取多個(gè)第一局部初始位置,該第一預(yù) 設(shè)閾值小于該字符框集合中字符框的寬度;
[0109] 該從該多個(gè)初始位置中,選取與該預(yù)設(shè)模板的匹配分值最大的初始位置,作為優(yōu) 選初始位置,包括:
[0110] 從該多個(gè)第一局部初始位置中,選取與該預(yù)設(shè)模板的匹配分值最大的第一局部初 始位置,作為該優(yōu)選初始位置。
[0111] 在另一實(shí)施例中,該從該多個(gè)第一局部初始位置中,選取與該預(yù)設(shè)模板的匹配分 值最大的第一局部初始位置之后,該方法還包括:
[0112] 以該與該預(yù)設(shè)模板的匹配分值最大的第一局部初始位置為起點(diǎn)、以該字符框集合 中字符框的寬度為步長(zhǎng),從該字符區(qū)域中,選取多個(gè)全局初始位置;
[0113] 執(zhí)行計(jì)算每個(gè)全局初始位置與該預(yù)設(shè)模板的匹配分值的步驟;
[0114] 執(zhí)行從該多個(gè)全局初始位置中,選取與該預(yù)設(shè)模板的匹配分值最大的全局初始位 置,作為該優(yōu)選初始位置的步驟。
[0115] 在另一實(shí)施例中,該從該多個(gè)全局初始位置中,選取與該預(yù)設(shè)模板的匹配分值最 大的全局初始位置之后,該方法還包括:
[0116] 以該與該預(yù)設(shè)模板的匹配分值最大的全局初始位置為起點(diǎn)、以第二預(yù)設(shè)閾值為步 長(zhǎng),從該字符區(qū)域中,選取多個(gè)第二局部初始位置,該第二預(yù)設(shè)閾值小于該第一預(yù)設(shè)閾值;
[0117] 執(zhí)行計(jì)算每個(gè)第二局部初始位置與該預(yù)設(shè)模板的匹配分值的步驟;
[0118] 執(zhí)行從該多個(gè)第二局部初始位置中,選取與該預(yù)設(shè)模板的匹配分值最大的第二局 部初始位置,作為該優(yōu)選初始位置的步驟。
[0119] 在另一實(shí)施例中,該根據(jù)該字符框集合中每個(gè)字符框與該初始位置之間的距離和 該預(yù)設(shè)模板的特征向量,計(jì)算該初始位置與該預(yù)設(shè)模板的匹配分值,包括:
[0120] 以該初始位置為起點(diǎn),創(chuàng)建多個(gè)連續(xù)的窗口,每個(gè)窗口的寬度均與該字符框集合 中字符框的寬度相等,所創(chuàng)建窗口的數(shù)目與該預(yù)設(shè)模板的特征向量的維數(shù)相同;
[0121] 根據(jù)該字符框集合中每個(gè)字符框與該初始位置之間的距離以及每個(gè)窗口的位置, 確定每個(gè)字符框所在的窗口;
[0122] 將該多個(gè)窗口中每個(gè)窗口內(nèi)的字符框的個(gè)數(shù)組成字符分布向量;
[0123] 對(duì)該預(yù)設(shè)模板的特征向量與該字符分布向量進(jìn)行點(diǎn)乘運(yùn)算,得到該初始位置與該 預(yù)設(shè)模板的匹配分值。
[0124] 在另一實(shí)施例中,該根據(jù)該優(yōu)選預(yù)設(shè)模板的特征向量和該優(yōu)選預(yù)設(shè)模板對(duì)應(yīng)的優(yōu) 選初始位置,對(duì)該字符框集合進(jìn)行分割,包括:
[0125] 從以該優(yōu)選預(yù)設(shè)模板對(duì)應(yīng)的優(yōu)選初始位置為起點(diǎn)的多個(gè)窗口中,提取與該優(yōu)選預(yù) 設(shè)模板的特征向量中的指定元素對(duì)應(yīng)的窗口,該指定元素是指該特征向量中用于表示字符 的元素;
[0126] 按照提取出的窗口的位置,對(duì)該字符框集合進(jìn)行分割。
[0127] 上述所有可選技術(shù)方案,可以采用任意結(jié)合形成本公開的可選實(shí)施例,在此不再 --贅述。
[0128] 圖2是根據(jù)一示例性實(shí)施例示出的一種字符分割方法的流程圖,如圖2所示,字符 分割方法用于處理裝置中,包括以下步驟:
[0129] 在步驟201中,處理裝置提取原始圖像的字符區(qū)域,該字符區(qū)域內(nèi)包括字符框集 合,該字符框集合包括多個(gè)尺寸相同的字符框。
[0130] 其中,該原始圖像中包括字符串,該字符串中包括多個(gè)字符,這些字符可以包括數(shù) 字、漢字、英文單詞等,該原始圖像可以為銀行卡圖像、名片圖像等,該原始圖像中的字符可 以為銀行卡上的數(shù)字、名片上的數(shù)字或者名片上的字等,本實(shí)施例對(duì)此不做限定。該處理裝 置用于對(duì)原始圖像中的字符串進(jìn)行分割,分割出的字符可以進(jìn)行字符識(shí)別,該處理裝置可 以為計(jì)算機(jī)或者服務(wù)器等,本實(shí)施例對(duì)此也不做限定。
[0131] 由于該原始圖像中真實(shí)的字符會(huì)有一定角度的旋轉(zhuǎn),容易對(duì)后續(xù)的分割過程和識(shí) 別過程造成影響,因此,在本實(shí)施例中,為了便于分割,可以對(duì)字符框進(jìn)行檢測(cè),以消除字符 旋轉(zhuǎn)的影響。
[0132] 該處理裝置可以對(duì)該原始圖像進(jìn)行字符檢測(cè),提取該原始圖像中的字符區(qū)域,該 字符區(qū)域至少包括字符框集合,且該字符框集合包括多個(gè)尺寸相同的字符框,可以認(rèn)為在 每個(gè)字符框內(nèi)分布有一個(gè)字符,則該處理裝置可以根據(jù)該字符框集合中的字符框,對(duì)該原 始圖像上的字符串進(jìn)行分割。
[0133] 例如,該步驟201可以包括以下步驟(1)至(5):
[0134] (1)該處理裝置對(duì)該原始圖像進(jìn)行檢測(cè),得到第一字符框集合。
[0135] 該處理裝置可以采用預(yù)設(shè)特征提取算法,提取該原始圖像的特征,并將該原始圖 像的特征輸入預(yù)設(shè)分類器,根據(jù)該預(yù)設(shè)分類器,對(duì)該原始圖像的特征進(jìn)行分類,得到該原始 圖像中的字符框集合,作為第一字符框集合,該第一字符框集合中包括多個(gè)字符框。該處理 裝置根據(jù)該第一字符框集合,可以獲取到每個(gè)字符框的位置和尺寸。
[0136] 其中,該預(yù)設(shè)特征提取算法可以為H0G(Histogram of Oriented Gradient,方向 梯度直方圖)或者其他特征提取算法,該預(yù)設(shè)分類器可以為Adaboost (自適應(yīng)增強(qiáng))分類 器、SVM(Supp〇rt Vector Machine,支持向量機(jī))分類器或者其他分類器,該預(yù)設(shè)分類器可 以通過對(duì)多個(gè)樣本字符的特征進(jìn)行訓(xùn)練得到。另外,該處理裝置還可以采用基于模板進(jìn)行 字符檢測(cè)的方法,獲取該第一字符框集合。本實(shí)施例對(duì)此均不做限定。
[0137] (2)該處理裝置根據(jù)該第一字符框集合中每個(gè)字符框的尺寸,對(duì)該第一字符框集 合中的多個(gè)字符框進(jìn)行過濾,得到第二字符框集合,使得該第二字符框集合中多個(gè)字符框 的尺寸相同。
[0138] 對(duì)該原始圖像進(jìn)行檢測(cè)時(shí),可能會(huì)存在誤檢的情況,這會(huì)導(dǎo)致檢測(cè)得到的第一字 符框集合中,每個(gè)字符框的尺寸有大有小,則為了便于后續(xù)對(duì)該原始圖像的字符區(qū)域進(jìn)行 分割,該處理裝置可以對(duì)該第一字符框集合中的多個(gè)字符框進(jìn)行過濾,使得剩余的多個(gè)字 符框的尺寸相同。
[0139] 考慮到在該原始圖像中,尺寸相同的字符可以看作同一類字符,且每類字符中包 含的字符數(shù)目越多,表示這類字符在該原始圖像中展示的信息越多,這類字符越重要,則可 以認(rèn)為出現(xiàn)次數(shù)最多的尺寸所對(duì)應(yīng)的字符即為該原始圖像中需要識(shí)別的字符。為此,該處 理裝置可以確定每種尺寸在該第一字符框集合中出現(xiàn)的次數(shù),并確定出現(xiàn)次數(shù)最多的尺 寸,僅保留該出現(xiàn)次數(shù)最多的尺寸所對(duì)應(yīng)的字符框,而將其他尺寸的字符框過濾掉,即將出 現(xiàn)最多的尺寸所對(duì)應(yīng)的字符框組成