字符分割方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本公開(kāi)是關(guān)于字符識(shí)別領(lǐng)域,具體來(lái)說(shuō)是關(guān)于一種字符分割方法和裝置。
【背景技術(shù)】
[0002] 人們?cè)谌粘I钪幸幚泶罅康淖址?,如紙上的文字、?chē)牌上的號(hào)碼等,為了提高 字符的處理效率,可以獲取目標(biāo)物的圖像,對(duì)該圖像中目標(biāo)物上的字符串進(jìn)行分割,并采用 字符識(shí)別技術(shù),將分割得到的每個(gè)字符翻譯成計(jì)算機(jī)能夠識(shí)別的文字,由計(jì)算機(jī)對(duì)翻譯成 的文字進(jìn)行處理。
[0003] 在分割過(guò)程中,可以先獲取包含字符串的原始圖像,對(duì)該原始圖像進(jìn)行二值化處 理,得到二值化圖像,將二值化圖像中各個(gè)像素的灰度值按照垂直方向進(jìn)行累加,得到投影 圖。由于該二值化圖像中,任兩個(gè)相鄰字符之間的像素的灰度值通常為0,而字符上像素的 灰度值通常為1,則投影圖會(huì)在任兩個(gè)相鄰字符之間的位置形成波谷,在任一字符上的位置 形成波峰,那么,根據(jù)該投影圖上波谷的位置進(jìn)行分割,即可將該字符串中的多個(gè)字符分割 開(kāi)。
【發(fā)明內(nèi)容】
[0004] 為了解決相關(guān)技術(shù)中存在的問(wèn)題,本公開(kāi)提供了一種字符分割方法和裝置。所述 技術(shù)方案如下:
[0005] 根據(jù)本公開(kāi)實(shí)施例的第一方面,提供了一種字符分割方法,所述方法包括:
[0006] 提取原始圖像的字符區(qū)域,所述字符區(qū)域內(nèi)包括字符框集合,所述字符框集合包 括多個(gè)尺寸相同的字符框;
[0007] 獲取多種預(yù)設(shè)模板的特征向量,每種預(yù)設(shè)模板的特征向量用于確定對(duì)應(yīng)的字符分 布方式;
[0008] 對(duì)于每種預(yù)設(shè)模板,
[0009] 從所述字符區(qū)域中,選取多個(gè)初始位置;
[0010] 對(duì)于選取的每個(gè)初始位置,根據(jù)所述字符框集合中每個(gè)字符框與所述初始位置之 間的距離和所述預(yù)設(shè)模板的特征向量,計(jì)算所述初始位置與所述預(yù)設(shè)模板的匹配分值,所 述匹配分值用于表示在所述字符框集合中,在所述初始位置之后的字符框的分布方式與所 述預(yù)設(shè)模板之間的匹配程度;
[0011] 從所述多個(gè)初始位置中,選取與所述預(yù)設(shè)模板的匹配分值最大的初始位置,作為 優(yōu)選初始位置;
[0012] 將所述優(yōu)選初始位置與所述預(yù)設(shè)模板的匹配分值作為所述預(yù)設(shè)模板的指定匹配 分值,將所述指定匹配分值與所述預(yù)設(shè)模板的特征向量的維數(shù)之間的商作為所述預(yù)設(shè)模板 的優(yōu)選匹配分值;
[0013] 從所述多種預(yù)設(shè)模板中,選取優(yōu)選匹配分值最大的預(yù)設(shè)模板,作為優(yōu)選預(yù)設(shè)模 板;
[0014] 根據(jù)所述優(yōu)選預(yù)設(shè)模板的特征向量和所述優(yōu)選預(yù)設(shè)模板對(duì)應(yīng)的優(yōu)選初始位置,對(duì) 所述字符框集合進(jìn)行分割。
[0015] 在另一實(shí)施例中,所述提取原始圖像的字符區(qū)域,包括:
[0016] 對(duì)所述原始圖像進(jìn)行檢測(cè),得到第一字符框集合,所述第一字符框集合中包括多 個(gè)字符框;
[0017] 根據(jù)所述第一字符框集合中每個(gè)字符框的尺寸,對(duì)所述第一字符框集合中的多個(gè) 字符框進(jìn)行過(guò)濾,得到第二字符框集合,使得所述第二字符框集合中多個(gè)字符框的尺寸相 同;
[0018] 根據(jù)所述第二字符框集合中每個(gè)字符框的指定坐標(biāo)點(diǎn)的位置,進(jìn)行直線(xiàn)擬合,得 到第一直線(xiàn),并將所述第二字符框集合中,所述指定坐標(biāo)點(diǎn)位于所述第一直線(xiàn)上的字符框 組成第三字符框集合;
[0019] 對(duì)所述原始圖像進(jìn)行旋轉(zhuǎn)變換,得到第一圖像,使得在所述第一圖像中,由所述第 一直線(xiàn)旋轉(zhuǎn)后形成的第二直線(xiàn)位于水平方向;
[0020] 根據(jù)所述第二直線(xiàn)在所述第一圖像中的位置以及由所述第三字符框集合旋轉(zhuǎn)后 形成的第四字符框集合在所述第一圖像中的位置,從所述第一圖像中,提取所述字符區(qū)域, 使得所述字符區(qū)域包括所述第四字符框集合。
[0021] 在另一實(shí)施例中,所述從所述字符區(qū)域中,選取多個(gè)初始位置,包括:
[0022] 以第一預(yù)設(shè)閾值為步長(zhǎng),從所述字符區(qū)域中,選取多個(gè)第一局部初始位置,所述第 一預(yù)設(shè)閾值小于所述字符框集合中字符框的寬度;
[0023] 所述從所述多個(gè)初始位置中,選取與所述預(yù)設(shè)模板的匹配分值最大的初始位置, 作為優(yōu)選初始位置,包括:
[0024] 從所述多個(gè)第一局部初始位置中,選取與所述預(yù)設(shè)模板的匹配分值最大的第一局 部初始位置,作為所述優(yōu)選初始位置。
[0025] 在另一實(shí)施例中,所述從所述多個(gè)第一局部初始位置中,選取與所述預(yù)設(shè)模板的 匹配分值最大的第一局部初始位置之后,所述方法還包括:
[0026] 以所述與所述預(yù)設(shè)模板的匹配分值最大的第一局部初始位置為起點(diǎn)、以所述字符 框集合中字符框的寬度為步長(zhǎng),從所述字符區(qū)域中,選取多個(gè)全局初始位置;
[0027] 執(zhí)行計(jì)算每個(gè)全局初始位置與所述預(yù)設(shè)模板的匹配分值的步驟;
[0028] 執(zhí)行從所述多個(gè)全局初始位置中,選取與所述預(yù)設(shè)模板的匹配分值最大的全局初 始位置,作為所述優(yōu)選初始位置的步驟。
[0029] 在另一實(shí)施例中,所述從所述多個(gè)全局初始位置中,選取與所述預(yù)設(shè)模板的匹配 分值最大的全局初始位置之后,所述方法還包括:
[0030] 以所述與所述預(yù)設(shè)模板的匹配分值最大的全局初始位置為起點(diǎn)、以第二預(yù)設(shè)閾值 為步長(zhǎng),從所述字符區(qū)域中,選取多個(gè)第二局部初始位置,所述第二預(yù)設(shè)閾值小于所述第一 預(yù)設(shè)閾值;
[0031] 執(zhí)行計(jì)算每個(gè)第二局部初始位置與所述預(yù)設(shè)模板的匹配分值的步驟;
[0032] 執(zhí)行從所述多個(gè)第二局部初始位置中,選取與所述預(yù)設(shè)模板的匹配分值最大的第 二局部初始位置,作為所述優(yōu)選初始位置的步驟。
[0033] 在另一實(shí)施例中,所述根據(jù)所述字符框集合中每個(gè)字符框與所述初始位置之間的 距離和所述預(yù)設(shè)模板的特征向量,計(jì)算所述初始位置與所述預(yù)設(shè)模板的匹配分值,包括:
[0034] 以所述初始位置為起點(diǎn),創(chuàng)建多個(gè)連續(xù)的窗口,每個(gè)窗口的寬度均與所述字符框 集合中字符框的寬度相等,所創(chuàng)建窗口的數(shù)目與所述預(yù)設(shè)模板的特征向量的維數(shù)相同;
[0035] 根據(jù)所述字符框集合中每個(gè)字符框與所述初始位置之間的距離以及每個(gè)窗口的 位置,確定每個(gè)字符框所在的窗口;
[0036] 將所述多個(gè)窗口中每個(gè)窗口內(nèi)的字符框的個(gè)數(shù)組成字符分布向量;
[0037] 對(duì)所述預(yù)設(shè)模板的特征向量與所述字符分布向量進(jìn)行點(diǎn)乘運(yùn)算,得到所述初始位 置與所述預(yù)設(shè)模板的匹配分值。
[0038] 在另一實(shí)施例中,所述根據(jù)所述優(yōu)選預(yù)設(shè)模板的特征向量和所述優(yōu)選預(yù)設(shè)模板對(duì) 應(yīng)的優(yōu)選初始位置,對(duì)所述字符框集合進(jìn)行分割,包括:
[0039] 從以所述優(yōu)選預(yù)設(shè)模板對(duì)應(yīng)的優(yōu)選初始位置為起點(diǎn)的多個(gè)窗口中,提取與所述優(yōu) 選預(yù)設(shè)模板的特征向量中的指定元素對(duì)應(yīng)的窗口,所述指定元素是指所述特征向量中用于 表示字符的元素;
[0040] 按照提取出的窗口的位置,對(duì)所述字符框集合進(jìn)行分割。
[0041] 根據(jù)本公開(kāi)實(shí)施例的第二方面,提供了一種字符分割裝置,所述裝置包括:
[0042] 提取模塊,用于提取原始圖像的字符區(qū)域,所述字符區(qū)域內(nèi)包括字符框集合,所述 字符框集合包括多個(gè)尺寸相同的字符框;
[0043] 獲取模塊,用于獲取多種預(yù)設(shè)模板的特征向量,每種預(yù)設(shè)模板的特征向量用于確 定對(duì)應(yīng)的字符分布方式;
[0044] 初始選取模塊,用于對(duì)于每種預(yù)設(shè)模板,從所述字符區(qū)域中,選取多個(gè)初始位置;
[0045] 計(jì)算模塊,用于對(duì)于選取的每個(gè)初始位置,根據(jù)所述字符框集合中每個(gè)字符框與 所述初始位置之間的距離和所述預(yù)設(shè)模板的特征向量,計(jì)算所述初始位置與所述預(yù)設(shè)模板 的匹配分值,所述匹配分值用于表示在所述字符框集合中,在所述初始位置之后的字符框 的分布方式與所述預(yù)設(shè)模板之間的匹配程度;
[0046] 匹配選取模塊,用于從所述多個(gè)初始位置中,選取與所述預(yù)設(shè)模板的匹配分值最 大的初始位置,作為優(yōu)選初始位置;
[0047] 確定模塊,用于將所述優(yōu)選初始位置與所述預(yù)設(shè)模板的匹配分值作為所述預(yù)設(shè)模 板的指定匹配分值,將所述指定匹配分值與所述預(yù)設(shè)模板的特征向量的維數(shù)之間的商作為 所述預(yù)設(shè)模板的優(yōu)選匹配分值;
[0048] 模板選取模塊,用于從所述多種預(yù)設(shè)模板中,選取優(yōu)選匹配分值最大的預(yù)設(shè)模板, 作為優(yōu)選預(yù)設(shè)模板;
[0049] 分割模塊,用于根據(jù)所述優(yōu)選預(yù)設(shè)模板的特征向量和所述優(yōu)選預(yù)設(shè)模板對(duì)應(yīng)的優(yōu) 選初始位置,對(duì)所述字符框集合進(jìn)行分割。
[0050] 在另一實(shí)施例中,所述提取模塊用于對(duì)所述原始圖像進(jìn)行檢測(cè),得到第一字符框 集合,所述第一字符框集合中包括多個(gè)字符框;根據(jù)所述第一字符框集合中每個(gè)字符框的 尺寸,對(duì)所述第一字符框集合中的多個(gè)字符框進(jìn)行過(guò)濾,得到第二字符框集合,使得所述第 二字符框集合中多個(gè)字符框的尺寸相同;根據(jù)所述第二字符框集合中每個(gè)字符框的指定坐 標(biāo)點(diǎn)的位置,進(jìn)行直線(xiàn)擬合,得到第一直線(xiàn),并將所述第二字符框集合中,所述指定坐標(biāo)點(diǎn) 位于所述第一直線(xiàn)上的字符框組成第三字符框集合;對(duì)所述原始圖像進(jìn)行旋轉(zhuǎn)變換,得到 第一圖像,使得在所述第一圖像中,由所述第一直線(xiàn)旋轉(zhuǎn)后形成的第二直線(xiàn)位于水平方向; 根據(jù)所述第二直線(xiàn)在所述第一圖像中的位置以及由所述第三字符框集合旋轉(zhuǎn)后形成的第 四字符框集合在所述第一圖像中的位置,從所述第一圖像中,提取所述字符區(qū)域,使得所述 字符區(qū)域包括所述第四字符框集合。
[0051] 在另一實(shí)施例中,所述初始選取模塊還用于以第一預(yù)設(shè)閾值為步長(zhǎng),從所述字符 區(qū)域中,選取多個(gè)第一局部初始位置,所述第一預(yù)設(shè)閾值小于所述字符框集合中字符框的 寬度;
[0052] 所述計(jì)算模塊還用于計(jì)算每個(gè)第一局部初始位置與所述預(yù)設(shè)模板的匹配分值;
[0053] 所述匹配選取模塊還用于從所述多個(gè)第一局部初始位置中,選取與所述預(yù)設(shè)模板 的匹配分值最大的第一局部初始位置,作為所述優(yōu)選初始位置。
[0054] 在另一實(shí)施例中,所述初始選取模塊還用于以所述與所述預(yù)設(shè)模板的匹配分值最 大的第一局部初始位置為起點(diǎn)、以所述字符框集合中字符框的寬度為步長(zhǎng),從所述字符區(qū) 域中,選取多個(gè)全局初始位置;
[0055] 所述計(jì)算模塊還用于計(jì)算每個(gè)全局初始位置與所述預(yù)設(shè)模板的匹配分值;
[0056] 所述匹配選取模塊還用于從所述多個(gè)全局初始位置中,選取與所述預(yù)設(shè)模板的匹 配分值最大的全局初始位置,作為所述優(yōu)選初始位置。
[0057] 在另一實(shí)施例中,所述初始選取模塊還用于以所述與所述預(yù)設(shè)模板的匹配分值最 大的全局初始位置為起點(diǎn)、以第二預(yù)設(shè)閾值為步長(zhǎng),從所述字符區(qū)域中,選取多個(gè)第二局部 初始位置,所述第二預(yù)設(shè)閾值小于所述第一預(yù)設(shè)閾值;
[0058] 所述計(jì)算模塊還用于計(jì)算每個(gè)第二局部初始位置與所述預(yù)設(shè)模板的匹配分值;
[0059] 所述匹配選取模塊還用于從所述多個(gè)第二局部初始位置中,選取與所述預(yù)設(shè)模板 的匹配分值最大的第二局部初始位置,作為所述優(yōu)選初始位置。
[0060] 在另一實(shí)施例中,所述計(jì)算模塊用于以所述初始位置為起點(diǎn),創(chuàng)建多個(gè)連續(xù)的窗 口,每個(gè)窗口的寬度均與所述字符框集合中字符框的寬度相等,所創(chuàng)建窗口的數(shù)目與所述 預(yù)設(shè)模板的特征向量的維數(shù)相同;根據(jù)所述字符框集合中每個(gè)字符框與所述初始位置之間 的距離以及每個(gè)窗口的位置,確定每個(gè)字符框所在的窗口;將所述多個(gè)窗口中每個(gè)窗口內(nèi) 的字符框的個(gè)數(shù)組成字符分布向量;對(duì)所述預(yù)設(shè)模板的特征向量與所述字符分布向量進(jìn)行 點(diǎn)乘運(yùn)算,得到所述初始位置與所述預(yù)設(shè)模板的匹配分值。
[0061] 在另一實(shí)施例中,所述分割模塊還用于從以所述優(yōu)選預(yù)設(shè)模板對(duì)應(yīng)的優(yōu)選初始位 置為起點(diǎn)的多個(gè)窗口中,提取與所述優(yōu)選預(yù)設(shè)模板的特征向量中的指定元素對(duì)應(yīng)的窗口, 所述指定元素是指所述特征向量中用于表示字符的元素;按照提取出的窗口的位置,對(duì)所 述字符框集合進(jìn)行分割。
[0062] 根據(jù)本公開(kāi)實(shí)施例的第三方面,提供了一種字符分割裝裝置,所述裝置包括: [0063] 處理器;
[0064] 用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器;
[0065] 其中,所述處理器被配置為:
[0066] 提取原始圖像的字符區(qū)域,所述字符區(qū)域內(nèi)包括字符框集合,所述字符框集合包 括多個(gè)尺寸相同的字符框;
[0067] 獲取多種預(yù)設(shè)模板的特征向量,每種預(yù)設(shè)模板的特征向量用于確定對(duì)應(yīng)的字符分 布方式;
[0068] 對(duì)于每種預(yù)設(shè)模板,
[0069] 從所述字符區(qū)域中,選取多個(gè)初始位置;
[0070] 對(duì)于選取的每個(gè)初始位置,根據(jù)所述字符框集合中每個(gè)字符框與所述初始位置之 間的距離和所述預(yù)設(shè)模板的特征向量,計(jì)算所述初始位置與所述預(yù)設(shè)模板的匹配分值,所 述匹配分值用于表示在所述字符框集合中,在所述初始位置之后的字符框的分布方式與所 述預(yù)設(shè)模板之間的匹配程度;
[0071] 從所述多