字體識別方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,具體而言涉及一種字體識別方法及裝置。
【背景技術(shù)】
[0002] 在世界范圍內(nèi),不同國家、不同地區(qū)的人使用不同種類的語言,相應(yīng)地,文字也各 不相同。即使是同一種文字,其字體也可能存在差異(如圖1所示)。對于文檔圖像處理而 言,文字字體的變化可能會對文字識別(OCR)的精度產(chǎn)生影響;對于藝術(shù)設(shè)計而言,不同的 字體可以表達(dá)不同的設(shè)計理念和視覺效果。然而,普通人的字體識別能力是非常有限的,因 為目前的常用文字(如中文、英文等)字體繁多,可能高達(dá)數(shù)千種,且某些字體類別之間的 差異微乎其微;即使是專業(yè)人士,也必須經(jīng)過長時間的訓(xùn)練且借助于工具才能具備超群的 字體識別能力。因此,基于圖像的自動化字體識別在文檔圖像處理和藝術(shù)設(shè)計等領(lǐng)域一直 是一項重要的技術(shù)。
[0003]目前,已經(jīng)存在一些可以直接通過文字圖像判斷字體的技術(shù)。然而,有的方法可 以區(qū)分中文和英文字符,但是無法識別具體的字體;有的方法可以支持手寫字體識別,但是 處理的類別非常有限;有的方法僅針對單個漢字,無法處理由多個字符組成的詞語或短語; 還有的方法采用圖像匹配的方式實(shí)現(xiàn)字體識別,但是只能識別最常見的幾種英文字體,不 是針對字體識別的通用解決方案??傊壳耙延械募夹g(shù)和系統(tǒng)在自動化字體識別的精度 和適應(yīng)性等方面仍存在不足之處。
【發(fā)明內(nèi)容】
[0004] 針對現(xiàn)有技術(shù)的不足,一方面,本發(fā)明提供一種字體識別方法,所述字體識別方法 包括:計算給定文字圖像的圖像特征;以及基于所計算的圖像特征利用訓(xùn)練好的分類模型 確定所述給定文字圖像中的文字的字體。
[0005] 在本發(fā)明的一個實(shí)施例中,所述分類模型的訓(xùn)練包括:構(gòu)建文字圖像數(shù)據(jù)庫,所 述文字圖像數(shù)據(jù)庫包括多個文字圖像以及每個文字圖像相應(yīng)的標(biāo)簽,所述標(biāo)簽指示相應(yīng) 的文字圖像中的文字的字體;計算所述文字圖像數(shù)據(jù)庫中的每個文字圖像的圖像特征;基 于所述標(biāo)簽和所計算的每個文字圖像的圖像特征構(gòu)建訓(xùn)練集;以及采用隨機(jī)森林(Random Forest)算法在所述訓(xùn)練集上訓(xùn)練出所述分類模型。
[0006] 在本發(fā)明的一個實(shí)施例中,在所述分類模型的訓(xùn)練中:所述計算文字圖像數(shù)據(jù)庫 中的每個文字圖像的圖像特征包括:將每個文字圖像的高度歸一化;在高度歸一化后的每 個文字圖像中采集第一預(yù)定數(shù)目的不同尺寸的圖像塊;以及計算每個圖像塊的圖像特征。 所述基于所述標(biāo)簽和所計算的每個文字圖像的圖像特征構(gòu)建訓(xùn)練集包括:基于每個圖像塊 的標(biāo)簽和所計算的每個圖像塊的圖像特征構(gòu)建訓(xùn)練集,其中,每個圖像塊的標(biāo)簽為其所源 自的文字圖像的標(biāo)簽。
[0007] 在本發(fā)明的一個實(shí)施例中,所述計算給定文字圖像的圖像特征包括:將給定文字 圖像的高度歸一化;在高度歸一化后的給定文字圖像中采集第二預(yù)定數(shù)目的不同尺寸的圖 像塊;以及計算每個圖像塊的圖像特征。
[0008] 示例性地,所述基于所計算的圖像特征利用訓(xùn)練好的分類模型確定所述給定文字 圖像中的文字的字體包括:將所計算的所述第二預(yù)定數(shù)目的圖像塊的圖像特征分別輸入到 所述分類模型以得到多個識別結(jié)果;以及對所述多個識別結(jié)果取平均值作為所述給定文字 圖像中的文字的字體的最終識別結(jié)果。
[0009] 示例性地,所述第二預(yù)定數(shù)目為100。
[0010] 示例性地,所述圖像塊的高度和寬度相等。
[0011] 示例性地,所述第一預(yù)定數(shù)目為50。
[0012] 在本發(fā)明的一個實(shí)施例中,計算圖像特征包括計算紋理特征和/或形狀特征。
[0013] 示例性地,計算紋理特征包括計算詞袋模型(Bag of Words)。
[0014] 示例性地,計算形狀特征包括計算形狀上下文(Shape Context)。
[0015] 另一方面,本發(fā)明還提供一種字體識別裝置,所述字體識別裝置包括:特征提取模 塊,用于計算給定文字圖像的圖像特征;以及圖像分類模塊,用于利用其包括的訓(xùn)練好的分 類模型、基于所計算的圖像特征確定所述給定文字圖像中的文字的字體。
[0016] 在本發(fā)明的一個實(shí)施例中,所述分類模型的訓(xùn)練包括:構(gòu)建文字圖像數(shù)據(jù)庫,所述 文字圖像數(shù)據(jù)庫包括多個文字圖像以及每個文字圖像相應(yīng)的標(biāo)簽,所述標(biāo)簽指示相應(yīng)的文 字圖像中的文字的字體;計算所述文字圖像數(shù)據(jù)庫中的每個文字圖像的圖像特征;基于所 述標(biāo)簽和所計算的每個文字圖像的圖像特征構(gòu)建訓(xùn)練集;以及采用隨機(jī)森林算法在所述訓(xùn) 練集上訓(xùn)練出所述分類模型。
[0017] 在本發(fā)明的一個實(shí)施例中,在所述分類模型的訓(xùn)練中:所述計算文字圖像數(shù)據(jù)庫 中的每個文字圖像的圖像特征包括:將每個文字圖像的高度歸一化;在高度歸一化后的每 個文字圖像中采集第一預(yù)定數(shù)目的不同尺寸的圖像塊;以及計算每個圖像塊的圖像特征。 所述基于所述標(biāo)簽和所計算的每個文字圖像的圖像特征構(gòu)建訓(xùn)練集包括:基于每個圖像塊 的標(biāo)簽和所計算的每個圖像塊的圖像特征構(gòu)建訓(xùn)練集,其中,每個圖像塊的標(biāo)簽為其所源 自的文字圖像的標(biāo)簽。
[0018] 在本發(fā)明的一個實(shí)施例中,所述特征提取模塊計算給定文字圖像的圖像特征的方 法包括:將給定文字圖像的高度歸一化;在高度歸一化后的給定文字圖像中采集第二預(yù)定 數(shù)目的不同尺寸的圖像塊;以及計算每個圖像塊的圖像特征。
[0019] 示例性地,所述圖像分類模塊利用其包括的訓(xùn)練好的分類模型、基于所計算的圖 像特征確定所述給定文字圖像中的文字的字體的方法包括:將所計算的所述第二預(yù)定數(shù)目 的圖像塊的圖像特征分別輸入到所述分類模型以得到多個識別結(jié)果;以及對所述多個識別 結(jié)果取平均值作為所述給定文字圖像中的文字的字體的最終識別結(jié)果。
[0020] 示例性地,所述第二預(yù)定數(shù)目為100。
[0021] 示例性地,所述圖像塊的高度和寬度相等。
[0022] 示例性地,所述第一預(yù)定數(shù)目為50。
[0023] 在本發(fā)明的一個實(shí)施例中,所述特征提取模塊計算圖像特征的方法包括計算紋理 特征和/或形狀特征。
[0024] 示例性地,所述特征提取模塊計算紋理特征的方法包括計算詞袋模型。
[0025] 示例性地,所述特征提取模塊計算形狀特征的方法包括計算形狀上下文。
[0026] 本發(fā)明提供的字體識別方法及裝置通過圖像特性自動判斷給定文字的字體,識別 精度高且速度快,此外還免去了人工辨識字體的過程,因此可以極大提高文檔處理、藝術(shù)設(shè) 計等過程的效率。
【附圖說明】
[0027] 本發(fā)明的下列附圖在此作為本發(fā)明的一部分用于理解本發(fā)明。附圖中示出了本發(fā) 明的實(shí)施例及其描述,用來解釋本發(fā)明的原理。
[0028] 附圖中:
[0029] 圖1示出了不同字體文字圖像的示例;
[0030] 圖2示出了根據(jù)本發(fā)明實(shí)施例的字體識別方法的流程圖;以及
[0031] 圖3示出了根據(jù)本發(fā)明實(shí)施例的字體識別裝置的結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0032] 在下文的描述中,給出了大量具體的細(xì)節(jié)以便提供對本發(fā)明更為徹底的理解。然 而,對于本領(lǐng)域技術(shù)人員而言顯而易見的是,本發(fā)明可以無需一個或多個這些細(xì)節(jié)而得以 實(shí)施。在其他的例子中,為了避免與本發(fā)明發(fā)生混淆,對于本領(lǐng)域公知的一些技術(shù)特征未進(jìn) 行描述。
[0033] 應(yīng)當(dāng)理解的是,本發(fā)明能夠以不同形式實(shí)施,而不應(yīng)當(dāng)解釋為局限于這里提出的 實(shí)施例。相反地,提供這些實(shí)施例將使公開徹底和完全,并且將本發(fā)明的范圍完全地傳遞給 本領(lǐng)域技術(shù)人員。
[0034] 在此使用的術(shù)語的目的僅在于描述具體實(shí)施例并且不作為本發(fā)明的限制。在此使 用時,單數(shù)形式的"一"、"一個"和"所述/該"也意圖包括復(fù)數(shù)形式,除非上下文清楚指出 另外的方式。還應(yīng)明白術(shù)語"組成"和/或"包括",當(dāng)在該說明書中使用時,確定所述特征、 整數(shù)、步驟、操作、元件和/或部件的存在,但不排除一個或更多其它的特征、整數(shù)、步驟、操 作、元件、部件和/或組的存在或添加。在此使用時,術(shù)語"和/或"包括相關(guān)所列項目的任 何及所有組合。
[0035] 為了徹底理解本發(fā)明,將在下列的描述中提出詳細(xì)的步驟以及詳細(xì)的結(jié)構(gòu),以便 闡釋本發(fā)明的技術(shù)方案。本發(fā)明的較佳實(shí)施例詳細(xì)描述如下,然而除了這些詳細(xì)描述外,本 發(fā)明還可以具有其他實(shí)施方式。
[0036] 本發(fā)明的一個實(shí)施例提供一種字體識別方法,用于通過圖像特性自