字體識別方法及裝置的制造方法

文檔序號：9397205閱讀：522來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

字體識別方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及圖像處理技術(shù)領(lǐng)域，具體而言涉及一種字體識別方法及裝置。
【背景技術(shù)】
[0002] 在世界范圍內(nèi)，不同國家、不同地區(qū)的人使用不同種類的語言，相應(yīng)地，文字也各不相同。即使是同一種文字，其字體也可能存在差異（如圖1所示）。對于文檔圖像處理而言，文字字體的變化可能會對文字識別（OCR)的精度產(chǎn)生影響；對于藝術(shù)設(shè)計而言，不同的字體可以表達(dá)不同的設(shè)計理念和視覺效果。然而，普通人的字體識別能力是非常有限的，因為目前的常用文字（如中文、英文等）字體繁多，可能高達(dá)數(shù)千種，且某些字體類別之間的差異微乎其微；即使是專業(yè)人士，也必須經(jīng)過長時間的訓(xùn)練且借助于工具才能具備超群的字體識別能力。因此，基于圖像的自動化字體識別在文檔圖像處理和藝術(shù)設(shè)計等領(lǐng)域一直是一項重要的技術(shù)。
[0003]目前，已經(jīng)存在一些可以直接通過文字圖像判斷字體的技術(shù)。然而，有的方法可以區(qū)分中文和英文字符，但是無法識別具體的字體；有的方法可以支持手寫字體識別，但是處理的類別非常有限；有的方法僅針對單個漢字，無法處理由多個字符組成的詞語或短語；還有的方法采用圖像匹配的方式實(shí)現(xiàn)字體識別，但是只能識別最常見的幾種英文字體，不是針對字體識別的通用解決方案?？傊壳耙延械募夹g(shù)和系統(tǒng)在自動化字體識別的精度和適應(yīng)性等方面仍存在不足之處。

【發(fā)明內(nèi)容】

[0004] 針對現(xiàn)有技術(shù)的不足，一方面，本發(fā)明提供一種字體識別方法，所述字體識別方法包括：計算給定文字圖像的圖像特征；以及基于所計算的圖像特征利用訓(xùn)練好的分類模型確定所述給定文字圖像中的文字的字體。
[0005] 在本發(fā)明的一個實(shí)施例中，所述分類模型的訓(xùn)練包括：構(gòu)建文字圖像數(shù)據(jù)庫，所述文字圖像數(shù)據(jù)庫包括多個文字圖像以及每個文字圖像相應(yīng)的標(biāo)簽，所述標(biāo)簽指示相應(yīng) 的文字圖像中的文字的字體；計算所述文字圖像數(shù)據(jù)庫中的每個文字圖像的圖像特征；基于所述標(biāo)簽和所計算的每個文字圖像的圖像特征構(gòu)建訓(xùn)練集；以及采用隨機(jī)森林（Random Forest)算法在所述訓(xùn)練集上訓(xùn)練出所述分類模型。
[0006] 在本發(fā)明的一個實(shí)施例中，在所述分類模型的訓(xùn)練中：所述計算文字圖像數(shù)據(jù)庫中的每個文字圖像的圖像特征包括：將每個文字圖像的高度歸一化；在高度歸一化后的每個文字圖像中采集第一預(yù)定數(shù)目的不同尺寸的圖像塊；以及計算每個圖像塊的圖像特征。所述基于所述標(biāo)簽和所計算的每個文字圖像的圖像特征構(gòu)建訓(xùn)練集包括：基于每個圖像塊的標(biāo)簽和所計算的每個圖像塊的圖像特征構(gòu)建訓(xùn)練集，其中，每個圖像塊的標(biāo)簽為其所源自的文字圖像的標(biāo)簽。
[0007] 在本發(fā)明的一個實(shí)施例中，所述計算給定文字圖像的圖像特征包括：將給定文字圖像的高度歸一化；在高度歸一化后的給定文字圖像中采集第二預(yù)定數(shù)目的不同尺寸的圖像塊；以及計算每個圖像塊的圖像特征。
[0008] 示例性地，所述基于所計算的圖像特征利用訓(xùn)練好的分類模型確定所述給定文字圖像中的文字的字體包括：將所計算的所述第二預(yù)定數(shù)目的圖像塊的圖像特征分別輸入到所述分類模型以得到多個識別結(jié)果；以及對所述多個識別結(jié)果取平均值作為所述給定文字圖像中的文字的字體的最終識別結(jié)果。
[0009] 示例性地，所述第二預(yù)定數(shù)目為100。
[0010] 示例性地，所述圖像塊的高度和寬度相等。
[0011] 示例性地，所述第一預(yù)定數(shù)目為50。
[0012] 在本發(fā)明的一個實(shí)施例中，計算圖像特征包括計算紋理特征和/或形狀特征。
[0013] 示例性地，計算紋理特征包括計算詞袋模型（Bag of Words)。
[0014] 示例性地，計算形狀特征包括計算形狀上下文（Shape Context)。
[0015] 另一方面，本發(fā)明還提供一種字體識別裝置，所述字體識別裝置包括：特征提取模塊，用于計算給定文字圖像的圖像特征；以及圖像分類模塊，用于利用其包括的訓(xùn)練好的分類模型、基于所計算的圖像特征確定所述給定文字圖像中的文字的字體。
[0016] 在本發(fā)明的一個實(shí)施例中，所述分類模型的訓(xùn)練包括：構(gòu)建文字圖像數(shù)據(jù)庫，所述文字圖像數(shù)據(jù)庫包括多個文字圖像以及每個文字圖像相應(yīng)的標(biāo)簽，所述標(biāo)簽指示相應(yīng)的文字圖像中的文字的字體；計算所述文字圖像數(shù)據(jù)庫中的每個文字圖像的圖像特征；基于所述標(biāo)簽和所計算的每個文字圖像的圖像特征構(gòu)建訓(xùn)練集；以及采用隨機(jī)森林算法在所述訓(xùn) 練集上訓(xùn)練出所述分類模型。
[0017] 在本發(fā)明的一個實(shí)施例中，在所述分類模型的訓(xùn)練中：所述計算文字圖像數(shù)據(jù)庫中的每個文字圖像的圖像特征包括：將每個文字圖像的高度歸一化；在高度歸一化后的每個文字圖像中采集第一預(yù)定數(shù)目的不同尺寸的圖像塊；以及計算每個圖像塊的圖像特征。所述基于所述標(biāo)簽和所計算的每個文字圖像的圖像特征構(gòu)建訓(xùn)練集包括：基于每個圖像塊的標(biāo)簽和所計算的每個圖像塊的圖像特征構(gòu)建訓(xùn)練集，其中，每個圖像塊的標(biāo)簽為其所源自的文字圖像的標(biāo)簽。
[0018] 在本發(fā)明的一個實(shí)施例中，所述特征提取模塊計算給定文字圖像的圖像特征的方法包括：將給定文字圖像的高度歸一化；在高度歸一化后的給定文字圖像中采集第二預(yù)定數(shù)目的不同尺寸的圖像塊；以及計算每個圖像塊的圖像特征。
[0019] 示例性地，所述圖像分類模塊利用其包括的訓(xùn)練好的分類模型、基于所計算的圖像特征確定所述給定文字圖像中的文字的字體的方法包括：將所計算的所述第二預(yù)定數(shù)目的圖像塊的圖像特征分別輸入到所述分類模型以得到多個識別結(jié)果；以及對所述多個識別結(jié)果取平均值作為所述給定文字圖像中的文字的字體的最終識別結(jié)果。
[0020] 示例性地，所述第二預(yù)定數(shù)目為100。
[0021] 示例性地，所述圖像塊的高度和寬度相等。
[0022] 示例性地，所述第一預(yù)定數(shù)目為50。
[0023] 在本發(fā)明的一個實(shí)施例中，所述特征提取模塊計算圖像特征的方法包括計算紋理特征和/或形狀特征。
[0024] 示例性地，所述特征提取模塊計算紋理特征的方法包括計算詞袋模型。
[0025] 示例性地，所述特征提取模塊計算形狀特征的方法包括計算形狀上下文。
[0026] 本發(fā)明提供的字體識別方法及裝置通過圖像特性自動判斷給定文字的字體，識別精度高且速度快，此外還免去了人工辨識字體的過程，因此可以極大提高文檔處理、藝術(shù)設(shè) 計等過程的效率。
【附圖說明】
[0027] 本發(fā)明的下列附圖在此作為本發(fā)明的一部分用于理解本發(fā)明。附圖中示出了本發(fā) 明的實(shí)施例及其描述，用來解釋本發(fā)明的原理。
[0028] 附圖中：
[0029] 圖1示出了不同字體文字圖像的示例；
[0030] 圖2示出了根據(jù)本發(fā)明實(shí)施例的字體識別方法的流程圖；以及
[0031] 圖3示出了根據(jù)本發(fā)明實(shí)施例的字體識別裝置的結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0032] 在下文的描述中，給出了大量具體的細(xì)節(jié)以便提供對本發(fā)明更為徹底的理解。然而，對于本領(lǐng)域技術(shù)人員而言顯而易見的是，本發(fā)明可以無需一個或多個這些細(xì)節(jié)而得以實(shí)施。在其他的例子中，為了避免與本發(fā)明發(fā)生混淆，對于本領(lǐng)域公知的一些技術(shù)特征未進(jìn) 行描述。
[0033] 應(yīng)當(dāng)理解的是，本發(fā)明能夠以不同形式實(shí)施，而不應(yīng)當(dāng)解釋為局限于這里提出的實(shí)施例。相反地，提供這些實(shí)施例將使公開徹底和完全，并且將本發(fā)明的范圍完全地傳遞給本領(lǐng)域技術(shù)人員。
[0034] 在此使用的術(shù)語的目的僅在于描述具體實(shí)施例并且不作為本發(fā)明的限制。在此使用時，單數(shù)形式的"一"、"一個"和"所述/該"也意圖包括復(fù)數(shù)形式，除非上下文清楚指出另外的方式。還應(yīng)明白術(shù)語"組成"和/或"包括"，當(dāng)在該說明書中使用時，確定所述特征、整數(shù)、步驟、操作、元件和/或部件的存在，但不排除一個或更多其它的特征、整數(shù)、步驟、操作、元件、部件和/或組的存在或添加。在此使用時，術(shù)語"和/或"包括相關(guān)所列項目的任何及所有組合。
[0035] 為了徹底理解本發(fā)明，將在下列的描述中提出詳細(xì)的步驟以及詳細(xì)的結(jié)構(gòu)，以便闡釋本發(fā)明的技術(shù)方案。本發(fā)明的較佳實(shí)施例詳細(xì)描述如下，然而除了這些詳細(xì)描述外，本發(fā)明還可以具有其他實(shí)施方式。
[0036] 本發(fā)明的一個實(shí)施例提供一種字體識別方法，用于通過圖像特性自

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：姚聰;周舒暢;周昕宇;印奇;
技術(shù)所有人：北京曠視科技有限公司;北京小孔科技有限公司;
我是此專利的發(fā)明人

上一篇：一種書法字風(fēng)格的識別方法
上一篇：一種基于卷積神經(jīng)網(wǎng)絡(luò)的服裝分類方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

字體裝置相關(guān)技術(shù)

字體裝置藝術(shù)相關(guān)技術(shù)

無線識別裝置相關(guān)技術(shù)

usb裝置無法識別相關(guān)技術(shù)

裝置開停車風(fēng)險識別相關(guān)技術(shù)

射頻識別裝置相關(guān)技術(shù)

車牌識別裝置相關(guān)技術(shù)

無法配置生物識別裝置相關(guān)技術(shù)

顏色識別裝置相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

字體識別方法及裝置的制造方法