欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

字體識(shí)別方法及裝置的制造方法_3

文檔序號(hào):9397205閱讀:來源:國知局
的圖像特征構(gòu)建訓(xùn)練集可以包括:基于每 個(gè)圖像塊的標(biāo)簽和所計(jì)算的每個(gè)圖像塊的圖像特征構(gòu)建訓(xùn)練集,其中,每個(gè)圖像塊的標(biāo)簽 為其所源自的文字圖像的標(biāo)簽。
[0061] 根據(jù)本發(fā)明的一個(gè)實(shí)施例,特征提取模塊301計(jì)算給定文字圖像的圖像特征的方 法可以包括:將給定文字圖像的高度歸一化;在高度歸一化后的給定文字圖像中采集第二 預(yù)定數(shù)目的不同尺寸的圖像塊;以及計(jì)算每個(gè)圖像塊的圖像特征。所述圖像分類模塊利用 其包括的訓(xùn)練好的分類模型、基于所計(jì)算的圖像特征確定所述給定文字圖像中的文字的字 體的方法包括:將所計(jì)算的所述第二預(yù)定數(shù)目的圖像塊的圖像特征分別輸入到所述分類模 型以得到多個(gè)識(shí)別結(jié)果;以及對(duì)所述多個(gè)識(shí)別結(jié)果取平均值作為所述給定文字圖像中的文 字的字體的最終識(shí)別結(jié)果。
[0062] 其中,所述第一預(yù)定數(shù)目和所述第二預(yù)定數(shù)目的數(shù)值可以根據(jù)實(shí)際需要進(jìn)行設(shè) 定。示例性地,所述第一預(yù)定數(shù)目可以為50;所述第二預(yù)定數(shù)目可以為100。在一個(gè)示例 中,所述圖像塊的高度和寬度相等。
[0063] 根據(jù)本發(fā)明的一個(gè)實(shí)施例,特征提取模塊301計(jì)算圖像特征的方法可以包括計(jì)算 紋理特征和/或形狀特征。
[0064] 示例性地,特征提取模塊301計(jì)算紋理特征的方法可以包括計(jì)算詞袋模型。
[0065] 示例性地,特征提取模塊301計(jì)算形狀特征的方法可以包括計(jì)算形狀上下文。
[0066] 關(guān)于詞袋模型和形狀上下文的計(jì)算,上文已進(jìn)行了詳細(xì)描述,因此此處不再贅述。
[0067] 本發(fā)明實(shí)施例的各個(gè)模塊可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行 的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用 微處理器或者數(shù)字信號(hào)處理器(DSP)來實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的字體識(shí)別裝置中的一些 或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一 部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本 發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣 的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在存儲(chǔ)載體上提供,或者以任何其他形式提供。
[0068] 本發(fā)明已經(jīng)通過上述實(shí)施例進(jìn)行了說明,但應(yīng)當(dāng)理解的是,上述實(shí)施例只是用于 舉例和說明的目的,而非意在將本發(fā)明限制于所描述的實(shí)施例范圍內(nèi)。此外本領(lǐng)域技術(shù)人 員可以理解的是,本發(fā)明并不局限于上述實(shí)施例,根據(jù)本發(fā)明的教導(dǎo)還可以做出更多種的 變型和修改,這些變型和修改均落在本發(fā)明所要求保護(hù)的范圍以內(nèi)。本發(fā)明的保護(hù)范圍由 附屬的權(quán)利要求書及其等效范圍所界定。
【主權(quán)項(xiàng)】
1. 一種字體識(shí)別方法,其特征在于,所述字體識(shí)別方法包括: 計(jì)算給定文字圖像的圖像特征;以及 基于所計(jì)算的圖像特征利用訓(xùn)練好的分類模型確定所述給定文字圖像中的文字的字 體。2. 如權(quán)利要求1所述的字體識(shí)別方法,其特征在于,所述分類模型的訓(xùn)練包括: 構(gòu)建文字圖像數(shù)據(jù)庫,所述文字圖像數(shù)據(jù)庫包括多個(gè)文字圖像以及每個(gè)文字圖像相應(yīng) 的標(biāo)簽,所述標(biāo)簽指示相應(yīng)的文字圖像中的文字的字體; 計(jì)算所述文字圖像數(shù)據(jù)庫中的每個(gè)文字圖像的圖像特征; 基于所述標(biāo)簽和所計(jì)算的每個(gè)文字圖像的圖像特征構(gòu)建訓(xùn)練集;以及 采用隨機(jī)森林算法在所述訓(xùn)練集上訓(xùn)練出所述分類模型。3. 如權(quán)利要求2所述的字體識(shí)別方法,其特征在于,在所述分類模型的訓(xùn)練中: 所述計(jì)算文字圖像數(shù)據(jù)庫中的每個(gè)文字圖像的圖像特征包括: 將每個(gè)文字圖像的高度歸一化; 在高度歸一化后的每個(gè)文字圖像中采集第一預(yù)定數(shù)目的不同尺寸的圖像塊;以及 計(jì)算每個(gè)圖像塊的圖像特征, 所述基于所述標(biāo)簽和所計(jì)算的每個(gè)文字圖像的圖像特征構(gòu)建訓(xùn)練集包括: 基于每個(gè)圖像塊的標(biāo)簽和所計(jì)算的每個(gè)圖像塊的圖像特征構(gòu)建訓(xùn)練集,其中,每個(gè)圖 像塊的標(biāo)簽為其所源自的文字圖像的標(biāo)簽。4. 如權(quán)利要求3所述的字體識(shí)別方法,其特征在于, 所述計(jì)算給定文字圖像的圖像特征包括: 將給定文字圖像的高度歸一化; 在高度歸一化后的給定文字圖像中采集第二預(yù)定數(shù)目的不同尺寸的圖像塊;以及 計(jì)算每個(gè)圖像塊的圖像特征。5. 如權(quán)利要求4所述的字體識(shí)別方法,其特征在于,所述基于所計(jì)算的圖像特征利用 訓(xùn)練好的分類模型確定所述給定文字圖像中的文字的字體包括: 將所計(jì)算的所述第二預(yù)定數(shù)目的圖像塊的圖像特征分別輸入到所述分類模型以得到 多個(gè)識(shí)別結(jié)果;以及 對(duì)所述多個(gè)識(shí)別結(jié)果取平均值作為所述給定文字圖像中的文字的字體的最終識(shí)別結(jié) 果。6. 如權(quán)利要求4所述的字體識(shí)別方法,其特征在于,所述第二預(yù)定數(shù)目為100。7. 如權(quán)利要求3或4所述的字體識(shí)別方法,其特征在于,所述圖像塊的高度和寬度相 等。8. 如權(quán)利要求3所述的字體識(shí)別方法,其特征在于,所述第一預(yù)定數(shù)目為50。9. 如權(quán)利要求1-5中的任一項(xiàng)所述的字體識(shí)別方法,其特征在于,計(jì)算圖像特征包括 計(jì)算紋理特征和/或形狀特征。10. 如權(quán)利要求9所述的字體識(shí)別方法,其特征在于,計(jì)算紋理特征包括計(jì)算詞袋模 型,計(jì)算形狀特征包括計(jì)算形狀上下文。11. 一種字體識(shí)別裝置,其特征在于,所述字體識(shí)別裝置包括: 特征提取模塊,用于計(jì)算給定文字圖像的圖像特征;以及 圖像分類模塊,用于利用其包括的訓(xùn)練好的分類模型、基于所計(jì)算的圖像特征確定所 述給定文字圖像中的文字的字體。12. 如權(quán)利要求11所述的字體識(shí)別裝置,其特征在于,所述分類模型的訓(xùn)練包括: 構(gòu)建文字圖像數(shù)據(jù)庫,所述文字圖像數(shù)據(jù)庫包括多個(gè)文字圖像以及每個(gè)文字圖像相應(yīng) 的標(biāo)簽,所述標(biāo)簽指示相應(yīng)的文字圖像中的文字的字體; 計(jì)算所述文字圖像數(shù)據(jù)庫中的每個(gè)文字圖像的圖像特征; 基于所述標(biāo)簽和所計(jì)算的每個(gè)文字圖像的圖像特征構(gòu)建訓(xùn)練集;以及 采用隨機(jī)森林算法在所述訓(xùn)練集上訓(xùn)練出所述分類模型。13. 如權(quán)利要求12所述的字體識(shí)別裝置,其特征在于,在所述分類模型的訓(xùn)練中: 所述計(jì)算文字圖像數(shù)據(jù)庫中的每個(gè)文字圖像的圖像特征包括: 將每個(gè)文字圖像的高度歸一化; 在高度歸一化后的每個(gè)文字圖像中采集第一預(yù)定數(shù)目的不同尺寸的圖像塊;以及 計(jì)算每個(gè)圖像塊的圖像特征, 所述基于所述標(biāo)簽和所計(jì)算的每個(gè)文字圖像的圖像特征構(gòu)建訓(xùn)練集包括: 基于每個(gè)圖像塊的標(biāo)簽和所計(jì)算的每個(gè)圖像塊的圖像特征構(gòu)建訓(xùn)練集,其中,每個(gè)圖 像塊的標(biāo)簽為其所源自的文字圖像的標(biāo)簽。14. 如權(quán)利要求13所述的字體識(shí)別裝置,其特征在于, 所述特征提取模塊計(jì)算給定文字圖像的圖像特征的方法包括: 將給定文字圖像的高度歸一化; 在高度歸一化后的給定文字圖像中采集第二預(yù)定數(shù)目的不同尺寸的圖像塊;以及 計(jì)算每個(gè)圖像塊的圖像特征。15. 如權(quán)利要求14所述的字體識(shí)別裝置,其特征在于,所述圖像分類模塊利用其包括 的訓(xùn)練好的分類模型、基于所計(jì)算的圖像特征確定所述給定文字圖像中的文字的字體的方 法包括: 將所計(jì)算的所述第二預(yù)定數(shù)目的圖像塊的圖像特征分別輸入到所述分類模型以得到 多個(gè)識(shí)別結(jié)果;以及 對(duì)所述多個(gè)識(shí)別結(jié)果取平均值作為所述給定文字圖像中的文字的字體的最終識(shí)別結(jié) 果。16. 如權(quán)利要求14所述的字體識(shí)別裝置,其特征在于,所述第二預(yù)定數(shù)目為100。17. 如權(quán)利要求13或14所述的字體識(shí)別裝置,其特征在于,所述圖像塊的高度和寬度 相等。18. 如權(quán)利要求13所述的字體識(shí)別裝置,其特征在于,所述第一預(yù)定數(shù)目為50。19. 如權(quán)利要求11-15中的任一項(xiàng)所述的字體識(shí)別裝置,其特征在于,所述特征提取模 塊計(jì)算圖像特征的方法包括計(jì)算紋理特征和/或形狀特征。20. 如權(quán)利要求19所述的字體識(shí)別裝置,其特征在于,所述特征提取模塊計(jì)算紋理特 征的方法包括計(jì)算詞袋模型,所述特征提取模塊計(jì)算形狀特征的方法包括計(jì)算形狀上下 文。
【專利摘要】本發(fā)明提供了一種字體識(shí)別方法及裝置。所述字體識(shí)別方法包括:計(jì)算給定文字圖像的圖像特征;以及基于所計(jì)算的圖像特征利用訓(xùn)練好的分類模型確定所述給定文字圖像中的文字的字體。本發(fā)明提供的字體識(shí)別方法及裝置通過圖像特性自動(dòng)判斷給定文字的字體,識(shí)別精度高且速度快,此外還免去了人工辨識(shí)字體的過程,因此可以極大提高文檔處理、藝術(shù)設(shè)計(jì)等過程的效率。
【IPC分類】G06K9/68, G06K9/62
【公開號(hào)】CN105117740
【申請(qǐng)?zhí)枴緾N201510520116
【發(fā)明人】姚聰, 周舒暢, 周昕宇, 印奇
【申請(qǐng)人】北京曠視科技有限公司, 北京小孔科技有限公司
【公開日】2015年12月2日
【申請(qǐng)日】2015年8月21日
當(dāng)前第3頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
西乡县| 泰顺县| 兴隆县| 工布江达县| 聂荣县| 临安市| 梁山县| 德江县| 长丰县| 达日县| 通江县| 怀化市| 丰顺县| 万宁市| 贺州市| 鄂托克旗| 宜宾县| 泉州市| 环江| 连云港市| 西乌珠穆沁旗| 长泰县| 汕尾市| 清丰县| 嘉黎县| 铁力市| 北宁市| 梅河口市| 临安市| 垦利县| 东山县| 历史| 临沂市| 舒兰市| 本溪市| 宁夏| 长乐市| 且末县| 洪泽县| 蚌埠市| 巴彦淖尔市|