技術(shù)特征:
技術(shù)總結(jié)
公開了用于從成像文件提取文本的方法和設(shè)備。示例性方法包括將文件的圖像分段為對(duì)應(yīng)于所述文件中的個(gè)體字符的局部子圖像。該示例性方法還包括基于各自的所述子圖像與基準(zhǔn)子圖像的視覺相關(guān)性將各自的所述子圖像分組為群集。所述基準(zhǔn)子圖像與被分組為所述群集的各自的所述子圖像之間的所述視覺相關(guān)性超出相關(guān)性閾值。該示例性方法還包括基于被分組為所述群集的所述子圖像識(shí)別用于所述群集的指定字符。該示例性方法還包括將所述指定字符與所述文件的所述圖像中與被分組為所述群集的各自的所述子圖像相關(guān)聯(lián)的位置相關(guān)聯(lián)。
技術(shù)研發(fā)人員:凱文·克強(qiáng)·鄧
受保護(hù)的技術(shù)使用者:尼爾森(美國(guó))有限公司
技術(shù)研發(fā)日:2016.10.31
技術(shù)公布日:2017.08.15