技術(shù)總結(jié)
提供了一種圖像處理方法和裝置。該方法包括:生成圖像的第一尺度二值圖,第一尺度小于圖像原始尺度;基于第一尺度的二值圖檢測圖像中的至少一個(gè)文本行;生成圖像的第二尺度二值圖,其中第二尺度大于第一尺度;針對每個(gè)文本行,計(jì)算第一尺度二值圖中相應(yīng)部分與第二尺度二值圖中相應(yīng)部分間的相似度,并將相似度低于預(yù)定水平的文本行作為噪聲去除;針對未去除的文本行中的一個(gè)或更多個(gè),對第二尺度的二值圖中的相應(yīng)部分進(jìn)行OCR以確定相應(yīng)文本行的文字取向;以及根據(jù)所確定的文字取向確定圖像的取向。檢測文本行的步驟包括檢測水平文本行和豎直文本行,在其重疊的情況下檢測重疊區(qū)域的文本塊取向,并將與文本塊取向不一致的文本行作為噪聲去除。
技術(shù)研發(fā)人員:孫俊;潘屹峰;直井聰
受保護(hù)的技術(shù)使用者:富士通株式會(huì)社
文檔號碼:201210137925
技術(shù)研發(fā)日:2012.05.04
技術(shù)公布日:2016.12.14