本發(fā)明涉及圖像識別技術(shù)領(lǐng)域,尤其是涉及一種計算機故障檢測系統(tǒng)及方法一種基于筆劃密度特征文字識別方法。
背景技術(shù):
隨著數(shù)碼相機、攝像頭、超高速掃描儀等圖像獲取設備的廣泛應用,圖像中信息越來越引起人們的關(guān)注。其中嵌入在圖像中的文字是圖像語義內(nèi)容的一種重要表達方式,能夠提供一些人們所需要的重要信息。例如圖像中的文字可以是該圖像的內(nèi)容概述,如果能夠自動提取和識別圖像中的文字,就可以讓計算機自動理解圖像內(nèi)容。讓計算機像人類一樣識別圖像中的文字,對于圖像和視頻的存儲、分類、理解及檢索等來說具有極其重要的意義,它主要應用在中文信息處理、辦公室自動化、及其翻譯、人工智能等高技術(shù)領(lǐng)域,有著廣泛的應用前景和商業(yè)價值。目前對圖像中的文字一般只是通過簡單的圖像分割處理來進行識別,無法根據(jù)圖像中的文字特征來進行自適應調(diào)節(jié),導致現(xiàn)有的圖像文字識別方法精度較低,無法滿足實際應用的需求。
技術(shù)實現(xiàn)要素:
鑒于以上內(nèi)容,有必要提供一種計算機故障檢測系統(tǒng)及方法一種基于筆劃密度特征文字識別方法,目的在于解決現(xiàn)有的圖像文字識別方法對文字的識別精度較低的技術(shù)問題。
本發(fā)明的目的通過以下技術(shù)方案實現(xiàn):
一種基于筆劃密度特征文字識別方法,包括以下步驟:
獲取待識別圖像;
對已獲取圖像預處理:圖像傾斜校正以校正圖像和閾值化處理獲得前景信息及背景信息單一的圖像;
分析處理圖像:分析圖像的行間紋理特征,獲取圖像的文字矩陣參數(shù);
分割圖像:基于所述文字矩陣參數(shù)對圖像進行切割,形成若干個子圖像,獲取圖像的文字字塊;
識別:對文字字塊進行單獨處理,獲取文字字塊的圖像特征,并對所述圖像特征進行識別;所述圖像特征獲取方法為:計算出文字字塊邊框,在加框的文字字塊p×q點陣中,分別向水平、垂直、45度和135度方向投影,每個方向取n個值作為特征,形成4n維特征向量。
進一步的,所述對已獲取圖像預處理還包括對已識別圖像進行圖像降噪以提升識別處理的精確度。
進一步的,所述圖像降噪處理可以采用小波去噪法、形態(tài)學噪聲濾除器法、中值濾波器法、自適應維納濾波器法及均值濾波器法等方法。
進一步的,所述閾值化處理包括固定閾值化方法、自適應閾值化方法、大津法或迭代法。
進一步的,將圖像矩陣中圖像分為將圖像的矩陣坐標中的字體用第一像素值表示,背景用第二像素值表示,統(tǒng)計圖像的矩陣坐標中每行第二像素值的個數(shù),獲取一數(shù)組;統(tǒng)計對若干行高參數(shù),參數(shù)取平均值統(tǒng)計,獲取字體大小參數(shù)。
進一步的,所述識別基于預設的聚類算法對切分后的文字子塊進行圖像分割處理,獲取文字字塊中的文字信息,并根據(jù)所述文字信息在預置的系統(tǒng)文字庫中進行比對,根據(jù)比對結(jié)構(gòu)確定圖像中的文字。
進一步的,所述分析處理圖像還包括對文字字塊進行膨脹處理。
進一步的,所述識別步驟包括所提取文字字塊進行歸一化處理后再進行識別。
本發(fā)明有益效果:本發(fā)明通過識別圖像的矩陣行高紋理特征進行分析,計算出圖像文字的矩陣參數(shù),再基于文字相關(guān)的矩陣參數(shù)估算出文字字體大小參數(shù),然后在對每一個文字快進行分割,并對文字子塊進行識別,提高了切分文字子塊的準確性,從而提高文字識別的精度。
【具體實施方式】
一種基于筆劃密度特征文字識別方法,其特征在于,包括以下步驟:
獲取待識別圖像;待識別圖像可以是任何需要進行文字識別的圖像,待識別圖像可以來自外部設備。待識別圖像可以是原始圖像,也可以是對原始圖像進行預處理后得到的圖像,待識別的圖像可以是jpg、bmp、png等圖像格式。
對已獲取圖像預處理,包括閾值化處理、閾值化處理和傾斜校正。閾值化處理:所述閾值化處理包括固定閾值化方法、自適應閾值化方法、大津法或迭代法。圖像的閾值化有利于圖像的進一步處理,獲得前景信息及背景信息單一的圖像,使圖像變得簡單,而且數(shù)據(jù)量減小,能凸顯出感興趣的目標的輪廓。閾值化處理:由于待識別圖像的品質(zhì)受限于輸入設備、環(huán)境、以及文檔的印刷質(zhì)量,在對圖像中印刷體字符進行識別處理前,需要根據(jù)噪聲的特征對待識別圖像進行去噪處理,提升識別處理的精確度,圖像降噪處理可以采用小波去噪法、形態(tài)學噪聲濾除器法、中值濾波器法、自適應維納濾波器法及均值濾波器法等方法。傾斜校正:由于掃描和拍攝過程涉及人工操作,輸入計算機的待識別圖像或多或少都會存在一些傾斜,在對圖像中印刷體字符進行識別處理前,就需要進行圖像方向檢測,并校正圖像方向。
分析處理圖像,分析圖像的行間紋理特征,獲取圖像的文字矩陣參數(shù);將圖像矩陣中圖像分為將圖像的矩陣坐標中的字體用第一像素值表示,背景用第二像素值表示,統(tǒng)計圖像的矩陣坐標中每行第二像素值的個數(shù),獲取一數(shù)組;統(tǒng)計對若干行高參數(shù),參數(shù)取平均值統(tǒng)計,獲取字體大小參數(shù)。
分割圖像:基于所述文字矩陣參數(shù)對圖像進行切割,形成若干個子圖像,獲取圖像的文字字塊;在進行圖像切割前還包括對圖像中文字區(qū)域中的文字進行判斷排列方向,可以對文字字塊逐行逐列掃描像素,得到文字字塊中文字的行間距和列間距,并計算文字行的高度方差及文字列的寬度方差。該文字行的高度方差用于反映文字行高度的一致性,而該文字列的寬度方差用于反映文字列寬度的一致性。然后綜合該文字間距和文字行的高度或文字列的寬度的一致性等因素來判斷該文字是橫向排列還是縱向排列。例如,若行間距大于列間距,并且文字行高度一致,則判定文字區(qū)域中文字是橫向排列。若列間距大于行間距,并且文字列寬度一致,則判定文字區(qū)域中文字是縱向排列。對文字字塊的切分結(jié)果進行修正,例如包括將錯誤切分后的文字行或列合并,或?qū)τ⑽氖鬃帜概c第二字母的錯誤切分進行修正
識別:對文字字塊進行單獨處理,獲取文字字塊的圖像特征,并對所述圖像特征進行識別;使用經(jīng)過版面分析及單字切分操作后的該文字字塊從文字區(qū)域中提取文字之前,還可以對該文字字塊進行膨脹處理,然后使用該文字字塊保留文字邊緣梯度,去除局部背景梯度的干擾,從而從該文字區(qū)域中將每一個文字提取出來,并對所提取文字進行歸一化處理,即將所有文字縮放到統(tǒng)一大小,最后提取每個文字的特征進行識別。所述圖像特征獲取方法為:計算出文字字塊邊框,在加框的文字字塊p×q點陣中,分別向水平、垂直、45度和135度方向投影,每個方向取n個值作為特征,形成4n維特征向量。
上所述,僅是本發(fā)明的較佳實施例而已,并非對本發(fā)明作任何形式上的限制,雖然本發(fā)明已以較佳實施例揭示如上,然而并非用以限定本發(fā)明,任何本領(lǐng)域技術(shù)人員,在不脫離本發(fā)明技術(shù)方案范圍內(nèi),當可利用上述揭示的技術(shù)內(nèi)容做出些許更動或修飾為等同變化的等效實施例,但凡是未脫離本發(fā)明技術(shù)方案內(nèi)容,依據(jù)本發(fā)明的技術(shù)實質(zhì)對以上實施例所作的任何簡介修改、等同變化與修飾,均仍屬于本發(fā)明技術(shù)方案的范圍。