一種圖像的處理方法和裝置制造方法
【專利摘要】本申請?zhí)峁┝艘环N圖像的處理方法和裝置,包括:獲取待識別的圖像,其中,所述待識別的圖像中包括字符圖像;將獲取的圖像進行切邊處理,得到包含所述字符圖像的、有效的待識別圖像范圍;將所述有效的待識別圖像范圍內(nèi)的圖像進行預處理,獲得預處理后的所述字符圖像;使用多個識別引擎,對預處理后的所述字符圖像進行識別;當確定預處理后的所述字符圖像與所述多個識別引擎中的至少一個識別引擎的識別結果為可靠時,則輸出可靠的所述識別結果。因此本申請可以解決在進行圖像識別時,無法準確的獲得圖像中的有效信息,并且識別功能單一的問題。
【專利說明】一種圖像的處理方法和裝置
【技術領域】
[0001]本申請涉及識別【技術領域】,特別是涉及一種圖像的處理方法和裝置。
【背景技術】
[0002]近年來,隨著業(yè)務的計算機化,使用了大量的電子文檔,由于這個原因,圖像識別技術作為將紙件文檔轉換為電子文檔的技術的重要性正在與日俱增。
[0003]在圖像識別時,由于用戶使用的拍攝設備的不同,所得到的圖像的大小就有可能不同,將得到的圖像進行識別時,無法準確的獲得圖像中的有效信息,并將圖像中的有效信息轉換成可編輯文字信息提供給使用者。同時,現(xiàn)有的拍圖器功能比較單一,只能識別和處理一種圖像,不能滿足用戶的實際需求。
【發(fā)明內(nèi)容】
[0004]本申請?zhí)峁┮环N圖像處理方法和裝置,以解決現(xiàn)有技術中在進行圖像識別時,無法準確的獲得圖像中的有效信息,并且識別功能單一的問題。
[0005]為了解決上述問題,本申請公開了一種圖像的處理方法,包括:獲取待識別的圖像,其中,所述待識別的圖像中包括字符圖像;將獲取的圖像進行切邊處理,得到包含所述字符圖像的、有效的待識別圖像范圍;將所述有效的待識別圖像范圍內(nèi)的圖像進行預處理,獲得預處理后的所述字符圖像;使用多個識別引擎,對預處理后的所述字符圖像進行識別;當確定預處理后的所述字符圖像與所述多個識別引擎中的至少一個識別引擎的識別結果為可靠時,則輸出可靠的所述識別結果。
[0006]優(yōu)選地,所述多個識別引擎包括:名片識別引擎、模板識別引擎和文本識別引擎中的至少二個;當所述多個識別引擎包括所述名片識別引擎時,所述使用多個識別引擎,對預處理后的所述字符圖像進行識別的步驟包括:
[0007]對預處理后的所述字符圖像進行分割,獲得多個單一字符,將每個單一字符與名片識別引擎中的名片數(shù)據(jù)庫進行匹配,得到每個單一字符的相似度的判定分值,將所述每個單一字符的相似度的判定分值求和,并對求和結果進行歸一化處理,將所述歸一化處理結果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第一閾值和第二閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別,其中,所述字符圖像的第一閾值大于第二閾值;
[0008]當所述多個識別引擎包括所述文本識別引擎時,所述使用多個識別引擎,對預處理后的所述字符圖像進行識別的步驟包括:對預處理后的所述字符圖像進行分割,獲得多個單一字符,將每個單一字符與文本識別引擎中的文本數(shù)據(jù)庫進行匹配,得到每個單一字符的相似度的判定分值,將所述每個單一字符的相似度的判定分值求和,并對求和結果進行歸一化處理,將所述歸一化處理結果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第三閾值和第四閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別,其中,所述字符圖像的第三閾值大于第四閾值;
[0009]當所述多個識別引擎包括所述模板識別引擎時,所述使用多個識別引擎,對預處理后的所述字符圖像進行識別的步驟包括:
[0010]對預處理后的所述字符圖像進行分割,獲得多個單一字符,將每個單一字符與模板識別引擎中的模板數(shù)據(jù)庫進行匹配,得到每個單一字符的相似度的判定分值,將所述每個單一字符的相似度的判定分值求和,并對求和結果進行歸一化處理,將所述歸一化處理結果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第五閾值和第六閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別,其中,所述字符圖像的第五閾值大于第六閾值。
[0011]優(yōu)選地,將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第一閾值和第二閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別包括:若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第一閾值時,則輸出可靠的所述識別結果;若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第二閾值時,輸出不可靠的所述識別結果,在確定還有未使用的識別引擎時,繼續(xù)調(diào)用未使用的識別引擎對預處理后的所述字符圖像進行識別。
[0012]優(yōu)選地,將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第三閾值和第四閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別包括:若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第三閾值時,則輸出可靠的所述識別結果;若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第四閾值時,輸出不可靠的所述識別結果,在確定還有未使用的識別引擎時,繼續(xù)調(diào)用未使用的識別引擎對預處理后的所述字符圖像進行識別。
[0013]優(yōu)選地,將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第五閾值和第六閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別包括:若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第五閾值時,則輸出可靠的所述識別結果;
[0014]若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第六閾值時,輸出不可靠的所述識別結果,在確定還有未使用的識別引擎時,繼續(xù)調(diào)用未使用的識別引擎對預處理后的所述字符圖像進行識別。
[0015]優(yōu)選地,還包括:若多個識別引擎識別出的多個識別結果中的至少一個識別結果在可靠與不可靠之間,則比較多個識別引擎識別出的字符圖像的相似度的判定分值的平均值,選擇字符圖像的相似度的判定分值的平均值中最大值作為字符圖像的識別結果。
[0016]為了解決上述問題,本申請還公開了一種圖像的處理裝置,包括:
[0017]獲取模塊,用于獲取待識別的圖像,其中,所述待識別的圖像中包括字符圖像;
[0018]處理模塊,用于將獲取的圖像進行切邊處理,得到包含所述字符圖像的、有效的待識別圖像范圍;
[0019]預處理模塊,用于將所述有效的待識別圖像范圍內(nèi)的圖像進行預處理,獲得預處理后的所述字符圖像;
[0020]識別模塊,用于使用多個識別引擎,對預處理后的所述字符圖像進行識別;
[0021]輸出模塊,用于當確定預處理后的所述字符圖像與所述多個識別引擎中的至少一個識別引擎的識別結果為可靠時,則輸出可靠的所述識別結果。
[0022]優(yōu)選地,所述多個識別弓I擎包括:名片識別弓丨擎、模板識別弓丨擎、文本識別引擎中的至少二個;
[0023]所述識別模塊,用于:
[0024]當所述多個識別引擎包括所述名片識別引擎時,所述使用多個識別引擎,對預處理后的所述字符圖像進行識別包括:對預處理后的所述字符圖像進行分割,獲得多個單一字符,將每個單一字符與名片識別引擎中的名片數(shù)據(jù)庫進行匹配,得到每個單一字符的相似度的判定分值,將所述每個單一字符的相似度的判定分值求和,并對求和結果進行歸一化處理,將所述歸一化處理結果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第一閾值和第二閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別,其中,所述字符圖像的第一閾值大于第二閾值;
[0025]當所述多個識別引擎包括所述文本識別引擎時,所述使用多個識別引擎,對預處理后的所述字符圖像進行識別包括:對預處理后的所述字符圖像進行分割,獲得多個單一字符,將每個單一字符與文本識別引擎中的文本數(shù)據(jù)庫進行匹配,得到每個單一字符的相似度的判定分值,將所述每個單一字符的相似度的判定分值求和,并對求和結果進行歸一化處理,將所述歸一化處理結果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第三閾值和第四閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別,其中,所述字符圖像的第三閾值大于第四閾值;
[0026]當所述多個識別引擎包括所述模板識別引擎時,所述使用多個識別引擎,對預處理后的所述字符圖像進行識別包括:對預處理后的所述字符圖像進行分割,獲得多個單一字符,將每個單一字符與模板識別引擎中的模板數(shù)據(jù)庫進行匹配,得到每個單一字符的相似度的判定分值,將所述每個單一字符的相似度的判定分值求和,并對求和結果進行歸一化處理,將所述歸一化處理結果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第五閾值和第六閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別,其中,所述字符圖像的第五閾值大于第六閾值。
[0027]優(yōu)選地,所述識別模塊在將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第一閾值和第二閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別時:
[0028]若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第一閾值時,則輸出可靠的所述識別結果;
[0029]若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第二閾值時,輸出不可靠的所述識別結果,在確定還有未使用的識別引擎時,繼續(xù)調(diào)用未使用的識別引擎對預處理后的所述字符圖像進行識別。
[0030]優(yōu)選地,所述識別模塊在將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第三閾值和第四閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別時:
[0031]若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第三閾值時,則輸出可靠的所述識別結果;
[0032]若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第四閾值時,輸出不可靠的所述識別結果,在確定還有未使用的識別引擎時,繼續(xù)調(diào)用未使用的識別引擎對預處理后的所述字符圖像進行識別。
[0033]與現(xiàn)有技術相比,本申請包括以下優(yōu)點:
[0034]首先,將待識別的圖像進行切邊處理,得到了包含字符圖像的有效的識別圖像范圍,同時將獲得的有效的圖像進行預處理,排除了干擾噪聲的影響,從而能準確的獲得圖像中的有效信息。
[0035]其次,本申請通過使用多個識別引擎對獲得的預處理后的字符圖像進行識別,從而實現(xiàn)了對多種圖片類型的處理,當字符圖像與多個識別引擎中的至少一個識別引擎的識別結果為可靠時,則輸出可靠的識別結果。多個識別引擎可以對不同類型的圖像進行處理,例如:多個識別引擎可以為模板識別引擎、名片識別引擎、模板識別引擎和車牌識別引擎等,由于本申請將獲得的預處理后的字符圖像使用多個識別引擎進行處理,避免了現(xiàn)有方法中在進行圖像識別時,無法準確的獲得圖像中的有效信息,并且識別功能單一的問題。
【專利附圖】
【附圖說明】
[0036]圖1是本申請實施例一中的一種圖像處理方法的流程圖;
[0037]圖2是本申請實施例二中的一種圖像處理方法的流程圖;
[0038]圖3是本申請實施例三中的一種圖像處理裝置的結構框圖。
【具體實施方式】
[0039]為使本申請的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結合附圖和【具體實施方式】對本申請作進一步詳細的說明。
[0040]參照圖1,示出了本申請實施例一中的一種圖像處理方法,包括:
[0041]步驟101:獲取待識別的圖像,其中,所述待識別的圖像中包括字符圖像。
[0042]待識別的圖像可以從照相管理裝置或者圖像輸入裝置中獲取待識別的圖像。
[0043]步驟102:將獲取的圖像進行切邊處理,得到包含所述字符圖像的、有效的待識別圖像范圍。
[0044]圖像切邊:指能夠從原圖中,將被識別圖像的邊緣從原圖切出來,常見的被識別圖像如身份證等。
[0045]將獲取的圖像進行切邊處理,找到圖像的四個角點,進行透視變換,即透視變換是對圖像進行拉縮,把斜視圖變成正視圖,得到圖像的有效內(nèi)容,得到包含字符圖像的、有效的待識別圖像范圍。
[0046]如果字符圖像的、有效的待識別圖像范圍能夠清晰的識別,則繼續(xù)識別處理過程,如果字符圖像的、有效的待識別圖像范圍不能夠清晰的識別,則提示使用者重新拍攝或輸入圖像。
[0047]步驟103:將所述有效的待識別圖像范圍內(nèi)的圖像進行預處理,獲得預處理后的所述字符圖像。
[0048]將所述有效的待識別圖像范圍內(nèi)的圖像進行預處理包括:對獲取的圖像進行傾斜矯正,對圖像進行增強處理、對圖像進行二值化處理和對圖像進行降噪處理。其中,對圖像進行增強處理是使圖像的亮、暗更清楚,黑白分明;對圖像進行二值化處理是將圖像中的字符與背景區(qū)分開;對圖像進行降噪處理是去掉圖像中的干擾噪聲,比如碎筆畫等。將待識別圖像范圍內(nèi)的圖像進行預處理后的結果是得到字符與背景分明的字符圖像。
[0049]步驟104:使用多個識別引擎,對預處理后的所述字符圖像進行識別。
[0050]步驟105:當確定預處理后的所述字符圖像與所述多個識別引擎中的至少一個識別引擎的識別結果為可靠時,則輸出可靠的所述識別結果。
[0051]當確定預處理后的字符圖像與多個識別引擎中的至少一個識別引擎的識別結果為不可靠時,則繼續(xù)調(diào)用多個識別引擎中未使用的識別引擎對字符圖像進行處理。
[0052]對是否調(diào)用多個識別引擎中的其他識別引擎,主要取決于之前使用過的識別引擎的識別結果。
[0053]通過本實施例,首先,將待識別的圖像進行切邊處理,得到了包含字符圖像的有效的識別圖像范圍,同時將獲得的有效的圖像進行預處理,排除了干擾噪聲的影響,從而能準確的獲得圖像中的有效信息。
[0054]其次,本申請通過使用多個識別引擎對獲得的預處理后的字符圖像進行識別,從而實現(xiàn)了對多種圖片類型的處理,當字符圖像與多個識別引擎中的至少一個識別引擎的識別結果為可靠時,則輸出可靠的識別結果。多個識別引擎可以對不同類型的圖像進行處理,例如:多個識別引擎可以為模板識別引擎、名片識別引擎、模板識別引擎、車牌識別弓I擎和語音識別引擎等,由于本申請將獲得的預處理后的字符圖像使用多個識別引擎進行處理,避免了現(xiàn)有方法中在進行圖像識別時,無法準確的獲得圖像中的有效信息,并且識別功能單一的問題。
[0055]參照圖2,示出了本申請實施例二中的一種圖像處理方法,包括:
[0056]步驟201:通過拍攝設備,對待識別圖像進行拍照。
[0057]步驟202:獲取待識別的圖像,其中,所述待識別的圖像中包括字符圖像。
[0058]步驟203:將獲取的圖像進行切邊處理,得到包含所述字符圖像的、有效的待識別圖像范圍。
[0059]步驟204:判定獲取的圖像是否清晰能夠識別,如果是,則執(zhí)行步驟205 ;如果否,則執(zhí)行步驟208。
[0060]步驟205:將所述有效的待識別圖像范圍內(nèi)的圖像進行預處理,獲得預處理后的所述字符圖像。
[0061]將有效的待識別圖像范圍內(nèi)的圖像進行預處理包括:對獲取的圖像進行傾斜矯正,對圖像進行增強處理、對圖像進行二值化處理和對圖像進行降噪處理。其中,對圖像進行增強處理是使圖像的亮、暗更清楚,黑白分明;對圖像進行二值化處理是將圖像中的字符與背景區(qū)分開;對圖像進行降噪處理是去掉圖像中的干擾噪聲,比如碎筆畫等。將待識別圖像范圍內(nèi)的圖像進行預處理后的結果是得到字符與背景分明的字符圖像。
[0062]步驟206:對獲取的預處理后的字符圖像進行光學字符識別,光學字符識別是對圖像進行分析、識別,得到文字和版面信息。該光學字符識別可以使用多個識別引擎,對預處理后的所述字符圖像進行識別。
[0063]光學字符識別(Optical Character Recognit1n, OCR)是指對文本資料的圖像文件進行分析識別處理,獲取文字及版面信息的過程。
[0064]多個識別引擎包括:名片識別引擎、模板識別引擎和文本識別引擎中的至少二個,名片識別引擎適用于名片的識別處理,模板識別引擎適用于模板的識別處理,文本識別引擎適用于文本的識別處理。
[0065]當所述多個識別引擎包括所述名片識別引擎時,所述使用多個識別引擎,對預處理后的所述字符圖像進行識別的步驟包括:
[0066]對預處理后的所述字符圖像進行分割,獲得多個單一字符,將每個單一字符與名片識別引擎中的名片數(shù)據(jù)庫進行匹配,得到每個單一字符的相似度的判定分值,將所述每個單一字符的相似度的判定分值求和,并對求和結果進行歸一化處理,將所述歸一化處理結果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第一閾值和第二閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別,其中,所述字符圖像的第一閾值大于第二閾值,其中,第一閾值和第二閾值都是通過統(tǒng)計得到的,也就是設定一個訓練集,求出訓練集合中每個圖的總相似度,通過設定第一閾值和第二閾值使得名片識別引擎的識別結果正確率和拒識準確率最大化。
[0067]優(yōu)選地,將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第一閾值和第二閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別包括:
[0068]若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第一閾值時,則輸出可靠的所述識別結果;
[0069]若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第二閾值時,輸出不可靠的所述識別結果,在確定還有未使用的識別引擎時,繼續(xù)調(diào)用未使用的識別引擎對預處理后的所述字符圖像進行識別。
[0070]當所述多個識別引擎包括所述文本識別引擎時,所述使用多個識別引擎,對預處理后的所述字符圖像進行識別的步驟包括:對預處理后的所述字符圖像進行分割,獲得多個單一字符,將每個單一字符與文本識別引擎中的文本數(shù)據(jù)庫進行匹配,得到每個單一字符的相似度的判定分值,將所述每個單一字符的相似度的判定分值求和,并對求和結果進行歸一化處理,將所述歸一化處理結果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第三閾值和第四閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別,其中,所述字符圖像的第三閾值大于第四閾值,其中,第三閾值和第四閾值都是通過統(tǒng)計得到的,也就是設定一個訓練集,求出訓練集合中每個圖的總相似度,通過設定第三閾值和第四閾值使得名片識別引擎的識別結果正確率和拒識準確率最大化。
[0071]優(yōu)選地,將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第三閾值和第四閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別包括:若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第三閾值時,則輸出可靠的所述識別結果;
[0072]若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第四閾值時,輸出不可靠的所述識別結果,在確定還有未使用的識別引擎時,繼續(xù)調(diào)用未使用的識別引擎對預處理后的所述字符圖像進行識別。
[0073]當所述多個識別引擎包括所述模板識別引擎時,所述使用多個識別引擎,對預處理后的所述字符圖像進行識別的步驟包括:
[0074]對預處理后的所述字符圖像進行分割,獲得多個單一字符,將每個單一字符與模板識別引擎中的模板數(shù)據(jù)庫進行匹配,得到每個單一字符的相似度的判定分值,將所述每個單一字符的相似度的判定分值求和,并對求和結果進行歸一化處理,將所述歸一化處理結果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第五閾值和第六閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別,其中,所述字符圖像的第五閾值大于第六閾值,其中,第五閾值和第六閾值都是通過統(tǒng)計得到的,也就是設定一個訓練集,求出訓練集合中每個圖的總相似度,通過設定第五閾值和第六閾值使得名片識別引擎的識別結果正確率和拒識準確率最大化。
[0075]模板數(shù)據(jù)庫中存儲各個模板的標準格式,例如:身份證模板,該身份證模板中的姓名、出生日期、地址等都對應固定的位置,匹配時按照對應的格式進行識別。
[0076]優(yōu)選地,將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第五閾值和第六閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別包括:若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第五閾值時,則輸出可靠的所述識別結果O
[0077]若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第六閾值時,輸出不可靠的所述識別結果,在確定還有未使用的識別引擎時,繼續(xù)調(diào)用未使用的識別引擎對預處理后的所述字符圖像進行識別。
[0078]進一步的,如果通過三種識別引擎對圖像進行識別后,所得到的識別結果均為不可靠時,則提示使用者該圖像不能識別。如果通過三種識別引擎對圖像進行識別后,所得到的結果都是在可靠與不可靠之間或者若多個識別引擎識別出的多個識別結果中的至少一個識別結果在可靠與不可靠之間,則比較多個識別引擎識別出的字符圖像的相似度的判定分值的平均值,選擇字符圖像的相似度的判定分值的平均值中最大值作為字符圖像的識別結果,其中可靠與不可靠之間的范圍包括通過三種識別引擎對圖像進行識別后,所得到的識別結果大于第一閾值,而小于第二閾值;識別結果大于第三閾值,而小于第四閾值;識別結果大于第五閾值,而小于第六閾值。
[0079]如果多個識別引擎中只包括一個識別引擎時,則對字符圖像的過程也可以采用本申請限定的方法進行字符圖像的識別。
[0080]需要說明的是,本申請的多個識別引擎可以按照預先設定順序進行調(diào)用,也可以根據(jù)具體操作的情況調(diào)用相應的識別引擎,本申請不加以限制。
[0081]步驟207:當確定預處理后的所述字符圖像與所述多個識別引擎中的至少一個識別引擎的識別結果為可靠時,則輸出可靠的所述識別結果。結束流程。
[0082]步驟208:提示使用者重新拍攝或輸入圖像,重復進行步驟201-步驟207的操作過程。
[0083]進一步的,通過具體的應用實例來說明本申請限定的技術方案實現(xiàn)方法。
[0084]在光學字符識別中,多種類型的圖像識別處理能力是這樣實現(xiàn)的:在光學字符識別包括多個識別引擎,例如三個引擎一名片識別引擎、模板識別引擎和文本識別引擎。
[0085]拍圖器獲得圖片并初步處理后進入光學字符識別過程包括:可以按照一定的順序調(diào)用識別引擎,例如按照名片識別引擎、模板識別引擎、文本識別引擎的順序調(diào)用識別引擎。按照舉例的順序,拍圖器在進行光學字符識別時,先調(diào)用名片識別引擎對圖像進行識另|J,求出圖像中各字符的相似度的判定分值,將每個單一字符的相似度的判定分值求和,并對求和結果進行歸一化處理,將歸一化處理結果作為字符圖像的相似度的判定分值的平均值D1,其中,各字符的相似度判定分值可以是概率或者距離。預先設定兩個閾值Al、A2,如果Dl大于Al則識別結果可靠,光學字符識別過程不需要再調(diào)用其余的識別引擎,輸出識別結果;如果Dl小于A2,則輸出識別結果不可靠,光學字符識別過程繼續(xù)調(diào)用模板識別引擎。
[0086]在模板識別引擎對圖像進行識別過程中,求出圖像中各字符的相似度的判定分值,將每個單一字符的相似度的判定分值求和,并對求和結果進行歸一化處理,將歸一化處理結果作為字符圖像的相似度的判定分值的平均值D2,其中,各字符的相似度判定分值可以是概率或者距離。預先設定兩個閾值B1、B2,如果D2大于BI,則輸出識別結果可靠,光學字符識別過程不需要再調(diào)用其余的識別引擎,輸出識別結果;如果D2小于B2,則輸出識別結果不可靠,光學字符識別過程繼續(xù)調(diào)用文本識別引擎。
[0087]在文本識別引擎對圖像進行識別過程中,求出圖像中各字符的相似度的判定分值,將每個單一字符的相似度的判定分值求和,并對求和結果進行歸一化處理,將歸一化處理結果作為字符圖像的相似度的判定分值的平均值D3,其中,各字符的相似度判定分值可以是概率或者距離。預先設定兩個閾值C1、C2,如果D3大于Cl,則輸出識別結果可靠;如果D3小于C2,則輸出識別結果不可靠。
[0088]如果在三種識別引擎對圖像進行識別后,所得到的識別結果都是不可靠,則提示使用者該圖像不能識別;如果在三種識別引擎對圖像進行識別后,所得到的結果都是在可靠與不可靠之間,其中,可靠與不可靠之間的范圍是A1〈D1〈A2,B1〈D2〈B2,C1〈D3〈C2,則比較D1、D2、D3的值,將三個值中最大者對應的識別結果作為最終的識別結果。
[0089]上述過程是以三個識別引擎為例對光學字符識別過程進行的描述,如果識別引擎為兩個或三個以上,則光學字符識別過程采用類似的方法。
[0090]需要說明的是,本申請以舉例的方式說明多個識別引擎的調(diào)用順序,當然也可以按照其它順序調(diào)用多個識別引擎,而且根據(jù)識別結果的情況,可以只調(diào)用其中的一個或多個識別引擎。
[0091]通過本實施例,首先,將待識別的圖像進行切邊處理,得到了包含字符圖像的有效的識別圖像范圍,同時將獲得的有效的圖像進行預處理,排除了干擾噪聲的影響,從而能準確的獲得圖像中的有效信息。
[0092]其次,本申請通過使用多個識別引擎對獲得的預處理后的字符圖像進行識別,從而實現(xiàn)了對多種圖片類型的處理,當字符圖像與多個識別引擎中的至少一個識別引擎的識別結果為可靠時,則輸出可靠的識別結果。多個識別引擎可以對不同類型的圖像進行處理,例如:多個識別引擎可以為模板識別引擎、名片識別引擎、模板識別引擎、車牌識別引擎和語音識別引擎等,由于本申請將獲得的預處理后的字符圖像使用多個識別引擎進行處理,避免了現(xiàn)有方法中在進行圖像識別時,無法準確的獲得圖像中的有效信息,并且識別功能單一的問題
[0093]基于上述方法實施例的說明,本申請還提供了相應的一種圖像處理裝置的實施例,來實現(xiàn)上述方法實施例所述的內(nèi)容。
[0094]參見圖3,示出了本申請實施例三中的一種圖像處理裝置的結構框圖,具體可以包括:
[0095]獲取模塊301,用于獲取待識別的圖像,其中,所述待識別的圖像中包括字符圖像。
[0096]處理模塊302,用于將獲取的圖像進行切邊處理,得到包含所述字符圖像的、有效的待識別圖像范圍。
[0097]預處理模塊303,用于將所述有效的待識別圖像范圍內(nèi)的圖像進行預處理,獲得預處理后的所述字符圖像。
[0098]識別模塊304,用于使用多個識別引擎,對預處理后的所述字符圖像進行識別。
[0099]輸出模塊305,用于當確定預處理后的所述字符圖像與所述多個識別引擎中的至少一個識別引擎的識別結果為可靠時,則輸出可靠的所述識別結果。
[0100]優(yōu)選地,所述多個識別引擎包括:名片識別引擎、模板識別引擎、文本識別引擎中的至少二個;所述識別模塊,用于:
[0101]當所述多個識別引擎包括所述名片識別引擎時,所述使用多個識別引擎,對預處理后的所述字符圖像進行識別包括:對預處理后的所述字符圖像進行分割,獲得多個單一字符,將每個單一字符與名片識別引擎中的名片數(shù)據(jù)庫進行匹配,得到每個單一字符的相似度的判定分值,將所述每個單一字符的相似度的判定分值求和,并對求和結果進行歸一化處理,將所述歸一化處理結果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第一閾值和第二閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別,其中,所述字符圖像的第一閾值大于第二閾值。
[0102]當所述多個識別引擎包括所述文本識別引擎時,所述使用多個識別引擎,對預處理后的所述字符圖像進行識別包括:對預處理后的所述字符圖像進行分割,獲得多個單一字符,將每個單一字符與文本識別引擎中的文本數(shù)據(jù)庫進行匹配,得到每個單一字符的相似度的判定分值,將所述每個單一字符的相似度的判定分值求和,并對求和結果進行歸一化處理,將所述歸一化處理結果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第三閾值和第四閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別,其中,所述字符圖像的第三閾值大于第四閾值。
[0103]當所述多個識別引擎包括所述模板識別引擎時,所述使用多個識別引擎,對預處理后的所述字符圖像進行識別包括:對預處理后的所述字符圖像進行分割,獲得多個單一字符,將每個單一字符與模板識別引擎中的模板數(shù)據(jù)庫進行匹配,得到每個單一字符的相似度的判定分值,將所述每個單一字符的相似度的判定分值求和,并對求和結果進行歸一化處理,將所述歸一化處理結果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第五閾值和第六閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別,其中,所述字符圖像的第五閾值大于第六閾值。
[0104]優(yōu)選地,所述識別模塊在將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第一閾值和第二閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別時:
[0105]若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第一閾值時,則輸出可靠的所述識別結果。
[0106]若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第二閾值時,輸出不可靠的所述識別結果,在確定還有未使用的識別引擎時,繼續(xù)調(diào)用未使用的識別引擎對預處理后的所述字符圖像進行識別。
[0107]優(yōu)選地,所述識別模塊在將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第三閾值和第四閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別時:
[0108]若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第三閾值時,則輸出可靠的所述識別結果。
[0109]若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第四閾值時,輸出不可靠的所述識別結果,在確定還有未使用的識別引擎時,繼續(xù)調(diào)用未使用的識別引擎對預處理后的所述字符圖像進行識別。
[0110]優(yōu)選地,所述識別模塊在將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第五閾值和第六閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別時:
[0111]若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第五閾值時,則輸出可靠的所述識別結果。
[0112]若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第六閾值時,輸出不可靠的所述識別結果,在確定還有未使用的識別引擎時,繼續(xù)調(diào)用未使用的識別引擎對預處理后的所述字符圖像進行識別。
[0113]優(yōu)選地,所述裝置還包括:比較模塊,用于若多個識別引擎識別出的多個識別結果中的至少一個識別結果在可靠與不可靠之間,則比較多個識別引擎識別出的字符圖像的相似度的判定分值的平均值,選擇字符圖像的相似度的判定分值的平均值中最大值作為所述字符圖像的識別結果。
[0114]通過本實施例,首先,將待識別的圖像進行切邊處理,得到了包含字符圖像的有效的識別圖像范圍,同時將獲得的有效的圖像進行預處理,排除了干擾噪聲的影響,從而能準確的獲得圖像中的有效信息。
[0115]其次,本申請通過使用多個識別引擎對獲得的預處理后的字符圖像進行識別,從而實現(xiàn)了對多種圖片類型的處理,當字符圖像與多個識別引擎中的至少一個識別引擎的識別結果為可靠時,則輸出可靠的識別結果。多個識別引擎可以對不同類型的圖像進行處理,例如:多個識別引擎可以為模板識別引擎、名片識別引擎、模板識別引擎、車牌識別弓I擎和語音識別引擎等,由于本申請將獲得的預處理后的字符圖像使用多個識別引擎進行處理,避免了現(xiàn)有方法中在進行圖像識別時,無法準確的獲得圖像中的有效信息,并且識別功能單一的問題
[0116]對于裝置實施例而言,由于其與方法實施例基本相似,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。
[0117]以上對本申請所提供的一種圖像處理的方法和裝置,進行了詳細介紹,本文中應用了具體個例對本申請的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本申請的方法及其核心思想;同時,對于本領域的一般技術人員,依據(jù)本申請的思想,在【具體實施方式】及應用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應理解為對本申請的限制。
【權利要求】
1.一種圖像的處理方法,其特征在于,包括: 獲取待識別的圖像,其中,所述待識別的圖像中包括字符圖像; 將獲取的圖像進行切邊處理,得到包含所述字符圖像的、有效的待識別圖像范圍; 將所述有效的待識別圖像范圍內(nèi)的圖像進行預處理,獲得預處理后的所述字符圖像; 使用多個識別引擎,對預處理后的所述字符圖像進行識別; 當確定預處理后的所述字符圖像與所述多個識別引擎中的至少一個識別引擎的識別結果為可靠時,則輸出可靠的所述識別結果。
2.根據(jù)權利要求1所述的方法,其特征在于,所述多個識別引擎包括:名片識別引擎、模板識別引擎和文本識別引擎中的至少二個; 當所述多個識別引擎包括所述名片識別引擎時,所述使用多個識別引擎,對預處理后的所述字符圖像進行識別的步驟包括: 對預處理后的所述字符圖像進行分割,獲得多個單一字符,將每個單一字符與名片識別引擎中的名片數(shù)據(jù)庫進行匹配,得到每個單一字符的相似度的判定分值,將所述每個單一字符的相似度的判定分值求和,并對求和結果進行歸一化處理,將所述歸一化處理結果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第一閾值和第二閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別,其中,所述字符圖像的第一閾值大于第二閾值; 當所述多個識別引擎包括所述文本識別引擎時,所述使用多個識別引擎,對預處理后的所述字符圖像進行識別的步驟包括:對預處理后的所述字符圖像進行分割,獲得多個單一字符,將每個單一字符與文本識別引擎中的文本數(shù)據(jù)庫進行匹配,得到每個單一字符的相似度的判定分值,將所述每個單一字符的相似度的判定分值求和,并對求和結果進行歸一化處理,將所述歸一化處理結果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第三閾值和第四閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別,其中,所述字符圖像的第三閾值大于第四閾值; 當所述多個識別引擎包括所述模板識別引擎時,所述使用多個識別引擎,對預處理后的所述字符圖像進行識別的步驟包括: 對預處理后的所述字符圖像進行分割,獲得多個單一字符,將每個單一字符與模板識別引擎中的模板數(shù)據(jù)庫進行匹配,得到每個單一字符的相似度的判定分值,將所述每個單一字符的相似度的判定分值求和,并對求和結果進行歸一化處理,將所述歸一化處理結果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第五閾值和第六閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別,其中,所述字符圖像的第五閾值大于第六閾值。
3.根據(jù)權利要求2所述的方法,其特征在于,將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第一閾值和第二閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別包括: 若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第一閾值時,則輸出可靠的所述識別結果; 若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第二閾值時,輸出不可靠的所述識別結果,在確定還有未使用的識別引擎時,繼續(xù)調(diào)用未使用的識別引擎對預處理后的所述字符圖像進行識別。
4.根據(jù)權利要求2所述的方法,其特征在于,將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第三閾值和第四閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別包括:若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第三閾值時,則輸出可靠的所述識別結果; 若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第四閾值時,輸出不可靠的所述識別結果,在確定還有未使用的識別引擎時,繼續(xù)調(diào)用未使用的識別引擎對預處理后的所述字符圖像進行識別。
5.根據(jù)權利要求2所述的方法,其特征在于,將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第五閾值和第六閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別包括:若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第五閾值時,則輸出可靠的所述識別結果; 若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第六閾值時,輸出不可靠的所述識別結果,在確定還有未使用的識別引擎時,繼續(xù)調(diào)用未使用的識別引擎對預處理后的所述字符圖像進行識別。
6.根據(jù)權利要求3、4或5所述的方法,其特征在于,還包括:若多個識別引擎識別出的多個識別結果中的至少一個識別結果在可靠與不可靠之間,則比較多個識別引擎識別出的字符圖像的相似度的判定分值的平均值,選擇字符圖像的相似度的判定分值的平均值中最大值作為字符圖像的識別結果。
7.一種圖像的處理裝置,其特征在于,包括: 獲取模塊,用于獲取待識別的圖像,其中,所述待識別的圖像中包括字符圖像; 處理模塊,用于將獲取的圖像進行切邊處理,得到包含所述字符圖像的、有效的待識別圖像范圍; 預處理模塊,用于將所述有效的待識別圖像范圍內(nèi)的圖像進行預處理,獲得預處理后的所述字符圖像; 識別模塊,用于使用多個識別引擎,對預處理后的所述字符圖像進行識別; 輸出模塊,用于當確定預處理后的所述字符圖像與所述多個識別引擎中的至少一個識別引擎的識別結果為可靠時,則輸出可靠的所述識別結果。
8.根據(jù)權利要求7所述的裝置,其特征在于,所述多個識別引擎包括:名片識別引擎、模板識別引擎、文本識別引擎中的至少二個; 所述識別模塊,用于: 當所述多個識別引擎包括所述名片識別引擎時,所述使用多個識別引擎,對預處理后的所述字符圖像進行識別包括:對預處理后的所述字符圖像進行分割,獲得多個單一字符,將每個單一字符與名片識別引擎中的名片數(shù)據(jù)庫進行匹配,得到每個單一字符的相似度的判定分值,將所述每個單一字符的相似度的判定分值求和,并對求和結果進行歸一化處理,將所述歸一化處理結果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第一閾值和第二閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別,其中,所述字符圖像的第一閾值大于第二閾值; 當所述多個識別引擎包括所述文本識別引擎時,所述使用多個識別引擎,對預處理后的所述字符圖像進行識別包括:對預處理后的所述字符圖像進行分割,獲得多個單一字符,將每個單一字符與文本識別引擎中的文本數(shù)據(jù)庫進行匹配,得到每個單一字符的相似度的判定分值,將所述每個單一字符的相似度的判定分值求和,并對求和結果進行歸一化處理,將所述歸一化處理結果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第三閾值和第四閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別,其中,所述字符圖像的第三閾值大于第四閾值; 當所述多個識別引擎包括所述模板識別引擎時,所述使用多個識別引擎,對預處理后的所述字符圖像進行識別包括:對預處理后的所述字符圖像進行分割,獲得多個單一字符,將每個單一字符與模板識別引擎中的模板數(shù)據(jù)庫進行匹配,得到每個單一字符的相似度的判定分值,將所述每個單一字符的相似度的判定分值求和,并對求和結果進行歸一化處理,將所述歸一化處理結果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第五閾值和第六閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別,其中,所述字符圖像的第五閾值大于第六閾值。
9.根據(jù)權利要求8所述的裝置,其特征在于,所述識別模塊在將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第一閾值和第二閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別時: 若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第一閾值時,則輸出可靠的所述識別結果; 若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第二閾值時,輸出不可靠的所述識別結果,在確定還有未使用的識別引擎時,繼續(xù)調(diào)用未使用的識別引擎對預處理后的所述字符圖像進行識別。
10.根據(jù)權利要求8所述的裝置,其特征在于,所述識別模塊在將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第三閾值和第四閾值進行比較,根據(jù)比較結果對所述字符圖像進行識別時: 若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第三閾值時,則輸出可靠的所述識別結果; 若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第四閾值時,輸出不可靠的所述識別結果,在確定還有未使用的識別引擎時,繼續(xù)調(diào)用未使用的識別引擎對預處理后的所述字符圖像進行識別。
【文檔編號】G06K9/00GK104239853SQ201410429608
【公開日】2014年12月24日 申請日期:2014年8月27日 優(yōu)先權日:2014年8月27日
【發(fā)明者】李健, 蘭志才, 張連毅, 武衛(wèi)東 申請人:北京捷通華聲語音技術有限公司