專利名稱:用于電力通信機房啞設(shè)備標(biāo)識牌的文字識別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及標(biāo)識牌的文字識別技術(shù),特別是涉及用于電力通信機房啞設(shè)備標(biāo)識牌的文字識別方法。
背景技術(shù):
電力系統(tǒng)設(shè)備種類繁多,由于很多電力通信機房是早期建設(shè),很多設(shè)備都沒有采用各種先進技術(shù)進行管理,造成大量設(shè)備登記信息不足,雖然部分設(shè)備有人工貼上一維碼標(biāo)簽,但還是存在很多沒有進行設(shè)備信息建檔工作及日常維護實時同步設(shè)備信息等情況,從而造成越來越多“啞設(shè)備”存在。為了解決啞設(shè)備問題,目前普遍采用的方法就是通過人工現(xiàn)場重新登記管理,但這對于電力系統(tǒng)將是一項非常龐大的工程,沒有更優(yōu)秀的技術(shù)手段輔助將會造成大量的人力物力投入,并且周期也非常長。因此如何在電力系統(tǒng)中怎樣快速高效管理維護這些啞設(shè)備,以啞設(shè)備智能管理手段有效的減輕人力物力投入,已成為一個非常急需解決的重大問題。文字識別技術(shù)在各個領(lǐng)域應(yīng)用已非常成熟,如車牌識別技術(shù)、圖書文字翻譯技術(shù)。字符識別的主要對象是漢字、字母和數(shù)字,而漢字其結(jié)構(gòu)非常復(fù)雜,其識別過程復(fù)雜程度遠(yuǎn)高于數(shù)字和字母。常用文符識別方法有人工神經(jīng)網(wǎng)絡(luò)法必須找尋特征,會有計算量大、耗資源等問題;模板匹配法對噪聲要求高、字符變化大影響識別率;結(jié)構(gòu)特征字符識別法對性能要求高、存儲資源大、識別速度慢;統(tǒng)計特征字符識別法相識度較高字符識別差,有時也需尋找特征,特征變化大情況下識別率低。而光學(xué)字符識別(OCR)技術(shù)是一種高速辨別圖像文字實用技術(shù),整個行業(yè)應(yīng)用最廣、最成熟。但目前OCR技術(shù)的應(yīng)用仍面臨許多技術(shù)挑戰(zhàn),現(xiàn)有OCR技術(shù)一般都是在室外亮度好或采用高清攝像頭進行拍攝,并且識別文字對象結(jié)構(gòu)特征比較固定,變化比較少,因此識別能力要求不需要太高。而對于通信機房啞設(shè)備標(biāo)牌,因機房環(huán)境燈光不足或啞設(shè)備標(biāo)牌文字清晰度不夠,而且,啞設(shè)備標(biāo)牌存在樣式多、色彩多、背景底紋多、面積大小、文字大小、字體類型多等情況下都會影響OCR識別的準(zhǔn)確率和識別速度。另外,目前的智能手機系統(tǒng)、平板電腦操作系統(tǒng),它們的處理速度遠(yuǎn)遠(yuǎn)低于個人電腦的操作系統(tǒng),在這種情況下,如何在手機或平板電腦應(yīng)用OCR技術(shù),并提高其識別速度和準(zhǔn)確性?這就成為了 OCR技術(shù)進一步發(fā)展的瓶頸。
發(fā)明內(nèi)容
基于此,有必要針對上述問題,提供一種用于電力通信機房啞設(shè)備標(biāo)識牌的文字識別方法,能夠快速高效管理維護啞設(shè)備,實現(xiàn)啞設(shè)備管理的智能化,減輕投入的人力維護,增強信息維護的準(zhǔn)確性、及時性。一種用于電力通信機房啞設(shè)備標(biāo)識牌的文字識別方法,包括提取啞設(shè)備標(biāo)志牌圖像,對該圖像進行二值化處理,獲得優(yōu)化圖片;根據(jù)所述優(yōu)化圖片中橫向粘連的像素點,對每行字的圖像進行切割;再根據(jù)每行字的圖像中縱向粘連的像素點,對每個單字的圖像進行切割;
由起始行到終止行的單字圖片組成文字組圖,將所述文字組圖中的單字圖片與標(biāo) 志牌特征庫的樣本字進行對比,按對比的準(zhǔn)確率確定識別字符,獲得字符串;
將所述字符串與所述標(biāo)志牌特征庫的信息分類項進行匹配,顯示匹配結(jié)果并存入 設(shè)備資源管理檔案。
相應(yīng)地,一種用于電力通信機房啞設(shè)備標(biāo)識牌的文字識別裝置,包括
預(yù)處理單元,用于提取啞設(shè)備標(biāo)志牌圖像,對該圖像進行二值化處理,獲得優(yōu)化圖 片;
與所述預(yù)處理單元相連的圖片切割單元,用于根據(jù)所述優(yōu)化圖片中橫向粘連的像 素點,對每行字的圖像進行切割;再根據(jù)每行字的圖像中縱向粘連的像素點,對每個單字的 圖像進行切割;
與所述圖片切割單元相連的字符對比單元,用于由起始行到終止行的單字圖片組 成文字組圖,將所述文字組圖中的單字圖片與標(biāo)志牌特征庫的樣本字進行對比,按對比的 準(zhǔn)確率確定識別字符,獲得字符串;
與所述字符對比單元相連的匹配歸檔單元,用于將所述字符串與所述標(biāo)志牌特征 庫的信息分類項進行匹配,顯示匹配結(jié)果并存入設(shè)備資源管理檔案。
實施本發(fā)明,具有如下有益效果
本發(fā)明技術(shù)將以O(shè)CR圖像分析處理技術(shù)對電力通信機房的啞設(shè)備進行智能化管 理。通過平板電腦或智能手機拍攝啞設(shè)備上的標(biāo)牌文字,以O(shè)CR圖像分析處理技術(shù)自動分 析標(biāo)牌照片的文字信息并結(jié)合設(shè)備資源系統(tǒng)關(guān)聯(lián)應(yīng)用后形成全新的物聯(lián)網(wǎng)管理工作模式, 如啞設(shè)備快速建檔應(yīng)用、啞設(shè)備屬性快速查詢、啞設(shè)備二維碼標(biāo)簽快速制作等,為啞設(shè)備提 供優(yōu)秀、高效的技術(shù)手段。
圖1為本發(fā)明電力通信機房啞設(shè)備標(biāo)識牌的文字識別方法的流程圖2為本發(fā)明電力通信機房啞設(shè)備標(biāo)識牌的文字識別方法的實施例流程圖3為本發(fā)明電力通信機房啞設(shè)備標(biāo)識牌的文字識別裝置的示意圖4為本發(fā)明電力通信機房啞設(shè)備標(biāo)識牌的文字識別裝置的實施例示意圖。
具體實施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖對本發(fā)明作進一 步地詳細(xì)描述。
圖1為本發(fā)明電力通信機房啞設(shè)備標(biāo)識牌的文字識別方法的流程圖,包括
SlOl :提取啞設(shè)備標(biāo)志牌圖像,對該圖像進行二值化處理,獲得優(yōu)化圖片;
S102 :根據(jù)所述優(yōu)化圖片中橫向粘連的像素點,對每行字的圖像進行切割;再根 據(jù)每行字的圖像中縱向粘連的像素點,對每個單字的圖像進行切割;
S103:由起始行到終止行的單字圖片組成文字組圖,將所述文字組圖中的單字圖 片與標(biāo)志牌特征庫的樣本字進行對比,按對比的準(zhǔn)確率確定識別字符,獲得字符串;
S104:將所述字符串與所述標(biāo)志牌特征庫的信息分類項進行匹配,顯示匹配結(jié)果 并存入設(shè)備資源管理檔案。
OCR (Optical Character Recognition,光學(xué)字符識別)是指電子設(shè)備(例如平板電腦、智能手機、掃描儀或數(shù)碼相機)檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過程;即對文本資料進行掃描,然后對圖像文件進行分析處理,獲取文字及版面信息的過程。本發(fā)明技術(shù)將以O(shè)CR圖像分析處理技術(shù)對電力通信機房的啞設(shè)備進行智能化管理。通過平板電腦或智能手機拍攝啞設(shè)備上的標(biāo)牌文字,以O(shè)CR圖像分析處理技術(shù)自動分析標(biāo)牌照片的文字信息并結(jié)合設(shè)備資源系統(tǒng)關(guān)聯(lián)應(yīng)用后形成全新的物聯(lián)網(wǎng)管理工作模式,如啞設(shè)備快速建檔應(yīng)用、啞設(shè)備屬性快速查詢、啞設(shè)備二維碼標(biāo)簽快速制作等,為啞設(shè)備提供優(yōu)秀、高效的技術(shù)手段。本發(fā)明技術(shù)對電力系統(tǒng)中設(shè)備標(biāo)牌中的字符識別技術(shù)進行研究,對設(shè)備標(biāo)牌中的字符識別系統(tǒng)的每一個模塊進行了研究及實現(xiàn)。整個方案由圖象預(yù)處理、字符識別、設(shè)備信息提取分解三個部分組成,方案的技術(shù)輸入是單張啞設(shè)備標(biāo)牌圖象,而預(yù)處理部分為圖片提取、二值化和傾斜矯正,以混識辨別引擎實現(xiàn)字符識別和標(biāo)牌信息提取分解匹配管理。具體地,進行圖象預(yù)處理時,采用圖像濾波處理、直方圖灰度修正以及灰度圖像對比技術(shù)把設(shè)備信息區(qū)域圖的部分突出出來。為了進行有效的識別,還可以采用閾值法進行標(biāo)牌圖像的二值化。通過對其標(biāo)牌二值化,提取標(biāo)牌圖像中的鋼印信息。最后,進行標(biāo)牌圖像的邊緣檢測和分割,再采用基于光學(xué)字符識別(OCR)的技術(shù)以及MATLAB軟件算法完成對標(biāo)牌字符的識別。需要補充說明的是,本發(fā)明考慮了啞設(shè)備標(biāo)牌的格式特點進行識別。主要包括一方面,標(biāo)牌中有很多鋼印信息或打印貼紙信息,通過OCR提取標(biāo)牌特征時,需要完整的提取其特征量。另一方面,標(biāo)牌中的字符很多,尤其是所涉及的漢字比較豐富,本發(fā)明還通過漢字組成的意思表示,才實現(xiàn)智能化的匹配。圖2為本發(fā)明電力通信機房啞設(shè)備標(biāo)識牌的文字識別方法的實施例流程圖。與圖1相比,圖2為具體實施例的不意圖。本具體實施例將基于Android手機操作系統(tǒng)進行Android OCR技術(shù)開發(fā)和資源識別流程處理技術(shù)開發(fā),對于手機OCR技術(shù)將由圖像預(yù)處理、字符識別、設(shè)備信息提取分解三個部分組成,而整個方案的技術(shù)輸入將以Android手機或Android平板電腦的攝像頭拍攝單張啞設(shè)備標(biāo)牌圖像,進行圖片提取、二值化和傾斜矯正等操作,最終在Android手機操作系統(tǒng)進行快速字符識別和標(biāo)牌資源信息提取分解關(guān)聯(lián)操作。S201 :提取啞設(shè)備標(biāo)志牌圖像,對該圖像進行二值化處理,獲得優(yōu)化圖片;S202 :根據(jù)所述優(yōu)化圖片中橫向粘連的像素點,對每行字的圖像進行切割;再根據(jù)每行字的圖像中縱向粘連的像素點,對每個單字的圖像進行切割;S203:由起始行到終止行的單字圖片組成文字組圖,將所述文字組圖中的單字圖片與標(biāo)志牌特征庫的樣本字進行對比,按對比的準(zhǔn)確率確定識別字符,獲得字符串;S204:所述信息分類項包括型號、參數(shù)和種類中的至少一種,從所述字符串的起始字符開始,搜索與所述型號相匹配的由若干個起始字符組成的開頭詞組;判斷搜索成功,當(dāng)是時轉(zhuǎn)入S205 ;當(dāng)否時轉(zhuǎn)入S206 ;S205 :將開頭詞組后的內(nèi)容作為參數(shù)查詢對應(yīng)設(shè)備的詳細(xì)信息;S206 :從所述字符串的終止字符開始,搜索與所述種類相匹配的由若干個終止字符組成的結(jié)尾詞組;
判斷匹配成功,當(dāng)是時轉(zhuǎn)入S207 ;當(dāng)否時轉(zhuǎn)入S208 ;
S207 :將結(jié)尾詞組前的內(nèi)容作為參數(shù)查詢對應(yīng)設(shè)備的詳細(xì)信息;
S208 :將所述字符串作為參數(shù)查詢對應(yīng)設(shè)備的詳細(xì)信息;
S209 :顯示匹配結(jié)果并存入設(shè)備資源管理檔案。
本技術(shù)將為Android手機或Android平板電腦的開發(fā)一個拍照功能,主要實現(xiàn)調(diào) 用Android操作系統(tǒng)的拍照API進行現(xiàn)場啞設(shè)備標(biāo)牌位置拍照,完成拍照后將存儲在SD 卡中。
拍照功能將實現(xiàn)以下技術(shù)輔助拍攝提高照片成像效果
I)拍照功能自動控制是否因機房拍攝區(qū)域燈光不足自動開啟閃光燈輔助拍攝,提 高照片燈光亮度,提升識別率;
2)拍照功能自動控制攝像頭焦點自動識別標(biāo)牌照片在最清晰及定位標(biāo)牌中心點 的情況下自動完成拍攝。
第一部分,啞設(shè)備標(biāo)牌圖像提取與圖像二值化處理
采用平板電腦、智能手機對當(dāng)前啞設(shè)備標(biāo)牌位置進行拍照,由于某些機房區(qū)域燈 光不足,可利用終端所帶的閃光燈輔助拍攝。完成拍照后將進行標(biāo)牌圖像的優(yōu)化處理。
啞設(shè)備標(biāo)牌樣式多、色彩多、背景底紋多、面積大小差異大等情況,采用黑白轉(zhuǎn)換 方式將會嚴(yán)重丟失圖像信息。本發(fā)明技術(shù)將以得到精細(xì)的圖像信息為前提采用圖像二值化 灰度進行轉(zhuǎn)換,充分提高識別率。同時為了更加適應(yīng)啞設(shè)備標(biāo)牌特點,本技術(shù)將對啞設(shè)備 標(biāo)牌進行3X3分塊切割,切割的作用主要是采用多線程方式進行快速處理,并且圖像越小 其識別率越可提高;實施按塊進行二值化灰度轉(zhuǎn)換,圖像二值化灰度轉(zhuǎn)換的優(yōu)點在于可避 免圖像邊緣色彩過重、背景分散重疊等情況造成二值化圖像失真,影響識別率。
拍照過程中,照片會經(jīng)常出現(xiàn)傾斜或偏移,將影響圖象識別成功率。系統(tǒng)將基于黑 白像素交替點模擬計算傾斜矯正后的平衡水平值,以最高平衡水平作為基值完成矯正,進 而保證標(biāo)牌圖像分析和行分割的正確性。
本發(fā)現(xiàn)技術(shù)提供以下處理技術(shù)完成標(biāo)牌照片傾斜偏移矯正處理
I)對標(biāo)牌照片基于黑白像素交替點模擬計算傾斜矯正后的平衡水平值,以最高平 衡水平作為矯正基值;
2)以矯正基值進行傾斜偏移處理;
3)進行邊緣過重識別和切邊處理。
第二部分,字符識別
由于啞設(shè)備標(biāo)牌中包含中文、英文、數(shù)字、標(biāo)點,可能還會有其他國外語言,目前本 發(fā)明技術(shù)只適用于簡體中文、英文、數(shù)字、標(biāo)點等識別。啞設(shè)備標(biāo)牌中字符字體樣式也存在 多樣化,有些非常大,有些非常少,有些還有文字背景色。并且一些字符字體也采會宋體、黑 體、綜藝、楷體等等。因此,多字體多模式多樣式的混識辨別引擎是本發(fā)明技術(shù)的最大特點。
混識辨別弓I擎將對標(biāo)牌圖像切割出每個字符。對二值化好的標(biāo)牌小塊圖像進行每 行黑白像素點識別,算出每行字符的起始和結(jié)束坐標(biāo)值,完成每行字符圖像切圖;對每行文 字圖像繼續(xù)縱向逐列切字處理,同樣以黑白像素點,找出行圖像的每個文字起始和結(jié)束坐 標(biāo),完成將得到每個字的單獨圖像。
本技術(shù)方案中將建設(shè)一個電力機房設(shè)備標(biāo)牌信息字典庫,字典庫將含有各種標(biāo)牌的樣式、圖像結(jié)構(gòu)、相關(guān)產(chǎn)品數(shù)據(jù)特征等字典值。對于切割出來的單個字圖像將在字典庫中進行文字識別學(xué)習(xí)處理,混識辨別引擎對單個字圖像分析出特征值組,然后與字典庫標(biāo)準(zhǔn)樣本的特征值組進行匹配,將按準(zhǔn)確率值由高到低進行篩選。第三部分,匹配分析本技術(shù)已收集大量電力機房設(shè)備標(biāo)牌信息項庫,對OCR識別出的字符數(shù)據(jù)將在標(biāo)牌信息字典庫進行字符挖掘分析,分析出最符合的標(biāo)牌信息字典組。如分析出的標(biāo)牌信息字典組存在“型號”屬性項,那么本技術(shù)將“型號”兩字后面范圍的字符,作為型號值提交給通信資源系統(tǒng)進行型號匹配查詢從而得到當(dāng)前啞設(shè)備詳細(xì)信息。如分析出的標(biāo)牌信息字典組找不到屬性項,只有相關(guān)內(nèi)容,如70P0380110DF配線單元,那么本技術(shù)將優(yōu)先分析中文字符,從標(biāo)牌信息字典庫找出屬于ODF配線單元的相關(guān)信息,得到所屬設(shè)備種類后向通信資源系統(tǒng)提交ODF設(shè)備型號70P03801,從而得到當(dāng)前啞設(shè)備詳細(xì)信息。否則,將整個字符串作為參數(shù)查詢對應(yīng)設(shè)備的詳細(xì)信息。最后,顯示匹配結(jié)果并存入設(shè)備資源管理檔案。圖3為本發(fā)明電力通信機房啞設(shè)備標(biāo)識牌的文字識別裝置的示意圖,包括預(yù)處理單元,用于提取啞設(shè)備標(biāo)志牌圖像,對該圖像進行二值化處理,獲得優(yōu)化圖片;與所述預(yù)處理單元相連的圖片切割單元,用于根據(jù)所述優(yōu)化圖片中橫向粘連的像素點,對每行字的圖像進行切割;再根據(jù)每行字的圖像中縱向粘連的像素點,對每個單字的圖像進行切割;與所述圖片切割單元相連的字符對比單元,用于由起始行到終止行的單字圖片組成文字組圖,將所述文字組圖中的單字圖片與標(biāo)志牌特征庫的樣本字進行對比,按對比的準(zhǔn)確率確定識別字符,獲得字符串;與所述字符對比單元相連的匹配歸檔單元,用于將所述字符串與所述標(biāo)志牌特征庫的信息分類項進行匹配,顯示匹配結(jié)果并存入設(shè)備資源管理檔案。圖3與圖1相對應(yīng),圖中各個單元的運行方式與方法中的相同。圖4為本發(fā)明電力通信機房啞設(shè)備標(biāo)識牌的文字識別裝置的實施例示意圖。所述信息分類項包括型號、參數(shù)和種類中的至少一種,如圖4所示,所述匹配歸檔單元,包括型號匹配單元,用于從所述字符串的起始字符開始,搜索與所述型號相匹配的由若干個起始字符組成的開頭詞組;在搜索到的時候,將開頭詞組后的內(nèi)容作為參數(shù)查詢對應(yīng)設(shè)備的詳細(xì)信息;與所述型號匹配單元相連的種類匹配單元,用于在沒有搜索到的時候,從所述字符串的終止字符開始,搜索與所述種類相匹配的由若干個終止字符組成的結(jié)尾詞組;當(dāng)匹配成功,將結(jié)尾詞組前的內(nèi)容作為參數(shù)查詢對應(yīng)設(shè)備的詳細(xì)信息;當(dāng)匹配失敗,將所述字符串作為參數(shù)查詢對應(yīng)設(shè)備的詳細(xì)信息。如圖4所示,預(yù)處理單元,還包括傾斜校正單元,用于基于黑白像素點的交替模擬計算平衡水平值,對圖像進行傾斜校正處理。
所述標(biāo)志牌特征庫包括宋體字庫、黑體字庫、綜藝字庫、楷體字庫,如圖4所示,所 述字符對比單元,包括
字庫篩選單元,用于將所述文字組圖中的單字圖片分別與宋體字庫、黑體字庫、綜 藝字庫、楷體字庫的樣本字進行對比,按準(zhǔn)確率由高到低進行篩選,確定識別字符。
圖4與圖2相對應(yīng),圖中各個單元的運行方式與方法中的相同。
以上所述實施例僅表達了本發(fā)明的幾種實施方式,其描述較為具體和詳細(xì),但并 不能因此而理解為對本發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是,對于本領(lǐng)域的普通技術(shù)人員 來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進,這些都屬于本發(fā)明的保 護范圍。因此,本發(fā)明專利的保護范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。
權(quán)利要求
1.一種電力通信機房啞設(shè)備標(biāo)識牌的文字識別方法,其特征在于,包括 提取啞設(shè)備標(biāo)志牌圖像,對該圖像進行二值化處理,獲得優(yōu)化圖片; 根據(jù)所述優(yōu)化圖片中橫向粘連的像素點,對每行字的圖像進行切割;再根據(jù)每行字的圖像中縱向粘連的像素點,對每個單字的圖像進行切割; 由起始行到終止行的單字圖片組成文字組圖,將所述文字組圖中的單字圖片與標(biāo)志牌特征庫的樣本字進行對比,按對比的準(zhǔn)確率確定識別字符,獲得字符串; 將所述字符串與所述標(biāo)志牌特征庫的信息分類項進行匹配,顯示匹配結(jié)果并存入設(shè)備資源管理檔案。
2.根據(jù)權(quán)利要求1所述的電力通信機房啞設(shè)備標(biāo)識牌的文字識別方法,其特征在于,所述信息分類項包括型號、參數(shù)和種類中的至少一種,將所述字符串與所述標(biāo)志牌特征庫的信息分類項進行匹配的步驟,包括 從所述字符串的起始字符開始,搜索與所述型號相匹配的由若干個起始字符組成的開頭詞組; 當(dāng)搜索到的時候,將開頭詞組后的內(nèi)容作為參數(shù)查詢對應(yīng)設(shè)備的詳細(xì)信息; 當(dāng)沒有搜索到的時候,從所述字符串的終止字符開始,搜索與所述種類相匹配的由若干個終止字符組成的結(jié)尾詞組;當(dāng)匹配成功,將結(jié)尾詞組前的內(nèi)容作為參數(shù)查詢對應(yīng)設(shè)備的詳細(xì)信息;當(dāng)匹配失敗,將所述字符串作為參數(shù)查詢對應(yīng)設(shè)備的詳細(xì)信息。
3.根據(jù)權(quán)利要求1或2所述的電力通信機房啞設(shè)備標(biāo)識牌的文字識別方法,其特征在于,對該圖像進行二值化處理的步驟之后,獲得優(yōu)化圖片的步驟之前,還包括 基于黑白像素點的交替模擬計算平衡水平值,對圖像進行傾斜校正處理。
4.根據(jù)權(quán)利要求1或2所述的電力通信機房啞設(shè)備標(biāo)識牌的文字識別方法,其特征在于,所述標(biāo)志牌特征庫包括宋體字庫、黑體字庫、綜藝字庫、楷體字庫,將所述文字組圖中的單字圖片與標(biāo)志牌特征庫的樣本字進行對比,按對比的準(zhǔn)確率確定識別字符的步驟包括 將所述文字組圖中的單字圖片分別與宋體字庫、黑體字庫、綜藝字庫、楷體字庫的樣本字進行對比,按準(zhǔn)確率由高到低進行篩選,確定識別字符。
5.一種電力通信機房啞設(shè)備標(biāo)識牌的文字識別裝置,其特征在于,包括 預(yù)處理單元,用于提取啞設(shè)備標(biāo)志牌圖像,對該圖像進行二值化處理,獲得優(yōu)化圖片; 與所述預(yù)處理單元相連的圖片切割單元,用于根據(jù)所述優(yōu)化圖片中橫向粘連的像素點,對每行字的圖像進行切割;再根據(jù)每行字的圖像中縱向粘連的像素點,對每個單字的圖像進行切割; 與所述圖片切割單元相連的字符對比單元,用于由起始行到終止行的單字圖片組成文字組圖,將所述文字組圖中的單字圖片與標(biāo)志牌特征庫的樣本字進行對比,按對比的準(zhǔn)確率確定識別字符,獲得字符串; 與所述字符對比單元相連的匹配歸檔單元,用于將所述字符串與所述標(biāo)志牌特征庫的信息分類項進行匹配,顯示匹配結(jié)果并存入設(shè)備資源管理檔案。
6.根據(jù)權(quán)利要求5所述的電力通信機房啞設(shè)備標(biāo)識牌的文字識別裝置,其特征在于,所述信息分類項包括型號、參數(shù)和種類中的至少一種,所述匹配歸檔單元,包括 型號匹配單元,用于從所述字符串的起始字符開始,搜索與所述型號相匹配的由若干個起始字符組成的開頭詞組;在搜索到的時候,將開頭詞組后的內(nèi)容作為參數(shù)查詢對應(yīng)設(shè)備的詳細(xì)信息;與所述型號匹配單元相連的種類匹配單元,用于在沒有搜索到的時候,從所述字符串的終止字符開始,搜索與所述種類相匹配的由若干個終止字符組成的結(jié)尾詞組;當(dāng)匹配成功,將結(jié)尾詞組前的內(nèi)容作為參數(shù)查詢對應(yīng)設(shè)備的詳細(xì)信息;當(dāng)匹配失敗,將所述字符串作為參數(shù)查詢對應(yīng)設(shè)備的詳細(xì)信息。
7.根據(jù)權(quán)利要求5或6所述的電力通信機房啞設(shè)備標(biāo)識牌的文字識別裝置,其特征在于,預(yù)處理單元,還包括傾斜校正單元,用于基于黑白像素點的交替模擬計算平衡水平值,對圖像進行傾斜校正處理。
8.根據(jù)權(quán)利要求5或6所述的電力通信機房啞設(shè)備標(biāo)識牌的文字識別裝置,其特征在于,所述標(biāo)志牌特征庫包括宋體字庫、黑體字庫、綜藝字庫、楷體字庫,所述字符對比單元, 包括字庫篩選單元,用于將所述文字組圖中的單字圖片分別與宋體字庫、黑體字庫、綜藝字庫、楷體字庫的樣本字進行對比,按準(zhǔn)確率由高到低進行篩選,確定識別字符。
全文摘要
本發(fā)明公開了用于電力通信機房啞設(shè)備標(biāo)識牌的文字識別方法,包括提取啞設(shè)備標(biāo)志牌圖像,對該圖像進行二值化處理,獲得優(yōu)化圖片;根據(jù)所述優(yōu)化圖片中橫向粘連的像素點,對每行字的圖像進行切割;再根據(jù)每行字的圖像中縱向粘連的像素點,對每個單字的圖像進行切割;由起始行到終止行的單字圖片組成文字組圖,將所述文字組圖中的單字圖片與標(biāo)志牌特征庫的樣本字進行對比,按對比的準(zhǔn)確率確定識別字符,獲得字符串;將所述字符串與所述標(biāo)志牌特征庫的信息分類項進行匹配,顯示匹配結(jié)果并存入設(shè)備資源管理檔案。采用本發(fā)明,可以加快人工處理效率。因此本發(fā)明技術(shù)在電力系統(tǒng)對啞設(shè)備管理具有廣泛的實際應(yīng)用價值和重要的學(xué)術(shù)意義。
文檔編號G06K9/54GK103065146SQ201210568460
公開日2013年4月24日 申請日期2012年12月24日 優(yōu)先權(quán)日2012年12月24日
發(fā)明者張正峰, 顏曉強, 蔣康明, 李偉堅, 朱文紅, 黃平, 付佳佳, 竇錚, 李增城, 巫海青 申請人:廣東電網(wǎng)公司電力調(diào)度控制中心, 廣東凱通軟件開發(fā)有限公司