專利名稱:一種通過多個(gè)圖象光識(shí)別郵件的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種在一自動(dòng)地址讀取系統(tǒng)中處理郵件的方法,其中一多級(jí)灰度圖像由包含地址信息的每件物品的表面構(gòu)成,該多級(jí)灰度圖像被轉(zhuǎn)換成第一個(gè)二值圖像,該二值圖像被送至一光學(xué)字符讀取(OCR)單元,對(duì)所述地址信息進(jìn)行第一次自動(dòng)估計(jì)。
該方法特別適用于自動(dòng)郵件分類裝置,其中對(duì)地址信息進(jìn)行自動(dòng)估計(jì),從而對(duì)郵件進(jìn)行向外或向內(nèi)的分類。
背景技術(shù):
在上述這類處理郵件的已知方法中,在處理大量圖像時(shí),將多級(jí)灰度圖像轉(zhuǎn)換成二值圖像的過程涉及到越來越復(fù)雜的運(yùn)算方法。尤其是,在地址信息的標(biāo)志和圖像背景之間的對(duì)比度較低,地址信息很難讀取的情況下,已經(jīng)研發(fā)出運(yùn)算方法用于將多級(jí)灰度圖像二進(jìn)制化,其中地址信息的字符間距或多或少地比較遠(yuǎn),所述間距依賴于字符是手寫的還是由機(jī)器打印出來的,所述機(jī)器可以是點(diǎn)矩陣打印機(jī)、激光打印機(jī)等等。
盡管這些二進(jìn)制算法的性能得到了改進(jìn),然而實(shí)際上,由于不適當(dāng)?shù)亩M(jìn)制化使得不能對(duì)地址信息進(jìn)行明確地確認(rèn),或者由于不適當(dāng)?shù)亩M(jìn)制化使得地址信息被讀錯(cuò),在自動(dòng)郵件分類裝置中成批次的郵件仍然含有被拒絕的郵件。
美國專利No.6282314公開一種分析可能含有字符和表格的圖像的方法,其中圖像被二進(jìn)制化從而隔離可由OCR讀取的含有字符和圖像的各部分。美國專利No.4747149公開了一種分析圖像的方法,其中以多種不同方式并行地進(jìn)行二進(jìn)制化,并且對(duì)最佳的二值圖像OCR處理。
發(fā)明內(nèi)容
為了提高讀取成功率并降低出錯(cuò)率,本發(fā)明的目的是對(duì)上述處理物品的方法提出改進(jìn)。
為此目的,本發(fā)明提出一種在一自動(dòng)地址讀取系統(tǒng)中處理郵件的方法,其中一多級(jí)灰度圖像由包含地址信息的每件物品的表面構(gòu)成,該多級(jí)灰度圖像被轉(zhuǎn)換成第一個(gè)二值圖像,該二值圖像被送至一光學(xué)字符讀取(OCR)單元對(duì)所述地址信息進(jìn)行第一次自動(dòng)估計(jì),該方法具有以下特征從多級(jí)灰度圖像和/或二值圖像和/或自動(dòng)數(shù)據(jù)估計(jì)的結(jié)果中提取出代表某一類別地址信息標(biāo)志的標(biāo)記,考慮到所述標(biāo)記所代表的類別,將所述多級(jí)灰度圖像再次轉(zhuǎn)換成第二個(gè)二值圖像,并且將第二個(gè)二值圖像傳送至一OCR單元,以進(jìn)行第二次自動(dòng)估計(jì)。
本發(fā)明的方法具有下列特征·構(gòu)成上述信號(hào)的數(shù)據(jù)包括指示在多級(jí)灰度圖像的地址信息標(biāo)志中對(duì)比度的第一統(tǒng)計(jì)數(shù)據(jù)、指示在第一個(gè)二值圖像中地址信息標(biāo)志的印刷質(zhì)量的第二統(tǒng)計(jì)數(shù)據(jù)、指示地址信息標(biāo)志類型(手寫圖像或機(jī)器打印標(biāo)志)的第三統(tǒng)計(jì)數(shù)據(jù),以及有關(guān)單詞和字符識(shí)別質(zhì)量的第四統(tǒng)計(jì)數(shù)據(jù);·將多級(jí)灰度圖像第二次轉(zhuǎn)換成二值圖像包括根據(jù)地址信息標(biāo)志類別從多個(gè)二進(jìn)制過程中選擇一個(gè)特定的二進(jìn)制處理過程;·通過一分類器選擇出上述特定的處理過程,所述分類器接收構(gòu)成標(biāo)記的數(shù)據(jù)作為其輸入;和·組合第一次自動(dòng)估計(jì)結(jié)果和第二次自動(dòng)估計(jì)結(jié)果,從而得到地址信息。
在本發(fā)明的方法中,多級(jí)灰度圖像的第一次轉(zhuǎn)換采用一種所謂“通用”的二進(jìn)制算法,也就是說,這種算法并不特別適用于一特定的地址信息標(biāo)志類別。術(shù)語“標(biāo)志類別”表示根據(jù)標(biāo)志是手寫的還是機(jī)器打印的結(jié)果對(duì)標(biāo)志進(jìn)行分類;在多級(jí)灰度圖像中標(biāo)志是低對(duì)比度寫成的,或者在多級(jí)灰度圖像中標(biāo)志是高對(duì)比度寫成的;標(biāo)志是用點(diǎn)矩陣打印機(jī)打印的,或者標(biāo)志的字符是用激光打印機(jī)打印的;標(biāo)志中的字符是拆開的,或者標(biāo)志中的字符是連在一起的等等。本技術(shù)領(lǐng)域的技術(shù)人員知道“通用”二進(jìn)制算法在地址信息標(biāo)志的多個(gè)類別中具有令人滿意的統(tǒng)計(jì)效果。
與此相比,多級(jí)灰度圖像的第二次轉(zhuǎn)換采用一種特定的二進(jìn)制算法,也就是說,該算法特定適用于一種地址信息標(biāo)志類別。作為非限制性實(shí)例,本技術(shù)領(lǐng)域的技術(shù)人員知道,基于拉普拉斯型卷積的二進(jìn)制算法適用于低對(duì)比度的圖像;基于統(tǒng)計(jì)閾值的二進(jìn)制算法適用于高對(duì)比度的圖像;使像素值達(dá)到平均數(shù)的低通濾波的二進(jìn)制算法適用于由點(diǎn)陣打印機(jī)打印出的標(biāo)志。
下面對(duì)本發(fā)明方法的實(shí)施過程進(jìn)行描述,并在附圖中表示出來。
圖1為本發(fā)明方法的方塊示意圖。
圖2表示如何將兩個(gè)自動(dòng)估計(jì)結(jié)果組合起來的示意圖。
具體實(shí)施例方式
本發(fā)明所依據(jù)的思想是在對(duì)地址信息進(jìn)行第一次自動(dòng)估計(jì)之后,對(duì)包括地址信息的多級(jí)灰度圖像進(jìn)行第二次二值處理,對(duì)于地址信息標(biāo)志的某些特定的特征,第二次二值處理將比第一次二值處理更加合適。
在圖1中,郵件表面的包含地址信息的多級(jí)灰度圖像MNG首先被通用的第一次二值處理Bin1轉(zhuǎn)換成第一個(gè)二值圖像NB1。
為了對(duì)地址信息進(jìn)行第一次自動(dòng)估計(jì)OCR1,該第一個(gè)二值圖像NB1被傳送至一個(gè)OCR單元。
從多級(jí)灰度圖像MNG和/或從二值圖像NB1和/或從自動(dòng)估計(jì)OCR1的結(jié)果中提取出構(gòu)成標(biāo)記SGN1、SGN2的數(shù)據(jù)。這些數(shù)據(jù)的提取用箭號(hào)E1和E2表示。
舉例來說,SGN1標(biāo)記部分包含·從自動(dòng)估計(jì)OCR1連同有關(guān)地址信息標(biāo)志類別(手寫/機(jī)打)的指示中所提取的數(shù)據(jù);·由處理OCR1所得到的二值圖像中二維地址模塊的坐標(biāo);·從二值圖像Bin1、自動(dòng)估計(jì)OCR1和有關(guān)地址信息標(biāo)志印刷質(zhì)量的指示中所提取的統(tǒng)計(jì)數(shù)據(jù)互連組份(interconnected components)(二值圖象的象素串)的平均密度;地址信息中每一字符的互連組份數(shù);每一互連組份的字符數(shù);每一字符的寄生(parasite)數(shù);整個(gè)地址模塊中最佳侯選物的識(shí)別得分的平均值。
SGN2信號(hào)部分包含,例如,從多級(jí)灰度圖像中提取出的統(tǒng)計(jì)數(shù)據(jù),代表多級(jí)灰度圖像中地址信息標(biāo)志的對(duì)比度多級(jí)灰度圖象中字符的平均灰度水平;字符灰度直方圖的標(biāo)準(zhǔn)差;多級(jí)灰度圖像的背景的平均灰度水平;多級(jí)灰度圖像背景的直方圖的標(biāo)準(zhǔn)差。
在每個(gè)多級(jí)灰度圖像MNG中,所提取出的數(shù)據(jù)構(gòu)成標(biāo)記SGN1、SGN2,對(duì)地址信息標(biāo)志進(jìn)行分類。類型數(shù)據(jù)可以輸入至一個(gè)適于識(shí)別地址信息標(biāo)志類別的分類器CLA中,然后從多個(gè)專用二進(jìn)制處理方法中識(shí)別一個(gè)特定的二進(jìn)制處理方法,所述處理方法最適于該類型的標(biāo)志。此后,對(duì)所述多級(jí)灰度圖像MNG進(jìn)行上述由Bin2提供并經(jīng)分類器CLA確定的特定的二進(jìn)制處理。
本技術(shù)領(lǐng)域技術(shù)人員知道,對(duì)圖像進(jìn)行二進(jìn)制化的特定二進(jìn)制運(yùn)算方法,例如Bin2,具有一個(gè)噪聲背景,地址信息為手寫的圖像,地址信息為機(jī)器打印的圖像等。根據(jù)不同情況,這些算法在其他選擇中采用了自適應(yīng)對(duì)比、微分運(yùn)算符、低通運(yùn)算符,或者動(dòng)態(tài)閾值等。
為了對(duì)地址信息進(jìn)行第二次自動(dòng)估計(jì)OCR2,所述第二個(gè)二值圖像NB1可以被傳送至一個(gè)OCR單元。
舉例來說,分類器CLA可以是一個(gè)具有監(jiān)督訓(xùn)練的神經(jīng)網(wǎng)絡(luò),或者是一個(gè)具有模糊邏輯基本操作知識(shí)的專家系統(tǒng)。
根據(jù)本發(fā)明的方法,我們發(fā)現(xiàn),將兩個(gè)自動(dòng)估計(jì)OCR1和OCR2的結(jié)果T1和T2組合起來之后,其讀取成功率就有可能既優(yōu)于第一次自動(dòng)估計(jì)OCR1后的讀取成功率,也優(yōu)于第二次自動(dòng)估計(jì)OCR2后的讀取成功率。
我們發(fā)現(xiàn)通過將第一次自動(dòng)估計(jì)OCR1的結(jié)果T1和第二次自動(dòng)估計(jì)OCR2的T2組合起來并作為輸出,通過比較第一次自動(dòng)估計(jì)輸出的特定出錯(cuò)率以及第二次自動(dòng)估計(jì)輸出的出錯(cuò)率,有可能降低整體出錯(cuò)率。
在圖1中,用CMB表示的方塊代表將T1和T2組合起來的過程。這個(gè)組合過程在于采用從執(zhí)行第一次和第二次自動(dòng)估計(jì)的OCR單元輸出產(chǎn)生的結(jié)果向量,以及所述結(jié)果向量的可信度。組合過程還可以利用專家系統(tǒng),通過地址數(shù)據(jù)庫在語義水平上獲得的聯(lián)系,使得地址假設(shè)之間相關(guān)聯(lián)。所述組合結(jié)果T1和T2的過程的優(yōu)點(diǎn)是如果經(jīng)過OCR1處理的地址信息被拒絕,其有可能提高二值圖像NB2的讀取成功率;通過OCR2再次循環(huán)處理經(jīng)OCR1得到的分類結(jié)果從而提高整體讀取成功率。
更具體地,參照?qǐng)D2,經(jīng)過OCR1和OCR2處理有可能提取出一條或者兩條與上下文有關(guān)的地址信息,或者當(dāng)兩個(gè)二值圖像NB1和NB2都失敗時(shí),上述處理沒有提取出任何信息。按照本發(fā)明,組合CMB與上下文有關(guān)的地址信息T1和T2在于形成地址信息ADR,當(dāng)與上下文有關(guān)的兩條信息T1和T2被讀取,而且相互關(guān)聯(lián)時(shí),可以用T1=T2=>ADR=T1表示。如果與上下文有關(guān)的地址信息T1和T2中只有一個(gè)被讀取時(shí),其被保留作為所尋找的地址信息,用模塊ADR=T1或者ADR=T2表示。如果與上下文有關(guān)并且相互矛盾的信息T1和T2被讀取時(shí),此時(shí)需要進(jìn)行裁決,考慮所述與上下文有關(guān)的信息T1和T2各自的可信度,以決定保留哪個(gè)地址ADR,在圖2中用T1≠T2=>T1或者T2或者“拒絕”表示。最后,如果從二值圖像NB1和NB2中沒有提取出任一條與上下文有關(guān)的信息,則沒有地址信息形成,對(duì)應(yīng)于模塊ADR=拒絕。
權(quán)利要求
1.一種在一自動(dòng)地址讀取系統(tǒng)中處理郵件的方法,其中一多級(jí)灰度圖像(MNG)由包含地址信息(ADR)的每件物品的表面構(gòu)成,該多級(jí)灰度圖像被轉(zhuǎn)換成第一個(gè)二值圖像(NB1),并且該二值圖像被發(fā)送至一個(gè)OCR單元用于對(duì)地址信息進(jìn)行第一次自動(dòng)估計(jì)(OCR1),該方法具有以下特征從多級(jí)灰度圖像和/或二值圖像和/或自動(dòng)數(shù)據(jù)估計(jì)的結(jié)果中提取出代表某一類別的地址信息標(biāo)志的標(biāo)記(SGN1、SGN2),然后考慮所述標(biāo)記代表的類別,所述多級(jí)灰度圖像再次被轉(zhuǎn)換成第二個(gè)二值圖像(NB2),并且該第二個(gè)二值圖像被傳送到一個(gè)OCR單元用于進(jìn)行第二次自動(dòng)估計(jì)(OCR2)。
2.如權(quán)利要求1所述的方法,其中組成標(biāo)記(SGN1,SGN2)的數(shù)據(jù)包括關(guān)于多級(jí)灰度圖像的統(tǒng)計(jì)數(shù)據(jù),關(guān)于第一個(gè)二值圖像的統(tǒng)計(jì)數(shù)據(jù),和關(guān)于由第一次自動(dòng)估計(jì)(OCR1)傳送的單詞和字符的識(shí)別的統(tǒng)計(jì)數(shù)據(jù)。
3.如權(quán)利要求1或2所述的方法,其中組成標(biāo)記(SGN1,SGN2)的數(shù)據(jù)包括指示在多級(jí)灰度圖像的地址信息標(biāo)志中對(duì)比度的第一統(tǒng)計(jì)數(shù)據(jù)、指示在第一個(gè)二值圖像中地址信息標(biāo)志印刷質(zhì)量的第二統(tǒng)計(jì)數(shù)據(jù)、指示地址信息標(biāo)志類型(手寫圖像/機(jī)打標(biāo)志)的第三統(tǒng)計(jì)數(shù)據(jù)以及有關(guān)單詞和字符識(shí)別質(zhì)量的第四統(tǒng)計(jì)數(shù)據(jù)。
4.如權(quán)利要求1至3中任一項(xiàng)所述的方法,其中將多級(jí)灰度圖像第二次轉(zhuǎn)換成二值圖像在于,根據(jù)地址信息標(biāo)志類別從多個(gè)二進(jìn)制處理過程中選擇一個(gè)特定的二進(jìn)制處理方法。
5.如權(quán)利要求4所述的方法,其中該特定處理過程通過一個(gè)分類器(CLA)被選擇出,所述分類器接收構(gòu)成標(biāo)記的數(shù)據(jù)作為其輸入。
6.如權(quán)利要求5所述的方法,其中分類器(CLA)是一個(gè)具有監(jiān)督訓(xùn)練的神經(jīng)網(wǎng)絡(luò)。
7.如權(quán)利要求1至6中任一項(xiàng)所述的方法,其中為了得到地址信息(ADR),將第一次自動(dòng)估計(jì)(OCR1)和第二次自動(dòng)估計(jì)(OCR2)的結(jié)果組合起來。
全文摘要
一種在一自動(dòng)地址讀取系統(tǒng)中處理郵件的方法,其中一多級(jí)灰度圖像(MNG)由包含地址信息(ADR)的每件物品的表面構(gòu)成,該多級(jí)灰度圖像被轉(zhuǎn)換成第一個(gè)二值圖像(NB1),并且該二值圖像被發(fā)送至一個(gè)OCR單元用于對(duì)地址信息進(jìn)行第一次自動(dòng)估計(jì)(OCR1),該方法具有以下特征從多級(jí)灰度圖像和/或二值圖像和/或自動(dòng)數(shù)據(jù)估計(jì)的結(jié)果中提取出代表某一類別的地址信息標(biāo)志的標(biāo)記(SGN1、SGN2),然后考慮所述標(biāo)記代表的類別,所述多級(jí)灰度圖像再次被轉(zhuǎn)換成第二個(gè)二值圖像(NB2),并且該第二個(gè)二值圖像被傳送到一個(gè)OCR單元用于進(jìn)行第二次自動(dòng)估計(jì)(OCR2)。
文檔編號(hào)G06K9/38GK1538342SQ20041004308
公開日2004年10月20日 申請(qǐng)日期2004年2月18日 優(yōu)先權(quán)日2003年2月19日
發(fā)明者伯爾卡瑟姆·本尤彼, 伯爾卡瑟姆 本尤彼 申請(qǐng)人:索利斯蒂克有限公司