一種通過多個(gè)圖象光識(shí)別郵件的方法

文檔序號(hào)：6402824閱讀：170來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：一種通過多個(gè)圖象光識(shí)別郵件的方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種在一自動(dòng)地址讀取系統(tǒng)中處理郵件的方法，其中一多級(jí)灰度圖像由包含地址信息的每件物品的表面構(gòu)成，該多級(jí)灰度圖像被轉(zhuǎn)換成第一個(gè)二值圖像，該二值圖像被送至一光學(xué)字符讀取(OCR)單元，對(duì)所述地址信息進(jìn)行第一次自動(dòng)估計(jì)。
該方法特別適用于自動(dòng)郵件分類裝置，其中對(duì)地址信息進(jìn)行自動(dòng)估計(jì)，從而對(duì)郵件進(jìn)行向外或向內(nèi)的分類。
背景技術(shù)：
在上述這類處理郵件的已知方法中，在處理大量圖像時(shí)，將多級(jí)灰度圖像轉(zhuǎn)換成二值圖像的過程涉及到越來越復(fù)雜的運(yùn)算方法。尤其是，在地址信息的標(biāo)志和圖像背景之間的對(duì)比度較低，地址信息很難讀取的情況下，已經(jīng)研發(fā)出運(yùn)算方法用于將多級(jí)灰度圖像二進(jìn)制化，其中地址信息的字符間距或多或少地比較遠(yuǎn)，所述間距依賴于字符是手寫的還是由機(jī)器打印出來的，所述機(jī)器可以是點(diǎn)矩陣打印機(jī)、激光打印機(jī)等等。
盡管這些二進(jìn)制算法的性能得到了改進(jìn)，然而實(shí)際上，由于不適當(dāng)?shù)亩M(jìn)制化使得不能對(duì)地址信息進(jìn)行明確地確認(rèn)，或者由于不適當(dāng)?shù)亩M(jìn)制化使得地址信息被讀錯(cuò)，在自動(dòng)郵件分類裝置中成批次的郵件仍然含有被拒絕的郵件。
美國專利No.6282314公開一種分析可能含有字符和表格的圖像的方法，其中圖像被二進(jìn)制化從而隔離可由OCR讀取的含有字符和圖像的各部分。美國專利No.4747149公開了一種分析圖像的方法，其中以多種不同方式并行地進(jìn)行二進(jìn)制化，并且對(duì)最佳的二值圖像OCR處理。

發(fā)明內(nèi)容
為了提高讀取成功率并降低出錯(cuò)率，本發(fā)明的目的是對(duì)上述處理物品的方法提出改進(jìn)。
為此目的，本發(fā)明提出一種在一自動(dòng)地址讀取系統(tǒng)中處理郵件的方法，其中一多級(jí)灰度圖像由包含地址信息的每件物品的表面構(gòu)成，該多級(jí)灰度圖像被轉(zhuǎn)換成第一個(gè)二值圖像，該二值圖像被送至一光學(xué)字符讀取(OCR)單元對(duì)所述地址信息進(jìn)行第一次自動(dòng)估計(jì)，該方法具有以下特征從多級(jí)灰度圖像和/或二值圖像和/或自動(dòng)數(shù)據(jù)估計(jì)的結(jié)果中提取出代表某一類別地址信息標(biāo)志的標(biāo)記，考慮到所述標(biāo)記所代表的類別，將所述多級(jí)灰度圖像再次轉(zhuǎn)換成第二個(gè)二值圖像，并且將第二個(gè)二值圖像傳送至一OCR單元，以進(jìn)行第二次自動(dòng)估計(jì)。
本發(fā)明的方法具有下列特征·構(gòu)成上述信號(hào)的數(shù)據(jù)包括指示在多級(jí)灰度圖像的地址信息標(biāo)志中對(duì)比度的第一統(tǒng)計(jì)數(shù)據(jù)、指示在第一個(gè)二值圖像中地址信息標(biāo)志的印刷質(zhì)量的第二統(tǒng)計(jì)數(shù)據(jù)、指示地址信息標(biāo)志類型(手寫圖像或機(jī)器打印標(biāo)志)的第三統(tǒng)計(jì)數(shù)據(jù)，以及有關(guān)單詞和字符識(shí)別質(zhì)量的第四統(tǒng)計(jì)數(shù)據(jù)；·將多級(jí)灰度圖像第二次轉(zhuǎn)換成二值圖像包括根據(jù)地址信息標(biāo)志類別從多個(gè)二進(jìn)制過程中選擇一個(gè)特定的二進(jìn)制處理過程；·通過一分類器選擇出上述特定的處理過程，所述分類器接收構(gòu)成標(biāo)記的數(shù)據(jù)作為其輸入；和·組合第一次自動(dòng)估計(jì)結(jié)果和第二次自動(dòng)估計(jì)結(jié)果，從而得到地址信息。
在本發(fā)明的方法中，多級(jí)灰度圖像的第一次轉(zhuǎn)換采用一種所謂“通用”的二進(jìn)制算法，也就是說，這種算法并不特別適用于一特定的地址信息標(biāo)志類別。術(shù)語“標(biāo)志類別”表示根據(jù)標(biāo)志是手寫的還是機(jī)器打印的結(jié)果對(duì)標(biāo)志進(jìn)行分類；在多級(jí)灰度圖像中標(biāo)志是低對(duì)比度寫成的，或者在多級(jí)灰度圖像中標(biāo)志是高對(duì)比度寫成的；標(biāo)志是用點(diǎn)矩陣打印機(jī)打印的，或者標(biāo)志的字符是用激光打印機(jī)打印的；標(biāo)志中的字符是拆開的，或者標(biāo)志中的字符是連在一起的等等。本技術(shù)領(lǐng)域的技術(shù)人員知道“通用”二進(jìn)制算法在地址信息標(biāo)志的多個(gè)類別中具有令人滿意的統(tǒng)計(jì)效果。
與此相比，多級(jí)灰度圖像的第二次轉(zhuǎn)換采用一種特定的二進(jìn)制算法，也就是說，該算法特定適用于一種地址信息標(biāo)志類別。作為非限制性實(shí)例，本技術(shù)領(lǐng)域的技術(shù)人員知道，基于拉普拉斯型卷積的二進(jìn)制算法適用于低對(duì)比度的圖像；基于統(tǒng)計(jì)閾值的二進(jìn)制算法適用于高對(duì)比度的圖像；使像素值達(dá)到平均數(shù)的低通濾波的二進(jìn)制算法適用于由點(diǎn)陣打印機(jī)打印出的標(biāo)志。

下面對(duì)本發(fā)明方法的實(shí)施過程進(jìn)行描述，并在附圖中表示出來。
圖1為本發(fā)明方法的方塊示意圖。
圖2表示如何將兩個(gè)自動(dòng)估計(jì)結(jié)果組合起來的示意圖。
具體實(shí)施例方式
本發(fā)明所依據(jù)的思想是在對(duì)地址信息進(jìn)行第一次自動(dòng)估計(jì)之后，對(duì)包括地址信息的多級(jí)灰度圖像進(jìn)行第二次二值處理，對(duì)于地址信息標(biāo)志的某些特定的特征，第二次二值處理將比第一次二值處理更加合適。
在圖1中，郵件表面的包含地址信息的多級(jí)灰度圖像MNG首先被通用的第一次二值處理Bin1轉(zhuǎn)換成第一個(gè)二值圖像NB1。
為了對(duì)地址信息進(jìn)行第一次自動(dòng)估計(jì)OCR1，該第一個(gè)二值圖像NB1被傳送至一個(gè)OCR單元。
從多級(jí)灰度圖像MNG和/或從二值圖像NB1和/或從自動(dòng)估計(jì)OCR1的結(jié)果中提取出構(gòu)成標(biāo)記SGN1、SGN2的數(shù)據(jù)。這些數(shù)據(jù)的提取用箭號(hào)E1和E2表示。
舉例來說，SGN1標(biāo)記部分包含·從自動(dòng)估計(jì)OCR1連同有關(guān)地址信息標(biāo)志類別(手寫/機(jī)打)的指示中所提取的數(shù)據(jù)；·由處理OCR1所得到的二值圖像中二維地址模塊的坐標(biāo)；·從二值圖像Bin1、自動(dòng)估計(jì)OCR1和有關(guān)地址信息標(biāo)志印刷質(zhì)量的指示中所提取的統(tǒng)計(jì)數(shù)據(jù)互連組份(interconnected components)(二值圖象的象素串)的平均密度；地址信息中每一字符的互連組份數(shù)；每一互連組份的字符數(shù)；每一字符的寄生(parasite)數(shù)；整個(gè)地址模塊中最佳侯選物的識(shí)別得分的平均值。
SGN2信號(hào)部分包含，例如，從多級(jí)灰度圖像中提取出的統(tǒng)計(jì)數(shù)據(jù)，代表多級(jí)灰度圖像中地址信息標(biāo)志的對(duì)比度多級(jí)灰度圖象中字符的平均灰度水平；字符灰度直方圖的標(biāo)準(zhǔn)差；多級(jí)灰度圖像的背景的平均灰度水平；多級(jí)灰度圖像背景的直方圖的標(biāo)準(zhǔn)差。
在每個(gè)多級(jí)灰度圖像MNG中，所提取出的數(shù)據(jù)構(gòu)成標(biāo)記SGN1、SGN2，對(duì)地址信息標(biāo)志進(jìn)行分類。類型數(shù)據(jù)可以輸入至一個(gè)適于識(shí)別地址信息標(biāo)志類別的分類器CLA中，然后從多個(gè)專用二進(jìn)制處理方法中識(shí)別一個(gè)特定的二進(jìn)制處理方法，所述處理方法最適于該類型的標(biāo)志。此后，對(duì)所述多級(jí)灰度圖像MNG進(jìn)行上述由Bin2提供并經(jīng)分類器CLA確定的特定的二進(jìn)制處理。
本技術(shù)領(lǐng)域技術(shù)人員知道，對(duì)圖像進(jìn)行二進(jìn)制化的特定二進(jìn)制運(yùn)算方法，例如Bin2，具有一個(gè)噪聲背景，地址信息為手寫的圖像，地址信息為機(jī)器打印的圖像等。根據(jù)不同情況，這些算法在其他選擇中采用了自適應(yīng)對(duì)比、微分運(yùn)算符、低通運(yùn)算符，或者動(dòng)態(tài)閾值等。
為了對(duì)地址信息進(jìn)行第二次自動(dòng)估計(jì)OCR2，所述第二個(gè)二值圖像NB1可以被傳送至一個(gè)OCR單元。
舉例來說，分類器CLA可以是一個(gè)具有監(jiān)督訓(xùn)練的神經(jīng)網(wǎng)絡(luò)，或者是一個(gè)具有模糊邏輯基本操作知識(shí)的專家系統(tǒng)。
根據(jù)本發(fā)明的方法，我們發(fā)現(xiàn)，將兩個(gè)自動(dòng)估計(jì)OCR1和OCR2的結(jié)果T1和T2組合起來之后，其讀取成功率就有可能既優(yōu)于第一次自動(dòng)估計(jì)OCR1后的讀取成功率，也優(yōu)于第二次自動(dòng)估計(jì)OCR2后的讀取成功率。
我們發(fā)現(xiàn)通過將第一次自動(dòng)估計(jì)OCR1的結(jié)果T1和第二次自動(dòng)估計(jì)OCR2的T2組合起來并作為輸出，通過比較第一次自動(dòng)估計(jì)輸出的特定出錯(cuò)率以及第二次自動(dòng)估計(jì)輸出的出錯(cuò)率，有可能降低整體出錯(cuò)率。
在圖1中，用CMB表示的方塊代表將T1和T2組合起來的過程。這個(gè)組合過程在于采用從執(zhí)行第一次和第二次自動(dòng)估計(jì)的OCR單元輸出產(chǎn)生的結(jié)果向量，以及所述結(jié)果向量的可信度。組合過程還可以利用專家系統(tǒng)，通過地址數(shù)據(jù)庫在語義水平上獲得的聯(lián)系，使得地址假設(shè)之間相關(guān)聯(lián)。所述組合結(jié)果T1和T2的過程的優(yōu)點(diǎn)是如果經(jīng)過OCR1處理的地址信息被拒絕，其有可能提高二值圖像NB2的讀取成功率；通過OCR2再次循環(huán)處理經(jīng)OCR1得到的分類結(jié)果從而提高整體讀取成功率。
更具體地，參照?qǐng)D2，經(jīng)過OCR1和OCR2處理有可能提取出一條或者兩條與上下文有關(guān)的地址信息，或者當(dāng)兩個(gè)二值圖像NB1和NB2都失敗時(shí)，上述處理沒有提取出任何信息。按照本發(fā)明，組合CMB與上下文有關(guān)的地址信息T1和T2在于形成地址信息ADR，當(dāng)與上下文有關(guān)的兩條信息T1和T2被讀取，而且相互關(guān)聯(lián)時(shí)，可以用T1＝T2＝＞ADR＝T1表示。如果與上下文有關(guān)的地址信息T1和T2中只有一個(gè)被讀取時(shí)，其被保留作為所尋找的地址信息，用模塊ADR＝T1或者ADR＝T2表示。如果與上下文有關(guān)并且相互矛盾的信息T1和T2被讀取時(shí)，此時(shí)需要進(jìn)行裁決，考慮所述與上下文有關(guān)的信息T1和T2各自的可信度，以決定保留哪個(gè)地址ADR，在圖2中用T1≠T2＝＞T1或者T2或者“拒絕”表示。最后，如果從二值圖像NB1和NB2中沒有提取出任一條與上下文有關(guān)的信息，則沒有地址信息形成，對(duì)應(yīng)于模塊ADR＝拒絕。
權(quán)利要求
1.一種在一自動(dòng)地址讀取系統(tǒng)中處理郵件的方法，其中一多級(jí)灰度圖像(MNG)由包含地址信息(ADR)的每件物品的表面構(gòu)成，該多級(jí)灰度圖像被轉(zhuǎn)換成第一個(gè)二值圖像(NB1)，并且該二值圖像被發(fā)送至一個(gè)OCR單元用于對(duì)地址信息進(jìn)行第一次自動(dòng)估計(jì)(OCR1)，該方法具有以下特征從多級(jí)灰度圖像和/或二值圖像和/或自動(dòng)數(shù)據(jù)估計(jì)的結(jié)果中提取出代表某一類別的地址信息標(biāo)志的標(biāo)記(SGN1、SGN2)，然后考慮所述標(biāo)記代表的類別，所述多級(jí)灰度圖像再次被轉(zhuǎn)換成第二個(gè)二值圖像(NB2)，并且該第二個(gè)二值圖像被傳送到一個(gè)OCR單元用于進(jìn)行第二次自動(dòng)估計(jì)(OCR2)。
2.如權(quán)利要求1所述的方法，其中組成標(biāo)記(SGN1，SGN2)的數(shù)據(jù)包括關(guān)于多級(jí)灰度圖像的統(tǒng)計(jì)數(shù)據(jù)，關(guān)于第一個(gè)二值圖像的統(tǒng)計(jì)數(shù)據(jù)，和關(guān)于由第一次自動(dòng)估計(jì)(OCR1)傳送的單詞和字符的識(shí)別的統(tǒng)計(jì)數(shù)據(jù)。
3.如權(quán)利要求1或2所述的方法，其中組成標(biāo)記(SGN1，SGN2)的數(shù)據(jù)包括指示在多級(jí)灰度圖像的地址信息標(biāo)志中對(duì)比度的第一統(tǒng)計(jì)數(shù)據(jù)、指示在第一個(gè)二值圖像中地址信息標(biāo)志印刷質(zhì)量的第二統(tǒng)計(jì)數(shù)據(jù)、指示地址信息標(biāo)志類型(手寫圖像/機(jī)打標(biāo)志)的第三統(tǒng)計(jì)數(shù)據(jù)以及有關(guān)單詞和字符識(shí)別質(zhì)量的第四統(tǒng)計(jì)數(shù)據(jù)。
4.如權(quán)利要求1至3中任一項(xiàng)所述的方法，其中將多級(jí)灰度圖像第二次轉(zhuǎn)換成二值圖像在于，根據(jù)地址信息標(biāo)志類別從多個(gè)二進(jìn)制處理過程中選擇一個(gè)特定的二進(jìn)制處理方法。
5.如權(quán)利要求4所述的方法，其中該特定處理過程通過一個(gè)分類器(CLA)被選擇出，所述分類器接收構(gòu)成標(biāo)記的數(shù)據(jù)作為其輸入。
6.如權(quán)利要求5所述的方法，其中分類器(CLA)是一個(gè)具有監(jiān)督訓(xùn)練的神經(jīng)網(wǎng)絡(luò)。
7.如權(quán)利要求1至6中任一項(xiàng)所述的方法，其中為了得到地址信息(ADR)，將第一次自動(dòng)估計(jì)(OCR1)和第二次自動(dòng)估計(jì)(OCR2)的結(jié)果組合起來。
全文摘要
一種在一自動(dòng)地址讀取系統(tǒng)中處理郵件的方法，其中一多級(jí)灰度圖像(MNG)由包含地址信息(ADR)的每件物品的表面構(gòu)成，該多級(jí)灰度圖像被轉(zhuǎn)換成第一個(gè)二值圖像(NB1)，并且該二值圖像被發(fā)送至一個(gè)OCR單元用于對(duì)地址信息進(jìn)行第一次自動(dòng)估計(jì)(OCR1)，該方法具有以下特征從多級(jí)灰度圖像和/或二值圖像和/或自動(dòng)數(shù)據(jù)估計(jì)的結(jié)果中提取出代表某一類別的地址信息標(biāo)志的標(biāo)記(SGN1、SGN2)，然后考慮所述標(biāo)記代表的類別，所述多級(jí)灰度圖像再次被轉(zhuǎn)換成第二個(gè)二值圖像(NB2)，并且該第二個(gè)二值圖像被傳送到一個(gè)OCR單元用于進(jìn)行第二次自動(dòng)估計(jì)(OCR2)。
文檔編號(hào)G06K9/38GK1538342SQ20041004308
公開日2004年10月20日申請(qǐng)日期2004年2月18日優(yōu)先權(quán)日2003年2月19日
發(fā)明者伯爾卡瑟姆·本尤彼, 伯爾卡瑟姆本尤彼申請(qǐng)人:索利斯蒂克有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：伯爾卡瑟姆.本尤彼
技術(shù)所有人：索利斯蒂克有限公司
我是此專利的發(fā)明人

上一篇：圖像再現(xiàn)裝置和圖像再現(xiàn)方法
上一篇：具有鍵盤或相關(guān)設(shè)備的安全通信的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

垃圾郵件識(shí)別相關(guān)技術(shù)

郵件被識(shí)別為垃圾郵件相關(guān)技術(shù)

如何識(shí)別垃圾郵件相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種通過多個(gè)圖象光識(shí)別郵件的方法