用于智能輪詢的系統(tǒng)和方法

文檔序號：6499533閱讀：327來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：用于智能輪詢的系統(tǒng)和方法
對相關(guān)申請的交叉引用本申請要求美國臨時申請序列號60/520,658的優(yōu)先權(quán)，該申請在此引入作為參考。
背景技術(shù)：
圖像識別一般通過光字符識別(OCR)處理來完成。這種圖像識別的一項應(yīng)用是在郵政或郵件操作技術(shù)中，其中從郵件項的地址面(address face)讀出目的地地址。本領(lǐng)域的技術(shù)人員可以想象其他的應(yīng)用。為了確保通過OCR處理準確地對圖像進行讀取或解碼，多個獨立的OCR過程可以并行或非并行地在同一圖像上運行?？梢员M力考慮和/或比較它們各自的結(jié)果，以便確定所掃描的地址的最可靠的處理結(jié)果或解碼。
郵件操作應(yīng)用中的OCR處理包括四個基本上獨立的過程的組合地址塊定位、二進制化、OCR處理以及數(shù)據(jù)庫查找。簡單地說，地址塊定位是對信封的地址面上的信息進行定位。二進制化是將灰度圖轉(zhuǎn)換為二進制的。OCR處理是將圖像映射并識別為字母或數(shù)字字符。數(shù)據(jù)庫查找是合理化由OCR輸出的連續(xù)字符流，其方式是采用合理的數(shù)據(jù)庫的復(fù)雜的集合來對所述處理結(jié)果進行匹配，其中所述數(shù)據(jù)庫包括用于識別目的地的郵政編碼、城市、街道和收件人信息。前述的過程當一起發(fā)生時被用于掃描地址面圖像并且利用合理的確定性將其映射為分揀決策。對本申請的目的來說，前述的過程將被簡稱為OCR過程。
假設(shè)OCR過程是復(fù)雜的并且目的地地址不一致，則各個OCR過程的結(jié)果在準確性方面有所不同。這樣，用于對各個OCR過程的結(jié)果進行比較以及加權(quán)的系統(tǒng)和方法是必要的，以便整體上達到在可操作或工作的等級或者誤差限度之內(nèi)的結(jié)果。這種等級或限度可以根據(jù)應(yīng)用而有所不同。但是，賦予權(quán)重和/或比較等級是一個統(tǒng)計問題，其可以由已知的計算機裝置應(yīng)用在多種應(yīng)用中。通過表決(voting)或輪詢能夠?qū)⒍鄠€獨立的OCR結(jié)果組合起來，并由此減小OCR過程固有的誤差率。
現(xiàn)有技術(shù)已經(jīng)致力于改善OCR過程的一般領(lǐng)域。

圖1揭示了一種裝置，其中串行14地設(shè)置有多個OCR過程1-3。圖像10被引入到第一OCR過程，然后被引入到第二OCR過程，并且如果前面的過程未能讀取及解碼所述圖像10那么將圖像10引入到第三OCR過程。如果所述圖像由三個OCR過程中的一個有效地讀取并且解碼，則產(chǎn)生結(jié)果12。雖然在解碼圖像方面是有效的，但該裝置也具有可能對于許多應(yīng)用而言過高的誤差率。高誤差率的一個原因在于孤注一擲的圖像讀取和解碼的方法。這里，所述圖像或者由三個OCR過程中的一個來解碼，或者發(fā)生錯誤。不存在介于中間的情況。
圖2描述并行20設(shè)置的圖1的三個OCR過程(1-3)，每一個OCR過程此外被連接到表決器22。所述表決器試圖找到多數(shù)的意見并且根據(jù)多數(shù)裁定原則在圖像讀取及解碼的OCR過程結(jié)果之中進行選擇。三個OCR過程中的至少兩個必須一致以便解碼對于輪詢而言有效的目的地地址。該方法的問題是涉及運行至少三個OCR過程的成本，以及涉及獲得及協(xié)同經(jīng)常互不兼容的、OCR過程內(nèi)部的多個專有過程的成本，其中所述專有過程使得可靠性的排序變得困難。
圖3示出具有兩個OCR過程的圖2的并行表決裝置。這代表比圖2的針對三個OCR過程的要求更經(jīng)濟的裝置，或者可以代表這樣的環(huán)境，在所述環(huán)境中三個OCR過程中的一個完全不能分辨主題地址。運行基本與圖2中一樣，但是只使用兩個OCR過程，而不是三個OCR過程。然而，基于多數(shù)表決的決策不可能僅利用兩個OCR過程來做出。
在現(xiàn)有技術(shù)中給出了用于鑒別最后最可靠解碼的多種方法，諸如選擇哪個結(jié)果代表地址解碼的最大深度，或者使用各個OCR過程內(nèi)部的數(shù)據(jù)(通常在多個OCR過程之間是唯一的并且是制造商專有的)以分派有關(guān)的置信等級并因此在競爭的選擇性的地址解碼之間進行選擇。
現(xiàn)有技術(shù)過程仍然有問題，即現(xiàn)有技術(shù)過程仍容易受到由目錄錯誤或不良的閾值所引起的基于解碼深度的故障的影響。另外，所述過程依賴于OCR過程性能的孤注一擲的確定。又一種現(xiàn)有技術(shù)的解決方案需要訪問OCR內(nèi)部的過程，以便根據(jù)所用OCR過程的內(nèi)部性能等級來創(chuàng)建置信等級。該解決方案具有負擔，如上面所述的，所述負擔指的是附加的處理以及對通常專有的與OCR內(nèi)部過程相關(guān)聯(lián)的信息的訪問。
另外，OCR過程的多個賣主所使用的可靠性量度經(jīng)常是不兼容的。因此，需要OCR過程的實際的輪詢，所述輪詢最大化可用的信息以達到最好可能的且最精確可能的結(jié)果。
發(fā)明概述本發(fā)明的一個優(yōu)點是，增強兩個或更多的OCR過程在對圖像進行讀取及解碼方面的性能。該目的和其他目的通過以下方式實現(xiàn)，即將現(xiàn)有技術(shù)解決方案的孤注一擲的方法簡化為由特別OCR過程所進行的特別讀取及解碼的不同性能成功的加權(quán)制表。根據(jù)在相似環(huán)境下的過去OCR過程性能的評估和/或隨時間收集的這種性能數(shù)據(jù)，可以事先已知這種權(quán)重。通過適當存儲的數(shù)據(jù)記錄使得這種過去的性能可供使用，其中所述數(shù)據(jù)記錄依據(jù)適當?shù)腛CR過程應(yīng)用被訪問以及另外的檢索。這種數(shù)據(jù)記錄此外可以通過以下方式被連續(xù)更新，即利用視頻編碼操作者(operator)來證實隨機所選擇的輪詢決策，并由此再次根據(jù)類別連續(xù)地確認及提煉與給定OCR過程相關(guān)的性能，其中所述類別在掃描和OCR過程期間通常是不證自明的。因為這種信息是電子存儲的，所以它可用于大量應(yīng)用，而不受地理或語言限制，后者通過標準應(yīng)用加以克服。
所述數(shù)據(jù)記錄涉及被應(yīng)用于設(shè)置事件或分類的OCR過程性能，其中所述分類在自動處理期間通常是可評估的。這種分類包括信件對扁平郵件(flat)對包裹、透明的窗口信封、數(shù)字區(qū)對字母字符區(qū)、字符間距和字體、顯著的傾斜、手寫印刷體對機器印刷體、顏色背景、干涉背景(滲通)、矩陣印刷、外部地址、內(nèi)部地址、收件人、背書、以及郵戳值讀數(shù)。也可以使用其他考慮。
依照前述準則將數(shù)據(jù)記錄統(tǒng)計地量化，以便提供基于OCR過程的性能權(quán)重。作為一個實例，可以根據(jù)統(tǒng)計上測量的因素(例如是否正讀取扁平郵件對信件)來選擇被接受用于解碼的OCR過程，或者可以按統(tǒng)計方式組合各個對扁平郵件有價值的因素，其中所述扁平郵件具有數(shù)字和窗口信封。
一旦確定，參考前述準則的OCR過程的結(jié)果將被給出，并且在其他OCR過程的結(jié)果上考慮輪詢選擇。因此，多個OCR過程中的每一個的長處、即最成功的方面被輪詢以達到復(fù)合的結(jié)果性的讀取和解碼。
附圖的若干視圖簡述結(jié)合附圖根據(jù)下面的說明和附加于此的權(quán)利要求，本發(fā)明的上述和其他優(yōu)點將變得清晰，在所述附圖中圖1至3描述了現(xiàn)有技術(shù)的過程；圖4描述了多個OCR過程的性能監(jiān)測；圖5描述了數(shù)字性能；圖6描述了信件性能；圖7描述了扁平郵件性能；圖8描述了其中決策被加權(quán)的運行階段；圖9描述了數(shù)字加權(quán)；圖10描述了信件加權(quán)；以及圖11描述了本方法的流程圖。
發(fā)明詳述現(xiàn)在參考上面列出的附圖從圖4開始來討論本發(fā)明，其中相同的數(shù)字表示相同的單元。圖4描述了性能監(jiān)測40，其中根據(jù)預(yù)先設(shè)置的對兩種OCR過程為通用的分類依照單個的結(jié)果對OCR過程進行輪詢，所述OCR過程的數(shù)據(jù)在手工解碼期間被提供。統(tǒng)計分類包括以下領(lǐng)域信件對扁平郵件對包裹、透明的窗口信封、數(shù)字區(qū)對字母字符區(qū)、字符間距和字體、可測量的斜度、手寫印刷體對機器印刷體、顏色背景、干涉背景(滲通)、矩陣印刷、外部地址、內(nèi)部地址、收件人、背書、以及郵戳值?？梢园ㄈ绫绢I(lǐng)域技術(shù)人員所預(yù)想的其他考慮。
這種統(tǒng)計分類可以通過先前的測試來完成，并且通過令編碼者證實隨機所選擇的輪詢事件來更新及提煉，其中多個OCR過程是不同的。編碼者可以接收每個、幾乎每個、或其他數(shù)量的未成功解碼的圖像。附加地，分類的數(shù)量和類型可以隨著應(yīng)用而發(fā)生變化?？紤]世界范圍的應(yīng)用和典型的對這種分類的數(shù)字答案，分類的語言是不重要的，并且編碼者的地理位置同樣也是不固定的。參考至少一個上述準則，尋找OCR過程性能的一個指示。為此假定(圖4)將圖像42饋送到三個OCR過程1-3。盡管在需要利用僅僅兩個(或偶數(shù)個)競爭的OCR過程來做出決策時本發(fā)明具有特別的價值，但是所引用的實例示出競爭的三個OCR過程以強調(diào)同化多個OCR過程的簡易性，這是由于不要求任何內(nèi)部的說明或?qū)Ｓ械膬?nèi)部信息。
圖4描述了基于性能的OCR處理44。因此，OCR過程被輪詢，并且依照先前計算的根據(jù)分類的統(tǒng)計加權(quán)(如上面所討論的)來選擇一個解碼。在運行中以及如在后續(xù)附圖中將看到的，一旦針對根據(jù)準則或分類的單個OCR過程性能收集到至少可使用的數(shù)量的數(shù)據(jù)，就可以因此為決策過程對每個OCR過程進行加權(quán)。附加地，通過借助于隨機輪詢決策證實操作者能夠產(chǎn)生分辨和提煉，并且如結(jié)果所指出的，更新/提煉支持分類的統(tǒng)計。
經(jīng)由實例，在圖5中，每個OCR過程1-3包括條形圖50、52、54，其高度代表在成功地對數(shù)字56進行讀取和解碼時各自的OCR過程性能。如所描述的，OCR過程2排得最高(52)，其次為OCR過程1(50)，再次為OCR過程3(54)。在運行中，輪詢單元42將為有關(guān)數(shù)據(jù)記錄(如條形圖所描述的)而查閱數(shù)據(jù)庫，電子地確定最大值(這里為52)并且向OCR2提供加權(quán)值。如果所述值處于可接受的應(yīng)用容差之內(nèi)(拒絕具有下一個最接近OCR過程的虛無假說)，則假定OCR2正確地對數(shù)字進行讀取及編碼。該數(shù)據(jù)檢索及評估自動地由適當?shù)碾娮友b置(諸如被正確編程的計算機)來執(zhí)行。
圖6描述了被應(yīng)用于讀取及編碼郵件項的上述過程，其中所述郵件項在本實例中包括信件66。OCR過程針對信件的性能各具有排序60、62、64。
圖7描述了被應(yīng)用于讀取及編碼扁平郵件76的不同OCR過程排序70、72、74。應(yīng)理解，該裝置適用于對OCR過程而言共同的所有考慮。
圖8描述了自動地由輪詢單元42所執(zhí)行的決策過程80。被適當?shù)嘏渲糜糜谟绊憶Q策過程的其他裝置可以與所述輪詢一起被使用或者取代所述輪詢。支持權(quán)重和用于適當?shù)刈x取及編碼的應(yīng)用要求的所需數(shù)據(jù)的數(shù)量是變化的。
圖9描述了關(guān)于數(shù)字96的加權(quán)的決策。如上面一樣，以條形圖形式來描述加權(quán)決策。圖9的條形圖(90，92，94)在值方面對應(yīng)于也涉及數(shù)字的圖5的條形圖(50，52，54)。在圖10(100，102和104)與圖6(60，62，64)之間也可以找到相同的關(guān)系，這兩個附圖都涉及信件。
已知的統(tǒng)計技術(shù)(諸如虛無假說檢驗)可以被用于將編碼者評估映射到關(guān)于OCR權(quán)重的決策，使得僅僅統(tǒng)計上重要的相對差異被反映在最終的輪詢決策過程中。
圖11描述了根據(jù)利用至少兩個OCR過程掃描圖像的步驟112的方法的流程圖。可以利用任意數(shù)量的OCR過程來使用本發(fā)明。做出判斷114是否所有OCR過程成功地對圖像進行了解碼。如果OCR過程沒有成功地對圖像進行解碼116，那么所述方法結(jié)束118，并且圖像很可能進入視頻編碼。
如果OCR過程成功地讀取了圖像120，則做出另一個判斷122，即多個OCR過程是否產(chǎn)生基本上相同的結(jié)果。如果多個OCR過程以當前應(yīng)用所需要的足夠的可靠性基本上產(chǎn)生相同的結(jié)果124，則排除了輪詢的需要并且所述方法結(jié)束118。
如果多個OCR過程沒有產(chǎn)生基本上相同的結(jié)果123，那么所述方法繼續(xù)輪詢。在此，最高加權(quán)的OCR過程的基于分類的性能被接受作為正確的解碼136，并且所述過程結(jié)束118。
第二個與輪詢相關(guān)的步驟包括手工地證實隨機選擇的輪詢決策，以便進一步提高統(tǒng)計推斷的精度125。因此，操作者對圖像進行視頻編碼126并且指明輪詢決策的正確性，并且有關(guān)OCR過程的統(tǒng)計進一步增加，或者如果輪詢出錯，則有關(guān)OCR過程的權(quán)重被減少128。然后所述方法結(jié)束118。
權(quán)利要求
1.一種對圖像進行解碼的方法，包括以下步驟-并行地將至少第一和第二光字符識別過程應(yīng)用于圖像，所述圖像包括多個分類，-確定所述第一和第二光字符識別過程是否產(chǎn)生基本上相似的圖像結(jié)果，-如果所述圖像結(jié)果不相似，則選擇最高加權(quán)的OCR過程的基于分類的結(jié)果，并且-基于逐一的分類，將所述最高加權(quán)的OCR過程的基于分類的結(jié)果分派給所述圖像結(jié)果。
2.如權(quán)利要求1所述的方法，其中至少一個所述分類致力于在其上印有所述圖像的信封的識別。
3.如權(quán)利要求3所述的方法，其中所述至少一個分類致力于所述圖像是手寫的還是機器印刷的。
4.如權(quán)利要求3所述的方法，其中所述至少一個分類致力于所述圖像是手寫的還是機器印刷的。
5.如權(quán)利要求3所述的方法，其中所述至少一個分類致力于識別所述信封的顏色背景。
6.如權(quán)利要求3所述的方法，其中所述至少一個分類致力于所述信封是窗口信封還是無窗口的信封。
7.如權(quán)利要求3所述的方法，其中所述至少一個分類致力于所述圖像是具有郵政編碼的地址還是不具有郵政編碼的地址。
8.如權(quán)利要求3所述的方法，其中所述至少一個分類致力于是否所述圖像是傾斜的。
9.如權(quán)利要求3所述的方法，其中所述至少一個分類致力于是否所述信封是光滑的。
10.如權(quán)利要求3所述的方法，其中所述至少一個分類致力于所述圖像是被印在扁平郵件上還是被印在常規(guī)郵件上。
11.如權(quán)利要求3所述的方法，其中所述至少一個分類致力于數(shù)字。
12.如權(quán)利要求3所述的方法，其中所述至少一個分類致力于信件。
13.如權(quán)利要求3所述的方法，其中所述至少一個分類致力于扁平郵件。
14.如權(quán)利要求3所述的方法，其中所述至少一個分類致力于內(nèi)部分揀過程。
15.如權(quán)利要求3所述的方法，其中所述至少一個分類致力于外部分揀過程。
16.用于執(zhí)行權(quán)利要求1至15的方法步驟的計算機的使用。
17.用于運行處理器以實施權(quán)利要求1至15的方法步驟的軟件的使用。
18.一種對圖像進行解碼的方法，包括以下步驟-并行地將至少第一和第二光字符識別過程應(yīng)用于圖像，所述圖像包括多個分類，-確定所述第一和第二光字符識別過程是否產(chǎn)生基本上相似的圖像結(jié)果，-如果所述圖像結(jié)果不相似，則手工地對所述圖像進行編碼，并且-根據(jù)圖像編碼在統(tǒng)計上更新OCR過程的權(quán)重。
19.用于執(zhí)行權(quán)利要求18的方法步驟的計算機的使用。
全文摘要
本發(fā)明涉及一種對圖像進行解碼的方法。所述方法包括以下步驟并行地將至少第一和第二光字符識別過程應(yīng)用于圖像，所述圖像包括許多分類；確定第一和第二光字符識別過程是否產(chǎn)生基本上相似的圖像結(jié)果；如果所述圖像結(jié)果不相似，則選擇最高加權(quán)的OCR過程的基于分類的結(jié)果；并且基于逐一的分類，將所述最高加權(quán)的OCR過程的基于分類的結(jié)果分派給所述圖像結(jié)果。
文檔編號G06K9/68GK1882954SQ200480034086
公開日2006年12月20日申請日期2004年11月18日優(yōu)先權(quán)日2003年11月18日
發(fā)明者W·羅森鮑姆申請人:西門子公司

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：Ｗ.羅森鮑姆
技術(shù)所有人：西門子公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構(gòu)動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

智能照明系統(tǒng)安裝方法相關(guān)技術(shù)

智能照明系統(tǒng)施工方法相關(guān)技術(shù)

rs485通訊輪詢方法相關(guān)技術(shù)

智能家居控制系統(tǒng)相關(guān)技術(shù)

智能家居系統(tǒng)相關(guān)技術(shù)

建筑智能化系統(tǒng)homedo相關(guān)技術(shù)

施耐德智能控制系統(tǒng)相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于智能輪詢的系統(tǒng)和方法