識(shí)別郵件發(fā)送信息的方法和裝置的制作方法

文檔序號(hào)：5070740閱讀：173來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>分離篩選設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：識(shí)別郵件發(fā)送信息的方法和裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及如獨(dú)立權(quán)利要求1和4前序部分所述的識(shí)別郵件發(fā)送信息的方法和裝置。
在郵件分揀/發(fā)送時(shí)，所有可機(jī)器處理的郵件不可能都能完全自動(dòng)處理。其中的原因是多方面的，從找不到地址塊，到讀出的地址中有機(jī)器不能分辨的矛盾之處。在這種情況下，電子閱讀裝置只能被迫中斷處理過程，不能給出最終的結(jié)果。
當(dāng)今公知的郵件綜合處理的解決辦法都基于以下兩步處理原理，簡述如下第一步電子閱讀裝置從掃描器獲得一個(gè)非壓縮的二維/灰度圖像，力求對郵件進(jìn)行全面處理。在此可完成以下處理步驟。
·ROI-識(shí)別可能相關(guān)的信息區(qū)域·區(qū)域中行的劃分·字符識(shí)別和單詞劃分·采用地址分析的地址翻譯-排列一個(gè)單詞可能的含義·地址相關(guān)-決定一種含義，基于與參考數(shù)據(jù)(字典)的比較確定分揀結(jié)果其中，所有的處理步驟都給出侯選的含義。然而，若其中任一步給不出結(jié)果，或得到有相同概率的多個(gè)結(jié)果，以致最后不能確定單義的含義時(shí)，則處理過程最終結(jié)束。
這樣的郵件將作為拒絕郵件發(fā)給機(jī)器控制器，然后啟動(dòng)視頻編碼系統(tǒng)進(jìn)一步處理。第二步視頻編碼系統(tǒng)與電子閱讀裝置同時(shí)或在出現(xiàn)拒絕郵件后，獲得一個(gè)壓縮的二維圖像，在機(jī)器控制器分配任務(wù)后，同樣力求對郵件進(jìn)行全面處理。此時(shí)可以考慮電子閱讀裝置的部分結(jié)果。
在對所有相關(guān)地址進(jìn)行多級(jí)編碼時(shí)，一個(gè)相同的編碼流程首先是各編碼臺(tái)提高處理能力的必要的前提條件。在利用部分結(jié)果時(shí)只能有條件地使每封郵件的編碼費(fèi)用減小，因?yàn)橛纱艘鸬亩鄠€(gè)編碼入口點(diǎn)破壞了均勻性。處理方法遵循以下格言“編碼快于思考”因此，除非利用大量的用戶干預(yù)來限定編碼器，從而輸入最少的必要信息，否則必定給出不必要的信息，這應(yīng)予以容許。由此，由于必要的編碼時(shí)間也限定了在線能力(US-46 32 252)。
分揀機(jī)器的機(jī)械延遲傳送帶的長度對劃分在線和離線處理起決定性作用。大體上有兩種不同的系統(tǒng)可供使用。
1.采用短的延遲傳送帶(大約4-5秒)的機(jī)器只利用一個(gè)電子閱讀裝置對郵件進(jìn)行在線處理。接在后面的編碼系統(tǒng)進(jìn)行離線處理(US-49 92 649)。
2.采用比較長的延遲傳送帶的機(jī)器也能在編碼系統(tǒng)中對部分郵件進(jìn)行在線處理(DE 43 24 255)。
其缺點(diǎn)是它對視頻編碼人員的處理能力要求較高。
在獨(dú)立權(quán)利要求1和4中所給出的發(fā)明的目的是，利用自動(dòng)OCR閱讀器和視頻編碼臺(tái)，盡可能快地讀取郵件表面包含的發(fā)送信息且對視頻編碼人員的較低要求。
由此，在任一步處理步驟中出現(xiàn)非單義的結(jié)果時(shí)，自動(dòng)OCR處理單元不是中斷圖像的處理，而是轉(zhuǎn)到一種待命狀態(tài)，而且為單義解決這一步處理，給每個(gè)視頻編碼臺(tái)產(chǎn)生一個(gè)說明要執(zhí)行操作的任務(wù)，因而對視頻編碼人員的要求較低。這樣提高了總體閱讀過程的處理速度，因而用相應(yīng)的中間存儲(chǔ)器就可以提高在線處理郵件的數(shù)量。
本發(fā)明的有利實(shí)施形式由各從屬權(quán)利要求給出。
根據(jù)權(quán)利要求2和3所述，通過在視頻編碼臺(tái)的屏幕上顯示任務(wù)，以及給各視頻編碼臺(tái)分配不同種類的任務(wù)，可以在編碼處理能力很小時(shí)也能獲得特別快的編碼結(jié)果。
根據(jù)權(quán)利要求5和6有利的是，用任務(wù)編制器產(chǎn)生各視頻編碼臺(tái)的任務(wù)，各任務(wù)編制器在OCR處理單元的關(guān)聯(lián)文本存儲(chǔ)器中搜索非單義的結(jié)果/中間結(jié)果，為單義地解決這個(gè)閱讀問題而編制相應(yīng)的任務(wù)，并將任務(wù)發(fā)送到各視頻編碼臺(tái)，并在屏幕上顯示。
根據(jù)權(quán)利要求7和8，有利形式是設(shè)置應(yīng)答處理器，它將各視頻編碼臺(tái)數(shù)據(jù)插入關(guān)聯(lián)文本存儲(chǔ)器，刪除非單義的結(jié)果，并向OCR處理單元發(fā)送一個(gè)繼續(xù)處理閱讀過程的信號(hào)。
另外根據(jù)權(quán)利要求9，有利的是，在視頻編碼裝置的輸入端設(shè)置一個(gè)任務(wù)分配器，它根據(jù)在編碼臺(tái)數(shù)據(jù)庫中存儲(chǔ)的各視頻編碼臺(tái)的任務(wù)權(quán)限和負(fù)荷信息，將到達(dá)的編碼任務(wù)分配到各視頻編碼臺(tái)。
根據(jù)權(quán)利要求10，有利的是，為了特別快和有效地進(jìn)行工作，在本發(fā)明的裝置前接入一種快速自動(dòng)在線發(fā)送信息閱讀器。若該閱讀器在給定的短時(shí)間段內(nèi)不能讀出發(fā)送信息，該圖像將繼續(xù)傳送給本發(fā)明的裝置。
根據(jù)權(quán)利要求11，對多個(gè)圖像并行處理也是有利的。
下面借助附圖所示實(shí)施例對本發(fā)明作進(jìn)一步說明，附圖中

圖1是讀取發(fā)送信息的處理步驟；圖2是翻譯本發(fā)明流程的方框圖；圖3是區(qū)域搜索時(shí)任務(wù)編制器的流程圖；圖4是區(qū)域搜索時(shí)任務(wù)分配器的流程圖；圖5是屏幕上顯示的區(qū)域搜索的任務(wù)圖6是區(qū)域搜索時(shí)應(yīng)答處理器的流程圖；圖7是在字符識(shí)別和地址分析中對不明含義的地址行不能完全識(shí)別時(shí)任務(wù)編制器的流程圖；圖8是對不明含義的地址行不能完全識(shí)別時(shí)任務(wù)分配器的流程圖；圖9是對不明含義的地址行不能完全識(shí)別時(shí)的任務(wù)顯示；圖10是對不明含義的地址行不能完全識(shí)別時(shí)應(yīng)答處理器的流程圖；圖11是地址相關(guān)時(shí)任務(wù)編制器的流程圖；圖12是地址相關(guān)時(shí)任務(wù)分配器的流程圖；圖13是地址相關(guān)時(shí)任務(wù)顯示；圖14是地址相關(guān)時(shí)應(yīng)答處理器的流程圖。
要處理郵件的圖像在掃描后送給自動(dòng)閱讀器。在此有利的是，根據(jù)系統(tǒng)的已知特性首先將一個(gè)快速自動(dòng)在線閱讀器作為主要的閱讀器，它力求對郵件進(jìn)行非交互的或不中斷的處理。因而在郵件停留在機(jī)器中的時(shí)間內(nèi)肯定得到一個(gè)結(jié)果，從而根據(jù)這個(gè)結(jié)果能馬上對郵件進(jìn)行分配。如果這次的閱讀嘗試失敗，郵件的圖像發(fā)送給帶有一個(gè)OCR處理單元11的本發(fā)明的裝置，該裝置既利用剩余的機(jī)器時(shí)間，又能完全獨(dú)立地產(chǎn)生一個(gè)機(jī)器繼續(xù)運(yùn)行的分配結(jié)果。這種OCR處理單元11由不同的功能組所組成，這些功能組一部分對郵件并行處理，而另一部分則串行處理。本例中郵件為送到接收人而編碼，同時(shí)也應(yīng)確定郵戳的有效性。下面將對本發(fā)明的裝置的各功能組內(nèi)部和功能組之間的流程進(jìn)行描述。這些功能組通過一個(gè)由操作系統(tǒng)提供的套接字接口進(jìn)行通信，這種套接字接口可以有選擇地將單個(gè)功能組安插給一臺(tái)計(jì)算機(jī)，還是安插給通過以太網(wǎng)相連的不同計(jì)算機(jī)。
OCR處理單元11力求對郵件進(jìn)行全面處理。其中不同的處理步驟可以串行運(yùn)行，也可以部分循環(huán)運(yùn)行。
原則上每一步處理步驟為了獲得單義結(jié)果都有各自的特殊問題，因而都是基于視頻編碼處理的候選者。它們所遇到的問題與描述現(xiàn)有技術(shù)時(shí)所述的問題是相同的。
圖1示出的是OCR處理單元11中的不同處理步驟及其由此產(chǎn)生的編碼步驟。其中可以獨(dú)立處理的步驟采用并行進(jìn)行，而相互依賴的步驟則串行進(jìn)行。
根據(jù)圖2，從OCR處理單元11中獲得郵件數(shù)據(jù)，并按照圖1所示的處理流程中規(guī)定的任務(wù)次序進(jìn)行處理。在此，從輸入數(shù)據(jù)和當(dāng)前的部分結(jié)果/結(jié)果中生成一個(gè)郵件關(guān)聯(lián)文本，存儲(chǔ)在關(guān)聯(lián)文本存儲(chǔ)器12中。當(dāng)部分結(jié)果不能簡化為一個(gè)單義的結(jié)果時(shí)，OCR處理單元11的任務(wù)就首次失敗。
這種狀態(tài)下，OCR處理單元11中斷識(shí)別和翻譯過程，并保持在它的處理關(guān)聯(lián)文本中。對此可以利用先進(jìn)的多任務(wù)操作系統(tǒng)的標(biāo)準(zhǔn)機(jī)制。任務(wù)編制器13分析這個(gè)郵件關(guān)聯(lián)文本，并由此對要解決的問題編制一個(gè)任務(wù)發(fā)給視頻編碼裝置20。該任務(wù)的組成是郵件的圖像或圖像片斷、相關(guān)的屬性數(shù)據(jù)和一個(gè)要執(zhí)行的操作。
在視頻編碼裝置20的入口有一個(gè)任務(wù)分配器21始終等候進(jìn)行中的任務(wù)。這些任務(wù)中的要執(zhí)行的操作得到分析后，從可用的一組編碼臺(tái)7中選出一個(gè)合適的編碼臺(tái)7用于解決問題。選擇時(shí)考慮工作臺(tái)的負(fù)荷狀況和編碼模式。若沒有合適的編碼臺(tái)7可用，則給應(yīng)答處理器14反饋一個(gè)任務(wù)反饋信息。
選定的編碼臺(tái)7收到任務(wù)數(shù)據(jù)，并在高分辨率的屏幕上給編碼器顯示郵件圖像。該編碼臺(tái)7會(huì)輸出所需的編碼結(jié)果。這個(gè)結(jié)果會(huì)反饋給應(yīng)答處理器14。
應(yīng)答處理器14將應(yīng)答數(shù)據(jù)插入郵件關(guān)聯(lián)文本，刪除非單義的數(shù)據(jù)，并準(zhǔn)備繼續(xù)執(zhí)行OCR處理單元11的識(shí)別和翻譯過程。
編碼任務(wù)主要包括以下操作·確認(rèn)要求編碼器確認(rèn)自動(dòng)閱讀器輸出的識(shí)別結(jié)果。閱讀器的結(jié)果大多是正確的，但由于要保證的錯(cuò)誤率和達(dá)到正確識(shí)別的概率，也會(huì)出現(xiàn)拒絕這些結(jié)果。通過編碼器的快速確認(rèn)，這些識(shí)別結(jié)果不再被拒絕，而且在在線時(shí)間內(nèi)還能夠用于分揀。
·選擇編碼器從多個(gè)在自動(dòng)識(shí)別過程中作為可能結(jié)果輸出的候選者中進(jìn)行選擇。隨后自動(dòng)識(shí)別過程借助于所述判定幫助的反饋繼續(xù)進(jìn)行?？赡芤獜母鞣N差異極大的對象，例如從部分字符串、候選的相關(guān)圖像區(qū)域(ROI)直到來自地址數(shù)據(jù)庫的候選者中進(jìn)行選擇。
·關(guān)鍵詞編碼器給出由OCR處理單元11標(biāo)記的地址部分的摘要或全部字符串。這些輸入給OCR處理單元11在識(shí)別這些地址成分時(shí)進(jìn)行補(bǔ)充或改善相關(guān)性。
·人工ROI編碼器用光柵方法或觸摸屏從郵件(大信件和包裹)的總圖像中選出所需的相關(guān)圖像區(qū)域(ROI)，如接收者的地址標(biāo)記。接著OCR處理單元11將它的識(shí)別任務(wù)轉(zhuǎn)到人工評估ROI。
所有的操作都是簡單和常規(guī)的，幾乎不包含國家特征，這樣大大降低必需的與用戶有關(guān)的自適應(yīng)性。OCR處理單元11能從它的當(dāng)前關(guān)聯(lián)文本出發(fā)尋求視頻編碼器的幫助，由此通過視頻編碼完整處理它的識(shí)別過程。為提高閱讀和視頻編碼系統(tǒng)的效率，總有多個(gè)識(shí)別過程并行進(jìn)行。為改善工作關(guān)聯(lián)文本，減少編碼時(shí)間，可選的方法是將不同的編碼任務(wù)分配到各個(gè)編碼臺(tái)。這種交互式集成閱讀和視頻編碼方法的優(yōu)點(diǎn)總結(jié)如下·簡單常規(guī)的編碼策略和編碼規(guī)則簡化了視頻編碼器的學(xué)習(xí)過程，特別是在復(fù)雜的地址構(gòu)成或深度編碼時(shí)更是明顯。
·大大降低對編碼人員的編碼能力的要求。這種情況同樣適合在復(fù)雜的地址構(gòu)成和/或深度編碼時(shí)(如過程跟蹤分揀中集成后發(fā)送)。
·自動(dòng)閱讀過程的最佳支持又一次提高在線編碼速率和閱讀和編碼系統(tǒng)的效率。
下面借助選定的處理步驟的編碼任務(wù)對工作過程作進(jìn)一步說明。不能自動(dòng)找出的地址在處理大信件時(shí)經(jīng)常出現(xiàn)的現(xiàn)象是，掃描得到的圖像中除接收地址外還包含許多與地址塊相似的附加信息，如郵票邊的日戳。在這種情況下，搜索地址塊時(shí)經(jīng)常出現(xiàn)完全拒識(shí)，或者通過高強(qiáng)度的多個(gè)候選者的并行驗(yàn)證找到正確的地址，但這一點(diǎn)常常導(dǎo)致超過在線處理時(shí)間的限制。
OCR處理單元11首先力求辨識(shí)接收者地址塊。
a)如果找到的特征不足以確定一個(gè)單義的或較少變化的含義，則凍結(jié)這個(gè)處理步驟，并開始以下處理·給視頻編碼裝置20編制帶有以下參數(shù)的任務(wù)·郵件圖像包括圖像屬性采用TIFF格式·所有要考慮圖像區(qū)域的坐標(biāo)描述·確定詢問的類型，在這種情況下為接收確認(rèn)而詢問是否選擇一個(gè)圖像區(qū)域·視頻編碼裝置20的一個(gè)任務(wù)分配器21選定一個(gè)合適可用的編碼臺(tái)7；·編碼臺(tái)7顯示郵件圖像，并處理詢問；·編碼器輸入的結(jié)果反饋回發(fā)出請求的OCR處理單元11。
在收到應(yīng)答后，郵件的處理過程在以前凍結(jié)的位置重新開始。
b)如果找到的特征不足以確定一個(gè)含義，則凍結(jié)這個(gè)處理步驟的關(guān)聯(lián)文本，并開始以下處理·給視頻編碼裝置20編制帶有以下參數(shù)的任務(wù)·郵件圖像包括圖像屬性采用TIFF格式·確定詢問的類型，在這種情況下為接收確認(rèn)而詢問是否輸入一個(gè)圖像區(qū)域·視頻編碼裝置20的任務(wù)分配器21選定一個(gè)合適可用的編碼臺(tái)7；·編碼臺(tái)7顯示郵件圖像，并處理詢問；·編碼器輸入的結(jié)果反饋回發(fā)出請求的OCR處理單元11。
在收到應(yīng)答后，郵件的處理過程在以前凍結(jié)的位置重新開始。
在大多數(shù)情況下，在用視頻編碼器獲得正確地址塊時(shí)，隨后完全自動(dòng)處理地址塊的概率非常高，因?yàn)閹缀跛写笮偶系牡刂窐?biāo)簽都是用機(jī)器寫的。沒有足夠高概率的地址在處理商務(wù)郵件地址時(shí)經(jīng)常出現(xiàn)的現(xiàn)象是，盡管接收地址原則上是單義的，但自動(dòng)比較的結(jié)果卻是拒識(shí)的，因?yàn)闀鴮懛绞經(jīng)]有一個(gè)能與地址數(shù)據(jù)庫中可找到的地址有足夠高的相關(guān)概率。
OCR處理單元11首先力求讀取接收者地址塊。
如果找到的特征不足以達(dá)到所要求的概率，則凍結(jié)這個(gè)處理步驟，并開始以下處理·給視頻編碼裝置20編制帶有以下參數(shù)的任務(wù)·郵件圖像包括圖像屬性采用TIFF格式·完全的接收地址·確定詢問的類型，在這種情況下詢問是否確認(rèn)接收者地址·視頻編碼裝置20的任務(wù)分配器21選定一個(gè)合適可用的編碼臺(tái)7；·編碼臺(tái)7顯示郵件圖像，并處理詢問；·編碼器輸入的結(jié)果反饋回發(fā)出請求的OCR處理單元11。
在收到應(yīng)答后，郵件的處理過程在以前凍結(jié)的位置重新開始。
從而原則上結(jié)束處理過程。讀不出地址的郵件基于當(dāng)前的技術(shù)水平，在識(shí)別手寫體時(shí)經(jīng)常不能完全自動(dòng)識(shí)別地址。
OCR處理單元11首先力求讀取接收者地址塊。
如果在處理過程中的任一步找到的特征不足以進(jìn)行下一步處理，則凍結(jié)這個(gè)處理步驟，并開始以下處理·給視頻編碼裝置20編制帶有以下參數(shù)的任務(wù)·郵件圖像包括圖像屬性采用TIFF格式·不能處理的圖像區(qū)域的坐標(biāo)描述·確定詢問的類型，在這種情況下詢問是否輸入用坐標(biāo)描述的地址部分
·視頻編碼裝置20的任務(wù)分配器21選定一個(gè)合適可用的編碼臺(tái)7；·編碼臺(tái)7顯示郵件圖像，并處理詢問，·編碼器輸入的結(jié)果反饋回發(fā)出請求的OCR處理單元11。
在收到應(yīng)答后，郵件的處理過程在以前凍結(jié)的位置重新開始。
在多數(shù)情況下，通過清除空隙能夠使自動(dòng)處理過程達(dá)到完整的結(jié)果。如果不是這樣，通常最好的做法是對郵件重復(fù)這一步驟。
下面對特定閱讀流程的功能流程作進(jìn)一步說明。區(qū)域搜索處理開始時(shí)總是選擇相關(guān)圖像區(qū)域(ROI)，即分析整個(gè)圖像的幾何特征區(qū)和色彩特征區(qū)，并由此先提出一種關(guān)于含義的假定。處理時(shí)該假定的組成包括·描述特征區(qū)位置和大小的坐標(biāo)值左下角的X/Y坐標(biāo)對左上角的X/Y坐標(biāo)對右下角的X/Y坐標(biāo)對左上角的X/Y坐標(biāo)對·假定的含義(如接收者地址塊、郵資已付郵戳、發(fā)件者地址塊)存儲(chǔ)在一個(gè)數(shù)據(jù)庫，以下稱為郵件關(guān)聯(lián)文本。
當(dāng)出現(xiàn)非單義結(jié)果時(shí)，OCR處理單元11中負(fù)責(zé)區(qū)域搜索的功能組1促使任務(wù)編制器13對視頻編碼裝置20指定進(jìn)行單義編碼。對這個(gè)郵件來說，功能組1自動(dòng)進(jìn)入一種等待狀態(tài)，直到收到視頻編碼的結(jié)果?；诂F(xiàn)代操作系統(tǒng)提供的并行處理的可能性，已經(jīng)可以開始下一個(gè)郵件的處理。
圖3示出的是任務(wù)編制器13的功能，它一直在關(guān)聯(lián)文本存儲(chǔ)器12中搜索多義的或不存在的區(qū)域，直到只留下單義的和不需再處理的區(qū)域。
接受區(qū)域搜索任務(wù)后110開始搜索多義的或不能找到的區(qū)域111。若發(fā)現(xiàn)具有相同含義的區(qū)域，則編制一個(gè)相應(yīng)的選擇任務(wù)112，并插入找到的相應(yīng)區(qū)域的數(shù)據(jù)中113中。若找不到區(qū)域，則編制一個(gè)輸入帶有已找到含義115的區(qū)域的任務(wù)114。所有區(qū)域處理完畢，進(jìn)行步驟116，將任務(wù)傳給視頻編碼裝置20。
在此基礎(chǔ)上，即使發(fā)現(xiàn)郵戳是單義的，但仍存在具有與接收者地址有相似信息的不同圖像區(qū)域，那么任務(wù)編制器13將此詢問發(fā)給視頻編碼裝置20。
視頻編碼裝置20中對應(yīng)的部分是任務(wù)分配器21，它不是分析整個(gè)任務(wù)，而是必須確定任務(wù)的種類，以便從它的編碼臺(tái)數(shù)據(jù)庫22中的所有當(dāng)前可用的編碼臺(tái)7中選出一個(gè)編碼臺(tái)，其操作人員應(yīng)具有解決這個(gè)任務(wù)所需的能力。這個(gè)任務(wù)對這種方法的有效性非常重要，因?yàn)闉榱吮苊獬霈F(xiàn)不必要的工作停頓，每個(gè)編碼器都應(yīng)獲得足夠的編碼任務(wù)。
圖4示出的是任務(wù)分配器21的功能。
出現(xiàn)找不到適合的編碼臺(tái)的情況，首先會(huì)在處理差異很大的編碼任務(wù)的小型編碼裝置中導(dǎo)致處理時(shí)間的延長，因?yàn)樵谶@種情況下，閱讀器中的處理會(huì)在稍后的時(shí)刻出現(xiàn)中斷，當(dāng)合適的編碼器重新可用時(shí)，處理過程重新開始。
編碼過程本身是盡可能按人體因素設(shè)計(jì)的。圖5表示的是編碼臺(tái)上數(shù)據(jù)的圖形顯示。通過數(shù)字塊實(shí)現(xiàn)選擇，從而編碼器也可以承接基于其它鍵盤輸入的編碼任務(wù)。
編碼器輸入的結(jié)果，即區(qū)域編號(hào)，將用于將該區(qū)域的數(shù)據(jù)作為結(jié)果反饋給OCR處理單元11。若詢問包含不同含義的區(qū)域，則根據(jù)其含義歸類，并在多個(gè)步驟中處理。
區(qū)域搜索的應(yīng)答處理器14刪除郵件關(guān)聯(lián)文本中的多義區(qū)域，插入結(jié)果區(qū)域。這樣到此時(shí)對每個(gè)要處理的區(qū)域只有一個(gè)單義的結(jié)果。
圖6給出的流程圖示出的是應(yīng)答處理器14的功能。在從視頻編碼裝置20收到應(yīng)答310后，將檢驗(yàn)是否作為搜索結(jié)果輸出區(qū)域。若不是這樣，則在OCR處理單元11中繼續(xù)進(jìn)行區(qū)域搜索314，其中將產(chǎn)生處理過程中斷。若在OCR處理單元11中成功完成區(qū)域搜索，則在關(guān)聯(lián)文本存儲(chǔ)器12中檢驗(yàn)是否存在具有相同含義的相應(yīng)的區(qū)域。若是，則刪除這些數(shù)據(jù)312。若有關(guān)這個(gè)區(qū)域的數(shù)據(jù)不再存在于關(guān)聯(lián)文本存儲(chǔ)器中，則來自視頻編碼的數(shù)據(jù)插入關(guān)聯(lián)文本存儲(chǔ)器12中313。
在由區(qū)域搜索重新開始處理過程時(shí)，郵件關(guān)聯(lián)文本按慣例傳遞給隨后的處理單元。此例中指的既是郵戳識(shí)別又是字符處理(OCR)，因?yàn)檫@兩個(gè)單元不依賴于其它單元的處理結(jié)果。
在此郵戳識(shí)別對無需編碼器干預(yù)的簡單任務(wù)已足夠，因?yàn)猷]戳要么是非常清楚，足以從它的形狀單義識(shí)別，要么特別模糊，用視頻編碼器進(jìn)行干預(yù)也不能實(shí)質(zhì)性地提高其結(jié)果。
字符處理過程識(shí)別單個(gè)字符，將字符組成詞，再將詞組成行，由此產(chǎn)生許多的候選者。這些數(shù)據(jù)(字符)以各種可能組合的詞和行存入郵件關(guān)聯(lián)文本中。
這其中包含的信息對羅馬文字來講在很多方面都需要考慮人體特性，因而不在此詳細(xì)討論。對于基于詞或音節(jié)的文字(如中文)，此處也可以考慮采用交互式處理。
字符處理的輸出將郵件關(guān)聯(lián)文本傳遞給地址翻譯。地址翻譯這一處理單元力求確定每個(gè)單詞的含義，由此構(gòu)造一個(gè)一致的地址，以便能得出單義的發(fā)送信息。
在此，假定的含義分配給在郵件關(guān)聯(lián)文本中的每個(gè)單詞，這些含義必須相互補(bǔ)充，以獲得一個(gè)完整的句法正確的地址。
這樣給出的地址變型通過包含所有相關(guān)地的數(shù)據(jù)庫來調(diào)整。地址的變型通過多步迭代獲得，每個(gè)步驟中處理一個(gè)地址部分(如郵政編碼和城市名)。
如果地址中的各單詞不能得出單義的含義，則地址翻譯系統(tǒng)將啟動(dòng)一個(gè)任務(wù)編制器13，該任務(wù)編制器13在郵件關(guān)聯(lián)文本中搜索含義不明的地址部分，因?yàn)槔缰荒懿煌耆_認(rèn)地址中的字符。任務(wù)編制器13的功能在圖7中用流程圖描述。
接受輸入字符的任務(wù)后120，開始在關(guān)聯(lián)文本存儲(chǔ)器中搜索不具有單義含義的地址部分121。若找到了，則給不明字符編制一個(gè)輸入任務(wù)122，其中，插入?yún)^(qū)域數(shù)據(jù)和輸入方法123。若確定了所有的不明地址部分并編制了相應(yīng)的任務(wù)，則將總?cè)蝿?wù)124繼續(xù)傳給視頻編碼裝置20。
在視頻編碼裝置20中對應(yīng)的任務(wù)分配器21在接受任務(wù)220后確定任務(wù)的種類，以便在它的編碼臺(tái)數(shù)據(jù)庫22中搜索可用的一個(gè)或多個(gè)視頻編碼臺(tái)221，其操作人員應(yīng)具有解決這個(gè)任務(wù)所需的能力；在多個(gè)編碼臺(tái)時(shí)選定編碼臺(tái)應(yīng)有最小負(fù)荷222。若確定了相應(yīng)的視頻編碼臺(tái)，則給這個(gè)編碼臺(tái)發(fā)送一個(gè)任務(wù)225。若沒有視頻編碼臺(tái)可供使用，則形成一個(gè)反饋應(yīng)答223，向OCR處理單元11發(fā)送過去224(見圖8)。
出現(xiàn)找不到合適編碼臺(tái)的情況，首先會(huì)在處理差異很大的編碼任務(wù)的小型編碼系統(tǒng)中導(dǎo)致處理時(shí)間的延長，因?yàn)樵谶@種情況下，閱讀器中的處理會(huì)在稍后的時(shí)刻出現(xiàn)中斷，當(dāng)合適的編碼器重新可用時(shí)，處理過程重新開始。
編碼過程本身是盡可能按人體因素設(shè)計(jì)的。
圖9表示的是編碼臺(tái)上數(shù)據(jù)的圖形顯示。通過標(biāo)準(zhǔn)鍵盤實(shí)現(xiàn)輸入。輸入方法(例如第一個(gè)單詞的前3個(gè)字符和數(shù)字)通過詢問確定，因?yàn)榇朔椒ㄒ蕾囉趹?yīng)用數(shù)據(jù)庫的存取方法。
這個(gè)輸入的結(jié)果將反饋給閱讀器。若詢問包括多個(gè)區(qū)域，則處理過程用多個(gè)步驟實(shí)現(xiàn)。
地址翻譯的應(yīng)答處理器14刪除郵件關(guān)聯(lián)文本中不能識(shí)別區(qū)域的多義字符，插入結(jié)果字符。這樣到此時(shí)對每個(gè)要處理的區(qū)域只有一個(gè)單義的結(jié)果。
圖10中的流程圖示出的是應(yīng)答處理器14的功能。在從視頻編碼裝置20收到應(yīng)答后320，檢驗(yàn)是否存在對任務(wù)的應(yīng)答。若不是這樣，則在OCR處理單元中繼續(xù)地址翻譯324，其中，出現(xiàn)處理過程中斷。若成功完成視頻編碼，則在關(guān)聯(lián)文本存儲(chǔ)器12中搜索沒有含義的區(qū)域。若找到這樣的區(qū)域，則刪除相應(yīng)的字符322，將來自視頻編碼的字符數(shù)據(jù)插入郵件關(guān)聯(lián)文本中323，再繼續(xù)地址翻譯324。
在由地址翻譯重新開始處理過程時(shí)，若不能單義地定義地址或部分地址，則地址翻譯中的判定器將在郵件關(guān)聯(lián)文本中搜索地址或部分地址的所有可能的含義。基于不同的判定準(zhǔn)則(例如每種可能性的概率、已定義的錯(cuò)誤率)判定器力求得到一個(gè)單義的結(jié)果，或者列出可能的候選者名單。經(jīng)判定器減少的可能的候選者名單將打上標(biāo)記，啟動(dòng)相應(yīng)的任務(wù)編制器。
圖11中的流程圖示出的是任務(wù)編制器13的功能。
在接受地址候選者的判定任務(wù)后130，在郵件關(guān)聯(lián)文本中搜索具有相同地址/地址部分的已標(biāo)記的各候選者。若找到了，則編制一個(gè)選擇任務(wù)132。各候選者和區(qū)域?qū)⒉迦肴蝿?wù)中133。若所有標(biāo)記的候選者都找到了，則將一個(gè)相應(yīng)的任務(wù)傳給視頻編碼裝置20中134。
在視頻編碼裝置20中對應(yīng)的任務(wù)分配器在接受任務(wù)230后確定任務(wù)的種類，以便在它的編碼臺(tái)數(shù)據(jù)庫22中搜索可用的一個(gè)或多個(gè)視頻編碼臺(tái)231，其操作人員應(yīng)具有解決這個(gè)任務(wù)所需的能力。在多個(gè)編碼臺(tái)時(shí)，選定編碼臺(tái)應(yīng)有最小負(fù)荷232。若確定了相應(yīng)的視頻編碼臺(tái)，則給這個(gè)編碼臺(tái)發(fā)送一個(gè)任務(wù)235。若沒有視頻編碼臺(tái)可供作用，則形成一個(gè)反饋應(yīng)答233，向OCR處理單元11發(fā)送過去234(見圖12)。
出現(xiàn)找不到合適編碼臺(tái)的情況，首先會(huì)在處理差異很大的編碼任務(wù)的小型編碼系統(tǒng)中導(dǎo)致處理時(shí)間的延長，因?yàn)樵诖饲闆r下，閱讀器中的處理會(huì)在稍后的時(shí)刻出現(xiàn)中斷，當(dāng)合適的編碼器重新可用時(shí)，處理過程重新開始。
編碼過程本身是盡可能按人體因素設(shè)計(jì)的。圖13表示的是編碼臺(tái)上數(shù)據(jù)的圖形顯示。通過標(biāo)準(zhǔn)鍵盤實(shí)現(xiàn)輸入。
編碼輸入的結(jié)果，即候選者的編號(hào)用于將這些候選者的數(shù)據(jù)作為結(jié)果反饋給閱讀器。若任務(wù)包括選擇不同的地址部分，則處理過程用多個(gè)步驟實(shí)現(xiàn)。
判定任務(wù)的應(yīng)答處理器刪除已處理地址部分的候選者，插入結(jié)果數(shù)據(jù)。
圖14中的流程圖表示的是其功能。在從視頻編碼裝置20收到應(yīng)答后330，檢驗(yàn)是否存在對任務(wù)的應(yīng)答。若不是這樣，則在OCR處理單元中繼續(xù)判定過程334，其中，出現(xiàn)處理過程中斷。若成功完成視頻編碼，則在關(guān)聯(lián)文本存儲(chǔ)器12中搜索可能的地址部分331并將其刪除332。然后將視頻編碼的地址部分插入關(guān)聯(lián)文本存儲(chǔ)器中333，再利用結(jié)果輸出繼續(xù)判定過程334。
權(quán)利要求
1.一種識(shí)別郵件發(fā)送信息的方法，借助于OCR對采集和存儲(chǔ)的包含發(fā)送信息的郵件表面的圖像進(jìn)行自動(dòng)閱讀，其中，以同時(shí)運(yùn)行和先后運(yùn)行的步驟執(zhí)行自動(dòng)閱讀，例如確定感興趣的區(qū)域(1)(ROI)；閱讀郵票(2)、分行、分段、識(shí)別字符和單詞(4)、利用地址分析和與地址數(shù)據(jù)庫中的地址相比較進(jìn)行地址翻譯(5)，其中，只有在前一步以單義的結(jié)果結(jié)束時(shí)，以及在一個(gè)帶有視頻編碼臺(tái)(7)的視頻編碼裝置(20)中對不能自動(dòng)單義地識(shí)別的發(fā)送信息進(jìn)行編碼時(shí)，才執(zhí)行相應(yīng)的下一個(gè)步驟，在視頻編碼臺(tái)(7)的高分辨率顯示器上顯示發(fā)送來的包含發(fā)送信息的相應(yīng)圖像，其特征在于在自動(dòng)運(yùn)行的閱讀信息步驟(1-6)中的任一步出現(xiàn)非單義結(jié)果時(shí)，識(shí)別過程暫停在當(dāng)前步驟；從到此為止產(chǎn)生的單義的和非單義的結(jié)果和中間結(jié)果中，自動(dòng)地將說明非單義和缺損結(jié)果和要執(zhí)行的操作的視頻編碼任務(wù)發(fā)送到一個(gè)或多個(gè)視頻編碼臺(tái)(7)以得到單義的識(shí)別結(jié)果；利用代替非單義結(jié)果的單義編碼結(jié)果，暫停的自動(dòng)閱讀步驟成功地結(jié)束，并開始隨后的步驟。
2.根據(jù)權(quán)利要求1所述的方法，其特征在于視頻編碼時(shí)在各個(gè)視頻編碼臺(tái)(7)的屏幕上顯示包含待閱讀發(fā)送信息的圖像、要解決的任務(wù)和至此為止產(chǎn)生的結(jié)果和/或部分結(jié)果。
3.根據(jù)權(quán)利要求1所述的方法，其特征在于在視頻編碼裝置中，每個(gè)視頻編碼臺(tái)(7)只負(fù)責(zé)各種視頻編碼任務(wù)中的一部分，根據(jù)任務(wù)的類別及對此負(fù)責(zé)的視頻編碼臺(tái)，并根據(jù)各視頻編碼臺(tái)當(dāng)前的負(fù)荷，將編碼任務(wù)分配到各視頻編碼臺(tái)。
4.一種識(shí)別郵件發(fā)送信息的裝置，包括·一個(gè)具有各種功能組的OCR自動(dòng)處理單元(11)，這些功能組例如用于確定感興趣的區(qū)域(ROI)、分行、分段、識(shí)別字符和單詞、地址分析、在相連接的一個(gè)地址數(shù)據(jù)庫中進(jìn)行地址比較，其中，在關(guān)聯(lián)文本存儲(chǔ)器(12)中存放結(jié)果、部分結(jié)果、發(fā)送信息分析的狀態(tài)和輸入數(shù)據(jù)，·一個(gè)至少具有一個(gè)視頻編碼臺(tái)(7)的視頻編碼裝置(20)，用于處理OCR處理單元(11)不能單義閱讀的發(fā)送信息，其特征在于OCR自動(dòng)處理單元(11)如此設(shè)計(jì)，以便在功能組出現(xiàn)非單義或錯(cuò)誤的中間結(jié)果和/或結(jié)果時(shí)保持在各自的當(dāng)前狀態(tài)，并向視頻編碼裝置(20)發(fā)送相應(yīng)的對非單義的作業(yè)進(jìn)行視頻編碼處理的任務(wù)請求，而OCR處理單元(11)在收到單義的視頻編碼結(jié)果后繼續(xù)已中斷的處理過程。
5.根據(jù)權(quán)利要求4所述的裝置，其特征在于至少有一個(gè)任務(wù)編制器(13)與OCR處理單元(11)相連接，它接收各閱讀功能的任務(wù)信號(hào)，為各閱讀功能在關(guān)聯(lián)文本存儲(chǔ)器(12)中搜索非單義的或沒有找到的結(jié)果，由此，編制一個(gè)由附有已找到和/或要閱讀的發(fā)送信息的郵件表面的圖像、OCR處理單元(11)各功能組輸出的非單義結(jié)果以及編碼作業(yè)組成的任務(wù)，并將該任務(wù)發(fā)送到視頻編碼裝置(20)。
6.根據(jù)權(quán)利要求4或5所述的裝置，其特征在于OCR處理單元(11)的每個(gè)功能組后面連接著與視頻編碼裝置(20)相連的任務(wù)編制器(13)。
7.根據(jù)權(quán)利要求4所述的裝置，其特征在于至少有一個(gè)與視頻編碼裝置(20)相連的應(yīng)答處理器(14)與OCR處理單元(11)相連接，它將視頻編碼裝置(20)的應(yīng)答數(shù)據(jù)插入到關(guān)聯(lián)文本存儲(chǔ)器(12)中，刪除非單義的結(jié)果，以及向視頻編碼單元(11)發(fā)送一個(gè)繼續(xù)進(jìn)行閱讀過程的信號(hào)。
8.根據(jù)權(quán)利要求4或7所述的裝置，其特征在于OCR處理單元(11)中的每個(gè)功能組與一個(gè)與視頻編碼裝置(20)相連的應(yīng)答處理器(14)相連接。
9.根據(jù)權(quán)利要求4或7所述的裝置，其特征在于每個(gè)視頻編碼臺(tái)(7)在確定發(fā)送信息時(shí)只對編碼作業(yè)中的一部分負(fù)責(zé)，而所有的視頻編碼臺(tái)(7)都通過一個(gè)任務(wù)分配器(21)與視頻編碼裝置(20)的輸入相連，其中，任務(wù)分配器(21)根據(jù)存儲(chǔ)在一個(gè)相連接的編碼臺(tái)數(shù)據(jù)庫中的各視頻編碼臺(tái)(7)的作業(yè)權(quán)限和負(fù)荷狀態(tài)信息，將視頻編碼任務(wù)分配到各視頻編碼臺(tái)(7)。
10.根據(jù)權(quán)利要求4至9所述的裝置，其特征在于在自動(dòng)OCR處理單元(11)前接入一個(gè)快速自動(dòng)在線發(fā)送信息閱讀器，其中，只有在出現(xiàn)非單義的閱讀結(jié)果時(shí)，才將相應(yīng)圖像的閱讀任務(wù)轉(zhuǎn)發(fā)給自動(dòng)OCR處理單元(11)。
11.根據(jù)權(quán)利要求4至10所述的裝置，其特征在于同時(shí)處理具有待確定發(fā)送信息的多幅圖像。
全文摘要
本發(fā)明涉及采用自動(dòng)OCR閱讀和視頻編碼方法來識(shí)別郵件發(fā)送信息的方法和裝置,其中,為了既快又省地閱讀,在自動(dòng)運(yùn)行的閱讀信息步驟中的任一步出現(xiàn)非單義結(jié)果時(shí),識(shí)別過程暫停在當(dāng)前步驟;從到此為止產(chǎn)生的單義的和非單義的結(jié)果和中間結(jié)果中,自動(dòng)地將說明非單義和缺損結(jié)果和要執(zhí)行的操作的視頻編碼任務(wù)發(fā)送到一個(gè)或多個(gè)視頻編碼臺(tái)以得到單義的識(shí)別結(jié)果;利用代替非單義結(jié)果的單義編碼結(jié)果,暫停的自動(dòng)閱讀步驟成功地結(jié)束,并開始隨后的步驟。
文檔編號(hào)B07C3/10GK1273542SQ98809865
公開日2000年11月15日申請日期1998年8月26日優(yōu)先權(quán)日1997年11月4日
發(fā)明者本諾·尼斯旺德, 于爾根·齊倫申請人:西門子公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：本諾.尼斯旺德;于爾根.齊倫
技術(shù)所有人：西門子公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、謝老師：1.代謝工程：氨基酸和核苷酸及衍生物代謝工程育種、代謝網(wǎng)絡(luò)定量分析、氨基酸和核苷酸及衍生物產(chǎn)品開發(fā)和應(yīng)用 2.發(fā)酵工程：發(fā)酵過程優(yōu)化放大，產(chǎn)品分離提取，節(jié)能減排和資源高效利用 3.系統(tǒng)生物學(xué)：重要工業(yè)微生物生理代謝、基因組和蛋白質(zhì)組等比較組學(xué)研究。
2、王老師：1.化工過程系統(tǒng)工程 2.化工過程強(qiáng)化 3.反應(yīng)精餾；精密精餾
3、鄧?yán)蠋煟?font color="777777">1.新型分離、富集材料 2.高靈敏、高通量分離分析檢測技術(shù) 3.新型高靈敏傳感檢測
4、鄧?yán)蠋煟?font color="777777">鹵水資源綜合利用、稀有元素分離技術(shù)、相平衡與相圖、溶液熱力學(xué)與熱化學(xué)、海洋化學(xué)
5、唐老師：海水和鹵水資源綜合利用、食鹽與健康及鹽產(chǎn)品高值化、膜分離技術(shù)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

java發(fā)送郵件的方法相關(guān)技術(shù)

outlook定時(shí)發(fā)送郵件相關(guān)技術(shù)

發(fā)送郵件相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

識(shí)別郵件發(fā)送信息的方法和裝置的制作方法