用于一個(gè)或多個(gè)圖像處理算法的自動(dòng)選擇的方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開(kāi)了用于圖像處理的自動(dòng)算法選擇的方法和系統(tǒng)。本發(fā)明公開(kāi)用于對(duì)處理的圖像的變化的要求自動(dòng)選擇正確的算法的方法和系統(tǒng)。算法的選擇是完全自動(dòng)的并且由多個(gè)機(jī)器學(xué)習(xí)方法指導(dǎo)。這里的系統(tǒng)被配置為預(yù)處理多個(gè)圖像以用于創(chuàng)建訓(xùn)練數(shù)據(jù)。接下來(lái),提取、預(yù)處理和匹配測(cè)試圖像,以用于估計(jì)處理算法的最可能匹配。
【專利說(shuō)明】用于一個(gè)或多個(gè)圖像處理算法的自動(dòng)選擇的方法和系統(tǒng)
[0001]相關(guān)申請(qǐng)的交叉引用
[0002]本專利申請(qǐng)要求于2013年05月24日提交的印度專利申請(qǐng)N0.1840/MUM/2013的權(quán)益。
【技術(shù)領(lǐng)域】
[0003]本文描述的本發(fā)明主題一般涉及圖像處理,并且更具體涉及一個(gè)或多個(gè)圖像處理算法的自動(dòng)選擇。
【背景技術(shù)】
[0004]圖像處理涉及圖像如照片或視頻幀的處理以生成已處理圖像,或涉及與圖像有關(guān)的特征或參數(shù)的集合作為處理的輸出。
[0005]圖像的處理可以涉及各種任務(wù)如二值化、頁(yè)面分割、斜度校正、符號(hào)識(shí)別和頁(yè)面布局分析。通過(guò)市場(chǎng)中可用的各種傳統(tǒng)已知算法可以完成這些任務(wù)。但是,在內(nèi)部圖像變化中出現(xiàn)重大問(wèn)題,其中單一算法可能不能產(chǎn)生可接受的或期望的結(jié)果。而且,沒(méi)有已知的單一算法可以在所有的情況下很好地處理圖像。
[0006]而且,在傳統(tǒng)方法中,基于用戶反饋來(lái)選擇算法或技術(shù)及其相應(yīng)的參數(shù),以為了獲得期望的已處理圖像。傳統(tǒng)方法的主要限制在于其涉及人工干預(yù),人工干預(yù)使得系統(tǒng)變慢并且使得最終結(jié)果對(duì)于人類感知靈敏。盡管存在用于使用機(jī)器學(xué)習(xí)方法來(lái)對(duì)圖像處理建議合適算法的各種方法,但是這些從未解決內(nèi)部圖像變化所面對(duì)的挑戰(zhàn)。因此,存在從多個(gè)算法中自動(dòng)識(shí)別在處理期間匹配圖像要求的一個(gè)或多個(gè)算法的需要。本發(fā)明的實(shí)施方式意圖滿足這些需要和從下文提出的說(shuō)明和附圖中變得顯而易見(jiàn)的其它目的。
【發(fā)明內(nèi)容】
[0007]提供本
【發(fā)明內(nèi)容】
來(lái)介紹涉及用于一個(gè)或多個(gè)圖像處理算法的自動(dòng)選擇的系統(tǒng)和方法的方案并且在以下詳細(xì)說(shuō)明中進(jìn)一步描述方案。本
【發(fā)明內(nèi)容】
并不意圖確定所要求的本發(fā)明主題的基本特征,也不意圖用于確定和限定所要求的本發(fā)明主題的范圍。
[0008]在一個(gè)實(shí)現(xiàn)中,公開(kāi)了用于一個(gè)或多個(gè)預(yù)存儲(chǔ)圖像處理算法的自動(dòng)選擇以用于圖像處理的圖像處理系統(tǒng)。圖像處理系統(tǒng)包括處理器以及耦合至處理器的存儲(chǔ)器,該處理器用于執(zhí)行存在在存儲(chǔ)器中的多個(gè)模塊。多個(gè)模塊包括:接收模塊、圖像處理模塊、比較模塊、記錄模塊和匹配模塊。接收模塊被配置為接收至少一個(gè)圖像。圖像處理模塊被配置為將所接收?qǐng)D像分割為多個(gè)圖像片段并且進(jìn)一步在每個(gè)圖像片段上執(zhí)行來(lái)自多個(gè)圖像處理算法的一個(gè)或多個(gè)預(yù)存儲(chǔ)算法以為了獲得多個(gè)圖像處理算法輸出。另一方面,比較模塊被配置為將圖像處理算法輸出中的每個(gè)與預(yù)定閾值圖像處理輸出得分進(jìn)行比較。記錄模塊被配置為將圖像處理算法連同相應(yīng)的一個(gè)或多個(gè)圖像片段以及關(guān)聯(lián)的特征向量一起記錄為訓(xùn)練對(duì)。匹配模塊被配置為匹配來(lái)自每個(gè)輸入預(yù)處理測(cè)試圖像的訓(xùn)練對(duì)中的一個(gè)或多個(gè)潛在匹配圖像處理算法。
[0009]在一個(gè)實(shí)現(xiàn)中,公開(kāi)了在圖像處理環(huán)境中用于自動(dòng)選擇一個(gè)或多個(gè)算法的計(jì)算機(jī)實(shí)現(xiàn)的方法。該方法包括接收至少一個(gè)圖像。將接收的圖像分割為多個(gè)圖像片段。在接下來(lái)的步驟中,在每個(gè)圖像片段中上執(zhí)行來(lái)自多個(gè)圖像處理算法的一個(gè)或多個(gè)預(yù)存儲(chǔ)算法,以為了獲得多個(gè)圖像處理算法輸出。而且,將每個(gè)圖像處理算法輸出與預(yù)定閾值圖像處理輸出得分進(jìn)行比較。針對(duì)每個(gè)超過(guò)預(yù)定閾值圖像處理輸出得分的圖像處理算法,將圖像處理算法連同相應(yīng)的一個(gè)或多個(gè)圖像片段以及關(guān)聯(lián)的特征向量一起記錄為訓(xùn)練對(duì)。在接下來(lái)的步驟中,從每個(gè)輸入預(yù)處理測(cè)試圖像的訓(xùn)練對(duì)中選擇一個(gè)或多個(gè)潛在匹配圖像處理算法。
【專利附圖】
【附圖說(shuō)明】
[0010]參考附圖來(lái)描述詳細(xì)說(shuō)明。在圖中,參考標(biāo)號(hào)的最左邊的數(shù)字指示其中首次出現(xiàn)參考標(biāo)號(hào)的圖。相同的標(biāo)號(hào)在所有圖中使用以指示相似的特征和組件。
[0011]圖1示出根據(jù)本發(fā)明主題的實(shí)施方式顯示的圖像處理系統(tǒng)的網(wǎng)路實(shí)現(xiàn)。
[0012]圖2示出根據(jù)本發(fā)明主題的實(shí)施方式的圖像處理系統(tǒng)。
[0013]圖3示出根據(jù)本發(fā)明主題的實(shí)施方式的圖像處理系統(tǒng)的方框圖。
[0014]圖4示出根據(jù)本發(fā)明主題的實(shí)施方式的在圖像處理環(huán)境中自動(dòng)選擇一個(gè)或多個(gè)算法的方法。
[0015]圖5示出根據(jù)本發(fā)明主題的實(shí)施方式用于獲得預(yù)處理測(cè)試圖像的方法。
[0016]圖6示出根據(jù)本發(fā)明主題的實(shí)施方式用于圖像處理的流程圖。
[0017]圖7示出根據(jù)本發(fā)明主題的實(shí)施方式的示例性圖像處理系統(tǒng)及其工作。
[0018]圖8示出根據(jù)本發(fā)明主題的實(shí)施方式的圖像處理系統(tǒng)的結(jié)果。
【具體實(shí)施方式】
[0019]公開(kāi)用于在圖像處理環(huán)境中自動(dòng)選擇一個(gè)或多個(gè)算法的系統(tǒng)和方法。
[0020]在一個(gè)實(shí)現(xiàn)中,圖像處理系統(tǒng)包括處理器和耦合至處理器的存儲(chǔ)器,該處理器用于執(zhí)行存在在存儲(chǔ)器中的多個(gè)模塊。多個(gè)模塊包括:接收模塊、圖像處理模塊、比較模塊、記錄模塊和匹配模塊。接收模塊被配置為接收至少一個(gè)圖像。圖像處理模塊被配置為將接收的圖像分割為多個(gè)圖像片段。圖像處理模塊進(jìn)一步被配置為在每個(gè)圖像片段上,使用來(lái)自多個(gè)圖像處理算法中的一個(gè)或多個(gè)預(yù)存儲(chǔ)算法執(zhí)行圖像處理以為了獲得多個(gè)圖像處理算法輸出。另一方面,比較模塊被配置為將每個(gè)圖像處理算法輸出與預(yù)定閾值圖像處理輸出得分進(jìn)行比較。記錄模塊被配置為將圖像處理算法連同相應(yīng)的一個(gè)或多個(gè)圖像片段以及關(guān)聯(lián)的特征向量一起記錄作為訓(xùn)練對(duì)。匹配模塊被配置為匹配每個(gè)來(lái)自輸入預(yù)處理測(cè)試圖像的所述訓(xùn)練的一個(gè)或多個(gè)潛在匹配圖像處理算法。
[0021]在一個(gè)實(shí)現(xiàn)中,可以通過(guò)圖像處理系統(tǒng)接收?qǐng)D像。使用已經(jīng)分割算法將接收的圖像分割為多個(gè)片段。多個(gè)預(yù)存儲(chǔ)的算法可以適用在多個(gè)片段上。而且,將通過(guò)執(zhí)行算法獲得的每個(gè)結(jié)果與預(yù)定閾值圖像處理輸出得分進(jìn)行比較。在下一個(gè)步驟中,針對(duì)每個(gè)超過(guò)預(yù)定閾值圖像處理輸出得分的圖像處理算法,將圖像處理算法連同對(duì)應(yīng)的一個(gè)或多個(gè)圖像片段及其關(guān)聯(lián)的特征向量一起記錄作為訓(xùn)練對(duì)。而且,從輸入預(yù)處理測(cè)試圖像的訓(xùn)練對(duì)中選擇一個(gè)或多個(gè)匹配圖像處理算法。
[0022]在一個(gè)實(shí)現(xiàn)中,通過(guò)接收被進(jìn)一步分割為多個(gè)片段的測(cè)試圖像來(lái)獲得預(yù)處理測(cè)試圖像。繼而從多個(gè)片段中提取多個(gè)特征。
[0023]雖然所描述的在圖像處理方案中的自動(dòng)選擇一個(gè)或多個(gè)算法的系統(tǒng)和方法的方案可以在任意數(shù)量的不同計(jì)算系統(tǒng)、環(huán)境和/或配置中實(shí)現(xiàn),但是在以下示例性系統(tǒng)的環(huán)境中描述實(shí)施方式。
[0024]現(xiàn)參考圖1,示出根據(jù)本發(fā)明主題的實(shí)施方式的,用于在圖像處理環(huán)境中自動(dòng)選擇一個(gè)或多個(gè)算法的圖像處理系統(tǒng)102的網(wǎng)絡(luò)實(shí)現(xiàn)100。在一個(gè)實(shí)施方式中,圖像處理系統(tǒng)102被配置為接收?qǐng)D像。使用已知分割算法將接收的圖像分割為多個(gè)片段。多個(gè)預(yù)存儲(chǔ)算法應(yīng)用在多個(gè)片段上。而且,將通過(guò)執(zhí)行算法獲得的每個(gè)結(jié)果與預(yù)定閾值圖像處理輸出得分進(jìn)行比較。在下一個(gè)步驟中,針對(duì)超過(guò)預(yù)定閾值圖像處理輸出得分的圖像處理算法中的每個(gè),將圖像處理算法連同對(duì)應(yīng)的一個(gè)或多個(gè)圖像片段以及關(guān)聯(lián)的特征向量一起記錄作為訓(xùn)練對(duì)。而且,從用于每個(gè)輸入預(yù)處理測(cè)試圖像的訓(xùn)練對(duì)中選擇一個(gè)或多個(gè)潛在匹配圖像處理算法。
[0025]盡管考慮圖像處理系統(tǒng)102實(shí)現(xiàn)在服務(wù)器上來(lái)解釋本發(fā)明主題,但是可以理解的是圖像處理系統(tǒng)102可以實(shí)現(xiàn)在各種計(jì)算系統(tǒng)中,例如筆記本電腦、臺(tái)式計(jì)算機(jī)、工作站、大型計(jì)算機(jī)、服務(wù)器和網(wǎng)絡(luò)服務(wù)器等等。要理解的是,可以由多個(gè)用戶通過(guò)在下文中統(tǒng)一稱為用戶104的一個(gè)或多個(gè)用戶設(shè)備104-1、104-2、…、104-N或存在用戶設(shè)備104上的應(yīng)用來(lái)訪問(wèn)圖像處理系統(tǒng)102。用戶設(shè)備104的實(shí)例可以包括但不限于便攜計(jì)算機(jī)、個(gè)人數(shù)字助理、手持設(shè)備和工作站。用戶設(shè)備通過(guò)網(wǎng)絡(luò)106可通信地與圖像處理系統(tǒng)102耦合。
[0026]在一個(gè)實(shí)現(xiàn)中,網(wǎng)絡(luò)106可以為無(wú)線網(wǎng)絡(luò)、有線網(wǎng)絡(luò)或其結(jié)合。網(wǎng)絡(luò)106可以實(shí)現(xiàn)為不同網(wǎng)絡(luò)中的一種,例如企業(yè)內(nèi)部網(wǎng)、局域網(wǎng)(LAN)、廣域網(wǎng)(WAN)以及互聯(lián)網(wǎng)等等。網(wǎng)絡(luò)106可以為專用網(wǎng)絡(luò)或者共享網(wǎng)絡(luò)。共享網(wǎng)絡(luò)代表使用各種協(xié)議的不同類型的網(wǎng)絡(luò)的聯(lián)合,例如超文本傳輸協(xié)議(HTTP)、傳輸控制協(xié)議/因特網(wǎng)互聯(lián)協(xié)議(TCP/IP)和無(wú)線應(yīng)用協(xié)議(WAP)等等來(lái)相互通信。而且,網(wǎng)絡(luò)106可以包括各種網(wǎng)絡(luò)設(shè)備,包括例程、橋接器、服務(wù)器、計(jì)算設(shè)備和存儲(chǔ)設(shè)備等等。
[0027]現(xiàn)參考圖2,其示出根據(jù)本發(fā)明的主題圖像處理系統(tǒng)102。在一個(gè)實(shí)現(xiàn)中,圖像處理系統(tǒng)102可以包括至少一個(gè)處理器202、輸入/輸出(I/O)接口 204以及存儲(chǔ)器206。至少一個(gè)處理器202可以實(shí)現(xiàn)為一個(gè)或多個(gè)微處理器,微型計(jì)算機(jī)、微型控制器、數(shù)字信號(hào)處理器、中央處理單元、狀態(tài)機(jī)、邏輯電路和/或基于操作指令操縱信號(hào)的任何設(shè)備。在其它性能中,至少一個(gè)處理器202被配置為取得和執(zhí)行存儲(chǔ)在存儲(chǔ)器206中的計(jì)算機(jī)可讀指令。
[0028]I/O接口 204可以包括各種軟件和硬件接口,例如網(wǎng)頁(yè)接口和圖形用戶接口等。I/O接口 204可以允許圖形處理系統(tǒng)102與用戶直接或通過(guò)客戶設(shè)備104相互作用。而且,I/O接口 204可以使得圖形處理系統(tǒng)102能夠與其它計(jì)算設(shè)備,例如網(wǎng)頁(yè)服務(wù)器和外部數(shù)據(jù)服務(wù)器(未示出)相互通信。I/O接口 204可以有助于在包括有線網(wǎng)絡(luò)(例如LAN、線纜等)和無(wú)線網(wǎng)絡(luò)(例如WLAN、移動(dòng)電話或衛(wèi)星)的各種網(wǎng)絡(luò)和協(xié)議類型中的多重通信。I/O接口 203可以包括用于將多個(gè)設(shè)備進(jìn)行相互連接或連接至另一個(gè)服務(wù)器的一個(gè)或多個(gè)端口。
[0029]存儲(chǔ)器206可以包括在本領(lǐng)域中已知的任意計(jì)算機(jī)可讀介質(zhì),例如易失性存儲(chǔ)器,諸如靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM)和動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DRAM),和/或非易失性存儲(chǔ)器,諸如只讀存儲(chǔ)器(ROM)、可擦除編程ROM、閃存、硬盤(pán)、光盤(pán)和磁帶。存儲(chǔ)器206可以包括模塊208和數(shù)據(jù)210。
[0030]模塊208包括執(zhí)行具體任務(wù)或?qū)崿F(xiàn)具體抽象數(shù)據(jù)類型的例程、程序、對(duì)象、組件、數(shù)據(jù)結(jié)構(gòu)等。在一個(gè)實(shí)現(xiàn)中,模塊208可以包括接收模塊212、圖像處理模塊214、比較模塊216、記錄模塊218、匹配模塊220和其它模塊222。其它模塊222可以包括用于補(bǔ)充圖像處理系統(tǒng)102的應(yīng)用和功能的程序和編碼指令。
[0031]除其它事項(xiàng)外,數(shù)據(jù)210用作存儲(chǔ)由一個(gè)或多個(gè)模塊208處理、接收和生成的數(shù)據(jù)的庫(kù)。數(shù)據(jù)210還可以包括接收數(shù)據(jù)庫(kù)224、圖像處理數(shù)據(jù)庫(kù)226、比較數(shù)據(jù)庫(kù)228、記錄數(shù)據(jù)庫(kù)230、匹配數(shù)據(jù)庫(kù)232和其它數(shù)據(jù)130。其它數(shù)據(jù)130可以包括由于在其它模塊218中的一個(gè)或多個(gè)模塊的執(zhí)行而導(dǎo)致的數(shù)據(jù)。
[0032]在一個(gè)實(shí)現(xiàn)中,用戶可以使用客戶設(shè)備104來(lái)經(jīng)由I/O接口 204訪問(wèn)圖像處理系統(tǒng)102。用戶可以使用I/O接口 204來(lái)注冊(cè)他們以為了使用圖像處理系統(tǒng)102。圖像處理系統(tǒng)102的工作可以在以下解釋的圖3和圖4中詳細(xì)解釋。圖像處理系統(tǒng)102可以用于在圖像處理環(huán)境中自動(dòng)選擇一個(gè)或多個(gè)算法。圖像處理系統(tǒng)102的實(shí)際工作在以下段落中說(shuō)明。
[0033]參考圖3,框圖300描述根據(jù)本發(fā)明的主題的實(shí)施方式的圖像處理系統(tǒng)102的詳細(xì)工作。
[0034]在一個(gè)實(shí)現(xiàn)中,模塊208包括執(zhí)行具體任務(wù)或?qū)崿F(xiàn)具體抽象數(shù)據(jù)類型的例程、程序、對(duì)象、組件、數(shù)據(jù)結(jié)構(gòu)等。在一個(gè)實(shí)現(xiàn)中,模塊208可以包括接收模塊212、圖像處理模塊214、比較模塊216、記錄模塊218、匹配模塊220和其它模塊222。其它模塊222可以包括補(bǔ)充圖像處理系統(tǒng)102的應(yīng)用和功能的程序或編碼指令。
[0035]接收模塊212
[0036]在一個(gè)實(shí)現(xiàn)中,接收模塊212被配置為接收用于處理的多個(gè)圖像。由接收模塊212接收的圖像從與圖像處理系統(tǒng)212相互作用的各種設(shè)備104獲得。
[0037]在一個(gè)實(shí)例中,接收的圖像可以為一種文件格式,該文件格式可以包括但不限于JPEG/JFIF 圖像、JPEG2000 圖像、Exif 圖像、TIFF 圖像和 RAW 等。
[0038]在一個(gè)實(shí)現(xiàn)中,接收模塊212可以從設(shè)備104接收預(yù)處理的圖像。預(yù)處理的圖像可以包括但不限于從圖像提取的多個(gè)特征。
[0039]在一個(gè)實(shí)例中,通過(guò)接收測(cè)試圖像獲得預(yù)處理。將接收的測(cè)試圖像分割為多個(gè)圖像片段。多個(gè)圖像片段進(jìn)一步用于從片段中提取多個(gè)特征。
[0040]在一個(gè)實(shí)現(xiàn)中,與接收模塊212有關(guān)的數(shù)據(jù)存儲(chǔ)在接收數(shù)據(jù)庫(kù)224中。在一個(gè)實(shí)例中,接收數(shù)據(jù)庫(kù)224可以包括但不限于用于處理的多個(gè)接收的圖像,預(yù)處理圖像,從多個(gè)圖像提取的多個(gè)特征。
[0041]圖像處理模塊214
[0042]在一個(gè)實(shí)現(xiàn)中,圖像處理模塊214被配置為將接收的圖像分割為多個(gè)圖像片段并且在每個(gè)圖像上執(zhí)行來(lái)自多個(gè)圖像處理算法的一個(gè)或多個(gè)預(yù)存儲(chǔ)算法以為了獲得多個(gè)圖像處理算法輸出。
[0043]在一個(gè)實(shí)現(xiàn)中,圖像處理模塊214使用可能預(yù)存儲(chǔ)在圖像處理系統(tǒng)102中的已知分割方法將接收的圖像分割為多個(gè)圖像片段。在一個(gè)實(shí)例中,已知分割方法可以包括但不限于閾值方法、聚類方法和基于壓縮的方法等。
[0044]在一個(gè)實(shí)現(xiàn)中,多個(gè)圖像片段可以包括但不限于重疊的片段或非重疊片段或其組合。使用來(lái)自多個(gè)圖像處理算法的一個(gè)或多個(gè)預(yù)存儲(chǔ)算法進(jìn)一步處理圖像片段以為了獲得多個(gè)圖像處理算法輸出。
[0045]在一個(gè)實(shí)例中,一個(gè)或多個(gè)預(yù)存儲(chǔ)算法可以包括但不限于包括二值化算法、降噪算法、分割算法、符號(hào)識(shí)別算法、頁(yè)面布局檢測(cè)、頁(yè)面布局分割以及通過(guò)本領(lǐng)域中已知的任何現(xiàn)有的圖像處理算法。
[0046]在一個(gè)實(shí)例中,從處理獲得的多個(gè)圖像處理算法輸出可以包括相同圖像的不同區(qū)域連同對(duì)于相應(yīng)區(qū)域預(yù)測(cè)的算法。在另一個(gè)實(shí)例中,多個(gè)圖像處理算法輸出可以包括圖像或與圖像有關(guān)的特征或參數(shù)的集合。
[0047]在一個(gè)實(shí)現(xiàn)中,與圖像處理模塊214有關(guān)的數(shù)據(jù)存儲(chǔ)在圖像處理數(shù)據(jù)庫(kù)226中。在一個(gè)實(shí)例中,圖像處理數(shù)據(jù)庫(kù)226可以包括但不限于多個(gè)已知分割方法、多個(gè)圖像處理算法和多個(gè)圖像片段等。
[0048]比較模塊216
[0049]在一個(gè)實(shí)現(xiàn)中,比較模塊216被配置為將圖像處理處理算法輸出中的每個(gè)與預(yù)定閾值圖像處理輸出得分進(jìn)行比較。從圖像處理模塊216獲得的輸出與預(yù)定閾值圖像處理輸出得分進(jìn)行比較。
[0050]在一個(gè)實(shí)例中,從圖像處理模塊216獲得的輸出與地面實(shí)況(GT)進(jìn)行比較。使用可以包括但不限于手動(dòng)數(shù)據(jù)或本領(lǐng)域中已知的任何GT技術(shù)來(lái)計(jì)算GT。
[0051]在一個(gè)實(shí)現(xiàn)中,比較模塊216可以確定預(yù)定閾值圖像處理輸出得分為作為每個(gè)訓(xùn)練對(duì)的特征的地面實(shí)況。而且,與比較模塊216有關(guān)的數(shù)據(jù)存儲(chǔ)在比較數(shù)據(jù)庫(kù)228中。在一個(gè)實(shí)例中,比較數(shù)據(jù)庫(kù)228可以包括但不限于圖像處理算法輸出、預(yù)定閾值圖像處理輸出得分和地面實(shí)況(GT)等。
[0052]記錄模塊218
[0053]在一個(gè)實(shí)現(xiàn)中,記錄模塊218被配置為基于比較模塊216的輸出,記錄圖像處理算法連同相應(yīng)一個(gè)或多個(gè)圖像片段以及關(guān)聯(lián)特征向量一起作為訓(xùn)練對(duì)。
[0054]在一個(gè)實(shí)現(xiàn)中,圖像處理算法與相應(yīng)的一個(gè)或多個(gè)圖像片段一起可以從比較模塊216獲得。通過(guò)提取每個(gè)圖像片段的圖像瞬時(shí)特征來(lái)獲得與一個(gè)或多個(gè)圖像片段有關(guān)的關(guān)聯(lián)特征向量,其中圖像瞬時(shí)特征包括與圖像片段對(duì)應(yīng)的均值、方差及斜度。而且,基于每個(gè)圖像片段的圖像瞬時(shí)特征形成特征向量,其中使用HSV量化或通過(guò)本領(lǐng)域中已知的任何技術(shù)獲得特征向量。在一個(gè)實(shí)例中,從每個(gè)接收的圖像提取長(zhǎng)度265的特征向量。
[0055]在一個(gè)實(shí)現(xiàn)中,訓(xùn)練對(duì)可以包括但不限于圖像處理算法連同對(duì)應(yīng)的一個(gè)或多個(gè)圖像片段。
[0056]在一個(gè)實(shí)現(xiàn)中,與記錄模塊218有關(guān)的數(shù)據(jù)存儲(chǔ)在記錄數(shù)據(jù)庫(kù)230中。在一個(gè)實(shí)例中,記錄數(shù)據(jù)庫(kù)230可以包括但不限于圖像處理算法連同對(duì)應(yīng)的一個(gè)或多個(gè)圖像片段和關(guān)聯(lián)特征向量一起作為訓(xùn)練對(duì)和作為每個(gè)訓(xùn)練對(duì)的特征確定的地面實(shí)況等等。
[0057]匹配模塊220
[0058]在一個(gè)實(shí)現(xiàn)中,匹配模塊220被配置為匹配來(lái)自用于每個(gè)輸入預(yù)處理測(cè)試圖像的訓(xùn)練對(duì)中的一個(gè)或多個(gè)潛在匹配圖像處理算法。通過(guò)接收測(cè)試圖像獲得預(yù)處理測(cè)試圖像。將接收的測(cè)試圖像分割為多個(gè)圖像片段。利用多個(gè)圖像片段從片段提取多個(gè)特征。
[0059]在一個(gè)實(shí)現(xiàn)中,來(lái)自片段的多個(gè)特征可以通過(guò)現(xiàn)有技術(shù)中熟練技術(shù)人員公知的方法來(lái)提取。但是,公開(kāi)的本發(fā)明主題應(yīng)當(dāng)理解為包括本領(lǐng)域熟練技術(shù)人員可能公知的圖像分割方法。
[0060]在一個(gè)實(shí)例中,接收的圖像可以為這樣一種格式,該格式可以包括但不限于JPEG/JFIF圖像,JPEG2000圖像、Exif圖像、TIFF圖像和RAW等。
[0061]在一個(gè)實(shí)例中,可以在圖像處理系統(tǒng)102或在設(shè)備104處執(zhí)行圖像預(yù)處理。
[0062]在一個(gè)實(shí)現(xiàn)中,與匹配模塊220有關(guān)的數(shù)據(jù)存儲(chǔ)在匹配數(shù)據(jù)庫(kù)232中。在一個(gè)實(shí)例中,匹配數(shù)據(jù)庫(kù)232可以包括但不限于預(yù)處理測(cè)試圖像和圖像處理算法等。
[0063]現(xiàn)參考圖4,描述根據(jù)本發(fā)明主題的實(shí)施方式的在圖像處理環(huán)境中用于自動(dòng)選擇一個(gè)或多個(gè)算法的方法。
[0064]方法400可以在計(jì)算機(jī)可執(zhí)行指令的一般環(huán)境中描述。通常,計(jì)算機(jī)可執(zhí)行指令可以包括執(zhí)行具體功能或?qū)崿F(xiàn)具體抽象數(shù)據(jù)類型的例程、程序、對(duì)象、組件、數(shù)據(jù)結(jié)構(gòu)、流程、目錄和功能等。方法400還可以在分布式計(jì)算環(huán)境中實(shí)行,其中由通過(guò)通信網(wǎng)絡(luò)鏈接的遠(yuǎn)程處理設(shè)備執(zhí)行功能。在分布式計(jì)算環(huán)境中,計(jì)算機(jī)可執(zhí)行指令可以位于本地遠(yuǎn)程計(jì)算機(jī)存儲(chǔ)介質(zhì)中,包括存儲(chǔ)器存儲(chǔ)設(shè)備。
[0065]用于描述方法400的順序并不意圖理解為限制,并且任意數(shù)量的描述的方法框可以以任意順序結(jié)合以實(shí)現(xiàn)方法400或替換的方法。另外,單獨(dú)的框可以從方法400中刪除而沒(méi)有超出本文中的本發(fā)明的主題的精神和范圍。此外,方法可以以任何合適的硬件、軟件、固件或其結(jié)合來(lái)實(shí)現(xiàn)。但是,為了解釋容易,在以下描述的實(shí)施方式中,方法400可以被視為在上文描述的圖像處理系統(tǒng)102中實(shí)現(xiàn)。
[0066]在框402處,接收至少一個(gè)圖像。接收的圖像從與圖像處理系統(tǒng)102相互作用的各種設(shè)備104獲得。
[0067]在框404處,通過(guò)在本領(lǐng)域中已知的任何現(xiàn)有的圖像分割技術(shù)來(lái)執(zhí)行將接收的圖像分割為多個(gè)圖像片段。但是,公開(kāi)的本發(fā)明的主題應(yīng)當(dāng)理解為包括可以由本領(lǐng)域中的熟練技術(shù)人員已知的其它圖像分割方法。
[0068]在框406處,在每個(gè)圖像片段上處理來(lái)自多個(gè)圖像處理算法的一個(gè)或多個(gè)預(yù)存儲(chǔ)算法以為了獲得多個(gè)圖像處理算法輸出。在一個(gè)實(shí)例中,圖像處理算法可以包括但不限于二值化算法,降噪算法、分割算法、符號(hào)識(shí)別算法。
[0069]在框408處,將圖像處理算法輸出與預(yù)定閾值圖像處理輸出得分進(jìn)行比較。在一個(gè)實(shí)例中,預(yù)定閾值圖像處理輸出得分為作為每個(gè)訓(xùn)練對(duì)的特征的地面實(shí)況(GT)。
[0070]在框410處,將圖像處理算法連同對(duì)應(yīng)的圖像片段和關(guān)聯(lián)特征向量一起記錄作為訓(xùn)練對(duì)。在一個(gè)實(shí)現(xiàn)中,通過(guò)提取每個(gè)圖像片段的圖像瞬時(shí)特征獲得與一個(gè)或多個(gè)圖像片段有關(guān)的關(guān)聯(lián)特征向量,其中圖像瞬時(shí)特征包括與圖像片段對(duì)應(yīng)的均值、方差和斜度。而且,基于每個(gè)圖像片段的圖像瞬時(shí)特征形成特征向量,其中使用HSV量化獲得特征向量。
[0071]在框412處,針對(duì)用于進(jìn)一步處理的每個(gè)輸入預(yù)處理測(cè)試圖像,選擇來(lái)自訓(xùn)練對(duì)的匹配圖像處理算法。在一個(gè)實(shí)現(xiàn)中,通過(guò)接收測(cè)試圖像獲得預(yù)處理測(cè)試圖像。將接收的測(cè)試圖像分割為多個(gè)圖像片段。進(jìn)一步利用多個(gè)圖像片段從片段提出多個(gè)特征。
[0072]現(xiàn)參考圖5,描述根據(jù)本發(fā)明的主題的用于獲得預(yù)處理的測(cè)試圖像500的方法??梢栽趫D像處理系統(tǒng)102中或在設(shè)備104中執(zhí)行方法500。
[0073]在步驟502處,接收測(cè)試。在一個(gè)實(shí)例中,接收的圖像可以為一種格式,該格式包括但不限于JPEG/JFIF圖像,JPEG2000圖像、Exif圖像、TIFF圖像和RAW等。
[0074]在步驟504處,將接收的測(cè)試圖像分割為多個(gè)圖像片段。在一個(gè)實(shí)例中,通過(guò)本領(lǐng)域中任意現(xiàn)有圖像分割即使來(lái)執(zhí)行分割。但是,公開(kāi)的本發(fā)明主題應(yīng)當(dāng)理解為包括本領(lǐng)域中熟練技術(shù)任何已熟知的其它圖像分割方法。
[0075]在步驟506處,多個(gè)圖像片段進(jìn)一步用于從圖像片段提取多個(gè)特征。在一個(gè)實(shí)例中,通過(guò)本領(lǐng)域中已知的任意現(xiàn)有圖像提取技術(shù)來(lái)執(zhí)行提取。但是,公開(kāi)的本發(fā)明主題應(yīng)當(dāng)理解為包括本領(lǐng)域中熟練技術(shù)人員已熟知的其它圖像提取方法。
[0076]現(xiàn)參考圖6,描述根據(jù)本發(fā)明的主題的實(shí)施方式的圖像處理流程。
[0077]在一個(gè)實(shí)現(xiàn)中,可以通過(guò)圖像處理系統(tǒng)來(lái)接收?qǐng)D像。使用已知分割算法將接收的圖像分割為多個(gè)片段。多個(gè)預(yù)存儲(chǔ)算法應(yīng)用到多個(gè)片段上。而且,將每個(gè)算法結(jié)果與可以為地面實(shí)況(GT)的預(yù)定閾值圖像處理輸出得分進(jìn)行比較。在下一個(gè)步驟中,針對(duì)超過(guò)預(yù)定閾值圖像處理輸出得分的每個(gè)圖像處理算法,將對(duì)應(yīng)一個(gè)或多個(gè)圖像片段和關(guān)聯(lián)特征向量記錄為訓(xùn)練對(duì)。
[0078]而且,通過(guò)圖像處理系統(tǒng)接收至少一個(gè)測(cè)試圖像。使用已知分割算法將接收的測(cè)試圖像分割為多個(gè)片段。使用已知提取算法從測(cè)試圖像提取多個(gè)特征。至少,選擇來(lái)自用于每個(gè)輸入預(yù)處理(提取特征)測(cè)試圖像的訓(xùn)練對(duì)的一個(gè)或多個(gè)潛在匹配的圖像處理算法。
[0079]在圖7中說(shuō)明流程圖的詳細(xì)工作。
[0080]現(xiàn)參考圖7,描述根據(jù)本發(fā)明主題的實(shí)施方式的示例性圖像處理系統(tǒng)及其工作。
[0081]設(shè)想T =為η個(gè)訓(xùn)練圖像的集合。對(duì)于每個(gè)訓(xùn)練圖像\而言,獲得光學(xué)符號(hào)識(shí)別(OCR’ d)輸出gi。設(shè)A為預(yù)存儲(chǔ)在圖像處理系統(tǒng)中的m個(gè)二值化算法A =Ia1, a2..., an}。將每個(gè)圖像劃分為k個(gè)(重疊或非重疊)片段(S1, s2..., sk),即
[0082]ii =
[0083] 而且,m個(gè)算法中的每個(gè)在k個(gè)片段中的每個(gè)上工作。設(shè)Fij指示來(lái)自在片段SiI工作的算法a」的二值化結(jié)果。完整的圖像的二值化通過(guò)以下獲得:
_4] U^=1r^
[0085]因?yàn)閖可以從I變化至m,所以訓(xùn)練圖像存在km個(gè)不同二值化結(jié)果。
[0086]在一個(gè)實(shí)例中,如果OCR識(shí)別這些k111個(gè)圖像中的每個(gè)并且生成許多OCR輸出(Q1, cv,okm)。然后將這些Oi中的每個(gè)與對(duì)應(yīng)的地面實(shí)況(GT)gi進(jìn)行比較并且如果發(fā)現(xiàn)匹配,那么生成Oi的算法系列為在k個(gè)片段上工作的k個(gè)二值化算法(所有k個(gè)算法不必要不同)的正確集合。設(shè)B=可以為在片段(Sl,S2,…,sk)上工作的這些k個(gè)算法的集合。在一個(gè)實(shí)例中,二值化算法可以包括到不限于Otsu方法、Savoula算法、Niblack算法和Wo If 二值化技術(shù)等。
[0087]應(yīng)當(dāng)注意所有bi e A而且匕可以等于bj,其中i ? =j。因此,在匕和Si之間有一對(duì)一的對(duì)應(yīng)性并且我們聲稱匕為Si的二值化的正確算法。
[0088]上述方程用于生成訓(xùn)練對(duì)〈圖像片段,二值化算法〉,即<Si,bp。O^b2…,bk)中的每個(gè)可以視為生成輸出的路徑并且有mk個(gè)這種路徑。模型可以生成OCR輸出是正確的許多最終圖像。因此,從單個(gè)訓(xùn)練圖像,我們可以有許多路徑給出正確OCR結(jié)果。所有這些路徑視為生成訓(xùn)練示例。這個(gè)過(guò)程已經(jīng)在圖7中說(shuō)明。GT代表地面實(shí)況,對(duì)勾標(biāo)記對(duì)應(yīng)生成正確ICR輸出的路徑,并且交叉標(biāo)記指示生成錯(cuò)誤OCR輸出的路徑。在準(zhǔn)備訓(xùn)練數(shù)據(jù)同時(shí)忽略生成錯(cuò)誤OCR輸出的路徑。
[0089]在一個(gè)實(shí)例中,為了訓(xùn)練遵循器學(xué)習(xí)算法(例如,SVM)的機(jī)制,接下來(lái)每個(gè)Si (代表圖像片段)導(dǎo)致相應(yīng)的特征向量4。所以最終〈fpbi〉對(duì)用于訓(xùn)練。
[0090]在一個(gè)實(shí)例中,基于每個(gè)圖像片段的圖像瞬時(shí)特征獲得特征向量。圖像瞬時(shí)特征包括與圖像片段(Sxy)對(duì)應(yīng)的均值(Ex),方差(ο ω)和斜度(Zx)。使用以下提到的方程提取特征:
【權(quán)利要求】
1.一種用于在圖像處理環(huán)境中自動(dòng)選擇一個(gè)或多個(gè)算法的計(jì)算機(jī)實(shí)現(xiàn)的方法,所述方法包括: 接收至少一個(gè)圖像; 將所接收?qǐng)D像分割為多個(gè)圖像片段; 在每個(gè)圖像片段上執(zhí)行來(lái)自多個(gè)圖像處理算法的一個(gè)或多個(gè)預(yù)存儲(chǔ)算法,以為了獲得多個(gè)圖像處理算法輸出; 將每個(gè)圖像處理算法輸出與預(yù)定閾值圖像處理輸出得分比較; 針對(duì)每個(gè)超過(guò)預(yù)定閾值圖像處理輸出得分的圖像處理算法,將該圖像處理算法連同相應(yīng)的一個(gè)或多個(gè)圖像片段和關(guān)聯(lián)的特征向量一起記錄為訓(xùn)練對(duì);并且 從用于每個(gè)輸入預(yù)處理測(cè)試圖像的訓(xùn)練對(duì)中選擇一個(gè)或多個(gè)潛在匹配圖像處理算法。
2.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,所述預(yù)處理測(cè)試圖像在以下步驟中獲得: 接收所述測(cè)試圖像; 將所接收測(cè)試圖像分割為多個(gè)圖像片段;以及 從所述多個(gè)圖像片段中提取多個(gè)特征。
3.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,所述圖像片段包括重疊的片段和非重疊的片段或其組合。
4.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,所述多個(gè)圖像處理算法包括:二值化算法、降噪算法、分割算法,符號(hào)識(shí)別算法、頁(yè)面布局檢測(cè)、頁(yè)面布局分割或其組合。
5.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,所述特征向量在以下步驟中獲得: 提取每個(gè)圖像片段的圖像矩特征,其中圖像矩特征包括與該圖像片段對(duì)應(yīng)的均值、方差及斜度;以及 形成特征向量,其中,使用HSV量化等來(lái)獲得特征向量。
6.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中,所述預(yù)定閾值圖像處理輸出得分是被確定為每個(gè)訓(xùn)練對(duì)的特征的地面實(shí)況。
7.一種用于在圖像處理環(huán)境中自動(dòng)選擇一個(gè)或多個(gè)算法的圖像處理系統(tǒng),所述系統(tǒng)包括: 處理器; 耦合至處理器的存儲(chǔ)器,其中,所述處理器能夠執(zhí)行存儲(chǔ)在存儲(chǔ)器中的多個(gè)模塊,并且其中,所述多個(gè)模塊包括: 用于接收至少一個(gè)圖像的接收模塊; 圖像處理模塊,所述圖像處理模塊被配置為: 將所接收?qǐng)D像分割為多個(gè)圖像片段;并且 在每個(gè)圖像片段上執(zhí)行來(lái)自多個(gè)圖像處理算法的一個(gè)或多個(gè)預(yù)存儲(chǔ)算法,以為了獲得多個(gè)圖像處理算法輸出; 比較模塊,所述比較模塊被配置為將每個(gè)圖像處理算法輸出與預(yù)定閾值圖像處理輸出得分比較; 記錄模塊,所述記錄模塊被配置為將該圖像處理算法連同相應(yīng)的一個(gè)或多個(gè)圖像片段以及關(guān)聯(lián)的特征向量一起記錄為訓(xùn)練對(duì);和 匹配模塊,所述匹配模塊被配置為從用于每個(gè)輸入預(yù)處理測(cè)試圖像的訓(xùn)練對(duì)中選擇一個(gè)或多個(gè)潛在匹配圖像處理算法。
8.根據(jù)權(quán)利要求7所述的圖像處理系統(tǒng),其中,所述圖像處理模塊被配置為通過(guò)執(zhí)行從二值算法、降噪算法、分割算法、符號(hào)識(shí)別算法、頁(yè)面布局檢測(cè)、頁(yè)面布局分割或其組合中選擇的一個(gè)或多個(gè)圖像處理算法來(lái)處理所接收?qǐng)D像。
9.根據(jù)權(quán)利要求7所述的圖像處理系統(tǒng),所述預(yù)處理測(cè)試圖像在以下步驟中得到: 接收所述測(cè)試圖像; 將所接收測(cè)試圖像分割為多個(gè)圖像片段;以及 從所述多個(gè)圖像片段中提取多個(gè)特征。
10.根據(jù)權(quán)利要求7所述的圖像處理系統(tǒng),其中,所述記錄模塊還被配置為獲得在以下步驟中得到的特征向量: 提取每個(gè)圖像片段的圖像矩特征,其中圖像矩特征包括與該圖像片段對(duì)應(yīng)的均值、方差及斜度;以及 形成特征向量,其中,使用HSV量化等來(lái)獲得特征向量。
11.根據(jù)權(quán)利要求7所述的圖像處理系統(tǒng),其中,所述比較模塊將預(yù)定閾值圖像處理輸出得分確定為作為每個(gè)訓(xùn)練對(duì)的特征的地面實(shí)況。
【文檔編號(hào)】G06K9/66GK104182770SQ201410222004
【公開(kāi)日】2014年12月3日 申請(qǐng)日期:2014年5月23日 優(yōu)先權(quán)日:2013年5月24日
【發(fā)明者】塔努什亞姆·查托帕迪亞雅, 拉穆·溫帕達(dá)·雷迪, 尤帕爾·加蘭 申請(qǐng)人:塔塔咨詢服務(wù)有限公司