本申請(qǐng)是國家申請(qǐng)?zhí)枮?01110294177.3的發(fā)明專利申請(qǐng)的分案申請(qǐng),該發(fā)明專利申請(qǐng)的國際申請(qǐng)日為2011年5月20日,發(fā)明名稱為“用于在圖像信號(hào)中捕獲文檔的交互式用戶接口”。相關(guān)申請(qǐng)的交叉引用本國家階段申請(qǐng)要求2011年1月28日提交的題目為“interactiveuserinterfaceforcapturingadocumentinanimagesignal(用于在圖像信號(hào)中捕獲文檔的交互式用戶接口)”的美國專利申請(qǐng)no.13/016,655的優(yōu)先權(quán)。本申請(qǐng)還要求2010年5月21日提交的題目為“systemoperativeforcaptureofaframeofimagedatahavingrepresentationofafeature(可操作用于捕獲具有特征表示的圖像數(shù)據(jù)幀的系統(tǒng))”的美國臨時(shí)專利申請(qǐng)no.61/347,292的優(yōu)先權(quán)。以上申請(qǐng)的每一個(gè)的全部內(nèi)容在此并入以供參考。本公開通常涉及數(shù)字設(shè)備,并且特別涉及具有成像子系統(tǒng)的數(shù)字設(shè)備。
背景技術(shù):
::具有成像子系統(tǒng)的數(shù)字設(shè)備,例如智能電話、數(shù)字相機(jī)和便攜式數(shù)據(jù)掃描終端,可以被用于捕獲具有一個(gè)或多個(gè)特征的表示的圖像幀。具有數(shù)目增加的像素的較高密度圖像傳感器陣列的可用性,在提供某種優(yōu)點(diǎn)的同時(shí),可能還面臨挑戰(zhàn)。在具有增加數(shù)目的像素的圖像傳感器陣列的情況下,利用這種終端捕獲的圖像數(shù)據(jù)的幀具有增加數(shù)目的像素值。雖然更大數(shù)目的像素值通常允許捕獲具有較高分辨率的幀,但是較高分辨率能夠?qū)е略黾拥奶幚硌舆t。圖像傳感器陣列可用于單色的和彩色種類;相對(duì)于單色,彩色圖像傳感器陣列還提供了增加的數(shù)據(jù)。以上討論僅僅被提供用于通常的背景信息,并不意欲用作幫助確定所要求主題的范圍。技術(shù)實(shí)現(xiàn)要素:公開了用于交互式用戶接口的設(shè)備、方法和軟件,用于捕獲具有特征表示的圖像數(shù)據(jù)的幀。在示例性實(shí)施例中,設(shè)備包括成像子系統(tǒng)、一個(gè)或多個(gè)存儲(chǔ)器元件、以及一個(gè)或多個(gè)處理器。成像子系統(tǒng)能夠提供表示在所述成像子系統(tǒng)上入射的光的圖像數(shù)據(jù)。一個(gè)或多個(gè)存儲(chǔ)器元件包括操作時(shí)能夠存儲(chǔ)圖像數(shù)據(jù)的輸入幀的至少第一存儲(chǔ)器元件。一個(gè)或多個(gè)處理器可以被使能用來執(zhí)行各種步驟。一個(gè)步驟可以包括從第一存儲(chǔ)器元件接收?qǐng)D像數(shù)據(jù)。另一個(gè)步驟可以包括試圖識(shí)別在圖像數(shù)據(jù)中定義候選四邊形形式的線性特征。另一個(gè)步驟可以包括提供用于引導(dǎo)用戶改變?cè)撛O(shè)備的定位以增強(qiáng)用于識(shí)別在圖像數(shù)據(jù)中定義候選四邊形形式的線性特征的能力的用戶可感知暗示。提供本
發(fā)明內(nèi)容以簡化的形式引入了概念的選擇,并且這在以下具體實(shí)施方式中還進(jìn)一步描述。本
發(fā)明內(nèi)容不是旨在識(shí)別所要求主題的關(guān)鍵特征或必要特征,也不是旨在用來幫助確定所要求主題的范圍。所要求主題并不限于解決
背景技術(shù):
:中提到的任意或全部缺點(diǎn)的實(shí)施方式。附圖說明通過參考以下描述的附圖,這里所描述的特征可以更好地被理解。附圖無需按比例縮放,而是通常重點(diǎn)放在說明本發(fā)明的原則。在附圖中,相同的附圖標(biāo)記被用來表示全部各種視圖中的相似部件。圖1描述了根據(jù)示例性實(shí)施例的系統(tǒng)的簡化的、混合的透視圖和圖解視圖,該系統(tǒng)包括具有成像子系統(tǒng)的數(shù)字設(shè)備。圖2描述了根據(jù)示例性實(shí)施例的具有成像子系統(tǒng)的數(shù)字設(shè)備的示意性框圖。圖3描述了根據(jù)示例性實(shí)施例的方法的流程圖。圖4-8描述了根據(jù)各種示例性實(shí)施例的用于檢測和捕獲文檔的處理圖像幀的各個(gè)方面的簡化視圖。圖9描述了根據(jù)示例性實(shí)施例的具有從圖像信號(hào)捕獲的文檔的圖形再現(xiàn)的圖形用戶接口應(yīng)用窗口。圖10描述了根據(jù)示例性實(shí)施例的關(guān)于處理圖像幀的方面的圖。圖11描述了根據(jù)示例性實(shí)施例的處理圖像幀的方面的視圖。圖12描述了根據(jù)各種示例性實(shí)施例的圖形用戶接口應(yīng)用窗口。圖13-16描述了根據(jù)各種示例性實(shí)施例的圖形用戶接口應(yīng)用圖標(biāo)。圖17和18描述了根據(jù)各種示例性實(shí)施例的圖形用戶接口應(yīng)用窗口。這些附圖無需按比例縮放,而是通常重點(diǎn)放在說明各種實(shí)施例的原則。在附圖中,相同的附圖標(biāo)記被用來表示全部各種視圖中的相似部件。具體實(shí)施方式圖1描述了根據(jù)示例性實(shí)施例的系統(tǒng)5000,用于在圖像信號(hào)中捕獲文檔110,該系統(tǒng)包括移動(dòng)設(shè)備1000,在此以透視圖描述。圖1和2提供了示例性的設(shè)備和系統(tǒng),其可以被用來執(zhí)行文檔捕獲方法,而圖3描述了文檔捕獲方法200的示例性實(shí)施例。如圖1和2所示的,在這個(gè)示例性實(shí)施例中,移動(dòng)設(shè)備100可以包括具有成像視場1240的成像子系統(tǒng)400,該成像視場可以被投射的照明場1260包圍,并且其可以引導(dǎo)到目標(biāo)文檔110上。在各種實(shí)施例中,移動(dòng)設(shè)備1000和/或系統(tǒng)5000可以示例性地被使能以在圖像信號(hào)中捕獲文檔110,如在后續(xù)附圖和后面說明中進(jìn)一步概述的。在圖1的示例性實(shí)施例中,移動(dòng)設(shè)備1000被描述為手持型移動(dòng)計(jì)算機(jī),并且在各種實(shí)施例中,還可以采取智能電話、移動(dòng)電話、圖形輸入板(tablet)或筆記本計(jì)算機(jī)、膝上型計(jì)算機(jī)、電子書閱讀器、標(biāo)記掃描終端或具有成像子系統(tǒng)的任意寬范圍的其它類型的數(shù)字設(shè)備的形式。在圖1的示例性實(shí)施例中,移動(dòng)設(shè)備1000包括用戶接口元件,包括布置在手持外殼1014上的觸發(fā)器1220、顯示器1222、指示機(jī)構(gòu)(pointermechanism)1224、以及鍵盤1226。鍵盤1225上的兩個(gè)按鍵被指定為掃描鍵1227和輸入鍵1228,盡管可以任意選擇哪些鍵被用于這些功能,以及它們被布置在移動(dòng)設(shè)備1000上的何處,并且可以與圖1中的示例性描述不同。系統(tǒng)5000可以操作時(shí)用來執(zhí)行多個(gè)動(dòng)作,其可以包括以下例子,它們可以表征一個(gè)示例性實(shí)施例:1)預(yù)覽幀可以被顯示在移動(dòng)設(shè)備1000的顯示器1222上,示出成像子系統(tǒng)400或相機(jī)查看的內(nèi)容,實(shí)時(shí)更新或盡可能接近實(shí)時(shí)地可實(shí)行。預(yù)覽幀可以具有比圖像傳感器陣列1033的分辨率較低的分辨率。2)預(yù)覽幀可以被處理來定位文檔。3)如果文檔已經(jīng)被定位,它的輪廓可以在預(yù)覽圖像中用四邊形邊界表示,其顏色被用來向操作者給出信息——紅色邊界可以指示文檔已經(jīng)被識(shí)別但是所得到的圖像不是最佳的,綠色邊界可以指示文檔已經(jīng)被識(shí)別并且所得到的圖像是最佳的。4)作為文檔識(shí)別過程的一部分,文檔的距離可以被計(jì)算,并且這個(gè)距離可以被用來設(shè)置透鏡組件250的焦點(diǎn),該透鏡組件包括成像透鏡或者相機(jī)透鏡240。例如,系統(tǒng)5000可以是可操作地以便透鏡組件250的最佳焦點(diǎn)設(shè)置的平面響應(yīng)于到目標(biāo)的距離,如根據(jù)這里提出的距離檢測方法所確定的。5)同樣,作為文檔識(shí)別過程的一部分,分析輸入預(yù)覽幀速率。幀速率根據(jù)曝光時(shí)間變化,其依次根據(jù)環(huán)境光等級(jí)而變化。因此,如果幀速率降至(dropbelow)某個(gè)閾值之下,那么相機(jī)的照明子系統(tǒng)800(例如,led燈)能夠自動(dòng)地被激發(fā)。6)在非最佳圖像的情況下,可以在預(yù)覽圖像中向操作者給出另外視覺信息,來幫助它們提高圖像質(zhì)量——這可以采用圖形“暗示”的形式,或者關(guān)于例如如何移動(dòng)移動(dòng)設(shè)備1000的事情給出明確指令的引導(dǎo)指示來完成。7)這些暗示可能示出例如直線箭頭指示哪個(gè)方向來對(duì)移動(dòng)設(shè)備1000進(jìn)行移動(dòng),曲線箭頭指示哪個(gè)方向旋轉(zhuǎn)移動(dòng)設(shè)備1000,放大透視圖所畫的箭頭指示移動(dòng)設(shè)備1000要更加接近或者更加遠(yuǎn)離文檔來移動(dòng),另外加上其它圖形圖像指示文檔部分地在陰影中,或者移動(dòng)設(shè)備1000沒有被足夠拿穩(wěn)之類的事情。8)暗示的顏色將循環(huán)以便提高它們?cè)诹粱蛘吆诎当尘爸械目梢娦?,并且它們還可以栩栩如生。9)當(dāng)幀已經(jīng)被確定為最佳時(shí),操作者可以通過按鍵或者通過某一其它動(dòng)作向移動(dòng)設(shè)備1000發(fā)信號(hào)通知靜止的圖像要被捕獲和保存。10)一旦該圖像已經(jīng)被捕獲,可以核查針對(duì)銳度來檢測該圖像。系統(tǒng)5000在一個(gè)實(shí)施例中能夠是可操作的,以便僅僅當(dāng)它足夠尖銳時(shí),將向操作者提供可聽見和/或可視的指示:被捕獲的幀已經(jīng)被保存。11)該幀可以被適當(dāng)?shù)夭们?縮放/旋轉(zhuǎn),以便只保留文檔本身的圖像。該過程將創(chuàng)建分辨率足夠填滿移動(dòng)計(jì)算機(jī)的顯示屏的文檔圖像,并且該文檔在圖象中將是垂直的,而不必考慮其原始定向。12)被處理的幀可以顯示在移動(dòng)設(shè)備1000的顯示器1222上用于最后操作者核準(zhǔn)。13)一旦圖像已經(jīng)被顯示,裁切/縮放/旋轉(zhuǎn)過程可以重復(fù)“在背景中”,這次生成適于保存的較大圖像。14)一旦這個(gè)第二次變換過程完成,操作者可以給出他們對(duì)文檔圖像的核準(zhǔn),這可以通過按壓鍵盤1226上的按鍵或者通過某種其它動(dòng)作來給出。15)系統(tǒng)5000是可操作以便如果被核準(zhǔn),則文檔的圖像接著將被保存在移動(dòng)設(shè)備1000的存儲(chǔ)器中,例如儲(chǔ)存存儲(chǔ)器1084,其可以是例如通過閃存或硬盤驅(qū)動(dòng)存儲(chǔ)器提供,且文檔捕獲過程可能接著就完成。系統(tǒng)5000是可操作的以便如果操作者指示該文檔沒有被保存,那么該文檔捕獲過程將立即再次開始。在各種實(shí)施例中,可以采用各種不同的順序執(zhí)行任意或者全部這些動(dòng)作。在本公開中,這些動(dòng)作的示例性方面還在其它地方被進(jìn)一步詳細(xì)描述。在各種示例性實(shí)施例中,系統(tǒng)5000可以是可操作的以便具有流式預(yù)覽圖像1111的預(yù)覽窗口1101可以被顯示在數(shù)字設(shè)備1000的顯示器1222上,如圖1所示。流式預(yù)覽圖像1111可以示出被相機(jī)或者成像子系統(tǒng)400成像的圖像幀的降低分辨率的實(shí)時(shí)預(yù)覽。預(yù)覽圖像1111可以在促進(jìn)成功文檔捕獲中用作各種有用的目的。例如,示例性文檔捕獲處理實(shí)施方式可以允許用戶查看流式文檔圖像110b,示出了文檔110如何正被移動(dòng)設(shè)備1000成像,以及示出目標(biāo)文檔110何時(shí)相對(duì)平滑、亮度適中,以及包括在成像子系統(tǒng)400的視場1240中。示例性文檔捕獲處理實(shí)施方式還可以提供了一種文檔簡檔型下拉菜單1141,允許用戶選擇具有特定大小和縱橫比的文檔簡檔類型。在各種實(shí)施例中,顯示器1222可以合并觸摸板用于導(dǎo)航以及虛擬致動(dòng)器選擇,在該情況下移動(dòng)設(shè)備1000的用戶接口可以由顯示器1222提供。移動(dòng)設(shè)備1000的用戶接口元件還可以通過將移動(dòng)設(shè)備1000配置為可操作通過解碼編程條碼符號(hào)而再編程來提供。在另一個(gè)實(shí)施例中,移動(dòng)設(shè)備可以沒有顯示器,并且可以采取槍風(fēng)格形式因素。在各種實(shí)施例中,移動(dòng)設(shè)備1000可以自己構(gòu)成在圖像信號(hào)中捕獲文檔110的系統(tǒng),以及在各種實(shí)施例中,結(jié)合一個(gè)或多個(gè)外部服務(wù)器2000、3000(框圖中所示)的移動(dòng)設(shè)備1000(該外部服務(wù)器可以通過網(wǎng)絡(luò)2500連接)可以一起用作在圖像信號(hào)中捕獲文檔110的系統(tǒng)。在此說明中,系統(tǒng)5000可以被描述為被使能或者配置用于各種特征、特性或功能;并且在各種實(shí)施例中,這可能涉及單獨(dú)的移動(dòng)設(shè)備1000,或者與被使能或者配置用于各種特征、特性或功能的系統(tǒng)5000的其它元件通信或者合作的移動(dòng)設(shè)備。圖1的各種元件將在下面進(jìn)一步描述。圖2描述了根據(jù)與圖1的示例性實(shí)施例一致的示例性實(shí)施例的具有成像子系統(tǒng)400的移動(dòng)設(shè)備1000的示意性框圖。移動(dòng)設(shè)備1000包括成像子系統(tǒng)400、一個(gè)或多個(gè)存儲(chǔ)器元件1085以及處理器。成像子系統(tǒng)400能夠提供表示在其上入射的光的圖像數(shù)據(jù)。一個(gè)或多個(gè)存儲(chǔ)器元件1085包括至少第一存儲(chǔ)器元件,示例性地例如ram1080,其可操作能夠至少臨時(shí)或者瞬時(shí)存儲(chǔ)圖像數(shù)據(jù)的輸入幀,同時(shí)其它存儲(chǔ)器元件可以被用在各種實(shí)施例中。處理器1060可以與可執(zhí)行指令通信連接,用于使能處理器1060執(zhí)行各種步驟。根據(jù)示例性方法200,那些步驟示例性地在圖3中示出,并且在那些步驟中涉及的圖像處理的某些方面在圖4-6中示例性地示出。圖2的其它參考元件沒有被介紹,并且在圖3-6被進(jìn)一步描述之后,圖2的各種元件將被進(jìn)一步描述。根據(jù)各種示例性實(shí)施例,在各種示例性方法中,系統(tǒng)5000可以利用可以包括多個(gè)階段的示例性文檔檢測和定位過程在圖像信號(hào)中捕獲文檔110,這些在這里簡單介紹,并且在以下進(jìn)一步詳細(xì)描述。每一個(gè)不同的文檔類型可以具有保存諸如其邊緣長度、目標(biāo)顏色平衡等等之類參數(shù)的簡檔,并且這些參數(shù)連同固定參數(shù)組可以被用于控制該過程。在示例性實(shí)施例中如下呈現(xiàn)不同的步驟。首先,圖像數(shù)據(jù)的幀可以經(jīng)由抓幀器從directshow預(yù)覽流獲得,或者用作抓幀器的空渲染器,例如,以及再采樣為較小尺寸,被稱為縮略圖。接著,輸入循環(huán),其使用不同的標(biāo)準(zhǔn)來檢測邊緣,并選擇給出最佳結(jié)果的那一個(gè)。對(duì)于循環(huán)的每次反復(fù),可以沿著垂直和水平軸搜索縮略圖用于表示文檔邊緣的亮度和/或顏色的變化。在示例性實(shí)施例中,注冊(cè)了高達(dá)兩種變化用于每個(gè)水平和垂直通道。邊緣部分可以建在連續(xù)變化之外,并且接著可能屬于相同邊緣的部分可以被分組在一起。當(dāng)沿著每個(gè)軸注冊(cè)了僅僅兩種變化時(shí),最多有四組,這應(yīng)該對(duì)應(yīng)于文檔的四邊緣。直線方程可以適于四邊緣組,并且然后求解聯(lián)立方程對(duì),給出四個(gè)角點(diǎn)。這些點(diǎn)接著從2d轉(zhuǎn)變?yōu)?d,給出三維空間中的原始文檔的角點(diǎn)。該文檔維度接著可以被核查。此后,該文檔的位置在給定的時(shí)間段可以被平滑,來去除方案中的某些不穩(wěn)定。該文檔接著可以被核查過多的陰影,并且其位置和方向可以被用來確定可視性暗示,這些暗示可以被提供給操作者,顯示怎樣移動(dòng)移動(dòng)設(shè)備1000,來提高圖像質(zhì)量。最后,一旦操作者可以開始最后的文檔捕獲,將在顯示之前為了銳度核查所得到的圖像。根據(jù)這個(gè)示例性實(shí)施例,一旦它被顯示,可以執(zhí)行其它的處理將它轉(zhuǎn)換為矩形,降低漸暈、校正任意顏色不平衡、并使其尖銳。例如,根據(jù)示例性實(shí)施例,圖3示出了一種操作移動(dòng)設(shè)備1000的方法200,其用于識(shí)別圖像信號(hào)中的文檔。例如,處理器1060可以與可執(zhí)行指令通信連接,該可執(zhí)行指令使得處理器1060能夠執(zhí)行方法200的步驟。如圖3的示例性實(shí)施例中所示,方法200包括步驟201,用于從第一存儲(chǔ)器元件(示例性地例如ram1080)接收輸入幀。這之后是步驟203,用于基于輸入幀生成降低分辨率的幀,該降低分辨率的幀包括比輸入幀更少的像素,其中降低分辨率的幀中的像素組合了來自輸入幀中的兩個(gè)或多個(gè)像素的信息。步驟205包括試圖識(shí)別轉(zhuǎn)變對(duì),其包括在降低分辨率的幀中的臨近像素對(duì),具有在超過像素轉(zhuǎn)變閾值的像素之間的差值。如果這種轉(zhuǎn)變對(duì)被識(shí)別,那么可以執(zhí)行步驟207,用于試圖識(shí)別在降低分辨率的幀中的兩個(gè)或多個(gè)識(shí)別的轉(zhuǎn)變對(duì)之間的一個(gè)或多個(gè)線性特征。如果這種線性特征被識(shí)別,接著步驟209,用于提供在降低分辨率的幀中的一個(gè)或多個(gè)識(shí)別的線性特征的指示。這種線性特征可以表示數(shù)字設(shè)備1000讀取的圖像信號(hào)中的矩形文檔110的圖像的邊緣,并且可以用來在圖像信號(hào)中定位或者隔離矩形文檔110的圖像。該圖像信號(hào)可以通過移動(dòng)設(shè)備1000的成像子系統(tǒng)400生成,并且可以包括在成像子系統(tǒng)400的視場1240中的全部或部分目標(biāo)文檔110的圖像。文檔110的圖像可以不是矩形,即使該目標(biāo)文檔110是矩形的,由于在移動(dòng)設(shè)備1000和文檔110之間的透視角度的效果,例如傾斜的,并且這里公開的各個(gè)步驟可以被用來補(bǔ)償或者校正這種傾斜。在移動(dòng)設(shè)備1000和方法200的各種示例性實(shí)施例中,用于檢測和捕獲文檔的技術(shù)典型地可以能夠以小于40ms每幀在實(shí)時(shí)320×240視頻流圖像信號(hào)中定位文檔,如示例性實(shí)施例,盡管大于和小于這個(gè)值的其它時(shí)段可應(yīng)用于不同的實(shí)施例。目標(biāo)文檔110可以包括文檔、包、其它類型基底或任何具有在其上可說明特征的基本上矩形形式,例如寫入或者容易受例如解碼或編譯影響的其它標(biāo)記形式。圖4-8圖形描述了根據(jù)與圖3的示例性方法200一致的示例性實(shí)施例的用于檢測或識(shí)別特征的過程的方面,例如可以表示文檔邊緣的像素轉(zhuǎn)變對(duì)和線性特征,以便在移動(dòng)設(shè)備1000成像的數(shù)據(jù)301的幀中識(shí)別和捕獲文檔110的圖像。圖4-8在以下進(jìn)一步描述。在各種實(shí)施例中,圖像信號(hào)處理驅(qū)動(dòng)器或者應(yīng)用程序可以結(jié)合在移動(dòng)設(shè)備1000中。圖像信號(hào)處理驅(qū)動(dòng)器可以把從圖像傳感器陣列1033加載圖像數(shù)據(jù)幀的過程指引到緩沖存儲(chǔ)器元件,例如ram1080以對(duì)于處理器1060可用。這是在步驟201中準(zhǔn)備的,用于從第一存儲(chǔ)器元件例如ram1080接收輸入幀。在示例性實(shí)施例中,移動(dòng)設(shè)備1000可以結(jié)合redmondwashington的微軟公司的directshow媒體管理軟件的版本。在各種其它實(shí)施例中,移動(dòng)設(shè)備1000可以結(jié)合另外視頻驅(qū)動(dòng)器或其它圖像信號(hào)驅(qū)動(dòng)器。在示例性實(shí)施例中,步驟203可以涉及通過抓幀器或空渲染器從directshow預(yù)覽流獲得的圖像數(shù)據(jù)幀,且再采樣為較小尺寸,被稱為縮略圖。在這個(gè)示例性實(shí)施例中,縮略圖是基于來自預(yù)覽流的圖像數(shù)據(jù)的輸入幀的降低分辨率的幀,縮略圖包括比輸入幀更少的像素。在各種示例性實(shí)施例中,生成降低分辨率的幀還可以包括將輸入幀分割為像素組,并且對(duì)于每個(gè)像素組,平均像素組中的像素的一個(gè)或多個(gè)屬性,并生成具有像素組的平均屬性的平均像素。縮略圖中的每個(gè)像素可以因此從輸入幀中的兩個(gè)或多個(gè)像素組合信息。作為示例性實(shí)例,初始輸入幀可以在四個(gè)像素組中劃分為2×2排列,并且那些2×2像素組的每一個(gè)可以被平均或者另外根據(jù)亮度、顏色或者二者,被組合成為單獨(dú)表示的像素來代替原始像素組。像素組的其它大小或者用于降低初始圖像幀中的像素計(jì)數(shù)或數(shù)據(jù)數(shù)量的方法,例如組合九個(gè)像素組為3×3排列,或其它分組,也可以被用于不同的實(shí)施例。文檔捕獲過程的各種實(shí)施例可以利用在輸入幀中的基本上全部像素組,并應(yīng)用用于在縮略圖中生成基本上全部像素的方法而執(zhí)行,其中該過程可能包括小錯(cuò)誤和偏差,這可能影響實(shí)質(zhì)上不會(huì)充分改變?cè)撨^程的多個(gè)像素中的一個(gè)。例如,根據(jù)各種示例性實(shí)施例,小錯(cuò)誤可能由有缺陷的成像陣列像素、輻射影響、小隨機(jī)下載錯(cuò)誤、或可能干擾相對(duì)少量像素的其它小影響而產(chǎn)生,而不是實(shí)質(zhì)上影響被處理的輸入幀中的每組像素的過程,以在降低分辨率的幀中生成每個(gè)像素,可以理解,“每個(gè)”的含義是“基本上每個(gè)”,而不是“絕對(duì)的每一個(gè)”。在查找期間,移動(dòng)設(shè)備1000可以在顯示器1222上顯示預(yù)覽流幀。系統(tǒng)5000可以是可操作的以便當(dāng)預(yù)覽流幀正在被生成和顯示時(shí),系統(tǒng)5000可以緩沖較高分辨率幀(例如,1600×1200、1280×1024),從其中能夠?qū)С鲱A(yù)覽流幀。響應(yīng)于例如通過啟動(dòng)鍵盤1225的掃描鍵1227被激活來保存幀或圖像(例如,文檔表示)的命令,相應(yīng)于用于質(zhì)量檢測處理的較低分辨率的幀的緩沖的較高分辨率的幀可以被處理來保存。在一個(gè)實(shí)例中,較高分辨率的幀可以具有與圖像傳感器陣列1033的像素計(jì)數(shù)相等的像素計(jì)數(shù)(例如,1600×1200),或者相似的較高分辨率(例如,1280×1024)。瞬時(shí)地或者另外臨時(shí)地緩沖圖像數(shù)據(jù)幀的任意步驟可以被理解為包括存儲(chǔ)圖像數(shù)據(jù)幀。此外,預(yù)覽流可以已經(jīng)是由移動(dòng)設(shè)備1000成像的全分辨率成像數(shù)據(jù)的降低分辨率的版本,以便在這個(gè)示例性實(shí)施例中,成像驅(qū)動(dòng)器生成第一降低分辨率的圖像幀或幀系列,同時(shí)文檔識(shí)別應(yīng)用程序可以生成第二級(jí)幀,其具有與來自成像驅(qū)動(dòng)器的第一輪降低分辨率的圖像幀進(jìn)一步降低的分辨率。在各種其它實(shí)施例中,各種其它過程可以在生成降低分辨率的幀或(多個(gè)幀)中涉及,其可能僅僅涉及來自全分辨率輸入幀的分辨率降低的單個(gè)步驟,或者任意數(shù)量和方式的分辨率降低步驟。例如,在一個(gè)示例性實(shí)施例中,移動(dòng)設(shè)備1000可以具有將高分辨率單色成像器與相對(duì)較低分辨率彩色圖像合并在同一個(gè)成像芯片上的成像器,例如640×480像素陣列視頻圖形陣列(vga)彩色成像器,如示例性實(shí)例。在這個(gè)示例性實(shí)例中,彩色成像器可以被用于流動(dòng)預(yù)覽顯示,同時(shí)例如高分辨率成像器可以被用于最后的文檔捕獲。盡管縮略圖具有降低的分辨率以及與較高分辨率幀相比降低數(shù)量的數(shù)據(jù)(其基于較高分辨幀),但是這使得能夠降低處理器在執(zhí)行識(shí)別和捕獲文檔圖像中涉及的后續(xù)步驟時(shí)的處理負(fù)擔(dān)和持續(xù)時(shí)間,例如識(shí)別像素轉(zhuǎn)變對(duì)和線性特征的步驟。作為示例性實(shí)例,在用于文檔特征檢測的圖像處理之前,降低分辨率的預(yù)覽流圖像幀可以被進(jìn)一步降低。例如,在示例性實(shí)施例中,640×480vga彩色成像器的輸入可以在分辨率上被降低至四分之一以生成原始預(yù)覽圖像,原始成像器信號(hào)中的每組2×2像素被平均或者另外組合來生成原始預(yù)覽圖像中的單個(gè)像素。這個(gè)原始預(yù)覽圖像可以示例性地是320×240r5g6b5,但是可以在2秒內(nèi)降低分辨率,在檢測過程開始之前,示例性地被重新采樣并且轉(zhuǎn)換為160×120r8g8b8。這樣的處理可以提供各種優(yōu)點(diǎn),例如可以更快為邊緣查找這個(gè)較小尺寸的3字節(jié)每像素圖像。同樣,這樣的處理可以從文檔中移除可能誤認(rèn)為邊緣的某些精細(xì)的細(xì)節(jié)。各種其它示例性實(shí)施例可以僅僅包括分辨率降低的一個(gè)步驟,和/或可以使用降低分辨率的其它方法,來生成快速的邊緣檢測幀。例如,在一個(gè)示例性實(shí)施例中,移動(dòng)設(shè)備1000可以能夠生成降低分辨率線性特征檢測縮略圖幀,并在這些降低分辨率線性特征檢測縮略圖幀上執(zhí)行線性特征檢測和文檔捕獲過程的全補(bǔ)充,例如,以大約每秒7到10幀的幀速率。高于以及低于這個(gè)的其它降低分辨率線性特征檢測幀速率可以用于其它實(shí)施例中。在基于圖像數(shù)據(jù)的輸入幀創(chuàng)建縮略圖之后,線性特征識(shí)別步驟可以在循環(huán)中被執(zhí)行。這在圖3中示出,其中在一個(gè)或多個(gè)查找特征被識(shí)別之前,識(shí)別步驟205和207可以繼續(xù)迭代循環(huán)。每個(gè)特征查找的數(shù)量和執(zhí)行查找特征的循環(huán)數(shù)量在不同實(shí)施例中可以是不同的。在各種實(shí)施例中,可以使用不同標(biāo)準(zhǔn)檢測邊緣,并且可以選擇給出最佳結(jié)果的那個(gè)標(biāo)準(zhǔn)。例如,識(shí)別像素轉(zhuǎn)變的步驟可以涉及針對(duì)在臨近像素之間的亮度和/或顏色的變化(其能夠表示文檔邊緣)在水平和垂直方向上沿著掃描線在循環(huán)中迭代地搜索縮略圖。換句話說,沿著每個(gè)掃描線的像素的每個(gè)臨近像素對(duì)可以被評(píng)估以評(píng)估這對(duì)中的兩個(gè)像素是否足夠不同,在絕對(duì)項(xiàng)或者相對(duì)于縮略圖中的其它臨近像素對(duì),它們?cè)诒硎疚臋n邊緣上具有某一可能性。這在圖4中示例性描述,其描述了相應(yīng)于從圖像傳感器陣列1033的部分或全部像素幀獲得的圖像數(shù)據(jù)的幀的圖像幀301。為了清楚,在圖4中僅僅示出了一些示例性的水平掃描線311和垂直掃描線313。在示例性實(shí)施例中,不超過2個(gè)候選像素轉(zhuǎn)變對(duì)可以被注冊(cè)用于每個(gè)水平掃描線311和每個(gè)垂直掃描線313。圖4還描繪了用于表示沿水平掃描線311的識(shí)別的水平像素轉(zhuǎn)變對(duì)321的白圈,以及用于表示沿垂直掃描線313的識(shí)別的垂直像素轉(zhuǎn)變對(duì)323的黑圈。如上所述,雖然降低分辨率的幀可以被用于快速檢測和識(shí)別特征,例如像素轉(zhuǎn)變對(duì)和線性特征,在各個(gè)實(shí)施例中表示成像的文檔,但是較高分辨率的幀,例如分辨率等于圖像傳感器陣列1033的分辨率,或者其它更高的分辨率的幀可以被處理用于檢測指示的特征,在各種實(shí)施例中,其中處理能量足夠用于對(duì)較高分辨率的快速特征檢測。圖5-8描述了在識(shí)別的像素轉(zhuǎn)變對(duì)上建立以識(shí)別線性特征(例如,邊緣段、對(duì)準(zhǔn)的邊緣段組以及可能定義文檔圖像的角的邊緣段組的交叉)并且然后識(shí)別和補(bǔ)償透視傾斜以將3d空間中2d文檔的圖像映射為文檔的標(biāo)準(zhǔn)2d圖像的另外方面。如下提供這些方面的簡要概述。表示文檔以及可能被檢測為檢測和識(shí)別文檔圖像的過程的一部分的各種特征(例如,像素轉(zhuǎn)變對(duì)、邊緣段、對(duì)齊的邊緣段組和邊緣段組角交叉)可以共同被稱為文檔表示特征或者表示特征,例如,它們表示文檔的潛在特征,例如文檔的邊緣。在各種示例性實(shí)施例中,表示文檔的任意這些特征,以及被識(shí)別的文檔片段、部分識(shí)別的文檔、或者識(shí)別的文檔,可以共同地被認(rèn)為是在降低分辨率幀中的識(shí)別的線性特征。如圖5描述的,可能是邊緣段的候選線性特征可以從連續(xù)的像素轉(zhuǎn)變對(duì)中被識(shí)別,并且接著對(duì)齊的并且示出屬于相同邊緣的可能性的邊緣段可以被分組在一起。在這個(gè)示例性實(shí)施例中,由于僅僅有兩個(gè)像素轉(zhuǎn)變對(duì)沿著每個(gè)掃描線或軸注冊(cè),因此最大有四個(gè)對(duì)齊的邊緣段組,其應(yīng)該對(duì)應(yīng)于文檔的四個(gè)邊緣。如圖6所示,直線等式可以適合于四邊緣組,接著被求解為聯(lián)立方程的對(duì),給出四個(gè)角點(diǎn)。這些點(diǎn)接著可以從2d轉(zhuǎn)換為3d,給出在3維空間中的原始文檔的角點(diǎn),這將參考圖7-8在下面進(jìn)一步描述。例如,然后,文檔維度通過將其在像素上的外觀大小與成像器透鏡組件250相關(guān),在計(jì)算其物理大小后,可以被核查。此后,文檔的位置可以在給定時(shí)段上被平滑,以移除解決方案中的某一不穩(wěn)定性??梢葬槍?duì)過多的陰影核查該文檔,并且它的位置和方向可以被用來確定用戶暗示,示例性地以在提高定位上給出暗示的圖形圖標(biāo)的形式,這可以向操作者給出以顯示如何移動(dòng)移動(dòng)設(shè)備1000以增強(qiáng)圖像質(zhì)量。最后,一旦操作者啟動(dòng)最后文檔捕獲,可以在顯示之前針對(duì)銳度核查所得到的圖像。一旦它被顯示,可以執(zhí)行進(jìn)一步的處理將所得到的圖像轉(zhuǎn)換為矩形,降低漸暈,校正任何顏色不平衡,并使其尖銳。在一個(gè)實(shí)施例中,可以允許操作者保存圖像(例如,文檔表示)。這些特征在下面進(jìn)一步被描述。在各種實(shí)施例中,指示特征檢測過程可以使用用于檢測文檔指示特征的各種算法的一種或多種。如以上參考圖4所示,一種示例性的算法實(shí)施例可以涉及沿水平線311和垂直線313通過縮略圖掃描,并查找包括正好兩個(gè)重要像素轉(zhuǎn)變的那些。另一個(gè)示例性算法實(shí)施例可以涉及在每個(gè)方向查找第一重要像素轉(zhuǎn)變,從四個(gè)邊緣的每一個(gè)的中心開始,并朝著縮略圖的中心運(yùn)作。在各種示例性實(shí)施例中,超過像素轉(zhuǎn)變閾值的像素轉(zhuǎn)變對(duì)可以被認(rèn)作是絕對(duì)項(xiàng)中重要的,例如如果在像素的三色值和其臨近的三色值之間的絕對(duì)差值的和大于特定值。例如,每個(gè)像素可以用r8g8b8格式編碼24位的顏色數(shù)據(jù),以便每個(gè)像素的每個(gè)紅色、綠色和藍(lán)色強(qiáng)度可以在0到255的范圍內(nèi),并且閾值可以是三色成分的每一個(gè)的至少64差值,如示例性的實(shí)例,或者三色成分的每一個(gè)的至少128差值的組,如另一個(gè)示例性的實(shí)例。在其它示例性實(shí)施例中,每個(gè)顏色成分的其它強(qiáng)度閾值,或者低于或者高于或者在這個(gè)范圍內(nèi),還可以被用于像素轉(zhuǎn)變閾值。在另一個(gè)示例性實(shí)施例中,顏色成分強(qiáng)度可以被相乘,且臨近像素的顏色成分的乘積之間的差值可以被評(píng)估用于重要的像素轉(zhuǎn)變。在其它示例性實(shí)施例中,像素轉(zhuǎn)變對(duì)可以被認(rèn)為是相對(duì)項(xiàng)中重要的,例如通過沿每個(gè)軸或掃描線選擇具有最大差值的兩個(gè)像素轉(zhuǎn)變對(duì)。在各種實(shí)施例中,可以使用結(jié)合絕對(duì)和相對(duì)標(biāo)準(zhǔn)的評(píng)估。在各種實(shí)施例中,這里描述的兩種算法都可以使用某些不同的轉(zhuǎn)變值來查看哪一個(gè)給出了最佳的最終結(jié)果。在查找指示特征的每次嘗試后,指示性特征檢測過程可以繼續(xù)進(jìn)行來查看還有多遠(yuǎn)。如果任一核查失敗,那么將嘗試下個(gè)轉(zhuǎn)變值和/或邊緣檢測算法。該過程可以繼續(xù)直到已經(jīng)獲得了全部滿意的結(jié)果,或者當(dāng)兩個(gè)算法都已經(jīng)使用全部可應(yīng)用的轉(zhuǎn)變值。實(shí)際上,可以有即使有邊緣也沒有發(fā)現(xiàn)邊緣的不同數(shù)量的掃描線,即使沒有實(shí)際邊緣也發(fā)現(xiàn)“邊緣”的線,以及發(fā)現(xiàn)水平和垂直邊緣的線。由于光亮和其它條件沿著被成像的文檔的每個(gè)邊緣而變化,因此指示性特征檢測過程在目標(biāo)文檔的某些部分比其它部分執(zhí)行得更好。因此,發(fā)現(xiàn)邊緣已經(jīng)被分解為若干段不是罕見的事,每一個(gè)都包括連續(xù)的或者對(duì)齊的像素轉(zhuǎn)變點(diǎn)??梢酝ㄟ^將具有它們的每個(gè)水平和垂直線的第一和第二像素轉(zhuǎn)變對(duì)與來自先前掃描線(如果有)的像素轉(zhuǎn)變對(duì)進(jìn)行比較,建立邊緣段的列表,來查看它們是否大致類似,并且在相同方向上移動(dòng)。如果它們是,那么這些點(diǎn)可以被加入到當(dāng)前邊緣段,否則開始新的段??梢钥紤]給定的錯(cuò)誤余量,例如允許每段中的單獨(dú)離群值,例如,以便不分解包括單獨(dú)錯(cuò)誤識(shí)別值的邊緣段。在這個(gè)過程的最后,可以丟棄小于特定最小數(shù)量點(diǎn)的段,保留應(yīng)該包括四個(gè)邊緣的每一個(gè)的四個(gè)段集合。在示例性實(shí)施例中,可以使用最小平方方法,將直線等式適合四個(gè)集合的每一個(gè)中的每段。每個(gè)集合可以接著被單獨(dú)核查,并且可以成對(duì)測試所述段,查看它們是否可能屬于相同邊緣。為此,可以使用它們的兩個(gè)等式通過在合適的情況下在對(duì)應(yīng)于縮略圖的寬度或高度的范圍上對(duì)在多個(gè)位置上的線之間的距離平方求和來獲得兩個(gè)線之差的度量。如果這種度量小于指定值,該段可以被合并。在這個(gè)過程的最后,具有小于指定最小數(shù)量點(diǎn)的合并段可以被丟棄,并且在每個(gè)集合(如果有)中的最大保留合并段被選擇——當(dāng)水平邊緣正被查找時(shí),這將消除例如對(duì)應(yīng)于垂直邊緣的段。最小平方方法可以再被使用將直線適于四個(gè)邊緣。圖5示出了來自從圖4描繪的掃描線產(chǎn)生的至少近似對(duì)齊邊緣段431(每個(gè)邊緣段示為粗線段)(其被分組在一起并且被擴(kuò)展表示合并的段線433)的單個(gè)線的可能結(jié)果。邊緣段431的每一個(gè)可以從垂直像素轉(zhuǎn)變對(duì)323的臨近或連續(xù)集合中被聚集,垂直像素轉(zhuǎn)變對(duì)323可以跨越縮略圖301從垂直掃描線313生成。邊緣段435還可以從垂直掃描線313生成的垂直像素轉(zhuǎn)變對(duì)323的連續(xù)集合中被聚集,但是在這個(gè)示例性實(shí)施例中,掃描線的一個(gè)特定方位生成的邊緣段可以被用來填充邊緣段組的一個(gè)方位,作為誤差約束技術(shù)。至少大體對(duì)齊的邊緣段431可以被合并,同時(shí)沒有對(duì)齊的邊緣段435可以被丟棄,因?yàn)樗鼪]有與其它的垂直掃描生成的段對(duì)齊,并且與合并段431相比,它在垂直掃描中檢測的像素轉(zhuǎn)變對(duì)的數(shù)量方面是數(shù)據(jù)缺乏的(由于它更接近垂直,并且比垂直掃描線具有更多的平行組件,以及較低的垂直掃描分辨率,同時(shí)合并段431更接近水平,且每個(gè)具有比垂直掃描線更多的垂直組件,以及較高的垂直掃描分辨率)。相似的,可以進(jìn)行水平掃描以僅僅檢測更接近于垂直的,并且讀取比垂直更高的水平掃描的分辨率的段組,并且相似的,被檢測為大大強(qiáng)于與直角段對(duì)齊。單獨(dú)的段可能包括不準(zhǔn)確性,但是合并段傾向于產(chǎn)生更多準(zhǔn)確的組合結(jié)果,如圖5的合并段線433示例性示出的。在其它示例性實(shí)施例中,來自垂直和水平掃描的信息可以被用來檢測和特征化形成目標(biāo)文檔的四個(gè)邊緣的任意部分的任意邊緣段。用于檢測、特征化和合并像素轉(zhuǎn)變對(duì)和/或邊緣段的充分處理可以產(chǎn)生四個(gè)合并段線433、437、443、447,并且邊緣方程可以被確定來特征化四個(gè)合并段線的每一個(gè)。在各種實(shí)施例中,在已經(jīng)獲得四邊緣方程后,邊緣方程可以接著成對(duì)檢查,以核查它們相對(duì)角度至少是接近的,例如在90°的預(yù)期余量內(nèi)。在各種實(shí)施例中,這種核查可以是近似的,且角度可以在稍后更加精確地被重新計(jì)算。這個(gè)目的是為了確保邊緣建立過程導(dǎo)致能夠表示2d矩形形式的邊緣的圖像部分,如3d空間中成像的。如圖6所示,如果核查成功,則方程可以成對(duì)求解為聯(lián)立方程,給出交叉合并段線433、437、443和447的四對(duì)的每一個(gè)的四個(gè)交叉定義的四個(gè)角點(diǎn)451、453、455和457。這些角的解的有效性可以接著被測試高度精確性。角從應(yīng)該是二維文檔的二維圖像導(dǎo)出,但是文檔存在于三維空間(簡稱三空間),并且已經(jīng)沿著x、y或者z軸旋轉(zhuǎn)。沿著z軸的某個(gè)旋轉(zhuǎn)量并不是個(gè)問題,因?yàn)樗鼪]有影響整個(gè)的形狀幾何,它僅僅降低最大可能文檔圖像大小。然而,任何x和/或y軸旋轉(zhuǎn)將朝向目標(biāo)文檔的相機(jī)視線改變?yōu)閮A斜的透視圖,并且將相機(jī)的矩形視圖改變?yōu)榫哂袧撛谒膫€(gè)不同側(cè)邊長度和角的角度的非矩形四邊形。在各種示例性實(shí)施例中,可以更加嚴(yán)格地進(jìn)行2空間角的角度核查,或在這個(gè)點(diǎn)上計(jì)算側(cè)邊的縱橫比,但是這樣做限制了能夠容許的傾斜的量,并且還可能允許通過無效的角的解。圖7和8描述了成像這樣一種傾斜的透視四邊形和解釋來自它的矩形文檔的表示的方面。圖7描述了在圖像幀601中成像文檔的這種傾斜的透視視圖四邊形611的示例性實(shí)例,其中四邊形611通過四個(gè)邊緣631、633、635和637以及通過上述的特征檢測過程識(shí)別的四個(gè)角點(diǎn)651、653、655和657定義。四邊形611可以代表矩形,其是下部看的并且稍微向中心的左傾,但是它還可能是它可以代表不同矩形的無效角的解,如圖8中無效的解線邊界711所示。如果非常嚴(yán)格的有效被應(yīng)用于2空間角度和邊長,則解釋傾斜圖像的范圍將被太嚴(yán)格限制,并且四邊形611將被拒絕,由于它與矩形太不相同。識(shí)別矩形文檔的處理因此可以允許明顯的背離90度的候選四邊形的四個(gè)角的每一個(gè)的角度的誤差,和/或明顯的背離相等的四邊形的每對(duì)對(duì)邊的長度,盡管在它們角度上距離90度的超額偏差,或者在所述對(duì)對(duì)邊的長度上還是使得候選四邊形不合格。實(shí)際上,無需不合格而允許多么明顯的這些偏差在各個(gè)實(shí)施例中可能是不同的,并且例如在一個(gè)實(shí)施例中是可調(diào)節(jié)的。在示例性實(shí)施例中,為了確定二維空間角是否代表了三維空間中所需大小和形狀的扁平矩形,角坐標(biāo)可以在進(jìn)行任意其它確認(rèn)之前從二維空間轉(zhuǎn)換為三維空間。在通常的情況下,問題是處于約束中的,并且可能有無窮多的解答,包括在任意平面和相機(jī)頂點(diǎn)定義的無窮四邊錐之間的全部可能的交叉,這些四個(gè)邊緣的每一個(gè)通過頂點(diǎn)以及四個(gè)識(shí)別的角點(diǎn)651、653、655和657的每一個(gè)。在一個(gè)示例性實(shí)施例中,這種轉(zhuǎn)變可以利用非線性編程技術(shù)實(shí)現(xiàn),利用各種假設(shè)來執(zhí)行。在這個(gè)例子中,可以使用以下三種假設(shè):1、三維空間坐標(biāo)真的代表矩形,因此每個(gè)三維空間的角的角度為90°。2、矩形的中心是在固定位置。這意味著除了四個(gè)自由變量(每個(gè)角的z坐標(biāo)),還可以需要少量值,例如僅僅需要三個(gè)或者僅僅需要兩個(gè),并且例如可以計(jì)算保留的一個(gè)或兩個(gè)。與第一假定一起,這避免了無窮多的解答,并且還防止了為零的所有z坐標(biāo)的退化解。3、角的z坐標(biāo)是類似的——換句話說,矩形相對(duì)于相機(jī)不是非常傾斜。在這個(gè)示例性實(shí)施例中,這種假定提供一組合理的開始值給非線性解決者,以便更快找到解答。矩形到相機(jī)的距離可以根據(jù)外形尺寸來估計(jì),且可以用作每個(gè)角的初始z坐標(biāo)。在這個(gè)示例性實(shí)施例中,利用首次假定,可以構(gòu)建方程,其變量是三個(gè)自由角的三維空間z坐標(biāo),其結(jié)果代表了四個(gè)角的角度距離90°還有多遠(yuǎn),并且利用其它兩種假定,這個(gè)方程可以利用非線性編程而求解(從減少角度誤差的意義上說)。作為這個(gè)示例性實(shí)施例的方程的例子可以按照如下構(gòu)建,利用傳統(tǒng)的代數(shù)符號(hào),單獨(dú)一個(gè)羅馬字母表示的三維空間中的點(diǎn),單獨(dú)一個(gè)粗斜體字母表示的二維空間的點(diǎn),示出線的終點(diǎn)的字母對(duì)的線,以及具有音調(diào)號(hào)(^)的單獨(dú)一個(gè)字母的角度。首先,在這個(gè)示例性實(shí)施例中,基于每個(gè)點(diǎn)的假定的z坐標(biāo),利用簡單的透視變換,角的二維空間x和y坐標(biāo)被轉(zhuǎn)變?yōu)槿S空間:ax=saxazay=sayazbx=sbxbzby=sbybzcx=scxczcy=scyczdx=sdxdzdy=sdydz其中s是將二維四邊形的大小與相機(jī)的角度視場相比得到的縮放因數(shù)。在僅僅具有三個(gè)自由變量的情況下,點(diǎn)b、c和d的z坐標(biāo)可以在求解處理期間自由變化,但是點(diǎn)a的z坐標(biāo)是由以上第二假定限制的,并且總是等于4rz-bz-cz-dz,其中rz是矩形中間到相機(jī)的估計(jì)距離。接著每個(gè)邊和每個(gè)對(duì)角的長度的平方可以被如下計(jì)算:sab=(ax–bx)2+(ay–by)2+(az–bz)2sbc=(bx–cx)2+(by–cy)2+(bz–cz)2scd=(cx–dx)2+(cy–dy)2+(cz–dz)2sda=(dx–ax)2+(dy–ay)2+(dz–az)2sac=(ax–cx)2+(ay–cy)2+(az–cz)2sbd=(bx–dx)2+(by–dy)2+(bz–dz)2現(xiàn)在,隨著4個(gè)角的角度更接近90°而降低的誤差值可以被導(dǎo)出:aε=sda+sab–sbdbε=sab+sbc–saccε=sbc+scd–sbddε=scd+sda–sac如果任何角是90°,那么通過pythagoras定理,相應(yīng)的誤差值會(huì)是零。然而,如果角度不是90°,那么余弦規(guī)則指出該誤差值,例如,對(duì)于角a,將等于:隨著趨于90°,其將趨于零。由于da和ab趨于零,該誤差值也將趨于零,隨著它們的相應(yīng)的z坐標(biāo)趨于零,其將依次趨于零。然而,因?yàn)閼?yīng)用到角的限制,例如因?yàn)樵诋?dāng)前例子中定義az的方式,它不會(huì)和其他z坐標(biāo)一樣同時(shí)為零,在這個(gè)例子中。這防止了退化解az=bz=cz=dz=0。最后,四個(gè)誤差值可以組合為單獨(dú)一個(gè)值,解決者能夠?qū)で笞钚』?。需要一種方法,其將防止抵償負(fù)誤差的正誤差,因此單獨(dú)誤差的平方可以求和:在這個(gè)示例性實(shí)施例中,盡管會(huì)稍微快速地將誤差的絕對(duì)值求和,而不是它們的平方,但這么做會(huì)給方程曲面引入中斷,這可能降低求解的精確度。用于以上示例性實(shí)施例的求解方法是迭代的,其通過以小德耳塔值重復(fù)改變?nèi)齻€(gè)自由變量和查看這些變化是否提高結(jié)果,來尋求最小化上述方程的結(jié)果。對(duì)于每次迭代,它可以計(jì)算總的誤差,在一個(gè)實(shí)施例中,高達(dá)27次——這是因?yàn)樗鼘⑹褂妹總€(gè)自由變量本身,利用增加的德耳塔,以及減少的德耳塔(它可能進(jìn)行小于27次計(jì)算,因?yàn)樗鼘⒉恢貜?fù)在前次迭代中已經(jīng)進(jìn)行的計(jì)算)。如果給定的變化集合沒有提高結(jié)果,系統(tǒng)5000可以確定當(dāng)前結(jié)果必須是接近本地最小值,并且因此減少下次迭代的德耳塔。當(dāng)?shù)露_(dá)到指定的最小值,或者達(dá)到最小德耳塔值之前,迭代的數(shù)目達(dá)到了指定的限制,該求解處理可以終止。在這個(gè)示意性實(shí)例中,這通常發(fā)生得很快,因?yàn)榉匠瘫砻媸沁B續(xù)的和相對(duì)平滑的。在這個(gè)示例性實(shí)施例中,原始角求解的有效性接著能夠通過在三維空間角上的兩次簡單核查被確定。首先,三維空間角度可以被核查為足夠接近90°,接著矩形邊的縱橫比可以被核查為足夠接近預(yù)期值。這些測試能夠比二維空間四邊形上相應(yīng)的核查更加嚴(yán)格,例如,在示例性實(shí)施方式中,三維空間角度可以被核查在90°±0.25°范圍中,縱橫比在預(yù)期值的2%以內(nèi)。在這個(gè)示例性實(shí)施例中,測試可以進(jìn)行得甚至更加嚴(yán)格,沒有相對(duì)接近優(yōu)選平面的文檔可能被拒絕。在這個(gè)例子中,如果滿足兩種測試,則處理可以繼續(xù)。邊緣檢測處理的各種實(shí)施例因此可以包括測量識(shí)別的線性特征之間的角度,評(píng)估所測量的角度是否在大約90度的受限的斜角之內(nèi),如果是,識(shí)別線性特征的交叉點(diǎn)為被識(shí)別的角點(diǎn)。在各種示意性實(shí)施例中,傾斜值可以被認(rèn)為等于角度誤差或者角度中的誤差值,表示2d90度角度的3d成像的傾斜效果。結(jié)果的平滑:在這個(gè)示例性實(shí)施例中由文檔檢測處理返回的結(jié)果值是原始圖像中的2d角位置、3d文檔距離、相機(jī)軸的偏移和旋轉(zhuǎn)角度、縱橫比與預(yù)期值的差值、以及陰影量。在這個(gè)示例性實(shí)施例中,因?yàn)樵趩蝹€(gè)邊緣求解中的小變化會(huì)對(duì)最終的三維空間求解產(chǎn)生巨大的差值,因此這些結(jié)果可以通過計(jì)算移動(dòng)均值在指定時(shí)期平滑。在這個(gè)示意性實(shí)施例中,如果該值突然以高于指定量發(fā)生改變,那么新的結(jié)果可以臨時(shí)忽略,并且返回原先那個(gè),除非所有四個(gè)角都已經(jīng)變化,在這個(gè)情況下,移動(dòng)均值可以被重置,因?yàn)樗赡芗僭O(shè)相機(jī)(或文檔)快速移動(dòng)到新位置。圖像陰影檢測:還可以執(zhí)行圖像質(zhì)量的其它檢查,例如圖像陰影檢查和相機(jī)移動(dòng)檢查。文檔上的陰影可以嚴(yán)重影響它的可讀性,所以圖像還可以針對(duì)額外的陰影被檢查。在這個(gè)示例性實(shí)施例中,例如可以通過將組中的縮略圖像素顏色求和,將值的合成列表以升序從最黑組到最亮組排序,形成近似表示原始圖像亮度值的柱狀圖,以及在柱狀圖中檢查百分比值-這可以支持在陰影和文檔內(nèi)在的對(duì)比特征之間的可靠分析-來執(zhí)行例如陰影檢測。例如,在示例性實(shí)施例中,通過將10×10組中的縮略圖像素顏色值求和,可以執(zhí)行陰影檢測。值的合成列表然后可以升序排序,以便首先是最黑的組,最后是最亮的組,形成近似表示原始圖像亮度值的柱狀圖。然后可以檢查第10和第90百分比值。在這個(gè)示意性實(shí)施例中,這是因?yàn)榫哂嘘幱暗膱D像通常在最低值和最高值之間表示與沒有陰影的圖像相比明顯更大的差值,但是兩端的盡頭可能需要被忽略。圖10用圖801示出了這個(gè)點(diǎn),其示出了從陰影和沒有陰影的相同的示例性目標(biāo)文檔獲得的值。在圖801,線811代表大約第10個(gè)百分點(diǎn),線813代表大約第90個(gè)百分點(diǎn),并且標(biāo)記點(diǎn)示出陰影圖像的值的較高比率。在這個(gè)示例性實(shí)施例中,陰影百分比可以計(jì)算為:100-(第10個(gè)百分值×100)/(第90個(gè)百分值)這個(gè)值可以接著被檢查小于文檔配置文件中的最大值。這個(gè)最大值需要根據(jù)文檔類型設(shè)置,因?yàn)榫哂写竺娣e不同顏色和/或陰影的文檔將顯露出這種方法,在相同的光照條件下,具有比更統(tǒng)一的文檔更大的陰影百分比。在這個(gè)示例性實(shí)施例中,如果陰影檢查失敗了,可以在設(shè)備屏幕上顯示圖形操作者暗示圖標(biāo),來通知操作者。相機(jī)移動(dòng)檢查:還可以進(jìn)行圖像質(zhì)量的其它檢查,例如相機(jī)移動(dòng)檢查。在示例性實(shí)施例中,可以執(zhí)行這種檢查,當(dāng)已知移動(dòng)設(shè)備1000在移動(dòng)時(shí),防止用戶試圖捕獲靜止圖像。在示例性實(shí)施例中,可以執(zhí)行相機(jī)移動(dòng)檢查,當(dāng)已知移動(dòng)設(shè)備1000在移動(dòng)時(shí),防止用戶試圖捕獲靜止圖像。在示例性實(shí)施例中,移動(dòng)檢查可以例如比較來自當(dāng)前預(yù)覽圖像和前一預(yù)覽圖像的像素塊的組,并且對(duì)像素組的全部紅、綠或藍(lán)值中的任一種進(jìn)行變化已經(jīng)改變得超過指定量作為相機(jī)的過度移動(dòng)的指示。可以采取各種步驟來防止這些因素,例如陰影,或者妨礙文檔圖像捕獲的相機(jī)移動(dòng),包括自動(dòng)步驟和/或操作者暗示。移動(dòng)檢查可以例如比較來自當(dāng)前預(yù)覽圖像和前一預(yù)覽圖像的4×4像素的64組。如果像素組的全部紅色、綠色或藍(lán)色值的任一種已經(jīng)變化地超過指定量,那么可以在顯示器1222上示出圖標(biāo)。在各種示例性實(shí)施例中,系統(tǒng)5000可以操作以便具有流預(yù)覽圖像的預(yù)覽窗口可以在數(shù)字設(shè)備的顯示器上示出,如圖1、17和18所示。系統(tǒng)5000可以操作以便移動(dòng)設(shè)備1000可以在顯示器1222上顯示流預(yù)覽圖像1111,其中流預(yù)覽圖像1111示出了相機(jī)正在查看的低分辨率的實(shí)時(shí)預(yù)覽。預(yù)覽圖像1111可以為在提高成功文檔捕獲中的各種有用的目的服務(wù)。例如,示例性文檔捕獲處理的執(zhí)行可以識(shí)別多個(gè)不同標(biāo)準(zhǔn)和/或非標(biāo)準(zhǔn)文檔簡檔類型,具有相關(guān)的文檔縱橫比和大小。預(yù)覽窗口1101可以示出特定文檔配置文件類型的表示。例如,示例性文檔捕獲處理的執(zhí)行可以預(yù)先選擇文檔簡檔類型。在另一個(gè)示例性實(shí)施方式中,文檔簡檔類型可以在屏幕頂部顯示,如果不是要求的那一個(gè),那么文檔簡檔類型下拉菜單1141可以被打開,可以選擇在菜單上列出的若干可用簡檔中的一個(gè),如圖11所示。列出的菜單選項(xiàng)可以組合文檔簡檔類型和定向,例如a5風(fēng)景,a4風(fēng)景,a5人像,a4人像等,如圖11所示。不同的簡檔可以被存儲(chǔ)用于各種標(biāo)準(zhǔn)的文檔類型,每一個(gè)可以具有例如縱橫比、邊緣長度、目標(biāo)顏色平衡等相關(guān)參數(shù)的簡檔。例如這些的標(biāo)準(zhǔn)參數(shù)可以結(jié)合一組固定參數(shù)一起使用來控制處理。例如,系統(tǒng)5000還可以是可操作的以便該簡檔可以經(jīng)由鍵盤1226、通過按壓鍵盤1226的輸入鍵1228打開文檔簡檔類型下拉菜單1141、利用下箭頭和/或上箭頭來高亮顯示所需簡檔、以及接著再次按壓輸入鍵1228來選擇它來進(jìn)行選擇。在這個(gè)示例性實(shí)施例中,新的簡檔或者具有定向的簡檔的組合還可以很簡單的被加入或者是現(xiàn)有的被修改的簡檔。圖像簡檔上的額外信息可以在以下配置文件小節(jié)中提供。操作者暗示:利用選擇的正確簡檔,操作者可以將移動(dòng)設(shè)備1000的成像系統(tǒng)400或者相機(jī)定位到文檔110。在這點(diǎn),在這個(gè)示例性實(shí)施例中,如果候選文檔方案已經(jīng)通過了全部測試,那么可以表示它可能代表有效文檔。然而,在示例性實(shí)施例中,系統(tǒng)5000可以是可操作的以便在允許靜止圖像捕獲和保存(例如捕獲和保存文件表示)之前可以進(jìn)行最后的一組檢查。在這個(gè)示例性實(shí)施例中,這些檢查保證了文檔滿足質(zhì)量成像的某個(gè)標(biāo)準(zhǔn),例如文檔沒有擴(kuò)展超出如透鏡組件250組合圖像傳感陣列1033所定義的終端或相機(jī)的視場、文檔采取了視場的某個(gè)最小量、以及文檔沒有傾斜使得在圖像轉(zhuǎn)化處理期間有場深問題或者圖像降級(jí)。參考圖12-17中的一個(gè)或多個(gè)描述和討論操作者暗示的各個(gè)方面。系統(tǒng)5000可以是可操作的以便預(yù)覽窗口可以提供操作者暗示或者指導(dǎo)指示,其可以采用圖形操作者暗示圖標(biāo)和/或其它用戶感知指示、圖形或其它的形式,以在定位移動(dòng)設(shè)備1000和/或文檔110從而提高捕獲文檔110的高分辨率圖像的成像質(zhì)量中向用戶提供操作引導(dǎo)。各種不同的操作者暗示圖標(biāo)可以用來指導(dǎo)用戶采用多個(gè)類型的動(dòng)作來改善文檔捕獲的成像質(zhì)量。在各種實(shí)施例中,操作者暗示可以采取任何用戶可感知形式,示例性包括聲音或音頻輸出、觸覺輸出或任意類型的圖形或其它視覺輸出,并且可以包括輸出的任意組合。在示例性實(shí)施例中,系統(tǒng)5000可以是可操作的以便預(yù)覽窗口可以示出在文檔110處指出的具有成像子系統(tǒng)400的三個(gè)中的一個(gè):沒有邊界的文檔(即,其表示)、具有紅色邊界的文檔,或者具有綠色邊界的文檔,來指示不同狀態(tài)。在這個(gè)示例性實(shí)施方式中,系統(tǒng)5000可以是可操作的以便如果整個(gè)文檔是可見的且沒有邊界的,程序不能檢測文檔的存在。例如,這可能是因?yàn)槲臋n距離太遠(yuǎn)了,光照條件差(例如,文檔部分地在強(qiáng)太陽光下),背景正“轉(zhuǎn)移”識(shí)別處理或者部分文檔延伸在相機(jī)的視場以外。在這個(gè)示例性實(shí)施例中,系統(tǒng)5000可以是可操作的以便如果這些檢查中的任何一個(gè)失敗了,可以在顯示器1222上渲染操作者暗示圖標(biāo),示出操作者如何移動(dòng)終端來解決成像質(zhì)量標(biāo)準(zhǔn)失敗。圖12示出了在應(yīng)用窗口1101中預(yù)覽圖像1111中渲染的操作者暗示圖標(biāo)1121的示例性的例子,作為操作者暗示圖標(biāo)的示例性例子。質(zhì)量成像標(biāo)準(zhǔn)的失敗可以在特定時(shí)段上聚集,以便操作者不以快速變化的指令來呈現(xiàn)。例如,利用操作者暗示圖標(biāo),用戶可以例如被提示來確保文檔上的光照是合理均勻的,以試著更接近文檔進(jìn)行移動(dòng),或者將文檔放置在更加統(tǒng)一的背景中。系統(tǒng)5000可以是可操作的以便一旦文檔被檢測,它將示出重疊邊界。例如,紅色邊界表示文檔已經(jīng)被檢測了,但是將生成的圖像可能由于某些原因中的一個(gè)而不是最佳的。在這種情況下,操作者暗示圖標(biāo)可以在屏幕上顯示為關(guān)于如何改進(jìn)圖像的一種視覺指令,例如,左邊下方的屏幕截圖告訴操作者移動(dòng)終端更接近于文檔。系統(tǒng)5000可以是可操作的以便如果服從指令,那么邊界可以變?yōu)榫G色,表示掃描鍵1228可以被按壓來捕獲文檔。在這個(gè)示例性實(shí)施例中,文檔沒有必須針對(duì)邊界對(duì)整或居中變?yōu)榫G色,因?yàn)樽詈蟛东@的圖像將自動(dòng)按需裁剪/縮放/旋轉(zhuǎn)。這在圖17中示出。系統(tǒng)5000可以是可操作的以便呈現(xiàn)紅色邊界時(shí)顯示的圖標(biāo)顏色將循環(huán),從而對(duì)于明亮和黑暗的背景都是可視的,并且它還可能是動(dòng)畫的。它可能包括圖13-16中示出的任意圖標(biāo),其中每個(gè)圖標(biāo)作為用戶暗示圖標(biāo)。圖13示出了直線指示符圖標(biāo),向用戶提示在八個(gè)所示方向的任意一個(gè)方向平移移動(dòng)移動(dòng)設(shè)備1000。如圖13所示,這些直線指示符可以從具有八個(gè)不同方位的任意一個(gè)的箭頭選擇,包括:向上、斜向左上、向左、斜向左下、向下、斜向右下、向右和斜向右上。這些僅僅是示例性的例子,暗示圖標(biāo)可以提供任意方向上的點(diǎn),并且精確地在移動(dòng)設(shè)備1000應(yīng)該被移動(dòng)的方向上的點(diǎn)。暗示圖標(biāo)的圖形格式還可以采取任意各種形式;另一個(gè)示例性的例子是在所需方向上移動(dòng)的移動(dòng)設(shè)備1000的動(dòng)畫圖像。圖14示出了用戶暗示圖標(biāo),向用戶提示在所指示的方向上旋轉(zhuǎn)移動(dòng)設(shè)備1000。圖14的圖標(biāo)構(gòu)成了顯示在監(jiān)視器上的曲線指示符,表示旋轉(zhuǎn)設(shè)備的方向。圖15示出了用戶暗示圖標(biāo),提示用戶更接近目標(biāo)文檔或者遠(yuǎn)離目標(biāo)文檔來移動(dòng)移動(dòng)設(shè)備1000。圖15的圖標(biāo)作為監(jiān)視器上顯示的距離指示符,指示更接近目標(biāo)或者更遠(yuǎn)離目標(biāo)重新定位設(shè)備的方向。圖16示出了用戶暗示圖標(biāo)1601,指示文檔部分在陰影中,并且應(yīng)該被移動(dòng)到光照更加均勻的地方。圖標(biāo)1601作為在監(jiān)視器上顯示的部分陰影指示符,指示明顯的部分陰影模糊了候選四邊形形狀。圖16還示出了用戶暗示圖標(biāo)1602,指示文檔的圖像因?yàn)橄鄼C(jī)移動(dòng)是不清楚的。圖標(biāo)1602作為監(jiān)視器上顯示的額外移動(dòng)指示符,表示成像系統(tǒng)和/或候選四邊形形式的至少一個(gè)正在顯示出額外的移動(dòng),干擾了識(shí)別定義候選四邊形形式的線性特征的能力。系統(tǒng)5000可以是可操作的以便用戶暗示圖標(biāo)1602僅僅在掃描鍵1227已經(jīng)被按壓來捕獲文檔圖像之后使用,并且指示該圖像沒有足夠尖銳,因此終端應(yīng)該被拿得更穩(wěn)一些,并嘗試再次捕獲。作為示例性例子,如果文檔非常接近視場的左手邊,左頂角超出了視圖,那么可以示出曲線指示符用戶暗示圖標(biāo)1401,如圖14所示,告訴操作者去順時(shí)針旋轉(zhuǎn)設(shè)備。然而,在這個(gè)示例性實(shí)施例中,如果在這之后不久,左底角超出了視圖,那么替代告知操作者逆時(shí)針旋轉(zhuǎn)示出的設(shè)備的用戶暗示圖標(biāo),可替代示出直線指示符用戶暗示圖標(biāo)1307,圖標(biāo)1307如圖13中一樣告知他們將該設(shè)備移到左邊。在一個(gè)示例性實(shí)施例中,系統(tǒng)5000不需要可操作的來顯示掃描按鈕1227,并且相反可以是可操作的以便文檔的較高質(zhì)量較高分辨率靜止圖像響應(yīng)于確定對(duì)應(yīng)于較高分辨率幀(通常被緩存)的較低分辨率幀是可接受的質(zhì)量而被保存,無需同樣響應(yīng)于激活掃描按鈕1227的處理。在系統(tǒng)5000是可操作的以便用于確定幀質(zhì)量被處理的相應(yīng)于較低分辨率幀的較高分辨率幀已經(jīng)被緩沖,被緩沖的較高分辨率幀可以被保存,或者可以被處理用來保存響應(yīng)于激活按鈕1227的圖像,指示移動(dòng)設(shè)備1000應(yīng)該被拿得更穩(wěn)一些的圖標(biāo)可以不被顯示(當(dāng)前手移動(dòng)不會(huì)影響之前捕獲的幀的移動(dòng))。系統(tǒng)5000可以是可操作的以便有出現(xiàn)在這個(gè)屏幕上的兩個(gè)其它圖標(biāo)——當(dāng)閃光燈打開時(shí),小的“光球”圖標(biāo)可以被顯示在靠近屏幕的左下方,并且當(dāng)正在寫入診斷時(shí),正如以下在配置文件部分中進(jìn)一步描述的,在這個(gè)示例性實(shí)施例中,小的“扳手”圖標(biāo)可以被顯示靠近屏幕的右下方。在這個(gè)示例性實(shí)施例中,系統(tǒng)5000可以是可操作的以便一旦全部成像質(zhì)量標(biāo)準(zhǔn)都滿足了,操作者可以被提示來捕獲并保存靜止圖像(例如,文檔表示,該表示可以包括在圖像數(shù)據(jù)的幀中)。在一個(gè)實(shí)施例中,系統(tǒng)5000可以是可操作的以便當(dāng)成像質(zhì)量檢查被滿足時(shí),移動(dòng)設(shè)備1000可以自動(dòng)成像并保存文檔110的高分辨率拷貝,或者提示用戶輸入來成像并保存文檔110的高分辨率拷貝,例如通過激活在移動(dòng)設(shè)備1000上的掃描按鈕1227,如圖17所示。系統(tǒng)5000可以是可操作的以便當(dāng)掃描按鈕1227被激活時(shí),掃描按鈕1227的激活導(dǎo)致在按鈕激活之后捕獲的幀或圖像被保存或者被處理為保存。在各種示例性實(shí)施例中,被捕獲并且經(jīng)受處理為保存的圖像數(shù)據(jù)的幀可以具有比針對(duì)質(zhì)量檢測經(jīng)受處理的幀更高的分辨率(例如,可以具有例如1600×1200或者1280×1024的分辨率)。系統(tǒng)5000還可以是可操作的以便當(dāng)掃描按鈕1227被激勵(lì)時(shí),如這里所述的,相應(yīng)于針對(duì)質(zhì)量檢測經(jīng)受處理的較低分辨率幀的緩沖過的較高分辨率幀,被保存或者被處理為保存特征圖像,例如文檔。在各種示例性實(shí)施例中,被緩沖的較高分辨率的幀可以具有與圖像傳感器陣列的分辨率相等的分辨率或者另一相對(duì)較高的分辨率,例如1600×1200或者1280×1024。在各種示例性實(shí)施例中,幀或圖像的保存,例如文檔表示,可以包括將幀寫入到長期存儲(chǔ)存儲(chǔ)器,例如存儲(chǔ)器1084,它可以是例如閃存或者硬盤驅(qū)動(dòng)器。系統(tǒng)5000還可以是可操作的以便幀或圖像的保存(例如,文檔表示),無需響應(yīng)于通過確定可接受的質(zhì)量完成所述質(zhì)量檢查激勵(lì)掃描按鈕1227,并且還無需響應(yīng)于激勵(lì)掃描按鈕1227而發(fā)生。在各種示例性實(shí)施例中,用于保存而處理的圖像數(shù)據(jù)可以是在完成質(zhì)量檢查后或者在質(zhì)量檢查完成之前捕獲的幀的圖像數(shù)據(jù)(如相應(yīng)于用于質(zhì)量檢查而處理的幀的緩沖過的幀被處理用于保存一樣)。預(yù)保存處理:在各種示例性實(shí)施例中,這是在文檔圖像可以被保存之前進(jìn)行的最后處理,并且在各種示例性實(shí)施例中,可以包括一個(gè)或兩個(gè)階段。在示例性實(shí)施例中,第一階段可以包括同時(shí)執(zhí)行的三個(gè)或四個(gè)獨(dú)立功能。首先,這個(gè)處理階段可以包括從被捕獲圖片中提取文檔圖像,并利用2×2雙線性內(nèi)插對(duì)它進(jìn)行變換,使其成為矩形的和垂直的。第二,該處理階段可以包括降低通過相機(jī)透鏡和光照子系統(tǒng)800產(chǎn)生的漸暈。第三,這個(gè)處理階段可以包括利用在前面步驟中收集的信息,校正圖像亮度和顏色平衡,以便其符合圖像簡檔中保存的目標(biāo)值。第四,如果要求灰度級(jí)圖像,每個(gè)像素顏色值可以被設(shè)置為單獨(dú)顏色值的均值。在這個(gè)示例性實(shí)施例中,第二處理階段可以由文檔簡檔中的標(biāo)記控制,并且利用卷積濾波可選地使圖像銳化。在這個(gè)示例性實(shí)施例中,顏色平衡校正可以通過從rgb到hsv或者其它某些類似的顏色空間并且再次轉(zhuǎn)換回來的顏色空間轉(zhuǎn)換來執(zhí)行。然而,這種處理可能比某些應(yīng)用或者情況下花費(fèi)更多時(shí)間,因此在其它示例性實(shí)施例中可以采用低計(jì)算密度(但是因此可能準(zhǔn)確性低)的方法。兩種簡單方法中任一種可以用于不同的示例性實(shí)施例中,其中一個(gè)涉及將平均源值和目標(biāo)值之間的差值增加到每一個(gè)像素,另一個(gè)涉及將每個(gè)像素除以平均源值,并將它乘以目標(biāo)值。當(dāng)差值很大時(shí),第一種方法工作得更好,但是可能不能很好地保存圖像對(duì)比度。第二種方法可以更好得保存圖像對(duì)比度,但是當(dāng)差值很小時(shí)才可以工作得很好。各種示例性實(shí)施例可以使用兩種方法的結(jié)果的平均值,以與每個(gè)顏色的值中的差值的大小成比例地加權(quán),其可以在各種示例性實(shí)施例中在校正顏色溫度差值時(shí)工作得相當(dāng)好。圖像銳度檢查:在示例性實(shí)施例中,當(dāng)在顯示靜止圖像的屏幕大小版本之前靜止圖像已經(jīng)被選擇用于捕獲時(shí),可以針對(duì)銳度檢查它。僅僅通過查看預(yù)覽屏幕大小版本來查看圖像有多么尖銳是很困難的,并且這個(gè)圖像銳度檢查可以對(duì)此補(bǔ)償。銳度檢查可以示例性采樣像素的鄰近對(duì)的隨機(jī)集合,并返回表示為像素顏色值的平均總和的百分比的像素顏色值中的絕對(duì)差值的平均值。這樣工作是因?yàn)槟:膱D像在亮度上從一個(gè)像素到下一個(gè)像素與尖銳圖像相比具有更小的變化。如圖18所示,在這個(gè)示例性實(shí)施例中,銳度檢查可以單獨(dú)進(jìn)行,例如,圖像的五個(gè)不同部分——每個(gè)象限加上中間部分——一旦圖像超過文檔邊緣,忽略最外面的區(qū)域。這種處理帶來各種優(yōu)點(diǎn)。首先,如果當(dāng)靜止圖像被捕獲時(shí)相機(jī)正在被旋轉(zhuǎn),移動(dòng)模糊的效果在整個(gè)文檔上不同。第二,文檔在不同部分可以具有不同的等級(jí)細(xì)節(jié)。例如,如果文檔的特定象限大體上是白色的,那么在銳度測試上通常不會(huì)有好的成績。如果這樣,針對(duì)那個(gè)象限可以降低最小的銳度值,或者通過將文檔簡檔中的那個(gè)象限的銳度值設(shè)置為零來完全跳過測試。在示例性實(shí)施例中,一旦捕獲了足夠尖銳的靜止圖片,文檔的屏幕大小圖像可以從其中提取和進(jìn)行變換,以便其是矩形的和垂直的。例如,圖1示出了具有如可由文檔捕獲處理而捕獲的候選文檔110的預(yù)覽圖像1211;圖9示出了候選文檔110,其已經(jīng)從預(yù)覽圖像1211中提取和變換,使其成為獨(dú)自所顯示的矩形的和垂直的、且被變換的、矩形的和垂直的候選文檔110b。在這個(gè)處理期間,可以收集顏色信息,其將被用來校正預(yù)保存處理期間的圖像。在這個(gè)示例性實(shí)施例中,圖像可以顯示在顯示器1222上,并且可以在文檔圖像能夠被保存之前最后預(yù)保存處理步驟之后。在各種示例性實(shí)施例中,這個(gè)最后的預(yù)保存處理可以示例性涉及任意或全部以下步驟:從被捕獲的圖片中提取文檔圖像,利用2×2雙線性內(nèi)插將它進(jìn)行變換,以便使其成為矩形的和垂直的,降低相機(jī)透鏡和led閃光燈產(chǎn)生的漸暈,利用前面步驟中收集的信息校正圖像亮度和顏色平衡,以便其符合圖像簡檔中保存的目標(biāo)值,將圖像轉(zhuǎn)換灰度級(jí),例如利用3×3卷積濾波器對(duì)圖像進(jìn)行銳化,和/或校正顏色平衡。圖像文件保存:一旦預(yù)保存處理完成了,操作者可以在各種示例性實(shí)施例中被提示或允許來保存文檔圖像,例如通過按壓輸入鍵1228。在其它示例性實(shí)施例中,系統(tǒng)5000還可以是可操作的以便文檔圖像的保存響應(yīng)于所述預(yù)保存處理完成來進(jìn)行,而不是輸入鍵1228的輸入,即無需進(jìn)一步響應(yīng)于輸入鍵1228的激活來保存。如示例性實(shí)例,保存可以利用微軟公司的imagingfactory組件來執(zhí)行。在各種示例性實(shí)施例中,保存圖像可以包括將圖像寫入存儲(chǔ)存儲(chǔ)器1084,它可以是例如所選擇的圖像文件格式中的閃存或者硬盤驅(qū)動(dòng)器。系統(tǒng)5000可以是可操作的以便一旦文檔圖像已經(jīng)被成功捕獲,可以顯示被捕獲的文檔的預(yù)覽。系統(tǒng)5000可以是可操作的以便可以利用可用屏幕區(qū)域的最大量來顯示預(yù)覽,因此較高文檔將利用白色的左右邊界來顯示,更寬文檔將利用白色頂部和底部邊界來顯示。這是在圖9中示例性示出的。系統(tǒng)5000可以是可操作的以便幾秒鐘之后,提示出現(xiàn)在如上所述的圖像下方。在示例性實(shí)施例中,系統(tǒng)5000可以是可操作的以便按壓輸入按鈕1228將該文檔保存到具有文件名docyyyymmddhhmmss.ext的\ipsm\文檔捕獲,其中ext表示所選文件類型,選自從jpg、png或bmp文件類型。在一個(gè)實(shí)施例中,系統(tǒng)5000可以是可操作的以便如果替代地按壓掃描按鈕1227,文檔將不被保存。在兩種情況下,預(yù)覽窗口將接著被再次顯示,以便如果需要的話可以執(zhí)行另一個(gè)捕獲。被保存的圖像可以針對(duì)光學(xué)效應(yīng),例如漸暈和顏色平衡被校正,因此通常將具有比預(yù)覽更高的質(zhì)量。這是在圖9中示例性示出的。在示例性實(shí)施例中,為了退出程序,用戶可以輕擊菜單欄的退出按鈕,或者當(dāng)顯示預(yù)覽窗口時(shí)按壓右邊的菜單按鈕。在一個(gè)示例性實(shí)施例中,系統(tǒng)5000可以是可操作的以便系統(tǒng)5000可以通過菜單選擇,并且還通過基于xml的配置文件來配置。系統(tǒng)5000可以是可操作的以便隨后的菜單選擇可以通過輕擊顯示器1222上顯示的菜單欄的選項(xiàng)或者通過按壓鍵盤1226的指定菜單按鈕可用,菜單選擇的每一個(gè)具有顯示在顯示器1222上的相應(yīng)的激活按鈕。系統(tǒng)5000可以是可操作的以便任意以下涉及的菜單選項(xiàng)可以通過選擇顯示在顯示器1222上的顯示菜單選項(xiàng)來有效。閃光燈在捕獲處理期間的閃光燈狀態(tài),“關(guān)閉”、“自動(dòng)”或“打開”。當(dāng)文檔簡檔被選擇時(shí)初始化這個(gè)菜單選項(xiàng),但可以隨后變化。文件類型文檔圖像將被保存的格式,“低質(zhì)量jpeg”、“中質(zhì)量jpeg”、“高質(zhì)量jpeg”、“png”或“bmp”。當(dāng)文檔簡檔被選擇時(shí)初始化這個(gè)菜單選項(xiàng),但可以隨后變化。智能聚焦如果這個(gè)選項(xiàng)啟用,則根據(jù)從終端1000到文檔的估計(jì)距離來將設(shè)定透鏡焦點(diǎn)。如果這個(gè)選項(xiàng)禁用,替代地,相機(jī)將使用自動(dòng)聚焦模式。自動(dòng)聚焦通常保留啟用,因?yàn)樗鼘⒔档筒东@圖像花費(fèi)的時(shí)間。寫診斷如果這個(gè)選項(xiàng)啟用,則程序?qū)懭朐\斷文件,包括有關(guān)文檔識(shí)別處理的技術(shù)信息。如果文檔簡檔已經(jīng)建立,其似乎不能識(shí)別預(yù)期文檔,則啟用這個(gè)選項(xiàng),接著嘗試捕獲文檔圖像,將生成名為documentcapture.log的終端1000的終端1000根文件夾(根目錄)中的文件,其可以用于執(zhí)行診斷測試。在不同的示例性實(shí)施例中,可以利用軟件開發(fā)工具包的合適編輯器來編輯xml文件,其可以是隨移動(dòng)設(shè)備1000一起出售的,在網(wǎng)站提供下載的,或者以其它方式可獲得。配置文件:配置文件可以包括各種部分,每一部分可以包括定義文檔參數(shù)的鍵,如以下示例性實(shí)施例描述的。在這個(gè)示例性實(shí)施例中第一部分通常被稱為“默認(rèn)”——這本身并不定義文檔類型,但是設(shè)置用于全部文檔類型的默認(rèn)值。在默認(rèn)之后的每個(gè)部分定義文檔類型,并且在這個(gè)示例性實(shí)施例中,可以包括至少文檔寬度和高度的鍵。它還可以包括其它鍵來覆蓋默認(rèn)部分中的那些內(nèi)容。系統(tǒng)5000可以是可操作的以便相應(yīng)于在顯示器1222上顯示的那些之間的菜單選項(xiàng)可以有效。系統(tǒng)5000可以是可操作的以便以下選項(xiàng)中的任意一個(gè)可以通過選擇在顯示器1222上顯示的合適的菜單選項(xiàng)來有效。對(duì)于當(dāng)前示例性實(shí)施例,可用鍵和它們的值為:寬度以mm計(jì)的文檔寬度,范圍:70到450。這個(gè)值必須是精確的,除非文檔可能沒有被識(shí)別。高度以mm計(jì)的文檔高度,范圍70到450。這個(gè)值必須是精確的,除非文檔可能沒有被識(shí)別。公差以千分之一個(gè)百分點(diǎn)計(jì)的文檔縱橫比公差,范圍0到100,默認(rèn)20(即,2.0%)??v橫比被定義為文檔寬度除以高度。如果測量值不同于理論值相差大于這個(gè)百分比,那么文檔圖像將被拒絕。如果文檔寬度或者高度變化非常明顯,則增加這個(gè)默認(rèn)值。例如,如果兩個(gè)a5文檔被打印在a4紙上,那么通過折疊或者撕開這張紙來產(chǎn)生單獨(dú)文檔。然而,這不可能精確的完成,將帶來文檔高度的變化,因此縱橫比公差可能需要被增加。顏色模式文檔的顏色模式,“彩色”或“灰度級(jí)”。查看在“文件類型”鍵的說明中有關(guān)文件大小的信息。注意,顏色平衡校正仍將對(duì)灰度級(jí)文檔執(zhí)行,因?yàn)閳D像總是被捕獲有顏色。目標(biāo)r、目標(biāo)g、目標(biāo)b文檔的顏色平衡校正——目標(biāo)平均像素紅色、綠色和藍(lán)色,范圍0到255,默認(rèn)220。如果文檔不是大體是白色的,那么這些值就需要被改變,否則它的顏色不能被正確再現(xiàn)。為了確定目標(biāo)值應(yīng)該是多少,利用自然光捕獲文檔圖像,并等待“按壓ent來保存……”提示來出現(xiàn)?,F(xiàn)在按壓c鍵,并且推薦的目標(biāo)均值紅色、綠色和藍(lán)色值將被顯示。如果由于合成圖像不夠尖銳,文檔不能重復(fù)捕獲,則這可能是由于顏色平衡校正刪除了太多文檔細(xì)節(jié),因此在再次嘗試之前,將全部最小文檔圖像銳度值設(shè)置為0,在目標(biāo)顏色值被設(shè)置后,恢復(fù)銳度值。如果具有不同顏色的文檔需要利用相同的簡檔來捕獲,可以通過設(shè)置全部三個(gè)目標(biāo)值為0來禁用顏色平衡校正。閃光燈捕獲處理期間的閃光燈模式,“關(guān)閉”、“自動(dòng)”或者“打開”。默認(rèn)設(shè)置“自動(dòng)”適于多數(shù)情況。然而,如果文檔太亮了,最好設(shè)置閃光燈模式為“關(guān)閉”。如果文檔總是在暗光條件下成像,那么設(shè)置閃光燈模式為“打開”將稍微加速捕獲處理。亮度不用閃光燈的亮度調(diào)整,-2.0、-1.5、-1.0、-0.5、0、0.5、1.0、1.5或2.0之一。默認(rèn)值0通常是合適的,除非文檔包括大面積的黑顏色,在該情況中負(fù)向調(diào)整可以防止文本在較亮面積的“沖掉”。f亮度利用閃光燈的亮度調(diào)整,-2.0、-1.5、-1.0、-0.5、0、0.5、1.0、1.5或2.0之一。默認(rèn)值0通常適于大文檔,但是對(duì)于較小文檔(a5或更小)可能需要負(fù)向調(diào)整,停止由于關(guān)閉閃光燈led帶來的圖像過度曝光。tl銳度、tr銳度、bl銳度、br銳度、cs銳度對(duì)于文檔的左上、右上、左下和右下象限和中間區(qū)域的最小文檔圖像銳度要求,范圍0到100。在捕獲靜止圖像后,首先檢查銳度。如圖18的圖表所示,在文檔的五個(gè)區(qū)域執(zhí)行該檢查。如圖18所示,四個(gè)象限沒有完全擴(kuò)展到文檔圖像邊緣,如果圖像稍微超出了實(shí)際的文檔區(qū)域,并且中間區(qū)域與其它四個(gè)區(qū)域重疊。默認(rèn)值20通常適用,除非文檔在這些區(qū)域中的一個(gè)中包括非常小的細(xì)節(jié)(例如,大多是空白的),在該情況中應(yīng)該減少相應(yīng)銳度值。如果銳度值為0,那么相應(yīng)的區(qū)域?qū)?huì)總是通過檢查。陰影最大文檔圖像陰影量百分比,范圍0到100。默認(rèn)值50通常是適用的,除非文檔具有被誤認(rèn)為陰影的大面積黑色區(qū)域,在這種情況下,該值應(yīng)該被增加。如果陰影值為0,文檔將總是通過檢查。銳化文檔圖像銳化濾波器,“禁用”或“啟用”。默認(rèn)值“啟用”通常適于包括大部分是文本和/或?qū)嵭膱D形的文檔,但是其中文檔包括中間色區(qū)域(通過利用改變大小和間隔的非常小的點(diǎn)來模擬連續(xù)色調(diào)的打印技術(shù)),例如陰影部分或正確成像的照片,禁用濾波器實(shí)際上可以提高圖像質(zhì)量。即使銳化濾波器被啟用,注意,圖像仍必須滿足指定的最小銳化標(biāo)準(zhǔn),之后應(yīng)用濾波器以便被接受。分辨率k個(gè)像素中的文檔圖像分辨率,范圍300到2048,默認(rèn)1024(即,1兆像素)。這可以根據(jù)所要求的圖像分辨率來變化,圖像像素寬度和高度根據(jù)文檔的縱橫比從這個(gè)圖來計(jì)算。注意,盡管由于分辨率從其默認(rèn)值增加到其最大值,合成圖像可能變得不那么尖銳,并且因此最小文檔銳化值可能需要被降低。文件類型文檔圖像將被保存的格式,“低質(zhì)量jpeg”、“中等質(zhì)量jpeg”、“高質(zhì)量jpeg”、“png”或“bmp”。jpeg文件是最小且最快被保存的。png文件比bmp文件要小,但是保存花費(fèi)時(shí)間比bmp要長,特別是對(duì)于彩色圖像。jpeg文件格式被設(shè)計(jì)用于保存全部顏色圖像,因此灰度級(jí)jpeg不會(huì)比等同顏色更小。然而灰度級(jí)bmp和png文件比它們的顏色等同小很多,并且將更快地保存。成像設(shè)備硬件:返回圖2,在具有圖像傳感器的示例性移動(dòng)設(shè)備1000上提供更多細(xì)節(jié),作為支持這里所述的操作的典型硬件平臺(tái)。移動(dòng)設(shè)備1000可以包括透鏡組件250,其可以適于將位于目標(biāo)襯底上的視場1240中的文檔110的圖像聚焦于圖像傳感器陣列1033。移動(dòng)設(shè)備1000和圖像傳感器陣列1033的視場1240可以通過透鏡組件250結(jié)合圖像傳感器陣列1033來定義。圖像傳感器1032可以包括多個(gè)像素圖像傳感器陣列1033,其具有行列像素排列的像素,與列電路1034和行電路1035相關(guān)聯(lián)。與圖像傳感器1032相關(guān)聯(lián)的可以是放大器電路1036(放大器),以及模數(shù)轉(zhuǎn)換器1037,其將從圖像傳感器陣列1033讀出的模擬信號(hào)形式的圖像信息轉(zhuǎn)換為數(shù)字信號(hào)形式的圖像信息。圖像傳感器1032還可以具有相關(guān)聯(lián)的定時(shí)控制電路1038,用于控制例如圖像傳感器1032的曝光期,增益被施加到放大器1036上。在這個(gè)示例性實(shí)施例中,指出的電路組件1032、1036、1037和1038可以打包為公共圖像傳感器集成電路1040。在各種實(shí)施例中,圖像傳感器集成電路1040可以結(jié)合比指出數(shù)量的元件少的元件。在一個(gè)示例性實(shí)施例中,圖像傳感器集成電路1040可以由例如從micron技術(shù)公司獲得的mt9v022(752×480像素陣列)或mt9v023(752×480像素陣列)圖像傳感器集成電路提供。在一個(gè)示例性實(shí)施例中,圖像傳感器集成電路1040可以由從arecontvision獲得的av21052兆像素顏色(1600×1200像素陣列)提供。在一個(gè)示例性實(shí)例中,圖像傳感器集成電路1040可以由從micron技術(shù)公司獲得的mtd001c12stc2兆像素顏色(1600×1200像素陣列)提供。在一個(gè)示例性實(shí)例中,圖像傳感器集成電路1040可以結(jié)合bayer模式濾波器,以便在圖像傳感器陣列的紅色像素位置處定義紅色像素,在綠色像素位置處定義綠色像素,以及在藍(lán)色像素位置處定義藍(lán)色像素。利用這種結(jié)合了bayer模式的圖像傳感器陣列提供的幀能夠包括在紅色像素位置上的紅色像素值,在綠色像素位置上的綠色像素值,以及在藍(lán)色像素位置上的藍(lán)色像素值。在結(jié)合bayer模式圖像傳感器陣列的示例性實(shí)施例中,將幀經(jīng)受進(jìn)一步處理之前的處理器1060可以利用開發(fā)圖像數(shù)據(jù)的單色幀的綠色像素值在綠色像素位置中間的幀像素位置內(nèi)插像素值。在另一個(gè)示例性實(shí)施例中,將幀經(jīng)受進(jìn)一步處理之前的處理器1060可以利用開發(fā)圖像數(shù)據(jù)的單色幀的紅色像素值在紅色像素位置中間內(nèi)插像素值。在另一個(gè)示例性實(shí)施例中,將幀經(jīng)受進(jìn)一步處理之前的處理器1060可以利用藍(lán)色像素值在藍(lán)色像素位置中間內(nèi)插像素值。在操作移動(dòng)設(shè)備1000的過程中,圖像信號(hào)可以從圖像傳感器1032讀出,轉(zhuǎn)換,并存儲(chǔ)到系統(tǒng)存儲(chǔ)器,例如ram1080。在各種實(shí)施例中,移動(dòng)設(shè)備1000可以包括一個(gè)或多個(gè)存儲(chǔ)器元件1085,其可以示例性包括ram1080,非易失性存儲(chǔ)器例如eprom1082,存儲(chǔ)器存儲(chǔ)設(shè)備1084,以及各種其它類型的存儲(chǔ)器元件的任意一種。在示例性實(shí)施例中,存儲(chǔ)器存儲(chǔ)設(shè)備1084可以示例性是或者包括閃存、硬盤驅(qū)動(dòng)器、任意類型的ram、eprom、eeprom、dvd-rom、cd-rom或其它類型的rom、光盤、磁盤、磁盒、磁帶、或者任意其它類型的易失性或非易失性或者可移動(dòng)或非可移動(dòng)存儲(chǔ)器或數(shù)據(jù)存儲(chǔ)器元件。在各種示例性實(shí)施例中,移動(dòng)設(shè)備1000可以包括處理器1060,適于讀出存儲(chǔ)在存儲(chǔ)器1080中的圖像數(shù)據(jù),并將這種圖像數(shù)據(jù)經(jīng)受各種圖像處理算法。例如,根據(jù)各種實(shí)施例,一個(gè)或多個(gè)處理器1060可以示例性是或者包括中央處理單元(cpu)、復(fù)雜可編程邏輯設(shè)備(cpld)、特定用途集成電路(asic)、現(xiàn)場可編程門陣列(fpga),或任意類型的能夠處理邏輯操作的電路。在各種實(shí)施例中,移動(dòng)設(shè)備1000可以包括提供總線仲裁的系統(tǒng)總線1500,其可以包括使用任意的各種結(jié)構(gòu)的任意各種總線結(jié)構(gòu),例如存儲(chǔ)器總線或者存儲(chǔ)器控制器,外圍總線,或者本地總線。在各種實(shí)施例中,例如,這可以包括外圍元件互連(pci)或者夾層總線,工業(yè)標(biāo)準(zhǔn)結(jié)構(gòu)(isa)總線,增強(qiáng)工業(yè)標(biāo)準(zhǔn)結(jié)構(gòu)(eisa)總線,微通道結(jié)構(gòu)(mca)總線,視頻電子標(biāo)準(zhǔn)協(xié)會(huì)(vesa)總線,或其它總線結(jié)構(gòu)。在各種實(shí)施例中,移動(dòng)設(shè)備1000可以包括直接存儲(chǔ)器存取單元(dma)1070,用于將已經(jīng)經(jīng)受轉(zhuǎn)換的從圖像傳感器1032讀出的圖像信息路由到ram1080。在圖像傳感器1032和ram1080之間提供有效數(shù)據(jù)傳送的系統(tǒng)總線結(jié)構(gòu)和/或直接存儲(chǔ)器存取元件的其它實(shí)施例可以包括在各種實(shí)施例中。在本公開的示例性計(jì)算系統(tǒng)中的服務(wù)器2000、服務(wù)器3000或其它計(jì)算元件可以類似地包括任意各種一個(gè)或多個(gè)處理器、一個(gè)或多個(gè)存儲(chǔ)器元件、一個(gè)或多個(gè)系統(tǒng)總線或者其它數(shù)據(jù)通信元件,和其它元件。在不同實(shí)施例中,系統(tǒng)5000的存儲(chǔ)器可以包括任意移動(dòng)設(shè)備1000、服務(wù)器2000、服務(wù)器3000或計(jì)算和/或網(wǎng)絡(luò)環(huán)境中的其它元件的存儲(chǔ)器。在各種實(shí)施例中,移動(dòng)設(shè)備1000可以包括照明子系統(tǒng)800,用于目標(biāo)區(qū)域的照明和照明模式1260的投射。例如,照明子系統(tǒng)800可以示例性包括一個(gè)或多個(gè)led閃光燈、一個(gè)或多個(gè)持續(xù)led燈、一個(gè)或多個(gè)氙閃光管、或其它照明元件。在各種實(shí)施例中,示例性移動(dòng)設(shè)備還可以缺少照明子系統(tǒng)800。在圖1和2所示的實(shí)施例中,例如,照明模式1260可以投射到大約是但是比視場1240定義的區(qū)域大的區(qū)域上,但是還可以投射在比視場1240定義的區(qū)域小的區(qū)域。在各種實(shí)施例中,照明子系統(tǒng)800還可以包括照明透鏡組件300,如圖2的實(shí)施例中所示。除了或者代替照明透鏡組件300,照明子系統(tǒng)800可以包括可替代的光成型光學(xué)裝置,例如一個(gè)或多個(gè)擴(kuò)散器、反射鏡和棱境。在使用中,移動(dòng)設(shè)備1000可以以這樣的方式通過操作者針對(duì)包括承載可解碼標(biāo)記120的文檔110的目標(biāo)區(qū)域定向,即將照明模式1260投射到可解碼標(biāo)記120上的方式??山獯a標(biāo)記120可以包括任意類型的字符、符號(hào)、或其它易于被解碼的視覺可檢測特征。這可以包括通過任意各種光學(xué)字符識(shí)別(ocr)技術(shù)解碼的字符和/或數(shù)字,或者一維或二維條碼符號(hào),如示例性實(shí)施例。參考移動(dòng)設(shè)備1000的另外方面,透鏡組件250可以使用電能輸入單元1202控制。在一個(gè)實(shí)施例中,電能輸入單元1202可以操作為受控的電壓源,并且在另一個(gè)實(shí)施例中,作為受控的電流源。照明模式光源組件500可以利用光源控制電路1206控制。光源控制電路1206可以發(fā)送信號(hào)到照明模式光源組件500,例如通過照明模式光源組件500改變照明輸出的等級(jí)。移動(dòng)設(shè)備1000的某些元件,例如圖像傳感器集成電路1040(和圖像傳感器陣列1033)、成像透鏡240、和照明子系統(tǒng)800可以打包成成像模塊400,其可以結(jié)合在手持外殼1014中。在另一個(gè)示例性實(shí)施例中,移動(dòng)設(shè)備可以沒有照明子系統(tǒng)。在這個(gè)示例性實(shí)施例中,移動(dòng)設(shè)備1000可以包括多個(gè)外圍設(shè)備,示例性包括觸發(fā)器1220,其可以用于使用于激活幀讀出和/或某種解碼處理的觸發(fā)信號(hào)有效。移動(dòng)設(shè)備1000可以被適配以便激活觸發(fā)器1220激活觸發(fā)信號(hào),并開始解碼嘗試。特別的,移動(dòng)設(shè)備1000可以是可操作的以便響應(yīng)于激活觸發(fā)信號(hào),可以采用從圖像傳感器陣列1033讀出圖像信息的方式捕獲連續(xù)的幀(典型的模擬信號(hào)的形式),并接著在轉(zhuǎn)換后將圖像信息存儲(chǔ)到存儲(chǔ)器1080(其可以在給定時(shí)間緩沖一個(gè)或多個(gè)連續(xù)的幀)。處理器1060可以是可操作的使一個(gè)或多個(gè)連續(xù)的幀經(jīng)受解碼嘗試。在另一個(gè)示例性實(shí)施例中,移動(dòng)設(shè)備1000可以缺少解碼功能。在一個(gè)示例性實(shí)施例中,包括透鏡組件250和圖像傳感器集成電路1040的成像組件900的元件可以在移動(dòng)設(shè)備1000中復(fù)制,每個(gè)復(fù)制的成像組件900可以結(jié)合在手持外殼1014中,每個(gè)可以采取圖2所示的成像組件900的方式與系統(tǒng)總線1500和處理器1060連接。在這個(gè)示例性實(shí)施例中,成像組件900的一個(gè)可以被優(yōu)化用來解碼可解碼標(biāo)記,并且其它的成像組件900可以被優(yōu)化用來捕獲和保存圖像數(shù)據(jù)幀和圖像數(shù)據(jù)幀中的特征表示。在示例性實(shí)施例中,為了試圖解碼條碼符號(hào),例如一維條碼符號(hào),系統(tǒng)5000的處理器(例如,移動(dòng)設(shè)備1000的處理器1060)可以處理對(duì)應(yīng)于像素位置行的幀的圖像數(shù)據(jù)(例如,行、列或像素位置的對(duì)角集合),來確定黑色和亮色單元的空間模式,且可以將每個(gè)確定的亮色和黑色單元模式通過查找表轉(zhuǎn)換為字符或者字符串。在這個(gè)示例性實(shí)施例中,在可解碼標(biāo)記表示是二維條碼符號(hào)的情況下,解碼嘗試可以包括步驟:利用特征檢測算法定位探測器模式,根據(jù)與探測器模式的預(yù)定關(guān)系定位與探測器模式相交的矩形行,確定沿著矩形行的黑色和亮色單元的模式,以及通過查找表將每個(gè)亮色模式轉(zhuǎn)換為字符或者字符串。移動(dòng)設(shè)備1000可以包括各種接口電路,用于將各種外圍設(shè)備耦合到系統(tǒng)地址/數(shù)據(jù)總線(系統(tǒng)總線)1500,用于與同樣耦合到系統(tǒng)總線1500的處理器1060通信。移動(dòng)通信1000可以包括接口電路1028,用于將圖像傳感器定時(shí)和控制電路1038耦合到系統(tǒng)總線1500;接口電路1102,用于將電能輸入電源1202耦合到系統(tǒng)總線1500;接口電路1106,用于將照明光源組控制電路1206耦合到系統(tǒng)總線1500;以及接口電路1120,用于將觸發(fā)器1220耦合到系統(tǒng)總線1500。移動(dòng)設(shè)備1000還可以包括耦合到系統(tǒng)總線1500并通過接口1122與處理器1060通信的顯示器1222;還包括通過連接到系統(tǒng)總線1500的接口1124與處理器1060通信的指示機(jī)構(gòu)1224。移動(dòng)設(shè)備1000還可以包括耦合到系統(tǒng)總線1500的鍵盤1226。鍵盤1226可以通過連接到系統(tǒng)總線1500的接口1126與處理器1060通信。移動(dòng)設(shè)備1000還可以包括通過接口1108與系統(tǒng)總線1500耦合的范圍檢測器單元1208。移動(dòng)設(shè)備1000可以用稱為幀速率的速率捕獲圖像數(shù)據(jù)的幀。典型的幀速率是60幀每秒(fps),其被轉(zhuǎn)換為16.6ms的幀時(shí)間(幀時(shí)期)。另一種典型的幀速率是30幀每秒(fps),其被轉(zhuǎn)換為每幀33.3ms的幀時(shí)間(幀時(shí)期)。移動(dòng)設(shè)備1000的幀速率可以通過降低幀圖片大小來增加(以及幀時(shí)間減少)。示例性實(shí)施例可以使用av2105圖像傳感器集成電路,其中最大分辨率圖片大小(1600×1200)可以被選擇,這可能產(chǎn)生24fps的幀速率。hdtv窗口圖片大小(1280×1024)的選擇可能產(chǎn)生32fps的幀速率。利用mt9d001c12stc圖像傳感器集成電路,最大分辨率圖片大小(1600×1200)可以被選擇,其可能產(chǎn)生20fps的幀速率。sxga窗口圖片大小的選擇可能產(chǎn)生28fps的幀速率。在一個(gè)示例性實(shí)施例中的移動(dòng)設(shè)備1000的示例性物理形式視圖在圖1中示出。觸發(fā)器1220、顯示器1222、指示機(jī)構(gòu)1224和鍵盤1226可以布置在圖1所示的手持外殼1014的公共面。在一個(gè)實(shí)施例中的顯示器1222、指示機(jī)構(gòu)1224和鍵盤1226可以被認(rèn)為是移動(dòng)設(shè)備1000的用戶接口或用戶輸入/輸出元件。在一個(gè)實(shí)施例中的顯示器1222可以結(jié)合觸摸板,用于導(dǎo)航和虛擬激勵(lì)器選擇,在該情況中移動(dòng)設(shè)備1000的用戶接口可以由顯示器1222提供。移動(dòng)設(shè)備1000的用戶接口還可以通過配置移動(dòng)設(shè)備1000是可操作的以通過解碼編程條碼符號(hào)被再編程來提供。移動(dòng)設(shè)備1000的手持外殼1014可以在另一個(gè)實(shí)施例中缺少顯示器,且采取槍風(fēng)格形式因素。這里描述的圖像處理步驟可以分布在移動(dòng)設(shè)備1000、服務(wù)器2000和/或3000,且一個(gè)實(shí)施例完全可以通過移動(dòng)設(shè)備1000來執(zhí)行。在這種實(shí)施例中,系統(tǒng)5000可以被認(rèn)為由移動(dòng)設(shè)備1000提供。這里所述的示例性設(shè)備、系統(tǒng)、裝置或方法的小例子如下:a1、一種設(shè)備,包括:成像子系統(tǒng),能夠提供表示入射在所述成像子系統(tǒng)上的光的圖像數(shù)據(jù);一個(gè)或多個(gè)存儲(chǔ)器元件,包括至少一個(gè)緩沖存儲(chǔ)器元件,可操作地啟用以臨時(shí)存儲(chǔ)圖像數(shù)據(jù);以及一個(gè)或多個(gè)處理器,被啟用來:從一個(gè)或多個(gè)存儲(chǔ)器元件中的至少第一存儲(chǔ)器元件接收?qǐng)D像數(shù)據(jù);嘗試在圖形數(shù)據(jù)中識(shí)別定義候選四邊形形狀的線性特征;以及經(jīng)由一個(gè)或多個(gè)輸出組件提供用戶可感知暗示,用于指導(dǎo)用戶改變?cè)O(shè)備的定位,以增強(qiáng)在圖像數(shù)據(jù)中識(shí)別定義候選四邊形形狀的線性特征的能力。a2、如a1的設(shè)備,其中一個(gè)或多個(gè)輸出組件包括預(yù)覽監(jiān)視器,啟用來顯示基于圖像數(shù)據(jù)的預(yù)覽圖像,其中一個(gè)或多個(gè)處理器進(jìn)一步啟用來提供用戶可感知暗示作為顯示在預(yù)覽圖像上的暗示圖標(biāo)。a3、如a2的設(shè)備,其中一個(gè)或多個(gè)處理器還啟用成使得暗示圖標(biāo)包括在監(jiān)視器上對(duì)應(yīng)于被識(shí)別的線性特征的蹤跡。a4、如a3的設(shè)備,其中一個(gè)或多個(gè)處理器進(jìn)一步啟用成使得監(jiān)視器上對(duì)應(yīng)于被識(shí)別的線性特征的蹤跡從第一顏色變?yōu)榈诙伾员硎緦?duì)由被識(shí)別的線性特征定義的候選四邊形形狀的成功識(shí)別。a5、如a4的設(shè)備,其中一個(gè)或多個(gè)存儲(chǔ)器元件還包括第二存儲(chǔ)器元件,其中一個(gè)或多個(gè)處理器還被啟用來向用戶提示,以指示對(duì)應(yīng)于被識(shí)別的候選四邊形形狀的高分辨率圖像是否應(yīng)該被存儲(chǔ)在第二存儲(chǔ)器元件中,其中高分辨率圖像具有比預(yù)覽圖像更高的分辨率;以及如果用戶這么指示,那么將對(duì)應(yīng)于被識(shí)別的候選四邊形形狀的高分辨率圖像存儲(chǔ)在第二存儲(chǔ)器元件中。a6、如a4的設(shè)備,其中一個(gè)或多個(gè)存儲(chǔ)器元件還包括第二存儲(chǔ)器元件,其中一個(gè)或多個(gè)處理器還啟用來通過將對(duì)應(yīng)于被識(shí)別的候選四邊形形狀的高分辨率圖像存儲(chǔ)在第二存儲(chǔ)器元件中,來響應(yīng)候選四邊形形狀的成功識(shí)別,其中高分辨率圖像具有比預(yù)覽圖像更高的分辨率。a7、如a2的設(shè)備,其中一個(gè)或多個(gè)處理器進(jìn)一步啟用成使得暗示圖標(biāo)包括在監(jiān)視器上顯示的直線指示符,其指示對(duì)設(shè)備的平移再定位的方向。a8、如a2的設(shè)備,其中一個(gè)或多個(gè)處理器進(jìn)一步啟用成使得暗示圖標(biāo)包括在監(jiān)視器上顯示的距離指示符,指示將設(shè)備再定位更接近或者遠(yuǎn)離目標(biāo)的方向。a9、如a2的設(shè)備,其中一個(gè)或多個(gè)處理器進(jìn)一步啟用成使得暗示圖標(biāo)包括在監(jiān)視器上顯示的指示符,其指示旋轉(zhuǎn)設(shè)備的方向。a10、如a2的設(shè)備,其中一個(gè)或多個(gè)處理器進(jìn)一步啟用成使得暗示圖標(biāo)包括在監(jiān)視器上顯示的過度移動(dòng)指示符,其指示成像系統(tǒng)和/或候選四邊形形式的至少一個(gè)顯示干擾識(shí)別定義候選四邊形形狀的線性特征能力的過度移動(dòng)。a11、如a2的設(shè)備,其中一個(gè)或多個(gè)處理器進(jìn)一步啟用成使得暗示圖標(biāo)包括在監(jiān)視器上顯示的部分陰影指示符,其指示明顯的部分陰影模糊了候選四邊形形狀。a12、如a2的設(shè)備,其中一個(gè)或多個(gè)處理器進(jìn)一步啟用成使得嘗試在圖像數(shù)據(jù)中識(shí)別定義候選四邊形形狀的線性特征包括:基于圖像數(shù)據(jù)的輸入幀,生成降低分辨率的幀,該降低分辨率的幀包括比輸入幀更少的像素,其中在降低分辨率的幀中的像素組合了來自輸入幀中的兩個(gè)或多個(gè)像素的信息;在監(jiān)視器上顯示降低分辨率的幀作為預(yù)覽圖像;以及嘗試在降低分辨率的幀中識(shí)別定義候選四邊形形狀的線性特征。a13、如a12的設(shè)備,其中一個(gè)或多個(gè)處理器進(jìn)一步啟用成使得嘗試在圖像數(shù)據(jù)中識(shí)別定義候選四邊形形狀的線性特征包括:嘗試識(shí)別過渡對(duì),包括在具有像素之間的差值超出了像素過渡閾值的降低分辨率的幀中的相鄰像素對(duì),其;嘗試在兩個(gè)或多個(gè)被識(shí)別的過渡對(duì)之間降低分辨率的幀中識(shí)別一個(gè)或多個(gè)線性特征;以及提供降低分辨率的幀的一個(gè)或多個(gè)被識(shí)別的線性特征的指示。a14、如a13的設(shè)備,其中一個(gè)或多個(gè)處理器進(jìn)一步啟用成使得嘗試在圖像數(shù)據(jù)中識(shí)別定義候選四邊形形狀的線性特征包括:將連續(xù)被識(shí)別的像素過渡連接到被識(shí)別的行段中,識(shí)別相互大致成一行的行段的集合,以及將被識(shí)別的成一行的行段的集合合并到被識(shí)別的線性特征中;測量被識(shí)別的線性特征之間的角度;評(píng)估被測量的角度是否在大約90度的限制傾斜值中,如果是,則將線性特征的交叉點(diǎn)識(shí)別為被識(shí)別的角點(diǎn);評(píng)估具有四個(gè)角點(diǎn)的四個(gè)線性特征是否被識(shí)別,如果未被識(shí)別,則在預(yù)覽監(jiān)視器上提供暗示圖標(biāo),以指導(dǎo)用戶改變?cè)O(shè)備的定位,從而增強(qiáng)識(shí)別具有四個(gè)角點(diǎn)的四個(gè)線性特征的能力。a15、一種利用一個(gè)或多個(gè)處理器執(zhí)行的方法,包括:從成像組件接收?qǐng)D像數(shù)據(jù)幀;利用至少一個(gè)處理器,基于輸入幀生成降低分辨率的幀,該降低分辨率的幀包括比輸入幀更少的像素,其中,在降低分辨率的幀中的多個(gè)像素的每一個(gè)像素組合了來自輸入幀中的兩個(gè)或多個(gè)像素的信息;利用至少一個(gè)處理器,嘗試在圖像數(shù)據(jù)中識(shí)別定義候選四邊形形狀的線性特征;以及利用至少一個(gè)處理器,確定圖形操作者暗示圖標(biāo),用來指導(dǎo)用戶改變成像設(shè)備的定位,以增強(qiáng)在隨后的圖像數(shù)據(jù)中識(shí)別定義候選四邊形形狀的線性特征的能力;以及通過輸出組件提供圖形操作者暗示圖標(biāo)。a16、如a15的方法,其中,該方法還包括在預(yù)覽監(jiān)視器上提供降低分辨率的幀的圖像和圖形操作者指導(dǎo)圖標(biāo),且圖形操作者指導(dǎo)圖標(biāo)是從以下選擇:指示對(duì)成像組件的平移再定位的方向的直線指示符;指示設(shè)備向前或向后再定位的方向的距離指示符;指示旋轉(zhuǎn)設(shè)備的方向的曲線指示符;指示圖像數(shù)據(jù)展示過度運(yùn)動(dòng)的過度運(yùn)動(dòng)指示符;以及指示明顯部分陰影模糊了候選四邊形形狀的部分陰影指示符。a17、一種包括能夠使能一個(gè)或多個(gè)計(jì)算組件的可執(zhí)行指令的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),包括一個(gè)或多個(gè)存儲(chǔ)器,用于:接收?qǐng)D像數(shù)據(jù)的第一幀;嘗試在圖像數(shù)據(jù)的第一幀中識(shí)別定義候選四邊形形狀的線性特征;以及提供用戶可感知暗示,用于指導(dǎo)用戶改變?cè)O(shè)備的定位,來增強(qiáng)在隨后的圖像數(shù)據(jù)幀中識(shí)別定義候選四邊形形狀的線性特征的能力。a18、如a17的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中可執(zhí)行指令還能夠使能一個(gè)或多個(gè)計(jì)算組件用于:存儲(chǔ)多個(gè)用于用戶可感知暗示的圖形圖標(biāo);評(píng)估圖像數(shù)據(jù)是非優(yōu)化的一個(gè)或多個(gè)原因;選擇一個(gè)或多個(gè)圖形圖標(biāo),用于解決圖像數(shù)據(jù)是非優(yōu)化的一個(gè)或多個(gè)被評(píng)估的原因;以及在預(yù)覽監(jiān)視器上顯示一個(gè)或多個(gè)選擇的圖形圖標(biāo),還顯示候選四邊形形狀。a19、如a18的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中可執(zhí)行指令還能夠使能一個(gè)或個(gè)多計(jì)算組件從以下選擇:指示對(duì)成像組件的平移再定位的方向的直線指示符圖形圖標(biāo);指示設(shè)備向前或向后再定位的方向的距離指示符圖形圖標(biāo);指示旋轉(zhuǎn)設(shè)備的方向的曲線指示符圖形圖標(biāo);指示圖像數(shù)據(jù)展示過度運(yùn)動(dòng)的過度運(yùn)動(dòng)指示符圖形圖標(biāo);以及指示明顯部分陰影模糊了候選四邊形形狀的部分陰影指示符圖形圖標(biāo)。盡管已經(jīng)參考多個(gè)特定實(shí)施例描述了本發(fā)明,應(yīng)該理解,本發(fā)明的真實(shí)精神和范圍應(yīng)該僅僅針對(duì)本說明書支持的權(quán)利要求來確定。此外,盡管在這里的多種情況下,其中系統(tǒng)和裝置和方法被描述為具有某些數(shù)量的組件,應(yīng)該理解,這樣的系統(tǒng)、裝置和方法可以采用比所述某些數(shù)量的組件更少或更多來實(shí)現(xiàn)。同樣,雖然已經(jīng)描述了多個(gè)特定實(shí)施例,應(yīng)該理解,已經(jīng)描述的關(guān)于每個(gè)特定實(shí)施例的特征和方面可以用于每個(gè)保留的特定描述的實(shí)施例。當(dāng)前第1頁12當(dāng)前第1頁12