欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

掃描文件的多色彩舍去的制作方法

文檔序號(hào):6476515閱讀:202來源:國(guó)知局
專利名稱:掃描文件的多色彩舍去的制作方法
技術(shù)領(lǐng)域
本發(fā)明一般地涉及掃描文件圖像的圖像處理,并且更特別地涉及用 于從圖像中識(shí)別并移除色彩內(nèi)容的方法。
背景技術(shù)
在制造掃描環(huán)境中,掃描文件可具有與來自該文件的所需數(shù)據(jù)無關(guān) 的色彩內(nèi)容。例如,預(yù)先印刷的申請(qǐng)表、稅務(wù)表和其它文件可包含表格 色彩區(qū)域,包括印刷的指令、線、方框或者將文件用戶指引到需要人工 錄入的范圍的符號(hào),其中所錄入的信息典型地采用鉛筆或者深色墨水。 許多類型的預(yù)先印刷的表格使用預(yù)先印刷的位置標(biāo)記以用于字符錄入, 從而將所錄入的字符或其它標(biāo)記限于特定的位置和大小。這種位置標(biāo)記
識(shí)(OCR)掃描。
出于清楚說明的目的,本申請(qǐng)使用術(shù)語"表格色彩"來識(shí)別可以從 掃描表格或其它文件的掃描圖像數(shù)據(jù)中忽略和"舍去"的色彩內(nèi)容。表 格色彩是非中性的,從而對(duì)應(yīng)于表格色彩的紅色(R)、綠色(G)和藍(lán) 色(B)數(shù)據(jù)值互不相同。在掃描表格或其它文件上感興趣的數(shù)據(jù)是深 色中性數(shù)據(jù),在本申請(qǐng)中以術(shù)語"中性色數(shù)據(jù),,表示。中性色數(shù)據(jù)表示 任何用戶錄入的文本標(biāo)記(例如那些可能已經(jīng)用鋼筆或鉛筆在表格上所 做出的標(biāo)記),或者錄入到表格或文件中的印刷數(shù)據(jù)。在許多應(yīng)用中, 使用光符辨識(shí)(OCR)或其它工具來進(jìn)一步處理從表格或其它文件掃描 的中性色數(shù)據(jù)。術(shù)語"背景色彩"具有作為術(shù)語用于文件掃描領(lǐng)域的傳 統(tǒng)意義。即,背景色彩一般是在上面錄入或印刷文本或表格內(nèi)容的介質(zhì) 的色彩。典型地,中性色彩(例如大多數(shù)情況下是白色或偏白色)的背 景色彩也可以是非中性色彩,例如在將文件印刷在有色紙或其它彩色介 質(zhì)的情況下。在黑白兩色掃描中,例如,優(yōu)選將背景色彩偏移為白色或 很淺的灰色,以提高背景與文本或表格色彩內(nèi)容之間的對(duì)比度。
為了更有效地存儲(chǔ)和處理這種掃描文件,從掃描文件圖像數(shù)據(jù)移除非所需的表格色彩是有用的。傳統(tǒng)上,已采用若干方式來實(shí)行這種做法。 用于掃描預(yù)先印刷文件(例如表格)的若干方法使用預(yù)先已知的關(guān)于該 預(yù)先印刷文件自身的頻諉內(nèi)容的信息,并且使用適當(dāng)調(diào)試以消除該頻譜
內(nèi)容的掃描硬件。例如,再公告專利RE29, 104 (Shepard)利用經(jīng)調(diào)試 的激光掃描器單元以掃描文件,其中激光的波長(zhǎng)與文件上標(biāo)記的色彩相 匹配,從而從標(biāo)記反射的光與從文件背景反射的光具有相同的強(qiáng)度。預(yù) 先印刷的字符位置標(biāo)記因而是"盲區(qū)(blinded)"并且不會(huì)干擾字符的 讀取。在其它方法中,同樣在預(yù)知預(yù)先印刷的表格上所期望的色彩情況 下采用各種類型的濾光器。
用于將感興趣的中性色數(shù)據(jù)從表格色彩分離的其它方法在色彩數(shù) 據(jù)自身上進(jìn)行操作。例如,美國(guó)專利NO. 5, 335, 292 (Lovelady等)說明
了將色彩數(shù)據(jù)重新映射到背景,其有效地使文件上的非所需色彩變?yōu)?0CR系統(tǒng)的"盲區(qū)",其中同樣預(yù)先已知該色彩。還可以使用訓(xùn)練,從而 掃描系統(tǒng)"學(xué)會(huì)"如何處理文件集。然而,訓(xùn)練具有若干缺陷。例如, 對(duì)于訓(xùn)練需要分離的訓(xùn)練操作與工具。訓(xùn)練應(yīng)用在色彩方面具有限制, 并且在許多情況下, 一般只有在所掃描的文件在紅色、綠色或藍(lán)色色彩 通道之一中具有高階內(nèi)容時(shí)才運(yùn)作良好。訓(xùn)練不僅耗時(shí),而且還需要適 當(dāng)?shù)牟僮髡咴趫?chǎng)以檢查并驗(yàn)證結(jié)果。
那些諸如所述的解決方式可以用于在預(yù)先已知非所需的表格色彩 或色彩的情況下移除表格色彩內(nèi)容。然而,這些解決方式限制任何掃描 系統(tǒng)的色彩舍去,從而使其僅可用于特定的文件集。在采用硬件解決方 式(例如濾色器或者使用具有特定波長(zhǎng)的掃描光的硬件解決方式)的情 況下,掃描光學(xué)系統(tǒng)與文件相匹配,從而色彩舍去僅可用于具有特定色 彩的文件。針對(duì)特定表格色彩進(jìn)行檢查的圖像處理解決方式相似地受 限,即使這種系統(tǒng)可以被更簡(jiǎn)單地"重新訓(xùn)練"或者重新編程以識(shí)別和 移除其它色彩。盡管如此,尋找特定表格色彩或色彩集的解決方式不提 供可以與大范圍的具有色彩內(nèi)容的文件共同使用的靈活的解決方式。這 可對(duì)工作流程具有不利影響,例如,因?yàn)槠湫枰獙?duì)具有不同表格色彩的 文件進(jìn)行手工分類以將這些文件指向不同的掃描系統(tǒng)。其它更復(fù)雜的問 題包括墨水批次與印刷量(print run)之間的差異,這導(dǎo)致屬于相同 類型但不同時(shí)或不在相同位置印刷的文件的頻鐠內(nèi)容方面的偏差。
為嘗試提供更靈活的色彩探測(cè)和舍去方案,美國(guó)專利No. 7, 085, 413 (Huang等)說明了對(duì)從掃描文件獲得的色彩直方圖的使 用,其中如果主要色彩超過了臨界亮度,則可對(duì)該主要色彩進(jìn)行識(shí)別和 移除。該類型的方法至少比前面說明的需要已知非所需色彩的方法更具 動(dòng)態(tài)性。然而,Huang等'413公開中所述的方法以及移除整個(gè)色彩通 道以便于移除非所需的表格色彩的類似方法存在從掃描數(shù)據(jù)中舍棄所 需信息的風(fēng)險(xiǎn)并提供有限的性能,特別是在表格色彩和色彩內(nèi)容之間的 差異可能變化很大的情況下。在文件具有大量色彩內(nèi)容(例如至少占一 半面積的單一色彩)的情況下,或者在將文件提供于有色紙料上的情況 下,可接收這種解決方式。然而,這種方法不適合掃描具有某一小量的 色彩內(nèi)容或者可能具有多種色彩的文件。
理想情況下,色彩舍去方案將灰階中性色數(shù)據(jù)內(nèi)容保留在文件中, 例如鉛筆標(biāo)記或鋼筆標(biāo)記或錄入的深色文本內(nèi)容(例如來自印刷機(jī)), 從而可以將該內(nèi)容存儲(chǔ)或用于進(jìn)一步的處理,例如用于0CR處理或標(biāo)記 感測(cè)應(yīng)用??山邮艿纳噬崛シ桨笗?huì)舍棄非所需的表格色彩,將一個(gè)或 多個(gè)表格色彩的色彩像素舍去到該文件的背景中,而不會(huì)損害該中性色 數(shù)據(jù)的質(zhì)量。此外,掃描系統(tǒng)具有如下色彩舍去方法會(huì)極為有利自動(dòng) 調(diào)試用于具有不同背景色彩的紙料、在每個(gè)掃描文件上獨(dú)立地識(shí)別表格 色彩內(nèi)容,以及采取所需步驟來移除表格色彩而同時(shí)保留作為中性色數(shù) 據(jù)所提供的所需信息。

發(fā)明內(nèi)容
本發(fā)明的目的是提供移除表格色彩而不會(huì)使中性色彩數(shù)據(jù)明顯丟 失的文件掃描方法。鑒于該目的,本發(fā)明提供一種用于從文件的掃描圖 像數(shù)據(jù)中移除非所需表格色彩內(nèi)容的方法,該方法包括
a) 獲取以色彩數(shù)據(jù)格式的掃描文件圖像數(shù)據(jù);
b) 將該圖像數(shù)據(jù)分割成兩個(gè)或更多方塊(tile);
c) 將每個(gè)方塊根據(jù)其背景和色彩內(nèi)容的組合而分類成至少第一集 和第二集;
d) 從第一方塊集中識(shí)別背景色彩;
e) 從第二方塊集中識(shí)別至少一個(gè)表格色彩;并且
f) 應(yīng)用使表格色彩圖像數(shù)據(jù)值向背景色彩值偏移的變換。 從另一方面,本發(fā)明提供了一種用于從文件的掃描圖像數(shù)據(jù)中移除非所需表格色彩內(nèi)容的方法,該方法包括
a) 獲取以色彩數(shù)據(jù)格式的掃描文件圖像數(shù)據(jù);
b) 將該圖像數(shù)據(jù)分割成兩個(gè)或更多方塊;
c) 將每個(gè)方塊通過其色彩內(nèi)容利用以下步驟特征化
(i) 針對(duì)該方塊內(nèi)的紅色色彩值生成紅色直方(ii) 針對(duì)該方塊內(nèi)的綠色色彩值生成綠色直方(iii) 針對(duì)該方塊內(nèi)的藍(lán)色色彩值生成藍(lán)色直方(iv) 根據(jù)紅色、綠色和藍(lán)色直方圖分布來確定,該方塊是否主 要包含中性色背景內(nèi)容,或者主要包含表格色彩內(nèi)容,或者背景和色彩 內(nèi)容的組合;
d) 根據(jù)主要具有中性色背景內(nèi)容的方塊來識(shí)別背景色彩;
e) 根據(jù)主要具有表格色彩內(nèi)容的方塊來識(shí)別至少一個(gè)表格色彩;
f) 將具有該至少一個(gè)表格色彩的像素選擇性地變換到背景色彩。 本發(fā)明的特征是,其對(duì)每個(gè)掃描文件的色彩內(nèi)容進(jìn)行個(gè)別分析,然
后確定哪個(gè)色彩或者哪些色彩是要移除的表格色彩內(nèi)容。
本發(fā)明的優(yōu)點(diǎn)是,其不要求預(yù)先知道表格色彩以用于訓(xùn)練,但是動(dòng)
態(tài)地應(yīng)用色彩處理工具以識(shí)別表格色彩內(nèi)容并將該內(nèi)容變換到背景。 在結(jié)合附圖閱讀以下詳細(xì)說明的情況下,本發(fā)明的這些和其它目的、特征和優(yōu)點(diǎn)將對(duì)那些本領(lǐng)域中的技術(shù)人員變得明顯,在所述附圖中
示出并說明本發(fā)明的示例性實(shí)施例。


雖然本說明書最后的權(quán)利要求書特別指出并清楚地主張本發(fā)明主 題的權(quán)利要求,但是相信可以從下述說明并結(jié)合附圖來更好地理解本發(fā) 明,其中
圖l是示出色彩舍去方法的基本步驟的邏輯流程圖; 圖2是示出在子采樣和方塊直方圖分析中所使用的程序序列的邏輯 流程圖3A和3B示出在一個(gè)實(shí)施例的數(shù)據(jù)轉(zhuǎn)換和分析中所使用的步驟序
列;
圖4示出根據(jù)一個(gè)實(shí)施例根據(jù)色彩和背景內(nèi)容特征對(duì)圖像的掃描方 塊的分配。圖5示出將數(shù)據(jù)中的一些從RGB到HSV的示例轉(zhuǎn)換; 圖6是系數(shù)計(jì)算和應(yīng)用的邏輯流程圖;以及 圖7是示出方塊利用和子采樣的平面圖。
具體實(shí)施例方式
本說明書特別指向形成依照本發(fā)明的設(shè)備的部分或者與該設(shè)備更 直接地配合的元件。應(yīng)該理解,未具體示出或說明的元件可采取為本領(lǐng) 域的技術(shù)人員所熟知的各種形式。
本發(fā)明的方法可以從掃描圖像數(shù)據(jù)移除所有表格色彩,在所產(chǎn)生的 灰階圖像中只留下中性色彩。即,使用本發(fā)明的方法,可以使一個(gè)或多 個(gè)表格色彩向文件的背景色彩實(shí)質(zhì)偏移,即向(典型地是白色或很淺的 中性色的)頁面色彩偏移。該表格色彩變換用對(duì)中性色數(shù)據(jù)的最小影響 實(shí)現(xiàn),所述中性色數(shù)據(jù)包含文件已經(jīng)被掃描的信息內(nèi)容。與傳統(tǒng)解決方 式不同,不需要對(duì)掃描系統(tǒng)進(jìn)行預(yù)先"訓(xùn)練,,或者預(yù)知表格或背景色彩。 作為該方法的結(jié)果,非所需表格色彩舍去到背景中,而同時(shí)保留所需中 性色數(shù)據(jù)。在該處理之后,則可將文件數(shù)據(jù)用于光符辨識(shí)(OCR)邏輯 處理、標(biāo)記感測(cè)探測(cè)處理,或者從文件中獲得"中性色數(shù)據(jù)"(更確切 地說是從文件的中性色彩部分獲得數(shù)據(jù))的其它處理。
為了實(shí)現(xiàn)這個(gè)目的,本發(fā)明的方法典型地使用減小的分辨率或子采 樣圖像來工作,以簡(jiǎn)單地減少必須被處理的圖像數(shù)據(jù)量以及減少所需的 時(shí)間量。該方法首先對(duì)減小的分辨率或子采樣圖像執(zhí)行基于直方圖的 RGB分析,以將掃描圖像數(shù)據(jù)分類以用于確定背景和表格色彩內(nèi)容。接 下來,執(zhí)行色調(diào)(H)、飽和度(S)和值(V)變換,并且分析所得到的 HSV數(shù)據(jù)以識(shí)別最普通的背景和表格顏色。然后開發(fā)系數(shù)算法并將其應(yīng) 用于每個(gè)像素,這使中性色數(shù)據(jù)和背景像素產(chǎn)生很小的變化或不產(chǎn)生變 化并使表格色彩像素向背景變換。
圖1的邏輯流程圖示出色彩舍去方法的基本步驟。這些步驟的更詳 細(xì)說明接下來在本申請(qǐng)的后續(xù)部分中給出。提供圖例30作為在此以及 后面在圖2、 3A、 3B和6所示的邏輯流程圖中使用的符號(hào)的關(guān)鍵。
最初,提供原始圖像10作為圖像數(shù)據(jù)。起初幾個(gè)關(guān)鍵步驟幫助識(shí) 別文件的色彩內(nèi)容。作為這些步驟的第一步驟,對(duì)原始圖像10的圖像 數(shù)據(jù)執(zhí)行可選的子采樣步驟IOO或者相似步驟以減小圖像的分辨率。子采樣或其它分辨率減小(例如使用雙線性差值或雙三次差值)有助于減 少計(jì)算時(shí)間,因?yàn)槠錅p小了需要進(jìn)行處理以用于隨后的色彩分析的圖像
數(shù)據(jù)的大小。必須注意,該子采樣或其它分辨率減小只針對(duì)色彩分析程 序而進(jìn)行。 一旦已使用在此定義的初始步驟識(shí)別了待舍去到背景中的表
格色彩,則處理完整的原始圖像10(而不是該圖像的子采樣部分)以在
后面的步驟中移除色彩。
下面執(zhí)行方塊直方圖分析步驟200,其中圖像被分割成多塊并且每 塊被用于生成紅色(R)、綠色(G)和藍(lán)色(B)直方圖。使用方塊直方 圖分析步驟200將圖像的各段分類以識(shí)別包含色彩和其它內(nèi)容的區(qū)域。 接下來,從方塊直方圖分析步驟200獲得的一部分圖像段被轉(zhuǎn)換成HSV 數(shù)據(jù)并在HSV分析步驟300中進(jìn)行處理。在該處理中,對(duì)這些色調(diào)、飽 和度和值參數(shù)進(jìn)行分析以為這些方塊找出最普通的背景和前景色彩。
使用在本發(fā)明中所使用的邏輯的重復(fù)迭代,可以將若干非中性色彩 作為舍去色彩來處理。 一旦確定了這些色彩,則為每個(gè)色彩計(jì)算系數(shù)集 并將該系數(shù)集應(yīng)用于系數(shù)應(yīng)用步驟400。處理的這部分可以可選地允許 測(cè)量操作者對(duì)舍去色彩識(shí)別的控制。作為該處理的結(jié)果,提供色彩舍去 圖像18。
有益的是注意到,參考圖1所述的處理應(yīng)用于最簡(jiǎn)單的情況,即移 除單一色彩。相同處理的合適部分也在必須舍去多個(gè)色彩的情況下迭代 地實(shí)行,如隨后所述。
圖2的邏輯流程圖示出在子采樣步驟100和方塊直方圖分析步驟 200中所使用的程序序列。圖7示出原始圖像IO在其經(jīng)歷該處理時(shí)的平 面圖(未按比例)。對(duì)于該步驟,對(duì)原始圖像IO進(jìn)行子采樣,或者以其 它方式減小其分辨率,并使用特定尺寸、組織成列12的段或方塊14對(duì) 其進(jìn)行掃描。將塊14排列成連續(xù)的列提供了對(duì)整個(gè)圖像的覆蓋。方塊 14優(yōu)選是不重疊的,從而每個(gè)像素16出現(xiàn)于一個(gè)且只有一個(gè)方塊14 中。
在每個(gè)方塊14中有若干像素16,如在圖7的放大窗E中所示。對(duì) 一定數(shù)量的像素16進(jìn)行子采樣以用于隨后的色彩分析。在圖7的簡(jiǎn)單 示例中,子采樣每隔一像素進(jìn)行選擇以提供分辨率減小的圖像。如先前 說提到的,該子采樣是可選的并且僅為減小必須被處理的數(shù)據(jù)量以便于 識(shí)別舍去色彩而實(shí)行。經(jīng)驗(yàn)結(jié)果已經(jīng)示出,對(duì)于確定大多數(shù)文件的舍去色彩來說,大約100dpi (dots per inch,每英寸點(diǎn)數(shù))的子采樣是可 接受的。取決于文件的復(fù)雜性和所需的精確度,更低的dpi值(例如 50-70dpi)的性能可能不如針對(duì)不小于100dpi的圖像所做的分析。在 一個(gè)實(shí)施例中,方塊14的尺寸大約是0. 16平方英寸。可替換地使用非 方形的方塊形狀。
回過來參考圖2的流程圖,方塊設(shè)定步驟IIO建立了欲用于掃描步 驟120 (其中在該圖像的兩端之間移動(dòng)而獲得每隔方塊14)的方塊14 的大小。然后對(duì)每個(gè)方塊14執(zhí)行色彩特征化。與在整個(gè)圖像上將色彩 特征化的傳統(tǒng)方法比,使用小的方塊14更有利于色彩分析。使用多個(gè) 小方塊14促進(jìn)了對(duì)相互間有所區(qū)別的多個(gè)色彩的探測(cè)。然后,在方塊 直方圖分析步驟200中對(duì)每個(gè)方塊14的特征化準(zhǔn)備用于進(jìn)一步色彩分 析的圖像數(shù)據(jù),如下文所述。
方塊直方圖分析
在直方圖生成步驟210,為每個(gè)方塊14生成了紅色(R)、綠色(G) 和藍(lán)色(B)直方圖。因?yàn)樵谖募D像邊緣的數(shù)據(jù)可能是部分的(例如 列12中的最后一塊14超過文件頁的邊緣),所以可從將進(jìn)一步進(jìn)行分 析的方塊直方圖內(nèi)容集中舍去相應(yīng)的數(shù)據(jù)。
對(duì)于說生成的每個(gè)紅色的、綠色的和藍(lán)色的直方圖,在獲得值步驟 220中獲得下列數(shù)據(jù)
(i) 最小碼值(CV);
(ii) 最大碼值(CV);
(iii )峰值或最普通的CV。 接下來是單一峰值決策步驟230,其中評(píng)估每個(gè)直方圖中碼值(CV) 的相對(duì)分布。在步驟230中,需要確定是否任何個(gè)別的直方圖展示出單 一峰值或者多于一個(gè)峰值。色彩通道中的每一個(gè)都必須展示單一峰值以 便于方塊包含單一色彩或者中性色。具有多于僅一個(gè)峰值指示在相應(yīng)方 塊14中存在多個(gè)色彩的可能性。對(duì)于該評(píng)估,使用憑經(jīng)驗(yàn)確定的閾值 (圖2中的THRESH1 )。如果最大CV和最小CV的差超過該閾值,則感測(cè) 多峰值(即,可能的多色彩)狀況。
在感測(cè)了單一峰值狀況的情況下,接下來執(zhí)行中性色彩測(cè)試240。 在該邏輯中,對(duì)針對(duì)紅色、綠色和藍(lán)色的峰值進(jìn)行比較。對(duì)于中性色彩, R、 G和B值將大致相同,并在某一較小的變化范圍內(nèi)。只要這些值的差低于憑經(jīng)驗(yàn)確定的閾值(圖2中的Thresh3),則假設(shè)方塊具有中性或者 背景色彩。在這種情況下,變換步驟242追蹤中性峰值并將針對(duì)峰值數(shù) 據(jù)值的RGB數(shù)據(jù)值轉(zhuǎn)換到HSV數(shù)據(jù)值。然后,將該色彩信息作為淺中性 色或者背景數(shù)據(jù)存儲(chǔ)在表A中,這在圖2的20處指示。
如果步驟240確定了針對(duì)紅色、綠色和藍(lán)色的峰值之間的差超過閾 值,則方塊指示極有可能是色彩舍去的候選者的色彩。變換步驟244追
后,該色彩信息作為單一峰值色彩數(shù)據(jù)存儲(chǔ)在表B中,這在圖2的2; 處指示。
在感測(cè)多峰值狀況的情況下,執(zhí)行深中性色決策步驟250。在此, 計(jì)算最小R、 G和B值之間的差,并將其與憑經(jīng)驗(yàn)確定的閾值(圖2中 的Thresh2)相比較。如果小于該閾值,則直方圖指示具有多個(gè)峰值的 深中性色,這是極有可能對(duì)應(yīng)所感興趣數(shù)據(jù)(例如鉛筆標(biāo)記、鋼筆錄入 或者其它中性色文本或標(biāo)記)的圖像內(nèi)容的特征。該關(guān)系,即最小R、 G 和B值之間的差小于閾值的多峰值狀況,也可以指示直方圖中的多個(gè)色 彩。在任一情況下,雖然這種方塊很有可能具有針對(duì)掃描文件所感興趣 的數(shù)據(jù)內(nèi)容,但是關(guān)于這種方塊的信息對(duì)于舍去色彩識(shí)別的目的來說并 不感興趣。相對(duì)于圖2所示的邏輯流程,該數(shù)據(jù)存儲(chǔ)在表D中,這在24 處指示。同樣,有益的是重新強(qiáng)調(diào),僅針對(duì)舍去色彩識(shí)別的有限目的而 將該數(shù)據(jù)視為"舍棄",如表D和下文說概述的。使用該數(shù)據(jù)用于色彩 分析的嘗試可能在識(shí)別表格色彩時(shí)導(dǎo)致模糊的結(jié)果。在后續(xù)色彩計(jì)算中 不考慮該數(shù)據(jù)使得處理簡(jiǎn)化并更可能產(chǎn)生表格色彩的精確識(shí)別。明顯 地,不會(huì)舍棄對(duì)應(yīng)于分配給表D的方塊的實(shí)際圖像數(shù)據(jù)。 一旦已經(jīng)識(shí)別
一個(gè)或更多個(gè)舍去色彩,則與所有其它圖像像素一起對(duì)該圖像數(shù)據(jù)進(jìn)行 色彩舍去處理,如下文所述。
仍參考圖2的步驟250,在存在多峰值狀況并且最小R、 G和B值的 差超過閾值的情況下,直方圖指示色彩和背景內(nèi)容。變換步驟254追蹤
后將此存儲(chǔ)在表C中,這在26處指示。
因此,在方塊直方圖分析步驟200中的處理結(jié)束時(shí),已經(jīng)將每個(gè)方 塊14的內(nèi)容分類并存儲(chǔ)。綜上所述,以進(jìn)行下列分配以用于對(duì)每個(gè)方 塊14進(jìn)行分類表A,其中方塊14主要包含中性色或者背景色彩。
表B,其中方塊14包含純表格色彩的相當(dāng)大的區(qū)域。
表C,其中方塊14兼含表格色彩和背景內(nèi)容。
表D,其中方塊14包含極有可能包含所感興趣的數(shù)據(jù)的深中性色內(nèi)容。
然后,具有與欲保留的表D深中性色內(nèi)容明顯不同內(nèi)容的所有方塊 14在額外分析之前都必須經(jīng)歷RGB到HSV轉(zhuǎn)換。
作為示例,考慮圖4所示的部分文件。在此,文件40具有白色/中 性色背景并具有紅色表格色彩(欲舍去色彩)和黑色文本。文件40具 有紅線42、錄入文本44和色彩區(qū)域46,并且使用圖2所示的邏輯流程 來示出針對(duì)代表性方塊14的一小部分樣本數(shù)據(jù)。在該實(shí)施例中,對(duì)來 自該文件的方塊14如下分類
(i) 在表C中保存多峰值直方圖數(shù)據(jù)(色彩前景和背景)。在包含 白色或其它淺中性色背景和有色文本或線的文件的一部分上,紅色、綠 色和藍(lán)色方塊直方圖展示多于一個(gè)峰值。RGB方塊直方圖中的最小值代 表針對(duì)該方塊14所存在的最深色彩(圖4示例中的紅色),數(shù)據(jù)存儲(chǔ)與 表C中。
(ii) 單一峰值中性色直方圖數(shù)據(jù)保存于表A(淺中性色背景)中。 在只包含白色、偏白色或者其它主要為中性色背景的文件的一部分上, 紅色、綠色和藍(lán)色方塊直方圖只展示一個(gè)峰值。在這樣的方塊14中, 針對(duì)紅色、綠色和藍(lán)色成分的最普通CV將對(duì)應(yīng)于白色背景色彩,針對(duì) 每一這種方塊的數(shù)據(jù)存儲(chǔ)于表A中。
(iii) 單一峰值色彩直方圖數(shù)據(jù)保存于表B(色彩背景)中。在包 含例如圖4中色彩區(qū)域46的較大純舍去色彩區(qū)域(在一個(gè)實(shí)施例中超 過0.16平方英寸)的文件的一部分上,可生成包含該非中性色彩的單 一峰值方塊直方圖,針對(duì)每一這種方塊的數(shù)據(jù)存儲(chǔ)于表B中。
(iv )所有其它直方圖數(shù)據(jù)保存在表D (深中性色前景和背景)中。 在兼含白色背景和黑色文本的文件的一部分上,紅色、綠色和藍(lán)色方塊 直方圖展示多于一個(gè)峰值。RGB方塊直方圖中的最小值代表針對(duì)該方塊 而存在的最深中性黑色文本,其是不會(huì)針對(duì)舍去色彩識(shí)別目的而考慮的 數(shù)據(jù)。針對(duì)這種方塊的色彩數(shù)據(jù)存儲(chǔ)于表D中。
按照對(duì)方塊14中的每一個(gè)的這種分類和分配,使用表B和表C數(shù)據(jù)來確定欲在產(chǎn)生用于色彩舍去的系數(shù)等式時(shí)使用的最佳色彩RGB值。 如果發(fā)現(xiàn)方塊14針對(duì)紅色、綠色和藍(lán)色方塊直方圖具有單一峰值,則 根據(jù)來自那些方塊的最普通的紅色、綠色和藍(lán)色CV來計(jì)算色調(diào)、飽和 度和值(HSV)參數(shù)。如果方塊14具有針對(duì)紅色、綠色和藍(lán)色的多峰值 直方圖,并且最小值的比較指示存在該色彩,則基于針對(duì)RGB的最小值 來計(jì)算針對(duì)該方塊14的HSV參數(shù)。
一旦完成方塊直方圖分析步驟200,算法便具有以下信息文件圖 像中方塊14的總數(shù)、單一峰值方塊的數(shù)量以及非中性色多峰值方塊14 的數(shù)量。然后,可以在后續(xù)處理中使用針對(duì)每個(gè)單一峰值方塊直方圖和 多峰值方塊直方圖的對(duì)應(yīng)色調(diào)、飽和度和值參數(shù)。
色調(diào)、飽和度和值分析
如在成像領(lǐng)域中已熟知的那樣,色彩的精確分析需要看三個(gè)屬性, 例如紅色、綠色、藍(lán)色(RGB)或者色調(diào)、飽和度和值(HSV)坐標(biāo)。 在此,已經(jīng)示出使用HSV值而不是其對(duì)應(yīng)的RGB值對(duì)于識(shí)別表格色彩來 說特別有用。
在利用圖2的處理邏輯實(shí)行對(duì)方塊14的分類和分配之后,在發(fā)現(xiàn) 文件中的舍去色彩時(shí)的下一步是分析針對(duì)已經(jīng)分類成表20、 22和26的 數(shù)據(jù)的方塊直方圖計(jì)算的結(jié)果。這通過分析已經(jīng)針對(duì)每個(gè)對(duì)應(yīng)的單一峰 值和多峰值方塊直方圖而計(jì)算出的色調(diào)、飽和度和值參數(shù)實(shí)行。如參考 圖2的處理步驟所述,分配給表A、 B和C的RGB值變換成其對(duì)應(yīng)的色 調(diào)、飽和度和值(HSV)坐標(biāo)。
根據(jù)每個(gè)單一峰值方塊直方圖,針對(duì)最普通的紅色、綠色和藍(lán)色碼 值(CV)來計(jì)算色調(diào)、飽和度和值(HSV)參數(shù),如參考圖2所述。然 后實(shí)行對(duì)這些色調(diào)、飽和度和值參數(shù)的分析以發(fā)現(xiàn)最普通的背景和前景 色彩。通過循環(huán)穿過HSV分析程序,可以發(fā)現(xiàn)若干非中性色彩作為舍去 色彩。
圖3A和3B的邏輯流程圖給出在HSV分析步驟300中所遵循的詳細(xì) 程序。第一步驟序列開始于表A中所列的方塊數(shù)據(jù)。如前面提到和在圖 4的示例中所示出的,表A包含針對(duì)只具有淺中性色前景內(nèi)容的方塊14 的錄入項(xiàng)。
分析的第一步驟是發(fā)現(xiàn)最普通的中性色背景色彩,如果在大量色彩 中存在一個(gè)最普通的中性色背景色彩的話。這幫助消除不是背景色彩的中性色彩,并且通過從上述(表A)直方圖數(shù)據(jù)中發(fā)現(xiàn)最普通值(HSV) 來實(shí)行。首先在普通值確定步驟304中對(duì)從在圖2中的方塊直方圖分析 步驟200所獲得的表A值進(jìn)行平均。步驟304為所有的表A錄入項(xiàng)提供 平均的R、 G和B值。使用圖4的示例,該步驟本質(zhì)上將R、 G和B列的 每一列中的值進(jìn)行平均,從而計(jì)算出平均的R值、平均的G值和平均的 B值。
然后使用表A值實(shí)行中性色內(nèi)容決策步驟310。該步驟確定背景內(nèi) 容是否是色彩或者中性色。這可以若干方式來確定。在一個(gè)實(shí)施例中, 使用是整個(gè)文件的50%的閾值或者某個(gè)其它合適的百分比值。在表A 內(nèi)容超過針對(duì)該文件的閾值百分比的情況下,可以假設(shè)中性背景色彩并 且繼續(xù)利用取平均步驟312處理。取平均步驟312找到針對(duì)具有這種內(nèi) 容類型的方塊的平均峰值和最小RGB值。然后,作為取平均步驟312的 一部分來計(jì)算分布的最小值和該平均的中間值。執(zhí)行另一取平均步驟 314以計(jì)算在普通值確定步驟304中所獲得的平均R、G和B峰值的平均 值。然后,在背景設(shè)定步驟316,將背景變量設(shè)為平均RGB峰值。將背 景最小值設(shè)為在步驟312中所計(jì)算的最小值。
在一些情況下,可以在有色紙上印刷文件。在表A內(nèi)容指示有色而 非中性色彩背景的情況下,執(zhí)行在圖3A中由虛線輪廓所指示的色彩背 景步驟320。這些步驟應(yīng)用于來自表B的數(shù)據(jù)。首先,獲得了針對(duì)最普 通RGB色調(diào)的碼值。然后,計(jì)算平均RGB值的最高值并將其指定為背景。
該平均背景用于計(jì)算在色彩舍去階段所采用的主要系數(shù),后面將說明。 還獲得RGB分布的最小值并將其指定為背景最小值,這用來確定像素是
否為背景像素。例如,如果最高值通道被確定為紅色,則將紅色通道高 于最小背景值情況下的圖像像素指定為紅色通道值。
下面參考圖3B,示出用于識(shí)別背景以及欲舍去的表格色彩的基本處 理循環(huán)。在每個(gè)循環(huán)錄入330之后,執(zhí)行色調(diào)識(shí)別步驟332,其基本步 驟在虛線輪廓內(nèi)示出。將來自表C的值用作為輸入。使用表C數(shù)據(jù)生成 了 HSV值的直方圖??梢栽谶B續(xù)的回路操作中識(shí)別出第一、第二和第三 最普通的色調(diào)。 一旦找到最普通色調(diào),便將超出給定范圍角度(在圖3B 的示例實(shí)施例中是+/-10度)處的其它色調(diào)排除在考慮之外。然后針 對(duì)所識(shí)別的色彩檢查值(V)和飽和度(S)坐標(biāo)。確定最普通的V坐標(biāo)標(biāo)值。
例如,參考圖5,其中示出某些典型值,例如可能在表C內(nèi)列出的 值。將這些RGB值轉(zhuǎn)換成HSV值。在所給出的示例中(其中為清楚起見 在該示例中只示出4個(gè)值),最普通的色調(diào)值是9度,紅色色調(diào)。+/-IO度的范圍給定359度和19度之間的H值所得范圍。這為該循環(huán)操作 消除了 ( 252, 370, 180)HSV值,(帶藍(lán)色的色調(diào)),因?yàn)橹?52度在該 H值范圍之外。剩余HSV錄入項(xiàng)的最普通值坐標(biāo)是160。這將可以可選 地用作為針對(duì)偽造數(shù)據(jù)的檢驗(yàn)的飽和度計(jì)數(shù)隔離。這些飽和度值的最高 值(S = 500 )對(duì)應(yīng)于第二RGB錄入項(xiàng)(160, 90, 45)。
再次參考圖3B,執(zhí)行第二色調(diào)識(shí)別步驟338,其基本步驟在虛線輪 廓內(nèi)示出。這些步驟對(duì)與表C一起使用的數(shù)據(jù)應(yīng)用相似處理,使用在色 調(diào)識(shí)別步驟332所建立的相同色調(diào)范圍并獲得飽和度值。舍去色彩確定 步驟340將從表C和表B數(shù)據(jù)所獲得飽和度值進(jìn)行比較,并且選擇對(duì)應(yīng) 于兩個(gè)飽和度值中的較低值的RGB值作為欲舍去的RGB色彩。然后,在 最大/最小確定步驟344中獲得對(duì)應(yīng)于該色彩的最大和最小RGB值。例 如,對(duì)于RGB色彩(160, 90, 45)來說,最大值是160,最小值是45。
然后,循環(huán)返回步驟350將處理指回循環(huán)錄入330以用于欲舍去的 后續(xù)表格色彩。在一個(gè)實(shí)施例中,執(zhí)行圖3B所示循環(huán)三次以識(shí)別三個(gè) 舍去色彩。參考圖3A和3B在前面所述的程序探測(cè)中性色背景和色彩內(nèi) 容并對(duì)其進(jìn)行概括,以便于提供由色彩移除算法所使用的變量。 一旦確 定了這些色彩,這為每個(gè)色彩計(jì)算系數(shù)集。
色彩舍去算法
前面的步驟提供用于生成系數(shù)的變量,所述系數(shù)允許快速處理圖像 數(shù)據(jù)并移除非所需的色彩材料。例如,在共同轉(zhuǎn)讓的美國(guó)專利 No. 5, 014, 328和美國(guó)專利No. 5, 014, 329 (兩個(gè)都頒予Rudak)中說明了
色彩舍去系數(shù)的使用,并且這兩個(gè)專利都通過引用并入于此。
對(duì)于色彩舍去,為每個(gè)RGB色彩生成色彩舍去函數(shù)。該函數(shù)具有一 次系數(shù)(primary coefficient)和二次系數(shù)。對(duì)于圖4象中的每個(gè)像素, 將該一次系數(shù)乘以最大RGB值,而將二次系數(shù)乘以最小RGB值。然后, 將這兩個(gè)所產(chǎn)生的值加到一起以產(chǎn)生針對(duì)該像素的灰階值。由于任何圖 像都可以具有與所存在的色彩一樣多的系數(shù)等式,因此必須檢查圖像中 的每個(gè)像素以確定哪個(gè)等式應(yīng)該應(yīng)用于該像素。首先將每個(gè)像素RGB值與背景最小值相比較。如果R、 G和B值大 于背景最小值,則將該像素灰階值設(shè)為該像素RGB(最大值)。這樣做是 為了保留圖像內(nèi)的背景可變性。如果任何RGB值小于背景最小值,則在 給定像素RGB與用于生成色彩舍去系數(shù)等式的三個(gè)可能RGB值之間執(zhí)行 比較。針對(duì)最接近匹配的色彩舍去RGB的等式(如由該像素的相對(duì)色調(diào) 所確定的那樣)將被用于計(jì)算針對(duì)該像素的灰階值。如果未發(fā)現(xiàn)最接近 匹配,則使用具有最低一次系數(shù)數(shù)字的等式。
多色彩舍去算法的最終輸出是具有與輸入圖像相同分辨率的灰階 圖像。輸出圖像將所有中性色像素保持為接近其原始灰階值,而將所有 合格的色彩像素驅(qū)至近背景值。像素的色彩越多,則系數(shù)等式將越有可 能產(chǎn)生接近圖像中的背景值的灰階值。
圖6的邏輯流程圖示出根據(jù)一個(gè)實(shí)施例的多色彩舍去程序。系數(shù)計(jì) 算步驟410具有在虛線輪廓中示出的程序序列。為了能夠動(dòng)態(tài)地(例如, 在對(duì)文件進(jìn)行掃描時(shí))執(zhí)行該程序,只相對(duì)于二維來考慮三維色彩空間。 由于算法的目的是舍去除了中性色的所有色彩,因此二維色彩空間是可 行的選擇。例如,如果在3維RGB色彩空間中將最主要的表格色彩識(shí)別 為RGB ( 200, 100, 50),則會(huì)在2維空間中使用最大值(200 )和最小 值(50)來計(jì)算系數(shù)等式。該等式對(duì)于任何由RGB ( 200, 200 - 50, 50) 或(200 - 50, 200, 50 )或(50, 200, 200 - 50 )代表的色彩都會(huì)完全 相同。使用該等式的目的是將任何這些RGB色彩驅(qū)至灰階背景值。
例如,圖6中系數(shù)計(jì)算步驟410的程序可獲得如下內(nèi)容
參數(shù)->最大值200,最小值50,背景235
一次系數(shù)- (背景-最小值)/ (最大值-最小值) (235 - 50 ) / ( 200 - 50 ) = 1.233
二次系數(shù)=(1-一次系數(shù))
1-1. 233 = -0.233
然后,使用在前面的系數(shù)計(jì)算步驟410中獲得的系數(shù)來為每個(gè)像素 執(zhí)行像素處理步驟420。在該2維空間中,根據(jù)下面所示例的系數(shù)等式 將3維空間中的若干色彩平面移動(dòng)到背景值
系數(shù)計(jì)算=(最大值*一次系數(shù))+ (最小值*二次系數(shù)) (200*1. 233 ) + ( 50*-0. 233 ) - 234. 95
最大值(200 )和最小值(50)系數(shù)等式因而將若干色彩移動(dòng)至灰階背景值235。
本發(fā)明的方法提供了靈活、有效的適應(yīng)性色彩舍去方案,并且不需 要針對(duì)可能掃描的每種類型的文件進(jìn)行訓(xùn)練。明顯地,本發(fā)明的方法允 許分別掃描每一個(gè)別文件,而不會(huì)預(yù)先載入值或需要操作者錄入并且不 需要識(shí)別文件類型。不需要預(yù)先對(duì)文件進(jìn)行分類,從而只有特定類型的 文件去往特別的掃描器,或者將只具有特定色彩的文件在相同批次程序 中進(jìn)行處理。這意味著,例如,不必將掃描限于文件類型的特定集;本 發(fā)明的方法可以為不同的色彩文件提供色彩舍去,從而允許掃描這些文 件并按順序?qū)ζ溥M(jìn)行處理。
然后,可以將使用本發(fā)明方法所處理的文件以若干種方式使用。例 如,可在根據(jù)本發(fā)明的色彩舍去之后對(duì)文件執(zhí)行OCR處理。
可以由掃描器設(shè)備或者由對(duì)所掃描的數(shù)據(jù)進(jìn)行操作的圖像處理器 來執(zhí)行本發(fā)明的方法。因?yàn)槠涮峁┯糜谝瞥粋€(gè)或多個(gè)非所需表格色彩 的快速方法,所以可以將本發(fā)明方法直接在所掃描數(shù)據(jù)上執(zhí)行,從而提 供給終端用戶的掃描器數(shù)據(jù)已經(jīng)通過使用表格色彩舍去而符合條件。
不像用于選擇色彩舍去的其它方法,本發(fā)明方法不需要訓(xùn)練掃描器 或者圖像處理裝置。利用本發(fā)明方法,不需要預(yù)先對(duì)文件進(jìn)行分類。
子采樣、方塊化、生成直方圖、執(zhí)行RGB-HSV轉(zhuǎn)換以及針對(duì)異常 狀況的測(cè)試的步驟可以應(yīng)用那些圖像處理領(lǐng)域內(nèi)的專業(yè)人員所熟悉的 若干不同類型的程序。如那些圖像處理領(lǐng)域內(nèi)的專業(yè)人員所熟知的,還 可以在圖像數(shù)據(jù)處理期間執(zhí)行針對(duì)異常的可選檢查。色彩掃描可以獲得 RGB數(shù)據(jù),或者可選地可以獲得某一其它數(shù)據(jù)格式(例如YCC格式)的 色彩數(shù)據(jù)。方塊優(yōu)選是非重疊的,雖然一定數(shù)量的重疊(其中相同像素 在兩個(gè)相鄰方塊的邊緣上)可以是允許的。盡管已經(jīng)發(fā)現(xiàn)系數(shù)變換有利 于將表格色彩偏移為背景色彩,但可以替換地使用應(yīng)用本發(fā)明的色彩識(shí) 別方法的其它變換。子采樣只是可用于減小圖像方塊的分辨率的若干種 方法之一。用于減小分辨率的其它合適方法包括,但不限于,例如雙線 性差值或者雙三次差值。
因此,所提供的是用于從所掃描的圖像中識(shí)別并移除表格色彩內(nèi)容 的i殳備和方法。部件列表
10原始圖像 12行 14方塊 16像素
18色彩舍去圖像
20表
22表
24表
26表
30圖例
40文件
42紅線
44錄入文本
46色彩區(qū)域
100子采樣步驟
110方塊設(shè)定步驟
120掃描步驟
200方塊化的直方圖分析步驟
210直方圖生成步驟
220獲得值步驟
230單一峰值決策步驟
240中性色彩測(cè)試
242變換步驟
244變換步驟
250深中性色決策步驟
254變換步驟
300 HSV分析步驟
304普通值確定步驟
310中性色內(nèi)容決策步驟
312取平均步驟
314取平均步驟316背景設(shè)定步驟
320色彩背景步驟
330循環(huán)錄入
332色調(diào)識(shí)別步驟
338色調(diào)識(shí)別步驟
340舍去色彩區(qū)定步驟
344最大值/最小值確定步驟
350循環(huán)返回步驟
400系數(shù)應(yīng)用步驟
410系數(shù)計(jì)算步驟
420像素處理步驟
權(quán)利要求
1.一種用于從文件的掃描圖像數(shù)據(jù)中移除至少一非所需表格色彩內(nèi)容的方法,該方法包括a)獲取以色彩數(shù)據(jù)格式的掃描文件圖像數(shù)據(jù);b)將該圖像數(shù)據(jù)分割成兩個(gè)或更多方塊;c)將每個(gè)方塊根據(jù)該方塊的背景和色彩內(nèi)容的組合而分類成至少第一集和第二集;d)從第一方塊集中識(shí)別背景色彩;e)從第二方塊集中識(shí)別至少一個(gè)表格色彩;并且f)應(yīng)用使表格色彩圖像數(shù)據(jù)值向背景色彩值偏移的變換。
2. 權(quán)利要求1的方法,其中將每個(gè)方塊分類包括形成針對(duì)每個(gè)方塊 的紅色、綠色和藍(lán)色直方圖。
3. 權(quán)利要求1的方法,其中將每個(gè)方塊分類包括減小該方塊的分辨 率的步驟。
4. 權(quán)利要求1的方法,其中所述色彩格式是紅色、綠色和藍(lán)色UGB) 格式。
5. 權(quán)利要求l的方法,其中所述方塊實(shí)質(zhì)上是非重疊的。
6. 權(quán)利要求1的方法,其中應(yīng)用變換包括應(yīng)用將表格色彩值向背 景色彩值偏移的系數(shù)。
7. 權(quán)利要求l的方法,其中識(shí)別所述背景色彩包括 a )將RGB色彩數(shù)據(jù)變換為HSV色彩數(shù)據(jù);以及b )針對(duì)具有在所述背景色彩大約+ / - 10度范圍內(nèi)的色調(diào)色彩數(shù)據(jù) 值的像素來識(shí)別最普通的色調(diào)色彩數(shù)據(jù)值。
8. 權(quán)利要求1的方法進(jìn)一步包括減少所述圖像數(shù)據(jù)的分辨率。
9. 權(quán)利要求l的方法,其中識(shí)別至少一個(gè)表格色彩包括a) 將RGB色彩數(shù)據(jù)變換為HSV (色調(diào)、飽和度、值)色彩數(shù)據(jù);并且b) 找到所述最普通的色調(diào)色彩數(shù)據(jù)值。
10. —種用于從文件的掃描圖像數(shù)據(jù)中移除非所需表格色彩內(nèi)容的 方法,該方法包括a) 獲取以色彩數(shù)據(jù)格式的掃描文件圖像數(shù)據(jù);b) 將所述圖像數(shù)據(jù)分割成兩個(gè)或更多方塊;c) 利用以下步驟將每個(gè)方塊通過其色彩內(nèi)容特征化(i) 針對(duì)所述方塊內(nèi)的紅色色彩值生成紅色直方圖;(ii) 針對(duì)所述方塊內(nèi)的綠色色彩值生成綠色直方圖;(iii) 針對(duì)所述方塊內(nèi)的藍(lán)色色彩值生成藍(lán)色直方圖;(iv) 根據(jù)所述紅色、綠色和藍(lán)色直方圖分布來確定,所述方塊 是否主要包含中性色背景內(nèi)容,或者主要包含表格色彩內(nèi)容,或者背景 和色彩內(nèi)容的組合;d) 根據(jù)主要具有中性色背景內(nèi)容的方塊來識(shí)別背景色彩;e) 根據(jù)主要具有表格色彩內(nèi)容的方塊來識(shí)別至少一個(gè)表格色彩;f )將具有所述至少一個(gè)表格色彩的像素選擇性地變換到背景色彩。
11. 權(quán)利要求10的方法,其中選擇性變換包括應(yīng)用將表格色彩值向 背景色彩值變換的系數(shù)。
12. 權(quán)利要求10的方法,其中識(shí)別所述背景色彩包括 a )將RGB色彩數(shù)據(jù)變換到HSV色彩數(shù)據(jù);并且b )針對(duì)具有在所述背景色彩大約+ / - 10度范圍內(nèi)的色調(diào)色彩數(shù)據(jù) 值的像素來識(shí)別最普通的色調(diào)色彩數(shù)據(jù)值。
13. 權(quán)利要求10的方法,其中根據(jù)所述紅色、綠色和藍(lán)色直方圖 分布來確定所述方塊是否主要包含中性色背景內(nèi)容或者主要包含表格 色彩內(nèi)容或者背景和色彩內(nèi)容的組合包括識(shí)別在所述紅色、綠色和藍(lán)色 直方圖分布中的一個(gè)或更多峰值。
14. 權(quán)利要求10的方法,其中識(shí)別至少一個(gè)表格色彩包括將RGB 坐標(biāo)值轉(zhuǎn)換到HSV坐標(biāo)值。
15. 權(quán)利要求10的方法,其中對(duì)每個(gè)方塊進(jìn)行特征化進(jìn)一步包括 減小所述方塊內(nèi)的圖像數(shù)據(jù)的分辨率。
16. 權(quán)利要求10的方法,其中所述色彩格式是紅色、綠色、藍(lán)色 (RGB)格式。
17. 權(quán)利要求10的方法,其中所述方塊實(shí)質(zhì)上是非重疊的。
18. 權(quán)利要求10的方法,其中執(zhí)行相同步驟來處理連續(xù)文件中的 每個(gè)文件。
19. 權(quán)利要求10的方法,其中選擇性地變換像素包括基于所識(shí)別 表格色彩的最大和最小RGB數(shù)據(jù)值來生成變換系數(shù),并且將所述變換系 數(shù)應(yīng)用于每個(gè)像素的最大和最小RGB數(shù)據(jù)值。
20. —種用于掃描文件的方法,包括a) 掃描包含第一表格色彩和第一背景色彩的第一文件;b) 從所述第一文件的掃描數(shù)據(jù)中探測(cè)至少第一表格色彩和第一背 景色彩;c) 根據(jù)所探測(cè)的第 一表格色彩和第一背景色彩來計(jì)算和應(yīng)用第一變換,其中所述第一變換使第一表格色彩向第一背景色彩偏移;d) 掃描包含第二表格色彩和第二背景色彩的第二文件,其中所述 第二表格色彩與所述第一表格色彩不同,并且所述第二背景色彩與所述 第一背景色彩不同;e) 從所述第二文件的掃描數(shù)據(jù)中探測(cè)至少第二表格色彩和第二背 景色彩;并且f) 根據(jù)所探測(cè)的第二表格色彩和第二背景色彩來計(jì)算和應(yīng)用第二 變換,其中所述第二變換使所述第二表格色彩向所述第二背景色彩偏 移。
21. 權(quán)利要求20的方法,其中探測(cè)至少第一表格色彩和第一背景色 彩包括將所述文件分割成多個(gè)方塊并且針對(duì)每個(gè)方塊生成紅色、綠色和 藍(lán)色直方圖。
22. —種用于從掃描文件數(shù)據(jù)中移除至少一個(gè)非所需表格色彩的方 法,包括a) 形成所述文件數(shù)據(jù)的多個(gè)非重疊段;b) 生成針對(duì)每個(gè)段的紅色、綠色和藍(lán)色直方圖;c) 探測(cè)任何一個(gè)紅色、綠色和藍(lán)色直方圖中的一個(gè)或更多峰值;d) 根據(jù)所述峰值探測(cè)背景色彩;e) 將紅色、綠色和藍(lán)色直方圖的峰值變換成色調(diào)、飽和度和值坐 標(biāo)值;f) 分析色調(diào)、飽和度和值坐標(biāo)值;并且g) 根據(jù)所述色調(diào)、飽和度和值坐標(biāo)值來探測(cè)所述至少一個(gè)非所需 表格色彩。
23. —種用于掃描多個(gè)文件的方法,其中為多個(gè)文件中的每個(gè)文件 提供文件數(shù)據(jù)重復(fù)下列步驟a) 獲取以色彩數(shù)據(jù)格式的掃描文件圖像數(shù)據(jù);b) 根據(jù)所掃描的文件圖像數(shù)據(jù)來計(jì)算背景色彩和至少一個(gè)表格色彩;并且c) 根據(jù)所述至少一個(gè)表格色彩和背景色彩來計(jì)算和應(yīng)用變換,其 中所述變換使所述表格色彩向所述背景色彩偏移。
24. —種用于掃描文件的方法,包括a) 掃描包括至少第一和第二表格色彩和背景色彩的文件;b) 從所掃描的文件數(shù)據(jù)中探測(cè)第一表格色彩和背景色彩;c )根據(jù)所探測(cè)的第 一表格色彩和背景色彩來計(jì)算和應(yīng)用第 一變換, 其中所述第一變換將所述第一表格色彩向所述背景色彩偏移;d) 從所掃描的文件數(shù)據(jù)中探測(cè)第二表格色彩;e) 根據(jù)所探測(cè)的第二表格色彩和背景色彩來計(jì)算和應(yīng)用第二變換, 其中所述第二變換將所述第二表格色彩向所述背景色彩偏移。
25. 權(quán)利要求24的方法進(jìn)一步包括對(duì)所掃描的文件數(shù)據(jù)應(yīng)用所述第 一和第二變換。
全文摘要
一種用于通過將圖像分割成兩個(gè)或者更多方塊(14)而從所掃描的文件中移除非所需表格色彩內(nèi)容的方法。每個(gè)方塊(14)根據(jù)其背景與色彩內(nèi)容的組合而分類成至少第一和第二集。根據(jù)第一方塊(14)集來識(shí)別背景色彩。根據(jù)第二方塊集識(shí)別至少一個(gè)表格色彩。應(yīng)用使表格色彩圖像數(shù)據(jù)值偏移到背景色彩數(shù)據(jù)值的變換。
文檔編號(hào)G06K9/20GK101622631SQ200880006198
公開日2010年1月6日 申請(qǐng)日期2008年2月11日 優(yōu)先權(quán)日2007年2月26日
發(fā)明者G·S·米奇勒 申請(qǐng)人:伊斯曼柯達(dá)公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
郸城县| 郯城县| 高碑店市| 健康| 衢州市| 株洲市| 通化市| 化州市| 开平市| 昌江| 肇庆市| 万山特区| 浦江县| 突泉县| 嘉定区| 上饶县| 子长县| 孝感市| 辽宁省| 龙海市| 综艺| 呼图壁县| 长泰县| 乌拉特前旗| 莆田市| 鄱阳县| 梓潼县| 江永县| 四子王旗| 涟源市| 扶沟县| 盐亭县| 遂平县| 白沙| 扶沟县| 阳春市| 乌鲁木齐市| 邯郸县| 城固县| 柞水县| 广平县|