專利名稱::在對jpeg圖像進行代碼轉換時增強壓縮的制作方法
技術領域:
:本發(fā)明一般涉及施加校正以提高圖像質(zhì)量時的圖像數(shù)據(jù)壓縮,特別涉及為了附加或更極端的數(shù)據(jù)壓縮而進行的文檔解碼和重新編碼,以允許在經(jīng)濟上可接受的快速訪問存儲器中的長期存儲,并且以減少的處理時間執(zhí)行這種解碼和重新編碼。
背景技術:
:畫面和圖形圖像包括極其大量的數(shù)據(jù),并且如果其被數(shù)字化以允許通過數(shù)字數(shù)據(jù)處理器進行傳輸或處理,則以良好的保真度表示畫面或圖形圖像的各個像素通常需要數(shù)以百萬計的字節(jié)。圖像壓縮的目的是用較少數(shù)據(jù)表示圖像,以便節(jié)約存儲成本或傳輸時間和成本。最有效的壓縮是通過近似原始圖像來完成的,而不是完全地再現(xiàn)它。1993年由VanNostrandReinhold出版的由Pennebaker和Mitchell在“JPEGStillImageDataCompressionStandard”中詳細討論的JPEG(聯(lián)合圖像專家組)標準允許在不同應用之間交換圖像,并且開創(chuàng)了在多媒體應用中提供數(shù)字連續(xù)-色調(diào)彩色圖像的能力,這里將該文獻的全文引作參考。JPEG主要涉及具有二維空間、包含灰度或色彩信息且不具有時間相關性的圖像,這有別于MPEG(運動圖像專家組)標準。JEPG壓縮能夠?qū)⒋鎯σ蠼档投鄠€數(shù)量級,并且改善過程中的系統(tǒng)響應時間。JPEG標準的主要目標是針對給定的數(shù)據(jù)量和/或可用的傳輸或處理時間提供最大的圖像保真度,并且允許任意程度的數(shù)據(jù)壓縮。通常的情況是,系數(shù)為二十或更大的數(shù)據(jù)壓縮(以及同等系數(shù)的傳輸時間和存儲大小減少)不會產(chǎn)生可為一般觀看者覺察到的不自然或圖像惡化。當然,對于具有特定已知特征的特定種類的圖像或圖形,其他數(shù)據(jù)壓縮技術是可能的并且可能產(chǎn)生更大程度的圖像壓縮。JPEG標準已被完全一般化,以基本上相同地執(zhí)行而與圖像內(nèi)容無關,并且適應各種數(shù)據(jù)壓縮要求。因此,采用若干版本中的一個或多個的JPEG標準的編碼器和解碼器已經(jīng)得到相對廣泛的使用,并且允許為各種目的而對圖像進行廣泛的訪問。標準化還允許減小成本,尤其是解碼器的成本,以允許高質(zhì)量圖像訪問廣泛地可用。因此,利用JPEG標準通常優(yōu)于其他數(shù)據(jù)壓縮技術,特別是對于特定和明確種類的圖像,即使由此獲得的效率增加只是少量的,也是如此。特別是使用根據(jù)JPEG標準的技術,即使這樣的數(shù)據(jù)量大幅減小是可能的,一些應用也需要在圖像質(zhì)量和數(shù)據(jù)存儲或傳輸時間的成本之間進行嚴格的折衷。例如,可能需要將圖像存儲一段時間,其中該段時間占據(jù)存儲介質(zhì)或設備的使用壽命的大部分,同時又要求其存儲容量的大部分。因此,盡管事實上圖像數(shù)據(jù)可能被覆寫任意次數(shù),但在給定時間段內(nèi)存儲圖像的成本仍可被認為是存儲介質(zhì)或設備以及支持數(shù)據(jù)處理器安裝的成本的一部分。當然,該存儲的成本以必須存儲的圖像數(shù)為倍數(shù)。考慮圖像質(zhì)量與存儲成本之間的折衷的另一方法是確定可接受的最大存儲成本,然后針對給定的質(zhì)量確定所需數(shù)目的圖像可以在可用存儲器中保存多久。這是圖像壓縮大小的函數(shù),它通常與圖像的復雜度直接相關,并且與所需的重構圖像質(zhì)量成反比。這種要求高的應用的例子是如果不被歸檔則必須長期存儲的法律文檔的存儲,尤其是可流通票據(jù),例如每日所產(chǎn)生的數(shù)以千萬計的大量個人支票。雖然個人支票的最初結算和資金轉帳目前使用自動設備來執(zhí)行,并且通過使用印刷在支票上的可機讀標記而變得便利,但是錯誤仍然可能存在,并且可能有必要為特定交易提供證明,以便在支票形成其一部分的該交易過后很久來糾正錯誤。特別地,個人支票存在一些圖像數(shù)據(jù)壓縮復雜度。例如,為防止欺詐性交易,不變地提供具有或多或少復雜度并且具有一定范圍圖像值的背景圖案。將采用可能是多種顏色的高對比度油墨來印刷一些信息,而以相對低的對比度包括其他安全信息。可能包括大范圍圖像值的裝飾。另外,將以不容易預知的圖像值來提供手寫或印刷標記(例如,支票金額和簽名)。即使非常簡單的文檔也可能包括各種圖像值,如信頭的顏色和底紋,高對比度印刷,紙上的水印以及多個簽名。當需要準確的圖像重構時,可能包含在文檔中的這一范圍的圖像值可以限制圖像數(shù)據(jù)可被壓縮的程度。因此,在不考慮維護存儲的需要和在更長的時間內(nèi)進行快速電子訪問的可能性的情況下,以有可能以高保真度將圖像重構到原始文檔的形式進行存儲的成本是相當高的,并且該成本限制了該存儲在經(jīng)濟上可行的時間。因為這些圖像值必須是可準確再現(xiàn)的,并且利用JPEG標準是理想的以便適應廣泛的訪問和系統(tǒng)互兼容性,所以,與以良好的圖像保真度再現(xiàn)一致的用于進一步減小數(shù)據(jù)量的基本上唯一的技術是減小原始圖像的空間采樣頻率。然而,尤其是在低對比度的情況下,采樣不可避免地降低了小標記的可辨認性。目前,每英寸100點(dpi)或每英寸100像素的采樣(從目前常用的300dpi或600dpi打印機分辨率大約減至1/3到1/6)被認為是個人支票上的低對比度標記的足夠可辨認性的限度。美國國家標準協(xié)會(ANSI)圖像交換標準委員會推薦100dpi作為最小分辨率。當以每像素多個比特壓縮圖像時,大多數(shù)支票應用使用100dpi或120dpi灰度圖像。實際上,在這樣的應用中圖像數(shù)據(jù)的所需質(zhì)量還隨時間改變。例如,在文檔或其處理的日期的數(shù)月內(nèi),經(jīng)常出現(xiàn)真實性問題,從而需要足以例如鑒別簽名的圖像質(zhì)量,而在相距甚遠的以后日期,可能只需圖像質(zhì)量足以確認關于文檔內(nèi)容的基本信息。因此,特別是與存儲成本相比,當降低的圖像質(zhì)量變得更可容忍時,可以為更長期的存儲而進一步壓縮圖像數(shù)據(jù)。目前,個人支票圖像為商業(yè)使用立即存儲在DASD上大約90天,并且為歸檔的目的轉移到磁帶上,并且為法律的原因保存7年。因此,數(shù)據(jù)在“在線”的快速訪問存儲裝置中僅在幾個月內(nèi)是可用的,并且轉移到磁帶上需要一些重要的處理時間。在這一點上,逐日產(chǎn)生的個人支票和其他文檔的數(shù)量本身存在若干問題。對圖像進行編碼和/或解碼所需的處理是大量的,并且即使在通用或?qū)S锰幚砥魃弦詷O高的速度執(zhí)行,也可能需要大量的時間。即使可以在一秒的一小部分(例如,1/10秒或更少)內(nèi)執(zhí)行編碼或解碼處理,絕對數(shù)量的文檔也可能持續(xù)占用大量處理器的全部處理容量。如上所述,當降低的圖像質(zhì)量隨著時間的過去而變得愈加可容忍時,為了降低存儲成本,需要甚至更多的處理。也就是,為了從已經(jīng)被壓縮的數(shù)據(jù)增強圖像壓縮,如上面包括的發(fā)明申請序列號09/760,383所述,需要首先從壓縮數(shù)據(jù)對圖像進行解碼,然后使用不同的量化表對圖像進行再次編碼,以便進一步減少數(shù)據(jù)量。該處理時間也表示巨大的成本,其在降低的所占存儲介質(zhì)量的成本上有效地增大存儲成本。相反,如果用于進一步數(shù)據(jù)減少的處理的成本能夠降低,則可以以在經(jīng)濟上可接受的成本將數(shù)據(jù)存儲更長的時間并且/或者存儲在具有更短訪問或檢索時間的存儲器中。
發(fā)明內(nèi)容因此,本發(fā)明的目的是提供一種能夠增大壓縮數(shù)據(jù)的壓縮程度并且在減少的處理時間內(nèi)減少圖像數(shù)據(jù)量的圖像數(shù)據(jù)處理方法和裝置。為了實現(xiàn)本發(fā)明的這些和其他目的,提供了一種用于對壓縮數(shù)據(jù)進行代碼轉換以便進一步壓縮的方法和裝置,其包括以下步驟(或用于執(zhí)行步驟的部件)對壓縮數(shù)據(jù)進行熵解碼以形成量化變換系數(shù)值,減小量化變換系數(shù)值的范圍以形成減小范圍的量化變換系數(shù)值,更改量化表中的至少一個值以形成更改的量化表,對所述減小范圍的量化變換系數(shù)值進行熵編碼,以形成進一步壓縮的數(shù)據(jù),以及與更改的量化表一起傳輸或存儲進一步壓縮的數(shù)據(jù)。從第一方面來看,本發(fā)明提供一種用于對壓縮數(shù)據(jù)進行代碼轉換以便進一步壓縮的方法,其包括以下步驟對所述壓縮數(shù)據(jù)進行熵解碼以形成量化變換系數(shù)值;減小所述量化變換系數(shù)值的范圍以形成減小范圍的量化變換系數(shù)值;更改量化表中的至少一個值以形成更改的量化表;對所述減小范圍的量化變換系數(shù)值進行熵編碼,以形成進一步壓縮的數(shù)據(jù);以及與所述更改的量化表一起傳輸或存儲所述進一步壓縮的數(shù)據(jù)。最好,本發(fā)明提供一種方法,其中所述減小范圍的步驟以系數(shù)2減小所述范圍。最好,本發(fā)明提供一種方法,其中所述更改的量化值在原始數(shù)據(jù)樣本中的8比特精度的1到255的范圍內(nèi)。最好,本發(fā)明提供一種方法,其中所述更改的量化值在原始數(shù)據(jù)樣本中的8比特精度的1到255的范圍內(nèi)。最好,本發(fā)明提供一種方法,其還包括以下步驟根據(jù)量化系數(shù)的變更來更改霍夫曼(Huffman)表,而不收集圖像的新統(tǒng)計信息。最好,本發(fā)明提供一種方法,其中從原始霍夫曼表數(shù)據(jù)來估計所述出現(xiàn)頻率。最好,本發(fā)明提供一種方法,其中從所述量化變換系數(shù)值的直方圖來確定所述出現(xiàn)頻率。最好,本發(fā)明提供一種方法,其中所述熵編碼步驟包括算術編碼。最好,本發(fā)明提供一種方法,其中所述量化變換系數(shù)值采用封裝(packed)格式。最好,本發(fā)明提供一種方法,其中更改所述量化表中的所述至少一個值的步驟與減小所述至少一個值的范圍的所述步驟互補。最好,本發(fā)明提供一種方法,其還包括以下步驟根據(jù)量化系數(shù)的變更來更改霍夫曼表,而不收集圖像的新統(tǒng)計信息。最好,本發(fā)明提供一種方法,其中從原始霍夫曼表數(shù)據(jù)來估計所述出現(xiàn)頻率。最好,本發(fā)明提供一種方法,其中從所述量化變換系數(shù)值的直方圖來確定所述出現(xiàn)頻率。最好,本發(fā)明提供一種方法,其中所述熵編碼步驟還包括算術編碼。最好,本發(fā)明提供一種方法,其中所述變換系數(shù)值采用封裝格式。最好,本發(fā)明提供一種方法,其還包括以下步驟根據(jù)之字形掃描位置上非零量化變換系數(shù)的出現(xiàn)頻率,阻止變更所述之字形掃描位置上的量化變換系數(shù),并且阻止變更所述之字形掃描位置上的所述量化表中的量化值。最好,本發(fā)明提供一種方法,其還包括以下步驟根據(jù)之字形掃描位置上非零量化變換系數(shù)的出現(xiàn)頻率,阻止變更所述之字形掃描位置上的量化變換系數(shù),并且阻止變更所述之字形掃描位置上的所述量化表中的量化值。從第二方面來看,本發(fā)明提供一種用于對壓縮數(shù)據(jù)進行代碼轉換以便進一步壓縮的裝置,其包括以下部件用于對所述壓縮數(shù)據(jù)進行熵解碼以形成量化變換系數(shù)值的部件;用于減小所述量化變換系數(shù)值的范圍以形成減小范圍的量化變換系數(shù)值的部件;用于更改量化表中的至少一個值以形成更改的量化表的部件;用于對所述減小范圍的量化變換系數(shù)值進行熵編碼以形成進一步壓縮的數(shù)據(jù)的部件;以及用于與所述更改的量化表一起傳輸或存儲所述進一步壓縮的數(shù)據(jù)的部件。從第三方面來看,本發(fā)明提供一種計算機程序產(chǎn)品,其直接可裝載到數(shù)字計算機的內(nèi)部存儲器中,包括用于當在計算機上運行所述產(chǎn)品時執(zhí)行從而實現(xiàn)如上所述的本發(fā)明的軟件代碼部分?,F(xiàn)在將參照附圖僅作為示例對本發(fā)明的實施例進行描述,其中圖1是示出增大壓縮圖像數(shù)據(jù)的壓縮程度的示例性技術的流程圖或高級方框圖;以及圖2是示出根據(jù)本發(fā)明的處理壓縮圖像數(shù)據(jù)以在減少的處理時間內(nèi)增大壓縮程度的流程圖或高級方框圖。具體實施例方式現(xiàn)在參照附圖,并且特別是圖1,其中示出了增大壓縮圖像數(shù)據(jù)的壓縮程度的示例性技術的流程圖或高級方框圖。圖1主要涉及這樣一種裝置和方法,其用于產(chǎn)生對文檔圖像數(shù)據(jù)的增大壓縮以大幅減少其數(shù)據(jù)量,同時保持可辨認性和文檔圖像質(zhì)量以及與標準解碼處理的兼容性而無需后處理(如美國專利06606418的圖7所示)。該功能是通過如下方式實現(xiàn)的減小圖像數(shù)據(jù)的動態(tài)范圍,使用第一量化表對減小動態(tài)范圍的數(shù)據(jù)進行編碼,并且與不同的量化表一起存儲或傳輸編碼圖像數(shù)據(jù),其中該量化表在另外的傳統(tǒng)解碼期間恢復原始圖像數(shù)據(jù)的動態(tài)范圍。具體地說,該圖示出將該技術應用于已經(jīng)通過根據(jù)JPEG標準進行編碼而壓縮的圖像數(shù)據(jù)。因此,圖1中的任何部分都不被認為是關于本發(fā)明的現(xiàn)有技術,而是被標注為“相關技術”,因為提供它是為了幫助理解如圖2所示并在下面討論的本發(fā)明及其有益效果,不過這里沒有反映本發(fā)明的區(qū)別特征。更具體地說,文檔圖像中存在的圖像值允許圖像值的動態(tài)范圍的減小,其可在以后被恢復同時保持細節(jié)和可辨認性。動態(tài)范圍的這種減小,雖然理論上導致信息和圖像保真度的一些損失,但是允許圖像數(shù)據(jù)的進一步壓縮,其超過當前為短期、高速訪問存儲裝置采用的圖像數(shù)據(jù)壓縮,并且允許以其范圍通常為2到5或更大的系數(shù)來減少數(shù)據(jù)量,同時將圖像質(zhì)量保持在可辨認的級別。如上面包括的申請所述,甚至還可以增強低對比度特征的可辨認性。如果不考慮處理成本,數(shù)據(jù)量的這種減少將以類似的系數(shù)來降低存儲成本。然而,如上面提到的那樣,已經(jīng)發(fā)現(xiàn),期望存儲大量文檔如個人支票,并且處理已經(jīng)采取壓縮的形式存儲在數(shù)據(jù)庫中的大量文檔以便降低將來的存儲成本或提供更高速可訪問性的成本將是相當高的。通過考慮圖1,能夠更容易地理解該成本,其中該圖示出用于從單個文檔的數(shù)字存儲數(shù)據(jù)進一步減少數(shù)據(jù)量的過程。首先,檢索圖像710,并且如果該圖像采用任何壓縮技術包括無損編碼被壓縮過720,而不是作為原始數(shù)據(jù)來存儲的,則通過適當?shù)慕獯a器對其進行解壓縮/解碼730,以恢復原始圖像數(shù)據(jù)。在上面包括的申請中討論的可選直方圖和預處理未在圖1中示出,但是如果需要可以被包括。在塊740中,減小圖像范圍,如果在750確定減小范圍的圖像數(shù)據(jù)要被壓縮(可能采用不同的壓縮技術),則對其進行編碼760。然后,與范圍擴展信息一起存儲減小范圍的圖像(經(jīng)過或未經(jīng)壓縮)770。對于基于JPEGDCT的壓縮,該范圍擴展信息可以是替換的、經(jīng)過比例放縮(scaled)的Q表2的形式。對于其他應用,其可以是JPEG-LS輸出再映射表的形式。本領域的技術人員可以容易地理解,解碼圖像處理730包括熵解碼、反量化和反離散余弦變換(IDCT)處理。熵解碼是能夠相對快速執(zhí)行的處理。(熵編碼利用這樣的事實,即較常見的值以較少的比特表達是合適的,而表示相對較多信息的較不常見值以相對較多的比特表達是合適的。)另一方面,反量化和IDCT處理在計算上是相當密集的。減小圖像范圍的處理740可利用查詢表來執(zhí)行,從而對于每個圖像數(shù)據(jù)樣本需要兩次存儲器訪問和一次存儲操作。對圖像進行編碼的處理760需要在計算上密集的正向離散余弦變換(DCT)操作、量化和熵編碼。本領域的技術人員還可以容易地理解和清楚,圖1的上面過程完全且充分地重構圖像數(shù)據(jù)以便顯示或其他表現(xiàn)(例如,打印),而處理740-770相同于根據(jù)上面包括的申請對原始圖像數(shù)據(jù)執(zhí)行的處理,以便實現(xiàn)超過標準JPEG處理的增大程度的壓縮,同時保持文檔圖像特征的細節(jié)和可辨認性。因此,數(shù)據(jù)可被描述為從變換域轉換到圖像域(有時稱作真實和/或像素域),并且轉換回到變換域。因此,所涉及的過程實質(zhì)上是彼此互逆的處理,其中的任一個或兩者在計算上都可能是密集的,并且當大量的文檔集中在一起時需要相當多的處理時間。當數(shù)據(jù)保持在變換域中時,本發(fā)明提供相同的結果,因此避免了執(zhí)行若干對實質(zhì)上互逆且互補的處理,同時如下所述產(chǎn)生數(shù)據(jù)的一些附加壓縮。由于數(shù)據(jù)沒有返回到其原始形式,因此該過程被很好地描述為代碼轉換。現(xiàn)在將根據(jù)圖2的流程圖說明本發(fā)明的基本過程,該圖還可以被理解成這樣一種裝置的高級方框圖,其中該裝置用于在通過程序配置成用于執(zhí)行所示功能的設備的編程通用計算機或者類似配置的專用邏輯處理電路中執(zhí)行所示的功能,這一點對于本領域的技術人員將是清楚的。為便于下面討論起見,假定已經(jīng)以某種壓縮形式如遵循JPEG標準的代碼對圖像數(shù)據(jù)進行了編碼。需要理解的是,本發(fā)明完全適用于任何其他壓縮編碼方案,并且上面的假定僅僅避免原始數(shù)據(jù)不是壓縮形式的情況(例如,原始圖像數(shù)據(jù)),在上面包括的申請中對該情況提供了適合且優(yōu)選的方法和裝置。作為本發(fā)明的過程和裝置的概述,一旦檢索出壓縮圖像數(shù)據(jù)(210),就對該壓縮數(shù)據(jù)進行熵解碼220,以便將數(shù)據(jù)恢復成量化系數(shù)的格式。然后,優(yōu)選地采用下面將要詳述的簡化過程,如240所示可以直接減小量化系數(shù)的動態(tài)范圍,并且執(zhí)行熵編碼260。然后,通過如270所示與擴展信息一起存儲(或者傳輸)所得到的熵編碼數(shù)據(jù),完成進一步的壓縮。該擴展信息可以與范圍的減小互補或者可以為提供一些圖像增強而選擇。如上面提到的那樣,通過避免互逆且互補的操作對,一般可以在圖1的完全圖像解碼處理730所需的處理時間的1/4內(nèi)執(zhí)行熵解碼處理230。類似地,一般可以在完全圖像編碼處理所需的時間的少于1/4內(nèi)完成熵編碼處理而不考慮所采用的壓縮技術或標準。一般而言,特別是通過下面討論的優(yōu)選技術,與減小圖像數(shù)據(jù)的動態(tài)范圍相比,可以更快速地執(zhí)行減小量化系統(tǒng)范圍的處理。因此,本發(fā)明提供的處理速度的增益系數(shù)至少為4,并且在甚至考慮使用專用處理器來執(zhí)行DCT和IDCT以及量化和反量化處理的情況下,通常能夠大得多。熵解碼和編碼過程是公知的,并且無需作進一步的討論,不過需要注意的是,對于熵編碼,統(tǒng)計分析經(jīng)常地可被省略,或者以對原始壓縮數(shù)據(jù)的熵編碼的相對簡單的操縱或JPEG標準所允許的對熵編碼的可選方案來替代。減小量化系數(shù)的范圍的處理240可以使用查詢表(LUT)來完成,這意味著對于被處理的每個量化系數(shù)存在兩次存儲器訪問和一次存儲操作,或者需要如圖1的對應操作740對每個圖像樣本所做的那樣來減小范圍。然而,圖1的圖像數(shù)據(jù)的樣本數(shù)目總是每宏塊64個,而相同宏塊(在塊結束(EOB)標記/符號之前)的量化系數(shù)(根據(jù)編碼約定包括一些零值系數(shù))數(shù)目經(jīng)常遠遠小于64,并且經(jīng)常遠遠小于16。此外,由于只能減小非零量化系數(shù),因此實際的量化系數(shù)數(shù)目經(jīng)常甚至更少。而且,當之字形掃描位置(即變換塊中的位置)上非零系數(shù)的稀少不值得(justify)額外的計算和可能的邊沿惡化時,一些系數(shù)可以保持不變,在這種情況下,對應于其位置的量化值在范圍恢復數(shù)據(jù)中也必須保持不變。因此,實際上,減小量化系數(shù)范圍的處理時間經(jīng)常比減小圖像樣本的動態(tài)范圍所需的時間的1/4還少得多。此外,如果范圍減小對于減小了其范圍的所有量化系數(shù)都是不變的,則只需一個LUT。甚至更簡單和迅速的方案也經(jīng)常提供良好的結果。例如,以2的系數(shù)減小范圍在一些情況下是優(yōu)選的,這消除了任何LUT的需要,并且范圍減小可通過簡單的幅度偏移來實現(xiàn)。該簡單范圍減小實施例的特殊例子是,如在上面包括的美國專利申請序列號09/736,444和/或序列號09/896,110中所公開的那樣,采用封裝格式來維護或提供數(shù)據(jù),其中以2的冪減小范圍包括從前一RS字節(jié)中的大小減去2的冪數(shù)。如果在范圍減小中該RS字節(jié)中的大小值小于2的冪,則該系數(shù)已被減至零,并且必須擴展該運行趟(run)中的系數(shù)數(shù)目,從而若有的話,在其任一側合并新的零系數(shù)與零的運行趟。然而,采用新封裝格式的減小范圍數(shù)據(jù)中的字節(jié)總數(shù)將保持相同,或者更經(jīng)常地減少,并且采用JPEG封裝格式不可能需要更大數(shù)目的比特或字節(jié)。因此,雖然使用JPEG封裝格式可能需要少量的相對簡單的附加處理,但是可以采用減小范圍的數(shù)據(jù)覆寫相同的緩沖區(qū)。然后,對減小范圍的數(shù)據(jù)進行重新熵編碼,以獲得大幅增大的壓縮。在這一點上需要注意的是,緩沖區(qū)保存每系數(shù)需要至少兩字節(jié)非零的未壓縮量化系數(shù),而霍夫曼代碼可以只需幾個比特。一般而言,對于最大數(shù)據(jù)壓縮,可以使用JPEG算術編碼選項來自動提供接近于熵極限的重新熵編碼數(shù)據(jù);因此改善了壓縮,同時避免了任何圖像惡化,并且避免了用于收集定制霍夫曼熵編碼的統(tǒng)計信息的一些處理時間。然后,需要時可以在以后將數(shù)據(jù)轉換成基線JPEG。此外關于JPEG封裝格式,在上面包括的申請中公開了通過其幫助特定處理。具體地說,JPEG封裝格式允許簡化為減小范圍的編碼器生成定制霍夫曼表。定制霍夫曼表可以與經(jīng)過算術編碼的圖像一起保存,以便在以后轉換回到基線JPEG壓縮。這些定義霍夫曼表(DHT)標記可以與采用“針對表簡化的JPEG規(guī)范(JPEG-abbreviated-for-table-specification)”數(shù)據(jù)格式的JPEG圖像編碼數(shù)據(jù)分開存儲,以便如果算術編碼版本足夠,則不傳輸這些額外的字節(jié)。(注意,如果不需要霍夫曼版本,則將不需要DHT標記。如果需要轉換回到霍夫曼,則使用DHT標記,因為接收器的解碼器不知道如何對進一步壓縮的算術編碼版本進行解碼。)可選地,如上面包括的Pennebaker等人的出版物所詳述,未用的定制霍夫曼表可以保存在JPEG應用標記(APPn標記)中。可以登記該標記的字段以允許解釋數(shù)據(jù)。該標記可以與圖像數(shù)據(jù)嵌入在一起,或者保持獨立。如果注意范圍減小處理,可以從范圍減小之前的表估計近似的定制霍夫曼表。例如,可以從所施加的范圍減小量估計概率分布的偏移。如果解碼器中的霍夫曼表不是采用JPEG標準提供的示例性霍夫曼表,則特別是在RS符號值沒有數(shù)字順序的情況下,可以假定它是定制表。如果假定某分布對應于每碼字長度的符號數(shù),則在給定動態(tài)范圍減小量的情況下可以計算新的分布。如果給定R/S符號的代碼為N比特,則該組內(nèi)的所有相對部分之和總計為1/2N。相對頻率可以在該類別內(nèi)的所有2N個級別之間平分??蛇x地,可以對其進行調(diào)整,使得更小的級別是更可能的。只要總相對頻率匹配原始類別的相對頻率,則將相同的霍夫曼代碼長度分配給不變數(shù)據(jù)。然后,動態(tài)范圍減小將這些級別聚集在一起。然后,對于未減至零的級別,可以組合這些群集,以收集這些類別的相對頻率。保守性估計將忽略運行趟變長的影響。注意,由于不能創(chuàng)建任何新的非零系數(shù),因此運行趟不會變短。較早出現(xiàn)的塊結束(EOB)的影響的估計可以通過觀察對于期望的范圍減小典型的圖像如何改變其統(tǒng)計信息來以經(jīng)驗方式確定。必須注意,允許所組合的所有可能零運行趟的大小高達最大可能值,因為先前定制表可具有未用符號的間隙,并且除非收集實際的直方圖,否則不允許這些間隙。只要滿足該條件,該方法允許從一個定制霍夫曼表立即轉換到另一個定制霍夫曼表而不必收集新的直方圖;幫助保持本發(fā)明在其他方面實現(xiàn)的處理時間減小的增益。上面已經(jīng)提到,當額外的壓縮不值得其計算和可能的邊沿惡化時,無需改變一些量化系數(shù),或者禁止修改。關于是否應當修改特定之字形掃描次序位置中的量化變換系數(shù)的判定可以基于每個之字形掃描位置上非零變換系數(shù)數(shù)目的可選直方圖來進行,或者例如從原始數(shù)據(jù)中的定制霍夫曼表來估計。對于具有頻繁出現(xiàn)的非零量化變換系數(shù)的那些之字形掃描位置,將獲得最大的壓縮增益。對于非零量化變換系數(shù)出現(xiàn)很少的位置,壓縮增益將不值得其計算時間或者即使非常輕微的圖像質(zhì)量惡化。然而,所獲得或估計的非零量化變換系數(shù)數(shù)目的統(tǒng)計信息可以提供對壓縮增益和存儲節(jié)省的估計,因此幫助識別量化系數(shù)不應被改變的之字形掃描位置。例如,在支票的背面,背書將不總是具有高對比度,而防偽圖案在高/大得多的數(shù)目上很有可能具有相差非常大的統(tǒng)計信息。如果將不修改具有相對不頻繁出現(xiàn)的非零量化系數(shù)的之字形掃描位置上的量化變換系數(shù)的基本原理應用于這種情況,則背書的圖像值將很有可能不被修改那么多,并且可以導致保持背書的可辨認性和細節(jié)。在變換域而非真實或像素域中進行范圍減小的一個重要優(yōu)點是這樣能夠以不同方式按照之字形掃描次序處理不同位置上的變換系數(shù),因此保持可能具有較大重要性的圖像特征(這可以通過相對出現(xiàn)頻率來表示),同時實現(xiàn)非常高的數(shù)據(jù)壓縮。如果使用了定制霍夫曼表(或者在需要將算術編碼轉換成基線霍夫曼表的情況下包括其),則可以在用來估計停止修改系數(shù)的之字形掃描位置的功能中包括分配給塊結束(EOB)代碼的比特數(shù)。在JPEG技術規(guī)范的附錄K(包括在上面引作參考的文獻中)內(nèi)列出的AC系數(shù)霍夫曼代碼表中,與在色度表中具有兩比特代碼長度相比,EOB在亮度表中具有四比特代碼長度。與其他運行趟/大小組合的長度相結合,可以獲得在之字形掃描次序中何時停止修改系數(shù)的估計,以及來自這些修改的比特節(jié)省的估計。亮度AC系數(shù)表中EOB的較長代碼長度表示應當在更多的之字形掃描位置上修改量化變換系數(shù)。在這一點上,還必須注意避免允許改變后的量化表值超過原始樣本中的八比特精度的255(或者基于數(shù)據(jù)原始精度的其他最大值)。(不允許零值,因此所允許的范圍為1到255。)如果解碼器的量化表在變更以補償范圍減小之前已經(jīng)為255,則這些量化系數(shù)在小于范圍減小的情況下可以設為零,但不被減小,因為這些量化值已經(jīng)為其最大值,并且當量化值限于八比特(例如,對于基線熵編碼)時,附加的范圍恢復是不可能的。通過前文可以看到,本發(fā)明通過緊接在熵解碼之后在變換域中進行范圍減小來在對編碼信號進行代碼轉換的期間執(zhí)行附加的壓縮,從而為增大文檔圖像數(shù)據(jù)的壓縮提供大幅的處理時間減小,這在能夠進行重新熵編碼之前避免了在計算上密集的以下操作反量化、向真實/圖像域的反變換、在真實/圖像域中的范圍減小、以及之后的返回到變換域的正變換和重新量化。因此,根據(jù)本發(fā)明的進一步壓縮的處理時間很有可能不大于在真實或圖像像素數(shù)據(jù)域中執(zhí)行壓縮時所需的處理時間的1/4。當按比例縮小量化系數(shù)時,改變霍夫曼表的統(tǒng)計信息。修改的霍夫曼表可以通過使用舊表來估計符號的相對頻率然后適當?shù)匕幢壤趴s符號來估計。例如,以二的系數(shù)按比例縮小量化系數(shù)將合并相鄰的系數(shù)頻率。平均起來,對于該情況,每個霍夫曼代碼將需要少一個比特,因為兩個頻率已被組合。處理時間和成本的這一減少對應于圖像存儲成本的直接和大量降低,從而經(jīng)濟地提供在延長的時間內(nèi)對這些圖像的高速和“在線”訪問,并且允許更容易且高效地向壓縮形式的這種數(shù)據(jù)的現(xiàn)有數(shù)據(jù)庫提供這些益處。雖然本發(fā)明是按照單個優(yōu)選實施例來描述的,但是本領域的技術人員應當認識到,可以在所附權利要求的精神和范圍內(nèi)通過修改來實施本發(fā)明。具體地說,本發(fā)明可以容易地應用于采用任何壓縮技術和其他有損、基于變換的壓縮算法以及遵循JPEG標準的技術經(jīng)過壓縮的壓縮數(shù)據(jù)。權利要求1.一種用于對壓縮數(shù)據(jù)進行代碼轉換以便進一步壓縮的方法,包括以下步驟對所述壓縮數(shù)據(jù)進行熵解碼,以形成量化變換系數(shù)值;減小所述量化變換系數(shù)值的范圍,以形成減小范圍的量化變換系數(shù)值;更改量化表中的至少一個值,以形成更改的量化表;對所述減小范圍的量化變換系數(shù)值進行熵編碼,以形成進一步壓縮的數(shù)據(jù);以及與所述更改的量化表一起傳輸或存儲所述進一步壓縮的數(shù)據(jù)。2.如權利要求1所述的方法,其中所述減小范圍的步驟以系數(shù)2減小所述范圍。3.如權利要求1所述的方法,其中所述更改的量化值在原始數(shù)據(jù)樣本中的8比特精度的1到255的范圍內(nèi)。4.如權利要求2所述的方法,其中所述更改的量化值在原始數(shù)據(jù)樣本中的8比特精度的1到255的范圍內(nèi)。5.如權利要求1所述的方法,還包括以下步驟根據(jù)量化系數(shù)的變更來更改霍夫曼表,而不收集圖像的新統(tǒng)計信息。6.如權利要求5所述的方法,其中從原始霍夫曼表數(shù)據(jù)來估計所述出現(xiàn)頻率。7.如權利要求5所述的方法,其中從所述量化變換系數(shù)值的直方圖來確定所述出現(xiàn)頻率。8.如權利要求1所述的方法,其中所述熵編碼步驟包括算術編碼。9.如權利要求1所述的方法,其中所述量化變換系數(shù)值采用封裝格式。10.如權利要求1所述的方法,其中更改所述量化表中的所述至少一個值的所述步驟與減小所述至少一個值的范圍的所述步驟互補。11.如權利要求2所述的方法,還包括以下步驟根據(jù)量化系數(shù)的變更來更改霍夫曼表,而不收集圖像的新統(tǒng)計信息。12.如權利要求11所述的方法,其中從原始霍夫曼表數(shù)據(jù)來估計所述出現(xiàn)頻率。13.如權利要求11所述的方法,其中從所述量化變換系數(shù)值的直方圖來確定所述出現(xiàn)頻率。14.如權利要求2所述的方法,其中所述熵編碼步驟還包括算術編碼。15.如權利要求2所述的方法,其中所述變換系數(shù)值采用封裝格式。16.如權利要求1所述的方法,還包括以下步驟根據(jù)之字形掃描位置上非零量化變換系數(shù)的出現(xiàn)頻率,阻止變更所述之字形掃描位置上的量化變換系數(shù);以及阻止變更所述之字形掃描位置上的所述量化表中的量化值。17.如權利要求2所述的方法,還包括以下步驟根據(jù)之字形掃描位置上非零量化變換系數(shù)的出現(xiàn)頻率,阻止變更所述之字形掃描位置上的量化變換系數(shù);以及阻止變更所述之字形掃描位置上的所述量化表中的量化值。18.一種用于對壓縮數(shù)據(jù)進行代碼轉換以便進一步壓縮的裝置,包括以下部件用于對所述壓縮數(shù)據(jù)進行熵解碼以形成量化變換系數(shù)值的部件;用于減小所述量化變換系數(shù)值的范圍以形成減小范圍的量化變換系數(shù)值的部件;用于更改量化表中的至少一個值以形成更改的量化表的部件;用于對所述減小范圍的量化變換系數(shù)值進行熵編碼以形成進一步壓縮的數(shù)據(jù)的部件;以及用于與所述更改的量化表一起傳輸或存儲所述進一步壓縮的數(shù)據(jù)的部件。19.一種計算機程序產(chǎn)品,直接可裝載到數(shù)字計算機的內(nèi)部存儲器中,包括用于當在計算機上運行所述產(chǎn)品時執(zhí)行從而實現(xiàn)如權利要求1到17所述的方法的軟件代碼部分。全文摘要通過在變換域中進行代碼轉換的期間執(zhí)行進一步的壓縮而不將圖像數(shù)據(jù)恢復到其原始圖像數(shù)據(jù)形式,以減少的時間執(zhí)行允許在延長的時間內(nèi)將數(shù)據(jù)經(jīng)濟地存儲在高速訪問存儲器中的進一步數(shù)據(jù)壓縮。通過在對熵解碼量化變換數(shù)據(jù)的范圍減小期間利用大量的零值量化變換系數(shù)并且不改變非零系數(shù)稀少的之字形掃描位置上的量化變換系數(shù),實現(xiàn)處理時間的減少。通過計算或估計與進一步壓縮的量化值一起存儲的變更量化表,可以恢復范圍。其他的優(yōu)點得自于在代碼轉換期間對數(shù)據(jù)使用JPEG封裝格式。文檔編號G06T9/00GK1692375SQ03821292公開日2005年11月2日申請日期2003年9月12日優(yōu)先權日2002年10月4日發(fā)明者瓊·密特切爾,拉沃爾·普拉卡施申請人:國際商業(yè)機器公司