專利名稱:基于白平衡的數(shù)碼相機(jī)圖像與計算機(jī)生成圖像區(qū)分方法
技術(shù)領(lǐng)域:
本發(fā)明屬于多媒體取證領(lǐng)域,尤其涉及一種基于白平衡的數(shù)碼相機(jī)圖像與計算機(jī)生成圖像區(qū)分方法。
背景技術(shù):
個人電腦與互聯(lián)網(wǎng)的普及標(biāo)志著數(shù)字時代的到來。數(shù)字時代的便利不言而喻,但由此產(chǎn)生的社會問題也隨之而來,譬如‘電子犯罪’。隨著不斷攀升的電子犯罪案件,數(shù)字取證(digitalforensics)技術(shù)應(yīng)運(yùn)而生。它是將包括數(shù)字信號產(chǎn)生、存儲、傳輸?shù)鹊南嚓P(guān)信息作為犯罪調(diào)查與法律事務(wù)所需的證據(jù),例如電子郵件,辦公文檔、音、視頻、圖像,上網(wǎng)記錄、內(nèi)存數(shù)據(jù)、GPS信息等。在數(shù)字取證學(xué)科的多個方向中,多媒體取證技術(shù)為近年來剛剛興起的熱門方向。多媒體取證主要驗證數(shù)字信息(如數(shù)字圖像、視頻、音頻等)的真實性與可靠性,主要用途是用于在法庭上驗證數(shù)字證據(jù)的可靠性,是否可以采信等。如今,數(shù)字圖像因其迅速普及、廣泛傳播和極易修改等特性引起了人們的廣泛關(guān)注。數(shù)字圖像隨處可見,報刊、雜志、網(wǎng)絡(luò)等等都其傳播途徑。于此同時,越來越強(qiáng)大的照片編輯軟件使得即使是普通人依然可以通過個人電腦對數(shù)字圖像進(jìn)行編輯及修改,甚至偽造照片。隨著圖像編輯軟件的升級,篡改圖像、計算機(jī)生成圖像越來越逼真,甚至難以用肉眼區(qū)分其真實性。然而,除了某些特定的娛樂場景,大多數(shù)時候,人們都需要確切地知道所看到的數(shù)字圖像真?zhèn)巍L貏e是一旦牽扯到經(jīng)濟(jì)利益、個人聲譽(yù)、輿論導(dǎo)向、犯罪調(diào)查等等,數(shù)字圖像內(nèi)容的真實性、來源的可靠性更是必須確認(rèn)的信息。不幸的是,偽造圖像早已深入到我們的生活,科學(xué)、政治、商業(yè)、法律、媒體等諸多領(lǐng)域均受到了不同程度的影響。而傳統(tǒng)的驗證方法難以應(yīng)付今日的數(shù)字圖像“信譽(yù)危機(jī)”。為了更好的應(yīng)對數(shù)字圖像的安全問題,數(shù)字圖像被動取證技術(shù)應(yīng)用而生。數(shù)字圖像被動取證技術(shù)屬于近年來出現(xiàn)的前沿研究領(lǐng)域,其在醫(yī)學(xué)、軍事、法庭證據(jù)、新聞報道、保險事故調(diào)查、電子商務(wù)等領(lǐng)域均有涉獵,應(yīng)用十分廣泛。國內(nèi)外研究尚處于初級階段,技術(shù)上雖面臨著諸多挑戰(zhàn),但絲毫不影響市場對其的迫切需求,應(yīng)用前景看好。數(shù)碼相機(jī)圖像與計算機(jī)生成圖像區(qū)分是數(shù)字圖像被動取證技術(shù)中的一個熱門研究分支。在制圖軟件泛濫的今天,計算機(jī)生成圖像已經(jīng)可以做到“以假亂真”的逼真效果。如何區(qū)分圖像內(nèi)容是數(shù)碼相機(jī)拍攝得到的自然圖片,是對真實世界的記錄及反映;還是只是計算機(jī)制圖技術(shù)的體現(xiàn),內(nèi)容并不真實,甚至是對現(xiàn)實的扭曲,并可誤導(dǎo)公眾。這些都是在面對非娛樂(如刑事偵查、法庭舉證等)場景中所必須回答出的問題。也是本專利研究的重點(diǎn)。傳統(tǒng)的用于數(shù)字相機(jī)圖像與計算機(jī)生成圖像區(qū)分的方法是基于小波檢測的區(qū)分方法。這類方法往往通過對小波進(jìn)行多級分解,并在各個子帶上求取多個統(tǒng)計量以組成區(qū)分特征。在現(xiàn)有的這類方法中,常見的做法是為了提高區(qū)分精度而不斷的增大小波分解的級數(shù),并在更多子帶上求取統(tǒng)計特征,用不斷增多假設(shè)條件、增大區(qū)分特征維度為代價來換取區(qū)分精度的提高,這必然會導(dǎo)致統(tǒng)計特征維度偏大;與此同時,小波變換并不能很好的挖掘圖像的邊緣信息,而數(shù)碼相機(jī)所拍攝得到的真實世界圖像與計算機(jī)生成的人工圖像間的重要區(qū)別之一就在與邊緣細(xì)節(jié)的不同,這亦導(dǎo)致了區(qū)分精度仍有待提高的不足。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服上述不足之處,從而解決數(shù)碼相機(jī)圖像與計算機(jī)生成圖像區(qū)分中,統(tǒng)計特征維度過大、區(qū)分精度不高的問題。本發(fā)明提供一種基于白平衡的數(shù)碼相機(jī)圖像與計算機(jī)生成圖像區(qū)分方法,包含以下步驟步驟1,建立圖像數(shù)據(jù)庫,圖像數(shù)據(jù)庫中包括若干數(shù)碼相機(jī)圖像和若干計算機(jī)生成圖像;步驟2,對圖像數(shù)據(jù)庫中的每一幅圖像進(jìn)行統(tǒng)計特征提取,獲得特征向量集;步驟3,將步驟2中所得的特征向量集送入分類器中訓(xùn)練,得到用于區(qū)分?jǐn)?shù)碼相機(jī)圖像與計算機(jī)生成圖像的區(qū)分模型;步驟4,對待測的圖像進(jìn)行統(tǒng)計特征提取,所得特征向量送入分類器,通過步驟3所得區(qū)分模型進(jìn)行判斷。而且,步驟2和步驟4中,對任一圖像進(jìn)行統(tǒng)計特征提取的實現(xiàn)方式包括以下子步驟,步驟2. 1,選擇η種白平衡算法,對圖像進(jìn)行η種白平衡算法的光源估計;步驟2. 2,針對步驟2.1所得η種光源估計,分別計算R,G, B三個通道上的增益系數(shù),列舉這3 Xn個增益系數(shù),其中ce {r,g,b},i = {I, 2,..., η};步驟2. 3,依據(jù)步驟2. 2中求得的3Xn個增益因子,通過公式次-1)計算得到另外的3Xn個統(tǒng)計特征; 步驟2. 4,將步驟2. 2求得的增益系數(shù)作為第I至第3Xn個特征,將步驟2. 3求得的統(tǒng)計特征4作為第3Xn+l至第6Xn個特征,組合成為最終的特征向量。而且,取n=5。本發(fā)明追求性能更優(yōu)的數(shù)字圖像鑒別方法,用于在數(shù)字圖像鑒權(quán)中判斷圖像是否為數(shù)碼相機(jī)拍攝得到的真實圖像,還是通過制圖軟件生成的人工圖像,進(jìn)而為圖像內(nèi)容真實與否提供可靠的判斷依據(jù),以利于我國刑偵技術(shù)研究的發(fā)展、推進(jìn)相關(guān)法律的制定。
具體實施例方式本發(fā)明通過分析數(shù)碼相機(jī)成像與計算機(jī)制圖軟件成像的原理,指出了數(shù)碼相機(jī)拍照成像過程中,必須經(jīng)過白平衡處理這一步驟,而計算機(jī)成像則不必如此,然后以此不同之處為出發(fā)點(diǎn),設(shè)計出來一種基于白平衡的數(shù)碼相機(jī)圖像與計算機(jī)生成圖像區(qū)分方法。該方法設(shè)計的基本原理如下多數(shù)白平衡處理的基本方法遵循Von Kries模型,即①對圖像光源進(jìn)行考察,評估圖像的色溫依據(jù)色溫估計的結(jié)果,設(shè)定圖像上每個顏色層的顏色調(diào)制增益因子依據(jù)設(shè)定的顏色調(diào)制增益因子,調(diào)制圖像顏色,所得的圖像即為白平衡處理過的圖像。對與數(shù)碼相機(jī)圖像而言,其圖像已經(jīng)經(jīng)過了一次白平衡處理,圖像上光源的色溫已經(jīng)相同或相近于白平衡算法所設(shè)定的標(biāo)準(zhǔn)光源色溫,而計算機(jī)生成圖像則不然。因此,如果對數(shù)碼相機(jī)圖像進(jìn)行白平衡處理,相當(dāng)于第二次白平衡處理,其顏色調(diào)制改動必然不大、甚至是不需要調(diào)制。而對計算機(jī)生成圖像進(jìn)行白平衡處理,此時相當(dāng)于第一次白平衡處理,其顏色調(diào)制改動相對較大。換句話說,圖像生成過程中白平衡處理有無可以通過對圖像色溫的評估進(jìn)行判斷。在圖像是否為相機(jī)拍攝的真實圖像、成像過程中經(jīng)過了何種白平衡處理算法等問題均未知的情況下,通過對已知圖像進(jìn)行多種白平衡色溫估計,并提取統(tǒng)計特征;而后采用分類器訓(xùn)練出區(qū)分模型的方法實現(xiàn)數(shù)碼相機(jī)圖像與計算機(jī)生成圖像的區(qū)分。實施例詳細(xì)說明本發(fā)明技術(shù)方案。本發(fā)明提供的一種基于白平衡的數(shù)碼相機(jī)圖像與計算機(jī)生成圖像區(qū)分方法,用于在數(shù)字圖像鑒權(quán)中判斷圖像是否為數(shù)碼相機(jī)拍攝得到的真實圖像,還是通過制圖軟件生成的人工圖像,進(jìn)而為圖像內(nèi)容真實與否提供可靠的判斷依據(jù)。本發(fā)明技術(shù)方案可采用計算機(jī)軟件技術(shù)實現(xiàn)自動運(yùn)行。以下通過實施例詳細(xì)說明本發(fā)明技術(shù)方案。實施例實現(xiàn)流程包含以下步驟步驟1,建立圖像數(shù)據(jù)庫具體實施時可建立用于訓(xùn)練數(shù)碼相機(jī)圖像與計算機(jī)生成圖像區(qū)分模型的專有圖像數(shù)據(jù)庫,包括有數(shù)碼相機(jī)圖像、計算機(jī)生成圖像若干(可自行收集,也可采用他人已建立的數(shù)據(jù)庫,如哥倫比亞大學(xué)的DVMM數(shù)據(jù)庫)。步驟2,統(tǒng)計特征提取 對圖像數(shù)據(jù)庫中的每一幅圖像均依據(jù)統(tǒng)計特征提取方法提取特征向量,獲得圖像數(shù)據(jù)庫中所有圖像的特征向量構(gòu)成的特征向量集。步驟3,訓(xùn)練區(qū)分模型將步驟2中所得的特征向量集送入分類器中訓(xùn)練,得到用于區(qū)分?jǐn)?shù)碼相機(jī)圖像與計算機(jī)生成圖像的區(qū)分模型;步驟4,待測圖像鑒別如需要判斷圖像是否為計算機(jī)生成圖像時,通過步驟2中一致的統(tǒng)計特征提取方法提取出待測圖像的特征,所得特征向量送入分類器,通過已經(jīng)訓(xùn)練好的區(qū)分模型進(jìn)行判斷。為便于實施參考,本發(fā)明實施例進(jìn)一步提供上述區(qū)分方法中提及的統(tǒng)計特征提取方法的具體求解步驟如下步驟2. 1,圖像光源估計實施例取n=5,對圖像進(jìn)行5種白平衡算法的第一步操作,即光源估計(一般有4種白平衡算法,Gray World, MaxRGB, Shades of Grey,以及 Grey Edge,但 Grey Edge 依據(jù)參數(shù)不同分為2種情況,總共5種光源估計法)。步驟2. 2,特征集一的提取針對步驟2.1的5種光源估計,分別計算R,G, B三個通道上的增益系數(shù),列舉這15個增益系數(shù),其中c e {r,g, b},i = {1,2,...,5},將這15個統(tǒng)計特征作為第I至第15個特征;步驟2. 3,特征集二的提取依據(jù)步驟2. 2中求得的15個增益因子,通過公式<-1)計算得到另外的15個統(tǒng)計特征,將這15個統(tǒng)計特征作為第16至第30個特征;其中,abs(.)表示的是取絕對值操作,英文為absolute,是各類計算機(jī)語言(包括C語目、VB語目、Pascal語目、Matlab語目等常用編程語目)中取絕對值的函數(shù)表達(dá)。
步驟2. 4,最終特征的形成將步驟2. 2求得的特征作為第I至第15個特征;將步驟2. 3求得的特征作為第16至第30個特征,合并組合成為最終的特征向量。本文中所描述的具體實施例僅僅是對本發(fā)明精神作舉例說明。本發(fā)明所屬技術(shù)領(lǐng)域的技術(shù)人員可以對所描述的具體實施例做各種各樣的修改或補(bǔ)充或采用類似的方式替代,但并不會偏離本發(fā)明的精神或者超越所附權(quán)利要求書所定義的范圍。
權(quán)利要求
1.一種基于白平衡的數(shù)碼相機(jī)圖像與計算機(jī)生成圖像區(qū)分方法,其特征在于包含以下步驟, 步驟1,建立圖像數(shù)據(jù)庫,圖像數(shù)據(jù)庫中包括若干數(shù)碼相機(jī)圖像和若干計算機(jī)生成圖像; 步驟2,對圖像數(shù)據(jù)庫中的每一幅圖像進(jìn)行統(tǒng)計特征提取,獲得特征向量集; 步驟3,將步驟2中所得的特征向量集送入分類器中訓(xùn)練,得到用于區(qū)分?jǐn)?shù)碼相機(jī)圖像與計算機(jī)生成圖像的區(qū)分模型; 步驟4,對待測的圖像進(jìn)行統(tǒng)計特征提取,所得特征向量送入分類器,通過步驟3所得區(qū)分模型進(jìn)行判斷。
2.如權(quán)利要求1所述基于白平衡的數(shù)碼相機(jī)圖像與計算機(jī)生成圖像區(qū)分方法,其特征在于 步驟2和步驟4中,對任一圖像進(jìn)行統(tǒng)計特征提取的實現(xiàn)方式包括以下子步驟, 步驟2. 1,選擇η種白平衡算法,對圖像進(jìn)行η種白平衡算法的光源估計; 步驟2. 2,針對步驟2.1所得η種光源估計,分別計算R,G, B三個通道上的增益系數(shù),列舉這 3Xn 個增益系數(shù)0^ :,其中 ce {r,g,b}, i = {I, 2,..., η}; 步驟2. 3,依據(jù)步驟2. 2中求得的3Χη個增益因子,通過公式吒_1)計算得到另外的3Xn個統(tǒng)計特征; 步驟2. 4,將步驟2. 2求得的增益系數(shù)作為第I至第3Xn個特征,將步驟2. 3求得的統(tǒng)計特征<作為第3Xn+l至第6Xn個特征,組合成為最終的特征向量。
3.如權(quán)利要求1所述基于白平衡的數(shù)碼相機(jī)圖像與計算機(jī)生成圖像區(qū)分方法,其特征在于取n=5。
全文摘要
本發(fā)明涉及一種多媒體取證技術(shù),特別是一種基于白平衡的數(shù)碼相機(jī)圖像與計算機(jī)生成圖像區(qū)分方法,以解決數(shù)字圖像內(nèi)容真實性鑒別的問題。利用數(shù)碼相機(jī)拍攝得到的圖像會遺留有白平衡處理過的痕跡,而計算機(jī)生成得到的圖像則不必經(jīng)過這個處理過程的原理,依據(jù)對待測圖像中白平衡處理痕跡的有無檢測,從而實現(xiàn)數(shù)碼相機(jī)圖像與計算機(jī)生成圖像區(qū)分。本發(fā)明可應(yīng)用于數(shù)字圖像鑒權(quán)系統(tǒng)的制定、正版卡通與盜版區(qū)分等應(yīng)用,對性能較好的數(shù)字圖像內(nèi)容真實性檢測方法的使用取得主動權(quán)。
文檔編號G06K9/62GK103065156SQ20121056389
公開日2013年4月24日 申請日期2012年12月21日 優(yōu)先權(quán)日2012年12月21日
發(fā)明者胡瑞敏, 高尚, 王中元, 張茂勝, 盧濤 申請人:武漢大學(xué)