文件保護及驗證方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及文件安全保護技術(shù)領(lǐng)域,特別是涉及一種文件保護及驗證方法。
【背景技術(shù)】
[0002]水印(Watermarking)技術(shù)是將一些標識信息(即水印)直接嵌入數(shù)字載體(包括多媒體、文檔、軟件等)當(dāng)中,但不影響原載體的使用價值,也不容易被人的知覺系統(tǒng)(如視覺或聽覺系統(tǒng))覺察或注意到。通過這些隱藏在載體中的信息,可以達到確認內(nèi)容創(chuàng)建者、購買者、傳送隱秘信息或者判斷載體是否被篡改等目的。目前已被廣泛應(yīng)用于文件的保護和防篡改,但其魯棒性差導(dǎo)致可靠性不佳是個明顯的技術(shù)缺陷。
[0003]以上【背景技術(shù)】內(nèi)容的公開僅用于輔助理解本發(fā)明的發(fā)明構(gòu)思及技術(shù)方案,其并不必然屬于本專利申請的現(xiàn)有技術(shù),在沒有明確的證據(jù)表明上述內(nèi)容在本專利申請的申請日已經(jīng)公開的情況下,上述【背景技術(shù)】不應(yīng)當(dāng)用于評價本申請的新穎性和創(chuàng)造性。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的主要目的在于提出一種文件保護方法,以解決上述現(xiàn)有技術(shù)存在的文件保護的可靠性不佳的技術(shù)問題。
[0005]為此,本發(fā)明提出一種文件保護方法,包括:數(shù)字文件或紙質(zhì)文件讀取步驟,即掃描所述數(shù)字文件或紙質(zhì)文件獲得原始圖;特征提取步驟,即對所述原始圖進行檢測以提取出具有至少一個保護特征的特征圖;
[0006]特征圖處理步驟,即根據(jù)所述特征圖生成第一鑒別信息,或?qū)λ鎏卣鲌D進行hash生成特征圖的信息摘要,再根據(jù)特征圖的信息摘要生成第一鑒別信息;
[0007]簽名步驟,即對所述第一鑒別信息進行數(shù)字化簽名并生成簽名文件的信息摘要;
[0008]保護信息生成步驟,即根據(jù)所述簽名文件的信息摘要,通過預(yù)定的加密算法生成加密數(shù)據(jù)矩陣;
[0009]保護文件生成步驟,即將所述加密數(shù)據(jù)矩陣獨立保存、合成至所述數(shù)字文件或打印到紙質(zhì)文件中。
[0010]優(yōu)選地,本發(fā)明還可以具有如下技術(shù)特征:
[0011]所述特征提取步驟之前還包括文件預(yù)處理步驟,即對所述原始圖進行降噪處理得到去噪圖像的步驟;該情況下,通過檢測所述去噪圖像而提取出具有至少一個保護特征的特征圖。
[0012]還包括定位步驟,即在所述數(shù)字文件或紙質(zhì)文件讀取步驟之后,進一步分析和確定后續(xù)所生成的保護信息的存放位置的步驟。
[0013]所述保護特征提取步驟還包括:將所述檢測圖除所述保護信息的存放位置以外的位置分為兩個以上區(qū)域,并逐個區(qū)域進行保護特征提取的子步驟。
[0014]所述保護信息生成步驟中,還同時寫入時間、文本尺寸、所述數(shù)字文件或紙質(zhì)文件的光譜和所述數(shù)字文件或紙質(zhì)文件的色譜中的至少一者。
[0015]所述保護特征包括文本的OCR特征、紋理特征、人臉識別特征和/或光譜特征。
[0016]所述文本的OCR特征通過光學(xué)字符識別技術(shù)獲取,所述人臉識別特征通過人臉識別算法獲得,所述紋理特征通過紋理分析技術(shù)提取,所述光譜特征通過光譜特征提取方法獲得。
[0017]所述紙質(zhì)文件是貼紙、標簽或薄木片,所述紋理特征是所述貼紙、標簽或薄木片自身具備的紋理特征。
[0018]本發(fā)明還提出一種文件驗證方法,用于如前任一項所述的文件保護方法獲得的保護文件,文件掃描,即掃描所述保護文件,得到掃描圖;特征提取,即檢測所述掃描圖以提取其保護特征,進而得到具有至少一個保護特征的特征圖;特征圖處理,即根據(jù)所述特征圖生成第二鑒別信息,或?qū)λ鎏卣鲌D進行hash生成特征圖的信息摘要,再根據(jù)特征圖的信息摘要生成第二鑒別信息;簽名驗證,即驗證所述保護文件中的簽名信息;匹配度計算,將前述獲得的所述第二鑒別信息與所述保護文件中的第一鑒別信息進行比對,以得到匹配度值;輸出驗證結(jié)果,當(dāng)所述匹配度值超出預(yù)定匹配度值時,認定為偽造或篡改文件,當(dāng)所述匹配度值在預(yù)定匹配度值范圍內(nèi)時,認定為未經(jīng)偽造或篡改的原件或復(fù)印件。
[0019]優(yōu)選的,所述匹配度值至少包括通過光學(xué)字符識別技術(shù)獲取的文本的OCR特征的匹配度值、通過人臉識別算法獲得的特征的匹配度值,通過紋理分析技術(shù)提取的紋理特征的匹配度值,以及通過光譜特征提取方法獲得的光譜特征的匹配度值中的至少一個;所述OCR特征的匹配度值、通過人臉識別算法獲得的特征的匹配度值和紋理特征的匹配度值用于認定文件內(nèi)容是否被篡改過,所述光譜特征的匹配度值用于認定文件是否是原件。
[0020]本發(fā)明與現(xiàn)有技術(shù)對比的有益效果包括:該文件保護方法可簡便快捷的生成魯棒性優(yōu)良的保護文件,且僅靠文本內(nèi)容即可實現(xiàn)保護及驗證,成本低,實用性強。
[0021 ] 本發(fā)明的文件驗證方法,可方便可靠的識別出目標文件是否被修改、復(fù)制等,可靠性高,且其實現(xiàn)過程簡單方便,成本低,實用性強。
【附圖說明】
[0022]圖1是本發(fā)明文件保護方法【具體實施方式】的示意圖(涵蓋了實施例一、實施例二和實施例三的情況);
[0023]圖2是實施例一中所得特征圖的示意圖;
[0024]圖3是本發(fā)明文件驗證方法【具體實施方式】的示意圖(涵蓋了分別對應(yīng)實施例一、實施例二和實施例三進行驗證的情況)。
【具體實施方式】
[0025]為方便理解,以下是后文中將出現(xiàn)的技術(shù)術(shù)語的具體說明:
[0026]1、hash,一般翻譯做“散列”,也有直接音譯為“哈?!钡模褪前讶我忾L度的輸入(又叫做預(yù)映射),通過散列算法,變換成固定長度的輸出,該輸出就是散列值。這種轉(zhuǎn)換是一種壓縮映射,也就是,散列值的空間通常遠小于輸入的空間,不同的輸入可能會散列成相同的輸出,所以不可能從散列值來唯一的確定輸入值。簡單的說就是一種將任意長度的消息壓縮到某一固定長度的消息摘要的函數(shù)。
[0027]I1、所述數(shù)字文件讀取步驟中提及的“掃描”,既包括各種數(shù)碼攝像裝置的拍照或掃描,也包括計算機中軟件的讀取處理(即由軟件執(zhí)行的格式轉(zhuǎn)化處理)。
[0028]下面結(jié)合【具體實施方式】并對照附圖對本發(fā)明作進一步詳細說明。應(yīng)該強調(diào)的是,下述說明僅僅是示例性的,而不是為了限制本發(fā)明的范圍及其應(yīng)用。
[0029]參照以下附圖1-3,將描述非限制性和非排他性的實施例,其中相同的附圖標記表示相同的部件,除非另外特別說明。
[0030]實施例一:
[0031]如圖1所示,本實施例的文件保護方法,包括如下步驟:
[0032]數(shù)字文件或紙質(zhì)文件讀取步驟,即掃描所述數(shù)字文件或紙質(zhì)文件獲得原始圖。該步驟相當(dāng)于將數(shù)字文件或紙質(zhì)文件做了格式轉(zhuǎn)化處理,該格式轉(zhuǎn)化處理的方法可以是任何可用手段,譬如軟件的格式轉(zhuǎn)化處理及各種數(shù)碼設(shè)備的攝像或掃描等,均可實現(xiàn)最終的技術(shù)效果。
[0033]本較佳實施例中,還包括文件預(yù)處理步驟,即對所述原始圖進行降噪處理得到去噪圖像的步驟,該去噪圖像中僅保留文本和照片等必要內(nèi)容(這里僅是舉例而言),以去除干擾因素。該情況下,通過檢測所述去噪圖像而提取出具有至少一個保護特征的特征圖,如圖2所示。而所述降噪處理可以采用各種圖像濾波處理手段。
[0034]本較佳實施例中,還包括定位步驟,即在所述數(shù)字文件或紙質(zhì)文件讀取步驟之后,進一步分析和確定后續(xù)所生成的保護信息的存放位置。值得說明的是,該步驟不是必須在特征提取步驟之前完成,只要在后文所述保護文件生成步驟之前確定均可。此外,該步驟為優(yōu)選做法,因為事先定位可以使保護信息存儲/打印在希望的任何合理位置,可進一步方便后續(xù)的文件驗證操作,或增加排布的合理性。但,即使不做事先的定位,也是可以實現(xiàn)本實施例的技術(shù)效果的。
[0035]特征提取步驟,即對所述原始圖進行檢測以提取具有至少一個保護特征的特征圖。所提取的特征包括但不限于:通過光學(xué)字符識別技術(shù)獲取的OCR(Optical CharacterRecognit1n)特征,通過人臉識別算法獲得的特征,通過紋理分析技術(shù)提取的紋理特征,以及通過光譜特征提取方法獲得的光譜特征等,即,既可包括OCR特征、人臉識別特征,又可包括光譜特征。具體而言,可以是:顏色的比例,文件中的圓圈個數(shù),角度以及交叉的個數(shù),字母的一般形狀,人臉識別(在圖片上)中測量眼睛與嘴之間的距離,以及保護文件的光譜提取部位的吸收光譜等等。如果該步驟所得特征圖足夠小的話,可以直接進行保存或合成至紙質(zhì)文件中。
[0036]此外,比較優(yōu)選的做法是:所述特征檢測不是對文本一次檢測完成的,而是將文本分為兩個以上區(qū)域,逐個區(qū)域檢測出來,這樣,如有任何修改或篡改發(fā)生,后續(xù)驗證時可以得知具體是哪些部分被改變過。
[0037]特征圖處理步驟,即根據(jù)所述特征圖直接生成第一鑒別信息(特征圖足夠小的情況下),或?qū)λ鎏卣鲌D進行hash生成特征圖的信息摘要,再根據(jù)特征圖的信息摘要生成第一鑒別信息(特征圖比較大的情況下)。后一做法的好處是:因為只存儲第一鑒別信息而非文本的具體內(nèi)容,也非加密文本本身,甚至也不存儲文本的哈希碼,總之,本實施例不存儲足以完整恢復(fù)文件內(nèi)容的特征或特征組合,所以讀取本實施例文件中的數(shù)據(jù)矩陣碼圖,并不足以重構(gòu)恢復(fù)整個文件,文件恢復(fù)技術(shù)不可用。
[0038]再者,本實施例的方法所存儲的特征可以更多,這樣,在檢查文件是否被修改或者拷貝的準確率就越高,因為本實施例不直接存儲文本或者圖片而是存儲提取出來的特征,這樣占用較小內(nèi)存(條形碼、射頻識別技術(shù)均存在內(nèi)存占用大的技術(shù)問題)、魯棒更好、更穩(wěn)定,并且計算強度小。與此同時,因它同時保護了與文本無關(guān)的內(nèi)容,例如字體、文本位置、畫圖等等,所以不但保護了文件內(nèi)容,并且能夠檢測文件是否被替換或者是否被掃描和拷貝。雖然用于保護的信息量更大,檢測內(nèi)容更加豐富具體,但所有這些過程均不需要準確知道文件內(nèi)容到底是什么。
[0039]簽名步驟,即對所述第一鑒別信息進行數(shù)字化簽名并生成簽名文件的信息摘要。
[0040]保護信息生成步驟,即根據(jù)所述簽名文件的信息摘要,通過預(yù)定的加密算法生成加密數(shù)據(jù)矩陣。具體而言,可利用非對稱加密技術(shù)將所得到的簽名文件的文件摘要寫進文件中,其中寫進時所用的私鑰是獨一無二的,即每個文件里面寫進特征所用的私鑰均不相同。同時,在寫進簽名文件的文件摘要的時候,也會將時間以及文本尺寸等寫入。最后,將生成的保護信息寫到所述定位步驟所確定的保護信息的存放位置上。舉例而言,保護信息生成步驟可在打印文件——譬如PS