1.一種基于IS4軟件特征的隱藏信息檢測及提取方法,其特征在于包括如下步驟:
(1)文件格式識別,根據(jù)輸入待檢測文件File的文件頭標識FileID來判定文件載體的格式,格式包括JPG、PNG、BMP、WAV和HTML;
(2)關(guān)鍵數(shù)據(jù)抽取,分別依據(jù)IS4軟件對JPG、PNG、BMP、WAV和HTML格式的文件載體的嵌入原理,采用信息提取算法Extra(·)從待檢測文件File中抽取關(guān)鍵數(shù)據(jù)信息KeyInfo;
(3)關(guān)鍵數(shù)據(jù)內(nèi)容解析,解析KeyInfo各字段內(nèi)容信息,所述字段內(nèi)容信息包括軟件簽名Sig、信息長度Len、隱藏消息數(shù)據(jù)Msg;
(4)隱寫檢測判定,利用KeyInfo中軟件簽名Sig和信息長度Len,與IS4軟件的隱寫特征做匹配,如果匹配成功則表明當前文件File是經(jīng)IS4軟件處理的隱秘載體,反之判定為正常文件;
(5)隱藏信息提取,如果步驟(4)判定為隱秘載體,則從KeyInfo中提取出嵌入的隱藏信息Msg。
2.根據(jù)權(quán)利要求1所述的基于IS4軟件特征的隱藏信息檢測及提取方法,其特征在于:所述步驟(2)中,當待檢測文件File是檢測JPG文件時,Extra(·)表示從File二進制比特流中搜索到的比特串模式,是一個由N個以“0xFF FE”開頭的比特串和“0xFF FF”比特串結(jié)尾組成的比特流;然后去除模式串中的開頭標記,即“0xFF FE”和結(jié)尾標記,即“0xFF FF”,最后獲得關(guān)鍵數(shù)據(jù)信息KeyInfo。
3.根據(jù)權(quán)利要求1所述的基于IS4軟件特征的隱藏信息檢測及提取方法,其特征在于:所述步驟(2)中,當待檢測文件File是檢測PNG文件時,Extra(·)表示從File二進制比特流中搜索到一個由N個以“0x74 45 58 74 43 6F 6D 6D 65 6E 74 00”開頭的比特串和“0x00 00 00 00 49 45 4E 44 AE 42 60 82”比特串結(jié)尾(N≥2)組成的比特流,然后去除模式串中的開頭標記(“0x74 45 58 74 43 6F 6D 6D 65 6E 74”)和結(jié)尾標記(“0x00 00 00 00 49 45 4E 44 AE 42 60 82”),最后獲得關(guān)鍵數(shù)據(jù)信息KeyInfo。
4.根據(jù)權(quán)利要求1所述的基于IS4軟件特征的隱藏信息檢測及提取方法,其特征在于:所述步驟(2)中,當待檢測文件File是檢測BMP文件時,Extra(·)表示從File中抽取圖片像素最低比特位(Least Significant Bit,LSB)組成比特流,抽取順序為(I) 像素間按照圖像坐標軸從左至右、由上及下的空間順序;(II)像素內(nèi)按照BGR的通道順序。
5.根據(jù)權(quán)利要求1所述的基于IS4軟件特征的隱藏信息檢測及提取方法,其特征在于:所述步驟(2)中,當待檢測文件File是檢測WAV文件時,Extra(·)表示抽取File data數(shù)據(jù)塊中數(shù)據(jù)段數(shù)據(jù)的某些字節(jié)最低比特位(LSB)組成比特流(WAV文件的data數(shù)據(jù)塊的標記為“0x64 61 74 61”,標記字段隨后的4字節(jié)為data數(shù)據(jù)塊大小字段,再隨后是數(shù)據(jù)段),其中數(shù)據(jù)段數(shù)據(jù)的選擇取決于File的聲道數(shù),如果File是單聲道音頻則選取所有的數(shù)據(jù)段數(shù)據(jù),如果File是雙聲道音頻則選擇數(shù)據(jù)段的奇數(shù)位字節(jié)。
6.根據(jù)權(quán)利要求1所述的基于IS4軟件特征的隱藏信息檢測及提取方法,其特征在于:所述步驟(2)中,當待檢測文件File是檢測HTML文件時,Extra(·)表示從File中匹配二進制模式串“0x3E@**@0D 0A”,其中“0x3E”表示標簽結(jié)束標記“>”、“@**@”表示若干個“0x20”和“0x09”、“0x0D 0A”表示文本換行,并抽取子串“@**@”以及文件末尾的模式串“@**@”,然后將“0x20”和“0x09”分別映射為比特“0”和“1”構(gòu)成KeyInfo的比特流數(shù)據(jù)。
7.根據(jù)權(quán)利要求1所述的基于IS4軟件特征的隱藏信息檢測及提取方法,其特征在于:所述步驟(4)中,與IS4軟件的隱寫特征做匹配時,針對不同文件載體格式,即JPG、PNG、BMP、WAV和HTML的隱寫特征不同。
8.根據(jù)權(quán)利要求3所述的基于IS4軟件特征的隱藏信息檢測及提取方法,其特征在于:對于JPG格式的文件,隱寫特征如下:
A.關(guān)鍵數(shù)據(jù)塊的總數(shù)N≥2;
B.滿足數(shù)據(jù)長度關(guān)系式
C.關(guān)鍵數(shù)據(jù)塊長度校驗,即滿足從JPG格式的文件中抽取出關(guān)鍵數(shù)據(jù)塊KeyInfon的實際數(shù)據(jù)長度M表示消息數(shù)據(jù)Msg的個數(shù),i和j表示索引下標,Lj表示信息長度。
9.根據(jù)權(quán)利要求3所述的基于IS4軟件特征的隱藏信息檢測及提取方法,其特征在于:對于PNG格式的文件,隱寫特征如下:
A.關(guān)鍵數(shù)據(jù)塊的總數(shù)N≥2;
B.滿足數(shù)據(jù)長度關(guān)系式
C.關(guān)鍵數(shù)據(jù)塊長度校驗,即滿足(I)從PNG文件中抽取出關(guān)鍵數(shù)據(jù)塊KeyInfo1的實際數(shù)據(jù)長度(II)從PNG文件中抽取出隱藏消息數(shù)據(jù)Msgm的實際數(shù)據(jù)長度
10.根據(jù)權(quán)利要求3所述的基于IS4軟件特征的隱藏信息檢測及提取方法,其特征在于:對于BMP格式的文件,隱寫特征如下:
A.滿足數(shù)據(jù)長度關(guān)系式
B.關(guān)鍵數(shù)據(jù)塊長度校驗,即滿足(I)從BMP文件中抽取出信息頭Header的實際數(shù)據(jù)長度(II)從BMP文件中抽取出隱藏消息數(shù)據(jù)Msgm的實際數(shù)據(jù)長度
11.根據(jù)權(quán)利要求3所述的基于IS4軟件特征的隱藏信息檢測及提取方法,其特征在于:對于WAV格式的文件和HTML格式的文件,隱寫特征如下:
A.依據(jù)對通信協(xié)議頭Header數(shù)據(jù)長度的統(tǒng)計分析,F(xiàn)ile中包含模式串“@**@”的總長度≥512字節(jié);
B.滿足數(shù)據(jù)長度關(guān)系式
C.關(guān)鍵數(shù)據(jù)塊長度校驗,即滿足(I)從WAV格式的文件或HTML格式的文件中抽取出信息頭Header的實際數(shù)據(jù)長度(II)從WAV格式的文件或HTML格式的文件中抽取出隱藏消息數(shù)據(jù)Msgm的實際數(shù)據(jù)長度
12.根據(jù)權(quán)利要求1所述的基于IS4軟件特征的隱藏信息檢測及提取方法,其特征在于:所述步驟(5)中的隱藏信息Msg可能是密文消息。