一種基于水印的音頻審計方法和系統(tǒng)的制作方法
【技術領域】
[0001 ]本發(fā)明設及信息安全領域,具體地說,設及一種對嵌有水印的音頻文件進行內容 審計的方法和系統(tǒng)。
【背景技術】
[0002] 當前,確保網(wǎng)絡安全、建設網(wǎng)絡強國、提升信息化水平、推進傳統(tǒng)媒體與新興媒體 融合已成為重大國家戰(zhàn)略,構建能夠對音頻進行集中存儲、管理和共享的云計算平臺是響 應此戰(zhàn)略的重要舉措,云安全是此類音頻云建設的一個重要關注點。音頻云是W音頻為核 屯、的數(shù)據(jù)共享平臺,因而需要W音頻為保護核屯、,通過用戶層和平臺層安全防護來構建全 面的安全管控體系。針對用戶層安全防護,一方面需要對用戶的身份和權限進行統(tǒng)一管理, 確保用戶的合法接入和合法訪問;另一方面需要實時地對用戶操作音頻的行為進行審計, 及時發(fā)現(xiàn)違規(guī)現(xiàn)象。針對平臺層安全防護,一方面需要部署傳統(tǒng)的安全設備(如防火墻、IPS (Intrusion Prevention System,入侵防御系統(tǒng))、WAF(Web Application Firewall,Web應 用防火墻)等)和制定相關安全策略,另一方面需要通過實時監(jiān)控和深入分析音頻的流轉過 程來深度挖掘云平臺的安全隱患,W提高安全事故預防能力,提高事故響應、處理、恢復的 速度,提高事后審查和恢復能力。因此,不論是用戶層還是平臺層,對音頻進行安全審計都 是其中的重要關注點。
[0003] -般來說,音頻云中承載著多個應用,各類電臺、專業(yè)或商業(yè)機構、團體或個人等 海量用戶通過互聯(lián)網(wǎng)接入音頻云中,音頻的訪問情況十分復雜。在音頻云中,音頻一般通過 交換機流入或流出音頻文件服務器,為了實現(xiàn)對音頻的全面安全審計,不僅要運用基于網(wǎng) 絡旁路抓包的審計技術,捕獲并分析流入或流出音頻文件服務器的所有數(shù)據(jù)包,獲取相關 網(wǎng)絡傳輸信息,實時記錄音頻在網(wǎng)絡中的流轉路徑;還要能夠對音頻的關鍵內容進行快速 審計,并獲取訪問者的身份信息,從而實時記錄哪些用戶訪問了哪些類型、什么內容的音 頻,W便于及時發(fā)現(xiàn)違規(guī)訪問行為。
[0004] 現(xiàn)有的網(wǎng)絡安全審計技術不適用于音頻云環(huán)境,主要體現(xiàn)在W下兩個方面:
[0005] (1)現(xiàn)有的網(wǎng)絡安全審計技術大多對網(wǎng)絡操作行為進行審計,而無法進行內容審 計。少數(shù)可進行內容審計的技術采用的是基于關鍵詞匹配的方法,需要將一個文件對應的 數(shù)據(jù)包完全捕獲并做完整拼接之后才能審計,效率很低。當其應用于內容不能直接獲取的 音頻的審計時,還需要在得到完整的音頻文件后,進行音頻和文本之間的轉換,然后再基于 關鍵詞匹配對文本內容進行審計,效率極低。
[0006] (2)現(xiàn)有的網(wǎng)絡安全審計技術只能獲取網(wǎng)絡傳輸?shù)南嚓P信息,將訪問行為、訪問對 象與某個IP相關聯(lián),而不能與訪問者的身份信息相關聯(lián),無法形成用戶訪問音頻的完整審 計鏈。
[0007] 在音頻云中,為了進行版權保護和安全控制,在存儲音頻之前,可在音頻中嵌入水 印,來指代ID、版權、安全級別等音頻關鍵內容信息。音頻水印技術是指用信號處理的方法 在數(shù)字化的音頻數(shù)據(jù)中嵌入隱蔽的標記,運種標記通常是人耳不可感知的,只有通過專用 的檢測器或閱讀器才能提取。音頻水印一般具有W下兩個特點:
[0008] (1)音頻水印的長度是固定的(例如64bit),其中的比特位與音頻的關鍵內容信息 之間有明確的對應關系。
[0009] (2)為便于進行水印解析,且防止水印信息被完全篡改或破壞,音頻水印不只是被 嵌入在音頻頭或是音頻的某個位置,而是被循環(huán)嵌入到音頻中,因此只需要獲取不少于特 定長度(例如12s)的連續(xù)的音頻數(shù)據(jù),即可解析出完整的音頻水印信息。
[0010] 另外,為了進行身份管理和訪問控制,音頻云中一般部署有身份認證系統(tǒng),該系統(tǒng) 通常會將所有用戶的登錄、下線行為記錄到日志信息中。
[0011] 因此,可設計一種基于水印的音頻審計方法,通過網(wǎng)絡協(xié)議解析得到IP、端口號等 網(wǎng)絡傳輸信息,通過水印解析得到音頻的關鍵內容信息,通過與相關的身份認證系統(tǒng)對接 得到訪問者的身份信息,最終實現(xiàn)對音頻的全面內容審計。
【發(fā)明內容】
[0012] 針對現(xiàn)有的網(wǎng)絡安全審計技術應用于音頻云環(huán)境的不足和缺陷,本發(fā)明提出一種 基于水印的音頻審計方法和系統(tǒng),能夠對嵌有水印的音頻文件進行實時的、全面的內容審 計,構建包含訪問者、訪問行為和訪問對象的完整審計鏈。
[0013] 本發(fā)明提出了一種基于水印的音頻審計方法,捕獲流入或流出音頻文件服務器的 所有數(shù)據(jù)包,解析其網(wǎng)絡傳輸信息,解析音頻中嵌有的水印信息,且將網(wǎng)絡傳輸信息和訪問 者身份信息相關聯(lián),構建包含訪問者、訪問行為、訪問對象的完整審計鏈。其步驟如圖1所 示,包括:
[0014] 1)實時捕獲流入或流出音頻文件服務器的所有數(shù)據(jù)包,并將捕獲到的數(shù)據(jù)包寫入 文件存儲起來;
[0015] 2)讀取存有數(shù)據(jù)包的文件,進行網(wǎng)絡層IP協(xié)議和傳輸層TCP協(xié)議的解析,得到相關 的網(wǎng)絡傳輸信息;再進行TCP重組,得到有序的TCP數(shù)據(jù)包;
[0016] 3)依據(jù)^5、(:伴5、冊1?、。1?協(xié)議的報文格式規(guī)定,判斷1'〔?重組后的數(shù)據(jù)包對應哪 種應用層協(xié)議,然后進行應用層協(xié)議解析,得到相應的有效音頻數(shù)據(jù)及相關信息;
[0017] 4)接收應用層協(xié)議解析后得到的有效音頻數(shù)據(jù)及相關信息,對不同的音頻文件, 開辟不同的緩沖區(qū)進行音頻數(shù)據(jù)累積,直到整個音頻文件接收完畢或者音頻數(shù)據(jù)量達到預 置大小,即得到該文件對應的有效音頻片段,放入共享文件夾中存儲;
[0018] 5)讀取共享文件夾中的有效音頻片段,解析出其中的水印信息,并經(jīng)過進一步分 析后得出水印信息對應的音頻關鍵內容信息;
[0019] 6)與相關的身份認證系統(tǒng)對接,將已經(jīng)獲取到的網(wǎng)絡傳輸信息與身份認證系統(tǒng)中 的用戶登錄日志相關聯(lián),獲取對應的音頻訪問者的身份信息;
[0020] 7)將網(wǎng)絡傳輸信息、音頻關鍵內容信息、音頻訪問者的身份信息合為一條完整的 審計信息,寫入數(shù)據(jù)庫中,并對數(shù)據(jù)庫中的審計信息進行全方位展示。
[0021 ]更進一步,步驟1)通過下述方法實現(xiàn)對數(shù)據(jù)包的捕獲和存儲:
[0022] 1)基于萬兆網(wǎng)卡進行鏈路層的數(shù)據(jù)包捕獲,通過零拷貝技術實現(xiàn)對數(shù)據(jù)包的高速 捕獲;
[0023] 2)對于捕獲到的數(shù)據(jù)包,采用內存映射文件的技術,多線程存儲到多個文件中。
[0024]更進一步,步驟2)進行網(wǎng)絡層IP協(xié)議解析得到的網(wǎng)絡傳輸信息包括源IP、目的IP 等,進行傳輸層TCP協(xié)議解析得到的網(wǎng)絡傳輸信息包括源端口號、目的端口號等。
[00巧]更進一步,步驟3)通過下述方法實現(xiàn)對NFS、CIFS、HTTP、FTP協(xié)議的解析:
[00%] 1)NFS(化twork File System,網(wǎng)絡文件系統(tǒng))協(xié)議是一種C/S架構的文件共享協(xié) 議,通過RPC(Remote Procedure Call,遠程過程調用)報文進行應答,TCP重組后的數(shù)據(jù)報 文遵循RP巧良文格式,因此通過對RP巧良文進行分析得到有效音頻數(shù)據(jù)。
[0027] 2)CIFS(Common Internet File System,通用Internet文件系統(tǒng))協(xié)議有通用的 報文格式,W'〇xFF' 'S' 'M' 'B'作為引導字符。上傳文件使用寫命令SMB_COM_WRnE_ANDX, 下載文件使用讀命令SMB_COM_READ_ANDX。每次讀寫請求所能傳輸?shù)淖畲箝y值為一個確定 值,如32768字節(jié)。因此需要先分多次進行數(shù)據(jù)報文解析,W偏移量Off set標注,然后進行組 裝。
[0028] 3)HTTP協(xié)議化ypedext Transfer Protocol,超文本傳輸協(xié)議)存在很多種應用 報文類型,此處主要關注下載與上傳文件報文。下載文件使