本發(fā)明涉及音頻處理技術,具體涉及一種基于音頻實現(xiàn)設備解鎖的方法和系統(tǒng)。
背景技術:隨著人們對手機體驗要求的增強,現(xiàn)有的手機解鎖功能已經(jīng)不能滿足人們的需求?,F(xiàn)有的手機解鎖功能主要可以分為:普通密碼解鎖,指紋解鎖,頭像解鎖三個方面。但上述手機解鎖功能已經(jīng)不能滿足人們的手機體驗需求,具體而言,普通密碼解鎖的安全性很低;指紋解鎖和頭像解鎖均基于圖像,但目前的指紋倒模以及化妝技術使得指紋解鎖和頭像解鎖的安全性降低。因此,無論是手機還是其它需要信息保密的設備,都需要安全性更高的解鎖功能,但目前尚未出現(xiàn)這樣的解鎖功能。
技術實現(xiàn)要素:有鑒于此,本發(fā)明的主要目的在于提供一種基于音頻實現(xiàn)設備解鎖的方法和系統(tǒng),以提高設備解鎖的安全性。為達到上述目的,本發(fā)明的技術方案是這樣實現(xiàn)的:一種基于音頻實現(xiàn)設備解鎖的方法,該方法包括:設備從接收到的音頻密碼中提取以下至少之一:旋律、節(jié)奏、音色;當所述旋律、節(jié)奏以及音色分別與預設的旋律、節(jié)奏、音色相匹配時,所述設備解鎖。提取所述旋律的過程包括:對輸入信號x(n)進行降采樣以獲得y(n),對y(n)進行端點檢測,判定信號開始和結束的端點;據(jù)此根據(jù)樂音的短時平穩(wěn)性,將信號分成多幀并提 取出信號的基頻;根據(jù)十二音律特性,將提取出來的所述基頻轉換成樂器數(shù)字接口MIDI音符。提取所述基頻是基于增強的改進的梅爾倒譜系數(shù)Specmurt算法實現(xiàn)的;所述增強的Specmurt算法包括復小波變換實現(xiàn)增強的Specmurt算法,或短時傅立葉變換STFT、MDCT實現(xiàn)增強的Specmurt算法。提取所述節(jié)奏的過程包括:對輸入信號x(n)進行降采樣以獲得z(n),對z(n)進行端點檢測,判定信號開始和結束的端點;對z(n)進行STFT以獲得U(wk,ti),對分成多幀的信號進行ACF以獲得A(l,ti);據(jù)此結合自相關的特點獲得A(wl,ti),其中wl=l/fs抽樣頻率;聯(lián)合STFT和FM-ACF以獲得聯(lián)合函數(shù)Y(wk,ti)=U(wk,ti).A(wl,ti),根據(jù)Y(wk,ti)求解出信號的節(jié)奏。提取所述音色的過程包括:對輸入信號x(n)進行降采樣以獲得v(n),對v(n)進行端點檢測,判定信號開始和結束的端點q(n);對v(n)求解MFCC系數(shù)并保存;對q(n)求解譜包絡,對v(n)求取信號的幅度包絡。當所述旋律、節(jié)奏以及音色分別與預設的旋律、節(jié)奏、音色相匹配時,所述設備解鎖的過程包括:獲取輸入的用于解鎖的音頻密碼的匹配失真度和路徑偏差的綜合值,據(jù)此判斷用于解鎖的音頻密碼的旋律與預先設置的音頻密碼的旋律是否低于預設的閾值,在低于閾值時對比用于解鎖的音頻密碼的節(jié)奏和預先設置的音頻密碼的節(jié)奏是否一致,在一致時判斷用于解鎖的音頻密碼的音色與預先設置的音頻密碼的音色是否低于預設的閾值,在低于閾值時解鎖設備。一種基于音頻實現(xiàn)設備解鎖的系統(tǒng),該系統(tǒng)包括樂音特征決策模塊,還包括以下模塊中至少之一:旋律提取模塊、節(jié)奏提取模塊、音色提取模塊;其中,所述旋律提取模塊、節(jié)奏提取模塊、音色提取模塊,分別用于在設置于所述系統(tǒng)中時,從接收到的音頻密碼中提取相應的內容;所述樂音特征決策模塊,用于在所述旋律提取模塊、節(jié)奏提取模塊、音色提取模塊所分別提取的旋律、節(jié)奏以及音色分別與預設的旋律、節(jié)奏、音色相匹配時,解鎖設備。所述旋律提取模塊在提取旋律時,用于:對輸入信號x(n)進行降采樣以獲得y(n),對y(n)進行端點檢測,判定信號開始和結束的端點;據(jù)此根據(jù)樂音的短時平穩(wěn)性,將信號分成多幀并提取出信號的基頻;根據(jù)十二音律特性,將提取出來的所述基頻轉換成MIDI音符。所述旋律提取模塊,用于基于增強的Specmurt算法實現(xiàn)所述基頻的提??;所述增強的Specmurt算法包括復小波變換實現(xiàn)增強的Specmurt算法,或STFT、MDCT實現(xiàn)增強的Specmurt算法。所述節(jié)奏提取模塊在提取節(jié)奏時,用于:對輸入信號x(n)進行降采樣以獲得z(n),對z(n)進行端點檢測,判定信號開始和結束的端點;對z(n)進行STFT以獲得U(wk,ti),對分成多幀的信號進行ACF以獲得A(l,ti);據(jù)此結合自相關的特點獲得A(wl,ti),其中wl=l/fs;聯(lián)合STFT和FM-ACF以獲得聯(lián)合函數(shù)Y(wk,ti)=U(wk,ti).A(wl,ti),根據(jù)Y(wk,ti)求解出信號的節(jié)奏。所述音色提取模塊在提取音色時,用于:對輸入信號x(n)進行降采樣以獲得v(n),對v(n)進行端點檢測,判定信號開始和結束的端點q(n);對v(n)求解MFCC系數(shù)并保存;對q(n)求解譜包絡,對v(n)求取信號的幅度包絡。所述樂音特征決策模塊在解鎖設備時,用于:獲取輸入的用于解鎖的音頻密碼的匹配失真度和路徑偏差的綜合值,據(jù)此判斷用于解鎖的音頻密碼的旋律與預先設置的音頻密碼的旋律是否低于預設的閾值,在低于閾值時對比用于解鎖的音頻密碼的節(jié)奏和預先設置的音頻密碼的節(jié)奏是否一致,在一致時判斷用于解鎖的音頻密碼的音色與預先設置的音頻密 碼的音色是否低于預設的閾值,在低于閾值時解鎖設備。本發(fā)明基于音頻實現(xiàn)設備解鎖的技術,在解鎖時對音頻中的具體因素進行了考慮,從而提高了設備解鎖的安全性。附圖說明圖1為本發(fā)明一實施例的手機解鎖流程圖;圖2為本發(fā)明實施例的特征提取流程圖;圖3為本發(fā)明實施例中提取旋律的原理示意圖;圖4為本發(fā)明實施例中由復小波變換實現(xiàn)的Specmurt增強算法示意圖;圖5為本發(fā)明實施例中由MDCT(修正的離散余弦變換)、(傅立葉變換)DFT(只需其一)實現(xiàn)的Specmurt增強算法示意圖;圖6為本發(fā)明實施例中提取節(jié)奏的原理示意圖;圖7為本發(fā)明實施例中提取音色的原理示意圖;圖8為本發(fā)明另一實施例的手機解鎖流程圖;圖9為本發(fā)明實施例的手機解鎖流程簡圖。具體實施方式在實際應用中,可以進行如圖1所示的流程,該流程的細化過程可由圖2至圖8展示。針對用戶提供的音頻(如用戶輸入的音樂),可以進行如圖2所示的處理:旋律的提取、節(jié)奏的提取、音色的提取,以獲取音樂特征。需要說明的是,無論是手機還是其它需要信息保密的設備,都需要安全性更高的解鎖功能,因此本發(fā)明方法和系統(tǒng)針對需要信息保密的設備而不僅限于手機,并且針對手機等設備實現(xiàn)解鎖的技術是統(tǒng)一的。下面僅以手機為例,結合附圖和實施例對本發(fā)明進行詳細描述。在基于音頻實現(xiàn)手機解鎖時,可以進行如下所示的三個步驟:步驟一:對輸入源(包括旋律、節(jié)奏、音色)進行采集;步驟二:用戶輸入解鎖所需要的音頻密碼(包括旋律、節(jié)奏、音色);步驟三:基于音頻進行信息比對,以進行手機解鎖。在執(zhí)行步驟一時,可以利用手機或者其他終端設備的信息采集裝置對用戶的輸入源進行采集。具體形式可以為:a、麥克風,通過采集空氣振動波實現(xiàn)信號的采集。b、利用喉部震動實現(xiàn)的信號采集。c、利用頜骨部位震動實現(xiàn)的信號采集。d、其他的通過采集物體的振動來實現(xiàn)的信號采集。無論上述的輸入源是預先設置的音頻密碼,還是在解鎖時輸入的用于解鎖的音頻密碼,手機均可以對采集到的信號進行處理(如模數(shù)轉換并記錄采樣頻率),并將完成處理的信號作為輸入信號保存。具體而言,可以對采集到的信號分別進行如下處理:如圖3所示的旋律提?。蝗鐖D6所示的節(jié)奏提?。蝗鐖D7所示的音色提取。在進行旋律提取時,可以進行如下操作:a、對輸入信號x(n)進行降采樣以獲得y(n),建議采樣速率降低到22050Hz或更小,但不低于10000Hz。b、由端點檢測單元對y(n)進行端點檢測,判定信號開始和結束的端點;分幀單元據(jù)此根據(jù)樂音的短時平穩(wěn)性,將信號分成多幀并發(fā)送給基頻提取單元。c、基頻提取單元利用增強的Specmurt(改進的梅爾倒譜系數(shù))算法提取出信號的基頻。d、根據(jù)十二音律特性,音律轉換單元將提取出來的所述基頻轉換成MIDI(樂器數(shù)字接口)音符并保存到數(shù)據(jù)庫中。需要說明的是,有多種實現(xiàn)方式可以用于增強的Specmurt算法,如使用復小波變換實現(xiàn)增強的Specmurt算法,或使用STFT(短時傅立葉變換)、MDCT(其中一者即可)實現(xiàn)增強的Specmurt算法等。在使用復小波變換實現(xiàn)增強的Specmurt算法時,可以進行如圖4所示的操作,具體為:a)在Specmurt算法的實現(xiàn)過程中,考慮諧波結構的設計、對數(shù)頻率下頻 譜的求解兩個方面。采用fcent=log2(fHz/2)*120來消除Spcmurt算法中頻率fHz和對數(shù)頻率fcent的關系轉換后對數(shù)頻率之間的距離太小,對計算基頻造成很大影響的問題。通過實驗選擇合適的諧波結構。b)在短時分幀后利用復小波變換實現(xiàn)Specmurt算法時,采用復小波變換并疊加各個尺度下能量的方法降低噪聲的干擾。c)利用低通濾波的方法,將每個尺度能量的分布看成是時域信號并進行低通濾波以濾除干擾頻率。d)將步驟c中獲得的結果同基本諧波結構解卷積。在使用STFT、MDCT實現(xiàn)增強的Specmurt算法時,可以進行如圖5所示的操作,具體為:a)將線性頻譜轉換成對數(shù)頻譜。b)采用提取包絡的方法消除直接由線性頻譜轉換成對數(shù)頻譜時存在的缺陷。c)同基本諧波結構解卷積。在進行節(jié)奏提取時,可以進行如下操作:a、由降采樣單元對輸入信號x(n)進行降采樣以獲得z(n),建議為11.025Hz。b、端點檢測單元對信號z(n)進行端點檢測,判定信號開始和結束的端點;分幀單元據(jù)此根據(jù)樂音的短時平穩(wěn)性,將信號分成多幀并保存為p(n)。c、ACF(自相關求解)單元對所述分幀單元所保存的信號p(n)進行ACF以獲得A(l,ti);FM-ACF單元據(jù)此結合自相關的特點獲得A(wl,ti),其中wl=l/fs(抽樣頻率)。d、STFT,對所述分幀單元所保存的信號p(n)進行DFT以獲得U(wk,ti);公式如下:e、聯(lián)合函數(shù)處理單元聯(lián)合STFT和FM-ACF以獲得聯(lián)合函數(shù)Y(wk,ti)=U(wk,ti).A(wl,ti)。e、根據(jù)Y(wk,ti)求解出信號的節(jié)奏并保存到數(shù)據(jù)庫中。在進行音色提取時,可以進行如下操作:a、對輸入信號x(n)進行降采樣以獲得v(n),建議為22050Hz。對v(n)進行端點檢測,判定信號開始和結束的端點。具體而言,以能量(E)和過零率(ZCR)為特征的起止點算法的根據(jù)是背景噪聲與語音的短時段及特征從統(tǒng)計看都有相當?shù)膮^(qū)別。設波形時域信號為x(1),加窗分幀處理后得到第n幀語音信號以便為先用短時能量作第一次判別,并在此基礎上用短時過零率作第二次判別。在用短時能量作第一次判別時,為了不至于把語音能量的局部下降點錯誤地當成起止點,常采用雙門限比較的方法。b、對判定完端點的v(n)求解譜包絡并保存。如:對v(n)進行短時傅立葉變換,然后對每幀信號求取極大值,將局部極大值相連以獲得譜包絡。c、對v(n)求取信號的幅度包絡并保存。如:Teager能量算子求包絡:T(v(n))=[v(n)]2-v(n-1)*v(n+1));可以用低通濾波器濾除高頻成分,低頻成分就是包絡;求局部極大值,設定一個包絡門限,將局部極大值相連。在執(zhí)行步驟二時,可以向手機輸入解鎖所需要的歌曲,手機根據(jù)步驟一所述的方法采集用戶輸入的信息并進行處理,將處理后的結果儲存到數(shù)據(jù)庫中。在執(zhí)行步驟三時,圖2中所示的樂音特征決策模塊可以進行如下操作:a、比對旋律:采用DTW(動態(tài)時間規(guī)整算法),把時間規(guī)整和距離測度計算結合起來,減少由于時間長短的不同所引起的誤差。獲取輸入的用于解鎖的音頻密碼的匹配失真度和路徑偏差的綜合值,據(jù)此判斷用于解鎖的音頻密碼的旋律與預先設置的音頻密碼的旋律是否低于預設的閾值,如果低于閾值,則進行下一步比對,否則提示解鎖不成功。b、比對節(jié)奏信息:對比用于解鎖的音頻密碼的節(jié)奏和預先設置的音頻密碼的節(jié)奏是否一致,在一致時進行下一步比對,否則提示解鎖不成功。C、比對音色信息:采用DTW方法獲取譜包絡、幅度包絡、MFCC系數(shù)以獲得最后的綜合值,據(jù)此判斷用于解鎖的音頻密碼的音色與預先設置的音頻密 碼的音色是否低于預設的閾值,如果低于閾值,手機解鎖并提示解鎖成功,否則提示解鎖不成功。在實際應用中,也可以只對上述的旋律、節(jié)奏、音色中的一個或兩個內容進行判斷,以確認是否解鎖,具體的判斷方法與上述相應描述類似。結合以上描述可見,本發(fā)明基于音頻實現(xiàn)設備解鎖的操作思路可以表示如圖9所示的流程,該流程包括以下步驟:步驟910:設備從接收到的音頻密碼中提取以下至少之一:旋律、節(jié)奏、音色。步驟920:當所述旋律、節(jié)奏以及音色分別與預設的旋律、節(jié)奏、音色相匹配時,所述設備解鎖。所述匹配可以是完全一致,也可以是在進行旋律、節(jié)奏或音色對比時符合前述的閾值要求。綜上所述可見,無論是方法還是系統(tǒng),本發(fā)明基于音頻實現(xiàn)設備解鎖的技術,在解鎖時對音頻中的具體因素進行了考慮,從而提高了設備解鎖的安全性。以上所述,僅為本發(fā)明的較佳實施例而已,并非用于限定本發(fā)明的保護范圍。