專利名稱:一種手機音頻文件的情緒化處理和播放方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種情緒化處理技術(shù),尤其是涉及一種手機音頻文件的情緒化 處理和播放方法。
背景技術(shù):
現(xiàn)有音樂播放器,包括手機,其一般提供歌曲分類列表只能基于音樂所屬 流派,歌手名稱,專輯名稱等信息進行分類管理。智能播放器可以使用基于歌 曲內(nèi)容分析分類技術(shù),以便用戶可以方便選擇自己喜歡聽歌曲。例如基于音樂 內(nèi)容的情緒分類,用戶可以根據(jù)需要選擇溫柔、歡樂、憂傷或憤怒的歌曲。
因此,如何將音頻文件在手機中進行情緒化播放是目前手機所面臨的一個 問題。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題在于提供一種手機音頻文件情緒化處理和播 放方法,可以在手機上進行音頻文件的情緒化播放。
為了實現(xiàn)上述目的,本發(fā)明提供了一種手機音頻文件情緒化處理和播放方 法,其特點在于,包括如下步驟
步驟l,確定用戶的現(xiàn)場聽覺需求;
步驟2,根據(jù)用戶的現(xiàn)場聽覺需求,利用一音頻處理軟件對一輸入音頻文 件進行情緒化處理,得到一處理后音頻文件;
步驟3,歸納該處理后的音頻文件的提取特征信息,根據(jù)該提取特征信息 將該處理后的音頻文件進行歸類,并分類存儲到手機中,同時在手機上生成一 目錄索引庫;
步驟4,用戶通過該目錄索引庫進行音頻選擇,選擇相應(yīng)的音頻文件進行 播放。
優(yōu)選地,所述的手機音頻文件情緒化處理和播放方法還包括步驟重復(fù)上
述步驟1 3,對多個輸入音頻文件進行情緒化處理和分類存儲。
優(yōu)選地,所述的手機音頻文件情緒化處理和播放方法在步驟4中,用戶在
選擇相應(yīng)的音頻文件之后,還包括歩驟利用手機內(nèi)的風(fēng)格化處理軟件對所選 擇的音頻文件進行風(fēng)格化處理,增加相應(yīng)的風(fēng)格化音效后再進行播放。
優(yōu)選地,所述的手機音頻文件情緒化處理和播放方法在步驟2中,所述的 情緒化處理包括
步驟21,分析該輸入音頻文件在某時刻產(chǎn)生的頻率點的數(shù)量、力度及頻 率,確定節(jié)奏復(fù)雜度和歌曲速度范圍;
步驟22,按照音樂和聲理論,計算整首音樂的音強差及相似音強之間的 時間值,確定歌曲的速度和節(jié)奏;并按照頻率對音頻文件影響計算頻率點的變 化時間,確定歌曲的情緒;
步驟23,根據(jù)所確定的歌曲的速度和節(jié)奏、情緒,生成該處理后音頻文件。
優(yōu)選地,所述的手機音頻文件情緒化處理和播放方法在步驟3中,進行歸 類的步驟包括
步驟31,使用訓(xùn)練樣本訓(xùn)練一參考模式庫,該參考模式庫包括各種情緒 化特征的參考模式;
步驟32,對該處理后的音頻文件進行分析,提取其中能區(qū)別情感的特征 參數(shù);
步驟33,將所提取的特征參數(shù)同參考模式進行匹配比較,得到分類結(jié)果。 優(yōu)選地,所述的手機音頻文件情緒化處理和播放方法所述步驟33進一步 包括
步驟331,根據(jù)提取的強度特征進行分類,強度弱的歸屬分類I,強度強 的歸屬分類II;
步驟332,分別在分類I、 II中,再根據(jù)音色和節(jié)奏進行分類。 優(yōu)選地,所述的手機音頻文件情緒化處理和播放方法中,所述強度特征采 用信號能量在頻域的分布參數(shù);所述音色特征采用描述信號頻譜形狀和頻譜對 比度參數(shù);所述節(jié)奏特征采用節(jié)奏強度、節(jié)奏規(guī)則度和節(jié)拍參數(shù)。
優(yōu)選地,所述的手機音頻文件情緒化處理和播放方法中,在生成該處理后 音頻文件之前還包括步驟24,將該音頻文件進行風(fēng)格化處理,將情緒化處
理和風(fēng)格化處理后的音頻文件整合成該處理后的音頻文件。
根據(jù)本發(fā)明,可以將音頻文件進行情緒化處理后在手機上進行情緒化播
放,使播放音樂更加具有主動性,大大提高了欣賞的靈活性。
以下結(jié)合附圖和具體實施例對本發(fā)明進行詳細描述,但不作為對本發(fā)明的限定。
圖1為本發(fā)明一較佳的手機音頻文件情緒化處理及播放方法的流程圖; 圖2為本發(fā)明另一較佳的手機音頻文件情緒化處理及播放方法的流程圖; 圖3為本發(fā)明的分類方法流程圖;以及 圖4為本發(fā)明的模式識別方法流程圖。
具體實施例方式
如圖1所示,本發(fā)明的手機音頻文件情緒化處理和播放方法包括以下步
驟
步驟l,確定用戶的現(xiàn)場聽覺需求;
步驟2,根據(jù)用戶的現(xiàn)場聽覺需求,利用一音頻處理軟件對一輸入音頻文 件進行情緒化處理,得到一處理后音頻文件;
步驟3,歸納該處理后的音頻文件的提取特征信息,根據(jù)該提取特征信息 將該處理后的音頻文件進行歸類,并分類存儲到手機中,同時在手機上生成一 目錄索引庫;
步驟4,用戶通過該目錄索引庫進行音頻選擇,選擇相應(yīng)的音頻文件進行 播放。
其中,在步驟1中,確定用戶的現(xiàn)場聽覺需求包括風(fēng)格(如搖滾,抒情, 布魯斯等)、設(shè)定速度范圍、節(jié)奏復(fù)雜度、頻率響應(yīng)范圍及速度范圍,及音強 值的設(shè)定等。
結(jié)合圖2,本發(fā)明的手機音頻文件情緒化處理和播放方法在步驟4中,用 戶在選擇相應(yīng)的音頻文件之后,還可以包括步驟利用手機內(nèi)的風(fēng)格化處理軟 件對所選擇的音頻文件進行風(fēng)格化處理,增加相應(yīng)的風(fēng)格化音效后再進行播 放。
在本發(fā)明的一個實施例中,可以重復(fù)上述步驟1 3,對多個輸入音頻文件 進行情緒化處理和分類存儲,如此即可以在手機內(nèi)產(chǎn)生一目錄索引庫,其由不 同分類的文件庫構(gòu)成,每一類別的文件庫下存儲多個同類的音頻文件。
在本發(fā)明的一個實施例中,在步驟2中,可以采用現(xiàn)有的音頻處理軟件, 例如CoolEdit,對輸入音頻文件的情緒化處理,其可包括如下步驟
步驟21,分析該輸入音頻文件在某時刻產(chǎn)生的頻率點的數(shù)量、力度及頻 率,確定節(jié)奏復(fù)雜度和歌曲速度范圍;
步驟22,按照音樂和聲理論,計算整首音樂的音強差及相似音強之間的 時間值,確定歌曲的速度和節(jié)奏;并按照頻率對音頻文件影響計算頻率點的變 化時間,確定歌曲的情緒;
步驟23,根據(jù)所確定的歌曲的速度和節(jié)奏、情緒,生成該處理后音頻文件。
在本發(fā)明一較佳的實施例中,在分析音頻文件的各頻率點之間的時間差及 力度、響度信息后,歸類提取特征參數(shù)(建立模式庫),然后利用音頻處理軟 件給某一段頻率上的力度和響度進行適當?shù)奶幚?,增加或者衰減,并可加上所 需各種混響(大廳,演奏廳等)效果,從而來達到所期望的情緒化效果,即生 成該處理后的音頻文件。
優(yōu)選地,本發(fā)明在步驟3中,對處理后的音頻文件進行歸類的步驟包括
步驟31,使用訓(xùn)練樣本訓(xùn)練一參考模式庫,該參考模式庫包括各種情緒 化特征的參考模式;
步驟32,對該處理后的音頻文件進行分析,提取其中能區(qū)別情感的特征 參數(shù);
步驟33,將所提取的特征參數(shù)同參考模式進行匹配比較,得到分類結(jié)果。 如圖3所示,本發(fā)明提供一種以模式識別為基礎(chǔ)的分類系統(tǒng)框架,本發(fā)明 可以采用這種分類系統(tǒng)框架來進行歸類。其中,在訓(xùn)練階段使用訓(xùn)練樣本訓(xùn)練 參考模式庫(識別模型),通常可采用HMM、 GMM等統(tǒng)計概率模型,建立 不同類別的參考模式;在特征提取階段通過對音樂信號進行分析,提取一些能 區(qū)別情感的一些特征參數(shù);在模式匹配階段,將待分類的特征參數(shù)同參考模式 進行匹配比較,以得到分類結(jié)果。
上面過程,對一般模式識別應(yīng)用,如語音識別等,都基本類似。具體到音
樂的情感分類,由于情感是一個主觀的概念,很難有明確的客觀特征參數(shù)來描 述,因此通常會選取多個特征參數(shù),通過一種分層框架來實現(xiàn)。
本發(fā)明在所述步驟33中,即采用如圖4所示的分層框架來進行模式識別,
其包括
步驟331,根據(jù)提取的強度(Intensity)特征進行分類,強度弱的歸屬分 類I,強度強的歸屬分類II;
步驟332,分別在分類I、 II中,再根據(jù)音色(timbre)和節(jié)奏(rhythm)
進行分類。
例如,圖4中選取四個特征參數(shù)^ 、 A2 、 l-A、 1-A2,其中V 1 —A, 分別代表分類I中音色和節(jié)奏的權(quán)值,^、 1-義2分別代表分類11中音色和節(jié)奏 的權(quán)值。對于分類I,音色要比節(jié)奏好區(qū)分,因此權(quán)值A(chǔ)^0.5;對于分類II, 節(jié)奏要比音色好區(qū)分,因此權(quán)值^<0.5。
在具體音樂信號特征提取時,強度特征采用信號能量在頻域的分布參數(shù);
音色特征采用描述信號頻譜形狀和頻譜對比度參數(shù);節(jié)奏特征采用節(jié)奏強度, 節(jié)奏規(guī)則度和節(jié)拍等參數(shù)。
關(guān)于上述分類的具體實現(xiàn)方法,可以參考論文Lie Lu, Dan Liu, and Hong-Jiang Zhang, "Automatic Mood Detection and Tracking of Music Audio Signals" , IEEE TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING, VOL. 14, NO. 1, JANUARY 2006。(呂列、劉丹和張洪江
"自動情緒探測和音樂音頻信號跟蹤"——電氣和電子工程師協(xié)會會報音 頻、語音和語言處理VOL. 14,NO. 1, JANUARY 2006)
在將所有音頻文件都經(jīng)過情緒化處理后,可以將處理后的音頻文件通過上 述分類方法分類存儲到手機上,同時生成一目錄索引庫,當用戶希望進行情緒 化播放時,可進入手機的音頻風(fēng)格選擇模式,自動搜索設(shè)備中的音頻文件或手 動選擇存放的目錄進行播放,從而可以欣賞到情緒化的音頻文件。
在本發(fā)明中,在選擇播放的音頻文件后,還可以利用手機上自帶的風(fēng)格化 處理軟件,將音頻文件加入風(fēng)格化音效后進行播放,例如,增加聲音反射時間 計算,模仿大廳等各種特效,使播放音樂更加具有主動性,大大提高的了欣賞 的靈活性。當然,本發(fā)明也可以在進行情緒化處理過程中,將音頻文件進行風(fēng) 格化處理后再進行分類存儲,這些并不作為對本發(fā)明的限制。
當然,本發(fā)明還可有其他多種實施例,在不背離本發(fā)明精神及其實質(zhì)的情 況下,熟悉本領(lǐng)域的技術(shù)人員當可根據(jù)本發(fā)明作出各種相應(yīng)的改變和變型,但 這些相應(yīng)的改變和變形都應(yīng)屬于本發(fā)明所附的權(quán)利要求的保護范圍。
權(quán)利要求
1.一種手機音頻文件情緒化處理和播放方法,其特征在于,包括如下步驟步驟1,確定用戶的現(xiàn)場聽覺需求;步驟2,根據(jù)用戶的現(xiàn)場聽覺需求,利用一音頻處理軟件對一輸入音頻文件進行情緒化處理,得到一處理后音頻文件;步驟3,歸納該處理后的音頻文件的提取特征信息,根據(jù)該提取特征信息將該處理后的音頻文件進行歸類,并分類存儲到手機中,同時在手機上生成一目錄索引庫;步驟4,用戶通過該目錄索引庫進行音頻選擇,選擇相應(yīng)的音頻文件進行播放。
2、 根據(jù)權(quán)利要求1所述的手機音頻文件情緒化處理和播放方法,其特征 在于,還包括步驟-重復(fù)上述步驟"3,對多個輸入音頻文件進行情緒化處理和分類存儲。
3、 根據(jù)權(quán)利要求1或2所述的手機音頻文件情緒化處理和播放方法,其 特征在于,在步驟4中,用戶在選擇相應(yīng)的音頻文件之后,還包括步驟利用手機內(nèi)的風(fēng)格化處理軟件對所選擇的音頻文件進行風(fēng)格化處理,增 加相應(yīng)的風(fēng)格化音效后再進行播放。
4、 根據(jù)權(quán)利要求1所述的手機音頻文件情緒化處理和播放方法,其特征 在于,在步驟2中,所述的情緒化處理包括步驟21,分析該輸入音頻文件在某時刻產(chǎn)生的頻率點的數(shù)量、力度及頻 率,確定節(jié)奏復(fù)雜度和歌曲速度范圍;步驟22,按照音樂和聲理論,計算整首音樂的音強差及相似音強之間的 時間值,確定歌曲的速度和節(jié)奏;并按照頻率對音頻文件影響計算頻率點的 變化時間,確定歌曲的情緒;步驟23,根據(jù)所確定的歌曲的速度和節(jié)奏、情緒,生成該處理后音頻文件。
5、 根據(jù)權(quán)利要求4所述的手機音頻文件情緒化處理和播放方法,其特征 在于,在步驟3中,進行歸類的步驟包括步驟31,使用訓(xùn)練樣本訓(xùn)練一參考模式庫,該參考模式庫包括各種情緒 化特征的參考模式;步驟32,對該處理后的音頻文件進行分析,提取其中能區(qū)別情感的特征 參數(shù);步驟33,將所提取的特征參數(shù)同參考模式進行匹配比較,得到分類結(jié)果。
6、 根據(jù)權(quán)利要求5所述的手機音頻文件情緒化處理和播放方法,其特征 在于,所述步驟33進一步包括步驟331,根據(jù)提取的強度特征進行分類,強度弱的歸屬分類I,強度強 的歸屬分類II;步驟332,分別在分類I、 II中,再根據(jù)音色和節(jié)奏進行分類。
7、 根據(jù)權(quán)利要求6所述的手機音頻文件情緒化處理和播放方法,其特征 在于,所述強度特征采用信號能量在頻域的分布參數(shù);所述音色特征采用描 述信號頻譜形狀和頻譜對比度參數(shù);所述節(jié)奏特征采用節(jié)奏強度、節(jié)奏規(guī)則 度和節(jié)拍參數(shù)。
8、 根據(jù)權(quán)利要求4所述的手機音頻文件情緒化處理和播放方法,其特征 在于,在生成該處理后音頻文件之前還包括步驟24,將該音頻文件進行風(fēng)格化處理,將情緒化處理和風(fēng)格化處理后 的音頻文件整合成該處理后的音頻文件。
全文摘要
本發(fā)明涉及一種手機音頻文件情緒化處理和播放方法,包括如下步驟步驟1,確定用戶的現(xiàn)場聽覺需求;步驟2,根據(jù)用戶的現(xiàn)場聽覺需求,利用一音頻處理軟件對一輸入音頻文件進行情緒化處理,得到一處理后音頻文件;步驟3,歸納該處理后的音頻文件的提取特征信息,根據(jù)該提取特征信息將該處理后的音頻文件進行歸類,并分類存儲到手機中,同時在手機上生成一目錄索引庫;步驟4,用戶通過該目錄索引庫進行音頻選擇,選擇相應(yīng)的音頻文件進行播放。
文檔編號H04M1/21GK101370216SQ20081022409
公開日2009年2月18日 申請日期2008年10月15日 優(yōu)先權(quán)日2008年10月15日
發(fā)明者儲信鵬, 呂博學(xué) 申請人:北京中星微電子有限公司