欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種自適應(yīng)音頻感知響度調(diào)整方法

文檔序號(hào):2819043閱讀:1676來源:國(guó)知局
專利名稱:一種自適應(yīng)音頻感知響度調(diào)整方法
技術(shù)領(lǐng)域
本發(fā)明屬于多媒體信息處理和音頻分析領(lǐng)域,涉及一種自適應(yīng)音頻感知響度估計(jì)與快速歸一化的新型技術(shù),可用于將不同響度感知基準(zhǔn)的音頻文件自動(dòng)調(diào)整為統(tǒng)一的感知響度基準(zhǔn)。
背景技術(shù)
ReplayGain(回放增益)標(biāo)準(zhǔn)是David Robinson于2001年提出的一套技術(shù)標(biāo)準(zhǔn),用以衡量MP3音樂文件的感知響度,并對(duì)音頻響度進(jìn)行增益歸一化處理(見文獻(xiàn) D. Robinson, " ReplayGain specification discussion" ,www. replaygain. org,2010)。 具體步驟是,首先對(duì)整個(gè)音頻文件進(jìn)行心理聲學(xué)掃描,以量度它的感知響度和峰值電平;進(jìn)而計(jì)算音頻文件的原始響度與目標(biāo)響度(通常定為89分貝的聲壓值)的差別增益值;將該音頻文件的增益值和峰值電平值作為元數(shù)據(jù)存儲(chǔ)于音頻文件中,以便播放器能夠根據(jù)這些元數(shù)據(jù)自動(dòng)衰減(或放大)音量播放該文件,從而在回放不同的音頻文件時(shí)得到近似一致的輸出響度。ReplayGain標(biāo)準(zhǔn)可以緩解在播放不同專輯的音頻文件時(shí)需要不斷手動(dòng)調(diào)整音量的問題,并避免對(duì)響度較高的歌曲產(chǎn)生削波。然而,ReplayGain標(biāo)準(zhǔn)對(duì)于音頻文件感知響度的衡量采用了固定閾值(95%最大能量)的估計(jì)方法,難以保證其對(duì)不同類型音頻感知響度的估計(jì)精度,尤其不能很好地剔除音頻中由于自然發(fā)聲過程所引起的極低與極高響度成份的不良影響,從而使得所估計(jì)的響度偏離真實(shí)聽覺感知響度區(qū)間。

發(fā)明內(nèi)容
本發(fā)明的目的是針對(duì)現(xiàn)有技術(shù)在自動(dòng)估計(jì)不同音頻文件的感知響度上的不足,提供一套實(shí)用的音頻感知響度自適應(yīng)調(diào)整方法,可以使用戶方便地將不同音量基準(zhǔn)的音頻文件更為準(zhǔn)確地自動(dòng)調(diào)整到統(tǒng)一的感知響度基準(zhǔn)。為此,本發(fā)明采用如下的技術(shù)方案一種自適應(yīng)音頻感知響度調(diào)整方法,包括以下步驟a)對(duì)當(dāng)前音頻信號(hào)進(jìn)行等響度濾波;b)計(jì)算RMS能量序列首先,將濾波后的音頻信號(hào)按照時(shí)間間隔分割成若干個(gè)窗口,設(shè)每個(gè)窗口的數(shù)據(jù)量為M,計(jì)算每個(gè)窗口的均方根值,得到整個(gè)音頻文件的RMS能量序列;c)能量分貝轉(zhuǎn)換將RMS能量序列轉(zhuǎn)換為分貝序列,并對(duì)分貝序列進(jìn)行升序排序得到SDB序列;d)采用差分法計(jì)算SDB序列的二階導(dǎo)數(shù)SDB"序列;e)設(shè)置一個(gè)局部窗口,利用局部均值對(duì)SDB"序列進(jìn)行平滑操作,去除干擾噪聲, 得到wSDB "序列;f)如果wSDB"序列長(zhǎng)度大于某一特定閾值時(shí),采用線性插值亞采樣的方法降低樣本數(shù)量,亞采樣后的平滑二階導(dǎo)數(shù)序列仍記為wSDB"序列;
g)構(gòu)造衡量某一時(shí)間區(qū)間[tp t2]是否為最優(yōu)穩(wěn)定分貝空間可能性的能量函
數(shù)
權(quán)利要求
1.一種自適應(yīng)音頻感知響度調(diào)整方法,包括以下步驟a)對(duì)當(dāng)前音頻信號(hào)進(jìn)行等響度濾波;b)計(jì)算RMS能量序列首先,將濾波后的音頻信號(hào)按照時(shí)間間隔分割成若干個(gè)窗口,設(shè)每個(gè)窗口的數(shù)據(jù)量為M,計(jì)算每個(gè)窗口的均方根值,得到整個(gè)音頻文件的RMS能量序列;c)能量分貝轉(zhuǎn)換將RMS能量序列轉(zhuǎn)換為分貝序列,并對(duì)分貝序列進(jìn)行升序排序得到 SDB序列;d)采用差分法計(jì)算SDB序列的二階導(dǎo)數(shù)SDB"序列;e)設(shè)置一個(gè)局部窗口,利用局部均值對(duì)SDB"序列進(jìn)行平滑操作,去除干擾噪聲,得到 wSDB "序列;f)如果wSDB"序列長(zhǎng)度大于某一特定閾值時(shí),采用線性插值亞采樣的方法降低樣本數(shù)量,亞采樣后的平滑二階導(dǎo)數(shù)序列仍記為wSDB"序列;g)構(gòu)造衡量某一時(shí)間區(qū)間[tpt2]是否為最優(yōu)穩(wěn)定分貝空間可能性的能量函數(shù)ri = '-z - ri — f::' ….,,其中,Std( )為標(biāo)準(zhǔn)差,a 為調(diào)制系數(shù),wSDB " (h —t2)表示wSDB"序列中Wtjljt2的子段,遍歷所有可能的時(shí)間區(qū)間[ti,t2]組合,求出其中能量函數(shù)取值最大的時(shí)間區(qū)間作為最優(yōu)穩(wěn)定分貝區(qū)間,并在此區(qū)間上求均值, 得到當(dāng)前音頻文件的最優(yōu)穩(wěn)定分貝代表值;h)按照83dB標(biāo)準(zhǔn),恢復(fù)當(dāng)前音頻文件的最優(yōu)穩(wěn)定響度。i)在當(dāng)前音頻文件的最優(yōu)穩(wěn)定響度的基礎(chǔ)上,采用線性映射的方法,調(diào)整該音頻的實(shí)際響度。
2.根據(jù)權(quán)利要求I所述的自適應(yīng)音頻感知響度調(diào)整方法,其特征在于,步驟a中采用級(jí)聯(lián)Yulewalk與二階高通Butterworth濾波器組,對(duì)當(dāng)前音頻信號(hào)進(jìn)行等響度濾波。
全文摘要
本發(fā)明屬于多媒體信息處理和音頻分析領(lǐng)域,涉及一種自適應(yīng)音頻感知響度調(diào)整方法,包括對(duì)于當(dāng)前音頻文件進(jìn)行等響度濾波;對(duì)于音頻信號(hào)按特定窗口大小計(jì)算其RMS能量值,從而得到整個(gè)音頻文件的RMS能量序列;將RMS能量序列轉(zhuǎn)換為分貝值序列,并對(duì)其進(jìn)行升序排序;對(duì)升序的分貝值序列利用差分法計(jì)算二階導(dǎo)數(shù),并利用局部窗口平均法進(jìn)行二階導(dǎo)數(shù)序列的平滑處理;當(dāng)序列過長(zhǎng)時(shí),對(duì)原始序列進(jìn)行亞采樣;在平滑后的二階導(dǎo)數(shù)序列上搜索當(dāng)前音頻的最優(yōu)穩(wěn)定分貝區(qū)間,計(jì)算此區(qū)間的平均分貝值作為當(dāng)前音頻文件的最優(yōu)穩(wěn)定響度。采用線性映射的方法對(duì)該音頻進(jìn)行響度調(diào)整。本發(fā)明具有運(yùn)行速度快、校正準(zhǔn)確、符合聲學(xué)感知、性能穩(wěn)定、無損音頻音質(zhì)等優(yōu)點(diǎn)。
文檔編號(hào)G10L21/02GK102610232SQ20121000551
公開日2012年7月25日 申請(qǐng)日期2012年1月10日 優(yōu)先權(quán)日2012年1月10日
發(fā)明者萬亮, 馮偉, 江建民, 譚志羽 申請(qǐng)人:天津大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
随州市| 靖远县| 牟定县| 南康市| 北票市| 平和县| 武平县| 左贡县| 梓潼县| 甘孜| 涿鹿县| 堆龙德庆县| 从江县| 柳州市| 寿宁县| 湘西| 额敏县| 阜平县| 延津县| 镇宁| 泾川县| 芜湖市| 岢岚县| 怀宁县| 松阳县| 全南县| 瑞安市| 双鸭山市| 道孚县| 静乐县| 邢台县| 丰原市| 奉新县| 新疆| 营口市| 奉化市| 遵化市| 读书| 锡林郭勒盟| 北流市| 东兴市|