專利名稱:一種音頻文件處理方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻處理技術(shù),特別地涉及一種音頻文件處理方法及系統(tǒng)。
背景技術(shù):
隨著移動互聯(lián)網(wǎng)的迅猛發(fā)展,利用手機上網(wǎng)越來越多,而通過手機下載歌曲也就越來越普遍,但是存在的瓶頸是流量費用比較貴,而且下載網(wǎng)速比較慢。針對移動互聯(lián)網(wǎng)音樂需求進行分析,提供歌曲快照(關(guān)鍵片段),能夠很好的代表這首歌曲,歌曲文件大大減少,對用戶來說能夠很少的花費就可以聽聽這首歌曲好聽不好聽,對版不對版,而且在現(xiàn)在的很慢的移動網(wǎng)速來說大大節(jié)約了用戶時間;對移動運營商的帶寬減少和服務(wù)器壓力減少都有很好的作用;對服務(wù)提供商帶寬消耗減少許多,服務(wù)器的消耗和用戶的體驗都有很好的提升。如果提供有效的歌曲快照成為亟待解決的技術(shù)問題。
發(fā)明內(nèi)容
本發(fā)明解決的技術(shù)問題在于提供了一種音頻文件處理方法及系統(tǒng),以為用戶提供有效的歌曲快照。為解決上述問題,本發(fā)明提供了一種音頻文件處理方法,包括,選擇歌曲文件,并將所述歌曲文件從音頻文件格式統(tǒng)一轉(zhuǎn)換為Wav格式;分析所述歌曲文件,計算出歌曲文件的關(guān)鍵快照起止時間;切割出快照歌曲文件。進一步地,上述的方法,還包括,對所述切割出的快照歌曲文件進行淡化處理;寫入歌名、歌手標簽信息到快照歌曲文件;對快照歌曲文件進行質(zhì)量檢測,在檢測合格后提交所述快照歌曲文件至存儲數(shù)據(jù)庫。上述的方法,其中,所述選擇歌曲文件具體包括,將同名、同歌手的歌曲文件為同組,在同組中選擇大于特定時長的歌曲文件,所述特定時長優(yōu)選大于70秒。上述的方法,其中,所述分析所述歌曲文件,計算出歌曲文件的關(guān)鍵快照起止時間具體包括,提取所述歌曲Wav格式文件的信息采樣大小(采樣值)、采樣率、單雙聲道信息,并計算出所述歌曲文件時長;根據(jù)所述歌曲文件時長確定關(guān)鍵快照的默認時長;根據(jù)Wav格式的歌曲文件,讀取音頻采樣數(shù)據(jù)進行存儲;在采樣數(shù)據(jù)基礎(chǔ)上產(chǎn)生出按照時間升序排序的序列表;計算所有相鄰片段均值差量的百分比,形成一個百分比數(shù)組;
在上面步驟的基礎(chǔ)上,找出可能的段落起止點,形成候選段落點數(shù)組;根據(jù)對比時長,選出平均幅值最大的片段的起止時間和最大平均幅值;計算確定的段落(片段)點間的時長,篩選掉〈30秒時長的段落,若選出了快照片段,則根據(jù)該快照片段確定快照起止時間;否則,選出默認時長(40或45秒)平均幅值最大的片段,稱為默認片段,根據(jù)該默認片段確定快照起止時間。上述的方法,其中,所述切割出快照歌曲文件中進行切割采用的方法包括,直接用開源工具ffmpeg按照指定時間對MP3文件進行切割;或用開源庫MAD和libmp31ame進行截取片段歌曲數(shù)據(jù)。上述的方法,其中,對所述切割出的快照歌曲文件進行淡化處理具體包括淡入操作和淡出操作,淡入操作是聲音從低到高漸變的過程;淡出操作是聲音從高到底漸變過程;具體地,淡入快照片段的前3秒,淡出結(jié)尾的3秒。上述的方法,其中,所述寫入歌名、歌手tag信息到快照歌曲文件具體包括,把歌名歌手按照ID3v2. 3格式寫入MP3格式的快照文件。上述的方法,其中,所述對快照歌曲文件進行質(zhì)量檢測,在檢測合格后提交所述快照歌曲文件至存儲數(shù)據(jù)庫具體包括,檢測快照歌曲文件MP3大小,如果所產(chǎn)生的片段MP3文件大小經(jīng)驗值大于5KB且小于〈4MB,則合格。本發(fā)明還提供了一種音頻文件處理系統(tǒng),包括,歌曲文件轉(zhuǎn)換模塊,用于選擇歌曲文件,并將所述歌曲文件從音頻文件格式統(tǒng)一轉(zhuǎn)換為Wav格式;歌曲文件分析模塊,用于分析所述歌曲文件,計算出歌曲文件的關(guān)鍵快照起止時間;歌曲文件切割模塊,用于切割出快照歌曲文件。進一步地,上述的系統(tǒng),還包括,淡化處理模塊,用于對所述切割出的快照歌曲文件進行淡化處理;標簽寫入模塊,用于寫入歌名、歌手標簽信息到快照歌曲文件;質(zhì)量檢測模塊,用于對快照歌曲文件進行質(zhì)量檢測,在檢測合格后提交所述快照歌曲文件至存儲數(shù)據(jù)庫。采用本發(fā)明的技術(shù)方案,可以用于移動互聯(lián)網(wǎng)的下載歌曲,節(jié)約帶寬和流量以及省錢;幫助用戶試聽歌曲是否好聽,是否對版(是否自己所要聽的歌曲);在高昂的手機流量費用下,很好的節(jié)約了帶寬和金錢;幫助人們高效的批量制作鈴聲。
此處所說明的附圖用來提供對本發(fā)明的進一步理解,構(gòu)成本發(fā)明的一部分,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當限定。在附圖中圖I是本發(fā)明第一實施例流程圖;圖2是一個歌曲波形示意圖;圖3是歌曲關(guān)鍵快照波形示意圖;圖4是本發(fā)明第二實施例結(jié)構(gòu)圖。
具體實施例方式為了使本發(fā)明所要解決的技術(shù)問題、技術(shù)方案及有益效果更加清楚、明白,以下結(jié)合附圖和實施例,對本發(fā)明進行進一步詳細說明。應(yīng)當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。如圖I所示,是本發(fā)明第一實施例流程圖,提供了一種音頻文件處理方法,具體包括,步驟SlOl,選擇歌曲文件,并將所述歌曲文件從音頻文件格式統(tǒng)一轉(zhuǎn)換為Wav格式;作為一個實施例,選擇歌曲文件是從互聯(lián)網(wǎng)海量歌曲中進行的,由于互聯(lián)網(wǎng)海量歌曲各有不同的情況,存在歌曲不完整、音質(zhì)差等問題,因此具體選擇步驟包括,將同名、同歌手的歌曲文件為同組,選擇大于特定時長的歌曲文件,所述特定時長優(yōu)選大于70秒(也可以是7CT100秒內(nèi)任一時長)。步驟S102,分析所述歌曲文件,計算出歌曲文件的關(guān)鍵快照起止時間;如圖2所示,是一個歌曲波形示意圖,如圖3所示,是歌曲關(guān)鍵快照波形示意圖,這樣的波形能量片段即是我們要找出的歌曲關(guān)鍵快照,經(jīng)過大量歌曲樣例抽測98%以上包含歌曲的關(guān)鍵內(nèi)容,而我們的算法計算結(jié)果經(jīng)過抽測樣例96%可完整包含歌曲關(guān)鍵片段。原理主要是根據(jù)波形能量某片段時間內(nèi)能量聚集的變化,密集程度,即找到一首歌曲中,所有片段中,能量聚集最高,表現(xiàn)為波形圖顯示最密集,且最高的一塊區(qū)域,且一定時長范圍內(nèi)的為關(guān)鍵快照。具體地,包括,102a,提取所述歌曲文件的Wav信息采樣大小(采樣值)、采樣率、單雙聲道信息,并計算出所述歌曲文件時長;102b,根據(jù)所述歌曲文件時長確定關(guān)鍵快照的默認時長;具體地,所述歌曲文件時長〈70秒的不做處理;所述歌曲文件時長〈=270秒的默認時長為40秒(這個是統(tǒng)計和分析樣例得出的時長);所述歌曲文件時長>270的設(shè)置默認時長45秒ο102c,根據(jù)Wav格式的歌曲文件,讀取音頻采樣數(shù)據(jù)進行存儲;102d,在采樣數(shù)據(jù)基礎(chǔ)上產(chǎn)生出按照時間(秒)升序排序的序列表(秒,秒內(nèi)所有采樣幅值和);pcm編碼(又叫脈沖編碼調(diào)制):數(shù)字通信的編碼方式之一。主要過程是將話音、圖像等模擬信號每隔一定時間進行取樣,使其離散化,同時將抽樣值按分層單位四舍五人取整量化,同時將抽樣值按一組二進制碼來表不抽樣脈沖的幅值。鍵值對排序表如下O,第一秒內(nèi)幅值和I,第二秒內(nèi)幅值和。。。N,歌曲最后一秒米樣幅值和說明幅值和能量具有相同的單調(diào)性,可參看能量計算公式,因此計算幅值的密集和大小情況即是代表能量情況。102e,片段排序表產(chǎn)生片段(測試經(jīng)驗值3秒)幅值秒均值排序表;片段平均值在所述序列表基礎(chǔ)上產(chǎn)生鍵值對排序表如下I,f 3秒內(nèi)幅值平均值2,2^4秒內(nèi)幅值平均值。。。N-2,歌曲最后3秒幅值平均值102f,計算所有相鄰片段均值差量的百分比,形成一個百分比數(shù)組;百分比計算如果相鄰后3秒均值-相鄰前3秒均值>=0,相鄰片段均值差量的百分比為((相鄰后3秒均值-相鄰前3秒均值)/相鄰后3秒均值)*100 ;如果相鄰后3秒均值-相鄰前3秒均值 〈0,相鄰片段均值差量的百分比為((相鄰后3秒均值-相鄰前3秒均值)/相鄰前3秒均值)*100 ;本步驟計算結(jié)果,數(shù)組示例2% 5% 1% -%2 -4%....102g,在上面步驟的基礎(chǔ)上,找出可能的段落起止點,形成候選段落點數(shù)組;具體計算A.如果連續(xù)三個差量百分比>0且三個差量百分比之和>=30且有至少一個差量百分比> 8;則確定該第一個差量百分比對應(yīng)起始時間為一個段落點,起伏較大的波形之間,本文記作歌曲的歌唱時的段落點;B.如果連續(xù)三個差量百分比〈O且三個差量百分比之和<=-20且有至少一個差量百分比〈-11 ;則確定該連續(xù)三個差量百分比的第一個差量百分比對應(yīng)的起始時間負值為一個段落點值。C.把A,B中的時間點放入序列數(shù)組,作為可能的段落起止點。102h,根據(jù)對比時長,選出平均幅值最大的片段的起止時間和最大平均幅值(記為基準幅值);對比時長,是根據(jù)樣例測試得出的一個經(jīng)驗時長值,例如30秒,以這個時長作為選擇關(guān)鍵片段的參考時間。102i,計算確定的段落(片段)點間的時長,篩選掉〈30秒時長的段落;剩下的段落中,篩選出段落平均幅值 > 基準幅值*95%且剩下段落中平均幅值最大的段落(片段)為所選快照(關(guān)鍵片段)。102j,選出默認時長(40或45秒)平均幅值最大的片段,稱為默認片段;102k,確定快照起止時間。如果102i步驟中選出了快照片段,則選用,否則選用102k步中的默認片段快照。步驟S103,切割出快照歌曲文件;具體地,所述進行切割采用的方法為第一種方法直接用開源工具ffmpeg按照指定時間對MP3文件進行切割如下所示ffmpeg _i input, mp3 _ss hh:mm:ss _t hh:mm:ss -acodec copy output, mp3CN 102930887 A
書
明
說
5/6頁參數(shù)說明-ss :指定從那里開始切-t 指定到那里結(jié)束-acodec copy :編碼格式,和輸入的一樣第二種方法用開源庫MD和libmp31ame進行截取片段歌曲數(shù)據(jù)。MAD (Iibmad)是一個開源的高精度MPEG音頻解碼庫I)用mad開源庫把MP3歌曲文件解碼成pcm ;獲得采樣大小,采樣率,通道數(shù),采樣數(shù),采樣等信息。2)根據(jù)快照的起止時間(關(guān)鍵片段),計算出對應(yīng)的起止采樣位置采樣是第幾個開始,第幾個結(jié)束;3)用libmp31ame庫把2)步中確定起止采樣位置內(nèi)的所有采樣PCM數(shù)據(jù)編碼成MP3。進一步地,該實施例還包括,步驟S104,對所述切割出的快照歌曲文件進行淡化處理;淡化說明操作是為了用戶體驗好,不至于太突然,尤其截取的歌曲片段,讓耳朵聽覺逐漸適應(yīng)的過程;一般在截取的音樂快照片段中有很好的效果。淡入操作就是聲音從低到高漸變的過程;淡出就是從高到底漸變過程;具體地,淡入快照片段的前3秒,淡出結(jié)尾的3秒,其中,淡化算法為淡入3秒則該3秒內(nèi)每個采樣值進行縮小處理3秒內(nèi)第i采樣值記為Nii記為第幾個米樣序號,第一個位O,第二個為I。。。3秒內(nèi)采樣數(shù)計為C,該值等于采樣率乘3秒算出。則3秒內(nèi)采樣值修改公式Ni = Ni X (i + C)淡出處理則該3秒內(nèi)每個采樣值進行縮小處理所選3秒內(nèi)第i采樣值記為Nii記為第幾個米樣序號,第一個位O,第二個為I。。。3秒內(nèi)采樣數(shù)計為C,該值等于采樣率乘3秒算出。則3秒內(nèi)采樣值修改公式Ni = Ni X ( (C - I - i ) + C )步驟S105,寫入歌名、歌手標簽信息到快照歌曲文件;具體地,把歌名歌手按照ID3v2. 3格式寫入MP3格式的快照文件,注意字符編碼,否則出亂碼。ID3標簽是MP3音樂檔案中的歌曲附加訊息,它能夠在MP3中附加曲子的演出者、作者以及其它類別資訊,方便眾多樂曲的管理。缺少ID3標簽并不會影響MP3的播放,但若沒有的話,管理音樂文件也會相當?shù)穆闊?。如果你在網(wǎng)上下載MP3,里面多半已經(jīng)寫有預(yù)設(shè)的ID3信息。
8
此外,ID3也就是ID3Tags,其中的“Tag”在英文中名詞的一個意思是“標簽”,所以“ID3Tags”也就是“MP3文件曲目標簽”的意思。有些地方以“ ID3”這樣的簡稱來代表“ ID3Tags ”,二者本質(zhì)是一樣的ID3,一般是位于一個mp3文件的開頭或末尾的若干字節(jié)內(nèi),附加了關(guān)于該mp3的歌手,標題,專輯名稱,年代,風格等信息,該信息就被稱為ID3信息,ID3信息分為兩個版本,Vl和v2版。其中vl版的ID3在mp3文件的末尾128字節(jié),以TAG三個字符開頭,后面跟上歌曲信息。v2版一般位于mp3的開頭,可以存儲歌詞,該專輯的圖片等大容量的信采用ID3v2. 3,因為這個版本被支持最廣泛,且可以伸縮和擴展,一般寫入MP3文件開頭步驟S106,對快照歌曲文件進行質(zhì)量檢測,在檢測合格后提交所述快照歌曲文件至存儲數(shù)據(jù)庫。具體地,檢測快照歌曲文件MP3大小,如果所產(chǎn)生的片段MP3文件大小經(jīng)驗值大于5KB且小于4MB,則合格;其中KB,MB是計算機中表儲存容量大小的單位。如圖4所示,是本發(fā)明第二實施例結(jié)構(gòu)圖,提供了一種音頻文件處理系統(tǒng),包括,歌曲文件轉(zhuǎn)換模塊,用于選擇歌曲文件,并將所述歌曲文件從音頻文件格式統(tǒng)一轉(zhuǎn)換為Wav格式;歌曲文件分析模塊,用于分析所述歌曲文件,計算出歌曲文件的關(guān)鍵快照起止時間;歌曲文件切割模塊,用于切割出快照歌曲文件。進一步地,該系統(tǒng)還包括,淡化處理模塊,用于對所述切割出的快照歌曲文件進行淡化處理;標簽寫入模塊,用于寫入歌名、歌手標簽信息到快照歌曲文件;質(zhì)量檢測模塊,用于對快照歌曲文件進行質(zhì)量檢測,在檢測合格后提交所述快照歌曲文件至存儲數(shù)據(jù)庫。上述說明示出并描述了本發(fā)明的一個優(yōu)選實施例,但如前所述,應(yīng)當理解本發(fā)明并非局限于本文所披露的形式,不應(yīng)看作是對其他實施例的排除,而可用于各種其他組合、修改和環(huán)境,并能夠在本文所述發(fā)明構(gòu)想范圍內(nèi),通過上述教導或相關(guān)領(lǐng)域的技術(shù)或知識進行改動。而本領(lǐng)域人員所進行的改動和變化不脫離本發(fā)明的精神和范圍,則都應(yīng)在本發(fā)明所附權(quán)利要求的保護范圍內(nèi)。
權(quán)利要求
1.一種音頻文件處理方法,其特征在于,包括, 選擇歌曲文件,并將所述歌曲文件從音頻文件格式統(tǒng)一轉(zhuǎn)換為Wav格式; 分析所述歌曲文件,計算出歌曲文件的關(guān)鍵快照起止時間; 切割出快照歌曲文件。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,還包括, 對所述切割出的快照歌曲文件進行淡化處理; 寫入歌名、歌手標簽信息到快照歌曲文件; 對快照歌曲文件進行質(zhì)量檢測,在檢測合格后提交所述快照歌曲文件至存儲數(shù)據(jù)庫。
3.根據(jù)權(quán)利要求I或2所述的方法,其特征在于,所述選擇歌曲文件具體包括, 將同名、同歌手的歌曲文件為同組,在同組中選擇大于特定時長的歌曲文件,所述特定時長優(yōu)選大于70秒。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述分析所述歌曲文件,計算出歌曲文件的關(guān)鍵快照起止時間具體包括, 提取所述歌曲文件的Wav信息采樣大小(采樣值)、采樣率、單雙聲道信息,并計算出所述歌曲文件時長; 根據(jù)所述歌曲文件時長確定關(guān)鍵快照的默認時長; 根據(jù)Wav格式的歌曲文件,讀取音頻采樣數(shù)據(jù)進行存儲; 在采樣數(shù)據(jù)基礎(chǔ)上產(chǎn)生出按照時間升序排序的序列表; 計算所有相鄰片段均值差量的百分比,形成一個百分比數(shù)組; 在上面步驟的基礎(chǔ)上,找出可能的段落起止點,形成候選段落點數(shù)組; 根據(jù)對比時長,選出平均幅值最大的片段的起止時間和最大平均幅值; 計算確定的段落(片段)點間的時長,篩選掉〈30秒時長的段落,若選出了快照片段,則根據(jù)該快照片段確定快照起止時間;否則,選出默認時長(40或45秒)平均幅值最大的片段,稱為默認片段,根據(jù)該默認片段確定快照起止時間。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述切割出快照歌曲文件中進行切割采用的方法包括, 直接用開源工具ffmpeg按照指定時間對MP3文件進行切割;或 用開源庫MAD和libmp31ame進行截取片段歌曲數(shù)據(jù)。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述對所述切割出的快照歌曲文件進行淡化處理具體包括淡入操作和淡出操作,淡入操作是聲音從低到高漸變的過程;淡出操作是聲音從高到底漸變過程;具體地,淡入快照片段的前3秒,淡出結(jié)尾的3秒。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述寫入歌名、歌手tag信息到快照歌曲文件具體包括, 把歌名歌手按照ID3v2. 3格式寫入MP3格式的快照文件。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述對快照歌曲文件進行質(zhì)量檢測,在檢測合格后提交所述快照歌曲文件至存儲數(shù)據(jù)庫具體包括, 檢測快照歌曲文件MP3大小,如果所產(chǎn)生的片段MP3文件大小經(jīng)驗值大于5KB且小于〈4MB,則合格。
9.一種音頻文件處理系統(tǒng),其特征在于,包括,歌曲文件轉(zhuǎn)換模塊,用于選擇歌曲文件,并將所述歌曲文件從音頻文件格式統(tǒng)一轉(zhuǎn)換為Wav格式; 歌曲文件分析模塊,用于分析所述歌曲文件,計算出歌曲文件的關(guān)鍵快照起止時間; 歌曲文件切割模塊,用于切割出快照歌曲文件。
10.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,還包括, 淡化處理模塊,用于對所述切割出的快照歌曲文件進行淡化處理; 標簽寫入模塊,用于寫入歌名、歌手標簽信息到快照歌曲文件; 質(zhì)量檢測模塊,用于對快照歌曲文件進行質(zhì)量檢測,在檢測合格后提交所述快照歌曲文件至存儲數(shù)據(jù)庫。
全文摘要
本發(fā)明涉及音頻處理領(lǐng)域,提供了一種音頻文件處理方法及系統(tǒng),以為用戶提供有效的歌曲快照。該方法包括選擇歌曲文件,并將所述歌曲文件從音頻文件格式統(tǒng)一轉(zhuǎn)換為Wav格式;分析所述歌曲文件,計算出歌曲文件的關(guān)鍵快照起止時間;切割出快照歌曲文件。采用本發(fā)明的技術(shù)方案,可以用于移動互聯(lián)網(wǎng)的下載歌曲,節(jié)約帶寬和流量以及省錢;幫助用戶試聽歌曲是否好聽,是否對版(是否自己所要聽的歌曲);在高昂的手機流量費用下,很好的節(jié)約了帶寬和金錢;幫助人們高效的批量制作鈴聲。
文檔編號G11B20/12GK102930887SQ20121042801
公開日2013年2月13日 申請日期2012年10月31日 優(yōu)先權(quán)日2012年10月31日
發(fā)明者張云飛, 劉軍, 陳偉, 李錦根, 黃興紅 申請人:深圳市宜搜科技發(fā)展有限公司