欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種對(duì)音頻數(shù)據(jù)進(jìn)行處理的方法及裝置的制作方法

文檔序號(hào):7509218閱讀:266來源:國(guó)知局
專利名稱:一種對(duì)音頻數(shù)據(jù)進(jìn)行處理的方法及裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種音頻數(shù)據(jù)處理方法及裝置,尤其涉及一種對(duì)壓縮音頻數(shù)據(jù)進(jìn)行處理的方法及裝置。
背景技術(shù)
隨著音頻壓縮技術(shù)的發(fā)展,人們對(duì)于音頻壓縮技術(shù)的應(yīng)用越來越廣,要求也越來越高。例如,現(xiàn)有的很多電子玩具、電子書以及電子字典等產(chǎn)品,都具有語音輸出、真人發(fā)音,甚至聲音錄制播放等功能。一般來說,這類電子設(shè)備都需要對(duì)輸入語音進(jìn)行壓縮存儲(chǔ),然后再根據(jù)需要解壓縮播放輸出。
現(xiàn)有的音頻壓縮方式,以語音壓縮為例,主要采取如圖1所示的過程首先,輸入的原始語音經(jīng)過預(yù)處理后進(jìn)行LPC(Linear Predict Coding,線性預(yù)測(cè)編碼)分析,其中的LPC系數(shù)進(jìn)行LSF(Line Spectrum Frequency,線譜頻率)轉(zhuǎn)化得到LSF系數(shù),進(jìn)而將LSF系數(shù)傳輸給量化器;然后LPC分析后,預(yù)測(cè)殘差并進(jìn)行語氣(UV)判斷和音調(diào)(Pitch)搜索,得到音調(diào)和UV信息,并將其輸送給量化器,量化器根據(jù)LSF系數(shù)和音調(diào)系數(shù)UV信息合成輸出壓縮碼流。
上述對(duì)語音信號(hào)的預(yù)處理,主要是將連續(xù)語音分成一系列的音幀。語音信號(hào)處理時(shí),常假設(shè)語音的特征是緩慢變化的,因此,處理這種不固定(nonstationary)周期的語音信號(hào)時(shí),常將其分段處理,把每一小段當(dāng)成一個(gè)固定(stationary)信號(hào)處理,每一小段稱之為音幀,或稱音框(Frame),或短時(shí)距(short time)。音幀的取法方式有固定音框數(shù)取法,以及不固定音框數(shù)取法。
對(duì)于解壓縮的方式,如圖2所示,其過程與圖1相反首先,壓縮碼流經(jīng)過反量化器得到LSF系數(shù),音調(diào)系數(shù)以及UV信息,LSF系數(shù)轉(zhuǎn)化成LPC系數(shù),音調(diào)系數(shù)與UV信息合成激勵(lì)信號(hào),LPC系數(shù)和激勵(lì)信號(hào)經(jīng)過LPC合成后,經(jīng)后處理,輸出解碼語音。
適用于語音壓縮的編碼方式有多種,例如上述線性預(yù)測(cè)編碼(LPC)屬于參數(shù)編碼,參數(shù)編碼是將信源信號(hào)在頻率域或其它正交變換域提取特征參數(shù),并將其變換成數(shù)字代碼進(jìn)行傳輸。另外還有波形編碼,如脈沖編碼調(diào)制(pulse code modulation,PCM),以及混合編碼,如多脈沖激勵(lì)線性預(yù)測(cè)編碼(MPLPC)。
上述的音調(diào)以及語氣信息,都屬于輸入語音的特征參數(shù),對(duì)特征參數(shù)的處理是對(duì)語音信號(hào)進(jìn)行有效壓縮的重要一環(huán)。
現(xiàn)有的語音壓縮算法,特別是分段式壓縮算法,利用上述壓縮方式,對(duì)輸入語音文件進(jìn)行分段式壓縮,并將特征參數(shù),例如音調(diào)數(shù)據(jù)獨(dú)立保存在每段中,然后將壓縮后的語音數(shù)據(jù)與音調(diào)數(shù)據(jù)保存到存儲(chǔ)模塊中。
利用上述現(xiàn)有壓縮方式對(duì)語音文件進(jìn)行壓縮處理后,已經(jīng)在相當(dāng)程度上達(dá)到了壓縮的效果,可滿足一般的應(yīng)用需求。然而,在電子設(shè)備越來越小型化、便攜化的今天,對(duì)于很多數(shù)碼產(chǎn)品,例如掌上型電子設(shè)備,經(jīng)過上述壓縮后的語音仍占據(jù)了相對(duì)較大的存儲(chǔ)空間,人們?nèi)匀幌M麑?duì)于經(jīng)過上述壓縮后的語音進(jìn)行進(jìn)一步壓縮。
因此,針對(duì)當(dāng)前具有音頻壓縮需求的電子設(shè)備,能否提出一種解決方案,在現(xiàn)有的壓縮方式的基礎(chǔ)上,對(duì)壓縮后的音頻數(shù)據(jù)進(jìn)行進(jìn)一步的處理,已經(jīng)成為業(yè)內(nèi)亟待解決的問題。

發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題在于提供一種對(duì)音頻數(shù)據(jù)進(jìn)行處理的方法及裝置,在現(xiàn)有的分段式壓縮方式的基礎(chǔ)上,對(duì)壓縮后的音頻數(shù)據(jù)進(jìn)行進(jìn)一步的壓縮處理,而聲音質(zhì)量并不會(huì)受到明顯的影響。
本發(fā)明提供一種對(duì)音頻數(shù)據(jù)進(jìn)行處理的方法,對(duì)經(jīng)分段式壓縮后的、各幀中獨(dú)立保存有特征參數(shù)數(shù)據(jù)的音頻數(shù)據(jù)進(jìn)行進(jìn)一步的壓縮,首先根據(jù)所述各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù),為各幀生成特征參數(shù)包絡(luò)曲線數(shù)據(jù);然后使用所述各幀特征參數(shù)包絡(luò)曲線數(shù)據(jù)替換所述各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù)。
另外,上述本發(fā)明方法還包括如下對(duì)壓縮音頻數(shù)據(jù)的編輯步驟1)接收用戶輸入的操作信息;2)根據(jù)前述操作信息,自動(dòng)生成與此對(duì)應(yīng)的控制命令;3)根據(jù)所述控制命令,編輯所述存儲(chǔ)的壓縮后的音頻數(shù)據(jù);及4)顯示編輯后的音頻數(shù)據(jù)的波形和包絡(luò)。
本發(fā)明進(jìn)而還提供一種音頻數(shù)據(jù)處理裝置,包括分段式壓縮模塊,用于對(duì)音頻數(shù)據(jù)進(jìn)行分段式壓縮,將特征參數(shù)數(shù)據(jù)獨(dú)立保存于每幀中;存儲(chǔ)模塊,用于存儲(chǔ)壓縮音頻數(shù)據(jù);以及再壓縮模塊,用于對(duì)經(jīng)分段式壓縮后的音頻數(shù)據(jù)進(jìn)行進(jìn)一步的壓縮,該再壓縮模塊又包括包絡(luò)曲線生成單元,用于根據(jù)所述各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù),為各幀生成特征參數(shù)包絡(luò)曲線數(shù)據(jù);以及特征參數(shù)替換單元,用于使用所述各幀特征參數(shù)包絡(luò)曲線數(shù)據(jù)替換所述各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù)。
另外,上述音頻數(shù)據(jù)處理裝置還包括解壓縮模塊,用于對(duì)經(jīng)壓縮編輯后的音頻數(shù)據(jù)進(jìn)行解壓縮,包括特征參數(shù)計(jì)算單元,用于根據(jù)各幀音頻數(shù)據(jù)中的特征參數(shù)包絡(luò)曲線數(shù)據(jù),動(dòng)態(tài)計(jì)算出當(dāng)前各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù);以及分段式解壓縮單元,用于根據(jù)所述各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù),對(duì)當(dāng)前各幀音頻數(shù)據(jù)進(jìn)行分段式解壓縮。
另外,上述音頻數(shù)據(jù)處理裝置還包括輸出模塊,用于輸出經(jīng)解壓縮后的音頻數(shù)據(jù)和包絡(luò)曲線。
另外,上述音頻數(shù)據(jù)處理裝置還包括用戶交互模塊,用于接收用戶輸入的命令,以執(zhí)行再壓縮編輯和顯示控制。
本發(fā)明由于采用包絡(luò)曲線來近似地表示各個(gè)音幀的特征參數(shù),例如音調(diào)的變化,在播放時(shí)動(dòng)態(tài)的計(jì)算出當(dāng)前音幀數(shù)據(jù)的音調(diào)值,從而起到壓縮的作用。在導(dǎo)出數(shù)據(jù)時(shí),通過將音幀中的特征參數(shù)數(shù)據(jù)拿掉,并用包絡(luò)曲線的數(shù)據(jù)進(jìn)行替換即可,一般來說,由于聲音文件的音幀較多,所以對(duì)音調(diào)部分的數(shù)據(jù)的替換起到了對(duì)數(shù)據(jù)壓縮的功能。另外,本發(fā)明還提供了對(duì)壓縮后的語音的輸出和交互式編輯,用戶可以通過各種用戶命令對(duì)壓縮語音數(shù)據(jù)進(jìn)行靈活方便的交互式修改,并實(shí)時(shí)輸出編輯修改后的聲音文件。


圖1為現(xiàn)有的音頻壓縮方式示意圖;圖2為現(xiàn)有的音頻解壓縮方式示意圖;圖3為本發(fā)明所述的對(duì)音頻數(shù)據(jù)進(jìn)行處理的方法實(shí)施例流程示意圖;圖4為利用本發(fā)明對(duì)音頻數(shù)據(jù)進(jìn)行交互式壓縮編輯處理的方法實(shí)施例流程示意圖;圖5為本發(fā)明所述的對(duì)音頻數(shù)據(jù)進(jìn)行處理的裝置實(shí)施例結(jié)構(gòu)示意圖;圖6為利用本發(fā)明對(duì)音頻數(shù)據(jù)進(jìn)行交互式壓縮編輯處理的裝置實(shí)施例示意圖;以及圖7為利用本發(fā)明對(duì)音頻數(shù)據(jù)進(jìn)行壓縮編輯的用戶界面示意圖。
具體實(shí)施例方式
分析現(xiàn)有的音頻數(shù)據(jù)壓縮,由于通過傳統(tǒng)的分段式壓縮處理后,會(huì)為每一個(gè)音幀獨(dú)立記錄一個(gè)特征參數(shù),例如音調(diào)的值,但實(shí)際上,音調(diào)只要在一定范圍內(nèi)變化,聲音聽起來仍然可以讓人滿意,因此,對(duì)于經(jīng)過壓縮后的語音數(shù)據(jù),仍存在進(jìn)一步壓縮的空間。
具體來說,現(xiàn)有的壓縮方式,通過對(duì)語音文件進(jìn)行分段式壓縮,將音調(diào)數(shù)據(jù)獨(dú)立保存在每段中,而后將壓縮后的語音數(shù)據(jù)與音調(diào)數(shù)據(jù)保存到存儲(chǔ)單元。針對(duì)這種情況,本發(fā)明首先提出一種對(duì)音頻數(shù)據(jù)進(jìn)行處理的方法,對(duì)經(jīng)分段式壓縮后的、各幀中獨(dú)立保存有特征參數(shù)數(shù)據(jù)的音頻數(shù)據(jù)進(jìn)行進(jìn)一步的壓縮,如圖3所示,首先,根據(jù)所述各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù),為各幀生成特征參數(shù)包絡(luò)曲線數(shù)據(jù)(步驟301);然后使用所述各幀特征參數(shù)包絡(luò)曲線數(shù)據(jù)替換所述各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù)(步驟302)。
應(yīng)當(dāng)注意的是,盡管本發(fā)明是以音調(diào)為例來說明對(duì)音頻數(shù)據(jù),特別是語音數(shù)據(jù)的特征參數(shù)數(shù)據(jù),但是,明顯的,特征參數(shù)數(shù)據(jù)還可以包括其他特征參數(shù)數(shù)據(jù),例如語氣等特征。因此,無論是何種音頻數(shù)據(jù),何種特征參數(shù),都被本發(fā)明所包含。
如圖4所示,為本發(fā)明方法的另一實(shí)施例流程示意圖,首先,對(duì)輸入的原始音頻數(shù)據(jù),例如“.Wav”格式文件,進(jìn)行分段式壓縮,形成例如“.Bin”格式文件,特征參數(shù)數(shù)據(jù)獨(dú)立保存于每幀中(步驟401),應(yīng)當(dāng)注意,如果直接輸入的就是“.Bin”格式文件,則該步驟可以省略;然后根據(jù)所述各幀壓縮音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù),為各幀生成特征參數(shù)包絡(luò)曲線數(shù)據(jù)(步驟402);使用所述各幀特征參數(shù)包絡(luò)曲線數(shù)據(jù)替換所述各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù)(步驟403);根據(jù)各幀音頻數(shù)據(jù)中的特征參數(shù)包絡(luò)曲線數(shù)據(jù),動(dòng)態(tài)計(jì)算出各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù),以對(duì)當(dāng)前各幀音頻數(shù)據(jù)進(jìn)行解壓縮(步驟404);輸出所述解壓縮結(jié)果(步驟405);獲取用戶根據(jù)所述輸出結(jié)果而輸入的編輯修改命令(步驟406);根據(jù)所述編輯修改命令控制所述包絡(luò)曲線的修改生成與替換,以進(jìn)行壓縮調(diào)整(步驟407);根據(jù)所述壓縮調(diào)整,對(duì)調(diào)整后的音頻數(shù)據(jù)再次進(jìn)行解壓縮,并輸出結(jié)果(步驟408);然后根據(jù)獲取的用戶修改命令,重復(fù)所述壓縮調(diào)整與解壓縮步驟,直至編輯結(jié)束(步驟409)。
其中,所述獲取用戶輸入的編輯修改命令之步驟(步驟406),如果用戶需要改變特征參數(shù)包絡(luò)曲線還可以對(duì)所述各幀的特征參數(shù)包絡(luò)曲線數(shù)據(jù)進(jìn)行多次修改,生成進(jìn)一步簡(jiǎn)化的特征參數(shù)包絡(luò)曲線,而對(duì)包絡(luò)曲線的修改,可以通過修改所述包絡(luò)曲線的節(jié)點(diǎn)而實(shí)現(xiàn),然后使用修改后的特征參數(shù)包絡(luò)曲線數(shù)據(jù)替換各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù)。
其中,所述獲取用戶輸入的編輯修改命令之步驟(步驟406),如果需要對(duì)波形的顯示大小進(jìn)行控制,則還可以進(jìn)一步包括根據(jù)用戶命令,控制對(duì)音頻數(shù)據(jù)波形圖的放大(zoom out)、縮小(zoom in)以及全圖(zoom all)顯示輸出;還可以根據(jù)用戶命令,選擇特征參數(shù)包絡(luò)曲線的顯示輸出,可以選擇音調(diào)包絡(luò)曲線,也可以選擇語氣等其他特征的包絡(luò)曲線。
其中所述的編輯修改命令之步驟(步驟406),如果需要輸入音頻數(shù)據(jù),可以是直接從外部輸入音頻,也可以是根據(jù)獲取的下載音頻文件的用戶命令,選擇打開存儲(chǔ)在存儲(chǔ)模塊中的音頻文件。
對(duì)應(yīng)于本發(fā)明所述的處理方法,本發(fā)明還提供一種對(duì)音頻數(shù)據(jù)進(jìn)行處理的裝置,如圖5所示,可以包括分段式壓縮模塊,用于對(duì)音頻數(shù)據(jù)進(jìn)行分段式壓縮,將特征參數(shù)數(shù)據(jù)獨(dú)立保存于每幀中,經(jīng)分段式壓縮后的音頻數(shù)據(jù)存儲(chǔ)于存儲(chǔ)模塊502中,本發(fā)明所述的再壓縮裝置501,包括包絡(luò)曲線生成模塊5011,用于根據(jù)所述各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù),為各幀生成特征參數(shù)包絡(luò)曲線數(shù)據(jù);以及特征參數(shù)替換模塊5012,用于使用所述各幀特征參數(shù)包絡(luò)曲線數(shù)據(jù)替換所述各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù)。
本發(fā)明還提供一種音頻數(shù)據(jù)處理裝置的實(shí)施例,如圖6所示,為本發(fā)明所述的交互式壓縮編輯裝置實(shí)施例示意圖,包括分段式壓縮模塊601,存儲(chǔ)模塊602,解壓縮模塊603,輸出模塊604,再壓縮模塊605,用戶交互模塊606,如果需要將壓縮文件下載到其他硬件中播放,則還可以包括一個(gè)下載播放模塊607。
其中,分段式壓縮模塊601用于對(duì)輸入的原始音頻數(shù)據(jù),例如“.Wav”格式的文件,進(jìn)行分段式壓縮,形成“.Bin”格式的壓縮音頻數(shù)據(jù),將特征參數(shù)數(shù)據(jù)獨(dú)立保存于每幀中,應(yīng)當(dāng)注意,如果輸入的音頻數(shù)據(jù)直接就是“.Bin格式”的文件,那么該分段式壓縮模塊601可以省略,直接在存儲(chǔ)模塊中存儲(chǔ)即可;存儲(chǔ)模塊602用于存儲(chǔ)壓縮音頻數(shù)據(jù),如“.Bin”格式文件;再壓縮模塊605用于對(duì)經(jīng)分段式壓縮后的音頻數(shù)據(jù)進(jìn)行進(jìn)一步的壓縮;解壓縮模塊603用于對(duì)經(jīng)壓縮編輯后的音頻數(shù)據(jù)進(jìn)行解壓縮;輸出模塊604用于輸出經(jīng)解壓縮后的音頻數(shù)據(jù);用戶交互模塊606用于接受用戶輸入的命令,以控制執(zhí)行壓縮編輯。
其中,再壓縮模塊605包括一個(gè)包絡(luò)曲線生成單元(圖中未示),用于根據(jù)所述各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù),為各幀生成特征參數(shù)包絡(luò)曲線數(shù)據(jù);以及一個(gè)特征參數(shù)替換單元(圖中未示),用于使用所述各幀特征參數(shù)包絡(luò)曲線數(shù)據(jù)替換所述各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù)。
其中,解壓縮模塊603包括特征參數(shù)計(jì)算單元(圖中未示),用于根據(jù)各幀音頻數(shù)據(jù)中的特征參數(shù)包絡(luò)曲線數(shù)據(jù),動(dòng)態(tài)計(jì)算出當(dāng)前各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù);以及分段式解壓縮單元(圖中未示),用于根據(jù)所述各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù),對(duì)當(dāng)前各幀音頻數(shù)據(jù)進(jìn)行分段式解壓縮。
其中,用戶交互模塊606包括一個(gè)輸出顯示控制單元6062,用于控制所述輸出模塊顯示音頻波形與特征參數(shù)的包絡(luò)曲線;以及包絡(luò)曲線修改單元6061,用戶通過包絡(luò)修改單元對(duì)顯示的特征參數(shù)包絡(luò)曲線進(jìn)行修改,并生成進(jìn)一步簡(jiǎn)化的特征參數(shù)包絡(luò)曲線數(shù)據(jù),而對(duì)包絡(luò)曲線的修改,可以通過修改所述包絡(luò)曲線的節(jié)點(diǎn)而實(shí)現(xiàn),所述再壓縮模塊使用所述修改后的特征參數(shù)包絡(luò)曲線數(shù)據(jù)替換各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù)。如果需要對(duì)顯示波形進(jìn)行進(jìn)一步的控制,則還可以包括一個(gè)波形顯示控制單元6063,用于控制對(duì)音頻數(shù)據(jù)波形的放大(zoom out)、縮小(zoom in)以及全圖顯示(zoom all),還可以包括直接選擇顯示原始文件中的音調(diào)和語氣的包絡(luò)曲線作參考。如果需要進(jìn)一步控制選擇所述存儲(chǔ)模塊602中的壓縮音頻文件,則還可以包括一個(gè)音頻文件下載單元6064,用于選擇壓縮音頻文件。
其中,所述包絡(luò)曲線包括音調(diào)和語氣的包絡(luò)曲線。
其中,輸出模塊604進(jìn)行輸出,包括圖形顯示輸出模塊和聲音播放輸出模塊。
另外,本發(fā)明所述的交互式壓縮編輯裝置,還可以進(jìn)一步包括一個(gè)下載模塊607,存儲(chǔ)模塊602中的聲音文件可以下載到下載模塊607中進(jìn)行播放,下載模塊607可以是EMU板。
如圖7所示,為利用本發(fā)明的交互式壓縮編輯裝置及其方法,對(duì)音頻數(shù)據(jù)進(jìn)行壓縮編輯的用戶界面示意圖,輸出模塊的輸出可以包括圖像顯示輸出和聲音播放輸出,而圖像顯示輸出可以顯示波形及其包絡(luò)曲線,也可以只顯示其一。
從圖7中可以看出,曲線701為根據(jù)各個(gè)幀中音調(diào)值為參數(shù)畫出的包絡(luò)曲線,曲線702為用戶通過用戶交互單元發(fā)送包絡(luò)修改命令而再次生成的包絡(luò)曲線,可以明顯看出數(shù)據(jù)個(gè)數(shù)的減少。通過如此反復(fù)的修改,并隨時(shí)收聽到解壓縮后的效果,可以交互式的對(duì)壓縮音頻數(shù)據(jù)進(jìn)行壓縮編輯。
從本發(fā)明的實(shí)施例中可以看出,由于采用包絡(luò)曲線來近似表示各個(gè)音幀的音調(diào)變化,在播放時(shí)動(dòng)態(tài)計(jì)算出當(dāng)前音幀數(shù)據(jù)的音調(diào)值,從而起到壓縮的作用。在導(dǎo)出數(shù)據(jù)時(shí),將音幀中的音調(diào)數(shù)據(jù)拿掉,并用包絡(luò)曲線的數(shù)據(jù)進(jìn)行替換,由于一般語音文件的音幀較多,所以對(duì)音調(diào)部分的數(shù)據(jù)的替換起到了對(duì)數(shù)據(jù)壓縮的功能。
例如,對(duì)于一大小為74.3KB原始聲音文件LF1.Wav,先對(duì)其以采樣率為8000,壓縮編碼率為2000bps進(jìn)行初步的壓縮,壓縮后的文件LF1.Bin大小為1.17KB,此時(shí)采用本發(fā)明所述的壓縮編輯方法對(duì)其進(jìn)行進(jìn)一步的編輯壓縮,將音幀中的音調(diào)數(shù)據(jù)替換掉,文件減少7×音幀個(gè)數(shù)/8個(gè)字節(jié),之后生成一個(gè)替代音調(diào)數(shù)據(jù)的包絡(luò)曲線文件(一般16點(diǎn)以內(nèi),取8個(gè)點(diǎn)),大小為8×4個(gè)字節(jié),由于音幀的值會(huì)較大,從而達(dá)到壓縮目的,得到一個(gè)大小為1.03KB的文件LF1.Bin。
而且,利用本發(fā)明提供的對(duì)壓縮后的語音的輸出和交互式編輯,用戶可以通過各種用戶命令對(duì)壓縮語音數(shù)據(jù)進(jìn)行靈活方便的交互式修改,并實(shí)時(shí)輸出編輯修改后的聲音文件。
另外,值得提出的是,本發(fā)明可以擴(kuò)展成為對(duì)其他壓縮算法壓縮后的聲音數(shù)據(jù)的進(jìn)一步壓縮。只要是分段式壓縮存儲(chǔ),并將特征參數(shù),例如音調(diào)數(shù)據(jù)獨(dú)立保存在每段中的算法都可以適用本發(fā)明。
權(quán)利要求
1.一種對(duì)音頻數(shù)據(jù)進(jìn)行處理的方法,對(duì)經(jīng)分段式壓縮后的、各幀中獨(dú)立保存有特征參數(shù)數(shù)據(jù)的音頻數(shù)據(jù)進(jìn)行進(jìn)一步的壓縮,其特征在于包括如下步驟根據(jù)所述各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù),為各幀生成特征參數(shù)包絡(luò)曲線數(shù)據(jù);以及使用所述各幀特征參數(shù)包絡(luò)曲線數(shù)據(jù)替換所述各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù)。
2.如權(quán)利要求1所述的方法,其特征在于還包括如下解壓縮步驟根據(jù)各幀音頻數(shù)據(jù)中的特征參數(shù)包絡(luò)曲線數(shù)據(jù),動(dòng)態(tài)計(jì)算出當(dāng)前各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù),并根據(jù)特征參數(shù)數(shù)據(jù)對(duì)音頻數(shù)據(jù)進(jìn)行解壓縮。
3.如權(quán)利要求2所述的方法,其特征在于還包括動(dòng)態(tài)輸出所述解壓縮后的音頻數(shù)據(jù)的步驟。
4.如權(quán)利要求3所述的方法,其特征在于所述動(dòng)態(tài)輸出包括顯示音頻數(shù)據(jù)的波形、包絡(luò)曲線和/或播放該音頻數(shù)據(jù)。
5.如權(quán)利要求4所述的方法,其特征在于還包括如下對(duì)壓縮音頻數(shù)據(jù)的編輯步驟1)接收用戶輸入的操作信息;2)根據(jù)前述操作信息,自動(dòng)生成與此對(duì)應(yīng)的控制命令;3)根據(jù)所述控制命令,編輯所述存儲(chǔ)的壓縮后的音頻數(shù)據(jù);及4)顯示編輯后的音頻數(shù)據(jù)的波形和包絡(luò)。
6.如權(quán)利要求5所述的方法,其特征在于所述步驟1)的接收操作信息包括接收用戶針對(duì)包絡(luò)曲線的修改并生成簡(jiǎn)化的特征參數(shù)包絡(luò)曲線;所述步驟3)中編輯存儲(chǔ)的壓縮后的音頻數(shù)據(jù)是指使用修改后的特征參數(shù)包絡(luò)曲線數(shù)據(jù)替換各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù)。
7.如權(quán)利要求6所述的方法,其特征在于所述步驟1)輸入的操作信息還包括放大、縮小、全圖顯示操作;選擇聲音文件的文件選擇操作。
8.一種音頻數(shù)據(jù)處理裝置,其特征在于包括分段式壓縮模塊,用于對(duì)音頻數(shù)據(jù)進(jìn)行分段式壓縮,將特征參數(shù)數(shù)據(jù)獨(dú)立保存于每幀中;存儲(chǔ)模塊,用于存儲(chǔ)壓縮音頻數(shù)據(jù);以及再壓縮模塊,用于對(duì)經(jīng)分段式壓縮后的音頻數(shù)據(jù)進(jìn)行進(jìn)一步的壓縮,包括包絡(luò)曲線生成單元,用于根據(jù)所述各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù),為各幀生成特征參數(shù)包絡(luò)曲線數(shù)據(jù);以及特征參數(shù)替換單元,用于使用所述各幀特征參數(shù)包絡(luò)曲線數(shù)據(jù)替換所述各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù)。
9.如權(quán)利要求8所述的裝置,其特征在于還包括解壓縮模塊,用于對(duì)經(jīng)壓縮編輯后的音頻數(shù)據(jù)進(jìn)行解壓縮,包括特征參數(shù)計(jì)算單元,用于根據(jù)各幀音頻數(shù)據(jù)中的特征參數(shù)包絡(luò)曲線數(shù)據(jù),動(dòng)態(tài)計(jì)算出當(dāng)前各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù);以及分段式解壓縮單元,用于根據(jù)所述各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù),對(duì)當(dāng)前各幀音頻數(shù)據(jù)進(jìn)行分段式解壓縮。
10.如權(quán)利要求9所述的裝置,其特征在于還包括輸出模塊,用于輸出經(jīng)解壓縮后的音頻數(shù)據(jù)和包絡(luò)曲線。
11.如權(quán)利要求8所述的裝置,其特征在于還包括用戶交互模塊,用于接收用戶輸入的命令,以執(zhí)行再壓縮編輯和顯示控制。
12.如權(quán)利要求11所述的裝置,其特征在于所述的用戶交互模塊,進(jìn)一步包括包絡(luò)修改單元,用戶通過包絡(luò)修改單元對(duì)顯示的特征參數(shù)包絡(luò)曲線進(jìn)行修改,并生成進(jìn)一步簡(jiǎn)化的特征參數(shù)包絡(luò)曲線數(shù)據(jù),所述再壓縮模塊使用所述修改后的特征參數(shù)包絡(luò)曲線數(shù)據(jù)替換各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù)。
13.如權(quán)利要求11所述的裝置,其特征在于所述的用戶交互模塊,進(jìn)一步包括波形顯示控制單元,用于控制對(duì)音頻數(shù)據(jù)波形的放大、縮小以及全圖顯示;音頻文件下載單元,用于在所述存儲(chǔ)模塊中選擇打開壓縮音頻文件。
14.如權(quán)利要求8所述的裝置,其特征在于還包括一個(gè)將存儲(chǔ)單元中的壓縮音頻數(shù)據(jù)下載到硬體的下載單元。
15.如權(quán)利要求9所述的裝置,其特征在于還包括一個(gè)動(dòng)態(tài)播放解壓縮后的音頻數(shù)據(jù)的播放單元。
全文摘要
本發(fā)明公開了一種對(duì)音頻數(shù)據(jù)進(jìn)行處理的方法及裝置,對(duì)經(jīng)分段式壓縮后的、各幀中獨(dú)立保存有特征參數(shù)數(shù)據(jù)的音頻數(shù)據(jù)進(jìn)行進(jìn)一步的處理,首先根據(jù)所述各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù),為各幀生成特征參數(shù)包絡(luò)曲線數(shù)據(jù),然后使用所述各幀特征參數(shù)包絡(luò)曲線數(shù)據(jù)替換所述各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù),播放時(shí),根據(jù)各幀音頻數(shù)據(jù)中的特征參數(shù)包絡(luò)曲線數(shù)據(jù),動(dòng)態(tài)計(jì)算出當(dāng)前各幀音頻數(shù)據(jù)的特征參數(shù)數(shù)據(jù)。本發(fā)明由于采用包絡(luò)曲線來近似地表示并替代各個(gè)音幀的特征參數(shù)的變化,從而起到了再次壓縮的作用,用戶可以通過各種用戶命令對(duì)壓縮語音數(shù)據(jù)進(jìn)行靈活方便的交互式修改,并實(shí)時(shí)輸出編輯修改后的聲音文件。
文檔編號(hào)H03M7/30GK1892821SQ200510080679
公開日2007年1月10日 申請(qǐng)日期2005年7月6日 優(yōu)先權(quán)日2005年7月6日
發(fā)明者廖棟才, 李琳 申請(qǐng)人:凌陽科技股份有限公司, 北京北陽電子技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
城步| 五莲县| 荥阳市| 曲靖市| 平武县| 邯郸市| 丘北县| 竹溪县| 柏乡县| 阳泉市| 丘北县| 英超| 建瓯市| 威海市| 滦南县| 道真| 磐安县| 沈阳市| 东乌| 华安县| 山西省| 行唐县| 和静县| 隆昌县| 勐海县| 航空| 鸡泽县| 武功县| 鄄城县| 中山市| 莱阳市| 深水埗区| 贡嘎县| 扎赉特旗| 玛纳斯县| 清水河县| 长宁区| 密云县| 镇坪县| 安吉县| 衡阳县|