專利名稱:一種音頻數(shù)據(jù)變音方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻數(shù)據(jù)處理領(lǐng)域,特別涉及一種對音頻數(shù)據(jù)進行變音處理 的方法。
背景技術(shù):
音頻變音是對音頻數(shù)據(jù)進行后期處理的方法,例如,保持音頻數(shù)據(jù)音調(diào)
不變而加快或減慢音頻節(jié)奏;保持音頻數(shù)據(jù)的節(jié)奏不變而提高或降低音頻數(shù) 據(jù)的音調(diào);將音頻數(shù)據(jù)的固有音量放大或減小等等。
音頻變音是音樂工作者、語音工作者在進行樂譜記錄、語音識別、制作 虛擬化人聲等工作中常用的技術(shù)手段。此外,在日常生活中,出于娛樂和對 個性化的追求等目的,對音頻數(shù)據(jù)進行變音/混音處理,如制作個性化手機 鈴音等需求也大量存在。
但是,由于對音頻數(shù)據(jù)進行變音處理對處理平臺的硬件資源有較高的要 求,并不是任何保存有音頻數(shù)據(jù)的終端都能將音頻數(shù)據(jù)快速、有效地進行變 音處理。例如,由于缺乏相應(yīng)的硬件資源,保存在手機等嵌入式設(shè)備中的音 頻數(shù)據(jù)通常無法在設(shè)備中直接進行變音處理。此外,由于缺乏專業(yè)的音頻處 理軟件和豐富的音頻素材,普通消費者即使將音頻數(shù)據(jù)傳送至個人電腦等硬 件資源相對豐富的平臺上,也很難對音頻數(shù)據(jù)進行滿足需求的變音處理。
此外,由于音頻數(shù)據(jù)通常都是經(jīng)過特定的算法壓縮后進行傳輸和保存, 如果缺乏對該壓縮算法的支持,普通的音頻處理軟件也無法對音頻數(shù)據(jù)進行 處理。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是,克服現(xiàn)有技術(shù)中對音頻數(shù)據(jù)進行變音處理 的方法的不足,提出 一種借助網(wǎng)絡(luò)中的4某體服務(wù)器實現(xiàn)音頻數(shù)據(jù)變音的方 法,使任何具備網(wǎng)絡(luò)通訊功能的終端都能夠及時地對音頻數(shù)據(jù)進行滿足需求 的變音處理。
為了解決上述問題,本發(fā)明提供一種音頻數(shù)據(jù)變音方法,包含如下步驟
步驟A:終端將變音參數(shù)發(fā)送至媒體服務(wù)器;
步驟B:媒體服務(wù)器發(fā)送變音請求接受信息至終端;
步驟C:終端接收到變音請求接受信息后,向媒體服務(wù)器發(fā)送音頻數(shù)據(jù)
流;
步驟D:媒體服務(wù)器接收到完整可變音數(shù)據(jù)單元后,進行變音處理; 步驟E:當滿足變音停止條件時停止變音處理,否則重復(fù)步驟C至步驟D。
此外,在所述步驟A之前還包含如下步驟
步驟l,終端向網(wǎng)絡(luò)中的媒體服務(wù)器發(fā)出音頻變音服務(wù)請求;
步驟2,媒體服務(wù)器對接收到的音頻變音服務(wù)請求的有效性進行審核; 若為無效請求返回錯誤信息,本方法結(jié)束;若為有效請求,發(fā)送變音服務(wù)請 求有效信息給終端;
終端接收到變音服務(wù)請求有效信息后,執(zhí)行所述步驟A。
此外,所述變音參數(shù)包含回放參數(shù),且在所述步驟E之后還包含如下步
驟
媒體服務(wù)器根據(jù)回放參數(shù)對經(jīng)過變音處理的音頻數(shù)據(jù)進行回放處理。
此外,所述變音參數(shù)包含變音服務(wù)類型,音頻參數(shù)。
此外,所述變音停止條件包含音頻數(shù)據(jù)或音頻數(shù)據(jù)段落結(jié)束,用戶終 止或暫停變音操作。
此外,所述變音參數(shù)包含服務(wù)時間,所述變音停止條件包含服務(wù)時間結(jié)束。
此外,所述變音參數(shù)包含回放參數(shù),回放參數(shù)包含回放方式,且在所述
步驟D和步驟E之間還包含如下步驟
步驟3,若回放方式是實時模擬回放或?qū)崟r數(shù)字回放,則媒體服務(wù)器 將經(jīng)過變音處理的音頻數(shù)據(jù)發(fā)送至終端。
此外,所述回放參數(shù)包含編碼格式,且在所述步驟D和步驟3,之間還 包含如下步驟
根據(jù)編碼格式對音頻數(shù)據(jù)進行編碼。
本發(fā)明通過將終端上的音頻數(shù)據(jù)上傳至網(wǎng)絡(luò)中的媒體服務(wù)器,由媒體服 務(wù)器對該音頻數(shù)據(jù)進行變音處理,并可將經(jīng)過處理的音頻數(shù)據(jù)實時傳送至終 端,使得任何具備網(wǎng)絡(luò)訪問能力的終端都能以最快最便捷的方式對音頻數(shù)據(jù) 進行變音處理。
圖l是本發(fā)明音頻數(shù)據(jù)變音方法的流程圖。
具體實施例方式
本發(fā)明的基本思路是,將終端上的音頻數(shù)據(jù)及相應(yīng)的變音參數(shù)上傳至網(wǎng) 絡(luò)中的媒體服務(wù)器,媒體服務(wù)器接收到完整的可變音數(shù)據(jù)單元后對音頻數(shù)據(jù) 進行解碼和變音處理。
下面將結(jié)合附圖和實施例對本發(fā)明進行詳細的描述。
圖l是本發(fā)明音頻數(shù)據(jù)變音方法的流程圖。
如圖l所示,本發(fā)明的音頻數(shù)據(jù)變音方法包含如下步驟
步驟1:終端向網(wǎng)絡(luò)中的媒體服務(wù)器發(fā)出音頻變音服務(wù)請求; 上述終端可以是具有網(wǎng)絡(luò)訪問功能的個人電腦或個人數(shù)字助理(PDA)、
移動音頻擷取/播放裝置、移動電話等嵌入式裝置。
上述音頻變音服務(wù)請求可以通過IP網(wǎng)絡(luò)以命令包的形式發(fā)出,也可以
通過電話網(wǎng)絡(luò)結(jié)合IVR (Interactive Voice Response,交互式語音應(yīng)答)系統(tǒng) 等方式發(fā)送至媒體服務(wù)器。
音頻變音服務(wù)請求中可包含用戶名、密碼等用戶識別信息。
步驟2:媒體服務(wù)器對接收到的音頻變音服務(wù)請求的有效性進行審核; 對于無效請求返回錯誤信息,本方法結(jié)束;若為有效請求,則發(fā)送變音服務(wù) 請求有效信息給終端;
對音頻變音服務(wù)請求的審核包含對用戶名、密碼等用戶識別信息的審 核。例如,若用戶名、密碼不正確,或該用戶沒有申請變音服務(wù),則該音頻 變音服務(wù)請求為無效請求。
步驟3:終端接收到變音服務(wù)請求有效信息后,將變音參數(shù)發(fā)送至〗某體 服務(wù)器;
上述變音參數(shù)包含變音服務(wù)類型,音頻參數(shù),服務(wù)時間,回放參數(shù)等信
息;
變音服務(wù)類型可包含變調(diào),變節(jié)奏,固有音量調(diào)整,降噪,淡入、淡 出、回聲等音頻特殊效果制作等。
音頻參數(shù)與變音服務(wù)類型相關(guān),如對于變調(diào)服務(wù),音頻參數(shù)可包含音調(diào) 增加或降低的半音數(shù);對于固有音量調(diào)整服務(wù),音頻參數(shù)可包含音量增加或 降低的百分比;對于回聲制作服務(wù),音頻參數(shù)可包含回聲延遲時間等。
服務(wù)時間信息可包含服務(wù)開始時間,服務(wù)結(jié)束時間或服務(wù)時間長度等信息。
回放參數(shù)可包含回放方式,編碼格式等信息。例如,當回放方式選用文 件回放方式時,媒體服務(wù)器將經(jīng)過變音處理的音頻數(shù)據(jù)保存成音頻丈件,并
在適當?shù)臅r候通過IP網(wǎng)絡(luò)發(fā)送至終端;若回放方式選用模擬回放方式,媒 體服務(wù)器將經(jīng)過變音處理的音頻數(shù)據(jù)通過電話網(wǎng)絡(luò)發(fā)送至終端,終端可以將 其以模擬音頻數(shù)據(jù)方式進行播放。此外,回放方式還可以是實時模擬回放,
即將經(jīng)過變音處理的數(shù)據(jù)以模擬語音數(shù)據(jù)的形式實時發(fā)送至終端;或?qū)崟r數(shù) 字回放,即將經(jīng)過變音處理的數(shù)據(jù)以數(shù)字語音數(shù)據(jù)的形式實時發(fā)送至終端。 編碼格式可以是g711u 、 g711a 、 g723、 g729等。
步驟4:媒體服務(wù)器對接收到的變音參數(shù)進行有效性檢查,若變音參數(shù) 錯誤則返回參數(shù)錯誤信息;若參數(shù)正確有效則發(fā)送變音請求接受信息至終 端.
步驟5:終端接收到變音請求接受信息后,向媒體服務(wù)器發(fā)送音頻數(shù)據(jù)
流;
上述音頻數(shù)據(jù)流可以是通過ip網(wǎng)絡(luò)發(fā)送的數(shù)字音頻數(shù)據(jù)包,或者是通 過電話網(wǎng)絡(luò)發(fā)送的模擬音頻數(shù)據(jù)流。
步驟6:媒體服務(wù)器接收到完整可變音數(shù)據(jù)單元后,進行變音處理;
上述完整可變音數(shù)據(jù)單元的大小與終端發(fā)送的音頻數(shù)據(jù)流的類型,變音 服務(wù)類型、音頻參數(shù)和服務(wù)時間有關(guān)。例如,當終端發(fā)送的音頻流為g711u 、 g711a 、 g723、 g729等編碼格式的數(shù)據(jù),則完整可變音數(shù)據(jù)單元的數(shù)據(jù)長 度至少要大于該音頻編碼格式的完整可解碼單元,即至少要接收到解碼所需 的所有參數(shù),對音頻數(shù)據(jù)進行正確的解碼后對其進行變音處理;當終端發(fā)送 的音頻流為模擬音頻數(shù)據(jù),則完整可變音數(shù)據(jù)單元的時間小于或等于服務(wù)時 間;對于淡出效果制作,完整可變音數(shù)據(jù)單元包含的音頻數(shù)據(jù)要包含音頻段 落的尾端數(shù)據(jù)。
步驟7:若回放方式是實時模擬回放或?qū)崟r數(shù)字回放,則媒體服務(wù)器將 經(jīng)過變音處理的音頻數(shù)據(jù)發(fā)送至終端;
媒體服務(wù)器在將經(jīng)過變音處理的音頻數(shù)據(jù)發(fā)送至終端前,可根據(jù)變音參 數(shù)中指定的編碼格式對音頻數(shù)據(jù)進行編碼。 步驟8:當滿足變音停止條件時停止變音處理;否則重復(fù)步驟5至步驟
7;
變音停止條件可以是音頻數(shù)據(jù)或音頻數(shù)據(jù)段落結(jié)束,用戶終止或暫停變 音操作,服務(wù)時間結(jié)束等。
步驟9:媒體服務(wù)器根據(jù)回放參數(shù)對經(jīng)過變音處理的音頻數(shù)據(jù)進行回放 處理;
回放處理可以是將經(jīng)過變音處理的音頻數(shù)據(jù)通過電話網(wǎng)絡(luò)以模擬語音 的方式發(fā)送至終端;或?qū)⒔?jīng)過變音處理的音頻數(shù)據(jù)保存成音頻文件,并在適 當?shù)臅r候通過IP網(wǎng)絡(luò)發(fā)送至終端指定的位置。
權(quán)利要求
1. 一種音頻數(shù)據(jù)變音方法,包含如下步驟步驟A終端將變音參數(shù)發(fā)送至媒體服務(wù)器;步驟B媒體服務(wù)器發(fā)送變音請求接受信息至終端;步驟C終端接收到變音請求接受信息后,向媒體服務(wù)器發(fā)送音頻數(shù)據(jù)流;步驟D媒體服務(wù)器接收到完整可變音數(shù)據(jù)單元后,進行變音處理;步驟E當滿足變音停止條件時停止變音處理,否則重復(fù)步驟C至步驟D。
2、 如權(quán)利要求1所述的音頻數(shù)據(jù)變音方法,其特征在于,在所述步驟 A之前還包含如下步驟步驟l,終端向網(wǎng)絡(luò)中的媒體服務(wù)器發(fā)出音頻變音服務(wù)請求;步驟2,媒體服務(wù)器對接收到的音頻變音服務(wù)請求的有效性進行審核; 若為無效請求返回錯誤信息,本方法結(jié)束;若為有效請求,發(fā)送變音服務(wù)請 求有效信息給終端;終端接收到變音服務(wù)請求有效信息后,執(zhí)行所述步驟A。
3、 如權(quán)利要求1所述的音頻數(shù)據(jù)變音方法,其特征在于,所述變音參 數(shù)包含回放參數(shù),且在所述步驟E之后還包含如下步驟媒體服務(wù)器根據(jù)回放參數(shù)對經(jīng)過變音處理的音頻數(shù)據(jù)進行回放處理。
4、 如權(quán)利要求1所述的音頻數(shù)據(jù)變音方法,其特征在于,所述變音參 數(shù)包含變音服務(wù)類型,音頻參數(shù)。
5、 如權(quán)利要求1所述的音頻數(shù)據(jù)變音方法,其特征在于,所述變音停 止條件包含音頻數(shù)據(jù)或音頻數(shù)據(jù)段落結(jié)束,用戶終止或暫停變音操作。
6、 如權(quán)利要求1所述的音頻數(shù)據(jù)變音方法,其特征在于,所述變音參 數(shù)包含服務(wù)時間,所述變音停止條件包舍服務(wù)時間結(jié)束。
7、 如權(quán)利要求1所述的音頻數(shù)據(jù)變音方法,其特征在于,所述變音參 數(shù)包舍回放參數(shù),回放參數(shù)包舍回放方式,且在所述步驟D和步驟E之間 還包含如下步驟步驟3,若回放方式是實時模擬回放或?qū)崟r數(shù)字回放,則媒體服務(wù)器將 經(jīng)過變音處理的音頻數(shù)據(jù)發(fā)送至終端。
8、 如權(quán)利要求7所述的音頻數(shù)據(jù)變音方法,其特征在于,所述回放參 數(shù)包含編碼格式,且在所述步驟D和步驟3'之間還包舍如下步驟根據(jù)編碼格式對音頻數(shù)據(jù)進行編碼。
全文摘要
一種音頻數(shù)據(jù)變音方法,包含如下步驟步驟A終端將變音參數(shù)發(fā)送至媒體服務(wù)器;步驟B媒體服務(wù)器發(fā)送變音請求接受信息至終端;步驟C終端接收到變音請求接受信息后,向媒體服務(wù)器發(fā)送音頻數(shù)據(jù)流;步驟D媒體服務(wù)器接收到完整可變音數(shù)據(jù)單元后,進行變音處理;步驟E當滿足變音停止條件時停止變音處理,否則重復(fù)步驟C至步驟D。本發(fā)明通過將終端上的音頻數(shù)據(jù)上傳至網(wǎng)絡(luò)中的媒體服務(wù)器,由媒體服務(wù)器對該音頻數(shù)據(jù)進行變音處理,并可將經(jīng)過處理的音頻數(shù)據(jù)實時傳送至終端,使得任何具備網(wǎng)絡(luò)訪問能力的終端都能以最快最便捷的方式對音頻數(shù)據(jù)進行變音處理。
文檔編號H04L12/16GK101207500SQ20061017024
公開日2008年6月25日 申請日期2006年12月21日 優(yōu)先權(quán)日2006年12月21日
發(fā)明者吳建軍, 東 王, 罡 鄭 申請人:中興通訊股份有限公司