專利名稱:音頻信號(hào)錯(cuò)誤還原方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻信號(hào)錯(cuò)誤還原方法,尤其涉及將受損音頻數(shù)據(jù)包
適用SOLA (Synchronize Over-Lap Add)方法還原錯(cuò)誤信號(hào),以此最 小化內(nèi)存使用量和時(shí)間延遲,同時(shí)能夠進(jìn)行信號(hào)還原的音頻信號(hào)錯(cuò)誤 還原方法。
背景技術(shù):
簡(jiǎn)稱為VOD ( Video On Demand視頻點(diǎn)播)和A0D ( Audio On Demand 音頻點(diǎn)播)的服務(wù),是指按照用戶的要求,通過(guò)電話線或光纜提供影 片或新聞以及音樂(lè)等信息的最新概念的影像服務(wù)事業(yè)。
最近,隨著EVD0 (數(shù)據(jù)傳輸優(yōu)化)和WCDMA等寬帶無(wú)線網(wǎng)絡(luò)的發(fā) 展,可以提供移動(dòng)的V0D/A0D服務(wù)。
上述VOD和AOD服務(wù)將視頻節(jié)目或音頻節(jié)目壓縮為數(shù)碼后,存儲(chǔ) 在視頻服務(wù)器,通過(guò)高速網(wǎng)絡(luò)向用戶提供其要求的節(jié)目,使用戶享受 節(jié)目服務(wù)。
上述AOD和VOD數(shù)據(jù)產(chǎn)生語(yǔ)音數(shù)據(jù)(64Kbps )400倍以上的30Mbps (SIF級(jí)、360*240*30 )巨大數(shù)據(jù)量。將這么龐大數(shù)據(jù)量的動(dòng)影像存儲(chǔ) 在存儲(chǔ)媒介或傳輸給傳輸網(wǎng)絡(luò),這在過(guò)去幾乎是不可能的。
但隨著MPEG-1或MPEG-2之類(lèi)的動(dòng)影像壓縮運(yùn)算法則趨于標(biāo)準(zhǔn)化,
并開(kāi)發(fā)出能夠體現(xiàn)這種運(yùn)算法則的單一芯片,以MPEG-1為例,可進(jìn)行 20倍以上的壓縮,并可在以1.5Mbps傳輸率可傳輸?shù)木W(wǎng)絡(luò)上進(jìn)行傳輸,
能夠?qū)崟r(shí)看到動(dòng)影像,也可以用一張CD-ROM存儲(chǔ)72分鐘左右的一部 影片。
尤其是,對(duì)語(yǔ)音/音頻流使用的壓縮方式,使用了 EVRC/QCELP、 AMR、 AAC,這樣具有較高的壓縮效率的技術(shù),可以維持幾乎相同音質(zhì)的同時(shí), 也將數(shù)據(jù)量縮減為1/10。
因此,以利用無(wú)線網(wǎng)絡(luò)的移動(dòng)服務(wù)為例,因在有限的信道區(qū)域需 要傳輸影像和音頻信號(hào),有必要使用上述語(yǔ)音壓縮技術(shù)。
隨著上述壓縮技術(shù)的發(fā)展,其應(yīng)用范圍也逐步擴(kuò)大,V0D或A0D不 僅適用于簡(jiǎn)單的影片,還可適用于包括新聞之類(lèi)的電視節(jié)目、游戲、 音樂(lè)電視、遠(yuǎn)程購(gòu)物、各種信息相關(guān)服務(wù)在內(nèi)的影像休閑服務(wù)。
另外,通過(guò)V0D或A0D等附加方法也可以提供才艮紙或廣播等的以 其它方式提供的服務(wù)。
但壓縮影像或語(yǔ)音/音頻信號(hào)后,進(jìn)行傳輸時(shí),由于系統(tǒng)的內(nèi)在原 因或傳輸/接收地區(qū),其壓縮信號(hào)會(huì)產(chǎn)生錯(cuò)誤。
尤其是,如MPEG4那樣,還原動(dòng)影像時(shí),開(kāi)發(fā)得較多的是因影像 幀發(fā)生錯(cuò)誤而還原這些錯(cuò)誤的技術(shù),但因語(yǔ)音/音頻信號(hào)發(fā)生錯(cuò)誤而還 原這些錯(cuò)誤的技術(shù),實(shí)際開(kāi)發(fā)得并不多。
當(dāng)影像幀每秒傳輸15-30幀時(shí),即使有大約一個(gè)幀發(fā)生錯(cuò)誤,用 戶普遍也無(wú)法用肉眼發(fā)覺(jué)錯(cuò)誤的發(fā)生。
但語(yǔ)音/音頻信號(hào)的一個(gè)幀或幾個(gè)樣品發(fā)生錯(cuò)誤時(shí),用戶就會(huì)立即 察覺(jué)到音質(zhì)的不良。
如上所述,當(dāng)在語(yǔ)音/音頻信號(hào)中發(fā)生錯(cuò)誤信號(hào)時(shí),現(xiàn)有技術(shù)將發(fā) 生錯(cuò)誤的語(yǔ)音/音頻信號(hào)幀進(jìn)行數(shù)據(jù)包化,或簡(jiǎn)單地將此前語(yǔ)音/音頻 信號(hào)幀復(fù)制使用,因此存在還原的語(yǔ)音/音頻信號(hào)的音質(zhì)不理想的缺 點(diǎn)。
發(fā)明內(nèi)容
本發(fā)明中,當(dāng)語(yǔ)音/音頻信號(hào)發(fā)生錯(cuò)誤時(shí),復(fù)制此前語(yǔ)音/音頻信號(hào)
幀,并根據(jù)SOLA方式求出最佳的語(yǔ)音/音頻信號(hào)值。
之后,利用窗口處理器,進(jìn)行復(fù)制還原,使發(fā)生錯(cuò)誤的區(qū)域重疊 (overlap),這樣,可以提供既能最小化計(jì)算的復(fù)雜度、內(nèi)存使用量及 時(shí)間延遲,還能還原為優(yōu)質(zhì)音質(zhì)的音頻信號(hào)錯(cuò)誤還原方法。
為實(shí)現(xiàn)上述目的,本發(fā)明的音頻信號(hào)錯(cuò)誤還原方法,其特征為包 括如下步驟
從數(shù)據(jù)流形式信號(hào)輸入音頻數(shù)據(jù)包信息;
從上述音頻數(shù)據(jù)包信息感應(yīng)發(fā)生錯(cuò)誤的數(shù)據(jù)包;
若從上述音頻數(shù)據(jù)包信息判斷出發(fā)生錯(cuò)誤的數(shù)據(jù)包信息,就復(fù)制 發(fā)生錯(cuò)誤的數(shù)據(jù)包信息對(duì)應(yīng)音頻幀的前一個(gè)幀,存儲(chǔ)到緩沖器;
對(duì)上述緩沖器存儲(chǔ)的前一個(gè)幀指定最佳的錯(cuò)誤還原音頻幀,并對(duì) 指定的音頻幀進(jìn)行窗口處理;
將上述進(jìn)行窗口處理的錯(cuò)誤還原音頻幀與發(fā)生錯(cuò)誤的音頻幀進(jìn)行 合成;
解碼上述合成音頻信息。 此處,從上述音頻數(shù)據(jù)包信息感應(yīng)發(fā)生錯(cuò)誤的數(shù)據(jù)包的步驟還包
括如下步驟
比較上述音頻數(shù)據(jù)包信息里的音頻表示信息和與此相應(yīng)的音頻幀 存在與否的步驟;以及
若上述音頻數(shù)據(jù)包信息具有音頻表示信息,但沒(méi)有音頻幀信息時(shí), 就判斷上述音頻數(shù)據(jù)包信息對(duì)應(yīng)的音頻幀信息是否發(fā)生錯(cuò)誤的步驟。
此外,上述發(fā)生錯(cuò)誤的音頻幀的前兩個(gè)以上的音頻幀,對(duì)上述緩 沖器存儲(chǔ)的此前幀指定最佳的錯(cuò)誤還原音頻幀的方法是才艮據(jù)SOLA方 法指定的。
此外,對(duì)上述指定的4告誤還原音頻幀進(jìn)行窗口處理的步驟還包括, 若壓縮上述指定的還原音頻幀,與錯(cuò)誤發(fā)生幀合成時(shí),使其與相臨音 頻幀一定部分重疊而進(jìn)行處理的步驟。上述錯(cuò)誤還原音頻幀與將要插 入的錯(cuò)誤區(qū)域相臨的音頻幀重疊的兩側(cè)區(qū)域分別達(dá)到還原幀大小的 1/16。
根據(jù)本發(fā)明所述,若語(yǔ)音/音頻信號(hào)發(fā)生錯(cuò)誤,就復(fù)制此前語(yǔ)音/ 音頻信號(hào)的幀,并根據(jù)SOLA方式求出最佳的語(yǔ)音/音頻信號(hào)的值。
之后,與發(fā)生錯(cuò)誤的區(qū)域重疊,進(jìn)行復(fù)制和還原,以此最小化計(jì) 算的復(fù)雜度、內(nèi)存使用量及時(shí)間延遲的同時(shí),還可以還原優(yōu)質(zhì)的音質(zhì)。
本發(fā)明為了還原發(fā)生錯(cuò)誤的語(yǔ)音/音頻信號(hào), 一般釆用用于語(yǔ)音變 換的時(shí)標(biāo)(Time Scale)的SOLA方式,使其可以還原為沒(méi)有信號(hào)歪曲 的最佳的語(yǔ)音/音頻信號(hào)。
首先對(duì)用于分析和合成語(yǔ)音/音頻信號(hào)的SOLA方式進(jìn)行詳細(xì)的說(shuō)明。
上述SOLA方式利用分析和合成兩個(gè)步驟糾正輸入信號(hào)的時(shí)標(biāo), 分析步驟如OLA那樣,將輸入信號(hào)區(qū)分為部分重疊的多個(gè)窗口,但各 個(gè)窗口具有固定長(zhǎng)度n,并保持固定的分析長(zhǎng)度Sa大小的間隔。
在合成步驟,將分析步驟確保的各個(gè)窗口以合成長(zhǎng)度Ss間隔重新 進(jìn)行設(shè)置,此時(shí),各個(gè)窗口與此前窗口的合成-輸出信號(hào)部分重疊。若 將各個(gè)窗口與輸出信號(hào)重疊時(shí),為減少因分析長(zhǎng)度和合成長(zhǎng)度間的差 距而導(dǎo)致的信號(hào)不連續(xù)性,使各個(gè)窗口在與輸出信號(hào)的類(lèi)似度,即交 叉相關(guān)(cross correlation)度最高的點(diǎn)進(jìn)行整列,將這樣的整列導(dǎo)致的 重疊稱為同步重疊。
重疊區(qū)域的合成與非重疊區(qū)域的簡(jiǎn)單附加是與OLS相同方式處理 的。由于該SOLA是以盡量維持原先長(zhǎng)度信息的方式糾正時(shí)標(biāo)的,因 此糾正時(shí)標(biāo)的輸出信號(hào)音質(zhì)比起OLA,得到大幅改善。
WSOLA是為了充分保證波形片斷(segment)臨界的信號(hào)連續(xù)性, 以相臨幀的波形類(lèi)似性為標(biāo)準(zhǔn)找出最大相關(guān)度點(diǎn),尤其從相關(guān)的樣品 索引的所有相臨樣品糾正時(shí)標(biāo)的合成信號(hào)將與原先信號(hào)維持最大局部 類(lèi)似度(local similarity)的方法。
本發(fā)明為還原語(yǔ)音/音頻數(shù)據(jù)包錯(cuò)誤,利用下述音頻信號(hào)處理特性。
一般而言,語(yǔ)音信號(hào)和音頻信號(hào)不會(huì)具有急劇變化,幾十msec以 內(nèi)具有比較穩(wěn)定的特性。此外,針對(duì)與人交流的有意義的語(yǔ)音和音樂(lè) 信號(hào)大部分是由具有定調(diào)(Pitch)之類(lèi)的諧波成分和共振峰成分的包 絡(luò)構(gòu)成。
因此,本發(fā)明利用上述之類(lèi)音頻信號(hào)特性還原發(fā)生錯(cuò)誤的語(yǔ)音/音 頻信號(hào)幀時(shí),利用相臨的語(yǔ)音/音頻信號(hào)幀。
特別是,若將發(fā)生錯(cuò)誤的語(yǔ)音/音頻信號(hào)的后一個(gè)幀作為錯(cuò)誤還原 幀使用,因時(shí)間延遲導(dǎo)致無(wú)法還原優(yōu)質(zhì)語(yǔ)音,本發(fā)明利用發(fā)生錯(cuò)誤的 語(yǔ)音/音頻信號(hào)的前一個(gè)幀還原語(yǔ)音/音頻信號(hào)。
如上所述,若語(yǔ)音/音頻信號(hào)發(fā)生錯(cuò)誤,本發(fā)明公開(kāi)的方法就會(huì)復(fù)
制此前語(yǔ)音/音頻信號(hào)的幀,并根據(jù)SOLA方式求出最佳語(yǔ)音/音頻信號(hào) 值后,進(jìn)行還原,使其能夠重疊在發(fā)生錯(cuò)誤的區(qū)域。這樣,具有在最 小化計(jì)算的復(fù)雜度、內(nèi)存使用量及時(shí)間延遲的同時(shí),還可以還原優(yōu)質(zhì) 音質(zhì)的效杲。
圖l是本發(fā)明的音頻信號(hào)錯(cuò)誤還原系統(tǒng)的示意圖。
圖2是旨在說(shuō)明將本發(fā)明的錯(cuò)誤復(fù)制音頻信號(hào)進(jìn)行窗口重疊,進(jìn) 行還原的示意圖。
圖3是旨在說(shuō)明本發(fā)明的還原發(fā)生錯(cuò)誤的音頻信號(hào)的過(guò)程的流程圖。
圖4a至圖4c是為比較本發(fā)明還原的音頻信號(hào)與沒(méi)有發(fā)生錯(cuò)誤的 原先音頻信號(hào)的示意圖。
附圖標(biāo)記
100:交叉相關(guān)處理器 200:窗口處理器
300:合成器 400:變頻器
具體實(shí)施例方式
以下參照附圖對(duì)本發(fā)明的實(shí)施例進(jìn)行詳細(xì)i兌明。 圖l是本發(fā)明的音頻信號(hào)錯(cuò)誤還原系統(tǒng)的示意圖。
如圖1所示,交叉相關(guān)處理器100根據(jù)SOLA方式從為還原而復(fù)制 的語(yǔ)音/音頻信號(hào)幀找出最佳的錯(cuò)誤還原幀。
上述SOLA方式從為將錯(cuò)誤還原使用而復(fù)制的語(yǔ)音/音頻信號(hào)幀找 出提供交叉相關(guān)度(cross correlation)最大值的點(diǎn)。
音頻錯(cuò)誤還原系統(tǒng)由以下幾部分構(gòu)成根據(jù)上述S0LA方式,取得 最佳還原幀的交叉相關(guān)處理器100;對(duì)上述交叉相關(guān)處理器100所定的 錯(cuò)誤還原幀,進(jìn)行與還原幀兩側(cè)邊臨界沒(méi)有發(fā)生錯(cuò)誤的語(yǔ)音/音頻幀重 疊的窗口處理器200;將上述窗口處理器200和交叉相關(guān)處理器100求 出的錯(cuò)誤還原幀與發(fā)生錯(cuò)誤區(qū)域合成的合成器300;將上述合成器300 合成的值轉(zhuǎn)換為模擬形式的轉(zhuǎn)換器400。
用于VOD協(xié)議的RTP數(shù)據(jù)包內(nèi)具有語(yǔ)音/音頻信號(hào)的幀索引信息。 因此,若上述RTP數(shù)據(jù)包內(nèi)的幀索引信息相應(yīng)的語(yǔ)音/音頻信號(hào)幀不存 在時(shí),就容易檢測(cè)出發(fā)生錯(cuò)誤的語(yǔ)音/音頻信號(hào)幀。
在本發(fā)明公開(kāi)的方法中,若語(yǔ)音/音頻信號(hào)發(fā)生錯(cuò)誤,就使用此前 兩個(gè)語(yǔ)音/音頻信號(hào)幀的波形信息,還原發(fā)生錯(cuò)誤的語(yǔ)音/音頻信號(hào)。
特別是,旨在還原的最佳錯(cuò)誤還原幀的選擇是根據(jù)SOLA方法進(jìn)行 的,并且為提高還原點(diǎn)上的音質(zhì),進(jìn)行與相臨信號(hào)幀間的重疊處理。若語(yǔ)音/音頻信號(hào)幀中的第IC個(gè)語(yǔ)音/音頻幀發(fā)生錯(cuò)誤,就將此前 的第K-l、 K-2個(gè)語(yǔ)音/音頻幀的波形信號(hào)復(fù)制給緩沖器。
這時(shí),因輸出緩沖器已經(jīng)存在第K-l個(gè)語(yǔ)音/音頻幀,僅追加一個(gè) 緩沖器,將第K-2個(gè)語(yǔ)音/音頻幀存儲(chǔ)到緩沖器。
若將上述輸出緩沖器大小假設(shè)為N,因需要準(zhǔn)備兩個(gè)緩沖器,緩沖 器的總大小為2N,但在2N中,因分別重疊發(fā)生錯(cuò)誤的語(yǔ)音/音頻信號(hào) 的此前幀和此后幀約N/16,還原錯(cuò)誤,實(shí)際上使用的緩沖器大小是 N+N/8。
即,若從語(yǔ)音/音頻信號(hào)中發(fā)現(xiàn)發(fā)生錯(cuò)誤的幀,就將此前兩個(gè)語(yǔ)音 /音頻信號(hào)幀復(fù)制到緩沖器,然后,找出旨在補(bǔ)充(padding )根據(jù)SOLA 方式還原此前兩個(gè)語(yǔ)音/音頻信號(hào)幀的最佳點(diǎn)。
這種方法是將2N還原樣品與第K-l語(yǔ)音/音頻幀進(jìn)行易變 (sliding),并找出最相似之處的方法。
該方法雖然在定調(diào)周期大于1幀時(shí),很難適用,但如語(yǔ)音/音頻信 號(hào)那樣,多媒體數(shù)字信號(hào)編解碼器(CODEC)幀大小約為20msec,并且 所有語(yǔ)音和大部分音樂(lè)信號(hào)的基本頻率為100-200Hz以上時(shí),均可適用。
上述根據(jù)上述SOU方式找出的要補(bǔ)充的最佳點(diǎn),比現(xiàn)有的OLA方 法,能夠減少還原的臨界區(qū)域的不連續(xù)點(diǎn)或定調(diào)(Pitch)等的急劇變 化,可以還原出自然的語(yǔ)音/音頻信號(hào)。
這樣,若根據(jù)SOLA方法找出最佳還原點(diǎn),就處理上述窗口處理器 200還原的信號(hào),使其與相臨信號(hào)重疊。
圖2是旨在說(shuō)明將本發(fā)明的復(fù)制錯(cuò)誤的音頻信號(hào)進(jìn)行窗口重疊, 進(jìn)行還原的示意圖。表示了上述圖1的窗口處理器處理還原信號(hào)的形 式。
利用SOLA方法找出上述還原信號(hào)可能要插入的最佳點(diǎn),當(dāng)還原信 號(hào)插入時(shí),進(jìn)行與還原信號(hào)的兩側(cè)邊沒(méi)有發(fā)生錯(cuò)誤的信號(hào)間重疊一定 距離的搡作。
其作用在于,在還原信號(hào)和沒(méi)有發(fā)生錯(cuò)誤的信號(hào)結(jié)合的臨界區(qū)域, 防止相位不連續(xù)(Phase Discontinuity)和急劇變化,旨在還原為優(yōu) 質(zhì)音頻。
窗口處理器乘上提前設(shè)置的假設(shè)值,將窗口大小縮小為原先幀大 小的1/8,使還原信號(hào)能夠與相臨的語(yǔ)音/音頻信號(hào)重疊。
重疊的部分是窗口大小的1/16,使原信號(hào)的歪曲達(dá)到最小化,并 將減少臨界面的急劇變化。因此,用于實(shí)際還原的樣品大小是k+l/8 (k)。
圖3是旨在說(shuō)明本發(fā)明的還原發(fā)生錯(cuò)誤的音頻信號(hào)的過(guò)程的流程圖。
如圖3所示,若從語(yǔ)音/音頻流信號(hào)輸入RTP數(shù)據(jù)包信號(hào),就從數(shù) 據(jù)包信息判斷是否發(fā)生語(yǔ)音/音頻幀錯(cuò)誤(S301、 S302 )。
若上述數(shù)據(jù)包信息沒(méi)有發(fā)生語(yǔ)音/音頻幀錯(cuò)誤,就立即將語(yǔ)音/音 頻流信號(hào)傳輸給音頻解碼器,進(jìn)行解碼(S307 )。
但上述數(shù)據(jù)包信息發(fā)生語(yǔ)音/音頻幀的錯(cuò)誤時(shí),為使錯(cuò)誤還原,將 復(fù)制發(fā)生錯(cuò)誤的幀的此前兩個(gè)幀,存儲(chǔ)到緩沖器(S302、 S303 )。
若上述緩沖器存儲(chǔ)了用于還原的兩個(gè)語(yǔ)音/音頻幀,就根據(jù)SOLA 方法,指定可能要插入到錯(cuò)誤區(qū)域的還原信號(hào)(S304 )。
這時(shí),為求出最佳還原信號(hào)區(qū)域,使用交叉相關(guān)(cross correlat ion )信息。
如上述那樣,若求出旨在還原的信號(hào),窗口處理器就乘上權(quán)數(shù)值, 使可能要插入還原信號(hào)的臨界區(qū)域信號(hào)分別縮小為1/16,進(jìn)行重疊 (S305 )。
即,若將為還原而求出的信號(hào)插入到錯(cuò)誤區(qū)域,兩側(cè)臨界區(qū)域分 別將1幀大小設(shè)置為1N時(shí),就分別重疊1/16N大小。
因此,還原信號(hào)的整體大小成為N+1/8 (N)。
如上所述,若結(jié)束窗口處理,就利用合成器插入還原信號(hào),實(shí)施 錯(cuò)誤還原(S306 )。
之后,上述合成器將錯(cuò)誤信號(hào)被還原的語(yǔ)音/音頻信號(hào)施加給解碼 器,進(jìn)行解碼(S307 )。
圖4a至圖4c是為比較本發(fā)明還原的音頻信號(hào)與沒(méi)有發(fā)生錯(cuò)誤的 原先音頻信號(hào)的示意圖。
如圖4a和圖4c所示,原先語(yǔ)音/音頻信號(hào)是以沒(méi)有受損的連續(xù)性 模擬波形顯示,但數(shù)據(jù)包的一定部分受損時(shí),如圖4b所示,能夠發(fā)現(xiàn) 語(yǔ)音波形被切斷區(qū)域。
這樣,語(yǔ)音/音頻信號(hào)是否發(fā)生錯(cuò)誤的判斷是根據(jù)VOD協(xié)議以信息 流形式傳輸?shù)男畔⑿盘?hào)中分析RTP數(shù)據(jù)包信息信號(hào)。
這樣,數(shù)據(jù)包信息具有表示語(yǔ)音信號(hào)存在的比特信息,但若不存 在語(yǔ)音幀,就可視為發(fā)生錯(cuò)誤。
若語(yǔ)音信號(hào)發(fā)生錯(cuò)誤,就如上述圖3所示,將此前幀作為還原信 號(hào)使用,利用SOLA方法,并進(jìn)行窗口處理,將最佳還原信號(hào)插入到 錯(cuò)誤發(fā)生區(qū)域。
特別是,本發(fā)明從此前幀信息復(fù)制還原信號(hào),并對(duì)該還原信號(hào)指 定最佳語(yǔ)音還原信號(hào),還將對(duì)指定的還原信號(hào)進(jìn)行窗口處理,進(jìn)行還 原,使一定幀大小重疊在發(fā)生錯(cuò)誤區(qū)域的相臨區(qū)域。
這樣,不僅在錯(cuò)誤區(qū)域,而且在錯(cuò)誤區(qū)域與沒(méi)有發(fā)生錯(cuò)誤的相臨 幀的臨界區(qū)域,也不會(huì)發(fā)生音質(zhì)下降,可以得到優(yōu)質(zhì)的語(yǔ)音信號(hào)。
如上所述,參照上述實(shí)施例,詳細(xì)地進(jìn)行了說(shuō)明以及圖示,但本 發(fā)明并不僅限于此。在不偏離本項(xiàng)發(fā)明的基本技術(shù)思想范圍內(nèi),具有 本領(lǐng)域的常規(guī)知識(shí)的人員可以在不偏離本發(fā)明所提權(quán)利要求的范圍 內(nèi),進(jìn)行其他多樣的變更以及修改。
權(quán)利要求
1、一種音頻信號(hào)錯(cuò)誤還原方法,其特征在于,包括如下步驟從數(shù)據(jù)流形式信號(hào)輸入音頻數(shù)據(jù)包信息;從上述音頻數(shù)據(jù)包信息感應(yīng)發(fā)生錯(cuò)誤的數(shù)據(jù)包;若從上述音頻數(shù)據(jù)包信息判斷出發(fā)生錯(cuò)誤的數(shù)據(jù)包信息,就復(fù)制發(fā)生錯(cuò)誤的數(shù)據(jù)包信息對(duì)應(yīng)音頻幀的前一個(gè)幀,存儲(chǔ)到緩沖器;對(duì)上述緩沖器存儲(chǔ)的前一個(gè)幀指定最佳的錯(cuò)誤還原音頻幀,并對(duì)指定的音頻幀進(jìn)行窗口處理;將上述進(jìn)行窗口處理的錯(cuò)誤還原音頻幀與發(fā)生錯(cuò)誤的音頻幀合成;解碼上述合成音頻信息。
2、 如權(quán)利要求l所述的音頻信號(hào)錯(cuò)誤還原方法,其特征在于, 上述從音頻數(shù)據(jù)包信息感應(yīng)錯(cuò)誤發(fā)生數(shù)據(jù)包的步驟包括如下兩個(gè)步驟即比較上述音頻數(shù)據(jù)包信息中存在的音頻顯示信息和與之相應(yīng) 的音頻幀存在與否的步驟;以及若上述音頻數(shù)據(jù)包信息具有音頻表示信息,但不具備音頻幀信息, 就判斷上述音頻數(shù)據(jù)包信息對(duì)應(yīng)的音頻幀信息發(fā)生錯(cuò)誤的步驟。
3、 如權(quán)利要求1所述的音頻信號(hào)錯(cuò)誤還原方法,其特征在于, 復(fù)制上述發(fā)生錯(cuò)誤的音頻幀的前兩個(gè)以上音頻幀。
4、 如權(quán)利要求1所述的音頻信號(hào)錯(cuò)誤還原方法,其特征在于,對(duì)上述緩沖器存儲(chǔ)的此前幀指定最佳錯(cuò)誤還原音頻幀的方法是根據(jù)SOLA方法指定的。
5、 如權(quán)利要求1所述的音頻信號(hào)錯(cuò)誤還原方法,其特征在于,將上述指定的錯(cuò)誤還原音頻幀進(jìn)行窗口處理的步驟還包括若壓縮上述指定的還原音頻幀,與錯(cuò)誤發(fā)生幀進(jìn)行合成時(shí),就進(jìn) 行處理,使其與相臨音頻幀重疊一定部分的步驟。
6、 如權(quán)利要求5所述的音頻信號(hào)錯(cuò)誤還原方法,其特征在于,上述錯(cuò)誤還原音頻幀與可能要插入的錯(cuò)誤區(qū)域的相臨音頻幀重疊 的兩側(cè)區(qū)域分別是還原幀大小的1/16。
全文摘要
本發(fā)明涉及將受損音頻信息包適用SOLA(Synchronize Over-LapAdd)方法還原錯(cuò)誤信號(hào),以此最小化內(nèi)存使用量和時(shí)間延遲,同時(shí)能夠進(jìn)行信號(hào)還原的音頻信號(hào)錯(cuò)誤還原方法。該方法包括如下步驟從數(shù)據(jù)流形式信號(hào)輸入音頻數(shù)據(jù)包信息;從上述音頻數(shù)據(jù)包信息感應(yīng)發(fā)生錯(cuò)誤的數(shù)據(jù)包;若從上述音頻數(shù)據(jù)包信息判斷出發(fā)生錯(cuò)誤的數(shù)據(jù)包信息,就復(fù)制發(fā)生錯(cuò)誤的數(shù)據(jù)包信息對(duì)應(yīng)音頻幀的前一個(gè)幀,存儲(chǔ)到緩沖器;對(duì)上述緩沖器存儲(chǔ)的前一個(gè)幀指定最佳的錯(cuò)誤還原音頻幀,并對(duì)指定的音頻幀進(jìn)行窗口處理;將上述進(jìn)行窗口處理的錯(cuò)誤還原音頻幀與發(fā)生錯(cuò)誤的音頻幀進(jìn)行合成;解碼上述合成音頻信息。
文檔編號(hào)H04L1/00GK101192895SQ200610097930
公開(kāi)日2008年6月4日 申請(qǐng)日期2006年11月22日 優(yōu)先權(quán)日2006年11月22日
發(fā)明者金基壽 申請(qǐng)人:樂(lè)金電子(昆山)電腦有限公司