欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

具有可切換旁路的音頻編碼/解碼方案的制作方法

文檔序號(hào):2823170閱讀:281來(lái)源:國(guó)知局
專利名稱:具有可切換旁路的音頻編碼/解碼方案的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及音頻編碼,具體地,涉及低比特率音頻編碼方案。
背景技術(shù)
本領(lǐng)域已知諸如MP3或AAC的頻域編碼方案。這些頻域編碼器基于時(shí)域/頻域變 換、隨后的量化階段以及編碼階段,在量化階段中,使用來(lái)自于心理聲學(xué)模塊的信息控制量 化誤差;在編碼階段中,使用碼表對(duì)已量化的頻譜系數(shù)及相對(duì)應(yīng)的邊帶信息進(jìn)行熵編碼。另一方面,如3GPP TS沈.290所述,具有極為適合用于語(yǔ)音處理的編碼器,例如 AMR-WB+。這樣的語(yǔ)音編碼方案執(zhí)行時(shí)域信號(hào)的線性預(yù)測(cè)濾波。這樣的LP濾波從對(duì)所輸入 的時(shí)域信號(hào)的線性預(yù)測(cè)分析而獲得。然后,對(duì)所得到的LP濾波系數(shù)進(jìn)行編碼且傳輸作為邊 帶信息。該方法被稱為線性預(yù)測(cè)編碼(LPC)。在濾波器的輸出,使用ACELP編碼器的合成分 析階段,或者備選地,使用變換編碼器對(duì)也被稱為激勵(lì)信號(hào)的預(yù)測(cè)殘余信號(hào)或預(yù)測(cè)誤差信 號(hào)進(jìn)行編碼,該變換編碼器使用有重迭的傅立葉變換。使用閉環(huán)或開(kāi)環(huán)算法來(lái)進(jìn)行ACELP 編碼與變換編碼的激勵(lì)編碼(也被稱為TCX編碼)之間的判決。頻域音頻編碼方案(例如,組合了 AAC編碼方案及頻譜帶寬復(fù)制技術(shù)的高效率AAC 編碼方案)也可被組合到在術(shù)語(yǔ)“MPEG環(huán)繞”之下為人所知的的聯(lián)合立體聲或多通道編碼 工具。頻域編碼方案的優(yōu)點(diǎn)在于針對(duì)音樂(lè)信號(hào),其在低比特率處顯示出高質(zhì)量。但問(wèn)題在 于語(yǔ)音信號(hào)在低比特率處的質(zhì)量。另一方面,語(yǔ)音編碼器諸如AMR-WB+也有高頻加強(qiáng)級(jí)及立體聲功能。頻域編碼方案的優(yōu)點(diǎn)在于,針對(duì)音樂(lè)信號(hào),其在低比特率處顯示出高質(zhì)量。但問(wèn)題 在于低比特率處的語(yǔ)音信號(hào)質(zhì)量。語(yǔ)音編碼方案即使在低比特率處也對(duì)語(yǔ)音信號(hào)顯示高質(zhì)量,但對(duì)于低比特率處的 音樂(lè)信號(hào)則顯示質(zhì)量不佳。

發(fā)明內(nèi)容
本發(fā)明的目的提供一種提高式編碼/解碼構(gòu)想。根據(jù)權(quán)利要求1所述的用于編碼音頻信號(hào)的設(shè)備、根據(jù)權(quán)利要求12所述的用于編 碼音頻信號(hào)的方法、根據(jù)權(quán)利要求13所述的用于解碼已編碼的音頻信號(hào)的設(shè)備、根據(jù)權(quán)利 要求21所述的用于對(duì)已編碼音頻信號(hào)進(jìn)行解碼的方法,或者根據(jù)權(quán)利要求22所述的計(jì)算 機(jī)程序,可以實(shí)現(xiàn)本目的。在根據(jù)本發(fā)明的編碼器中,使用兩個(gè)域變換器,其中第一域變換器將音頻信號(hào)由 第一域(諸如時(shí)域)變換入第二域(諸如LPC域)。第二域變換器被操作為由輸入域變換 至輸出域,且第二域變換器接收第一域變換器的輸出信號(hào)或可切換旁路(bypass)的輸出 信號(hào)作為輸入信號(hào),可切換旁路被連接來(lái)用來(lái)旁路該第一域變換器。換言之,從而意味著第 二域變換器接收第一域諸如時(shí)域的音頻信號(hào),或備選地,接收第一域變換器的輸出信號(hào),亦 即已經(jīng)由一個(gè)域變換至不同域的音頻信號(hào)來(lái)作為輸入信號(hào)。第二域變換器的輸出信號(hào)通過(guò)第一處理器處理來(lái)產(chǎn)生第一已處理信號(hào),而第一域變換器的輸出信號(hào)通過(guò)第二處理器處理 以產(chǎn)生第二已處理信號(hào)。優(yōu)選地,該可變換旁路也可以附加地連接至第二處理器,使得輸入 第二處理器的輸入為時(shí)域音頻信號(hào),而非第一域變換器的輸出。此種極為具有靈活性的編碼構(gòu)想特別可用于高質(zhì)量高比特有效的音頻編碼,原因 在于其允許至少于3個(gè)不同域的編碼音頻信號(hào);以及當(dāng)可切換旁路也額外連接至第二處理 器時(shí),甚至允許對(duì)4個(gè)域中的音頻信號(hào)進(jìn)行編碼??赏ㄟ^(guò)由可控地切換該可切換旁路,以針 對(duì)該時(shí)域音頻信號(hào)的某個(gè)部分旁路或橋聯(lián)第一域變換器。即使已旁路第一域變換器,仍然 存在編碼時(shí)域音頻信號(hào)的兩種不同可能,亦即經(jīng)由連接至第二域變換器的第一處理器或第 二處理器來(lái)實(shí)現(xiàn)。優(yōu)選地,第一處理器及第二域變換器共同形成信宿模型編碼器,諸如從MPEG 1第 3層或MPEG 4 (AAC)已知的心理聲學(xué)驅(qū)動(dòng)音頻編碼器。優(yōu)選地,另一個(gè)編碼器亦即第二個(gè)處理器為時(shí)域編碼器,例如為從ACELP編碼器 已知的殘留編碼器,此處,LPC殘留信號(hào)使用用于LPC殘留信號(hào)或時(shí)域信號(hào)的殘留編碼器 (例如,向量量化編碼器)來(lái)編碼。在一個(gè)實(shí)施例中,當(dāng)旁路為開(kāi)啟時(shí),本時(shí)域編碼器接收 LPC域信號(hào)來(lái)作為輸入。此種編碼器為信源模型編碼器,原因在于與信宿模型編碼器相反, 信源模型編碼器被特別設(shè)計(jì)來(lái)利用語(yǔ)音產(chǎn)生模型的細(xì)節(jié)。但當(dāng)旁路被關(guān)閉時(shí),輸入第二處 理器的輸入信號(hào)將是時(shí)域信號(hào)而非LPC域信號(hào)。但若可切換旁路被去激活(這意味著來(lái)自第一域的音頻信號(hào)在被進(jìn)一步處理之 前被變換到第二域中),則再度有兩種不同可能,亦即在第二域(例如可能為L(zhǎng)PC域)中 編碼第一域變換器的輸出;或備選地,將第二域信號(hào)變換至第三域,第三域可以例如是頻譜 域。優(yōu)選地,頻譜域變換器亦即第二域變換器適于實(shí)現(xiàn)相同算法,而與輸入第二域變 換器的輸入信號(hào)是否在第一域(諸如時(shí)域)或在第二域(諸如LCP域)無(wú)關(guān)。在解碼器端,存在有兩個(gè)不同的解碼分支,此處一個(gè)解碼分支包括域變換器,亦即 第二域變換器;而另一個(gè)解碼分支只包括逆處理器,但不包括域變換器。取決于編碼器側(cè) 設(shè)定的實(shí)際旁路,亦即取決于旁路是否激活,可旁路或不旁路解碼器中的第一變換器。特別 地,當(dāng)?shù)诙儞Q器的輸出信號(hào)已經(jīng)在目標(biāo)域(諸如第一域或時(shí)域)中時(shí),可旁路解碼器的第 一變換器。但若解碼器的第二變換器的輸出在與第一域不同的域中,則解碼器旁路被去激 活,而將信號(hào)從不同域轉(zhuǎn)換成目標(biāo)域,亦即于優(yōu)選實(shí)施例中的第一域。在一個(gè)實(shí)施例中,第 二已處理信號(hào)在相同的域,亦即第二域中;但在編碼器的可切換旁路也連接至第二處理器 的其它實(shí)施例中,解碼器端的第二逆處理器的輸出信號(hào)也已經(jīng)在第一域中。在此種情況下, 使用解碼器側(cè)的可切換旁路來(lái)旁路第一變換器,以使得解碼器輸出組合器能夠接收輸入信 號(hào),其代表了音頻信號(hào)的不同部分,且在相同的域中。這樣的信號(hào)可通過(guò)組合器來(lái)進(jìn)行時(shí)間 復(fù)用,或可通過(guò)解碼器輸出信號(hào)組合器進(jìn)行交叉衰減。在優(yōu)選實(shí)施例中,編碼設(shè)備包括用于壓縮輸入信號(hào)的共同預(yù)處理級(jí)。該共同預(yù)處 理級(jí)包括多通道處理器和/或頻譜帶寬復(fù)制處理器,使得對(duì)所有的不同編碼模式,該共同 預(yù)處理級(jí)的輸出相對(duì)于輸入該共同預(yù)處理級(jí)的輸入是已壓縮版本。相對(duì)應(yīng)地,解碼器側(cè)的 組合器的輸出可通過(guò)共同后處理級(jí)來(lái)進(jìn)行后處理,該級(jí)可被操作為執(zhí)行頻譜帶寬復(fù)制綜合 和/或多通道擴(kuò)展運(yùn)算(諸如多通道上混頻操作),該運(yùn)算優(yōu)選使用由編碼器側(cè)傳送至解碼器側(cè)的參數(shù)型多通道信息來(lái)指導(dǎo)。在優(yōu)選實(shí)施例中,輸入編碼器的音頻信號(hào)及通過(guò)解碼器輸出的音頻信號(hào)所在的第 一域?yàn)闀r(shí)域。在優(yōu)選實(shí)施例中,第一域變換器的輸出所在的第二域?yàn)長(zhǎng)PC域,故第一域變換 器為L(zhǎng)PC分析級(jí)。在另外的實(shí)施例中,第三域亦即第二域變換器的輸出所在的域?yàn)轭l譜域, 或?yàn)橥ㄟ^(guò)第一域變換器所產(chǎn)生的LPC域信號(hào)的頻譜域。連接至第二域變換器的第一處理器 優(yōu)選地被實(shí)現(xiàn)為信宿編碼器,例如量化器/定標(biāo)器,其連同熵減少碼諸如連接至霍夫曼編 碼器或算術(shù)編碼器的心理聲學(xué)驅(qū)動(dòng)量化器執(zhí)行相同的功能,而與輸入信號(hào)于頻譜域或LPC 頻譜域無(wú)關(guān)。在又一優(yōu)選實(shí)施例中,在全功能設(shè)備中,用于處理第一域變換器的輸出或用于處 理可切換旁路的輸出的第二處理器為時(shí)域編碼器,諸如用于ACELP編碼器或用于任何其它 CELP編碼器的殘留信號(hào)編碼器。


隨后,將關(guān)于附圖對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行實(shí)質(zhì)描述,在附圖中圖Ia是根據(jù)本發(fā)明的第一方面的編碼方案的方框圖;圖Ib是根據(jù)本發(fā)明的第一方面的解碼方案的方框圖;圖Ic是根據(jù)本發(fā)明的另一方面的編碼方案的方框圖;圖Id是根據(jù)本發(fā)明的另一方面的解碼方案的方框圖;圖加是根據(jù)本發(fā)明的第二方面的編碼方案的方框圖;圖2b是根據(jù)本發(fā)明的第二方面的解碼方案的示意圖;圖2c是圖加的優(yōu)選共同預(yù)處理的方框圖;以及圖2d是圖2b的優(yōu)選共同后處理的方框圖;圖3a示意了根據(jù)本發(fā)明的又一方面的編碼方案的方框圖;圖北示意了根據(jù)本發(fā)明的又一方面的解碼方案的方框圖;圖3c示意了具有級(jí)聯(lián)開(kāi)關(guān)的編碼設(shè)備/方法的示意性表示;圖3d示意了其中使用級(jí)聯(lián)組合器的用于解碼的設(shè)備或方法的示意圖;圖!Be示意了對(duì)時(shí)域信號(hào)和示意包括在兩個(gè)已編碼信號(hào)中的短交叉衰減區(qū)的編碼 信號(hào)的對(duì)應(yīng)表示的示意;圖如示意了具有放置于編碼分支之前的開(kāi)關(guān)的方框圖;圖4b示意了具有放置在編碼分支之后的開(kāi)關(guān)的編碼方案的方框圖;圖如示意了優(yōu)選組合器實(shí)施例的方框圖;圖fe示意了作為準(zhǔn)周期或類脈沖信號(hào)段的時(shí)域語(yǔ)音段的波形;圖恥示意了顯示圖fe的段的頻譜;圖5c示意了作為類噪聲段或靜態(tài)段的示例的無(wú)聲語(yǔ)音的時(shí)域語(yǔ)音段;圖5d示意了圖5c的時(shí)域波形的頻譜;
圖6示意了分析綜合CELP編碼器方框圖;圖7a至7d示意了作為類脈沖信號(hào)和靜態(tài)信號(hào)的有聲/無(wú)聲激勵(lì)信號(hào);圖7e示意了提供短期預(yù)測(cè)信息和預(yù)測(cè)誤差信號(hào)的編碼器側(cè)的LPC級(jí);圖7f示意了用于產(chǎn)生加權(quán)信號(hào)的LPC器件的又一個(gè)實(shí)施例;
圖7g示意了用于通過(guò)根據(jù)圖2b的變換器537的需要,應(yīng)用逆加權(quán)操作和隨后的 激勵(lì)分析將加權(quán)信號(hào)變換成激勵(lì)信號(hào)的實(shí)現(xiàn);圖8示意了根據(jù)本發(fā)明的實(shí)施例,聯(lián)合多通道算法的方框圖;圖9示意了頻寬擴(kuò)展算法的優(yōu)選實(shí)施例;圖IOa示意了當(dāng)執(zhí)行開(kāi)環(huán)判決時(shí),對(duì)開(kāi)關(guān)的詳細(xì)描述;以及圖IOb示意了對(duì)當(dāng)在閉環(huán)判決模式下操作時(shí)的開(kāi)關(guān)的示意。
具體實(shí)施例方式圖Ia示意了本發(fā)明的實(shí)施例,其中有兩個(gè)域變換器510、410及可切換旁路50???切換旁路50適于對(duì)輸入到可切換旁路50的切換控制輸入中的控制信號(hào)51進(jìn)行響應(yīng),以處 于活躍狀態(tài)或非活躍狀態(tài)。若該可切換旁路是活躍狀態(tài),則不將音頻信號(hào)輸入99、195處的 音頻信號(hào)饋入第一域變換器510中,而是饋入到可切換旁路50中,以使得第二域變換器410 直接在輸入99、195處接收該音頻信號(hào)。在將結(jié)合圖Ic及圖Id進(jìn)行討論的一個(gè)實(shí)施例中, 可切換旁路50備選地可連接至第二處理器520,而不連接至第二域變換器410,以使得只經(jīng) 由第二處理器520處理可切換旁路50的輸出信號(hào)。然而,如果通過(guò)控制信號(hào)51將可切換旁路50設(shè)定在非活躍狀態(tài),則將在音頻信號(hào) 輸入99或195處的音頻信號(hào)輸入第一域變換器510中,并在第一域變換器510的輸出處輸 入第二域變換器410或第二處理器520中。優(yōu)選地,基于開(kāi)關(guān)控制信號(hào)來(lái)進(jìn)行對(duì)將第一域 變換器輸出信號(hào)輸入第二域變換器410中還是輸入第二處理器520中的判決,但備選地也 可經(jīng)由其它手段(例如,元數(shù)據(jù)或基于信號(hào)分析)進(jìn)行判決。備選地,甚至可以將第一域變 換器信號(hào)510輸入兩個(gè)設(shè)備410、520中,并且經(jīng)由圖4b中所討論的處理器和輸出接口之間 的開(kāi)關(guān)連接,來(lái)選擇將哪一個(gè)處理信號(hào)輸入到輸出接口中,以表示某個(gè)時(shí)間部分中的音頻 信號(hào)。另一方面,也可以在輸出接口 800本身內(nèi)進(jìn)行對(duì)將哪一個(gè)信號(hào)輸入到輸出數(shù)據(jù)流中 的判決。如圖Ia中所示,用于編碼音頻信號(hào)來(lái)獲得已編碼音頻信號(hào)的有創(chuàng)造性的設(shè)備包 括第一域變換器,其中,輸入99/195處的音頻信號(hào)在第一域中,第一域變換器用于將音頻 信號(hào)由第一域變換入第二域中。此外,提供了可切換旁路M,可切換旁路M對(duì)第一域變換 器510進(jìn)行旁路,或者用于對(duì)旁路開(kāi)關(guān)控制信號(hào)51進(jìn)行響應(yīng),使第一域變換器進(jìn)行音頻信 號(hào)的變換。從而,當(dāng)在活躍狀態(tài)中時(shí),可切換旁路對(duì)第一域變換器進(jìn)行旁路;而在非活躍狀 態(tài)中時(shí),將音頻信號(hào)輸入第一域變換器中。此外,提供第二域變換器410,用于將從可切換旁路50或第一域變換器接收的音 頻信號(hào)變換到第三域中。第三域不同于第二域。此外,提供第一處理器420,用于根據(jù)第一 算法來(lái)對(duì)第三域音頻信號(hào)進(jìn)行編碼,以獲得第一已處理信號(hào)。此外,提供第二處理器520,用 于根據(jù)第二算法對(duì)從第一域變換器接收的音頻信號(hào)進(jìn)行編碼,此處,第二算法不同于第一 算法不同。第二處理器提供第二已處理信號(hào)。特別地,針對(duì)音頻信號(hào)的一部分,該設(shè)備適于 在其輸出處具有已編碼音頻信號(hào),其中,該已編碼信號(hào)包括第一已處理信號(hào)或第二已處理 信號(hào)。當(dāng)然可以有交叉區(qū)域,然而從增強(qiáng)編碼效率的角度看,目標(biāo)是將交叉區(qū)域維持盡可能 地小,可能時(shí)消除該交叉區(qū)域,以使得能夠獲得最大比特率壓縮。圖Ib示意了在優(yōu)選實(shí)施例中,與圖Ia中的編碼器相對(duì)應(yīng)的解碼器。圖Ib中用于解碼已編碼音頻信號(hào)的設(shè)備接收包括第三域中的第一已處理信號(hào)和第二域中的第二已處 理信號(hào)在內(nèi)的已編碼音頻信號(hào)來(lái)作為輸入信號(hào),其中,第二域與第三域彼此不同。特別地, 輸入到輸入接口 900中的信號(hào)類似于圖Ia的接口 800的輸出信號(hào)。解碼設(shè)備包括第一逆 處理器430,用于逆處理第一已處理信號(hào);以及第二逆處理器530,用于逆處理第二已處理 信號(hào)。此外,提供第二變換器440,用于將第一逆處理信號(hào)由第三域變換至不同的域。此外, 提供第一變換器M0,用于將第二逆處理信號(hào)變換至第一域,或者用于當(dāng)該不同的域不是第 一域時(shí),將該第一逆處理信號(hào)變換至第一域。這意味著當(dāng)?shù)谝灰烟幚硇盘?hào)已經(jīng)不在第一域 (即,在預(yù)處理/后處理電路的情況下的已解碼音頻信號(hào)或中間音頻信號(hào)所要在的目標(biāo)域) 中時(shí),第一已逆處理信號(hào)僅由第一變換器來(lái)進(jìn)行變換。此外,解碼器包括旁路52,用于當(dāng)該 不同的域是第一域時(shí),旁路該第一變換器M0。圖Ib的電路還包括組合器600,用于組合第 一變換器MO的輸出信號(hào)和旁路輸出(即,旁路52輸出的信號(hào)),以獲得組合的已解碼音 頻信號(hào)699,可以就這樣使用,或者甚至可使用后面將要討論到的共同后處理級(jí)來(lái)進(jìn)行解壓 縮。圖Ic示意了本發(fā)明的音頻編碼器的優(yōu)選實(shí)施例,其中,提供了處于心理聲學(xué)模型 300的信號(hào)分類器,用來(lái)對(duì)輸入到由MPEG環(huán)繞編碼器101及增強(qiáng)頻帶復(fù)制處理器102所形 成的共同預(yù)處理級(jí)中的音頻信號(hào)進(jìn)行分類。此外,第一域變換器510是LPC分析級(jí),可切換 旁路連接在LPC分析級(jí)510的輸入與輸出之間,作為第一域變換器。LPC設(shè)備通常輸出LPC域信號(hào),可以是LPC域中的任何信號(hào),例如,圖7e中的激勵(lì) 信號(hào)、或圖7f中的加權(quán)信號(hào)、或已經(jīng)通過(guò)將LPC濾波系數(shù)應(yīng)用到音頻信號(hào)而產(chǎn)生的任何其 它信號(hào)。此外,LPC設(shè)備也可以確定這些系數(shù),還可以對(duì)這些系數(shù)進(jìn)行量化/編碼。此外,開(kāi)關(guān)200被設(shè)置在第一域變換器的輸出處,使得能夠?qū)⒃谂月?0和LPC級(jí) 510的共同輸出處的信號(hào)轉(zhuǎn)發(fā)到第一編碼分支400或第二編碼分支500。第一編碼分支400 包括圖Ia的第二域變換器410和第一處理器420,第二編碼分支500包括圖Ia的第二處理 器520。在圖Ic的編碼器實(shí)施例中,將第一域變換器510的輸入連接至可切換旁路50的輸 入,將可切換旁路50的輸出連接至第一域變換器510的輸出,以形成共同輸出,并將該共同 輸出輸入到開(kāi)關(guān)200中,其中,開(kāi)關(guān)200包括兩個(gè)輸出,或者甚至可以包括用于附加編碼處 理器的附加輸出。優(yōu)選地,第一編碼分支400中的第二域變換器410包括MDCT變換,附加地,可將 MDCT變換與可切換時(shí)間偏差(time warp, Tff)功能結(jié)合。使用定標(biāo)器(scalar) /量化器來(lái) 編碼MDCT頻譜,定標(biāo)器/量化器基于位于信號(hào)分類器塊300內(nèi)的心理聲學(xué)模型所提供的信 息來(lái)執(zhí)行對(duì)輸入值的量化。另一方面,第二處理器包括用于對(duì)輸入信號(hào)進(jìn)行時(shí)域編碼的時(shí) 域編碼器。在一個(gè)實(shí)施例中,控制開(kāi)關(guān)200,以使得在旁路50處于活躍狀態(tài)/閉合的情況 下,將開(kāi)關(guān)200自動(dòng)設(shè)定至上編碼分支400。但在又一個(gè)實(shí)施例中,即使當(dāng)旁路處于活躍狀 態(tài)/閉合時(shí),也可以獨(dú)立于可切換旁路50來(lái)控制開(kāi)關(guān)200,使得時(shí)域編碼器520可以直接接 收時(shí)域音頻輸入信號(hào)。圖Id示意了相對(duì)應(yīng)的解碼器,其中,LPC綜合塊540與圖Ib的第一變換器相對(duì)應(yīng), 且可經(jīng)由旁路52而被旁路,優(yōu)選地,旁路52是經(jīng)由比特流解復(fù)用器900所產(chǎn)生的旁路信號(hào) 來(lái)控制的可切換旁路。比特流解復(fù)用器900可以從輸入比特流899產(chǎn)生此信號(hào)以及用于編 碼分支430、530或SBR綜合塊701或MPEG環(huán)繞解碼器塊702的全部其它控制信號(hào),或者可以接收針對(duì)從信號(hào)分析或任何其它分隔的信息源而來(lái)的這些控制線的數(shù)據(jù)。 隨后,將給出針對(duì)編碼器的圖Ic和針對(duì)解碼器的圖Id中的實(shí)施例的更詳細(xì)的描述。 優(yōu)選實(shí)施例包括混合音頻編碼器,混合音頻編碼器將成功的MPEG技術(shù)(諸如AAC、 SBR及MPEG環(huán)繞技術(shù))和成功的語(yǔ)音編碼技術(shù)的力量相結(jié)合。所產(chǎn)生的編碼解碼器包括用 于全部信號(hào)類別的共同預(yù)處理,該共同預(yù)處理由MPEG環(huán)繞與加強(qiáng)型SBR(eSBR)所組成。通 過(guò)心理聲學(xué)模型控制并基于信號(hào)類別,逐幀地選擇由信宿或信源而獲得的編碼器架構(gòu)。所提出的編碼解碼器有利地使用編碼工具,例如MPEG環(huán)繞、SBR及AAC基本編碼 器。這些編碼工具受到變化及增強(qiáng)來(lái)提高語(yǔ)音性能且在很低的比特率處。在較高比特率處, AAC的性能至少是匹配的,原因新的編碼解碼器可以回落到非常接近AAC的模式。實(shí)現(xiàn)增強(qiáng) 型無(wú)噪聲編碼模式,其在平均上提供了稍好的無(wú)噪聲編碼性能。針對(duì)大約321ApS或更低的 比特率,激活額外的工具以提高用于語(yǔ)音信號(hào)和其它信號(hào)基本編碼器的性能。這樣的工具 的主要組件是基于LPC的頻率成形,針對(duì)基于MDCT的編碼器以及時(shí)域編碼器的更多備選窗 口長(zhǎng)度選項(xiàng)。將新的頻寬擴(kuò)展技術(shù)用來(lái)作為對(duì)SBR工具的擴(kuò)張,其更適合低交叉頻率并用 于語(yǔ)音。MPEG環(huán)繞工具通過(guò)提供下變頻及參數(shù)化立體聲聲像來(lái)提供立體聲信號(hào)或多通道信 號(hào)的參數(shù)表示。針對(duì)給定的測(cè)試情況,只將其用來(lái)編碼立體聲信號(hào),但通過(guò)使用從MPEG-D 而來(lái)的現(xiàn)有的MPEG環(huán)繞功能,其也適合用于多通道輸入信號(hào)。優(yōu)選地,僅在低比特率處使用編碼解碼器鏈中的全部工具(MDCT編碼器除外)率。MPEG環(huán)繞技術(shù)被用來(lái)經(jīng)由M個(gè)音頻傳輸通道發(fā)送N個(gè)音頻輸入通道。從而,系統(tǒng) 通道本質(zhì)上具有多通道能力。MPEG環(huán)繞技術(shù)已得到增強(qiáng)來(lái)提高在低比特率處并針對(duì)類語(yǔ)音 信號(hào)的性能?;静僮髂J綇牧Ⅲw聲輸入信號(hào)創(chuàng)建高質(zhì)量單聲道下變頻。此外,提取空間參數(shù) 的集合。在解碼器側(cè),使用已解碼單聲道下變頻與所提取并發(fā)送的空間參數(shù)相組合,來(lái)產(chǎn)生 立體聲輸出信號(hào)。在MPEG環(huán)繞上混頻中使用由單個(gè)OTT (—對(duì)二)盒(OTT box)所組成的 簡(jiǎn)單樹(shù)狀結(jié)構(gòu),低比特率2-1-2模式已經(jīng)被增加至MPEG環(huán)繞中既有的5-X-5或7_x_7工 作點(diǎn)。一些組件已受到修改來(lái)更好地適于語(yǔ)音重現(xiàn)。針對(duì)較高數(shù)據(jù)率(例如,641cbpS或以 上),核心碼使用離散立體聲編碼(中間/旁邊或L/R),MPEG環(huán)繞沒(méi)有被用于此工作點(diǎn)。本技術(shù)提交中提出的頻寬擴(kuò)展基于MPEG SBR技術(shù)。所使用的濾波器組與MPEG環(huán) 繞及SBR中所使用的QMF濾波器組相同,提供了在額外的綜合/分析的情況下共享MPEG環(huán) 繞與SBR間的QMF域抽樣的可能性。與標(biāo)準(zhǔn)化的SBR工具相比,eSBR引入了增強(qiáng)型處理算 法,其對(duì)于語(yǔ)音及音頻兩項(xiàng)內(nèi)容皆為最優(yōu)。包括了至SBR的擴(kuò)展,SBR更適用于極低比特率 及低交叉頻率。從SBR及AAC的組合知道,本特征可被全局地解除活躍狀態(tài),除了對(duì)核心編碼器的 全頻率范圍的編碼之外。所提出的系統(tǒng)的核心編碼器部分可被視為可選的的LPC濾波器與可切換頻域/時(shí) 域核心編碼器的組合。從語(yǔ)音編碼器架構(gòu)知道,LPC濾波器提供針對(duì)人類語(yǔ)音的源模型的基礎(chǔ)。可全局 地或逐幀地使能或去能(旁路)LPC處理。在LPC濾波器之后,使用時(shí)域或基于變換的頻域變換器架構(gòu)來(lái)編碼LPC域信號(hào)。通過(guò)擴(kuò)展的心理聲學(xué)模型來(lái)控制在這兩個(gè)分支之間的切換。時(shí)域編碼器架構(gòu)基于ACELP技術(shù),提供特別針對(duì)低比特率語(yǔ)音信號(hào)的最優(yōu)編碼性 能?;陬l域的編碼解碼器分支基于具有定標(biāo)器/量化器及熵編碼的MDCT架構(gòu)??蛇x地,可利用時(shí)間偏差工具,以通過(guò)更緊密的信號(hào)表示來(lái)增強(qiáng)較高比特率(例 如,641cbpS及以上)的語(yǔ)音信號(hào)的編碼效率。從現(xiàn)有的MPEG技術(shù)知道,基于MDCT的架構(gòu)給予了較低比特率處的良好質(zhì)量和逼 近透明度的標(biāo)量。在更高比特率處,其可在更高比特率處向AAC模式收斂。緩沖器要求與AAC相同,S卩,輸入緩沖器中的最大比特?cái)?shù)為每個(gè)核心編碼器通道 6144 每個(gè)單聲道通道元件6144比特,每個(gè)立體聲通道對(duì)元件12288位。比特儲(chǔ)存器在編碼器處受到控制,這允許將編碼處理適于目前的比特需求。比特 儲(chǔ)存器的特性與AAC相同。編碼器及解碼器能夠被控制為以12kbps單聲道與64kpbs立體聲之間的不同比特 率進(jìn)行操作。以P⑶的方式來(lái)詳細(xì)說(shuō)明解碼器復(fù)雜度。對(duì)于基本解碼器,要求大約11. 7P⑶復(fù) 雜度。在使用時(shí)間偏差工具的情況下,例如針對(duì)641ApS測(cè)試模式,解碼器復(fù)雜度增加至 22. 2PCU。針對(duì)優(yōu)選立體聲解碼器,對(duì)RAM和ROM的要求為RAMj^J M 千字ROM:約 150 千字通過(guò)通知熵編碼器,可獲得只有大約98千字的總ROM大小。在使用時(shí)間偏差工具的情況下,RAM需求增加約3千字,ROM需求增加約40千字。理論算法延遲取決于編碼解碼鏈所使用的工具(例如MPEG環(huán)繞等等)所提出的 技術(shù)的算法延遲在編碼解碼器抽樣率處逐工作點(diǎn)地進(jìn)行顯示。下文給定的數(shù)值不包括成幀 的延遲,即,以處理第一幀所需的抽樣數(shù)來(lái)填充編碼器輸入緩沖器所需的延遲。針對(duì)所有指 定的工作模式,這種成幀的延遲都是2048個(gè)抽樣。下表包含了最小算法延遲及針對(duì)所使用 的實(shí)現(xiàn)的延遲。再抽樣48kHz輸入PCM文件對(duì)編碼解碼器抽樣率的附加延遲以“(.)”來(lái)指定。
權(quán)利要求
1.一種用于編碼音頻信號(hào)來(lái)獲得已編碼音頻信號(hào)的設(shè)備,所述音頻信號(hào)在第一域中, 所述設(shè)備包括第一域變換器(510),用于將所述音頻信號(hào)由所述第一域變換至第二域中;可切換旁路(50),用于響應(yīng)旁路切換控制信號(hào)(51),旁路所述第一域變換器(510)或 使得通過(guò)所述第一域變換器(510)對(duì)所述音頻信號(hào)進(jìn)行變換;第二域變換器G10),用于將從所述可切換旁路(50)或所述第一域變換器(510)接收 的音頻信號(hào)變換至第三域中,所述第三域與所述第二域不同;第一處理器G20),用于根據(jù)第一編碼算法對(duì)第三域音頻信號(hào)進(jìn)行編碼;以及第二處理器(520),用于根據(jù)與所述第一編碼算法不同的第二編碼算法,對(duì)從第一域變 換器(510)接收的音頻信號(hào)進(jìn)行編碼來(lái)獲得第二已處理信號(hào),其中,針對(duì)所述音頻信號(hào)的一部分的已編碼信號(hào)包括第一已處理信號(hào)或第二已處理信號(hào)。
2.根據(jù)權(quán)利要求1所述的設(shè)備,其中,所述第一域變換器(510)包括LPC分析濾波器, 用于對(duì)所述音頻信號(hào)進(jìn)行LPC濾波,以獲得LPC殘留信號(hào)和LPC參數(shù)數(shù)據(jù)。
3.根據(jù)權(quán)利要求1或2所述的設(shè)備,其中,所述第二域變換器(410)包括時(shí)間-頻率變 換器,用于將輸入信號(hào)變換成其頻譜表示。
4.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的設(shè)備,其中,所述第二處理器(520)可被操作為 產(chǎn)生已編碼輸出信號(hào),使得所述已編碼輸出信號(hào)與所述第二處理器(520)的輸入信號(hào)處于 相同的域中。
5.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的設(shè)備,其中,所述第一處理器(420)包括量化器 及熵編碼器;以及所述第二處理器(520)包括基于碼本的源編碼器。
6.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的設(shè)備,其中,所述第一處理器(420)基于信宿模 型,以及所述第二處理器(520)基于信源模型。
7.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的設(shè)備,還包括切換級(jí)000),連接在所述第一域 變換器(510)的輸出與所述第二域變換器(410)的輸入和所述第二處理器(520)的輸入之 間,其中,所述切換級(jí)(200)適于響應(yīng)切換級(jí)控制信號(hào),在所述第二域變換器(410)的輸入 與所述第二處理器(520)的輸入之間切換。
8.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的設(shè)備,其中,所述可切換旁路(50)的輸出連接至 所述第一域變換器(510)的輸出,以及所述可切換旁路(50)的輸入連接至所述第一域變換 器(510)的輸入。
9.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的設(shè)備,進(jìn)一步包括信號(hào)分類器,用于依據(jù)對(duì)所述 音頻信號(hào)部分的分析結(jié)果,針對(duì)所述音頻信號(hào)的所述部分控制所述可切換旁路(50)。
10.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的設(shè)備,其中,所述第二域變換器(410)可被操作 為以基于塊的方式變換輸入信號(hào);以及所述第二域變換器可被操作為響應(yīng)音頻信號(hào)分 析來(lái)執(zhí)行基于塊的切換,使得所述第二域變換器G10)由于取決于所述音頻信號(hào)的內(nèi)容對(duì) 不同長(zhǎng)度的塊進(jìn)行變換而受到控制。
11.一種編碼音頻信號(hào)來(lái)獲得已編碼音頻信號(hào)的方法,所述音頻信號(hào)在第一域中,所述 方法包括將所述音頻信號(hào)由所述第一域變換(510)至第二域中;響應(yīng)旁路切換控制信號(hào)(51),旁路(50)將所述音頻信號(hào)由所述第一域變換(510)至第 二域中的步驟,或?qū)⑺鲆纛l信號(hào)由所述第一域變換至所述第二域中;將已旁路的音頻信號(hào)(50)或在所述第二域中的音頻信號(hào)變換(410)至第三域中,所述 第三域與所述第二域不同;根據(jù)第一編碼算法,對(duì)由變換G10)已旁路音頻信號(hào)(50)或在所述第二域中的音頻信 號(hào)的步驟所產(chǎn)生的第三域音頻信號(hào)進(jìn)行編碼G20);以及根據(jù)與所述第一編碼算法不同的第二編碼算法,編碼(520)所述第二域中的音頻信 號(hào),以獲得第二已處理信號(hào),其中,針對(duì)所述音頻信號(hào)的一部分的已編碼信號(hào)包括第一已處理信號(hào)或第二已處理信號(hào)。
12.一種用于解碼已編碼音頻信號(hào)的設(shè)備,所述已編碼音頻信號(hào)包括在第三域中的第 一已處理信號(hào)以及在第二域中的第二已處理信號(hào),其中,所述第二域與所述第三域彼此不 同,所述設(shè)備包括第一逆處理器G30),用于逆處理所述第一已處理信號(hào); 第二逆處理器(530),用于逆處理所述第二已處理信號(hào); 第二變換器G40),用于將第一逆處理信號(hào)由所述第三域變換至不同的域中; 第一變換器(540),用于將第二逆處理信號(hào)變換至第一域中,或者用于當(dāng)所述不同的域 不是所述第一域時(shí),將被變換至所述不同的域中的第一逆處理信號(hào)變換至所述第一域中; 以及旁路(52),用于當(dāng)所述不同的域是所述第一域時(shí),旁路所述第一變換器(540)。
13.根據(jù)權(quán)利要求12所述的設(shè)備,還包括組合器(600),用于將所述第一變換器(MO) 的輸出和所述旁路(5 的輸出進(jìn)行組合,以獲得組合解碼音頻信號(hào)(699)。
14.根據(jù)權(quán)利要求12或13所述的解碼設(shè)備,還包括輸入接口(900),用于從已編碼音 頻信號(hào)提取所述第一已處理信號(hào)、所述第二已處理信號(hào)以及控制信號(hào),所述控制信號(hào)指示 針對(duì)特定的第一逆處理信號(hào)是否要由所述旁路來(lái)對(duì)所述第一變換器640)進(jìn)行旁路。
15.根據(jù)權(quán)利要求12至14中任一項(xiàng)所述的解碼設(shè)備,其中,所述第一變換器640)包 括線性預(yù)測(cè)編碼(LPC)綜合級(jí),以及其中,所述第二變換器(440)包括頻譜-時(shí)間變換器,用于將音頻信號(hào)的頻譜表示變換 成所述音頻信號(hào)的時(shí)間表示。
16.根據(jù)權(quán)利要求12至15中任一項(xiàng)所述的解碼設(shè)備,其中,所述第一逆處理器(430) 包括熵解碼器及解量化器;以及所述第二逆處理器(530)包括基于碼本的源解碼器。
17.根據(jù)權(quán)利要求12至16中任一項(xiàng)所述的解碼設(shè)備,其中,所述第二變換器(440)可 被操作為執(zhí)行綜合濾波操作,諸如能夠由包括在所述編碼音頻信號(hào)中的附加信息(434) 來(lái)控制的逆時(shí)間錯(cuò)位修改離散余弦變換操作。
18.—種解碼已編碼音頻信號(hào)的方法,所述已編碼音頻信號(hào)包括在第三域中的第一已 處理信號(hào)和在第二域中的第二已處理信號(hào),其中,所述第二域和所述第三域彼此不同,所述 方法包括逆處理(430)所述第一已處理信號(hào);逆處理(530)所述第二已處理信號(hào);對(duì)所述第一逆處理信號(hào)進(jìn)行第二域變換G40),從所述第三域變換至不同的域; 將所述第二逆處理信號(hào)進(jìn)行第一域變換(540)以變換到第一域中,或者當(dāng)所述不同的 域不是所述第一域時(shí),將所述第一逆處理信號(hào)變換到所述第一域中;以及 當(dāng)所述不同的域是所述第一域時(shí),旁路(5 所述第一域變換步驟(540)。
19. 一種計(jì)算機(jī)程序,用于當(dāng)于計(jì)算機(jī)上運(yùn)行時(shí),執(zhí)行根據(jù)權(quán)利要求11所述的編碼音 頻信號(hào)的方法,或根據(jù)權(quán)利要求18所述的的解碼已編碼音頻信號(hào)的方法。
全文摘要
一種編碼裝置包括第一域變換器、可切換旁路、第二域變換器、第一處理器及第二處理器來(lái)獲得已編碼音頻信號(hào),該已編碼音頻信號(hào)具有由已經(jīng)通過(guò)不同的算法所編碼的在不同域中的已編碼數(shù)據(jù)表示的不同編碼部分。在解碼器的相對(duì)應(yīng)解碼階段結(jié)合用于旁路域變換器的旁路允許產(chǎn)生具有高質(zhì)量及低比特率的已解碼音頻信號(hào)。
文檔編號(hào)G10L19/14GK102099856SQ200980127915
公開(kāi)日2011年6月15日 申請(qǐng)日期2009年7月6日 優(yōu)先權(quán)日2008年7月17日
發(fā)明者烏爾里?!た死窢? 伯恩哈德·格瑞, 吉米·拉皮埃爾, 哈拉爾德·波普, 尼古拉斯·里特爾博謝, 布魯諾·貝塞特, 拉爾夫·蓋格爾, 斯特凡·拜爾, 斯特凡·蓋爾斯貝格, 洛克·勒菲弗, 熱雷米·勒康特, 約翰內(nèi)斯·希爾珀特, 紀(jì)堯姆·??怂? 菲利普·古爾奈, 雷德曼·薩拉米, 馬克斯·諾伊恩多夫, 馬庫(kù)斯·馬特拉斯 申請(qǐng)人:弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì), 沃伊斯亞吉公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
河北区| 荣成市| 海原县| 九寨沟县| 肥城市| 隆化县| 筠连县| 景宁| 怀来县| 辽中县| 湟中县| 东山县| 嘉荫县| 庆安县| 乌鲁木齐市| 广宁县| 新野县| 营口市| 桐乡市| 开原市| 罗甸县| 奉贤区| 离岛区| 栾城县| 睢宁县| 临潭县| 西林县| 衡南县| 亳州市| 平山县| 大埔县| 巫溪县| 闸北区| 陈巴尔虎旗| 平潭县| 嵩明县| 九江市| 北海市| 南乐县| 双牌县| 肇州县|