欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

支持時(shí)域及頻域編碼模式的音頻編解碼器的制造方法

文檔序號(hào):2825625閱讀:238來(lái)源:國(guó)知局
支持時(shí)域及頻域編碼模式的音頻編解碼器的制造方法
【專利摘要】在速率/失真比方面具有低延遲及增高的編碼效率的支持時(shí)域及頻域兩種編碼模式的音頻編解碼器通過(guò)如下得到:配置音頻編碼器使得音頻編碼器以不同操作模式操作,使得如果活動(dòng)的操作模式為第一操作模式,則可用幀編碼模式的模式相關(guān)集合與時(shí)域編碼模式的第一子集不相交,并且與頻域編碼模式的第二子集重疊;而如果活動(dòng)的操作模式為第二操作模式,則可用幀編碼模式的模式相關(guān)集合與兩個(gè)子集即時(shí)域編碼模式的子集以及頻域編碼模式的子集都重疊。
【專利說(shuō)明】支持時(shí)域及頻域編碼模式的音頻編解碼器
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及支持時(shí)域及頻域編碼模式的音頻編解碼器。
【背景技術(shù)】
[0002]最近,最終通過(guò)了 MPEG USAC編解碼器。統(tǒng)一語(yǔ)音與音頻編碼(USAC)是使用高階音頻編碼(AAC)、變換編碼激勵(lì)(TCX)及代數(shù)代碼激勵(lì)線性預(yù)測(cè)編碼器(ACELP)的混合方式來(lái)編碼音頻信號(hào)的編解碼器。更具體地,MPEG USAC使用1024樣本的幀長(zhǎng)度,且允許在1024或8x128樣本的仿AAC幀、TCX1024幀,或在一個(gè)幀內(nèi)ACELP幀(256樣本)、TCX256及TCX512樣本的組合之間切換。
[0003]不利地MPEG USAC編解碼器不適合需要低延遲的應(yīng)用。雙向通信應(yīng)用例如需要這樣的短延遲。由于USAC具有1024樣本的幀長(zhǎng)度,故USAC并非這些低延遲應(yīng)用的候選者。
[0004]在W02011147950中,曾經(jīng)提出通過(guò)將USAC編解碼器的編碼模式只限制于TCX及ACELP模式而使得USAC方法適用于低延遲應(yīng)用。此外,曾經(jīng)提出使得幀結(jié)構(gòu)變得更細(xì)小以便遵守由低延遲應(yīng)用所施加的低延遲要求。
[0005]但仍然需要提出一種音頻編解碼器,在速率/失真比方面具有增高的編碼效率而執(zhí)行低編碼延遲。優(yōu)選地,該編解碼器應(yīng)該能夠有效地處置不同類型的音頻信號(hào)比如語(yǔ)音及首樂(lè)。

【發(fā)明內(nèi)容】

[0006]這樣,本發(fā)明的目的在于提供一種音頻編解碼器,以提供低延遲用于低延遲應(yīng)用,但與USAC相比,例如在速率/失真比方面具有增高的編碼效率。
[0007]該目的通過(guò)審查中的獨(dú)立權(quán)利要求的主題來(lái)實(shí)現(xiàn)。
[0008]本發(fā)明的基本構(gòu)想是可獲得具有低延遲及在速率/失真比方面具有增加的編碼效率的支持時(shí)域及頻域編碼模式的音頻編解碼器,如果該音頻編碼器被配置成以不同操作模式進(jìn)行操作,使得如果活動(dòng)的操作模式為第一操作模式,則可用的幀編碼模式的模式相關(guān)集合與時(shí)域編碼模式的第一子集不相交,并且與頻域編碼模式的第二子集重疊;而如果活動(dòng)的操作模式為第二操作模式,則可用的幀編碼模式的模式相關(guān)集合與兩個(gè)子集重疊,即,時(shí)域編碼模式的子集以及頻域編碼模式的子集。例如,取決于用于傳輸數(shù)據(jù)流的可用傳輸比特率,可執(zhí)行關(guān)于采用第一和第二操作模式中的哪一個(gè)的決定。例如,決定的依賴性可以是在較低可用傳輸比特率的情況下采用第二操作模式,而在較高可用傳輸比特率的情況下采用第一操作模式。更具體地,通過(guò)對(duì)編碼器提供操作模式,可防止編碼器在編碼情況下選擇任何時(shí)域編碼模式,比如通過(guò)可用傳輸比特率而來(lái)確定,當(dāng)在長(zhǎng)期的基礎(chǔ)上在速率/失真比方面考慮編碼效率時(shí),選擇任何時(shí)域編碼模式極其可能造成編碼效率的損耗。更精確而言,本發(fā)明的發(fā)明人發(fā)現(xiàn)在(相對(duì))高的可用傳輸帶寬的情況下,抑制選擇任何時(shí)域編碼模式使得編碼效率增高:但在短期的基礎(chǔ)上,可以假設(shè)時(shí)域編碼模式當(dāng)前優(yōu)于頻域編碼模式,但如果以較長(zhǎng)時(shí)間周期來(lái)分析音頻信號(hào),則此假設(shè)變得不正確。這種長(zhǎng)期分析或預(yù)測(cè)在低延遲應(yīng)用不可能,因此,防止編碼器事先采用任何時(shí)域編碼模式使得能夠?qū)崿F(xiàn)增加的編碼效率。
[0009]根據(jù)本發(fā)明的實(shí)施例,前述構(gòu)想是經(jīng)探索以達(dá)到數(shù)據(jù)流比特率更進(jìn)一步增高的程度:雖然同步地控制編碼器與解碼器的操作模式就比特率而言相當(dāng)價(jià)廉,或當(dāng)同步性是通過(guò)一下其它裝置提供時(shí)甚至無(wú)需耗用任何比特率,但可以探討編碼器與解碼器同步地在操作模式之間操作與切換的事實(shí),以便減輕傳遞在音頻信號(hào)的連續(xù)部分中數(shù)據(jù)流的各個(gè)幀相關(guān)聯(lián)的幀編碼模式時(shí)的額外傳遞負(fù)擔(dān)。更特別地,當(dāng)解碼器的關(guān)聯(lián)器可被配置成取決于與數(shù)據(jù)流中的幀相關(guān)聯(lián)的幀模式語(yǔ)法元素而執(zhí)行數(shù)據(jù)流的連續(xù)幀的每一個(gè)與多個(gè)幀編碼模式的模式相關(guān)集合中的一個(gè)的關(guān)聯(lián)時(shí),該關(guān)聯(lián)器可特別地取決于活動(dòng)的操作模式而改變關(guān)聯(lián)的性能的依賴性。更具體地,依賴性的改變可以使得如果活動(dòng)的操作模式為第一操作模式,則該模式相關(guān)集合與第一子集不相交,并且與第二子集重疊;而如果活動(dòng)的操作模式為第二操作模式,則該模式相關(guān)集合與兩個(gè)子集重疊。然而,通過(guò)由探索與當(dāng)前的操作模式相關(guān)聯(lián)的情況的知識(shí),提高比特率的較少限制性的解決方案也是可行的。
[0010]本發(fā)明的實(shí)施例的有利的方面是從屬權(quán)利要求的主題。
【專利附圖】

【附圖說(shuō)明】
[0011]更具體地,本發(fā)明的優(yōu)選實(shí)施例在下面參考附圖以進(jìn)一步細(xì)節(jié)說(shuō)明,附圖中
[0012]圖1示出根據(jù)實(shí)施例的音頻解碼器的框圖;
[0013]圖2示出根據(jù)實(shí)施例,幀模式語(yǔ)法元素與該模式相關(guān)集合的幀編碼模式的可能值之間的雙射映射的示意圖;
[0014]圖3示出根據(jù)實(shí)施例的時(shí)域解碼器的框圖;
[0015]圖4示出根據(jù)實(shí)施例的頻域編碼器的框圖;
[0016]圖5示出根據(jù)實(shí)施例的音頻編碼器的框圖;及
[0017]圖6示出根據(jù)實(shí)施例的時(shí)域及頻域編碼器的框圖。
[0018]有關(guān)附圖的說(shuō)明須注意除非另外明白地教示,否則在一幅圖中的組件描述也將同等地適用于另一幅圖中具有與其相關(guān)聯(lián)的相同組件符號(hào)的組件。
【具體實(shí)施方式】
[0019]圖1示出根據(jù)本發(fā)明的實(shí)施例的音頻解碼器10。音頻解碼器包括時(shí)域解碼器12及頻域解碼器14。此外,音頻解碼器10包括關(guān)聯(lián)器16,被配置為將數(shù)據(jù)流20的每一個(gè)連續(xù)幀18a-18c關(guān)聯(lián)到多個(gè)22幀編碼模式所組成的模式相關(guān)集合中的一個(gè),多個(gè)22幀編碼模式在圖1中示例說(shuō)明為A、B及C??梢杂卸嘤谌齻€(gè)幀編碼模式,因此數(shù)目從3改成其它數(shù)目。各個(gè)幀18a-c對(duì)應(yīng)于音頻解碼器從數(shù)據(jù)流20重建的音頻信號(hào)26的連續(xù)部分24a_c中的一個(gè)。
[0020]更精確地來(lái)說(shuō),關(guān)聯(lián)器16是連接在一方面解碼器10的輸入28與另一方面時(shí)域解碼器12及頻域解碼器14的輸入之間,從而以后面詳述的方式為關(guān)聯(lián)器16提供相關(guān)聯(lián)的幀18a_c。
[0021]時(shí)域解碼器12是被配置來(lái)解碼幀,該幀具有與其相關(guān)聯(lián)的多個(gè)22幀編碼模式中的一個(gè)或多個(gè)所組成的第一子集30中的一個(gè);而且頻域解碼器14是被配置來(lái)解碼幀,該幀具有與其相關(guān)聯(lián)的多個(gè)22幀編碼模式中的一個(gè)或多個(gè)所組成的第二子集32中的一個(gè)。第一及第二子集彼此不相交,如圖1中示例說(shuō)明。更精確的來(lái)說(shuō),該時(shí)域解碼器12具有輸出使得輸出音頻信號(hào)26的對(duì)應(yīng)于具有與其相關(guān)聯(lián)的幀編碼模式的第一子集30中的一個(gè)的幀的重建部分24a-c ;及該頻域解碼器14包括輸出用以輸出音頻信號(hào)26的對(duì)應(yīng)于具有與其相關(guān)聯(lián)的幀編碼模式的第二子集32中的一個(gè)的幀的重建部分。
[0022]如圖1所示,音頻解碼器10可選地具有組合器34,該組合器34連接在一方面時(shí)域解碼器12及頻域解碼器14的輸出與另一方面解碼器10的輸出36之間。特別地,雖然圖1建議部分24a-24c彼此不重疊,而是在時(shí)間t上彼此立即連接,在該種情況下也可不存在組合器34 ;也可能部分24a-24c在時(shí)間t上至少部分連接,但彼此部分重疊,比如涉及由頻域解碼器14所使用的重疊變換,允許時(shí)間混迭抵消,舉例而言,如同后文將就頻域解碼器14作進(jìn)一步細(xì)節(jié)解說(shuō)的實(shí)施例的情況。
[0023]在繼續(xù)對(duì)圖1的實(shí)施例進(jìn)行說(shuō)明之前,須注意圖1示例說(shuō)明的幀編碼模式A-C的數(shù)目?jī)H供舉例說(shuō)明。圖1的音頻解碼器可支持多于三個(gè)編碼模式。后文中,子集32的幀編碼模式被稱作頻域編碼模式,而子集30的幀編碼模式被稱作時(shí)域編碼模式。關(guān)聯(lián)器16將任何時(shí)域編碼模式30的幀15a-c轉(zhuǎn)發(fā)給時(shí)域解碼器12,并且將任何頻域編碼模式的幀18a_c轉(zhuǎn)發(fā)給頻域解碼器14。組合器34正確地登記如由時(shí)域解碼器12及頻域解碼器14所輸出的音頻信號(hào)26的重建部分,因此如圖1所示在時(shí)間t上為連續(xù)排列。可選地,組合器34可在頻域編碼模式部分24之間執(zhí)行重疊加法功能,或在緊接地連續(xù)部分間的過(guò)渡處執(zhí)行其它特定措施,比如重疊加法功能用以執(zhí)行由頻域解碼器14所輸出部分間的混迭抵消。可在由時(shí)域及頻域解碼器12及14分開(kāi)輸出的立即相連部分24a-c之間執(zhí)行正向混迭抵消,即針對(duì)從頻域編碼模式部分24至?xí)r域編碼模式部分24的過(guò)渡,及從時(shí)域編碼模式部分24至頻域編碼模式部分24的過(guò)渡。有關(guān)可能實(shí)現(xiàn)的進(jìn)一步細(xì)節(jié)請(qǐng)參考后文描述的進(jìn)一步細(xì)節(jié)實(shí)施例。
[0024]如后面將要詳細(xì)描述,關(guān)聯(lián)器16是被配置來(lái)使用幀編碼模式A-C而執(zhí)行數(shù)據(jù)流20的連續(xù)幀18a-c的關(guān)聯(lián),而其執(zhí)行關(guān)聯(lián)的方式可在不適合使用此種時(shí)域編碼模式的情況下避免使用時(shí)域編碼模式,比如在高可用傳輸比特率的情況下,在這種情況下,在速率/失真比方面,時(shí)域編碼模式比頻域編碼模式更無(wú)效,因此時(shí)域編碼模式用于某些幀18a_18c極其可能導(dǎo)致編碼效率的減低。
[0025]據(jù)此,關(guān)聯(lián)器16被配置來(lái)取決于與該數(shù)據(jù)流20中的幀18a_c相關(guān)聯(lián)的一幀模式語(yǔ)法元素而執(zhí)行幀與幀編碼模式的關(guān)聯(lián)。舉例而言,數(shù)據(jù)流20的語(yǔ)法可被配置來(lái)使得各個(gè)幀18a-c包括用以確定對(duì)應(yīng)的幀18a-c所屬的幀編碼模式的幀模式語(yǔ)法元素38。
[0026]此外,關(guān)聯(lián)器16被配置來(lái)在多個(gè)操作模式中的活動(dòng)的模式下進(jìn)行操作,或從多個(gè)操作模式中選出當(dāng)前的操作模式。關(guān)聯(lián)器16可取決于數(shù)據(jù)流或根據(jù)外部控制信號(hào)而執(zhí)行該選擇。舉例而言,如后面將要詳細(xì)描述的,與編碼器的操作模式的改變同步地,音頻解碼器10改變其操作模式,以及為了實(shí)現(xiàn)同步,編碼器可以傳送活動(dòng)的操作模式及該數(shù)據(jù)流20內(nèi)的操作模式中的活動(dòng)的操作模式的改變。另外,編碼器及解碼器10可通過(guò)一些外部控制信號(hào)同步地被控制,比如由較低的傳輸層比如EPS或RTP等所提供的控制信號(hào)。外部提供的控制信號(hào)例如可以指示一些可用傳輸比特率。
[0027]為了示例說(shuō)明或?qū)崿F(xiàn)避免如前文所述的不當(dāng)選擇或不當(dāng)使用時(shí)域編碼模式,關(guān)聯(lián)器16被配置來(lái)取決于活動(dòng)的操作模式,改變幀18與編碼模式的關(guān)聯(lián)的性能的依賴性。更明確而言,如果活動(dòng)的操作模式為第一操作模式,則多個(gè)幀編碼模式的模式相關(guān)集合例如為40處所示,其與第一子集30不相交而與第二子集32重疊;而如果活動(dòng)的操作模式為第二操作模式,則模式相關(guān)集合例如為圖1中42處所示,且與第一及第二子集30及32重疊。
[0028]換句話說(shuō),根據(jù)圖1的實(shí)施例,音頻解碼器10是可以經(jīng)由數(shù)據(jù)流20或外部控制信號(hào)加以控制,因而在第一模式與第二模式間改變其活動(dòng)的操作模式,通過(guò)此改變巾貞編碼模式的操作模式相關(guān)集合,換句話說(shuō),在40與42間改變,使得根據(jù)一個(gè)操作模式,模式相關(guān)集合40與時(shí)域編碼模式集合脫離;而在另一個(gè)操作模式中,模式相關(guān)集合42含有至少一個(gè)時(shí)域編碼模式以及至少一個(gè)頻域編碼模式。
[0029]為了進(jìn)一步以細(xì)節(jié)解釋關(guān)聯(lián)器16的關(guān)聯(lián)性能的依賴性,參考圖2,舉例示出數(shù)據(jù)流20中的一個(gè)片段,該片段包括與圖1的幀18a至18c中的某一個(gè)相關(guān)聯(lián)的幀模式語(yǔ)法元素38。就此點(diǎn)而言,須注意圖1舉例說(shuō)明的數(shù)據(jù)流20的結(jié)構(gòu)僅用于示例說(shuō)明目的,也可應(yīng)用其它結(jié)構(gòu)。舉例而言,雖然圖1的幀18a至18c是示出作為數(shù)據(jù)流20的單純連接或連續(xù)部分,它們之間并無(wú)交插,但也可以應(yīng)用這種交插。此外,雖然圖1提示幀模式語(yǔ)法元素38是包含在所指的幀內(nèi)部,但并非必然如此。相反地,幀模式語(yǔ)法元素38可位于幀18a至18c外部的數(shù)據(jù)流20內(nèi)。此外,包含在數(shù)據(jù)流20內(nèi)的幀模式語(yǔ)法元素38的數(shù)目不是必須等于數(shù)據(jù)流20中的幀18a至18c的數(shù)目。例如圖2的幀模式語(yǔ)法元素38可與數(shù)據(jù)流20中的幀18a至18c中的多于一個(gè)相關(guān)聯(lián)。
[0030]總而言之,取決于幀模式語(yǔ)法元素38已經(jīng)插入數(shù)據(jù)流20內(nèi)的方式,在如數(shù)據(jù)流20所含且經(jīng)由數(shù)據(jù)流20所傳輸?shù)膸J秸Z(yǔ)法元素38與幀模式語(yǔ)法元素38的可能值的集合46間存在映射44。舉例言的,幀模式語(yǔ)法元素38可直接地,即、使用二進(jìn)制表示,比如PCM插入數(shù)據(jù)流20,或使用可變長(zhǎng)度代碼和/或使用熵編碼比如霍夫曼編碼或算術(shù)編碼而插入數(shù)據(jù)流20。如此,關(guān)聯(lián)器16可被配置來(lái)比如通過(guò)解碼48而從數(shù)據(jù)流20中提取幀模式語(yǔ)法元素38,以便導(dǎo)出可能值的任何集合46,其中可能值在圖2中通過(guò)小三角形表示。在編碼器端,相對(duì)應(yīng)地例如通過(guò)編碼50而進(jìn)行插入。
[0031]換句話說(shuō),幀模式語(yǔ)法元素38可能假設(shè)的任何可能值,亦即在幀模式語(yǔ)法元素38的可能值范圍集合46內(nèi)的各個(gè)可能值與多個(gè)幀編碼模式A、B及C中的某一個(gè)相關(guān)聯(lián)。更具體地,一方面的集合46的可能值與另一方面的幀編碼模式的模式相關(guān)集合之間有雙射映射。通過(guò)圖2的雙箭頭52示例說(shuō)明的映射是根據(jù)活動(dòng)的操作模式而改變。雙射映射52是關(guān)聯(lián)器16的功能的一部分,關(guān)聯(lián)器16取決于活動(dòng)的操作模式而改變映射52。如圖1說(shuō)明,在圖2中示例說(shuō)明的第二操作模式的情況下,雖然模式相關(guān)集合40或42與兩個(gè)幀編碼模式子集30及32重疊,但在第一操作模式的情況下,模式相關(guān)集合與子集30不相交,即不包含子集30的任何元素。換言之,雙射映射52將幀模式語(yǔ)法元素38的可能值的域映射至幀編碼模式的共域(co-domain)上,分別稱作為模式相關(guān)集合50及52。如圖1及圖2的示例說(shuō)明,通過(guò)使用針對(duì)集合46的可能值的實(shí)線的三角形,在兩個(gè)操作模式中即第一及第二操作模式中,雙射映射52的域可保持相同,而如前文示例說(shuō)明及描述,雙射映射52的共域改變。
[0032]然而,集合46內(nèi)部的可能值的數(shù)目可能改變。這是以圖2中畫有虛線的三角形表示。更精確而言,第一與第二操作模式之間的可用幀編碼模式的數(shù)目可能不同。然而,如果這樣,在任何情況下仍然實(shí)現(xiàn)關(guān)聯(lián)器16使得雙射映射52的共域表現(xiàn)為如前述,在第一操作模式為活動(dòng)的情況下,模式相關(guān)集合與子集30間沒(méi)有重疊。
[0033]換言之,注意到下述情況。在內(nèi)部,幀模式語(yǔ)法元素38的值可以某個(gè)二進(jìn)制值表示,容納可能值集合46的可能值范圍與當(dāng)前活動(dòng)的操作模式無(wú)關(guān)。為求更精確,關(guān)聯(lián)器16在內(nèi)部以二進(jìn)制表示的二進(jìn)制值來(lái)表示幀模式語(yǔ)法元素38的值。運(yùn)用此二進(jìn)制值,集合46的可能值被排序?yàn)轫樞蛄勘?ordinal scale),使得集合46的可能值即便在操作模式改變的情況下也保持彼此可相比較。根據(jù)這種順序量表,集合46的第一可能值例如可以定義為在集合46的可能值中具有最高概率者,而集合46的可能值中的第二可能值連續(xù)地為具有次低概率者等等。因此,盡管操作模式改變,但幀模式語(yǔ)法元素38的可能值彼此可相比較。后述情況下,盡管第一與第二操作模式之間的活動(dòng)的操作模式改變,雙射映射52的域及共域,即可能值的集合46及幀編碼模式的模式相關(guān)集合保持相同;但雙射映射52改變一方面模式相關(guān)集合的幀編碼模式與另一方面集合46的可相比較的可能值之間的關(guān)聯(lián)。在后述實(shí)施例中,圖1的解碼器10仍可利用根據(jù)后文解釋的實(shí)施例作用的編碼器,換言之,在第一操作模式的情況下,避開(kāi)選擇不合適的時(shí)域編碼模式。通過(guò)在第一操作模式的情況下,將集合46的更高可能的可能值與頻域編碼模式32單獨(dú)地關(guān)聯(lián),而在第一操作模式期間只使用針對(duì)時(shí)域編碼模式30的集合46的較低可能的可能值,但在第二操作模式的情況下改變此種策略,若使用用以將幀模式語(yǔ)法元素38插入數(shù)據(jù)流20/從數(shù)據(jù)流20提取幀模式語(yǔ)法元素38的熵編碼,導(dǎo)致了數(shù)據(jù)流20的較高壓縮率。換言之,在第一操作模式中,時(shí)域編碼模式30中沒(méi)有任何一個(gè)可以與集合46的可能值相關(guān)聯(lián),該可能值的概率高于通過(guò)映射52而映射至頻域編碼模式32中的任一者所映射的可能值的概率,這樣的情況存在于第二操作模式,在第二操作模式中,至少一個(gè)時(shí)域編碼模式30與如下可能值相關(guān)聯(lián),該可能值的概率比根據(jù)映射52而與頻域編碼模式32相關(guān)聯(lián)的另一可能值的概率更高。
[0034]剛才所述與可能值46相關(guān)聯(lián)的且可選地用于編碼/解碼可能值的概率可以是固定的或自適應(yīng)改變的。不同概率估計(jì)集合可用于不同操作模式。在自適應(yīng)改變概率的情況下,可使用上下文自適應(yīng)熵編碼。
[0035]如圖1所示,關(guān)聯(lián)器16的一個(gè)優(yōu)選實(shí)施例為關(guān)聯(lián)的性能的依賴性是取決于活動(dòng)的操作模式,而幀模式語(yǔ)法元素38被編碼成數(shù)據(jù)流20及從數(shù)據(jù)流20解碼,使得集合46內(nèi)的可區(qū)別的可能值數(shù)目與該活動(dòng)的操作模式為第一或第二操作模式無(wú)關(guān)。更具體地,在圖1的情況下,可區(qū)別的可能值的數(shù)目為2,也如圖2示例說(shuō)明,考慮帶有實(shí)線的三角形。在該種情況下,舉例而言,關(guān)聯(lián)器16可被配置來(lái)使得如果活動(dòng)的操作模式為第一操作模式,則模式相關(guān)集合40包括幀編碼模式的第二子集32的第一及第二幀編碼模式A及B,以及負(fù)責(zé)這些幀編碼模式的頻域解碼器14被配置來(lái)使用不同的時(shí)-頻分辨率來(lái)對(duì)與第一及第二幀編碼模式A及B中的一者相關(guān)聯(lián)的幀進(jìn)行解碼。通過(guò)此方式,例如一個(gè)比特將足以直接地傳輸數(shù)據(jù)流20內(nèi)部的幀模式語(yǔ)法元素38,即無(wú)需任何額外的熵編碼,其中當(dāng)從第一操作模式改成第二操作模式時(shí),只有雙射映射52改變,反之亦然。
[0036]如后文中將參考第3及4圖概述的,時(shí)域解碼器12可以是代碼激勵(lì)線性預(yù)測(cè)解碼器,及頻域解碼器可以是變換解碼器,被配置來(lái)基于被編碼成數(shù)據(jù)流20的變換系數(shù)等級(jí)而對(duì)具有與其相關(guān)聯(lián)的幀編碼模式的第二子集中的任一個(gè)的幀進(jìn)行解碼。
[0037]例如參考圖3。圖3示出時(shí)域解碼器12及與時(shí)域編碼模式相關(guān)聯(lián)的幀,使得該幀通過(guò)時(shí)域解碼器12而獲得重建音頻信號(hào)26的對(duì)應(yīng)部分24。根據(jù)圖3的實(shí)施例及根據(jù)后面將描述的圖4的實(shí)施例,時(shí)域解碼器12及頻域解碼器為以線性預(yù)測(cè)為基礎(chǔ)的解碼器,被配置成針對(duì)來(lái)自數(shù)據(jù)流12的各個(gè)幀獲得線性預(yù)測(cè)濾波器系數(shù)。雖然圖3及圖4提示各個(gè)幀18可將線性預(yù)測(cè)濾波器系數(shù)16結(jié)合于其中,但非必需為此種情況。線性預(yù)測(cè)系數(shù)60在數(shù)據(jù)流12內(nèi)部傳輸?shù)腖PC (線性預(yù)測(cè)編碼)傳輸速率可等于幀18的幀速率或可以不同。然而,通過(guò)從LPC傳輸速率內(nèi)插至LPC應(yīng)用速率,編碼器與解碼器可同步操作或應(yīng)用單獨(dú)地與各幀相關(guān)聯(lián)的線性預(yù)測(cè)濾波器系數(shù)。
[0038]如圖3所示,時(shí)域解碼器12可包括線性預(yù)測(cè)合成濾波器62及激勵(lì)信號(hào)構(gòu)建器64。如圖3所示,線性預(yù)測(cè)合成濾波器62被饋送針對(duì)當(dāng)前時(shí)域編碼模式幀18而從數(shù)據(jù)流12獲得的線性預(yù)測(cè)濾波器系數(shù)。激勵(lì)信號(hào)構(gòu)建器64是被饋送針對(duì)當(dāng)前解碼幀18 (具有與其相關(guān)聯(lián)的時(shí)域編碼模式)而從數(shù)據(jù)流12獲得的激勵(lì)參數(shù)或代碼,比如碼簿指數(shù)(CBI) 66。激勵(lì)信號(hào)構(gòu)建器64及線性預(yù)測(cè)合成濾波器62串聯(lián)連接,因而在合成濾波器62的輸出端輸出重建的對(duì)應(yīng)的音頻信號(hào)部分24。更具體地,激勵(lì)信號(hào)構(gòu)建器64被配置來(lái)使用激勵(lì)參數(shù)66而構(gòu)建激勵(lì)信號(hào)68,如圖3指示,該激勵(lì)信號(hào)可以包含在與任何時(shí)域編碼模式相關(guān)聯(lián)的當(dāng)前解碼幀內(nèi)部。激勵(lì)信號(hào)68是一種殘差信號(hào),其頻譜包絡(luò)是通過(guò)線性預(yù)測(cè)合成濾波器62形成。更具體地,線性預(yù)測(cè)合成濾波器是通過(guò)針對(duì)當(dāng)前解碼幀(具有與其相關(guān)聯(lián)的時(shí)域編碼模式)在數(shù)據(jù)流20內(nèi)部傳遞的線性預(yù)測(cè)濾波器系數(shù)來(lái)控制,以便獲得音頻信號(hào)26的重建部分24。
[0039]有關(guān)圖3的CELP解碼器的可能實(shí)現(xiàn)的進(jìn)一步的細(xì)節(jié)參考已知的編解碼器,比如前述USAC[2]或AMR-WB+編解碼器[I]。根據(jù)后述編解碼器,圖3的CELP解碼器可實(shí)現(xiàn)為ACELP解碼器,據(jù)此通過(guò)組合受代碼/參數(shù)控制的信號(hào)即創(chuàng)新激勵(lì),以及連續(xù)更新的自適應(yīng)激勵(lì)而形成激勵(lì)信號(hào)68,該連續(xù)更新的自適應(yīng)激勵(lì)是根據(jù)針對(duì)當(dāng)前已解碼時(shí)域編碼模式幀18也在數(shù)據(jù)流12內(nèi)部傳遞的自適應(yīng)激勵(lì)參數(shù)來(lái)修改針對(duì)恰在之前的時(shí)域編碼模式幀的最終獲得及施加的激勵(lì)信號(hào)而得到。自適應(yīng)激勵(lì)參數(shù)例如可限定音準(zhǔn)延遲及增益,從音準(zhǔn)及增益的意義上規(guī)定如何修改過(guò)去的激勵(lì)以便獲得針對(duì)當(dāng)前幀的自適應(yīng)激勵(lì)。創(chuàng)新激勵(lì)可從當(dāng)前幀內(nèi)部的代碼66推導(dǎo)出,代碼限定多個(gè)脈沖及其在激勵(lì)信號(hào)內(nèi)部的位置。代碼66可用于碼簿查詢,或例如在數(shù)目及位置方面,邏輯上或算術(shù)上限定創(chuàng)新激勵(lì)脈沖。
[0040]同理,圖4示出頻域解碼器14的可能的實(shí)施例。圖4示出進(jìn)入頻域解碼器14的當(dāng)前幀18,幀18具有與其相關(guān)聯(lián)的任何頻域編碼模式。頻域解碼器14包括頻域噪聲整形器70,其輸出連接至重新變換器72。重新變換器72的輸出又轉(zhuǎn)而為頻域解碼器14的輸出,輸出對(duì)應(yīng)于當(dāng)前已經(jīng)解碼的幀18的音頻信號(hào)的重建部分。
[0041]如圖4所示,數(shù)據(jù)流20可傳遞針對(duì)具有與其相關(guān)聯(lián)的任何頻域編碼模式的幀的變換系數(shù)等級(jí)74及線性預(yù)測(cè)濾波器系數(shù)76。雖然線性預(yù)測(cè)濾波器系數(shù)76可具有與任何時(shí)域編碼模式相關(guān)聯(lián)的幀所關(guān)聯(lián)的線性預(yù)測(cè)濾波器系數(shù)的相同結(jié)構(gòu),但變換系數(shù)等級(jí)74是用以表示在變換域中用于頻域幀18的激勵(lì)信號(hào)。如從USAC已知,例如變換系數(shù)等級(jí)74可沿頻譜軸差異地編碼。變換系數(shù)等級(jí)74的量化準(zhǔn)確度可通過(guò)常用比例因子或增益因子來(lái)控制。比例因子可以是數(shù)據(jù)流的一部分及假設(shè)為變換系數(shù)等級(jí)74的一部分。但也可使用任何其它量化方案。變換系數(shù)等級(jí)74被饋送至頻域噪聲整形器70。同理適用于針對(duì)當(dāng)前已解碼頻域幀18的線性預(yù)測(cè)濾波器系數(shù)76。然后頻域噪聲整形器70被配置來(lái)從變換系數(shù)等級(jí)74獲得激勵(lì)信號(hào)的激勵(lì)頻譜,及根據(jù)線性預(yù)測(cè)濾波器系數(shù)76而在頻譜上對(duì)該激勵(lì)頻譜整形。更精確地,頻域噪聲整形器70被配置來(lái)將變換系數(shù)等級(jí)74解量化以便獲得激勵(lì)信號(hào)的頻譜。然后,頻域噪聲整形器70將線性預(yù)測(cè)濾波器系數(shù)76變換成加權(quán)頻譜以便對(duì)應(yīng)于由線性預(yù)測(cè)濾波器系數(shù)76所限定的線性預(yù)測(cè)合成濾波器的轉(zhuǎn)移函數(shù)。這種變換可涉及施加至LPC的ODFT,以便將LPC轉(zhuǎn)成頻譜加權(quán)值。進(jìn)一步細(xì)節(jié)可從USAC標(biāo)準(zhǔn)獲得。運(yùn)用該加權(quán)頻譜,頻域噪聲整形器70對(duì)通過(guò)變換系數(shù)等級(jí)74所獲得的激勵(lì)頻譜進(jìn)行整形或加權(quán),由此獲得激勵(lì)信號(hào)頻譜。通過(guò)整形/加權(quán),在編碼端通過(guò)量化變換系數(shù)所引入的量化噪聲被整形因而感覺(jué)上不明顯。然后重新變換器72將由頻域噪聲整形器70所輸出的已整形的激勵(lì)頻譜進(jìn)行重新變換,以獲得對(duì)應(yīng)于剛解碼幀18的重建部分。
[0042]如前文已述,圖4的頻域解碼器14可支持不同編碼模式。更明確地,頻域解碼器14可被配置來(lái)在對(duì)與不同頻域編碼模式相關(guān)聯(lián)的頻域幀進(jìn)行解碼時(shí)應(yīng)用不同的時(shí)-頻分辨率。例如,通過(guò)重新變換器72執(zhí)行的重新變換可以是重疊變換,據(jù)此連續(xù)的且彼此重疊的待變換信號(hào)的開(kāi)窗部分再細(xì)分成個(gè)別變換,其中重新變換器72獲得這些開(kāi)窗部分78a、78b及78c的重建。如前記,組合器34可通過(guò)例如重疊加法處理而交互補(bǔ)償出現(xiàn)在這些開(kāi)窗部分的重疊部分的混迭。重新變換器72的重疊變換或重疊重新變換例如可以要求時(shí)間混迭抵消的臨界采樣變換/重新變換。舉例而言,重新變換器72可執(zhí)行逆MDCT。總而言之,頻域編碼模式A及B可彼此不同在于對(duì)應(yīng)于當(dāng)前已解碼幀18的部分18是通過(guò)一個(gè)開(kāi)窗部分78覆蓋,也延伸至先前部分及后繼部分,由此獲得幀18內(nèi)部變換系數(shù)等級(jí)74的一個(gè)較大集合,或是延伸至兩個(gè)連續(xù)開(kāi)窗子部分78c及78b,其是交互重疊且延伸入先前部分及后繼部分,及分別地與先前部分及后繼部分重疊,由此獲得幀18內(nèi)部變換系數(shù)等級(jí)74的兩個(gè)較小集合。因此,雖然解碼器及頻域噪聲整形器70及重新變換器72例如可對(duì)模式A的幀執(zhí)行兩項(xiàng)操作,即塑形及重新變換,但例如對(duì)幀編碼模式B的每個(gè)幀,可手動(dòng)執(zhí)行一項(xiàng)操作。
[0043]前述音頻解碼器的實(shí)施例是特別設(shè)計(jì)來(lái)利用音頻編碼器,音頻編碼器是在不同操作模式下進(jìn)行操作的,換言之,以便在這些操作模式間改變幀編碼模式的選擇至下述程度,在這些操作模式中的一個(gè)中不選擇時(shí)域幀編碼模式,而只在另一個(gè)操作模式中選用。但須注意至少只考慮這些實(shí)施例的子集,后述音頻編碼器的實(shí)施例也匹配不支持不同操作模式的音頻解碼器。這一點(diǎn)至少對(duì)于在這些操作模式之間數(shù)據(jù)流的產(chǎn)生不改變的那些編碼器實(shí)施例為真。換言之,根據(jù)后述音頻編碼器的一些實(shí)施例,對(duì)于這些操作模式中的一個(gè)對(duì)頻域編碼模式的幀編碼模式的選擇限制本身并不反映在數(shù)據(jù)流12內(nèi)部,在數(shù)據(jù)流12中操作模式的改變至當(dāng)前為止是透明的(除了這些操作模式中的一個(gè)為活動(dòng)的期間不存在時(shí)域幀編碼模式)。但根據(jù)前述多個(gè)實(shí)施例的特別專用的音頻解碼器連同前述音頻編碼器的個(gè)別實(shí)施例形成音頻編解碼器,如前所述,音頻編解碼器在對(duì)應(yīng)于例如特殊傳輸況的特殊操作模式期間額外利用幀編碼模式選擇限制。
[0044]圖5示出根據(jù)本發(fā)明的實(shí)施例的音頻編碼器。圖5的音頻編碼器一般地表示為100,并且包括關(guān)聯(lián)器102、時(shí)域編碼器104及頻域編碼器106,關(guān)聯(lián)器102是連接在一方面音頻編碼器100的輸入108與另一方面時(shí)域編碼器104及頻域編碼器106的輸入之間。時(shí)域編碼器104及頻域編碼器106的輸出連接至音頻編碼器100的輸出110。因此,圖5中在112指示的待編碼的音頻信號(hào)輸入輸入端108,及音頻編碼器100被配置來(lái)從其中形成數(shù)據(jù)流 114。
[0045]關(guān)聯(lián)器102是被配置來(lái)將對(duì)應(yīng)于前述音頻信號(hào)112的部分24的連續(xù)部分116a至116c中的每個(gè)與多個(gè)幀編碼模式的模式相關(guān)集合中的一個(gè)相關(guān)聯(lián)(參考圖1至4的40及42)。
[0046]時(shí)域編碼器104被配置成將與多個(gè)22幀編碼模式中的一個(gè)或多個(gè)所組成的第一子集30中的一個(gè)相關(guān)聯(lián)的部分116a至116c編碼成數(shù)據(jù)流114的對(duì)應(yīng)的幀118a至118c。頻域編碼器106同樣地負(fù)責(zé)將與集合32的任何頻域編碼模式相關(guān)聯(lián)的部分編碼成數(shù)據(jù)流114的對(duì)應(yīng)的幀118a至118c。
[0047]關(guān)聯(lián)器102被配置來(lái)在多個(gè)操作模式中的活動(dòng)模式中進(jìn)行操作。更精確地,關(guān)聯(lián)器102被配置使得多個(gè)操作模式中的確切一個(gè)為活動(dòng)的,但在音頻信號(hào)112的順序編碼部分116a至116c期間多個(gè)操作模式中的活動(dòng)模式的選擇可改變。
[0048]更具體地,關(guān)聯(lián)器102被配置使得如果活動(dòng)的操作模式為第一操作模式,則模式相關(guān)集合的表現(xiàn)為類似圖1的集合40,即集合40與第一子集30不相交及與第二子集32重疊;但如果活動(dòng)的操作模式為第二操作模式,則多個(gè)編碼模式的模式相關(guān)集合的表現(xiàn)為類似圖1的模式42,即模式42與第一及第二子集30及32重疊。
[0049]如前文所述,圖5的音頻編碼器的功能允許外部控制編碼器100,因而防止編碼器100不利地選擇任何時(shí)域幀編碼模式,雖然外部狀況比如傳輸狀況為如下,比起只限制選擇頻域幀編碼模式,初步選擇任何時(shí)域幀編碼模式極其可能在速率/失真比方面獲得較低編碼效率。如圖5所示,關(guān)聯(lián)器102例如可被配置來(lái)接收外部控制信號(hào)120。關(guān)聯(lián)器102例如可連接至某個(gè)外部實(shí)體,使得由該外部實(shí)體所提供的外部控制信號(hào)120指示用于數(shù)據(jù)流114傳輸?shù)目捎脗鬏攷?。該外部?shí)體例如可以是下方較低傳輸層的一部分,比如就OSI層模型而言為較低層。舉例言之,外部實(shí)體可以是LTE通信網(wǎng)路的一部分。信號(hào)122當(dāng)然可基于實(shí)際可用傳輸帶寬的估值或平均未來(lái)可用傳輸帶寬的估值提供。如前文就圖1至4已述,“第一操作模式”可與低于某個(gè)閾值的可用傳輸帶寬相關(guān)聯(lián),而“第二操作模式”可與超過(guò)預(yù)定閾值的可用傳輸帶寬相關(guān)聯(lián),由此防止編碼器100在不適當(dāng)狀況下選用任何時(shí)域幀編碼模式,在不適當(dāng)狀況下時(shí)域編碼極其可能獲得更加無(wú)效的壓縮,換言之,可用傳輸帶寬低于某個(gè)閾值。
[0050]但須注意控制信號(hào)120也可以由某個(gè)其它實(shí)體提供,比如語(yǔ)音檢測(cè)器,該語(yǔ)音檢測(cè)器分析待重建的音頻信號(hào),即112,以便區(qū)別語(yǔ)音語(yǔ)句(即音頻信號(hào)112內(nèi)的語(yǔ)音分量占主導(dǎo)的期間的時(shí)間間隔)與非語(yǔ)音語(yǔ)句(其中音頻信號(hào)112內(nèi)的其它音頻源比如音樂(lè)等占主導(dǎo))。控制信號(hào)120可指示語(yǔ)音語(yǔ)句和非語(yǔ)音語(yǔ)句中的這種變化,并且關(guān)聯(lián)器102可被配置成因此而在操作模式間改變。例如,在語(yǔ)音語(yǔ)句中關(guān)聯(lián)器102可以輸入前述“第二操作模式”,而“第一操作模式”可以與非語(yǔ)音語(yǔ)句相關(guān)聯(lián),由此遵守下述事實(shí),在非語(yǔ)音語(yǔ)句期間選擇時(shí)域幀編碼模式極其可能導(dǎo)致較為無(wú)效的壓縮。
[0051]雖然關(guān)聯(lián)器102可被配置成將幀模式語(yǔ)法元素122 (與圖1的語(yǔ)法元素38作比較)編碼成數(shù)據(jù)流114,以便針對(duì)各部分116a至116c指示相應(yīng)的部分與多個(gè)幀編碼模式中的哪個(gè)幀編碼模式相關(guān)聯(lián),但該幀模式語(yǔ)法元素122插入數(shù)據(jù)流114可能不取決于操作模式以獲得具有圖1至4的幀模式語(yǔ)法元素38的數(shù)據(jù)流20。如前文已述,數(shù)據(jù)流114的數(shù)據(jù)流的產(chǎn)生可與當(dāng)前活動(dòng)的操作模式無(wú)關(guān)地執(zhí)行。[0052]但就比特率額外開(kāi)銷而言,優(yōu)選地?cái)?shù)據(jù)流114是通過(guò)圖5的音頻編碼器100產(chǎn)生,以便獲得前文關(guān)于圖1至4的實(shí)施例所討論的數(shù)據(jù)流20,據(jù)此數(shù)據(jù)流的產(chǎn)生有利地適應(yīng)于當(dāng)前活動(dòng)的操作模式。
[0053]因此,根據(jù)圖5的音頻編碼器100的實(shí)施例,匹配前文關(guān)于圖1至4的音頻解碼器討論的實(shí)施例,關(guān)聯(lián)器102可被配置成使用在一方面與相應(yīng)的部分116a至116c相關(guān)聯(lián)的幀模式語(yǔ)法元素122的可能值的集合46與另一方面幀編碼模式的模式相關(guān)集合之間的雙射映射52來(lái)將幀模式語(yǔ)法元素122編碼成數(shù)據(jù)流114,該雙射映射52取決于活動(dòng)的操作模式而改變。更具體地,改變可以是使得如果活動(dòng)的操作模式為第一操作模式,則模式相關(guān)集合的表現(xiàn)類似集合40,即該集合與第一子集30不相交而與第二子集32重疊;但如果活動(dòng)的操作模式為第二操作模式,則模式相關(guān)集合的表現(xiàn)類似集合42,即該集合與第一及第二子集30和32重疊。更具體地,如前文已述,集合46內(nèi)的可能值的數(shù)目可以是2,而與活動(dòng)的操作模式為第一或第二操作模式獨(dú)立無(wú)關(guān);及關(guān)聯(lián)器102可被配置成使得如果活動(dòng)的操作模式為第一操作模式,則模式相關(guān)集合包括頻域幀編碼模式A及B ;及頻域編碼器106可被配置成根據(jù)其幀編碼模式為模式A或模式B而使用不同時(shí)-頻分辨率來(lái)編碼相應(yīng)的部分116a 至 116c。
[0054]圖6示出對(duì)應(yīng)于前述事實(shí)的時(shí)域編碼器104及頻域編碼器106的可能實(shí)現(xiàn)的實(shí)施例,據(jù)此代碼激勵(lì)線性預(yù)測(cè)編碼可用于時(shí)域幀編碼模式,而變換編碼激勵(lì)線性預(yù)測(cè)編碼是用于頻域編碼模式。據(jù)此,根據(jù)圖6,時(shí)域編碼器104為代碼激勵(lì)線性預(yù)測(cè)編碼器,及頻域編碼器106為變換編碼器,變換編碼器被配置成使用變換系數(shù)等級(jí)來(lái)編碼與頻域編碼模式相關(guān)聯(lián)的部分,及將該部分編碼成數(shù)據(jù)流114的對(duì)應(yīng)幀118a至118c。
[0055]為了說(shuō)明時(shí)域編碼器104及頻域編碼器106的可能實(shí)現(xiàn),參考圖6。根據(jù)圖6,頻域編碼器106及時(shí)域編碼器104共同擁有或共享LPC分析器130。但須注意這種環(huán)境對(duì)本實(shí)施例而言并不重要,也可使用不同的實(shí)現(xiàn),據(jù)此兩個(gè)編碼器104及106彼此完全分開(kāi)。此夕卜,有關(guān)前文就圖1和4所述的編碼器實(shí)施例及解碼器實(shí)施例,須注意本發(fā)明并非限于下述情況,其中兩種編碼模式即頻域幀編碼模式及時(shí)域幀編碼模式為基于線性預(yù)測(cè)。然而,編碼器與解碼器實(shí)施例也可轉(zhuǎn)移為另一種情況,其中時(shí)域編碼及頻域編碼中的任一個(gè)是以不同方式來(lái)實(shí)現(xiàn)。
[0056]回頭參考圖6的說(shuō)明,除了 LPC分析器130之外,圖6的頻域編碼器106包括變換器132、LPC至頻域加權(quán)轉(zhuǎn)換器134、頻域噪聲整形器136、及量化器138。變換器132、頻域噪聲整形器136及量化器138是串聯(lián)連接在頻域編碼器106的公共輸入140與輸出142之間。LPC轉(zhuǎn)換器134連接在LPC分析器130的輸出與頻域噪聲整形器136的加權(quán)輸入之間。LPC分析器130的輸入連接至公共輸入140。
[0057]就時(shí)域編碼器104而言,除了 LPC分析器130之外,包括LP分析濾波器144及基于代碼的激勵(lì)信號(hào)逼近器146,二者串聯(lián)連接在公共輸入140與時(shí)域編碼器104的輸出148之間。LP分析濾波器144的線性預(yù)測(cè)系數(shù)輸入連接至LPC分析器130的輸出。
[0058]在對(duì)在輸入端140輸入的音頻信號(hào)112進(jìn)行編碼中,LPC分析器130針對(duì)音頻信號(hào)112的各部分116a至116c連續(xù)地確定線性預(yù)測(cè)系數(shù)。LPC確定可能涉及音頻信號(hào)的連續(xù)開(kāi)窗部分(重疊或不重疊)的自相關(guān)性確定,比如使用(韋)李杜((Wiener-)Levison-Durbin)算法或蕭爾(Schur)算法或其它而對(duì)所產(chǎn)生的自相關(guān)性執(zhí)行LPC估算(可選性地伴以先前使自相關(guān)性接受Lag開(kāi)窗)。
[0059]如關(guān)于圖3和4所述,LPC分析器130并非必需以等于幀118a至118c的幀速率的LPC傳輸速率來(lái)傳輸數(shù)據(jù)流114內(nèi)的線性預(yù)測(cè)系數(shù)。也可使用甚至高于該速率的速率。一般地,LPC分析器130可以由前述自相關(guān)率所限定的LPC確定速率來(lái)確定LPC信息60及76,例如基于該自相關(guān)率而確定LPC的確定速率。然后,LPC分析器130可以可能低于LPC確定速率的LPC傳輸速率將LPC信息60及76插入數(shù)據(jù)流。時(shí)域(TD)及頻域(FD)編碼器104及106又可通過(guò)內(nèi)插數(shù)據(jù)流114的幀118a至118c內(nèi)所傳輸?shù)腖PC信息60及76來(lái)施加線性預(yù)測(cè)系數(shù),以高于LPC傳輸速率的LPC應(yīng)用速率而更新該系數(shù)。更具體地,由于頻域編碼器106及頻域解碼器每次變換應(yīng)用一次LPC系數(shù),所以頻域幀內(nèi)的LPC應(yīng)用速率可低于通過(guò)從LPC傳輸速率內(nèi)插而調(diào)整/更新時(shí)域編碼器/解碼器中應(yīng)用的LPC系數(shù)的速率。由于在解碼端也同步地執(zhí)行內(nèi)插,故相同線性預(yù)測(cè)系數(shù)可用于一方面時(shí)域及頻域編碼器,另一方面可用于時(shí)域及頻域解碼器??偠灾?,LPC分析器130在等于或高于幀速率的某個(gè)LPC確定速率而確定針對(duì)音頻信號(hào)112的線性預(yù)測(cè)系數(shù),及以可等于或低于LPC確定速率的LPC傳輸速率將LPC確定速率插入數(shù)據(jù)流。但LP分析濾波器144可以內(nèi)插,以便以高于LPC傳輸速率的LPC應(yīng)用速率來(lái)更新LP分析濾波器。LPC轉(zhuǎn)換器134可以執(zhí)行內(nèi)插或不執(zhí)行內(nèi)插,以便針對(duì)各次變換或各次LPC至頻譜加權(quán)轉(zhuǎn)換需要而確定LPC系數(shù)。為了傳輸LPC系數(shù),可使LPC系數(shù)在合適的域比如在LSF/LSP域中接受量化。
[0060]時(shí)域編碼器104可操作如下。LP分析濾波器可取決于由LPC分析器130所輸出的線性預(yù)測(cè)系數(shù)而過(guò)濾音頻信號(hào)112的時(shí)域編碼模式部分。在LP分析濾波器144的輸出,這樣得到激勵(lì)信號(hào)150。激勵(lì)信號(hào)是通過(guò)逼近器146來(lái)逼近。更具體地,逼近器146設(shè)定代碼比如碼簿指數(shù)或其它參數(shù)來(lái)估計(jì)激勵(lì)信號(hào)150,比如通過(guò)最小化或最大化一方面由激勵(lì)信號(hào)150的偏差所限定的一些最佳化度量,另一方面在合成域即在根據(jù)LPC將相應(yīng)的合成濾波器施加至相應(yīng)的激勵(lì)信號(hào)后通過(guò)碼簿指數(shù)限定的合成產(chǎn)生的激勵(lì)信號(hào)。最佳化度量可以可選地在感覺(jué)上更相關(guān)的頻帶上感覺(jué)上強(qiáng)調(diào)偏差。通過(guò)逼近器146由代碼集合確定的創(chuàng)新激勵(lì)可稱作創(chuàng)新參數(shù)。
[0061]這樣,逼近器146可以每個(gè)時(shí)域幀編碼模式部分輸出一個(gè)或多個(gè)創(chuàng)新參數(shù),以便經(jīng)由例如幀模式語(yǔ)法元素122插入對(duì)應(yīng)的幀,該對(duì)應(yīng)的幀與時(shí)域編碼模式相關(guān)聯(lián)。頻域編碼器106又可如下操作。變換器132使用例如重疊變換來(lái)變換音頻信號(hào)112的頻域部分,以獲得每個(gè)部分的一個(gè)或多個(gè)頻譜。在變換器132輸出端所得的光譜圖輸入頻域噪聲整形器136,該整形器136根據(jù)LPC對(duì)表示光譜圖的頻譜序列進(jìn)行整形。為此,LPC轉(zhuǎn)換器134將LPC分析器130的線性預(yù)測(cè)系數(shù)轉(zhuǎn)換成頻域加權(quán)值,以便在頻譜上加權(quán)該頻譜。這時(shí),執(zhí)行頻譜加權(quán)從而獲得LP分析濾波器的轉(zhuǎn)移函數(shù)結(jié)果。換言之,ODFT例如可用來(lái)將LPC系數(shù)轉(zhuǎn)換成頻譜權(quán)值,然后由變換器132輸出的頻譜可除以頻譜權(quán)值,而乘法是用在解碼器端。
[0062]此后,量化器138將由頻域噪聲整形器136所輸出的結(jié)果所得激勵(lì)頻譜量化成為變換系數(shù)等級(jí)60用來(lái)插入數(shù)據(jù)流114的對(duì)應(yīng)幀。
[0063]根據(jù)前述實(shí)施例,當(dāng)通過(guò)修改USAC編碼器來(lái)以不同操作模式進(jìn)行操作而修改在本申請(qǐng)說(shuō)明書(shū)的序言部分所討論的USAC編解碼器時(shí)可以得出本發(fā)明的實(shí)施例,因而避免在在某個(gè)操作模式的情況下選擇ACELP模式。為了使得實(shí)現(xiàn)較低的延遲,USAC編解碼器可以進(jìn)一步以下述方式修改:例如,與操作模式無(wú)關(guān),可以只使用TCX及ACELP幀編碼模式。為了實(shí)現(xiàn)較低延遲,可以減小幀長(zhǎng)度來(lái)達(dá)到20毫秒的幀。更具體地,根據(jù)前述實(shí)施例為了更有效地呈現(xiàn)USAC編解碼器,可以修改USAC的操作模式即窄帶(NB)、寬帶(WB)、及超寬帶(SWB),使得根據(jù)下面說(shuō)明的表,在各個(gè)操作模式內(nèi)只有總體可用幀編碼模式的適當(dāng)?shù)淖蛹?br> 可用:
【權(quán)利要求】
1.一種音頻解碼器,包括: 時(shí)域解碼器(12); 頻域解碼器(14); 關(guān)聯(lián)器(16),被配置成將數(shù)據(jù)流(20)的連續(xù)的幀(18a-C)中的每個(gè)與多個(gè)(22)幀編碼模式的模式相關(guān)集合中的一個(gè)相關(guān)聯(lián),所述幀中的每個(gè)代表音頻信號(hào)的連續(xù)部分(24a-24c)中對(duì)應(yīng)的一個(gè), 其中所述時(shí)域解碼器(12)被配置成對(duì)與所述多個(gè)(22)幀編碼模式中的一個(gè)或多個(gè)的第一子集(30)中的一個(gè)相關(guān)聯(lián)的幀進(jìn)行解碼,而所述頻域解碼器(14)被配置成對(duì)與所述多個(gè)(22)幀編碼模式中的一個(gè)或多個(gè)的第二子集(32)中的一個(gè)相關(guān)聯(lián)的幀進(jìn)行解碼,所述第一子集和所述第二子集彼此不相交; 其中所述關(guān)聯(lián)器(16)被配置成執(zhí)行取決于與所述數(shù)據(jù)流(20)中的所述幀(18a-C)相關(guān)聯(lián)的幀模式語(yǔ)法元素(38)的關(guān)聯(lián),以及通過(guò)根據(jù)所述數(shù)據(jù)流和/或外部控制信號(hào)從所述多個(gè)操作模式中選出所述活動(dòng)的操作模式而在多個(gè)操作模式中的活動(dòng)的操作模式中進(jìn)行操作,并且改變?nèi)Q于所述活動(dòng)的操作模式而改變所述關(guān)聯(lián)的性能的依賴性。
2.根據(jù)權(quán)利要求1所述的音頻解碼器,其中所述關(guān)聯(lián)器(16)被配置成使得如果所述活動(dòng)的操作模式為第一操作模式,則所述多個(gè)幀編碼模式的所述模式相關(guān)集合(40)與所述第一子集(30)不相交而與所述第二子集(32)重疊,以及 如果所述活動(dòng)的操作模式為第二操作模式,則所述多個(gè)幀編碼模式的所述模式相關(guān)集合(42)與所述第一子集(30)及所述第二子集(32)重疊。
3.根據(jù)權(quán)利要·求1或2所述的音頻解碼器,其中所述幀模式語(yǔ)法元素被編碼成所述數(shù)據(jù)流(20),使得對(duì)于與各個(gè)幀有關(guān)的所述幀模式語(yǔ)法元素(38)的可區(qū)分的可能值的數(shù)目與所述活動(dòng)的操作模式為所述第一操作模式或所述第二操作模式無(wú)關(guān)。
4.根據(jù)權(quán)利要求3所述的音頻解碼器,其中所述可區(qū)分的可能值的數(shù)目為2,并且所述關(guān)聯(lián)器(16)被配置成使得如果所述活動(dòng)的操作模式為所述第一操作模式,則所述模式相關(guān)集合(40)包括一個(gè)或多個(gè)幀編碼模式的所述第二子集(32)的第一和第二幀編碼模式,并且所述頻域解碼器(14)被配置成在對(duì)與所述第一幀編碼模式和所述第二幀編碼模式相關(guān)聯(lián)的幀進(jìn)行解碼時(shí)使用不同的時(shí)頻分辨率。
5.根據(jù)前述權(quán)利要求中任意一項(xiàng)所述的音頻解碼器,其中所述時(shí)域解碼器是代碼激勵(lì)線性預(yù)測(cè)解碼器。
6.根據(jù)前述權(quán)利要求中任意一項(xiàng)所述的音頻解碼器,其中所述頻域解碼器是變換解碼器,所述變換解碼器被配置成基于編碼于其中的變換系數(shù)等級(jí)而對(duì)與所述幀編碼模式中的一個(gè)或多個(gè)的所述第二子集(32)中的一個(gè)相關(guān)聯(lián)的幀進(jìn)行解碼。
7.根據(jù)前述權(quán)利要求中任意一項(xiàng)所述的音頻解碼器,其中所述時(shí)域解碼器(12)及所述頻域解碼器是基于線性預(yù)測(cè)的解碼器,其被配置成針對(duì)來(lái)自所述數(shù)據(jù)流的每個(gè)幀獲得線性預(yù)測(cè)濾波器系數(shù),其中所述時(shí)域解碼器(12)被配置成通過(guò)針對(duì)與所述多個(gè)幀編碼模式中的一個(gè)或多個(gè)的所述第一子集中的一個(gè)相關(guān)聯(lián)的所述幀將取決于所述LPC濾波器系數(shù)的LP合成濾波器施加至與所述多個(gè)幀編碼模式中的一個(gè)或多個(gè)的所述第一子集中的一個(gè)相關(guān)聯(lián)的所述幀中的使用碼簿指數(shù)構(gòu)建的激勵(lì)信號(hào),而重建與所述幀編碼模式中的一個(gè)或多個(gè)的所述第一子集中的一個(gè)相關(guān)聯(lián)的所述幀所對(duì)應(yīng)的所述音頻信號(hào)(26)的所述部分,并且所述頻域解碼器(14)被配置成通過(guò)針對(duì)與所述第二子集中的一個(gè)相關(guān)聯(lián)的所述幀根據(jù)所述LPC濾波器系數(shù)對(duì)與所述第二子集中的一個(gè)相關(guān)聯(lián)的所述幀中由變換系數(shù)等級(jí)所限定的激勵(lì)頻譜進(jìn)行整形,并且對(duì)整形后的激勵(lì)頻譜進(jìn)行重新變換來(lái)重建與所述幀編碼模式中的一個(gè)或多個(gè)的所述第二子集中的一個(gè)相關(guān)聯(lián)的所述幀所對(duì)應(yīng)的所述音頻信號(hào)的部分。
8.一種音頻編碼器,包括: 時(shí)域編碼器(104); 頻域編碼器(106);及 關(guān)聯(lián)器(102),被配置成將音頻信號(hào)(112)的連續(xù)的部分(116a-c)中的每一個(gè)與多個(gè)(22)幀編碼模式的模式相關(guān)集合中的一個(gè)相關(guān)聯(lián), 其中所述時(shí)域編碼器(104)被配置成將與所述多個(gè)(22)幀編碼模式中的一個(gè)或多個(gè)的第一子集中的一個(gè)相關(guān)聯(lián)的部分編碼成數(shù)據(jù)流(114)的對(duì)應(yīng)幀(118a-c),并且其中所述頻域編碼器(106 )被配置成將與所述多個(gè)編碼模式中的一個(gè)或多個(gè)的第二子集中的一個(gè)相關(guān)聯(lián)的部分編碼成所述數(shù)據(jù)流的對(duì)應(yīng)幀, 其中所述關(guān)聯(lián)器(102)被配置成在多個(gè)操作模式中的活動(dòng)的模式中進(jìn)行操作,使得如果所述活動(dòng)的操作模式為第一操作模式,則所述多個(gè)幀編碼模式的所述模式相關(guān)集合(40)與所述第一子集(30)不相交而與所述第二子集(32)重疊,以及如果所述活動(dòng)的操作模式為第二操作模式,則 所述多個(gè)編碼模式的所述模式相關(guān)集合與所述第一子集(30)及所述第二子集(32)重疊。
9.根據(jù)權(quán)利要求8所述的音頻編碼器,其中所述關(guān)聯(lián)器(102)被配置成將幀模式語(yǔ)法元素(122)編碼成所述數(shù)據(jù)流(114),以便針對(duì)每個(gè)部分指示各個(gè)部分與所述多個(gè)幀編碼模式中的哪個(gè)幀編碼模式相關(guān)聯(lián)。
10.根據(jù)權(quán)利要求9所述的音頻編碼器,其中所述關(guān)聯(lián)器(102)被配置成使用一方面與各個(gè)部分相關(guān)聯(lián)的所述幀模式語(yǔ)法元素的可能值的集合與另一方面所述幀編碼模式的所述模式相關(guān)集合之間的雙射映射而將所述幀模式語(yǔ)法元素(122)編碼成所述數(shù)據(jù)流(114),所述雙射映射(52)取決于所述活動(dòng)的操作模式而改變。
11.根據(jù)權(quán)利要求9所述的音頻編碼器,其中所述關(guān)聯(lián)器(102)被配置成使得如果所述活動(dòng)的操作模式為所述第一操作模式,則所述多個(gè)幀編碼模式的所述模式相關(guān)集合與所述第一子集(30)不相交而與所述第二子集(32)重疊,以及 如果所述活動(dòng)的操作模式為第二操作模式,則所述多個(gè)幀編碼模式的所述模式相關(guān)集合與所述第一子集及所述第二子集重疊。
12.根據(jù)權(quán)利要求11所述的音頻解碼器,其中在所述可能值的集合中的可能值的數(shù)目是2,并且所述關(guān)聯(lián)器(102)被配置成使得如果所述活動(dòng)的操作模式為所述第一操作模式,則所述模式相關(guān)集合包括一個(gè)或多個(gè)幀編碼模式的所述第二子集的第一和第二幀編碼模式,并且所述頻域編碼器被配置在對(duì)與所述第一幀編碼模式和所述第二幀編碼模式相關(guān)聯(lián)的幀進(jìn)行解碼時(shí)使用不同的時(shí)頻分辨率。
13.根據(jù)權(quán)利要求8至12中任意一項(xiàng)所述的音頻編碼器,其中所述時(shí)域編碼器是代碼激勵(lì)線性預(yù)測(cè)編碼器。
14.根據(jù)權(quán)利要求8至13中任意一項(xiàng)所述的音頻編碼器,其中所述頻域編碼器是變換編碼器,所述變換解碼器被配置成使用變換系數(shù)等級(jí)將與所述幀編碼模式中的一個(gè)或多個(gè)的所述第二子集中的一個(gè)相關(guān)聯(lián)的部分進(jìn)行編碼,并且將所述部分編碼成所述數(shù)據(jù)流的對(duì)應(yīng)的幀。
15.根據(jù)權(quán)利要求8至14中任意一項(xiàng)所述的音頻編碼器,其中所述時(shí)域解碼器及所述頻域解碼器是基于線性預(yù)測(cè)的編碼器,其被配置成針對(duì)所述音頻信號(hào)(112)的各部分傳送LPC濾波器系數(shù),其中所述時(shí)域編碼器(104)被配置成將取決于所述LPC濾波器系數(shù)的LP分析濾波器施加至與所述幀編碼模式中的一個(gè)或多個(gè)的所述第一子集中的一個(gè)相關(guān)聯(lián)的所述音頻信號(hào)(112)的所述部分以獲得激勵(lì)信號(hào)(150),并且通過(guò)使用碼簿指數(shù)來(lái)近似所述激勵(lì)信號(hào)及將其插入所述對(duì)應(yīng)的幀;其中所述頻域編碼器(106)被配置成對(duì)與所述幀編碼模式中的一個(gè)或多個(gè)的所述第二子集中的一個(gè)相關(guān)聯(lián)的所述音頻信號(hào)的部分進(jìn)行變換以獲得頻譜,及針對(duì)與所述第二子集中的一個(gè)相關(guān)聯(lián)的部分根據(jù)所述LPC濾波器系數(shù)對(duì)所述頻譜進(jìn)行整形,以獲得激勵(lì)頻譜,將所述激勵(lì)頻譜量化為與所述第二子集中的一個(gè)相關(guān)聯(lián)的所述幀中的變換系數(shù)等級(jí),并將所述量化激勵(lì)頻譜插入所述對(duì)應(yīng)的幀內(nèi)。
16.一種使用時(shí)域解碼器(12)和頻域解碼器(14)的音頻解碼方法,所述方法包括: 將數(shù)據(jù)流(20)的連續(xù)幀(18a-c)中的每個(gè)與多個(gè)(22)幀編碼模式的模式相關(guān)集合中的一個(gè)相關(guān)聯(lián),所述幀中的每個(gè)代表音頻信號(hào)的連續(xù)部分(24a-24c)中對(duì)應(yīng)的一個(gè), 通過(guò)所述時(shí)域解碼器(12)對(duì)與所述多個(gè)(22)幀編碼模式中的一個(gè)或多個(gè)的第一子集(30)中的一個(gè)相關(guān)聯(lián)的幀(18a-C)進(jìn)行解碼, 通過(guò)所述頻域解碼器(14)對(duì)與所述多個(gè)(22)幀編碼模式中的一個(gè)或多個(gè)的第二子集(32)中的一個(gè)相關(guān)聯(lián)的幀(18a-C)進(jìn)行解碼,所述第一子集和所述第二子集彼此不相交;其中所述關(guān)聯(lián)取決于與所述數(shù)據(jù)流(20)中的所述幀(18a-C)相關(guān)聯(lián)的幀模式語(yǔ)法元素(38), 并且其中所述關(guān)聯(lián)是通過(guò)根據(jù)所述數(shù)據(jù)流和/或外部控制信號(hào)從所述多個(gè)操作模式中選出所述活動(dòng)的操作模式而在多個(gè)操作模式中的活動(dòng)的操作模式中執(zhí)行,使得所述關(guān)聯(lián)的性能的依賴性取決于所述活動(dòng)的操作模式而改變。
17.一種使用時(shí)域編碼器(104)及頻域編碼器(106)的音頻編碼方法,所述方法包括: 將音頻信號(hào)(112)的連續(xù)部分(116a-c)中的每個(gè)與多個(gè)(22)幀編碼模式的模式相關(guān)集合中的一個(gè)相關(guān)聯(lián), 通過(guò)所述時(shí)域編碼器(104)對(duì)與所述多個(gè)(22)幀編碼模式中的一個(gè)或多個(gè)的第一子集中(30)的一個(gè)相關(guān)聯(lián)的部分編碼成數(shù)據(jù)流(114)的對(duì)應(yīng)的幀(118a-c), 通過(guò)所述頻域編碼器(106)對(duì)與所述多個(gè)編碼模式中的一個(gè)或多個(gè)第二子集(32)中的一個(gè)相關(guān)聯(lián)的部分編碼成所述數(shù)據(jù)流的對(duì)應(yīng)的幀, 其中所述關(guān)聯(lián)在多個(gè)操作模式中的活動(dòng)的模式中執(zhí)行,使得如果所述活動(dòng)的操作模式為第一操作模式,則所述多個(gè)幀編碼模式的所述模式相關(guān)集合與所述第一子集(30)不相交而與所述第二子集(32)重疊,以及如果所述活動(dòng)的操作模式為第二操作模式,則所述多個(gè)編碼模式的所述模式相關(guān)集合與所述第一子集和所述第二子集重疊。
18.一種具有程序代碼的計(jì)算機(jī)程序,當(dāng)所述計(jì)算機(jī)程序在計(jì)算機(jī)上運(yùn)行時(shí),所述程序代碼用于執(zhí)行根據(jù)權(quán)利要求16或17所述的方法。
【文檔編號(hào)】G10L19/012GK103548078SQ201280018224
【公開(kāi)日】2014年1月29日 申請(qǐng)日期:2012年2月14日 優(yōu)先權(quán)日:2011年2月14日
【發(fā)明者】拉爾夫·熱日爾, 康斯坦丁·施密特, 伯恩哈德·格里爾, 曼弗雷德·盧茨基, 米夏埃爾·維爾納, 馬克·蓋爾, 約翰內(nèi)斯·希爾珀特, 瑪麗亞·路易斯瓦萊羅, 沃爾夫?qū)ひ袼? 申請(qǐng)人:弗蘭霍菲爾運(yùn)輸應(yīng)用研究公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
喀喇| 正蓝旗| 榆林市| 英吉沙县| 富裕县| 漳浦县| 泰顺县| 泾源县| 齐河县| 微博| 沅江市| 永和县| 山东省| 江口县| 剑川县| 新源县| 澄江县| 四会市| 竹溪县| 阿拉善右旗| 金山区| 怀来县| 平利县| 无棣县| 东乡族自治县| 江源县| 微博| 方正县| 金坛市| 安泽县| 兴安盟| 玉树县| 尼勒克县| 乡宁县| 彝良县| 始兴县| 壶关县| 新宾| 杭州市| 聊城市| 屏山县|