專利名稱:用于高頻帶寬擴展的對信號進(jìn)行編碼和解碼的設(shè)備和方法
技術(shù)領(lǐng)域:
以下描述的一個或多個實施例涉及一種對音頻信號(諸如語音信號或音樂信號)進(jìn)行編碼或解碼的方法和設(shè)備,更具體地,涉及一種對音頻信號中與高頻域?qū)?yīng)的信號進(jìn)行編碼和解碼的方法和設(shè)備。
背景技術(shù):
與對應(yīng)于低頻域的信號相比,對應(yīng)于高頻域的信號對于頻域的精細(xì)結(jié)構(gòu)較不敏感。因此,需要提高編碼效率來克服在對音頻信號編碼時可用的比特的限制。因此,大量的比特可被分配給對應(yīng)于低頻域的信號,而較少數(shù)量的比特可被分配給對應(yīng)于高頻域的信號。這樣的方案可應(yīng)用于頻帶復(fù)制(SBR)技術(shù)?;谌祟惖穆犛X對于高頻帶信號具有相對較低分辨力的事實,SBR技術(shù)可用于通過將高頻帶分量信號表示為包絡(luò),并在高頻帶分量信號的解碼期間合成高頻帶分量信號來提高編碼效率。在SBR技術(shù)中,需要一種改進(jìn)的用于擴展高頻域的帶寬的方法。
發(fā)明內(nèi)容
通過提供一種編碼設(shè)備來實現(xiàn)以上和/或其它方面,所述編碼設(shè)備包括:下采樣單元,對時域輸入信號進(jìn)行下采樣;核心編碼單元,對下采樣的時域輸入信號進(jìn)行核心編碼;頻率變換單元,將核心編碼的時域輸入信號變換為頻域輸入信號;擴展編碼單元,使用頻域輸入信號的基礎(chǔ)信號執(zhí)行帶寬擴展編碼。擴展編碼單元可包括:基礎(chǔ)信號產(chǎn)生器,使用頻域輸入信號的頻譜來產(chǎn)生頻域輸入信號的基礎(chǔ)信號;因子估算器,使用基礎(chǔ)信號來估算能量控制因子;能量提取器,從頻域輸入信號提取能量;能量控制器,使用能量控制因子控制提取的能量;能量量化器,對受控的能量進(jìn)行量化。基礎(chǔ)信號產(chǎn)生器可包括:人工信號產(chǎn)生器,通過復(fù)制和折疊頻域輸入信號的低頻部分來產(chǎn)生與高頻部分對應(yīng)的人工信號;包絡(luò)估算器,使用窗口估算人工信號的包絡(luò);包絡(luò)應(yīng)用器,將估算的包絡(luò)應(yīng)用于人工信號。應(yīng)用估算的包絡(luò)的意思是用估算的人工信號的包絡(luò)來劃分人工信號。因子估算器可包括:第一音調(diào)計算單元,計算頻域輸入信號的高頻部分的音調(diào);第二音調(diào)計算單元,計算基礎(chǔ)信號的音調(diào);因子計算單元,使用高頻部分的音調(diào)和基礎(chǔ)信號的音調(diào)來計算能量控制因子。還可通過提供一種編碼設(shè)備來實現(xiàn)以上和/或其它方面,所述編碼設(shè)備包括:下采樣單元,對時域輸入信號進(jìn)行下采樣;核心編碼單元,對下采樣的時域輸入信號進(jìn)行核心編碼;頻率變換單元,將核心編碼的時域輸入信號變換為頻域輸入信號;擴展編碼單元,使用頻域輸入信號的特征,并使用頻域輸入信號的基礎(chǔ)信號來執(zhí)行帶寬擴展編碼。擴展編碼單元可包括:基礎(chǔ)信號產(chǎn)生器,使用頻域輸入信號的頻譜,產(chǎn)生頻域輸入信號的基礎(chǔ)信號;因子估算器,使用基礎(chǔ)信號和頻域輸入信號的特征來估算能量控制因子;能量提取器,從頻域輸入信號提取能量;能量控制器,使用能量控制因子控制提取的能量;能量量化器,對受控的能量進(jìn)行量化。還可通過提供一種編碼設(shè)備來實現(xiàn)以上和/或其它方面,所述編碼設(shè)備包括:編碼模式選擇單元,使用頻域輸入信號和時域輸入信號選擇帶寬擴展編碼的編碼模式;擴展編碼單元,使用頻域輸入信號和選擇的編碼模式執(zhí)行帶寬擴展編碼。擴展編碼單元可包括:能量提取器,基于編碼模式,從頻域輸入信號提取能量;能量控制器,基于編碼模式控制提取的能量;能量量化器,基于編碼模式對受控的能量進(jìn)行量化。通過提供一種解碼設(shè)備來實現(xiàn)以上和/或其它方面,所述解碼設(shè)備包括:核心解碼單元,對時域輸入信號進(jìn)行核心解碼,其中,所述時域輸入信號包括在比特流中并被核心編碼;上采樣單元,對核心解碼的時域輸入信號進(jìn)行上采樣;頻率變換單元,將上采樣的時域輸入信號變換為頻域輸入信號;擴展解碼單元,使用時域輸入信號的能量并使用頻域輸入信號執(zhí)行帶寬擴展解碼。擴展解碼單元可包括:反量化器,對時域輸入信號的能量進(jìn)行反量化;基礎(chǔ)信號
產(chǎn)生器,使用頻域輸入信號來產(chǎn)生基礎(chǔ)信號;增益計算單元,使用反量化的能量和基礎(chǔ)信
號的能量來計算增益,增益被應(yīng)用于基礎(chǔ)信號;增益應(yīng)用器,應(yīng)用針對每個頻帶的計算的增.、/■
Mo基礎(chǔ)信號產(chǎn)生器可包括:人 工信號產(chǎn)生器,通過復(fù)制和折疊頻域輸入信號的低頻部分來產(chǎn)生與高頻部分對應(yīng)的人工信號;包絡(luò)估算器,使用包含在比特流中的窗口來估算基礎(chǔ)信號的包絡(luò);包絡(luò)應(yīng)用器,將估算的包絡(luò)應(yīng)用于人工信號。通過提供一種編碼方法來實現(xiàn)以上和/或其它方面,所述編碼方法包括:對時域輸入信號進(jìn)行下采樣;對下采樣的時域輸入信號進(jìn)行核心編碼;將時域輸入信號變換為頻域輸入信號;使用頻域輸入信號的基礎(chǔ)信號來執(zhí)行帶寬擴展編碼。還通過提供一種編碼方法來實現(xiàn)以上和/或其它方面,所述編碼方法包括:使用頻域輸入信號和時域輸入信號選擇帶寬擴展編碼的編碼模式;使用頻域輸入信號和選擇的編碼模式執(zhí)行帶寬擴展編碼。通過提供一種解碼方法來實現(xiàn)以上和/或其它方面,所述解碼方法包括:對時域輸入信號進(jìn)行核心解碼,其中,所述適于輸入信號包含在比特流中并被核心編碼;對核心解碼的時域輸入信號進(jìn)行上采樣;將上采樣的時域輸入信號變換為頻域輸入信號;使用時域輸入信號的能量并使用頻域輸入信號來執(zhí)行帶寬擴展解碼。示例實施例的其它方面、特征和/或優(yōu)點將部分地在以下的描述中闡述,通過描述部分將是清楚的,或者可通過本公開的實踐而得知。根據(jù)示例實施例,可提取輸入信號的基礎(chǔ)信號,并且可使用輸入信號的高頻域的音調(diào)并使用基礎(chǔ)信號的音調(diào)來控制輸入信號的能量,因此可以有效地擴展高頻域的帶寬。
結(jié)合附圖,通過以下的實施例的說明,這些和/或其它方面和優(yōu)點將會變得清楚和更容易理解,其中:
圖1不出根據(jù)不例實施例的編碼設(shè)備和解碼設(shè)備的框圖;圖2示出圖1的編碼設(shè)備的示例的框圖;圖3示出圖1的編碼設(shè)備的核心編碼單元的框圖;圖4示出圖1的編碼設(shè)備的擴展編碼單元的示例的框圖;圖5示出圖1的編碼設(shè)備的擴展編碼單元的另一示例的框圖;圖6示出擴展編碼單元的基礎(chǔ)信號產(chǎn)生器的框圖;圖7示出擴展編碼單元的因子估算器的框圖;圖8示出圖1的編碼設(shè)備的能量量化器的操作的流程圖;圖9示出根據(jù)示例實施例的量化能量的操作的示圖;圖10示出根據(jù)示例實施例的產(chǎn)生人工信號的操作的示圖;圖1lA和圖1lB示出根據(jù)示例實施例的估計包絡(luò)的窗口的示例的示圖;圖12示出圖1的解碼設(shè)備的框圖;圖13示出圖12的擴展解碼單元的框圖;圖14示出擴展解碼單元的反量化器的操作的流程圖;圖15示出根據(jù)示例實施例的編碼方法的流程圖;圖16示出根據(jù)示例實施例的解碼方法的流程圖;圖17示出圖1的編碼設(shè)備的另一示例的框圖;圖18示出圖17的編碼設(shè)備的能量量化器的操作的框圖;圖19示出根據(jù)示例實施例的使用非均等比特分配方法量化能量的操作的示圖20示出根據(jù)示例實施例的使用幀內(nèi)預(yù)測執(zhí)行向量量化(VQ)的操作的示圖;圖21示出根據(jù)示例實施例的使用頻率加權(quán)方法量化能量的操作的示圖;圖22示出根據(jù)示例實施例的執(zhí)行多級分割VQ和使用幀內(nèi)預(yù)測的VQ的操作的示圖;圖23示出圖13的反量化器的操作的框圖;圖24示出圖1的編碼設(shè)備的另一示例的框圖。
具體實施例方式現(xiàn)在將詳細(xì)參照示例實施例,實施例的示例在附圖中示出,其中,相同的標(biāo)號始終表示相同的部件。以下通過參照附圖描述示例實施例以解釋本公開。圖1不出根據(jù)不例實施例的編碼設(shè)備101和解碼設(shè)備102的框圖。編碼設(shè)備101可產(chǎn)生輸入信號的基礎(chǔ)信號,并可將產(chǎn)生的基礎(chǔ)信號發(fā)送到解碼設(shè)備102。這里,基礎(chǔ)信號可基于低頻信號被產(chǎn)生,并可表示低頻信號的包絡(luò)信息被白化的信號,因此,基礎(chǔ)信號可以是激勵信號。當(dāng)接收到基礎(chǔ)信號時,解碼設(shè)備102可對從基礎(chǔ)信號解碼得到輸入信號。換而言之,編碼設(shè)備101和解碼設(shè)備102可執(zhí)行超寬頻帶帶寬擴展(SWBBWE)。特別地,基于從0千赫茲(KHz)到6.4KHz的低頻域中的解碼的寬頻帶(WB)信號,可執(zhí)行SWB BffE以產(chǎn)生與SWB對應(yīng)的從6.4KHz到16KHz的高頻域。這里,16KHz可根據(jù)情況而改變。另外,可基于以線性預(yù)測域(LPD)為基礎(chǔ)的碼激勵線性預(yù)測(CELP)通過語音編解碼器來產(chǎn)生解碼的WB信號,或者可通過在頻域中執(zhí)行量化的方案來產(chǎn)生解碼的WB信號。在頻域中執(zhí)行量化的方案可包括例如基于修改的離散余弦變換(MDCT)執(zhí)行的高級音頻編碼(AAC)方案。以下,將進(jìn)一步描述編碼設(shè)備101和解碼設(shè)備102的操作。圖2示出圖1的編碼設(shè)備101的配置的框圖。參照圖2,編碼設(shè)備101可包括例如下采樣單元201、核心編碼單元202、頻率變換單元203和擴展編碼單元204。下采樣單元201可對時域輸入信號進(jìn)行下采樣以用于WB編碼。由于時域輸入信號(即,SWB信號)通常具有32KHz采樣率,因此需要將采樣率轉(zhuǎn)換為適合于WB編碼的采樣率。例如,下采樣單元201可將時域輸入信號從32KHz采樣率下采樣到12.8KHz的采樣率。核心編碼單元202可對下采樣的時域輸入信號進(jìn)行核心編碼。換而言之,核心編碼單元202可執(zhí)行WB編碼。例如,核心編碼單元202可還行CELP型WB編碼。頻率變換單元203可將時域輸入信號變換為頻域輸入信號。例如,頻率變換單元203可使用快速傅里葉變換(FFT)或MDCT來將時域輸入信號變換為頻域輸入信號。以下,假設(shè)采用MDCT。擴展編碼單元204可使用頻域輸入信號的基礎(chǔ)信號執(zhí)行帶寬擴展編碼。特別地,擴展編碼單元204可基于頻域輸入信號執(zhí)行SWB BffE編碼。另外,擴展編碼單元204可使用頻域輸入信號的特征以及頻域輸入信號的基礎(chǔ)信號的特征執(zhí)行帶寬擴展編碼。這里,根據(jù)頻域輸入信號的特征的源,擴展編碼單元204可如圖4或圖5被配置。將參照以下的圖4和圖5進(jìn)一步描述擴展編碼單元204的操作。在圖2中,上邊的路徑指示核心編碼,下邊的路徑指示帶寬擴展編碼。具體地,輸入信號的能量信息可通過SWB BffE編碼被傳遞到解碼設(shè)備102。圖3示出核心編碼單元202的框圖。參照圖3,核心編碼單元202可包括例如信號分類器301和編碼器302。信號分類器301可對具有12.SKHz采樣率的下采樣的輸入信號的特征進(jìn)行分類。特別地,信號分類器301可根據(jù)頻域輸入信號的特征,確定將應(yīng)用到頻域輸入信號的編碼模式。例如,在國際電信聯(lián)盟-電信標(biāo)準(zhǔn)(ITU-T)G.718編解碼器中,信號分類器301可將語音信號確定為有聲語音編模式(voiced speech encoding mode)、無聲語音編碼模式(unvoiced speech encoding mode)、瞬態(tài)編石馬模式(transient encoding mode)和通用編碼模式(generic encoding mode)中的一個或多個。在此示例中,無聲語音編碼模式可被設(shè)計為對無聲的語音幀和大部分的不活動幀進(jìn)行編碼。編碼器302可執(zhí)行基于信號分類器301所分類的頻域輸入信號優(yōu)化的編碼。圖4示出圖2的擴展編碼單元204的示例的框圖。參照圖4,擴展編碼單元204可包括例如基礎(chǔ)信號產(chǎn)生器401、因子估算器402、能量提取器403、能量控制器404和能量量化器405。在示例中,擴展編碼單元204可在沒有接收到編碼模式的輸入的情況下估算能量控制因子。在另一示例中,擴展編碼單元204可基于從核心編碼單元202接收的編碼模式估算能量控制因子。基礎(chǔ)信號產(chǎn)生器401可使用頻域輸入信號的頻譜來產(chǎn)生輸入信號的基礎(chǔ)信號?;A(chǔ)信號可表不用于基于WB信號執(zhí)行SWB BWE的信號。換句話說,基礎(chǔ)信號可表不用于形成低頻域的精細(xì)結(jié)構(gòu)的信號。將參照圖6進(jìn)一步描述產(chǎn)生基礎(chǔ)信號的操作。在示例中,因子估算器402可使用基礎(chǔ)信號估算能量控制因子。特別地,編碼設(shè)備101可將輸入信號的能量信息發(fā)送到解碼設(shè)備102,以便在解碼設(shè)備102中產(chǎn)生SWB域中的信號。另外,因子估算器402可估算能量控制因子,從而控制感覺方面中的能量。將參照圖7進(jìn)一步描述估算能量控制因子的操作。在另一示例中,因子估算器402可使用基礎(chǔ)信號和頻域輸入信號的特征估算能量控制因子。在此示例中,可從核心編碼單元202接收頻域輸入信號的特征。能量提取器403可從頻域輸入信號提取能量。提取的能量可被發(fā)送到解碼設(shè)備102。這里,可針對每個頻帶提取能量。能量控制器404可使用能量控制因子控制提取的能量。特別地,能量控制器404可將能量控制因子應(yīng)用到針對每個頻帶提取的能量,并可控制能量。能量量化器405可量化受控的能量。能量可被轉(zhuǎn)換為分貝(dB)標(biāo)度,并可被量化。特別地,能量量化器405可獲取全局能量(S卩,總能量),并可對全局能量執(zhí)行標(biāo)量量化(SQ),并對全局能量和每個頻帶的能量之間的差執(zhí)行標(biāo)量量化。另外,第一頻帶可直接量化能量,后面的頻帶可對當(dāng)前頻帶和先前頻帶之間的差進(jìn)行量化。此外,能量量化器405可直接針對每個頻帶對能量進(jìn)行量化,而不使用頻帶之間的差值。當(dāng)針對每個頻帶量化能量時,可使用SQ或向量量化(VQ)。下面將參照圖8和圖9進(jìn)一步描述能量量化器405。圖5示出擴展編碼單元204的另一示例的框圖。圖5的擴展編碼單元204還可包括信號分類器501,并且因此可與圖4的擴展編碼單元204不同。例如,因子估算器402可使用基礎(chǔ)信號和頻域輸入信號的特征來估算能量控制因子。在此示例中,可從信號分類器501而不是核心編碼單元202接收頻域輸入信號的特征。信號分類器501可使用MDCT頻譜,基于頻域輸入信號的特征對具有32KHz采樣率的輸入信號進(jìn)行分類。特別地,信號分類器501可根據(jù)頻域輸入信號的特征確定將被應(yīng)用于頻域輸入信號的編碼模式。當(dāng)輸入信號的特征被分類時,可從信號提取能量控制因子并可控制能量。在實施例中,可僅從適合用于估算能量控制因子的信號提取能量控制因子。例如,不包括音調(diào)分量的信號(諸如噪聲信號或無聲語音信號)可能不適合用于估算能量控制因子。這里,當(dāng)輸入信號被分類為無聲語音編碼模式時,擴展編碼單元204可執(zhí)行帶寬擴展編碼,而不是估算能量控制因子。圖5中示出的基礎(chǔ)信號產(chǎn)生器401、因子估算器402、能量提取器403、能量控制器404和能量量化器405可執(zhí)行與圖4中示出的基礎(chǔ)信號產(chǎn)生器401、因子估算器402、能量提取器403、能量控制器404和能量量化器405相同的功能,因此將省略對其的進(jìn)一步描述。圖6不出基礎(chǔ)信號產(chǎn)生器401的框圖。參照圖6,基礎(chǔ)信號產(chǎn)生器401可包括例如人工信號產(chǎn)生器601、包絡(luò)估算器602和包絡(luò)應(yīng)用器603。人工信號產(chǎn)生器601可通過復(fù)制和折疊頻域輸入信號的低頻部分來產(chǎn)生與高頻部分對應(yīng)的人工信號。特別地,人工信號產(chǎn)生器601可復(fù)制頻域輸入信號的低頻頻譜,并可在SWB域中產(chǎn)生人工信號。將參照圖10進(jìn)一步描述產(chǎn)生人工信號的操作。
包絡(luò)估算器602可使用窗口來估算基礎(chǔ)信號的包絡(luò)。基礎(chǔ)信號的包絡(luò)可用于移除SffB域中的人工信號的頻譜中所包括的低頻域的包絡(luò)信息??墒褂梦挥陬A(yù)定頻率之前或之后的頻譜來確定預(yù)定頻率索引的包絡(luò)。另外,可通過移動平均來估算包絡(luò)。例如,當(dāng)MDCT用于變換頻率時,可使用MDCT變換后的頻譜的絕對值來估算基礎(chǔ)信號的包絡(luò)。這里,包絡(luò)估算器602可形成白化頻帶(whitening band),并可將每個白化頻帶的頻率幅度的平均值估算為每個白化頻帶中包含的頻率的包絡(luò)。包含在白化頻帶中的頻譜的數(shù)量可被設(shè)置為少于用于提取能量的頻帶的數(shù)量。當(dāng)每個白化頻帶的頻率幅度的平均值被估算為包含在每個白化頻帶中的頻率的包絡(luò)時,包絡(luò)估算器602可發(fā)送包括白化頻帶中的頻譜的數(shù)量的信息,并可調(diào)整基礎(chǔ)信號的平滑度。特別地,包絡(luò)估算器602可基于白化頻帶是包括八個頻譜還是三個頻譜來發(fā)送包括白化頻帶中的頻譜的數(shù)量的信息。例如,當(dāng)白化頻帶包括三個頻譜時,與包括八個頻譜的白化頻帶相比,可產(chǎn)生更加平坦的基礎(chǔ)信號。另外,包絡(luò)估算器602可基于在核心編碼單元202的編碼期間使用的編碼模式來估算包絡(luò),而不是發(fā)送包括白化頻帶中的頻譜的數(shù)量的信息。核心編碼單元202可基于輸入信號的特征將輸入信號分類為有聲語音編碼模式、無聲語音編碼模式、瞬態(tài)編碼模式和通用編碼模式,并可對輸入信號進(jìn)行編碼。這里,包絡(luò)估算器602可基于根據(jù)輸入信號的特征的編碼模式來控制包含在白化頻帶中的頻譜的數(shù)量。在一示例中,當(dāng)輸入信號基于有聲語音編碼模式被編碼時,包絡(luò)估算器602可形成具有三個頻譜的白化頻帶,并可估算包絡(luò)。在另一示例中,當(dāng)輸入信號基于除了有聲語音編碼模式之外的編碼模式被編碼時,包絡(luò)估算器602可形成具有三個頻譜的白化頻帶,并可估算包絡(luò)。包絡(luò)應(yīng)用器603可將估算的包絡(luò)應(yīng)用于人工信號。將估算的包絡(luò)應(yīng)用于人工信號的操作被稱為“白化”,人工信號可被包絡(luò)平滑。包絡(luò)應(yīng)用器603可將人工信號劃分為每個頻率索引的包絡(luò),并可產(chǎn) 生基礎(chǔ)信號。圖7示出因子估算器402的框圖。參照圖7,因子估算器402可包括例如第一音調(diào)計算單元701、第二音調(diào)計算單元702和因子計算單元703。第一音調(diào)計算單元701可計算頻域輸入信號的高頻部分的音調(diào)。換而言之,第一音調(diào)計算單元701可計算SWB域(即,輸入信號的高頻部分)的音調(diào)。第二音調(diào)計算單元702可計算基礎(chǔ)信號的音調(diào)??赏ㄟ^測量頻譜平坦度來計算音調(diào)。特別地,可使用如下的等式I來計算音調(diào)。可基于頻譜的幾何平均和算術(shù)平均之間的關(guān)系來測量頻域平坦度。[等式I]
(iV-11、
ni_ T = min(10 * 1u 10 - / 廠.0.999)
V iVJT:音調(diào),S(k):頻譜,N:頻譜系數(shù)的長度,r:常數(shù)
因子計算單元703可使用高頻域的音調(diào)和基礎(chǔ)信號的音調(diào)來計算能量控制因子。這里,可使用以下的等式2來計算能量控制因子:[等式2]
權(quán)利要求
1.一種編碼設(shè)備,包括: 處理器,控制一個或多個處理器可運行的單元; 核心編碼單元,對下采樣的時域輸入信號進(jìn)行核心編碼; 頻率變換單元,將時域輸入信號變換為頻域輸入信號; 擴展編碼單元,使用頻域輸入信號的基礎(chǔ)信號以及頻域輸入信號來執(zhí)行帶寬擴展編碼。
2.如權(quán)利要求1所述的編碼設(shè)備,其中,擴展編碼單元包括: 基礎(chǔ)信號產(chǎn)生器,使用頻域輸入信號的頻譜來產(chǎn)生頻域輸入信號的基礎(chǔ)信號; 因子估算器,使用基礎(chǔ)信號和頻域輸入信號來估算能量控制因子; 能量提取器,從頻域輸入信號提取能量; 能量控制器,使用能量控制因子控制提取的能量; 能量量化器,對受控的能量進(jìn)行量化。
3.如權(quán)利要求2所述的編碼設(shè)備,其中,基礎(chǔ)信號產(chǎn)生器包括: 人工信號產(chǎn)生器,通過復(fù)制和折疊頻域輸入信號的低頻部分來產(chǎn)生與高頻部分對應(yīng)的人工信號; 包絡(luò)估算器,使用窗口估算人工信號的包絡(luò); 包絡(luò)應(yīng)用器,將估算的包絡(luò)應(yīng)用于人工信號來產(chǎn)生基礎(chǔ)信號。
4.如權(quán)利要求3所述的編碼設(shè)備,其中,窗口的尖峰與基礎(chǔ)信號的包絡(luò)被估算的頻率索引對應(yīng), 其中,包絡(luò)估算器基于音調(diào)或相關(guān)性的比較結(jié)果來選擇窗口,并使用選擇的窗口估算基礎(chǔ)信號的包絡(luò)。
5.如權(quán)利要求3所述的編碼設(shè)備,其中,包絡(luò)估算器將白化頻帶的頻率幅度的平均值估算為所述白化頻帶中包含的頻率的包絡(luò)。
6.如權(quán)利要求5所述的編碼設(shè)備,其中,包絡(luò)估算器基于核心編碼模式控制包含在白化頻帶中的頻譜的數(shù)量,并估算基礎(chǔ)信號的包絡(luò)。
7.如權(quán)利要求2所述的編碼設(shè)備,其中,因子估算器包括: 第一音調(diào)計算單元,計算頻域輸入信號的高頻部分的音調(diào); 第二音調(diào)計算單元,計算基礎(chǔ)信號的音調(diào); 因子計算單元,使用高頻部分的音調(diào)和基礎(chǔ)信號的音調(diào)來計算能量控制因子。
8.如權(quán)利要求2所述的編碼設(shè)備,其中,能量控制器在能量控制因子小于預(yù)定能量控制因子時控制提取的能量。
9.如權(quán)利要求2所述的編碼設(shè)備,其中,能量量化器選擇能量向量的子向量,量化選擇的子向量,并使用插值誤差來對未被選擇子向量進(jìn)行量化。
10.如權(quán)利要求9所述的編碼設(shè)備,其中,能量量化器選擇子向量,并按照規(guī)則的間隔來量化選擇的子向量。
11.如權(quán)利要求9所述的編碼設(shè)備,其中,能量量化器選擇子向量候選,并執(zhí)行包括至少兩級的多級向量量化(VQ)。
12.如權(quán)利要求9所述的編碼設(shè)備,其中,能量量化器產(chǎn)生用于針對每個子向量候選使得每一級中的均方差(MSE)或加權(quán)均方差(WMSE)最小化的索引集,并選擇所有級中的MSE或WMSE的總和最小的子向量候選。
13.如權(quán)利要求9所述的編碼設(shè)備,其中,能量量化器產(chǎn)生用于針對每個子向量候選使得每一級中的MSE或麗SE最小化的索引集,通過反量化操作恢復(fù)能量向量,并選擇使得恢復(fù)的能量向量和原始能量向量之間的MSE或WMSE最小化的子向量候選。
14.一種編碼設(shè)備,包括: 處理器,控制一個或多個處理器可運行的單元; 核心編碼單元,對下采樣的時域輸入信號進(jìn)行核心編碼; 頻率變換單元,將時域輸入信號變換為頻域輸入信號; 擴展編碼單元,使用頻域輸入信號,并使用頻域輸入信號的基礎(chǔ)信號來執(zhí)行帶寬擴展編碼。
15.如權(quán)利要求14所述的編碼設(shè)備,其中,擴展編碼單元包括: 基礎(chǔ)信號產(chǎn)生器,使用頻域輸入信號的頻譜,產(chǎn)生頻域輸入信號的基礎(chǔ)信號; 因子估算器,使用基礎(chǔ)信號和頻域輸入信號的特征來估算能量控制因子; 能量提取器,從頻域輸入信號提取能量; 能量控制器,使用能量控制因子控制提取的能量; 能量量化器,對受控的能量進(jìn)行量化。
16.如權(quán)利要求15所述 的編碼設(shè)備,其中,擴展編碼單元還包括:信號分類器,使用頻域輸入信號的頻譜,基于頻域輸入信號的特征對頻域輸入信號進(jìn)行分類, 其中,因子估算器使用由信號分類器確定的頻域輸入信號的特征來估算能量控制因子。
17.如權(quán)利要求15所述的編碼設(shè)備,其中,因子估算器使用由核心編碼單元確定的頻域輸入信號的特征估算能量控制因子。
18.如權(quán)利要求15所述的編碼設(shè)備,其中,基礎(chǔ)信號產(chǎn)生器包括: 人工信號產(chǎn)生器,通過復(fù)制和折疊頻域輸入信號的低頻部分來產(chǎn)生與高頻部分對應(yīng)的人工信號; 包絡(luò)估算器,使用窗口估算人工信號的包絡(luò); 包絡(luò)應(yīng)用器,將估算的包絡(luò)應(yīng)用于人工信號來產(chǎn)生基礎(chǔ)信號。
19.如權(quán)利要求18所述的編碼設(shè)備,其中,窗口的尖峰與基礎(chǔ)信號的包絡(luò)被估算的頻率索引對應(yīng), 其中,包絡(luò)估算器基于音調(diào)或相關(guān)性的比較結(jié)果來選擇窗口,并使用選擇的窗口估算基礎(chǔ)信號的包絡(luò)。
20.如權(quán)利要求18所述的編碼設(shè)備,其中,包絡(luò)估算器將白化頻帶的頻率幅度的平均值估算為所述白化頻帶中包含的頻率的包絡(luò)。
21.如權(quán)利要求20所述的編碼設(shè)備,其中,包絡(luò)估算器基于核心編碼模式控制包含在白化頻帶中的頻譜的數(shù)量,并估算基礎(chǔ)信號的包絡(luò)。
22.如權(quán)利要求14所述的編碼設(shè)備,其中,因子估算器包括: 第一音調(diào)計算單元,計算頻域輸入信號的高頻部分的音調(diào); 第二音調(diào)計算單元,計算基礎(chǔ)信號的音調(diào); 因子計算單元,使用高頻部分的音調(diào)和基礎(chǔ)信號的音調(diào)來計算能量控制因子。
23.如權(quán)利要求15所述的編碼設(shè)備,其中,能量控制器在能量控制因子小于預(yù)定能量控制因子時控制提取的能量。
24.如權(quán)利要求15所述的編碼設(shè)備,其中,能量量化器選擇能量向量的子向量,量化選擇的子向量,并使用插值誤差來對未被選擇子向量進(jìn)行量化。
25.如權(quán)利要求24所述的編碼設(shè)備,其中,能量量化器選擇子向量,并按照規(guī)則的間隔來量化選擇的子向量。
26.如權(quán)利要求24所述的編碼設(shè)備,其中,能量量化器選擇子向量候選,并執(zhí)行包括至少兩級的多級向量量化(VQ)。
27.—種編碼設(shè)備,包括: 處理器,控制一個或多個處理器可運行的單元; 能量提取器,基于編碼模式從頻域輸入信號提取能量; 能量控制器,基于編碼模式控制提取的能量; 能量量化器,基于編碼模式量化受控的能量。
28.—種編碼設(shè)備,包括: 處理器,控制一個或多個處理器可運行的單元; 編碼模式選擇單元,使用頻域輸入信號和時域輸入信號選擇帶寬擴展編碼的編碼模式; 擴展編碼單元,使用頻域輸入信號和選擇的編碼模式執(zhí)行帶寬擴展編碼。
29.如權(quán)利要求28所述的編碼設(shè)備,其中,編碼模式選擇單元使用頻域輸入信號和時域輸入信號對頻域輸入信號進(jìn)行分類,基于通過對頻域輸入信號分類而獲得的信息來確定帶寬擴展編碼模式的編碼模式,并基于確定的編碼模式確定頻帶的數(shù)量。
30.如權(quán)利要求28所述的編碼設(shè)備,其中,擴展編碼單元包括: 能量提取器,基于編碼模式,從頻域輸入信號提取能量; 能量控制器,基于編碼模式控制提取的能量; 能量量化器,基于編碼模式對受控的能量進(jìn)行量化。
31.如權(quán)利要求30所述的編碼設(shè)備,其中,能量提取器基于編碼模式提取與頻帶對應(yīng)的能量。
32.如權(quán)利要求30所述的編碼設(shè)備,其中,能量控制器使用基于頻域輸入信號的基礎(chǔ)信號估算的能量控制因子來控制能量。
33.如權(quán)利要求30所述的編碼設(shè)備,其中,能量量化器基于編碼模式使用針對頻域輸入信號優(yōu)化的方案來量化能量。
34.如權(quán)利要求33所述的編碼設(shè)備,其中,當(dāng)編碼模式是瞬態(tài)模式時,能量量化器通過將頻率加權(quán)方法應(yīng)用于頻帶來量化能量。
35.如權(quán)利要求34所述的編碼設(shè)備,其中,頻率加權(quán)方法用于為具有高感知重要性的低頻帶分配權(quán)重來量化能量。
36.如權(quán)利要求33所述的編碼設(shè)備,其中,當(dāng)編碼模式是普通模式或諧波模式時,能量量化器通過將非均等比特分配方法應(yīng)用于頻帶來量化能量。
37.如權(quán)利要求36所述的編碼設(shè)備,其中,非均等比特分配方法用于為具有高感知重要性的低頻帶分配比高頻帶更多的比特來量化能量。
38.如權(quán)利要求30所述的編碼設(shè)備,其中,能量量化器預(yù)測包括至少兩個元素的量化目標(biāo)向量的代表值,對預(yù)測的代表值和量化目標(biāo)向量的所述至少兩個元素中的每一個之間的誤差信號執(zhí)行向量量化(VQ)。
39.一種解碼設(shè)備,包括: 處理器,控制一個或多個處理器可運行的單元; 核心解碼單元,對包括在比特流中的時域輸入信號進(jìn)行核心解碼; 上采樣單元,對核心解碼的時域輸入信號進(jìn)行上采樣; 頻率變換單元,將上采樣的時域輸入信號變換為頻域輸入信號; 擴展解碼單元,使用頻域輸入信號的能量執(zhí)行帶寬擴展解碼。
40.如權(quán)利要求39所述的解碼設(shè)備,其中,擴展解碼單元包括: 反量化器,對時域輸入信號的能量進(jìn)行反量化; 基礎(chǔ)信號產(chǎn)生器,使用頻域輸入信號來產(chǎn)生基礎(chǔ)信號; 增益計算單元,使用反量化的能量和基礎(chǔ)信號的能量來計算增益,增益被應(yīng)用于基礎(chǔ)信號; 增益應(yīng)用器,應(yīng)用針對每個頻 帶的計算的增益。
41.如權(quán)利要求40所述的解碼設(shè)備,其中,反量化器選擇能量向量的子向量,反量化選擇的子向量,對反量化的子向量進(jìn)行插值,將插值誤差值與插值的子向量相加,并最終反量化能量。
42.如權(quán)利要求40所述的解碼設(shè)備,其中,基礎(chǔ)信號產(chǎn)生器包括: 人工信號產(chǎn)生器,通過復(fù)制和折疊頻域輸入信號的低頻部分來產(chǎn)生與高頻部分對應(yīng)的人工信號; 包絡(luò)估算器,使用包含在比特流中的窗口來估算基礎(chǔ)信號的包絡(luò); 包絡(luò)應(yīng)用器,將估算的包絡(luò)應(yīng)用于人工信號。
43.如權(quán)利要求40所述的解碼設(shè)備,其中,增益計算單元和增益應(yīng)用器設(shè)置用于應(yīng)用能量平滑的子頻帶,并使用插值來產(chǎn)生每個子頻帶的能量,其中,針對每個子頻帶計算增.、Mo
44.一種編碼方法,包括: 對下采樣的時域輸入信號進(jìn)行核心編碼; 將時域輸入信號變換為頻域輸入信號; 通過處理器,使用頻域輸入信號的基礎(chǔ)信號來執(zhí)行帶寬擴展編碼。
45.如權(quán)利要求44所述的編碼方法,其中,執(zhí)行帶寬擴展編碼的步驟包括: 使用頻域輸入信號的頻譜來產(chǎn)生頻域輸入信號的基礎(chǔ)信號; 使用基礎(chǔ)信號來估算能量控制因子; 從頻域輸入信號提取能量; 使用能量控制因子控制提取的能量; 對受控的能量進(jìn)行量化。
46.如權(quán)利要求45所述的編碼方法,其中,產(chǎn)生頻域輸入信號的基礎(chǔ)信號的步驟包括: 通過復(fù)制和折疊頻域輸入信號的低頻部分來產(chǎn)生與高頻部分對應(yīng)的人工信號; 使用窗口估算基礎(chǔ)信號的包絡(luò);將估算的包絡(luò)應(yīng)用于人工信號。
47.如權(quán)利要求46所述的編碼方法,其中,窗口的尖峰與基礎(chǔ)信號的包絡(luò)被估算的頻率索引對應(yīng), 其中,估算基礎(chǔ)信號的包絡(luò)的步驟包括:基于音調(diào)或相關(guān)性的比較結(jié)果來選擇窗口,并使用選擇的窗口估算基礎(chǔ)信號的包絡(luò)。
48.如權(quán)利要求46所述的編碼方法,其中,估算基礎(chǔ)信號的包絡(luò)的步驟包括:將白化頻帶的頻率幅度的平均值估算為所述白化頻帶中包含的頻率的包絡(luò)。
49.如權(quán)利要求48所述的編碼方法,其中,估算基礎(chǔ)信號的包絡(luò)的步驟包括:基于核心編碼模式控制包含在白化頻帶中的頻譜的數(shù)量,并估算基礎(chǔ)信號的包絡(luò)。
50.如權(quán)利要求45所述的編碼方法,其中,估算能量控制因子的步驟包括: 計算頻域輸入信號的高頻部分的音調(diào); 計算基礎(chǔ)信號的音調(diào); 使用高頻部分的音調(diào)和基礎(chǔ)信號的音調(diào)來計算能量控制因子。
51.如權(quán)利要求45所述的編碼方法,其中,控制提取的能量的步驟包括:在能量控制因子小于預(yù)定能量控制因子時控制提取的能量。
52.如權(quán)利要求45所述的編碼方法,其中,量化步驟包括:選擇能量向量的子向量,量化選擇的子向量,并使用插值誤差來對未被選擇子向量進(jìn)行量化。
53.如權(quán)利要求52所述的編碼方法,其中,量化步驟包括:選擇子向量,并按照規(guī)則的間隔來量化選擇的子向量。
54.如權(quán)利要求52所述的編碼方法,其中,量化步驟包括:選擇子向量候選,并執(zhí)行包括至少兩級的多級向量量化(VQ)。
55.如權(quán)利要求54所述的編碼方法,其中,量化步驟包括:產(chǎn)生針對每個子向量候選使得每一級中的均方差(MSE)或加權(quán)均方差(WMSE)最小化的索引集,并選擇所有級中的MSE或WMSE的總和最小的子向量候選。
56.如權(quán)利要求54所述的編碼方法,其中,量化步驟包括:產(chǎn)生針對每個子向量候選使得每一級中的MSE或麗SE最小化的索引集,通過反量化操作恢復(fù)能量向量,并選擇使得恢復(fù)的能量向量和原始能量向量之間的MSE或WMSE最小化的子向量候選。
57.—種編碼方法,包括: 對下采樣的時域輸入信號進(jìn)行核心編碼; 將核心編碼的時域輸入信號變換為頻域輸入信號; 通過處理器,使用頻域輸入信號的特征,并使用頻域輸入信號的基礎(chǔ)信號來執(zhí)行帶寬擴展編碼。
58.如權(quán)利要求57所述的編碼方法,其中,執(zhí)行帶寬擴展編碼的步驟包括: 使用頻域輸入信號的頻譜,產(chǎn)生頻域輸入信號的基礎(chǔ)信號; 使用基礎(chǔ)信號和頻域輸入信號的特征來估算能量控制因子; 從頻域輸入信號提取能量; 使用能量控制因子控制提取的能量; 對受控的能量進(jìn)行量化。
59.如權(quán)利要求58所述的編碼方法,其中,執(zhí)行帶寬擴展編碼的步驟還包括:使用頻域輸入信號的頻譜,基于頻域輸入信號的特征對頻域輸入信號進(jìn)行分類, 其中,估算能量控制因子的步驟包括:使用在所示分類中確定的頻域輸入信號的特征來估算能量控制因子。
60.如權(quán)利要求58所述的編碼方法,其中,估算能量控制因子的步驟包括:使用在核心編碼中確定的頻域輸入信號的特性估算能量控制因子。
61.如權(quán)利要求58所述的編碼方法,其中,產(chǎn)生基礎(chǔ)信號的步驟包括: 通過復(fù)制和折疊頻域輸入信號的低頻部分來產(chǎn)生與高頻部分對應(yīng)的人工信號; 使用窗口估算人工信號的包絡(luò); 將估算的包絡(luò)應(yīng)用于人工信號。
62.如權(quán)利要求61所述的編碼方法,其中,窗口的尖峰與基礎(chǔ)信號的包絡(luò)被估算的頻率索引對應(yīng), 其中,估算人工信號的包絡(luò)的步驟包括:基于音調(diào)或相關(guān)性的比較結(jié)果來選擇窗口,并使用選擇的窗口估算基礎(chǔ)信號的包絡(luò)。
63.如權(quán)利要求61所述的編碼方法,其中,估算人工信號的包絡(luò)的步驟包括:將白化頻帶的頻率幅度的平均值估算為所述白化頻帶中包含的頻率的包絡(luò)。
64.如權(quán)利要求63所述的編碼方法,其中,估算人工信號的包絡(luò)的步驟包括:基于核心編碼模式控制包含在白化頻帶中的頻譜的數(shù)量,并估算基礎(chǔ)信號的包絡(luò)。
65.如權(quán)利要求58所述的編碼方法,其中,估算能量控制因子的步驟包括: 計算頻域輸入信號的高頻部分的音調(diào); 計算基礎(chǔ)信號的音調(diào); 使用高頻部分的音調(diào)和基礎(chǔ)信號的音調(diào)來計算能量控制因子。
66.如權(quán)利要求58所述的編碼方法,其中,控制提取的能量的步驟包括:在能量控制因子小于預(yù)定能量控制因子時控制提取的能量。
67.如權(quán)利要求58所述的編碼方法,其中,量化能量的步驟包括:選擇能量向量的子向量,量化選擇的子向量,并使用插值誤差來對未被選擇子向量進(jìn)行量化。
68.如權(quán)利要求67所述的編碼方法,其中,量化能量的步驟包括:選擇子向量,并按照規(guī)則的間隔來量化選擇的子向量。
69.如權(quán)利要求67所述的編碼方法,其中,量化能量的步驟包括:選擇子向量候選,并執(zhí)行包括至少兩級的多級向量量化(VQ)。
70.—種編碼方法,包括: 基于編碼模式從頻域輸入信號提取能量; 基于編碼模式控制提取的能量; 通過處理器,基于編碼模式量化受控的能量。
71.—種編碼方法,包括: 使用頻域輸入信號和時域輸入信號選擇帶寬擴展編碼的編碼模式; 使用頻域輸入信號和選擇的編碼模式執(zhí)行帶寬擴展編碼。
72.如權(quán)利要求71所述的編碼方法,其中,選擇帶寬擴展編碼的編碼模式的步驟包括: 使用頻域輸入信號和時域輸入信號對頻域輸入信號進(jìn)行分類; 基于通過對頻域輸入信號分類而獲得的信息來確定帶寬擴展編碼模式的編碼模式,并基于確定的編碼模式確定頻帶的數(shù)量。
73.如權(quán)利要求71所述的編碼方法,其中,執(zhí)行帶寬擴展編碼的步驟包括: 基于編碼模式,從頻域輸入信號提取能量; 基于編碼模式控制提取的能量; 基于編碼模式對受控的能量進(jìn)行量化。
74.如權(quán)利要求73所述的編碼方法,其中,提取能量的步驟包括:基于編碼模式提取與頻帶對應(yīng)的能量。
75.如權(quán)利要求73所述的編碼方法,其中,控制提取的能量的步驟包括:使用基于頻域輸入信號的基礎(chǔ)信號估算的能量控制因子來控制能量。
76.如權(quán)利要求73所述的編碼方法,其中,量化能量的步驟包括:基于編碼模式使用針對頻域輸入信號優(yōu)化的方案來量化能量。
77.如權(quán)利要求76所述的編碼方法,其中,量化能量的步驟包括:當(dāng)編碼模式是瞬態(tài)模式時,通過將頻率加權(quán)方法應(yīng)用于頻帶來量化能量。
78.如權(quán)利要求77所述的編 碼方法,其中,頻率加權(quán)方法用于為具有高感知重要性的低頻帶分配權(quán)重來量化能量。
79.如權(quán)利要求76所述的編碼方法,其中,量化能量的步驟包括:當(dāng)編碼模式是普通模式或諧波模式時,通過將非均等比特分配方法應(yīng)用于頻帶來量化能量。
80.如權(quán)利要求79所述的編碼方法,其中,非均等比特分配方法用于為具有高感知重要性的低頻帶分配比高頻帶更多的比特來量化能量。
81.如權(quán)利要求73所述的編碼方法,其中,量化能量的步驟包括:預(yù)測包括至少兩個元素的量化目標(biāo)向量的代表值,對預(yù)測的代表值和量化目標(biāo)向量的所述至少兩個元素中的每一個之間的誤差信號執(zhí)行向量量化(VQ)。
82.—種解碼方法,包括: 對包括在比特流中的時域輸入信號進(jìn)行核心解碼; 對核心解碼的時域輸入信號進(jìn)行上采樣; 將上采樣的時域輸入信號變換為頻域輸入信號; 通過處理器,使用頻域輸入信號的能量并使用頻域輸入信號來執(zhí)行帶寬擴展解碼。
83.如權(quán)利要求82所述的解碼方法,其中,執(zhí)行帶寬擴展解碼的步驟包括: 對時域輸入信號的能量進(jìn)行反量化; 使用頻域輸入信號來產(chǎn)生基礎(chǔ)信號; 使用反量化的能量和基礎(chǔ)信號的能量來計算增益,增益被應(yīng)用于基礎(chǔ)信號; 應(yīng)用針對每個頻帶的計算的增益。
84.如權(quán)利要求83所述的解碼方法,其中,反量化步驟包括:選擇能量向量的子向量,反量化選擇的子向量,對反量化的子向量進(jìn)行插值,將插值誤差值與插值的子向量相加,并最終反量化能量。
85.如權(quán)利要求84所述的解碼方法,其中,產(chǎn)生基礎(chǔ)信號的步驟包括: 通過復(fù)制和折疊頻域輸入信號的低頻部分來產(chǎn)生與高頻部分對應(yīng)的人工信號; 使用包含在比特流中的窗口來估算基礎(chǔ)信號的包絡(luò); 將估算的包絡(luò)應(yīng)用于人工信號。
86.如權(quán)利要求84所述的解碼方法,其中,計算增益的步驟包括:設(shè)置用于應(yīng)用能量平滑的子頻帶,并通過插值來產(chǎn)生每個子頻帶的能量,其中,針對每個子頻帶計算增益。
87.一種存儲了 用于使計算機實現(xiàn)權(quán)利要求44的方法的程序的非暫時性計算機可讀記錄介質(zhì)。
全文摘要
提供了一種用于高頻帶寬擴展的對信號進(jìn)行編碼和解碼的設(shè)備和方法。編碼設(shè)備可對時域輸入信號進(jìn)行下采樣,可對下采樣的時域輸入信號進(jìn)行核心編碼,可將核心編碼的時域輸入信號變換為頻域輸入信號,并可使用頻域輸入信號的基礎(chǔ)信號來執(zhí)行帶寬擴展編碼。
文檔編號G10L19/20GK103210443SQ201180054965
公開日2013年7月17日 申請日期2011年9月15日 優(yōu)先權(quán)日2010年9月15日
發(fā)明者成昊相, 朱基峴, 吳殷美 申請人:三星電子株式會社