欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

編碼方法、裝置、程序以及記錄介質與流程

文檔序號:12513569閱讀:385來源:國知局
編碼方法、裝置、程序以及記錄介質與流程

本發(fā)明涉及音響信號的編碼技術。尤其,涉及將音響信號變換為頻域而進行編碼的編碼技術。



背景技術:

在聲音或音樂等音響信號的編碼中,將輸入音響信號在頻域進行編碼的方法正在被廣泛使用。作為音響信號的頻域上的編碼方法,有例如非專利文獻1或非專利文獻2的方法。

在非專利文獻1所記載的編碼方法中,進行使用了基于能夠變換為線性預測系數(shù)的系數(shù)的頻譜包絡的編碼處理。具體地,在非專利文獻1所記載的編碼方法中,對從輸入音響信號中得到的能夠變換為線性預測系數(shù)的系數(shù)進行編碼從而得到線性預測系數(shù)碼,通過能夠變換為與線性預測系數(shù)碼對應的量化后的線性預測系數(shù)的系數(shù)所對應的頻譜包絡系數(shù)列,編碼對與輸入音響信號對應的頻域系數(shù)列進行正規(guī)化而得到的正規(guī)化系數(shù)列,從而得到正規(guī)化系數(shù)碼。能夠變換為線性預測系數(shù)的系數(shù)是指,線性預測系數(shù)其本身、PARCOR系數(shù)(偏自相關系數(shù))或者LSP參數(shù)等。

在非專利文獻2所記載的編碼方法中,取得劃分后的每個頻域的系數(shù)的平均能量的對數(shù)值與相鄰的頻域的平均能量的對數(shù)值的差分,進行伴隨差分值可變長度編碼的編碼處理。具體地,在非專利文獻2所記載的編碼方法中,將與輸入音響信號對應的頻域系數(shù)列劃分為越低頻則采樣數(shù)越少而越高頻則采樣數(shù)越多的頻域,得到劃分后的每個頻域的平均能量,將該平均能量通過對數(shù)軸進行量化。對量化后的值、與將相鄰的頻域的平均能量同樣通過對數(shù)軸進行量化后的值的差分進行可變長度編碼。使用劃分后的每個頻域的通過對數(shù)軸量化后的平均能量,適應性地決定各頻域系數(shù)的量化比特數(shù)或各頻域系數(shù)的量化步長,從而對各頻域系數(shù)進行量化,進而對其進行可變長度編碼。

現(xiàn)有技術文獻

非專利文獻

非專利文獻1:Anthony Vetro,“MPEG Unified Speech and Audio Coding”,Industry and Standards,IEEE MultiMedia,April-June,2013.

非專利文獻2:M.Bosi and R.E.Goldberg,”Introduction to Digital Audio Coding and Standards”,Kluwer Academic Publishers,2003.



技術實現(xiàn)要素:

發(fā)明要解決的課題

根據(jù)非專利文獻2的編碼方法,在輸入音響信號的頻譜包絡的起伏不大的情況或頻譜的集中度不高的情況下,通過對平均能量的差分進行可變長度編碼從而能夠減少平均能量碼的碼量,因此,能夠高效地對輸入音響信號進行編碼。可是,在輸入音響信號的頻譜包絡的起伏大的情況或頻譜的集中度高的情況下,對平均能量的差分進行可變長度編碼而得到的平均能量碼的碼量變多。

對此,根據(jù)非專利文獻1的編碼方法,通過能夠變換為線性預測系數(shù)的系數(shù),能夠高效地對頻譜包絡進行編碼,因此,在輸入音響信號的頻譜包絡的起伏大的情況或頻譜的集中度高的情況下,能夠比非專利文獻2的編碼方法更高效地對輸入音響信號進行編碼。可是,在輸入音響信號的頻譜包絡的起伏不大的情況或頻譜的集中度不高的情況下,不能如非專利文獻2的編碼方法那樣高效地進行編碼。

如此,在以往的編碼方法中,存在根據(jù)輸入音響信號的特性而不能高效地進行編碼的情況。

本發(fā)明的目的在于,提供一種編碼方法、裝置、程序以及記錄介質,與輸入音響信號的特性無關地,高效地進行編碼,且能夠得到收聽者感到不自然的情況較少的解碼音響信號。

用于解決課題的手段

本發(fā)明的一個方式的編碼方法是,將輸入音響信號按規(guī)定時間區(qū)間的幀的每個,通過在頻域上的多個編碼處理之中被決定的編碼處理來進行編碼的編碼方法,所述編碼方法包含:決定步驟,在前一幀的輸入音響信號的高頻分量的能量的大小和當前幀的輸入音響信號的高頻分量的能量的大小的至少其中一個為規(guī)定的閾值以下的情況下,設為能夠將與前一幀不同的編碼處理決定作為當前幀的編碼處理。

本發(fā)明的一個方式的編碼方法是,將輸入音響信號按規(guī)定時間區(qū)間的幀的每個,通過在頻域上的多個編碼處理之中被決定的編碼處理來進行編碼的編碼方法,所述編碼方法包含:決定步驟,在前一幀的輸入音響信號的高頻分量的能量的大小和當前幀的輸入音響信號的高頻分量的能量的大小的至少其中一個為規(guī)定的閾值以下的情況下,設為能夠將與前一幀不同的編碼處理決定作為當前幀的編碼處理,在并非如此的情況下,根據(jù)輸入音響信號的高頻分量為稀疏的狀態(tài),決定是設為能夠將與前一幀不同的編碼處理決定作為當前幀的編碼處理,還是將與前一幀相同的編碼處理決定作為當前幀的編碼處理。

本發(fā)明的一方式的編碼方法是,將輸入音響信號按規(guī)定時間區(qū)間的幀的每個,通過在頻域上的多個編碼處理之中被決定的編碼處理來進行編碼的編碼方法,所述編碼方法包含:第一編碼步驟,使用基于能夠變換為與輸入音響信號對應的線性預測系數(shù)的系數(shù)的頻譜包絡,對與輸入音響信號對應的頻域的系數(shù)列進行編碼;第二編碼步驟,針對與輸入音響信號對應的頻域的系數(shù)列,伴隨著劃分后的每個頻域的系數(shù)的平均能量的對數(shù)值與相鄰的頻域的平均能量的對數(shù)值之差分的可變長度編碼,進行編碼;以及決定步驟,在當前幀的輸入音響信號的頻譜的起伏大的情況或者集中度高的情況下,設為能夠決定將當前幀通過第一編碼步驟來進行編碼,在當前幀的輸入音響信號的頻譜的起伏小的情況或者集中度低的情況下,設為能夠決定將當前幀通過第二編碼步驟來進行編碼。

發(fā)明效果

通過能夠按每個幀選擇在頻域上進行編碼的多個編碼處理的其中一個的結構,從而能夠得到收聽者感到不自然的情況較少的解碼音響信號。

附圖說明

圖1是示例了編碼裝置的結構的框圖。

圖2是示例了解碼裝置的結構的框圖。

圖3是表示編碼方法的處理的流程的例的圖。

圖4是表示決定部380的處理的流程的例的圖。

圖5是表示適合編碼處理判定部382的處理的流程的例的圖。

圖6是表示第二實施方式的切換決定部383的處理的流程的例的圖。

圖7是表示第三實施方式的適合編碼處理判定部382的處理的流程的例的圖。

圖8是第一編碼處理以及第二編碼處理的概念圖。

具體實施方式

[第一實施方式]

以下,說明本發(fā)明的第一實施方式。第一實施方式是如下的結構:在通過進行在頻域上的編碼處理的多個不同的編碼處理的其中一個而對與每個幀的輸入音響信號對應的頻域的系數(shù)列進行編碼的結構中,僅在輸入音響信號或者/以及與輸入音響信號對應的頻域的系數(shù)列的高頻分量的能量小的情況下,進行編碼處理的切換。輸入音響信號的高頻分量的能量是指,輸入音響信號的高頻分量的能量的大小本身、或高頻分量的能量在輸入音響信號中占據(jù)的大小等。

<編碼裝置300>

編碼裝置300的結構在圖1中示出。編碼裝置300具備:頻域變換部110、決定部380、第一編碼部101、第二編碼部201。第一編碼部101具備:例如,線性預測分析編碼部120、頻譜包絡系數(shù)列生成部130、包絡正規(guī)化部140、正規(guī)化系數(shù)編碼部150。第二編碼部201具備:例如,領域分割部220、平均對數(shù)能量差分可變長度編碼部240、系數(shù)編碼部250。在編碼裝置300中,以規(guī)定的時間區(qū)間即幀為單位,時域的聲音音響數(shù)字信號(以下,設為輸入音響信號。)被輸入,按每個幀進行以下的處理。以下,設為當前的輸入音響信號是第f個幀,對各部的具體處理進行說明。將第f個幀的輸入音響信號設為xf(n)(n=1,...,Nt)。在此,Nt是每個幀的采樣數(shù)。

以下,針對編碼裝置300的動作進行說明。通過編碼裝置300,執(zhí)行在圖3中示例的編碼方法的各步驟的處理。

<頻域變換部110>

頻域變換部110將輸入音響信號xf(n)(n=1,...,Nt)變換為頻域的系數(shù)列、例如N點的MDCT系數(shù)列Xf(n)(n=1,...,N),并進行輸出(步驟S110)。其中,N是在頻域中的采樣數(shù),是正整數(shù)。向頻域的變換也可以通過不是MDCT的公知的變換方法來進行。

此外,當在第一編碼部101、第二編碼部201、決定部380中通過多個精度或方法得到的頻域的系數(shù)列為必須的情況下,在頻域變換部110中,通過多個精度或方法得到頻域的系數(shù)列即可。例如,在第一編碼部101和第二編碼部201將MDCT系數(shù)列作為頻域的系數(shù)列來使用,且決定部380將功率譜(power spetrum)序列作為頻域的系數(shù)列來使用的情況下,頻域變換部110從輸入音響信號中求出MDCT系數(shù)列和功率譜序列即可。此外,例如,在第一編碼部101和第二編碼部201將MDCT系數(shù)列作為頻域的系數(shù)列來使用,且決定部380將每個頻帶的能量的序列作為頻域的系數(shù)列來使用的情況下,頻域變換部110從輸入音響信號中求出MDCT系數(shù)列和每個頻帶的能量的序列即可。此外,例如,在第一編碼部101和第二編碼部201將MDCT系數(shù)列作為頻域的系數(shù)列來使用,且決定部380的切換可否判定部381將每個頻帶的能量的序列作為頻域的系數(shù)列來使用,且決定部380的適合編碼處理判定部382將功率譜序列作為頻域的系數(shù)列來使用的情況下,頻域變換部110從輸入音響信號中求出MDCT系數(shù)列和每個頻帶的能量的序列和功率譜序列即可。

<決定部380>

決定部380在前一幀的輸入音響信號的高頻分量的能量的大小、和當前幀的輸入音響信號的高頻分量的能量的大小的至少其中一個比規(guī)定的閾值小的情況下,能夠將與前一幀不同的編碼處理決定為當前幀的編碼處理(步驟S380)。

換而言之,決定部380進行如下判定,進行切換控制以使根據(jù)該判定結果來對當前幀的頻域的系數(shù)列進行編碼,其中,所述判定是在至少輸入音響信號的高頻分量的能量小的情況下,允許通過與對前一幀的頻域的系數(shù)列進行了編碼的編碼處理不同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼,在并非如此的情況下不允許通過與對前一幀的頻域的系數(shù)列進行了編碼的編碼處理不同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼。

決定部380具備:例如,切換可否判定部381、適合編碼處理判定部382、切換決定部383、切換部384。以下,針對決定部380的一例進行說明。決定部380進行在圖4中示例的各步驟的處理。

<切換可否判定部381>

切換可否判定部381在前一幀的輸入音響信號的高頻分量的能量的大小、與當前幀的輸入音響信號的高頻分量的能量的大小的至少其中一個比規(guī)定的閾值小的情況下,判定為可切換、即能夠通過與對前一幀的頻域的系數(shù)列進行了編碼的編碼處理不同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼,在并非如此的情況下判定為不可切換、即不允許通過與對前一幀的頻域的系數(shù)列進行了編碼的編碼處理不同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼,并輸出判定結果(步驟S381)。

以下,對切換可否判定部381的動作的例進行說明。首先,說明作為輸入音響信號的高頻分量的能量的大小,使用MDCT系數(shù)列的高頻的能量的例。

切換可否判定部381首先分別通過下述的式(1)求出前一幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)的高頻的能量Ehf-1,通過下述的式(2)求出當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)的高頻的能量Ehf(步驟S3811)。在式(1)和式(2)中,M是比N小的預先決定的正整數(shù)。

【數(shù)1】

切換可否判定部381接著在前一幀的高頻的能量Ehf-1和當前幀的高頻的能量Ehf的至少其中一個比預先決定的閾值TH1小的情況、即Ehf-1<TH1以及/或者Ehf<TH1的情況下判定為可切換,在并非如此的情況下判定為不可切換,輸出切換可否的信息(步驟S3812)。

另外,在當前幀的步驟S3811中求出的前一幀的高頻的能量Ehf-1與在前一幀的步驟S3811中求出的當前幀的高頻的能量Ehf是相同的。因此,如果將計算出的高頻的能量Ehf至少直到緊后的幀為止存儲在切換可否判定部381內,則不需要計算前一幀的高頻的能量的比例Ehf-1。

接著,說明作為輸入音響信號的高頻分量的能量的大小,使用高頻的能量相對于MDCT系數(shù)列的全部能量的比例的例。

切換可否判定部381首先分別通過下述的式(1A)來求出前一幀的高頻的能量相對于MDCT系數(shù)列Xf-1(n)(n=1,...,N)的全部能量的比例Ehf-1,通過下述的式(2A)來求出當前幀的高頻的能量相對于MDCT系數(shù)列Xf(n)(n=1,...,N)的全部能量的Ehf比例(步驟S3811)。在式(1A)和式(2A)中,M是預先決定的正整數(shù)。

【數(shù)2】

切換可否判定部381接著在前一幀的高頻的能量相對于全部能量的比例Ehf-1與當前幀的高頻的能量相對于全部能量的比例Ehf的至少其中一個比預先決定的閾值TH1小的情況、即Ehf-1<TH1以及/或者Ehf<TH1的情況下判定為可切換,在并非如此的情況下判定為不可切換,并輸出切換可否的信息(步驟S3812)。

另外,在當前幀的步驟S3811中求出的前一幀的高頻的能量相對于全部能量的比例Ehf-1與在前一幀的步驟S3811中求出的當前幀的高頻的能量相對于全部能量的比例Ehf是相同的。因此,如果將計算出的高頻的能量相對于全部能量的比例Ehf至少直到緊后的幀為止存儲在切換可否判定部381內,則不需要計算前一幀的高頻的能量相對于全部能量的比例Ehf-1。

另外,在上述的2個例中,在Ehf-1<TH1以及/或者Ehf<TH1的情況下判定為可切換,在并非如此的情況下判定為不可切換,但是,也可以在Ehf-1<TH1且Ehf<TH1的情況下判定為可切換,在并非如此的情況下判定為不可切換。即,也可以在前一幀的輸入音響信號的高頻分量的能量的大小與當前幀的輸入音響信號的高頻分量的能量的大小的雙方比規(guī)定的閾值小的情況下,判定為可切換、即能夠通過與對前一幀的頻域的系數(shù)列進行了編碼的編碼處理不同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼,在并非如此的情況下判定為不可切換、即不允許通過與對前一幀的頻域的系數(shù)列進行了編碼的編碼處理不同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼。

此外,在上述的例中,使用MDCT系數(shù)列求出了高頻的能量或高頻的能量相對于全部能量的比例,但是,也可以使用功率譜序列或每個頻帶的能量的序列來求出高頻的能量或高頻的能量相對于全部能量的比例。

<適合編碼處理判定部382>

適合編碼處理判定部382判定與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第一編碼部101的編碼處理和第二編碼部201的編碼處理的哪一個,并輸出判定結果(步驟S382)。

以下,說明適合編碼處理判定部382的動作的一例。適合編碼處理判定部382進行在圖5中示例的各步驟的處理。在以下的例中,第一編碼部101的編碼處理是非專利文獻1中示例的、使用了基于能夠變換為線性預測系數(shù)的系數(shù)的頻譜包絡的編碼處理,第二編碼部201的編碼處理是非專利文獻2中示例的、伴隨著劃分后的每個頻域的系數(shù)的平均能量的對數(shù)值與相鄰的頻域的平均能量的對數(shù)值之差分的可變長度編碼的編碼處理。

在該例中,在輸入音響信號的頻譜包絡的起伏大或者/以及集中度高的情況下,判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第一編碼部101的編碼處理,在輸入音響信號的頻譜包絡的起伏小或者/以及集中度低的情況下,判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第二編碼部201的編碼處理,并輸出判定結果。

作為估計頻譜的起伏或集中度的方法,可以采用任意的方法,在以下的例中,針對估計頻譜或者該包絡的谷的深度的結構進行說明。在該結構中,在頻譜或者該包絡的谷淺時被判定為頻譜的起伏小且集中度低,在頻譜或者該包絡的谷深時被判定為頻譜的起伏大且集中度高。頻譜或者該包絡的谷淺也可以說成是噪聲基地(noise floor)高。此外,頻譜或者該包絡的谷深也可以說成是噪聲基地低。

適合編碼處理判定部382首先將當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)劃分為每P采樣的Q個部分系數(shù)列XSf(1)(n)(n=1,...,P),XSf(2)(n)(n=1,...,P),...,XSf(Q)(n)(n=1,...,P)(步驟S3821)。P以及Q是滿足P×Q=N的關系的正整數(shù)。也可以P=1。此外,在此設為在適合編碼處理判定部382中也使用在第一編碼部101或者第二編碼部201中成為編碼處理的對象的頻域的系數(shù)列即MDCT系數(shù)列Xf(n)(n=1,...,N)的結構,但是,也可以將通過與MDCT系數(shù)列Xf(n)(n=1,...,N)不同的精度或方法來變換為頻域而得到的頻域的系數(shù)列、例如功率譜序列,作為適合編碼處理判定部382的處理的對象。

適合編碼處理判定部382接著求出部分系數(shù)列XSf(1)(n)(n=1,...,P),XSf(2)(n)(n=1,...,P),...,XSf(Q)(n)(n=1,...,P)的每一個的功率的平均值或者其對數(shù)值的序列AVEXS(q)(q=1,…,Q)(步驟S3822)。功率的平均值是通過式(3)求出的AVEXS(q)。此外,功率的平均值的對數(shù)值是通過式(3A)求出的AVEXS(q)。

【數(shù)3】

適合編碼處理判定部382接著針對功率的平均值或者功率的平均值的對數(shù)值的序列AVEXS(1),AVEXS(2),...,AVEXS(Q)的各元素,判定是否比相鄰的2個元素之中的任一個都小,求出被判定的元素數(shù)(步驟S3823)。即,求出滿足式(4)的q的個數(shù)Vally。

【數(shù)4】

AVEXS(q)-min(AVEXS(q-1),AVEXS(q+1))<0 (4)

適合編碼處理判定部382接著求出與滿足式(4)的q對應的Vally個AVEXS(q)的平均值EV、即谷的部分領域的平均值EV(步驟S3824)。在AVEXS(q)是功率的平均值的情況下,步驟S3824中求出的EV是谷的部分的部分領域的功率的平均值。在AVEXS(q)是功率的平均值的對數(shù)值的情況下,步驟S3824中求出的EV是部分領域的功率的平均值的對數(shù)值的谷的部分的平均值。此外,適合編碼處理判定部382求出所有的部分領域的功率的平均值或者功率的平均值的對數(shù)值(步驟S3825)。所有的部分領域的功率的平均值是MDCT系數(shù)列Xf(n)(n=1,...,N)的功率的平均值,是通過式(11)求出的E。所有的部分領域的功率的平均值的對數(shù)值是MDCT系數(shù)列Xf(n)(n=1,...,N)的功率的平均值的對數(shù)值,是通過式(11A)求出的E。

【數(shù)5】

適合編碼處理判定部382接著在所有的部分領域的AVEXS(q)的平均值E和谷的部分領域的AVEXS(q)的平均值EV之差為規(guī)定的閾值TH2以下的情況下,被估計為是頻譜的谷淺、頻譜包絡的起伏少或者集中度低的頻譜,所以,判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第二編碼部201的編碼處理。相反地,在所有的部分領域的AVEXS(q)的平均值E與谷的部分領域的AVEXS(q)的平均值EV之差比閾值TH2大的情況下,被估計為頻譜的谷深、頻譜包絡的起伏大或者集中度高的頻譜,所以,判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第一編碼部101的編碼處理。適合編碼處理判定部382對哪個編碼處理適合的信息進行輸出(步驟S3826)。適合的編碼處理的信息也稱為適合信息。

此外,在步驟S3821中,也可以設為對每個部分系數(shù)列不同的采樣數(shù)。例如,也可以將當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)劃分為Q個部分系數(shù)列XSf(1)(n)(n=1,...,P1),XSf(2)(n)(n=1,...,P2),...,XSf(Q)(n)(n=1,...,PQ)。P1,P2,...,PQ是滿足P1+P2+...+PQ=N的正整數(shù)。此外,優(yōu)選為P1,P2,...,PQ滿足P1≤P2≤...≤PQ。此外,Q是正整數(shù)。

<切換決定部383>

切換決定部383根據(jù)切換可否判定部381得到的切換可否的信息、和適合編碼處理判定部382得到的哪個編碼處理適合的信息,決定將當前幀的頻域的系數(shù)列在第一編碼部101中進行編碼還是在第二編碼部201中進行編碼,并輸出能夠確定所決定的編碼處理的碼即切換碼(步驟S383)。所輸出的切換碼被輸入至解碼裝置400。在此,切換決定部383在為不可切換的情況下,不論當前幀適合的編碼處理是哪個編碼處理,都決定通過與前一幀相同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼。此外,在為可切換的情況下,不論前一幀的編碼處理是哪個編碼處理,都決定通過當前幀適合的編碼處理來對當前幀的頻域的系數(shù)列進行編碼。其中,也可以包含如下情況:即使在為可切換的情況下,也決定為不是通過當前幀適合的編碼處理,而是通過與前一幀相同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼。

以下,說明切換決定部383的動作的一例。在以下的例中,第一編碼部101的編碼處理是非專利文獻1中示例的、使用了基于能夠變換為線性預測系數(shù)的系數(shù)的頻譜包絡的編碼處理,第二編碼部201的編碼處理是非專利文獻2中示例的、伴隨著劃分后的每個頻域的系數(shù)的平均能量的對數(shù)值與相鄰的頻域的平均能量的對數(shù)值之差分的可變長度編碼的編碼處理。

切換決定部383在切換可否判定部381得到的切換可否的信息表示不可切換的情況、以及/或者、適合編碼處理判定部382得到的哪個編碼處理適合的信息表示與前一幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)的編碼處理相同的編碼處理的情況下,將與前一幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)的編碼處理相同的編碼處理決定為當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)的編碼處理。

即,在前一幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)在第一編碼部101中被編碼的情況、且切換可否判定部381得到的切換可否的信息表示不可切換的情況下,決定為當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)也在第一編碼部101中進行編碼。此外,在前一幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)在第一編碼部101中被編碼的情況、且適合編碼處理判定部382得到的哪個編碼處理適合的信息表示第一編碼部101的編碼處理的情況下,也決定為當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)也在第一編碼部101中進行編碼。

此外,在前一幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)在第二編碼部201中被編碼的情況、且切換可否判定部381得到的切換可否的信息表示不可切換的情況下,決定為當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)也在第二編碼部201中進行編碼。此外,在前一幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)在第二編碼部201被編碼的情況、且適合編碼處理判定部382得到的哪個編碼處理適合的信息表示第二編碼部的編碼處理的情況下,也決定為當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)也在第二編碼部201中進行編碼。

在切換可否判定部381得到的切換可否的信息表示可切換的情況、且適合編碼處理判定部382得到的哪個編碼處理適合的信息表示與前一幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)的編碼處理不同的編碼處理的情況下,將與前一幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)的編碼處理不同的編碼處理決定為當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)的編碼處理。即,在前一幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)在第一編碼部101中被編碼的情況、且切換可否判定部381得到的切換可否的信息表示可切換,適合編碼處理判定部382得到的哪個編碼處理適合的信息表示第二編碼部201的編碼處理的情況下,決定為當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)在第二編碼部201中進行編碼。此外,在前一幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)在第二編碼部201中被編碼的情況、且切換可否判定部381得到的切換可否的信息表示可切換,適合編碼處理判定部382得到的哪個編碼處理適合的信息表示第一編碼部101的編碼處理的情況下,決定為當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)在第一編碼部101中進行編碼。

<切換部384>

切換部384進行控制以使將頻域變換部110輸出的MDCT系數(shù)列Xf(n)(n=1,...,N)輸入至第一編碼部101或者第二編碼部201,使得通過在切換決定部383中決定的編碼處理對當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)進行編碼(步驟S384)。此外,在為了當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)的編碼,當前幀的輸入音響信號xf(n)(n=1,...,Nt)也是必須的情況下,將當前幀的輸入音響信號xf(n)(n=1,...,Nt)也輸入至第一編碼部101或者/以及第二編碼部201。

例如,在第一編碼部101的編碼處理是非專利文獻1中示例的、使用了基于能夠變換為線性預測系數(shù)的系數(shù)的頻譜包絡的編碼處理,且第二編碼部201的編碼處理是非專利文獻2中示例的、伴隨著劃分后的每個頻域的系數(shù)的平均能量與相鄰的頻域的平均能量之差分的可變長度編碼的編碼處理的情況下,由于僅在第一編碼部101中當前幀的輸入音響信號xf(n)(n=1,...,Nt)成為必須,因此,在將MDCT系數(shù)列Xf(n)(n=1,...,N)輸入至第一編碼部101的情況下將當前幀的輸入音響信號xf(n)(n=1,...,Nt)也輸入至第一編碼部101。

<第一編碼部101、第二編碼部201>

第一編碼部101和第二編碼部201都進行將頻域的系數(shù)列編碼的編碼處理,但是,進行的編碼處理相互不同。即,第一編碼部101通過與第二編碼部201不同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼,輸出作為所得到的碼的第一碼(步驟S101)。此外,第二編碼部201通過與第一編碼部101不同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼,輸出作為所得到的碼的第二碼(步驟S201)。例如,第一編碼部101進行使用了基于能夠變換為線性預測系數(shù)的系數(shù)的頻譜包絡的編碼處理,第二編碼部201進行使用了劃分后的每個頻域的系數(shù)的平均能量的編碼處理。

以下,說明第一編碼部101和第二編碼部201的動作的一例。在以下的例中,第一編碼部101的編碼處理是非專利文獻1中示例的、使用了基于能夠變換為線性預測系數(shù)的系數(shù)的頻譜包絡的編碼處理,第二編碼部201的編碼處理是非專利文獻2中示例的、伴隨著劃分后的每個頻域的系數(shù)的平均能量與相鄰的頻域的平均能量之差分的可變長度編碼的編碼處理。

在該例中,第一編碼部101的第一編碼處理是如圖8的左邊示例那樣通過能夠變換為線性預測系數(shù)的系數(shù)來表現(xiàn)頻域的頻譜包絡形狀的處理。另一方面,第二編碼部201的第二編碼處理是如圖8的右邊示例那樣通過比例因子帶(scale factor band;頻域系數(shù)列的向多個領域的劃分)來表現(xiàn)包絡形狀的處理。根據(jù)第二編碼處理,由于使用各領域的平均的高度的差分值的可變長度編碼,因此,在平均值平滑變化的情況下,也可以說效率非常好。

基于決定部380的決定或者選擇的結果,進行作為在頻域中的多個編碼處理的第一編碼部101的處理以及第二編碼部201的處理之中的一個。

<第一編碼部101>

第一編碼部101具備:線性預測分析編碼部120、頻譜包絡系數(shù)列生成部130、包絡正規(guī)化部140、正規(guī)化系數(shù)編碼部150。在第一編碼部101中,輸入當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)和輸入音響信號xf(n)(n=1,...,Nt),輸出包含線性預測系數(shù)碼CLf和正規(guī)化系數(shù)碼CNf的第一碼。所輸出的第一碼被輸入至解碼裝置400。另外,第一編碼部101是從非專利文獻1所記載的編碼處理中除去了將輸入音響信號變換為頻域的系數(shù)列的部分的部件。即,在頻域變換部110和第一編碼部101中進行的編碼處理與非專利文獻1所記載的編碼處理是同樣的。

<線性預測分析編碼部120>

線性預測分析部120對輸入音響信號xf(n)(n=1,...,Nt)進行線性預測分析而求出能夠變換為線性預測系數(shù)的系數(shù),對能夠變換為線性預測系數(shù)的系數(shù)進行編碼,得到線性預測系數(shù)碼CLf、和能夠變換為與線性預測系數(shù)碼CLf對應的量化后的線性預測系數(shù)的系數(shù),并輸出(步驟S120)。能夠變換為線性預測系數(shù)的系數(shù)是指,線性預測系數(shù)其本身、PARCOR系數(shù)(偏自相關系數(shù))或者LSP參數(shù)等。

<頻譜包絡系數(shù)列生成部130>

頻譜包絡系數(shù)列生成部130得到與線性預測分析編碼部120得到的能夠變換為量化后的線性預測系數(shù)的系數(shù)對應的功率譜包絡系數(shù)列Wf(n)(n=1,...,N),并輸出(步驟S130)。

<包絡正規(guī)化部140>

包絡正規(guī)化部140使用頻譜包絡系數(shù)列計算部130得到的功率譜包絡系數(shù)列Wf(n)(n=1,...,N),對頻域變換部110得到的MDCT系數(shù)列的各系數(shù)Xf(n)(n=1,...,N)進行正規(guī)化,對正規(guī)化MDCT系數(shù)列XNf(n)(n=1,...,N)進行輸出(步驟S140)。即,求出將MDCT系數(shù)列Xf(n)(n=1,...,N)的各系數(shù)除以功率譜包絡系數(shù)列Wf(n)(n=1,...,N)中包含的對應的系數(shù)后的值的序列,作為正規(guī)化MDCT系數(shù)列XNf(n)(n=1,...,N)。

<正規(guī)化系數(shù)編碼部150>

正規(guī)化系數(shù)編碼部150對包絡正規(guī)化部140得到的正規(guī)化MDCT系數(shù)列XNf(n)(n=1,...,N)進行編碼而得到正規(guī)化系數(shù)碼CNf(步驟S150)。

<第二編碼部201>

此外,第二編碼部201具備:領域分割部220、平均對數(shù)能量差分可變長度編碼部240、系數(shù)編碼部250。在第二編碼部201中,輸入當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N),輸出包含平均能量碼和差分系數(shù)碼的第二碼。所輸出的第二碼被輸入至解碼裝置400。另外,第二編碼部201是從非專利文獻2所記載的編碼處理中除去了將輸入音響信號變換為頻域的系數(shù)列的部分的部件。即,在頻域變換部110和第二編碼部201中進行的編碼處理與非專利文獻2所記載的編碼處理是同樣的。

<領域分割部220>

領域分割部220將頻域變換部110得到的MDCT系數(shù)列Xf(n)(n=1,...,N)劃分為越低頻的部分領域則采樣數(shù)越少而越高頻的部分領域則采樣數(shù)越多的多個部分領域(步驟S220)。若將部分領域的個數(shù)設為R,將各部分領域中包含的采樣數(shù)設為S1,...,SR,則MDCT系數(shù)列的各系數(shù)Xf(n)(n=1,...,N)從最低頻的采樣起依次按各部分領域劃分為XBf(1)(n)(n=1,...,S1),XBf(2)(n)(n=1,...,S2),...,XBf(R)(n)(n=1,...,SR)。R以及S1,...,SR是正整數(shù)。S1,...,SR設為滿足S1≤S2≤...≤SR的關系。將XBf(1)(n)(n=1,...,S1),XBf(2)(n)(n=1,...,S2),...,XBf(R)(n)(n=1,...,SR)稱作部分領域系數(shù)列。

<平均對數(shù)能量差分可變長度編碼部240>

平均對數(shù)能量差分可變長度編碼部240針對領域分割部220得到的各部分領域,求出部分領域中包含的系數(shù)的平均能量,針對部分領域的平均能量分別在對數(shù)軸上進行量化,對與相鄰的部分領域的平均能量的對數(shù)軸上的量化值之差進行可變長度編碼,得到平均能量碼CAf(步驟S240)。

平均對數(shù)能量差分可變長度編碼部240首先通過式(5)而求出各部分領域r(r=1,...,R)的平均能量EXB(r)(r=1,...,R)(步驟S2401)。

【數(shù)6】

平均對數(shù)能量差分可變長度編碼部240接著針對各部分領域,進行平均能量EXB(r)(r=1,...,R)的對數(shù)領域上的標量量化(scalar quantization),得到平均能量的對數(shù)領域上的量化值Q(log(EXB(r))(r=1,...,R)(步驟S2402)。平均對數(shù)能量差分可變長度編碼部240接著針對各部分領域,求出平均能量的對數(shù)領域上的量化值Q(log(EXB(r))、與相鄰的部分領域中包含的系數(shù)的平均能量的對數(shù)領域上的量化值Q(log(EXB(r-1))之差DiffEXB(r)(步驟S2403)。其中,在r=1的情況下,將平均能量EXB(1)的對數(shù)值的標量量化值Q(log(EXB(r))其本身設為DiffEXB(1)。將DiffEXB(r)(r=1,...,R)稱作平均對數(shù)能量差分。即,DiffEXB(r)(r=1,...,R)通過式(6)而求出。其中,將Q()設為標量量化函數(shù),設為如下的函數(shù):輸出對將輸入以預先決定的值進行正規(guī)化(除法運算)所得的值的小數(shù)部分進行四舍五入而得到的整數(shù)值。

【數(shù)7】

平均對數(shù)能量差分可變長度編碼部240接著對平均對數(shù)能量差分DiffEXB(r)(r=1,...,R)進行可變長度編碼而得到平均能量碼CAf(步驟S2404)。另外,由于平均對數(shù)能量差分DiffEXB(r)的絕對值小的情況統(tǒng)計學上的出現(xiàn)頻度更高,因此,可變長度碼被預先決定為與絕對值大的情況相比碼量變少。即,在平均對數(shù)能量的每個領域的變動小的情況下,即頻譜包絡的起伏小的情況、頻譜包絡的集中度低的情況下,存在能夠縮短平均能量碼CAf的碼的長度的趨勢。

<系數(shù)編碼部250>

系數(shù)編碼部250使用平均對數(shù)能量差分可變長度編碼部240得到的平均能量的對數(shù)領域上的量化值Q(log(EXB(r))(r=1,...,R),對領域分割部220得到的部分領域系數(shù)列XBf(1)(n)(n=1,...,S1),XBf(2)(n)(n=1,...,S2),...,XBf(R)(n)(n=1,...,SR)的各系數(shù)進行例如標量量化,得到系數(shù)碼CDf(步驟S250)。在該標量量化中使用的量化步長(step width)或量化比特數(shù)是對領域分割部220得到的部分領域系數(shù)列XBf(1)(n)(n=1,...,S1),XBf(2)(n)(n=1,...,S2),...,XBf(R)(n)(n=1,...,SR)的每一個,根據(jù)平均能量的量化值Q(EXB(r))(r=1,...,R)而決定的。另外,平均能量的量化值Q(EXB(r))(r=1,...,R)是將平均能量的對數(shù)領域上的量化值Q(log(EXB(r))(r=1,...,R)通過式(7)設為線性領域的值從而求出的。

【數(shù)8】

系數(shù)編碼部250首先考慮與各領域對應的平均能量的對數(shù)領域上的量化值Q(log(EXB(r))(r=1,...,R)、和該值與通過頻率估計的聽覺上不能識別的頻譜等級的能量的對數(shù)值之差的值,將作為系數(shù)碼CDf的碼量而給定的比特數(shù)分配給各部分領域系數(shù)列的各系數(shù)(步驟S2501)。

系數(shù)編碼部250接著根據(jù)各部分領域的平均能量的量化值Q(EXB(r))(r=1,...,R)和所分配的比特數(shù),求出各部分領域系數(shù)列的各系數(shù)的標量量化的步長(步驟S2502)。

系數(shù)編碼部250接著將各部分領域系數(shù)列的各系數(shù)以所決定的步長和比特數(shù)進行量化,進而對量化后的各系數(shù)的整數(shù)值進行可變長度編碼,得到系數(shù)碼CDf(步驟S2503)。

<解碼裝置400>

在圖2中示出解碼裝置400的結構。解碼裝置400具備:切換部480、第一解碼部401第二解碼部501。第一解碼部401具備:例如,線性預測解碼部420、頻譜包絡系數(shù)列生成部430、正規(guī)化系數(shù)解碼部450以及包絡逆正規(guī)化部440。第二解碼部501具備:例如,平均對數(shù)能量差分可變長度解碼部540以及系數(shù)解碼部550。在解碼裝置400中,以作為規(guī)定的時間區(qū)間的幀為單位,輸入包含切換碼和輸入碼的碼。在是由第一編碼部101編碼后的幀的情況下,輸入碼包含線性預測系數(shù)碼CLf和正規(guī)化系數(shù)碼CNf,在是由第二編碼部201編碼后的幀的情況下,輸入碼包含平均能量碼CAf和系數(shù)碼CDf。以下,設為成為當前處理的對象的幀是第f個幀,對各部的具體處理進行說明。

以下,說明解碼裝置400的動作。

<切換部480>

切換部480根據(jù)所輸入的切換碼,決定將當前幀的輸入碼在第一解碼部401中進行解碼還是在第二解碼部501中進行解碼,進行控制以使將輸入碼輸入至第一解碼部401或者第二解碼部501,使得能夠進行所決定的解碼處理(步驟S480)。

具體地,切換部480在所輸入的切換碼是用于確定第一編碼部101的編碼處理的碼、即用于確定使用了基于能夠變換為線性預測系數(shù)的系數(shù)的頻譜包絡的編碼處理的碼的情況下,進行控制以使將輸入碼輸入至進行與第一編碼部101的編碼處理對應的解碼處理的第二解碼部501。此外,在所輸入的切換碼是用于確定第二編碼部201的編碼處理的碼、即用于確定伴隨著劃分后的每個頻域的系數(shù)的平均能量與相鄰的頻域的平均能量之差分的可變長度編碼的編碼處理的碼的情況下,進行控制以使將輸入碼輸入至進行與第二編碼部201的編碼處理對應的解碼處理的第二解碼部501。

<第一解碼部401>

第一解碼部401具備:線性預測解碼部420、頻譜包絡系數(shù)列生成部430、正規(guī)化系數(shù)解碼部450、包絡逆正規(guī)化部440。在第一解碼部401中,輸入當前幀的線性預測系數(shù)碼CLf和正規(guī)化系數(shù)碼CNf,輸出頻域的系數(shù)列Xf(n)(n=1,...,N)。

<線性預測解碼部420>

線性預測解碼部420對輸入碼中包含的線性預測系數(shù)碼CLf進行解碼,得到能夠變換為解碼后的線性預測系數(shù)的系數(shù)。能夠變換為解碼后的線性預測系數(shù)的系數(shù)與編碼裝置300的線性預測分析編碼部120得到的能夠變換為量化后的線性預測系數(shù)的系數(shù)是相同的。此外,線性預測解碼部420進行的解碼處理是與編碼裝置300的線性預測分析編碼部120進行的編碼處理對應的處理。另外,能夠變換為線性預測系數(shù)的系數(shù)是指,線性預測系數(shù)其本身、PARCOR系數(shù)(偏自相關系數(shù))或者LSP參數(shù)等。

<頻譜包絡系數(shù)列生成部430>

頻譜包絡系數(shù)生成部430得到與線性預測解碼部420得到的能夠變換為解碼后的線性預測系數(shù)的系數(shù)對應的功率譜包絡系數(shù)列Wf(n)(n=1,...,N),并輸出。其中,N是頻域中的采樣數(shù),且是正整數(shù)。

<正規(guī)化系數(shù)解碼部450>

正規(guī)化系數(shù)解碼部450對所輸入的正規(guī)化系數(shù)碼CNf進行解碼,得到解碼正規(guī)化MDCT系數(shù)列^XNf(n)(n=1,...,N)(步驟S450)。在此,正規(guī)化系數(shù)解碼部450進行的解碼處理是與編碼裝置300的正規(guī)化系數(shù)編碼部150進行的編碼處理對應的處理。即,當在編碼裝置300中進行了向不是MDCT的頻域的變換處理的情況下,^XNf(n)(n=1,...,N)是與編碼裝置300的向頻域的變換處理對應的不是MDCT的域的頻域的系數(shù)列。另外,解碼正規(guī)化MDCT系數(shù)列^XNf(n)(n=1,...,N)對應于輸入至編碼裝置300的正規(guī)化系數(shù)編碼部150的正規(guī)化MDCT系數(shù)列XNf(n)(n=1,...,N),由于各自的系數(shù)中包含量化誤差,因此,設為對XNf(n)附加了“^”的^XNf(n)。

<包絡逆正規(guī)化部440>

包絡逆正規(guī)化部440使用頻譜包絡系數(shù)列計算部430得到的功率譜包絡系數(shù)列Wf(n)(n=1,...,N),對正規(guī)化系數(shù)解碼部450得到的解碼正規(guī)化MDCT系數(shù)列的各系數(shù)^XNf(n)(n=1,...,N)進行逆正規(guī)化,并輸出解碼MDCT系數(shù)列^XNf(n)(n=1,...,N)(步驟S440)。即,求出將解碼正規(guī)化MDCT系數(shù)列XNf(n)(n=1,...,N)的各系數(shù)與功率譜包絡系數(shù)列Wf(n)(n=1,...,N)的各系數(shù)對應的系數(shù)之間進行乘法運算而得到的值的序列,作為解碼MDCT系數(shù)列^Xf(n)(n=1,...,N)。

<第二解碼部501>

第二解碼部501具備:平均對數(shù)能量差分可變長度解碼部540、系數(shù)解碼部550。在第二解碼部501中,輸入當前幀的平均能量碼CAf和系數(shù)碼CDf,輸出頻域的系數(shù)列Xf(n)(n=1,...,N)。

<平均對數(shù)能量差分可變長度解碼部540>

平均對數(shù)能量差分可變長度解碼部540對所輸入的平均能量碼CAf進行解碼,得到部分領域的解碼平均能量Q(EXB(r))(r=1,...,R)(步驟S540)。另外,解碼平均能量由于與在編碼裝置300的系數(shù)編碼部250中得到的平均能量的量化值是相同的,因此,使用了相同的記號Q(EXB(r))。

平均對數(shù)能量差分可變長度解碼部540首先對平均能量碼CAf進行解碼,得到各部分領域的對數(shù)領域上的能量的差DiffEXB(r)(r=1,...,R)(步驟S5401)。在此,平均對數(shù)能量差分可變長度解碼部540進行的解碼處理是與編碼裝置300的平均對數(shù)能量差分可變長度編碼部240進行的編碼處理對應的處理。另外,各部分領域的對數(shù)領域上的能量的差由于與在編碼裝置300的平均對數(shù)能量差分可變長度編碼部240中得到的各部分領域的對數(shù)領域上的能量的差是相同的,因此,使用了相同的記號DiffEXB(r)。

平均對數(shù)能量差分可變長度解碼部540接著對每個部分領域,將對數(shù)領域上的能量的差DiffEXB(r)(r=1,...,R)加上相鄰的部分領域的平均能量的對數(shù)領域上的解碼值Q(log(EXB(r-1))),得到平均能量的對數(shù)領域上的解碼值Q(log(EXB(r))(步驟S5402)。另外,平均能量的對數(shù)領域上的解碼值由于與在編碼裝置300的平均對數(shù)能量差分可變長度編碼部240中得到的平均能量的對數(shù)領域上的量化值是相同的,因此,使用了相同的記號Q(log(EXB(r))。【數(shù)9】

平均對數(shù)能量差分可變長度解碼部540接著得到將平均能量的對數(shù)領域上的解碼值Q(log(EXB(r-1)))(r=1,...,R)設為線性領域的值后的值,作為解碼平均能量Q(EXB(r))(r=1,...,R)(步驟S5403)。

<系數(shù)解碼部550>

系數(shù)解碼部550使用在平均對數(shù)能量差分可變長度解碼部540中得到的解碼平均能量Q(EXB(r))(r=1,...,R),對系數(shù)碼CDf進行解碼從而得到解碼系數(shù)列^Xf(n)(n=1,...,N)(步驟S550)。在此,系數(shù)解碼部550進行的解碼處理是與編碼裝置300的系數(shù)編碼部250進行的編碼處理對應的處理。所輸入的系數(shù)碼CDf是在編碼裝置300的系數(shù)編碼部250中對各部分領域系數(shù)列的各系數(shù)進行可變長度編碼而得到的,因此,與系數(shù)碼CDf之中的各系數(shù)對應的碼部分的碼長度能夠自動復原。此外,根據(jù)在平均對數(shù)能量差分可變長度解碼部540中得到的解碼平均能量Q(EXB(r)),求出各領域的量化步長。基于此,能夠根據(jù)系數(shù)碼CDf而得到頻域的解碼MDCT系數(shù)列^Xf(n)(n=1,...,N)。

<時域變換部410>

時域變換部410將N點的解碼MDCT系數(shù)列^Xf(n)(n=1,...,N)變換到時域,得到解碼音響信號^xf(n)(n=1,...,Nt),并進行輸出(步驟S410)。其中,Nt是時域上的采樣數(shù),且是正整數(shù)。當在編碼裝置300的頻域變換部110進行了向不是MDCT的頻域的變換的情況下,進行與該變換處理對應的向時域的變換處理即可。

根據(jù)第一實施方式,由于僅在輸入音響信號的高頻的能量小的情況下能夠進行編碼處理以及解碼處理的切換,因此,即使在安裝了高頻分量的量化特性不同的多個編碼處理以及解碼處理的情況下,也能夠得到收聽者感到不自然的情況較少的解碼音響信號。

根據(jù)第一實施方式,此外,不實際嘗試進行編碼,就能夠選擇在使用了基于能夠變換為線性預測系數(shù)的系數(shù)的頻譜包絡的編碼處理和使用了劃分后的每個頻域的系數(shù)的平均能量的編碼處理之中適合于輸入音響信號的編碼處理,因此,能夠通過較少的演算處理量來進行適合于輸入音響信號的編碼處理。

根據(jù)第一實施方式,進而,能夠從使用了基于能夠變換為線性預測系數(shù)的系數(shù)的頻譜包絡的編碼處理和使用了劃分后的每個頻域的系數(shù)的平均能量的編碼處理之中選擇編碼處理并進行編碼,因此,無論是輸入音響信號的頻譜的起伏大的情況或者集中度高的情況下還是并非如此的情況下,都能夠與輸入音響信號的特性無關地進行高效率的編碼處理。

[第二實施方式]

在第一實施方式中,在輸入音響信號的高頻分量的能量的大小較大的情況下必定通過與前一幀的編碼處理相同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼,但是,在第二實施方式中,即使在輸入音響信號的高頻分量的能量的大小較大的情況下,也在輸入音響信號的高頻分量為稀疏的狀態(tài)下,允許通過與前一幀的編碼處理不同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼。

第二實施方式的編碼裝置在輸入音響信號的高頻分量的能量小的情況下,能夠將與前一幀不同的編碼處理決定為當前幀的編碼處理,在并非如此的情況下,根據(jù)輸入音響信號的高頻分量為稀疏的狀態(tài),決定是能夠將與前一幀不同的編碼處理決定為當前幀的編碼處理,還是將與前一幀相同的編碼處理決定為當前幀的編碼處理。

第二實施方式的編碼裝置的結構是與第一實施方式相同的圖1。在第二實施方式的編碼裝置300中,除了決定部380內的切換可否判定部381和切換決定部383的處理不同的部分以外,與第一實施方式的編碼裝置300是相同的。第二實施方式的解碼裝置的結構是與第一實施方式相同的圖2,各部的處理與第一實施方式的解碼裝置也是相同的。以下,說明進行與第一實施方式的編碼裝置300不同的處理的決定部380內的切換可否判定部381和切換決定部383。

<切換可否判定部381>

切換可否判定部381在前一幀的輸入音響信號的高頻分量的能量的大小、和當前幀的輸入音響信號的高頻分量的能量的大小的至少其中一個比規(guī)定的閾值小的情況下,判定為可切換、即設為能夠通過與對前一幀的頻域的系數(shù)列進行編碼的編碼處理不同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼,并輸出判定結果(步驟S381)。在上述以外的情況下,即沒有判定為可切換也沒有判定為不可切換,將表示沒有判定為任一個的信息作為判定結果進行輸出,或者不輸出判定結果。作為輸入音響信號的高頻分量的能量的大小,也可以使用高頻的能量,也可以使用高頻的能量相對于全部能量的比例,這與第一實施方式是同樣的。

<切換決定部383>

切換決定部383根據(jù)切換可否判定部381得到的切換可否的信息、適合編碼處理判定部382得到的哪個編碼處理適合的信息、從輸入音響信號求出的輸入音響信號的高頻分量是否稀疏的狀態(tài),決定將當前幀的頻域的系數(shù)列在第一編碼部101中進行編碼還是在第二編碼部201中進行編碼,輸出能夠確定所決定的編碼處理的碼即切換碼(步驟S383B)。所輸出的切換碼被輸入至解碼裝置400。

在切換可否判定部381得到的切換可否的信息為可切換的情況下,即在輸入音響信號的高頻分量的能量小的情況下,切換決定部383進行與第一實施方式的切換決定部383相同的處理。在切換可否判定部381得到的切換可否的信息表示沒有判定為任一個的情況下、或者沒有對切換可否判定部381輸入判定結果的情況下,即輸入音響信號的高頻分量的能量大的情況下,基于從輸入音響信號求出的輸入音響信號的高頻分量是否稀疏的狀態(tài),決定是否允許通過與前一幀的編碼處理不同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼。

以下,說明切換決定部383的動作之中與第一實施方式的切換決定部383不同的部分、即輸入音響信號的高頻分量的能量大的情況下的切換決定部383的動作的一例。在以下的例中,與第一實施方式同樣地,第一編碼部101的編碼處理是非專利文獻1中示例的、使用了基于能夠變換為線性預測系數(shù)的系數(shù)的頻譜包絡的編碼處理,第二編碼部201的編碼處理是非專利文獻2中示例的、伴隨著劃分后的每個頻域的系數(shù)的平均能量的對數(shù)值與相鄰的頻域的平均能量的對數(shù)值之差分的可變長度編碼的編碼處理。切換決定部383進行例如圖6的步驟S3831B至S3836B的處理。

切換決定部383首先將當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)劃分為每P采樣的Q個部分系數(shù)列XSf(1)(n)(n=1,...,P),XSf(2)(n)(n=1,...,P),...,XSf(Q)(n)(n=1,...,P)(步驟S3831B)。P以及Q是滿足P×Q=N的關系的正整數(shù)。也可以P=1。此外,在此設為在切換決定部383中也使用在第一編碼部101或者第二編碼部201中成為編碼處理的對象的頻域的系數(shù)列即MDCT系數(shù)列Xf(n)(n=1,...,N)的結構,但是,也可以將通過與MDCT系數(shù)列Xf(n)(n=1,...,N)不同的精度或方法變換至頻域而得到的頻域的系數(shù)列、例如功率譜序列,作為切換決定部383的處理的對象。

切換決定部383接著求出部分系數(shù)列XSf(1)(n)(n=1,...,P),XSf(2)(n)(n=1,...,P),...,XSf(Q)(n)(n=1,...,P)的每一個的功率的平均值的對數(shù)值的序列AVEXS(q)(q=1,…,Q)(步驟S3832B)。每個部分系數(shù)列的功率的平均值的對數(shù)值是通過式(3A)求出的AVEXS(q)。

切換決定部383還求出MDCT系數(shù)列Xf(n)(n=1,...,N)的功率的平均值的對數(shù)值(步驟S3833B)。MDCT系數(shù)列的功率的平均值的對數(shù)值是通過式(9)求出的AVETotal。

【數(shù)10】

切換決定部383接著求出q在預先設定的QLow(其中,1<QLow)至QHigh(其中,QLow≤QHigh≤Q)的范圍內、即位于預先決定的高頻側的1個或多個部分領域的范圍內滿足式(10)的AVEXS(q)的個數(shù)、即峰(peak)的領域的個數(shù)(步驟S3834B)。Μ以及λ是正的常數(shù)。

【數(shù)11】

AVEXS(q)≥μ·AVETotal+λ (10)

切換決定部383接著在峰的領域的個數(shù)為閾值TH3以下的情況下,判定為當前幀的輸入音響信號的高頻分量稀疏,在峰的領域的個數(shù)超過閾值TH3的情況下,判定為當前幀的輸入音響信號的高頻分量不稀疏(步驟S3835B)。在此,閾值TH3是根據(jù)預先決定的規(guī)則而決定的值,使得在與當前幀相近的過去的幀的輸入音響信號的高頻分量稀疏的情況下成為比與當前幀相近的過去的幀的輸入音響信號的高頻分量不稀疏的情況更大的值。例如,在與當前幀相近的過去的幀的輸入音響信號的高頻分量稀疏的情況下將預先決定的TH3_1設為閾值TH3,在與當前幀相近的過去的幀的輸入音響信號的高頻分量不稀疏的情況下將比TH3_1更小的值的預先決定的TH3_2設為閾值TH3。在此,與當前幀相近的過去的幀是指,例如前一幀或2幀前的幀等。當前幀的輸入音響信號的高頻分量是否稀疏的判定結果直到至少2幀后為止存儲在切換決定部383內。

切換決定部383接著基于前一幀的編碼處理、和針對當前幀以及與當前幀相近的過去的幀的輸入音響信號的高頻分量是否稀疏的判定結果,決定將當前幀的頻域的系數(shù)列在第一編碼部101和第二編碼部201的哪一個中進行編碼(步驟S3836B)。即,決定是否允許通過與前一幀的編碼處理不同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼。

例如,切換決定部383針對之前的幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)在第一編碼部101中被編碼的情況,在當前幀的高頻分量不稀疏、且前一幀和2幀前的幀的至少其中一個中高頻分量稀疏的情況下,能夠決定將當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)在第二編碼部201中進行編碼,在除此之外的情況下,決定將當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)在第一編碼部101中進行編碼。即,切換決定部383針對之前的幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)在第一編碼部101中被編碼的情況,在當前幀的高頻分量不稀疏、且前一幀和2幀前的幀的至少其中一個中高頻分量稀疏的情況下,允許通過與前一幀的編碼處理不同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼,在除此之外的情況下,不允許通過與前一幀的編碼處理的不同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼。

此外,切換決定部383針對之前的幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)在第二編碼部201中被編碼的情況,在(1)當前幀的高頻分量稀疏且前一幀的高頻分量不稀疏的情況下、或者(2)當前幀的高頻分量稀疏且前一幀的高頻分量稀疏且2幀前的幀的高頻分量不稀疏的情況下,能夠決定將當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)在第一編碼部201中進行編碼,在除此之外的情況下,決定將當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)在第二編碼部201中進行編碼。即,切換決定部383針對之前的幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)在第二編碼部201中被編碼的情況,在(1)當前幀的高頻分量稀疏且前一幀的高頻分量不稀疏的情況下、或者(2)當前幀的高頻分量稀疏且前一幀的高頻分量稀疏且2幀前的幀的高頻分量不稀疏的情況下,允許通過與前一幀的編碼處理不同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼,在除此之外的情況下,不允許通過與前一幀的編碼處理不同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼。

另外,切換決定部383在允許了通過與前一幀的編碼處理不同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼的情況下,基于適合編碼處理判定部382得到的哪個編碼處理適合的信息,決定當前幀的頻域的系數(shù)列的編碼處理。例如,切換決定部383在允許了通過與前一幀的編碼處理不同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼的情況下,即使在前一幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)在第二編碼部201中被編碼的情況下,在適合編碼處理判定部382得到的哪個編碼處理適合的信息表示第一編碼部101的編碼處理的情況下,也決定為將當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)在第一編碼部101中進行編碼。此外,切換決定部383在允許了通過與前一幀的編碼處理不同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼的情況下,即使在前一幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)在第一編碼部101中被編碼的情況下,在適合編碼處理判定部382得到的哪個編碼處理適合的信息表示第二編碼部201的編碼處理的情況下,也決定為將當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)在第二編碼部201中進行編碼。

另外,切換決定部383在即使允許了通過與前一幀的編碼處理不同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼的情況下,在根據(jù)編碼裝置300中未圖示的部件得到的其他的信息已判定為應該通過與前一幀的編碼處理相同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼的情況下,也可以通過與前一幀的編碼處理相同的編碼處理來對與當前幀的輸入音響信號對應的頻域的系數(shù)列進行編碼。

此外,在步驟S3831B中也可以設為對每個部分系數(shù)列不同的采樣數(shù)。例如,也可以將當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)劃分為Q個部分系數(shù)列XSf(1)(n)(n=1,...,P1),XSf(2)(n)(n=1,...,P2),...,XSf(Q)(n)(n=1,...,PQ)。P1,P2,...,PQ是滿足P1+P2+...+PQ=N的正整數(shù)。此外,優(yōu)選為P1,P2,...,PQ滿足P1≤P2≤...≤PQ。此外,Q是正整數(shù)。

此外,在適合編碼處理判定部382進行了與步驟S3831B或步驟S3832B或步驟S3833B的處理相同的處理的情況下,切換決定部383也可以使用由適合編碼處理判定部382進行的處理結果,而不進行步驟S3831B或步驟S3832B或步驟S3833B。

[第三實施方式]

在第一實施方式以及第二實施方式中使用1個閾值來判定當前幀適合的編碼處理,但是,第三實施方式進行使用了2個閾值的判定。

第三實施方式的編碼裝置的結構是與第一實施方式相同的圖1。第三實施方式的編碼裝置300除了決定部380內的適合編碼處理判定部382和切換決定部383的處理不同的部分以外,與第一實施方式或者第二實施方式的編碼裝置300是相同的。第三實施方式的解碼裝置的結構是與第一實施方式相同的圖2,各部的處理與第一實施方式的解碼裝置也是相同的。以下,說明進行與第一實施方式的編碼裝置300不同的處理的決定部380內的適合編碼處理判定部382和切換決定部383。

<適合編碼處理判定部382>

適合編碼處理判定部382進行圖7中示例的各步驟的處理。適合編碼處理判定部382判定與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第一編碼部101的編碼處理和第二編碼部201的編碼處理的哪一個,換而言之,判定是否進行其中一個編碼處理就可以,并輸出判定結果(步驟S382A)。

以下,對適合編碼處理判定部382的動作的一例進行說明。適合編碼處理判定部382進行圖7中示例的各步驟的處理。在以下的例中,第一編碼部101的編碼處理是非專利文獻1中示例的、使用了基于能夠變換為線性預測系數(shù)的系數(shù)的頻譜包絡的編碼處理,第二編碼部201的編碼處理是非專利文獻2中示例的、伴隨著劃分后的每個頻域的系數(shù)的平均能量的對數(shù)值與相鄰的頻域的平均能量的對數(shù)值之差分的可變長度編碼的編碼處理。

在該例中,適合編碼處理判定部382在輸入音響信號的頻譜包絡的起伏大或者/以及集中度高的情況下,判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第一編碼部101的編碼處理,在輸入音響信號的頻譜包絡的起伏小或者/以及集中度低的情況下,判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第二編碼部201的編碼處理,在輸入音響信號的頻譜包絡的起伏為中等程度或者/以及集中度為中等程度的情況下,判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列進行第一編碼部101的編碼處理和第二編碼部201的編碼處理中的任一個編碼處理都可以、即適合于第一編碼部101的編碼處理和第二編碼部201的編碼處理中的任一個編碼處理,并輸出判定結果。

在輸入音響信號的頻譜包絡的起伏為中等程度或者/以及集中度為中等程度的情況下,如后述那樣,在切換決定部383中決定通過與前一幀相同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼。即,在切換決定部383中,決定當前幀的編碼處理,使得由于在前一幀和當前幀之間編碼處理切換而收聽者感到不自然的情況較少。因此,輸入音響信號的頻譜包絡的起伏為中等程度或者/以及集中度為中等程度的情況不僅僅包含與當前幀的輸入音響信號對應的頻域的系數(shù)列進行第一編碼部101的編碼處理和第二編碼部201的編碼處理中的任一個編碼處理都可以的情況、或適合于第一編碼部101的編碼處理和第二編碼部201的編碼處理中的任一個編碼處理的情況,還包含很難說與當前幀的輸入音響信號對應的頻域的系數(shù)列適合第一編碼部101的編碼處理和第二編碼部201的編碼處理的哪一個編碼處理的情況、或有可能與當前幀的輸入音響信號對應的頻域的系數(shù)列不適合第一編碼部101的編碼處理和第二編碼部201的編碼處理中的任一個編碼處理的情況。即,也可以將上述的“適合于第一編碼部101的編碼處理和第二編碼部201的編碼處理中的任一個編碼處理”的判定,讀作“無法判別對于第一編碼部101的編碼處理和第二編碼部201的編碼處理中的任一個編碼處理的適合性”的判定。

作為估計頻譜的起伏或集中度的方法,也可以采用任意的方法,但是,對估計頻譜包絡的谷的深度的結構進行說明。在該結構中,在頻譜包絡的谷淺時判定為頻譜的起伏小且集中度低,在頻譜包絡的谷深時判定為頻譜的起伏大且集中度高,在頻譜包絡的谷的深度為中等程度時判定為頻譜的起伏為中等程度且集中度為中等程度。

適合編碼處理判定部382進行與第一實施方式的適合編碼處理判定部382相同的步驟S3821至S3825、和與第一實施方式的適合編碼處理判定部382不同的步驟S3826A。以下,對與第一實施方式的適合編碼處理判定部382不同的部分進行說明。

適合編碼處理判定部382在步驟S3825之后,進行使用了閾值TH2_1,TH2_2的下面的判定處理以及后述的適合信息的輸出(步驟S3826A)。

適合編碼處理判定部382在所有的部分領域的AVEXS(q)的平均值E與谷的部分領域的AVEXS(q)的平均值EV之差比規(guī)定的閾值TH2_1小的情況下,被估計為是頻譜的谷淺、頻譜包絡的起伏少或者集中度低的頻譜,所以,判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第二編碼部201的編碼處理。

此外,適合編碼處理判定部382在所有的部分領域的AVEXS(q)的平均值E與谷的部分領域的AVEXS(q)的平均值EV之差大于作為比閾值TH2_1大的值的規(guī)定的閾值TH2_2的情況下,被估計為是頻譜的谷深、頻譜包絡的起伏大或者集中度高的頻譜,所以,判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合第一編碼部101的編碼處理。

此外,適合編碼處理判定部382在所有的部分領域的AVEXS(q)的平均值E與谷的部分領域的AVEXS(q)的平均值EV之差為閾值TH2_1以上閾值TH2_2以下的情況下,被估計為是頻譜的谷的深度為中等程度、頻譜包絡的起伏為中等程度或者集中度為中等程度的頻譜,所以,與當前幀的輸入音響信號對應的頻域的系數(shù)列進行第一編碼部101的編碼處理和第二編碼部201的編碼處理中的任一個編碼處理都可以。即,判定為適合于第一編碼部101的編碼處理和第二編碼部201的編碼處理中的任一個編碼處理。

之后,適合編碼處理判定部382對適合的編碼處理的信息即適合信息進行輸出。適合信息是適合編碼處理判定部382的判定結果,也可以稱作其中一個或者雙方的編碼處理是否適合的信息。

另外,適合編碼處理判定部382也可以設為如下結構:僅在判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第一編碼部101的編碼處理和第二編碼部201的編碼處理的其中一個的情況下,輸出表示適合于第一編碼部101的編碼處理的信息或者表示適合于第二編碼部201的編碼處理的信息,在判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列進行第一編碼部101的編碼處理和第二編碼部201的編碼處理的哪一個編碼處理都可以、即適合于第一編碼部101的編碼處理和第二編碼部201的編碼處理中的任一個編碼處理的情況下,不輸出判定結果。

<切換決定部383>

切換決定部383根據(jù)切換可否判定部381得到的切換可否的信息、和適合編碼處理判定部382得到的其中一個或者雙方的編碼處理是否適合的信息、即適合的編碼處理的信息(適合信息),決定將當前幀的頻域的系數(shù)列在第一編碼部101中進行編碼還是在第二編碼部201中進行編碼,對能夠確定所決定的編碼處理的碼即切換碼進行輸出(步驟S383A)。所輸出的切換碼被輸入至解碼裝置400。在此,切換決定部383在是不可切換的情況下,不論當前幀適合的編碼處理是哪一個編碼處理,都決定通過與前一幀相同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼。此外,切換決定部383在是可切換、且當前幀適合于第一編碼部101的編碼處理和第二編碼部201的編碼處理中的任一個編碼處理的情況下,決定通過與前一幀相同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼。此外,切換決定部383在是可切換、且當前幀適合于第一編碼部101的編碼處理和第二編碼部201的編碼處理的其中一個的情況下,不論前一幀的編碼處理是哪一個編碼處理,都決定通過當前幀適合的編碼處理來對當前幀的頻域的系數(shù)列進行編碼。

以下,說明切換決定部383的動作的一例。在以下的例中,第一編碼部101的編碼處理是非專利文獻1中示例的、使用了基于能夠變換為線性預測系數(shù)的系數(shù)的頻譜包絡的編碼處理,第二編碼部201的編碼處理是非專利文獻2中示例的、伴隨著劃分后的每個頻域的系數(shù)的平均能量的對數(shù)值與相鄰的頻域的平均能量的對數(shù)值之差分的可變長度編碼的編碼處理。

切換決定部383在切換可否判定部381得到的切換可否的信息表示不可切換的情況、以及/或者、適合編碼處理判定部382得到的哪個編碼處理適合的信息(適合信息)表示與前一幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)的編碼處理相同的編碼處理的情況或者表示第一編碼部101的編碼處理和第二編碼部201的編碼處理中的任一個編碼處理都適合的情況下,將與前一幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)的編碼處理相同的編碼處理,決定為當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)的編碼處理。

即,切換決定部383在前一幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)在第一編碼部101中被編碼的情況、且切換可否判定部381得到的切換可否的信息表示不可切換的情況下,決定為當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)也在第一編碼部101中進行編碼。此外,切換決定部383在前一幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)在第一編碼部101中被編碼的情況、且適合編碼處理判定部382得到的哪個編碼處理適合的信息(適合信息)表示第一編碼部101的編碼處理的情況下,決定為當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)也在第一編碼部101中進行編碼。此外,切換決定部383在前一幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)在第一編碼部101中被編碼的情況、且適合編碼處理判定部382得到的哪個編碼處理適合的信息(適合信息)表示第一編碼部101的編碼處理和第二編碼部201的編碼處理中的任一個編碼處理都適合的情況下,決定為當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)也在第一編碼部101中進行編碼。

此外,切換決定部383在前一幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)在第二編碼部201中被編碼的情況、且切換可否判定部381得到的切換可否的信息表示不可切換的情況下,決定為當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)也在第二編碼部201中進行編碼。此外,切換決定部383在前一幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)在第二編碼部201中被編碼的情況、且適合編碼處理判定部382得到的哪個編碼處理適合的信息(適合信息)表示第二編碼部201的編碼處理的情況下,決定為當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)也在第二編碼部201中進行編碼。此外,切換決定部383在前一幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)在第二編碼部201中被編碼的情況、且適合編碼處理判定部382得到的哪個編碼處理適合的信息(適合信息)表示第一編碼部101的編碼處理和第二編碼部201的編碼處理中的任一個編碼處理都適合的情況下,決定為當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)也在第二編碼部201中進行編碼。

切換決定部383在切換可否判定部381得到的切換可否的信息表示可切換的情況、且適合編碼處理判定部382得到的哪個編碼處理適合的信息(適合信息)表示與前一幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)的編碼處理不同的編碼處理的情況下,將與前一幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)的編碼處理不同的編碼處理,決定為當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)的編碼處理。即,切換決定部383在前一幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)在第一編碼部101中被編碼的情況、切換可否判定部381得到的切換可否的信息表示可切換、且適合編碼處理判定部382得到的哪個編碼處理適合的信息(適合信息)表示第二編碼部201的編碼處理的情況下,決定為將當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)在第二編碼部201中進行編碼。此外,切換決定部383在前一幀的MDCT系數(shù)列Xf-1(n)(n=1,...,N)在第二編碼部201中被編碼的情況、切換可否判定部381得到的切換可否的信息表示可切換、且適合編碼處理判定部382得到的哪個編碼處理適合的信息(適合信息)表示第一編碼部101的編碼處理的情況下,決定為將當前幀的MDCT系數(shù)列Xf(n)(n=1,...,N)在第一編碼部101中進行編碼。

另外,在將適合編碼處理判定部382設為在判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第一編碼部101的編碼處理和第二編碼部201的編碼處理中的任一個編碼處理的情況下不輸出判定結果的結構的情況下,切換決定部383在沒有輸入適合的編碼處理的信息的情況下,進行上述的哪個編碼處理適合的信息(適合信息)表示適合于第一編碼部101的編碼處理和第二編碼部201的編碼處理中的任一個編碼處理的情況下的處理即可。

[第一變形例]

在當前幀的輸入音響信號適合非專利文獻1中示例的使用了基于能夠變換為線性預測系數(shù)的系數(shù)的頻譜包絡的編碼處理、和非專利文獻2中示例的伴隨著劃分后的每個頻域的系數(shù)的平均能量的對數(shù)值與相鄰的頻域的平均能量的對數(shù)值之差分的可變長度編碼的編碼處理的哪一個編碼處理的判定中,除了輸入音響信號的頻譜包絡的起伏的大小或集中度之外,還可以進行包含其他的信息的判定。

例如,即使在與前一幀的輸入音響信號對應的頻域的系數(shù)列通過第一編碼部101編碼、切換可否判定部381判定為可切換、且適合編碼處理判定部382判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第二編碼部201的編碼處理的情況下,在根據(jù)編碼裝置300中未圖示的部件得到的其他的信息而判定為應該將與當前幀的輸入音響信號對應的頻域的系數(shù)列通過第一編碼部101的編碼處理來進行編碼的情況下,也可以將與當前幀的輸入音響信號對應的頻域的系數(shù)列通過第一編碼部101來進行編碼。即,編碼裝置300是如下的結構即可:在與前一幀的輸入音響信號對應的頻域的系數(shù)列通過第一編碼部101編碼、切換可否判定部381判定為可切換、且適合編碼處理判定部382判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第二編碼部201的編碼處理的情況下,能夠決定將與當前幀的輸入音響信號對應的頻域的系數(shù)列通過第二編碼部201進行編碼。

此外,相反地,即使在與前一幀的輸入音響信號對應的頻域的系數(shù)列通過第二編碼部201編碼、切換可否判定部381判定為可切換、且適合編碼處理判定部382判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第一編碼部101的編碼處理的情況下,在根據(jù)編碼裝置300中未圖示的部件得到的其他的信息而判定為應該將與當前幀的輸入音響信號對應的頻域的系數(shù)列通過第二編碼部201的編碼處理來進行編碼的情況下,也可以將與當前幀的輸入音響信號對應的頻域的系數(shù)列通過第二編碼部201來進行編碼。即,編碼裝置300是如下的結構即可:在與前一幀的輸入音響信號對應的頻域的系數(shù)列通過第二編碼部編碼、切換可否判定部381判定為可切換、且適合編碼處理判定部382判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第一編碼部101的編碼處理的情況下,能夠決定將與當前幀的輸入音響信號對應的頻域的系數(shù)列通過第一編碼部101進行編碼。

此外,例如,在第三實施方式的編碼裝置300中,即使在與前一幀的輸入音響信號對應的頻域的系數(shù)列通過第一編碼部101編碼、適合編碼處理判定部382判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第一編碼部101的編碼處理和第二編碼部201的編碼處理中的任一個編碼處理的情況下,在切換可否判定部381判定為可切換、且根據(jù)編碼裝置300中未圖示的部件得到的其他的信息而判定為應該將與當前幀的輸入音響信號對應的頻域的系數(shù)列通過第二編碼部201的編碼處理來進行編碼的情況下,也可以將與當前幀的輸入音響信號對應的頻域的系數(shù)列通過第二編碼部201來進行編碼。

此外,相反地,即使在與前一幀的輸入音響信號對應的頻域的系數(shù)列通過第二編碼部201編碼、適合編碼處理判定部382判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第一編碼部101的編碼處理的第二編碼部201的編碼處理中的任一個編碼處理的情況下,在切換可否判定部381判定為可切換、且根據(jù)編碼裝置300中未圖示的部件得到的其他的信息而判定為應該將與當前幀的輸入音響信號對應的頻域的系數(shù)列通過第一編碼部101的編碼處理來進行編碼的情況下,也可以將與當前幀的輸入音響信號對應的頻域的系數(shù)列通過第一編碼部101來進行編碼。

即,第三實施方式的編碼裝置300是如下的結構即可:在切換可否判定部381判定為可切換、且適合編碼處理判定部382判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第一編碼部101的編碼處理和第二編碼部201的編碼處理中的任一個編碼處理的情況下,能夠決定將與當前幀的輸入音響信號對應的頻域的系數(shù)列通過與前一幀相同的編碼處理來進行編碼。

[第二變形例]

在將當前幀的頻域的系數(shù)列在第一編碼部101中進行編碼還是在第二編碼部201中進行編碼的決定中,也可以不使用切換可否判定部381得到的切換可否的信息。在該情況下,在決定部380內也可以不具備切換可否判定部381。

在該情況下,切換決定部383不使用切換可否判定部381得到的切換可否的信息,而是根據(jù)適合編碼處理判定部382得到的適合信息,決定將當前幀的頻域的系數(shù)列在第一編碼部101中進行編碼還是在第二編碼部201中進行編碼,對能夠確定所決定的編碼處理的碼即切換碼進行輸出。

例如,在適合編碼處理判定部382判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第一編碼部101的編碼處理的情況下,將與當前幀的輸入音響信號對應的頻域的系數(shù)列通過第一編碼部101來進行編碼,在適合編碼處理判定部382判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第二編碼部201的編碼處理的情況下,將與當前幀的輸入音響信號對應的頻域的系數(shù)列通過第二編碼部201來進行編碼即可。

在該情況下,與第一變形例同樣地,也可以進行包含其他的信息的判定。例如,即使在適合編碼處理判定部382判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第一編碼部101的編碼處理的情況下,在根據(jù)編碼裝置300中未圖示的部件得到的其他的信息而判定為應該將與當前幀的輸入音響信號對應的頻域的系數(shù)列通過第二編碼部201的編碼處理來進行編碼的情況下,也可以將與當前幀的輸入音響信號對應的頻域的系數(shù)列通過第二編碼部201來進行編碼。

相反地,即使在適合編碼處理判定部382判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第二編碼部201的編碼處理的情況下,在根據(jù)編碼裝置300中未圖示的部件得到的其他的信息而判定為應該將與當前幀的輸入音響信號對應的頻域的系數(shù)列通過第一編碼部101的編碼處理來進行編碼的情況下,也可以將與當前幀的輸入音響信號對應的頻域的系數(shù)列通過第一編碼部101來進行編碼。

即,作為如下結構即可:在適合編碼處理判定部382判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第一編碼部101的編碼處理的情況下,能夠決定將與當前幀的輸入音響信號對應的頻域的系數(shù)列通過第一編碼部101的編碼處理進行編碼。此外,作為如下結構即可:在適合編碼處理判定部382判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第二編碼部201的編碼處理的情況下,能夠決定將與當前幀的輸入音響信號對應的頻域的系數(shù)列通過第二編碼部201的編碼處理來進行編碼。

此外,例如,在第三實施方式的編碼裝置300中,在適合編碼處理判定部382判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第一編碼部101的編碼處理和第二編碼部201的編碼處理中的任一個編碼處理的情況之中,在根據(jù)編碼裝置300中未圖示的部件得到的其他的信息而判定為應該將與當前幀的輸入音響信號對應的頻域的系數(shù)列通過第一編碼部101的編碼處理來進行編碼的情況下,也可以將與當前幀的輸入音響信號對應的頻域的系數(shù)列通過第一編碼部101來進行編碼。

此外,在適合編碼處理判定部382判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第一編碼部101的編碼處理和第二編碼部201的編碼處理中的任一個編碼處理的情況之中,在根據(jù)編碼裝置300中未圖示的部件得到的其他的信息而判定為應該將與當前幀的輸入音響信號對應的頻域的系數(shù)列通過第二編碼部201的編碼處理來進行編碼的情況下,也可以將與當前幀的輸入音響信號對應的頻域的系數(shù)列通過第二編碼部201來進行編碼。

即,第三實施方式的編碼裝置300是如下的結構即可:在適合編碼處理判定部382判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第一編碼部101的編碼處理和第二編碼部201的編碼處理中的任一個編碼處理的情況下,能夠決定將與當前幀的輸入音響信號對應的頻域的系數(shù)列通過與前一幀相同的編碼處理來進行編碼。

另外,在上述的各實施方式中的、計算出的值和閾值的比較中,在計算出的值與閾值為相同的值的情況下,設定為分類到以閾值為邊界而相鄰的2個情況的任一個即可。即,也可以將是某個閾值以上的情況作為比該閾值大的情況,并且,將比該閾值小的情況作為是該閾值以下的情況。此外,也可以將比某個閾值大的情況作為是該閾值以上的情況,并且,將是該閾值以下的情況作為比該閾值小的情況。

例如,在第一實施方式中,決定部380也可以在前一幀的輸入音響信號的高頻分量的能量的大小、和當前幀的輸入音響信號的高頻分量的能量的大小的至少其中一個是規(guī)定的閾值以下的情況下,能夠將與前一幀不同的編碼處理決定作為當前幀的編碼處理(步驟S380)。

此外,在第二實施方式中,切換可否判定部381也可以在前一幀的輸入音響信號的高頻分量的能量的大小、和當前幀的輸入音響信號的高頻分量的能量的大小的至少其中一個是規(guī)定的閾值以下的情況下,判定為可切換、即能夠通過與對前一幀的頻域的系數(shù)列進行了編碼的編碼處理不同的編碼處理來對當前幀的頻域的系數(shù)列進行編碼,并輸出判定結果。

此外,在第一實施方式中,適合編碼處理判定部382在所有的部分領域的AVEXS(q)的平均值E和谷的部分領域的AVEXS(q)的平均值EV之差比規(guī)定的閾值TH2小的情況下,被估計為是頻譜的谷淺、頻譜包絡的起伏少或者集中度低的頻譜,所以,也可以判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合于第二編碼部201的編碼處理。相反地,在所有的部分領域的AVEXS(q)的平均值E和谷的部分領域的AVEXS(q)的平均值EV之差是閾值TH2以上的情況下,被估計為是頻譜的谷深、頻譜包絡的起伏大或者集中度高的頻譜,所以,也可以判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合第一編碼部101的編碼處理。

此外,在第三實施方式中,適合編碼處理判定部382在所有的部分領域的AVEXS(q)的平均值E與谷的部分領域的AVEXS(q)的平均值EV之差是作為比閾值TH2_1更大的值的規(guī)定的閾值TH2_2以上的情況下,被估計為是頻譜的谷深、頻譜包絡的起伏大或者集中度高的頻譜,所以,也可以判定為與當前幀的輸入音響信號對應的頻域的系數(shù)列適合第一編碼部101的編碼處理。在該情況下,適合編碼處理判定部382在所有的部分領域的AVEXS(q)的平均值E和谷的部分領域的AVEXS(q)的平均值EV之差為閾值TH2_1以上且比閾值TH2_2小的情況下,被估計為是頻譜的谷的深度為中等程度、頻譜包絡的起伏為中等程度或者集中度為中等程度的頻譜,所以,設為與當前幀的輸入音響信號對應的頻域的系數(shù)列也可以進行第一編碼部101的編碼處理和第二編碼部201的編碼處理中的任一個編碼處理。

在編碼裝置以及編碼方法中所說明的處理不僅可以根據(jù)記載的順序按時間序列執(zhí)行,也可以根據(jù)執(zhí)行處理的裝置的處理能力或者根據(jù)需要,并行地或者單獨地執(zhí)行。

此外,在將編碼方法中的各步驟通過計算機來實現(xiàn)的情況下,編碼方法應該具有的功能的處理內容由程序來記述。然后,將該程序在計算機中進行執(zhí)行,從而其各步驟在計算機上被實現(xiàn)。

記述了該處理內容的程序能夠記錄在計算機可讀取的記錄介質中。作為計算機可讀取的記錄介質,例如,磁記錄裝置、光盤、光磁記錄介質、半導體存儲器等任意介質均可。

此外,各處理部件也可以設為通過在計算機上執(zhí)行規(guī)定的程序而構成,也可以設為將這些處理內容的至少一部分以硬件方式來實現(xiàn)。

另外,不言而喻的是在不脫離本發(fā)明的宗旨的范圍能夠適當?shù)剡M行變更。

當前第1頁1 2 3 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
罗定市| 海晏县| 宁波市| 怀化市| 永登县| 五莲县| 丰台区| 洛宁县| 五原县| 壶关县| 格尔木市| 三河市| 务川| 巴塘县| 深圳市| 怀宁县| 丹凤县| 临沂市| 瓮安县| 文山县| 靖安县| 湛江市| 崇州市| 彰化市| 泗洪县| 平潭县| 长乐市| 简阳市| 永胜县| 林口县| 东海县| 潞城市| 景泰县| 北海市| 禹州市| 晋州市| 合作市| 若尔盖县| 新平| 澄城县| 任丘市|