欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

編碼設(shè)備、解碼設(shè)備、編碼方法和解碼方法

文檔序號(hào):2837398閱讀:354來源:國知局
專利名稱:編碼設(shè)備、解碼設(shè)備、編碼方法和解碼方法
技術(shù)領(lǐng)域
本發(fā)明涉及對(duì)諸如音頻信號(hào)或語音信號(hào)之類的聲信號(hào)進(jìn)行高效壓縮編碼的編碼設(shè)備、解碼設(shè)備、編碼方法和解碼方法,尤其涉及即使根據(jù)一部分編碼信息也能夠解碼音頻或語音的、適合于可伸縮(scalar)編碼和解碼的編碼設(shè)備、解碼設(shè)備、編碼方法和解碼方法。

背景技術(shù)
以低位速率壓縮音頻信號(hào)或語音信號(hào)的聲音編碼技術(shù)對(duì)于有效利用移動(dòng)通信中的無線電和記錄媒體是非常重要的。編碼語音信號(hào)的語音編碼方法包括由ITU(國際電信聯(lián)盟)標(biāo)準(zhǔn)化的G726和G729。這些方法編碼窄帶信號(hào)(300Hz-3.4kHz),并且能夠以8kb/s(千位每秒)到32kb/s的位速率進(jìn)行高質(zhì)編碼。
寬帶(50Hz-7kHz)的標(biāo)準(zhǔn)編碼包括ITU的G722和G722.1和GPP(第三代伙伴項(xiàng)目)的AMR-WB。這些方法能夠以6.6kb/s到64kb/s的位速率高質(zhì)編碼寬帶語音信號(hào)。
以低位速率對(duì)語音信號(hào)高效編碼的有效方法是CELP(碼激勵(lì)線性預(yù)測(cè))。CELP是根據(jù)通過工程技術(shù)模仿人類語音生成模型的模型進(jìn)行編碼的方法。具體地說,在CELP中,讓由隨機(jī)值組成的激勵(lì)信號(hào)經(jīng)過與周期性的強(qiáng)度相對(duì)應(yīng)的音調(diào)濾波器和與聲道特性相對(duì)應(yīng)的合成濾波器,并且確定編碼參數(shù),以便在聽覺特性加權(quán)下使輸出信號(hào)和輸入信號(hào)之間的平方誤差達(dá)到最小。
在許多最新標(biāo)準(zhǔn)語音編碼方法中,都是根據(jù)CELP進(jìn)行編碼。例如,G729能夠以8kb/s進(jìn)行窄帶信號(hào)編碼,和AMR-WB能夠以6.6kb/s到23.85kb/s進(jìn)行窄帶信號(hào)編碼。
同時(shí),在編碼音頻信號(hào)的音頻編碼的情況下,共同使用將音頻信號(hào)轉(zhuǎn)換到頻域和利用聽覺心理聲學(xué)模型進(jìn)行編碼的方法,譬如,由MPEG(運(yùn)動(dòng)圖像專家組)標(biāo)準(zhǔn)化的LayerIII方法和AAC方法。眾所周知,利用這些方法,對(duì)于44.1kHz取樣速率的信號(hào),在64kb/s到96kb/s每信道上幾乎不會(huì)變差。
這種音頻編碼是對(duì)音樂進(jìn)行高質(zhì)編碼的方法。音頻編碼也可以對(duì)如上所述,在背景中存在音樂或環(huán)境聲音的語音信號(hào)進(jìn)行高質(zhì)編碼,并且可以管理具有CD質(zhì)量的、大約22kHz的信號(hào)頻帶。
但是,當(dāng)利用語音編碼方法對(duì)語音信號(hào)占優(yōu)勢(shì)和在背景中疊加了音樂或環(huán)境聲音的信號(hào)進(jìn)行編碼時(shí),存在如下問題,由于背景音樂或環(huán)境聲音,不僅背景信號(hào)變差了,而且語音信號(hào)也變差了,因此,總質(zhì)量下降了。
出現(xiàn)這個(gè)問題是因?yàn)檎Z音編碼方法基于專用于CELP語音模型的方法。問題在于,語音編碼方法只能管理直到7kHz的信號(hào)頻帶,和對(duì)于復(fù)合信號(hào),不能充分地管理作為更高頻帶中的成分的信號(hào)。
此外,對(duì)于音頻編碼方法,為了取得高質(zhì)編碼,必須使用高位速率。對(duì)于音頻編碼方法,如果應(yīng)該利用下至32kb/s的位速率進(jìn)行編碼,那么,存在解碼信號(hào)質(zhì)量大幅下降的問題。因此,存在問題不能在傳輸速率低的通信網(wǎng)絡(luò)上使用的問題。


發(fā)明內(nèi)容
本發(fā)明的目的是提供一種甚至在低位速率下也能夠?qū)φZ音信號(hào)占優(yōu)勢(shì)和在背景中疊加了音樂或環(huán)境聲音的信號(hào)進(jìn)行高質(zhì)編碼和解碼的編碼設(shè)備、解碼設(shè)備、編碼方法和解碼方法。
這個(gè)目的是通過擁有兩個(gè)層,即基本層和增強(qiáng)層,根據(jù)基本層中的CELP,以低位速率對(duì)輸入信號(hào)窄帶或?qū)拵ьl區(qū)進(jìn)行高質(zhì)編碼,和在不能在基本層中得到表示的背景音樂或環(huán)境聲音,以及存在比基本層覆蓋的頻區(qū)高的頻率成分的信號(hào)的增強(qiáng)層中進(jìn)行編碼達(dá)到的。
根據(jù)本發(fā)明的一個(gè)方面,提供一種聲音編碼設(shè)備,包括第一編碼部分,對(duì)聲信號(hào)進(jìn)行編碼來獲取第一編碼信息;解碼部分,對(duì)所述第一編碼信息進(jìn)行解碼來獲取解碼信號(hào);確定部分,計(jì)算所述解碼信號(hào)的聽覺掩蔽閾值,并且確定出確定所述解碼信號(hào)中幅度顯示為大于或等于該聽覺掩蔽閾值的頻域;減法部分,獲取所述聲信號(hào)和所述解碼信號(hào)之間的殘差信號(hào);以及第二編碼部分,對(duì)所述殘差信號(hào)中的由所述確定部分確定出的頻域進(jìn)行編碼,獲取第二編碼信息。
根據(jù)本發(fā)明的一個(gè)方面,提供一種聲音解碼設(shè)備,包括第一解碼部分,對(duì)第一編碼信息進(jìn)行解碼來獲取第一解碼信號(hào);確定部分,計(jì)算所述第一解碼信號(hào)的聽覺掩蔽閾值,并且確定所述第一解碼信號(hào)中幅度顯示為大于或等于該聽覺掩蔽閾值的頻域;第二解碼部分,對(duì)所述第二編碼信息中的由所述確定部分確定出的頻域進(jìn)行編碼,獲取第二解碼信號(hào);以及加法部分,將所述第一解碼信號(hào)與所述第二解碼信號(hào)相加來獲取聲信號(hào)。
根據(jù)本發(fā)明的一個(gè)方面,提供一種通信終端設(shè)備,包括如上所述的聲音編碼設(shè)備或如上所述的聲音解碼設(shè)備。
根據(jù)本發(fā)明的一個(gè)方面,提供一種基站設(shè)備,包括如上所述的聲音編碼設(shè)備或如上所述的聲音解碼設(shè)備。
根據(jù)本發(fā)明的一個(gè)方面,提供一種聲音編碼方法,包括第一編碼步驟,對(duì)聲信號(hào)進(jìn)行編碼來獲取第一編碼信息;解碼步驟,對(duì)所述第一編碼信息進(jìn)行解碼來獲取解碼信號(hào);確定步驟,計(jì)算所述解碼信號(hào)的聽覺掩蔽閾值,并且確定所述解碼信號(hào)中幅度顯示為大于或等于該聽覺掩蔽閾值的頻域;減法步驟,獲取所述聲信號(hào)和所述解碼信號(hào)之間的殘差信號(hào);以及第二編碼步驟,對(duì)所述殘差信號(hào)中的由所述確定部分確定出的頻域進(jìn)行編碼,獲取第二編碼信息。
根據(jù)本發(fā)明的一個(gè)方面,提供一種聲音解碼方法,包括第一解碼步驟,對(duì)第一編碼信息進(jìn)行解碼來獲取第一解碼信號(hào);確定步驟,計(jì)算所述第一解碼信號(hào)的聽覺掩蔽閾值,并且確定所述第一解碼信號(hào)中幅度顯示為大于或等于該聽覺掩蔽閾值的頻域;第二解碼步驟,對(duì)所述第二編碼信息中的由所述確定部分確定出的頻域進(jìn)行編碼,獲取第二解碼信號(hào);以及加法步驟,將所述第一解碼信號(hào)與所述第二解碼信號(hào)相加來獲取聲信號(hào)。



圖1是示出根據(jù)本發(fā)明第1實(shí)施例的信號(hào)處理設(shè)備的配置的方塊圖; 圖2是示出輸入信號(hào)成分的例子的圖形; 圖3是示出根據(jù)上面實(shí)施例的信號(hào)處理設(shè)備的信號(hào)處理方法的例子的圖形; 圖4是示出基本層編碼器的配置的例子的圖形; 圖5是示出增強(qiáng)層編碼器的配置的例子的圖形; 圖6是示出增強(qiáng)層編碼器的配置的例子的圖形; 圖7是示出增強(qiáng)層中的LPC系數(shù)計(jì)算的例子的圖形; 圖8是示出根據(jù)本發(fā)明第3實(shí)施例的信號(hào)處理設(shè)備的增強(qiáng)層編碼器的配置的方塊圖; 圖9是示出根據(jù)本發(fā)明第4實(shí)施例的信號(hào)處理設(shè)備的增強(qiáng)層編碼器的配置的方塊圖; 圖10是示出根據(jù)本發(fā)明第5實(shí)施例的信號(hào)處理設(shè)備的配置的方塊圖; 圖11是示出基本層解碼器的例子的方塊圖; 圖12是示出增強(qiáng)層解碼器的例子的方塊圖; 圖13是示出增強(qiáng)層解碼器的例子的圖形; 圖14是示出根據(jù)本發(fā)明第7實(shí)施例的信號(hào)處理設(shè)備的增強(qiáng)層解碼器的配置的方塊圖; 圖15是示出根據(jù)本發(fā)明第8實(shí)施例的信號(hào)處理設(shè)備的增強(qiáng)層解碼器的配置的方塊圖; 圖16是示出根據(jù)本發(fā)明第9實(shí)施例的聲音編碼設(shè)備的配置的方塊圖; 圖17是示出聲信號(hào)信息分布的例子的圖形; 圖18是示出在基本層和增強(qiáng)層中經(jīng)受編碼的區(qū)域的例子的圖形; 圖19是示出聲(音樂)信號(hào)譜的例子的圖形; 圖20是示出上面實(shí)施例的聲音編碼設(shè)備的頻率確定部分的內(nèi)部配置的例子的方塊圖; 圖21是示出上面實(shí)施例的聲音編碼設(shè)備的聽覺掩蔽計(jì)算器的內(nèi)部配置的例子的圖形; 圖22是示出上面實(shí)施例的增強(qiáng)層編碼器的內(nèi)部配置的例子的方塊圖; 圖23是示出上面實(shí)施例的聽覺掩蔽計(jì)算器的內(nèi)部配置的例子的方塊圖; 圖24是示出根據(jù)本發(fā)明第9實(shí)施例的聲音解碼設(shè)備的配置的方塊圖; 圖25是示出上面實(shí)施例的聲音解碼設(shè)備的增強(qiáng)層解碼器的內(nèi)部配置的例子的方塊圖; 圖26是示出根據(jù)本發(fā)明第10實(shí)施例的基本層編碼器的內(nèi)部配置的例子的方塊圖; 圖27是示出上面實(shí)施例的基本層解碼器的內(nèi)部配置的例子的方塊圖; 圖28是示出上面實(shí)施例的基本層解碼器的內(nèi)部配置的例子的方塊圖; 圖29是示出根據(jù)本發(fā)明第11實(shí)施例的聲音編碼設(shè)備的頻率確定部分的內(nèi)部配置的例子的方塊圖; 圖30是示出上面實(shí)施例的估計(jì)誤差譜計(jì)算器計(jì)算的殘留誤差譜的例子的圖形; 圖31是示出根據(jù)本發(fā)明第12實(shí)施例的聲音編碼設(shè)備的頻率確定部分的內(nèi)部配置的例子的方塊圖; 圖32是示出上面實(shí)施例的聲音編碼設(shè)備的頻率確定部分的內(nèi)部配置的例子的方塊圖; 圖33是示出根據(jù)本發(fā)明第13實(shí)施例的聲音編碼設(shè)備的增強(qiáng)層編碼器的內(nèi)部配置的例子的方塊圖; 圖34是示出上面實(shí)施例的定序部分排序估計(jì)失真值的例子的圖形; 圖35是示出根據(jù)本發(fā)明第13實(shí)施例的聲音解碼設(shè)備的增強(qiáng)層解碼器的內(nèi)部配置的例子的方塊圖; 圖36是示出根據(jù)本發(fā)明第14實(shí)施例的聲音編碼設(shè)備的增強(qiáng)層編碼器的內(nèi)部配置的例子的方塊圖; 圖37是示出根據(jù)本發(fā)明第14實(shí)施例的聲音解碼設(shè)備的增強(qiáng)層解碼器的內(nèi)部配置的例子的方塊圖; 圖38是示出上面實(shí)施例的聲音編碼設(shè)備的頻率確定部分的內(nèi)部配置的例子的方塊圖; 圖39是示出根據(jù)本發(fā)明第14實(shí)施例的聲音解碼設(shè)備的增強(qiáng)層解碼器的內(nèi)部配置的例子的方塊圖; 圖40是示出根據(jù)本發(fā)明第15實(shí)施例的通信設(shè)備的配置的方塊圖; 圖41是示出根據(jù)本發(fā)明第16實(shí)施例的通信設(shè)備的配置的方塊圖; 圖42是示出根據(jù)本發(fā)明第17實(shí)施例的通信設(shè)備的配置的方塊圖;和 圖43是示出根據(jù)本發(fā)明第18實(shí)施例的通信設(shè)備的配置的方塊圖。

具體實(shí)施例方式 基本上,本發(fā)明擁有兩個(gè)層,即基本層和增強(qiáng)層,根據(jù)基本層中的CELP,以低位速率對(duì)輸入信號(hào)窄帶或?qū)拵ьl區(qū)進(jìn)行高質(zhì)編碼,然后,在不能在基本層中得到表示的背景音樂或環(huán)境聲音,以及存在比基本層覆蓋的頻區(qū)高的頻率成分的信號(hào)的增強(qiáng)層中進(jìn)行編碼,增強(qiáng)層具有如同使用音頻編碼方法一樣,能夠使所有信號(hào)得到管理的配置。
通過這種手段,可以對(duì)不能在基本層中得到表示的背景音樂或環(huán)境聲音,以及存在比基本層覆蓋的頻區(qū)高的頻率成分的信號(hào)進(jìn)行高效編碼。本發(fā)明的特性是,此時(shí),利用通過基本層編碼信息獲得的信息進(jìn)行增強(qiáng)層編碼。通過這種手段,獲得了能夠減少增強(qiáng)層編碼位的個(gè)數(shù)的效果。
現(xiàn)在參照附圖詳細(xì)描述本發(fā)明的實(shí)施例。
(第1實(shí)施例) 圖1是示出根據(jù)本發(fā)明第1實(shí)施例的信號(hào)處理設(shè)備的配置的方塊圖。圖1中的信號(hào)處理設(shè)備100主要包括向下取樣器(down-sampler)101、基本層編碼器102、局部解碼器103、向上取樣器(up-sampler)104、延遲器105、減法器106、增強(qiáng)層編碼器107和多路復(fù)用器108。
向下取樣器101從取樣速率FH到取樣速率FL向下取樣(down-sample)輸入信號(hào)取樣速率,并且將取樣速率FL的聲信號(hào)輸出到基本層編碼器102。這里,取樣速率FL是比取樣速率FH低的頻率。
基本層編碼器102編碼取樣速率FL的聲信號(hào),并且將編碼信息輸出到局部解碼器103和多路復(fù)用器108。
局部解碼器103解碼從基本層編碼器102輸出的編碼信息,將解碼信號(hào)輸出到向上取樣器104,并且將從解碼結(jié)果中獲得的參數(shù)輸出到增強(qiáng)層編碼器107。
向上取樣器104將解碼信號(hào)取樣速率升高到FH,并且將結(jié)果輸出到減法器106。
延遲器105將輸入取樣速率FH的聲信號(hào)延遲預(yù)定時(shí)間,然后,將信號(hào)輸出到減法器106。通過使這個(gè)延遲時(shí)間等于在向下取樣器106、基本層編碼器102、局部解碼器103和向上取樣器104中產(chǎn)生的時(shí)間延遲,可以防止在接著的相減處理中出現(xiàn)相移。
減法器106從取樣速率FH的聲信號(hào)中減去解碼信號(hào),并且將相減結(jié)果輸出到增強(qiáng)層編碼器107。
增強(qiáng)層編碼器107利用從局部解碼器103輸出的解碼結(jié)果參數(shù)解碼從減法器106輸出的信號(hào),并且將所得結(jié)果輸出到多路復(fù)用器108。多路復(fù)用器108多路復(fù)用和輸出由基本層編碼器102和增強(qiáng)層編碼器107編碼的信號(hào)。
現(xiàn)在說明基本層編碼和增強(qiáng)層編碼。圖2是示出輸入信號(hào)成分的例子的圖形。在圖2中,垂直軸表示信號(hào)成分信息量,而水平軸表示頻率。圖2示出了給出包含在輸入信號(hào)中的語音信息和背景音樂/背景噪聲信息的頻帶。
在語音信息的情況下,在低頻區(qū)中存在大量信息,信息量隨著頻區(qū)增高而減少。相反,在背景音樂和背景噪聲信息的情況下,與語音信息相比,在較低區(qū)域中存在相對(duì)少的信息,和大量信息處在較高區(qū)域中。
因此,本發(fā)明的信號(hào)處理設(shè)備使用數(shù)種編碼方法,并且對(duì)各自編碼方法適合的每個(gè)區(qū)域進(jìn)行不同編碼。
圖3是示出根據(jù)本實(shí)施例的信號(hào)處理設(shè)備的信號(hào)處理方法的例子的圖形。在圖3中,垂直軸表示信號(hào)成分信息量,而水平軸表示頻率。
基本層編碼器102被設(shè)計(jì)成有效表示從0到FL的頻帶中的語音信息,并且可以對(duì)該區(qū)域中的語音信息進(jìn)行高質(zhì)編碼。但是,從0到FL的頻帶中背景音樂和背景噪聲信息的編碼質(zhì)量不高。增強(qiáng)層編碼器107編碼基本層編碼器102不能編碼的部分和從FL到FH的頻帶中的信號(hào)。
因此,通過組合基本層編碼器102和增強(qiáng)層編碼器107,可以在寬帶中實(shí)現(xiàn)高質(zhì)編碼。此外,可以實(shí)現(xiàn)即使只利用至少基本層編碼部分的編碼信息也可以解碼語音信息的可伸縮功能。
這樣,局部解碼器103中出自通過編碼生成的那些參數(shù)當(dāng)中的有用參數(shù)被供應(yīng)給增強(qiáng)層編碼器107,和增強(qiáng)層編碼器107利用這個(gè)參數(shù)進(jìn)行編碼。
由于這個(gè)參數(shù)是從編碼信息中生成的,當(dāng)解碼本實(shí)施例的信號(hào)處理設(shè)備編碼的信號(hào)時(shí),在聲音解碼過程中可以獲得相同參數(shù),沒有必要附加這個(gè)傳輸?shù)浇獯a方的參數(shù)。其結(jié)果是,增強(qiáng)層編碼部分可以實(shí)現(xiàn)不會(huì)招致附加信息增加的有效編碼處理。
例如,存在于局部解碼器103解碼的參數(shù)當(dāng)中,指示輸入信號(hào)是諸如元音之類具有明顯周期性的信號(hào)還是諸如輔音之類具有明顯噪聲特性的信號(hào)的有聲/無聲標(biāo)志用作增強(qiáng)層編碼器107應(yīng)用的參數(shù)??梢岳糜新?無聲標(biāo)志進(jìn)行調(diào)整,譬如,進(jìn)行在有聲部分中的增強(qiáng)層中強(qiáng)調(diào)較低區(qū)域多于較高區(qū)域的位分配,和進(jìn)行在無聲部分中強(qiáng)調(diào)較高區(qū)域多于較低區(qū)域的位分配。
因此,根據(jù)本實(shí)施例的信號(hào)處理設(shè)備,通過從輸入信號(hào)中提取不超過預(yù)定頻率的成分和進(jìn)行適當(dāng)于語音編碼的編碼,和利用解碼所得編碼信息的結(jié)果進(jìn)行適合于音頻編碼的編碼,可以以低位速率進(jìn)行高質(zhì)編碼。
關(guān)于取樣速率FH和FL,只需要取樣速率FH比取樣速率FL高,并且對(duì)這些值沒有限制。例如,可以利用FH=24kHz和FL=16kHz的取樣速率進(jìn)行編碼。
(第2實(shí)施例) 在本實(shí)施例中,描述在第1實(shí)施例的局部解碼器103解碼的參數(shù)當(dāng)中,指示輸入信號(hào)譜的LPC系數(shù)用作增強(qiáng)層編碼器107利用的參數(shù)的例子。
本實(shí)施例的信號(hào)處理設(shè)備利用圖1中的基本層編碼器102中的CELP進(jìn)行編碼,并且在增強(qiáng)層編碼器107中利用指示輸入信號(hào)譜的LPC系數(shù)進(jìn)行編碼。
首先給出基本層編碼器102的操作的詳細(xì)描述,后面接著增強(qiáng)層編碼器107的基本配置的描述。這里提到的“基本配置”旨在簡化隨后實(shí)施例的描述,和表示不使用局部解碼器103編碼參數(shù)的配置。此后,給出使用局部解碼器103解碼的LPC系數(shù)的增強(qiáng)層編碼器107的描述,這是本實(shí)施例的特征。
圖4是示出基本層編碼器102的配置的例子的圖形?;緦泳幋a器102主要包括LPC分析器401、加權(quán)部分402、自適應(yīng)碼簿搜索單元403、自適應(yīng)增益量化器404、目標(biāo)矢量發(fā)生器405、噪聲碼簿搜索單元406、噪聲增益量化器407和多路復(fù)用器408。
LPC分析器401從向下取樣器101以取樣速率FL取樣的輸入信號(hào)中獲取LPC系數(shù),并且將這些LPC系數(shù)輸出到加權(quán)部分402。
加權(quán)部分402根據(jù)LPC分析器401獲取的LPC系數(shù),對(duì)輸入信號(hào)進(jìn)行加權(quán),并且將加權(quán)輸入信號(hào)輸出到自適應(yīng)碼簿搜索單元403、自適應(yīng)增益量化器404和目標(biāo)矢量發(fā)生器405。
自適應(yīng)碼簿搜索單元403利用作為目標(biāo)信號(hào)的加權(quán)輸入信號(hào)進(jìn)行自適應(yīng)碼簿搜索,并且將檢索的自適應(yīng)矢量輸出到自適應(yīng)增益量化器404和目標(biāo)矢量發(fā)生器405。然后,自適應(yīng)碼簿搜索單元403將確定為存在最小量化失真的自適應(yīng)矢量的代碼輸出到多路復(fù)用器408。
自適應(yīng)增益量化器404量化乘以從自適應(yīng)碼簿搜索單元403輸出的自適應(yīng)矢量的自適應(yīng)增益,并且將結(jié)果輸出到目標(biāo)矢量發(fā)生器405。然后,將這個(gè)代碼輸出到多路復(fù)用器408。
目標(biāo)矢量發(fā)生器405對(duì)將自適應(yīng)矢量乘以自適應(yīng)增益的結(jié)果與從加權(quán)部分402輸入的輸入信號(hào)進(jìn)行矢量相減,并且將相減結(jié)果作為目標(biāo)矢量輸出到噪聲碼簿搜索單元406和噪聲增益量化器407。
噪聲碼簿搜索單元406從噪聲碼簿中檢索與從目標(biāo)矢量發(fā)生器405輸出的目標(biāo)矢量相關(guān)的失真最小的噪聲矢量。然后,噪聲碼簿搜索單元406將檢索的噪聲矢量輸出到噪聲增益量化器407,并且還將那個(gè)代碼輸出到多路復(fù)用器408。
噪聲增益量化器407乘以噪聲碼簿搜索單元406檢索的噪聲矢量的噪聲增益,并且將那個(gè)代碼輸出到多路復(fù)用器408。
多路復(fù)用器408多路復(fù)用LPC系數(shù)、自適應(yīng)矢量、自適應(yīng)增益、噪聲矢量和噪聲增益編碼信息,并且將所得信號(hào)輸出到局部解碼器103和多路復(fù)用器108。
接著,描述圖4中基本層編碼器102的操作。首先,輸入從向下取樣器101輸出的取樣速率FL,和LPC分析器401獲取LPC系數(shù)。將LPC系數(shù)轉(zhuǎn)換成諸如LSP系數(shù)之類適合量化的參數(shù),并且量化它們。將通過這種量化獲得的編碼信息供應(yīng)給多路復(fù)用器408,并且,從編碼信息中計(jì)算出量化LSP系數(shù)和將其轉(zhuǎn)換成LPC系數(shù)。
通過這種量化,獲得量化LPC系數(shù)。利用量化LPC系數(shù)、自適應(yīng)碼簿、自適應(yīng)增益、噪聲碼簿和噪聲增益進(jìn)行編碼。
然后,加權(quán)部分402根據(jù)LPC分析器401獲得的LPC系數(shù),對(duì)輸入信號(hào)進(jìn)行加權(quán)。這種加權(quán)的目的是進(jìn)行譜成形,以便通過輸入信號(hào)的頻譜包絡(luò)掩蔽量化失真譜。
然后,自適應(yīng)碼簿搜索單元403利用作為目標(biāo)信號(hào)的加權(quán)輸入信號(hào)搜索自適應(yīng)碼簿。以音調(diào)周期為基礎(chǔ)重復(fù)舊激勵(lì)序列的信號(hào)被稱為自適應(yīng)矢量,和自適應(yīng)碼簿由在預(yù)定范圍的音調(diào)周期上生成的自適應(yīng)矢量組成。
如果將加權(quán)輸入信號(hào)指定為t(n),將包括LPC系數(shù)的加權(quán)合成濾波器的脈沖響應(yīng)被卷積成音調(diào)周期為i的自適應(yīng)矢量的信號(hào)指定為pi(n),那么,將使如下方程(1)的估算函數(shù)D達(dá)到極小的自適應(yīng)矢量的音調(diào)周期i作為參數(shù)發(fā)送到多路復(fù)用器408。
這里,N表示矢量長度。
接著,自適應(yīng)增益量化器404進(jìn)行乘以自適應(yīng)矢量的自適應(yīng)增益的量化。自適應(yīng)增益β用方程(2)表示。這個(gè)β值經(jīng)受標(biāo)量量化(scalar quantization),并且所得代碼被發(fā)送到多路復(fù)用器408。
然后,目標(biāo)矢量發(fā)生器405從輸入信號(hào)中減去自適應(yīng)矢量產(chǎn)生的效果,生成噪聲碼簿搜索單元406和噪聲增益量化器407使用的目標(biāo)矢量。如果這里的pi(n)表示當(dāng)方程(1)所表示的估算函數(shù)D達(dá)到極小時(shí),合成濾波器的脈沖響應(yīng)被卷積成自適應(yīng)矢量的信號(hào),和βq表示當(dāng)方程(2)所表示的自適應(yīng)矢量β經(jīng)受標(biāo)量量化時(shí)的量化值,那么,目標(biāo)矢量t2(n)由如下方程(2)表示。
t2(n)=t(n)-βq·pi(n) ...(3) 將前述目標(biāo)矢量t2(n)和LPC系數(shù)供應(yīng)給噪聲碼簿搜索單元406,進(jìn)行噪聲碼簿搜索。
這里,提供給噪聲碼簿搜索單元406的噪聲碼簿的典型成分是代數(shù)。在代數(shù)碼簿中,幅度為1的脈沖由只具有預(yù)定極少數(shù)的矢量表示。此外,對(duì)于代數(shù)碼簿,事先決定可以為每個(gè)相位保留的位置,以便不重疊。因此,代數(shù)碼簿的特征是,通過小量計(jì)算就可以確定脈沖位置和脈沖代碼(極性)的最佳組合。
如果將目標(biāo)矢量指定為t2(n),將加權(quán)合成濾波器的脈沖響應(yīng)被卷積成與代碼j相對(duì)應(yīng)的噪聲矢量的信號(hào)指定為cj(n),那么,將使如下方程(4)的估算函數(shù)D達(dá)到極小的噪聲矢量的指標(biāo)j作為參數(shù)發(fā)送到多路復(fù)用器408。
接著,噪聲增益量化器407進(jìn)行乘以噪聲矢量的噪聲增益的量化。噪聲增益γ用方程(5)表示。這個(gè)γ值經(jīng)受標(biāo)量量化,并且所得代碼被發(fā)送到多路復(fù)用器408。
多路復(fù)用器408多路復(fù)用發(fā)送的LPC系數(shù)、自適應(yīng)碼簿、自適應(yīng)增益、噪聲碼簿和噪聲增益編碼信息,并且將所得信號(hào)輸出到局部解碼器103和多路復(fù)用器108。
當(dāng)存在新輸入信號(hào)時(shí),重復(fù)上面的處理。當(dāng)不存在新輸入信號(hào)時(shí),終止該處理。
現(xiàn)在描述增強(qiáng)層編碼器107。圖5是示出增強(qiáng)層編碼器107的配置的例子的圖形。圖5中的增強(qiáng)層編碼器107主要包括LPC分析器501、譜包絡(luò)計(jì)算器502、MDCT部分503、功率計(jì)算器504、功率歸一化器505、譜歸一化器506、Bark標(biāo)度歸一化器508、Bark標(biāo)度形狀計(jì)算器507、矢量量化器509和多路復(fù)用器510。
LPC分析器501對(duì)輸入信號(hào)進(jìn)行LPC分析。并且,LPC分析器501在LSP或其它適合于量化的參數(shù)的值域中有效地量化LPC系數(shù),LPC分析器將編碼信息輸出到多路復(fù)用器,和LPC分析器將量化LPC系數(shù)輸出到譜包絡(luò)計(jì)算器502。譜包絡(luò)計(jì)算器502從量化LPC系數(shù)中計(jì)算譜包絡(luò),并且將這個(gè)譜包絡(luò)輸出到矢量量化器509。
MDCT部分503對(duì)輸入信號(hào)進(jìn)行MDCT(改進(jìn)離散余弦變換)處理,并且將獲得的MDCT系數(shù)輸出到功率計(jì)算504和功率歸一化器505。功率計(jì)算器504找出和量化MDCT系數(shù)的功率,并且將量化功率輸出到功率歸一化器505和將編碼信息輸出到多路復(fù)用器510。
功率歸一化器505利用量化功率歸一化MDCT系數(shù),并且將功率歸一化MDCT系數(shù)輸出到譜歸一化器506。譜歸一化器506利用譜包絡(luò)歸一化根據(jù)功率歸一化的MDCT系數(shù),并且將歸一化MDCT系數(shù)輸出到Bark標(biāo)度形狀計(jì)算器507和Bark標(biāo)度歸一化器508。
Bark標(biāo)度形狀計(jì)算器507通過Bark標(biāo)度計(jì)算以等間隔頻帶劃分的頻譜的形狀,然后,量化這個(gè)譜形狀,并且,將量化譜形狀輸出到Bark標(biāo)度歸一化器508和矢量量化器509。并且,Bark標(biāo)度形狀計(jì)算器507將編碼信息輸出到多路復(fù)用器510。
Bark標(biāo)度歸一化器508利用量化Bark標(biāo)度形狀歸一化歸一化MDCT系數(shù),將結(jié)果輸出到矢量量化器509。
矢量量化器509對(duì)從Bark標(biāo)度歸一化器508輸出的歸一化MDCT系數(shù)進(jìn)行矢量量化,找出失真最小的代碼矢量,并且將代碼矢量的指標(biāo)作為編碼信息輸出到多路復(fù)用器510。
多路復(fù)用器510多路復(fù)用所有編碼信息,并且將所得信號(hào)輸出到多路復(fù)用器108。
現(xiàn)在描述圖5中增強(qiáng)層編碼器107的操作。圖1中的減法器106獲得的相減信號(hào)經(jīng)受LPC分析器501的LPC分析。然后,通過LPC分析計(jì)算出LPC系數(shù)。將LPC系數(shù)轉(zhuǎn)換成此后進(jìn)行量化、諸如LSP系數(shù)之類適合于量化的參數(shù)。將與這里獲得的LPC系數(shù)有關(guān)的編碼信息供應(yīng)給多路復(fù)用器510。
譜包絡(luò)計(jì)算器502根據(jù)解碼的LPC系數(shù),按照如下的方程(6)計(jì)算譜包絡(luò)。
這里,αq表示解碼的LPC系數(shù),NP表示LPC系數(shù)的次序,和M表示譜分辨率。通過方程(6)獲得的譜包絡(luò)env(m)供如后所述的譜歸一化器506和矢量量化器509使用。
然后,輸入信號(hào)在MDCT部分503中經(jīng)受MDCT處理,獲得MDCT系數(shù)。MDCT處理的特征是,由于使用了每次一半地完全疊加連續(xù)幀的分析幀,和分析幀的前一半是奇函數(shù),而分析幀的后一半是偶函數(shù)的正交基,不會(huì)出現(xiàn)幀邊緣失真。當(dāng)進(jìn)行MDCT處理時(shí),將輸入信號(hào)與諸如正弦函數(shù)窗口那樣的窗口函數(shù)相乘。當(dāng)將MDCT系數(shù)指定為X(m)時(shí),MDCT系數(shù)按照如下方程(7)計(jì)算。
這里,x(n)表示將輸入信號(hào)乘以窗口函數(shù)時(shí)的信號(hào)。
接著,功率計(jì)算器504求出和量化MDCT系數(shù)X(m)的功率。然后,功率歸一化器505利用方程(8)歸一化具有那個(gè)量化之后的功率的MDCT系數(shù)。
這里,M表示MDCT系數(shù)的大小。在MDCT系數(shù)功率pow被量化之后,將編碼信息發(fā)送到多路復(fù)用器510。利用編碼信息解碼MDCT系數(shù)的功率,和利用所得值,按照如下方程(9)歸一化MDCT系數(shù)。
這里,X1(m)代表功率歸一化之后的MDCT系數(shù),和powq表示量化之后MDCT系數(shù)的功率。
然后,譜歸一化器506利用譜包絡(luò)歸一化已經(jīng)按照功率歸一化的MDCT系數(shù)。譜歸一化器506按照如下的方程(10)進(jìn)行歸一化。
接著,Bark標(biāo)度形狀計(jì)算器507通過Bark標(biāo)度計(jì)算以等間隔頻帶劃分的頻譜的形狀,然后,量化這個(gè)譜形狀。Bark標(biāo)度形狀計(jì)算器507將這個(gè)編碼信息發(fā)送到多路復(fù)用器510,并且還利用解碼值,對(duì)作為來自譜歸一化器506的輸出信號(hào)的MDCT系數(shù)X2(m)進(jìn)行歸一化。Bark標(biāo)度和Herz標(biāo)度之間的對(duì)應(yīng)關(guān)系通過如下方程(11)所表示的轉(zhuǎn)換表達(dá)式給出。
這里,B表示Bark標(biāo)度和f表示Herz標(biāo)度。對(duì)于在Bark標(biāo)度上以等間隔頻帶劃分的子頻帶,Bark標(biāo)度形狀計(jì)算器507按照如下的方程(12)計(jì)算形狀。
這里,fl(k)表示第k子頻帶的最低頻率和fh(k)表示第k子頻帶的最高頻率,和K表示子頻帶的個(gè)數(shù)。
然后,Bark標(biāo)度形狀計(jì)算器507量化每個(gè)頻帶的Bark標(biāo)度形狀B(k)和將編碼信息發(fā)送到多路復(fù)用器510,并且還解碼Bark標(biāo)度形狀和將結(jié)果供應(yīng)給Bark標(biāo)度歸一化器508和矢量量化器509。利用歸一化之后的Bark標(biāo)度形狀,Bark標(biāo)度歸一化器508按照如下方程(13)生成歸一化MDCT系數(shù)X3(m)。
這里,Bq(k)表示第k子頻帶量化之后的Bark標(biāo)度形狀。
接著,矢量量化器509將X3(m)劃分成數(shù)個(gè)矢量和利用與每個(gè)矢量相對(duì)應(yīng)的碼簿,找出失真最小的代碼矢量,并且將這個(gè)指標(biāo)作為編碼信息發(fā)送到多路復(fù)用器510。
當(dāng)進(jìn)行矢量量化時(shí),矢量量化器509利用輸入信號(hào)譜信息,確定兩個(gè)重要參數(shù)。這些參數(shù)之一是量化位分配,和另一個(gè)是碼簿搜索加權(quán)。量化位分配是利用譜包絡(luò)計(jì)算器502獲得的譜包絡(luò)env(m)確定的。
當(dāng)利用譜包絡(luò)確定量化位分配時(shí),也可以作出這樣的設(shè)置,使分配在與頻率0到FL相對(duì)應(yīng)的頻譜中的位數(shù)很少。
實(shí)現(xiàn)這個(gè)過程的一個(gè)例子是設(shè)置可以分配在頻率0到FL中的最大位數(shù)MAX_LOWBAND_BIT,并且,施加一個(gè)限制,以便分配在這個(gè)頻帶中的最大位數(shù)不超過最大位數(shù)MAX_LOWBAND_BIT的方法。
在這種實(shí)現(xiàn)例子中,由于在頻率為0到FL的基本層中已經(jīng)進(jìn)行了編碼,沒有必要分配大量位數(shù),和通過進(jìn)行有意使這個(gè)頻帶中的量化粗糙些并使位分配保持在低水平上的量化和將額外位分配給頻率FL到FH,可以提高總體質(zhì)量。也可以使用通過組合譜包絡(luò)env(m)和前述Bark標(biāo)度形狀Bq(k)確定這種位分配的配置。
利用應(yīng)用譜包絡(luò)計(jì)算器502獲得的譜包絡(luò)env(m)和從Bark標(biāo)度形狀計(jì)算器507獲得的Bark標(biāo)度形狀Bq(k)中計(jì)算的權(quán)重的失真度量進(jìn)行矢量量化。通過找出使如下方程(14)規(guī)定的失真D達(dá)到極小的代碼矢量C的指標(biāo)j實(shí)現(xiàn)矢量量化。
這里,w(m)表示加權(quán)函數(shù)。
利用譜包絡(luò)env(m)和Bark標(biāo)度形狀Bq(k)可以將加權(quán)函數(shù)w(n)表示成如下方程(15)所示那樣。
w(m)=(env(m)·Bq(Herz_to_Bark(m)))p...(15) 這里,p表示0和1之間的常數(shù),和Herz_to_Bark()表示從Herz標(biāo)度轉(zhuǎn)換到Bark標(biāo)度的函數(shù)。
當(dāng)加權(quán)函數(shù)w(m)確定下來時(shí),也可以作出這樣的設(shè)置,使將位分配給與頻率0到FL相對(duì)應(yīng)的頻譜的加權(quán)函數(shù)很小。實(shí)現(xiàn)這個(gè)過程的一個(gè)例子是下面將與頻率0到FL相對(duì)應(yīng)的加權(quán)函數(shù)w(m)的可能最大值設(shè)置成MAX_LOWBAND_WGT,并且,施加一個(gè)限制,以便這個(gè)頻帶的加權(quán)函數(shù)w(m)的值不超過MAX_LOWBAND_WGT的方法。在這種實(shí)現(xiàn)例子中,在頻率為0到FL的基本層中已經(jīng)進(jìn)行了編碼,通過有意降低這個(gè)頻帶的量化精度和相對(duì)提高頻率FL到FH的量化精度,可以提高總體質(zhì)量。
最后,多路復(fù)用器510多路復(fù)用編碼信息,并且將所得信號(hào)輸出到多路復(fù)用器108。當(dāng)存在新輸入信號(hào)時(shí),重復(fù)上面的處理。當(dāng)不存在新輸入信號(hào)時(shí),終止該處理。
因此,根據(jù)本實(shí)施例的信號(hào)處理設(shè)備,通過從輸入信號(hào)中提取不超過預(yù)定頻率的成分和利用碼激勵(lì)線性預(yù)測(cè)進(jìn)行編碼,和利用解碼所得編碼信息的結(jié)果通過MDCT處理進(jìn)行編碼,可以以低位速率進(jìn)行高質(zhì)編碼。
上面已經(jīng)描述了從減法器106獲得的相減信號(hào)中分析LPC系數(shù)的例子,但本發(fā)明的信號(hào)處理設(shè)備也可以利用局部解碼器103解碼的LPC系數(shù)進(jìn)行解碼。
圖6是示出增強(qiáng)層編碼器107的配置的例子的圖形。將與圖5中相同的標(biāo)號(hào)指定給圖6中與圖5中的那些相同的部分,并且省略對(duì)它們的詳細(xì)描述。
圖6中的增強(qiáng)層編碼器107與圖5中的增強(qiáng)層編碼器107的不同之處在于,配備了轉(zhuǎn)換表601、LPC系數(shù)映射部分602、譜包絡(luò)計(jì)算器603和變換部分604,并且利用局部解碼器103解碼的LPC系數(shù)進(jìn)行編碼。
轉(zhuǎn)換表601存儲(chǔ)基本層LPC系數(shù)和增強(qiáng)層LPC系數(shù),以及指示它們之間的對(duì)應(yīng)關(guān)系。
LPC系數(shù)映射部分602參考轉(zhuǎn)換表601,將從局部解碼器103輸入的基本層LPC系數(shù)轉(zhuǎn)換成增強(qiáng)層LPC系數(shù),并且將增強(qiáng)層LPC系數(shù)輸出到譜包絡(luò)計(jì)算器603。
譜包絡(luò)計(jì)算器603根據(jù)增強(qiáng)層LPC系數(shù)獲取譜包絡(luò),并且將這個(gè)譜包絡(luò)輸出到變換部分604。變換部分604變換譜包絡(luò)和將結(jié)果輸出到譜歸一化器506和矢量量化器509。
現(xiàn)在描述圖6中增強(qiáng)層編碼器107的操作?;緦覮PC系數(shù)是為信號(hào)帶0到FL中的信號(hào)求的,并且與增強(qiáng)層信號(hào)(信號(hào)帶0到FH)所用的LPC系數(shù)不一致。但是,在兩者之間存在強(qiáng)關(guān)聯(lián)。因此,在LPC系數(shù)映射部分602中,利用這種關(guān)聯(lián)事先獨(dú)立設(shè)計(jì)示出信號(hào)帶0到FL信號(hào)的LPC系數(shù)和信號(hào)帶0到FH信號(hào)的LPC系數(shù)之間的對(duì)應(yīng)關(guān)系的轉(zhuǎn)換表601。這個(gè)轉(zhuǎn)換表601用于從基本層LPC系數(shù)中求出增強(qiáng)層LPC系數(shù)。
圖7是示出增強(qiáng)層中的LPC系數(shù)計(jì)算的例子的圖形。轉(zhuǎn)換表601由表示增強(qiáng)層LPC系數(shù)(次序M)的J個(gè)候選者{Yj(m)}和與{Yj(m)}指定了對(duì)應(yīng)關(guān)系、與基本層LPC系數(shù)具有相同次數(shù)(=K)的候選者{yj(k)}組成。{Yj(m)}和{yj(k)}是根據(jù)大規(guī)模音頻和語音數(shù)據(jù)等事先設(shè)計(jì)和提供的。當(dāng)輸入基本層LPC系數(shù)x(k)時(shí),從{yj(k)}當(dāng)中找出與x(k)最相似的一系列LPC系數(shù)。通過輸出與確定為最相似的LPC系數(shù)的指標(biāo)j相對(duì)應(yīng)的增強(qiáng)層LPC系數(shù)Yj(m),可以實(shí)現(xiàn)從基本層LPC系數(shù)到增強(qiáng)層LPC系數(shù)的映射。
接著,譜包絡(luò)計(jì)算器603根據(jù)以這種方式找出的增強(qiáng)層LPC系數(shù)獲得譜包絡(luò)。然后,變換部分604變換這個(gè)譜包絡(luò)。然后,將這個(gè)變換譜包絡(luò)當(dāng)作如上所述的實(shí)現(xiàn)例子的譜包絡(luò),由此加以處理。
實(shí)現(xiàn)變換譜包絡(luò)的變換部分604的一個(gè)例子是使與經(jīng)受基本層編碼的信號(hào)帶0到FL相對(duì)應(yīng)的譜包絡(luò)的作用很小的處理。如果將譜包絡(luò)指定為env(m),變換env′(m)由如下方程(16)表示。
這里,p表示0和1之間的常數(shù)。
在頻率為0到FL的基本層中已經(jīng)進(jìn)行了編碼,和經(jīng)過增強(qiáng)層編碼的相減信號(hào)的頻率0到FL之間的頻譜接近平坦。與此無關(guān),在如在這個(gè)實(shí)現(xiàn)例子中所述的LPC系數(shù)映射中不考慮這樣的動(dòng)作。因此,通過利用利用方程(16)校正譜包絡(luò)的技術(shù)可以提高質(zhì)量。
因此,根據(jù)本實(shí)施例的信號(hào)處理設(shè)備,通過利用基本層量化器量化的LPC系數(shù)求出增強(qiáng)層LPC系數(shù),和從增強(qiáng)層LPC系數(shù)分析中計(jì)算出譜包絡(luò),使LPC分析和量化變得多余了,并且可以減少量化位的個(gè)數(shù)。
(第3實(shí)施例) 圖8是示出根據(jù)本發(fā)明第3實(shí)施例的信號(hào)處理設(shè)備的增強(qiáng)層編碼器的配置的方塊圖。將與圖5中相同的標(biāo)號(hào)指定給圖8中與圖5中的那些相同的部分,并且省略對(duì)它們的詳細(xì)描述。
圖8中的增強(qiáng)層編碼器107與圖5中的增強(qiáng)層編碼器107的不同之處在于,配備了譜精細(xì)結(jié)構(gòu)計(jì)算器801,并且,利用基本層編碼器102編碼和局部解碼器103解碼的音調(diào)周期計(jì)算譜精細(xì)結(jié)構(gòu),和將那個(gè)譜精細(xì)結(jié)構(gòu)應(yīng)用在譜歸一化和矢量量化中。
譜精細(xì)結(jié)構(gòu)計(jì)算器801從在基本層中編碼的音調(diào)周期T和音調(diào)增益β中計(jì)算譜精細(xì)結(jié)構(gòu),并且將譜精細(xì)結(jié)構(gòu)輸出到譜歸一化器506。
前述音調(diào)周期T和音調(diào)增益β實(shí)際上是編碼信息的組成部分,并且,通過局部解碼器(如圖1所示)可以獲得相同信息。因此,即使利用音調(diào)周期T和音調(diào)增益β進(jìn)行編碼,位速率也不會(huì)增加。
利用音調(diào)周期T和音調(diào)增益β進(jìn)行編碼,譜精細(xì)結(jié)構(gòu)計(jì)算器801按照如下方程(17)計(jì)算譜精細(xì)結(jié)構(gòu)har(m)。
這里,M表示譜分辨率。由于方程(17)是β的絕對(duì)值大于等于1時(shí)的振蕩濾波,所以還存在設(shè)置一種限制,使β絕對(duì)值的可能范圍小于等于小于1的預(yù)定設(shè)置值(例如,0.8)的方法。
譜歸一化器506利用譜包絡(luò)計(jì)算器502獲得的譜包絡(luò)env(m)和譜精細(xì)結(jié)構(gòu)計(jì)算器801獲得的譜精細(xì)結(jié)構(gòu)har(m)兩者,按照如下方程(18)進(jìn)行歸一化。
利用譜包絡(luò)計(jì)算器502獲得的譜包絡(luò)env(m)和譜精細(xì)結(jié)構(gòu)計(jì)算器801獲得的譜精細(xì)結(jié)構(gòu)har(m)兩者還可以確定矢量量化器509的量化位分配。譜精細(xì)結(jié)構(gòu)還用在矢量量化中的加權(quán)函數(shù)w(m)確定中。具體地說,按照如下方程(18)定義加權(quán)函數(shù)w(m)。
w(m)=(env(m)·har(m)·Bq(Herz_to_Bark(m)))p...(19) 這里,p表示0和1之間的常數(shù),和Herz_to_Bark()表示從Herz標(biāo)度轉(zhuǎn)換到Bark標(biāo)度的函數(shù)。
因此,根據(jù)本實(shí)施例的信號(hào)處理設(shè)備,通過利用基本層編碼器編碼和局部解碼器解碼的音調(diào)周期計(jì)算譜精細(xì)結(jié)構(gòu),和將那個(gè)譜精細(xì)結(jié)構(gòu)應(yīng)用在譜歸一化和矢量量化中,可以提高量化性能。
(第4實(shí)施例) 圖9是示出根據(jù)本發(fā)明第4實(shí)施例的信號(hào)處理設(shè)備的增強(qiáng)層編碼器的配置的方塊圖。將與圖5中相同的標(biāo)號(hào)指定給圖9中與圖5中的那些相同的部分,并且省略對(duì)它們的詳細(xì)描述。
圖9中的增強(qiáng)層編碼器107與圖5中的增強(qiáng)層編碼器的不同之處在于,配備了功率估計(jì)單元901和功率漲落量量化器902,并且,在局部解碼器103中利用基本層編碼器102獲得的編碼信息生成解碼信號(hào),根據(jù)那個(gè)解碼信號(hào)預(yù)測(cè)MDCT系數(shù)功率,和根據(jù)那個(gè)預(yù)測(cè)值編碼漲落量。
在圖1中,解碼參數(shù)從局部解碼器103輸出到增強(qiáng)層編碼器107,但是,在本實(shí)施例中,將局部解碼器103獲得的解碼信號(hào)輸出到增強(qiáng)層編碼器107,而不是解碼參數(shù)。
圖5中局部解碼器103解碼的信號(hào)sl(n)輸入到功率估計(jì)單元901。然后,功率估計(jì)單元901根據(jù)這個(gè)解碼信號(hào)sl(n)估計(jì)MDCT系數(shù)功率。如果將MDCT系數(shù)功率指定為powp,powp由如下方程(20)表示。
這里,N表示解碼信號(hào)sl(n)的長度,和α表示用于校正的預(yù)定常數(shù)。在使用從基本層LPC系數(shù)中求出的譜斜度的另一種方法中,MDCT系數(shù)功率估計(jì)由如下方程(21)表示。
這里,β表示具有當(dāng)譜斜度大時(shí)(當(dāng)?shù)皖l帶中譜能量大時(shí))接近0,和當(dāng)譜斜度小時(shí)(當(dāng)相對(duì)高區(qū)域中存在功率時(shí))接近1的特性、取決于從基本層LPC系數(shù)中求出的譜斜度的變量。
接著,功率漲落量量化器902通過功率估計(jì)單元901獲得的功率估計(jì)powp,歸一化MDCT部分503獲得的MDCT系數(shù)的功率,并且量化漲落量。漲落量r用如下方程(22)表示。
這里,pow表示MDCT系數(shù)功率,和通過方程(23)來計(jì)算。
這里,X(m)表示MDCT系數(shù),和M表示幀長度。功率漲落量量化器902量化漲落量r,將編碼信息發(fā)送到多路復(fù)用器510,并且還解碼量化漲落量rq。利用量化漲落量rq,功率歸一化器505利用如下方程(24)歸一化MDCT系數(shù)。
這里,X1(m)表示功率歸一化之后的MDCT系數(shù)。
因此,根據(jù)本實(shí)施例的信號(hào)處理設(shè)備,通過利用基本層解碼信號(hào)功率和增強(qiáng)層MDCT系數(shù)功率之間的關(guān)聯(lián),利用基本層解碼信號(hào)預(yù)測(cè)MDCT系數(shù)功率,和根據(jù)那個(gè)預(yù)測(cè)值編碼漲落量,可以減少M(fèi)DCT系數(shù)功率量化所需的位數(shù)。
(第5實(shí)施例) 圖10是示出根據(jù)本發(fā)明第5實(shí)施例的信號(hào)處理設(shè)備的配置的方塊圖。圖10中的信號(hào)處理設(shè)備主要包括多路分用器1001、基本層解碼器1002、向上取樣器1003、增強(qiáng)層解碼器1004和加法器1005。
多路分用器1001分離編碼信息,生成基本層編碼信息和增強(qiáng)層編碼信息。然后,多路分用器1001將基本層編碼信息輸出到基本層解碼器1002,和將增強(qiáng)層編碼信息輸出到增強(qiáng)層解碼器1004。
基本層解碼器1002利用多路分用器1001獲得的基本層編碼信息解碼取樣速率FL解碼信號(hào),并且將所得信號(hào)輸出到向上取樣器1003。同時(shí),將基本層解碼器1002解碼的參數(shù)輸入到增強(qiáng)層解碼器1004。向上取樣器1003將解碼信號(hào)取樣頻率升高到FH,并且將它輸出到加法器1005。
增強(qiáng)層解碼器1004利用多路分用器1001獲得的增強(qiáng)層編碼信息和基本層解碼器1002解碼的參數(shù),解碼取樣速率FH解碼信號(hào),并且將所得信號(hào)輸出到加法器1005。
加法器1005對(duì)從向上取樣器1003輸出的解碼信號(hào)和從增強(qiáng)層解碼器1004輸出的解碼信號(hào)進(jìn)行相加。
現(xiàn)在描述本實(shí)施例的信號(hào)處理設(shè)備的操作。首先,輸入在第1到第4實(shí)施例任何一個(gè)的信號(hào)處理設(shè)備中編碼的代碼,并且,多路分用器1001分離那個(gè)代碼,生成基本層編碼信息和增強(qiáng)層編碼信息。
接著,基本層解碼器1002利用多路分用器1001獲得的基本層編碼信息解碼取樣速率FL解碼信號(hào)。然后,向上取樣器1003將那個(gè)解碼信號(hào)的取樣頻率升高到FH。
在增強(qiáng)層解碼器1004中,利用多路分用器1001獲得的增強(qiáng)層編碼信息和基本層解碼器1002解碼的參數(shù)解碼取樣速率FH解碼信號(hào)。
加法器1005相加向上取樣器1003向上取樣的基本層解碼信號(hào)和增強(qiáng)層解碼信號(hào)。當(dāng)存在新輸入信號(hào)時(shí),重復(fù)上面的處理。當(dāng)不存在新輸入信號(hào)時(shí),終止該處理。
因此,根據(jù)本實(shí)施例的信號(hào)處理設(shè)備,通過利用基本層解碼器1002解碼的參數(shù)進(jìn)行增強(qiáng)層解碼器1004解碼,可以從利用基本層編碼中的解碼參數(shù)進(jìn)行增強(qiáng)層編碼的聲音編碼單元的編碼信息中生成解碼信號(hào)。
現(xiàn)在描述基本層解碼器1002。圖11是示出基本層解碼器1002的例子的方塊圖。圖11中的基本層解碼器1002主要包括多路分用器1101、激勵(lì)發(fā)生器1102和合成濾波器1103,和進(jìn)行CELP解碼處理。
多路分用器1101從多路分用器1001輸入的基本層編碼信息中分離出各種參數(shù),并且將這些參數(shù)輸出到和合成濾波器1103。
激勵(lì)發(fā)生器1102進(jìn)行自適應(yīng)矢量、自適應(yīng)矢量增益、噪聲矢量和噪聲矢量增益解碼,利用這些值生成激勵(lì)信號(hào),并且將這個(gè)激勵(lì)信號(hào)輸出到合成濾波器1103。合成濾波器1103利用解碼LPC系數(shù)生成合成信號(hào)。
現(xiàn)在描述圖11中基本層解碼器1002的操作。首先,多路分用器1101從基本層編碼信息中分離出各種參數(shù)。
接著,激勵(lì)發(fā)生器1102進(jìn)行自適應(yīng)矢量、自適應(yīng)矢量增益、噪聲矢量和噪聲矢量增益解碼。然后,激勵(lì)發(fā)生器1102按照如下方程(25)生成激勵(lì)矢量ex(n)。
ex(n)=βq·q(n)+γq·c(n) ...(25) 這里,q(n)表示自適應(yīng)矢量,βq表示自適應(yīng)矢量增益,c(n)表示噪聲矢量,和γq表示噪聲矢量增益。
然后,合成濾波器1103利用解碼LPC系數(shù),按照如下方程(26)生成合成信號(hào)syn(n)。
這里,αq表示解碼LPC系數(shù),和NP表示LPC系數(shù)的次序。
將以這種方式解碼的解碼信號(hào)syn(n)輸出到向上取樣器1003,并且將作為解碼結(jié)果獲得的參數(shù)輸出到增強(qiáng)層解碼器1004。當(dāng)存在新輸入信號(hào)時(shí),重復(fù)上面的處理。當(dāng)不存在新輸入信號(hào)時(shí),終止該處理。取決于CELP配置,在經(jīng)過后置濾波器之后輸出合成信號(hào)的模式也是可以的。所述的后置濾波器具有使編碼失真更不易覺察的后處理功能。
現(xiàn)在描述增強(qiáng)層解碼器1004。圖12是示出增強(qiáng)層解碼器1004的例子的方塊圖。圖12中的增強(qiáng)層解碼器1004主要包括多路分用器1201、LPC系數(shù)解碼器1202、譜包絡(luò)計(jì)算器1203、矢量解碼器1204、Bark標(biāo)度形狀解碼器1205、乘法器1206、乘法器1207、功率解碼器1208、乘法器1209和IMDCT部分1210。
多路分用器1201從多路分用器1001輸出的增強(qiáng)層編碼信息中分離出各種參數(shù)。LPC系數(shù)解碼器1202利用LPC系數(shù)相關(guān)編碼信息解碼LPC系數(shù),并且將結(jié)果輸出到譜包絡(luò)計(jì)算器1203。
譜包絡(luò)計(jì)算器1203利用LPC系數(shù),按照方程(6)計(jì)算譜包絡(luò),并且將譜包絡(luò)env(m)輸出到矢量解碼器1204和乘法器1207。
矢量解碼器1204根據(jù)譜包絡(luò)計(jì)算器1203獲得的譜包絡(luò)env(m)確定量化位分配,并且根據(jù)從多路分用器1201中獲得的編碼信息和前述量化位分配,解碼歸一化MDCT系數(shù)X3q(m)。量化位分配方法與用在第1到第4實(shí)施例任何一個(gè)的編碼方法中的增強(qiáng)層編碼中的方法相同。
Bark標(biāo)度形狀解碼器1205根據(jù)從多路分用器1201中獲得的編碼信息,解碼Bark標(biāo)度形狀Bq(k),并且將結(jié)果輸出到乘法器1206。
乘法器1206按照如下方程(27),將歸一化MDCT系數(shù)X3q(m)乘以Bark標(biāo)度形狀Bq(k),并且將結(jié)果輸出到乘法器1207。
這里,fl(k)表示第k子頻帶的最低頻率和fh(k)表示第k子頻帶的最高頻率,和K表示子頻帶個(gè)數(shù)。
乘法器1207按照如下方程(28),將從乘法器1206中獲得的歸一化MDCT系數(shù)X2q(m)乘以譜包絡(luò)計(jì)算器1203獲得的譜包絡(luò)env(m),并且將相乘結(jié)果輸出到乘法器1209。
X1q(m)=X2q(m)env(m)...(28) 功率解碼器1208根據(jù)從多路分用器1201中獲得的編碼信息解碼功率powq,并且將解碼結(jié)果輸出到乘法器1209。
乘法器1209按照如下方程(29),將歸一化MDCT系數(shù)X1q(m)乘以解碼功率powq,并且將相乘結(jié)果輸出到IMDCT部分1210。
IMDCT部分1210對(duì)以這種方式獲得的解碼MDCT系數(shù)進(jìn)行IMDCT(改進(jìn)離散余弦逆變換),重疊和相加一半在前一個(gè)幀中獲得和一半在當(dāng)前幀中獲得的信號(hào),并且,所得信號(hào)是輸出信號(hào)。當(dāng)存在新輸入信號(hào)時(shí),重復(fù)上面的處理。當(dāng)不存在新輸入信號(hào)時(shí),終止該處理。
因此,根據(jù)本實(shí)施例的信號(hào)處理設(shè)備,通過利用基本層解碼器解碼的參數(shù)進(jìn)行增強(qiáng)層解碼器解碼,可以從利用基本層編碼中的解碼參數(shù)進(jìn)行增強(qiáng)層編碼的編碼單元的編碼信息中生成解碼信號(hào)。
(第6實(shí)施例) 圖13是示出增強(qiáng)層解碼器1004的例子的方塊圖。將與圖12中相同的標(biāo)號(hào)指定給圖13中與圖2中的那些相同的部分,并且省略對(duì)它們的詳細(xì)描述。
圖13中的增強(qiáng)層解碼器1004與圖12中的增強(qiáng)層編碼器1004的不同之處在于,配備了轉(zhuǎn)換表1301、LPC系數(shù)映射部分1302、譜包絡(luò)計(jì)算器1303和變換部分1304,并且利用基本層解碼器1002解碼的LPC系數(shù)進(jìn)行解碼。
轉(zhuǎn)換表1301存儲(chǔ)基本層LPC系數(shù)和增強(qiáng)層LPC系數(shù),以及指示它們之間的對(duì)應(yīng)關(guān)系。
LPC系數(shù)映射部分1302參考轉(zhuǎn)換表1301,將從局部解碼器1002輸入的基本層LPC系數(shù)轉(zhuǎn)換成增強(qiáng)層LPC系數(shù),并且將增強(qiáng)層LPC系數(shù)輸出到譜包絡(luò)計(jì)算器1303。
譜包絡(luò)計(jì)算器1303根據(jù)增強(qiáng)層LPC系數(shù)獲取譜包絡(luò),并且將這個(gè)譜包絡(luò)輸出到變換部分1304。變換部分1304變換譜包絡(luò)和將結(jié)果輸出到乘法器1207和矢量解碼器1204。變換方法的一個(gè)例子是顯示在第2實(shí)施例的方程(16)中的方法。
現(xiàn)在描述圖13中增強(qiáng)層解碼器1003的操作?;緦覮PC系數(shù)是為信號(hào)帶0到FL中的信號(hào)求的,并且與增強(qiáng)層信號(hào)(信號(hào)帶0到FH)所用的LPC系數(shù)不一致。但是,在兩者之間存在強(qiáng)關(guān)聯(lián)。因此,在LPC系數(shù)映射部分1302中,利用這種關(guān)聯(lián)事先獨(dú)立設(shè)計(jì)示出信號(hào)帶0到FL信號(hào)的LPC系數(shù)和信號(hào)帶0到FH信號(hào)的LPC系數(shù)之間的對(duì)應(yīng)關(guān)系的轉(zhuǎn)換表1301。這個(gè)轉(zhuǎn)換表1301用于從基本層LPC系數(shù)中求出增強(qiáng)層LPC系數(shù)。
轉(zhuǎn)換表1301的細(xì)節(jié)與第2實(shí)施例中轉(zhuǎn)換表601的細(xì)節(jié)相同。
因此,根據(jù)本實(shí)施例的信號(hào)處理設(shè)備,通過利用基本層解碼器量化的LPC系數(shù)求出增強(qiáng)層LPC系數(shù),和從增強(qiáng)層LPC系數(shù)中計(jì)算出譜包絡(luò),使LPC分析和量化變得多余了,并且可以減少量化位的個(gè)數(shù)。
(第7實(shí)施例) 圖14是示出根據(jù)本發(fā)明第7實(shí)施例的信號(hào)處理設(shè)備的增強(qiáng)層解碼器的配置的方塊圖。將與圖12中相同的標(biāo)號(hào)指定給圖14中與圖12中的那些相同的部分,并且省略對(duì)它們的詳細(xì)描述。
圖14中的增強(qiáng)層解碼器1004與圖12中的增強(qiáng)層解碼器的不同之處在于,配備了譜精細(xì)結(jié)構(gòu)計(jì)算器1401,并且,利用基本層解碼器1002解碼的音調(diào)周期計(jì)算譜精細(xì)結(jié)構(gòu),將那個(gè)譜精細(xì)結(jié)構(gòu)應(yīng)用在解碼中,并且進(jìn)行與聲音編碼相對(duì)應(yīng)的聲音解碼,從而提高量化性能。
譜精細(xì)結(jié)構(gòu)計(jì)算器1401從基本層解碼器1002解碼的音調(diào)周期T和音調(diào)增益β中計(jì)算譜精細(xì)結(jié)構(gòu),并且將譜精細(xì)結(jié)構(gòu)輸出到矢量解碼器1204和乘法器1207。
利用音調(diào)周期Tq和音調(diào)增益βq,譜精細(xì)結(jié)構(gòu)計(jì)算器1401按照如下方程(30)計(jì)算譜精細(xì)結(jié)構(gòu)har(m)。
這里,M表示譜分辨率。由于方程(30)是βq的絕對(duì)值大于等于1時(shí)的振蕩濾波,所以還可以設(shè)置一種限制,使βq絕對(duì)值的可能范圍小于等于小于1的預(yù)定設(shè)置值(例如,0.8)。
利用譜包絡(luò)計(jì)算器1203獲得的譜包絡(luò)env(m)和譜精細(xì)結(jié)構(gòu)計(jì)算器1401獲得的譜精細(xì)結(jié)構(gòu)har(m)兩者還可以確定矢量解碼器1204的量化位分配。然后,根據(jù)那個(gè)量化位分配和從多路分用器1201中獲得的編碼信息解碼歸一化MDCT系數(shù)X3q(m)。此外,通過按照如下方程(31)將歸一化MDCT系數(shù)X2q(m)乘以譜包絡(luò)env(m)和譜精細(xì)結(jié)構(gòu)har(m)求出歸一化MDCT系數(shù)X1q(m)。
X1q(m)=X2q(m)env(m)har(m)...(31) 因此,根據(jù)本實(shí)施例的信號(hào)處理設(shè)備,通過利用基本層編碼器編碼和局部解碼器解碼的音調(diào)周期計(jì)算譜精細(xì)結(jié)構(gòu),和將那個(gè)譜精細(xì)結(jié)構(gòu)應(yīng)用在譜歸一化和矢量量化中,可以進(jìn)行與聲音編碼相對(duì)應(yīng)的聲音解碼,從而提高量化性能。
(第8實(shí)施例) 圖15是示出根據(jù)本發(fā)明第8實(shí)施例的信號(hào)處理設(shè)備的增強(qiáng)層解碼器的配置的方塊圖。將與圖12中相同的標(biāo)號(hào)指定給圖15中與圖12中的那些相同的部分,并且省略對(duì)它們的詳細(xì)描述。
圖15中的增強(qiáng)層解碼器1004與圖12中的增強(qiáng)層解碼器的不同之處在于,配備了功率估計(jì)單元1501、功率漲落量解碼器1502和功率發(fā)生器1503,并且,形成與利用基本層解碼信號(hào)預(yù)測(cè)MDCT系數(shù)功率,并根據(jù)那個(gè)預(yù)測(cè)值編碼漲落量的編碼器相對(duì)應(yīng)的解碼器。
在圖10中,解碼參數(shù)從基本層解碼器1002輸出到增強(qiáng)層解碼器1004,但是,在本實(shí)施例中,將基本層解碼器1002獲得的解碼信號(hào)輸出到增強(qiáng)層解碼器1004,而不是解碼參數(shù)。
功率估計(jì)單元1501利用方程(20)或方程(21),從基本層解碼器1002解碼的解碼信號(hào)sl(n)中估計(jì)MDCT系數(shù)的功率。
功率漲落量量化器1502根據(jù)從多路分用器1201獲得的編碼信息解碼功率漲落量,并且將這個(gè)功率漲落量輸出到功率發(fā)生器1503。功率發(fā)生器1503從功率漲落量中計(jì)算功率。
乘法器1209按照如下方程(32)求出MDCT系數(shù)。
這里,rq表示功率漲落量,和powp表示功率估計(jì)。X1q(m)表示來自乘法器1207的輸出信號(hào)。
因此,根據(jù)本實(shí)施例的信號(hào)處理設(shè)備,通過配置與利用基本層解碼信號(hào)預(yù)測(cè)MDCT系數(shù)功率,和根據(jù)那個(gè)預(yù)測(cè)值編碼漲落量的編碼器相對(duì)應(yīng)的解碼器,可以減少M(fèi)DCT系數(shù)功率量化所需的位數(shù)。
(第9實(shí)施例) 圖16是示出根據(jù)本發(fā)明第9實(shí)施例的聲音編碼設(shè)備的配置的方塊圖。圖16中的聲音編碼設(shè)備1600主要包括向下取樣器1601、基本層編碼器1602、局部解碼器1603、向上取樣器1604、延遲器1605、減法器1606、頻率確定部分1607、增強(qiáng)層編碼器1608和多路復(fù)用器1609。
基本層編碼器1602以預(yù)定基本幀為單位編碼取樣速率FL輸入數(shù)據(jù),并且將第一編碼信息輸出到局部解碼器1603和多路復(fù)用器1609。基本層編碼器1602可以利用,例如,CELP方法編碼輸入數(shù)據(jù)。
局部解碼器1603解碼第一編碼信息,并且將通過解碼獲得的解碼信號(hào)輸出到向上取樣器1604。向上取樣器1604將解碼信號(hào)取樣速率升高到FH,并且將結(jié)果輸出到減法器1606和頻率確定部分1607。
延遲器1605將輸入信號(hào)延遲預(yù)定時(shí)間,然后,將信號(hào)輸出到減法器1606。通過使這個(gè)延遲時(shí)間等于在向下取樣器1601、基本層編碼器1602、局部解碼器1603和向上取樣器1604中產(chǎn)生的時(shí)間延遲,可以防止在接著的相減處理中出現(xiàn)相移。減法器1606進(jìn)行輸入信號(hào)和解碼信號(hào)之間的相減,并且將相減結(jié)果作為誤差信號(hào)輸出到增強(qiáng)層編碼器1608。
頻率確定部分1607根據(jù)取樣速率已經(jīng)升高到FH的解碼信號(hào)確定進(jìn)行誤差信號(hào)編碼的區(qū)域和不進(jìn)行誤差信號(hào)編碼的區(qū)域,并且通知增強(qiáng)層編碼器1608。例如,頻率確定部分1607根據(jù)取樣速率已經(jīng)升高到FH的解碼信號(hào)確定聽覺掩蔽的頻率,并且將這個(gè)頻率輸出到增強(qiáng)層編碼器1608。
增強(qiáng)層編碼器1608將誤差信號(hào)轉(zhuǎn)換到頻域和生成誤差譜,并且根據(jù)從頻率確定部分1607中獲得的頻率信息進(jìn)行誤差譜編碼。多路復(fù)用器1609多路復(fù)用通過基本層編碼器1602編碼獲得編碼信息和通過增強(qiáng)層編碼器1608編碼獲得編碼信息。
現(xiàn)在分別描述基本層編碼器1602和增強(qiáng)層編碼器1608編碼的信號(hào)。圖17是示出聲信號(hào)信息分布的例子的圖形。在圖17中,垂直軸表示信息量,而水平軸表示頻率。圖17示出了在哪些頻帶中給出多少包含在輸入信號(hào)中的語音信息和背景音樂和背景噪聲信息。
如圖17所示,在語音信息的情況下,在低頻區(qū)中存在大量信息,信息量隨著頻區(qū)增高而減少。相反,在背景音樂和背景噪聲信息的情況下,與語音信息相比,在較低區(qū)域中存在相對(duì)少的信息,和在較高區(qū)域中存在大量信息。
因此,在基本層中,利用CELP高質(zhì)量地編碼語音信號(hào),和在增強(qiáng)層中,不能在基本層中得到表示的背景音樂或環(huán)境聲音和存在比基本層覆蓋的頻區(qū)高的頻率成分的信號(hào)得到有效編碼。
圖18是示出基本層和增強(qiáng)層中編碼區(qū)的例子的圖形。在圖18中,垂直軸表示信息量,而水平軸表示頻率。圖18示出了作為分別由基本層編碼器1603和增強(qiáng)層編碼器1608編碼的信息的對(duì)象的區(qū)域。
基本層編碼器1602被設(shè)計(jì)成有效表示從0到FL的頻帶中的語音信息,并且可以對(duì)該區(qū)域中的語音信息進(jìn)行高質(zhì)編碼。但是,對(duì)于基本層編碼器1602,從0到FL的頻帶中背景音樂和背景噪聲信息的編碼質(zhì)量不高。
增強(qiáng)層編碼器1608被設(shè)計(jì)成覆蓋如上所述,基本層編碼器1602的能力不足的部分和從FL到FH的頻帶中的信號(hào)。因此,通過組合基本層編碼器1502和增強(qiáng)層編碼器1608,可以在寬帶中實(shí)現(xiàn)高質(zhì)編碼。
如圖18所示,通過基本層編碼器1602中的編碼獲得的第一編碼信息包含0和FL之間的頻帶中的語音信息,因此,可以實(shí)現(xiàn)即使只利用至少第一編碼信息也可以獲得解碼信號(hào)的可伸縮功能。
此外,可以考慮利用增強(qiáng)層中的聽覺掩蔽來升高編碼頻率。聽覺掩蔽應(yīng)用了當(dāng)供應(yīng)某個(gè)信號(hào)時(shí),頻率在那個(gè)信號(hào)的頻率附近的信號(hào)不能被聽到(被掩蔽)的人聽覺特性。
圖19是示出聲(音樂)信號(hào)譜的例子的例子。在圖19中,實(shí)線表示聽覺掩蔽,和虛線表示誤差譜。這里的“誤差譜”指的是輸入信號(hào)和基本層解碼信號(hào)的誤差信號(hào)(增強(qiáng)層輸入信號(hào))的頻譜。
在圖19中陰影區(qū)所指的誤差譜中,幅度值低于聽覺掩蔽,因此,人的耳朵聽不到聲音,而在其它區(qū)域中,誤差譜幅度值超過聽覺掩蔽,因此,感覺得到量化失真。
在增強(qiáng)層中,只需編碼包括在圖19中的白區(qū)中的誤差譜,使得那些區(qū)域的量化失真小于聽覺掩蔽。屬于陰影區(qū)的系數(shù)已經(jīng)小于聽覺掩蔽,因此,不需要量化。
在本實(shí)施例的聲音編碼設(shè)備1600中,根據(jù)聽覺掩蔽等編碼殘留誤差信號(hào)的頻率不從編碼方發(fā)送到解碼方,編碼方和解碼方利用向上取樣基本層解碼信號(hào)分開確定進(jìn)行增強(qiáng)層編碼的誤差譜頻率。
在解碼信號(hào)來源于對(duì)基本層編碼信息的解碼的情況下,編碼方和解碼方獲得相同信號(hào),因此,通過讓編碼方通過從這個(gè)解碼信號(hào)中確定聽覺掩蔽頻率來編碼信號(hào)和讓解碼方通過從這個(gè)解碼信號(hào)中獲取聽覺掩蔽頻率來解碼信號(hào),編碼和發(fā)送作為附加信息的誤差譜頻率信息就變得多余了,從而能夠?qū)崿F(xiàn)位速率的降低。
接著,詳細(xì)描述根據(jù)本實(shí)施例的聲音編碼設(shè)備的操作。首先,描述頻率確定部分1607從向上取樣基本層解碼信號(hào)(下文稱為“基本層解碼信號(hào)”)中確定在增強(qiáng)層中編碼的誤差譜頻率的操作。圖20是示出本實(shí)施例的聲音編碼設(shè)備的頻率確定部分的內(nèi)部配置的例子的方塊圖。
在圖20中,頻率確定部分1607主要包括FFT部分1901、估計(jì)聽覺掩蔽計(jì)算器1902和確定部分1903。
FFT部分1901對(duì)從向上取樣器1604輸出的基本層解碼信號(hào)x(n)進(jìn)行正交轉(zhuǎn)換,計(jì)算幅度譜P(m),并且將幅度譜P(m)輸出到估計(jì)聽覺掩蔽計(jì)算器1902和確定部分1903。具體地說,F(xiàn)FT部分1901利用如下方程(33)計(jì)算幅度譜P(m)。
這里,Re(m)和Im(m)表示基本層解碼信號(hào)x(n)的付里葉系數(shù)的實(shí)部和虛部,和m表示頻率。
接著,估計(jì)聽覺掩蔽計(jì)算器1902利用基本層解碼信號(hào)幅度譜P(m)計(jì)算估計(jì)聽覺掩蔽M′(m),并且將估計(jì)聽覺掩蔽M′(m)輸出到確定部分1903。一般說來,聽覺掩蔽是根據(jù)輸入信號(hào)的頻譜計(jì)算的,但在這個(gè)實(shí)現(xiàn)例子中,利用基本層解碼信號(hào)x(n)而不是利用輸入信號(hào)來估計(jì)聽覺掩蔽。這基于這樣的思想,由于基本層解碼信號(hào)x(n)被確定成相對(duì)應(yīng)于輸入信號(hào)失真很小,所以,如果用基本層解碼信號(hào)x(n)取代輸入信號(hào),將會(huì)取得足夠好的近似,并且主要問題也不會(huì)存在。
然后,確定部分1903利用基本層解碼信號(hào)幅度譜P(m)和估計(jì)聽覺掩蔽計(jì)算器1902獲得的估計(jì)聽覺掩蔽M′(m),確定增強(qiáng)層編碼器1608進(jìn)行誤差譜編碼可應(yīng)用的頻率。確定部分1903把基本層解碼信號(hào)幅度譜P(m)當(dāng)作誤差譜的近似,并且將使如下方程(34)成立的頻率輸出到增強(qiáng)層編碼器1608。
P(m)-M′(m)>0...(34) 在方程(34)中,項(xiàng)P(m)估計(jì)誤差譜的大小,和項(xiàng)M′(m)估計(jì)聽覺掩蔽。然后,確定部分1903比較估計(jì)誤差譜和估計(jì)聽覺掩蔽的值,并且,如果方程(34)得到滿足-也就是說,如果估計(jì)誤差譜的值超過估計(jì)聽覺掩蔽的值-假設(shè)那個(gè)頻率的誤差譜是可當(dāng)作噪聲感覺的,并且讓增強(qiáng)層編碼器1608對(duì)它進(jìn)行編碼。
相反,如果估計(jì)誤差譜的值小于估計(jì)聽覺掩蔽的大小,確定部分1903認(rèn)為由于掩蔽效應(yīng),那個(gè)頻率的誤差譜將不會(huì)當(dāng)作噪聲感覺到,并且確定不要對(duì)這個(gè)頻率的誤差譜進(jìn)行量化。
現(xiàn)在描述估計(jì)聽覺掩蔽計(jì)算器1902的操作。圖21是示出本實(shí)施例的聲音編碼設(shè)備的聽覺掩蔽計(jì)算器的內(nèi)部配置的例子的圖形。在圖21中,估計(jì)聽覺掩蔽計(jì)算器1902主要包括Bark譜計(jì)算器2001、擴(kuò)展函數(shù)卷積單元2002、音調(diào)計(jì)算器2003和聽覺掩蔽計(jì)算器2004。
在圖21中,Bark譜計(jì)算器2001利用如下方程(35)計(jì)算Bark譜B(k)。
這里,P(m)表示幅度譜,并且從上面的方程(33)中求出,k與Bark譜號(hào)相對(duì)應(yīng),和fl(k)和fh(k)分別表示第kBark譜的最低頻率和最高頻率。在頻帶分布在Bark標(biāo)度上是等間隔的情況下,Bark譜B(k)表示譜強(qiáng)度。如果Herz標(biāo)度用h表示和Bark標(biāo)度用B表示,Herz標(biāo)度和Bark標(biāo)度之間的關(guān)系用如下方程(36)表示。
擴(kuò)展函數(shù)卷積單元2002利用如下方程(37)將擴(kuò)展函數(shù)SF(k)卷積成Bark譜B(k)。
C(k)=B(k)*SF(k)...(37) 音調(diào)計(jì)算器2003利用如下方程(38)求出每個(gè)Bark譜的譜平坦度SFM(k)。
這里,μg(k)表示第k Bark譜中功率譜的幾何平均,和μa(k)表示第k Bark譜中功率譜的算術(shù)平均。然后,音調(diào)計(jì)算器2003利用如下方程(39),從譜平坦度SFM(k)的分貝值SFMdB(k)中計(jì)算音調(diào)系數(shù)α(k)。
利用如下方程(40),聽覺掩蔽計(jì)算器2004從音調(diào)計(jì)算器2003計(jì)算的音調(diào)系數(shù)α(k)中求出每個(gè)Bark標(biāo)度的偏移量O(k)。
O(k)=α(k)·(14.5-k)+(1.0-α(k))·5.5...(40) 然后,聽覺掩蔽計(jì)算器2004利用如下方程(41),通過從擴(kuò)展函數(shù)卷積單元2002求出的C(k)中減去偏移量O(k)計(jì)算聽覺掩蔽T(k)。
這里,Tq(k)表示絕對(duì)閾值。絕對(duì)閾值代表作為人聽覺特性觀察的聽覺掩蔽的最小值。聽覺掩蔽計(jì)算器2004將在Bark標(biāo)度上表達(dá)的聽覺掩蔽T(k)轉(zhuǎn)換成Herz標(biāo)度。并且求出輸出到確定部分1903的估計(jì)聽覺掩蔽M′(k)。
增強(qiáng)層編碼器1608利用以這種方式求出的經(jīng)過量化的頻率m進(jìn)行MDCT系數(shù)編碼。圖22是示出本實(shí)施例的增強(qiáng)層編碼器的內(nèi)部配置的例子的圖形。圖22中的增強(qiáng)層編碼器1608主要包括MDCT部分2101和MDCT系數(shù)量化器2102。
MDCT部分2101將從減法器1606輸出的輸入信號(hào)乘以分析窗,然后,進(jìn)行MDCT(改進(jìn)離散余弦變換)處理以獲得MDCT系數(shù)。在MDCT處理中,供分析用的正交基用于相繼的兩個(gè)幀。并且,分析幀一半重疊,分析幀的前一半是奇函數(shù),而分析幀的后一半是偶函數(shù)。MDCT處理的特征是,由于逆變換之后波形的疊加造成的相加,不會(huì)出現(xiàn)幀邊緣失真。當(dāng)進(jìn)行MDCT時(shí),輸入信號(hào)被乘以諸如正弦函數(shù)窗口之類的窗口函數(shù)。如果將一系列MDCT系數(shù)指定為X(n)時(shí),MDCT系數(shù)按照如下方程(42)計(jì)算。
MDCT系數(shù)量化器2102量化與來自頻率確定部分1607的頻率相對(duì)應(yīng)的系數(shù)。然后,MDCT系數(shù)量化器2102將量化MDCT系數(shù)編碼信息輸出到多路分用器1609。
因此,根據(jù)本實(shí)施例的聲音編碼設(shè)備,由于利用基本層解碼信號(hào)確定了增強(qiáng)層中用于量化的頻率,沒有必要將用于量化的頻率信息從編碼方發(fā)送到解碼方,并且能夠以低位速率進(jìn)行高質(zhì)編碼。
在上面的實(shí)施例中,已經(jīng)描述了使用FFT的聽覺掩蔽計(jì)算方法,但是,也可以利用MDCT取代FFT來計(jì)算聽覺掩蔽。圖23是示出本實(shí)施例的聽覺掩蔽計(jì)算器的內(nèi)部配置的例子的圖形。將與圖20中相同的標(biāo)號(hào)指定給圖23中與圖20中的那些相同的部分,并且省略對(duì)它們的詳細(xì)描述。
MDCT部分2201利用MDCT系數(shù)近似計(jì)算幅度譜P(m)。具體地說,MDCT部分2201利用如下方程(43)近似計(jì)算幅度譜P(m)。
這里,R(m)是通過對(duì)向上取樣器1604供應(yīng)的信號(hào)進(jìn)行MDCT處理求出的MDCT系數(shù)。
估計(jì)聽覺掩蔽計(jì)算器1902從P(m)中近似計(jì)算Bark譜B(k)。此后,按照上述方法計(jì)算用于量化的頻率信息。
因此,本實(shí)施例的聲音編碼設(shè)備可以利用MDCT計(jì)算聽覺掩蔽。
現(xiàn)在描述解碼方。圖24是示出根據(jù)本發(fā)明第9實(shí)施例的聲音解碼設(shè)備的配置的方塊圖。圖24中的聲音解碼設(shè)備2300主要包括多路分用器2301、基本層解碼器2302、向上取樣器2303、頻率確定部分2304、增強(qiáng)層解碼器2305和加法器2306。
多路分用器2301將聲音編碼設(shè)備1600編碼的代碼分離成基本層第一編碼信息和增強(qiáng)層第二編碼信息,并且將第一編碼信息輸出到基本層解碼器2302,和將第二編碼信息輸出到增強(qiáng)層解碼器2305。
基本層解碼器2302解碼第一編碼信息和獲取取樣速率FL解碼信號(hào)。然后,基本層解碼器2302將解碼信號(hào)輸出到向上取樣器2303。向上取樣器2303將取樣速率FL解碼信號(hào)轉(zhuǎn)換成取樣速率FH解碼信號(hào),并且將這個(gè)信號(hào)輸出到頻率確定部分2304和加法器2306。
利用向上取樣基本層解碼信號(hào),頻率確定部分2304確定要在增強(qiáng)層解碼器2305中解碼的誤差譜頻率。這個(gè)頻率確定部分2304具有與圖16中的頻率確定部分16相同類型的配置。
增強(qiáng)層解碼器2305解碼第二編碼信息和將取樣速率FH解碼信號(hào)輸出到加法器2306。
加法器2306相加向上取樣器2303向上取樣的基本層解碼信號(hào)和增強(qiáng)層解碼器2305解碼的增強(qiáng)層解碼信號(hào),并且輸出所得信號(hào)。
接著,詳細(xì)描述根據(jù)本實(shí)施例的聲音解碼設(shè)備的每個(gè)方塊的操作。圖25是示出本實(shí)施例的聲音解碼設(shè)備的增強(qiáng)層解碼器的內(nèi)部配置的例子的方塊圖。圖25示出了圖24中的增強(qiáng)層解碼器2305的內(nèi)部配置的例子。圖25中的增強(qiáng)層解碼器2305主要包括MDCT系數(shù)解碼器2401、IMDCT部分2402和疊加加法器2403。
MDCT系數(shù)解碼器2401根據(jù)從頻率確定部分2304輸出的頻率,確定從多路分用器2301輸出的第二編碼信息中量化的MDCT系數(shù)。具體地說,定位與頻率確定部分2304所指的頻率相對(duì)應(yīng)的解碼MDCT系數(shù),并且,對(duì)于其它頻率填上零。
IMDCT部分2402對(duì)從MDCT系數(shù)解碼器2401輸出的MDCT系數(shù)進(jìn)行逆MDCT處理,生成時(shí)域信號(hào),并且將這個(gè)信號(hào)輸出到疊加加法器2403。
疊加加法器2403在對(duì)來自IMDCT部分2402的時(shí)域信號(hào)開窗之后,進(jìn)行疊加和相加操作,并且,它將解碼信號(hào)輸出到加法器2306。具體地說,疊加加法器2403將解碼信號(hào)乘以一個(gè)窗口和疊加在前一幀和當(dāng)前幀中解碼的時(shí)域信號(hào),進(jìn)行相加,并且生成輸出信號(hào)。
因此,根據(jù)本實(shí)施例的聲音解碼設(shè)備,通過利用基本層解碼信號(hào)確定用于增強(qiáng)層解碼的頻率,無需任何附加信息就可以確定用于增強(qiáng)層解碼的頻率,并且,能夠以低位速率進(jìn)行高質(zhì)編碼。
(第10實(shí)施例) 在本實(shí)施例中,描述CELP用在基本層編碼中的例子。圖26是示出根據(jù)本發(fā)明第10實(shí)施例的基本層編碼器的內(nèi)部配置的例子的方塊圖。圖26示出了圖16中的基本層編碼器1602的內(nèi)部配置的例子。圖26中的基本層編碼器1602主要包括LPC分析器2501、加權(quán)部分2502、自適應(yīng)碼簿搜索單元2503、自適應(yīng)增益量化器2504、目標(biāo)矢量發(fā)生器2505、噪聲碼簿搜索單元2506、噪聲增益量化器2507和多路復(fù)用器2508。
LPC分析器2501計(jì)算取樣速率FL輸入信號(hào)的LPC系數(shù),將LPC系數(shù)轉(zhuǎn)換成諸如LSP系數(shù)之類適合于量化的參數(shù),并且進(jìn)行量化。然后,LPC分析器2501將通過這種量化獲得的編碼信息輸出到多路復(fù)用器2508。
此外,LPC分析器2501從編碼信息中計(jì)算量化LSP系數(shù),將這個(gè)量化LSP系數(shù)轉(zhuǎn)換成LSP系數(shù),并且將量化LSP系數(shù)輸出到自適應(yīng)碼簿搜索單元2503、自適應(yīng)增益量化器2504、噪聲碼簿搜索單元2506和噪聲增益量化器2507。LPC分析器2501還將原LPC系數(shù)輸出到加權(quán)部分2502、自適應(yīng)碼簿搜索單元2503、自適應(yīng)增益量化器2504、噪聲碼簿搜索單元2506和噪聲增益量化器2507。
加權(quán)部分2502根據(jù)LPC分析器1501獲得的LPC系數(shù),對(duì)從向下取樣器1601輸出的輸入信號(hào)進(jìn)行加權(quán)。這種操作的目的是進(jìn)行譜成形,以便通過輸入信號(hào)譜包絡(luò)掩蔽量化失真譜。
然后,自適應(yīng)碼簿搜索單元2503利用作為目標(biāo)信號(hào)的加權(quán)輸入信號(hào)搜索自適應(yīng)碼簿。以音調(diào)周期為基礎(chǔ)重復(fù)以前確定激勵(lì)信號(hào)的信號(hào)被稱為自適應(yīng)矢量,和自適應(yīng)碼簿由在預(yù)定范圍的音調(diào)周期上生成的自適應(yīng)矢量組成。
如果將加權(quán)輸入信號(hào)指定為t(n),和將包括原LPC系數(shù)和量化LPC系數(shù)的加權(quán)合成濾波器的脈沖響應(yīng)被卷積成音調(diào)周期為i的自適應(yīng)矢量的信號(hào)指定為pi(n),那么,自適應(yīng)碼簿搜索單元2503將使如下方程(44)的估算函數(shù)D達(dá)到極小的自適應(yīng)矢量的音調(diào)周期i作為編碼信息輸出到多路復(fù)用器408。
這里,N表示矢量長度。由于方程(44)的第一項(xiàng)與音調(diào)周期i無關(guān),自適應(yīng)碼簿搜索單元2503實(shí)際上只計(jì)算第二項(xiàng)。
自適應(yīng)增益量化器2504進(jìn)行乘以自適應(yīng)矢量的自適應(yīng)增益的量化。自適應(yīng)增益β用方程(45)表示。自適應(yīng)增益量化器2504進(jìn)行這個(gè)自適應(yīng)增益β的標(biāo)量量化,并且將在量化過程中獲得的編碼信息輸出到多路復(fù)用器2508。
目標(biāo)矢量發(fā)生器2505從輸入信號(hào)中減去自適應(yīng)矢量產(chǎn)生的效果,生成和輸出噪聲碼簿搜索單元2506和噪聲增益量化器2507使用的目標(biāo)矢量。在目標(biāo)矢量發(fā)生器2505中,如果pi(n)表示當(dāng)方程(44)所表示的估算函數(shù)D達(dá)到極小時(shí),加權(quán)合成濾波器脈沖響應(yīng)被卷積成自適應(yīng)矢量的信號(hào),和βq表示當(dāng)方程(45)所表示的自適應(yīng)矢量β經(jīng)受標(biāo)量量化時(shí)的量化自適應(yīng)增益,那么,目標(biāo)矢量t2(n)由如下方程(46)表示。
t2(n)=t(n)-βq·pi(n)...(46) 噪聲碼簿搜索單元406利用前述目標(biāo)矢量t2(n)、原LPC系數(shù)和量化LPC系數(shù),進(jìn)行噪聲碼簿搜索。噪聲碼簿搜索單元406可以使用,例如,隨機(jī)噪聲或利用大量語音信號(hào)學(xué)習(xí)的信號(hào)。此外,可以使用代數(shù)碼簿。代數(shù)碼簿由一些脈沖組成。這樣代數(shù)碼簿的特征是,通過小量計(jì)算就可以確定脈沖位置和脈沖代碼(極性)的最佳組合。
如果將目標(biāo)矢量指定為t2(n),和將加權(quán)合成濾波器的脈沖響應(yīng)被卷積成與代碼j相對(duì)應(yīng)的噪聲矢量的信號(hào)指定為cj(n),那么,噪聲碼簿搜索單元2506將使如下方程(47)的估算函數(shù)D達(dá)到極小的噪聲矢量的指標(biāo)j輸出到多路復(fù)用器2508。
噪聲增益量化器2507量化乘以噪聲矢量的噪聲增益。噪聲增益量化器2507利用如下方程(48)計(jì)算自適應(yīng)增益γ,對(duì)這個(gè)噪聲增益γ進(jìn)行標(biāo)量量化,并且將編碼信息輸出到多路復(fù)用器2508。
多路復(fù)用器2508多路復(fù)用LPC系數(shù)的編碼信息、自適應(yīng)矢量、自適應(yīng)增益、噪聲矢量和噪聲增益編碼信息,并且將所得信號(hào)輸出到局部解碼器1603和多路復(fù)用器1609。
現(xiàn)在描述解碼方。圖27是示出本實(shí)施例的基本層解碼器的內(nèi)部配置的例子的方塊圖。圖27示出了基本層解碼器2302的例子。圖27中的基本層解碼器2302主要包括多路分用器2601、激勵(lì)發(fā)生器2602和合成濾波器2603。
多路分用器2601將來自多路分用器2301的第一編碼信息分離成LPC系數(shù)、自適應(yīng)矢量、自適應(yīng)增益、噪聲矢量和噪聲增益編碼信息,并且將自適應(yīng)矢量、自適應(yīng)增益、噪聲矢量和噪聲增益編碼信息輸出到激勵(lì)發(fā)生器2602。類似地,多路分用器2601將線性預(yù)測(cè)系數(shù)編碼信息輸出到合成濾波器2603。
激勵(lì)發(fā)生器2602解碼自適應(yīng)矢量、自適應(yīng)矢量增益、噪聲矢量和噪聲矢量增益編碼信息,和利用如下方程(49)生成激勵(lì)矢量ex(n)。
ex(n)=βq·q(n)-γq·c(n) ...(49) 這里,q(n)表示自適應(yīng)矢量,βq表示自適應(yīng)矢量增益,c(n)表示噪聲矢量,和γq表示噪聲矢量增益。
合成濾波器2603對(duì)LPC系數(shù)編碼信息進(jìn)行LPC系數(shù)解碼,和利用如下方程(50),從解碼LPC系數(shù)中生成合成信號(hào)syn(n)。
這里,αq表示解碼LPC系數(shù),和NP表示LPC系數(shù)的次序。然后,合成濾波器2603將以這種方式解碼的解碼信號(hào)syn(n)輸出到向上取樣器2303。
因此,根據(jù)本實(shí)施例的聲音編碼設(shè)備,通過在發(fā)送方在基本層中利用CELP編碼輸入信號(hào),和在接收方利用CELP解碼這個(gè)編碼輸入信號(hào),可以以低位速率實(shí)現(xiàn)高質(zhì)基本層。
為了抑制量化失真被人們感覺到,本實(shí)施例的編碼設(shè)備也可以應(yīng)用在合成濾波器2603之后附屬連接后置濾波器的配置。圖28是示出本實(shí)施例的基本層解碼器的內(nèi)部配置的例子的方塊圖。將與圖27中相同的標(biāo)號(hào)指定給圖28中與圖27中的那些相同的部分,并且省略對(duì)它們的詳細(xì)描述。
各種類型的配置可用于后置濾波器,以實(shí)現(xiàn)量化失真被人們感覺到的抑制,一種典型方法是利用包括通過多路分用器2601解碼獲得的LPC系數(shù)的共振峰強(qiáng)調(diào)濾波器的方法。共振峰強(qiáng)調(diào)濾波函數(shù)Hf(z)用如下方程(51)表示。
這里,A(z)表示包括解碼LPC系數(shù)的分析濾波函數(shù),和γn、γd和μ表示確定濾波器特性的常數(shù)。
(第11實(shí)施例) 圖29是示出根據(jù)本發(fā)明第11實(shí)施例的聲音編碼設(shè)備的頻率確定部分的內(nèi)部配置的例子的方塊圖。將與圖20中相同的標(biāo)號(hào)指定給圖29中與圖20中的那些相同的部分,并且省略對(duì)它們的詳細(xì)描述。圖29中的頻率確定部分1607與圖20中的頻率確定部分的不同之處在于,配備了估計(jì)誤差譜計(jì)算器2801和確定部分2802,并且,從基本層解碼信號(hào)幅度譜P(m)中估計(jì)估計(jì)誤差譜E′(m),和利用估計(jì)誤差譜E′(m)和估計(jì)聽覺掩蔽M′(m),確定增強(qiáng)層編碼器1608編碼的誤差譜的頻率。
FFT部分1901對(duì)從向上取樣器1604輸出的基本層解碼信號(hào)x(n)進(jìn)行付里葉變換,計(jì)算幅度譜P(m),并且將幅度譜P(m)輸出到估計(jì)聽覺掩蔽計(jì)算器1902和估計(jì)誤差譜計(jì)算器2801。具體地說,F(xiàn)FT部分1901利用如下方程(33)計(jì)算幅度譜P(m)。
估計(jì)誤差譜計(jì)算器2801從FFT部分1901計(jì)算的基本層解碼信號(hào)幅度譜P(m)中計(jì)算估計(jì)誤差譜E′(m),并且將估計(jì)誤差譜E′(m)輸出到確定部分2802。估計(jì)誤差譜E′(m)是通過執(zhí)行使基本層解碼信號(hào)幅度譜P(m)接近平坦的處理計(jì)算的。具體地說,估計(jì)誤差譜計(jì)算器2801利用如下方程(52)計(jì)算估計(jì)誤差譜E′(m)。
E′(m)=a·P(m)γ...(52) 這里,a和γ是大于等于0和小于1的常數(shù)。
利用估計(jì)誤差譜計(jì)算器2801獲得的估計(jì)誤差譜E′(m)和估計(jì)聽覺掩蔽計(jì)算器1902獲得的估計(jì)聽覺掩蔽M′(m),確定部分1903確定增強(qiáng)層編碼器1608用于誤差譜編碼的頻率。
接著,描述本實(shí)施例的估計(jì)誤差譜計(jì)算器2801計(jì)算的估計(jì)誤差譜。圖30是示出本實(shí)施例的估計(jì)誤差譜計(jì)算器計(jì)算的殘留誤差譜的例子的圖形。
如圖30所示,誤差譜E(m)的譜線形狀比基本層解碼信號(hào)幅度譜P(m)的譜線形狀光滑,并且,它的總頻帶功率較小。因此,通過使幅度譜P(m)變平成γ(0<γ<1)的功率,和通過乘以a(0<a<1)降低總頻帶功率,可以提高誤差譜估計(jì)的精度。
此外,在解碼方,聲音解碼設(shè)備2300的頻率確定部分2304的內(nèi)部配置與圖29中的編碼方頻率確定部分1607的內(nèi)部配置相同。
因此,根據(jù)本實(shí)施例的聲音編碼設(shè)備,通過使從基本層解碼信號(hào)譜中估計(jì)的殘留誤差譜變平滑,可以使估計(jì)誤差譜接近殘留誤差譜,和可以在增強(qiáng)層中有效地編碼誤差譜。
在本實(shí)施例中,已經(jīng)描述了使用FFT的情況,但是,像上述第9實(shí)施例中那樣,MDCT或其它變換用來取代FFT的配置也是可以的。
(第12實(shí)施例) 圖31是示出根據(jù)本發(fā)明第12實(shí)施例的聲音編碼設(shè)備的頻率確定部分的內(nèi)部配置的例子的方塊圖。將與圖20中相同的標(biāo)號(hào)指定給圖31中與圖20中的那些相同的部分,并且省略對(duì)它們的詳細(xì)描述。圖31中的頻率確定部分1607與圖20中的頻率確定部分的不同之處在于,配備了估計(jì)聽覺掩蔽校正部分3001和確定部分3002,并且,在通過估計(jì)聽覺掩蔽計(jì)算器1902從基本層解碼信號(hào)幅度譜P(m)中計(jì)算出估計(jì)聽覺掩蔽M′(m)之后,頻率確定部分1607根據(jù)局部解碼器1603解碼參數(shù)信息,對(duì)這個(gè)估計(jì)聽覺掩蔽M′(m)加以校正。
FFT部分1901對(duì)從向上取樣器1604輸出的基本層解碼信號(hào)x(n)進(jìn)行付里葉變換,計(jì)算幅度譜P(m),并且將幅度譜P(m)輸出到估計(jì)聽覺掩蔽計(jì)算器1902和確定部分3002。估計(jì)聽覺掩蔽計(jì)算器1902利用基本層解碼信號(hào)幅度譜P(m)計(jì)算估計(jì)聽覺掩蔽M′(m),并且將估計(jì)聽覺掩蔽M′(m)輸出到估計(jì)聽覺掩蔽校正部分3001。
因此,根據(jù)本實(shí)施例的聲音編碼設(shè)備,通過使從基本層解碼信號(hào)譜中估計(jì)的殘留誤差譜變平滑,可以使估計(jì)誤差譜接近殘留誤差譜,和可以在增強(qiáng)層中有效地編碼誤差譜。
利用從局部解碼器1603輸入的基本層解碼參數(shù)信息,估計(jì)聽覺掩蔽校正部分3001對(duì)估計(jì)聽覺掩蔽計(jì)算器1902獲得的估計(jì)聽覺掩蔽M′(m)加以校正。
這里假設(shè)供應(yīng)從解碼LPC系數(shù)中計(jì)算的一階PARCOR系數(shù)作為基本層編碼信息。一般說來,LPC系數(shù)和PARCOR系數(shù)代表輸入信號(hào)譜包絡(luò)。由于PARCOR系數(shù)的特性,隨著PARCOR系數(shù)的階降低,譜包絡(luò)的形狀簡化了,并且,當(dāng)PARCOR系數(shù)的階是1時(shí),指出了頻譜的傾斜度。
另一方面,在音頻或語音輸入信號(hào)的譜特性中,存在與較高區(qū)相反,功率朝著較低區(qū)方向偏置的情況(例如,對(duì)于元音),和反過來的情況(例如,對(duì)于輔音)。基本層解碼信號(hào)易受這樣輸入信號(hào)譜特性的影響,并且,存在過分強(qiáng)調(diào)譜功率偏置的傾向。
因此,在本實(shí)施例的聲音編碼設(shè)備中,通過在估計(jì)聽覺掩蔽校正部分3001中利用前述一階PARCOR系數(shù)校正過分強(qiáng)調(diào)譜偏置,可以提高估計(jì)聽覺掩蔽M′(m)的精度。
估計(jì)聽覺掩蔽校正部分3001利用如下方程(53),從基本層編碼器1602輸出的一階PARCOR系數(shù)k(1)中計(jì)算校正濾波函數(shù)Hk(z)。
Hk(z)=1-β·k(1)·z-1...(53) 這里,β表示小于1的正常數(shù)。接著,估計(jì)聽覺掩蔽校正部分3001利用如下方程(54),計(jì)算校正濾波函數(shù)Hk(z)的幅度特性K(m)。
然后,估計(jì)聽覺掩蔽校正部分3001利用如下方程(55),從校正濾波函數(shù)幅度特性K(m)中計(jì)算校正估計(jì)聽覺掩蔽M″(m)。
M″(m)=K(m)·M′(m)...(55) 然后,取代估計(jì)聽覺掩蔽M′(m),估計(jì)聽覺掩蔽校正部分3001將校正估計(jì)聽覺掩蔽M″(m)輸出到確定部分3002。
利用基本層解碼信號(hào)幅度譜P(m)和從估計(jì)聽覺掩蔽校正部分3001輸出的校正估計(jì)聽覺掩蔽M″(m),確定部分3002確定增強(qiáng)層編碼器1608用于誤差譜編碼的頻率。
因此,根據(jù)本實(shí)施例的聲音編碼設(shè)備,通過利用掩蔽效應(yīng)特性,從輸入信號(hào)譜中計(jì)算聽覺掩蔽,和在增強(qiáng)層編碼中進(jìn)行使量化失真不超過掩蔽值的量化,在不會(huì)使質(zhì)量下降的情況下,可以減少經(jīng)受量化的MDCT系數(shù)的個(gè)數(shù),和以低位速率進(jìn)行高質(zhì)編碼。
因此,根據(jù)本實(shí)施例的聲音編碼設(shè)備,通過根據(jù)基本層編碼器解碼參數(shù)信息對(duì)估計(jì)聽覺掩蔽加入校正,可以提高估計(jì)聽覺掩蔽的精度,和在增強(qiáng)層中進(jìn)行有效誤差譜編碼。
此外,在解碼方,聲音解碼設(shè)備2300的頻率確定部分2304的內(nèi)部配置與圖31中的編碼方頻率確定部分1607的內(nèi)部配置相同。
對(duì)于本實(shí)施例的頻率確定部分1607,還可以應(yīng)用將本實(shí)施例和第11實(shí)施例組合在一起的配置。圖32是示出本實(shí)施例的聲音編碼設(shè)備的頻率確定部分的內(nèi)部配置的例子的方塊圖。將與圖20中相同的標(biāo)號(hào)指定給圖32中與圖20中的那些相同的部分,并且省略對(duì)它們的詳細(xì)描述。
FFT部分1901對(duì)從向上取樣器1604輸出的基本層解碼信號(hào)x(n)進(jìn)行付里葉變換,計(jì)算幅度譜P(m),并且將幅度譜P(m)輸出到估計(jì)聽覺掩蔽計(jì)算器1902和估計(jì)誤差譜計(jì)算器2801。
估計(jì)聽覺掩蔽計(jì)算器1902利用基本層解碼信號(hào)幅度譜P(m)計(jì)算估計(jì)聽覺掩蔽M′(m),并且將估計(jì)聽覺掩蔽M′(m)輸出到估計(jì)聽覺掩蔽校正部分3001。
在估計(jì)聽覺掩蔽校正部分3001中,應(yīng)用從局部解碼器1603輸入的基本層解碼參數(shù)信息來校正估計(jì)聽覺掩蔽計(jì)算器1902獲得的估計(jì)聽覺掩蔽M′(m)。
估計(jì)誤差譜計(jì)算器2801從FFT部分1901計(jì)算的基本層解碼信號(hào)幅度譜P(m)中計(jì)算估計(jì)誤差譜E′(m),并且將估計(jì)誤差譜E′(m)輸出到確定部分3101。
利用估計(jì)誤差譜計(jì)算器2801估計(jì)的估計(jì)誤差譜E′(m)和從估計(jì)聽覺掩蔽校正部分3001輸出的校正聽覺掩蔽M″(m),確定部分3101確定增強(qiáng)層編碼器1608進(jìn)行誤差譜編碼的頻率。
在本實(shí)施例中,已經(jīng)描述了使用FFT的情況,但是,像上述第9實(shí)施例中那樣,MDCT或其它變換技術(shù)用來取代FFT的配置也是可以的。
(第13實(shí)施例) 圖33是示出根據(jù)本發(fā)明第13實(shí)施例的聲音編碼設(shè)備的增強(qiáng)層編碼器的內(nèi)部配置的例子的方塊圖。將與圖22中相同的標(biāo)號(hào)指定給圖33中與圖22中的那些相同的部分,并且省略對(duì)它們的詳細(xì)描述。圖33中的增強(qiáng)層編碼器與圖22中的增強(qiáng)層編碼器的不同之處在于,配備了定序部分3201和MDCT系數(shù)量化器3202,并且,按照估計(jì)失真值D(m)的數(shù)量,通過頻率對(duì)頻率確定部分1607供應(yīng)的頻率進(jìn)行加權(quán)。
在圖33中,MDCT部分2101將從減法器1606輸出的輸入信號(hào)乘以分析窗,然后,進(jìn)行MDCT(改進(jìn)離散余弦變換)處理以獲得MDCT系數(shù),并且將MDCT系數(shù)輸出到MDCT系數(shù)量化器3202。
定序部分3201接收頻率確定部分1607獲得的頻率信息,并且計(jì)算每個(gè)頻率的估計(jì)誤差譜E′(m)超過估計(jì)聽覺掩蔽M′(m)的數(shù)量(下文稱為“估計(jì)失真值”)D(m)。這個(gè)估計(jì)失真值D(m)由如下方程(56)定義。
D(m)=E’(m)-M’(m)...(56) 這里,定序部分3201只計(jì)算滿足如下方程(57)的估計(jì)失真值D(m)。
E’(m)-M’(m)>0...(57) 然后,定序部分3201按從高到低估計(jì)失真值D(m)次序進(jìn)行定序,并且將相應(yīng)頻率信息輸出到MDCT系數(shù)量化器3202。MDCT系數(shù)量化器3202進(jìn)行量化,根據(jù)估計(jì)失真值D(m),將位成正比地分配給位于按從高到低估計(jì)失真值D(m)次序排列的頻率上的誤差譜E(m)。
作為一個(gè)例子,這里描述從頻率確定部分發(fā)送的頻率和估計(jì)失真值像圖34所示那樣的情況。圖34是示出本實(shí)施例的定序部分排序估計(jì)失真值的例子的圖形。
定序部分3201根據(jù)圖34中的信息,按從高到低估計(jì)失真值D(m)次序重新排列頻率。在本例中,作為定序部分3201的處理結(jié)果獲得的頻率m次序是7、8、4、9、1、11、3、12。定序部分3201將這個(gè)定序信息輸出到MDCT系數(shù)量化器3202。
在MDCT部分2101給出的誤差譜E(m)內(nèi),MDCT系數(shù)量化器3202根據(jù)定序部分3201給出的定序信息,量化E(7)、E(8)、E(4)、E(9)、E(1)、E(11)、E(3)、E(12)。
同時(shí),在該次序的開頭分配許多用于誤差譜量化的位,和朝著該次序的末端分配逐漸減少的位。也就是說,頻率的估計(jì)失真值D(m)越大,分配用于誤差譜量化的位就越多,頻率的估計(jì)失真值D(m)越小,分配用于誤差譜量化的位就越少。
例如,可以進(jìn)行如下位分配對(duì)于E(7),8個(gè)位;對(duì)于E(8)和E(4),7個(gè)位;對(duì)于E(9)和E(1),6個(gè)位;對(duì)于E(11)、E(3)和E(12),5個(gè)位。這樣,根據(jù)估計(jì)失真值D(m)進(jìn)行自適應(yīng)位分配提高了量化效率。
當(dāng)應(yīng)用矢量量化時(shí),增強(qiáng)層編碼器1608從位于該次序的開頭上的誤差譜開始依次配置矢量,并且對(duì)各自矢量進(jìn)行矢量量化。同時(shí),進(jìn)行矢量配置和量化位分配,以便對(duì)于位于該次序的開頭上的誤差譜,分配的位較多,和對(duì)于位于該次序的末端上的誤差譜,分配的位較少。在圖34中的例子中,配置了三個(gè)矢量-二維、二維和四維,以及V1=(E(7),E(8))、V2=(E(4),E(9))和V3=(E(1),E(11),E(3),E(12)),并且,位分配是對(duì)于V1,10個(gè)位;對(duì)于V2,8個(gè)位;和對(duì)于V3,8個(gè)位。
因此,根據(jù)本實(shí)施例的聲音編碼設(shè)備,通過在增強(qiáng)層編碼中進(jìn)行將大量信息分配給估計(jì)誤差譜超過估計(jì)聽覺掩蔽的數(shù)量大的頻率的編碼,可以實(shí)現(xiàn)量化效率的提高。
現(xiàn)在描述解碼方。圖35是示出根據(jù)本發(fā)明第13實(shí)施例的聲音解碼設(shè)備的增強(qiáng)層解碼器的內(nèi)部配置的例子的方塊圖。將與圖25中相同的標(biāo)號(hào)指定給圖35中與圖25中的那些相同的部分,并且省略對(duì)它們的詳細(xì)描述。圖35中的增強(qiáng)層解碼器2305與圖25中的增強(qiáng)層解碼器的不同之處在于,配備了定序部分3401和MDCT系數(shù)解碼器3402,并且,按照估計(jì)失真值D(m)的數(shù)量定序頻率確定部分2304供應(yīng)的頻率。
定序部分3401利用上面的方程(56)計(jì)算估計(jì)失真值D(m)。定序部分3401具有與上述定序部分3201相同的配置。通過這種配置,可以解碼能夠進(jìn)行自適應(yīng)位分配和提高量化效率的上述聲音編碼方法的編碼信息。
MDCT系數(shù)解碼器3402利用按照估計(jì)失真值D(m)的數(shù)量定序的頻率信息,解碼從多路分用器2301輸出的第二編碼信息。具體地說,MDCT系數(shù)解碼器3402定位與頻率確定部分2304供應(yīng)的頻率相對(duì)應(yīng)的解碼MDCT系數(shù),并且,對(duì)于其它頻率填上零。然后,IMDCT部分2402對(duì)從MDCT系數(shù)解碼器2401獲得的MDCT系數(shù)進(jìn)行逆MDCT處理,生成時(shí)域信號(hào)。
疊加加法器2403為了組合將前述信號(hào)乘以一個(gè)窗口函數(shù),和疊加在前一幀和當(dāng)前幀中解碼的時(shí)域信號(hào),進(jìn)行相加,并且生成輸出信號(hào)。疊加加法器2403將這個(gè)輸出信號(hào)輸出到加法器2306。
因此,根據(jù)本實(shí)施例的聲音解碼設(shè)備,通過在增強(qiáng)層編碼中進(jìn)行按照估計(jì)誤差譜超過估計(jì)聽覺掩蔽的數(shù)量進(jìn)行自適應(yīng)位分配的矢量量化,可以實(shí)現(xiàn)量化效率的提高。
(第14實(shí)施例) 圖36是示出根據(jù)本發(fā)明第14實(shí)施例的聲音編碼設(shè)備的增強(qiáng)層編碼器的內(nèi)部配置的例子的方塊圖。將與圖22中相同的標(biāo)號(hào)指定給圖36中與圖22中的那些相同的部分,并且省略對(duì)它們的詳細(xì)描述。圖36中的增強(qiáng)層編碼器與圖22中的增強(qiáng)層編碼器的不同之處在于,配備了固定頻帶指定部分3501和MDCT系數(shù)量化器3502,并且,與從頻率確定部分1607中獲得的頻率一起量化包括在事先指定的頻帶中的MDCT系數(shù)。
在圖36中,在固定頻帶指定部分3501中事先設(shè)置就聽覺感覺而言重要的頻帶。這里假設(shè)對(duì)于包括在所設(shè)頻帶中的頻率,設(shè)置“m=15,16”。
MDCT系數(shù)量化器3502在來自MDCT部分2101的輸入信號(hào)中,利用從頻率確定部分1607輸出的聽覺掩蔽將輸入信號(hào)分類成要量化的系數(shù)和不要量化的系數(shù),并且,編碼要量化的系數(shù),以及固定頻帶指定部分3501設(shè)置的頻帶中的系數(shù)。
假設(shè)相關(guān)頻率成為如圖34所示那樣,MDCT系數(shù)量化器3502量化誤差譜E(1)、E(3)、E(4)、E(7)、E(8)、E(9)、E(11)、E(12)和固定頻帶指定部分3501指定的頻率的誤差譜E(15)、E(16)。
因此,根據(jù)本實(shí)施例的聲音編碼設(shè)備,通過強(qiáng)迫量化不可能選作量化的對(duì)象、但從聽覺的觀點(diǎn)來說重要的頻帶,即使不選擇應(yīng)該真正選為編碼的對(duì)象的頻率,也必定可以量化位于包括在從聽覺的觀點(diǎn)來說重要的頻帶中的頻率上的誤差譜,從而使質(zhì)量得到提高。
現(xiàn)在描述解碼方。圖37是示出根據(jù)本發(fā)明第14實(shí)施例的聲音解碼設(shè)備的增強(qiáng)層解碼器的內(nèi)部配置的例子的方塊圖。將與圖25中相同的標(biāo)號(hào)指定給圖37中與圖25中的那些相同的部分,并且省略對(duì)它們的詳細(xì)描述。圖37中的增強(qiáng)層解碼器與圖25中的增強(qiáng)層解碼器的不同之處在于,配備了固定頻帶指定部分3601和MDCT系數(shù)解碼器3602,并且,與從頻率確定部分2304中獲得的頻率一起解碼包括在事先指定的頻帶中的MDCT系數(shù)。
在圖37中,在固定頻帶指定部分3601中事先設(shè)置就聽覺感覺而言重要的頻帶。
MDCT系數(shù)解碼器3602根據(jù)從頻率確定部分1607輸出的經(jīng)過解碼的誤差譜頻率,解碼從多路分用器2301輸出的第二編碼信息中量化的MDCT系數(shù)。具體地說,MDCT系數(shù)解碼器3602定位與頻率確定部分2304和固定頻帶指定部分3501所指的頻率相對(duì)應(yīng)的解碼MDCT系數(shù),并且,對(duì)于其它頻率填上零。
IMDCT部分2402對(duì)從MDCT系數(shù)解碼器3601輸出的MDCT系數(shù)進(jìn)行逆MDCT處理,生成時(shí)域信號(hào),并且將這個(gè)信號(hào)輸出到疊加加法器2403。
因此,根據(jù)本實(shí)施例的聲音解碼設(shè)備,通過解碼包括在事先指定的頻帶中的MDCT系數(shù),可以解碼其中已經(jīng)強(qiáng)迫量化了不可能選作量化的對(duì)象、但從聽覺的觀點(diǎn)來說重要的頻帶的信號(hào),并且,即使不選擇在編碼方應(yīng)該真正選為編碼的對(duì)象的頻率,也必定可以量化位于包括在從聽覺的觀點(diǎn)來說重要的頻帶中的頻率上的誤差譜,從而使質(zhì)量得到提高。
對(duì)于本實(shí)施例的增強(qiáng)層編碼器和增強(qiáng)層解碼器,還可以應(yīng)用將本實(shí)施例和第13實(shí)施例組合在一起的配置。圖38是示出本實(shí)施例的聲音編碼設(shè)備的頻率確定部分的內(nèi)部配置的例子的方塊圖。將與圖22中相同的標(biāo)號(hào)指定給圖38中與圖22中的那些相同的部分,并且省略對(duì)它們的詳細(xì)描述。
在圖38中,MDCT部分2101將從減法器1606輸出的輸入信號(hào)乘以分析窗,然后,進(jìn)行MDCT(改進(jìn)離散余弦變換)處理以獲得MDCT系數(shù),并且將MDCT系數(shù)輸出到MDCT系數(shù)量化器3701。
定序部分3201接收頻率確定部分1607獲得的頻率信息,并且,計(jì)算每個(gè)頻率的估計(jì)誤差譜E′(m)超過估計(jì)聽覺掩蔽M′(m)的數(shù)量(下文稱為“估計(jì)失真值”)D(m)。
在固定頻帶指定部分3501中事先設(shè)置就聽覺感覺而言重要的頻帶。
MDCT系數(shù)量化器3701進(jìn)行量化,根據(jù)按照估計(jì)失真值D(m)定序的頻率信息,將位成正比地分配給位于按從高到低估計(jì)失真值D(m)次序排列的頻率上的誤差譜E(m)。MDCT系數(shù)量化器3701還編碼固定頻帶指定部分3501設(shè)置的頻帶中的系數(shù)。
現(xiàn)在描述解碼方。圖39是示出根據(jù)本發(fā)明第14實(shí)施例的聲音解碼設(shè)備的增強(qiáng)層解碼器的內(nèi)部配置的例子的方塊圖。將與圖25中相同的標(biāo)號(hào)指定給圖39中與圖25中的那些相同的部分,并且省略對(duì)它們的詳細(xì)描述。
在圖39中,定序部分3401接收頻率確定部分2304獲得的頻率信息,并且,計(jì)算每個(gè)頻率的估計(jì)誤差譜E′(m)超過估計(jì)聽覺掩蔽M′(m)的數(shù)量(下文稱為“估計(jì)失真值”)D(m)。
然后,定序部分3401按從高到低估計(jì)失真值D(m)次序進(jìn)行定序,并且將相應(yīng)頻率信息輸出到MDCT系數(shù)解碼器3801。在固定頻帶指定部分3601中事先設(shè)置就聽覺感覺而言重要的頻帶。
MDCT系數(shù)解碼器3801根據(jù)從定序部分3401輸出的經(jīng)過解碼的誤差譜頻率,解碼從多路分用器2301輸出的第二編碼信息中量化的MDCT系數(shù)。具體地說,MDCT系數(shù)解碼器3801定位與定序部分3401和固定頻帶指定部分3601所指的頻率相對(duì)應(yīng)的解碼MDCT系數(shù),并且,對(duì)于其它頻率填上零。
IMDCT部分2402對(duì)從MDCT系數(shù)解碼器3801輸出的MDCT系數(shù)進(jìn)行逆MDCT處理,生成時(shí)域信號(hào),并且將這個(gè)信號(hào)輸出到疊加加法器2403。
(第15實(shí)施例) 現(xiàn)在參照附圖描述本發(fā)明的第15實(shí)施例。圖40是示出根據(jù)本發(fā)明第15實(shí)施例的通信設(shè)備的配置的方塊圖。本實(shí)施例的特征是圖40中的信號(hào)處理設(shè)備3903被配置成如上述第1到第14實(shí)施例所示的聲音編碼設(shè)備之一。
如圖40所示,根據(jù)本發(fā)明第15實(shí)施例的通信設(shè)備3900包括輸入設(shè)備3901、A/D轉(zhuǎn)換設(shè)備3902和與網(wǎng)絡(luò)3904連接的信號(hào)處理設(shè)備3903。
A/D轉(zhuǎn)換設(shè)備3902與輸入設(shè)備3901的輸出端相連接。信號(hào)處理設(shè)備3903的輸入端與A/D轉(zhuǎn)換設(shè)備3902的輸出端相連接。信號(hào)處理設(shè)備3903的輸出端與網(wǎng)絡(luò)3904相連接。
輸入設(shè)備3901將人耳朵可聽見的聲波轉(zhuǎn)換成作為電信號(hào)的模擬信號(hào),并且將這個(gè)模擬信號(hào)供應(yīng)給A/D轉(zhuǎn)換設(shè)備3902。A/D轉(zhuǎn)換設(shè)備3902將模擬信號(hào)轉(zhuǎn)換成數(shù)字信號(hào),并且將這個(gè)數(shù)字信號(hào)供應(yīng)給信號(hào)處理設(shè)備3903。信號(hào)處理設(shè)備3903編碼輸入數(shù)字信號(hào)和生成代碼,并且將這個(gè)代碼輸出到網(wǎng)絡(luò)3904。
因此,根據(jù)本發(fā)明這個(gè)實(shí)施例的通信設(shè)備,可以在通信過程中獲得像上述第1到第14實(shí)施例所示那樣的效果,并且,可以提供用少量的位有效編碼聲信號(hào)的聲音編碼設(shè)備。
(第16實(shí)施例) 現(xiàn)在參照附圖描述本發(fā)明的第16實(shí)施例。圖41是示出根據(jù)本發(fā)明第16實(shí)施例的通信設(shè)備的配置的方塊圖。本實(shí)施例的特征是圖41中的信號(hào)處理設(shè)備4003被配置成如上述第1到第14實(shí)施例所示的聲音解碼設(shè)備之一。
如圖41所示,根據(jù)本發(fā)明第16實(shí)施例的通信設(shè)備4000包括與網(wǎng)絡(luò)4001連接的接收設(shè)備4002、信號(hào)處理設(shè)備4003、D/A轉(zhuǎn)換設(shè)備4004和輸出設(shè)備4005。
接收設(shè)備4002與網(wǎng)絡(luò)4001相連接。信號(hào)處理設(shè)備4003的輸入端與接收設(shè)備4002的輸出端相連接。D/A轉(zhuǎn)換設(shè)備4004的輸入端與信號(hào)處理設(shè)備4003的輸出端相連接。輸出設(shè)備4005的輸入端與D/A轉(zhuǎn)換設(shè)備4004的輸出端相連接。
接收設(shè)備4002接收來自網(wǎng)絡(luò)4001的數(shù)字編碼聲信號(hào),生成數(shù)字接收聲信號(hào),并且將這個(gè)接收聲信號(hào)供應(yīng)給信號(hào)處理設(shè)備4003。信號(hào)處理設(shè)備4003接收來自接收設(shè)備4002的接收聲信號(hào),對(duì)這個(gè)接收聲信號(hào)進(jìn)行解碼處理和生成數(shù)字解碼聲信號(hào),并且將這個(gè)數(shù)字解碼聲信號(hào)供應(yīng)給D/A轉(zhuǎn)換設(shè)備4004。D/A轉(zhuǎn)換設(shè)備4004轉(zhuǎn)換來自信號(hào)處理設(shè)備4003的數(shù)字解碼聲信號(hào)和生成模擬解碼語音信號(hào),并且將這個(gè)模擬解碼語音信號(hào)供應(yīng)給輸出設(shè)備4005。輸出設(shè)備4005將作為電信號(hào)的模擬解碼語音信號(hào)轉(zhuǎn)換成空氣振動(dòng),并且像聲波那樣輸出這些空氣振動(dòng),以便人的耳朵可聽見。
因此,根據(jù)本施例的通信設(shè)備,可以在通信過程中獲得像上述第1到第14實(shí)施例所示那樣的效果,并且,可以解碼用少量的位有效編碼的聲信號(hào),從而輸出良好的聲信號(hào)。
(第17實(shí)施例) 現(xiàn)在參照附圖描述本發(fā)明的第17實(shí)施例。圖42是示出根據(jù)本發(fā)明第17實(shí)施例的通信設(shè)備的配置的方塊圖。本實(shí)施例的特征是圖42中的信號(hào)處理設(shè)備4103被配置成如上述第1到第14實(shí)施例所示的聲音編碼設(shè)備之一。
如圖42所示,根據(jù)本發(fā)明第17實(shí)施例的通信設(shè)備4100包括輸入設(shè)備4101、A/D轉(zhuǎn)換設(shè)備4102和信號(hào)處理設(shè)備4103、RF(射頻)調(diào)制設(shè)備4104和天線4105。
輸入設(shè)備4101將人耳朵可聽見的聲波轉(zhuǎn)換成作為電信號(hào)的模擬信號(hào),并且將這個(gè)模擬信號(hào)供應(yīng)給A/D轉(zhuǎn)換設(shè)備4102。A/D轉(zhuǎn)換設(shè)備4102將模擬信號(hào)轉(zhuǎn)換成數(shù)字信號(hào),并且將這個(gè)數(shù)字信號(hào)供應(yīng)給信號(hào)處理設(shè)備4103。信號(hào)處理設(shè)備4103編碼輸入數(shù)字信號(hào)和生成編碼聲信號(hào),并且將這個(gè)編碼聲信號(hào)輸出到RF調(diào)制設(shè)備4104。RF調(diào)制設(shè)備4104調(diào)制編碼聲信號(hào)和生成調(diào)制編碼聲信號(hào),并且將這個(gè)調(diào)制編碼聲信號(hào)供應(yīng)給天線4105。天線4105發(fā)送該調(diào)制編碼聲信號(hào)作為無線電波。
因此,根據(jù)本實(shí)施例的通信設(shè)備,可以在無線電通信過程中獲得像上述第1到第14實(shí)施例所示那樣的效果,并且,可以用少量的位有效編碼聲信號(hào)。
(第18實(shí)施例) 現(xiàn)在參照附圖描述本發(fā)明的第18實(shí)施例。圖43是示出根據(jù)本發(fā)明第18實(shí)施例的通信設(shè)備的配置的方塊圖。本實(shí)施例的特征是圖43中的信號(hào)處理設(shè)備4203被配置成如上述第1到第14實(shí)施例所示的聲音解碼設(shè)備之一。
如圖43所示,根據(jù)本發(fā)明第18實(shí)施例的通信設(shè)備4200包括天線4201、RF解調(diào)設(shè)備4202、信號(hào)處理設(shè)備4203、D/A轉(zhuǎn)換設(shè)備4204和輸出設(shè)備4205。
天線4201接收作為無線電波的數(shù)字編碼聲信號(hào),生成作為電信號(hào)的數(shù)字接收編碼聲信號(hào),并且將這個(gè)數(shù)字接收編碼聲信號(hào)供應(yīng)給RF解調(diào)設(shè)備4202。RF解調(diào)設(shè)備4202解調(diào)來自天線4201的接收編碼聲信號(hào)和生成解調(diào)編碼聲信號(hào),并且將這個(gè)解調(diào)編碼聲信號(hào)供應(yīng)給信號(hào)處理設(shè)備4203。
信號(hào)處理設(shè)備4203接收來自RF解調(diào)設(shè)備4202的數(shù)字解調(diào)編碼聲信號(hào),進(jìn)行解碼處理和生成數(shù)字解碼聲信號(hào),并且將這個(gè)數(shù)字解碼聲信號(hào)供應(yīng)給D/A轉(zhuǎn)換設(shè)備4204。D/A轉(zhuǎn)換設(shè)備4204轉(zhuǎn)換來自信號(hào)處理設(shè)備4203的數(shù)字解碼聲信號(hào)和生成模擬解碼語音信號(hào),并且將這個(gè)模擬解碼語音信號(hào)供應(yīng)給輸出設(shè)備4205。輸出設(shè)備4205將作為電信號(hào)的模擬解碼語音信號(hào)轉(zhuǎn)換成空氣振動(dòng),并且像聲波那樣輸出這些空氣振動(dòng),以便人的耳朵可聽見。
因此,根據(jù)本施例的通信設(shè)備,可以在無線電通信過程中獲得像上述第1到第14實(shí)施例所示那樣的效果,并且,可以解碼用少量的位有效編碼的聲信號(hào),從而輸出良好的聲信號(hào)。
本發(fā)明可應(yīng)用于使用音頻信號(hào)的接收設(shè)備、接收解碼設(shè)備、或語音信號(hào)解碼設(shè)備。本發(fā)明還可應(yīng)用于移動(dòng)臺(tái)設(shè)備或基站設(shè)備。
本發(fā)明不局限于上述的實(shí)施例,并且,在不偏離本發(fā)明范圍的情況下,可以進(jìn)行各種各樣的改變和改進(jìn)。例如,在上面的實(shí)施例中,已經(jīng)描述了將本發(fā)明作為信號(hào)處理設(shè)備來實(shí)現(xiàn)的情況,但是,本發(fā)明不局限于此,并且,也可以將這種信號(hào)處理方法作為軟件來實(shí)現(xiàn)。
例如,事先將執(zhí)行上述信號(hào)處理方法的程序存儲(chǔ)在ROM(只讀存儲(chǔ)器)中,和由CPU(中央處理單元)執(zhí)行這個(gè)程序也是可以的。
將執(zhí)行上述信號(hào)處理方法的程序存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)媒體中,將存儲(chǔ)在存儲(chǔ)媒體中的程序記錄在計(jì)算機(jī)的RAM(隨機(jī)訪問存儲(chǔ)器)中,和按照那個(gè)程序操作計(jì)算機(jī)也是可以的。
在上面的描述中,已經(jīng)描述了MDCT用作從時(shí)域變換到頻域的方法,但是,本發(fā)明不局限于此,只要是正交的,可以應(yīng)用任何變換方法。例如,也可以應(yīng)用離散付里葉變換、離散余弦變換或小波變換方法。
本發(fā)明可應(yīng)用于使用音頻信號(hào)的接收設(shè)備、接收解碼設(shè)備、或語音信號(hào)解碼設(shè)備。本發(fā)明還可應(yīng)用于移動(dòng)臺(tái)設(shè)備或基站設(shè)備。
從上面的描述中可清楚看出,根據(jù)本發(fā)明的編碼設(shè)備,解碼設(shè)備、編碼方法和解碼方法,通過利用從基本層編碼信息中獲得的信息進(jìn)行增強(qiáng)層編碼,即使在語音占優(yōu)勢(shì)和在背景中疊加了音樂或環(huán)境聲音的信號(hào)的情況下,也可以以低位速率進(jìn)行高質(zhì)編碼。
本申請(qǐng)基于2002年4月26日提出的日本專利申請(qǐng)第2002-127541號(hào)和2002年9月12日提出的日本專利申請(qǐng)第2002-267436號(hào),特此全文引用,以供參考。
工業(yè)可應(yīng)用性 本發(fā)明適用于編碼和解碼語音信號(hào)的設(shè)備和通信設(shè)備。
權(quán)利要求
1.一種編碼設(shè)備,包括
向下取樣部分,用于降低輸入信號(hào)的取樣速率;
基本層編碼部分,用于對(duì)降低了取樣速率的輸入信號(hào)進(jìn)行編碼來獲取第一編碼信息;
解碼部分,用于對(duì)所述第一編碼信息進(jìn)行解碼來生成解碼信號(hào);
向上取樣部分,用于將所述解碼信號(hào)的取樣速率升高到與所述輸入信號(hào)的取樣速率相同的速率;
減法部分,用于從所述輸入信號(hào)減去升高了所述取樣速率的解碼信號(hào)來獲取相減信號(hào);
增強(qiáng)層編碼部分,用于利用在所述解碼部分的解碼處理中生成的參數(shù),或者將所述參數(shù)變換成用于總頻帶的參數(shù),對(duì)所述相減信號(hào)進(jìn)行編碼來獲取第二編碼信息;和
多路復(fù)用部分,用于對(duì)所述第一編碼信息和所述第二編碼信息進(jìn)行多路復(fù)用。
2.根據(jù)權(quán)利要求1所述的編碼設(shè)備,其中,所述增強(qiáng)層編碼部分利用在所述解碼部分生成的解碼信號(hào)的功率,進(jìn)行所述相減信號(hào)的歸一化。
3.根據(jù)權(quán)利要求1所述的編碼設(shè)備,還包括濾波器構(gòu)成部分,用于通過所述參數(shù)來構(gòu)成濾波器,
其中,所述增強(qiáng)層編碼部分根據(jù)所述濾波器或者所述濾波器的譜特性,至少進(jìn)行以下的處理中的一個(gè)來獲取第二編碼信息所述相減信號(hào)的歸一化、矢量量化的位分配的確定、和矢量搜索的加權(quán)的確定。
4.根據(jù)權(quán)利要求3所述的編碼設(shè)備,其中,所述增強(qiáng)層編碼部分進(jìn)行限制,以使所述位分配或者所述矢量搜索的加權(quán)不超過預(yù)先規(guī)定的上限值。
5.根據(jù)權(quán)利要求3所述的編碼設(shè)備,其中,所述濾波器構(gòu)成部分利用所述參數(shù)中的LPC系數(shù),表示總頻帶的譜包絡(luò)作為所述譜特性。
6.根據(jù)權(quán)利要求3所述的編碼設(shè)備,其中,所述濾波器構(gòu)成部分利用所述參數(shù)中的音調(diào)周期或者音調(diào)增益,表示總頻帶的譜精細(xì)結(jié)構(gòu)作為所述譜特性。
7.根據(jù)權(quán)利要求3所述的編碼設(shè)備,還包括變換部分,對(duì)與所述第一編碼信息的頻帶對(duì)應(yīng)的所述濾波器的譜特性進(jìn)行變換。
8.根據(jù)權(quán)利要求7所述的編碼設(shè)備,其中,所述變換部分對(duì)所述濾波器的譜特性進(jìn)行變換,以使所述第一編碼信息的頻帶的量化精度比其它的頻帶低。
9.一種解碼設(shè)備,包括
基本層解碼部分,用于對(duì)第一編碼信息進(jìn)行解碼來獲取第一解碼信號(hào);
增強(qiáng)層解碼部分,用于對(duì)第二編碼信息進(jìn)行解碼來獲取第二解碼信號(hào);
向上取樣部分,用于將所述第一解碼信號(hào)的取樣速率升高到與所述第二解碼信號(hào)的取樣速率相同的速率;和
加法部分,用于相加升高了所述取樣速率的第一解碼信號(hào)和所述第二解碼信號(hào)。
10.根據(jù)權(quán)利要求9所述的解碼設(shè)備,還包括濾波器構(gòu)成部分,用于通過所述參數(shù)來構(gòu)成濾波器,
其中,所述增強(qiáng)層解碼部分根據(jù)所述濾波器或者所述濾波器的譜特性,至少進(jìn)行以下的處理中的一個(gè),對(duì)第二編碼信息進(jìn)行解碼來獲取第二解碼信號(hào)相減信號(hào)的歸一化和矢量量化的位分配的確定。
11.根據(jù)權(quán)利要求9所述的解碼設(shè)備,其中,所述增強(qiáng)層解碼部分進(jìn)行限制,以使所述位分配不超過預(yù)先規(guī)定的上限值。
12.根據(jù)權(quán)利要求9所述的解碼設(shè)備,其中,所述濾波器構(gòu)成部分利用所述參數(shù)中的LPC系數(shù),表示總頻帶的譜包絡(luò)作為所述譜特性。
13.根據(jù)權(quán)利要求9所述的解碼設(shè)備,其中,所述濾波器構(gòu)成部分利用所述參數(shù)中的音調(diào)周期或者音調(diào)增益,表示總頻帶的譜精細(xì)結(jié)構(gòu)作為所述譜特性。
14.根據(jù)權(quán)利要求9所述的解碼設(shè)備,其中,還包括變換部分,對(duì)與所述第一編碼信息的頻帶對(duì)應(yīng)的所述濾波器的譜特性進(jìn)行變換。
15.根據(jù)權(quán)利要求14所述的解碼設(shè)備,其中,所述變換部分對(duì)所述濾波器的譜特性進(jìn)行變換,以使所述第一編碼信息的頻帶的量化精度比其它的頻帶低。
16.一種編碼方法,包括
降低輸入信號(hào)的取樣速率的步驟;
對(duì)降低了取樣速率的輸入信號(hào)進(jìn)行編碼來獲取第一編碼信息的步驟;
根據(jù)所述第一編碼信息生成解碼信號(hào)的步驟;
將所述解碼信號(hào)的取樣速率升高到與所述輸入信號(hào)的取樣速率相同的速率的步驟;
利用在生成所述解碼信號(hào)的處理中獲得的參數(shù),或者將所述參數(shù)變換成用于總頻帶的參數(shù),對(duì)所述輸入信號(hào)和升高了所述取樣速率的解碼信號(hào)之間的差值進(jìn)行編碼,獲取第二編碼信息的步驟;和
多路復(fù)用所述第一編碼信息和所述第二編碼信息的步驟。
17.一種解碼方法,包括
對(duì)第一編碼信息進(jìn)行解碼來獲取第一解碼信號(hào)的步驟;
對(duì)第二編碼信息進(jìn)行解碼來獲取第二解碼信號(hào)的步驟;
將所述第一解碼信號(hào)的取樣速率升高到與所述第二解碼信號(hào)的取樣速率相同的速率的步驟;和
相加升高了所述取樣速率的第一解碼信號(hào)和所述第二解碼信號(hào)的步驟。
全文摘要
向下取樣器(101)將輸入信號(hào)的取樣速率從取樣速率FH降低到取樣速率FL?;緦泳幋a器(102)編碼取樣速率FL的聲信號(hào)。局部解碼器(103)解碼從基本層編碼器(102)輸出的編碼信息。向上取樣器(104)將解碼信號(hào)的取樣速率升高到FH。減法器(106)從取樣速率FH的聲信號(hào)中減去解碼信號(hào)。增強(qiáng)層編碼器(107)利用從局部解碼器(103)輸出的解碼所得參數(shù)編碼從減法器(106)輸出的信號(hào)。
文檔編號(hào)G10L19/00GK101131820SQ200710152908
公開日2008年2月27日 申請(qǐng)日期2003年4月28日 優(yōu)先權(quán)日2002年4月26日
發(fā)明者押切正浩 申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
龙游县| 勃利县| 寿宁县| 出国| 莒南县| 张北县| 同江市| 南溪县| 平顺县| 定安县| 疏勒县| 井研县| 株洲市| 泸水县| 桃园县| 噶尔县| 洮南市| 邯郸县| 刚察县| 桂平市| 长岭县| 湘乡市| 吴桥县| 武陟县| 延庆县| 潮州市| 湖口县| 吴忠市| 杨浦区| 澄江县| 绩溪县| 利川市| 遵义市| 定州市| 石台县| 双城市| 左贡县| 巨野县| 类乌齐县| 东辽县| 太白县|