專利名稱:用于壓縮的方法和裝置,用于傳輸?shù)姆椒ㄒ约坝糜跀U展被壓縮多聲道聲音信號的方法和 ...的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及壓縮,例如電影院、磁帶錄相機或視盤放相機等多聲道音響系統(tǒng)的聲音信號的方法和裝置,傳輸多聲道聲音系統(tǒng)的被壓縮聲音信號的方法,擴展多聲道聲音系統(tǒng)的被壓縮聲音信號的方法和裝置,以及記錄多聲道音響系統(tǒng)的被壓縮聲音信號的記錄媒體。
背景技術(shù):
已知許多壓縮數(shù)字聲頻或語聲信號的技術(shù)。例如,在子頻帶編碼中,非塊形成頻帶劃分系統(tǒng),不將輸入音頻信號按時間劃分成塊,而將其用濾波器按頻率劃分成多個用于量化的頻帶。在塊形成頻帶劃分系統(tǒng)中,例如變換編碼系統(tǒng),時間域的輸入音頻信號通過正交變換被轉(zhuǎn)換成頻域的頻譜系數(shù)。產(chǎn)生的頻譜系數(shù)按頻率劃分成多個頻帶,并且每個頻帶的頻譜系數(shù)被量化。
一種組合了子頻帶編碼和變換編碼的技術(shù)也是已知的。其中,通過按頻率劃分輸入音頻信號而不將其劃分成塊所產(chǎn)生的頻域信號被個別地、正交地變換成頻譜系數(shù)。然后,將頻譜系數(shù)按頻率劃分成多個頻帶,接著每個頻帶里的頻譜系數(shù)被量化。
在那些用于將輸入的數(shù)字音頻信號劃分成頻域而不是將其劃分成塊的濾波器中,有一種是正交鏡像(QMF)濾波器,例如在R.E.Crochieve,55 BELL SYST.TECH.J.No.8,(1976)的《子頻帶中的語聲數(shù)字編碼》中有所描述。在Joseph H.Rothweilev,ICASSP 83,BOSTON(1983)的《多相正交濾波器—一種新的子頻帶編碼技術(shù)》中,討論了將輸入音頻信號按頻率劃分成同樣帶寬的頻帶的技術(shù)。
正交地變換輸入信號的已知技術(shù)包括將數(shù)字輸入音頻信號按時間劃分成有預(yù)定時間間隔的塊,并且用快速付利葉變換(FFT),離散余弦變換(DCT),或改進的DCT(MDCT)處理所產(chǎn)生的塊,將每個數(shù)字音頻信號塊從時間域變換成頻域的一組頻譜系數(shù)。在J.P.Princen和A.B.Bradley,的《采用基于時域混疊對消的濾波器組的子頻帶/變換編碼》,ICASSP 1987中討論了改進的DCT。
作為用于量化通過分頻所得到的頻譜系數(shù)的一種技術(shù),已知按頻率將頻譜系數(shù)劃分成頻帶,并考慮到人類聽覺的頻率分辨率的特征。在0Hz到20或22KHz范圍內(nèi)的音頻能按頻率劃分成頻帶,例如25個臨界頻帶,它們的帶寬隨頻率的增加而增加。通過對每個頻帶進行自適應(yīng)比特分配而對每個頻帶內(nèi)的頻譜系數(shù)進行量化。例如,從改進離散余弦變換(MDCT)所得到的頻譜系數(shù)被頻率劃分成頻帶,并用自適應(yīng)確定的比特數(shù)對每個頻帶里的頻譜系數(shù)進行量化。
現(xiàn)在將討論兩種已知的自適應(yīng)比特分配技術(shù)。首先,在ASSP-25,IEEE聲音,語聲處理和信號處理學(xué)報,1977,8月No.4中所描述的技術(shù)中,根據(jù)相應(yīng)頻帶信號的大小來進行比特分配。盡管這個系統(tǒng)提供扁平量化噪聲頻譜,并最小化噪聲能量,但是,聽者感覺到的噪聲末被最小化,因為這種技術(shù)不利用人類聽覺的掩蔽特征。
另一方面,M.A.Kransner《臨界頻帶編碼器—適應(yīng)聽覺系統(tǒng)感覺要求的數(shù)字編碼》,ICASSP 1980中,描述了利用人類聽覺的掩蔽特性來確定為每個聲道建立固定量化比特分配所需的信號-噪聲之比的技術(shù)。但是,由于其固定的比特分配,這種技術(shù)對單一正弦(sine)波輸入提供相對差的結(jié)果。
作為壓縮數(shù)字聲音信號的高效系統(tǒng),例如,采用上述子頻帶編碼系統(tǒng),一種被稱作ATRAC的高效壓縮系統(tǒng)已經(jīng)投入實際使用。這個系統(tǒng)利用人類聽覺特性,用自適應(yīng)變換聲音編碼將數(shù)字聲音信號壓縮到它們原始比特要求的大約20%。ATRAC是當(dāng)前代理人(sony公司)的注冊商標(biāo)。
在四到八條聲道中的多聲道聲音或語聲信號,不僅在例如一般音響設(shè)備中用到,還在立體聲或多聲道音響系統(tǒng)中采用,例如在電影院、高質(zhì)量電視、磁帶錄相機和視盤放相機中發(fā)現(xiàn)的那些設(shè)備。在這些情況下,需要采用高效壓縮,以降低代表大量聲音信號所需的比特率。
特別是,在商業(yè)應(yīng)用中,已經(jīng)有了一種向多聲道數(shù)字聲音信號和處理八聲道數(shù)字聲音信號的設(shè)備方面發(fā)展的趨勢。典型的處理八聲道數(shù)字聲音信號的設(shè)備是電影院音響系統(tǒng),以及通過各種電子媒體,電子化地重放電影的畫面和聲音的裝置,尤其是諸如象高質(zhì)量電視系統(tǒng)、磁帶錄相機和視盤放相機那樣的裝置。在這種裝置音響系統(tǒng)中,有一種趨于四和八聲道之間的多聲道音響系統(tǒng)的趨勢。
電影院音響系統(tǒng)最近已經(jīng)建議在電影膠片上為以下八條聲道記錄數(shù)字聲音信號左邊,左邊-中心,中心,右邊-中心,右邊,左環(huán),右環(huán)和子低音喇叭。這些聲音聲道分別由左揚聲器,左-中心揚聲器,中心揚聲器,右-中心揚聲器和右揚聲器重放,它們?nèi)才旁谄聊恢螅蛔拥鸵衾任挥谄聊磺懊婊蚝竺?;以及一個左環(huán)繞揚聲器和右環(huán)繞揚聲器。在左邊墻大廳背墻的左部以及右邊墻和大廳背墻的右部,為左環(huán)繞揚聲器和右環(huán)繞揚聲器,分別安排了兩組揚聲器。大廳背墻和兩邊墻上的這兩組揚聲器產(chǎn)生豐富的環(huán)繞聲域,以伴隨在電影院的寬屏幕上的壯觀的視覺效果。這了簡化,從現(xiàn)在起,這兩組揚聲器被稱作“左環(huán)繞揚聲器”和“右環(huán)繞揚聲器”。
難以在電影膠片上象在密磁盤(CD)中所采用的那樣用44.1KHz的采樣頻率錄制八聲道的16-比特線性量化數(shù)字聲音,因為膠片上缺少能為這樣的信號容納足夠?qū)挼囊舨鄣膮^(qū)域。電影膠片的寬度和膠片上圖象區(qū)的寬度是標(biāo)準(zhǔn)化的。膠片的寬度不能增加,也不能減少圖象區(qū)的寬度以容納這類數(shù)字音頻信號所需寬度的聲槽。有標(biāo)準(zhǔn)圖象區(qū),標(biāo)準(zhǔn)模擬聲槽,和標(biāo)準(zhǔn)孔眼的標(biāo)準(zhǔn)膠片只有一個窄的數(shù)字聲音信號能被記錄的區(qū)域。因此,只有數(shù)字聲音信號在記錄在膠片上之前被壓縮過,才能記錄八聲道的數(shù)字聲音。能用上述ATRAC高效壓縮系統(tǒng)對八聲道數(shù)字聲音進行壓縮。
電影膠片容易被劃壞,因此,如果數(shù)字聲音信號未經(jīng)任何形式的檢錯和糾錯而被錄制,它將引起遺漏。因此,采用糾錯碼是必不可少的,當(dāng)進行信號壓縮時,必須考慮這一點。
作為在家里提供電影的一種媒體,光盤已經(jīng)開始流行,最理想的是能夠用四到八個聲道在光盤上錄制多聲道聲音,以提供比傳統(tǒng)立體聲更逼真的聲音。在光盤上,視頻信號的數(shù)據(jù)量是音頻信號的十倍,并只為聲音信號提供有限的記錄區(qū)域。特別地,象當(dāng)前大屏幕趨勢所要求的那樣,當(dāng)需要圖象信號提供高質(zhì)圖象時,盡可能多地記錄區(qū)被用于圖象信號。因此,如果要在聲音信號的可記錄區(qū)域中提供所需數(shù)目的聲道,聲音信號必須被高度壓縮。
當(dāng)由當(dāng)前代理人之一(sony公司)所建議的上述ATRAC高效壓縮系統(tǒng)被用于立體(兩聲道)聲系統(tǒng)中時,每個聲道中的音頻信號被相互獨立地進行壓縮。這使每條聲道能被獨立地使用,并且簡化了用于壓縮音頻信號的處理算法。按這種方式工作,ATRAC系統(tǒng)為大多數(shù)應(yīng)用提供足夠的壓縮,并且當(dāng)用ATRAC系統(tǒng)對音頻信號進行壓縮和擴展時,所獲得的聲音質(zhì)量被認為很好。
但是,由于它獨立地壓縮每個音頻信號,因此不能說當(dāng)前ATRAC系統(tǒng)用以進行其壓縮的比特分配處理以最高效率操作。例如,如果一條聲道的信號電平很低,能用較少比特,充分地代表該信號。另一方面,另一條聲道中的信號可能需要更多的比特來充分地代表它?,F(xiàn)有ATRAC系統(tǒng)在每個聲道分配相同數(shù)目的比特,而與在聲道中充分表示信號實際所需的比特數(shù)目無關(guān)。因此,為了提供其高質(zhì)量重放,本系統(tǒng)進行的比特分配中,必須有一些冗余。
如果要把多聲道聲音信號錄制在電影膠片或光盤上,需要提高壓縮比而音質(zhì)惡化又最小。
因此,本發(fā)明的一個目標(biāo)是提供一種編碼方法和裝置,用于進一步提高壓縮比以使多聲道聲音信號能被錄制在電影膠片、光盤或其它媒體上,或能被傳輸或分配。
本發(fā)明的另一目標(biāo)是提供一種編碼方法或裝置,以聲音質(zhì)量的最小程度惡化,為至少兩條聲道的聲音信號編碼,有良好的聲道隔離,以及穩(wěn)定的立體聲效果。
發(fā)明概述本發(fā)明首先提供多聲道信號處理器,用于在多聲道音響系統(tǒng)的相應(yīng)聲道中壓縮數(shù)字聲音信號。該裝置包括第一級壓縮系統(tǒng)和第二級壓縮系統(tǒng)。在第一級壓縮系統(tǒng)中,耦合電路進行至少兩條聲道之間數(shù)字聲音信號的耦合,以為每條聲道產(chǎn)生一個經(jīng)過耦合處理的信號。壓縮器電路從耦合電路接收經(jīng)過耦合處理的信號,并且將每個經(jīng)過耦合處理的信號劃分成相應(yīng)頻帶中的頻帶信號,并壓縮通過劃分每個經(jīng)過耦合處理的信號所得到的頻帶信號,以生成第一級被壓縮信號。在第二級壓縮系統(tǒng)中,確定電路為每一聲道接收來自第一級壓縮系統(tǒng)的第一級被壓縮信號,并且根據(jù)相應(yīng)聲道的第一級被壓縮信號來為每條聲道確定能量。聲道比特分配判定電路相應(yīng)于確定電路操作,并且在聲道之間分配預(yù)定的比特數(shù)量,給每條聲道分配一些比特。最后,附加壓縮器對每條聲道使用由聲道比特分配判定電路分配給相應(yīng)聲道的比特數(shù),進一步壓縮每條聲道的第一級被壓縮信號。
發(fā)明接著提供一種用于在多聲道音響系統(tǒng)的相應(yīng)聲道中壓縮數(shù)字聲音信號的方法。在該方法中,在至少兩條聲道的數(shù)字聲音信號之間進行耦合,為每個聲道生成一個經(jīng)耦合處理的信號。經(jīng)過耦合處理的信號被分頻成相應(yīng)的頻帶內(nèi)的頻帶信號。通過劃分每個經(jīng)過耦合處理的信號所得到的頻帶信號被壓縮,以產(chǎn)生第一級被壓縮信號。從相應(yīng)聲道的第一級被壓縮信號確定每條聲道的能量,相應(yīng)于每條聲道的確定能量,在聲道之間分配預(yù)定量的比特數(shù)量,為每條聲道分配一些比特。最后,每條聲道的第一級被壓縮信號,利用分配給該聲道的比特數(shù),被進一步壓縮。
本發(fā)明還提供一種錄制媒體,通過上述在多聲道音響系統(tǒng)的相應(yīng)聲道中壓縮數(shù)字聲音信號的方法所生成的被壓縮信號被錄制在其上。
本發(fā)明還提供一種方法,用于通過傳輸媒體在多聲道音響系統(tǒng)的相應(yīng)聲道中傳輸數(shù)字聲音信號,其中,上述方法所描述的每個聲道的第一級被壓縮信號被進一步壓縮以生成相應(yīng)的第二級被壓縮信號,所有聲道的第二級被壓縮信號被復(fù)用生成一個比特流,比特流被加在傳輸媒體上。
本發(fā)明接著提供一種多聲道信號擴展器,用于擴展代表多聲道音響系統(tǒng)的相應(yīng)聲道中數(shù)字聲音信號被壓縮信號,系統(tǒng)中至少兩個聲道中的數(shù)字聲音信號在被壓縮之前已經(jīng)經(jīng)過耦合。被壓縮信號包括代表至少兩個聲道的數(shù)字聲音信號的主要信息和輔助信息。該裝置包括解復(fù)用器,第二級擴展器和第一級擴展器。解復(fù)用器分解被壓縮的信號以提取主要信息和輔助信息。第二級擴展器通過將可變長度碼轉(zhuǎn)換成固定長度碼來擴展來自解復(fù)用器的主要信息。第一級擴展器響應(yīng)來自解復(fù)用器輔助信息而進行操作,進一步擴展來自第二級擴展器的固定長度碼以在至少兩個聲道的每個當(dāng)中提供再生數(shù)字聲音信號。盡管在兩條聲道中的數(shù)字聲音信號按標(biāo)準(zhǔn)有同樣的帶寬,但是,一條聲道中的第一級擴展器對其操作的固定長度碼與另一聲道中的,第一級擴展器對其操作的固定長度碼相比,代表較窄帶寬的信號。
本發(fā)明還提供一種方法,用于擴展代表多聲道音響系統(tǒng)的相應(yīng)聲道中的數(shù)字聲音信號的被壓縮信號,系統(tǒng)中,至少兩個聲道中數(shù)字聲音信號在壓縮前已經(jīng)經(jīng)過耦合。被壓縮信號包括代表至少兩個聲道的數(shù)字聲音信號的主信息和輔助信息。在該方法中,被壓縮的信號經(jīng)復(fù)用以提取主要信息和輔助信息。通過把主要信息的可變長度碼轉(zhuǎn)換成固定長度碼,來擴展從被壓縮信號中提取的主要信息。最后,從被壓縮信號中提取的輔助信息被用于進一步擴展通過轉(zhuǎn)換主要信息的可變長度碼所得到的固定長度碼,以在至少兩條聲道中的每條中生成再生數(shù)字聲音信號。盡管按標(biāo)準(zhǔn)兩條聲道中的數(shù)字聲音信號有相同的帶寬,但是在至少兩條聲道的一條中被進一步擴展的固定長度碼與在至少兩條聲道的另一聲道中被進一步擴展的固定長度碼相比,代表有較窄帶寬的信號。
最后,本發(fā)明提供多聲道信號壓縮器,用于在多聲道音響系統(tǒng)的相應(yīng)聲道中壓縮數(shù)字聲音信號。該裝置包括第一級壓縮器和第二級壓縮器。第一級壓縮器接收相應(yīng)聲道的數(shù)字聲音信號并壓縮該數(shù)字聲音信號,以提供相應(yīng)的第一級被壓縮信號。第二級壓縮器從第一級壓縮器接收第一級的被壓縮信號,根據(jù)相應(yīng)的第一級被壓縮信號為每個聲道確定能量,對應(yīng)為每條聲道確定的能量,在信息之間分配比特,給每條聲道分配一些比特,并且進一步壓縮第一級被壓縮信號,以提供一個相應(yīng)的第二級被壓縮信號。每個聲道中的第二級被壓縮信號利用分配給該聲道的比特數(shù)。
附圖簡述
圖1是個框圖,表示根據(jù)本發(fā)明,用于壓縮多聲道聲音信號的多聲道壓縮器裝置的構(gòu)造。
圖2表示和電影一起使用的,八聲道數(shù)字聲音系統(tǒng)的揚聲器的排列。
圖3是個框圖,表示構(gòu)成圖1所示裝置的耦合電路的構(gòu)造。
圖4是個框圖,表示用于圖1所示裝置的第一級壓縮系統(tǒng)的一個壓縮器的實際例子。
圖5A和5B表示數(shù)字聲音信號的每一幀怎樣被劃分成頻率段,而每個頻率段中的信號又怎樣在圖4所示壓縮器中按時間被劃分成塊。
圖6是一個用于實現(xiàn)比特分配技術(shù)的自適應(yīng)比特分配電路,采用信號頻譜相關(guān)比特分配和噪聲頻譜相關(guān)比特分配。
圖7是允許噪聲電平檢測電路的框圖,用于在圖6所示的頻譜相關(guān)比特分配電路中發(fā)現(xiàn)所允許的噪聲電平。
圖8表示在每個頻帶中用頻譜系數(shù)來掩蔽的例子。
圖9表示信號頻譜,掩蔽閾值和最小可聽電平曲線。
圖10是個電路框圖,表示根據(jù)本發(fā)明用于擴展由圖1所示多聲道壓縮器所生成的被壓縮多聲道聲音信號的多聲道擴展器的例子。
本發(fā)明詳細描述參考附圖,現(xiàn)在將詳細描述本發(fā)明的優(yōu)選實施例。
圖1表示根據(jù)本發(fā)明,用于壓縮多聲道音響系統(tǒng)的數(shù)字聲音信號的多聲道信號壓縮器裝置的基本部分。多聲道壓縮器裝置被指定壓縮聲道CH1至CHn中的數(shù)字聲音信號,以生成輸出比特流。在該裝置中,第一級壓縮系統(tǒng)1包括壓縮器2021至202n,它們分別壓縮聲道CH1至CHn中的數(shù)字輸入聲音信號。第二級壓縮系統(tǒng)2包括對數(shù)頻譜包絡(luò)檢測器208,聲道比特分配判定電路209,熵編碼器2031至203n,以及輔助信息壓縮器2041至204n。
對數(shù)頻譜包絡(luò)檢測電路208接收由第一級壓縮系統(tǒng)1所生成的輔助信息,并且從輔助信息檢測每條聲道CH1至CHn中的信號能量,聲道比特分配判決電路209根據(jù)本質(zhì)上對應(yīng)于對數(shù)頻譜包絡(luò)檢測器208輸出的比值,來確定相應(yīng)于輸出比特率的總比特數(shù)在聲道之間的分配。在熵編碼器2031至203n中,自適應(yīng)量化器2051至205n,利用從聲道比特分配判決電路209所接收的聲道比特分配信息所指示的比特數(shù),自適應(yīng)地量化來自第一級壓縮系統(tǒng)1的被壓縮信號。熵編碼器將第一級壓縮系統(tǒng)1中的壓縮器所產(chǎn)生的固定長度字轉(zhuǎn)換成可變長度字。輔助信息壓縮器2041至204n自適應(yīng)地壓縮輔信息,即在壓縮相應(yīng)數(shù)字聲音信號過程中,在第一級壓縮系統(tǒng)1中由壓縮器2021至202n所生成的字長度信息和比例系數(shù)信息。
用與本發(fā)明相應(yīng)的多聲道信號壓縮器壓縮相應(yīng)聲道中的數(shù)字聲音信號所得到的比特流,被記錄在錄制媒體上,或通過傳輸媒體被傳輸。錄制媒體的例子包括電影膠片;盤形錄制媒體,諸如光盤,磁光盤,相變型光盤,以及磁盤;磁帶型錄制媒體,諸如錄相帶;以及固態(tài)媒體,諸如半導(dǎo)體存儲器和IC卡。
當(dāng)錄制媒體是電影膠片時,聲道CH1至CH8中聲音信號被送到例如圖2所示數(shù)字電影音響系統(tǒng)中的相應(yīng)揚聲器上。中夾聲道C,子低音喇叭聲道SW和左聲道L,左-中心聲道LC,右聲道R,右-中心聲道RC,左-環(huán)繞聲道LB,和右環(huán)繞聲道RB的信號,分別送到中央揚聲器102,子低音喇叭103,左揚聲器106,左-中心揚聲器104,右揚聲器107,右-中心揚中器105,左-環(huán)繞揚聲器108和右-環(huán)繞揚聲器109。
圖2表示了投影機100,它將電影膠片的圖象區(qū)的圖象投影到屏幕101上,并且還表示了各種揚聲器相對于投影機屏幕,觀眾110的布局。
中央揚聲器102位于屏幕101的中心處,在屏幕遠離觀眾110的一側(cè),響應(yīng)中央聲道聲音信號生成中央聲道聲音。它產(chǎn)生中心位的聲音,按慣例,所有對話都由中央揚聲器重放,而與講話的男演員或女演員在屏幕上的位置無關(guān)。
子低音喇叭響應(yīng)子低音喇叭聲道聲音信號產(chǎn)生低頻效應(yīng)音響。它產(chǎn)生的音響經(jīng)常被認為是顫音,而非低頻音響,諸如爆炸及其它大規(guī)模特殊效果的聲音。
左揚聲器106和右揚聲器107分別安放在屏幕101的左邊緣和右邊緣或之外,并且響應(yīng)左和右聲道音響信號產(chǎn)生左聲道聲音和右聲道聲音。它們主要用于重放立體聲音樂以及再生從位于接近屏幕左和右邊緣的音源發(fā)出的音響效果。
左-中心揚聲器104和右-中心揚聲器105分別位于中央揚聲器102和左揚聲器106之間,以及中央揚聲器102和右揚聲器107之間。它們分別響應(yīng)左中心聲道音響信號和右中心聲道音響信號產(chǎn)生左中心音響和右-中心音響。揚聲器104和105分別作為左揚聲器106和右揚聲器107的輔助揚聲器。在具有大屏幕101和能容納大量觀眾的電影院中,位于中央揚聲器102和左及右揚聲器106和107之間的聲源可感位置可能不穩(wěn)定或不清楚。增加左中心揚聲器104和右中心揚聲器105有助于更穩(wěn)定地定位這些聲源,因此有助于形成更真實的聲音形象。
左環(huán)繞揚聲器108和右環(huán)繞揚聲器109一般懸掛在大廳圍繞觀眾的墻上,并且響應(yīng)在環(huán)繞聲道音響信號和右環(huán)繞聲道音響信號,分別產(chǎn)生左環(huán)繞音響及右環(huán)繞音響。這些揚聲器有助于給觀眾以被包圍在一個音響環(huán)境中的感覺,諸如掌聲或歡呼聲,并且有助于形成三維聲音形象。
返回圖1,現(xiàn)在將描述多聲道信號壓縮器200的結(jié)構(gòu)。圖1中,聲道CH1到CHn中的數(shù)字音響信號分別被送到輸入端2011到201n,從這里經(jīng)過耦合電路220。耦合電路降低了代表多聲道音響系統(tǒng)的音響信號所需的比特數(shù)。后面將細述其操作。
聲道CH1到CHn的數(shù)字聲音信號,經(jīng)耦合電路220處理之后,被加到第一級壓縮系統(tǒng)1中的相應(yīng)壓縮器2021至202n上。壓縮器2011至201n壓縮數(shù)字聲音信號,以生成主信息和輔助信息,它們都被表示成固定長度字。后面將詳細描述壓縮器2021至202n的結(jié)構(gòu)。
來自壓縮器2021至202n的主信息分別被加到熵編碼器2031到203n上,它提供進一步壓縮,將主信息的固定長度字轉(zhuǎn)換成可變長度碼。來自壓縮器2021至202n的輔助信息被送到輔助信息壓縮器2041至204n,它包括與第一級壓縮系統(tǒng)1中進行的壓縮有關(guān)的字長和比例系數(shù),后面將對其更詳細地描述。輔助信息壓縮器響應(yīng)由聲道比特分配判決電路209給每條聲道的聲道比特分配信息,壓縮輔助信息。
熵編碼器2031至203n根據(jù)主信息的不同可能字出現(xiàn)的頻率,通過將主信息的固定長度字轉(zhuǎn)換成可變長度碼對主信息進行熵編碼。較經(jīng)常出現(xiàn)的字被分配給較短的可變長度碼,而較少出現(xiàn)的字被分配給較少可變長度碼。分別包括自適應(yīng)量化電路2051至205n的熵編碼器2031至203n進行自適應(yīng)量化。
聲道CH1至CHn的輔助信息也通過終端2151至215n從第一級壓縮器2021至202n發(fā)送給對數(shù)頻譜包絡(luò)檢測電路208。對數(shù)頻譜包絡(luò)檢測電路208,根據(jù)聲道的輔助信息計算每個聲道中的聲音能量,例如使用聲道中不同頻帶的比例系數(shù)。根據(jù)不同頻帶的比例系數(shù)來確定每條聲道的頻譜包絡(luò)。自此獲得每個聲道的對數(shù)頻譜包絡(luò)信息,并送到聲道比特分配判決電路209上。
聲道比特分配判決電路209響應(yīng)從對數(shù)頻譜包絡(luò)檢測電路208所接收的聲道的對數(shù)頻譜包絡(luò)信息進行操作,以確定相應(yīng)于輸出比特率的總比特數(shù)在聲道之間的分配。對每條聲道的主信息和輔助信息進行獨立的比特分配。
在本實施例中,第一級壓縮系統(tǒng)1中的壓縮器壓縮每條聲道中的數(shù)字聲音信號,以用大約100kbps的比特率提供主信息和輔助信息。因為所有八條聲道所要求的輸出比特率是500kbps,所以要求對主信息和輔助信息的進一步壓縮。因此,聲道比特分配判決電路209,根據(jù)每條聲道中的聲音信號所需比特,在八條聲道之間分配相應(yīng)于輸出比特率的比特數(shù)。換言之,當(dāng)相應(yīng)的熵編碼器2031至203n將來自第一級壓縮系統(tǒng)1的主信息從固定字長轉(zhuǎn)換成可變字長時,聲道比特分配判決電路209從相應(yīng)于比特率500kbps的比特數(shù)中,分配每個適應(yīng)量化器2051至205n所用的比特數(shù)。
作為這種比特分配處理的結(jié)果,在信號電平低的聲道上,壓縮器2021到202n之一所用的相應(yīng)于100kbps比特率的比特數(shù)被降低到,例如相應(yīng)于10kbps的比特數(shù),鑒于子低音信號聲道頻率范圍有限,由壓縮器用于子低音聲道的相應(yīng)于100kbps比特率的比特數(shù),減少到例如相應(yīng)于比特率20kbps的比特數(shù)。作為這種在聲道之間動態(tài)重分配的結(jié)果,分配給一些聲道的冗余比特能夠被去掉,以將輸出比特率降低到所要求的值(500kbps)。而當(dāng)比特用量許可時,重新分配冗余比特給能夠更有效地利用它們的聲道。
在聲道間相應(yīng)于輸出比特率進行比特分配,引起相應(yīng)聲道所用比特數(shù)的明顯差異。但是,由于采用了可變長度碼,也由于來自第二級壓縮系統(tǒng)2的被壓縮信號經(jīng)復(fù)用器206排列的方式,所以相應(yīng)聲道所用比特數(shù)的差異不引起操作上的問題。而且,相應(yīng)聲道所用比特數(shù)的差異并不妨礙進行同時的壓縮和擴展,這是因為擴展器進行和壓縮器相反的操作。換言之,在任何時間和任何聲道上,擴展器不需要比壓縮器所提供的比特數(shù)更多或更小的比特。
指示用于每條聲道量化主信息的比特分配的信息,通過終端2161至216n,被從聲道比特位置判決電路209分別送到自適應(yīng)量化電路2051至205n。指示用于每條聲道量化輔助信息的比特分配的信息,通過終端2141至214n,被從聲道比特位置判決電路209分別送到輔助信息壓縮器2041至204n。
在自適應(yīng)量化電路2051至205n中,對每條聲道采用由來自比特分配判決電路209的,指示聲道主信息比特分配的信息所指明的比特數(shù),自適應(yīng)地量化每條聲道的主信息。輔助信息壓縮器2041至204n,對每條聲道采用由來自聲道比特分配判決電路209的,指示聲道輔助信息比特分配的信息所指明的比特數(shù),壓縮輔助信息(即,比例系數(shù)和字長度信息)。
熵編碼器2031至203n及輔助信息壓縮器2041至204n的輸出被送到復(fù)用器206。
復(fù)用器復(fù)用加到該處的熵編碼器2031至203n和輔助信息壓縮器2041至204n的輸出,并將產(chǎn)生的比特流送到輸出端207。來自輸出端的輸出比特流,進而被糾錯電路(未示出)處理,該電路加入糾錯碼和/或調(diào)制器,以形成一個記錄在記錄媒體上的比特流。例如,光盤230或電影膠片(未示出)能被用作錄制媒體。或者,可以通過天線231用無線電傳送比特流。也可以通過其它適當(dāng)?shù)拿襟w傳輸比特流,例如,衛(wèi)星廣播、電纜、銅線或光纖傳輸系統(tǒng)、ISDN系統(tǒng)、etc。
現(xiàn)在將參考圖3描述由上述耦合電路220所完成的處理。
圖3表示完成所有聲道之間的耦合的耦合電路220的結(jié)構(gòu)。在圖3中,每一聲道CH1至CHn中的數(shù)字聲音信號分別由相應(yīng)的低通濾波器2211至221n和高通濾波器2221至222n分割成較低頻段信號和高頻段的信號。每條聲道中較低頻段信號和高頻段信號的頻率范圍分別為0Hz到11KHz和11到22KHz。例如,可以由適當(dāng)?shù)恼荤R象濾波器(QMFS)來提供低通濾波器2211到221n和高通濾波器2221到222n的功能。
來自低通濾波器2211到221n的頻率范圍在0Hz到11KHz之間的低頻段信號,通過終端2241至224n分別被加到第一級壓縮器2021到202n上。另一方面,來自高通濾波器2221到222n的,頻率范圍11KHz到22KHz的高頻段信號,通過終端2261至226n,分別被加到加法電路223上。加法電路將所有聲道的高頻段信號加在一起,生成一個單一的組合高頻段信號,它又通過終端225將該組合高頻段信號加到第一級壓縮器電路2021上。
相應(yīng)聲道的高頻段信號被組合在一起,形成單一組合的高頻段信號,它只和一個聲道的較低頻段信號一起被處理,因為我們知道人類的聽覺在高頻時,對方向不敏感。因此,聽者難以分辨多個揚聲器中哪一個產(chǎn)生高頻聲音。聲音的頻率越高這就變得越困難。我們的實驗表明,人類的聽覺對于頻率高于3KHz的聲音的方向幾乎沒有感知能力。
因此,如果音響系統(tǒng)至少有兩條聲道,并且從一條聲道的揚聲器重新生成所有聲道的高頻段信號,那么,聽者難以感知哪個揚聲器在產(chǎn)生聲音。因此,累加所在聲道的高頻段信號,以生成一個組合的高頻段信號,以及用音響系統(tǒng)的至少一個揚聲器來重新生成組合的高頻段信號,不會引起音響系統(tǒng)的方向特性的明顯降低。
因此,在耦合電路202中,組合多聲道音響系統(tǒng)各聲道的高頻段信號并且按單一聲道的高頻段信號來處理所得的組合高頻段信號,這使得無需在輸出比特流中包括單個聲道的高頻段信號。這就能從輸出比特流中,將代表單個聲道的高頻段信號的所需比特省去,這樣就節(jié)省了代表多聲道音響系統(tǒng)的聲音信號所需的比特數(shù)。
在上述實施例中,較低頻段信號是頻帶在0Hz到11KHz之間的信號分量,而高頻帶信號是頻帶在11到22KHz之間的信號分量。但是,由于缺乏對3KHz以上分量的方向感知,低頻帶信號可以是頻率在0Hz到3KHz范圍內(nèi)的信號分量,且高頻帶信號可以是頻率帶在3到22KHz之間的信號分量。
在以上實施例中,所有聲道的高頻段信號被組合在一起形成組合高頻帶信號,它作為單一聲道的高頻帶信號被壓縮。但是,如果可用比特率允許,則左邊聲道的高頻帶信號可以獨立于右邊聲道高頻帶信號組合在一起,以提供兩個組合高頻帶信號,它們作為兩個聲道的高頻帶信號被壓縮?;蛘?,前面聲道的高頻帶信號獨立于環(huán)繞聲道的高頻帶信號而被組合在一起,以提供兩個組合高頻帶信號。
現(xiàn)在將參考圖4描述圖1所示的,第一級壓縮系統(tǒng)1中的壓縮器2021至202n的實際結(jié)構(gòu)。在圖1所示的壓縮器2021至202n中,每個聲道中的數(shù)字聲音信號,例如可以是PCM聲音信號能采用子頻帶編碼(SBC),自適應(yīng)變換編碼(ATC),和自適應(yīng)比特分配(APC-AB)進行壓縮,圖4表示聲道CH1中的壓縮器2021的結(jié)構(gòu)。壓縮器2022至202n的結(jié)構(gòu)也類似,但由于聲道CH2至CHn的高于11KHz的高頻帶信號由耦合電路220(圖1)進行提取,所以,這些壓縮器沒有頻帶分割濾波器11和高頻帶處理電路29。而且,壓縮器2021沒有頻帶濾波器11,因為這個濾波器的功能由耦合電路202中的濾波器來提供。在當(dāng)前代理人之一(Sony公司)所有的美國專利No.5,301,205中更詳細地公開了壓縮器的結(jié)構(gòu)。
在當(dāng)前實施例中,聲道CH1中的數(shù)字聲音信號由非塊形成頻帶劃分濾波器劃分成多個頻帶。來自頻帶劃分濾波器的每個頻率范圍內(nèi)的頻帶信號按時間被動態(tài)地劃分成塊,并且每個頻帶的每個塊從時域進行正交變換,以生成一組頻段的頻譜系數(shù)。自適應(yīng)地將量化比特分配給頻譜系數(shù),該頻譜系數(shù)按頻率劃分成頻帶,最好為臨界頻帶,或是通過按頻率劃分較高頻帶而得到的子頻帶。這樣就使人類聽覺的心理聲學(xué)特性在考慮的范圍之內(nèi)。
通過頻帶劃分濾波器對數(shù)字聲音信號的非塊形成頻帶劃分,產(chǎn)生相等帶寬的頻帶,但是,頻帶帶寬最好隨著頻率的增加而增加。頻帶信號按時間被劃分成的塊的長度相應(yīng)于正交變換前的數(shù)字聲音信號或頻段信號的動態(tài)特性而自適應(yīng)地改變。塊自動調(diào)節(jié)用于每個臨界頻帶或是按頻率分割較高頻臨界頻帶所得的每個子頻帶的頻譜系數(shù)。
臨界頻帶是由考慮人類聽覺的頻率鑒別特性的分頻系統(tǒng)所產(chǎn)生的頻帶。臨界頻帶是噪聲頻帶,它能被和噪聲頻帶有相同強度并具有噪聲頻帶中心頻率的純聲音所覆蓋。臨界頻帶的寬度隨著頻率的增加而增加。0Hz到20或22KHz的音頻范圍一般被劃分成25個臨界頻帶。
在此對臨界頻帶作了說明后,應(yīng)當(dāng)理解較高頻率臨界頻帶能可選擇地被劃分成多個子頻帶。當(dāng)較高頻率關(guān)鍵頻帶被劃分成子頻帶時,對臨界頻帶的說明也適用于較高頻率臨界頻帶所被劃分成的子頻帶。
在圖4中,聲道CH1中的數(shù)字聲音信號,例如是0Hz到22KHz頻帶內(nèi)的PCM音頻信號,被加到輸入端10。數(shù)字聲音信號被頻帶劃分濾波器11劃分成較低頻段0Hz到11KHz的頻段信號和頻段在11到22KHz內(nèi)的高頻段信號,該濾波器最好是正交鏡象(QMF)濾波器。頻率段在0Hz到11KHz內(nèi)的較低頻帶信號又被頻帶劃分濾波器12進一步劃分成在頻率段0Hz到5.5KHz之內(nèi)的低頻段信號,以及頻段5.5到11KHz之間的頻段信號。該頻帶劃分濾波器最好也是一個QMF濾波器。
來自頻帶劃分濾波器11的高頻段信號被送到正交變換電路13,以及塊長度判決電路19上,正交變換電路13最好是改進的離散余弦變換(MDCT)電路。來自頻帶劃分濾波器12的中頻段信號被送給MDCT電路14,以及塊長度判決電路20。來自頻帶劃分濾波器12的低頻段信號被送到MDCT電路14,以及塊長度判決電路21。
圖5A和5B表示了為了由MDCT電路13、14、15進行正交變換,而將三個頻帶中數(shù)字聲音信號劃分成的塊的實際例子。三個頻帶中塊的塊長度由塊長度判決電路19、20和21動態(tài)地確定。圖5A和5B分別表示長模式的塊,其中頻帶信號在具有較長長度的塊中作正交變換,和短模式的塊,其中頻段信號在具有較短長度的塊中作正交變換。附加地或可選地,頻帶信號能在與所示的不同的塊長度組合中作正交變換。
在圖5A和5B所示的例子中,三個頻帶信號每個都有兩種可能的塊長度,它們在其中作正交變換。每個塊中頻段0Hz至5.5KHz內(nèi)的低頻段信號和中頻段5.5KHz至11KHz內(nèi)的中頻段信號的采樣數(shù)在圖5A中所示的長模式中被置為128,而在圖5B所示的短模式中被置為32。另一方面,每塊中頻段11KHz到22KHz內(nèi)高頻段信號的采樣數(shù)在圖5A所示的長模式中被置為256,且在圖5B所示的短模式中被置為32。以這種方法,當(dāng)選定短模式時,作正交變換的塊中的采樣數(shù)對所有頻段都置為相同。隨著頻率的增加,這降低了頻率分辨率,而同時作為將幀劃分成更多的塊的結(jié)果,時間分辨率得到了增加,塊長度判決電路19,20,21分別將它們確定的指明塊長度的信息送給MDCT電路13、14、15,以及自適應(yīng)比特分配和量化電路16、17和18,以及送給輸出端23、25和27。
自適應(yīng)比特分配和量化電路16、17和18將由MDCT電路13、14和15生成的頻譜系數(shù)按頻率劃分成臨界頻帶,并且歸一化和重量化每個臨界頻帶中的頻譜系數(shù)。為了在每個臨界頻帶中歸一化頻譜系數(shù),自適應(yīng)比特分配和量化電路為每個臨界頻帶確定一個比例系數(shù),并分別將比例系數(shù)送到輸出端22、24和26。
自適應(yīng)比特分配和量化電路16、17和18用以在每個臨界頻帶中重量化和歸一化頻譜系數(shù)的比特數(shù)取決于從相應(yīng)塊長度判決電路19、20和21中所接收的塊長度信息,和被分配用以重量化臨界頻帶頻譜系數(shù)的比特數(shù),后面將描述在臨界頻帶之間確定量化比特分配的自適應(yīng)比特分配電路。
來自自適應(yīng)比特分配和量化電路16、17和18的,經(jīng)重新量化的頻譜系數(shù)分別被送到輸出端22、24和26。最后,自適應(yīng)比特分配和量化電路16、17和18將指示用于重量化每個臨界頻帶頻譜系數(shù)的比特數(shù)的字長度信息,分別送給輸出端22、24和26。
在確定臨界頻帶之間量化比特的分配時,通過在每個臨界頻帶中計算由MDCT電路13、14和15所生成的頻譜系數(shù)幅度的均方根值來確定每個臨界頻帶中的信號能量,作為頻帶的強度。另外,每個臨界頻帶的比例系數(shù)也能用作臨界頻帶的強度,在這種情況下,無需在每個臨界頻帶中進一步計算信號能量,因此硬件的規(guī)模可以相對地減小。每個臨界頻帶中頻譜系數(shù)幅度的峰值或平均值也可以代替頻譜系數(shù)的能量被用作臨界頻帶的強度。
在圖4所示的例子中,數(shù)字聲音信號的帶寬被置為0Hz到22KHz,這樣,就能使用處理這個標(biāo)準(zhǔn)頻帶的通用LSI。但是,如果在多聲道信號壓縮器中包括有耦合電路220(圖1),那么電路就能被簡化,因為只用低頻帶壓縮電路28就能處理聲道CH2到CHn中的數(shù)字聲音信號,11KHz以上的高頻段信號被耦合電路220從聲道中去除了。因此,當(dāng)用耦合電路220處理八條聲道中的數(shù)字聲音信號時,需要八個低頻帶壓縮器電路28,每條聲道一個低頻帶壓縮電路,而所有聲道僅需一個高頻帶壓縮電路。因此,只有聲道CH1需要高頻帶壓縮器29來壓縮由耦合電路220生成的組合高頻帶信號。任何壓縮器電路中都無需QMF 11,因為濾波由耦合電路進行。盡管如上所述,組合高頻段信號是由壓縮器2021進行壓縮的,作為另一種方法它還能被其它壓縮器壓縮。
圖6表示了自適應(yīng)比特分配和量化電路16、17和18(圖4)的自適應(yīng)比特分配電路800的細節(jié),自適應(yīng)比特分配電路800確定了用于重新量化每個臨界頻帶頻譜系數(shù)的量化比特的分配。在圖6中,來自MDCT電路13、14和15(圖4)的頻譜系數(shù)經(jīng)自適應(yīng)比特分配和量化電路800的輸入端801被送到頻帶強度計算電路803。頻帶強度計算電路根據(jù)正交地變換頻段信號的每個塊所得到的臨界頻帶的一組頻譜系數(shù)為每個臨界頻帶計算強度。通過計算臨界頻帶中頻譜系數(shù)幅度的均方根值來計算臨界頻帶的強度。作為代替的方法,可以從臨界頻帶中頻譜系數(shù)的幅度的峰值或平均值、歸一化臨界頻帶中的頻譜系數(shù)所得的比例系數(shù)、或其它方法得到頻帶大小強度。
如圖8所示,頻帶強度計算電路803為每個臨界頻帶提供一頻帶強度作為其輸出。為了簡化,圖8只表示了12個頻帶(B1到B12)以代表臨界頻帶,和較高頻臨界頻帶被劃分成的子頻帶。
由頻帶強度計算電路803所計算的頻帶強度被送到信號譜相關(guān)比特分配電路804。信號譜相關(guān)比特分配電路采用會產(chǎn)生白噪聲譜的量化噪聲的方式,響應(yīng)每個臨界頻帶的強度對數(shù),在臨界頻帶之間分配相應(yīng)于塊802所指示的比特率的固定數(shù)目的量化比特。
噪聲譜相關(guān)比特分配電路805根據(jù)允許的噪聲頻譜來進行比特分配,以在臨界頻帶之間分配相應(yīng)于塊802所指示的比特率的固定數(shù)目的量化比特。噪聲譜相關(guān)比特分配電路805接收來自頻帶強度計算電路803的每個臨界頻帶的頻帶強度。響應(yīng)頻帶強度的頻譜,噪聲譜相關(guān)比特分配電路確定所允許的噪聲頻譜,也說是將掩蔽考慮在內(nèi)的每個臨界頻帶的允許噪聲電平。然后,噪聲譜相關(guān)比特分配電路在臨界頻帶之間分配相應(yīng)于比特率的固定數(shù)目的比特,以產(chǎn)生所要求的允許噪聲頻譜。
比特分配比判決電路809在信號譜相關(guān)比特分配和噪聲譜相關(guān)比特分配之間分配由塊802指明的,總的可用數(shù)目的量化比特,例如相應(yīng)于128kbps的比特。比特分配比判決電路809,根據(jù)聲道聲音信號的音調(diào),也就是聲音信號的頻譜平滑度來確定兩種不同類型比特分配之間的分配比率。由頻譜平滑性計算電路808所計算的頻譜平滑度系數(shù)指明聲音信號的頻譜平滑度,并被送到比特分配判決電路。
比特分配判決電路生成兩個控制信號,分別指示比特分配率和比特分配率的補數(shù),并將它們分別送到乘法器811和812。乘法器811用比特分配率乘由信號譜相關(guān)比特分配電路804所產(chǎn)生的固定數(shù)目比特的分配。乘法器812用比特分配率的補數(shù)乘由噪聲譜相關(guān)比特分配電路805所產(chǎn)生的固定數(shù)目比特的分配。
加法器將由乘法器811所確定的每個臨界頻帶的信號譜相關(guān)比特數(shù)和由乘法器812所確定的每個臨界頻帶的噪聲譜相關(guān)比特數(shù)相加,給出一個量化比特總數(shù),用于量化臨界頻帶中的頻譜系數(shù),并將結(jié)果送到輸出端807。這樣實際上用于在每個臨界頻帶中重新量化頻譜系數(shù)的信號譜相關(guān)比特數(shù)和噪聲譜相關(guān)比特數(shù)之比根據(jù)聲道中聲音信號的頻譜平滑度而變化。響應(yīng)自輸出端807接收到的結(jié)果,自適應(yīng)比特分配和量化電路16、17和18(圖4)中的量化器(未示出),用為量化臨界頻帶頻譜系數(shù)而分配的量化比特總數(shù)來重新量化每個臨界頻帶中的每個頻譜系數(shù)。
噪聲譜相關(guān)比特分配電路805包括一個允許噪聲頻譜計算電路,它通過考慮頻帶內(nèi)聲音信號的掩蔽,來計算所允許的噪聲頻譜。掩蔽是指當(dāng)一個聲音被另一個聲音掩蓋時,使人的聽覺感覺不到的現(xiàn)象。掩蔽包括在時間域由聲音造成的臨時掩蔽,和在頻段由聲音造成的同時掩蔽。作為掩蔽的結(jié)果,遭到臨時或同時掩蔽的任何噪聲都將聽不到。因此,在聲道的數(shù)字聲音信號的臨時或同時掩蔽范圍內(nèi)的噪聲被認為是可允許的噪聲。
圖7表示允許噪聲頻譜計算電路805的實際例子的框圖。在圖7中,來自MDCT電路13、14和15的頻譜系數(shù)被送到輸入端521,在此它們經(jīng)過頻帶強度計算電路522。頻帶強度計算電路通過計算臨界頻帶中頻譜系數(shù)的幅度之和來確定每個頻帶的強度?;蛘撸部梢岳门R界頻帶頻譜系數(shù)幅度的峰值,RMS或平均值以及臨界頻帶的比例系數(shù)。由頻帶強度計算電路522計算的臨界頻帶強度的頻譜一般被叫作樹皮頻譜。圖8表示了一個典型的樹皮頻譜SB,但為了簡化畫圖只表示了12個臨界頻帶B1至B12。
為了確定樹皮頻譜的掩蔽效果,對樹皮頻譜SB進行卷積處理,即樹皮頻譜的值與預(yù)定加權(quán)函數(shù)相乘,得到的積被加在一起。為此,來自頻譜強度計算電路522的樹皮頻譜值被送到卷積濾波器523。選擇性地,由圖6所示的頻帶強度計算電路803所計算的頻帶強度能通過終端540被接收并用作樹皮頻譜。如果這樣做的話,頻帶強度計算電路522能被省去。
卷積濾波器523包括多個延遲元件,它們順序地延遲樹皮頻譜的值,多個乘法器,例如25乘法器,一個臨界頻帶一個,用于用加權(quán)函數(shù)乘以每個延遲元件的輸出,以及一個加法電路用于累加乘法器的輸出,剛才描述的卷積處理從圖8所示樹皮頻譜中得到也在圖8中所示的掩蔽頻譜MS。
用在卷積濾波器電路523中的加權(quán)函數(shù)的實際例子對乘數(shù)M-1、M-2、M-3、M+1、M+2和M+3分別為0.15、0.0019、0.0000086、0.4、0.06和0.007。乘數(shù)M的加權(quán)系數(shù)是1,且M是從1到25的任意整數(shù)。
卷積濾波器523的輸出被送到減法器524,以得到和每個臨界頻帶中所允許噪聲電平相對應(yīng)的卷積域電平a,和允許噪聲電平相應(yīng)的卷積域電平a是這樣一個電平,即在經(jīng)反卷積之后,它將給出每個臨界頻帶的允許噪聲電平。
代表掩蔽電平的容許函數(shù)被加到減法器524上,以得出電平a。通過增大或減小容許函數(shù)來控制電平a。容許函數(shù)由后面將會描述的(n-ai)函數(shù)發(fā)生器525提供。
當(dāng)臨界頻帶數(shù)是i時,最低頻率臨界頻帶數(shù)是1,由以下等式來確定相應(yīng)于允許噪聲電平的電平aa=S-(n-ai)…(1)其中n和a分別是常數(shù)(a>0),且S是經(jīng)卷積處理的樹皮頻譜的密度。在等式(1)中,(n-ai)代表容許函數(shù)。在優(yōu)選實施例中,n被置為38且a被置為-0.5。有了這些設(shè)置,當(dāng)經(jīng)壓縮的信號被擴展時,不會損害聲音的質(zhì)量,因此就獲得了一個令人滿意的被壓縮信號。
如上所述確定的電平a被送到除法器526,它對卷積域內(nèi)的電平a進行反卷積。按這種方法,掩蔽頻譜變成了允許的噪聲頻譜。盡管反卷積一般要求復(fù)雜的算術(shù)操作,但是,在現(xiàn)有實施例中采用了簡單的除法器526來進行反卷積。
掩蔽頻譜,即每個臨界頻帶的掩蔽電平通過合成電路527被送到減法器528,它也通過延遲電路529從頻帶強度計算電路522或從頻帶強度計算電路803(圖6)接收上述樹皮頻譜SB。減法器528從樹皮頻譜SB中減去掩蔽頻譜,這樣,如圖9所示,掩蔽電平MS之下的樹皮頻譜SB部分被掩蓋??紤]到在減法器528之前的電路中的處理延遲,延遲電路529延遲樹皮頻譜。
減法器528的輸出通過允許噪聲頻譜校正電路530被送到輸出端531。輸出端531的輸出被送到ROM(未示出),其中存貯了多組被分配的比特數(shù)。輸出端531的輸出從ROM中選擇一組被分配的比特數(shù),即分配給每個臨界頻帶的比特數(shù)。ROM將這組被分配的比特數(shù)送到輸出端,作為如圖6所示噪聲譜相關(guān)比特分配電路805的輸出。
如圖9所示,合成電路527用掩蔽頻譜MS來分析表示所謂最小可聽電平曲線RC的數(shù)據(jù),最小可聽電平曲線代表人類聽覺的另一特性,并由最小可聽電平曲線生成器523提供。絕對電平低于最小可聽電平曲線的噪聲不能被聽到。對于給定的量化,最小可聽曲線的形狀取決于重放的音量。但是,由于用實用16-bit數(shù)字系統(tǒng)的動態(tài)范圍表示數(shù)字聲音信號的方法差別不大,如果人耳最敏感的頻帶內(nèi)聽不到量化噪聲,即4KHz附近的頻帶,那么能假定在其它頻帶內(nèi)聽不到低于最小可能電平曲線的量化噪聲。因此,當(dāng)和由系統(tǒng)所設(shè)置的字長度相對應(yīng)的4KHz附近的量化噪聲末被聽到時,能通過合成最小可聽電平曲線RC和掩蔽頻譜MS來提供允許噪聲電平。每個臨界頻帶中,所產(chǎn)生的允許噪聲電平可以達到由圖9中的陰影部分所指明的電平。在這個實施例中,在4KHz的最小可聽電平曲線的電平被設(shè)置成和采用例如20bits量化時對應(yīng)的最小電平相應(yīng)的電平。圖9還表示了信號頻譜SS。
允許噪聲頻譜校正電路530,在減法器528的輸出端,根據(jù)例如由校正信息電路533生成的等音量曲線,校正允許噪聲頻譜。等音量曲線也是人類聽覺的另一特性。這一曲線是通過確定各種頻率在與1KHz單音聽到的強度相同時的聲音壓力電平而得到的。等音量曲線和圖9所示的最小可聽曲線RC基本一樣。根據(jù)等音量曲線,當(dāng)4KHz的聲音的聲壓電平比1KHz的聲音的聲壓電平小8到10dB時,所聽到的4KHz附近的聲音和1KHz的聲音強度一樣。另一方面50Hz附近的聲音的聲壓電平必須比以同樣強度聽到的1KHz的聲音的聲壓電平大15dB。出于這種原理,高于最低可聽電平曲線的噪聲應(yīng)該具有相應(yīng)于等音量曲線的曲線給出的頻率特性。應(yīng)當(dāng)看到,調(diào)整系統(tǒng)和人類的聽覺特性相適應(yīng)要求考慮等音量曲線來校正允許噪聲頻譜。
現(xiàn)在返回圖6,兩種比特分配技術(shù),即噪聲譜相關(guān)比特分配和信號譜相關(guān)比特分配之間的聲道總可用比特數(shù)分配比,是由比特分配比判決電路809響應(yīng)由頻譜平滑性計算電路808所計算的頻譜平滑性指數(shù)來設(shè)置的。頻譜平滑性指數(shù)表明聲道的數(shù)字聲音信號的頻譜的平滑性?,F(xiàn)在將描述在兩種比特分配技術(shù)之間分配總的可用比特數(shù)的實用方法。
來自MDCT電路13、14和15(圖1)的頻譜系數(shù)通過輸入端801被送到頻譜平滑性計算電路808,808還被加上來自頻帶強度計算電路803的輸出。頻譜平滑性計算電路808計算指明數(shù)字聲音信號的頻譜平滑性的指數(shù)。在本實施例中,信號頻譜相鄰值之差的絕對值之和被信號頻譜絕對值之和去除后,作為指數(shù)使用。例如,頻譜平滑性計算電路能計算相鄰頻帶強度值之差的絕對值之和與所有頻帶強度之和的商,以此作為頻譜平滑性指數(shù),即,I=0.5×Σi=1n|Si-Si-1|]]>Σi=1n|Si|]]>其中,I是頻譜平滑性指數(shù),Si是第i個臨界頻帶的頻帶強度。
從頻譜平滑性計算電路808將頻譜平滑性指數(shù)送到比特分配率判決電路809,809設(shè)定根據(jù)信號譜相關(guān)比特分配所分配的比特,和根據(jù)噪聲譜相關(guān)比特分配所分配的比特之間的比特分配比。比特分配率判決電路809接收來自塊802的指明總可用比特數(shù)的信息。比特分配率判決電路設(shè)置比特分配率,這樣,隨著來自頻譜平滑性計算電路808的頻譜平滑性指數(shù)的增加(表明數(shù)字聲音信號的頻譜的平滑性降低),由噪聲譜相關(guān)比特分配分配更多的比特,而由信號譜相關(guān)比特分配更少的比特。
比特分配率判決電路809將指示比特分配率的控制信號送到乘法器811,并且將代表比特分配率的補數(shù)(1減去分配率)的控制信號送到乘法器812。根據(jù)分配率,乘法器811調(diào)整信號譜相關(guān)比特分配,乘法器812調(diào)整噪聲譜相關(guān)比特分配。
當(dāng)數(shù)字聲音信號的頻譜平滑時,代表來自比特分配率判決電路809的比特分配率的控制信號,假定一個值0.8來由信號譜相關(guān)比特分配來分配更多的比特。代表送到乘法器812的比特分配率的補數(shù)的控制信號被置為1-0.8=0.2。乘法器811用0.8乘以來自信號譜相關(guān)比特分配電路804的比特分配信息,而乘法器812用0.2乘以來自噪聲譜相關(guān)比特分配電路805的比特分配信息。加法器806將乘法器811和812的輸出相加,以為每個臨界頻帶提供總的比特分配??偟谋忍胤峙浔凰偷捷敵龆?07。
圖10表示多聲道擴展器100的結(jié)構(gòu),它是圖1所示多聲道壓縮器200的相對部分。在圖10中,從錄音媒體(或在發(fā)送后被接收)再生的比特流在糾錯之后被送到去復(fù)用器141。去復(fù)用器141將經(jīng)糾錯的比特流分解成每條聲道的熵編碼主信息和被壓縮的輔助信息。去復(fù)用器將經(jīng)熵編碼的主信息送到第二級擴展器130,將被壓縮的輔助信息送到輔助信息擴展器1041至104n。
第二級擴展器130,熵解碼器1311至131n為其相應(yīng)的聲道解碼經(jīng)熵編碼的主信息,以為每一聲道中的每個頻段生成一組被量化的頻譜系數(shù)。每組被量化的頻譜系數(shù)由固定長度的字組成,即對每個臨界頻帶中的頻譜系數(shù)用相同數(shù)目的比特進行量化。由于加到原始數(shù)字聲音信號上的耦合處理,所以,只有聲道CH1的熵解碼器在三個頻段的每一個當(dāng)中產(chǎn)生一組經(jīng)量化的頻譜系數(shù)。聲道CH2到CHn的熵解碼器1312到131n每個只為低和中頻帶生成一組經(jīng)量化的頻譜系數(shù)。
輔助信息擴展器1041到104n為每條聲道擴展從乘法器141接收到的被壓縮的輔助信息,并且將為每條聲道的每個頻段所產(chǎn)生的輔助信息送到第一級擴展器120的擴展器1021到102n相應(yīng)的一個之中。例如,輔助信息擴展器1041將聲道CH1的三個頻帶的輔助信息送到聲道CH1的擴展器1021的輸入端123、125和127上。同樣,由于對原始數(shù)字信號的耦合處理,聲道CH2到CHn的輔助信息解碼器1042到104n只將低頻段和中頻段的輔助信息提供給相應(yīng)的擴展器1022到102n。
第二級擴展器130將每條聲道的每個頻帶的一組經(jīng)量化的頻譜系數(shù)送給第一級擴展器120的輸入端。例如,聲道CH1的熵解碼器1311將聲道CH1的三個頻段中每一個的一組經(jīng)量化的頻譜系數(shù)送給第一級擴展器120中的擴展器1021的端子122、124和126。
下面將描述第一級擴展器120中聲道CH1的擴展器1021。聲道CH2到CHn的擴展器1022到102n也一樣,除了它們沒有高頻帶解量化器116和反向MDCT電路113,也可能沒有反向正交鏡像電路111。
解量化電路116、117、118采用相應(yīng)的字長度信息釋放加在相應(yīng)頻帶內(nèi)一組經(jīng)量化的頻譜系數(shù)上的自適應(yīng)比特分配。產(chǎn)生的每一頻帶中均勻量化的頻譜系數(shù)被送到相應(yīng)的一個反向正交變換電路113、114和115上。
反向正交變換電路IMDCT電路113、114、115,是較好的反向MDCT電路,它們對相應(yīng)頻帶內(nèi)的一組經(jīng)均勻量化的頻譜系數(shù)進行反向正交變換,以在相應(yīng)頻帶中生成時域信號塊。在進行反向MDCT的過程中,加在頻譜系數(shù)上的塊自動定位被釋放。反向量化鏡像濾波器(IQMF)電路112和111將相應(yīng)頻帶中的時域信號組合成全頻域數(shù)字聲音信號,它被送到輸出端110。
如果不對送到圖1所示的多聲道信號壓縮器中的第一級壓縮系統(tǒng)1的數(shù)字聲音信號進行耦合,那么擴展器1022到102n也必須每個都包括解量化器116,IMDCT電路113,和IQMF 111,來處理每個聲道的高頻段。
如果對數(shù)字聲音信號進行了耦合,最好由聲道CH1處理中心聲道,這樣就由中心揚聲器重放高頻段信號?;蛘?,IQMF 111也能被包括在多于聲道CH1的聲道中。在包括IQMF 111的聲道中,IQMF 111將被用于合成來自聲道CH1IMDCT 113輸出的組合高頻段時域信號和來自本聲道IQMF 112輸出的較低頻時域信號。這樣,就從多于一個的揚聲器重放組合的高頻段信號。
以上描述是參考八聲道音響系統(tǒng)進行的。但是,這里描述的設(shè)備是模塊化的,它能用于處理具有多于2的任何數(shù)目聲道的多聲道音響系統(tǒng)中的聲音信號。
盡管這里已詳細描述了本發(fā)明的說明性實施例,但是應(yīng)當(dāng)理解,本發(fā)明不限于所描述的具體實施例,可以在所附權(quán)利要求所定義的發(fā)明范圍內(nèi)進行各種修正。
權(quán)利要求
1.在多聲道音響系統(tǒng)的相應(yīng)聲道中壓縮數(shù)字聲音信號的多聲道信號壓縮器,該裝置包括第一級壓縮系統(tǒng),包括耦合設(shè)備,用于進行至少兩條聲道的數(shù)字聲音信號之間的耦合,以為每個聲道生成一個經(jīng)過耦合處理的信號,以及從該耦合設(shè)備接收經(jīng)耦合處理的信號的壓縮器設(shè)備,用于將每個耦合信號按頻率劃分成相應(yīng)頻帶中的頻帶信號;以及壓縮通過劃分每個經(jīng)過耦合處理的信號所得到的頻帶信號,以生成第一級經(jīng)壓縮信號;第二級壓縮系統(tǒng)包括判定設(shè)備,從第一級壓縮系統(tǒng)為每條聲道接收第一級壓縮的信號,根據(jù)每條聲道的第一級壓縮信號確定每條聲道的能量,聲道比特分配判定設(shè)備,它響應(yīng)判定設(shè)備進行操作,用于在聲道之間分配預(yù)定數(shù)目的比特,以為每條聲道分配一定數(shù)目的比特,用于進一步為每條聲道壓縮第一級壓縮信號的輔助壓縮器設(shè)備,壓縮器設(shè)備利用由聲道比特分配設(shè)備為每條聲道分配的比特數(shù)進行壓縮。
2.權(quán)利要求1的多聲道信號壓縮器,其中耦合設(shè)備至少在起碼兩條聲道的數(shù)字聲音信號的高頻帶部分之間進行耦合。
3.權(quán)利要求2的多聲道信號壓縮器,其中耦合設(shè)備從至少兩條聲道的數(shù)字聲音信號的高頻率部分生成耦合信號;壓縮器設(shè)備將耦合信號作為一個經(jīng)過耦合處理信號的高頻段部分來進行壓縮。
4.權(quán)利要求3的多聲道信號壓縮器,其中耦合設(shè)備在其間進行耦合的至少一個數(shù)字聲音信號包括一個較低頻帶部分,這部分不被耦合設(shè)備耦合;壓縮器設(shè)備壓縮至少一個數(shù)字聲音信號的較低頻段部分。
5.權(quán)利要求2的多聲道信號壓縮器,其中數(shù)字聲音信號的高頻帶部分有至少3KHz的最低頻率。
6.權(quán)利要求1的多聲道信號壓縮器,其中第一級壓縮信號包括固定長度的碼字;附加壓縮器設(shè)備包括可變長度編碼設(shè)備,用于將第一級壓縮信號的固定長度碼字轉(zhuǎn)換成可變長度碼,這樣較經(jīng)常地出現(xiàn)的固定長度碼字被轉(zhuǎn)換成具有較短字長度的可變碼字。
7.在多聲道音響系統(tǒng)的相應(yīng)聲道中,用于壓縮數(shù)字聲音信號的方法,該方法包括步驟在至少兩條聲道中的數(shù)字聲音信號之間進行耦合,以為每條聲道生成一個經(jīng)過耦合處理的信號;將經(jīng)過耦合處理的信號按頻率劃分成相應(yīng)頻帶內(nèi)的頻帶信號;將通過劃分每個經(jīng)過耦合處理的信號所得到的頻帶信號進行壓縮,以生成第一級壓縮信號;從每一聲道的第一級壓縮信號判定每一聲道的能量;響應(yīng)在判定步驟所確定的每一聲道的能量,在聲道之間分配預(yù)定數(shù)目的比特,以給每一聲道分配一些比特;并且利用通過分配步驟為每條聲道分配的比特數(shù),進一步為每一聲道壓縮第一級壓縮信號。
8.權(quán)利要求7的方法,其中,在進行耦合的步驟中,至少在起碼兩條聲道中的數(shù)字聲音信號的高頻帶部分進行耦合。
9.權(quán)利要求8的方法,其中在進行耦合的步驟中,通過在至少兩條聲道中的數(shù)字聲音信號的高頻帶部分之間進行耦合而生成耦合信號;作為一個經(jīng)過耦合處理的信號的高頻部分,對耦合信號進行頻率劃分和壓縮。
10.權(quán)利要求9的方法,其中,在進行耦合的步驟中,至少兩條聲道中的數(shù)字聲音信號的高頻帶部分有至少3KHz的最低頻率。
11.通過一種用于在多聲道音響系統(tǒng)的相應(yīng)聲道中的壓縮數(shù)字聲音信號的方法產(chǎn)生的信號被錄在一種錄音媒體上,該方法包括步驟在至少兩條聲道的數(shù)字聲音信號之間進行耦合,為每條聲道產(chǎn)生一個經(jīng)過耦合處理的信號;將經(jīng)過耦合處理的信號按頻率劃分成相應(yīng)頻帶中的頻帶信號;壓縮通過劃分每個經(jīng)過耦合處理的信號所得到的頻帶信號,生成第一級壓縮信號;根據(jù)每條聲道的第一級壓縮信號來確定該聲道的能量;根據(jù)判定步驟確定的每一聲道的能量,在聲道之間分配預(yù)定數(shù)目的比特,以給每一聲道分配一些比特;進一步為每一聲道壓縮第一級壓縮信號,以為每一聲道產(chǎn)生一個第二級壓縮信號,采用由分配步驟分配給每一聲道的比特數(shù),為每一聲道壓縮該聲道的第一級壓縮信號;復(fù)用所有聲道的第二級壓縮信號,以提供一個比特流;將比特流送到錄音傳輸媒體上。
12.權(quán)利要求11的錄音媒體,包括一光盤。
13.通過傳輸媒體在多聲道音響系統(tǒng)的相應(yīng)聲道中傳輸數(shù)字聲音信號的方法,該方法包括步驟在至少兩條聲道的數(shù)字聲音信號之間進行耦合,為每一聲道產(chǎn)生一個經(jīng)過耦合處理的信號;將經(jīng)過耦合處理的信號按頻率劃分成相應(yīng)頻帶中的頻帶信號;壓縮通過劃分每個經(jīng)過耦合處理的信號所獲得的頻帶信號,以生成第一級壓縮信號;從每一聲道的第一級壓縮信號判定該聲道的能量;響應(yīng)由判定步驟為每一聲道所確定的能量,在聲道之間分配預(yù)定數(shù)目的比特,以為每一聲道分配一些比特;為每一聲道進一步壓縮第一級壓縮信號,以為每一聲道產(chǎn)生第二級壓縮信號,采用由分配步驟分配給每一聲道的比特數(shù),為每一聲道壓縮該聲道的第一級壓縮信號;復(fù)用所有聲道的第二級壓縮信號,以提供一比特流;將比特流送到傳輸媒體上。
14.用于擴展代表多聲道音響系統(tǒng)相應(yīng)聲道中數(shù)字聲音信號的被壓縮信號的多聲道信號擴展器,在壓縮之前,至少兩聲道中的數(shù)字聲音信號已經(jīng)經(jīng)過耦合,被壓縮的信號包括代表至少兩聲道的數(shù)字聲音信號的主信息和輔助信息,該裝置包括用于分解被壓縮信號,以提取主信息和輔助信息的去復(fù)用設(shè)備;通過把可變長度碼轉(zhuǎn)變成固定長度碼,擴展來自去復(fù)用設(shè)備的主信息的第二級擴展器設(shè)備;響應(yīng)來自去復(fù)用設(shè)備的輔助信息進行操作的第一級擴展器設(shè)備,用于進一步擴展來自第二級擴展器設(shè)備的固定長度碼,以在至少兩條聲道的每一條中提供一再生數(shù)字聲音信號;其中盡管至少兩條聲道之一中的數(shù)字聲音信號和至少兩條聲道的另一聲道中的數(shù)字聲音信號一般有相同的帶寬,至少兩條聲道的一條中第一級擴展器設(shè)備對其進行操作的某些固定長度碼比至少兩條聲道的另一條中第一級擴展器設(shè)備對其進行操作的某些固定長度碼代表更窄的帶寬。
15.權(quán)利要求14的多聲道信號擴展器,其中主信息包括涉及至少兩條聲道中每一條的多個頻段的信息;第一級擴展器設(shè)備包括用于在每個頻帶內(nèi)為至少兩條聲道的另一條重新構(gòu)造時域信號的設(shè)備,用于在頻段內(nèi)為至少兩條聲道的每一條合成時域信號,以為至少兩條聲道中的每一條生成再生數(shù)字聲音信號的設(shè)備。
16.用于擴展代表多聲道音響系統(tǒng)相應(yīng)聲道中數(shù)字聲音信號的被壓縮信號的方法,至少兩條聲道中的數(shù)字聲音信號在經(jīng)壓縮之前已被耦合,被壓縮的信號包括代表至少兩條聲道的數(shù)字聲音信號的主信息和輔助信息,該方法包括步驟多路分解被壓縮信號,以提取主信息和輔助信息;通過將主信息的可變長度碼轉(zhuǎn)換成固定長度碼,擴展在去復(fù)用步驟從被壓縮信號中所提取的主信息;用在去復(fù)用步驟從被壓縮信號中所提取的輔助信息,進一步擴展通過轉(zhuǎn)換主信息的可變長度碼所得到的固定長度碼,以在至少兩條聲道的每一條中產(chǎn)生再生數(shù)字聲音信號;其中盡管至少兩條聲道之一中的數(shù)字聲音信號與至少兩條聲道的另一條中的數(shù)字聲音信號通常有相同的帶寬,在至少兩條聲道之一中對其進行進一步擴展操作的某些固定長度碼比在至少兩條聲道的另一條中對其進一步擴展操作的某些固定長度碼代表更窄的帶寬。
17.權(quán)利要求16的方法,其中主信息包括關(guān)于至少兩條聲道中的每一條的多個頻帶的信息并且其中進一步的擴展包括步驟處理一些固定長度碼,以在至少兩條聲道的每一條的每一頻帶重新構(gòu)造時域信號,為至少兩條聲道的每一條在頻帶合成時域信號,以為兩條聲道中的每一條產(chǎn)生再生數(shù)字聲音信號。
18.在多聲道音響系統(tǒng)的相應(yīng)聲道中,用于壓縮數(shù)字聲音信號的多聲道信號壓縮器,該裝置包括第一級壓縮器設(shè)備,用于接收相應(yīng)聲道的數(shù)字聲音信號和壓縮數(shù)字聲音信號,以提供相應(yīng)的第一級壓縮信號;第二級壓縮器設(shè)備,用于從第一級壓縮器設(shè)備接收第一級壓縮信號;根據(jù)相應(yīng)的一個第一級壓縮信號判定每一聲道的能量;響應(yīng)為每一聲道所判定的能量,在聲道之間分配比特,給每一聲道分配一些比特;進一步壓縮第一級壓縮信號,以提供相應(yīng)的第二級壓縮信號,每一聲道中的第二級壓縮信號利用分配給一條聲道的比特數(shù)。
全文摘要
在多聲道音響系統(tǒng)的相應(yīng)聲道中,壓縮數(shù)字聲音信號的多聲道信號壓縮器。該裝置包括第一級壓縮系統(tǒng)和第二級壓縮系統(tǒng)。在第一級壓縮系統(tǒng)中,耦合電路進行至少兩條聲道的數(shù)字聲音信號之間的耦合,以為第一聲道生成一個經(jīng)過耦合處理的信號。壓縮器電路從耦合電路接收經(jīng)過耦合處理的信號,并將每個經(jīng)過耦合處理的信號按頻率劃分成相應(yīng)頻帶中的頻帶信號,并壓縮通過劃分每一經(jīng)過耦合處理的信號所得到的頻帶信號,以生成第一級壓縮信號。在第二級壓縮系統(tǒng)中,判決電路從第一級壓縮系統(tǒng)為每一聲道接收第一級壓縮信號,并且從相應(yīng)聲道的第一級壓縮信號判定每一聲道的能量。聲道比特分配判決電路響應(yīng)判決電路進行操作,在聲道之間分配預(yù)定數(shù)目的比特給每一聲道。最后,輔助壓縮器采用由比特分配判決電路分配給相應(yīng)聲道的比特數(shù),進一步壓縮每一聲道的第一級壓縮信號。
文檔編號G10L19/008GK1119902SQ94191534
公開日1996年4月3日 申請日期1994年12月7日 優(yōu)先權(quán)日1993年12月7日
發(fā)明者赤桐健三, M·F·戴維斯, C·C·托德, Rim·多爾比 申請人:索尼公司, 杜比實驗室許可公司