參量多聲道解碼的制作方法

文檔序號：2830100閱讀：349來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：：參量多聲道解碼的制作方法參量多聲道解碼發(fā)明領(lǐng)域本發(fā)明涉及參量多聲道解碼器，比如立體聲解碼器。更具體的說，本發(fā)明涉及用于合成聲音的一種設(shè)備和方法，該聲音由多組參數(shù)表示，每組參數(shù)包括正弦參數(shù)和其它參數(shù)，其中，正弦參數(shù)表示聲音的正弦分量，而其它參數(shù)表示聲音的其它分量。
背景技術(shù)：
：用多組參數(shù)表示聲音是眾所周知的方法。所謂的參量編碼(ParametricCoding)技術(shù)用于對聲音進(jìn)行高效的編碼，用一系列參數(shù)來表示聲音。適當(dāng)?shù)慕獯a器能夠利用這些參數(shù)大致地重新構(gòu)造出原始聲音?？梢詫⑦@一系列參數(shù)劃分成多組，每組對應(yīng)于一個單獨的聲源(聲道)，如一個(人)揚聲器或一件樂器。最常見的MIDI(樂器數(shù)字接口)協(xié)議允許由樂器的多組指令來表示音樂。將每個指令分配給一個特定的樂器。每個樂器可以使用一個或多個聲道(在MIDI中稱作"聲音")?？梢酝瑫r使用的聲道數(shù)量稱作復(fù)調(diào)數(shù)量或者復(fù)調(diào)。MIDI指令可以高效地傳輸和/或存儲。合成器通常包含聲音定義數(shù)據(jù)，例如聲音帶或音色數(shù)據(jù)。在聲音帶中，將樂器的聲音抽樣作為聲音數(shù)據(jù)存儲，而音色數(shù)據(jù)則定義了聲音產(chǎn)生器的控制參數(shù)。MIDI指令使得合成器能夠從聲音帶得到聲音數(shù)據(jù)，并且合成出該數(shù)據(jù)所表示的聲音。這些聲音數(shù)據(jù)可以是實際的聲音抽樣，也就是數(shù)字化的聲音(波形)，如在通常的波表合成的情況下。但是，聲音抽樣通常需要大量的存儲空間，這在相對較小的設(shè)備，尤其是手持用戶設(shè)備(如移動蜂窩電話)中是不可行的。作為替代，可以用參數(shù)表示聲音抽樣，該參數(shù)可以包括幅度、頻率、相位和/或包絡(luò)形狀參數(shù)，并且可以使該聲音抽樣得以重新構(gòu)造。與存儲實際的聲音抽樣相比，存儲聲音抽樣的這些參數(shù)通常需要少得多的存儲空間。但是，聲音的合成可能會是相當(dāng)繁重的任務(wù)。尤其是在表示不同聲道(在MIDI中是"聲音")的多組參數(shù)需要同時合成(復(fù)調(diào)等級較高)的情況下。該繁重的負(fù)擔(dān)通常隨著需要合成的聲道("聲音")的數(shù)量(也就是復(fù)調(diào)的等級)的增長而呈線性增長。這使得很難在手持設(shè)備中采用這種技術(shù)。2004年5月在柏林(德國)出版的6073號AudioEngineeringSocietyConventionPaper中，由E.Schuijers、J.Breebaart、H.Pumhagen禾口J.Engdegard發(fā)表的論文"LowComplexityParametricStereoCoding"中提出了一種參量音頻解碼器(圖8)。將音頻信號分解為由參數(shù)分別表示的瞬態(tài)量、正弦分量和噪聲分量。該音頻信號的參數(shù)表示可以存儲在聲音帶中。參量解碼器(或合成器)利用這一參數(shù)表示來重新構(gòu)造原始的音頻輸入。在現(xiàn)有技術(shù)的參量編碼器中，對正弦量、瞬態(tài)量和噪聲進(jìn)行定向處理立體聲參數(shù)用于從一個單獨的聲道構(gòu)造兩條輸出聲道(立體聲系統(tǒng)中的左聲道和右聲道)。這一定向處理是在變換域中執(zhí)行的，如頻域或QMF(正交鏡像濾波器)域，這樣就可以大大提高定向處理的效率。但是，為了在變換域執(zhí)行正弦量、瞬態(tài)量和噪聲的定向處理，需要在變換域中合成這些聲音分量。已經(jīng)發(fā)現(xiàn)這會嚴(yán)重增大聲音合成的復(fù)雜度。本發(fā)明的發(fā)明者已經(jīng)意識到在頻域或QMF域合成聲音所付出的計算成本是由于在變換域中合成瞬態(tài)量和噪聲效率很低造成的，并且這會嚴(yán)重增大聲音合成的復(fù)雜度。
發(fā)明內(nèi)容本發(fā)明的一個目的就是克服當(dāng)前技術(shù)的這些及其它問題，并且提供一種設(shè)備用于產(chǎn)生由多組參數(shù)表示的聲音，使得聲音的合成大大簡化。因此，本發(fā)明提供一種設(shè)備用于產(chǎn)生由多組參數(shù)表示的聲音，每組參數(shù)包括正弦參數(shù)和附加參數(shù)，其中，正弦參數(shù)表示聲音的正弦分量，其它參數(shù)表示聲音的其它分量，該設(shè)備包括-第一正弦分量產(chǎn)生單元，僅產(chǎn)生第一輸出聲道的正弦分量，第二正弦分量產(chǎn)生單元，僅產(chǎn)生第二輸出聲道的正弦分量，至少一個附加分量產(chǎn)生單元，產(chǎn)生所述第一輸出聲道和第二輸出聲道的附加分量，以及第一組合單元和第二組合單元，分別把該附加分量與第一輸出聲道和第二輸出聲道的正弦分量組合起來。通過向每個輸出聲道提供不同的正弦分量產(chǎn)生單元，但提供一個共享的附加分量產(chǎn)生單元，可以減少產(chǎn)生單元的數(shù)量，因此就可以降低設(shè)備的復(fù)雜度。在本發(fā)明的設(shè)備中，針對每個聲道分別產(chǎn)生正弦分量，但是該附加分量，如噪聲分量和/或瞬態(tài)量，由這些輸出聲道共用的一個產(chǎn)生單元產(chǎn)生。因此，相比于當(dāng)前技術(shù)中的設(shè)備，本發(fā)明的設(shè)備至少可以減少一個產(chǎn)生單元。本發(fā)明所依據(jù)的洞察點是正弦聲音分量包含最多的方向信息，或者至少是最詳細(xì)的方向信息，而在特定的噪聲分量中包含非常少的方向信息，或者說是非常粗糙的方向信息。這使得同一噪聲分量可以用于兩條(或所有)聲道。在適當(dāng)?shù)慕M合單元中將這些共享噪聲分量(通常而言附加分量)與信道特定的正弦分量組合起來，以產(chǎn)生的輸出聲道既包含指示特定聲道的正弦分量，還包含一般的噪聲分量。在優(yōu)選實施例中，本發(fā)明的設(shè)備還包括兩個附加分量產(chǎn)生單元，分別產(chǎn)生第一類型附加分量和第二類型附加分量，其中，第一類型不同于第二類型，以及，至少一個其它組合單元，將該兩個附加分量產(chǎn)生單元所產(chǎn)生的附加分量組合起來。通過向附加分量提供兩個產(chǎn)生單元，可以向輸出聲道共同提供噪聲和瞬態(tài)量(和/或其它附加分量)。這樣，就可以避免雙份的(或多份的)噪聲產(chǎn)生單元和瞬態(tài)量產(chǎn)生單元。因此，在這個實施例中，最好是讓第一附加分量產(chǎn)生單元產(chǎn)生瞬態(tài)量，讓第二附加分量產(chǎn)生單元產(chǎn)生噪聲分量。優(yōu)選情況下，該設(shè)備還包括第一和第二加權(quán)單元用于對附加分量進(jìn)行加權(quán)。這使得共同附加分量的等級在每個輸出聲道都是可變的，因此產(chǎn)生更真實的聲音。在特別有利的實施例中，該正弦分量產(chǎn)生單元是變換域產(chǎn)生單元，而該附加分量產(chǎn)生單元是時域產(chǎn)生單元。因此，在這個實施例中，在變換域(如，頻域)只合成正弦分量，可以非常高效地進(jìn)行該合成。附加分量，如噪聲分量和瞬態(tài)量分量，在時域合成，因此可以避免在變換域低地合成這些分量。這樣就能大大降低復(fù)雜度。優(yōu)選情況下，這一特別有利的實施例還包括變換單元，用于將正弦參數(shù)變換到變換域；方向控制單元，用于將方向信息添加到變換后的正弦參數(shù)，以產(chǎn)生所述第一輸出聲道和第二輸出聲道。這一優(yōu)選實施例特別適合用作參量解碼器。在另一個有利的實施例中，該產(chǎn)生單元用于接收多組參數(shù)，這多組參數(shù)與不同的輸入聲道相關(guān)聯(lián)。這一實施例特別適合用作合成器，比如MIDI合成器。雖然上面只是參照兩個輸出聲道的情況對本發(fā)明進(jìn)行了討論，但本發(fā)明并不僅限于此。更具體的說，本發(fā)明的設(shè)備可以用于產(chǎn)生至少三個輸出聲道，優(yōu)選為產(chǎn)生六個輸出聲道。需要理解的是，六個輸出聲道可以用于所謂的5.1聲音系統(tǒng)中，該系統(tǒng)包括五個常規(guī)聲音輸出聲道(左前、左后、右前、右后和中間)，再加上一個子低音擴(kuò)音器用于產(chǎn)生低音。當(dāng)本發(fā)明的設(shè)備用于三個或更多個輸出聲道時，它有至少三個正弦分量產(chǎn)生單元，以及少于三個的附加分量產(chǎn)生單元。更優(yōu)選的是，該設(shè)備還針對每個附加分量類型，有一個共享附加分量產(chǎn)生單元，所述的附加分量類型是，比如噪聲或瞬態(tài)量。如上所述，本發(fā)明的設(shè)備可以最好是MIDI合成器或參量聲音解碼器，比如參量立體聲或多聲道解碼器。聲音系統(tǒng)最好包括如上所定義的設(shè)備。該聲音系統(tǒng)可以是包括擴(kuò)音器和喇叭或類似的轉(zhuǎn)換器的用戶聲音系統(tǒng)。其它聲音系統(tǒng)可以包括樂器、電話設(shè)備(如移動蜂窩電話)、便攜式音頻播放器(如MP3和AAC播放器)、計算機(jī)聲音系統(tǒng)等等。本發(fā)明還提供一種方法用于產(chǎn)生由多組參數(shù)所表示的聲音，每組參數(shù)包括正弦參數(shù)和附加參數(shù)，其中正弦參數(shù)表示聲音的正弦分量，附加參數(shù)表示聲音的附加分量，該方法包括的步驟有只產(chǎn)生第一聲道的正弦聲音分量，只產(chǎn)生第二聲道的正弦聲音分量，產(chǎn)生該第一聲道和第二聲道的附加聲音分量，以及分別將該附加聲音分量與該第一聲道的正弦分量和第二聲道的正弦分量組合起來。這種方法具有與如上所定義的設(shè)備相同的優(yōu)點，其中，第一聲道的正弦聲音分量、第二聲道的正弦聲音分量和這兩個聲道的附加聲音分量是在不同的步驟中處理的。本發(fā)明的方法最好還可以包括附加步驟產(chǎn)生第一類型附加分量和第二類型附加分量，其中第一類型不同于第二類型，以及將這兩種類型的附加分量組合起來。在一個典型的實施例中，該第一類型附加分量包括瞬態(tài)量，而該第二類型附加分量包括噪聲。該方法還可以包括一個步驟對附加分量進(jìn)行加權(quán)，最好是在將這些附加分量與各(輸出)聲道進(jìn)行組合之前進(jìn)行。在依照本發(fā)明的方法的特別有利的實施例中，正弦分量在變換域產(chǎn)生，而附加分量在時域產(chǎn)生。這大大降低了本發(fā)明方法的復(fù)雜度和所付出的計算成本。本發(fā)明的方法還可以包括步驟將正弦參數(shù)變換到變換域，以及將方向信息添加到變換后的正弦參數(shù)，以產(chǎn)生第一輸出聲道和第二輸出聲道。通過添加方向信息，如立體聲信息，可以從正弦參數(shù)的一個聲源構(gòu)造出兩條或更多條輸出聲道。通過添加方向信息以及在變換域處理該方向信息，可以高效地生成各個輸出聲道。此外，本發(fā)明還提供一種計算機(jī)程序產(chǎn)品用于執(zhí)行上述定義的方法。該計算機(jī)程序產(chǎn)品可以包括一組存儲在數(shù)據(jù)載體(如CD或DVD)上的計算機(jī)可執(zhí)行指令。該組計算機(jī)可執(zhí)行指令使得可編程計算機(jī)能夠執(zhí)行上面所定義的方法，也可以從遠(yuǎn)程服務(wù)器下載，比如通過互聯(lián)網(wǎng)。以下將參照附圖中所解釋的示例實施例對本發(fā)明作進(jìn)一步解釋，其中圖1示出了依照當(dāng)前技術(shù)的參量立體聲解碼器；圖2示出了依照本發(fā)明的參量立體聲解碼器；圖3示出了依照當(dāng)前技術(shù)的參量立體聲合成器；圖4示出了依照本發(fā)明的參量立體聲合成器。具體實施方式圖i以舉例形式所示出的依照當(dāng)前技術(shù)的立體聲參量解碼器r，包括正弦量信源11、瞬態(tài)量信源12和噪聲源13、組合單元14、QMF分析(QMFA)單元15、參量立體聲(PS)單元16、第一QMF合成(QMFS)單元17和第二QMF合成(QMFS)單元18。該正弦量信源11、瞬態(tài)量信源12和噪聲源13分別產(chǎn)生正弦參數(shù)(SP)、瞬態(tài)參數(shù)(TP)和噪聲參數(shù)(NP)，并且將這些參數(shù)饋入組合單元(加法器)14。這些參數(shù)可以是已經(jīng)存儲在信源11、12和13中的，或者通過這些信源來提供的，比如來自多路信號分離器。組合單元14將組合后的參數(shù)饋入QMF分析(QMFA)單元15。這一QMF分析單元15將參數(shù)從時域變換到QMF(正交鏡像過濾器)域，也就是等同于頻域。該QMF分析單元15可以包括一個或多個QMF濾波器，但是也可以由一個濾波器組和一個或多個FFT(快速傅立葉變換)單元組成。然后由參量立體聲(PS)單元16來處理剛得到的QMF域(或頻域)參數(shù)，該參量立體聲(PS)單元16還接收包含有立體聲信息的參量立體聲信號PSS。利用該立體聲信息，參量立體聲單元產(chǎn)生一組左(QMF域)參數(shù)和一組右(QMF域)參數(shù)，將它們饋入左QMF合成(QMFS)單元17和右QMF合成(QMFS)單元18。該QMF合成單元17和18將這些組QMF域參數(shù)變換到時域，這樣就分別產(chǎn)生左信號L和右信號R。雖然圖i的方案r可以很好地工作，但它牽涉很大的計算量。尤其是在QMF(頻)域的合成非常復(fù)雜，因此效率很低。因此，這一合成所需要的電路非常昂貴，但處理速度還是相對較慢。本發(fā)明的發(fā)明者已經(jīng)意識到，在頻域或QMF域合成聲音所牽涉的計算量，是由于瞬態(tài)量和噪聲非常難以高效合成所造成的。相比而言，在頻域或QMF域合成正弦分量可以高效進(jìn)行。由于在參量解碼器中，正弦參數(shù)以及瞬態(tài)參數(shù)和噪聲參數(shù)中的至少一個是可用的，所以可以根據(jù)參數(shù)類型進(jìn)行分別合成。因此，在本發(fā)明的解碼器中，正弦分量是在頻域或其等同體(如，QMF)中合成的，而其它分量是在其它域合成的，最好是在時域。圖2舉例說明了依照本發(fā)明的解碼器的一個優(yōu)選實施例。僅僅通過圖2中非限制性的例子舉例說明的依照本發(fā)明的參量立體聲解碼器1，也包括正弦量信源11、瞬態(tài)量信源12和噪聲源13。解碼器1還包括參量立體聲(PS)單元16、第一QMF合成(QMFS)單元17和第二QMF合成(QMFS)單元18、QMF分析(QMFA)單元19、第一時域合成(TDS)單元20、第二時域合成(TDS)單元21、增益計算(GC)單元22、第一乘法單元23、第一組合單元24、第二乘法單元25、第二組合單元26和第三組合單元27。正弦量信源11、瞬態(tài)量信源12和噪聲源13分別產(chǎn)生正弦參數(shù)(SP)、瞬態(tài)參數(shù)(TP)和噪聲參數(shù)(NP)。這些參數(shù)可以是已經(jīng)存儲在信源ll、12和13中的，或者通過這些信源來提供，比如從多路信號分離器。依照本發(fā)明，只將正弦參數(shù)(SP)饋入QMF分析(QMFA)單元19。該QMF分析單元19,與圖1中的QMFA單元15基本上相對應(yīng)，將這些參數(shù)從時域變換到QMF(正交鏡像過濾器)域，該QMF域基本等價于頻域。該QMF分析單元19可以包括一個或多個已知的QMF濾波器，但是也可以由已知的一個濾波器組和一個或多個FFT(快速傅立葉變換)單元來組成。然后，由參量立體聲(PS)單元16處理剛得到的QMF域(或頻域)參數(shù)，該參量立體聲(PS)單元16還接收包含立體聲信息的參量立體聲信號PSS。利用該立體聲信息，參量立體聲單元16產(chǎn)生一組左(QMF域)參數(shù)和一組右(QMF域)參數(shù)，分別將這兩組參數(shù)饋入左QMF合成(QMFS)單元17和右QMF合成(QMFS)單元18。QMF合成單元17和18將這些組QMF域參數(shù)變換到時域，然后將這些變換后的參數(shù)分別饋入第一組合單元24和第二組合單元26。在所示的實施例中，組合單元24和26由加法器組成，但是本發(fā)明并不僅限于此，也可以預(yù)料到其它組合單元，包括加權(quán)單元。在本發(fā)明的解碼器中，只將正弦參數(shù)(SP)饋入QMF分析單元(圖2中的19)。依照本發(fā)明，瞬態(tài)參數(shù)(TP)和/或噪聲參數(shù)(NP)不饋入QMF分析單元，而是分別饋入時域合成單元20和21。這樣，瞬態(tài)量和噪聲就是在時域而不是在QMF域(通常而言變換域)進(jìn)行合成，這大大簡化了合成處理。時域合成(TDS)單元20和21的技術(shù)結(jié)構(gòu)可以是已知的，并且比如在，2003年3月阿姆斯特丹(荷蘭)出版的5852號AudioEngineeringSocietyConventionPaper中，由W.Oomen、E.Schuijers、B.denBrinker禾卩J.Breebaart發(fā)表的論文"AdvancesinParametricCodingforHigh-QualityAudio"中描述的，該論文的全部內(nèi)容已合并進(jìn)本申請中。在第三組合單元27中對合成后的噪聲和瞬態(tài)量進(jìn)行組合，該實施例中所示的該第三組合單元27也是由加法器組成的。然后，將組合后的噪聲和瞬態(tài)量信號饋入第一乘法器23和第二乘法器25，以便與增益控制單元22產(chǎn)生的依賴于聲道的增益信號相乘。該增益控制(GC)單元22接收參量立體聲信號PSS，并且從該信號中得到適當(dāng)?shù)脑鲆婵刂菩盘枴Ｈ缓?，由組合單元24和26將該增益調(diào)整的瞬態(tài)量和噪聲信號與QMF合成單元17和18輸出的信號進(jìn)行組合，以分別產(chǎn)生左輸出信號L和右輸出信號R。如上所述，在頻域或QMF域分析及合成噪聲和/或瞬態(tài)量通常效率很低并且很復(fù)雜。在本發(fā)明的解碼器中，通過只在QMF域(或頻域)合成正弦分量，而在時域合成瞬態(tài)量和噪聲，來解決這個問題。為了進(jìn)一步簡化該解碼器，并不是針對每個聲道單獨進(jìn)行瞬態(tài)量和噪聲的合成，而是由所有聲道所共享的合成單元(圖2中的20和21)來進(jìn)行。通過增益計算單元22和乘法器23和25(它們決定基于聲道的增益)將依賴于聲道的信息附加到公共瞬態(tài)量和噪聲上。在圖2的實施例中需要注意到的是，瞬態(tài)量和噪聲是在它們的依賴于聲道的增益調(diào)整之前進(jìn)行組合的(在加法器27中)。這樣，就可以把瞬態(tài)量和噪聲的增益一起控制，因此其獨立于信號類型(瞬態(tài)量或噪聲)?？梢约僭O(shè)這樣的實施例，其中，合成后的瞬態(tài)量和噪聲直到它們各自的增益已經(jīng)調(diào)整之后才組合起來。在這樣的實施例中，與增益控制(GC)單元22相連的乘法器可以設(shè)置在時域合成單元20和組合單元27之間以及時域合成單元21和組合單元27之間。需要注意到，瞬態(tài)量信源12或者噪聲源13可以省略掉，在這種情況下，第三組合單元27也可以省略掉。在一個典型的實施例中，至少要有正弦量信源11和噪聲源13，瞬態(tài)量信源12是可選的。雖然已經(jīng)在圖2中示出了立體聲(兩個聲道)解碼器，但本發(fā)明并不僅限于此，并且可以依照本發(fā)明提供有三個或更多個聲道的多聲道解碼器，對于本領(lǐng)域的技術(shù)人員來說，任何必要的改變都是顯而易見的。因此，本發(fā)明還提供比如5.1解碼器。本發(fā)明的解碼器1通常在每個時隙都工作，每個時間分段(時隙或幀)都進(jìn)行分析及合成操作，其中所述幀可以部分地重疊。除了解碼器之外，本發(fā)明還提供合成器用于合成聲音，比如利用來自MIDI流或MIDI文件的控制數(shù)據(jù)。圖3示出了依照當(dāng)前技術(shù)的一種聲音合成器。依照當(dāng)前技術(shù)的聲音合成器2'用于再現(xiàn)兩個"聲音"或聲音輸入聲道V1和V2，每個聲音由一個參數(shù)信源組成。這種類型的合成器，比如在2004年5月在柏林(德國)出版的6063號AudioEngineeringSocietyConventionPaper中，由M.Szczerba、W.Oomen禾卩M.KleinMiddelink發(fā)表的i侖文"ParametricAudioCodingBasedWavetableSynthesis"中有所描述。第一參數(shù)源81(聲音V1)包括瞬態(tài)量信源31、正弦量信源32和噪聲源33，用于分別產(chǎn)生瞬態(tài)參數(shù)(TP)、正弦參數(shù)(SP)和噪聲參數(shù)(NP)，以及一個可選的聲相(Panning)信源34用于產(chǎn)生聲相參數(shù)(PP)。類似的，第二參數(shù)信源82(聲音V2)包括瞬態(tài)量信源35、正弦量信源36和噪聲源37用于分別產(chǎn)生瞬態(tài)參數(shù)(TP)、正弦參數(shù)(SP)和噪聲參數(shù)(PP)，以及一個(可選的)聲相信源38用于產(chǎn)生聲相參數(shù)(PP)。聲音合成器2'還包括第一生成器模塊47和第二生成器模塊48，其中，第一生成器模塊47包括第一瞬態(tài)量生成器(TG)51、第一正弦量生成器(SG)52和第一噪聲生成器(TG)53，第二生成器模塊48包括第二瞬態(tài)量生成器(TG)54、第二正弦量生成器(SG)55和第二噪聲生成器(NG)56。該第一生成器模塊47產(chǎn)生的聲音信號由第一組合單元61組合到第一(左)聲音輸出聲道L中，而第二生成器塊48產(chǎn)生的聲音信號由第二組合單元62組合到第二(右)聲音輸出聲道R中。需要注意到的是，每個聲音輸出聲道L和R包含來自兩個聲音輸入聲道(或者"聲音")VI和V2。還需要注意到的是，圖3中所示的聲音輸入聲道和聲音輸出聲道的數(shù)量只是示例性的，并且可以有多于兩個聲音輸入聲道和/或多于兩個聲音輸出聲道。由一系列加權(quán)單元39-44將這些聲音參數(shù)分配給生成器。第一加權(quán)單元39，舉個例子，與第一瞬態(tài)參數(shù)源31相連接，并且與第一和第二瞬態(tài)量生成器51和54相連接，以便將第一聲音VI的這些瞬態(tài)參數(shù)分配到兩個聲道L和R。該第一加權(quán)單元39可以采用預(yù)定的加權(quán)因數(shù)，比如0.5和0.5，或者0.4和0.6，但是也可以由聲相參數(shù)(PP)來控制，該參數(shù)由第一聲音V1的(可選的)聲相單元34產(chǎn)生。這樣，所有參數(shù)都得以分配到所有生成器。應(yīng)當(dāng)理解的是，圖3中的合成器2'相對比較復(fù)雜，并且當(dāng)添加更多聲音輸入聲道和/或聲音輸出聲道時，它的復(fù)雜度會大大增加。對于所謂的5.1聲音系統(tǒng)來說，需要六個生成器模塊，共計18個生成器。顯然這并不是理想的。圖4中通過非限制性的示例的形式，示出了依照本發(fā)明的合成器。本發(fā)明的合成器2也包括第一參數(shù)信源81和第二參數(shù)信源82。該第一參數(shù)信源81(聲音V1)包括瞬態(tài)量信源31、正弦量信源32和噪聲源33用于分別產(chǎn)生瞬態(tài)參數(shù)(TP)、正弦參數(shù)(SP)和噪聲參數(shù)(PP)，以及一個可選的聲相信源34用于產(chǎn)生聲相參數(shù)(PP)。類似的，第二參數(shù)信源82(聲音V2)包括瞬態(tài)量信源35、正弦量信源36和噪聲源37分別用于產(chǎn)生瞬態(tài)參數(shù)(TP)、正弦參數(shù)(SP)和噪聲參數(shù)(NP)，以及一個(可選的)聲相信源38用于產(chǎn)生聲相參數(shù)(PP)。但是，與當(dāng)前技術(shù)中的合成器2'相比，圖4中所示的本發(fā)明的合成器2沒有多個生成器模塊(圖3中的47和48)。取而代之的，合成器2有兩個正弦生成器(SG)52和55，每個對應(yīng)于一個輸出聲音聲道，如圖3中，但是只有一個單獨的噪聲生成器(NG)58和單獨的瞬態(tài)量生成器(TG)59。將來自瞬態(tài)量信源31和35的瞬態(tài)參數(shù)(TP)饋入該單獨的瞬態(tài)量生成器(TG)59，該生成器產(chǎn)生針對兩條聲道的瞬態(tài)量信號。類似地，將來自噪聲源33和37的噪聲參數(shù)饋入單獨的噪聲生成器(NG)58，該生成器產(chǎn)生針對兩條聲道的噪聲信號。對于每個聲道，另外的組合單元63和65分別用于組合該聲道的噪聲信號和瞬態(tài)量信號。然后，由等級調(diào)整單元64和66分別調(diào)整每個信道的聲音等級，所述調(diào)整單元64和66分別連接在組合單元63和61之間以及組合單元65和62之間。該等級調(diào)整單元64和66可以從聲相控制(PC)單元57接收加權(quán)信號，或者用于施加固定的、預(yù)定的加權(quán)因數(shù)。該(單獨的、可選的)聲相控制(PC)單元57從聲相單元34和38接收聲音VI和V2的聲相參數(shù)(PP)。該單元57將這些聲相參數(shù)轉(zhuǎn)換成適當(dāng)?shù)穆曄嗫刂菩盘?，而這些信號饋入等級調(diào)整(或加權(quán))單元64和66，并饋入正弦生成器52和55以便控制輸出聲音等級，從而確定輸出聲音的方向。比較圖3和圖4時，圖4中的合成器2明顯比圖3中當(dāng)前技術(shù)的合成器2'要簡單。此外，本發(fā)明的合成器2可以簡便地進(jìn)行改變以包括更多的輸入聲音聲道和/或輸出聲音聲道，而不會增加該合成器的復(fù)雜度。由于噪聲生成器(NG)和瞬態(tài)量生成器(TG)是在輸出聲道之間共享的，因此它們的數(shù)量不會增加。只有正弦生成器的數(shù)量必需增加，再加上每個輸出聲道相關(guān)聯(lián)的組合和加權(quán)單元。應(yīng)該注意到的是，該聲相參數(shù)(PP)單元34和38、聲相控制單元57和等級調(diào)整單元64和66是可選的，并且本發(fā)明也可以在沒有這些單元的情況下實現(xiàn)。但是，本發(fā)明的優(yōu)選實施例中將有這些單元。還應(yīng)該注意到的是，參數(shù)信源31-38可以是合成器2外部的。換句話說，可以預(yù)料到，依照本發(fā)明的實施例的合成器有輸入端子用于接收瞬態(tài)參數(shù)、正弦參數(shù)、噪聲參數(shù)和/或聲相參數(shù)，然后，這些輸入端子組成信源31-38。在一些實施例中，可以省略瞬態(tài)參數(shù)及合成器的相關(guān)聯(lián)的分量，該合成器只用于產(chǎn)生噪聲和正弦量。在其它實施例中，可以提供多個瞬態(tài)量生成器，而只在輸出聲道之間共享一個噪聲生成器。為了改進(jìn)聲音定位同時在輸出聲道之間共享生成器，可以采用后處理單元，比如濾波器和延遲線。這樣，可以實現(xiàn)改進(jìn)的定向處理(聲相)。這在產(chǎn)生3D(三維)聲音時尤其有優(yōu)勢，其中，定位是通過濾波(通常采用HRTF-頭相關(guān)傳輸函數(shù)-本領(lǐng)域眾所周知的)和映射到有限數(shù)量的聲道上完成的。也可以實行其它后處理操作，比如，增加混響和合聲效果。通過向合成的聲音信號的正弦分量只應(yīng)用混響，可以大大降低合成器的復(fù)雜度，但是幾乎不會感覺到混響效果的降低。如上所述，本發(fā)明的合成器并不僅限于立體聲應(yīng)用，而是還可以用于具有三個或更多個聲道的多聲道應(yīng)用，比如5.1聲音系統(tǒng)。這些參數(shù)的處理更適宜每個時間段執(zhí)行一次，其中，每個參數(shù)定義一個特定時間段(如，幀)的信號類型(噪聲、瞬態(tài)量或正弦量)。本發(fā)明基于的洞察點是，只有正弦分量可以在譜域中高效地合成。本發(fā)明還基于的洞察點是，人耳對于瞬態(tài)量和噪聲信號分量的方向的敏感度要小于對正弦信號分量的方向的敏感度。應(yīng)該注意到的是，本申請中所用到的任何術(shù)語都不應(yīng)解釋成限制本發(fā)明的保護(hù)范圍。具體而言，術(shù)語"包括"并不是指排除掉任何沒有具體說明的單元。專用(電路)單元可以由通用(電路)單元或者其它等同物來取代。對于本領(lǐng)域的技術(shù)人員，應(yīng)該理解的是，本發(fā)明并不限于本申請給出和描述的說明性實施例，在不偏離所附權(quán)利要求的保護(hù)范圍的前提下，可以做出各種修改。權(quán)利要求1、一種用于產(chǎn)生聲音的設(shè)備(1，2)，所述聲音用多組參數(shù)來表示，每組參數(shù)包括正弦參數(shù)(SP)和附加參數(shù)(NP，TP)，所述正弦參數(shù)(SP)表示所述聲音的正弦分量，所述附加參數(shù)(NP，TP)表示所述聲音的附加分量，所述設(shè)備包括第一正弦分量產(chǎn)生單元(17；52)，僅產(chǎn)生第一輸出聲道(L)的正弦分量；第二正弦分量產(chǎn)生單元(18；53)，僅產(chǎn)生第二輸出聲道(R)的正弦分量；至少一個附加分量產(chǎn)生單元(20，21；58，59)，產(chǎn)生所述第一輸出聲道(L)和所述第二輸出聲道(R)的附加分量；第一組合單元(24；62)和第二組合單元(26；62)，分別把所述附加分量同所述第一輸出聲道(L)和所述第二輸出聲道(R)的正弦分量組合起來。2、權(quán)利要求1的設(shè)備，包括-兩個附加分量產(chǎn)生單元(20，21;58，59)，分別產(chǎn)生第一類型的附加分量和第二類型的附加分量，所述第一類型不同于所述第二類型；至少一個其它組合單元(27;63，65)，把這兩個附加分量產(chǎn)生單元所產(chǎn)生的附加分量組合起來。3、權(quán)利要求2的設(shè)備，其中，第一附加分量產(chǎn)生單元(20;59)產(chǎn)生瞬態(tài)量，第二附加分量產(chǎn)生單元(21;58)產(chǎn)生噪聲。4、權(quán)利要求1的設(shè)備，還包括第一和第二加權(quán)單元(23，25;64，66)，對所述附加分量進(jìn)行加權(quán)。5、權(quán)利要求1的設(shè)備，其中，所述正弦分量產(chǎn)生單元(17，18;52，55)是變換域產(chǎn)生單元，其中，所述附加分量產(chǎn)生單元(20，21)是時域產(chǎn)生單元。6、權(quán)利要求5的設(shè)備，還包括變換單元(19)，把正弦參數(shù)(SP)變換到變換域；方向控制單元(16)，向變換后的正弦參數(shù)中添加方向信息(PSS)，從而產(chǎn)生所述第一輸出聲道(L)和所述第二輸出聲道(R)。7、權(quán)利要求1的設(shè)備，其中，所述產(chǎn)生單元(52，55，58，59)接收多組參數(shù)，所述多組參數(shù)與不同的輸入聲道(Vl，V2)相關(guān)聯(lián)。8、權(quán)利要求1的設(shè)備，產(chǎn)生至少三個輸出聲道，優(yōu)選為六個輸出聲道。9、權(quán)利要求1的設(shè)備，它是MIDI合成器。10、權(quán)利要求1的設(shè)備，它是參量聲音解碼器。11、一種聲音系統(tǒng)，包括權(quán)利要求l的設(shè)備(1，2)。12、一種用于產(chǎn)生聲音的方法，所述聲音用多組參數(shù)來表示，每組參數(shù)包括正弦參數(shù)(SP)和附加參數(shù)(NP，TP)，所述正弦參數(shù)(SP)表示所述聲音的正弦分量，所述附加參數(shù)(NP，TP)表示所述聲音的附加分量，所述方法包括下列步驟僅產(chǎn)生第一聲道(L)的正弦聲音分量；僅產(chǎn)生第二聲道(R)的正弦聲音分量；產(chǎn)生所述第一聲道(L)和所述第二聲道(R)的附加聲音分量；分別把所述附加聲音分量同所述第一聲道(L)和所述第二聲道(R)的正弦分量組合起來。13、權(quán)利要求12的方法，包括下列附加步驟分別產(chǎn)生第一類型的附加分量和第二類型的附加分量，所述第一類型不同于所述第二類型；把這兩種類型的附加分量組合起來。14、權(quán)利要求13的方法，其中，所述第一類型的附加分量包括瞬態(tài)量，所述第二類型的附加分量包括噪聲。15、權(quán)利要求12的方法，還包括下列步驟對所述附加分量進(jìn)行加權(quán)。16、權(quán)利要求12的方法，其中，所述正弦分量是在變換域中產(chǎn)生的，其中，所述附加分量是在時域中產(chǎn)生的。17、權(quán)利要求16的方法，還包括下列步驟把正弦參數(shù)(SP)變換到變換域；向變換后的正弦參數(shù)中添加方向信息(PSS)，從而產(chǎn)生所述第一輸出聲道(L)和所述第二輸出聲道(R)。18、一種計算機(jī)程序產(chǎn)品，執(zhí)行權(quán)利要求12的方法。全文摘要聲音解碼設(shè)備(1)對聲音進(jìn)行解碼，聲音用多組參數(shù)來表示，每組參數(shù)包括正弦參數(shù)(SP)和其它參數(shù)(NP，TP)，正弦參數(shù)(SP)表示聲音的正弦分量，其它參數(shù)(NP，TP)表示聲音的其它分量，如噪聲和/或瞬態(tài)量。該設(shè)備包括分別對應(yīng)于各輸出聲道(L，R)的正弦產(chǎn)生器單元(17，18)，而其它分量產(chǎn)生器(20；21)則由這些聲道共享。文檔編號G10L19/00GK101213592SQ200680024354公開日2008年7月2日申請日期2006年7月3日優(yōu)先權(quán)日2005年7月6日發(fā)明者A·J·赫里茨,D·E·M·泰爾桑,M·什切爾巴,M·克萊因·米德林克申請人:皇家飛利浦電子股份有限公司

完整全部詳細(xì)技術(shù)資料下載