聲音合成的制作方法

文檔序號(hào)：2830006閱讀：1402來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：：聲音合成的制作方法聲音合成本發(fā)明涉及聲音的合成。更具體地，本發(fā)明涉及一種合成聲音的設(shè)備和方法，其中聲音由參數(shù)集表示，每個(gè)集合包括表示聲音的噪聲分量的噪聲參數(shù)和表示其他分量的其他參數(shù)。用參數(shù)集表示聲音是眾所周知的。所謂的參數(shù)編碼技術(shù)被用于高效地編碼聲音，用一系列參數(shù)表示聲音。合適的解碼器能夠利用這一系列參數(shù)充分地重建原始聲音。這一系列參數(shù)可被劃分為集合，每個(gè)集合對(duì)應(yīng)于個(gè)別的聲音源(聲道)，諸如(人)說(shuō)話者或樂(lè)器。流行的MIDI(樂(lè)器數(shù)字接口)協(xié)議允許音樂(lè)通過(guò)樂(lè)器指令的集合表示。將每個(gè)指令分配給特定樂(lè)器。每個(gè)指令能夠利用一個(gè)或更多聲道(在MIDI中稱作"聲部(voices)，，)。將可以同時(shí)使用的聲道數(shù)目稱作復(fù)調(diào)級(jí)(polyphonylevel)或復(fù)調(diào)(polyphony)。MIDI指令可被高效傳輸和/或存儲(chǔ)。合成器通常包括聲音定義數(shù)據(jù)，例如聲音庫(kù)(soundbank)或音色(patch)數(shù)據(jù)。在聲音庫(kù)中，樂(lè)器聲音的樣本被存儲(chǔ)為聲音數(shù)據(jù)，而音色數(shù)據(jù)為聲音發(fā)生器定義控制參數(shù)。MIDI指令使合成器從聲音庫(kù)中檢索聲音數(shù)據(jù)，并合成由該數(shù)據(jù)表示的聲音。正如普通的波表(wavetable)合成一樣，這些聲音數(shù)據(jù)可以是實(shí)際的聲音樣本，是數(shù)字化的聲音(波形)。然而，聲音樣本通常需要大量存儲(chǔ)器，這在相對(duì)較小的設(shè)備中是不可行的，特別是在諸如移動(dòng)(蜂窩)電話的手持用戶設(shè)備中?？商鎿Q地，聲音樣本可以由包括振幅、頻率、相位和/或包絡(luò)形狀參數(shù)的參數(shù)以及允許重建聲音樣本的參數(shù)表示。存儲(chǔ)聲音樣本參數(shù)所需要的存儲(chǔ)量通常大大低于存儲(chǔ)實(shí)際的聲音樣本所需要的存儲(chǔ)量。然而，聲音的合成可能具有龐大的計(jì)算量。當(dāng)需要對(duì)表示不同聲道(MIDI中的"聲部")的很多參數(shù)集合進(jìn)行同時(shí)合成(高度的復(fù)調(diào))時(shí)，尤其是這樣。計(jì)算負(fù)擔(dān)通常隨著要被合成的通道("聲部")數(shù)量而線性增長(zhǎng)，也就是說(shuō)，隨著復(fù)調(diào)的程度線性增長(zhǎng)。這就使得在手持設(shè)備中使用這種技術(shù)非常困難。由M.Szczerba，W.Oomen和M.KleinMiddelink完成的論文"ParametricAudioCodingBasedWavetableSynthesis"，AudioEngineeringSocietyConventionPaperNo,6063，柏林(德國(guó))，2004年5月，公開(kāi)了一種SSC(正弦編碼)波表合成器。SSC編碼器將音頻輸入分解為瞬時(shí)、正弦和噪聲分量，并為這些分量的每一個(gè)生成參數(shù)表示。這些參數(shù)表示被存儲(chǔ)在聲音庫(kù)中。SSC解碼器(合成器)利用該參數(shù)表示重建原始音頻輸入。為了重建噪聲分量，個(gè)別聲道的時(shí)間包絡(luò)與各自的增益結(jié)合并相加，然后將白噪聲與該組合的時(shí)間包絡(luò)相混合，以產(chǎn)生在時(shí)間上整形的噪聲信號(hào)。利用個(gè)別聲道的頻譜包絡(luò)參數(shù)產(chǎn)生濾波器系數(shù)，該濾波器系數(shù)用于對(duì)時(shí)間上整形的噪聲信號(hào)進(jìn)行濾波，從而產(chǎn)生在時(shí)間上和頻譜上均被整形的噪聲信號(hào)。盡管這種已知的配置非常有效，然而，為很多聲道確定時(shí)間包絡(luò)和頻鐠包絡(luò)需要大量的計(jì)算負(fù)荷。在很多現(xiàn)代的聲音系統(tǒng)中，能夠使用64聲道，并且正在設(shè)想數(shù)量更多的聲道。這就使得該已知的配置不適宜用在計(jì)算能力有限的相對(duì)較小的設(shè)備中。另一方面，對(duì)在諸如移動(dòng)電話的手持用戶設(shè)備中實(shí)現(xiàn)聲音合成的需求正在增加。消費(fèi)者現(xiàn)在希望他們的手持設(shè)備可以產(chǎn)生范圍較廣的聲音，諸如不同的鈴聲。因此，本發(fā)明的目的是克服現(xiàn)有技術(shù)的這些和其他問(wèn)題，并提供一種合成聲音的噪聲分量的設(shè)備和方法，該設(shè)備和方法更高效，并能降低計(jì)算負(fù)荷。因此，本發(fā)明提供一種合成聲音的設(shè)備，其中聲音由參數(shù)集表示，每個(gè)集合包括表示聲音的噪聲分量的噪聲參數(shù)，該設(shè)備包括-選捧裝置，基于感知相關(guān)值(perceptualrelevancevalue)，從全部集合中選擇有限數(shù)目的集合，-合成裝置，只利用所選擇集合的噪聲參數(shù)合成噪聲分量。通過(guò)選擇有限數(shù)目的參數(shù)集并只利用這些有限數(shù)目的參數(shù)集進(jìn)行合成，有效地丟棄剩余集合，能夠大大降低合成的計(jì)算負(fù)荷。通過(guò)利用感知相關(guān)值選擇集合，沒(méi)有使用某些參數(shù)集的感知效果驚人地小。應(yīng)該預(yù)料到，僅僅利用例如64個(gè)參數(shù)集中的5個(gè)，將嚴(yán)重影響到所重建(即，合成)聲音的感知質(zhì)量。然而，發(fā)明人已經(jīng)發(fā)現(xiàn)，如在本實(shí)例中，通過(guò)適當(dāng)選擇五個(gè)集合，聲音質(zhì)量沒(méi)有受到影響。當(dāng)集合數(shù)目進(jìn)一步減少時(shí)，造成聲音質(zhì)量下降。然而，這種下降是逐漸的，并且選擇三個(gè)集合的數(shù)目仍然可以接受。除了表示聲音的噪聲分量的噪聲參數(shù)以外，參數(shù)集合還可以包括表示聲音其他分量的其他參數(shù)。因此，每個(gè)參數(shù)集合可以包括噪聲參數(shù)和其他參數(shù)，諸如正弦和/或瞬時(shí)參數(shù)。然而，集合只包括噪聲參數(shù)也是可能的。注意到，噪聲參數(shù)集的選擇優(yōu)選地與其他任意參數(shù)無(wú)關(guān)，諸如正弦和瞬時(shí)參數(shù)。然而，在某些實(shí)施例中，選擇裝置還被配置為基于表示其他聲音分量的一個(gè)或更多其他參數(shù)，從全部集合中選擇有限數(shù)目的集合。也就是說(shuō)，可以包括集合的任意正弦和/或瞬時(shí)分量參數(shù)，并且由此影響集合噪聲參數(shù)的選擇。在優(yōu)選實(shí)施例中，該設(shè)備包括用于判決要選擇哪個(gè)參數(shù)集的判決部分，以及用于基于判決部分提供的信息選擇參數(shù)集的選擇部分。然而，可以設(shè)想這樣的實(shí)施例，其中，判決部分和選擇部分組成一個(gè)單獨(dú)的整體單元?？商鎿Q地，該設(shè)備可以包括用于基于包含在參數(shù)集中的感知相關(guān)值來(lái)選擇參數(shù)集的選擇部分。如果參數(shù)集中包含感知相關(guān)值或者任何無(wú)需任何另外的判決過(guò)程而確定選擇的其他值，那么就不再需要判決部分了。本發(fā)明的合成設(shè)備可以包括單一的對(duì)所有被選擇集合的噪聲進(jìn)行頻譜整形的濾波器，以及用于確定濾波器濾波參數(shù)的萊文森-德賓(Levinson-Durbin)單元，其中該單一濾波器優(yōu)選地由拉格里(Laguerre)濾波器構(gòu)成。以這種方式，可以實(shí)現(xiàn)非常高效的合成。有益地，本發(fā)明的設(shè)備可以進(jìn)一步包括增益補(bǔ)償裝置，用于對(duì)所選擇的噪聲分量針對(duì)任何由于被拒絕(rejected)的任意噪聲分量造成的能量損失進(jìn)行增益補(bǔ)償。由于被拒絕的任意噪聲分量的能量分布在所選擇的噪聲分量上，因此該增益補(bǔ)償裝置允許噪聲的總能量基本保持不受選擇過(guò)程影響。此外，本發(fā)明提供一種利用參數(shù)集來(lái)表示聲音的編碼設(shè)備，每個(gè)參數(shù)集包括表示聲音的噪聲分量的噪聲參數(shù)，該設(shè)備包括相關(guān)(relevance)檢測(cè)器，用于提供表示各個(gè)噪聲參數(shù)的感知相關(guān)的相關(guān)值。該相關(guān)參數(shù)優(yōu)選地被添加到各個(gè)集合中，并可以基于感知模型而被確定。得到的參數(shù)集可由上述定義的合成設(shè)備重新轉(zhuǎn)換為聲音。本發(fā)明還提供一種包括上述定義的合成設(shè)備的用戶設(shè)備。該用戶設(shè)備優(yōu)選但不必須是便攜的，更優(yōu)選是手持的，可以由移動(dòng)(蜂窩)電話、CD播放器、DVD播放器、MP3播放器、PDA(個(gè)人數(shù)字助理)或其他適當(dāng)?shù)脑O(shè)備構(gòu)成。本發(fā)明進(jìn)一步提供一種合成由參數(shù)集表示的聲音的方法，每個(gè)集合包括表示聲音的噪聲分量的噪聲參數(shù)，該方法包括如下步驟-基于感知相關(guān)值，從全部集合中選擇有限數(shù)目的集合，-只利用所選擇集合的噪聲參數(shù)合成噪聲分量。在本發(fā)明的方法中，感知相關(guān)值可以指示噪聲振幅和/或噪聲能參數(shù)集可以只包含噪聲參數(shù)，但是也可以包含表示聲音其他分量的其他參數(shù)，諸如正弦和/或瞬時(shí)。本發(fā)明的方法可以包括進(jìn)一步的步驟對(duì)所選擇的噪聲分量針對(duì)任何由于被拒絕的任意噪聲分量造成的能量損失進(jìn)行增益補(bǔ)償。通過(guò)應(yīng)用該步驟，噪聲總能量基本不受選擇過(guò)程的影響。本發(fā)明額外還提供一種計(jì)算機(jī)程序產(chǎn)品，用于執(zhí)行上述定義的方法。計(jì)算機(jī)程序產(chǎn)品可以包括存儲(chǔ)在諸如CD或DVD的光或磁載體上，或者存儲(chǔ)并可以例如經(jīng)由因特網(wǎng)從遠(yuǎn)程服務(wù)器上下載的計(jì)算機(jī)可執(zhí)行指令的集合。下面將參考附圖所示的示例性實(shí)施例，對(duì)本發(fā)明進(jìn)行進(jìn)一步解釋，其中圖1示意性地示出了根據(jù)本發(fā)明的噪聲合成設(shè)備。圖2示意性地示出了用于本發(fā)明中的表示聲音的參數(shù)集。圖3更詳細(xì)地示意性示出了圖1中設(shè)備的選擇部分。圖4更詳細(xì)地示意性示出了圖1中設(shè)備的合成部分。圖5示意性地示出了合并了本發(fā)明設(shè)備的聲音合成設(shè)備。圖6示意性地示出了音頻編碼設(shè)備。僅通過(guò)圖1中非限制性實(shí)例所示的噪聲合成設(shè)備1包括選擇單元(選擇裝置)2和合成單元(合成裝置)3。根據(jù)本發(fā)明，選擇單元2接收噪聲參數(shù)NP，選擇有限數(shù)量的噪聲參數(shù)，并將這些選擇的參數(shù)NP，傳遞給合成單元3。合成單元3僅利用選擇的噪聲參數(shù)NP，來(lái)合成整形噪聲，即時(shí)間和/或頻譜包絡(luò)已經(jīng)被整形的噪聲。下面將結(jié)合圖4，更詳細(xì)地討論合成單元3的一個(gè)示例性實(shí)施例。噪聲參數(shù)NP可以是聲音參數(shù)集ShS"…，Sn的一部分，如圖2所示。在所示的實(shí)例中，參數(shù)集Si(i=l...N)包括表示瞬時(shí)聲音分量的瞬時(shí)參數(shù)TP、表示正弦聲音分量的正弦參數(shù)SP和表示噪聲聲音分量的噪聲參數(shù)NP。集合Si可以已經(jīng)利用如上所述的SSC編碼器或其他適當(dāng)?shù)木幋a器產(chǎn)生。將會(huì)了解，一些編碼器可以不產(chǎn)生瞬時(shí)參數(shù)(TP)而其他編碼器可以不產(chǎn)生正弦參數(shù)(SP)。這些參數(shù)可以遵循MIDI格式，也可以不遵循MIDI格式。每個(gè)集合Si可以表示一個(gè)激活的聲道(或者M(jìn)IDI系統(tǒng)中的"聲部")。圖3中更詳細(xì)地示出了噪聲參數(shù)的選擇，其示意性地示出了設(shè)備l的選擇單元2的實(shí)施例。圖3的該示例性選擇單元2包括判決部分21和選擇部分22。判決部分21和選擇部分22都接收噪聲參數(shù)NP。判決部分21只需要適當(dāng)?shù)倪x擇判決所基于的組成參數(shù)。適當(dāng)?shù)慕M成參數(shù)是增益g"在優(yōu)選實(shí)施例中，gi是噪聲集Si(參見(jiàn)圖2)時(shí)間包絡(luò)的增益。然而，還可以使用個(gè)別噪聲分量的振幅，或者可以由參數(shù)導(dǎo)出能量值。將會(huì)清楚，振幅和能量指示了噪聲的感知，因此它們的幅值組成了感知相關(guān)值。有益地，使用感知模型(例如包括人耳的聲學(xué)和心理學(xué)感知)來(lái)確定并(可選擇地)加權(quán)適當(dāng)?shù)膮?shù)。判決部分21判決要將哪些噪聲參數(shù)用于噪聲合成。利用應(yīng)用到感知相關(guān)值上的優(yōu)化準(zhǔn)則來(lái)作出判決，例如從可用增益gi中找到五個(gè)最高增益。相應(yīng)的集合號(hào)(例如2、3、12、23和41)被饋送到選擇部分22。在一些實(shí)施例中，選擇參數(shù)(即相關(guān)值)可以已經(jīng)被包括在噪聲參數(shù)NP中了。在這些實(shí)施例中，判決部分21可以省略。選擇部分22被配置為用于選擇由判決部分21指示的集合的噪聲參數(shù)。丟棄剩余集合的噪聲參數(shù)。結(jié)果，只有有限數(shù)目的噪聲參數(shù)被傳遞到合成單元(圖1中的3)并接下來(lái)被合成。因此，大大降低了合成單元的計(jì)算負(fù)荷。發(fā)明人已經(jīng)意識(shí)到，用于合成的噪聲參數(shù)的數(shù)量可以大大減少，而對(duì)聲音質(zhì)量沒(méi)有實(shí)質(zhì)性損失。被選擇集合的數(shù)目可以相對(duì)較小，例如從總共64個(gè)中選5個(gè)(7.8%)。通常，盡管至少10%是優(yōu)選，被選擇集合的數(shù)目至少應(yīng)該是總數(shù)目的4.5%，以防聲音質(zhì)量有任何可感知到的損失。如果被選擇集合的數(shù)目進(jìn)一步減少到低于大約4.5%，則被合成的聲音質(zhì)量逐漸下降，但是對(duì)于某些應(yīng)用來(lái)說(shuō)還可以接受。將會(huì)明白，也可以使用諸如15%、20%、30%或40%的更高百分比，盡管這樣將增加計(jì)算負(fù)荷。包括哪個(gè)集合、不包括哪個(gè)集合的判決是由判決部分21基于感知相關(guān)值做出的，例如噪聲分量的振幅(等級(jí))、從聲音庫(kù)(控制包絡(luò)發(fā)生器、低頻振蕩器等)中得到的清晰度數(shù)據(jù)(articulationdata)和從MIDI數(shù)據(jù)中得到的信息，例如有記錄的(note-on)速度和與清晰度相關(guān)的控制器。還可利用其他的感知相關(guān)值。一般地，具有最大相關(guān)值、例如最高的噪聲振幅(或增益)的M個(gè)集合被選擇。另外，或可替代地，判決部分21可以使用來(lái)自每個(gè)集合的其他參數(shù)。例如，可使用正弦參數(shù)來(lái)減少噪聲參數(shù)的數(shù)目。利用正弦(和/或瞬時(shí))參數(shù)，可以構(gòu)造掩蔽曲線，從而振幅低于掩蔽曲線的噪聲參數(shù)可被忽略。集合的噪聲參數(shù)因此可以與掩蔽曲線比較。如果它們落到曲線以下，則拒絕該集合的噪聲參數(shù)。將會(huì)明白，集合Si(圖2)和噪聲的選擇和合成通常在每個(gè)時(shí)間單元中進(jìn)行，例如每個(gè)時(shí)間幀。因此，噪聲參數(shù)和其他參數(shù)可以僅僅指某個(gè)時(shí)間單元。諸如時(shí)間幀的時(shí)間單元可以部分重疊。圖4中更詳細(xì)地示出了圖1的合成單元3的示例性實(shí)施例。在該實(shí)施例中，利用時(shí)間(時(shí)間域)包絡(luò)和頻譜(頻率域)包絡(luò)來(lái)產(chǎn)生噪聲。時(shí)間包絡(luò)發(fā)生器311、312和313接收分別對(duì)應(yīng)于被選擇集合Si的包絡(luò)參數(shù)bi(i-l…M)。根據(jù)本發(fā)明，被選擇集合的數(shù)目M小于可得到的集合數(shù)目N。時(shí)間包絡(luò)參數(shù)bi定義由發(fā)生器311-313輸出的時(shí)間包絡(luò)。乘法器331、332和333用各自的增益gi乘以時(shí)間包絡(luò)。作為結(jié)果得到的增益已調(diào)整的時(shí)間包絡(luò)被加法器341相加，并被饋送到下—個(gè)乘法器339，在那里與噪聲發(fā)生器305生成的(白)噪聲相乘。作為結(jié)果得到的已經(jīng)被在時(shí)間上整形但通常具有實(shí)際上均衡的頻i瞽的噪聲信號(hào)i皮饋送到(可選的)重疊再相加(overlap—and—add)電路360。在該電路中，隨后時(shí)間幀的噪聲片斷被組合，形成連續(xù)信號(hào)，其被饋送到濾波器390。如上所述，增益g'到gM對(duì)應(yīng)于被選擇的集合。由于有N個(gè)可得到的集合，因此增益gw到gw對(duì)應(yīng)于被拒絕的集合。在圖4所示的優(yōu)選實(shí)施例中，不丟棄增益gM+,到gN，而是用它們調(diào)節(jié)增益g,到gM。這種增益補(bǔ)償用來(lái)減小或甚至消除噪聲參數(shù)選擇對(duì)被合成噪聲的等級(jí)(即振幅)的影響。因此，圖4的實(shí)施例額外還包括加法器343和縮放(scaling)單元349。加法器343將增益gw+,到gw相加，并將作為結(jié)果得到的累積增益饋送到應(yīng)用縮放系數(shù)1/M的縮放單元349，以產(chǎn)生補(bǔ)償增益g"其中M是如上所述被選擇的集合數(shù)目。然后將該補(bǔ)償增益ge通過(guò)加法器334、335…加到每個(gè)增益g,到gM，加法器數(shù)目等于M。通過(guò)將被拒絕分量的累積增益分布在被選擇分量上，噪聲能量保持基本不變，由于噪聲分量選擇導(dǎo)致的聲級(jí)變化被避免了。將會(huì)明白，加法器343、縮放單元349和加法器334、335…是可選的，在其他實(shí)施例中，這些單元可以不出現(xiàn)。如果出現(xiàn)，縮放單元349可以可替換地被安排在加法器341和乘法器339之間。濾波器390在優(yōu)選實(shí)施例中是拉格里(Laguerre)濾波器，用來(lái)對(duì)噪聲信號(hào)頻譜整形。從被選擇集合Si導(dǎo)出的頻譜包絡(luò)參數(shù)ai被饋送到自相關(guān)單元321，自相關(guān)單元321計(jì)算這些參數(shù)的自相關(guān)。加法器342將作為結(jié)果得到的自相關(guān)相加，并將其饋送到單元370，以便確定頻譜整形濾波器390的濾波器系數(shù)。在優(yōu)選實(shí)施例中，單元370被配置為根據(jù)公知的萊文森-德賓(Levinson-Durbin)算法確定濾波器系數(shù)。然后由轉(zhuǎn)換單元380將作為結(jié)果得到的線性濾波器系數(shù)轉(zhuǎn)換為拉格里(Laguerre)濾波器系數(shù)。然后利用拉格里(Laguerre)濾波器390來(lái)整形(白)噪聲的頻譜包絡(luò)。作為確定每組參數(shù)ai自相關(guān)函數(shù)的替代，可使用更高效的方法。計(jì)算被選擇集合(即，被選擇的激活通道或"聲部")的功率譜，然后通過(guò)對(duì)相加的功率譜進(jìn)行傅立葉逆變換來(lái)計(jì)算自相關(guān)函數(shù)。然后將作為結(jié)果得到的自相關(guān)函數(shù)饋送到萊文森-德賓(Levinson-Durbin)單元370。將會(huì)明白，參數(shù)ai、b"gi和入都是圖1和圖2中用NP表示的噪聲參數(shù)的一部分。在圖3的選擇單元實(shí)施例中，判決部分22只使用增益參數(shù)gi。然而，可以設(shè)想這樣的實(shí)施例，其中參數(shù)ai、b"gi和入的某些或全部以及可能還有其他參數(shù)(例如關(guān)于正弦分量和/或瞬時(shí))也可以被判決部分22使用。需要注意，參數(shù)入可以是不變的，并且不需要是噪聲參數(shù)NP的一部分。圖5示意性地示出了本發(fā)明所用于的聲音合成器。合成器5包括噪聲合成器51、正弦合成器52和瞬時(shí)合成器53。輸出信號(hào)(合成的瞬時(shí)、正弦和噪聲)由加法器54相加，形成合成的音頻輸出信號(hào)。噪聲合成器51有益地包括如上所定義的設(shè)備(圖1中的1)。合成器5可以是音頻(聲音)解碼器(未示出)的一部分。音頻解碼器可以包括解復(fù)用器，用于對(duì)輸入比特流解復(fù)用，并分離出瞬時(shí)參數(shù)(TP)、正弦參數(shù)(SP)和噪聲參數(shù)(NP)的集合。僅通過(guò)圖6中非限制性實(shí)例所示的音頻編碼設(shè)備6以三個(gè)階段來(lái)編碼音頻信號(hào)s(n)。第一階段中，利用瞬時(shí)參數(shù)提取(TPE)單元61對(duì)音頻信號(hào)s(n)中的任意瞬時(shí)信號(hào)分量進(jìn)行編碼。將該參數(shù)提供給多路復(fù)用(MUX)單元68和瞬時(shí)合成(TS)單元62。當(dāng)多路復(fù)用單元68對(duì)參數(shù)進(jìn)行適當(dāng)?shù)亟M合并多路復(fù)用以便發(fā)送到諸如圖5中設(shè)備5的解碼器時(shí)，瞬時(shí)合成單元62重建編碼的瞬時(shí)(transients)。在第一組合單元63中將這些重建的瞬時(shí)從原始音頻信號(hào)s(n)中減去，以形成基本上消除了瞬時(shí)的中間信號(hào)。第二階段中，中間信號(hào)中的任意正弦信號(hào)分量(即正弦和余弦)由正弦參數(shù)提取(SPE)單元64編碼。作為結(jié)果得到的參數(shù)被饋送到多路復(fù)用單元68和正弦合成(SS)單元65。在第二組合單元66中，從中間信號(hào)中減去由正弦合成單元65重建的正弦，得到殘留(residual)信號(hào)。第三階段中，利用時(shí)間/頻率包絡(luò)數(shù)據(jù)提取(TFE)單元67，對(duì)殘留信號(hào)進(jìn)行編碼。需要注意，由于第一和第二階段中去除了瞬時(shí)和正弦，因此假定殘留信號(hào)是噪聲信號(hào)。因此，時(shí)間/頻率包絡(luò)數(shù)據(jù)提取(TFE)單元67用適當(dāng)?shù)脑肼晠?shù)來(lái)表示殘留噪聲。根據(jù)現(xiàn)有技術(shù)關(guān)于噪聲建模和編碼技術(shù)的綜述在美國(guó)斯坦福大學(xué)的S.N-Levine于1999年發(fā)表的論文"AudioRepresentationsforDataCompressionandCompressedDomainProcessing"的第5章中有所表述，其全部?jī)?nèi)容在這里被結(jié)合到本文獻(xiàn)中。從所有三個(gè)階段得到的參數(shù)被適當(dāng)組合，并由多路復(fù)用(MUX)單元68多路復(fù)用，該多路復(fù)用單元68還執(zhí)行附加的參數(shù)編碼，例如霍夫曼編碼或時(shí)間差分編碼，以便減少傳輸所需的帶寬。注意到，參數(shù)提取(即編碼)單元61、64和67可以對(duì)所提取的參數(shù)進(jìn)行量化?？商鎿Q地或附加地，可以在多路復(fù)用(MUX)單元68中進(jìn)行量化。進(jìn)一步注意到，s(ii)是數(shù)字信號(hào)，n表示樣本數(shù)，集合Si(n)被作為數(shù)字信號(hào)發(fā)送。然而，也可以應(yīng)用到模擬信號(hào)。當(dāng)已經(jīng)在MUX單元68中進(jìn)行組合和多路復(fù)用(以及可選地編碼和/或量化)之后，經(jīng)由傳輸介質(zhì)來(lái)傳輸參數(shù)，傳輸介質(zhì)諸如是衛(wèi)星鏈路、玻璃纖維電纜、銅纜以及任意其他適當(dāng)?shù)慕橘|(zhì)。音頻編碼設(shè)備6進(jìn)一步包括相關(guān)檢測(cè)器(RD)69。該相關(guān)檢測(cè)器69接收預(yù)先確定的參數(shù)，諸如噪聲增益gi(如圖3中所示)，并確定它們的聲學(xué)(感知)相關(guān)。作為結(jié)果得到的相關(guān)值被反饋到多路復(fù)用器68，在那里它們被插入到集合Si(n)形成輸出比特流。然后解碼器可以使用包括在該集合中的相關(guān)值來(lái)選擇適當(dāng)?shù)脑肼晠?shù)，而不必確定它們的感知相關(guān)。這樣，解碼器可以更簡(jiǎn)單和快速。盡管相關(guān)檢測(cè)器(RD)69在圖6中所示為連接到多路復(fù)用器68，相關(guān)檢測(cè)器69也可以代替為被直接連接到時(shí)間/頻率包絡(luò)數(shù)據(jù)提取(TFE)單元67。相關(guān)檢測(cè)器69的操作可以與圖3中所示的判決部分21的操作相似。圖6中所示音頻編碼設(shè)備6有三個(gè)階段。然而，音頻編碼設(shè)備6還可以由少于三個(gè)的階段組成，例如只有產(chǎn)生正弦和噪聲參數(shù)的兩個(gè)階段，或者多于三個(gè)階段，產(chǎn)生額外的參數(shù)。因此可以設(shè)想這樣的實(shí)施例，其中不出現(xiàn)單元61、62和63。圖6的音頻編碼設(shè)備6可以有益地被安排為產(chǎn)生可以由圖1中所示合成設(shè)備解碼(合成)的音頻參數(shù)。本發(fā)明的合成設(shè)備可以用于便攜式設(shè)備，特別是手持用戶設(shè)備，諸如蜂窩電話、PDA(個(gè)人數(shù)字助理)、手表、游戲設(shè)備、固態(tài)音頻播放器、電子樂(lè)器、數(shù)字電話答錄機(jī)、便攜式CD和/或DVD播放器等。從上面可以清楚地看到，本發(fā)明還提供一種合成由參數(shù)集表示的聲音的方法，其中每個(gè)參數(shù)集包括表示聲音的噪聲分量的噪聲參數(shù)，可選地還包括表示其他分量的其他參數(shù)，諸如瞬時(shí)和/或正弦。本發(fā)明的方法本質(zhì)上包括如下步驟-基于感知相關(guān)值，從全部集合中選擇有限數(shù)目的集合，-只利用所選擇集合的噪聲參數(shù)合成噪聲分量。本發(fā)明的方法可以額外包括下列可選步驟對(duì)所選擇的噪聲分量針對(duì)任何由于拒絕噪聲分量造成的能量損失進(jìn)行增益補(bǔ)償。進(jìn)一步可選的方法步驟可以從上面的描述中導(dǎo)出。附加地，本發(fā)明提供一種用參數(shù)集表示聲音的編碼設(shè)備，每個(gè)參數(shù)集包括表示聲音的噪聲分量的噪聲參數(shù)，優(yōu)選地還包括瞬時(shí)和/或正弦參數(shù)，該設(shè)備包括相關(guān)檢測(cè)器，用于提供表示各個(gè)噪聲參數(shù)的感知相關(guān)的相關(guān)值。本發(fā)明基于這樣的認(rèn)識(shí)，即當(dāng)合成聲音的噪聲分量時(shí)，選擇有限數(shù)目的聲道實(shí)際上可以不會(huì)導(dǎo)致被合成聲音發(fā)生降質(zhì)。本發(fā)明得益于進(jìn)一步的認(rèn)識(shí)，即基于感知相關(guān)值來(lái)選擇聲道最小化或消除了被合成聲音的失真。注意到，該文獻(xiàn)中使用的任何術(shù)語(yǔ)不應(yīng)被理解為限制本發(fā)明的范圍。特別地，詞語(yǔ)"包括"和"包含"不意味著排除沒(méi)有特別聲明的任何元素。一個(gè)(電路)元件可以由多個(gè)(電路)元件或它們的等價(jià)物代替。本領(lǐng)域技術(shù)人員將會(huì)明白，本發(fā)明不限于上面解釋的實(shí)施例，可以在不偏離如所附權(quán)利要求所定義的本發(fā)明范圍的情況下，做出很多修改和添加。權(quán)利要求1、一種用于合成聲音的設(shè)備(1)，其中聲音由參數(shù)集表示，每個(gè)集合包括表示聲音的噪聲分量的噪聲參數(shù)(NP)，該設(shè)備包括-選擇裝置(2)，基于感知相關(guān)值，從全部集合中選擇有限數(shù)目的集合，-合成裝置(3)，只利用所選擇集合的噪聲參數(shù)合成噪聲分量。2、根據(jù)權(quán)利要求1所述的設(shè)備，其中所述感知相關(guān)值指示噪聲分量的振幅和/或能量。3、根據(jù)權(quán)利要求1所述的設(shè)備，其中一個(gè)參數(shù)集進(jìn)一步包括表示聲音的瞬時(shí)分量和/或正弦分量的其他參數(shù)(SP;TP)。4、根據(jù)權(quán)利要求3所述的設(shè)備，其中選擇裝置(2)還被配置為基于表示聲音的其他分量的一個(gè)或更多其他參數(shù)(SP;TP)，從全部集合中選擇有限數(shù)目的集合。5、根據(jù)權(quán)利要求1所述的設(shè)備，其中噪聲參數(shù)(NP)定義噪聲的時(shí)間包絡(luò)和/或頻譜包絡(luò)。6、根據(jù)權(quán)利要求1所述的設(shè)備，其中每個(gè)參數(shù)集對(duì)應(yīng)于一個(gè)聲道，優(yōu)選地是MIDI聲部。7、根據(jù)權(quán)利要求1所述的設(shè)備，包括用于判決要選擇哪個(gè)參數(shù)集的判決部分(21)，以及用于基于判決部分(21)提供的信息選擇參數(shù)集的選擇部分(22)。8、根據(jù)權(quán)利要求1所述的設(shè)備，包括用于基于被包含在參數(shù)集中的感知相關(guān)值來(lái)選擇參數(shù)集的選擇部分(22)。9、根據(jù)權(quán)利要求1所述的設(shè)備，其中合成裝置(3)包括對(duì)所有被選擇集合的噪聲進(jìn)行頻譜整形的單個(gè)濾波器(390)，以及確定濾波器(390)濾波參數(shù)的萊文森-德賓單元(370)，其中該單個(gè)濾波器(390)優(yōu)選地由拉格里濾波器構(gòu)成。10、根據(jù)權(quán)利要求1所述的設(shè)備，進(jìn)一步包括增益補(bǔ)償裝置(343、349)，用于對(duì)所選擇的噪聲分量針對(duì)任何由于被拒絕的任意噪聲分量造成的能量損失進(jìn)行增益補(bǔ)償。11、一種音頻合成器(5)，諸如MIDI合成器，包括根據(jù)權(quán)利要求1所述的合成設(shè)備(1)。12、一種用戶設(shè)備，諸如蜂窩電話，包括根據(jù)權(quán)利要求1所述的合成設(shè)備(1)。13、一種合成聲音的方法，其中聲音由參數(shù)集表示，每個(gè)集合包括表示聲音的噪聲分量的噪聲參數(shù)(NP)，該方法包括如下步驟-基于感知相關(guān)值，從全部集合中選擇有限數(shù)目的集合，-只利用所選擇集合的噪聲參數(shù)合成噪聲分量。14、根據(jù)權(quán)利要求13所述的方法，其中所述感知相關(guān)值指示噪聲分量的振幅和/或能量。15、根據(jù)權(quán)利要求13所述的方法，其中一個(gè)參數(shù)集進(jìn)一步包括表示聲音的瞬時(shí)分量和/或正弦分量的其他參數(shù)(SP;TP)。16、根據(jù)權(quán)利要求15所述的方法，其中還基于表示聲音的其它分量的一個(gè)或更多其他參數(shù)(SP;TP)，執(zhí)行從全部集合中選擇有限數(shù)目的集合的步驟。17、根據(jù)權(quán)利要求13所述的方法，其中噪聲參數(shù)定義噪聲的時(shí)間包絡(luò)和/或頻譜包絡(luò)。18、根據(jù)權(quán)利要求13所述的方法，其中每個(gè)參數(shù)集對(duì)應(yīng)于一個(gè)聲道，優(yōu)選地是MIDI聲部。19、根據(jù)權(quán)利要求13所述的方法，進(jìn)一步包括對(duì)所選擇的噪聲分量針對(duì)任何由于被拒絕的任意噪聲分量造成的能量損失進(jìn)行增益補(bǔ)償?shù)牟襟E。20、根據(jù)權(quán)利要求13所述的方法，其中每個(gè)參數(shù)集對(duì)應(yīng)于一個(gè)聲道，優(yōu)選地是MIDI聲部。21、根據(jù)權(quán)利要求13所述的方法，其中每個(gè)參數(shù)集包含感知相關(guān)值。22、一種計(jì)算機(jī)程序產(chǎn)品，用于執(zhí)行根據(jù)權(quán)利要求13至21中任意一項(xiàng)所述的方法。全文摘要一種被配置為合成聲音的設(shè)備(1)，其中聲音由參數(shù)集表示，每個(gè)集合包括表示聲音的噪聲分量的噪聲參數(shù)(NP)，可選地還包括表示其他分量的其他參數(shù)，諸如瞬時(shí)和正弦。每個(gè)參數(shù)集可以對(duì)應(yīng)一個(gè)聲道，諸如MIDI聲部。為了減少計(jì)算負(fù)載，該設(shè)備包括選擇單元(2)，基于諸如振幅或能量的感知相關(guān)值(perceptualrelevancevalue)，從全部集合中選擇有限數(shù)目的集合。該設(shè)備進(jìn)一步包括合成單元(3)，只利用所選擇集合的噪聲參數(shù)合成噪聲分量。文檔編號(hào)G10H7/00GK101116135SQ200680004643公開(kāi)日2008年1月30日申請(qǐng)日期2006年2月1日優(yōu)先權(quán)日2005年2月10日發(fā)明者A·C·登布林克,A·J·格里茨,A·W·J·烏門(mén),M·克萊恩米德林克,M·施澤爾巴申請(qǐng)人:皇家飛利浦電子股份有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：M.施澤爾巴;A.C.登布林克;A.J.格里茨;A.W.J.烏門(mén);M.克萊恩米德林克
技術(shù)所有人：皇家飛利浦電子股份有限公司
我是此專利的發(fā)明人

上一篇：音源的參數(shù)聯(lián)合編碼的制作方法
上一篇：聲音合成的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

聲音合成器相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

聲音合成的制作方法