欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

聲音合成的制作方法

文檔序號(hào):2830006閱讀:1402來(lái)源:國(guó)知局

專利名稱::聲音合成的制作方法聲音合成本發(fā)明涉及聲音的合成。更具體地,本發(fā)明涉及一種合成聲音的設(shè)備和方法,其中聲音由參數(shù)集表示,每個(gè)集合包括表示聲音的噪聲分量的噪聲參數(shù)和表示其他分量的其他參數(shù)。用參數(shù)集表示聲音是眾所周知的。所謂的參數(shù)編碼技術(shù)被用于高效地編碼聲音,用一系列參數(shù)表示聲音。合適的解碼器能夠利用這一系列參數(shù)充分地重建原始聲音。這一系列參數(shù)可被劃分為集合,每個(gè)集合對(duì)應(yīng)于個(gè)別的聲音源(聲道),諸如(人)說(shuō)話者或樂(lè)器。流行的MIDI(樂(lè)器數(shù)字接口)協(xié)議允許音樂(lè)通過(guò)樂(lè)器指令的集合表示。將每個(gè)指令分配給特定樂(lè)器。每個(gè)指令能夠利用一個(gè)或更多聲道(在MIDI中稱作"聲部(voices),,)。將可以同時(shí)使用的聲道數(shù)目稱作復(fù)調(diào)級(jí)(polyphonylevel)或復(fù)調(diào)(polyphony)。MIDI指令可被高效傳輸和/或存儲(chǔ)。合成器通常包括聲音定義數(shù)據(jù),例如聲音庫(kù)(soundbank)或音色(patch)數(shù)據(jù)。在聲音庫(kù)中,樂(lè)器聲音的樣本被存儲(chǔ)為聲音數(shù)據(jù),而音色數(shù)據(jù)為聲音發(fā)生器定義控制參數(shù)。MIDI指令使合成器從聲音庫(kù)中檢索聲音數(shù)據(jù),并合成由該數(shù)據(jù)表示的聲音。正如普通的波表(wavetable)合成一樣,這些聲音數(shù)據(jù)可以是實(shí)際的聲音樣本,是數(shù)字化的聲音(波形)。然而,聲音樣本通常需要大量存儲(chǔ)器,這在相對(duì)較小的設(shè)備中是不可行的,特別是在諸如移動(dòng)(蜂窩)電話的手持用戶設(shè)備中??商鎿Q地,聲音樣本可以由包括振幅、頻率、相位和/或包絡(luò)形狀參數(shù)的參數(shù)以及允許重建聲音樣本的參數(shù)表示。存儲(chǔ)聲音樣本參數(shù)所需要的存儲(chǔ)量通常大大低于存儲(chǔ)實(shí)際的聲音樣本所需要的存儲(chǔ)量。然而,聲音的合成可能具有龐大的計(jì)算量。當(dāng)需要對(duì)表示不同聲道(MIDI中的"聲部")的很多參數(shù)集合進(jìn)行同時(shí)合成(高度的復(fù)調(diào))時(shí),尤其是這樣。計(jì)算負(fù)擔(dān)通常隨著要被合成的通道("聲部")數(shù)量而線性增長(zhǎng),也就是說(shuō),隨著復(fù)調(diào)的程度線性增長(zhǎng)。這就使得在手持設(shè)備中使用這種技術(shù)非常困難。由M.Szczerba,W.Oomen和M.KleinMiddelink完成的論文"ParametricAudioCodingBasedWavetableSynthesis",AudioEngineeringSocietyConventionPaperNo,6063,柏林(德國(guó)),2004年5月,公開(kāi)了一種SSC(正弦編碼)波表合成器。SSC編碼器將音頻輸入分解為瞬時(shí)、正弦和噪聲分量,并為這些分量的每一個(gè)生成參數(shù)表示。這些參數(shù)表示被存儲(chǔ)在聲音庫(kù)中。SSC解碼器(合成器)利用該參數(shù)表示重建原始音頻輸入。為了重建噪聲分量,個(gè)別聲道的時(shí)間包絡(luò)與各自的增益結(jié)合并相加,然后將白噪聲與該組合的時(shí)間包絡(luò)相混合,以產(chǎn)生在時(shí)間上整形的噪聲信號(hào)。利用個(gè)別聲道的頻譜包絡(luò)參數(shù)產(chǎn)生濾波器系數(shù),該濾波器系數(shù)用于對(duì)時(shí)間上整形的噪聲信號(hào)進(jìn)行濾波,從而產(chǎn)生在時(shí)間上和頻譜上均被整形的噪聲信號(hào)。盡管這種已知的配置非常有效,然而,為很多聲道確定時(shí)間包絡(luò)和頻鐠包絡(luò)需要大量的計(jì)算負(fù)荷。在很多現(xiàn)代的聲音系統(tǒng)中,能夠使用64聲道,并且正在設(shè)想數(shù)量更多的聲道。這就使得該已知的配置不適宜用在計(jì)算能力有限的相對(duì)較小的設(shè)備中。另一方面,對(duì)在諸如移動(dòng)電話的手持用戶設(shè)備中實(shí)現(xiàn)聲音合成的需求正在增加。消費(fèi)者現(xiàn)在希望他們的手持設(shè)備可以產(chǎn)生范圍較廣的聲音,諸如不同的鈴聲。因此,本發(fā)明的目的是克服現(xiàn)有技術(shù)的這些和其他問(wèn)題,并提供一種合成聲音的噪聲分量的設(shè)備和方法,該設(shè)備和方法更高效,并能降低計(jì)算負(fù)荷。因此,本發(fā)明提供一種合成聲音的設(shè)備,其中聲音由參數(shù)集表示,每個(gè)集合包括表示聲音的噪聲分量的噪聲參數(shù),該設(shè)備包括-選捧裝置,基于感知相關(guān)值(perceptualrelevancevalue),從全部集合中選擇有限數(shù)目的集合,-合成裝置,只利用所選擇集合的噪聲參數(shù)合成噪聲分量。通過(guò)選擇有限數(shù)目的參數(shù)集并只利用這些有限數(shù)目的參數(shù)集進(jìn)行合成,有效地丟棄剩余集合,能夠大大降低合成的計(jì)算負(fù)荷。通過(guò)利用感知相關(guān)值選擇集合,沒(méi)有使用某些參數(shù)集的感知效果驚人地小。應(yīng)該預(yù)料到,僅僅利用例如64個(gè)參數(shù)集中的5個(gè),將嚴(yán)重影響到所重建(即,合成)聲音的感知質(zhì)量。然而,發(fā)明人已經(jīng)發(fā)現(xiàn),如在本實(shí)例中,通過(guò)適當(dāng)選擇五個(gè)集合,聲音質(zhì)量沒(méi)有受到影響。當(dāng)集合數(shù)目進(jìn)一步減少時(shí),造成聲音質(zhì)量下降。然而,這種下降是逐漸的,并且選擇三個(gè)集合的數(shù)目仍然可以接受。除了表示聲音的噪聲分量的噪聲參數(shù)以外,參數(shù)集合還可以包括表示聲音其他分量的其他參數(shù)。因此,每個(gè)參數(shù)集合可以包括噪聲參數(shù)和其他參數(shù),諸如正弦和/或瞬時(shí)參數(shù)。然而,集合只包括噪聲參數(shù)也是可能的。注意到,噪聲參數(shù)集的選擇優(yōu)選地與其他任意參數(shù)無(wú)關(guān),諸如正弦和瞬時(shí)參數(shù)。然而,在某些實(shí)施例中,選擇裝置還被配置為基于表示其他聲音分量的一個(gè)或更多其他參數(shù),從全部集合中選擇有限數(shù)目的集合。也就是說(shuō),可以包括集合的任意正弦和/或瞬時(shí)分量參數(shù),并且由此影響集合噪聲參數(shù)的選擇。在優(yōu)選實(shí)施例中,該設(shè)備包括用于判決要選擇哪個(gè)參數(shù)集的判決部分,以及用于基于判決部分提供的信息選擇參數(shù)集的選擇部分。然而,可以設(shè)想這樣的實(shí)施例,其中,判決部分和選擇部分組成一個(gè)單獨(dú)的整體單元??商鎿Q地,該設(shè)備可以包括用于基于包含在參數(shù)集中的感知相關(guān)值來(lái)選擇參數(shù)集的選擇部分。如果參數(shù)集中包含感知相關(guān)值或者任何無(wú)需任何另外的判決過(guò)程而確定選擇的其他值,那么就不再需要判決部分了。本發(fā)明的合成設(shè)備可以包括單一的對(duì)所有被選擇集合的噪聲進(jìn)行頻譜整形的濾波器,以及用于確定濾波器濾波參數(shù)的萊文森-德賓(Levinson-Durbin)單元,其中該單一濾波器優(yōu)選地由拉格里(Laguerre)濾波器構(gòu)成。以這種方式,可以實(shí)現(xiàn)非常高效的合成。有益地,本發(fā)明的設(shè)備可以進(jìn)一步包括增益補(bǔ)償裝置,用于對(duì)所選擇的噪聲分量針對(duì)任何由于被拒絕(rejected)的任意噪聲分量造成的能量損失進(jìn)行增益補(bǔ)償。由于被拒絕的任意噪聲分量的能量分布在所選擇的噪聲分量上,因此該增益補(bǔ)償裝置允許噪聲的總能量基本保持不受選擇過(guò)程影響。此外,本發(fā)明提供一種利用參數(shù)集來(lái)表示聲音的編碼設(shè)備,每個(gè)參數(shù)集包括表示聲音的噪聲分量的噪聲參數(shù),該設(shè)備包括相關(guān)(relevance)檢測(cè)器,用于提供表示各個(gè)噪聲參數(shù)的感知相關(guān)的相關(guān)值。該相關(guān)參數(shù)優(yōu)選地被添加到各個(gè)集合中,并可以基于感知模型而被確定。得到的參數(shù)集可由上述定義的合成設(shè)備重新轉(zhuǎn)換為聲音。本發(fā)明還提供一種包括上述定義的合成設(shè)備的用戶設(shè)備。該用戶設(shè)備優(yōu)選但不必須是便攜的,更優(yōu)選是手持的,可以由移動(dòng)(蜂窩)電話、CD播放器、DVD播放器、MP3播放器、PDA(個(gè)人數(shù)字助理)或其他適當(dāng)?shù)脑O(shè)備構(gòu)成。本發(fā)明進(jìn)一步提供一種合成由參數(shù)集表示的聲音的方法,每個(gè)集合包括表示聲音的噪聲分量的噪聲參數(shù),該方法包括如下步驟-基于感知相關(guān)值,從全部集合中選擇有限數(shù)目的集合,-只利用所選擇集合的噪聲參數(shù)合成噪聲分量。在本發(fā)明的方法中,感知相關(guān)值可以指示噪聲振幅和/或噪聲能參數(shù)集可以只包含噪聲參數(shù),但是也可以包含表示聲音其他分量的其他參數(shù),諸如正弦和/或瞬時(shí)。本發(fā)明的方法可以包括進(jìn)一步的步驟對(duì)所選擇的噪聲分量針對(duì)任何由于被拒絕的任意噪聲分量造成的能量損失進(jìn)行增益補(bǔ)償。通過(guò)應(yīng)用該步驟,噪聲總能量基本不受選擇過(guò)程的影響。本發(fā)明額外還提供一種計(jì)算機(jī)程序產(chǎn)品,用于執(zhí)行上述定義的方法。計(jì)算機(jī)程序產(chǎn)品可以包括存儲(chǔ)在諸如CD或DVD的光或磁載體上,或者存儲(chǔ)并可以例如經(jīng)由因特網(wǎng)從遠(yuǎn)程服務(wù)器上下載的計(jì)算機(jī)可執(zhí)行指令的集合。下面將參考附圖所示的示例性實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步解釋,其中圖1示意性地示出了根據(jù)本發(fā)明的噪聲合成設(shè)備。圖2示意性地示出了用于本發(fā)明中的表示聲音的參數(shù)集。圖3更詳細(xì)地示意性示出了圖1中設(shè)備的選擇部分。圖4更詳細(xì)地示意性示出了圖1中設(shè)備的合成部分。圖5示意性地示出了合并了本發(fā)明設(shè)備的聲音合成設(shè)備。圖6示意性地示出了音頻編碼設(shè)備。僅通過(guò)圖1中非限制性實(shí)例所示的噪聲合成設(shè)備1包括選擇單元(選擇裝置)2和合成單元(合成裝置)3。根據(jù)本發(fā)明,選擇單元2接收噪聲參數(shù)NP,選擇有限數(shù)量的噪聲參數(shù),并將這些選擇的參數(shù)NP,傳遞給合成單元3。合成單元3僅利用選擇的噪聲參數(shù)NP,來(lái)合成整形噪聲,即時(shí)間和/或頻譜包絡(luò)已經(jīng)被整形的噪聲。下面將結(jié)合圖4,更詳細(xì)地討論合成單元3的一個(gè)示例性實(shí)施例。噪聲參數(shù)NP可以是聲音參數(shù)集ShS"…,Sn的一部分,如圖2所示。在所示的實(shí)例中,參數(shù)集Si(i=l...N)包括表示瞬時(shí)聲音分量的瞬時(shí)參數(shù)TP、表示正弦聲音分量的正弦參數(shù)SP和表示噪聲聲音分量的噪聲參數(shù)NP。集合Si可以已經(jīng)利用如上所述的SSC編碼器或其他適當(dāng)?shù)木幋a器產(chǎn)生。將會(huì)了解,一些編碼器可以不產(chǎn)生瞬時(shí)參數(shù)(TP)而其他編碼器可以不產(chǎn)生正弦參數(shù)(SP)。這些參數(shù)可以遵循MIDI格式,也可以不遵循MIDI格式。每個(gè)集合Si可以表示一個(gè)激活的聲道(或者M(jìn)IDI系統(tǒng)中的"聲部")。圖3中更詳細(xì)地示出了噪聲參數(shù)的選擇,其示意性地示出了設(shè)備l的選擇單元2的實(shí)施例。圖3的該示例性選擇單元2包括判決部分21和選擇部分22。判決部分21和選擇部分22都接收噪聲參數(shù)NP。判決部分21只需要適當(dāng)?shù)倪x擇判決所基于的組成參數(shù)。適當(dāng)?shù)慕M成參數(shù)是增益g"在優(yōu)選實(shí)施例中,gi是噪聲集Si(參見(jiàn)圖2)時(shí)間包絡(luò)的增益。然而,還可以使用個(gè)別噪聲分量的振幅,或者可以由參數(shù)導(dǎo)出能量值。將會(huì)清楚,振幅和能量指示了噪聲的感知,因此它們的幅值組成了感知相關(guān)值。有益地,使用感知模型(例如包括人耳的聲學(xué)和心理學(xué)感知)來(lái)確定并(可選擇地)加權(quán)適當(dāng)?shù)膮?shù)。判決部分21判決要將哪些噪聲參數(shù)用于噪聲合成。利用應(yīng)用到感知相關(guān)值上的優(yōu)化準(zhǔn)則來(lái)作出判決,例如從可用增益gi中找到五個(gè)最高增益。相應(yīng)的集合號(hào)(例如2、3、12、23和41)被饋送到選擇部分22。在一些實(shí)施例中,選擇參數(shù)(即相關(guān)值)可以已經(jīng)被包括在噪聲參數(shù)NP中了。在這些實(shí)施例中,判決部分21可以省略。選擇部分22被配置為用于選擇由判決部分21指示的集合的噪聲參數(shù)。丟棄剩余集合的噪聲參數(shù)。結(jié)果,只有有限數(shù)目的噪聲參數(shù)被傳遞到合成單元(圖1中的3)并接下來(lái)被合成。因此,大大降低了合成單元的計(jì)算負(fù)荷。發(fā)明人已經(jīng)意識(shí)到,用于合成的噪聲參數(shù)的數(shù)量可以大大減少,而對(duì)聲音質(zhì)量沒(méi)有實(shí)質(zhì)性損失。被選擇集合的數(shù)目可以相對(duì)較小,例如從總共64個(gè)中選5個(gè)(7.8%)。通常,盡管至少10%是優(yōu)選,被選擇集合的數(shù)目至少應(yīng)該是總數(shù)目的4.5%,以防聲音質(zhì)量有任何可感知到的損失。如果被選擇集合的數(shù)目進(jìn)一步減少到低于大約4.5%,則被合成的聲音質(zhì)量逐漸下降,但是對(duì)于某些應(yīng)用來(lái)說(shuō)還可以接受。將會(huì)明白,也可以使用諸如15%、20%、30%或40%的更高百分比,盡管這樣將增加計(jì)算負(fù)荷。包括哪個(gè)集合、不包括哪個(gè)集合的判決是由判決部分21基于感知相關(guān)值做出的,例如噪聲分量的振幅(等級(jí))、從聲音庫(kù)(控制包絡(luò)發(fā)生器、低頻振蕩器等)中得到的清晰度數(shù)據(jù)(articulationdata)和從MIDI數(shù)據(jù)中得到的信息,例如有記錄的(note-on)速度和與清晰度相關(guān)的控制器。還可利用其他的感知相關(guān)值。一般地,具有最大相關(guān)值、例如最高的噪聲振幅(或增益)的M個(gè)集合被選擇。另外,或可替代地,判決部分21可以使用來(lái)自每個(gè)集合的其他參數(shù)。例如,可使用正弦參數(shù)來(lái)減少噪聲參數(shù)的數(shù)目。利用正弦(和/或瞬時(shí))參數(shù),可以構(gòu)造掩蔽曲線,從而振幅低于掩蔽曲線的噪聲參數(shù)可被忽略。集合的噪聲參數(shù)因此可以與掩蔽曲線比較。如果它們落到曲線以下,則拒絕該集合的噪聲參數(shù)。將會(huì)明白,集合Si(圖2)和噪聲的選擇和合成通常在每個(gè)時(shí)間單元中進(jìn)行,例如每個(gè)時(shí)間幀。因此,噪聲參數(shù)和其他參數(shù)可以僅僅指某個(gè)時(shí)間單元。諸如時(shí)間幀的時(shí)間單元可以部分重疊。圖4中更詳細(xì)地示出了圖1的合成單元3的示例性實(shí)施例。在該實(shí)施例中,利用時(shí)間(時(shí)間域)包絡(luò)和頻譜(頻率域)包絡(luò)來(lái)產(chǎn)生噪聲。時(shí)間包絡(luò)發(fā)生器311、312和313接收分別對(duì)應(yīng)于被選擇集合Si的包絡(luò)參數(shù)bi(i-l…M)。根據(jù)本發(fā)明,被選擇集合的數(shù)目M小于可得到的集合數(shù)目N。時(shí)間包絡(luò)參數(shù)bi定義由發(fā)生器311-313輸出的時(shí)間包絡(luò)。乘法器331、332和333用各自的增益gi乘以時(shí)間包絡(luò)。作為結(jié)果得到的增益已調(diào)整的時(shí)間包絡(luò)被加法器341相加,并被饋送到下—個(gè)乘法器339,在那里與噪聲發(fā)生器305生成的(白)噪聲相乘。作為結(jié)果得到的已經(jīng)被在時(shí)間上整形但通常具有實(shí)際上均衡的頻i瞽的噪聲信號(hào)i皮饋送到(可選的)重疊再相加(overlap—and—add)電路360。在該電路中,隨后時(shí)間幀的噪聲片斷被組合,形成連續(xù)信號(hào),其被饋送到濾波器390。如上所述,增益g'到gM對(duì)應(yīng)于被選擇的集合。由于有N個(gè)可得到的集合,因此增益gw到gw對(duì)應(yīng)于被拒絕的集合。在圖4所示的優(yōu)選實(shí)施例中,不丟棄增益gM+,到gN,而是用它們調(diào)節(jié)增益g,到gM。這種增益補(bǔ)償用來(lái)減小或甚至消除噪聲參數(shù)選擇對(duì)被合成噪聲的等級(jí)(即振幅)的影響。因此,圖4的實(shí)施例額外還包括加法器343和縮放(scaling)單元349。加法器343將增益gw+,到gw相加,并將作為結(jié)果得到的累積增益饋送到應(yīng)用縮放系數(shù)1/M的縮放單元349,以產(chǎn)生補(bǔ)償增益g"其中M是如上所述被選擇的集合數(shù)目。然后將該補(bǔ)償增益ge通過(guò)加法器334、335…加到每個(gè)增益g,到gM,加法器數(shù)目等于M。通過(guò)將被拒絕分量的累積增益分布在被選擇分量上,噪聲能量保持基本不變,由于噪聲分量選擇導(dǎo)致的聲級(jí)變化被避免了。將會(huì)明白,加法器343、縮放單元349和加法器334、335…是可選的,在其他實(shí)施例中,這些單元可以不出現(xiàn)。如果出現(xiàn),縮放單元349可以可替換地被安排在加法器341和乘法器339之間。濾波器390在優(yōu)選實(shí)施例中是拉格里(Laguerre)濾波器,用來(lái)對(duì)噪聲信號(hào)頻譜整形。從被選擇集合Si導(dǎo)出的頻譜包絡(luò)參數(shù)ai被饋送到自相關(guān)單元321,自相關(guān)單元321計(jì)算這些參數(shù)的自相關(guān)。加法器342將作為結(jié)果得到的自相關(guān)相加,并將其饋送到單元370,以便確定頻譜整形濾波器390的濾波器系數(shù)。在優(yōu)選實(shí)施例中,單元370被配置為根據(jù)公知的萊文森-德賓(Levinson-Durbin)算法確定濾波器系數(shù)。然后由轉(zhuǎn)換單元380將作為結(jié)果得到的線性濾波器系數(shù)轉(zhuǎn)換為拉格里(Laguerre)濾波器系數(shù)。然后利用拉格里(Laguerre)濾波器390來(lái)整形(白)噪聲的頻譜包絡(luò)。作為確定每組參數(shù)ai自相關(guān)函數(shù)的替代,可使用更高效的方法。計(jì)算被選擇集合(即,被選擇的激活通道或"聲部")的功率譜,然后通過(guò)對(duì)相加的功率譜進(jìn)行傅立葉逆變換來(lái)計(jì)算自相關(guān)函數(shù)。然后將作為結(jié)果得到的自相關(guān)函數(shù)饋送到萊文森-德賓(Levinson-Durbin)單元370。將會(huì)明白,參數(shù)ai、b"gi和入都是圖1和圖2中用NP表示的噪聲參數(shù)的一部分。在圖3的選擇單元實(shí)施例中,判決部分22只使用增益參數(shù)gi。然而,可以設(shè)想這樣的實(shí)施例,其中參數(shù)ai、b"gi和入的某些或全部以及可能還有其他參數(shù)(例如關(guān)于正弦分量和/或瞬時(shí))也可以被判決部分22使用。需要注意,參數(shù)入可以是不變的,并且不需要是噪聲參數(shù)NP的一部分。圖5示意性地示出了本發(fā)明所用于的聲音合成器。合成器5包括噪聲合成器51、正弦合成器52和瞬時(shí)合成器53。輸出信號(hào)(合成的瞬時(shí)、正弦和噪聲)由加法器54相加,形成合成的音頻輸出信號(hào)。噪聲合成器51有益地包括如上所定義的設(shè)備(圖1中的1)。合成器5可以是音頻(聲音)解碼器(未示出)的一部分。音頻解碼器可以包括解復(fù)用器,用于對(duì)輸入比特流解復(fù)用,并分離出瞬時(shí)參數(shù)(TP)、正弦參數(shù)(SP)和噪聲參數(shù)(NP)的集合。僅通過(guò)圖6中非限制性實(shí)例所示的音頻編碼設(shè)備6以三個(gè)階段來(lái)編碼音頻信號(hào)s(n)。第一階段中,利用瞬時(shí)參數(shù)提取(TPE)單元61對(duì)音頻信號(hào)s(n)中的任意瞬時(shí)信號(hào)分量進(jìn)行編碼。將該參數(shù)提供給多路復(fù)用(MUX)單元68和瞬時(shí)合成(TS)單元62。當(dāng)多路復(fù)用單元68對(duì)參數(shù)進(jìn)行適當(dāng)?shù)亟M合并多路復(fù)用以便發(fā)送到諸如圖5中設(shè)備5的解碼器時(shí),瞬時(shí)合成單元62重建編碼的瞬時(shí)(transients)。在第一組合單元63中將這些重建的瞬時(shí)從原始音頻信號(hào)s(n)中減去,以形成基本上消除了瞬時(shí)的中間信號(hào)。第二階段中,中間信號(hào)中的任意正弦信號(hào)分量(即正弦和余弦)由正弦參數(shù)提取(SPE)單元64編碼。作為結(jié)果得到的參數(shù)被饋送到多路復(fù)用單元68和正弦合成(SS)單元65。在第二組合單元66中,從中間信號(hào)中減去由正弦合成單元65重建的正弦,得到殘留(residual)信號(hào)。第三階段中,利用時(shí)間/頻率包絡(luò)數(shù)據(jù)提取(TFE)單元67,對(duì)殘留信號(hào)進(jìn)行編碼。需要注意,由于第一和第二階段中去除了瞬時(shí)和正弦,因此假定殘留信號(hào)是噪聲信號(hào)。因此,時(shí)間/頻率包絡(luò)數(shù)據(jù)提取(TFE)單元67用適當(dāng)?shù)脑肼晠?shù)來(lái)表示殘留噪聲。根據(jù)現(xiàn)有技術(shù)關(guān)于噪聲建模和編碼技術(shù)的綜述在美國(guó)斯坦福大學(xué)的S.N-Levine于1999年發(fā)表的論文"AudioRepresentationsforDataCompressionandCompressedDomainProcessing"的第5章中有所表述,其全部?jī)?nèi)容在這里被結(jié)合到本文獻(xiàn)中。從所有三個(gè)階段得到的參數(shù)被適當(dāng)組合,并由多路復(fù)用(MUX)單元68多路復(fù)用,該多路復(fù)用單元68還執(zhí)行附加的參數(shù)編碼,例如霍夫曼編碼或時(shí)間差分編碼,以便減少傳輸所需的帶寬。注意到,參數(shù)提取(即編碼)單元61、64和67可以對(duì)所提取的參數(shù)進(jìn)行量化??商鎿Q地或附加地,可以在多路復(fù)用(MUX)單元68中進(jìn)行量化。進(jìn)一步注意到,s(ii)是數(shù)字信號(hào),n表示樣本數(shù),集合Si(n)被作為數(shù)字信號(hào)發(fā)送。然而,也可以應(yīng)用到模擬信號(hào)。當(dāng)已經(jīng)在MUX單元68中進(jìn)行組合和多路復(fù)用(以及可選地編碼和/或量化)之后,經(jīng)由傳輸介質(zhì)來(lái)傳輸參數(shù),傳輸介質(zhì)諸如是衛(wèi)星鏈路、玻璃纖維電纜、銅纜以及任意其他適當(dāng)?shù)慕橘|(zhì)。音頻編碼設(shè)備6進(jìn)一步包括相關(guān)檢測(cè)器(RD)69。該相關(guān)檢測(cè)器69接收預(yù)先確定的參數(shù),諸如噪聲增益gi(如圖3中所示),并確定它們的聲學(xué)(感知)相關(guān)。作為結(jié)果得到的相關(guān)值被反饋到多路復(fù)用器68,在那里它們被插入到集合Si(n)形成輸出比特流。然后解碼器可以使用包括在該集合中的相關(guān)值來(lái)選擇適當(dāng)?shù)脑肼晠?shù),而不必確定它們的感知相關(guān)。這樣,解碼器可以更簡(jiǎn)單和快速。盡管相關(guān)檢測(cè)器(RD)69在圖6中所示為連接到多路復(fù)用器68,相關(guān)檢測(cè)器69也可以代替為被直接連接到時(shí)間/頻率包絡(luò)數(shù)據(jù)提取(TFE)單元67。相關(guān)檢測(cè)器69的操作可以與圖3中所示的判決部分21的操作相似。圖6中所示音頻編碼設(shè)備6有三個(gè)階段。然而,音頻編碼設(shè)備6還可以由少于三個(gè)的階段組成,例如只有產(chǎn)生正弦和噪聲參數(shù)的兩個(gè)階段,或者多于三個(gè)階段,產(chǎn)生額外的參數(shù)。因此可以設(shè)想這樣的實(shí)施例,其中不出現(xiàn)單元61、62和63。圖6的音頻編碼設(shè)備6可以有益地被安排為產(chǎn)生可以由圖1中所示合成設(shè)備解碼(合成)的音頻參數(shù)。本發(fā)明的合成設(shè)備可以用于便攜式設(shè)備,特別是手持用戶設(shè)備,諸如蜂窩電話、PDA(個(gè)人數(shù)字助理)、手表、游戲設(shè)備、固態(tài)音頻播放器、電子樂(lè)器、數(shù)字電話答錄機(jī)、便攜式CD和/或DVD播放器等。從上面可以清楚地看到,本發(fā)明還提供一種合成由參數(shù)集表示的聲音的方法,其中每個(gè)參數(shù)集包括表示聲音的噪聲分量的噪聲參數(shù),可選地還包括表示其他分量的其他參數(shù),諸如瞬時(shí)和/或正弦。本發(fā)明的方法本質(zhì)上包括如下步驟-基于感知相關(guān)值,從全部集合中選擇有限數(shù)目的集合,-只利用所選擇集合的噪聲參數(shù)合成噪聲分量。本發(fā)明的方法可以額外包括下列可選步驟對(duì)所選擇的噪聲分量針對(duì)任何由于拒絕噪聲分量造成的能量損失進(jìn)行增益補(bǔ)償。進(jìn)一步可選的方法步驟可以從上面的描述中導(dǎo)出。附加地,本發(fā)明提供一種用參數(shù)集表示聲音的編碼設(shè)備,每個(gè)參數(shù)集包括表示聲音的噪聲分量的噪聲參數(shù),優(yōu)選地還包括瞬時(shí)和/或正弦參數(shù),該設(shè)備包括相關(guān)檢測(cè)器,用于提供表示各個(gè)噪聲參數(shù)的感知相關(guān)的相關(guān)值。本發(fā)明基于這樣的認(rèn)識(shí),即當(dāng)合成聲音的噪聲分量時(shí),選擇有限數(shù)目的聲道實(shí)際上可以不會(huì)導(dǎo)致被合成聲音發(fā)生降質(zhì)。本發(fā)明得益于進(jìn)一步的認(rèn)識(shí),即基于感知相關(guān)值來(lái)選擇聲道最小化或消除了被合成聲音的失真。注意到,該文獻(xiàn)中使用的任何術(shù)語(yǔ)不應(yīng)被理解為限制本發(fā)明的范圍。特別地,詞語(yǔ)"包括"和"包含"不意味著排除沒(méi)有特別聲明的任何元素。一個(gè)(電路)元件可以由多個(gè)(電路)元件或它們的等價(jià)物代替。本領(lǐng)域技術(shù)人員將會(huì)明白,本發(fā)明不限于上面解釋的實(shí)施例,可以在不偏離如所附權(quán)利要求所定義的本發(fā)明范圍的情況下,做出很多修改和添加。權(quán)利要求1、一種用于合成聲音的設(shè)備(1),其中聲音由參數(shù)集表示,每個(gè)集合包括表示聲音的噪聲分量的噪聲參數(shù)(NP),該設(shè)備包括-選擇裝置(2),基于感知相關(guān)值,從全部集合中選擇有限數(shù)目的集合,-合成裝置(3),只利用所選擇集合的噪聲參數(shù)合成噪聲分量。2、根據(jù)權(quán)利要求1所述的設(shè)備,其中所述感知相關(guān)值指示噪聲分量的振幅和/或能量。3、根據(jù)權(quán)利要求1所述的設(shè)備,其中一個(gè)參數(shù)集進(jìn)一步包括表示聲音的瞬時(shí)分量和/或正弦分量的其他參數(shù)(SP;TP)。4、根據(jù)權(quán)利要求3所述的設(shè)備,其中選擇裝置(2)還被配置為基于表示聲音的其他分量的一個(gè)或更多其他參數(shù)(SP;TP),從全部集合中選擇有限數(shù)目的集合。5、根據(jù)權(quán)利要求1所述的設(shè)備,其中噪聲參數(shù)(NP)定義噪聲的時(shí)間包絡(luò)和/或頻譜包絡(luò)。6、根據(jù)權(quán)利要求1所述的設(shè)備,其中每個(gè)參數(shù)集對(duì)應(yīng)于一個(gè)聲道,優(yōu)選地是MIDI聲部。7、根據(jù)權(quán)利要求1所述的設(shè)備,包括用于判決要選擇哪個(gè)參數(shù)集的判決部分(21),以及用于基于判決部分(21)提供的信息選擇參數(shù)集的選擇部分(22)。8、根據(jù)權(quán)利要求1所述的設(shè)備,包括用于基于被包含在參數(shù)集中的感知相關(guān)值來(lái)選擇參數(shù)集的選擇部分(22)。9、根據(jù)權(quán)利要求1所述的設(shè)備,其中合成裝置(3)包括對(duì)所有被選擇集合的噪聲進(jìn)行頻譜整形的單個(gè)濾波器(390),以及確定濾波器(390)濾波參數(shù)的萊文森-德賓單元(370),其中該單個(gè)濾波器(390)優(yōu)選地由拉格里濾波器構(gòu)成。10、根據(jù)權(quán)利要求1所述的設(shè)備,進(jìn)一步包括增益補(bǔ)償裝置(343、349),用于對(duì)所選擇的噪聲分量針對(duì)任何由于被拒絕的任意噪聲分量造成的能量損失進(jìn)行增益補(bǔ)償。11、一種音頻合成器(5),諸如MIDI合成器,包括根據(jù)權(quán)利要求1所述的合成設(shè)備(1)。12、一種用戶設(shè)備,諸如蜂窩電話,包括根據(jù)權(quán)利要求1所述的合成設(shè)備(1)。13、一種合成聲音的方法,其中聲音由參數(shù)集表示,每個(gè)集合包括表示聲音的噪聲分量的噪聲參數(shù)(NP),該方法包括如下步驟-基于感知相關(guān)值,從全部集合中選擇有限數(shù)目的集合,-只利用所選擇集合的噪聲參數(shù)合成噪聲分量。14、根據(jù)權(quán)利要求13所述的方法,其中所述感知相關(guān)值指示噪聲分量的振幅和/或能量。15、根據(jù)權(quán)利要求13所述的方法,其中一個(gè)參數(shù)集進(jìn)一步包括表示聲音的瞬時(shí)分量和/或正弦分量的其他參數(shù)(SP;TP)。16、根據(jù)權(quán)利要求15所述的方法,其中還基于表示聲音的其它分量的一個(gè)或更多其他參數(shù)(SP;TP),執(zhí)行從全部集合中選擇有限數(shù)目的集合的步驟。17、根據(jù)權(quán)利要求13所述的方法,其中噪聲參數(shù)定義噪聲的時(shí)間包絡(luò)和/或頻譜包絡(luò)。18、根據(jù)權(quán)利要求13所述的方法,其中每個(gè)參數(shù)集對(duì)應(yīng)于一個(gè)聲道,優(yōu)選地是MIDI聲部。19、根據(jù)權(quán)利要求13所述的方法,進(jìn)一步包括對(duì)所選擇的噪聲分量針對(duì)任何由于被拒絕的任意噪聲分量造成的能量損失進(jìn)行增益補(bǔ)償?shù)牟襟E。20、根據(jù)權(quán)利要求13所述的方法,其中每個(gè)參數(shù)集對(duì)應(yīng)于一個(gè)聲道,優(yōu)選地是MIDI聲部。21、根據(jù)權(quán)利要求13所述的方法,其中每個(gè)參數(shù)集包含感知相關(guān)值。22、一種計(jì)算機(jī)程序產(chǎn)品,用于執(zhí)行根據(jù)權(quán)利要求13至21中任意一項(xiàng)所述的方法。全文摘要一種被配置為合成聲音的設(shè)備(1),其中聲音由參數(shù)集表示,每個(gè)集合包括表示聲音的噪聲分量的噪聲參數(shù)(NP),可選地還包括表示其他分量的其他參數(shù),諸如瞬時(shí)和正弦。每個(gè)參數(shù)集可以對(duì)應(yīng)一個(gè)聲道,諸如MIDI聲部。為了減少計(jì)算負(fù)載,該設(shè)備包括選擇單元(2),基于諸如振幅或能量的感知相關(guān)值(perceptualrelevancevalue),從全部集合中選擇有限數(shù)目的集合。該設(shè)備進(jìn)一步包括合成單元(3),只利用所選擇集合的噪聲參數(shù)合成噪聲分量。文檔編號(hào)G10H7/00GK101116135SQ200680004643公開(kāi)日2008年1月30日申請(qǐng)日期2006年2月1日優(yōu)先權(quán)日2005年2月10日發(fā)明者A·C·登布林克,A·J·格里茨,A·W·J·烏門(mén),M·克萊恩米德林克,M·施澤爾巴申請(qǐng)人:皇家飛利浦電子股份有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
化州市| 会昌县| 都匀市| 兴山县| 腾冲县| 永德县| 张北县| 兴文县| 上蔡县| 永嘉县| 兴海县| 南投县| 武义县| 德州市| 大田县| 方正县| 灵山县| 庆安县| 息烽县| 崇左市| 丹棱县| 松阳县| 扬州市| 宜州市| 鸡东县| 青川县| 乌鲁木齐市| 新河县| 栾城县| 昌都县| 竹山县| 白沙| 米林县| 芦山县| 神农架林区| 婺源县| 惠州市| 赤城县| 盐边县| 来安县| 潼关县|