欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

三維聲場(chǎng)編碼及優(yōu)化重建的方法及裝置的制作方法

文檔序號(hào):7738291閱讀:217來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):三維聲場(chǎng)編碼及優(yōu)化重建的方法及裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明是關(guān)于一種改善三維聲場(chǎng)編碼、分布、及譯碼的技術(shù),本發(fā)明尤其指一種無(wú)需依據(jù)展示(exhibition)設(shè)置即可將具有空間信息的音頻信號(hào)編碼的技術(shù),以及最優(yōu)化譯碼一給定的展示系統(tǒng),其可為多揚(yáng)聲器設(shè)置或耳機(jī)。
背景技術(shù)
在多通道再生及收聽(tīng)中,一聽(tīng)眾通常會(huì)被多組揚(yáng)聲器所環(huán)繞。建造一聲場(chǎng)使聽(tīng)眾可以感知音源的預(yù)期位置即為再生中的一個(gè)一般的目的,例如一樂(lè)團(tuán)中一音樂(lè)演出者的位置。而不同的揚(yáng)聲器設(shè)置可以創(chuàng)造出不同的空間印象。例如,標(biāo)準(zhǔn)立體聲設(shè)置可以正確地在兩揚(yáng)聲器之間的空間再創(chuàng)出聲音場(chǎng)景,但卻無(wú)法達(dá)到離開(kāi)兩揚(yáng)聲器的角度的效果。在更廣的角度下,在聽(tīng)眾周?chē)O(shè)置更多的揚(yáng)聲器可達(dá)到更佳的空間印象。例如,多揚(yáng)聲器配置標(biāo)準(zhǔn)中最知名的5. 1環(huán)繞聲道(ITU-R775-1),其是由五個(gè)揚(yáng)聲器所構(gòu)成,五個(gè)揚(yáng)聲器分別設(shè)置在聽(tīng)眾的-30度、0度、30度、-110度、及110度方位角,而0度是為正向方位。然而,上述的設(shè)置并無(wú)法處理高于聽(tīng)眾的水平面的聲音。為增加聽(tīng)眾的環(huán)場(chǎng)體驗(yàn),目前的主流做法為在不同的高度拓設(shè)多揚(yáng)聲器。例如一由日本NHK,Hamasak所發(fā)展出的22. 2系統(tǒng),其是由總共M個(gè)設(shè)置在3個(gè)不同高度的揚(yáng)聲器所構(gòu)成。對(duì)上述設(shè)置而言,現(xiàn)有產(chǎn)生專(zhuān)門(mén)應(yīng)用的空間化音頻的范例是提供每一再生中所用的通道一個(gè)音軌。例如,立體聲設(shè)置需要兩個(gè)音軌、而5.1聲道則需要六個(gè)音軌等。這些音軌雖然也可由記錄時(shí)期直接產(chǎn)生而廣播,但正常來(lái)說(shuō)是為后制時(shí)期的結(jié)果。在許多場(chǎng)合中, 使用少數(shù)揚(yáng)聲器來(lái)產(chǎn)生完全相同的音頻通道是值得注意的。這是5. 1聲道電影院劇場(chǎng)相當(dāng)常見(jiàn)的,每一環(huán)繞聲道是通過(guò)三個(gè)或多個(gè)揚(yáng)聲器重放。因此,在這些場(chǎng)合中,雖然揚(yáng)聲器的數(shù)目可能多于六個(gè),但不同音頻聲道的數(shù)目仍然為六,而總共只有六個(gè)不同的信號(hào)被重放。此種一通道一音軌范例的一個(gè)結(jié)果是其將記錄時(shí)期及后制時(shí)期所完成的工作與即將展示內(nèi)容的展示設(shè)置連結(jié)。在記錄時(shí)期,例如廣播,所使用麥克風(fēng)的型式與位置以及其混合的方法是被決定為即將被再生的事件的函數(shù)。同樣地,在媒體產(chǎn)生中,后制工程師需要知道即將展示內(nèi)容的展示設(shè)置的細(xì)節(jié),并留意所有的通道。若無(wú)法正確地設(shè)定展示多揚(yáng)聲器配置以顯示合適的內(nèi)容,將導(dǎo)致再生質(zhì)量的下降。如果即將展示內(nèi)容在不同的設(shè)置中,在后制中則需要?jiǎng)?chuàng)出不同的版本。如此將增加成本及時(shí)間上的浪費(fèi)。另一個(gè)一通道一音軌范例的結(jié)果是為數(shù)據(jù)量為必需。另一方面,若無(wú)進(jìn)一步的編碼,此范例需要與通道數(shù)一樣多的音軌。另一方面,若提供不同的版本,其也會(huì)分開(kāi)地提供, 如此將再造成數(shù)據(jù)量的上升,或是需要將多聲道信號(hào)混合成兩聲道之后輸出,而危及輸出結(jié)果的質(zhì)量。最后,另一個(gè)一通道一音軌范例的不利趨勢(shì)是為,以上述的方法產(chǎn)生的內(nèi)容并非為永不過(guò)時(shí)的技術(shù)。例如,一 5. 1聲道設(shè)置所產(chǎn)出的一給定影片中所呈現(xiàn)的六音軌并不包含位于聽(tīng)眾上方的音源,也無(wú)法與揚(yáng)聲器完全地拓設(shè)設(shè)置于不同高度。
最近則出現(xiàn)一些能提供展示系統(tǒng)獨(dú)立空間化音頻的技術(shù)。振幅平移(amplitude panning)或許是最簡(jiǎn)易的技術(shù),例如所謂的向量振幅平移(vector based Amplitude panning, VBAP)。VBAP是基于將相同的單音信號(hào)饋入揚(yáng)聲器中,揚(yáng)聲器是靠近聲源預(yù)計(jì)設(shè)置的位置,并對(duì)每一揚(yáng)聲器的音量做調(diào)整。此系統(tǒng)可在二維或三維(包括高度)設(shè)置中運(yùn)作,通過(guò)分別選擇二或三個(gè)靠近的揚(yáng)聲器??商峁┮淮蟮淖罴呀Y(jié)合點(diǎn)為此方法的一個(gè)優(yōu)點(diǎn), 意味著揚(yáng)聲器設(shè)置中具有寬廣的區(qū)域使得聲音的感知就像從預(yù)計(jì)的方向而來(lái)一般。然而, 此方法并不適用于例如在回聲房中再生回聲場(chǎng),也不適用于高擴(kuò)散性的音源。由音源所發(fā)出的聲音的第一次反彈多半可由這些方法再生,但其結(jié)果的質(zhì)量相當(dāng)?shù)吐?。高逼真度立體聲復(fù)制(Ambisonics)是為另一種能提供展示系統(tǒng)獨(dú)立空間化音頻的技術(shù)。此技術(shù)可追溯到70年代,由Michael Gerzon所提出。此技術(shù)是提供一完整的編碼-譯碼鏈方法(encoding-decoding chain methodology)。就編碼而言,一組球狀諧禾口聲場(chǎng)是在一點(diǎn)上被保留。第0階(W)是在該點(diǎn)對(duì)應(yīng)至一全方向性麥克風(fēng)所記錄的信息。而第1階是由三個(gè)信號(hào)(X,Y,Z)所構(gòu)成,是在該點(diǎn)對(duì)應(yīng)至三個(gè)八字型(figure-of-eight)麥克風(fēng),并與卡氏坐標(biāo)所記錄的信息對(duì)應(yīng)。高階信號(hào)是對(duì)應(yīng)至具更復(fù)雜圖案的麥克風(fēng)所記錄的信息。混合序列高逼真度立體聲復(fù)制編碼是存在,每一序列中僅有一些子集合的信號(hào)被使用。例如,在第1階高逼真度立體聲復(fù)制中僅使用W,X,Y信號(hào)而省略Z信號(hào)。雖然1階以上信號(hào)的產(chǎn)生對(duì)后制或通過(guò)聲場(chǎng)模擬而言相當(dāng)容易,但當(dāng)通過(guò)麥克風(fēng)對(duì)聲場(chǎng)編碼則較困難;事實(shí)上,時(shí)至今日,只有麥克風(fēng)可以有效的在專(zhuān)業(yè)應(yīng)用上測(cè)量出第0階及第1階信號(hào)。 第1階高逼真度立體聲復(fù)制麥克風(fēng)的實(shí)例有如Soimdfield或最近的TetraMic。就解碼而言,當(dāng)多揚(yáng)聲器設(shè)置已被確認(rèn)(每一揚(yáng)聲器的位置與數(shù)目),將被饋入至每一揚(yáng)聲器的信號(hào)是由完整設(shè)置所產(chǎn)生的聲場(chǎng)的需求而決定,完整設(shè)置所產(chǎn)生的聲場(chǎng)是與預(yù)期聲場(chǎng)幾乎近似 (由后制所產(chǎn)生、或由記錄該信號(hào)之處中二者之一)。除了展示系統(tǒng)的獨(dú)立以外,此技術(shù)的其它優(yōu)點(diǎn)是為其所提供的高階操作(基本上為聲景的旋轉(zhuǎn)及縮放),且其能準(zhǔn)確地記錄回聲場(chǎng)。然而,高逼真度立體聲復(fù)制技術(shù)是具有兩個(gè)主要的缺點(diǎn)其一為無(wú)法再生窄頻音源;其二為結(jié)合點(diǎn)尺寸小。在本文中所用的窄頻(narrow)及傳播(spread)音源的概念是可視為所提及的感知聲音影像的角度寬幅。第一個(gè)缺點(diǎn)是由于即使試圖要產(chǎn)生一個(gè)非常窄頻的音源時(shí),高逼真度立體聲復(fù)制解碼將開(kāi)啟比一個(gè)較靠近預(yù)期聲音位置的揚(yáng)聲器更多的揚(yáng)聲器。第二個(gè)缺點(diǎn)是由于在結(jié)合點(diǎn)上,把從每一個(gè)揚(yáng)聲器而來(lái)的聲波做相位相加可產(chǎn)生所欲的聲場(chǎng),但在結(jié)合點(diǎn)外,聲波并不以正確的相位干擾。如此將改變聲音的保護(hù)色,而更重要的是,預(yù)感知的聲音就像是從靠近聽(tīng)眾的揚(yáng)聲器而來(lái),即如已知的心理聲學(xué)居前效應(yīng)(psychoacoustical precedence effect)。對(duì)一個(gè)固定大小的視聽(tīng)室而言,唯一能夠降低此二個(gè)問(wèn)題的方法是增加高逼真度立體聲復(fù)制序列的使用,然而,這也意味著通道的數(shù)目將會(huì)快速的增加,且需使用更多的揚(yáng)聲器。一可正確地再生一任意聲場(chǎng)的技術(shù)經(jīng)常值得提及,即所謂的重現(xiàn)波場(chǎng)合成(wave field synthesisWFS)。然而,此技術(shù)需要揚(yáng)聲器分開(kāi)的距離小于15-20公分,其是需要更高度的近似值(導(dǎo)致質(zhì)量的流失)及增加所需的揚(yáng)聲器數(shù)量,現(xiàn)有的方法是使用100到500 個(gè)揚(yáng)聲器,如此將限制其于高階客制化的使用性。一種能夠提供空間化音頻內(nèi)容、且空間化音頻內(nèi)容的分配是不依靠展示設(shè)置的方法是令人向往的,是為二維或三維;當(dāng)設(shè)置被明確配置后,此方法是可被譯碼以完全地展現(xiàn)其具有的性能;此方法也可再生任何型態(tài)的聲場(chǎng)(窄頻音源,回聲場(chǎng)或擴(kuò)散場(chǎng))給在場(chǎng)的聽(tīng)眾,意即,有大的結(jié)合點(diǎn);且此方法不需要大量的揚(yáng)聲器。如此即可能創(chuàng)造出不會(huì)過(guò)時(shí)的內(nèi)容,在場(chǎng)景中,此方法是可輕易地適用于所有現(xiàn)有的或未來(lái)的多揚(yáng)聲器設(shè)置,且也可讓聽(tīng)眾在電影院劇場(chǎng)或家中選擇最適合或聽(tīng)眾所需的內(nèi)容,而具有可確信會(huì)有大量?jī)?nèi)容能完全地開(kāi)拓所選擇設(shè)置的性能的利益。

發(fā)明內(nèi)容
本發(fā)明的主要目的是在提供一種無(wú)需依據(jù)展示設(shè)置即可將具有空間信息的音頻信號(hào)編碼的方法及裝置,以及最優(yōu)化譯碼及播放任何給定的展示系統(tǒng),包括在不同高度的揚(yáng)聲及耳機(jī)的設(shè)置。本發(fā)明是基于一種方法,是將某些給定的音頻原料通過(guò)將其指定至兩群組而編碼成一展示獨(dú)立格式第一群組包含需要高方向定位的音頻;第二群組包含用于定位的音頻,此定位是由足夠的低階高逼真度立體聲復(fù)制技術(shù)提供。第一群組所有的音頻將被編碼成一組具關(guān)聯(lián)性元數(shù)據(jù)且各別分開(kāi)的單音軌。各別分開(kāi)的單音軌的數(shù)目并無(wú)限制,雖然在某些實(shí)施例中可能會(huì)有強(qiáng)制的限制,此情形將說(shuō)明如下。元資料是包含與每一將被重放的音軌上的精確的時(shí)刻有關(guān)的信息,也包含空間信息描述,至少,在每一時(shí)刻信號(hào)的起源的方向。第二群組所有的音頻將被編碼成一組代表一給定的高逼真度立體聲復(fù)制序列。就理想而言會(huì)有一高逼真度立體聲復(fù)制通道的信號(hào)集合, 即使在某些特定實(shí)施例中有多于一個(gè)會(huì)被使用。就再生而言,一旦顯示系統(tǒng)被確認(rèn),在第一群組中的音頻通道是因重放而被編碼, 編碼是使用標(biāo)準(zhǔn)平移算法(standard panning algorithms),而標(biāo)準(zhǔn)平移算法則使用少數(shù)的與音源的預(yù)期位置有關(guān)的揚(yáng)聲器。在第二群組中的音頻通道是因重放而被譯碼,此譯碼是使用高逼真度立體聲復(fù)制譯碼器,此譯碼器為給定的顯示系統(tǒng)中的優(yōu)化。此方法及裝置是解決上述的問(wèn)題以及后續(xù)將敘述的問(wèn)題。第一,其允許音頻錄音。典型生產(chǎn)的后制時(shí)期與分布時(shí)期是與將顯示內(nèi)容的設(shè)置不相關(guān)。此一實(shí)情的一個(gè)通常結(jié)果為在此背景下以此方法產(chǎn)生的內(nèi)容是為不會(huì)過(guò)時(shí)的內(nèi)容,因此可適用于任何多揚(yáng)聲器設(shè)置,無(wú)論是現(xiàn)在或是未來(lái)。此一性能也可由高逼真度立體聲復(fù)制技術(shù)來(lái)達(dá)到。第二,其可正確地再生非常窄頻音源。這些音源會(huì)被編碼成個(gè)別的具有方向性元數(shù)據(jù)的音軌,允許使用少數(shù)的與音源的預(yù)期位置有關(guān)的揚(yáng)聲器的譯碼算法,例如基于振幅平移的二維或三維向量。相比之下,高逼真度立體聲復(fù)制需要高階的使用來(lái)達(dá)到相同的結(jié)果,如此造成相關(guān)音軌數(shù)目、數(shù)據(jù)量、及譯碼復(fù)雜度的關(guān)聯(lián)性增加。第三,此方法及裝置在大部分的情況下可提供一個(gè)大結(jié)合點(diǎn),因而放大最佳聲場(chǎng)重建的區(qū)域。此是以將有分于減少結(jié)合點(diǎn)的所有音頻部分予以分成第一組音軌來(lái)達(dá)成。例如圖8所示的實(shí)施例以及以下的說(shuō)明一段對(duì)話(huà)的正向聲音是被編碼成一具有聲音入射方向的信息的分離音軌,然而回聲的部分是被編碼成一組第一序列高逼真度立體聲復(fù)制音軌。因此,多數(shù)的聽(tīng)眾則感知到此音源的正向聲音就如同從正確的位置而來(lái)一般,大部分從與預(yù)期位置有關(guān)的揚(yáng)聲器而來(lái);因此,錯(cuò)相保護(hù)色(out-of-phase colouration)及居前效應(yīng)(precedence effect)可從正向聲音中被消除,將聲像定在正確的位置。第四,當(dāng)與一通道一音軌范例及高階高逼真度立體聲復(fù)制編碼比較時(shí),可在大部分多揚(yáng)聲器音軌編碼情況下降低以此方法編碼的數(shù)據(jù)量。此一實(shí)情是有利于存儲(chǔ)及分配的目的。數(shù)據(jù)量縮減的原因是為雙重的。在一方面,對(duì)于窄頻音頻播放列表的高度方向性音頻的分派是允許僅第1階高逼真度立體聲復(fù)制的使用,第1階高逼真度立體聲復(fù)制是用于聲景的剩余部分的重建,是由傳播、重建或非高度方向性音頻構(gòu)成。因此,第1階高逼真度立體聲復(fù)制群組中的四個(gè)音軌就已足夠。相比之下,正確地重建窄頻音源則需要高階高逼真度立體聲復(fù)制,其是需要例如第3階所用的16個(gè)音頻通道,或第4階所用的25個(gè)音頻通道。另一方面,同時(shí)播放的窄頻音源所需的數(shù)目在大多數(shù)情況下并不多;電影即為一個(gè)例子,在電影中,僅有對(duì)話(huà)及少數(shù)特別的聲音效應(yīng)會(huì)被指定至窄頻音頻播放列表。再者,窄頻音頻播放列表群組中所有的音頻是為一組長(zhǎng)度僅與音頻源的持續(xù)期間對(duì)應(yīng)的個(gè)別音軌。例如,對(duì)應(yīng)至在一場(chǎng)景中現(xiàn)三秒的車(chē)輛的音頻僅會(huì)持續(xù)三秒。因此,在一個(gè)欲產(chǎn)生以22. 2設(shè)定影片聲軌的電影應(yīng)用的例子中,一通道一音軌范例則需要M個(gè)音軌,而一第3階高逼真度立體聲復(fù)制編碼則需要16個(gè)音軌。相比之下,本發(fā)明提出的展示獨(dú)立格式僅需要4個(gè)全長(zhǎng)度音軌,外加一組不同長(zhǎng)度的分離的音軌,其是為了僅含蓋選定的窄頻音源的預(yù)期持續(xù)時(shí)間而被最小化。


圖1是顯示對(duì)給定的一組初始音軌選擇及編碼,最后以任意的展示設(shè)置而將其優(yōu)化地譯碼及播放。圖2是本發(fā)明提出的展示獨(dú)立格式示意圖,是具有兩音頻群組具有空間信息的窄頻音頻播放列表及高逼真度立體聲復(fù)制音軌。圖3是使用不同算法以處理兩音頻群組其中之一的譯碼器。圖4是顯示兩音頻群組可被再編碼的方法的一實(shí)施例。圖5是顯示展示獨(dú)立格式可以是基于音頻串流、而非是存儲(chǔ)于光盤(pán)或其它種類(lèi)存儲(chǔ)器中的完整音頻檔案的方法的一實(shí)施例。圖6是顯示輸入展示獨(dú)立格式至一譯碼器的方法的一實(shí)施例,其是可在任何展示設(shè)置中再生內(nèi)容。圖7是顯示某些旋轉(zhuǎn)程序的技術(shù)細(xì)節(jié),是對(duì)應(yīng)至在兩音頻群組上的簡(jiǎn)易操作。圖8是顯示于視聽(tīng)后制架構(gòu)中的方法的一實(shí)施例。圖9是顯示于虛擬場(chǎng)景中音頻的產(chǎn)生及后制的部分的方法的再一實(shí)施例。圖10是顯示以數(shù)字電影服務(wù)器的部分為方法的再一實(shí)施例。圖11是顯示在電影中的方法的一替代實(shí)施例,通過(guò)分配前將內(nèi)容解碼。
具體實(shí)施例方式圖1是顯示本發(fā)明的方法的一實(shí)施例,其對(duì)給定的一組初始音軌選擇及編碼,最后以任意的展示(exhibition)設(shè)置而將其優(yōu)化地譯碼及播放。意即,對(duì)于已給定的揚(yáng)聲器的位置,空間聲場(chǎng)可被盡可能的重建,以適合于可用的揚(yáng)聲器,以及盡可能地放大結(jié)合點(diǎn) (sweet-spot)。初始音頻可由任何音源形成,例如通過(guò)任何型式任何指向性圖案的麥克風(fēng)或頻率響應(yīng);通過(guò)高逼真度立體聲復(fù)制麥克風(fēng)的使用,高逼真度立體聲復(fù)制麥克風(fēng)是可傳送一組任何序列(order)或混成(mixture)序列的高逼真度立體聲復(fù)制信號(hào);或通過(guò)合成性產(chǎn)生的音頻的使用,或例如回聲房的效應(yīng)。選擇程序及編碼程序是由自初始音頻中產(chǎn)生兩群組音軌所構(gòu)成。第一群組是由需要窄化定位(narrow localization)的音頻所構(gòu)成,因一給定的高逼真度立體聲復(fù)制序列的方向性就已足夠,故第二群組則由剩余的音頻所構(gòu)成。被指定至第一群組的音頻信號(hào)是維持在單音軌,并伴隨著與其沿著時(shí)間的原始方向及其初始重放(playback)時(shí)間有關(guān)的空間元數(shù)據(jù)。選擇程序是為一用戶(hù)驅(qū)動(dòng)程序,縱使預(yù)設(shè)動(dòng)作可由某型式的初始音頻呈現(xiàn)。在一般的情況下(例如對(duì)非高逼真度立體聲復(fù)制音軌而言),用戶(hù)對(duì)每一初始音頻片段、其音源方向及音源型式做定義窄頻音源或高逼真度立體聲復(fù)制音源,是對(duì)應(yīng)至前述的編碼群組。 方向角度可通過(guò)例如與聽(tīng)眾相關(guān)的音源的方位角與仰角來(lái)定義,且可被確認(rèn)為固定數(shù)值或時(shí)變數(shù)據(jù)。若某些音軌并無(wú)提供方向,預(yù)設(shè)分派可被定義,例如,通過(guò)指定音軌至一給定的固定方向??蛇x擇性地,方向角度可由一傳播參數(shù)所伴隨。傳播(spread)以及窄(narrow) 的用詞在本文件中是可視為音源的感知聲像的角度寬幅。例如,量化傳播的方法是做用在區(qū)間
之間數(shù)值,其中數(shù)值0是代表完美地方向性音源(意即從一可識(shí)別的方向而來(lái)的音源),而數(shù)值1是代表具相同能量且從四面八方而來(lái)的音源。對(duì)某些型式的初始音軌,預(yù)設(shè)動(dòng)作可被定義。例如,音軌被辨識(shí)為立體聲對(duì) (stereo pairs),是可被指定至具高逼真度立體聲復(fù)制群組,高逼真度立體聲復(fù)制群組是具有分別為-30度方位角的L通道(L channel)及30度方位角的R通道(R channel)。被辨識(shí)為5. 1環(huán)繞聲道(ITU-R775-1)的音軌可被類(lèi)似地映射至_30度、0度、30度、-110度、 及110度方位角。最后,被辨識(shí)為第1階高逼真度立體聲復(fù)制(或B-格式,B-format)的音軌可被指定至無(wú)需方向性信息的高逼真度立體聲復(fù)制群組。如圖1所示的編碼程序,采用前述的用戶(hù)定義信息并輸出一具有空間信息的展示獨(dú)立音頻格式。而如圖2中所描述,第一群組的編碼程序的輸出是為一組具有對(duì)應(yīng)至不同音源的音頻信號(hào)的單音軌,也具有關(guān)聯(lián)性空間元數(shù)據(jù),并包含與一給定參考系統(tǒng)相關(guān)的原始方向,或音頻的傳播特性。第二音頻群組的轉(zhuǎn)換程序的輸出是為一選定序列的高逼真度立體聲復(fù)制的信號(hào)集合(例如,若第1階高逼真度立體聲復(fù)制被選定,則需4個(gè)音軌),是對(duì)應(yīng)至高逼真度立體聲復(fù)制群組中所有音源的混合。編碼程序的輸出接著被一譯碼器所使用,譯碼器是使用選定的展示設(shè)置的信息, 展示設(shè)置是用以對(duì)設(shè)置中的每一通道產(chǎn)生一音軌或音頻串流。圖3是使用不同算法以處理兩音頻群組其中之一的譯碼器。高逼真度立體聲復(fù)制音軌群組是被使用適合的高逼真度立體聲復(fù)制譯碼器所解碼,高逼真度立體聲復(fù)制譯碼器是用于特定的設(shè)置。在窄頻音頻播放列表中的音軌是被適用在此目的的算法所譯碼;這些使用每一音軌元數(shù)據(jù)空間信息來(lái)譯碼,正常來(lái)說(shuō),是使用非常少數(shù)每一音軌的預(yù)期位置有關(guān)的揚(yáng)聲器。一個(gè)如此算法的例子為VBAP (vector based Amplitude panning)。時(shí)間元數(shù)據(jù)是被用來(lái)在正確的時(shí)刻開(kāi)始播放此音頻。譯碼通道最后則被傳送至揚(yáng)聲器或耳機(jī)播放。圖4是顯示兩音頻群組可被再編碼的方法的再一實(shí)施例。一般的再編碼程序?qū)⑤斎胱鳛榘l音頻播放列表,窄頻音頻播放列表是具有關(guān)聯(lián)性方向元數(shù)據(jù)的N個(gè)不同的音軌,以及一給定序列P的一組高逼真度立體聲復(fù)制音軌,以及一混成A (例如,其可包含于第0階及第1階的所有音軌,但僅有兩個(gè)音軌對(duì)應(yīng)至第2階信號(hào))的給定型式。再編碼程序的輸出是為一窄頻音頻播放列,此窄頻音頻播放列表是包含M個(gè)具有具有關(guān)聯(lián)性方向元數(shù)據(jù)的音軌,以及一具有一混成B型式的給定序列Q的一組高逼真度立體聲復(fù)制音軌。在再編碼程序中,M,Q,B可分別與N,P,A不同。再編碼程序可被用于例如降低所具數(shù)據(jù)的數(shù)量。此可通過(guò)例如選擇一個(gè)或多個(gè)包含于窄頻音頻播放列表中的音軌并將其指定至高逼真度立體聲復(fù)制群組來(lái)達(dá)成,以將一單音轉(zhuǎn)換成高逼真度立體聲復(fù)制來(lái)達(dá)到與單音軌關(guān)聯(lián)的方向信息的使用。在此情況下,若以用于再編碼的窄頻音頻的高逼真度立體聲復(fù)制定位做為代價(jià),獲得M < N是有可能的。 為了相同的目標(biāo),降低高逼真度立體聲復(fù)制音軌是有可能的,例如,通過(guò)在平面展示設(shè)置中僅保留需要被播放的音軌。然而對(duì)于一給定或P的高逼真度立體聲復(fù)制信號(hào)的數(shù)目是為 (P+1) 2,平面設(shè)置的數(shù)目是減為1+2P。其它再編碼程序的應(yīng)用是為一給定窄頻音頻播放列表所需的同步音軌的減少。例如,在廣播應(yīng)用中大多希望能限制可被同時(shí)播放的音軌數(shù)目。再次,此可通過(guò)將窄頻音頻播放列表中的某些音軌指定至高逼真度立體聲復(fù)制群組。可選擇性地,窄頻音頻播放列表可包含用以描述其所包含的音頻的相關(guān)度的元數(shù)據(jù)(metadata),意即,描述每一將以窄頻音源的算法譯碼的音頻是有多重要。此元數(shù)據(jù)可被用于自動(dòng)地將最低相關(guān)音頻指定至高逼真度立體聲復(fù)制群組?!倬幋a程序的替代性使用是可簡(jiǎn)單的為允許用戶(hù)將窄頻音頻播放列表中的音頻指定至高逼真度立體聲復(fù)制群組,或?yàn)榱嗣烙^而改變高逼真度立體聲復(fù)制群組的序列及混成型式。其也可將于高逼真度立體聲復(fù)制群組中的音頻指定至窄頻音頻播放列表一個(gè)可能的事件為僅選擇第0階音頻的部分并手動(dòng)連結(jié)其空間元數(shù)據(jù);另一個(gè)可能性為使用算法以由自高逼真度立體聲復(fù)制音軌而演繹出音源位置,例如狄拉克算法(DirAC algorithm)。圖5是顯示本發(fā)明的再一實(shí)施例,其中所提出的展示獨(dú)立格式可以是基于音頻串流,而非是存儲(chǔ)于光盤(pán)或其它種類(lèi)存儲(chǔ)器中的完整音頻檔案。在廣播的事態(tài)中,音頻頻寬是有限且固定的,而因此音頻通道的數(shù)目可被同時(shí)串流。此一提出的方法是由下述兩點(diǎn)所構(gòu)成第一,在窄頻音頻串流及高逼真度立體聲復(fù)制串流的兩群組之間劃分有效的音頻串流; 第二,將中間型檔案基底展示獨(dú)立格式(file-based exhibition-independent format)編碼成有限數(shù)目的串流。此再編碼程序是使用于先前段落中所解釋說(shuō)明的技術(shù),當(dāng)有必要時(shí)減少做為窄頻音頻部分(通過(guò)將低度相關(guān)音軌再指定至高逼真度立體聲復(fù)制群組)以及群組部分(通過(guò)移除高逼真度立體聲復(fù)制成分)的同步音軌的數(shù)目。音頻串流具有更進(jìn)一步的特定性,例如需于連續(xù)串流中連接窄頻音軌,以及在有效串流設(shè)備中對(duì)窄頻音頻方向性元數(shù)據(jù)再編碼。如果音頻串流格式不允許串接此方向性元數(shù)據(jù),則應(yīng)保留一信號(hào)音軌以輸送此以一適合方式編碼的元數(shù)據(jù)。接下來(lái)的簡(jiǎn)單示例將用以對(duì)此做更詳細(xì)的解釋??紤]在本發(fā)明所提出的展示獨(dú)立格式中的一電影配音,是使用第1階高逼真度立體聲復(fù)制G通道)以及最大4個(gè)同步通道的窄頻音頻播放列表。此電影配音將被使用僅6通道的數(shù)字電視(digital TV)來(lái)串接。如圖5所示,此再編碼是使用3個(gè)高逼真度立體聲復(fù)制通道(移除Z通道)以及2個(gè)窄頻音頻通道(意即,再指定一最大為2的同步音軌至高逼真度立體聲復(fù)制群組)??蛇x擇性地,本發(fā)明所提出的展示獨(dú)立格式可做音頻壓縮用。此是可用于本發(fā)明所提出的展示獨(dú)立格式的兩個(gè)特點(diǎn)(flavours)檔案基底或串流基底。當(dāng)心理聲學(xué)基底失真格式被使用時(shí),上述的壓縮可能會(huì)影響空間重建的質(zhì)量。圖6是顯示本發(fā)明的方法的再一實(shí)施例,其中,展示獨(dú)立格式是輸入至一譯碼器, 其是可于任何展示設(shè)置中再生內(nèi)容。展示設(shè)置的規(guī)格可由數(shù)種不同的方法來(lái)完成。譯碼器可具有標(biāo)準(zhǔn)預(yù)設(shè),例如5. 1環(huán)繞聲道(ITU-R775-1),用戶(hù)可以輕易地選擇以與用戶(hù)的展示設(shè)置相配。此一選擇是可選擇性地允許一些調(diào)整,以對(duì)在用戶(hù)的特定規(guī)配置中揚(yáng)聲器的位置進(jìn)行微調(diào)。可選擇性地,用戶(hù)是可使用某些可對(duì)每一揚(yáng)聲器的位置做定位的自動(dòng)偵測(cè)系統(tǒng),例如,可通過(guò)音頻、超聲波、或紅外線(xiàn)技術(shù)。此展示設(shè)置規(guī)格可被無(wú)限次的再配置,允許用戶(hù)適應(yīng)任何現(xiàn)在或未來(lái)的多揚(yáng)聲器設(shè)置。譯碼器是可具有多組輸出,因而不同的譯碼程序可在同一時(shí)間被完成,為了能在不同設(shè)置中可同步播放。就理想而言,譯碼是在任何可能的播放系統(tǒng)的等化之前被完成。如果再生系統(tǒng)是為一耳機(jī),解碼是由標(biāo)準(zhǔn)雙聲技術(shù)(Mandard Binaural ^Technology)來(lái)達(dá)成。使用一個(gè)或多個(gè)頭部相關(guān)轉(zhuǎn)移函數(shù)(Head-Related Transfer Functions, HRTF)的數(shù)據(jù)庫(kù),其是可能產(chǎn)生使用適用在本方法中的兩音頻群組的算法的空間化聲音兩音頻群組是為窄頻音頻播放列表及高逼真度立體聲復(fù)制音軌。其一般由如下的二步驟所達(dá)成首先以上述的算法對(duì)虛擬多揚(yáng)聲器做解碼,再將每一通道與對(duì)應(yīng)至虛擬揚(yáng)聲器的位置的HRTF做旋繞(convolving)。對(duì)于多揚(yáng)聲器設(shè)置或耳機(jī)的展示而言,本方法的再一實(shí)施例是允許在一展示階段中的全聲景做最終旋轉(zhuǎn)。此在數(shù)種不同方法中是為實(shí)用。在一應(yīng)用中,一載耳機(jī)的用戶(hù)是可具有一頭部追蹤機(jī)制,頭部追蹤機(jī)制是測(cè)量與用戶(hù)根據(jù)全聲景而旋轉(zhuǎn)的頭部的方位有關(guān)的參數(shù)。圖7是顯示某些旋轉(zhuǎn)程序的技術(shù)細(xì)節(jié),是在兩音頻群組上對(duì)應(yīng)至簡(jiǎn)易操作。高逼真度立體聲復(fù)制音軌的旋轉(zhuǎn)是由應(yīng)用每一高逼真度立體聲復(fù)制序列的不同旋轉(zhuǎn)矩陣來(lái)實(shí)現(xiàn),這是一已知的程序。另一方面,與每一在窄頻音頻播放列表中的音軌相關(guān)的空間元數(shù)據(jù)可被修正,是通過(guò)簡(jiǎn)單的計(jì)算音源方位角以及仰角,其是為在一給定的方位上的聽(tīng)眾所能感知的。同樣地,此為一簡(jiǎn)單的標(biāo)準(zhǔn)計(jì)算。圖8是顯示于視聽(tīng)后制架構(gòu)中的方法的一實(shí)施例。一用戶(hù)擁有所有的音頻在他的后制軟件中,后制軟件可為一數(shù)字音頻工作站(Digital Audio Workstation)。用戶(hù)是使用標(biāo)準(zhǔn)外掛程序(standard plug-in)或?qū)S猛鈷斐绦?dedicated plug-in)以明確地確認(rèn)每一需要被定位的音源的方向。為產(chǎn)生本發(fā)明所提出的中間型展示獨(dú)立格式,其是選擇在單音軌播放列表中將被編碼的音頻,以及在高逼真度立體聲復(fù)制群組中將被編碼的音頻。此一指定可由不同種方法來(lái)完成。在一實(shí)施例中,用戶(hù)通過(guò)一外掛程序指定一指向性系數(shù)給每一音源;隨即被用來(lái)自動(dòng)指定所有具方向性系數(shù)的音源至一窄頻音頻播放列表, 此系數(shù)是高于一給定的數(shù)值。在一替代實(shí)施例中,某些預(yù)設(shè)指定是由軟件來(lái)實(shí)現(xiàn);例如,所有音頻的回聲部分,也包括原始以高逼真度立體聲復(fù)制麥克風(fēng)記錄的音頻,可被指定至高逼真度立體聲復(fù)制群組,除非用戶(hù)指定至其它地方。可作為選擇的是,所有的指定都由手動(dòng)完成。當(dāng)指定完成時(shí),此軟件是使用專(zhuān)用外掛程序來(lái)產(chǎn)生窄頻音頻播放列表以及高逼真度立體聲復(fù)制音軌。在此程序中,代表窄頻音頻播放列表中的空間性質(zhì)的元數(shù)據(jù)是被編碼。 同樣地,被指定至高逼真度立體聲復(fù)制群組的音源的方向、以及隨選出的傳播方向是被用來(lái)做從單音或立體聲至高逼真度立體聲復(fù)制的轉(zhuǎn)換,其是使用標(biāo)準(zhǔn)算法。因此,音頻后制階段的輸出是為一中間型展示獨(dú)立格式,此中間型展示獨(dú)立格式是具有窄頻音頻播放列表以及一組給定序列及混成的高逼真度立體聲復(fù)制通道。在此實(shí)施例中,是有助于未來(lái)的再定版(re-versioning)以產(chǎn)生多于一組的高逼真度立體聲復(fù)制通道。例如,在即將產(chǎn)生的不同語(yǔ)言版本的某些電影中,在一第二組高逼真度立體聲復(fù)制音軌中是很有用處的,而此第二組高逼真度立體聲復(fù)制音軌中的所有音頻是與對(duì)話(huà)有關(guān),包含對(duì)話(huà)的回聲部分。通過(guò)使用此方法,唯一因需要產(chǎn)生一不同語(yǔ)言版本的改變是包括取代包含于窄頻音頻播放列表的干對(duì)話(huà)(dry dialogue)、以及包含于第二組高逼真度立體聲復(fù)制音軌中的對(duì)話(huà)的回聲部分。圖9是顯示于虛擬場(chǎng)景中音頻的產(chǎn)生及后制的部分的方法的再一實(shí)施例(例如, 一動(dòng)畫(huà)電影或3D游戲)。在虛擬場(chǎng)景中,與音源以及聽(tīng)眾的位置及方向有關(guān)的信息是有用的。三維幾何(3D geometry)場(chǎng)景的信息以及其中所呈現(xiàn)的材料可隨意地被利用?;芈暱呻S意地并自動(dòng)地通過(guò)空間聲音模擬被計(jì)算。在此文件中,將場(chǎng)景編碼成本發(fā)明所提出的中間型展示獨(dú)立格式的編碼程序是可被簡(jiǎn)化。一方面,是有可能將音軌指定至每一音源,并對(duì)與聽(tīng)眾有關(guān)的每一時(shí)刻的位置做編碼,其是僅通過(guò)對(duì)各自的位置及方向做自動(dòng)地演繹,而無(wú)需之后在后制中做確認(rèn)。其也可決定于高逼真度立體聲復(fù)制群組中有多少的回聲需要被編碼,通過(guò)將每一音源的正向聲音與特定數(shù)目的第一聲音反射指定至窄頻音頻播放列表, 以及將回聲的剩余部指定至高逼真度立體聲復(fù)制群組。圖10是顯示以數(shù)字電影服務(wù)器的部分為方法的再一實(shí)施例。在此情況中,相同的音頻內(nèi)容是可以前述的展示獨(dú)立格式而被分配至電影院劇場(chǎng),是由窄頻音頻播放列表加上一組高逼真度立體聲復(fù)制音軌所構(gòu)成。每一劇場(chǎng)可具有一具備每一特定多揚(yáng)聲器設(shè)置的規(guī)格的譯碼器,其是可由手動(dòng)或由某種自動(dòng)偵測(cè)機(jī)制而輸入。尤其,設(shè)置的自動(dòng)偵測(cè)可輕易地被嵌入于系統(tǒng)中,并且,同時(shí)計(jì)算每一揚(yáng)聲器所需的等化(equalization)。此一步驟可由測(cè)量于一已知?jiǎng)?chǎng)中的每一揚(yáng)聲器的脈沖響應(yīng)所構(gòu)成,以演繹劇場(chǎng)位置以及所需的并用于對(duì)其做等化的反向?yàn)V波器。脈沖響應(yīng)的測(cè)量是可從現(xiàn)有的多種技術(shù)來(lái)完成(例如正弦掃描 sine swe印,或最大長(zhǎng)度序列MLS kquence),而相對(duì)應(yīng)的揚(yáng)聲器位置的演繹方法是為一無(wú)需經(jīng)常演繹的程序,但僅于當(dāng)空間的特征或設(shè)置改變時(shí)。在任何情況下,一旦譯碼器具有設(shè)置的規(guī)格,隨后內(nèi)容可被最優(yōu)化解碼成一通道一音軌格式,以準(zhǔn)備被播放。圖11是顯示于電影中的方法的一替代實(shí)施例,通過(guò)分配前將內(nèi)容解碼。在此情況下,譯碼器需知道每一電影設(shè)置的規(guī)格,因此內(nèi)容的多個(gè)一通道一音軌版本即可被產(chǎn)生,隨后則被分配。此一應(yīng)用是相當(dāng)有用的,例如,將內(nèi)容傳送一不具有此處提出的展示獨(dú)立格式兼容的譯碼器的電影。而在分配前先檢查或保證適用于一特定設(shè)置的音頻的質(zhì)量也可是相當(dāng)有用的。在本方法的再一實(shí)施例中,某些窄頻音頻播放列表可被再編輯,且無(wú)需憑借原始的主要計(jì)劃。例如,某些用以描述音源位置或其傳播的元數(shù)據(jù)可被修改。當(dāng)前述的說(shuō)明已配合特定實(shí)施例加以附圖及描述后,本領(lǐng)域的普通技術(shù)人員可由本說(shuō)明書(shū)所公開(kāi)的內(nèi)容輕易地了解本發(fā)明的其它優(yōu)點(diǎn)與功效。此外,本發(fā)明也可通過(guò)其它不同的具體實(shí)施例加以施行或應(yīng)用,且本說(shuō)明書(shū)中的各項(xiàng)細(xì)節(jié)也可基于不同觀點(diǎn)與應(yīng)用, 而在不悖離本發(fā)明的精神下進(jìn)行各種修飾與變更。上述實(shí)施例僅是為了方便說(shuō)明而舉例而已,本發(fā)明所主張的權(quán)利范圍自應(yīng)以權(quán)利要求所述為準(zhǔn),而非僅限于上述實(shí)施例。
權(quán)利要求
1.一種將音頻信號(hào)及相關(guān)空間信息編碼至一再生配置獨(dú)立格式的方法,其特征在于, 該方法包含(a)將一第一組音頻信號(hào)指定至一第一群組,并將該第一群組編碼成一組具關(guān)聯(lián)性元數(shù)據(jù)的單音軌,該關(guān)聯(lián)性元數(shù)據(jù)是描述與記錄位置有關(guān)的每一原始音軌的方向及其重放時(shí)間;(b)將一第二組音頻信號(hào)指定至一第二群組,并將該第二群組編碼成至少一組一給定序列及混成序列的高逼真度立體聲復(fù)制音軌;以及(c)產(chǎn)生包含該第一組音頻信號(hào)及該第二組音頻信號(hào)的兩群組音軌。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包含將與該組單音軌中的與音軌相關(guān)的傳播參數(shù)編碼。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包含將與該組單音軌中的與音軌相關(guān)的更進(jìn)一步方向參數(shù)編碼。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包含從任一包含與音軌有關(guān)的音源的場(chǎng)景的三維表示法推導(dǎo)出該第一組中的該信號(hào)的起源的方向,以及記錄位置。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包含根據(jù)預(yù)設(shè)規(guī)則指定該第一組中的音軌的該信號(hào)的起源的方向。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包含將每一該第一組中每一音軌的方向參數(shù)編碼成固定常數(shù)值或時(shí)變值。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包含將用以描述使用格式的規(guī)格的元數(shù)據(jù)編碼,該元數(shù)據(jù)包括高逼真度立體聲復(fù)制序列、混成序列型式、音軌關(guān)聯(lián)增益、及音軌序列。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包含將與高逼真度立體聲復(fù)制音軌相關(guān)的該初始重放時(shí)間予以編碼。
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包含將具有關(guān)聯(lián)性方向數(shù)據(jù)編碼成一給定序列及混成序列的該高逼真度立體聲復(fù)制音軌。
10.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包含將任何輸入多通道的信號(hào)編碼成一給定序列及混成序列的該高逼真度立體聲復(fù)制音軌。
11.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包含將任何序列及混成序列的任何輸入高逼真度立體聲復(fù)制信號(hào)編碼成一可能不同的給定的序列及混成序列的高逼真度立體聲復(fù)制音軌。
12.如權(quán)利要求1所述的方法,其特征在于,還包含再生配置獨(dú)立格式的再編碼,該再編碼是至少包含下列之一(a)指定該組單音軌中的音軌至該高逼真度立體聲復(fù)制集合;(b)將部分在高逼真度立體聲復(fù)制集合中的音頻指定至單音軌集合,是可能包含已從高逼真度立體聲復(fù)制信號(hào)推導(dǎo)出的方向信息;(c)改變音軌的該高逼真度立體聲復(fù)制集合的序列或混成序列;(d)修改與該組單音軌關(guān)聯(lián)的該方向元數(shù)據(jù);(e)通過(guò)如旋轉(zhuǎn)及縮放的操作而修改高逼真度立體聲復(fù)制音軌。
13.根據(jù)權(quán)利要求12所述的方法,其特征在于,還包含將再生配置獨(dú)立格式再編碼成適合用于廣播的格式,該再編碼是滿(mǎn)足下列限制一連續(xù)音頻串流的固定數(shù)字、包含于再生配置獨(dú)立格式的元數(shù)據(jù)的傳輸?shù)挠行f(xié)議的使用。
14.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包含將再生配置獨(dú)立格式譯碼至一給定的多揚(yáng)聲器配置,該譯碼是使用該多揚(yáng)聲器位置的一規(guī)格以用于(a)以適用于窄頻音源的算法將該組單音軌解碼;(b)通過(guò)適用于該音軌序列及混成序列及特定設(shè)置的算法將該高逼真度立體聲復(fù)制集合予以譯碼。
15.根據(jù)權(quán)利要求14所述的方法,其特征在于,還包含傳播參數(shù)的使用、及可能其它與單音軌集合相關(guān)的空間元數(shù)據(jù)以使用適用于特定傳播的譯碼算法。
16.根據(jù)權(quán)利要求14所述的方法,其特征在于,還包含標(biāo)準(zhǔn)再生配置設(shè)置預(yù)設(shè)的使用, 標(biāo)準(zhǔn)再生配置設(shè)置預(yù)設(shè)的使用包括立體聲及5. 1環(huán)繞聲道。
17.根據(jù)權(quán)利要求14所述的方法,其特征在于,還包含通過(guò)標(biāo)準(zhǔn)雙聲技術(shù)對(duì)耳機(jī)譯碼, 是使用頭部相關(guān)轉(zhuǎn)移函數(shù)的數(shù)據(jù)庫(kù)。
18.根據(jù)權(quán)利要求14所述的方法,其特征在于,還包含使用旋轉(zhuǎn)控制參數(shù)以實(shí)現(xiàn)一全聲景的旋轉(zhuǎn),其中該控制參數(shù)由頭部追蹤裝置產(chǎn)生。
19.根據(jù)權(quán)利要求14所述的方法,其特征在于,還包含使用自動(dòng)推導(dǎo)揚(yáng)聲器的位置的技術(shù),以定義譯碼器所使用的設(shè)定規(guī)格。
20.根據(jù)權(quán)利要求14或17所述的方法,其特征在于,其中解碼后的輸出是被存儲(chǔ)成一音軌群組,而非直接重放。
21.根據(jù)權(quán)利要求1、12、13或20所述的方法,其特征在于,是將全部或部分的音頻信號(hào)編碼成壓縮音頻格式。
22.—種將音頻信號(hào)及相關(guān)空間信息編碼至一再生配置獨(dú)立格式的編碼器,其特征在于,該編碼器包括(a)一將一第一組音頻信號(hào)指定至一第一群組,并將該第一群組編碼成一具有方向信息及初始重放信息的單音軌集合的編碼器;(b)一將一第二組音頻信號(hào)指定至一第二群組,并將該第二群組編碼成一任何序列及混成的高逼真度立體聲復(fù)制音軌集合的編碼器;(c)一產(chǎn)生包含該第一組音頻信號(hào)及該第二組音頻信號(hào)的兩群組音軌的編碼器。
23.一種在一輸入再生配置獨(dú)立格式中對(duì)音頻操縱及再編碼的音頻再編碼器及修改器,其特征在于,藉此其輸出是通過(guò)依據(jù)權(quán)利要求12所述的方法予以修改,其中該再編碼器適用于下列任一(a)指定該組單音軌中的音軌至該高逼真度立體聲復(fù)制集合;(b)將部分在高逼真度立體聲復(fù)制集合的音頻指定至單音軌,是可能包含已從高逼真度立體聲復(fù)制信號(hào)推導(dǎo)出的方向信息;(c)改變音軌的該高逼真度立體聲復(fù)制集合的序列或混成序列;(d)與該組單音軌關(guān)聯(lián)的該方向元數(shù)據(jù)的修改;(e)高逼真度立體聲復(fù)制音軌的修改,是通過(guò)例如旋轉(zhuǎn)及縮放的操作。
24.一種將再生配置獨(dú)立格式譯碼至一給定的N通道再生系統(tǒng)的音頻譯碼器,其特征在于,該再生配置獨(dú)立格式是依據(jù)權(quán)利要求14所述的方法所產(chǎn)生,該音頻譯碼器包括(a)一基于再生設(shè)置規(guī)格并將一具有方向信息及初始重放信息的單音軌集合編碼至N 音頻通道的譯碼器,(b)一基于再生設(shè)置規(guī)格并將一高逼真度立體聲復(fù)制音軌集合編碼至N音頻通道的譯碼器,(c)一將前述的二譯碼器的輸出混合的混合器,前述的二譯碼器是用于產(chǎn)生預(yù)備重放或存儲(chǔ)的N輸出音頻通道。
25.—種系統(tǒng),其特征在于,用于一再生配置獨(dú)立格式中對(duì)空間音頻編碼及再編碼,以及對(duì)任何多揚(yáng)聲器配置譯碼及重放,或用于耳機(jī),該系統(tǒng)包括(a)一音頻編碼器,用以將一組音頻信號(hào)及相關(guān)空間信息編碼至一根據(jù)權(quán)利要求22所述的再生配置獨(dú)立格式,(b)一音頻再編碼器及音頻修改器,用以于一根據(jù)權(quán)利要求23所述的輸入再生配置獨(dú)立格式中對(duì)音頻操縱及再編碼,(c)一根據(jù)權(quán)利要求M所述的音頻譯碼器,用以將再生配置獨(dú)立格式譯碼至一給定的再生配置系統(tǒng),其為一多揚(yáng)聲器配置或耳機(jī)。
26.一種計(jì)算機(jī)程序,其特征在于,是用于當(dāng)一計(jì)算機(jī)運(yùn)作時(shí)執(zhí)行依據(jù)權(quán)利要求1至21 的任一項(xiàng)所述的方法。
全文摘要
本發(fā)明公開(kāi)了一種無(wú)需依據(jù)展示設(shè)置即可將具有空間信息的音頻信號(hào)編碼的方法及裝置,以及,對(duì)任何給定的展示設(shè)置做最優(yōu)化譯碼及播放,將結(jié)合點(diǎn)區(qū)域做最大化,且包括在不同高度的揚(yáng)聲器及耳機(jī)的設(shè)置。需要精準(zhǔn)的定位的音頻部分被編碼成一組具有相關(guān)方向性參數(shù)的單音軌,而剩余的音頻則被編碼成一組選定序列及混成的高逼真度立體聲復(fù)制音軌。在一給定展示系統(tǒng)的規(guī)格中,通過(guò)對(duì)每一指定群組使用不同的譯碼方法,展示獨(dú)立格式被譯碼以適應(yīng)特定的系統(tǒng)。
文檔編號(hào)H04S3/00GK102326417SQ200980153195
公開(kāi)日2012年1月18日 申請(qǐng)日期2009年12月29日 優(yōu)先權(quán)日2008年12月30日
發(fā)明者保羅·阿盧密·奧寶, 安東尼奧·瑪?shù)貧W斯·索列 申請(qǐng)人:龐培法布拉大學(xué)巴塞隆納媒體基金會(huì)
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
巴林左旗| 英德市| 环江| 弥渡县| 得荣县| 横峰县| 海伦市| 石首市| 江阴市| 镇雄县| 合阳县| 达拉特旗| 扎鲁特旗| 九寨沟县| 福海县| 长垣县| 桦川县| 溆浦县| 吴江市| 蓝田县| 荣昌县| 增城市| 图们市| 古田县| 斗六市| 长葛市| 蓝田县| 蛟河市| 政和县| 闽侯县| 龙海市| 兴隆县| 无为县| 格尔木市| 惠水县| 嘉祥县| 刚察县| 莱阳市| 灵武市| 康乐县| 高淳县|