欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用以利用平均值而基于下混信號表示形態(tài)和與下混信號表示形態(tài)相關(guān)聯(lián)的參數(shù)側(cè)邊信息...的制作方法

文檔序號:2824908閱讀:189來源:國知局
專利名稱:用以利用平均值而基于下混信號表示形態(tài)和與下混信號表示形態(tài)相關(guān)聯(lián)的參數(shù)側(cè)邊信息 ...的制作方法
技術(shù)領(lǐng)域
依據(jù)本發(fā)明的實(shí)施例涉及 一種用以基于一下混信號表示形態(tài)及與該下混信號表示形態(tài)相關(guān)聯(lián)的一參數(shù)側(cè)邊信息來提供用于提供一上混信號表示形態(tài)的一或多個(gè)經(jīng)調(diào)整參數(shù)的裝置。依據(jù)本發(fā)明的另一實(shí)施例涉及一種用以基于該下混信號表示形態(tài)及該參數(shù)側(cè)邊信息來提供一上混信號表不形態(tài)的裝置。依據(jù)本發(fā)明的另一實(shí)施例涉及一種用以基于一下混信號表示形態(tài)及與該下混信號表示形態(tài)相關(guān)聯(lián)的一參數(shù)側(cè)邊信息來提供用于提供一上混信號表示形態(tài)的一或多個(gè)經(jīng)調(diào)整參數(shù)的方法。依據(jù)本發(fā)明的另一實(shí)施例涉及一種用以執(zhí)行該方法的計(jì)算機(jī)程序。依據(jù)本發(fā)明的若干實(shí)施例涉及一種用于MPEG SAOC的失真控制參數(shù)限制方案。
背景技術(shù)
于音頻處理、音頻傳輸及音頻儲存領(lǐng)域,逐漸需要處理多聲道內(nèi)容來改良聽覺感受。多聲道音頻內(nèi)容的使用給使用者帶來顯著改進(jìn)。舉例言的,可獲得三維空間聽覺感受而為使用者帶來娛樂效果的滿足與改善。但多聲道音頻內(nèi)容也可用于職業(yè)環(huán)境,例如用于電話會議應(yīng)用,原因在于通過使用多聲道音頻回放可改良發(fā)話者的可懂性(易于為人所了解)。但也期望在音頻質(zhì)量與位率需求間獲得良好折衷,來避免因多聲道應(yīng)用造成額外過度資源負(fù)荷。近來,已經(jīng)提示用于含有多音頻對象的音頻場景(audio scene)進(jìn)行位率有效的傳輸及/或儲存的參數(shù)技術(shù),例如雙耳線索編碼(類別I)(例如參考參考文獻(xiàn)[I])、聯(lián)合來源編碼(例如參考參考文獻(xiàn)[2])、及MPEG空間音頻對象編碼(例如參考參考文獻(xiàn)[3]、[4]、)。若執(zhí)行極端對象的呈現(xiàn)(rendering),則組合在接收端的使用者互動,此等技術(shù)可導(dǎo)致輸出信號的低音頻質(zhì)量(例如參考參考文獻(xiàn)[6])。此等技術(shù)針對聽覺上重建期望的輸出音頻場景而非通過波形匹配。圖8顯示此種系統(tǒng)(此處MPEG SA0C)的系統(tǒng)概述。圖8所示MPEG SAOC系統(tǒng)800包含一 SAOC編碼器810及一 SAOC解碼器820。SAOC編碼器810接收多個(gè)對象信號X1至xN,其例如可表示為時(shí)域信號或時(shí)頻域信號(例如呈傅立葉型變換的一變換系數(shù)集合形式,或呈QMF子頻帶信號形式)。SAOC編碼器810典型地也接收下混系數(shù)(I1至dN,其與對象信號X1至xN相關(guān)聯(lián)。下混系數(shù)的分開集合可供下混信號的各聲道利用。SAOC編碼器810典型地被配置為經(jīng)由依據(jù)相關(guān)聯(lián)的下混系數(shù)Cl1至dN而組合對象信號X1至xN來獲得一下混信號聲道。典型地,下混聲道比對象信號X1至xN少。為了允許(至少近似)于SAOC解碼器820端的對象信號的分離(或分開處理),SAOC編碼器810提供該一或多個(gè)下混信號(標(biāo)示為下混聲道)812及一側(cè)邊信息814 二者。側(cè)邊信息814描述的對象信號X1至xN特性來允許解碼器端的對象專一性處理。SAOC解碼器820被配置為接收該一或多個(gè)下混信號812及側(cè)邊信息814。又,SAOC解碼器820典型地被配置為接收一使用者互動信息及/或一使用者控制信息822,其描述期望的呈現(xiàn)設(shè)定值。舉例言之,使用者互動信息/使用者控制信息822可描述一揚(yáng)聲器設(shè)定值及提供對象信號X1至xN的該等對象的期望空間配置。SAOC解碼器820被配置為提供例如多個(gè)已解碼上混聲道信號&至, 上混聲道信
號例如可與多揚(yáng)聲器呈現(xiàn)配置的個(gè)別揚(yáng)聲器相關(guān)聯(lián)。SAOC解碼器820可例如包含一對象分離器820a,其被配置為基于該一或多個(gè)下混信號812及側(cè)邊信息814,重建(至少近似)對象信號X1至xN,由此獲得已重建對象信號820b。但已重建對象信號820b可能略為偏離原先 對象信號X1至xN,例如原因在于由于位率限制,側(cè)邊信息814并非相當(dāng)足夠用于完好重建。SAOC解碼器820可進(jìn)一步包含一混合器820c,其可被配置為接收已重建對象信號820b及
使用者互動信息/使用者控制信息822,及基于此而提供上混聲道信號&至Vv。混合器820c
可被配置為使用該使用者互動信息/使用者控制信息822而判定個(gè)別已重建對象信號820b
對上混聲道信號&至的貢獻(xiàn)。使用者互動信息/使用者控制信息822例如可包含呈現(xiàn)參
數(shù)(也標(biāo)示為呈現(xiàn)系數(shù))其判定個(gè)別已重建對象信號822對上混聲道信號&至74/的貢獻(xiàn)。但須注意于多個(gè)實(shí)施例中,對象的分離于圖8以對象分離器820a指示,及混合于圖8以混合器820c指示以單一步驟執(zhí)行。為了實(shí)現(xiàn)此項(xiàng)目的,總參數(shù)可經(jīng)運(yùn)算,其描述該
一或多個(gè)下混信號812映射至上混聲道信號&至;w的直接映射關(guān)系。此等參數(shù)可基于側(cè)邊
信息及使用者互動信息/使用者控制信息820運(yùn)算?,F(xiàn)在參考圖9a、圖9b及圖9c,將描述用以基于一下混信號表示形態(tài)及對象相關(guān)側(cè)邊信息來提供一上混信號表示形態(tài)的不同的裝置。須注意該對象相關(guān)側(cè)邊信息為與該下混信號相關(guān)聯(lián)的側(cè)邊信息的實(shí)例。圖9a顯示一種包含SAOC解碼器920的MPEG SAOC系統(tǒng)900的方塊示意圖。SAOC解碼器920包含一對象解碼器922及一混合器/呈現(xiàn)器926作為分開功能方塊。對象解碼器922依據(jù)該下混信號表示形態(tài)(例如呈以時(shí)域或時(shí)頻域表示的一或多個(gè)下混信號形式)及該對象相關(guān)側(cè)邊信息(例如呈對象元數(shù)據(jù)(meta data)形式)而提供多個(gè)已重建的對象信號924。混合器/呈現(xiàn)器926接收與多個(gè)N個(gè)對象相關(guān)聯(lián)的已重建的對象信號924,及基于此且系基于該呈現(xiàn)信息而提供一或多個(gè)上混聲道信號928。于該SAOC解碼器920,對象信號924的提取與混合/呈現(xiàn)分開進(jìn)行,其允許對象解碼功能與混合/呈現(xiàn)功能的分離,但帶來相當(dāng)高的運(yùn)算復(fù)雜度?,F(xiàn)在參考圖%,將簡短討論另一種MPEG SAOC系統(tǒng)930,其包含一 SAOC解碼器950。SAOC解碼器950依據(jù)該下混信號表示形態(tài)(例如呈一或多個(gè)下混信號形式)及該對象相關(guān)側(cè)邊信息(例如呈對象元數(shù)據(jù)(meta data)形式)而提供多個(gè)上混聲道信號958。SAOC解碼器950包含對象解碼器與混合器/呈現(xiàn)器的組合,其被配置為于聯(lián)合混合程序獲得上混聲道信號958,而未分開對象解碼與混合/呈現(xiàn),其中用于該聯(lián)合上混處理的參數(shù)取決于該對象相關(guān)側(cè)邊信息及該呈現(xiàn)信息。該聯(lián)合上混處理也依據(jù)下混信息,該下混信息被視為該對象相關(guān)側(cè)邊信息的一部分。綜上所述,上混聲道信號928、958的提供可于一步驟式處理或二步驟式處理執(zhí)行?,F(xiàn)在參考圖9c,將描述一種MPEG SAOC系統(tǒng)960。SAOC系統(tǒng)960包含SAOC至MPEG環(huán)繞轉(zhuǎn)碼器980,而非SAOC解碼器。SAOC至MPEG環(huán)繞轉(zhuǎn)碼器包含一側(cè)邊信息轉(zhuǎn)碼器982,其被配置為接收該對象相關(guān)側(cè)邊信息(例如呈對象元數(shù)據(jù)形式)及選擇性地,接收一或多個(gè)下混信號的信息及呈現(xiàn)信息。該側(cè)邊信息轉(zhuǎn)碼器也被配置為基于所接收的數(shù)據(jù)而提供MPEG環(huán)繞側(cè)邊信息(例如呈MPEG環(huán)繞位流形式)。據(jù)此,側(cè)邊信息轉(zhuǎn)碼器982被配置為考慮呈現(xiàn)信息及選擇性地,考慮該一或多個(gè)下混信號內(nèi)容的相關(guān)信息,而將接收自該對象編碼器的一對象相關(guān)(參數(shù))側(cè)邊信息變換成一聲道相關(guān)(參數(shù))側(cè)邊信息。
選擇性地,SAOC至MPEG環(huán)繞轉(zhuǎn)碼器980可被配置為操控例如由下混信號表示形態(tài)所描述的該一或多個(gè)下混信號而獲得經(jīng)操控的下混信號表示形態(tài)988。但可刪除下混信號操控器986,使得SAOC至MPEG環(huán)繞轉(zhuǎn)碼器980的輸出下混信號表示形態(tài)988與SAOC至MPEG環(huán)繞轉(zhuǎn)碼器的輸入下混信號表示形態(tài)相同。若聲道相關(guān)的MPEG環(huán)繞側(cè)邊信息984不允許基于SAOC至MPEG環(huán)繞轉(zhuǎn)碼器980的輸入下混信號表示形態(tài)提供期望的聽覺印象(于某些呈現(xiàn)群(rendering constellations)可能為此種情況),則可使用下混信號操控器986。
據(jù)此,SAOC至MPEG環(huán)繞轉(zhuǎn)碼器980提供下混信號表示形態(tài)988及MPEG環(huán)繞位流984,使得使用接收MPEG環(huán)繞位流984及下混信號表示形態(tài)988的MPEG環(huán)繞解碼器,可產(chǎn)生多個(gè)上混聲道信號,其表示依據(jù)輸入該SAOC至MPEG環(huán)繞轉(zhuǎn)碼器980的呈現(xiàn)信息的該等音頻對象。綜上所述,可使用用以解碼SAOC編碼的音頻信號的不同構(gòu)想。于某些情況下,使用SAOC解碼器,其依據(jù)該下混信號表示形態(tài)及對象相關(guān)參數(shù)側(cè)邊信息而提供上混聲道信號(例如上混聲道信號928、958)。此種構(gòu)想的實(shí)例可參考圖9a及圖9b。另外,SAOC編碼的音頻信息可經(jīng)轉(zhuǎn)碼來獲得一下混信號表示形態(tài)(例如下混信號表示形態(tài)988)及一聲道相關(guān)側(cè)邊信息(例如聲道相關(guān)MPEG環(huán)繞位流984),其可由MPEG環(huán)繞解碼器用來提供期望的上混聲道信號。于MPEG SAOC系統(tǒng)800,系統(tǒng)概述顯示于圖8,一般處理以頻率選擇方式進(jìn)行,且于各頻帶內(nèi)可描述如下 N個(gè)輸入音頻對象信號X1至xN經(jīng)下混作為SAOC編碼器處理的一部分。用于單聲道下混,下混系數(shù)標(biāo)示以Cl1至dN。此外,SAOC編碼器810提取描述該輸入音頻對象的側(cè)邊信息814。用于MPEG SA0C,對象功率相對于彼此的關(guān)系乃此種側(cè)邊信息的最基本形式。 下混信號(或多個(gè)信號)812及側(cè)邊信息814被傳輸及/或儲存。為了實(shí)現(xiàn)此項(xiàng)目的,下混音頻信號可使用眾所周知的聽覺音頻編碼器壓縮,諸如MPEG-I層II或III (也稱作為mp3”)、MPEG高級音頻編碼(AAC)、或其他音頻編碼器。 于接收端,SAOC解碼器820于構(gòu)想上嘗試使用所傳輸?shù)膫?cè)邊信息814 (及當(dāng)然,一或多個(gè)下混信號812)來重新儲存該原先對象信號(“對象分離”)。然后,此等近似的對象信號(也標(biāo)不為重建的對象信號820b)使用一呈現(xiàn)矩陣而混合入由M個(gè)音頻輸出聲道表不
的目標(biāo)場景(例如可由上混聲道信號力至^^表示)。用于單聲道輸出,呈現(xiàn)矩陣系數(shù)以A至rN表不。 實(shí)際上,罕見執(zhí)行(或甚至未曾執(zhí)行)對象信號的分離,原因在于分離步驟(以對象分離器820a指示)及混合步驟(以混合器820c指示)二者組合成單一轉(zhuǎn)碼步驟,其經(jīng)常導(dǎo)致運(yùn)算復(fù)雜度的劇減。已經(jīng)發(fā)現(xiàn)此種方案就傳輸位率(只需傳輸數(shù)個(gè)下混聲道加若干側(cè)邊信息,而無需傳輸N個(gè)分開對象音頻信號或分開系統(tǒng))及運(yùn)算復(fù)雜度(處理復(fù)雜度主要涉及輸出聲道的數(shù)目而非音頻對象數(shù)目)而言極其有效。對于接收端的使用者的額外優(yōu)點(diǎn)包括選擇一呈現(xiàn)設(shè)定值的自由度(單聲、立體聲、環(huán)繞、虛擬耳機(jī)回放等)及使用者互動的特征結(jié)構(gòu)呈現(xiàn)矩陣,如此,輸出場景可由使用者依據(jù)意愿、個(gè)人偏好或其他標(biāo)準(zhǔn)而設(shè)定且互動改變。舉例言之,可以定位共同在一個(gè)空間區(qū)的談話者來最大化與其余談話者間的區(qū)別。此種互動性可由設(shè)置解碼器使用者界面而實(shí)現(xiàn)。對各個(gè)所傳輸?shù)穆曇魧ο螅烧{(diào)整其相對電平及(用于非單聲道呈現(xiàn))呈現(xiàn)的空間 位置。當(dāng)使用者改變相關(guān)聯(lián)的圖形使用者界面(GUI)滑動器位置時(shí)可實(shí)時(shí)發(fā)生(例如對象電平=+5分貝,對象位置=_30度)。但發(fā)現(xiàn)于某些情況下,用以提供上混信號表示形態(tài)(例如上混聲道信號&至^^)的參數(shù)的解碼器端選擇造成聽覺的降級。有鑒于此種情況,本發(fā)明的目的是提供一種構(gòu)想其允許當(dāng)提供上混信號表示形態(tài)(例如上混聲道信號&至7&)時(shí)減少或甚至避免聽覺失真。

發(fā)明內(nèi)容
此一問題可由下述裝置獲得解決,該種用以基于一下混信號表示形態(tài)及與該下混信號表示形態(tài)相關(guān)聯(lián)的一參數(shù)側(cè)邊信息來提供用于提供一上混信號表示形態(tài)的一或多個(gè)經(jīng)調(diào)整參數(shù)的裝置。該裝置包含一參數(shù)調(diào)整器,其被配置為接收一或多個(gè)參數(shù)(于若干實(shí)施例可為輸入?yún)?shù)),及基于此而提供一或多個(gè)經(jīng)調(diào)整參數(shù)。該參數(shù)調(diào)整器被配置為依據(jù)多個(gè)參數(shù)值(于若干實(shí)施例可為輸入?yún)?shù)值)的平均值而提供一或多個(gè)經(jīng)調(diào)整參數(shù),使得經(jīng)由使用非最佳參數(shù)用以提供該上混信號表示形態(tài)所造成的該上混信號表示形態(tài)的失真,對偏離最佳參數(shù)的參數(shù)(或輸入?yún)?shù))至少減少大于一預(yù)定偏差。依據(jù)本發(fā)明的此一實(shí)施例基于下述構(gòu)想,多個(gè)輸入?yún)?shù)值的平均值組成有意義數(shù)量,其允許用于參數(shù)的調(diào)整,該等參數(shù)用來基于一下混信號表示形態(tài)及與該下混信號表示形態(tài)相關(guān)聯(lián)的一參數(shù)側(cè)邊信息而提供一上混信號表示形態(tài),原因在于失真經(jīng)常因過度偏離此一平均值所造成。平均值的使用允許調(diào)整一或多個(gè)參數(shù)來避免如此過度偏離平均值(偶爾也標(biāo)示為均值),結(jié)果帶來避免過度降級音頻質(zhì)量的可能。前文討論的實(shí)施例提供一種保護(hù)所呈現(xiàn)的SAOC場景的存在聲音質(zhì)量的構(gòu)想,對該所呈現(xiàn)的SAOC場景,全部處理皆可完全于SAOC解碼器/轉(zhuǎn)碼器內(nèi)進(jìn)行,原因在于SAOC解碼器/轉(zhuǎn)碼器包含用以調(diào)整參數(shù)所需的完整信息。又,前述實(shí)施例并未涉及該呈現(xiàn)場景的聽覺音頻質(zhì)量的復(fù)雜測量值的顯式計(jì)算,原因在于發(fā)現(xiàn)限制參數(shù)值與平均值間的偏差典型地導(dǎo)致良好聽覺印象,而參數(shù)值與平均值間的重大偏差典型地導(dǎo)致聽覺失真。如此,前文討論的實(shí)施例提供一種特別有效的機(jī)制,即平均值用來適當(dāng)調(diào)整參數(shù),該等參數(shù)被考慮用以提供上混信號表示形態(tài)。于優(yōu)選實(shí)施例,該裝置的參數(shù)調(diào)整器被配置為依據(jù)屬于多個(gè)參數(shù)值的加權(quán)平均的一平均值而提供一或多個(gè)經(jīng)調(diào)整的參數(shù)。使用加權(quán)平均提供高度自由度,原因在于可對不同參數(shù)值配置不同的權(quán)值。但配置相 同的權(quán)值對于該等參數(shù)值也是可能的。于優(yōu)選實(shí)施例,該裝置的參數(shù)調(diào)整器被配置為提供一或多個(gè)經(jīng)調(diào)整的參數(shù),使得該等提供一或多個(gè)經(jīng)調(diào)整的參數(shù)偏離該平均值小于對應(yīng)的接收的參數(shù)。通過將經(jīng)調(diào)整的參數(shù)調(diào)整至接近平均值,或甚至經(jīng)由設(shè)定經(jīng)調(diào)整的參數(shù)等于平均值,可實(shí)現(xiàn)顯著失真減少。于優(yōu)選實(shí)施例,該裝置被配置為接收描述音頻對象對該上混信號表示形態(tài)的一或多個(gè)聲道的貢獻(xiàn)的一或多個(gè)呈現(xiàn)系數(shù)(也標(biāo)示為呈現(xiàn)參數(shù))。此種情況下,裝置優(yōu)選被配置為提供一或多個(gè)經(jīng)調(diào)整的呈現(xiàn)系數(shù)作為經(jīng)調(diào)整的參數(shù)。已經(jīng)發(fā)現(xiàn)依據(jù)多個(gè)呈現(xiàn)參數(shù)的平均值(其作為輸入?yún)?shù)值)而調(diào)整呈現(xiàn)參數(shù),帶來獲得良好適合的經(jīng)調(diào)整的呈現(xiàn)參數(shù)的可能,避免過度聽覺失真。于優(yōu)選實(shí)施例,參數(shù)調(diào)整器被配置為接收多個(gè)呈現(xiàn)系數(shù)作為輸入?yún)?shù)。此種情況下,參數(shù)調(diào)整器被配置為對多個(gè)音頻對象相關(guān)聯(lián)的呈現(xiàn)系數(shù)運(yùn)算平均。又,參數(shù)調(diào)整器被配置為提供經(jīng)調(diào)整的呈現(xiàn)系數(shù),使得限制一經(jīng)調(diào)整的呈現(xiàn)系數(shù)與對多個(gè)音頻對象相關(guān)聯(lián)的呈現(xiàn)系數(shù)平均間的偏差。依據(jù)本發(fā)明的此一實(shí)施例基于發(fā)現(xiàn)若一經(jīng)調(diào)整的呈現(xiàn)系數(shù)與對多個(gè)音頻對象相關(guān)聯(lián)的呈現(xiàn)系數(shù)平均間的偏差被限制,則至少對偏離最佳呈現(xiàn)參數(shù)達(dá)大于一預(yù)定偏壓的呈現(xiàn)參數(shù)而言,經(jīng)由使用非最佳呈現(xiàn)參數(shù)所造成的上混信號表示形態(tài)失真典型地減少。如此,一個(gè)簡單機(jī)制即調(diào)整呈現(xiàn)系數(shù)使得該經(jīng)調(diào)整的呈現(xiàn)系數(shù)與對多個(gè)音頻對象相關(guān)聯(lián)的呈現(xiàn)系數(shù)平均間的偏差被限制,則允許避免過度聽覺失真。于優(yōu)選實(shí)施例,參數(shù)調(diào)整器被配置為保持一呈現(xiàn)系數(shù)不變,該呈現(xiàn)系數(shù)在依據(jù)對呈現(xiàn)系數(shù)的平均所測定的一容許區(qū)間以內(nèi);以及將大于該容許區(qū)間的上邊界值的一呈現(xiàn)系數(shù)選擇性地設(shè)定為小于或等于該上邊界值的一值;及將小于該容許區(qū)間的下邊界值的一呈現(xiàn)系數(shù)選擇性地設(shè)定為大于或等于該下邊界值的一值。據(jù)此,建立調(diào)整呈現(xiàn)系數(shù)的一種極為簡單的機(jī)制,其中此種簡單機(jī)制仍然允許獲得經(jīng)調(diào)整的呈現(xiàn)系數(shù),其避免因使用與平均值有強(qiáng)力差異的非最佳呈現(xiàn)參數(shù)所造成的上混信號表示形態(tài)的過度失真。于優(yōu)選實(shí)施例,該參數(shù)調(diào)整器被配置為迭代重復(fù)地選擇該等呈現(xiàn)系數(shù)中的一個(gè)別者,其包含于個(gè)別迭代重復(fù)中與該呈現(xiàn)系數(shù)平均值的最大偏離;及使得該等呈現(xiàn)系數(shù)中的該選定者更接近該呈現(xiàn)系數(shù)平均值。據(jù)此,落在依據(jù)該呈現(xiàn)系數(shù)平均值所測定的容許區(qū)間外側(cè)的呈現(xiàn)參數(shù)被迭代重復(fù)地調(diào)整至該容許區(qū)間內(nèi)部。如此,呈現(xiàn)參數(shù)系依據(jù)平均值而調(diào)整,使得使用非最佳呈現(xiàn)參數(shù)所造成的上混信號表示形態(tài)的失真典型地減低(至少對偏離最佳呈現(xiàn)參數(shù)執(zhí)大于預(yù)定偏離的輸入呈現(xiàn)參數(shù)而言是如此)。于優(yōu)選實(shí)施例,該參數(shù)調(diào)整器被配置為重復(fù)該等呈現(xiàn)系數(shù)中的一個(gè)別者的迭代重復(fù)選擇,及重復(fù)該等呈現(xiàn)系數(shù)中的該選定者的迭代重復(fù)修正,直至全部呈現(xiàn)系數(shù)皆調(diào)整至落入適用的容許區(qū)間內(nèi)部為止。如此,確保于該上混信號表示形態(tài)的聽覺失真維持夠小。于優(yōu)選實(shí)施例,該裝置被配置為接收一或多個(gè)轉(zhuǎn)碼系數(shù),其描述該下混信號表示形態(tài)的一或多個(gè)聲道映射至該上混信號表示形態(tài)的一或多個(gè)聲道的映射關(guān)系。此種情況下,該裝置被配置為提供一或多個(gè)已調(diào)整的轉(zhuǎn)碼系數(shù)作為經(jīng)調(diào)整的參數(shù)。依據(jù)本發(fā)明的此一實(shí)施例基于發(fā)現(xiàn)轉(zhuǎn)碼參數(shù)為極為適合用于依據(jù)平均值的調(diào)整,原因在于轉(zhuǎn)碼系數(shù)大為偏離平均值,典型地造成聽覺失真。據(jù)此,通過依據(jù)平均值調(diào)整或限制轉(zhuǎn)碼參數(shù),可減少因使用非最佳轉(zhuǎn)碼參數(shù)(至少對偏離最佳轉(zhuǎn)碼參數(shù)達(dá)大于預(yù)定偏差的輸入轉(zhuǎn)碼參數(shù))所引起的上混"[目號表不形態(tài)的失真。于優(yōu)選實(shí)施例,該參數(shù)調(diào)整器被配置為接收轉(zhuǎn)碼系數(shù)(也標(biāo)示為轉(zhuǎn)碼參數(shù))的一時(shí)間序列作為輸入?yún)?shù)。此種情況下,該參數(shù)調(diào)整器被配置為依據(jù)多個(gè)轉(zhuǎn)碼系數(shù)算出一時(shí)間均值(也標(biāo)示為時(shí)間平均)。又,該參數(shù)調(diào)整器被配置為提供該等經(jīng)調(diào)整的轉(zhuǎn)碼系數(shù),使得該等經(jīng)調(diào)整的轉(zhuǎn)碼系數(shù)與該時(shí)間均值的偏差限制。再度,提供一種用以避免經(jīng)由使用非最佳轉(zhuǎn)碼參數(shù)而造成上混信號表示形態(tài)的過度聽覺失真的簡單機(jī)構(gòu)。于優(yōu)選實(shí)施例,該參數(shù)調(diào)整器被配置為允許落在依據(jù)該時(shí)間均值(其構(gòu)成平均值)所測定的一容許區(qū)間內(nèi)部的一轉(zhuǎn)碼系數(shù)維持不變。又,該參數(shù)調(diào)整器被配置為將大于該容許區(qū)間的上邊界值的一轉(zhuǎn)碼系數(shù)選擇性地設(shè)定為小于或等于該上邊界值的一值,及將小于該容許區(qū)間的下邊界值的一轉(zhuǎn)碼系數(shù)選擇性地設(shè)定為大于或等于該下邊界值的一值。據(jù)此,可將轉(zhuǎn)碼系數(shù)調(diào)整至明確界定的容許區(qū)間內(nèi),其允許減少因使用非最佳轉(zhuǎn)碼參數(shù)所引起的上混信號表示形態(tài)的失真,至少對偏離最佳轉(zhuǎn)碼參數(shù)達(dá)大于預(yù)定偏差的輸入轉(zhuǎn)碼參數(shù)、尤為如此。當(dāng)使用時(shí)間均值時(shí),容許區(qū)間以適應(yīng)性方式選擇。此一構(gòu)想基于發(fā)現(xiàn)轉(zhuǎn)碼系數(shù)的強(qiáng)時(shí)間變化典型地帶來聽覺失真,因此須限于某種程度。于優(yōu)選實(shí)施例,該參數(shù)調(diào)整器被配置為使用該轉(zhuǎn)碼系數(shù)序列的遞歸低通濾波而算出該時(shí)間均值。此種構(gòu)想顯示帶來一極為明確界定的時(shí)間均值,其將轉(zhuǎn)碼系數(shù)的長期演化列入考慮。又,發(fā)現(xiàn)此種轉(zhuǎn)碼系數(shù)序列的遞歸低通濾波可使用低運(yùn)算強(qiáng)度及存儲強(qiáng)度執(zhí)行,其協(xié)助減少內(nèi)存需求。特別,可獲得有意義的時(shí)間均值而未長時(shí)間儲存轉(zhuǎn)碼系數(shù)歷史。于優(yōu)選實(shí)施例,該參數(shù)調(diào)整器被配置為提供一或多個(gè)經(jīng)調(diào)整參數(shù)中的一給定者,使得該等經(jīng)調(diào)整參數(shù)中的該給定者落在容許區(qū)間內(nèi)部,該容許區(qū)間的邊界依據(jù)多個(gè)輸入?yún)?shù)值的平均值及一或多個(gè)容許參數(shù)界定,以及使得一輸入?yún)?shù)與一相對應(yīng)經(jīng)調(diào)整參數(shù)間的偏差為最小化或維持在預(yù)定最大容許范圍以內(nèi)。已經(jīng)發(fā)現(xiàn)通過限制經(jīng)調(diào)整的參數(shù)于容許區(qū)間,同時(shí)考慮避免輸入?yún)?shù)與對應(yīng)經(jīng)調(diào)整的參數(shù)間有過大差異的目的,可獲得帶來良好聽覺印象的經(jīng)調(diào)整的參數(shù)。據(jù)此,可減少經(jīng)由使用非最佳轉(zhuǎn)碼參數(shù)而造成上混信號表示形態(tài)的失真而不必?fù)p及由該等輸入?yún)?shù)所界定期望的聽覺設(shè)定值。于優(yōu)選實(shí)施例,該參數(shù)調(diào)整器被配置為,其邊界依據(jù)多個(gè)輸入?yún)?shù)值的平均值界定的該容許區(qū)間,將發(fā)現(xiàn)落在該容許區(qū)間外部的一輸入?yún)?shù)選擇性地設(shè)定至該容許區(qū)間的一上邊界值或一下邊界值來獲得該輸入?yún)?shù)的經(jīng)調(diào)整版本。于另一優(yōu)選實(shí)施例,該參數(shù)調(diào)整器被配置為迭代重復(fù)地選擇該等輸入?yún)?shù)中的一個(gè)別者,其包含于個(gè)別迭代重復(fù)中與該平均值的最大偏離;以及將該等輸入?yún)?shù)中的該選定者調(diào)整至更接近該平均值,來迭代重復(fù)地將判定為落在其邊界依據(jù)平均值界定的一容許區(qū)間(其邊界依據(jù)平均值而界定)外部的輸入?yún)?shù)調(diào)整至該容許區(qū)間內(nèi)部。于優(yōu)選實(shí)施例,該參數(shù)調(diào)整器被配置為選擇一階大小,該階用來將該等輸入?yún)?shù)中較為接近該平均值的選定者調(diào)整至該等輸入?yún)?shù)中的該選定者與該平均值間的差的預(yù)定分量。依據(jù)本發(fā)明的另一實(shí)施例提供一種用以基于一下混信號表示形態(tài)及一參數(shù)側(cè)邊信息來提供一上混信號表示形態(tài)的裝置。該裝置包含如前文討論的用以基于一或多個(gè)所接收的參數(shù)而提供一或多個(gè)經(jīng)調(diào)整參數(shù)的一裝置。該用以提供一上混信號表示形態(tài)的裝置也包含一信號處理器,其被配置為基于該下混信號表示形態(tài)及該參數(shù)側(cè)邊信息而獲得該上混信號表示形態(tài)。該用以提供一或多個(gè)經(jīng)調(diào)整參數(shù)的裝置被配置為提供例如輸入至該信號處理器的呈現(xiàn)參數(shù)的、或于該信號處理器運(yùn)算的且由該信號處理器施加的轉(zhuǎn)碼參數(shù)等該信號處理器的一或多個(gè)處理參數(shù)的經(jīng)調(diào)整版本來獲得該上混信號表示形態(tài)。此一實(shí)施例基于發(fā)現(xiàn)大量參數(shù),該等參數(shù)由信號處理器施加,及輸入信號處理器或甚至于信號處理器計(jì)算,及其可基于該平均值而自前文討論的參數(shù)調(diào)整獲益。已經(jīng)發(fā)現(xiàn)若一參數(shù)集合(例如與不同音頻對象相關(guān)聯(lián)的一呈現(xiàn)系數(shù)集合,或與時(shí)間上不同情況相關(guān)聯(lián)的一轉(zhuǎn)碼參數(shù)值集合)良好平衡,使得此種數(shù)值集合的個(gè)別值并未包含與平均值的過度大量偏差,則信號處理器典型地提供良好質(zhì)量的上混信號表示形態(tài),小有失真。如此,經(jīng)由采用用以提供一或多個(gè)經(jīng)調(diào)整的參數(shù)的裝置組合用以提供上混信號表示形態(tài)的裝置,可實(shí)現(xiàn)本發(fā)明構(gòu)想的效益。于優(yōu)選實(shí)施例,該信號處理器被配置為依據(jù)經(jīng)調(diào)整的呈現(xiàn)系數(shù),其描述音頻對象對該上混信號表示形態(tài)的一或多個(gè)聲道的貢獻(xiàn)而提供該上混信號表示形態(tài)。該用以提供一 或多個(gè)經(jīng)調(diào)整參數(shù)的裝置被配置為接收多個(gè)使用者指定的呈現(xiàn)參數(shù)作為輸入?yún)?shù),及基于此而提供由該信號處理器(優(yōu)選至信號處理器)使用的一或多個(gè)經(jīng)調(diào)整的呈現(xiàn)參數(shù)。已經(jīng)發(fā)現(xiàn)使用該用以提供一或多個(gè)經(jīng)調(diào)整參數(shù)的裝置所能獲得的良好平衡的呈現(xiàn)參數(shù),典型地導(dǎo)致良好聽覺印象。于另一實(shí)施例,該用以提供一或多個(gè)經(jīng)調(diào)整參數(shù)的裝置被配置為接收一混合矩陣的一或多個(gè)混合矩陣元作為該一或多個(gè)輸入?yún)?shù),及基于此而提供由該信號處理器使用的一或多個(gè)經(jīng)調(diào)整的該混合矩陣的混合矩陣元。此種情況下,該信號處理器被配置為依據(jù)經(jīng)調(diào)整的該混合矩陣的混合矩陣元而提供該上混信號表示形態(tài),其中該混合矩陣描述該下混信號表示形態(tài)(例如表示呈時(shí)域表示形態(tài)或時(shí)頻域表示形態(tài)形式)的一或多個(gè)音頻聲道信號映射至該上混信號表示形態(tài)的一或多個(gè)音頻聲道信號的映射關(guān)系。已經(jīng)發(fā)現(xiàn)混合矩陣元應(yīng)也良好適應(yīng)于平均值,例如混合矩陣元的時(shí)間變化受限制。依據(jù)本發(fā)明的另一實(shí)施例,該音頻處理器被配置為獲得MPEG環(huán)繞任意下混增益值。此種情況下,該用以提供一或多個(gè)經(jīng)調(diào)整參數(shù)的裝置被配置為接收多個(gè)任意下混增益值作為輸入?yún)?shù),及提供多個(gè)經(jīng)調(diào)整的任意下混增益值。已經(jīng)發(fā)現(xiàn)施加用以提供經(jīng)調(diào)整的參數(shù)的裝置至任意下混增益值,也導(dǎo)致良好聽覺印象且允許限制聽覺失真。依據(jù)本發(fā)明的其他實(shí)施例提供一種用以提供一或多個(gè)經(jīng)調(diào)整的參數(shù)的方法及計(jì)算機(jī)程序。該方法基于前文討論的裝置的相同發(fā)現(xiàn)且可由此處就本發(fā)明裝置討論的結(jié)構(gòu)特征及功能中的任一者而擴(kuò)展延伸。


圖I顯示依據(jù)本發(fā)明的實(shí)施例一種用以提供一或多個(gè)經(jīng)調(diào)整的參數(shù)的裝置的方塊不意圖;圖2顯示依據(jù)本發(fā)明的實(shí)施例一種用以提供上混信號表示形態(tài)的裝置的方塊示意圖;圖3顯示依據(jù)本發(fā)明的另一實(shí)施例一種用以提供上混信號表示形態(tài)的裝置的方塊不意圖;圖4顯示使用間接控制及直接控制的參數(shù)限制方案的方塊示意圖;圖5a顯不表不收聽測試條件的一表;圖5b顯不表不收聽測試的音頻項(xiàng)目的一表;圖6顯示表示所測試的極端呈現(xiàn)條件的一表;圖7顯示對不同參數(shù)限制方案(PLS),MUSHRA收聽測試結(jié)果的一線圖表示形態(tài);圖8顯示參考MPEG SAOC系統(tǒng)的方塊示意圖;圖9a顯示使用分開的解碼器及混合器的一參考SAOC系統(tǒng)的方塊示意圖;
圖9b顯示使用集成型解碼器及混合器的一參考SAOC系統(tǒng)的方塊示意圖;圖9c顯示使用SAOC至MPEG轉(zhuǎn)碼器的一參考SAOC系統(tǒng)的方塊示意圖;及圖10顯示一表描述哪些轉(zhuǎn)碼系數(shù)可由所提示的參數(shù)限制方案而修正。
具體實(shí)施例方式I.依據(jù)圖1,用以提供一或多個(gè)經(jīng)調(diào)整的參數(shù)的裝置后文中,將描述一種用以基于下混信號表示形態(tài)及與下混信號表示形態(tài)相關(guān)聯(lián)的參數(shù)側(cè)邊信息來提供用于提供上混信號表示形態(tài)的一或多個(gè)經(jīng)調(diào)整參數(shù)的裝置。圖I顯示此種裝置100的方塊示意圖。該裝置100被配置為接收一或多個(gè)輸入?yún)?shù)110,及基于此而提供一或多個(gè)經(jīng)調(diào)整的參數(shù)120。裝置100包含一參數(shù)調(diào)整器130,其被配置為接收一或多個(gè)輸入?yún)?shù)110,及基于此而提供一或多個(gè)經(jīng)調(diào)整的參數(shù)120。該參數(shù)調(diào)整器130被配置為依據(jù)多個(gè)輸入?yún)?shù)值的平均值132而提供該一或多個(gè)經(jīng)調(diào)整的參數(shù)120,使得至少對偏離最佳參數(shù)達(dá)大于預(yù)定偏差的輸入?yún)?shù)(例如輸入?yún)?shù)110),經(jīng)由使用非最佳參數(shù)(例如一或多個(gè)輸入?yún)?shù)110)所造成的上混信號表示形態(tài)的失真減少。舉例言之,參數(shù)調(diào)整器130可具有比較該一或多個(gè)輸入?yún)?shù)110,該一或多個(gè)經(jīng)調(diào)整的參數(shù)120是“更接近”(表示造成較少失真)最佳參數(shù)(其將導(dǎo)致無失真上混信號表示形態(tài))的效果。為了實(shí)現(xiàn)此項(xiàng)目的,參數(shù)調(diào)整器130實(shí)施平均值運(yùn)算來獲得一相關(guān)輸入?yún)?shù)110(例如與一共享時(shí)間區(qū)間相關(guān)聯(lián)的輸入?yún)?shù),或與不同時(shí)間相關(guān)聯(lián)的相同參數(shù)類型的輸入?yún)?shù))集合的平均值132 (例如呈時(shí)間平均或?qū)ο箝g平均)。有關(guān)裝置100的操作,須注意基于一或多個(gè)輸入?yún)?shù)110提供一或多個(gè)經(jīng)調(diào)整的參數(shù)120依據(jù)平均值132實(shí)現(xiàn),原因在于發(fā)現(xiàn)平均值132為用以調(diào)整參數(shù)的有意義數(shù)量。更明確言之,發(fā)現(xiàn)(相對于平均值)中等參數(shù)典型地導(dǎo)致中等失真。進(jìn)一步細(xì)節(jié)容后詳述。2依據(jù)圖2,用以提供一種上混信號表示形態(tài)的裝置后文中,將描述依據(jù)圖2的用以提供一種上混信號表示形態(tài)的裝置。圖2顯示可視為音頻信號解碼器的此種裝置200的方塊示意圖。舉例言至,裝置200可包含SAOC解碼器或SAOC轉(zhuǎn)碼器的功能。裝置200被配置為接收一下混信號表示形態(tài)210及一參數(shù)側(cè)邊信息212。又,裝置200被配置為接收使用者指定呈現(xiàn)參數(shù)214。裝置被配置為提供一上混信號表示形態(tài)220。下混信號表不形態(tài)210例如可為一聲道音頻信號或二聲道音頻信號的表不形態(tài)。下混信號表示形態(tài)210例如可為時(shí)域表示形態(tài)或編碼表示形態(tài)。于若干實(shí)施例中,下混信號表示形態(tài)210可為時(shí)頻域表示形態(tài),其中該下混信號表示形態(tài)210的一或多個(gè)聲道由隨后平均值集合表示。上混信號表示形態(tài)220例如可為呈時(shí)域表示形態(tài)或時(shí)頻域表示形態(tài)形式的個(gè)別音頻聲道的表不形態(tài)。另外,上混信號表不形態(tài)220可為編碼表不形態(tài),包含一下混信號表示形態(tài)及一聲道相關(guān)側(cè)邊信息二者,例如MPEG環(huán)繞側(cè)邊信息。使用者指定呈現(xiàn)參數(shù)214可呈呈現(xiàn)矩陣條目形式提供,該呈現(xiàn)矩陣條目描述多個(gè)音頻對象對該上混信號表示形態(tài)220的一或多個(gè)聲道的期望貢獻(xiàn)。另外,使用者指定呈現(xiàn)參數(shù)214可呈任何其他適當(dāng)形式提供,例如規(guī)定音頻對象的期望的呈現(xiàn)位置及呈現(xiàn)體積。裝置200包含一信號處理器230,其被配置為基于下混信號表示形態(tài)210及參數(shù)側(cè)邊信息212而提供上混信號表示形態(tài)220。該信號處理器230包含一重新混合功能232,來基于該下混信號表示形態(tài)210而提供上混信號表示形態(tài)220。舉例言之,重新混合功能232可經(jīng)被配置為線性組合下混信號表示形態(tài)212的多個(gè)聲道而獲得一上混信號表示形態(tài)220的聲道。于此重新混合中,下混信號表示形態(tài)210的聲道對上混信號表示形態(tài)220的聲道的貢獻(xiàn)可經(jīng)由混合一混合矩陣G的矩陣元測定,其中混合矩陣G的第一維(例如列數(shù))可由上混信號表示形態(tài)220的聲道數(shù)目測定,及其中混合矩陣G的第二維(例如行數(shù))可由下混信號表示形態(tài)210的聲道數(shù)目測定。舉例言之,重新混合處理232可用來經(jīng)以將包含下混信號表示形態(tài)210的一或多個(gè)聲道的頻譜值的一或多個(gè)向量乘以混合矩陣G,可提供包含與上混信號表示形態(tài)220的一或多個(gè)聲道相關(guān)聯(lián)的頻譜值的一或多個(gè)向量。信號處理器230也包含一混合參數(shù)運(yùn)算236,其提供混合矩陣G(或相當(dāng)?shù)?,其矩陣??;旌暇仃囋涤苫旌蠀?shù)運(yùn)算230依據(jù)參數(shù)側(cè)邊信息212及已修正的呈現(xiàn)參數(shù)252測定?;旌暇仃嘒的混合矩陣元例如經(jīng)提供使得上混信號表示形態(tài)220的一或多個(gè)聲道描述音頻對象,依據(jù)已修正的呈現(xiàn)參數(shù)252由下混信號表示形態(tài)210的一或多個(gè)聲道表示。為了實(shí)現(xiàn)此項(xiàng)目的,參數(shù)側(cè)邊信息212由混合參數(shù)運(yùn)算236評估,其中該參數(shù)側(cè)邊信息212例如包含,一對象電平差信息OLD、一對象間相關(guān)性信息I0C、一下混增益信息DMG、及(選擇性地)一下混聲道電平差信息DCLD。該對象電平差信息例如可以逐頻帶方式,描述多個(gè)音頻對象間的電平差。同理,該對象間相關(guān)性信息例如可以逐頻帶方式,描述多個(gè)音頻對象間的相關(guān)性。該下混增益信息及該(選擇性地)下混聲道電平差信息可描述該下混,該下混執(zhí)行來將來自多個(gè)音頻對象的音頻對象信號組合成該下混信號表示形態(tài)的一或多個(gè)聲道,其中 典型地具有比下混信號表示形態(tài)210的聲道更多個(gè)音頻對象。據(jù)此,混合參數(shù)運(yùn)算236可評估基于參數(shù)側(cè)邊信息212及已修正的呈現(xiàn)參數(shù)252,如何選擇混合矩陣元來獲得包含預(yù)期的統(tǒng)計(jì)性質(zhì)的一上混信號表示形態(tài)220。信號處理器230可選擇性地包含側(cè)邊信息修正或側(cè)邊信息變換240,其被配置為接收參數(shù)側(cè)邊信息212,及提供已修正的側(cè)邊信息(例如MPEG環(huán)繞側(cè)邊信息),使得已修正的側(cè)邊信息及由重新混合處理232所提供的相關(guān)聯(lián)的重新混合下混信號表示形態(tài)描述一期望的音頻場景。要言之,信號處理器230例如可滿足SAOC解碼器820的功能,其中該下混信號表示形態(tài)210扮演該一或多個(gè)下混信號812的角色,其中該參數(shù)側(cè)邊信息212扮演側(cè)邊信息814的角色,及其中該上混信號表不形態(tài)220系相當(dāng)于輸出聲道信號八至^^,。另外,信號處理器230可包含分開解碼器及混合器920的功能,其中該下混信號表示形態(tài)210可扮演一或多個(gè)下混信號的角色,其中該參數(shù)側(cè)邊信息212可扮演對象元數(shù)據(jù)的角色,及其中該上混信號表示形態(tài)220可扮演一或多個(gè)輸出聲道信號928的角色。另外,信號處理器230可包含集成解碼器及混合器950的功能,其中該下混信號表示形態(tài)210可扮演一或多個(gè)下混信號的角色,其中該參數(shù)側(cè)邊信息212可扮演對象元數(shù)據(jù)的角色,及其中該上混信號表示形態(tài)220可扮演一或多個(gè)輸出聲道信號958的角色。另外,信號處理器230可包含MPEG環(huán)繞轉(zhuǎn)碼器980的功能,其中該下混信號表示形態(tài)210可扮演一或多個(gè)下混信號的角色,其中該參數(shù)側(cè)邊信息212可扮演對象元數(shù)據(jù)的角色,及其中該上混信號表示形態(tài)當(dāng)與MPEG環(huán)繞側(cè)邊信息984組合時(shí)可相當(dāng)于該一或多個(gè)下混信號988??偠灾?,已修正呈現(xiàn)參數(shù)252可扮演使用者互動/控制信息822或呈現(xiàn)信息的 角色。裝置200也包含用以提供經(jīng)調(diào)整的呈現(xiàn)參數(shù)的裝置250。用以提供經(jīng)調(diào)整的呈現(xiàn)參數(shù)的裝置250接收使用者指定的呈現(xiàn)參數(shù)214,及基于此而提供已修正呈現(xiàn)參數(shù)252。裝置250典型地被配置為計(jì)算與不同音頻對象相關(guān)聯(lián)的多個(gè)使用者指定的呈現(xiàn)參數(shù)的平均值而獲得平均值。又,裝置250被配置為依據(jù)該平均值執(zhí)行呈現(xiàn)參數(shù)限制,來經(jīng)由限制該使用者指定的呈現(xiàn)參數(shù)214而獲得已修正呈現(xiàn)參數(shù)252。已修正呈現(xiàn)參數(shù)252所受限的容許區(qū)間典型地依據(jù)該平均值測定,因而避免已修正呈現(xiàn)參數(shù)252與平均值間有強(qiáng)烈偏差,即使使用者指定的呈現(xiàn)參數(shù)214中的一者或多者包含此種與平均值的強(qiáng)烈偏差亦如此。由此方式,典型地避免上混信號表示形態(tài)220內(nèi)部的過度失真,原因在于包含有限的對象間偏差的已修正呈現(xiàn)參數(shù)252將導(dǎo)致具有低失真的上混信號表示形態(tài),同時(shí)與不同音頻對象相關(guān)聯(lián)的呈現(xiàn)參數(shù)間的重大差異典型地將導(dǎo)致聽覺假象(audible artifacts)。此處須注意用以提供經(jīng)調(diào)整的呈現(xiàn)參數(shù)的裝置250可包含與用以提供一或多個(gè)經(jīng)調(diào)整參數(shù)的裝置100相同的總體功能,其中該使用者指定的呈現(xiàn)參數(shù)214可扮演一或多個(gè)輸入?yún)?shù)110的角色,及其中該已修正呈現(xiàn)參數(shù)252可扮演一或多個(gè)經(jīng)調(diào)整參數(shù)120的角色。有關(guān)提供已修正呈現(xiàn)參數(shù)252的細(xì)節(jié)將參考圖4討論如下。3依據(jù)圖3,用以提供上混信號表示形態(tài)的裝置后文中,依據(jù)本發(fā)明的另一實(shí)施例的用以提供上混信號表示形態(tài)的裝置將參考圖3作說明,該圖顯示此種裝置300的方塊示意圖。裝置300典型地接收與裝置200同類型輸入信號,及提供相同類型輸出信號,因此相同組件符號用于此處來描述相同的或相當(dāng)?shù)男盘枴R灾?,裝置300接收一下混信號表示形態(tài)210、參數(shù)側(cè)邊信息212及使用者指定的呈現(xiàn)參數(shù)214 ;及裝置300基于此而提供一上混信號表示形態(tài)220。裝置300包含一信號處理器330,其功能可實(shí)質(zhì)上相當(dāng)于信號處理器230。信號處理器330包含一重新混合功能332,其與信號處理器230的重新混合功能232相同,在于其基于下混信號表示形態(tài)提供重新混合的音頻聲道信號。但重新混合332使用經(jīng)調(diào)整的混合矩陣,而非直接得自混合參數(shù)運(yùn)算的一混合矩陣。
信號處理器330也包含一混合參數(shù)運(yùn)算336,其功能上可與信號處理器230的混合參數(shù)運(yùn)算236的功能相同。據(jù)此,混合參數(shù)運(yùn)算336接收參數(shù)側(cè)邊信息212及使用者指定的呈現(xiàn)參數(shù)214,及基于此而提供一混合矩陣G (或相當(dāng)?shù)兀旌暇仃嘒的混合矩陣元,也標(biāo)示以337)。信號處理器330選擇性地也包含一側(cè)邊信息修正338,其功能與側(cè)邊信息修正240相同。此外,裝置300包含用以提供經(jīng)調(diào)整的混合矩陣元的裝置350。裝置350可為或可非為信號處理器330的一部分。裝置350被配置為接收由混合參數(shù)運(yùn)算336所提供的混合矩陣337,G (或相當(dāng)?shù)兀浠旌暇仃囋?,及基于此而提供經(jīng)調(diào)整的混合矩陣352G’(或相當(dāng)?shù)兀浣?jīng)調(diào)整的混合矩陣元)。舉例言之,每一頻帶及每個(gè)音頻幀可提供一個(gè)混合矩陣元集合及一個(gè)經(jīng)調(diào)整的混合矩陣元集合。換言之,若選用逐幀處理,則對下混信號表示形態(tài)210的每個(gè)音頻幀,混合矩陣G及經(jīng)調(diào)整的混合矩陣G’可更新一次。又并非必要并不同頻帶有多個(gè)混合矩陣G及經(jīng)調(diào)整的混合矩陣G’。 但裝置350被配置為基于由混合參數(shù)運(yùn)算336所提供的混合矩陣337的混合矩陣元而提供經(jīng)調(diào)整的混合矩陣352的經(jīng)調(diào)整的混合矩陣元。舉例言之,處理可以對混合矩陣(或經(jīng)調(diào)整的混合矩陣)的每個(gè)位置個(gè)別進(jìn)行,使得一給定混合矩陣位置的經(jīng)調(diào)整的混合矩陣元序列可取決于位在相同混合矩陣位置的混合矩陣337的混合矩陣元序列,但與位在不同混合矩陣位置的混合矩陣元不相干。用以提供經(jīng)調(diào)整的混合矩陣元的裝置350被配置為依據(jù)基于混合矩陣337而運(yùn)算的一或多個(gè)平均值(例如一或多個(gè)矩陣位置個(gè)別平均值)而提供該經(jīng)調(diào)整的混合矩陣352的一或多個(gè)經(jīng)調(diào)整的混合矩陣元。用以提供經(jīng)調(diào)整的混合矩陣352的經(jīng)調(diào)整的混合矩陣元的裝置350優(yōu)選被配置為計(jì)算在一給定混合矩陣位置隨時(shí)間的經(jīng)過,混合矩陣元的平均值。如此,對一給定混合矩陣位置,平均值(優(yōu)選地,但非必要地,時(shí)間平均值,例如浮動平均或準(zhǔn)無限脈沖響應(yīng)平均值,或經(jīng)由眾所周知用于時(shí)間平均的遞歸低通濾波或類似數(shù)算運(yùn)算所得的平均值)可基于該給定混合矩陣位置的混合矩陣元序列運(yùn)算。舉例言之,描述下混信號表不形態(tài)210的一給定聲道對上混信號表不形態(tài)220的一給定聲道的貢獻(xiàn)的混合矩陣兀序列(該等混合矩陣元系與多個(gè)音頻框相關(guān)聯(lián))可用來獲得此種平均值(也標(biāo)示為均值),該平均值可為有限脈沖響應(yīng)平均值或(準(zhǔn))無限脈沖響應(yīng)平均值(例如使用眾所周知用于時(shí)間平均的遞歸低通濾波或類似數(shù)算運(yùn)算所得)。該給定混合矩陣位置的一目前經(jīng)調(diào)整的混合矩陣兀(描述下混信號表不形態(tài)210的一給定聲道對上混信號表不形態(tài)220的一給定聲道的貢獻(xiàn))可被裝置350限制一容許區(qū)間,該容許區(qū)間依據(jù)與該給定混合矩陣位置相關(guān)聯(lián)的平均值界定。據(jù)此,避免混合矩陣元的過度時(shí)間起伏波動,原因在于經(jīng)調(diào)整的混合矩陣元受限于例如由在相同混合矩陣位置的先前混合矩陣元的平均(有限脈沖響應(yīng)平均或(準(zhǔn))無限脈沖響應(yīng)平均)所測定的容許區(qū)間。已經(jīng)發(fā)現(xiàn)此種該經(jīng)調(diào)整的混合矩陣352的經(jīng)調(diào)整的混合矩陣元的限制典型地帶來由使用非最佳參數(shù)(例如非最佳使用者指定的呈現(xiàn)參數(shù))所導(dǎo)致上混信號220的失真限制,至少若該非最佳使用者指定的呈現(xiàn)參數(shù)偏離最佳使用者指定的呈現(xiàn)參數(shù)達(dá)多于一個(gè)預(yù)定偏離時(shí)為如此。此處須注意用以提供經(jīng)調(diào)整的混合矩陣元的裝置350可包含與用以提供一或多個(gè)經(jīng)調(diào)整的參數(shù)的裝置100相同的整個(gè)功能,其中該混合矩陣337的混合矩陣元呈扮演一或多個(gè)輸入?yún)?shù)110的角色,及其中該經(jīng)調(diào)整的混合矩陣352的經(jīng)調(diào)整的混合矩陣元可扮演一或多個(gè)經(jīng)調(diào)整的參數(shù)120的角色。4依據(jù)圖4的參數(shù)限制方案后文中,依據(jù)本發(fā)明的參數(shù)限制方案將參考圖4作說明,該圖顯示此種參數(shù)限制方案的示意表示形態(tài)。圖4顯示參數(shù)限制方案組合SAOC解碼器410的應(yīng)用。但參數(shù)限制方案可組合不同類型音頻解碼器或音頻轉(zhuǎn)碼器,例如SAOC轉(zhuǎn)碼器施用。SAOC解碼器410接收下混420及SAOC位流422。又,SAOC解碼器提供一或多個(gè)輸出聲道430a至430M。于第一實(shí)施例,標(biāo)示為(a),參數(shù)限制方案實(shí)施間接控制。參數(shù)限制方案440接收 一輸入呈現(xiàn)矩陣R,例如使用者指定的呈現(xiàn)矩陣,及基于此而提供一經(jīng)調(diào)整的呈現(xiàn)矩陣及予SAOC解碼器。此種情況下,SAOC解碼器如前述使用經(jīng)調(diào)整的呈現(xiàn)矩陣及用于混合矩陣G的導(dǎo)算。參數(shù)限制方案440也接收參數(shù)Ak_、Ak+,其可決定容許區(qū)間邊界。另外或此外,可施加第二參數(shù)限制方案450。第二參數(shù)限制方案接收轉(zhuǎn)碼參數(shù)T,及基于此而提供經(jīng)調(diào)整的轉(zhuǎn)碼參數(shù)r。轉(zhuǎn)碼參數(shù)T可于SAOC解碼器410運(yùn)算,而經(jīng)調(diào)整的轉(zhuǎn)碼參數(shù)T可由SAOC解碼器410施用。舉例言之,轉(zhuǎn)碼參數(shù)T可相當(dāng)于如前文討論的混合矩陣G的混合矩陣元,而經(jīng)調(diào)整的轉(zhuǎn)碼參數(shù)T可相當(dāng)于經(jīng)調(diào)整的混合矩陣G’的經(jīng)調(diào)整的混合矩陣元。參數(shù)限制方案450也接收一或多個(gè)參數(shù)At_、At+,其可決定容許區(qū)間邊界。4. I 概述后文中,將概述用于失真控制的參數(shù)限制方案。一般性SAOC處理以時(shí)/頻選擇方式進(jìn)行,容后詳述。SAOC編碼器提取若干輸入音頻對象信號的心理聲學(xué)特性(例如對象功率關(guān)系及相關(guān)性),及然后,下混之成為一單聲道或立體聲道組合(例如可標(biāo)示為下混信號表示形態(tài))。此種下混信號及所提取的側(cè)邊信息使用眾所周知的聽覺音頻編碼器,以壓縮格式傳輸(或儲存)。在接收端,SAOC解碼器于構(gòu)想上嘗試使用所傳輸?shù)膫?cè)邊信息(例如對象電平差信息OLD、對象間相關(guān)性信息IOC下混增益信息DMG、及下混聲道電平差信息DCLD)來回復(fù)原先對象信號(即分開的下混物件)。此等近似對象信號然后使用呈現(xiàn)矩陣(其中該呈現(xiàn)矩陣典型地述不同音頻對象對上混信號表示形態(tài)的不同聲道的貢獻(xiàn))混合入一目標(biāo)場景。呈現(xiàn)矩陣由對各個(gè)所傳輸?shù)囊纛l對象及上混設(shè)定揚(yáng)聲器規(guī)定的相對呈現(xiàn)系數(shù)RC (或?qū)ο笤鲆?組成。此等對象增益判定全部分開的/呈現(xiàn)的對象的空間位置。實(shí)際上,罕見執(zhí)行(或甚至未曾執(zhí)行)對象信號的分離,原因在于分離及混合二者組合成單一組合處理步驟,其經(jīng)常導(dǎo)致運(yùn)算復(fù)雜度的劇減。單一組合處理步驟例如可使用轉(zhuǎn)碼系數(shù)執(zhí)行,其描述分開對象的對象分離與混合的組合。已經(jīng)發(fā)現(xiàn)就傳輸位率(只要求傳輸一或二下混聲道加若干側(cè)邊信息而非個(gè)別對象音頻信號數(shù)目)及運(yùn)算復(fù)雜度(處理復(fù)雜度主要涉及輸出聲道數(shù)目而非音頻對象數(shù)目)兩方面而言,此一方案極為有效。SAOC解碼器(于參數(shù)字準(zhǔn))將對象增益及其他側(cè)邊信息直接變換成轉(zhuǎn)碼系數(shù)(TC),其施加至該下混信號來形成已呈現(xiàn)的輸出音頻場景的對應(yīng)信號(或進(jìn)一步解碼操作的前處理下混信號,即典型地多聲道MPEG環(huán)繞呈現(xiàn))。已經(jīng)發(fā)現(xiàn)經(jīng)由施加失真控制措施或DCM可改良所呈現(xiàn)的輸出音頻場景的主觀聽覺音頻質(zhì)量,如非預(yù)公開的US 61/173,456所述。此項(xiàng)改良可由接受目標(biāo)呈現(xiàn)場景的溫和動態(tài)修正而實(shí)現(xiàn)。呈現(xiàn)信息的修正具有時(shí)間及頻率變量本質(zhì),在特定情況下可能導(dǎo)致不自然的音色及時(shí)間波動假象。參考文獻(xiàn)[6]所述失真控制措施(DCM)的替代之道中,依據(jù)本發(fā)明的實(shí)施例使用多項(xiàng)參數(shù)限制方案,其聚焦在音頻假象(音色、時(shí)間波動等)的減少及同時(shí)保有天然聲音質(zhì) 量。此處所提示的參數(shù)限制方案構(gòu)想并未使用心理聲學(xué)算法,基于心理聲學(xué)模型調(diào)整基于計(jì)算得的失真測量值的呈現(xiàn)系數(shù)(RC)。反而所提示的參數(shù)限制方案構(gòu)想顯示低度運(yùn)算及結(jié)構(gòu)復(fù)雜度,因此具有整合入SAOC技術(shù)的吸引力。雖言如此,其也可優(yōu)異地組合參考文獻(xiàn)[6]所述方案來由彼此互補(bǔ)而實(shí)現(xiàn)更佳的總體輸出質(zhì)量。在總SAOC系統(tǒng)中,參數(shù)限制方案可以兩種方式整合入SAOC解碼器處理連鎖。舉例言之,參數(shù)限制方案可放在前端通過控制呈現(xiàn)系數(shù)(RC) R而用于SAOC輸出信號的間接(夕卜部)修正,于圖4顯示為替代之道(a)。另外,在特性轉(zhuǎn)碼系數(shù)(TC)T施加至下混信號前,系數(shù)T直接(內(nèi)部)于SAOC解碼器后端修正,于圖4顯示為替代之道(b)。4. 2間接控制后文中,將討論間接控制構(gòu)想的進(jìn)一步細(xì)節(jié)。間接控制方法的基本假說考慮失真電平與RC偏離其對象平均值的偏差間的關(guān)系。此點(diǎn)基于觀察到相較于其他對象,由RC施加更特定衰減/增強(qiáng)至一個(gè)特定對象,由SAOC解碼器/轉(zhuǎn)碼器執(zhí)行所傳輸?shù)南禄煨盘柕母e極修正。換言之“對象增益”值相對于彼此的偏差愈高,則發(fā)生無法接受的失真機(jī)率愈高(假設(shè)相同下混系數(shù))。發(fā)現(xiàn)可通過檢驗(yàn)RC與跨全部對象的RC平均值(例如平均呈現(xiàn)值)的偏差測試。未喪失普適性,后文描述基于考慮對全部對象具有統(tǒng)一下混增益的單聲道下混的組態(tài)。對非平凡的下混情況(帶有不同的及/或動態(tài)的對象增益),算法可經(jīng)適當(dāng)修正。此夕卜,RC假設(shè)為頻率不變來簡化記法(notation)?;趲в袑ο笾羔榠的系數(shù)R(i)表示的使用者指定的呈現(xiàn)狀況,PLS通過產(chǎn)生實(shí)際上由SAOC呈現(xiàn)引擎所使用的修正RC值而避免極端呈現(xiàn)值。其可呈如下函數(shù)導(dǎo)算R(i) = FK(R(i),A),此處為PLS控制參數(shù)(即臨界值)。PLS控制參數(shù)可視為容許參數(shù)。呈現(xiàn)系數(shù)R(i)與平均呈現(xiàn)值&(例如算術(shù)平均)的偏差Rd(i)可獲得為Md(i) = ^K此處
— I -v-R —-R (i、.據(jù)此,Rd(i)為呈現(xiàn)系數(shù)R(i)與平均呈現(xiàn)值R間的比。平均呈現(xiàn)值R為對具有音頻對象指針i的音頻對象求取平均所得呈現(xiàn)系數(shù)R(i)的平均值。有限偏差限于某個(gè)容許A范圍為[013權(quán)利要求
1.一種用以基于一下混信號表示形態(tài)(210、420)及與所述下混信號表示形態(tài)相關(guān)聯(lián)的一參數(shù)側(cè)邊信息(212、422)來提供用于提供一上混信號表不形態(tài)(220、430a_430M)的一或多個(gè)經(jīng)調(diào)整參數(shù)(120、252、352、及、y)的裝置(100、250、350、440、450),所述裝置包含 一參數(shù)調(diào)整器,其被配置為接收一或多個(gè)參數(shù)(110、214、337),及基于此而提供一或多個(gè)經(jīng)調(diào)整參數(shù)(120、252、352),其中所述參數(shù)調(diào)整器被配置為依據(jù)多個(gè)參數(shù)值(110、214、337、R、T)的平均值(132、及、T)而提供一或多個(gè)經(jīng)調(diào)整參數(shù),使得經(jīng)由使用非最佳參數(shù)用以提供所述上混信號表示形態(tài)所造成的所述上混信號表示形態(tài)的失真,對偏離最佳參數(shù)的一或多個(gè)參數(shù)至少減少大于一預(yù)定偏差。
2.根據(jù)權(quán)利要求I所述的裝置(100、250、350、440、450),其中,所述參數(shù)調(diào)整器被配置為依據(jù)多個(gè)參數(shù)值的加權(quán)平均的平均值而提供一或多個(gè)經(jīng)調(diào)整參數(shù)。
3.根據(jù)權(quán)利要求I或2所述的裝置(100、250、350、440、450),其中,所述參數(shù)調(diào)整器被配置為提供一或多個(gè)經(jīng)調(diào)整參數(shù)使得所述一或多個(gè)經(jīng)調(diào)整參數(shù)偏離所述平均值小于相對應(yīng)所接收的參數(shù)。
4.根據(jù)權(quán)利要求I至3中任一項(xiàng)所述的裝置(100、250、440),其中,所述裝置被配置為接收描述音頻對象對所述上混信號表示形態(tài)(220、430a-430M)的一或多個(gè)聲道的貢獻(xiàn)的一或多個(gè)呈現(xiàn)系數(shù)(214、R),及其中,所述裝置被配置為提供一或多個(gè)經(jīng)調(diào)整的呈現(xiàn)系數(shù)(252、及)作為經(jīng)調(diào)整參數(shù)。
5.根據(jù)權(quán)利要求4所述的裝置(100、250、440),其中,所述參數(shù)調(diào)整器被配置為接收多個(gè)呈現(xiàn)系數(shù)(214、R)作為輸入?yún)?shù) '及 其中,所述參數(shù)調(diào)整器被配置為運(yùn)算出與多個(gè)音頻對象相關(guān)聯(lián)的呈現(xiàn)系數(shù)的一平均值Cr)■,& 其中,所述參數(shù)調(diào)整器被配置為提供經(jīng)調(diào)整的呈現(xiàn)系數(shù)(252、及),使得經(jīng)調(diào)整的呈現(xiàn)系數(shù)偏離與多個(gè)音頻對象相關(guān)聯(lián)的呈現(xiàn)系數(shù)的一平均值的偏差被限制。
6.根據(jù)權(quán)利要求5所述的裝置(100、250、440),其中,所述參數(shù)調(diào)整器被配置為使得落入于依據(jù)呈現(xiàn)系數(shù)的平均值(R )所測定的容許區(qū)間內(nèi)的一呈現(xiàn)系數(shù)(214、R)維持不變,及將大于所述容許區(qū)間的上邊界值(AjR )的一呈現(xiàn)系數(shù)(214、R)選擇性地設(shè)定為小于或等于所述上邊界值的一值,及 將小于所述容許區(qū)間的下邊界值()的一呈現(xiàn)系數(shù)(214、R)選擇性地設(shè)定為大于或 A等于所述下邊界值的一值。
7.根據(jù)權(quán)利要求5所述的裝置(100、250、440),其中,所述參數(shù)調(diào)整器被配置為迭代重復(fù)地選擇所述呈現(xiàn)系數(shù)中的一個(gè)別者(R(i_)),其包含于個(gè)別迭代重復(fù)中與所述呈現(xiàn)系數(shù)平均值(R )的最大偏離(Rd,_);及使得所述呈現(xiàn)系數(shù)中的所選定者(R(i_))更接近所述呈現(xiàn)系數(shù)平均值(R ),來將落在依據(jù)所述呈現(xiàn)系數(shù)平均值所測定的容許區(qū)間外側(cè)的呈現(xiàn)系數(shù)迭代重復(fù)地調(diào)整至所述容許區(qū)間內(nèi)部。
8.根據(jù)權(quán)利要求7所述的裝置(100、250、440),其中,所述參數(shù)調(diào)整器被配置為重復(fù)所述呈現(xiàn)系數(shù)中的一個(gè)別者(R(i_))的迭代重復(fù)選擇,及重復(fù)所述呈現(xiàn)系數(shù)中的所述選定者的迭代重復(fù)修正,直至全部呈現(xiàn)系數(shù)皆調(diào)整至落入適用的容許區(qū)間內(nèi)部為止。
9.根據(jù)權(quán)利要求I至3中任一項(xiàng)所述的裝置(100、350、450),其中所述裝置被配置為接收一或多個(gè)轉(zhuǎn)碼系數(shù)(337、T),其描述所述下混信號表示形態(tài)(210、420)的一或多個(gè)聲道映射至所述上混信號表示形態(tài)(220、430a-430M)的一或多個(gè)聲道的映射關(guān)系,及 其中,所述裝置被配置為提供一或多個(gè)經(jīng)調(diào)整的轉(zhuǎn)碼系數(shù)(352、j0作為經(jīng)調(diào)整參數(shù)。
10.根據(jù)權(quán)利要求9所述的裝置(100、350、450),其中,所述參數(shù)調(diào)整器被配置為接收轉(zhuǎn)碼系數(shù)(337、T)的一時(shí)間序列作為輸入?yún)?shù) '及 其中,所述參數(shù)調(diào)整器被配置為依據(jù)多個(gè)轉(zhuǎn)碼系數(shù)算出一時(shí)間均值(T );及 其中,所述參數(shù)調(diào)整器被配置為提供所述經(jīng)調(diào)整的轉(zhuǎn)碼系數(shù)(352、j0,使得所述經(jīng)調(diào)整的轉(zhuǎn)碼系數(shù)與所述時(shí)間均值的偏差限制。
11.根據(jù)權(quán)利要求10所述的裝置(100、350、450),其中,所述參數(shù)調(diào)整器被配置為允許落在依據(jù)所述時(shí)間均值(T )所測定的一容許區(qū)間內(nèi)部的一轉(zhuǎn)碼系數(shù)(337、T)維持不變,及 將大于所述容許區(qū)間的上邊界值(AF)的一轉(zhuǎn)碼系數(shù)選擇性地設(shè)定為小于或等于所述上邊界值的一值,及 將小于所述容許區(qū)間的下邊界值(HKT )的一轉(zhuǎn)碼系數(shù)選擇性地設(shè)定為大于或等于所述下邊界值的一值。
12.根據(jù)權(quán)利要求10或11所述的裝置(100、350、450),其中,所述參數(shù)調(diào)整器被配置為使用所述轉(zhuǎn)碼系數(shù)(337、T)序列的遞歸低通濾波而求出所述時(shí)間均值/ )
13.根據(jù)權(quán)利要求I至12中任一項(xiàng)所述的裝置(100、250、350、440、450),其中,所述參數(shù)調(diào)整器被配置為提供一或多個(gè)經(jīng)調(diào)整參數(shù)中的一給定者,使得所述經(jīng)調(diào)整參數(shù)中的所述給定者落在容許區(qū)間內(nèi)部,所述容許區(qū)間的邊界依據(jù)多個(gè)輸入?yún)?shù)值的平均值(132、及、T、X)及一或多個(gè)容許參數(shù)(Ak_、Ak+、At_、At+、Ax_、Ax+)界定,以及使得一輸入?yún)?shù)與一相對應(yīng)經(jīng)調(diào)整參數(shù)間的偏差為最小化或維持在預(yù)定最大容許范圍以內(nèi)。
14.根據(jù)權(quán)利要求13所述的裝置(100、250、350、440、450),其中,所述參數(shù)調(diào)整器被配置為,其邊界依據(jù)多個(gè)輸入?yún)?shù)值的平均值(132、^、t、尤)界定的所述容許區(qū)間,將發(fā)現(xiàn)落在所述容許區(qū)間外部的一輸入?yún)?shù)選擇性地設(shè)定至所述容許區(qū)間的一上邊界值(AR、Ar、Al、X+Ax+)或一下邊界值(~XR、、Xx'尤_AX_)來獲得所述輸入?yún)?shù)的經(jīng)調(diào)整版本(R、T、X )0
15.根據(jù)權(quán)利要求13所述的裝置(100、250、350、440、450),其中,所述參數(shù)調(diào)整器被配置為迭代重復(fù)地選擇所述輸入?yún)?shù)中的一個(gè)別者(R(i_)、Xi*),其包含于個(gè)別迭代重復(fù)中與所述平均值(132、A> J、x)的最大偏離;以及將所述輸入?yún)?shù)中的所述選定者調(diào)整至更接近所述平均值,來迭代重復(fù)地將判定為落在其邊界依據(jù)平均值界定的一容許區(qū)間外部的輸入?yún)?shù)調(diào)整至所述容許區(qū)間內(nèi)部。
16.根據(jù)權(quán)利要求15所述的裝置(100、350、450),其中,所述參數(shù)調(diào)整器被配置為選擇一修正階大小,所述修正階用來將所述輸入?yún)?shù)中較為接近所述平均值的選定者(R(i_)、X調(diào)整至所述輸入?yún)?shù)中的所述選定者與所述平均值間的差的預(yù)定分量。
17.—種用以基于一下混信號表不形態(tài)(210、420)及一參數(shù)側(cè)邊信息(212、422)來提供一上混信號表示形態(tài)(220、430a-430M)的裝置(200、300、410),所述裝置包含根據(jù)權(quán)利要求I至16中任一項(xiàng)所述的用以基于一或多個(gè)所接收的參數(shù)(110、214、·337、R、T)而提供一或多個(gè)經(jīng)調(diào)整參數(shù)(120、252、352、及、jO的一裝置(100、250、350、440、·450); 一信號處理器(230、330),其被配置為基于所述下混信號表示形態(tài)及所述參數(shù)側(cè)邊信息而獲得所述上混信號表示形態(tài), 其中,用以提供一或多個(gè)經(jīng)調(diào)整參數(shù)的所述裝置被配置為調(diào)整所述信號處理器的一或多個(gè)處理參數(shù)(252、352、R、T)。
18.根據(jù)權(quán)利要求17所述的裝置(200、300、410),其中,所述信號處理器(230)被配置為依據(jù)經(jīng)調(diào)整的呈現(xiàn)系數(shù)(252、及)而提供所述上混信號表示形態(tài)(220、430a-430M),所述經(jīng)調(diào)整的呈現(xiàn)系數(shù)描述音頻對象對所述上混信號表示形態(tài)的一或多個(gè)聲道的貢獻(xiàn);及 其中,用以提供一或多個(gè)經(jīng)調(diào)整參數(shù)的所述裝置(100、250、440)被配置為接收多個(gè)使用者指定的呈現(xiàn)參數(shù)(214、R)作為輸入?yún)?shù),及基于此而提供由所述信號處理器使用的一或多個(gè)經(jīng)調(diào)整的呈現(xiàn)參數(shù)(252、及)。
19.根據(jù)權(quán)利要求17所述的裝置(200、300、410),其中,用以提供一或多個(gè)經(jīng)調(diào)整參數(shù)的所述裝置(100、350、450)被配置為接收一混合矩陣的一或多個(gè)混合矩陣元(337、1')作為所述一或多個(gè)輸入?yún)?shù),及基于此而提供由所述信號處理器(330)使用的一或多個(gè)經(jīng)調(diào)整的所述混合矩陣的混合矩陣元(352、j0 ;及 其中,所述信號處理器被配置為依據(jù)經(jīng)調(diào)整的所述混合矩陣的混合矩陣元(352、j0而提供所述上混信號表示形態(tài)(220、430a-430M),其中,所述混合矩陣描述所述下混信號表示形態(tài)的一或多個(gè)音頻聲道信號映射至所述上混信號表示形態(tài)的一或多個(gè)音頻聲道信號的映射關(guān)系。
20.根據(jù)權(quán)利要求17所述的裝置(200、300、410),其中,所述信號處理器被配置為獲得MPEG環(huán)繞任意下混增益值,及 其中,用以提供一或多個(gè)經(jīng)調(diào)整參數(shù)的所述裝置被配置為接收多個(gè)任意下混增益值作為輸入?yún)?shù),及提供多個(gè)經(jīng)調(diào)整的任意下混增益值。
21.—種用以基于一下混信號表不形態(tài)及與所述下混信號表不形態(tài)相關(guān)聯(lián)的一參數(shù)側(cè)邊信息來提供用于提供一上混信號表示形態(tài)的一或多個(gè)經(jīng)調(diào)整參數(shù)的方法,所述方法包含 接收一或多個(gè)參數(shù);及 基于此而提供一或多個(gè)經(jīng)調(diào)整參數(shù),其中,所述一或多個(gè)經(jīng)調(diào)整參數(shù)依據(jù)多個(gè)參數(shù)值的平均值而提供,使得經(jīng)由使用非最佳參數(shù)用以提供所述上混信號表示形態(tài)所造成的所述上混信號表示形態(tài)的失真,對偏離最佳參數(shù)的一或多個(gè)參數(shù)至少減少大于一預(yù)定偏差。
22.—種計(jì)算機(jī)程序,其用于當(dāng)所述計(jì)算機(jī)程序于計(jì)算機(jī)上運(yùn)行時(shí)來執(zhí)行根據(jù)權(quán)利要求21所述的方法。
全文摘要
一種用以基于下混信號表示形態(tài)及與下混信號表示形態(tài)相關(guān)聯(lián)的參數(shù)側(cè)邊信息來提供用于提供上混信號表示形態(tài)的一或多個(gè)經(jīng)調(diào)整參數(shù)的裝置,其包含一參數(shù)調(diào)整器。該參數(shù)調(diào)整器被配置為接收一或多個(gè)參數(shù),及基于此而提供一或多個(gè)經(jīng)調(diào)整參數(shù)。該參數(shù)調(diào)整器被配置為依據(jù)多個(gè)參數(shù)值的平均值而提供一或多個(gè)經(jīng)調(diào)整參數(shù),使得通過使用非最佳參數(shù)所導(dǎo)致的該上混信號表示形態(tài)的失真,對偏離最佳參數(shù)的參數(shù)至少減少大于預(yù)定偏差。
文檔編號G10L19/00GK102714035SQ201080052486
公開日2012年10月3日 申請日期2010年10月15日 優(yōu)先權(quán)日2009年10月16日
發(fā)明者于爾根·赫萊, 科爾內(nèi)利婭·法爾克, 萊昂·特倫迪 申請人:弗蘭霍菲爾運(yùn)輸應(yīng)用研究公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
仙桃市| 延川县| 宜昌市| 湖口县| 绥滨县| 仁布县| 水城县| 虞城县| 浏阳市| 婺源县| 阿鲁科尔沁旗| 长岭县| 梧州市| 东至县| 贵德县| 高州市| 阿勒泰市| 贵州省| 江川县| 新竹县| 辛集市| 阳高县| 东港市| 维西| 垣曲县| 平定县| 吴忠市| 郴州市| 望都县| 边坝县| 鄂伦春自治旗| 东海县| 株洲市| 郴州市| 新郑市| 延川县| 泸溪县| 拜泉县| 郁南县| 正阳县| 台南县|