欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種3d音頻空間參數(shù)全方位非均勻量化編碼系統(tǒng)及方法

文檔序號:2828173閱讀:335來源:國知局
一種3d音頻空間參數(shù)全方位非均勻量化編碼系統(tǒng)及方法
【專利摘要】本發(fā)明提供一種3D音頻空間參數(shù)全方位非均勻量化編碼系統(tǒng)及方法,包括基于雙聲道輸入信號進(jìn)行預(yù)處理、聲道信號下混、下混信號量化編碼;按子帶提取空間參數(shù),所述空間參數(shù)為聲道間強(qiáng)度差異參數(shù)ICLD;根據(jù)全方位角度JND得到全方位角度量化表;根據(jù)輸入的揚(yáng)聲器的空間位置信息,建立在兩揚(yáng)聲器所夾區(qū)域之間所形成虛擬聲像的方位角與空間參數(shù)的映射表,從全方位角度量化表映射得到空間參數(shù)量化表;進(jìn)行空間參數(shù)全方位的非均勻量化壓縮編碼,對輸入的揚(yáng)聲器空間位置信息進(jìn)行熵編碼。本發(fā)明基于人耳對全方位的角度感知差異特性自適應(yīng)地根據(jù)揚(yáng)聲器方位信息生成全方位空間參數(shù)非均勻量化表,相比現(xiàn)有方法,本發(fā)明明顯提高了編碼效率和質(zhì)量。
【專利說明】一種3D音頻空間參數(shù)全方位非均勻量化編碼系統(tǒng)及方法

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及音頻編碼【技術(shù)領(lǐng)域】,尤其涉及一種3D音頻空間參數(shù)全方位非均勻量 化編碼系統(tǒng)及方法。

【背景技術(shù)】
[0002] 人耳的空間聽覺特性是聲道間空間參數(shù)感知去冗余的基礎(chǔ)。傳統(tǒng)的空間音頻參數(shù) 編碼方法,通過聲道下混和提取聲道間空間參數(shù)的方法進(jìn)行立體聲信號壓縮編碼,基于人 對空間方位感知的雙耳線索的恰可感知差異特性,對立體聲空間參數(shù)進(jìn)行感知去冗余量化 編碼。人對3D空間中不同方位的聲音具有不同的感知敏感特性,人對正前方聲音方位感知 最敏感,后方次之,側(cè)面最弱。然而現(xiàn)有多聲道3D音頻編碼技術(shù)仍然沿用立體聲編碼方法, 對所有方位揚(yáng)聲器對提取的空間參數(shù)采用相同的量化表,相同的量化范圍及步長設(shè)置難以 與人耳對不同方位的感知特性相符,從而造成要么量化比特數(shù)浪費、要么量化精度不夠帶 來感知失真的問題,降低編碼效率和質(zhì)量。


【發(fā)明內(nèi)容】

[0003] 本發(fā)明的目的是提供一種3D音頻空間參數(shù)全方位非均勻量化編碼系統(tǒng)及方法, 使得3D音頻中所有方位的揚(yáng)聲器信號中提取的空間參數(shù)感知編碼都能與人耳感知特性相 符。
[0004] 為達(dá)到上述目的,本發(fā)明提供一種3D音頻空間參數(shù)全方位非均勻量化編碼系統(tǒng), 包括以下模塊:
[0005] 預(yù)處理模塊,用于對雙聲道輸入信號進(jìn)行預(yù)處理,得到兩個聲道的當(dāng)前幀的各個 子帶的頻域信號X iGO和\(k)并做兩路輸出,一路輸出給聲道信號下混模塊,一路輸出給 空間參數(shù)提取模塊;i,j代表揚(yáng)聲器信號編號,k代表子帶編號,取值1,2,…,K,子帶數(shù)K > 1 ;
[0006] 聲道信號下混模塊,用于對從預(yù)處理模塊輸入的頻域信號Xi (k)和Xj (k),按每個 子帶每個頻譜系數(shù)進(jìn)行下混,得到當(dāng)前幀的頻域下混信號XmixGO = (Xi(k)+X^k))/2,輸出 給下混信號量化編碼模塊;
[0007] 下混信號量化編碼模塊,用于對聲道信號下混模塊輸入的下混信號XmixGO = (Xi (k) +X^k)) /2進(jìn)行量化編碼,將編碼結(jié)果作為碼流的一部分輸出給解碼端;
[0008] 空間參數(shù)提取模塊,用于對從預(yù)處理模塊輸入的所得當(dāng)前幀的各個子帶的頻域信 號Xi (k)和\ (k),按子帶提取空間參數(shù)并輸出給空間參數(shù)全方位非均勻量化編碼模塊,所 述空間參數(shù)為聲道間強(qiáng)度差異參數(shù)ICLD,提取如下,
[0009]

【權(quán)利要求】
1. 一種3D音頻空間參數(shù)全方位非均勻量化編碼系統(tǒng),其特征在于,包括以下模塊: 預(yù)處理模塊,用于對雙聲道輸入信號進(jìn)行預(yù)處理,得到兩個聲道的當(dāng)前幀的各個子帶 的頻域信號XiGO和\(k)并做兩路輸出,一路輸出給聲道信號下混模塊,一路輸出給空間 參數(shù)提取模塊;i,j代表揚(yáng)聲器信號編號,k代表子帶編號,取值1,2,…,K,子帶數(shù)K> 1 ; 聲道信號下混模塊,用于對從預(yù)處理模塊輸入的頻域信號Xi (k)和\ (k),按每個子帶 每個頻譜系數(shù)進(jìn)行下混,得到當(dāng)前幀的頻域下混信號XmixGO= (XiGO+X^k))/2,輸出給下 混信號量化編碼模塊; 下混信號量化編碼模塊,用于對聲道信號下混模塊輸入的下混信號XmixGO= (Xi (k) +X^k)) /2進(jìn)行量化編碼,將編碼結(jié)果作為碼流的一部分輸出給解碼端; 空間參數(shù)提取模塊,用于對從預(yù)處理模塊輸入的所得當(dāng)前幀的各個子帶的頻域信號XiGO和\(k),按子帶提取空間參數(shù)并輸出給空間參數(shù)全方位非均勻量化編碼模塊,所述 空間參數(shù)為聲道間強(qiáng)度差異參數(shù)ICLD,提取如下,
其中SXiGO2和SXjGO2表示對頻域信號XiGO和Xj(k)的第k個子帶的所有頻譜系 數(shù)求平方和; 全方位角度量化表生成模塊,用于包括根據(jù)輸入的全方位的角度恰可感知差異JND值Α_(8,e),量化得到全方位角度量化表中角度的量化值A(chǔ)Q(index),量化步長通過設(shè)置相鄰 兩個Aq (index)之間的差異約等于從量化點開始的2個連續(xù)A_(a,e)值的和,其中a,e分 別代表水平角和高度角;所得全方位角度量化表輸出給基于方位角自適應(yīng)映射的空間參數(shù) 量化表生成模塊; 基于方位角自適應(yīng)映射的空間參數(shù)量化表生成模塊,用于根據(jù)輸入的揚(yáng)聲器的空間位 置信息,計算兩揚(yáng)聲器的夾角,建立在兩揚(yáng)聲器所夾區(qū)域之間所形成虛擬聲像的方位角與 揚(yáng)聲器信號聲道間空間參數(shù)的映射表,根據(jù)從全方位角度量化表生成模塊輸入的全方位角 度量化表,從全方位角度量化表映射得到空間參數(shù)量化表,輸出給空間參數(shù)全方位非均勻 量化編碼模塊; 空間參數(shù)全方位非均勻量化編碼模塊,用于根據(jù)從基于方位角自適應(yīng)映射的空間參數(shù) 量化表生成模塊得到的空間參數(shù)量化表,對從空間參數(shù)提取模塊輸入的空間參數(shù)量化,對 量化索引進(jìn)行差分熵編碼,實現(xiàn)空間參數(shù)全方位的非均勻量化壓縮編碼,將編碼結(jié)果作為 碼流的一部分輸出給解碼端; 揚(yáng)聲器配置邊信息量化編碼模塊,用于對輸入的揚(yáng)聲器空間位置信息,進(jìn)行熵編碼,將 編碼結(jié)果作為碼流的一部分輸出給解碼端。
2. -種3D音頻空間參數(shù)全方位非均勻量化編碼系統(tǒng),其特征在于:基于方位角自適應(yīng) 映射的空間參數(shù)量化表生成模塊用于具體執(zhí)行以下操作, 給定輸入揚(yáng)聲器SjPS」的高度角e,揚(yáng)聲器SJPS」在主坐標(biāo)系XY中水平方位 角分別是9XY(k,i)和QxyG^j),在以兩揚(yáng)聲器連線的中垂線及其垂線所構(gòu)成的坐 標(biāo)系X'Y'中分別映射得到兩揚(yáng)聲器的水平方位角汛U) = 氏J) -UM))和 = -{θ^Y(k^j) -θχγ (kj)) ^a * 根據(jù)全方位量化表,選取高度角為e、水平方位角位于Θ^(k,i)和ΘXY(k,j)之間的角 度的量化值A(chǔ)Q(indeX)組成兩揚(yáng)聲器所構(gòu)成的局部區(qū)域的角度量化表;在該局部區(qū)域中,根 據(jù)主坐標(biāo)系XY中虛擬聲源Sij的水平方位角度(^./),得到虛擬聲源Sij在坐標(biāo)系X'Y' 中的水平方位角舛?(A,/,./_) - (M) + (々,/)); 根據(jù)兩揚(yáng)聲器在坐標(biāo)系Χ'Υ'中的水平方位角Θ(k,i)和Θ(k,j),以及局部區(qū)域中每 一個量化角度在坐標(biāo)系X'Y'中的水平方位角,計算得到該角度對應(yīng)的ICLD的量 化值,
3. -種3D音頻空間參數(shù)全方位非均勻量化編碼方法,其特征在于,包括以下步驟: 步驟1,對輸入信號進(jìn)行預(yù)處理,得到兩個聲道的當(dāng)前幀的各個子帶的頻域信號XiGO 和\ (k),i,j代表揚(yáng)聲器信號編號,k代表子帶編號,取值1,2,…,K,子帶數(shù)K> 1 ; 步驟2,得到下混信號,包括對于步驟1所得當(dāng)前幀的各個子帶的頻域信號XiGO和\(k),按每個子帶每個頻譜系數(shù)進(jìn)行下混,得到當(dāng)前幀的頻域下混信號Xmix(k)= (X^^+X^k))^ ; 步驟3,對下混信號進(jìn)行編碼,包括對步驟2所得當(dāng)前幀的頻域下混信號Xmix(k)= (Xi (k) +X^k)) /2進(jìn)行量化編碼,將編碼結(jié)果作為碼流的一部分輸出給解碼端; 步驟4,空間參數(shù)提取,包括對步驟1所得當(dāng)前幀的各個子帶的頻域信號XiGO和Xj (k),按子帶提取空間參數(shù),所述空間參數(shù)為聲道間強(qiáng)度差異參數(shù)ICLD,提取如下,
其中SXiGO2和SXjGO2表示對頻域信號XiGO和Xj(k)的第k個子帶的所有頻譜系 數(shù)求平方和; 步驟5,全方位角度量化表生成,包括根據(jù)輸入的全方位的角度恰可感知差異JND值Α_(8,e),量化得到全方位角度量化表中角度的量化值A(chǔ)Q(index),量化步長通過設(shè)置相鄰 兩個Aq (index)之間的差異約等于從量化點開始的2個連續(xù)A_(a,e)值的和,其中a,e分 別代表水平角和高度角; 步驟6,根據(jù)輸入的揚(yáng)聲器的空間位置信息,計算兩揚(yáng)聲器的夾角,建立在兩揚(yáng)聲器所 夾區(qū)域之間所形成虛擬聲像的方位角與揚(yáng)聲器信號聲道間空間參數(shù)的映射表,根據(jù)步驟5 所得全方位角度量化表,從全方位角度量化表映射得到空間參數(shù)量化表; 步驟7,根據(jù)步驟6中得到的空間參數(shù)量化表,對步驟4得到的空間參數(shù)進(jìn)行量化,對量 化索引進(jìn)行差分熵編碼,實現(xiàn)空間參數(shù)全方位的非均勻量化壓縮編碼,將編碼結(jié)果作為碼 流的一部分輸出給解碼端; 步驟8,對輸入的揚(yáng)聲器空間位置信息,進(jìn)行熵編碼,將編碼結(jié)果作為碼流的一部分輸 出給解碼端。
4. 一種3D音頻空間參數(shù)全方位非均勻量化編碼方法,其特征在于:步驟6實現(xiàn)方式如 下, 給定輸入揚(yáng)聲器SjPS」的高度角e,揚(yáng)聲器SJPS」在主坐標(biāo)系XY中水平方位 角分別是9XY(k,i)和QxyG^j),在以兩揚(yáng)聲器連線的中垂線及其垂線所構(gòu)成的坐 標(biāo)系X'Y'中分別映射得到兩揚(yáng)聲器的水平方位角外W) = -4(1·氏·/') -UW))和^. 根據(jù)全方位量化表,選取高度角為e、水平方位角位于Θ^(k,i)和ΘXY(k,j)之間的角 度的量化值A(chǔ)Q(indeX)組成兩揚(yáng)聲器所構(gòu)成的局部區(qū)域的角度量化表;在該局部區(qū)域中,根 據(jù)主坐標(biāo)系XY中虛擬聲源Su的水平方位角度(LA/),得到虛擬聲源Su在坐標(biāo)系X'Y' 中的水平方位角舛々乂./_) =Au(A,,·,./) - ./) +K々,/_)): 根據(jù)兩揚(yáng)聲器在坐標(biāo)系Χ'γ'中的水平方位角θ(k,i)和θ(k,j),以及局部區(qū)域中每 一個量化角度在坐標(biāo)系Χ'γ'中的水平方位角Ρ(·/(乂./_),計算得到該角度對應(yīng)的ICLD的量化 值,
【文檔編號】G10L19/038GK104464742SQ201410855935
【公開日】2015年3月25日 申請日期:2014年12月31日 優(yōu)先權(quán)日:2014年12月31日
【發(fā)明者】胡瑞敏, 高麗, 楊玉紅, 王曉晨, 涂衛(wèi)平, 武庭照, 柯善發(fā), 張茂勝, 李登實, 王松, 姜林, 楊乘 申請人:武漢大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
荣昌县| 沅江市| 永州市| 周宁县| 闵行区| 田阳县| 铁岭县| 江阴市| 日照市| 信阳市| 乐陵市| 昌黎县| 上林县| 泰和县| 清苑县| 喀什市| 嵊州市| 和硕县| 桐乡市| 长子县| 阳江市| 中宁县| 哈尔滨市| 平度市| 南召县| 辰溪县| 巴林右旗| 凤山县| 彭阳县| 鄢陵县| 金山区| 南乐县| 吕梁市| 巴南区| 晋中市| 顺义区| 岐山县| 赫章县| 从化市| 石柱| 黔西县|