一種用于處理音頻信號的方法和設備的制作方法
【專利摘要】本發(fā)明通常涉及一種音頻信號處理方法和裝置,用于處理一音頻信號,并且此方法包括的步驟如下:接收一縮混(DMX)信號;接收通道間相位差(IPD)信息,通道間相位差信息對應于第一相位通道和第二相位通道間的相位差;接收一通道電平差,通道電平差對應于第一相位通道和第二相位通道間的電平差;判定基于通道電平差的第一權重和第二權重的定義;根據判定的定義,使用IPD計算第一權重和第二權重;產生總的相位差(OPD)信息,基于第一權重和第二權重,總的相位差信息對應于第一相位通道和DMX信號間的相位差。
【專利說明】一種用于處理音頻信號的方法和設備
【技術領域】
[0001] 本發(fā)明通常涉及一種音頻信號處理方法和裝置,可用于處理音頻信號,尤其是涉 及一種音頻信號處理方法和設備,可用于編碼或解碼音頻信號。
【背景技術】
[0002] 通常,隨著大規(guī)模視頻圖像的使用,需要向聽眾提供一種具有沉浸感的音頻,類似 聲音環(huán)繞于聆聽著的周圍。為了提高環(huán)繞立體聲的臨場感受和身臨其境的環(huán)繞感覺,聲頻 通道的數量可大于2個通道或5. 1個通道。音頻信號可處理的通道數量(例如,22. 2個通 道)最多可至數十個。
【發(fā)明內容】
[0003] 摶術問是頁
[0004] 多個通道的最多可至數十個的信號,可通過一編碼器進行縮混,這個縮混信號可 傳輸至一解碼器。縮混信號必須被解碼器分離,以便使之接近于原始的通道信號。
[0005] 摶術方案
[0006] 本發(fā)明關注上述的問題,因此本發(fā)明的目的是提供一種音頻信號處理方法和設 備,可通過使用一從編碼器接收的上混參數(例如,一通道間相位差),上混一或多個縮混 的通道信號為兩個或多個通道信號。
[0007] 本發(fā)明的另一目的是提供一音頻信號處理方法和設備,它是如此配置,即當通道 間相位差(IPD)從編碼器收到相應的第一相位通道和第二相位通道間的相位差時,可使用 iro產生一總的相位差(0PD),總的相位差對應于第一相位通道和縮混信號間的相位差。
[0008] 本發(fā)明的進一步目的是提供一音頻信號處理方法和設備,可以應用權重,從一通 道間相位差(IPD)中產生一總的相位差(0PD),以防止在第一相位通道(例如,左聲道)和 第二相位通道間(例如,右聲道)間的相位差約為180°時,產生一錯誤。
[0009] 本發(fā)明的另一目的是提供一音頻信號處理方法和設備,可根據第一相位通道使用 權重的水平,改變第一相位通道(例如,左聲道)使用的第一權重的定義。
[0010] 本發(fā)明的另一目的是提供一音頻信號處理方法和設備,它在從一編碼器中接收上 混參數和一上混殘余信號時,有選擇的在一縮混信號上使用此上混參數和上混殘余信號, 因而通過差異化設置輸出信號的信道數量,進行了可擴展的音頻上混。
[0011] 為了完成上述目標,本發(fā)明提供了一種音頻信號處理方法,包括接收一縮混信號, 接收通道間相位差(IPD)信息,通道間相位差信息對應于第一相位通道和第二相位通道間 的相位差;接收一通道電平差(CLD),通道電平差對應于第一相位通道和第二相位通道間 的電平差;判定了基于CLD的第一權重和第二權重的定義;基于已判定的定義,使用IH)計 算第一權重和第二權重;以及產生總的相位差(0PD)信息,基于第一權重和第二權重,總的 相位差信息對應于第一相位通道和縮混信號間的相位差。
[0012] 本發(fā)明的音頻信號處理方法可進一步包括:使用總的相位差(0PD)和縮混信號產 生第一相位通道和第二相位通道。
[0013] 本發(fā)明的定義包括一第一定義和一第二定義,其中根據IPD,當第一相位通道的電 平值大于第二相位通道的電平值時,第一權重可大于第二權重。而根據IPD,當第二相位通 道的電平值大于第一相位通道的電平值時,第二權重可大于第一權重。
[0014] 本發(fā)明的另一目的是提供一音頻信號處理設備,包括一多路分解單元,用于接收 一縮混信號,接收一通道間相位差(iro),通道間相位差對應于第一相位通道和第二相位通 道間的相位差,以及接收一通道電平差(CLD),通道電平差對應于第一相位通道和第二相位 通道間的電平差;一權重定義判定單元,用于判定基于通道電平差的第一權重和第二權重 間的定義;一權重產生單元,用于基于定義使用iro計算第一權重和第二權重;以及一總的 相位差(0PD)產生單兀,用于基于第一權重和第二權重,產生0PD信息,0PD信息對應于第 一相位通道和縮混信號間的相位差。
[0015] 本發(fā)明的裝置可進一步包括一 (PD應用單元,用于使用(PD和縮混信號,產生第一 相位通道和第二相位通道。
[0016] 本發(fā)明的定義包括一第一定義和一第二定義,其中根據IPD,當第一相位通道的電 平值大于第二相位通道的電平值時,第一權重可大于第二權重。而根據IPD,當第二相位通 道的電平值大于第一相位通道的電平值時,第二權重可大于第一權重。
[0017] 本發(fā)明的另一目的是提供一音頻信號處理方法,包括接收一縮混信號,接收一通 道間相位差(iro),通道間相位差對應于第一相位通道和第二相位通道間的相位差;接收 一通道電平差,通道電平差對應于第一相位通道和第二相位通道間的電平差;計算一應用 于第一相位通道的第一權重,以及計算一應用于第二相位通道的第二權重;基于通道電平 差,判定一第一相位通道和縮混信號之和的定義;以及產生總的相位差(opd)信息,根據之 前總和的定義,基于第一權重和第二權重,總的相位差信息對應于第一相位通道和縮混信 號間的相位差。
[0018] 本發(fā)明的方法可進一步包括,使用oro和縮混信號,產生第一相位通道和第二相 位通道。
[0019] 本發(fā)明的總和定義可包括一第一總和定義和一第二總和定義,其中根據IPD,當第 一相位通道的電平值大于第二相位通道的電平值時,在第一總和定義中的第一權重可大于 第二權重。而根據IPD,當第二相位通道的電平值大于第一相位通道的電平值時,在第二總 和定義中的第二權重可大于第一權重。
[0020] 本發(fā)明的另一目的是提供一音頻信號處理方法,包括接收一縮混信號,接收一或 多個上混參數和一上混殘余信號;當收到上混參數是,對縮混信號使用此上混參數,因而產 生了 M參數輸出通道;當收到上混參數和一上混殘余信號時,對縮混信號使用此上混參數 和上混殘余信號,因而產生了 N離散輸出通道。
[0021] 有益效果
[0022] 本發(fā)明提供了以下的有益效果。
[0023] 首先,既然一縮混信號可以通過使用上混參數,上混為5. 1通道或更多通道的多 通道信號,因而相對于多通道信號編碼沒有變化,此方法的比特效率提高了。
[0024] 其次,既然揚聲器設置為單聲道或立體聲格式,當縮混信號在不需一上混步驟時, 沒有必要在一 5. 1通道或更多通道的信號被重建后縮混一重建的多通道信號,因而減少了 計算負荷和復雜性。
[0025] 第三,既然基于一通道間相位差(iro),可計算總的相位差(0PD),因此不需要單 獨的傳輸0PD,因而減少了比特數量。
[0026] 第四,在為了上混而產生一 (PD時,使用了權重,因而當在第一相位通道和第二相 位通道間間的相位差約為180°時,減少了發(fā)生的破壞性的干涉效果。
[0027] 第五,如果在第一相位通道的電平較低的情況下使用較高的權重,可防止增加的 失真的現象。
[0028] 第六,一解碼單元具有一可擴展結構,因此根據獨立設備的揚聲器設置,比特流的 解碼電平為差異化的設置,因而不僅增加了比特效率,而且減少了計算負荷和復雜性。
【專利附圖】
【附圖說明】
[0029] 圖1是一示意圖,根據圖像(UHDTV和HDTV)的尺寸,顯示了在相同的視距內的視 角;
[0030] 圖2是一示意圖,作為一多通道實例顯示了 22. 2個通道的揚聲器的分配;
[0031] 圖3是一示意圖,顯示了 一縮混多通道信號的步驟;
[0032] 根據本發(fā)明的一實施例,圖4是一示意圖,顯示了解碼器的配置。
[0033] 圖5說明了圖4的輸出通道產生單元120的第一實施例;
[0034] 圖6說明了圖4的輸出通道產生單元120的第二實施例;
[0035] 圖7說明了圖4的輸出通道產生單元120的第三實施例;
[0036] 圖8是一詳細的示意圖,顯示了圖5至圖7的上混單元122的實施例;
[0037] 圖9是一不意圖,顯不了由相位差引起的失真現象;
[0038] 根據本發(fā)明的另一實施例,圖10是一示意圖,顯示了一編碼器和解碼器的配置; 以及
[0039] 根據本發(fā)明的一實施例,圖11是一產品的示意配置圖,其中使用了一音頻信號處 理設備。 具體實施例
[0040] 在下文中,本發(fā)明的優(yōu)選的實施例將會結合附圖進行詳細的描述。在此之前,應當 注意文中使用的術語和單詞及權利要求不應當翻譯成限定于普通的含義或詞典的定義,并 且應當理解,本發(fā)明具有的含義和概念中的技術精髓,是基于
【發(fā)明者】能恰當的定義術語的 概念原則的基礎上的,以便更好的描述他或她的發(fā)明。因而,文中描述的實施例和附圖中說 明的配置并不是優(yōu)選的例子,并且沒有完全的展現本發(fā)明的技術精神。因此,在本發(fā)明申請 的同時,還會有不同的等同物和修改替代此實施例和配置。
[0041] 本發(fā)明的術語可以基于以下標準翻譯,并且即使未在本文中描述的術語,也可以 根據下述要點翻譯。根據語境,代碼可翻譯成編碼或解碼,而信息是一術語,包含值,參數, 系數,元素等,并可依據語境翻譯,但是本發(fā)明并不僅限于上述含義。
[0042] 圖1是一示意圖,根據圖像(例如,超高清電視(UHDTV)和高清晰度電視(HDTV)) 的尺寸,顯示了在相同的視距內的視角。隨著顯示器的產品技術的發(fā)展和消費者需求的增 力口,圖像的尺寸呈一增長趨勢。如圖1所示,一幅UHDTV圖像(7680*4320像素圖像)的尺 寸比一幅HDTV圖像(1920*1080像素圖像)的尺寸大約大16倍。當一 HDTV安裝于起居室 的墻面上,而觀看者以一預設的視距坐在沙發(fā)上時,視角可以為30°。然而,當一 UHDTV以 相同視距安裝時,視角可達到100°。這樣,當安裝一高質量的和高分辨率的屏幕時,優(yōu)選的 提供高真實感的和高還原性的聲音,以便與大尺寸的視頻相一致。為提供這樣一種環(huán)境,以 便讓觀察者有身臨其境的感覺,只提供一或兩個環(huán)繞的通道揚聲器時不夠的。因而,需要一 種多通道音頻環(huán)境,具有大量的揚聲器和通道。
[0043] 如上所述,除了一家庭影院外,可能的環(huán)境還有,一個人3D TV,一智能電話TV,一 22. 2通道音頻程序,一傳播媒介,一 3D視頻,一遠程呈現室,基于云的游戲,等。
[0044] 圖2是一示意圖,顯示了一多通道環(huán)境實例,其中說明了 22. 2通道揚聲器的配置。 22. 2通道可以是一多通道環(huán)境的實例,用于提高聲場效果,并且本發(fā)明并不僅限于特定數 據的通道或特定的揚聲器分配。參考圖2,可以為頂層提供總共9條通道。也就是,可看到 總共設置了 9個揚聲器,3個設置于頂部前端,3個設置于頂部中間,3個設置于頂部后端。 在中間層,5個揚聲器可設置于前端,2個設置側邊位置,3個設置于后端。在前端的5個揚 聲器中間,中間3個揚聲器可以包括在TV顯示屏內。在底層,在前部位置可安裝3個通道 和2個低頻效果(LFE)通道。
[0045] 這樣,在傳輸和再生產一至多數十個通道的多通道信號時,可能需要一高計算負 荷。進一步的,考慮到通信環(huán)境等,也可能需要高壓縮率。此外,在標準的家庭中,一多通道 的(例如,22. 2通道)揚聲器環(huán)境并不是經常擁有的,并且許多聽眾具有2通道或5. 1通道 設備。因而,在信號被各自的解碼為一多通道信號后,以普通方式傳輸至所有用戶的信號被 發(fā)送出去的情況下,當多通道信號必須被轉換回2通道和5. 1通道信號時,無效的通信發(fā)生 了。此外,22. 2通道脈沖編碼調制(PCM)信號必須被存儲,因而可能進行了無效的內存管 理。
[0046] 因而,在一縮混步驟執(zhí)行后(M-N縮混),而非各自的編碼和傳輸多通道的信號后 (總共M個通道,代表輸入的通道數),可以傳輸一縮混信號至一解碼器??s混步驟用于把 通道的數量減少至更小的數量(N個通道,代表輸入的通道數)。解碼器可以接收縮混信號, 并毫無改變的再生縮混信號,或者可使用從縮混步驟中抽取的信息,從縮混信號中產生一 些通道信號,其中通道信號的數量同原始信號的數量相同。
[0047] 圖3是一示意圖,顯示了一步驟,用于縮混一多通道信號。根據由編碼器定義的樹 形結構,多通道信號可以縮混。一縮混步驟可以在5. 1通道信號為一多通道信號例子的情 況下使用。然而,本發(fā)明并不僅限于一特定的樹形結構或特定的輸入通道數量,并且一多通 道信號可以是一 22. 2通道信號。進一步的,雖然縮混信號的通道(N通道)可以作為一單 聲道或立體聲信號的例子在圖3中使用,應當注意,只要通道的N數目小于輸入通道的M數 目,通道可以在任何情況下自由使用(5. 1通道或諸如此類)。
[0048] 參考圖3, 一左聲道,一右聲道,一中央聲道,一環(huán)繞左聲道,以及一環(huán)繞右聲道,可 以成為一多通道配置或是其中的一部分。中央聲道被測量權重,并且隨后被單獨的分配給 左聲道和右聲道。此外,當環(huán)繞左聲道和環(huán)繞右聲道出現時,它們可能被測量權重并隨后被 分別的納入左聲道和右聲道。其結果是,產生一總的左聲道(Lt/Lo)和一總的右聲道(Rt/ R〇),并且它們可以互相混合以產生一單聲道信號。
[0049] 同時,在縮混步驟中,由于反相信號間的相消干擾,可能產生信號質量惡化的問 題。具體的,當縮混以簡單獲得臨近通道的總和的方式進行時,具有不同相位的相同信號很 有可能被隨之求和。在此步驟中,放大效應或衰減效應在一些信號中發(fā)生,因此會產生相關 的失真結果。進一步的,當縮混只是簡單的通過在頂層或底層添加通道至中間層來進行時, 實際上無法達到需要的聲音的場景。
[0050] 這樣的話,信號縮混入一單聲道或立體聲信號或類似信號可以通過一解碼器上混 至一 5. 1通道或更多通道的多通道信號。如上所述,雖然在縮混步驟中聲音質量可以由于 相消干擾效果而惡化,此類惡化可以在上混步驟中進行處理。這個步驟將會在有關圖4中 描述。
[0051] 根據本發(fā)明的實施例,圖4顯示了一解碼器的配置。參考圖4,解碼器包括一信號 分離器110和一輸出通道產生單元120。信號分離器110從解碼器接收一音頻比特流,并從 比特流中抽取一縮混信號DMX和一上混參數UP。當然,縮混信號和上混參數可以通過分開 的獨立音頻信號比特流,而非單個比特流接收。
[0052] 輸出通道產生單元120可以通過對接收的縮混信號DMX使用上混參數UP,產生一 多通道信號(對應于N個通道)。如上所述,多通道信號具有比縮混信號的M個通道更多的 通道,并可以是一 5. 1通道或22. 2通道的信號。多通道信號的N個通道數可以等于編碼器 的輸入通道數,但根據情況,也可能不相等。
[0053] 這里,上混參數UP可包括一空間參數和通道間相位差(IPD)信息??臻g參數可包 括通道電平差(CLD),并可進一步的包括通道間相干性(相關性)(ICC)。當兩個通道(第 一通道和第二通道)通過一單個一拖二(0TT)盒子縮混成一單通道(第一輸出通道)時, 通道電平差(CLD)為第一輸入通道和第二輸入通道間的電平差,并且ICC為第一輸入通道 和第二輸入通道間的相關性。
[0054] 同時,通道間相位差(IPD)信息可以是一 IH)本身,或者是一通過量化或編碼IPD 所得的數值。信號分離器110從接收的iro信息中獲取一 IPD。這里,iro對應于第一輸入 通道和第二輸入通道間的相位差。第一輸入通道和第二輸入通道也可以視為第一相位通道 和第二相位通道。
[0055] 這樣,通過一或多個上混單元對縮混信號使用上混參數UP,輸出通道產生單元 120可產生多通道的輸出通道信號。輸出通道產生單元120不同的實施例120A,120B,120C 將會在下面相關的圖5至圖7中描述。
[0056] 圖5至圖7說明了圖4的輸出通道產生單元120的第一實施例120A至第三實施 例120B。首先,參考圖5,第一實施例的輸出通道產生單元120A包括一單個上混單元122。 通過對一單個輸入信號使用一上混參數UP,上混單元122產生一第一相位通道P1和一第二 相位通道P2。這里,輸入信號可以是一接收的縮混信號本身,或是一涵蓋在一縮混信號內的 單個通道信號。這里,上混參數UP可包含一通道間相位差(IPD)和一通道電平差(CLD)。 同時,如120A. 1中的實施例所不,一輸入信號可以被一去相關器D去相關,并且隨后輸入信 號和去相關信號可被輸入上混單兀122。
[0057] 同時,上混單元122可把通道間相位差(IPD)轉換為總的相位差(0PD),并對輸入 信號使用此0PD。這里,(PD對應于第一相位通道和縮混信號間的相位差(或是第一相位通 道和輸入信號間的相位差)。上混單元122的詳細描述將會在之后的相關圖8中描述。
[0058] 參考圖6,根據第二實施例,可知曉輸出通道產生單元120B的配置。輸出通道產 生單元120B包括兩個上混單元122,它們以平行配置。通過對輸入信號1使用一上混參數 UP,第一上混單元122. 1產生一第一相位通道P1和一第二相位通道P2,其中輸入信號1可 以是縮混信號的一部分。例如,當縮混信號是一立體聲信號,輸入信號1可以是一左聲道信 號。通過對輸入信號2使用一上混參數UP,第二上混單元122. 2產生一第三相位通道P3和 一第四相位通道P4。當縮混信號是一立體聲信號時,輸入信號2可以是一右聲道信號。
[0059] 類似的,第一上混單元122. 1和第二上混單元122. 2的詳細配置可以在之后的關 于圖8中描述。
[0060] 參考圖7,根據第三實施例,可知曉輸出通道產生單元120C的配置。在輸出通道 產生單元120C中,三個上混單元122可分層排列。第一上混單元122. 1輸出的第一相位通 道P1和第二相位通道P2分別作為輸入通道作用于第二上混單元122. 2和第三上混單元 122.3。第一上混單元122. 1可執(zhí)行幾乎同第一實施例中的上混單元相同的功能。通過對 第一相位通道P1使用上混參數UP,第二上混單元122. 2產生一第三相位通道P3和一第四 相位通道P4,并且通過對第二相位通道P2使用上混參數UP,第三上混單元122. 3產生一第 五相位通道P5和一第六相位通道P6。
[0061] 除了第一至第三實施例中的輸出通道產生單元120A至120C,多個上混單元122可 進行并聯或串聯,并可配置成不同的樹形結構,但本發(fā)明并不僅限于特定的樹形結構。
[0062] 以下,將會描述實施例中的一或多個上混單元122的詳細配置。
[0063] 圖8是一詳細的配置圖,顯示了圖5至圖7的上混單元122的實施例。上混單元 122把通道間相位差(IPD)信息轉換為總的相位差(0PD),對(PD使用一空間參數,并隨后 從一或多個通道中產生兩個或更多的通道信號。參考圖8,上混單元122包括一權重定義判 定單元122a,一權重產生單元122b,一 0PD產生單元122c,以及一 IPD應用單元122d。
[0064] 圖9中描述了由一相位差引起的有害的失真現象。參考圖9,圖中說明了在一單聲 道信號和左聲道和右聲道間的相位。圖9(A)顯示了當一左聲道信號和一右聲道信號只是 簡單的求和,以產生一單聲道信號時的相位差,如下列方程式1所示:
[0065] [方程式1]
【權利要求】
1. 一種音頻信號處理方法,包括: 接收一縮混信號; 接收通道間相位差(IPD)信息,所述通道間相位差信息對應于第一相位通道和第二相 位通道間的相位差; 接收一通道電平差(CLD),所述通道電平差對應于第一相位通道和第二相位通道間的 電平差; 判定基于CLD的第一權重和第二權重的定義,其中所述第一權重應用于第一相位通 道,所述第二權重應用于第二相位通道; 使用已判定的定義和IPD,計算第一權重和第二權重; 產生總的相位差(OPD)信息,基于第一權重和第二權重,總的相位差信息對應于第一相 位通道和縮混信號間的相位差。
2. 如權利要求1所述的音頻信號處理方法,進一步包括,使用總的相位差(OPD)信息和 縮混信號,產生第一相位通道和第二相位通道間。
3. 如權利要求1所述的音頻信號處理方法,其特征在于: 所述定義包括一第一定義,其中所述第一權重大于等于所述第二權重,以及一第二定 義,其中所述第一權重小于等于所述第二權重,以及 基于所述CLD,所述判定設置成: 當所述第一相位通道的電平值大于所述第二相位通道的電平值時,選擇所述第一定 義,以及 當所述第二相位通道的電平值大于所述第一相位通道的電平值時,選擇所述第二定 義。
4. 一種音頻信號處理裝置,包括: 一多路分解單元,用于接收一縮混信號,接收一通道間相位差(IPD)信息,所述通道 間相位差信息對應于第一相位通道和第二相位通道間的相位差,以及接收一通道電平差 (CLD),所述通道電平差對應于第一相位通道和第二相位通道間的電平差; 一權重定義判定單兀,用于基于CLD判定第一權重和第二權重的定義,其中第一權重 應用于第一相位通道,第二權重應用于第二相位通道; 一權重產生單元,用于使用判定的定義和IPD,計算第一權重和第二權重;以及 一總的相位差(OPD)產生單元,用于基于第一權重和第二權重產生(PD信息,其中OPD 信息對應于第一相位通道和縮混信號間的相位差。
【文檔編號】H04S5/00GK104509131SQ201380038930
【公開日】2015年4月8日 申請日期:2013年7月26日 優(yōu)先權日:2012年7月31日
【發(fā)明者】吳賢午, 宋政旭 申請人:英迪股份有限公司