音頻處理方法及音頻處理設(shè)備的制作方法

文檔序號(hào)：2836114閱讀：253來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：音頻處理方法及音頻處理設(shè)備的制作方法
技術(shù)領(lǐng)域：
本發(fā)明一般涉及音頻信號(hào)處理。更具體地，本發(fā)明的實(shí)施例涉及用于基于單通道音頻信號(hào)來(lái)進(jìn)行音頻信號(hào)呈現(xiàn)的音頻處理方法及音頻處理設(shè)備。
背景技術(shù)：
在很多音頻處理應(yīng)用中，可以接收單通道音頻信號(hào)，并基于單通道音頻信號(hào)來(lái)輸出聲音。例如，在語(yǔ)音通信系統(tǒng)中，語(yǔ)音通信終端A將語(yǔ)音捕獲為單通道音頻信號(hào)。單通道信號(hào)被發(fā)送至語(yǔ)音通信終端B。語(yǔ)音通信終端B接收并呈現(xiàn)單通道信號(hào)。再例如，可以將諸如話音、音樂(lè)等的期望聲音記錄為單通道信號(hào)。可以通過(guò)重放裝置來(lái)讀取并重放所記錄的單通道信號(hào)。為了提高期望聲音對(duì)于聽(tīng)眾的可理解性，可以將諸如維納(Wiener)濾波的噪聲減低方法用于減低噪聲，使得所呈現(xiàn)的信號(hào)中的期望聲音能夠更為易于理解。

發(fā)明內(nèi)容
根據(jù)本發(fā)明實(shí)施例，提供了一種音頻處理方法。根據(jù)該方法，將單通道音頻信號(hào)變換為多個(gè)第一子帶信號(hào)。估計(jì)每個(gè)子帶信號(hào)中的期望分量的比例和噪聲分量的比例。根據(jù)每個(gè)第一子帶信號(hào)生成分別對(duì)應(yīng)于多個(gè)通道的第二子帶信號(hào)。每個(gè)第二子帶信號(hào)包括第一分量和第二分量，該第一分量和該第二分量是通過(guò)基于多維聽(tīng)覺(jué)表現(xiàn)方法給對(duì)應(yīng)的第一子帶信號(hào)中的期望分量和噪聲分量分別賦予空間聽(tīng)覺(jué)特性和不同于該空間聽(tīng)覺(jué)特性的感知聽(tīng)覺(jué)特性來(lái)獲得的。將第二子帶信號(hào)變換為用于以該多維聽(tīng)覺(jué)表現(xiàn)方法進(jìn)行呈現(xiàn)的信號(hào)。根據(jù)本發(fā)明實(shí)施例，提供了一種音頻處理設(shè)備。該設(shè)備包括時(shí)域-頻域變換器、估計(jì)器、生成器以及頻域-時(shí)域變換器。時(shí)域-頻域變換器被配置為將單通道音頻信號(hào)變換為多個(gè)第一子帶信號(hào)。估計(jì)器被配置為估計(jì)每個(gè)子帶信號(hào)中的期望分量的比例和噪聲分量的比例。生成器被配置為根據(jù)每個(gè)第一子帶信號(hào)生成分別對(duì)應(yīng)于多個(gè)通道的第二子帶信號(hào)。每個(gè)第二子帶信號(hào)包括第一分量和第二分量，該第一分量和該第二分量是通過(guò)基于多維聽(tīng)覺(jué)表現(xiàn)方法給對(duì)應(yīng)的第一子帶信號(hào)中的期望分量和噪聲分量分別賦予空間聽(tīng)覺(jué)特性和不同于該空間聽(tīng)覺(jué)特性的感知聽(tīng)覺(jué)特性來(lái)獲得的。頻域-時(shí)域變換器被配置為將第二子帶信號(hào)變換為用于以該多維聽(tīng)覺(jué)表現(xiàn)方法進(jìn)行呈現(xiàn)的信號(hào)。

在附圖的各圖中，以示例性和非限制性的方式對(duì)本發(fā)明進(jìn)行闡釋，在附圖中，類似的附圖標(biāo)記指代類似的元件，其中:圖1是示出根據(jù)本發(fā)明實(shí)施例的示例音頻處理設(shè)備的框圖；圖2是示出根據(jù)本發(fā)明實(shí)施例的示例音頻處理方法的流程圖；圖3是示出根據(jù)本發(fā)明實(shí)施例的生成器的示例結(jié)構(gòu)的框圖；圖4是示出根據(jù)本發(fā)明實(shí)施例的、基于多通道聽(tīng)覺(jué)表現(xiàn)方法來(lái)生成子帶信號(hào)的示例處理的流程圖；圖5是示出根據(jù)本發(fā)明實(shí)施例的期望聲音和噪聲的聲音位置布置示例的示意圖；圖6是示出根據(jù)本發(fā)明實(shí)施例的生成器的示例結(jié)構(gòu)的框圖；圖7是示出根據(jù)本發(fā)明實(shí)施例的、基于多通道聽(tīng)覺(jué)表現(xiàn)方法來(lái)生成子帶信號(hào)的示例處理的流程圖；圖8是示出根據(jù)本發(fā)明實(shí)施例的示例音頻處理設(shè)備的框圖；圖9是示出根據(jù)本發(fā)明實(shí)施例的示例音頻處理方法的流程圖；圖10是示出用于實(shí)施本發(fā)明實(shí)施例的示例系統(tǒng)的框圖。
具體實(shí)施例方式下面參考附圖描述本發(fā)明實(shí)施例。應(yīng)注意，為清楚起見(jiàn)，在附圖和描述中省略了關(guān)于本領(lǐng)域技術(shù)人員已知但是與本發(fā)明無(wú)關(guān)的組件和過(guò)程的陳述和描述。本領(lǐng)域的技術(shù)人員可以理解，本發(fā)明的各方面可以被實(shí)施為系統(tǒng)(例如在線數(shù)字媒體商店、云計(jì)算服務(wù)、流媒體服務(wù)、電信網(wǎng)絡(luò)等)、裝置(例如蜂窩電話、便攜媒體播放器、個(gè)人計(jì)算機(jī)、電視機(jī)頂盒、或數(shù)字錄像機(jī)、或任意其它媒體播放器)、方法或計(jì)算機(jī)程序產(chǎn)品。因此，本發(fā)明的各方面可以采取以下形式:完全硬件實(shí)施例、完全軟件實(shí)施例(包括固件、駐留軟件、微代碼等)或組合軟件部分與硬件部分的實(shí)施例，本文可以一般地稱之為“電路”、“模塊”或“系統(tǒng)”。此外，本發(fā)明的各方面可以采取體現(xiàn)為一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)的計(jì)算機(jī)程序產(chǎn)品的形式，該計(jì)算機(jī)可讀介質(zhì)上體現(xiàn)有計(jì)算機(jī)可讀程序代碼?？梢允褂靡粋€(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)的任何組合。計(jì)算機(jī)可讀介質(zhì)可以是計(jì)算機(jī)可讀信號(hào)介質(zhì)或計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)例如可以是(但不限于)電的、磁的、光的、電磁的、紅外線的、或半導(dǎo)體的系統(tǒng)、設(shè)備或裝置、或前述各項(xiàng)的任何適當(dāng)?shù)慕M合。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的更具體的例子(非窮舉的列表)包括以下:有一個(gè)或多個(gè)導(dǎo)線的電連接、便攜式計(jì)算機(jī)磁盤(pán)、硬盤(pán)、隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、可擦式可編程只讀存儲(chǔ)器(EPR0M或閃存)、光纖、便攜式緊湊磁盤(pán)只讀存儲(chǔ)器(CD-ROM)、光存儲(chǔ)裝置、磁存儲(chǔ)裝置、或前述各項(xiàng)的任何適當(dāng)?shù)慕M合。在本文語(yǔ)境中，計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是任何含有或存儲(chǔ)供指令執(zhí)行系統(tǒng)、設(shè)備或裝置使用的或與指令執(zhí)行系統(tǒng)、設(shè)備或裝置相聯(lián)系的程序的有形介質(zhì)。計(jì)算機(jī)可讀信號(hào)介質(zhì)可以包括例如在基帶中或作為載波的一部分傳播的、其中帶有計(jì)算機(jī)可讀程序代碼的數(shù)據(jù)信號(hào)。這樣的傳播信號(hào)可以采取任何適當(dāng)?shù)男问?，包括但不限于電磁的、光的或其任何適當(dāng)?shù)慕M合。計(jì)算機(jī)可讀信號(hào)介質(zhì)可以是不同于計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的、能夠傳達(dá)、傳播或傳輸供指令執(zhí)行系統(tǒng)、設(shè)備或裝置使用的或與指令執(zhí)行系統(tǒng)、設(shè)備或裝置相聯(lián)系的程序的任何一種計(jì)算機(jī)可讀介質(zhì)。體現(xiàn)在計(jì)算機(jī)可讀介質(zhì)中的程序代碼可以采用任何適當(dāng)?shù)慕橘|(zhì)傳輸，包括但不限于無(wú)線、有線、光纜、射頻等等、或上述各項(xiàng)的任何適當(dāng)?shù)慕M合。用于執(zhí)行本發(fā)明各方面的操作的計(jì)算機(jī)程序代碼可以以一種或多種程序設(shè)計(jì)語(yǔ)言的任何組合來(lái)編寫(xiě)，所述程序設(shè)計(jì)語(yǔ)言包括面向?qū)ο蟮某绦蛟O(shè)計(jì)語(yǔ)言，諸如Java、SmalltalKC++之類，還包括常規(guī)的過(guò)程式程序設(shè)計(jì)語(yǔ)言，諸如“C”程序設(shè)計(jì)語(yǔ)言或類似的程序設(shè)計(jì)語(yǔ)言。程序代碼可以完全地在用戶的計(jì)算機(jī)上執(zhí)行、部分地在用戶的計(jì)算機(jī)上執(zhí)行、作為一個(gè)獨(dú)立的軟件包執(zhí)行、部分在用戶的計(jì)算機(jī)上并且部分在遠(yuǎn)程計(jì)算機(jī)上執(zhí)行、或者完全在遠(yuǎn)程計(jì)算機(jī)或服務(wù)器上執(zhí)行。在后一種情形中，遠(yuǎn)程計(jì)算機(jī)可以通過(guò)任何種類的網(wǎng)絡(luò)，包括局域網(wǎng)(LAN)或廣域網(wǎng)(WAN)，連接到用戶的計(jì)算機(jī)，或者，可以(例如利用因特網(wǎng)服務(wù)提供商來(lái)通過(guò)因特網(wǎng))連接到外部計(jì)算機(jī)。
以下參照按照本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或框圖來(lái)描述本發(fā)明的各個(gè)方面。應(yīng)當(dāng)理解，流程圖和/或框圖的每個(gè)方框以及流程圖和/或框圖中各方框的組合都可以由計(jì)算機(jī)程序指令實(shí)現(xiàn)。這些計(jì)算機(jī)程序指令可以提供給通用計(jì)算機(jī)、專用計(jì)算機(jī)或其它可編程數(shù)據(jù)處理設(shè)備的處理器以生產(chǎn)出一種機(jī)器，使得通過(guò)計(jì)算機(jī)或其它可編程數(shù)據(jù)處理裝置執(zhí)行的這些指令產(chǎn)生用于實(shí)現(xiàn)流程圖和/或框圖中的方框中規(guī)定的功能/操作的裝置。
也可以把這些計(jì)算機(jī)程序指令存儲(chǔ)在能夠指引計(jì)算機(jī)或其它可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀介質(zhì)中，使得存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)中的指令產(chǎn)生一個(gè)包括實(shí)現(xiàn)流程圖和/或框圖中的方框中規(guī)定的功能/操作的指令的制造品。
也可以把計(jì)算機(jī)程序指令加載到計(jì)算機(jī)、其它可編程數(shù)據(jù)處理設(shè)備或其它裝置上，導(dǎo)致在計(jì)算機(jī)、其它可編程處理設(shè)備或其它裝置上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的過(guò)程，使得在計(jì)算機(jī)或其它可編程設(shè)備上執(zhí)行的指令提供實(shí)現(xiàn)流程圖和/或框圖的方框中規(guī)定的功能/動(dòng)作的過(guò)程。
圖1是示出根據(jù)本發(fā)明實(shí)施例的示例音頻處理設(shè)備100的框圖。
如圖1所示，音頻處理設(shè)備100包括時(shí)域-頻域變換器101、估計(jì)器102、生成器103和頻域-時(shí)域變換器104。
通常，單通道音頻信號(hào)流的分段s (t)被輸入到音頻處理設(shè)備100，其中t為時(shí)間索弓I。音頻處理設(shè)備100處理每個(gè)分段S(t)，并生成對(duì)應(yīng)的多通道音頻信號(hào)S(t)。通過(guò)音頻輸出裝置(圖中未示出)輸出多通道音頻信號(hào)s(t)。下文中，也將分段稱為單通道音頻信號(hào)。
針對(duì)每個(gè)單通道音頻信號(hào)s (t)，時(shí)域-頻域變換器101被配置為將單通道音頻信號(hào)s (t)變換為數(shù)目K的子帶信號(hào)(對(duì)應(yīng)于K個(gè)頻率區(qū)間)D (k，t)，其中k為頻率區(qū)間索引。例如，可以通過(guò)快速傅里葉變換(FFT)進(jìn)行該變換。
估計(jì)器102被配置為估計(jì)每個(gè)子帶信號(hào)D (k，t)中的期望分量的比例和噪聲分量的比例。
有噪聲的音頻信號(hào)可被視為期望信號(hào)和噪聲信號(hào)的混合。如果人類聽(tīng)覺(jué)系統(tǒng)能夠從與噪聲信號(hào)對(duì)應(yīng)的干擾中提取出與期望信號(hào)對(duì)應(yīng)的聲音(也稱為期望聲音)，則音頻信號(hào)對(duì)于人類聽(tīng)覺(jué)系統(tǒng)而言是可理解的。例如，在語(yǔ)音通信應(yīng)用中，期望聲音可以是話音，而在錄音和播放應(yīng)用中，期望聲音可以是音樂(lè)。通常，取決于具體應(yīng)用，期望聲音可包括聽(tīng)眾想要聽(tīng)到的一個(gè)或更多個(gè)聲音，相應(yīng)地，噪聲可包括聽(tīng)眾不想聽(tīng)到的一個(gè)或更多個(gè)聲音，諸如平穩(wěn)白噪聲或粉紅噪聲、非平穩(wěn)多路重合噪聲、或干擾話音，等等。基于期望信號(hào)和噪聲信號(hào)的具體的譜特性，能夠采用適當(dāng)方法來(lái)估計(jì)每個(gè)子帶信號(hào)中與期望信號(hào)對(duì)應(yīng)的期望分量的比例以及與噪聲信號(hào)對(duì)應(yīng)的噪聲分量的比例。可以獨(dú)立地估計(jì)期望分量的比例及噪聲分量的比例。可替選地，在知道一個(gè)比例的情況下，通過(guò)將除了所估計(jì)的期望分量之外的剩余部分視為噪聲分量，或?qū)⒊怂烙?jì)的噪聲分量之外的剩余部分視為期望分量，能夠獲得另一比例。
在一個(gè)示例中，可以將期望分量的比例及噪聲分量的比例估計(jì)為增益函數(shù)。具體而言，能夠追蹤音頻信號(hào)中的噪聲分量以估計(jì)噪聲譜，并根據(jù)所估計(jì)的噪聲譜和子帶信號(hào)D(k，t)，導(dǎo)出每個(gè)子帶信號(hào)D (k，t)的增益函數(shù)G(k，t)。
通常，可以基于期望(例如，話音)分量*O的比例(如增益函數(shù)G(k，t))來(lái)獲得期望分量左O。在增益函數(shù)的情況下，可以獲得如下的期望分量左^ O:
S (k, O = G(k,t)D(k,t) (I)。
可以將噪聲分量的比例估計(jì)為(l_G(k，t))?？梢垣@得如下的噪聲分量
N (k, O:
N(k,t) = (\-G(k,t))D(k,t) (2) O
可以使用各種增益函數(shù)，包括但不限于譜減法、維納濾波、最小均方誤差對(duì)數(shù)譜幅度估計(jì)(MMSE-LSA)。
在譜減法的示例中，可以獲得如下的增益函數(shù)Gss(k，t): 廣Λ0.5
Gss(Kt)A(3)。 Iv I + Rprio (k, t) J
在維納濾波的示例中，可以獲得如下的增益函數(shù)Gwienek(k，t):
Gwm腿(k，t、=(4)。
l+RpRl0(k^t)
在MMSE-LSA的示例中，可以獲得如下的增益函數(shù)G__lSA (k，t):[_ g—m=Α -〔。+5v#) (5)，
其中，t)= R: Rpost (K t) (6)。
i+UO
在以上示例中，Rpeio(k, t)表示先驗(yàn)信噪比SNR，并可以將其導(dǎo)出如下: P JkJ)
RpriJM= s(7),并且 pm
Rpost (k, t)表示后驗(yàn)SNR，并可以將其導(dǎo)出如下:
RposAkJ) =(8), pm
其中，巧(^>、 ,&，0和PD(k，t)分別表示期望分量左O的功率、噪聲分量t)的功率和子帶信號(hào)D(k，t)的功率。在一個(gè)示例中，增益函數(shù)的值可以被限制在從O至I的范圍中。
應(yīng)注意，期望分量的比例和噪聲分量的比例不限于增益函數(shù)。同樣可以使用其它提供了對(duì)期望分量和噪聲分類的指示的函數(shù)。也可以基于期望信號(hào)(例如話音)或噪聲的概率來(lái)估計(jì)期望分量的比例和噪聲分量的比例。可以在Sun, Xuejing/Yen, Kuan-Chieh/Alves, Rogerio (2010): " Robust noise estimation using minimum correction withharmonicity control" , In INTERSPEECH-2010，1085-1088 中找到基于概率的比例的示例。在這個(gè)示例中，無(wú)話音概率(SAP)q(k，t)可以被計(jì)算如下:
權(quán)利要求
1.一種音頻處理方法，包括: 將單通道音頻信號(hào)變換為多個(gè)第一子帶信號(hào)；估計(jì)每個(gè)所述子帶信號(hào)中的期望分量的比例和噪聲分量的比例；根據(jù)每個(gè)所述第一子帶信號(hào)生成分別對(duì)應(yīng)于多個(gè)通道的第二子帶信號(hào)，其中每個(gè)所述第二子帶信號(hào)包括第一分量和第二分量，所述第一分量和所述第二分量是通過(guò)基于多維聽(tīng)覺(jué)表現(xiàn)方法給對(duì)應(yīng)的第一子帶信號(hào)中的所述期望分量和所述噪聲分量分別賦予空間聽(tīng)覺(jué)特性和不同于該空間聽(tīng)覺(jué)特性的感知聽(tīng)覺(jué)特性來(lái)獲得的；以及將所述第二子帶信號(hào)變換為用于以所述多維聽(tīng)覺(jué)表現(xiàn)方法進(jìn)行呈現(xiàn)的信號(hào)。
2.根據(jù)權(quán)利要求1所述的音頻處理方法，其中，生成第二子帶信號(hào)包括: 基于所述比例，從每個(gè)所述第一子帶信號(hào)中分別提取所述期望分量和所述噪聲分量；以及針對(duì)每個(gè)所述通道和每個(gè)所述第一子帶信號(hào)，利用第一濾波器對(duì)該第一子帶信號(hào)的所提取的期望分量進(jìn)行濾波，該第一濾波器對(duì)應(yīng)于該通道并應(yīng)用用于賦予所述空間聽(tīng)覺(jué)特性的第一傳遞函數(shù)，利用第二濾波器對(duì)該第一子帶信號(hào)的所提取的噪聲分量進(jìn)行濾波，該第二濾波器對(duì)應(yīng)于該通道并應(yīng)用用于賦予所述感知聽(tīng)覺(jué)特性的第二傳遞函數(shù)；以及對(duì)經(jīng)濾波的期望分量和經(jīng)濾波的噪聲分量求和，以獲得所述第二子帶信號(hào)之一。
3.根據(jù)權(quán)利要求1 所述的音頻處理方法，其中，生成第二子帶信號(hào)包括: 針對(duì)每個(gè)所述通道和每個(gè)所述第一子帶信號(hào)，計(jì)算濾波器參數(shù)，其中該濾波器參數(shù)是用于賦予所述空間聽(tīng)覺(jué)特性的傳遞函數(shù)與用于賦予所述感知聽(tīng)覺(jué)特性的另一傳遞函數(shù)的加權(quán)和，并且用于該傳遞函數(shù)的權(quán)重以及用于該另一傳遞函數(shù)的權(quán)重分別與對(duì)應(yīng)的第一子帶信號(hào)中的所述期望分量的比例以及所述噪聲分量的比例正相關(guān)，針對(duì)每個(gè)所述通道和每個(gè)所述第一子帶信號(hào)，將對(duì)應(yīng)的濾波器參數(shù)應(yīng)用至該第一子帶信號(hào)，以獲得所述第二子帶信號(hào)之一。
4.根據(jù)權(quán)利要求1至3中的任一項(xiàng)權(quán)利要求所述的音頻處理方法，其中，所述感知聽(tīng)覺(jué)特性包括空間聽(tīng)覺(jué)特性、或者時(shí)間或頻率白化特性。
5.根據(jù)權(quán)利要求4所述的音頻處理方法，其中，所述時(shí)間或頻率白化特性包括反射特性、回響特性或擴(kuò)散特性。
6.根據(jù)權(quán)利要求1至3中的任一項(xiàng)權(quán)利要求所述的音頻處理方法，其中，所述多維聽(tīng)覺(jué)表現(xiàn)方法是雙耳聽(tīng)覺(jué)表現(xiàn)方法，并且其中，每個(gè)所述第一傳遞函數(shù)包括用于賦予不同的空間聽(tīng)覺(jué)特性的一個(gè)或更多個(gè)頭部關(guān)聯(lián)傳遞函數(shù)。
7.根據(jù)權(quán)利要求6所述的音頻處理方法，其中，每個(gè)所述第二傳遞函數(shù)包括用于賦予與所述第一傳遞函數(shù)所賦予的空間聽(tīng)覺(jué)特性不同的空間聽(tīng)覺(jué)特性的一個(gè)或更多個(gè)頭部關(guān)聯(lián)傳遞函數(shù)。
8.根據(jù)權(quán)利要求6或7所述的音頻處理方法，其中，所述不同的空間聽(tīng)覺(jué)特性之間的區(qū)別包括以下中的至少一個(gè):所述不同的空間聽(tīng)覺(jué)特性的方位角之間的差、所述不同的空間聽(tīng)覺(jué)特性的仰角之間的差以及所述不同的空間聽(tīng)覺(jué)特性的距離之間的差。
9.根據(jù)權(quán)利要求1至3中的任一項(xiàng)權(quán)利要求所述的音頻處理方法，其中，所述多維聽(tīng)覺(jué)表現(xiàn)方法基于兩個(gè)立體聲揚(yáng)聲器，并且其中，在對(duì)應(yīng)于同一第一子帶信號(hào)的第二傳遞函數(shù)之間存在低相關(guān)。
10.根據(jù)權(quán)利要求1至3中的任一項(xiàng)權(quán)利要求所述的音頻處理方法，其中，將每個(gè)所述第一子帶信號(hào)中的所述期望分量的比例和所述噪聲分量的比例分別估計(jì)為不大于0.9和不小于0.1。
11.根據(jù)權(quán)利要求10所述的音頻處理方法，其中，假設(shè)將所述期望分量的比例表示為G，則將所述噪聲分量的比例估計(jì)為。
12.根據(jù)權(quán)利要求1至3中的任一項(xiàng)權(quán)利要求所述的音頻處理方法，其中，基于增益函數(shù)或概率來(lái)估計(jì)每個(gè)所述第一子帶信號(hào)中的所述期望分量的比例和所述噪聲分量的比例。
13.根據(jù)權(quán)利要求1至3中的任一項(xiàng)權(quán)利要求所述的音頻處理方法，其中，所述多維聽(tīng)覺(jué)表現(xiàn)方法是高保真度聲響復(fù)制聽(tīng)覺(jué)表現(xiàn)方法，并且其中，所述第一傳遞函數(shù)適合于在聲場(chǎng)中表現(xiàn)同一聲源。
14.根據(jù)權(quán)利要求1至3中的任一項(xiàng)權(quán)利要求所述的音頻處理方法，其中，所述多維聽(tīng)覺(jué)表現(xiàn)方法基于多個(gè)揚(yáng)聲器，并且，其中，將每個(gè)所述第一子帶信號(hào)中的所述期望分量的比例和所述噪聲分量的比例分別估計(jì)為不大于0.7和不小于O。
15.根據(jù)權(quán)利要求1至3中的任一項(xiàng)權(quán)利要求所述的音頻處理方法，進(jìn)一步包括: 檢測(cè)為進(jìn)行音頻呈現(xiàn)而在目前激活的音頻輸出裝置；確定該音頻輸出裝置所采用的多維聽(tīng)覺(jué)表現(xiàn)方法；以及將所述用于進(jìn)行呈現(xiàn) 的信號(hào)發(fā)送至該音頻輸出裝置。
16.—種音頻處理設(shè)備,包括: 時(shí)域-頻域變換器，被配置為將單通道音頻信號(hào)變換為多個(gè)第一子帶信號(hào)；估計(jì)器，被配置為估計(jì)每個(gè)所述子帶信號(hào)中的期望分量的比例和噪聲分量的比例；生成器，被配置為根據(jù)每個(gè)所述第一子帶信號(hào)生成分別對(duì)應(yīng)于多個(gè)通道的第二子帶信號(hào)，其中每個(gè)所述第二子帶信號(hào)包括第一分量和第二分量，所述第一分量和所述第二分量是通過(guò)基于多維聽(tīng)覺(jué)表現(xiàn)方法給對(duì)應(yīng)的第一子帶信號(hào)中的所述期望分量和所述噪聲分量分別賦予空間聽(tīng)覺(jué)特性和不同于該空間聽(tīng)覺(jué)特性的感知聽(tīng)覺(jué)特性來(lái)獲得的；以及頻域-時(shí)域變換器，被配置為將所述第二子帶信號(hào)變換為用于以所述多維聽(tīng)覺(jué)表現(xiàn)方法進(jìn)行呈現(xiàn)的信號(hào)。
17.根據(jù)權(quán)利要求16所述的音頻處理設(shè)備，其中，所述生成器包括: 提取器，被配置為基于所述比例，從每個(gè)所述第一子帶信號(hào)中分別提取所述期望分量和所述噪聲分量；分別對(duì)應(yīng)于所述通道的第一濾波器，每個(gè)所述第一濾波器被配置為通過(guò)應(yīng)用用于賦予所述空間聽(tīng)覺(jué)特性的第一傳遞函數(shù)，對(duì)每個(gè)所述第一子帶信號(hào)的所提取的期望分量進(jìn)行濾波，分別對(duì)應(yīng)于所述通道的第二濾波器，每個(gè)所述第二濾波器被配置為通過(guò)應(yīng)用用于賦予所述感知聽(tīng)覺(jué)特性的第二傳遞函數(shù)，對(duì)每個(gè)所述第一子帶信號(hào)的所提取的噪聲分量進(jìn)行濾波；以及分別對(duì)應(yīng)于所述通道的加法器，每個(gè)所述加法器被配置為對(duì)每個(gè)所述第一子帶信號(hào)的經(jīng)濾波的期望分量和經(jīng)濾波的噪聲分量求和，以獲得所述第二子帶信號(hào)之一。
18.根據(jù)權(quán)利要求16所述的音頻處理設(shè)備，其中，所述生成器包括: 計(jì)算器，被配置為針對(duì)每個(gè)所述通道和每個(gè)所述第一子帶信號(hào)，計(jì)算濾波器參數(shù)，其中該濾波器參數(shù)是用于賦予所述空間聽(tīng)覺(jué)特性的傳遞函數(shù)與用于賦予所述感知聽(tīng)覺(jué)特性的另一傳遞函數(shù)的加權(quán)和，并且用于該傳遞函數(shù)的權(quán)重以及用于該另一傳遞函數(shù)的權(quán)重分別與對(duì)應(yīng)的第一子帶信號(hào)中的所述期望分量的比例以及所述噪聲分量的比例正相關(guān)，分別對(duì)應(yīng)于所述通道的濾波器，每個(gè)所述濾波器被配置為應(yīng)用與該通道和每個(gè)所述第一子帶信號(hào)對(duì)應(yīng)的濾波器參數(shù)，以獲得所述第二子帶信號(hào)之一。
19.根據(jù)權(quán)利要求16至18中的任一項(xiàng)權(quán)利要求所述的音頻處理設(shè)備，其中，所述感知聽(tīng)覺(jué)特性包括空間聽(tīng)覺(jué)特性、或者時(shí)間或頻率白化特性。
20.根據(jù)權(quán)利要求19所述的音頻處理設(shè)備，其中，所述時(shí)間或頻率白化特性包括反射特性、回響特性或擴(kuò)散特性。
21.根據(jù)權(quán)利要求16至18中的任一項(xiàng)權(quán)利要求所述的音頻處理設(shè)備，其中，所述多維聽(tīng)覺(jué)表現(xiàn)方法是雙耳聽(tīng)覺(jué)表現(xiàn)方法，并且其中，每個(gè)所述第一傳遞函數(shù)包括用于賦予不同的空間聽(tīng)覺(jué)特性的一個(gè)或更多個(gè)頭部關(guān)聯(lián)傳遞函數(shù)。
22.根據(jù)權(quán)利要求21所述的音頻處理設(shè)備，其中，每個(gè)所述第二傳遞函數(shù)包括用于賦予與所述第一傳遞函數(shù)所賦予的空間聽(tīng)覺(jué)特性不同的空間聽(tīng)覺(jué)特性的一個(gè)或更多個(gè)頭部關(guān)聯(lián)傳遞函數(shù)。
23.根據(jù)權(quán)利要求21或22所述的音頻處理設(shè)備，其中，所述不同的空間聽(tīng)覺(jué)特性之間的區(qū)別包括以下中的至少一個(gè):所述不同的空間聽(tīng)覺(jué)特性的方位角之間的差、所述不同的空間聽(tīng)覺(jué)特性的仰角之間的差以及所述不同的空間聽(tīng)覺(jué)特性的距離之間的差。
24.根據(jù)權(quán)利要求16至18中的任一項(xiàng)權(quán)利要求所述的音頻處理設(shè)備，其中，所述多維聽(tīng)覺(jué)表現(xiàn)方法基于兩個(gè)立體聲揚(yáng)聲器，并且其中，在對(duì)應(yīng)于同一第一子帶信號(hào)的第二傳遞函數(shù)之間存在低相關(guān)。
25.根據(jù)權(quán)利要求16至18中的任一項(xiàng)權(quán)利要求所述的音頻處理設(shè)備，其中，將每個(gè)所述第一子帶信號(hào)中的所述期望分量的比例和所述噪聲分量的比例分別估計(jì)為不大于0.9和不小于0.1。
26.根據(jù)權(quán)利要求25所述的音頻處理設(shè)備，其中，假設(shè)將所述期望分量的比例表示為G，則將所述噪聲分量的比例估計(jì)為。
27.根據(jù)權(quán)利要求16至18中的任一項(xiàng)權(quán)利要求所述的音頻處理設(shè)備，其中，基于增益函數(shù)或概率來(lái)估計(jì)每個(gè)所述第一子帶信號(hào)中的所述期望分量的比例和所述噪聲分量的比例。
28.根據(jù)權(quán)利要求16至18中的任一項(xiàng)權(quán)利要求所述的音頻處理設(shè)備，其中，所述多維聽(tīng)覺(jué)表現(xiàn)方法是高保真度聲響復(fù)制聽(tīng)覺(jué)表現(xiàn)方法，并且其中，所述第一傳遞函數(shù)適合于在聲場(chǎng)中表現(xiàn)同一聲源。
29.根據(jù)權(quán)利要求16至18中的任一項(xiàng)權(quán)利要求所述的音頻處理設(shè)備，其中，所述多維聽(tīng)覺(jué)表現(xiàn)方法基于多個(gè)揚(yáng)聲器，并且，其中，將每個(gè)所述第一子帶信號(hào)中的所述期望分量的比例和所述噪聲分量的比例分別估計(jì)為不大于0.7和不小于O。
30.根據(jù)權(quán)利要求16至18中的任一項(xiàng)權(quán)利要求所述的音頻處理設(shè)備，進(jìn)一步包括:檢測(cè)器，被配置為檢測(cè)為進(jìn)行音頻呈現(xiàn)而在目前激活的音頻輸出裝置，并確定該音頻輸出裝置所采用的多維聽(tīng)覺(jué)表現(xiàn)方法，并且，其中，所述時(shí)域-頻域變換器被進(jìn)一步配置為將所述用于進(jìn)行呈現(xiàn)的信號(hào)發(fā)送至該音頻輸出裝置。
全文摘要
描述了一種音頻處理方法和音頻處理設(shè)備。將單通道音頻信號(hào)變換為多個(gè)第一子帶信號(hào)。估計(jì)每個(gè)子帶信號(hào)中的期望分量的比例和噪聲分量的比例。根據(jù)每個(gè)第一子帶信號(hào)來(lái)生成分別對(duì)應(yīng)于多個(gè)通道的第二子帶信號(hào)。每個(gè)第二子帶信號(hào)包括第一分量和第二分量，該第一分量和該第二分量是通過(guò)基于多維聽(tīng)覺(jué)表現(xiàn)方法給對(duì)應(yīng)的第一子帶信號(hào)中的期望分量和噪聲分量分別賦予空間聽(tīng)覺(jué)特性和不同于該空間聽(tīng)覺(jué)特性的感知聽(tīng)覺(jué)特性來(lái)獲得的。將第二子帶信號(hào)變換為用于以該多維聽(tīng)覺(jué)表現(xiàn)方法進(jìn)行呈現(xiàn)的信號(hào)。通過(guò)對(duì)期望聲音和噪聲賦予不同的聽(tīng)覺(jué)特性，可以改進(jìn)音頻信號(hào)的可理解性。
文檔編號(hào)G10L21/0208GK103165136SQ20111042177
公開(kāi)日2013年6月19日申請(qǐng)日期2011年12月15日優(yōu)先權(quán)日2011年12月15日
發(fā)明者孫學(xué)京, 格倫·迪金斯, 鄧惠群, 雙志偉, 程斌申請(qǐng)人:杜比實(shí)驗(yàn)室特許公司

完整全部詳細(xì)技術(shù)資料下載