欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

音頻處理方法及音頻處理設(shè)備的制作方法

文檔序號(hào):2836114閱讀:253來(lái)源:國(guó)知局
專利名稱:音頻處理方法及音頻處理設(shè)備的制作方法
技術(shù)領(lǐng)域
本發(fā)明一般涉及音頻信號(hào)處理。更具體地,本發(fā)明的實(shí)施例涉及用于基于單通道音頻信號(hào)來(lái)進(jìn)行音頻信號(hào)呈現(xiàn)的音頻處理方法及音頻處理設(shè)備。
背景技術(shù)
在很多音頻處理應(yīng)用中,可以接收單通道音頻信號(hào),并基于單通道音頻信號(hào)來(lái)輸出聲音。例如,在語(yǔ)音通信系統(tǒng)中,語(yǔ)音通信終端A將語(yǔ)音捕獲為單通道音頻信號(hào)。單通道信號(hào)被發(fā)送至語(yǔ)音通信終端B。語(yǔ)音通信終端B接收并呈現(xiàn)單通道信號(hào)。再例如,可以將諸如話音、音樂(lè)等的期望聲音記錄為單通道信號(hào)。可以通過(guò)重放裝置來(lái)讀取并重放所記錄的單通道信號(hào)。為了提高期望聲音對(duì)于聽(tīng)眾的可理解性,可以將諸如維納(Wiener)濾波的噪聲減低方法用于減低噪聲,使得所呈現(xiàn)的信號(hào)中的期望聲音能夠更為易于理解。

發(fā)明內(nèi)容
根據(jù)本發(fā)明實(shí)施例,提供了一種音頻處理方法。根據(jù)該方法,將單通道音頻信號(hào)變換為多個(gè)第一子帶信號(hào)。估計(jì)每個(gè)子帶信號(hào)中的期望分量的比例和噪聲分量的比例。根據(jù)每個(gè)第一子帶信號(hào)生成分別對(duì)應(yīng)于多個(gè)通道的第二子帶信號(hào)。每個(gè)第二子帶信號(hào)包括第一分量和第二分量,該第一分量和該第二分量是通過(guò)基于多維聽(tīng)覺(jué)表現(xiàn)方法給對(duì)應(yīng)的第一子帶信號(hào)中的期望分量和噪聲分量分別賦予空間聽(tīng)覺(jué)特性和不同于該空間聽(tīng)覺(jué)特性的感知聽(tīng)覺(jué)特性來(lái)獲得的。將第二子帶信號(hào)變換為用于以該多維聽(tīng)覺(jué)表現(xiàn)方法進(jìn)行呈現(xiàn)的信號(hào)。根據(jù)本發(fā)明實(shí)施例,提供了一種音頻處理設(shè)備。該設(shè)備包括時(shí)域-頻域變換器、估計(jì)器、生成器以及頻域-時(shí)域變換器。時(shí)域-頻域變換器被配置為將單通道音頻信號(hào)變換為多個(gè)第一子帶信號(hào)。估計(jì)器被配置為估計(jì)每個(gè)子帶信號(hào)中的期望分量的比例和噪聲分量的比例。生成器被配置為根據(jù)每個(gè)第一子帶信號(hào)生成分別對(duì)應(yīng)于多個(gè)通道的第二子帶信號(hào)。每個(gè)第二子帶信號(hào)包括第一分量和第二分量,該第一分量和該第二分量是通過(guò)基于多維聽(tīng)覺(jué)表現(xiàn)方法給對(duì)應(yīng)的第一子帶信號(hào)中的期望分量和噪聲分量分別賦予空間聽(tīng)覺(jué)特性和不同于該空間聽(tīng)覺(jué)特性的感知聽(tīng)覺(jué)特性來(lái)獲得的。頻域-時(shí)域變換器被配置為將第二子帶信號(hào)變換為用于以該多維聽(tīng)覺(jué)表現(xiàn)方法進(jìn)行呈現(xiàn)的信號(hào)。


在附圖的各圖中,以示例性和非限制性的方式對(duì)本發(fā)明進(jìn)行闡釋,在附圖中,類似的附圖標(biāo)記指代類似的元件,其中:圖1是示出根據(jù)本發(fā)明實(shí)施例的示例音頻處理設(shè)備的框圖;圖2是示出根據(jù)本發(fā)明實(shí)施例的示例音頻處理方法的流程圖;圖3是示出根據(jù)本發(fā)明實(shí)施例的生成器的示例結(jié)構(gòu)的框圖;圖4是示出根據(jù)本發(fā)明實(shí)施例的、基于多通道聽(tīng)覺(jué)表現(xiàn)方法來(lái)生成子帶信號(hào)的示例處理的流程圖;圖5是示出根據(jù)本發(fā)明實(shí)施例的期望聲音和噪聲的聲音位置布置示例的示意圖;圖6是示出根據(jù)本發(fā)明實(shí)施例的生成器的示例結(jié)構(gòu)的框圖;圖7是示出根據(jù)本發(fā)明實(shí)施例的、基于多通道聽(tīng)覺(jué)表現(xiàn)方法來(lái)生成子帶信號(hào)的示例處理的流程圖;圖8是示出根據(jù)本發(fā)明實(shí)施例的示例音頻處理設(shè)備的框圖;圖9是示出根據(jù)本發(fā)明實(shí)施例的示例音頻處理方法的流程圖;圖10是示出用于實(shí)施本發(fā)明實(shí)施例的示例系統(tǒng)的框圖。
具體實(shí)施例方式下面參考附圖描述本發(fā)明實(shí)施例。應(yīng)注意,為清楚起見(jiàn),在附圖和描述中省略了關(guān)于本領(lǐng)域技術(shù)人員已知但是與本發(fā)明無(wú)關(guān)的組件和過(guò)程的陳述和描述。本領(lǐng)域的技術(shù)人員可以理解,本發(fā)明的各方面可以被實(shí)施為系統(tǒng)(例如在線數(shù)字媒體商店、云計(jì)算服務(wù)、流媒體服務(wù)、電信網(wǎng)絡(luò)等)、裝置(例如蜂窩電話、便攜媒體播放器、個(gè)人計(jì)算機(jī)、電視機(jī)頂盒、或數(shù)字錄像機(jī)、或任意其它媒體播放器)、方法或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明的各方面可以采取以下形式:完全硬件實(shí)施例、完全軟件實(shí)施例(包括固件、駐留軟件、微代碼等)或組合軟件部分與硬件部分的實(shí)施例,本文可以一般地稱之為“電路”、“模塊”或“系統(tǒng)”。此外,本發(fā)明的各方面可以采取體現(xiàn)為一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)的計(jì)算機(jī)程序產(chǎn)品的形式,該計(jì)算機(jī)可讀介質(zhì)上體現(xiàn)有計(jì)算機(jī)可讀程序代碼??梢允褂靡粋€(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)的任何組合。計(jì)算機(jī)可讀介質(zhì)可以是計(jì)算機(jī)可讀信號(hào)介質(zhì)或計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)例如可以是(但不限于)電的、磁的、光的、電磁的、紅外線的、或半導(dǎo)體的系統(tǒng)、設(shè)備或裝置、或前述各項(xiàng)的任何適當(dāng)?shù)慕M合。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的更具體的例子(非窮舉的列表)包括以下:有一個(gè)或多個(gè)導(dǎo)線的電連接、便攜式計(jì)算機(jī)磁盤(pán)、硬盤(pán)、隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、可擦式可編程只讀存儲(chǔ)器(EPR0M或閃存)、光纖、便攜式緊湊磁盤(pán)只讀存儲(chǔ)器(CD-ROM)、光存儲(chǔ)裝置、磁存儲(chǔ)裝置、或前述各項(xiàng)的任何適當(dāng)?shù)慕M合。在本文語(yǔ)境中,計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是任何含有或存儲(chǔ)供指令執(zhí)行系統(tǒng)、設(shè)備或裝置使用的或與指令執(zhí)行系統(tǒng)、設(shè)備或裝置相聯(lián)系的程序的有形介質(zhì)。計(jì)算機(jī)可讀信號(hào)介質(zhì)可以包括例如在基帶中或作為載波的一部分傳播的、其中帶有計(jì)算機(jī)可讀程序代碼的數(shù)據(jù)信號(hào)。這樣的傳播信號(hào)可以采取任何適當(dāng)?shù)男问?,包括但不限于電磁的、光的或其任何適當(dāng)?shù)慕M合。計(jì)算機(jī)可讀信號(hào)介質(zhì)可以是不同于計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的、能夠傳達(dá)、傳播或傳輸供指令執(zhí)行系統(tǒng)、設(shè)備或裝置使用的或與指令執(zhí)行系統(tǒng)、設(shè)備或裝置相聯(lián)系的程序的任何一種計(jì)算機(jī)可讀介質(zhì)。體現(xiàn)在計(jì)算機(jī)可讀介質(zhì)中的程序代碼可以采用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括但不限于無(wú)線、有線、光纜、射頻等等、或上述各項(xiàng)的任何適當(dāng)?shù)慕M合。用于執(zhí)行本發(fā)明各方面的操作的計(jì)算機(jī)程序代碼可以以一種或多種程序設(shè)計(jì)語(yǔ)言的任何組合來(lái)編寫(xiě),所述程序設(shè)計(jì)語(yǔ)言包括面向?qū)ο蟮某绦蛟O(shè)計(jì)語(yǔ)言,諸如Java、SmalltalKC++之類,還包括常規(guī)的過(guò)程式程序設(shè)計(jì)語(yǔ)言,諸如“C”程序設(shè)計(jì)語(yǔ)言或類似的程序設(shè)計(jì)語(yǔ)言。程序代碼可以完全地在用戶的計(jì)算機(jī)上執(zhí)行、部分地在用戶的計(jì)算機(jī)上執(zhí)行、作為一個(gè)獨(dú)立的軟件包執(zhí)行、部分在用戶的計(jì)算機(jī)上并且部分在遠(yuǎn)程計(jì)算機(jī)上執(zhí)行、或者完全在遠(yuǎn)程計(jì)算機(jī)或服務(wù)器上執(zhí)行。在后一種情形中,遠(yuǎn)程計(jì)算機(jī)可以通過(guò)任何種類的網(wǎng)絡(luò),包括局域網(wǎng)(LAN)或廣域網(wǎng)(WAN),連接到用戶的計(jì)算機(jī),或者,可以(例如利用因特網(wǎng)服務(wù)提供商來(lái)通過(guò)因特網(wǎng))連接到外部計(jì)算機(jī)。
以下參照按照本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或框圖來(lái)描述本發(fā)明的各個(gè)方面。應(yīng)當(dāng)理解,流程圖和/或框圖的每個(gè)方框以及流程圖和/或框圖中各方框的組合都可以由計(jì)算機(jī)程序指令實(shí)現(xiàn)。這些計(jì)算機(jī)程序指令可以提供給通用計(jì)算機(jī)、專用計(jì)算機(jī)或其它可編程數(shù)據(jù)處理設(shè)備的處理器以生產(chǎn)出一種機(jī)器,使得通過(guò)計(jì)算機(jī)或其它可編程數(shù)據(jù)處理裝置執(zhí)行的這些指令產(chǎn)生用于實(shí)現(xiàn)流程圖和/或框圖中的方框中規(guī)定的功能/操作的裝置。
也可以把這些計(jì)算機(jī)程序指令存儲(chǔ)在能夠指引計(jì)算機(jī)或其它可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀介質(zhì)中,使得存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)中的指令產(chǎn)生一個(gè)包括實(shí)現(xiàn)流程圖和/或框圖中的方框中規(guī)定的功能/操作的指令的制造品。
也可以把計(jì)算機(jī)程序指令加載到計(jì)算機(jī)、其它可編程數(shù)據(jù)處理設(shè)備或其它裝置上,導(dǎo)致在計(jì)算機(jī)、其它可編程處理設(shè)備或其它裝置上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的過(guò)程,使得在計(jì)算機(jī)或其它可編程設(shè)備上執(zhí)行的指令提供實(shí)現(xiàn)流程圖和/或框圖的方框中規(guī)定的功能/動(dòng)作的過(guò)程。
圖1是示出根據(jù)本發(fā)明實(shí)施例的示例音頻處理設(shè)備100的框圖。
如圖1所示,音頻處理設(shè)備100包括時(shí)域-頻域變換器101、估計(jì)器102、生成器103和頻域-時(shí)域變換器104。
通常,單通道音頻信號(hào)流的分段s (t)被輸入到音頻處理設(shè)備100,其中t為時(shí)間索弓I。音頻處理設(shè)備100處理每個(gè)分段S(t),并生成對(duì)應(yīng)的多通道音頻信號(hào)S(t)。通過(guò)音頻輸出裝置(圖中未示出)輸出多通道音頻信號(hào)s(t)。下文中,也將分段稱為單通道音頻信號(hào)。
針對(duì)每個(gè)單通道音頻信號(hào)s (t),時(shí)域-頻域變換器101被配置為將單通道音頻信號(hào)s (t)變換為數(shù)目K的子帶信號(hào)(對(duì)應(yīng)于K個(gè)頻率區(qū)間)D (k,t),其中k為頻率區(qū)間索引。例如,可以通過(guò)快速傅里葉變換(FFT)進(jìn)行該變換。
估計(jì)器102被配置為估計(jì)每個(gè)子帶信號(hào)D (k,t)中的期望分量的比例和噪聲分量的比例。
有噪聲的音頻信號(hào)可被視為期望信號(hào)和噪聲信號(hào)的混合。如果人類聽(tīng)覺(jué)系統(tǒng)能夠從與噪聲信號(hào)對(duì)應(yīng)的干擾中提取出與期望信號(hào)對(duì)應(yīng)的聲音(也稱為期望聲音),則音頻信號(hào)對(duì)于人類聽(tīng)覺(jué)系統(tǒng)而言是可理解的。例如,在語(yǔ)音通信應(yīng)用中,期望聲音可以是話音,而在錄音和播放應(yīng)用中,期望聲音可以是音樂(lè)。通常,取決于具體應(yīng)用,期望聲音可包括聽(tīng)眾想要聽(tīng)到的一個(gè)或更多個(gè)聲音,相應(yīng)地,噪聲可包括聽(tīng)眾不想聽(tīng)到的一個(gè)或更多個(gè)聲音,諸如平穩(wěn)白噪聲或粉紅噪聲、非平穩(wěn)多路重合噪聲、或干擾話音,等等。基于期望信號(hào)和噪聲信號(hào)的具體的譜特性,能夠采用適當(dāng)方法來(lái)估計(jì)每個(gè)子帶信號(hào)中與期望信號(hào)對(duì)應(yīng)的期望分量的比例以及與噪聲信號(hào)對(duì)應(yīng)的噪聲分量的比例。可以獨(dú)立地估計(jì)期望分量的比例及噪聲分量的比例。可替選地,在知道一個(gè)比例的情況下,通過(guò)將除了所估計(jì)的期望分量之外的剩余部分視為噪聲分量,或?qū)⒊怂烙?jì)的噪聲分量之外的剩余部分視為期望分量,能夠獲得另一比例。
在一個(gè)示例中,可以將期望分量的比例及噪聲分量的比例估計(jì)為增益函數(shù)。具體而言,能夠追蹤音頻信號(hào)中的噪聲分量以估計(jì)噪聲譜,并根據(jù)所估計(jì)的噪聲譜和子帶信號(hào)D(k,t),導(dǎo)出每個(gè)子帶信號(hào)D (k,t)的增益函數(shù)G(k,t)。
通常,可以基于期望(例如,話音)分量*O的比例(如增益函數(shù)G(k,t))來(lái)獲得期望分量左O。在增益函數(shù)的情況下,可以獲得如下的期望分量左^ O:
S (k, O = G(k,t)D(k,t) (I)。
可以將噪聲分量的比例估計(jì)為(l_G(k,t))??梢垣@得如下的噪聲分量
N (k, O:
N(k,t) = (\-G(k,t))D(k,t) (2) O
可以使用各種增益函數(shù),包括但不限于譜減法、維納濾波、最小均方誤差對(duì)數(shù)譜幅度估計(jì)(MMSE-LSA)。
在譜減法的示例中,可以獲得如下的增益函數(shù)Gss(k,t): 廣Λ0.5
Gss(Kt)A(3)。 Iv I + Rprio (k, t) J
在維納濾波的示例中,可以獲得如下的增益函數(shù)Gwienek(k,t):
Gwm腿(k,t、=(4)。
l+RpRl0(k^t)
在MMSE-LSA的示例中,可以獲得如下的增益函數(shù)G__lSA (k,t):[_ g—m=Α -〔。+5v#) (5),
其中,t)= R: Rpost (K t) (6)。
i+UO
在以上示例中,Rpeio(k, t)表示先驗(yàn)信噪比SNR,并可以將其導(dǎo)出如下: P JkJ)
RpriJM= s(7),并且 pm
Rpost (k, t)表示后驗(yàn)SNR,并可以將其導(dǎo)出如下:
RposAkJ) =(8), pm
其中,巧(^>、 ,&,0和PD(k,t)分別表示期望分量左O的功率、噪聲分量t)的功率和子帶信號(hào)D(k,t)的功率。在一個(gè)示例中,增益函數(shù)的值可以被限制在從O至I的范圍中。
應(yīng)注意,期望分量的比例和噪聲分量的比例不限于增益函數(shù)。同樣可以使用其它提供了對(duì)期望分量和噪聲分類的指示的函數(shù)。也可以基于期望信號(hào)(例如話音)或噪聲的概率來(lái)估計(jì)期望分量的比例和噪聲分量的比例。可以在Sun, Xuejing/Yen, Kuan-Chieh/Alves, Rogerio (2010): " Robust noise estimation using minimum correction withharmonicity control" , In INTERSPEECH-2010,1085-1088 中找到基于概率的比例的示例。在這個(gè)示例中,無(wú)話音概率(SAP)q(k,t)可以被計(jì)算如下:
權(quán)利要求
1.一種音頻處理方法,包括: 將單通道音頻信號(hào)變換為多個(gè)第一子帶信號(hào); 估計(jì)每個(gè)所述子帶信號(hào)中的期望分量的比例和噪聲分量的比例; 根據(jù)每個(gè)所述第一子帶信號(hào)生成分別對(duì)應(yīng)于多個(gè)通道的第二子帶信號(hào),其中每個(gè)所述第二子帶信號(hào)包括第一分量和第二分量,所述第一分量和所述第二分量是通過(guò)基于多維聽(tīng)覺(jué)表現(xiàn)方法給對(duì)應(yīng)的第一子帶信號(hào)中的所述期望分量和所述噪聲分量分別賦予空間聽(tīng)覺(jué)特性和不同于該空間聽(tīng)覺(jué)特性的感知聽(tīng)覺(jué)特性來(lái)獲得的;以及 將所述第二子帶信號(hào)變換為用于以所述多維聽(tīng)覺(jué)表現(xiàn)方法進(jìn)行呈現(xiàn)的信號(hào)。
2.根據(jù)權(quán)利要求1所述的音頻處理方法,其中,生成第二子帶信號(hào)包括: 基于所述比例,從每個(gè)所述第一子帶信號(hào)中分別提取所述期望分量和所述噪聲分量;以及 針對(duì)每個(gè)所述通道和每個(gè)所述第一子帶信號(hào), 利用第一濾波器對(duì)該第一子帶信號(hào)的所提取的期望分量進(jìn)行濾波,該第一濾波器對(duì)應(yīng)于該通道并應(yīng)用用于賦予所述空間聽(tīng)覺(jué)特性的第一傳遞函數(shù), 利用第二濾波器對(duì)該第一子帶信號(hào)的所提取的噪聲分量進(jìn)行濾波,該第二濾波器對(duì)應(yīng)于該通道并應(yīng)用用于賦予所述感知聽(tīng)覺(jué)特性的第二傳遞函數(shù);以及 對(duì)經(jīng)濾波的期望分量和經(jīng)濾波的噪聲分量求和,以獲得所述第二子帶信號(hào)之一。
3.根據(jù)權(quán)利要求1 所述的音頻處理方法,其中,生成第二子帶信號(hào)包括: 針對(duì)每個(gè)所述通道和每個(gè)所述第一子帶信號(hào),計(jì)算濾波器參數(shù),其中該濾波器參數(shù)是用于賦予所述空間聽(tīng)覺(jué)特性的傳遞函數(shù)與用于賦予所述感知聽(tīng)覺(jué)特性的另一傳遞函數(shù)的加權(quán)和,并且用于該傳遞函數(shù)的權(quán)重以及用于該另一傳遞函數(shù)的權(quán)重分別與對(duì)應(yīng)的第一子帶信號(hào)中的所述期望分量的比例以及所述噪聲分量的比例正相關(guān), 針對(duì)每個(gè)所述通道和每個(gè)所述第一子帶信號(hào),將對(duì)應(yīng)的濾波器參數(shù)應(yīng)用至該第一子帶信號(hào),以獲得所述第二子帶信號(hào)之一。
4.根據(jù)權(quán)利要求1至3中的任一項(xiàng)權(quán)利要求所述的音頻處理方法,其中,所述感知聽(tīng)覺(jué)特性包括空間聽(tīng)覺(jué)特性、或者時(shí)間或頻率白化特性。
5.根據(jù)權(quán)利要求4所述的音頻處理方法,其中,所述時(shí)間或頻率白化特性包括反射特性、回響特性或擴(kuò)散特性。
6.根據(jù)權(quán)利要求1至3中的任一項(xiàng)權(quán)利要求所述的音頻處理方法,其中,所述多維聽(tīng)覺(jué)表現(xiàn)方法是雙耳聽(tīng)覺(jué)表現(xiàn)方法,并且 其中,每個(gè)所述第一傳遞函數(shù)包括用于賦予不同的空間聽(tīng)覺(jué)特性的一個(gè)或更多個(gè)頭部關(guān)聯(lián)傳遞函數(shù)。
7.根據(jù)權(quán)利要求6所述的音頻處理方法,其中,每個(gè)所述第二傳遞函數(shù)包括用于賦予與所述第一傳遞函數(shù)所賦予的空間聽(tīng)覺(jué)特性不同的空間聽(tīng)覺(jué)特性的一個(gè)或更多個(gè)頭部關(guān)聯(lián)傳遞函數(shù)。
8.根據(jù)權(quán)利要求6或7所述的音頻處理方法,其中,所述不同的空間聽(tīng)覺(jué)特性之間的區(qū)別包括以下中的至少一個(gè):所述不同的空間聽(tīng)覺(jué)特性的方位角之間的差、所述不同的空間聽(tīng)覺(jué)特性的仰角之間的差以及所述不同的空間聽(tīng)覺(jué)特性的距離之間的差。
9.根據(jù)權(quán)利要求1至3中的任一項(xiàng)權(quán)利要求所述的音頻處理方法,其中,所述多維聽(tīng)覺(jué)表現(xiàn)方法基于兩個(gè)立體聲揚(yáng)聲器,并且 其中,在對(duì)應(yīng)于同一第一子帶信號(hào)的第二傳遞函數(shù)之間存在低相關(guān)。
10.根據(jù)權(quán)利要求1至3中的任一項(xiàng)權(quán)利要求所述的音頻處理方法,其中,將每個(gè)所述第一子帶信號(hào)中的所述期望分量的比例和所述噪聲分量的比例分別估計(jì)為不大于0.9和不小于0.1。
11.根據(jù)權(quán)利要求10所述的音頻處理方法,其中,假設(shè)將所述期望分量的比例表示為G,則將所述噪聲分量的比例估計(jì)為。
12.根據(jù)權(quán)利要求1至3中的任一項(xiàng)權(quán)利要求所述的音頻處理方法,其中,基于增益函數(shù)或概率來(lái)估計(jì)每個(gè)所述第一子帶信號(hào)中的所述期望分量的比例和所述噪聲分量的比例。
13.根據(jù)權(quán)利要求1至3中的任一項(xiàng)權(quán)利要求所述的音頻處理方法,其中,所述多維聽(tīng)覺(jué)表現(xiàn)方法是高保真度聲響復(fù)制聽(tīng)覺(jué)表現(xiàn)方法,并且 其中,所述第一傳遞函數(shù)適合于在聲場(chǎng)中表現(xiàn)同一聲源。
14.根據(jù)權(quán)利要求1至3中的任一項(xiàng)權(quán)利要求所述的音頻處理方法,其中,所述多維聽(tīng)覺(jué)表現(xiàn)方法基于多個(gè)揚(yáng)聲器,并且,其中,將每個(gè)所述第一子帶信號(hào)中的所述期望分量的比例和所述噪聲分量的比例分別估計(jì)為不大于0.7和不小于O。
15.根據(jù)權(quán)利要求1至3中的任一項(xiàng)權(quán)利要求所述的音頻處理方法,進(jìn)一步包括: 檢測(cè)為進(jìn)行音頻呈現(xiàn)而在目前激活的音頻輸出裝置; 確定該音頻輸出裝置所采用的多維聽(tīng)覺(jué)表現(xiàn)方法;以及 將所述用于進(jìn)行呈現(xiàn) 的信號(hào)發(fā)送至該音頻輸出裝置。
16.—種音頻處理設(shè)備,包括: 時(shí)域-頻域變換器,被配置為將單通道音頻信號(hào)變換為多個(gè)第一子帶信號(hào); 估計(jì)器,被配置為估計(jì)每個(gè)所述子帶信號(hào)中的期望分量的比例和噪聲分量的比例; 生成器,被配置為根據(jù)每個(gè)所述第一子帶信號(hào)生成分別對(duì)應(yīng)于多個(gè)通道的第二子帶信號(hào),其中每個(gè)所述第二子帶信號(hào)包括第一分量和第二分量,所述第一分量和所述第二分量是通過(guò)基于多維聽(tīng)覺(jué)表現(xiàn)方法給對(duì)應(yīng)的第一子帶信號(hào)中的所述期望分量和所述噪聲分量分別賦予空間聽(tīng)覺(jué)特性和不同于該空間聽(tīng)覺(jué)特性的感知聽(tīng)覺(jué)特性來(lái)獲得的;以及 頻域-時(shí)域變換器,被配置為將所述第二子帶信號(hào)變換為用于以所述多維聽(tīng)覺(jué)表現(xiàn)方法進(jìn)行呈現(xiàn)的信號(hào)。
17.根據(jù)權(quán)利要求16所述的音頻處理設(shè)備,其中,所述生成器包括: 提取器,被配置為基于所述比例,從每個(gè)所述第一子帶信號(hào)中分別提取所述期望分量和所述噪聲分量; 分別對(duì)應(yīng)于所述通道的第一濾波器,每個(gè)所述第一濾波器被配置為通過(guò)應(yīng)用用于賦予所述空間聽(tīng)覺(jué)特性的第一傳遞函數(shù),對(duì)每個(gè)所述第一子帶信號(hào)的所提取的期望分量進(jìn)行濾波, 分別對(duì)應(yīng)于所述通道的第二濾波器,每個(gè)所述第二濾波器被配置為通過(guò)應(yīng)用用于賦予所述感知聽(tīng)覺(jué)特性的第二傳遞函數(shù),對(duì)每個(gè)所述第一子帶信號(hào)的所提取的噪聲分量進(jìn)行濾波;以及 分別對(duì)應(yīng)于所述通道的加法器,每個(gè)所述加法器被配置為對(duì)每個(gè)所述第一子帶信號(hào)的經(jīng)濾波的期望分量和經(jīng)濾波的噪聲分量求和,以獲得所述第二子帶信號(hào)之一。
18.根據(jù)權(quán)利要求16所述的音頻處理設(shè)備,其中,所述生成器包括: 計(jì)算器,被配置為針對(duì)每個(gè)所述通道和每個(gè)所述第一子帶信號(hào),計(jì)算濾波器參數(shù),其中該濾波器參數(shù)是用于賦予所述空間聽(tīng)覺(jué)特性的傳遞函數(shù)與用于賦予所述感知聽(tīng)覺(jué)特性的另一傳遞函數(shù)的加權(quán)和,并且用于該傳遞函數(shù)的權(quán)重以及用于該另一傳遞函數(shù)的權(quán)重分別與對(duì)應(yīng)的第一子帶信號(hào)中的所述期望分量的比例以及所述噪聲分量的比例正相關(guān), 分別對(duì)應(yīng)于所述通道的濾波器,每個(gè)所述濾波器被配置為應(yīng)用與該通道和每個(gè)所述第一子帶信號(hào)對(duì)應(yīng)的濾波器參數(shù),以獲得所述第二子帶信號(hào)之一。
19.根據(jù)權(quán)利要求16至18中的任一項(xiàng)權(quán)利要求所述的音頻處理設(shè)備,其中,所述感知聽(tīng)覺(jué)特性包括空間聽(tīng)覺(jué)特性、或者時(shí)間或頻率白化特性。
20.根據(jù)權(quán)利要求19所述的音頻處理設(shè)備,其中,所述時(shí)間或頻率白化特性包括反射特性、回響特性或擴(kuò)散特性。
21.根據(jù)權(quán)利要求16至18中的任一項(xiàng)權(quán)利要求所述的音頻處理設(shè)備,其中,所述多維聽(tīng)覺(jué)表現(xiàn)方法是雙耳聽(tīng)覺(jué)表現(xiàn)方法,并且 其中,每個(gè)所述第一傳遞函數(shù)包括用于賦予不同的空間聽(tīng)覺(jué)特性的一個(gè)或更多個(gè)頭部關(guān)聯(lián)傳遞函數(shù)。
22.根據(jù)權(quán)利要求21所述的音頻處理設(shè)備,其中,每個(gè)所述第二傳遞函數(shù)包括用于賦予與所述第一傳遞函數(shù)所賦予的空間聽(tīng)覺(jué)特性不同的空間聽(tīng)覺(jué)特性的一個(gè)或更多個(gè)頭部關(guān)聯(lián)傳遞函數(shù)。
23.根據(jù)權(quán)利要求21或22所述的音頻處理設(shè)備,其中,所述不同的空間聽(tīng)覺(jué)特性之間的區(qū)別包括以下中的至少一個(gè):所述不同的空間聽(tīng)覺(jué)特性的方位角之間的差、所述不同的空間聽(tīng)覺(jué)特性的仰角之間的差以及所述不同的空間聽(tīng)覺(jué)特性的距離之間的差。
24.根據(jù)權(quán)利要求16至18中的任一項(xiàng)權(quán)利要求所述的音頻處理設(shè)備,其中,所述多維聽(tīng)覺(jué)表現(xiàn)方法基于兩個(gè)立體聲揚(yáng)聲器,并且 其中,在對(duì)應(yīng)于同一第一子帶信號(hào)的第二傳遞函數(shù)之間存在低相關(guān)。
25.根據(jù)權(quán)利要求16至18中的任一項(xiàng)權(quán)利要求所述的音頻處理設(shè)備,其中,將每個(gè)所述第一子帶信號(hào)中的所述期望分量的比例和所述噪聲分量的比例分別估計(jì)為不大于0.9和不小于0.1。
26.根據(jù)權(quán)利要求25所述的音頻處理設(shè)備,其中,假設(shè)將所述期望分量的比例表示為G,則將所述噪聲分量的比例估計(jì)為。
27.根據(jù)權(quán)利要求16至18中的任一項(xiàng)權(quán)利要求所述的音頻處理設(shè)備,其中,基于增益函數(shù)或概率來(lái)估計(jì)每個(gè)所述第一子帶信號(hào)中的所述期望分量的比例和所述噪聲分量的比例。
28.根據(jù)權(quán)利要求16至18中的任一項(xiàng)權(quán)利要求所述的音頻處理設(shè)備,其中,所述多維聽(tīng)覺(jué)表現(xiàn)方法是高保真度聲響復(fù)制聽(tīng)覺(jué)表現(xiàn)方法,并且 其中,所述第一傳遞函數(shù)適合于在聲場(chǎng)中表現(xiàn)同一聲源。
29.根據(jù)權(quán)利要求16至18中的任一項(xiàng)權(quán)利要求所述的音頻處理設(shè)備,其中,所述多維聽(tīng)覺(jué)表現(xiàn)方法基于多個(gè)揚(yáng)聲器,并且,其中,將每個(gè)所述第一子帶信號(hào)中的所述期望分量的比例和所述噪聲分量的比例分別估計(jì)為不大于0.7和不小于O。
30.根據(jù)權(quán)利要求16至18中的任一項(xiàng)權(quán)利要求所述的音頻處理設(shè)備,進(jìn)一步包括:檢測(cè)器,被配置為檢測(cè)為進(jìn)行音頻呈現(xiàn)而在目前激活的音頻輸出裝置,并確定該音頻輸出裝置所采用的多維聽(tīng)覺(jué)表現(xiàn)方法,并且, 其中,所述時(shí)域-頻域變換器被進(jìn)一步配置為將所述用于進(jìn)行呈現(xiàn)的信號(hào)發(fā)送至該音頻輸出裝 置。
全文摘要
描述了一種音頻處理方法和音頻處理設(shè)備。將單通道音頻信號(hào)變換為多個(gè)第一子帶信號(hào)。估計(jì)每個(gè)子帶信號(hào)中的期望分量的比例和噪聲分量的比例。根據(jù)每個(gè)第一子帶信號(hào)來(lái)生成分別對(duì)應(yīng)于多個(gè)通道的第二子帶信號(hào)。每個(gè)第二子帶信號(hào)包括第一分量和第二分量,該第一分量和該第二分量是通過(guò)基于多維聽(tīng)覺(jué)表現(xiàn)方法給對(duì)應(yīng)的第一子帶信號(hào)中的期望分量和噪聲分量分別賦予空間聽(tīng)覺(jué)特性和不同于該空間聽(tīng)覺(jué)特性的感知聽(tīng)覺(jué)特性來(lái)獲得的。將第二子帶信號(hào)變換為用于以該多維聽(tīng)覺(jué)表現(xiàn)方法進(jìn)行呈現(xiàn)的信號(hào)。通過(guò)對(duì)期望聲音和噪聲賦予不同的聽(tīng)覺(jué)特性,可以改進(jìn)音頻信號(hào)的可理解性。
文檔編號(hào)G10L21/0208GK103165136SQ20111042177
公開(kāi)日2013年6月19日 申請(qǐng)日期2011年12月15日 優(yōu)先權(quán)日2011年12月15日
發(fā)明者孫學(xué)京, 格倫·迪金斯, 鄧惠群, 雙志偉, 程斌 申請(qǐng)人:杜比實(shí)驗(yàn)室特許公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
会宁县| 文山县| 祥云县| 始兴县| 金塔县| 福建省| 大洼县| 南溪县| 武汉市| 正安县| 基隆市| 井冈山市| 永寿县| 子洲县| 西宁市| 泰州市| 湘阴县| 磴口县| 萍乡市| 宜兰县| 葫芦岛市| 延边| 郸城县| 通化县| 砀山县| 崇阳县| 宁蒗| 临清市| 萨迦县| 房山区| 清河县| 牙克石市| 桂平市| 宣汉县| 通山县| 怀仁县| 古田县| 昌平区| 册亨县| 濉溪县| 津南区|