專利名稱:一種音頻處理方法、終端設(shè)備及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本申請(qǐng)涉及語(yǔ)音通信技術(shù)領(lǐng)域,特別是涉及一種音頻處理方法、終端設(shè)備及系統(tǒng)。
背景技術(shù):
現(xiàn)有電話會(huì)議系統(tǒng)中,包括多個(gè)具有麥克的終端設(shè)備,這些終端設(shè)備接入通信網(wǎng)絡(luò)中,比如 PSTN(Public Switched Telephone Network,公共交換電話網(wǎng)),IP (InternetProtocol,互聯(lián)網(wǎng)協(xié)議)網(wǎng)絡(luò)等。以三方電話會(huì)議為例,其中一方終端設(shè)備只需要提供兩條線路就可以把其它兩個(gè)終端設(shè)備聯(lián)系在一起,實(shí)現(xiàn)三方通話。目前最常見(jiàn)的方式是交換機(jī)提供三方通話功能,或者運(yùn)營(yíng)商提供多方電話會(huì)議橋接服務(wù),使得身處不同地方的人能夠克服地理位置或距離上困難,同時(shí)連接到會(huì)議系統(tǒng)中一起說(shuō)話討論,彼此能聽(tīng)到對(duì)方說(shuō)話,就好像在同一個(gè)屋子里開(kāi)會(huì)一樣。
但是,發(fā)明人在對(duì)現(xiàn)有技術(shù)的研究過(guò)程中發(fā)現(xiàn),對(duì)于一方終端設(shè)備側(cè)的用戶來(lái)說(shuō),當(dāng)多個(gè)人同時(shí)參與會(huì)議時(shí),多個(gè)語(yǔ)音信息將進(jìn)行混音后,通過(guò)連接線路在終端上進(jìn)行統(tǒng)一播放,經(jīng)常有聽(tīng)不清楚的情形,尤其是多個(gè)人同時(shí)說(shuō)話的時(shí)候,一方面是由于電話線路有信號(hào)不好或者干擾等原因,另一方面是發(fā)言者距離麥克風(fēng)的距離不同導(dǎo)致拾入的信號(hào)強(qiáng)弱不齊,加上多個(gè)人的聲音同時(shí)響起,要讓對(duì)方聽(tīng)清楚非常困難,為了解決這個(gè)問(wèn)題,電話會(huì)議系統(tǒng)中,會(huì)議主持人經(jīng)常會(huì)讓單個(gè)人發(fā)言,但這顯然降低了效率。與現(xiàn)場(chǎng)會(huì)議不同,現(xiàn)場(chǎng)會(huì)議中每個(gè)人除了通過(guò)識(shí)別不同人的音調(diào)和音質(zhì)以外還可以通過(guò)聲音發(fā)出的方位判斷所要獲取的聲音信息,而對(duì)于電話會(huì)議,所有語(yǔ)音信息統(tǒng)一混音后,接收到該混音信息的終端通過(guò)揚(yáng)聲器對(duì)其進(jìn)行統(tǒng)一播放,因此難以聽(tīng)清其中聲音較小的語(yǔ)音信息,如果將混音放大,則只能將所有聲音同一放大,因此仍然難以分辨單個(gè)語(yǔ)音信息。
發(fā)明內(nèi)容
本申請(qǐng)實(shí)施例提供了一種音頻處理方法、終端設(shè)備及系統(tǒng),以解決現(xiàn)有技術(shù)中難以分辨混音音頻中的單個(gè)語(yǔ)音信息,導(dǎo)致收聽(tīng)方分辨效果不佳的問(wèn)題。為了解決上述技術(shù)問(wèn)題,本申請(qǐng)實(shí)施例公開(kāi)了如下技術(shù)方案一種音頻處理方法,應(yīng)用于具有至少兩個(gè)音頻通道的第一終端設(shè)備中,所述第一終端設(shè)備與至少一個(gè)第二終端設(shè)備連通,所述方法包括接收所述至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l,所述混音音頻中包含混合在一起的至少兩個(gè)音頻信息;對(duì)所述混音音頻進(jìn)行分離,獲得所述混音音頻中的至少一個(gè)獨(dú)立的音頻信息;至少將分離出的一個(gè)所述獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。所述對(duì)混音音頻進(jìn)行分離包括獲取預(yù)先設(shè)置的分離矩陣,所述分離矩陣為由每個(gè)音頻信息的特征向量組成的矩陣;根據(jù)所述分離矩陣,通過(guò)快速獨(dú)立成分分析算法ICA從所述混音音頻中分離出獨(dú)立的音頻信息。所述對(duì)混音音頻進(jìn)行分離后還包括判斷分離出的每個(gè)獨(dú)立的音頻信息是否為噪音;根據(jù)判斷結(jié)果,將為噪音的音頻信息進(jìn)行過(guò)濾。還包括將分離出的多個(gè)獨(dú)立的音頻信息采用時(shí)分復(fù)用的方式通過(guò)少于所述音頻通道數(shù)量的揚(yáng)聲器進(jìn)行播放。
還包括獲取所述混音音頻的平均音量;根據(jù)所述平均音量調(diào)整通過(guò)所述一個(gè)音頻通道輸出的所述分離出的一個(gè)獨(dú)立的音頻信息的音量大小。還包括對(duì)所述分離出的一個(gè)所述獨(dú)立的音頻信息進(jìn)行聲紋檢測(cè),獲得聲紋特征;分配用于輸出與所述聲紋特征對(duì)應(yīng)的音頻信息的音頻通道。一種終端設(shè)備,所述終端設(shè)備作為第一終端設(shè)備,與至少一個(gè)第二終端設(shè)備連通,所述第一終端設(shè)備具有至少兩個(gè)音頻通道,所述第一終端設(shè)備包括接收單元,用于接收所述至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l,所述混音音頻中包含混合在一起的至少兩個(gè)音頻信息;分離單元,用于對(duì)所述混音音頻進(jìn)行分離,獲得所述混音音頻中的至少一個(gè)獨(dú)立的音頻信息;輸出單元,用于至少將分離出的一個(gè)所述獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。所述分離單元包括矩陣獲取單元,用于獲取預(yù)先設(shè)置的分離矩陣,所述分離矩陣為由每個(gè)音頻信息的特征向量組成的矩陣;音頻分離單元,用于根據(jù)所述分離矩陣,通過(guò)快速獨(dú)立成分分析算法ICA從所述混音音頻中分離出獨(dú)立的音頻信息。還包括判斷單元,用于判斷分離出的每個(gè)獨(dú)立的音頻信息是否為噪音;過(guò)濾單元,用于根據(jù)所述判斷單元的判斷結(jié)果,將為噪音的音頻信息進(jìn)行過(guò)濾。還包括播放單元,用于將分離出的多個(gè)獨(dú)立的音頻信息采用時(shí)分復(fù)用的方式通過(guò)少于所述音頻通道數(shù)量的揚(yáng)聲器進(jìn)行播放。還包括獲取單元,用于獲取所述混音音頻的平均音量;調(diào)整單元,用于根據(jù)所述平均音量調(diào)整通過(guò)所述一個(gè)音頻通道輸出的所述分離出的一個(gè)獨(dú)立的音頻信息的音量大小。還包括檢測(cè)單元,用于對(duì)所述分離出的一個(gè)所述獨(dú)立的音頻信息進(jìn)行聲紋檢測(cè),獲得聲紋特征;分配單元,用于分配用于輸出與所述聲紋特征對(duì)應(yīng)的音頻信息的音頻通道。一種音頻處理系統(tǒng),包括第一終端設(shè)備和與所述第一終端設(shè)備連接的至少一個(gè)第二終端設(shè)備,所述第一終端設(shè)備具有至少兩個(gè)音頻通道,所述第一終端設(shè)備,用于接收所述至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l,所述混音音頻中包含混合在一起的至少兩個(gè)音頻信息,對(duì)所述混音音頻進(jìn)行分離,獲得所述混音音頻中的至少一個(gè)獨(dú)立的音頻信息,至少將分離出的一個(gè)所述獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。由上述實(shí)施例可以看出,本申請(qǐng)實(shí)施例中第一終端設(shè)備接收至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l,該混音音頻中包含混合在一起的至少兩個(gè)音頻信息,對(duì)混音音頻進(jìn)行分離,獲得混音音頻中的至少一個(gè)獨(dú)立的音頻信息,至少將分離出的一個(gè)獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。應(yīng)用本申請(qǐng)實(shí)施例,通過(guò)在終端設(shè)備上設(shè)置至少兩個(gè)音頻通道,以及對(duì)混音音頻進(jìn)行分離,可以實(shí)現(xiàn)將一個(gè)獨(dú)立的音頻信息通過(guò)一個(gè)獨(dú) 立的音頻通道進(jìn)行輸出播放,由此可以增加單個(gè)音頻信息的清晰度,便于用戶進(jìn)行分辨;進(jìn)一步,根據(jù)分離出的獨(dú)立音頻信息,可以對(duì)其進(jìn)行音量大小的調(diào)節(jié),滿足用戶對(duì)不同音頻信息的收聽(tīng)需求;并且,雖然傳輸通道上設(shè)置了多個(gè)音頻通道,但是無(wú)需為每個(gè)音頻通道配置揚(yáng)聲器,而是采用時(shí)分復(fù)用方式共用揚(yáng)聲器,在保證獨(dú)立音頻信息可以清晰播放的同時(shí),節(jié)約了硬件成本。
為了更清楚地說(shuō)明本申請(qǐng)實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,對(duì)于本領(lǐng)域普通技術(shù)人員而言,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖I為本申請(qǐng)音頻處理方法的第一實(shí)施例流程圖;圖2A為本申請(qǐng)音頻處理方法的第二實(shí)施例流程圖;圖2B為圖2A中一種混音音頻分離的應(yīng)用場(chǎng)景示意圖;圖3為本申請(qǐng)首頻處理方法的第二實(shí)施例流程圖;圖4為本申請(qǐng)首頻處理方法實(shí)施例的一種應(yīng)用場(chǎng)景不意圖;圖5為本申請(qǐng)終端設(shè)備的第一實(shí)施例框圖;圖6為本申請(qǐng)終端設(shè)備的第二實(shí)施例框圖;圖7為本申請(qǐng)終端設(shè)備的第三實(shí)施例框圖;圖8為本申請(qǐng)終端設(shè)備的第四實(shí)施例框圖;圖9為本申請(qǐng)終端設(shè)備的第五實(shí)施例框圖;圖10為本申請(qǐng)語(yǔ)音處理系統(tǒng)的實(shí)施例框圖。
具體實(shí)施例方式本發(fā)明如下實(shí)施例提供了一種音頻處理方法、終端設(shè)備及系統(tǒng)。本發(fā)明實(shí)施例中的第一終端設(shè)備與至少一個(gè)第二終端設(shè)備連通,該第一終端設(shè)備具有至少兩個(gè)音頻通道。為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明實(shí)施例中的技術(shù)方案,并使本發(fā)明實(shí)施例的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖對(duì)本發(fā)明實(shí)施例中技術(shù)方案作進(jìn)一步詳細(xì)的說(shuō)明。參見(jiàn)圖1,為本申請(qǐng)音頻處理方法的第一實(shí)施例流程圖步驟101 :第一終端設(shè)備接收至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l,該混音音頻中包含混合在一起的至少兩個(gè)音頻信息。其中,第一終端設(shè)備作為音頻接收端,可以通過(guò)PSTN網(wǎng)絡(luò)或者IP網(wǎng)絡(luò)等與至少一個(gè)第二終端設(shè)備連通。第一終端設(shè)備與至少一個(gè)第二終端之間連通的情況包括當(dāng)?shù)谝唤K端設(shè)備連通一個(gè)第二終端設(shè)備時(shí),該第二終端設(shè)備上可以設(shè)置一個(gè)麥克風(fēng),通過(guò)該一個(gè)麥克風(fēng)接收多個(gè)用戶的語(yǔ)音音頻;或者,當(dāng)?shù)谝唤K端設(shè)備連通一個(gè)第二終端設(shè)備時(shí),該第二終端上可以設(shè)置多個(gè)麥克風(fēng),每個(gè)麥克風(fēng)接收一個(gè)用戶的語(yǔ)音音頻;或者,當(dāng)?shù)谝唤K端設(shè)備連通多個(gè)第二終端設(shè)備時(shí),每一個(gè)第二終端設(shè)備上可以分別設(shè)置一個(gè)麥克風(fēng),每個(gè)麥克風(fēng)接收一個(gè)用戶的語(yǔ)音音頻;或者,當(dāng)?shù)谝唤K端設(shè)備連通多個(gè)第二終端設(shè)備時(shí),有的第二設(shè)備上·設(shè)置多個(gè)麥克風(fēng),可以接收多個(gè)用戶的語(yǔ)音音頻,有的第二終端上設(shè)置一個(gè)麥克風(fēng),可以接收一個(gè)用戶的語(yǔ)音音頻。第一終端設(shè)備上與網(wǎng)絡(luò)交換機(jī)之間通過(guò)一條傳輸通道連通,該傳輸通道可以具體為語(yǔ)音傳輸通道,無(wú)論連接多少第二終端設(shè)備,這些第二終端設(shè)備傳輸?shù)亩鄠€(gè)語(yǔ)音音頻通過(guò)網(wǎng)絡(luò)交換機(jī)進(jìn)行混合,生成一路混音音頻,該混音音頻通過(guò)該一條語(yǔ)音傳輸通道傳輸?shù)皆摰谝唤K端設(shè)備。對(duì)應(yīng)前述第一終端設(shè)備與至少一個(gè)第二終端之間連通的情況,第一終端設(shè)備接收到的混音音頻可以包括一個(gè)第二終端設(shè)備側(cè)同時(shí)有多個(gè)人說(shuō)話,所獲得的混音音頻;或者,多個(gè)第二終端設(shè)備側(cè)的每一個(gè)第二終端設(shè)備都有一個(gè)人說(shuō)話,所獲得的混音音頻;或者多個(gè)第二終端設(shè)備側(cè),有的第二終端設(shè)備有一個(gè)人說(shuō)話,有的第二終端設(shè)備有多個(gè)人說(shuō)話,由此獲得的混音音頻。步驟102 :對(duì)混音音頻進(jìn)行分離,獲得混音音頻中的至少一個(gè)獨(dú)立的音頻信息。具體的,可以獲取預(yù)先設(shè)置的分離矩陣,所述分離矩陣為由每個(gè)音頻信息的特征向量組成的矩陣,根據(jù)所述分離矩陣,通過(guò)快速I(mǎi)CA (IndependentComponent Analysis,獨(dú)立成分分析)算法從所述混音音頻中分離出獨(dú)立的音頻信息。本實(shí)施例中,對(duì)混音音頻進(jìn)行分離后,可以對(duì)分離出的每一個(gè)獨(dú)立的音頻信息打上唯一識(shí)別該音頻信息的標(biāo)記,通過(guò)將該標(biāo)記與第一終端設(shè)備上的某個(gè)特定的音頻通道進(jìn)行匹配,由該音頻通道對(duì)該音頻信息進(jìn)行輸出。步驟103 :至少將分離出的一個(gè)獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。在分離出多個(gè)音頻信息的時(shí)候,可以根據(jù)第一終端設(shè)備上所具有音頻通道的數(shù)量對(duì)音頻信息進(jìn)行輸出,但至少保證有一個(gè)獨(dú)立的音頻信息可以通過(guò)一個(gè)音頻通道單獨(dú)輸出播放。當(dāng)分離出的音頻信息的數(shù)量小于音頻通道的數(shù)量的時(shí)候,可以根據(jù)用戶需要選擇與音頻通道數(shù)量一致或者小于音頻通道數(shù)量的音頻信息進(jìn)行播放;或者,也可以采用時(shí)分復(fù)用的方式使多個(gè)音頻信息通過(guò)一個(gè)音頻通道進(jìn)行輸出,例如,當(dāng)一個(gè)音頻通道在播放完一個(gè)音頻信息的空閑時(shí)刻,通過(guò)該音頻通道播放另一個(gè)音頻信息。另外,音頻通道輸出的音頻信息通過(guò)與該音頻通道相連的揚(yáng)聲器進(jìn)行播放,通??梢詾槊總€(gè)音頻通道配置一個(gè)揚(yáng)聲器,但是處于節(jié)約成本的考慮,可以配置少于音頻通道數(shù)量的揚(yáng)聲器,此時(shí)分離出的多個(gè)獨(dú)立的音頻信息也可以采用時(shí)分復(fù)用的方式通過(guò)少于音頻通道數(shù)量的揚(yáng)聲器進(jìn)行播放。需要說(shuō)明的是,本實(shí)施例中采用的時(shí)分復(fù)用的方式,一般是指當(dāng)一個(gè)發(fā)言者結(jié)束一小段說(shuō)話段落后,其所用的揚(yáng)聲器可以被另外一個(gè)發(fā)言者使用,而不是兩個(gè)發(fā)言者同時(shí)使用一個(gè)揚(yáng)聲器。參見(jiàn)圖2A,為本申請(qǐng)音頻處理方法的第二實(shí)施例流程圖,該實(shí)施例示出了對(duì)混音音頻進(jìn)行分離和過(guò)濾的詳細(xì)處理過(guò)程步驟201 :第一終端設(shè)備接收至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l,該混音音頻中包含混合在一起的至少兩個(gè)音頻信息。其中,第一終端設(shè)備作為音頻接收端,可以通過(guò)PSTN網(wǎng)絡(luò)或者IP網(wǎng)絡(luò)等與至少一個(gè)第二終端設(shè)備連通。第一終端設(shè)備與至少一個(gè)第二終端之間連通的情況包括當(dāng)?shù)谝唤K端設(shè)備連通一個(gè)第二終端設(shè)備時(shí),該第二終端設(shè)備上可以設(shè)置一個(gè)麥克風(fēng),通過(guò)該一個(gè)麥克風(fēng)接收多個(gè)用戶的語(yǔ)音音頻;或者,當(dāng)?shù)谝唤K端設(shè)備連通一個(gè)第二終端設(shè)備時(shí),該第二終 端上可以設(shè)置多個(gè)麥克風(fēng),每個(gè)麥克風(fēng)接收一個(gè)用戶的語(yǔ)音音頻;或者,當(dāng)?shù)谝唤K端設(shè)備連通多個(gè)第二終端設(shè)備時(shí),每一個(gè)第二終端設(shè)備上可以分別設(shè)置一個(gè)麥克風(fēng),每個(gè)麥克風(fēng)接收一個(gè)用戶的語(yǔ)音音頻;或者,當(dāng)?shù)谝唤K端設(shè)備連通多個(gè)第二終端設(shè)備時(shí),有的第二設(shè)備上設(shè)置多個(gè)麥克風(fēng),可以接收多個(gè)用戶的語(yǔ)音音頻,有的第二終端上設(shè)置一個(gè)麥克風(fēng),可以接收一個(gè)用戶的語(yǔ)音音頻。第一終端設(shè)備上與網(wǎng)絡(luò)交換機(jī)之間通過(guò)一條傳輸通道連通,該傳輸通道可以具體為語(yǔ)音傳輸通道,無(wú)論連接多少第二終端設(shè)備,這些第二終端設(shè)備傳輸?shù)亩鄠€(gè)語(yǔ)音音頻通過(guò)網(wǎng)絡(luò)交換機(jī)進(jìn)行混合,生成一路混音音頻,該混音音頻通過(guò)該一條語(yǔ)音傳輸通道傳輸?shù)皆摰谝唤K端設(shè)備。對(duì)應(yīng)前述第一終端設(shè)備與至少一個(gè)第二終端之間連通的情況,第一終端設(shè)備接收到的混音音頻可以包括一個(gè)第二終端設(shè)備側(cè)同時(shí)有多個(gè)人說(shuō)話,所獲得的混音音頻;或者,多個(gè)第二終端設(shè)備側(cè)的每一個(gè)第二終端設(shè)備都有一個(gè)人說(shuō)話,所獲得的混音音頻;或者多個(gè)第二終端設(shè)備側(cè),有的第二終端設(shè)備有一個(gè)人說(shuō)話,有的第二終端設(shè)備有多個(gè)人說(shuō)話,由此獲得的混音音頻。步驟202 :對(duì)混音音頻進(jìn)行分離,獲得混音音頻中的至少一個(gè)獨(dú)立的音頻信息。為了詳細(xì)描述本實(shí)施例中的混音音頻分離過(guò)程,下面結(jié)合圖2B所示的應(yīng)用場(chǎng)景進(jìn)行描述如下假設(shè)在一個(gè)會(huì)議場(chǎng)景中,vl和v2為兩個(gè)獨(dú)立的二維語(yǔ)音音頻輸入信號(hào),ml和m2為兩個(gè)獨(dú)立的麥克風(fēng),每個(gè)麥克風(fēng)收到的兩路語(yǔ)音音頻輸入信號(hào)二維隨機(jī)觀測(cè)信號(hào)。在這個(gè)實(shí)際的場(chǎng)景中,vl的聲音不僅會(huì)傳到ml,也會(huì)傳到m2,但是這兩個(gè)語(yǔ)音音頻輸入信號(hào)之間存在細(xì)微的區(qū)別,同樣的差別也發(fā)生在v2同時(shí)傳輸?shù)絤l和m2的情況。首先,可以在會(huì)議開(kāi)始前通過(guò)事先的學(xué)習(xí)訓(xùn)練,得到一個(gè)合適的H矩陣。即兩個(gè)發(fā)言人可以分別進(jìn)行自我介紹,相當(dāng)于先后輸入了 vl和v2,然后系統(tǒng)提取每個(gè)說(shuō)話人的音頻特征,具體可以使用幾秒長(zhǎng)度平穩(wěn)語(yǔ)音來(lái)進(jìn)行訓(xùn)練,然后根據(jù)MFCC Mel (Mel FrequencyCepstrum Coeff icient,頻率倒譜系數(shù))提取vl和v2的特征向量,然后用ICA的方式合并vl和v2得到矩陣H,H為2X2階滿秩混合矩陣。其次,在采用Fast ICA算法進(jìn)行混音音頻分離時(shí),假設(shè)已經(jīng)去掉了音頻信號(hào)的均值,則ICA的線性混合模型可以表示為m = Hv = hlvl+hlvl+h2vl+h2v2,其中,h為v的特征向量,m為每個(gè)麥克風(fēng)接收到的vl和v2的混音音頻;則需要估計(jì)分離矩陣W,使得m通過(guò)W后的輸出為源信號(hào)的估計(jì)值y,即y(t)=Wm(t) = WHv (t) = Gv (t),其中G為全局矩陣,如果通過(guò)學(xué)習(xí)得到G = I,那么y(t) = v(t),也就是說(shuō)通過(guò)算法估計(jì)計(jì)算出來(lái)的信號(hào)y,可以還原出原始的聲音V。除了上述示出的采用Fast ICA算法進(jìn)行混音音頻分離外,作為一個(gè)特例,可以簡(jiǎn)單地將ml,m2中各個(gè)語(yǔ)音的到達(dá)時(shí)間作為提取特征,比如vl到達(dá)ml的距離短,時(shí)間短,因此可以根據(jù)這個(gè)特征,在ml中提取出vl ;簡(jiǎn)單來(lái)說(shuō),就是在系統(tǒng)中分別比較vl,v2到達(dá)ml,m2的時(shí)間,然后進(jìn)行相減的計(jì)算。具體地,類(lèi)似于根據(jù)多個(gè)mic陣列消除噪音的原理,就是ml獲得相同語(yǔ)音分量的時(shí)間比m2早,那么可以將m2中收取的聲音作為ml的噪音,對(duì)其進(jìn)行去除,由此可以簡(jiǎn)單地得到vl和v2的分離信號(hào)。步驟203 :判斷分離出的每個(gè)獨(dú)立的音頻信息是否為噪音。作為噪音的音頻信息具有特定的音頻特征,將這些音頻特征作為噪音特征進(jìn)行保 存,對(duì)于分離出的每個(gè)獨(dú)立的音頻信息,分別與保存的噪音特征進(jìn)行比對(duì),當(dāng)匹配時(shí),則確定音頻信息為噪音。步驟204 :根據(jù)判斷結(jié)果,將為噪音的音頻信息進(jìn)行過(guò)濾。步驟205 :至少將分離出的一個(gè)獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。在分離出多個(gè)音頻信息的時(shí)候,可以根據(jù)第一終端設(shè)備上所具有音頻通道的數(shù)量對(duì)音頻信息進(jìn)行輸出,但至少保證有一個(gè)獨(dú)立的音頻信息可以通過(guò)一個(gè)音頻通道單獨(dú)輸出播放。當(dāng)分離出的音頻信息的數(shù)量小于音頻通道的數(shù)量的時(shí)候,可以根據(jù)用戶需要選擇與音頻通道數(shù)量一致或者小于音頻通道數(shù)量的音頻信息進(jìn)行播放;或者,也可以采用時(shí)分復(fù)用的方式使多個(gè)音頻信息通過(guò)一個(gè)音頻通道進(jìn)行輸出,例如,當(dāng)一個(gè)音頻通道在播放完一個(gè)音頻信息的空閑時(shí)刻,通過(guò)該音頻通道播放另一個(gè)音頻信息。步驟206 :通過(guò)與該音頻通道相連的揚(yáng)聲器播放該獨(dú)立的音頻信息。音頻通道輸出的音頻信息通過(guò)與該音頻通道相連的揚(yáng)聲器進(jìn)行播放,通??梢詾槊總€(gè)音頻通道配置一個(gè)揚(yáng)聲器,但是處于節(jié)約成本的考慮,可以配置少于音頻通道數(shù)量的揚(yáng)聲器,此時(shí)分離出的多個(gè)獨(dú)立的音頻信息也可以采用時(shí)分復(fù)用的方式通過(guò)少于音頻通道數(shù)量的揚(yáng)聲器進(jìn)行播放。需要說(shuō)明的是,本實(shí)施例中采用的時(shí)分復(fù)用的方式,一般是指當(dāng)一個(gè)發(fā)言者結(jié)束一小段說(shuō)話段落后,其所用的揚(yáng)聲器可以被另外一個(gè)發(fā)言者使用,而不是兩個(gè)發(fā)言者同時(shí)使用一個(gè)揚(yáng)聲器。參見(jiàn)圖3,為本申請(qǐng)音頻處理方法的第三實(shí)施例流程圖,該實(shí)施例是出了對(duì)分離出的獨(dú)立音頻信息分配音頻通道并進(jìn)行音量調(diào)整的過(guò)程步驟301 :第一終端設(shè)備接收所述至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l,該混音音頻中包含混合在一起的至少兩個(gè)音頻信息。其中,第一終端設(shè)備作為音頻接收端,可以通過(guò)PSTN網(wǎng)絡(luò)或者IP網(wǎng)絡(luò)等與至少一個(gè)第二終端設(shè)備連通。第一終端設(shè)備與至少一個(gè)第二終端之間連通的情況包括當(dāng)?shù)谝唤K端設(shè)備連通一個(gè)第二終端設(shè)備時(shí),該第二終端設(shè)備上可以設(shè)置一個(gè)麥克風(fēng),通過(guò)該一個(gè)麥克風(fēng)接收多個(gè)用戶的語(yǔ)音音頻;或者,當(dāng)?shù)谝唤K端設(shè)備連通一個(gè)第二終端設(shè)備時(shí),該第二終端上可以設(shè)置多個(gè)麥克風(fēng),每個(gè)麥克風(fēng)接收一個(gè)用戶的語(yǔ)音音頻;或者,當(dāng)?shù)谝唤K端設(shè)備連通多個(gè)第二終端設(shè)備時(shí),每一個(gè)第二終端設(shè)備上可以分別設(shè)置一個(gè)麥克風(fēng),每個(gè)麥克風(fēng)接收一個(gè)用戶的語(yǔ)音音頻;或者,當(dāng)?shù)谝唤K端設(shè)備連通多個(gè)第二終端設(shè)備時(shí),有的第二設(shè)備上設(shè)置多個(gè)麥克風(fēng),可以接收多個(gè)用戶的語(yǔ)音音頻,有的第二終端上設(shè)置一個(gè)麥克風(fēng),可以接收一個(gè)用戶的語(yǔ)音音頻。第一終端設(shè)備上與網(wǎng)絡(luò)交換機(jī)之間通過(guò)一條傳輸通道連通,該傳輸通道可以具體為語(yǔ)音傳輸通道,無(wú)論連接多少第二終端設(shè)備,這些第二終端設(shè)備傳輸?shù)亩鄠€(gè)語(yǔ)音音頻通過(guò)網(wǎng)絡(luò)交換機(jī)進(jìn)行混合,生成一路混音音頻,該混音音頻通過(guò)該一條語(yǔ)音傳輸通道傳輸?shù)皆摰谝唤K端設(shè)備。對(duì)應(yīng)前述第一終端設(shè)備與至少一個(gè)第二終端之間連通的情況,第一終端設(shè)備接收到的混音音頻可以包括一個(gè)第二終端設(shè)備側(cè)同時(shí)有多個(gè)人說(shuō)話,所獲得的混音音頻;或者,多個(gè)第二終端設(shè)備側(cè)的每一個(gè)第二終端設(shè)備都有一個(gè)人說(shuō)話,所獲得的混音音頻;或者多個(gè)第二終端設(shè)備側(cè),有的第二終端設(shè)備有一個(gè)人說(shuō)話,有的第二終端設(shè)備有多個(gè)人說(shuō)話,由此獲得的混音音頻。步驟302 :獲取混音音頻的平均音量,并記錄該平均音量。
步驟303 :對(duì)混音音頻進(jìn)行分離,獲得混音音頻中的至少一個(gè)獨(dú)立的音頻信息。具體的,可以獲取預(yù)先設(shè)置的分離矩陣,所述分離矩陣為由每個(gè)音頻信息的特征向量組成的矩陣,根據(jù)所述分離矩陣,通過(guò)快速I(mǎi)CA算法從混音音頻中分離出獨(dú)立的音頻信息。其中,當(dāng)應(yīng)用在會(huì)議場(chǎng)景時(shí),可以在進(jìn)行會(huì)議前進(jìn)行語(yǔ)音訓(xùn)練,將提取的語(yǔ)音的聲紋特征通過(guò)網(wǎng)絡(luò)發(fā)送到音頻接收端,然后在音頻接收端根據(jù)語(yǔ)音的聲紋特征從混音音頻中分離出獨(dú)立的音頻信息;另外,也可以由各個(gè)音頻接收端在會(huì)議開(kāi)始前收集各個(gè)發(fā)言人的聲紋特征,然后進(jìn)行保存,然后在音頻接收端根據(jù)語(yǔ)音的聲紋特征從混音音頻中分離出獨(dú)立的音頻信息。在提取語(yǔ)音的聲紋特征時(shí),可以對(duì)語(yǔ)音進(jìn)行分析獲得的特征包括頻譜、倒頻譜、共振峰、基音、反射系數(shù)等。步驟304 :對(duì)分離出的一個(gè)獨(dú)立的音頻信息進(jìn)行聲紋檢測(cè),獲得聲紋特征。步驟305 :分配用于輸出與該聲紋特征對(duì)應(yīng)的音頻信息的音頻通道。步驟306 :根據(jù)記錄的平均音量調(diào)整通過(guò)所分配的音頻通道輸出的一個(gè)獨(dú)立的音頻信息的音量大小。步驟307 :通過(guò)與該音頻通道相連的揚(yáng)聲器播放該獨(dú)立的音頻信息。音頻通道輸出的音頻信息通過(guò)與該音頻通道相連的揚(yáng)聲器進(jìn)行播放,通??梢詾槊總€(gè)音頻通道配置一個(gè)揚(yáng)聲器,但是處于節(jié)約成本的考慮,可以配置少于音頻通道數(shù)量的揚(yáng)聲器,此時(shí)分離出的多個(gè)獨(dú)立的音頻信息也可以采用時(shí)分復(fù)用的方式通過(guò)少于音頻通道數(shù)量的揚(yáng)聲器進(jìn)行播放。需要說(shuō)明的是,本實(shí)施例中采用的時(shí)分復(fù)用的方式,一般是指當(dāng)一個(gè)發(fā)言者結(jié)束一小段說(shuō)話段落后,其所用的揚(yáng)聲器可以被另外一個(gè)發(fā)言者使用,而不是兩個(gè)發(fā)言者同時(shí)使用一個(gè)揚(yáng)聲器。參見(jiàn)圖4,為本申請(qǐng)首頻處理方法實(shí)施例的一種應(yīng)用場(chǎng)景不意圖其中,終端設(shè)備I為音頻接收端,終端設(shè)備2和終端設(shè)備3為音頻發(fā)送端,上述三個(gè)終端設(shè)備可以通過(guò)圖4中示出的PSTN網(wǎng)絡(luò)交換機(jī)相連,另外,也可以通過(guò)IP網(wǎng)絡(luò)相連。每個(gè)終端設(shè)備與PSTN網(wǎng)絡(luò)交換機(jī)之間相連的傳輸通道為一條,因此當(dāng)有多個(gè)語(yǔ)音音頻需要傳輸時(shí),該傳輸通道僅能傳輸多個(gè)語(yǔ)音音頻的混音。
假設(shè)終端設(shè)備2上有兩個(gè)麥克風(fēng),分別為麥克風(fēng)I和麥克風(fēng)2,終端設(shè)備3上有一個(gè)麥克風(fēng),為麥克風(fēng)3,此時(shí)用戶間通過(guò)三個(gè)終端設(shè)備進(jìn)行電話會(huì)議。其中,用戶I和用戶2在終端設(shè)備2上,分別使用麥克風(fēng)I和麥克風(fēng)2輸入語(yǔ)音,用戶3在終端設(shè)備3上使用麥克風(fēng)3輸入語(yǔ)音,上述三個(gè)語(yǔ)音傳輸?shù)絇STN網(wǎng)的交換機(jī)后,該交換機(jī)將三個(gè)語(yǔ)音進(jìn)行混合后,通過(guò)終端設(shè)備I與該P(yáng)STN交換機(jī)之間的傳輸通道將混音音頻傳輸?shù)浇K端設(shè)備I。終端設(shè)備I接收到混音音頻后,可以采用前述實(shí)施例中示出的音頻處理方法對(duì)混音音頻進(jìn)行分離。假設(shè)終端設(shè)備I上預(yù)先設(shè)置了兩個(gè)音頻通道,如圖4所示,每一個(gè)音頻通道連接一個(gè)揚(yáng)聲器,圖4中共不出兩個(gè)揚(yáng)聲器,分別為揚(yáng)聲器I和揚(yáng)聲器2。對(duì)于分離出對(duì)應(yīng)三個(gè)用戶的三個(gè)獨(dú)立的語(yǔ)音音頻,可以選擇性的進(jìn)行播放,例如,可以通過(guò)揚(yáng)聲器I輸出用戶I的語(yǔ)音音頻,通過(guò)揚(yáng)聲器2輸出用戶3的語(yǔ)音音頻,對(duì)于用戶2的語(yǔ)音音頻可以選擇不輸出,或者在用戶I和用戶3的語(yǔ)音音頻輸出完畢后,再單獨(dú)輸出,對(duì)此本申請(qǐng)實(shí)施例不進(jìn)行限制,只要保證可以通過(guò)一個(gè)音頻通道對(duì)應(yīng)的一個(gè)揚(yáng)聲器輸出并播放一個(gè)獨(dú)立的語(yǔ)音音頻即可。圖4中,對(duì)于每個(gè)揚(yáng)聲器輸出的語(yǔ)音音頻的音量大小可以單獨(dú)進(jìn)行調(diào)節(jié);另外,也 可以僅設(shè)置一個(gè)揚(yáng)聲器,通過(guò)時(shí)分復(fù)用的方式輸出獨(dú)立的語(yǔ)音音頻,以節(jié)省硬件成本。與本申請(qǐng)音頻處理方法的實(shí)施例相對(duì)應(yīng),本申請(qǐng)還提供了終端設(shè)備和引用處理系統(tǒng)的實(shí)施例。其中,終端設(shè)備實(shí)施例中的終端設(shè)備均作為第一終端設(shè)備進(jìn)行描述,該第一終端設(shè)備與至少一個(gè)第二終端設(shè)備連通,該第一終端設(shè)備具有至少兩個(gè)音頻通道。參見(jiàn)圖5,為本申請(qǐng)終端設(shè)備的第一實(shí)施例框圖該終端設(shè)備包括接收單元510、分離單元520和輸出單元530。其中,接收單元510,用于接收所述至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l,所述混音音頻中包含混合在一起的至少兩個(gè)音頻信息;分離單元520,用于對(duì)所述混音音頻進(jìn)行分離,獲得所述混音音頻中的至少一個(gè)獨(dú)立的音頻信息;輸出單元530,用于至少將分離出的一個(gè)所述獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。參見(jiàn)圖6,為本申請(qǐng)終端設(shè)備的第二實(shí)施例框圖該終端設(shè)備包括接收單元610、分離單元620、判斷單元630、過(guò)濾單元640和輸出單元650。其中,接收單元610,用于接收所述至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l,所述混音音頻中包含混合在一起的至少兩個(gè)音頻信息;分離單元620,用于對(duì)所述混音音頻進(jìn)行分離,獲得所述混音音頻中的至少一個(gè)獨(dú)立的音頻信息;判斷單元630,用于判斷分離出的每個(gè)獨(dú)立的音頻信息是否為噪音;過(guò)濾單元640,用于根據(jù)所述判斷單元的判斷結(jié)果,將為噪音的音頻信息進(jìn)行過(guò)濾;輸出單元650,用于至少將分離出的一個(gè)所述獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。參見(jiàn)圖7,為本申請(qǐng)終端設(shè)備的第三實(shí)施例框圖
該終端設(shè)備包括接收單元710、分離單元720、輸出單元730和播放單元740。接收單元710,用于接收所述至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l,所述混音音頻中包含混合在一起的至少兩個(gè)音頻信息;分離單元720,用于對(duì)所述混音音頻進(jìn)行分離,獲得所述混音音頻中的至少一個(gè)獨(dú)立的音頻信息;輸出單元730,用于至少將分離出的一個(gè)所述獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出;播放單元740,用于將分離出的多個(gè)獨(dú)立的音頻信息采用時(shí)分復(fù)用的方式通過(guò)少于所述音頻通道數(shù)量的揚(yáng)聲器進(jìn)行播放。參見(jiàn)圖8,為本申請(qǐng)終端設(shè)備的第四實(shí)施例框圖
該終端設(shè)備包括接收單元810、獲取單元820、分離單元830、輸出單元840和調(diào)整單元850。接收單元810,用于接收所述至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l,所述混音音頻中包含混合在一起的至少兩個(gè)音頻信息;獲取單元820,用于獲取所述混音音頻的平均音量;分離單元830,用于對(duì)所述混音音頻進(jìn)行分離,獲得所述混音音頻中的至少一個(gè)獨(dú)立的音頻信息;輸出單元840,用于至少將分離出的一個(gè)所述獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出;調(diào)整單元850,用于根據(jù)所述平均音量調(diào)整通過(guò)所述一個(gè)音頻通道輸出的所述分離出的一個(gè)獨(dú)立的音頻信息的音量大小。參見(jiàn)圖9,為本申請(qǐng)終端設(shè)備的第五實(shí)施例框圖該終端設(shè)備包括接收單元910、分離單元920、檢測(cè)單元930、分配單元940和輸出單元950。其中,接收單元910,用于接收所述至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l,所述混音音頻中包含混合在一起的至少兩個(gè)音頻信息;分離單元920,用于對(duì)所述混音音頻進(jìn)行分離,獲得所述混音音頻中的至少一個(gè)獨(dú)立的音頻信息;檢測(cè)單元930,用于對(duì)所述分離出的一個(gè)獨(dú)立的音頻信息進(jìn)行聲紋檢測(cè),獲得聲紋特征;分配單元940,用于分配用于輸出與所述聲紋特征對(duì)應(yīng)的音頻信息的音頻通道;輸出單元950,用于至少將分離出的一個(gè)所述獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。上述圖5至圖9示出的終端設(shè)備實(shí)施例中,分離單元可以包括(圖5至圖9中未具體示出)矩陣獲取單元,用于獲取預(yù)先設(shè)置的分離矩陣,所述分離矩陣為由每個(gè)音頻信息的特征向量組成的矩陣;音頻分離單元,用于根據(jù)所述分離矩陣,通過(guò)快速獨(dú)立成分分析算法ICA從所述混音音頻中分離出獨(dú)立的音頻信息。
參見(jiàn)圖10,為本申請(qǐng)音頻處理系統(tǒng)的實(shí)施例框圖該音頻處理系統(tǒng)包括第一終端設(shè)備1010和與所述第一終端設(shè)備連接的至少一個(gè)第二終端設(shè)備1020,所述第一終端設(shè)備具有至少兩個(gè)音頻通道。為了示例方便,圖10中僅示出兩個(gè)第二終端設(shè)備1020。其中,所述第一終端設(shè)備1010,用于接收所述至少一個(gè)第二終端設(shè)備1020通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l,所述混音音頻中包含混合在一起的至少兩個(gè)音頻信息,對(duì)所述混音音頻進(jìn)行分離,獲得所述混音音頻中的至少一個(gè)獨(dú)立的音頻信息,至少將分離出的一個(gè)所述獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。進(jìn)一步,所述第一終端設(shè)備1010,還用于判斷分離出的每個(gè)獨(dú)立的音 頻信息是否為噪音,根據(jù)判斷結(jié)果,將為噪音的音頻信息進(jìn)行過(guò)濾。進(jìn)一步,所述第一終端設(shè)備1010,還用于將分離出的多個(gè)獨(dú)立的音頻信息采用時(shí)分復(fù)用的方式通過(guò)少于所述音頻通道數(shù)量的揚(yáng)聲器進(jìn)行播放。進(jìn)一步,所述第一終端設(shè)備1010,還用于獲取所述混音音頻的平均音量,根據(jù)所述平均音量調(diào)整通過(guò)所述一個(gè)音頻通道輸出的所述分離出的一個(gè)獨(dú)立的音頻信息的音量大小。進(jìn)一步,所述第一終端設(shè)備1010,還用于對(duì)所述分離出的一個(gè)所述獨(dú)立的音頻信息進(jìn)行聲紋檢測(cè),獲得聲紋特征,分配用于輸出與所述聲紋特征對(duì)應(yīng)的音頻信息的音頻通道。通過(guò)對(duì)以上實(shí)施方式的描述可知,本申請(qǐng)實(shí)施例中第一終端設(shè)備接收至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l,該混音音頻中包含混合在一起的至少兩個(gè)音頻信息,對(duì)混音音頻進(jìn)行分離,獲得混音音頻中的至少一個(gè)獨(dú)立的音頻信息,至少將分離出的一個(gè)獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。應(yīng)用本申請(qǐng)實(shí)施例,通過(guò)在終端設(shè)備上設(shè)置至少兩個(gè)音頻通道,以及對(duì)混音音頻進(jìn)行分離,可以實(shí)現(xiàn)將一個(gè)獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道進(jìn)行輸出播放,由于多個(gè)音頻通道的輸出揚(yáng)聲器物理位置上分開(kāi),使得用戶還可以獲取音頻來(lái)自不同的方位的信息,由此可以增加單個(gè)音頻信息的清晰度,便于用戶進(jìn)行分辨;進(jìn)一步,根據(jù)分離出的獨(dú)立音頻信息,可以對(duì)其進(jìn)行音量大小的調(diào)節(jié),滿足用戶對(duì)不同音頻信息的收聽(tīng)需求;并且,雖然傳輸通道上設(shè)置了多個(gè)音頻通道,但是無(wú)需為每個(gè)音頻通道配置揚(yáng)聲器,而是采用時(shí)分復(fù)用方式共用揚(yáng)聲器,在保證獨(dú)立音頻信息可以清晰播放的同時(shí),節(jié)約了硬件成本。本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明實(shí)施例中的技術(shù)可借助軟件加必需的通用硬件平臺(tái)的方式來(lái)實(shí)現(xiàn)。基于這樣的理解,本發(fā)明實(shí)施例中的技術(shù)方案本質(zhì)上或者說(shuō)對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品可以存儲(chǔ)在存儲(chǔ)介質(zhì)中,如R0M/RAM、磁碟、光盤(pán)等,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例或者實(shí)施例的某些部分所述的方法。本說(shuō)明書(shū)中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,各個(gè)實(shí)施例之間相同相似的部分互相參見(jiàn)即可,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處。尤其,對(duì)于系統(tǒng)實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述的比較簡(jiǎn)單,相關(guān)之處參見(jiàn)方法實(shí)施例的部分說(shuō)明即可。
以上所述的本發(fā)明實(shí)施方式,并不構(gòu)成對(duì)本發(fā)明保護(hù)范圍的限定。任何在本發(fā)明的精神和原則之內(nèi)所作的修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)?!?br>
權(quán)利要求
1.一種音頻處理方法,其特征在于,應(yīng)用于具有至少兩個(gè)音頻通道的第一終端設(shè)備中,所述第一終端設(shè)備與至少一個(gè)第二終端設(shè)備連通,所述方法包括 接收所述至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l,所述混音音頻中包含混合在一起的至少兩個(gè)音頻信息; 對(duì)所述混音音頻進(jìn)行分離,獲得所述混音音頻中的至少一個(gè)獨(dú)立的音頻信息; 至少將分離出的一個(gè)所述獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述對(duì)混音音頻進(jìn)行分離包括 獲取預(yù)先設(shè)置的分離矩陣,所述分離矩陣為由每個(gè)音頻信息的特征向量組成的矩陣; 根據(jù)所述分離矩陣,通過(guò)快速獨(dú)立成分分析算法ICA從所述混音音頻中分離出獨(dú)立的音頻信息。
3.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述對(duì)混音音頻進(jìn)行分離后還包括 判斷分離出的每個(gè)獨(dú)立的音頻信息是否為噪音; 根據(jù)判斷結(jié)果,將為噪音的音頻信息進(jìn)行過(guò)濾。
4.根據(jù)權(quán)利要求I所述的方法,其特征在于,還包括 將分離出的多個(gè)獨(dú)立的音頻信息采用時(shí)分復(fù)用的方式通過(guò)少于所述音頻通道數(shù)量的揚(yáng)聲器進(jìn)行播放。
5.根據(jù)權(quán)利要求I所述的方法,其特征在于,還包括 獲取所述混音音頻的平均音量; 根據(jù)所述平均音量調(diào)整通過(guò)所述一個(gè)音頻通道輸出的所述分離出的一個(gè)獨(dú)立的音頻信息的音量大小。
6.根據(jù)權(quán)利要求I所述的方法,其特征在于,還包括 對(duì)所述分離出的一個(gè)所述獨(dú)立的音頻信息進(jìn)行聲紋檢測(cè),獲得聲紋特征; 分配用于輸出與所述聲紋特征對(duì)應(yīng)的音頻信息的音頻通道。
7.—種終端設(shè)備,其特征在于,所述終端設(shè)備作為第一終端設(shè)備,與至少一個(gè)第二終端設(shè)備連通,所述第一終端設(shè)備具有至少兩個(gè)音頻通道,所述第一終端設(shè)備包括 接收單元,用于接收所述至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l,所述混音音頻中包含混合在一起的至少兩個(gè)音頻信息; 分離單元,用于對(duì)所述混音音頻進(jìn)行分離,獲得所述混音音頻中的至少一個(gè)獨(dú)立的音頻信息; 輸出單元,用于至少將分離出的一個(gè)所述獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。
8.根據(jù)權(quán)利要求7所述的終端設(shè)備,其特征在于,所述分離單元包括 矩陣獲取單元,用于獲取預(yù)先設(shè)置的分離矩陣,所述分離矩陣為由每個(gè)音頻信息的特征向量組成的矩陣; 音頻分離單元,用于根據(jù)所述分離矩陣,通過(guò)快速獨(dú)立成分分析算法ICA從所述混音音頻中分離出獨(dú)立的音頻信息。
9.根據(jù)權(quán)利要求7所述的終端設(shè)備,其特征在于,還包括 判斷單元,用于判斷分離出的每個(gè)獨(dú)立的音頻信息是否為噪音; 過(guò)濾單元,用于根據(jù)所述判斷單元的判斷結(jié)果,將為噪音的音頻信息進(jìn)行過(guò)濾。
10.根據(jù)權(quán)利要求7所述的終端設(shè)備,其特征在于,還包括播放單元,用于將分離出的多個(gè)獨(dú)立的音頻信息采用時(shí)分復(fù)用的方式通過(guò)少于所述音頻通道數(shù)量的揚(yáng)聲器進(jìn)行播放。
11.根據(jù)權(quán)利要求7所述的終端設(shè)備,其特征在于,還包括 獲取單元,用于獲取所述混音音頻的平均音量; 調(diào)整單元,用于根據(jù)所述平均音量調(diào)整通過(guò)所述一個(gè)音頻通道輸出的所述分離出的一個(gè)獨(dú)立的音頻信息的音量大小。
12.根據(jù)權(quán)利要求7所述的終端設(shè)備,其特征在于,還包括 檢測(cè)單元,用于對(duì)所述分離出的一個(gè)所述獨(dú)立的音頻信息進(jìn)行聲紋檢測(cè),獲得聲紋特征; 分配單元,用于分配用于輸出與所述聲紋特征對(duì)應(yīng)的音頻信息的音頻通道。
13.一種音頻處理系統(tǒng),其特征在于,包括第一終端設(shè)備和與所述第一終端設(shè)備連接的至少一個(gè)第二終端設(shè)備,所述第一終端設(shè)備具有至少兩個(gè)音頻通道, 所述第一終端設(shè)備,用于接收所述至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l,所述混音音頻中包含混合在一起的至少兩個(gè)音頻信息,對(duì)所述混音音頻進(jìn)行分離,獲得所述混音音頻中的至少一個(gè)獨(dú)立的音頻信息,至少將分離出的一個(gè)所述獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。
全文摘要
本申請(qǐng)實(shí)施例公開(kāi)了一種音頻處理方法,應(yīng)用于具有至少兩個(gè)音頻通道的第一終端設(shè)備中,所述第一終端設(shè)備與至少一個(gè)第二終端設(shè)備連通,所述方法包括所述第一終端設(shè)備接收所述至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l,所述混音音頻中包含混合在一起的至少兩個(gè)音頻信息;對(duì)所述混音音頻進(jìn)行分離,獲得所述混音音頻中的至少一個(gè)獨(dú)立的音頻信息;至少將分離出的一個(gè)所述獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。應(yīng)用本申請(qǐng)實(shí)施例,通過(guò)在終端設(shè)備上設(shè)置至少兩個(gè)音頻通道,以及對(duì)混音音頻進(jìn)行分離,可以實(shí)現(xiàn)將一個(gè)獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道進(jìn)行輸出播放,由此可以增加單個(gè)音頻信息的清晰度,便于用戶進(jìn)行分辨。
文檔編號(hào)G10L25/24GK102890936SQ20111020192
公開(kāi)日2013年1月23日 申請(qǐng)日期2011年7月19日 優(yōu)先權(quán)日2011年7月19日
發(fā)明者李眾慶 申請(qǐng)人:聯(lián)想(北京)有限公司