一種音頻處理方法、終端設(shè)備及系統(tǒng)的制作方法

文檔序號(hào)：2825271閱讀：211來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：一種音頻處理方法、終端設(shè)備及系統(tǒng)的制作方法
技術(shù)領(lǐng)域：
本申請(qǐng)涉及語(yǔ)音通信技術(shù)領(lǐng)域，特別是涉及一種音頻處理方法、終端設(shè)備及系統(tǒng)。
背景技術(shù)：
現(xiàn)有電話會(huì)議系統(tǒng)中，包括多個(gè)具有麥克的終端設(shè)備，這些終端設(shè)備接入通信網(wǎng)絡(luò)中，比如 PSTN(Public Switched Telephone Network,公共交換電話網(wǎng)),IP (InternetProtocol，互聯(lián)網(wǎng)協(xié)議)網(wǎng)絡(luò)等。以三方電話會(huì)議為例，其中一方終端設(shè)備只需要提供兩條線路就可以把其它兩個(gè)終端設(shè)備聯(lián)系在一起，實(shí)現(xiàn)三方通話。目前最常見(jiàn)的方式是交換機(jī)提供三方通話功能，或者運(yùn)營(yíng)商提供多方電話會(huì)議橋接服務(wù)，使得身處不同地方的人能夠克服地理位置或距離上困難，同時(shí)連接到會(huì)議系統(tǒng)中一起說(shuō)話討論，彼此能聽(tīng)到對(duì)方說(shuō)話，就好像在同一個(gè)屋子里開(kāi)會(huì)一樣。
但是，發(fā)明人在對(duì)現(xiàn)有技術(shù)的研究過(guò)程中發(fā)現(xiàn)，對(duì)于一方終端設(shè)備側(cè)的用戶來(lái)說(shuō)，當(dāng)多個(gè)人同時(shí)參與會(huì)議時(shí)，多個(gè)語(yǔ)音信息將進(jìn)行混音后，通過(guò)連接線路在終端上進(jìn)行統(tǒng)一播放，經(jīng)常有聽(tīng)不清楚的情形，尤其是多個(gè)人同時(shí)說(shuō)話的時(shí)候，一方面是由于電話線路有信號(hào)不好或者干擾等原因，另一方面是發(fā)言者距離麥克風(fēng)的距離不同導(dǎo)致拾入的信號(hào)強(qiáng)弱不齊，加上多個(gè)人的聲音同時(shí)響起，要讓對(duì)方聽(tīng)清楚非常困難，為了解決這個(gè)問(wèn)題，電話會(huì)議系統(tǒng)中，會(huì)議主持人經(jīng)常會(huì)讓單個(gè)人發(fā)言，但這顯然降低了效率。與現(xiàn)場(chǎng)會(huì)議不同，現(xiàn)場(chǎng)會(huì)議中每個(gè)人除了通過(guò)識(shí)別不同人的音調(diào)和音質(zhì)以外還可以通過(guò)聲音發(fā)出的方位判斷所要獲取的聲音信息，而對(duì)于電話會(huì)議，所有語(yǔ)音信息統(tǒng)一混音后，接收到該混音信息的終端通過(guò)揚(yáng)聲器對(duì)其進(jìn)行統(tǒng)一播放，因此難以聽(tīng)清其中聲音較小的語(yǔ)音信息，如果將混音放大，則只能將所有聲音同一放大，因此仍然難以分辨單個(gè)語(yǔ)音信息。

發(fā)明內(nèi)容
本申請(qǐng)實(shí)施例提供了一種音頻處理方法、終端設(shè)備及系統(tǒng)，以解決現(xiàn)有技術(shù)中難以分辨混音音頻中的單個(gè)語(yǔ)音信息，導(dǎo)致收聽(tīng)方分辨效果不佳的問(wèn)題。為了解決上述技術(shù)問(wèn)題，本申請(qǐng)實(shí)施例公開(kāi)了如下技術(shù)方案一種音頻處理方法，應(yīng)用于具有至少兩個(gè)音頻通道的第一終端設(shè)備中，所述第一終端設(shè)備與至少一個(gè)第二終端設(shè)備連通，所述方法包括接收所述至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l，所述混音音頻中包含混合在一起的至少兩個(gè)音頻信息；對(duì)所述混音音頻進(jìn)行分離，獲得所述混音音頻中的至少一個(gè)獨(dú)立的音頻信息；至少將分離出的一個(gè)所述獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。所述對(duì)混音音頻進(jìn)行分離包括獲取預(yù)先設(shè)置的分離矩陣，所述分離矩陣為由每個(gè)音頻信息的特征向量組成的矩陣；根據(jù)所述分離矩陣，通過(guò)快速獨(dú)立成分分析算法ICA從所述混音音頻中分離出獨(dú)立的音頻信息。所述對(duì)混音音頻進(jìn)行分離后還包括判斷分離出的每個(gè)獨(dú)立的音頻信息是否為噪音；根據(jù)判斷結(jié)果，將為噪音的音頻信息進(jìn)行過(guò)濾。還包括將分離出的多個(gè)獨(dú)立的音頻信息采用時(shí)分復(fù)用的方式通過(guò)少于所述音頻通道數(shù)量的揚(yáng)聲器進(jìn)行播放。
還包括獲取所述混音音頻的平均音量；根據(jù)所述平均音量調(diào)整通過(guò)所述一個(gè)音頻通道輸出的所述分離出的一個(gè)獨(dú)立的音頻信息的音量大小。還包括對(duì)所述分離出的一個(gè)所述獨(dú)立的音頻信息進(jìn)行聲紋檢測(cè)，獲得聲紋特征；分配用于輸出與所述聲紋特征對(duì)應(yīng)的音頻信息的音頻通道。一種終端設(shè)備，所述終端設(shè)備作為第一終端設(shè)備，與至少一個(gè)第二終端設(shè)備連通，所述第一終端設(shè)備具有至少兩個(gè)音頻通道，所述第一終端設(shè)備包括接收單元，用于接收所述至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l，所述混音音頻中包含混合在一起的至少兩個(gè)音頻信息；分離單元，用于對(duì)所述混音音頻進(jìn)行分離，獲得所述混音音頻中的至少一個(gè)獨(dú)立的音頻信息；輸出單元，用于至少將分離出的一個(gè)所述獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。所述分離單元包括矩陣獲取單元，用于獲取預(yù)先設(shè)置的分離矩陣，所述分離矩陣為由每個(gè)音頻信息的特征向量組成的矩陣；音頻分離單元，用于根據(jù)所述分離矩陣，通過(guò)快速獨(dú)立成分分析算法ICA從所述混音音頻中分離出獨(dú)立的音頻信息。還包括判斷單元，用于判斷分離出的每個(gè)獨(dú)立的音頻信息是否為噪音；過(guò)濾單元，用于根據(jù)所述判斷單元的判斷結(jié)果，將為噪音的音頻信息進(jìn)行過(guò)濾。還包括播放單元，用于將分離出的多個(gè)獨(dú)立的音頻信息采用時(shí)分復(fù)用的方式通過(guò)少于所述音頻通道數(shù)量的揚(yáng)聲器進(jìn)行播放。還包括獲取單元，用于獲取所述混音音頻的平均音量；調(diào)整單元，用于根據(jù)所述平均音量調(diào)整通過(guò)所述一個(gè)音頻通道輸出的所述分離出的一個(gè)獨(dú)立的音頻信息的音量大小。還包括檢測(cè)單元，用于對(duì)所述分離出的一個(gè)所述獨(dú)立的音頻信息進(jìn)行聲紋檢測(cè)，獲得聲紋特征；分配單元，用于分配用于輸出與所述聲紋特征對(duì)應(yīng)的音頻信息的音頻通道。一種音頻處理系統(tǒng)，包括第一終端設(shè)備和與所述第一終端設(shè)備連接的至少一個(gè)第二終端設(shè)備，所述第一終端設(shè)備具有至少兩個(gè)音頻通道，所述第一終端設(shè)備，用于接收所述至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l，所述混音音頻中包含混合在一起的至少兩個(gè)音頻信息，對(duì)所述混音音頻進(jìn)行分離，獲得所述混音音頻中的至少一個(gè)獨(dú)立的音頻信息，至少將分離出的一個(gè)所述獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。由上述實(shí)施例可以看出，本申請(qǐng)實(shí)施例中第一終端設(shè)備接收至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l，該混音音頻中包含混合在一起的至少兩個(gè)音頻信息，對(duì)混音音頻進(jìn)行分離，獲得混音音頻中的至少一個(gè)獨(dú)立的音頻信息，至少將分離出的一個(gè)獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。應(yīng)用本申請(qǐng)實(shí)施例，通過(guò)在終端設(shè)備上設(shè)置至少兩個(gè)音頻通道，以及對(duì)混音音頻進(jìn)行分離，可以實(shí)現(xiàn)將一個(gè)獨(dú)立的音頻信息通過(guò)一個(gè)獨(dú) 立的音頻通道進(jìn)行輸出播放，由此可以增加單個(gè)音頻信息的清晰度，便于用戶進(jìn)行分辨；進(jìn)一步，根據(jù)分離出的獨(dú)立音頻信息，可以對(duì)其進(jìn)行音量大小的調(diào)節(jié)，滿足用戶對(duì)不同音頻信息的收聽(tīng)需求；并且，雖然傳輸通道上設(shè)置了多個(gè)音頻通道，但是無(wú)需為每個(gè)音頻通道配置揚(yáng)聲器，而是采用時(shí)分復(fù)用方式共用揚(yáng)聲器，在保證獨(dú)立音頻信息可以清晰播放的同時(shí)，節(jié)約了硬件成本。

為了更清楚地說(shuō)明本申請(qǐng)實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案，下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹，顯而易見(jiàn)地，對(duì)于本領(lǐng)域普通技術(shù)人員而言，在不付出創(chuàng)造性勞動(dòng)性的前提下，還可以根據(jù)這些附圖獲得其他的附圖。圖I為本申請(qǐng)音頻處理方法的第一實(shí)施例流程圖；圖2A為本申請(qǐng)音頻處理方法的第二實(shí)施例流程圖；圖2B為圖2A中一種混音音頻分離的應(yīng)用場(chǎng)景示意圖；圖3為本申請(qǐng)首頻處理方法的第二實(shí)施例流程圖；圖4為本申請(qǐng)首頻處理方法實(shí)施例的一種應(yīng)用場(chǎng)景不意圖；圖5為本申請(qǐng)終端設(shè)備的第一實(shí)施例框圖；圖6為本申請(qǐng)終端設(shè)備的第二實(shí)施例框圖；圖7為本申請(qǐng)終端設(shè)備的第三實(shí)施例框圖；圖8為本申請(qǐng)終端設(shè)備的第四實(shí)施例框圖；圖9為本申請(qǐng)終端設(shè)備的第五實(shí)施例框圖；圖10為本申請(qǐng)語(yǔ)音處理系統(tǒng)的實(shí)施例框圖。
具體實(shí)施例方式本發(fā)明如下實(shí)施例提供了一種音頻處理方法、終端設(shè)備及系統(tǒng)。本發(fā)明實(shí)施例中的第一終端設(shè)備與至少一個(gè)第二終端設(shè)備連通，該第一終端設(shè)備具有至少兩個(gè)音頻通道。為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明實(shí)施例中的技術(shù)方案，并使本發(fā)明實(shí)施例的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂，下面結(jié)合附圖對(duì)本發(fā)明實(shí)施例中技術(shù)方案作進(jìn)一步詳細(xì)的說(shuō)明。參見(jiàn)圖1，為本申請(qǐng)音頻處理方法的第一實(shí)施例流程圖步驟101 :第一終端設(shè)備接收至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l，該混音音頻中包含混合在一起的至少兩個(gè)音頻信息。其中，第一終端設(shè)備作為音頻接收端，可以通過(guò)PSTN網(wǎng)絡(luò)或者IP網(wǎng)絡(luò)等與至少一個(gè)第二終端設(shè)備連通。第一終端設(shè)備與至少一個(gè)第二終端之間連通的情況包括當(dāng)?shù)谝唤K端設(shè)備連通一個(gè)第二終端設(shè)備時(shí)，該第二終端設(shè)備上可以設(shè)置一個(gè)麥克風(fēng)，通過(guò)該一個(gè)麥克風(fēng)接收多個(gè)用戶的語(yǔ)音音頻；或者，當(dāng)?shù)谝唤K端設(shè)備連通一個(gè)第二終端設(shè)備時(shí)，該第二終端上可以設(shè)置多個(gè)麥克風(fēng)，每個(gè)麥克風(fēng)接收一個(gè)用戶的語(yǔ)音音頻；或者，當(dāng)?shù)谝唤K端設(shè)備連通多個(gè)第二終端設(shè)備時(shí)，每一個(gè)第二終端設(shè)備上可以分別設(shè)置一個(gè)麥克風(fēng)，每個(gè)麥克風(fēng)接收一個(gè)用戶的語(yǔ)音音頻；或者，當(dāng)?shù)谝唤K端設(shè)備連通多個(gè)第二終端設(shè)備時(shí)，有的第二設(shè)備上·設(shè)置多個(gè)麥克風(fēng)，可以接收多個(gè)用戶的語(yǔ)音音頻，有的第二終端上設(shè)置一個(gè)麥克風(fēng)，可以接收一個(gè)用戶的語(yǔ)音音頻。第一終端設(shè)備上與網(wǎng)絡(luò)交換機(jī)之間通過(guò)一條傳輸通道連通，該傳輸通道可以具體為語(yǔ)音傳輸通道，無(wú)論連接多少第二終端設(shè)備，這些第二終端設(shè)備傳輸?shù)亩鄠€(gè)語(yǔ)音音頻通過(guò)網(wǎng)絡(luò)交換機(jī)進(jìn)行混合，生成一路混音音頻，該混音音頻通過(guò)該一條語(yǔ)音傳輸通道傳輸?shù)皆摰谝唤K端設(shè)備。對(duì)應(yīng)前述第一終端設(shè)備與至少一個(gè)第二終端之間連通的情況，第一終端設(shè)備接收到的混音音頻可以包括一個(gè)第二終端設(shè)備側(cè)同時(shí)有多個(gè)人說(shuō)話，所獲得的混音音頻；或者，多個(gè)第二終端設(shè)備側(cè)的每一個(gè)第二終端設(shè)備都有一個(gè)人說(shuō)話，所獲得的混音音頻；或者多個(gè)第二終端設(shè)備側(cè)，有的第二終端設(shè)備有一個(gè)人說(shuō)話，有的第二終端設(shè)備有多個(gè)人說(shuō)話，由此獲得的混音音頻。步驟102 :對(duì)混音音頻進(jìn)行分離，獲得混音音頻中的至少一個(gè)獨(dú)立的音頻信息。具體的，可以獲取預(yù)先設(shè)置的分離矩陣，所述分離矩陣為由每個(gè)音頻信息的特征向量組成的矩陣，根據(jù)所述分離矩陣，通過(guò)快速I(mǎi)CA (IndependentComponent Analysis,獨(dú)立成分分析)算法從所述混音音頻中分離出獨(dú)立的音頻信息。本實(shí)施例中，對(duì)混音音頻進(jìn)行分離后，可以對(duì)分離出的每一個(gè)獨(dú)立的音頻信息打上唯一識(shí)別該音頻信息的標(biāo)記，通過(guò)將該標(biāo)記與第一終端設(shè)備上的某個(gè)特定的音頻通道進(jìn)行匹配，由該音頻通道對(duì)該音頻信息進(jìn)行輸出。步驟103 :至少將分離出的一個(gè)獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。在分離出多個(gè)音頻信息的時(shí)候，可以根據(jù)第一終端設(shè)備上所具有音頻通道的數(shù)量對(duì)音頻信息進(jìn)行輸出，但至少保證有一個(gè)獨(dú)立的音頻信息可以通過(guò)一個(gè)音頻通道單獨(dú)輸出播放。當(dāng)分離出的音頻信息的數(shù)量小于音頻通道的數(shù)量的時(shí)候，可以根據(jù)用戶需要選擇與音頻通道數(shù)量一致或者小于音頻通道數(shù)量的音頻信息進(jìn)行播放；或者，也可以采用時(shí)分復(fù)用的方式使多個(gè)音頻信息通過(guò)一個(gè)音頻通道進(jìn)行輸出，例如，當(dāng)一個(gè)音頻通道在播放完一個(gè)音頻信息的空閑時(shí)刻，通過(guò)該音頻通道播放另一個(gè)音頻信息。另外，音頻通道輸出的音頻信息通過(guò)與該音頻通道相連的揚(yáng)聲器進(jìn)行播放，通?？梢詾槊總€(gè)音頻通道配置一個(gè)揚(yáng)聲器，但是處于節(jié)約成本的考慮，可以配置少于音頻通道數(shù)量的揚(yáng)聲器，此時(shí)分離出的多個(gè)獨(dú)立的音頻信息也可以采用時(shí)分復(fù)用的方式通過(guò)少于音頻通道數(shù)量的揚(yáng)聲器進(jìn)行播放。需要說(shuō)明的是，本實(shí)施例中采用的時(shí)分復(fù)用的方式，一般是指當(dāng)一個(gè)發(fā)言者結(jié)束一小段說(shuō)話段落后，其所用的揚(yáng)聲器可以被另外一個(gè)發(fā)言者使用，而不是兩個(gè)發(fā)言者同時(shí)使用一個(gè)揚(yáng)聲器。參見(jiàn)圖2A，為本申請(qǐng)音頻處理方法的第二實(shí)施例流程圖，該實(shí)施例示出了對(duì)混音音頻進(jìn)行分離和過(guò)濾的詳細(xì)處理過(guò)程步驟201 :第一終端設(shè)備接收至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l，該混音音頻中包含混合在一起的至少兩個(gè)音頻信息。其中，第一終端設(shè)備作為音頻接收端，可以通過(guò)PSTN網(wǎng)絡(luò)或者IP網(wǎng)絡(luò)等與至少一個(gè)第二終端設(shè)備連通。第一終端設(shè)備與至少一個(gè)第二終端之間連通的情況包括當(dāng)?shù)谝唤K端設(shè)備連通一個(gè)第二終端設(shè)備時(shí)，該第二終端設(shè)備上可以設(shè)置一個(gè)麥克風(fēng)，通過(guò)該一個(gè)麥克風(fēng)接收多個(gè)用戶的語(yǔ)音音頻；或者，當(dāng)?shù)谝唤K端設(shè)備連通一個(gè)第二終端設(shè)備時(shí)，該第二終端上可以設(shè)置多個(gè)麥克風(fēng)，每個(gè)麥克風(fēng)接收一個(gè)用戶的語(yǔ)音音頻；或者，當(dāng)?shù)谝唤K端設(shè)備連通多個(gè)第二終端設(shè)備時(shí)，每一個(gè)第二終端設(shè)備上可以分別設(shè)置一個(gè)麥克風(fēng)，每個(gè)麥克風(fēng)接收一個(gè)用戶的語(yǔ)音音頻；或者，當(dāng)?shù)谝唤K端設(shè)備連通多個(gè)第二終端設(shè)備時(shí)，有的第二設(shè)備上設(shè)置多個(gè)麥克風(fēng)，可以接收多個(gè)用戶的語(yǔ)音音頻，有的第二終端上設(shè)置一個(gè)麥克風(fēng)，可以接收一個(gè)用戶的語(yǔ)音音頻。第一終端設(shè)備上與網(wǎng)絡(luò)交換機(jī)之間通過(guò)一條傳輸通道連通，該傳輸通道可以具體為語(yǔ)音傳輸通道，無(wú)論連接多少第二終端設(shè)備，這些第二終端設(shè)備傳輸?shù)亩鄠€(gè)語(yǔ)音音頻通過(guò)網(wǎng)絡(luò)交換機(jī)進(jìn)行混合，生成一路混音音頻，該混音音頻通過(guò)該一條語(yǔ)音傳輸通道傳輸?shù)皆摰谝唤K端設(shè)備。對(duì)應(yīng)前述第一終端設(shè)備與至少一個(gè)第二終端之間連通的情況，第一終端設(shè)備接收到的混音音頻可以包括一個(gè)第二終端設(shè)備側(cè)同時(shí)有多個(gè)人說(shuō)話，所獲得的混音音頻；或者，多個(gè)第二終端設(shè)備側(cè)的每一個(gè)第二終端設(shè)備都有一個(gè)人說(shuō)話，所獲得的混音音頻；或者多個(gè)第二終端設(shè)備側(cè)，有的第二終端設(shè)備有一個(gè)人說(shuō)話，有的第二終端設(shè)備有多個(gè)人說(shuō)話，由此獲得的混音音頻。步驟202 :對(duì)混音音頻進(jìn)行分離，獲得混音音頻中的至少一個(gè)獨(dú)立的音頻信息。為了詳細(xì)描述本實(shí)施例中的混音音頻分離過(guò)程，下面結(jié)合圖2B所示的應(yīng)用場(chǎng)景進(jìn)行描述如下假設(shè)在一個(gè)會(huì)議場(chǎng)景中，vl和v2為兩個(gè)獨(dú)立的二維語(yǔ)音音頻輸入信號(hào)，ml和m2為兩個(gè)獨(dú)立的麥克風(fēng)，每個(gè)麥克風(fēng)收到的兩路語(yǔ)音音頻輸入信號(hào)二維隨機(jī)觀測(cè)信號(hào)。在這個(gè)實(shí)際的場(chǎng)景中，vl的聲音不僅會(huì)傳到ml，也會(huì)傳到m2，但是這兩個(gè)語(yǔ)音音頻輸入信號(hào)之間存在細(xì)微的區(qū)別，同樣的差別也發(fā)生在v2同時(shí)傳輸?shù)絤l和m2的情況。首先，可以在會(huì)議開(kāi)始前通過(guò)事先的學(xué)習(xí)訓(xùn)練，得到一個(gè)合適的H矩陣。即兩個(gè)發(fā)言人可以分別進(jìn)行自我介紹，相當(dāng)于先后輸入了 vl和v2，然后系統(tǒng)提取每個(gè)說(shuō)話人的音頻特征，具體可以使用幾秒長(zhǎng)度平穩(wěn)語(yǔ)音來(lái)進(jìn)行訓(xùn)練，然后根據(jù)MFCC Mel (Mel FrequencyCepstrum Coeff icient,頻率倒譜系數(shù))提取vl和v2的特征向量,然后用ICA的方式合并vl和v2得到矩陣H，H為2X2階滿秩混合矩陣。其次，在采用Fast ICA算法進(jìn)行混音音頻分離時(shí)，假設(shè)已經(jīng)去掉了音頻信號(hào)的均值,則ICA的線性混合模型可以表示為m = Hv = hlvl+hlvl+h2vl+h2v2,其中，h為v的特征向量，m為每個(gè)麥克風(fēng)接收到的vl和v2的混音音頻；則需要估計(jì)分離矩陣W，使得m通過(guò)W后的輸出為源信號(hào)的估計(jì)值y，即y(t)=Wm(t) = WHv (t) = Gv (t),其中G為全局矩陣,如果通過(guò)學(xué)習(xí)得到G = I,那么y(t) = v(t),也就是說(shuō)通過(guò)算法估計(jì)計(jì)算出來(lái)的信號(hào)y，可以還原出原始的聲音V。除了上述示出的采用Fast ICA算法進(jìn)行混音音頻分離外，作為一個(gè)特例，可以簡(jiǎn)單地將ml，m2中各個(gè)語(yǔ)音的到達(dá)時(shí)間作為提取特征，比如vl到達(dá)ml的距離短，時(shí)間短，因此可以根據(jù)這個(gè)特征，在ml中提取出vl ;簡(jiǎn)單來(lái)說(shuō)，就是在系統(tǒng)中分別比較vl，v2到達(dá)ml，m2的時(shí)間，然后進(jìn)行相減的計(jì)算。具體地，類(lèi)似于根據(jù)多個(gè)mic陣列消除噪音的原理，就是ml獲得相同語(yǔ)音分量的時(shí)間比m2早，那么可以將m2中收取的聲音作為ml的噪音，對(duì)其進(jìn)行去除，由此可以簡(jiǎn)單地得到vl和v2的分離信號(hào)。步驟203 :判斷分離出的每個(gè)獨(dú)立的音頻信息是否為噪音。作為噪音的音頻信息具有特定的音頻特征，將這些音頻特征作為噪音特征進(jìn)行保存，對(duì)于分離出的每個(gè)獨(dú)立的音頻信息，分別與保存的噪音特征進(jìn)行比對(duì)，當(dāng)匹配時(shí)，則確定音頻信息為噪音。步驟204 :根據(jù)判斷結(jié)果，將為噪音的音頻信息進(jìn)行過(guò)濾。步驟205 :至少將分離出的一個(gè)獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。在分離出多個(gè)音頻信息的時(shí)候，可以根據(jù)第一終端設(shè)備上所具有音頻通道的數(shù)量對(duì)音頻信息進(jìn)行輸出，但至少保證有一個(gè)獨(dú)立的音頻信息可以通過(guò)一個(gè)音頻通道單獨(dú)輸出播放。當(dāng)分離出的音頻信息的數(shù)量小于音頻通道的數(shù)量的時(shí)候，可以根據(jù)用戶需要選擇與音頻通道數(shù)量一致或者小于音頻通道數(shù)量的音頻信息進(jìn)行播放；或者，也可以采用時(shí)分復(fù)用的方式使多個(gè)音頻信息通過(guò)一個(gè)音頻通道進(jìn)行輸出，例如，當(dāng)一個(gè)音頻通道在播放完一個(gè)音頻信息的空閑時(shí)刻，通過(guò)該音頻通道播放另一個(gè)音頻信息。步驟206 :通過(guò)與該音頻通道相連的揚(yáng)聲器播放該獨(dú)立的音頻信息。音頻通道輸出的音頻信息通過(guò)與該音頻通道相連的揚(yáng)聲器進(jìn)行播放，通?？梢詾槊總€(gè)音頻通道配置一個(gè)揚(yáng)聲器，但是處于節(jié)約成本的考慮，可以配置少于音頻通道數(shù)量的揚(yáng)聲器，此時(shí)分離出的多個(gè)獨(dú)立的音頻信息也可以采用時(shí)分復(fù)用的方式通過(guò)少于音頻通道數(shù)量的揚(yáng)聲器進(jìn)行播放。需要說(shuō)明的是，本實(shí)施例中采用的時(shí)分復(fù)用的方式，一般是指當(dāng)一個(gè)發(fā)言者結(jié)束一小段說(shuō)話段落后，其所用的揚(yáng)聲器可以被另外一個(gè)發(fā)言者使用，而不是兩個(gè)發(fā)言者同時(shí)使用一個(gè)揚(yáng)聲器。參見(jiàn)圖3，為本申請(qǐng)音頻處理方法的第三實(shí)施例流程圖，該實(shí)施例是出了對(duì)分離出的獨(dú)立音頻信息分配音頻通道并進(jìn)行音量調(diào)整的過(guò)程步驟301 :第一終端設(shè)備接收所述至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l，該混音音頻中包含混合在一起的至少兩個(gè)音頻信息。其中，第一終端設(shè)備作為音頻接收端，可以通過(guò)PSTN網(wǎng)絡(luò)或者IP網(wǎng)絡(luò)等與至少一個(gè)第二終端設(shè)備連通。第一終端設(shè)備與至少一個(gè)第二終端之間連通的情況包括當(dāng)?shù)谝唤K端設(shè)備連通一個(gè)第二終端設(shè)備時(shí)，該第二終端設(shè)備上可以設(shè)置一個(gè)麥克風(fēng)，通過(guò)該一個(gè)麥克風(fēng)接收多個(gè)用戶的語(yǔ)音音頻；或者，當(dāng)?shù)谝唤K端設(shè)備連通一個(gè)第二終端設(shè)備時(shí)，該第二終端上可以設(shè)置多個(gè)麥克風(fēng)，每個(gè)麥克風(fēng)接收一個(gè)用戶的語(yǔ)音音頻；或者，當(dāng)?shù)谝唤K端設(shè)備連通多個(gè)第二終端設(shè)備時(shí)，每一個(gè)第二終端設(shè)備上可以分別設(shè)置一個(gè)麥克風(fēng)，每個(gè)麥克風(fēng)接收一個(gè)用戶的語(yǔ)音音頻；或者，當(dāng)?shù)谝唤K端設(shè)備連通多個(gè)第二終端設(shè)備時(shí)，有的第二設(shè)備上設(shè)置多個(gè)麥克風(fēng)，可以接收多個(gè)用戶的語(yǔ)音音頻，有的第二終端上設(shè)置一個(gè)麥克風(fēng)，可以接收一個(gè)用戶的語(yǔ)音音頻。第一終端設(shè)備上與網(wǎng)絡(luò)交換機(jī)之間通過(guò)一條傳輸通道連通，該傳輸通道可以具體為語(yǔ)音傳輸通道，無(wú)論連接多少第二終端設(shè)備，這些第二終端設(shè)備傳輸?shù)亩鄠€(gè)語(yǔ)音音頻通過(guò)網(wǎng)絡(luò)交換機(jī)進(jìn)行混合，生成一路混音音頻，該混音音頻通過(guò)該一條語(yǔ)音傳輸通道傳輸?shù)皆摰谝唤K端設(shè)備。對(duì)應(yīng)前述第一終端設(shè)備與至少一個(gè)第二終端之間連通的情況，第一終端設(shè)備接收到的混音音頻可以包括一個(gè)第二終端設(shè)備側(cè)同時(shí)有多個(gè)人說(shuō)話，所獲得的混音音頻；或者，多個(gè)第二終端設(shè)備側(cè)的每一個(gè)第二終端設(shè)備都有一個(gè)人說(shuō)話，所獲得的混音音頻；或者多個(gè)第二終端設(shè)備側(cè)，有的第二終端設(shè)備有一個(gè)人說(shuō)話，有的第二終端設(shè)備有多個(gè)人說(shuō)話，由此獲得的混音音頻。步驟302 :獲取混音音頻的平均音量，并記錄該平均音量。

步驟303 :對(duì)混音音頻進(jìn)行分離，獲得混音音頻中的至少一個(gè)獨(dú)立的音頻信息。具體的，可以獲取預(yù)先設(shè)置的分離矩陣，所述分離矩陣為由每個(gè)音頻信息的特征向量組成的矩陣，根據(jù)所述分離矩陣，通過(guò)快速I(mǎi)CA算法從混音音頻中分離出獨(dú)立的音頻信息。其中，當(dāng)應(yīng)用在會(huì)議場(chǎng)景時(shí)，可以在進(jìn)行會(huì)議前進(jìn)行語(yǔ)音訓(xùn)練，將提取的語(yǔ)音的聲紋特征通過(guò)網(wǎng)絡(luò)發(fā)送到音頻接收端，然后在音頻接收端根據(jù)語(yǔ)音的聲紋特征從混音音頻中分離出獨(dú)立的音頻信息；另外，也可以由各個(gè)音頻接收端在會(huì)議開(kāi)始前收集各個(gè)發(fā)言人的聲紋特征，然后進(jìn)行保存，然后在音頻接收端根據(jù)語(yǔ)音的聲紋特征從混音音頻中分離出獨(dú)立的音頻信息。在提取語(yǔ)音的聲紋特征時(shí)，可以對(duì)語(yǔ)音進(jìn)行分析獲得的特征包括頻譜、倒頻譜、共振峰、基音、反射系數(shù)等。步驟304 :對(duì)分離出的一個(gè)獨(dú)立的音頻信息進(jìn)行聲紋檢測(cè)，獲得聲紋特征。步驟305 :分配用于輸出與該聲紋特征對(duì)應(yīng)的音頻信息的音頻通道。步驟306 :根據(jù)記錄的平均音量調(diào)整通過(guò)所分配的音頻通道輸出的一個(gè)獨(dú)立的音頻信息的音量大小。步驟307 :通過(guò)與該音頻通道相連的揚(yáng)聲器播放該獨(dú)立的音頻信息。音頻通道輸出的音頻信息通過(guò)與該音頻通道相連的揚(yáng)聲器進(jìn)行播放，通?？梢詾槊總€(gè)音頻通道配置一個(gè)揚(yáng)聲器，但是處于節(jié)約成本的考慮，可以配置少于音頻通道數(shù)量的揚(yáng)聲器，此時(shí)分離出的多個(gè)獨(dú)立的音頻信息也可以采用時(shí)分復(fù)用的方式通過(guò)少于音頻通道數(shù)量的揚(yáng)聲器進(jìn)行播放。需要說(shuō)明的是，本實(shí)施例中采用的時(shí)分復(fù)用的方式，一般是指當(dāng)一個(gè)發(fā)言者結(jié)束一小段說(shuō)話段落后，其所用的揚(yáng)聲器可以被另外一個(gè)發(fā)言者使用，而不是兩個(gè)發(fā)言者同時(shí)使用一個(gè)揚(yáng)聲器。參見(jiàn)圖4,為本申請(qǐng)首頻處理方法實(shí)施例的一種應(yīng)用場(chǎng)景不意圖其中，終端設(shè)備I為音頻接收端，終端設(shè)備2和終端設(shè)備3為音頻發(fā)送端，上述三個(gè)終端設(shè)備可以通過(guò)圖4中示出的PSTN網(wǎng)絡(luò)交換機(jī)相連，另外，也可以通過(guò)IP網(wǎng)絡(luò)相連。每個(gè)終端設(shè)備與PSTN網(wǎng)絡(luò)交換機(jī)之間相連的傳輸通道為一條，因此當(dāng)有多個(gè)語(yǔ)音音頻需要傳輸時(shí)，該傳輸通道僅能傳輸多個(gè)語(yǔ)音音頻的混音。
假設(shè)終端設(shè)備2上有兩個(gè)麥克風(fēng)，分別為麥克風(fēng)I和麥克風(fēng)2，終端設(shè)備3上有一個(gè)麥克風(fēng)，為麥克風(fēng)3，此時(shí)用戶間通過(guò)三個(gè)終端設(shè)備進(jìn)行電話會(huì)議。其中，用戶I和用戶2在終端設(shè)備2上，分別使用麥克風(fēng)I和麥克風(fēng)2輸入語(yǔ)音，用戶3在終端設(shè)備3上使用麥克風(fēng)3輸入語(yǔ)音，上述三個(gè)語(yǔ)音傳輸?shù)絇STN網(wǎng)的交換機(jī)后，該交換機(jī)將三個(gè)語(yǔ)音進(jìn)行混合后，通過(guò)終端設(shè)備I與該P(yáng)STN交換機(jī)之間的傳輸通道將混音音頻傳輸?shù)浇K端設(shè)備I。終端設(shè)備I接收到混音音頻后，可以采用前述實(shí)施例中示出的音頻處理方法對(duì)混音音頻進(jìn)行分離。假設(shè)終端設(shè)備I上預(yù)先設(shè)置了兩個(gè)音頻通道，如圖4所示，每一個(gè)音頻通道連接一個(gè)揚(yáng)聲器，圖4中共不出兩個(gè)揚(yáng)聲器,分別為揚(yáng)聲器I和揚(yáng)聲器2。對(duì)于分離出對(duì)應(yīng)三個(gè)用戶的三個(gè)獨(dú)立的語(yǔ)音音頻，可以選擇性的進(jìn)行播放，例如，可以通過(guò)揚(yáng)聲器I輸出用戶I的語(yǔ)音音頻，通過(guò)揚(yáng)聲器2輸出用戶3的語(yǔ)音音頻，對(duì)于用戶2的語(yǔ)音音頻可以選擇不輸出，或者在用戶I和用戶3的語(yǔ)音音頻輸出完畢后，再單獨(dú)輸出，對(duì)此本申請(qǐng)實(shí)施例不進(jìn)行限制，只要保證可以通過(guò)一個(gè)音頻通道對(duì)應(yīng)的一個(gè)揚(yáng)聲器輸出并播放一個(gè)獨(dú)立的語(yǔ)音音頻即可。圖4中，對(duì)于每個(gè)揚(yáng)聲器輸出的語(yǔ)音音頻的音量大小可以單獨(dú)進(jìn)行調(diào)節(jié)；另外，也可以僅設(shè)置一個(gè)揚(yáng)聲器，通過(guò)時(shí)分復(fù)用的方式輸出獨(dú)立的語(yǔ)音音頻，以節(jié)省硬件成本。與本申請(qǐng)音頻處理方法的實(shí)施例相對(duì)應(yīng)，本申請(qǐng)還提供了終端設(shè)備和引用處理系統(tǒng)的實(shí)施例。其中，終端設(shè)備實(shí)施例中的終端設(shè)備均作為第一終端設(shè)備進(jìn)行描述，該第一終端設(shè)備與至少一個(gè)第二終端設(shè)備連通，該第一終端設(shè)備具有至少兩個(gè)音頻通道。參見(jiàn)圖5，為本申請(qǐng)終端設(shè)備的第一實(shí)施例框圖該終端設(shè)備包括接收單元510、分離單元520和輸出單元530。其中，接收單元510，用于接收所述至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l，所述混音音頻中包含混合在一起的至少兩個(gè)音頻信息；分離單元520，用于對(duì)所述混音音頻進(jìn)行分離，獲得所述混音音頻中的至少一個(gè)獨(dú)立的音頻信息；輸出單元530，用于至少將分離出的一個(gè)所述獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。參見(jiàn)圖6，為本申請(qǐng)終端設(shè)備的第二實(shí)施例框圖該終端設(shè)備包括接收單元610、分離單元620、判斷單元630、過(guò)濾單元640和輸出單元650。其中，接收單元610，用于接收所述至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l，所述混音音頻中包含混合在一起的至少兩個(gè)音頻信息；分離單元620，用于對(duì)所述混音音頻進(jìn)行分離，獲得所述混音音頻中的至少一個(gè)獨(dú)立的音頻信息；判斷單元630，用于判斷分離出的每個(gè)獨(dú)立的音頻信息是否為噪音；過(guò)濾單元640，用于根據(jù)所述判斷單元的判斷結(jié)果，將為噪音的音頻信息進(jìn)行過(guò)濾；輸出單元650，用于至少將分離出的一個(gè)所述獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。參見(jiàn)圖7，為本申請(qǐng)終端設(shè)備的第三實(shí)施例框圖
該終端設(shè)備包括接收單元710、分離單元720、輸出單元730和播放單元740。接收單元710，用于接收所述至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l，所述混音音頻中包含混合在一起的至少兩個(gè)音頻信息；分離單元720，用于對(duì)所述混音音頻進(jìn)行分離，獲得所述混音音頻中的至少一個(gè)獨(dú)立的音頻信息；輸出單元730，用于至少將分離出的一個(gè)所述獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出；播放單元740，用于將分離出的多個(gè)獨(dú)立的音頻信息采用時(shí)分復(fù)用的方式通過(guò)少于所述音頻通道數(shù)量的揚(yáng)聲器進(jìn)行播放。參見(jiàn)圖8，為本申請(qǐng)終端設(shè)備的第四實(shí)施例框圖
該終端設(shè)備包括接收單元810、獲取單元820、分離單元830、輸出單元840和調(diào)整單元850。接收單元810，用于接收所述至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l，所述混音音頻中包含混合在一起的至少兩個(gè)音頻信息；獲取單元820，用于獲取所述混音音頻的平均音量；分離單元830，用于對(duì)所述混音音頻進(jìn)行分離，獲得所述混音音頻中的至少一個(gè)獨(dú)立的音頻信息；輸出單元840，用于至少將分離出的一個(gè)所述獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出；調(diào)整單元850，用于根據(jù)所述平均音量調(diào)整通過(guò)所述一個(gè)音頻通道輸出的所述分離出的一個(gè)獨(dú)立的音頻信息的音量大小。參見(jiàn)圖9，為本申請(qǐng)終端設(shè)備的第五實(shí)施例框圖該終端設(shè)備包括接收單元910、分離單元920、檢測(cè)單元930、分配單元940和輸出單元950。其中，接收單元910，用于接收所述至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l，所述混音音頻中包含混合在一起的至少兩個(gè)音頻信息；分離單元920，用于對(duì)所述混音音頻進(jìn)行分離，獲得所述混音音頻中的至少一個(gè)獨(dú)立的音頻信息；檢測(cè)單元930，用于對(duì)所述分離出的一個(gè)獨(dú)立的音頻信息進(jìn)行聲紋檢測(cè)，獲得聲紋特征；分配單元940，用于分配用于輸出與所述聲紋特征對(duì)應(yīng)的音頻信息的音頻通道；輸出單元950，用于至少將分離出的一個(gè)所述獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。上述圖5至圖9示出的終端設(shè)備實(shí)施例中，分離單元可以包括(圖5至圖9中未具體示出)矩陣獲取單元，用于獲取預(yù)先設(shè)置的分離矩陣，所述分離矩陣為由每個(gè)音頻信息的特征向量組成的矩陣；音頻分離單元，用于根據(jù)所述分離矩陣，通過(guò)快速獨(dú)立成分分析算法ICA從所述混音音頻中分離出獨(dú)立的音頻信息。
參見(jiàn)圖10，為本申請(qǐng)音頻處理系統(tǒng)的實(shí)施例框圖該音頻處理系統(tǒng)包括第一終端設(shè)備1010和與所述第一終端設(shè)備連接的至少一個(gè)第二終端設(shè)備1020，所述第一終端設(shè)備具有至少兩個(gè)音頻通道。為了示例方便，圖10中僅示出兩個(gè)第二終端設(shè)備1020。其中，所述第一終端設(shè)備1010，用于接收所述至少一個(gè)第二終端設(shè)備1020通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l，所述混音音頻中包含混合在一起的至少兩個(gè)音頻信息，對(duì)所述混音音頻進(jìn)行分離，獲得所述混音音頻中的至少一個(gè)獨(dú)立的音頻信息，至少將分離出的一個(gè)所述獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。進(jìn)一步，所述第一終端設(shè)備1010，還用于判斷分離出的每個(gè)獨(dú)立的音頻信息是否為噪音，根據(jù)判斷結(jié)果，將為噪音的音頻信息進(jìn)行過(guò)濾。進(jìn)一步，所述第一終端設(shè)備1010，還用于將分離出的多個(gè)獨(dú)立的音頻信息采用時(shí)分復(fù)用的方式通過(guò)少于所述音頻通道數(shù)量的揚(yáng)聲器進(jìn)行播放。進(jìn)一步，所述第一終端設(shè)備1010，還用于獲取所述混音音頻的平均音量，根據(jù)所述平均音量調(diào)整通過(guò)所述一個(gè)音頻通道輸出的所述分離出的一個(gè)獨(dú)立的音頻信息的音量大小。進(jìn)一步，所述第一終端設(shè)備1010，還用于對(duì)所述分離出的一個(gè)所述獨(dú)立的音頻信息進(jìn)行聲紋檢測(cè)，獲得聲紋特征，分配用于輸出與所述聲紋特征對(duì)應(yīng)的音頻信息的音頻通道。通過(guò)對(duì)以上實(shí)施方式的描述可知，本申請(qǐng)實(shí)施例中第一終端設(shè)備接收至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l，該混音音頻中包含混合在一起的至少兩個(gè)音頻信息，對(duì)混音音頻進(jìn)行分離，獲得混音音頻中的至少一個(gè)獨(dú)立的音頻信息，至少將分離出的一個(gè)獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。應(yīng)用本申請(qǐng)實(shí)施例，通過(guò)在終端設(shè)備上設(shè)置至少兩個(gè)音頻通道，以及對(duì)混音音頻進(jìn)行分離，可以實(shí)現(xiàn)將一個(gè)獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道進(jìn)行輸出播放，由于多個(gè)音頻通道的輸出揚(yáng)聲器物理位置上分開(kāi)，使得用戶還可以獲取音頻來(lái)自不同的方位的信息，由此可以增加單個(gè)音頻信息的清晰度，便于用戶進(jìn)行分辨；進(jìn)一步，根據(jù)分離出的獨(dú)立音頻信息，可以對(duì)其進(jìn)行音量大小的調(diào)節(jié)，滿足用戶對(duì)不同音頻信息的收聽(tīng)需求；并且，雖然傳輸通道上設(shè)置了多個(gè)音頻通道，但是無(wú)需為每個(gè)音頻通道配置揚(yáng)聲器，而是采用時(shí)分復(fù)用方式共用揚(yáng)聲器，在保證獨(dú)立音頻信息可以清晰播放的同時(shí)，節(jié)約了硬件成本。本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明實(shí)施例中的技術(shù)可借助軟件加必需的通用硬件平臺(tái)的方式來(lái)實(shí)現(xiàn)。基于這樣的理解，本發(fā)明實(shí)施例中的技術(shù)方案本質(zhì)上或者說(shuō)對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái)，該計(jì)算機(jī)軟件產(chǎn)品可以存儲(chǔ)在存儲(chǔ)介質(zhì)中，如R0M/RAM、磁碟、光盤(pán)等，包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī)，服務(wù)器，或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例或者實(shí)施例的某些部分所述的方法。本說(shuō)明書(shū)中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述，各個(gè)實(shí)施例之間相同相似的部分互相參見(jiàn)即可，每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處。尤其，對(duì)于系統(tǒng)實(shí)施例而言，由于其基本相似于方法實(shí)施例，所以描述的比較簡(jiǎn)單，相關(guān)之處參見(jiàn)方法實(shí)施例的部分說(shuō)明即可。
以上所述的本發(fā)明實(shí)施方式，并不構(gòu)成對(duì)本發(fā)明保護(hù)范圍的限定。任何在本發(fā)明的精神和原則之內(nèi)所作的修改、等同替換和改進(jìn)等，均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)?！?br> 權(quán)利要求
1.一種音頻處理方法，其特征在于，應(yīng)用于具有至少兩個(gè)音頻通道的第一終端設(shè)備中，所述第一終端設(shè)備與至少一個(gè)第二終端設(shè)備連通，所述方法包括接收所述至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l，所述混音音頻中包含混合在一起的至少兩個(gè)音頻信息；對(duì)所述混音音頻進(jìn)行分離，獲得所述混音音頻中的至少一個(gè)獨(dú)立的音頻信息；至少將分離出的一個(gè)所述獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。
2.根據(jù)權(quán)利要求I所述的方法，其特征在于，所述對(duì)混音音頻進(jìn)行分離包括獲取預(yù)先設(shè)置的分離矩陣，所述分離矩陣為由每個(gè)音頻信息的特征向量組成的矩陣；根據(jù)所述分離矩陣，通過(guò)快速獨(dú)立成分分析算法ICA從所述混音音頻中分離出獨(dú)立的音頻信息。
3.根據(jù)權(quán)利要求I所述的方法，其特征在于，所述對(duì)混音音頻進(jìn)行分離后還包括判斷分離出的每個(gè)獨(dú)立的音頻信息是否為噪音；根據(jù)判斷結(jié)果，將為噪音的音頻信息進(jìn)行過(guò)濾。
4.根據(jù)權(quán)利要求I所述的方法，其特征在于，還包括將分離出的多個(gè)獨(dú)立的音頻信息采用時(shí)分復(fù)用的方式通過(guò)少于所述音頻通道數(shù)量的揚(yáng)聲器進(jìn)行播放。
5.根據(jù)權(quán)利要求I所述的方法，其特征在于，還包括獲取所述混音音頻的平均音量；根據(jù)所述平均音量調(diào)整通過(guò)所述一個(gè)音頻通道輸出的所述分離出的一個(gè)獨(dú)立的音頻信息的音量大小。
6.根據(jù)權(quán)利要求I所述的方法，其特征在于，還包括對(duì)所述分離出的一個(gè)所述獨(dú)立的音頻信息進(jìn)行聲紋檢測(cè)，獲得聲紋特征；分配用于輸出與所述聲紋特征對(duì)應(yīng)的音頻信息的音頻通道。
7.—種終端設(shè)備，其特征在于，所述終端設(shè)備作為第一終端設(shè)備，與至少一個(gè)第二終端設(shè)備連通，所述第一終端設(shè)備具有至少兩個(gè)音頻通道，所述第一終端設(shè)備包括接收單元，用于接收所述至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l，所述混音音頻中包含混合在一起的至少兩個(gè)音頻信息；分離單元，用于對(duì)所述混音音頻進(jìn)行分離，獲得所述混音音頻中的至少一個(gè)獨(dú)立的音頻信息；輸出單元，用于至少將分離出的一個(gè)所述獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。
8.根據(jù)權(quán)利要求7所述的終端設(shè)備，其特征在于，所述分離單元包括矩陣獲取單元，用于獲取預(yù)先設(shè)置的分離矩陣，所述分離矩陣為由每個(gè)音頻信息的特征向量組成的矩陣；音頻分離單元，用于根據(jù)所述分離矩陣，通過(guò)快速獨(dú)立成分分析算法ICA從所述混音音頻中分離出獨(dú)立的音頻信息。
9.根據(jù)權(quán)利要求7所述的終端設(shè)備，其特征在于，還包括判斷單元，用于判斷分離出的每個(gè)獨(dú)立的音頻信息是否為噪音；過(guò)濾單元，用于根據(jù)所述判斷單元的判斷結(jié)果，將為噪音的音頻信息進(jìn)行過(guò)濾。
10.根據(jù)權(quán)利要求7所述的終端設(shè)備，其特征在于，還包括播放單元，用于將分離出的多個(gè)獨(dú)立的音頻信息采用時(shí)分復(fù)用的方式通過(guò)少于所述音頻通道數(shù)量的揚(yáng)聲器進(jìn)行播放。
11.根據(jù)權(quán)利要求7所述的終端設(shè)備，其特征在于，還包括獲取單元，用于獲取所述混音音頻的平均音量；調(diào)整單元，用于根據(jù)所述平均音量調(diào)整通過(guò)所述一個(gè)音頻通道輸出的所述分離出的一個(gè)獨(dú)立的音頻信息的音量大小。
12.根據(jù)權(quán)利要求7所述的終端設(shè)備，其特征在于，還包括檢測(cè)單元，用于對(duì)所述分離出的一個(gè)所述獨(dú)立的音頻信息進(jìn)行聲紋檢測(cè)，獲得聲紋特征；分配單元，用于分配用于輸出與所述聲紋特征對(duì)應(yīng)的音頻信息的音頻通道。
13.一種音頻處理系統(tǒng)，其特征在于，包括第一終端設(shè)備和與所述第一終端設(shè)備連接的至少一個(gè)第二終端設(shè)備，所述第一終端設(shè)備具有至少兩個(gè)音頻通道，所述第一終端設(shè)備，用于接收所述至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l，所述混音音頻中包含混合在一起的至少兩個(gè)音頻信息，對(duì)所述混音音頻進(jìn)行分離，獲得所述混音音頻中的至少一個(gè)獨(dú)立的音頻信息，至少將分離出的一個(gè)所述獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。
全文摘要
本申請(qǐng)實(shí)施例公開(kāi)了一種音頻處理方法，應(yīng)用于具有至少兩個(gè)音頻通道的第一終端設(shè)備中，所述第一終端設(shè)備與至少一個(gè)第二終端設(shè)備連通，所述方法包括所述第一終端設(shè)備接收所述至少一個(gè)第二終端設(shè)備通過(guò)一條傳輸通道傳輸?shù)幕煲粢纛l，所述混音音頻中包含混合在一起的至少兩個(gè)音頻信息；對(duì)所述混音音頻進(jìn)行分離，獲得所述混音音頻中的至少一個(gè)獨(dú)立的音頻信息；至少將分離出的一個(gè)所述獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道輸出。應(yīng)用本申請(qǐng)實(shí)施例，通過(guò)在終端設(shè)備上設(shè)置至少兩個(gè)音頻通道，以及對(duì)混音音頻進(jìn)行分離，可以實(shí)現(xiàn)將一個(gè)獨(dú)立的音頻信息通過(guò)一個(gè)音頻通道進(jìn)行輸出播放，由此可以增加單個(gè)音頻信息的清晰度，便于用戶進(jìn)行分辨。
文檔編號(hào)G10L25/24GK102890936SQ20111020192
公開(kāi)日2013年1月23日申請(qǐng)日期2011年7月19日優(yōu)先權(quán)日2011年7月19日
發(fā)明者李眾慶申請(qǐng)人:聯(lián)想(北京)有限公司

完整全部詳細(xì)技術(shù)資料下載