基于麥克風(fēng)的音頻處理方法和裝置與流程

文檔序號(hào)：12864809閱讀：1315來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本發(fā)明涉及麥克風(fēng)技術(shù)領(lǐng)域，尤其涉及一種基于麥克風(fēng)的音頻處理方法和裝置。

背景技術(shù)：

在各類會(huì)議以及影視節(jié)目中，常常會(huì)需要使用到麥克風(fēng)，麥克風(fēng)可以收集聲音。進(jìn)而在各類會(huì)議以及影視節(jié)目中，可以將通過麥克風(fēng)采集到的聲音，進(jìn)行播放或者進(jìn)行語音識(shí)別等等處理。

現(xiàn)有技術(shù)中，每一個(gè)用戶可以單獨(dú)持有一個(gè)麥克風(fēng)，每一個(gè)麥克風(fēng)采集各自的音頻，進(jìn)而將一個(gè)麥克風(fēng)采集的音頻單獨(dú)生成一路音頻。從而可以區(qū)分出音頻是來自哪一個(gè)麥克風(fēng)，以及哪一個(gè)用戶的。

然而現(xiàn)有技術(shù)中，由于麥克風(fēng)都會(huì)同時(shí)開著進(jìn)行收音，當(dāng)麥克風(fēng)與其他麥克風(fēng)距離比較近的時(shí)候，當(dāng)前麥克風(fēng)需要采集的聲音也會(huì)進(jìn)入到其他麥克風(fēng)中，會(huì)造成串音現(xiàn)象，即發(fā)音人a對(duì)著麥克風(fēng)1說話時(shí)，發(fā)音人b的麥克風(fēng)2也能收到發(fā)聲人a的聲音。從而會(huì)造成一個(gè)用戶在說話，但是多個(gè)麥克風(fēng)都會(huì)采集到音頻，造成后續(xù)接收到的多個(gè)麥克風(fēng)所采集的音頻，進(jìn)而播放出的音頻是具有多路聲音的，并且不便于對(duì)具有多路聲音的音頻進(jìn)行語音識(shí)別等。

技術(shù)實(shí)現(xiàn)要素：

本發(fā)明提供一種基于麥克風(fēng)的音頻處理方法和裝置，用以解決現(xiàn)有技術(shù)中串音的時(shí)候，多個(gè)麥克風(fēng)都會(huì)采集到音頻，播放出的音頻是具有多路聲音的，并且不便于對(duì)具有多路聲音的音頻進(jìn)行語音識(shí)別的問題。

本發(fā)明的一方面是提供一種基于麥克風(fēng)的音頻處理方法，包括：

獲取每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻；

根據(jù)每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻，分別確定每一個(gè)麥克風(fēng)所采集的音頻的音頻變化量；

確定音頻變化量屬于預(yù)設(shè)范圍的音頻，為待進(jìn)行音頻處理的音頻。

進(jìn)一步地，每一個(gè)麥克風(fēng)的靈敏度相同，所述音頻變化量為音頻能量變化量，所述預(yù)設(shè)范圍為最大的音頻能量變化量；

所述根據(jù)每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻，分別確定每一個(gè)麥克風(fēng)所采集的音頻的音頻變化量，包括：

確定每一個(gè)麥克風(fēng)未采集音頻時(shí)的第一音頻能量，并在拾音過程中實(shí)時(shí)計(jì)算每一個(gè)麥克風(fēng)所采集的音頻的第二音頻能量；

確定每一個(gè)麥克風(fēng)的所述第二音頻能量與所述第一音頻能量的差值，得到每一個(gè)麥克風(fēng)所采集的音頻的所述音頻能量變化量。

進(jìn)一步地，每一個(gè)麥克風(fēng)的靈敏度不同，所述音頻變化量為音頻能量比例量，所述預(yù)設(shè)范圍為最大的音頻能量比例量；

所述根據(jù)每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻，分別確定每一個(gè)麥克風(fēng)所采集的音頻的音頻變化量，包括：

確定每一個(gè)麥克風(fēng)的所述第二音頻能量與所述第一音頻能量的比例值，得到每一個(gè)麥克風(fēng)所采集的音頻的所述音頻能量比例量。

進(jìn)一步地，所述確定音頻變化量屬于預(yù)設(shè)范圍的音頻，為待進(jìn)行音頻處理的音頻，包括：

確定音頻變化量屬于預(yù)設(shè)范圍的音頻的個(gè)數(shù)是否唯一；

若不唯一，則根據(jù)音頻變化量屬于預(yù)設(shè)范圍的各音頻分別一一對(duì)應(yīng)的麥克風(fēng)的優(yōu)先級(jí)，確定優(yōu)先級(jí)最高的麥克風(fēng)所采集的音頻為所述待進(jìn)行音頻處理的音頻；

若唯一，則確定音頻變化量屬于預(yù)設(shè)范圍的音頻，為所述待進(jìn)行音頻處理的音頻。

進(jìn)一步地，所述確定優(yōu)先級(jí)最高的麥克風(fēng)所采集的音頻為所述待進(jìn)行音頻處理的音頻，包括：

確定優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)是否唯一；

若不唯一，則根據(jù)優(yōu)先級(jí)最高的各麥克風(fēng)的排序，確定排序第一的麥克風(fēng)所采集的音頻為所述待進(jìn)行音頻處理的音頻；

若唯一，確定優(yōu)先級(jí)最高的麥克風(fēng)所采集的音頻，為所述待進(jìn)行音頻處理的音頻。

進(jìn)一步地，在所述確定音頻變化量屬于預(yù)設(shè)范圍的音頻，為待進(jìn)行音頻處理的音頻之后，還包括：

對(duì)所述待進(jìn)行音頻處理的音頻進(jìn)行語音識(shí)別處理，得到語音信息和/或文字信息；

或者，

只播放所述待進(jìn)行音頻處理的音頻。

本發(fā)明的另一方面是提供一種基于麥克風(fēng)的音頻處理裝置，包括：

獲取模塊，用于獲取每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻；

分析模塊，用于根據(jù)每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻，分別確定每一個(gè)麥克風(fēng)所采集的音頻的音頻變化量；

確定模塊，用于確定音頻變化量屬于預(yù)設(shè)范圍的音頻，為待進(jìn)行音頻處理的音頻。

進(jìn)一步地，每一個(gè)麥克風(fēng)的靈敏度相同，所述音頻變化量為音頻能量變化量，所述預(yù)設(shè)范圍為最大的音頻能量變化量；

所述分析模塊，具體用于：

確定每一個(gè)麥克風(fēng)的所述第二音頻能量與所述第一音頻能量的差值，得到每一個(gè)麥克風(fēng)所采集的音頻的所述音頻能量變化量。

進(jìn)一步地，每一個(gè)麥克風(fēng)的靈敏度不同，所述音頻變化量為音頻能量比例量，所述預(yù)設(shè)范圍為最大的音頻能量比例量；

所述分析模塊，具體用于：

確定每一個(gè)麥克風(fēng)的所述第二音頻能量與所述第一音頻能量的比例值，得到每一個(gè)麥克風(fēng)所采集的音頻的所述音頻能量比例量。

進(jìn)一步地，所述確定模塊，包括：

判斷子模塊，用于確定音頻變化量屬于預(yù)設(shè)范圍的音頻的個(gè)數(shù)是否唯一；

第一確定子模塊，用于若不唯一，則根據(jù)音頻變化量屬于預(yù)設(shè)范圍的各音頻分別一一對(duì)應(yīng)的麥克風(fēng)的優(yōu)先級(jí)，確定優(yōu)先級(jí)最高的麥克風(fēng)所采集的音頻為所述待進(jìn)行音頻處理的音頻；

第二確定子模塊，用于若唯一，則確定音頻變化量屬于預(yù)設(shè)范圍的音頻，為所述待進(jìn)行音頻處理的音頻。

進(jìn)一步地，所述第一確定子模塊，具體用于：

若音頻變化量屬于預(yù)設(shè)范圍的音頻的個(gè)數(shù)不唯一，則根據(jù)音頻變化量屬于預(yù)設(shè)范圍的各音頻分別一一對(duì)應(yīng)的麥克風(fēng)的優(yōu)先級(jí)，確定優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)是否唯一；

若優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)不唯一，則根據(jù)優(yōu)先級(jí)最高的各麥克風(fēng)的排序，確定排序第一的麥克風(fēng)所采集的音頻為所述待進(jìn)行音頻處理的音頻；

若優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)唯一，確定優(yōu)先級(jí)最高的麥克風(fēng)所采集的音頻，為所述待進(jìn)行音頻處理的音頻。

進(jìn)一步地，所述裝置，還包括：

處理模塊，用于在所述確定模塊確定音頻變化量屬于預(yù)設(shè)范圍的音頻，為待進(jìn)行音頻處理的音頻之后，對(duì)所述待進(jìn)行音頻處理的音頻進(jìn)行語音識(shí)別處理，得到語音信息和/或文字信息，或者，只播放所述待進(jìn)行音頻處理的音頻。

本發(fā)明的技術(shù)效果是：通過獲取每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻；根據(jù)每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻，分別確定每一個(gè)麥克風(fēng)所采集的音頻的音頻變化量；確定音頻變化量屬于預(yù)設(shè)范圍的音頻，為待進(jìn)行音頻處理的音頻。在多個(gè)麥克風(fēng)同時(shí)分別采集音頻的時(shí)候，可以對(duì)多個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻進(jìn)行分析，確定出后續(xù)需要進(jìn)行處理的音頻，進(jìn)而提取出一路音頻；從而在多個(gè)麥克風(fēng)同時(shí)開著進(jìn)行收音的時(shí)候，麥克風(fēng)發(fā)生串音時(shí)，對(duì)多個(gè)麥克風(fēng)所采集的音頻進(jìn)行分析，去確定出哪一個(gè)是當(dāng)前需要收音的麥克風(fēng)所采集的音頻，該音頻為待進(jìn)行音頻處理的音頻，然后可以對(duì)待進(jìn)行音頻處理的音頻進(jìn)行播放、語音識(shí)別等處理。并且，本實(shí)施例提供的方法也不需要調(diào)低麥克風(fēng)的靈敏度，因?yàn)檎{(diào)低麥克風(fēng)的靈敏度雖然可以在一定程度上減少串音，但是會(huì)使麥克風(fēng)的收音距離變短，使得收音效果變差，從而本實(shí)施例提供的方法不會(huì)影響麥克風(fēng)的收音效果，不影響語音采集質(zhì)量。

附圖說明

圖1為本發(fā)明實(shí)施例一提供的基于麥克風(fēng)的音頻處理方法的流程圖；

圖2為本發(fā)明實(shí)施例二提供的基于麥克風(fēng)的音頻處理方法的流程圖；

圖3為本發(fā)明實(shí)施例三提供的基于麥克風(fēng)的音頻處理裝置的結(jié)構(gòu)示意圖

圖4為本發(fā)明實(shí)施例四提供的基于麥克風(fēng)的音頻處理裝置的結(jié)構(gòu)示意圖。

具體實(shí)施方式

為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚，下面將結(jié)合本發(fā)明實(shí)施例中的附圖，對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述，顯然，所描述的實(shí)施例是本發(fā)明一部分實(shí)施例，而不是全部的實(shí)施例?；诒景l(fā)明中的實(shí)施例，本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例，都屬于本發(fā)明保護(hù)的范圍。

圖1為本發(fā)明實(shí)施例一提供的基于麥克風(fēng)的音頻處理方法的流程圖，如圖1所示，本實(shí)施例的方法，包括：

步驟101、獲取每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻。

在本實(shí)施例中，具體的，執(zhí)行主體可以為處理器、控制器或者其他可以執(zhí)行本實(shí)施例方法的裝置或設(shè)備等等。

在各類會(huì)議中，針對(duì)參與會(huì)議的每一個(gè)用戶會(huì)分別提供一個(gè)麥克風(fēng)，每一個(gè)麥克風(fēng)分別采集音頻?；蛘?，在影視節(jié)目中，針對(duì)參與節(jié)目錄制的每一個(gè)用戶會(huì)分別提供一個(gè)麥克風(fēng)，每一個(gè)麥克風(fēng)分別采集音頻?；蛘?，在庭審現(xiàn)場(chǎng)中，針對(duì)參與庭審的每一個(gè)用戶會(huì)分別提供一個(gè)麥克風(fēng)，每一個(gè)麥克風(fēng)分別采集音頻。在以上各場(chǎng)景中，每一個(gè)麥克風(fēng)需要單獨(dú)采集音頻。

然后可以去獲取到每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻。

舉例來說，在一個(gè)會(huì)議中，有5個(gè)需要發(fā)言的用戶，用戶a使用麥克風(fēng)1，用戶b使用麥克風(fēng)2，用戶c使用麥克風(fēng)3，用戶d使用麥克風(fēng)4，用戶e使用麥克風(fēng)5；進(jìn)而麥克風(fēng)1、2、3、4、5實(shí)時(shí)的分別采集音頻，可以獲取到麥克風(fēng)1、2、3、4、5實(shí)時(shí)的分別采集的音頻。

步驟102、根據(jù)每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻，分別確定每一個(gè)麥克風(fēng)所采集的音頻的音頻變化量。

在本實(shí)施例中，具體的，針對(duì)每一個(gè)麥克風(fēng)，對(duì)一個(gè)麥克風(fēng)所采集的音頻進(jìn)行計(jì)算，得到該麥克風(fēng)所采集的音頻的音頻變化量。例如，音頻變化量可以為音頻能量變化量、音頻能量比例量、音頻音量變化量等等。

步驟103、確定音頻變化量屬于預(yù)設(shè)范圍的音頻，為待進(jìn)行音頻處理的音頻。

在本實(shí)施例中，具體的，對(duì)各麥克風(fēng)所采集的音頻的音頻變化量進(jìn)行分析，確定出音頻變化量屬于預(yù)設(shè)范圍的音頻，然后將該音頻作為待進(jìn)行音頻處理的音頻。例如，音頻變化量為音頻能量變化量時(shí)，則確定出音頻能量變化量最大的音頻；音頻變化量為音頻能量比例量時(shí)，則確定出音頻能量比例量最大的音頻。

本實(shí)施例通過獲取每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻；根據(jù)每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻，分別確定每一個(gè)麥克風(fēng)所采集的音頻的音頻變化量；確定音頻變化量屬于預(yù)設(shè)范圍的音頻，為待進(jìn)行音頻處理的音頻。在多個(gè)麥克風(fēng)同時(shí)分別采集音頻的時(shí)候，可以對(duì)多個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻進(jìn)行分析，確定出后續(xù)需要進(jìn)行處理的音頻，進(jìn)而提取出一路音頻；從而在多個(gè)麥克風(fēng)同時(shí)開著進(jìn)行收音的時(shí)候，麥克風(fēng)發(fā)生串音時(shí)，對(duì)多個(gè)麥克風(fēng)所采集的音頻進(jìn)行分析，去確定出哪一個(gè)是當(dāng)前需要收音的麥克風(fēng)所采集的音頻，該音頻為待進(jìn)行音頻處理的音頻，然后可以對(duì)待進(jìn)行音頻處理的音頻進(jìn)行播放、語音識(shí)別等處理。并且，本實(shí)施例提供的方法也不需要調(diào)低麥克風(fēng)的靈敏度，因?yàn)檎{(diào)低麥克風(fēng)的靈敏度雖然可以在一定程度上減少串音，但是會(huì)使麥克風(fēng)的收音距離變短，使得收音效果變差，從而本實(shí)施例提供的方法不會(huì)影響麥克風(fēng)的收音效果，不影響語音采集質(zhì)量。

圖2為本發(fā)明實(shí)施例二提供的基于麥克風(fēng)的音頻處理方法的流程圖，如圖2所示，本實(shí)施例的方法，包括：

步驟201、獲取每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻。

在本實(shí)施例中，具體的，可以參見圖1的步驟101，不再贅述。

步驟202、根據(jù)每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻，分別確定每一個(gè)麥克風(fēng)所采集的音頻的音頻變化量。

步驟202包括了以下幾種實(shí)現(xiàn)方式。

第一種實(shí)現(xiàn)方式：每一個(gè)麥克風(fēng)的靈敏度相同，音頻變化量為音頻能量變化量；確定每一個(gè)麥克風(fēng)未采集音頻時(shí)的第一音頻能量，并在拾音過程中實(shí)時(shí)計(jì)算每一個(gè)麥克風(fēng)所采集的音頻的第二音頻能量；確定每一個(gè)麥克風(fēng)的第二音頻能量與第一音頻能量的差值，得到每一個(gè)麥克風(fēng)所采集的音頻的音頻能量變化量。

第二種實(shí)現(xiàn)方式：每一個(gè)麥克風(fēng)的靈敏度不同，音頻變化量為音頻能量比例量；確定每一個(gè)麥克風(fēng)未采集音頻時(shí)的第一音頻能量，并在拾音過程中實(shí)時(shí)計(jì)算每一個(gè)麥克風(fēng)所采集的音頻的第二音頻能量；確定每一個(gè)麥克風(fēng)的第二音頻能量與第一音頻能量的比例值，得到每一個(gè)麥克風(fēng)所采集的音頻的音頻能量比例量。

在本實(shí)施例中，具體的，針對(duì)每一個(gè)麥克風(fēng)，對(duì)一個(gè)麥克風(fēng)所采集的音頻進(jìn)行計(jì)算，得到該麥克風(fēng)所采集的音頻的音頻變化量。

在一種實(shí)現(xiàn)方式中，麥克風(fēng)的規(guī)格、型號(hào)相同，從而每一個(gè)麥克風(fēng)的靈敏度相同，或者，將麥克風(fēng)的靈敏度調(diào)成相同的數(shù)值，從而每一個(gè)麥克風(fēng)的靈敏度相同。針對(duì)每一個(gè)麥克風(fēng)，首先確定出麥克風(fēng)還沒有采集音頻時(shí)的第一音頻能量，這個(gè)時(shí)候，因?yàn)辂溈孙L(fēng)還沒有采集到音頻，直接根據(jù)麥克風(fēng)開著的時(shí)候所采集的聲音去計(jì)算第一音頻能量；然后，在麥克風(fēng)拾音過程中，實(shí)時(shí)計(jì)算麥克風(fēng)所采集的音頻的第二音頻能量。其中，計(jì)算音頻能量的時(shí)候，采用計(jì)算聲波的平均能流密度的方式計(jì)算出音頻能量，具體來說是用單位時(shí)間流經(jīng)某處單位面積介質(zhì)的能量的平均值的多少，來表示這個(gè)地方聲音的能量。然后，針對(duì)每一個(gè)麥克風(fēng)，可以將第二音頻能量減去第一音頻能量，得到第二音頻能量與第一音頻能量的差值，將該差值作為麥克風(fēng)所采集的音頻的音頻能量變化量。

在另一種實(shí)現(xiàn)方式中，麥克風(fēng)的規(guī)格、型號(hào)不同，從而每一個(gè)麥克風(fēng)的靈敏度不同。針對(duì)每一個(gè)麥克風(fēng)，首先確定出麥克風(fēng)還沒有采集音頻時(shí)的第一音頻能量，這個(gè)時(shí)候，因?yàn)辂溈孙L(fēng)還沒有采集到音頻，直接根據(jù)麥克風(fēng)開著的時(shí)候所采集的聲音去計(jì)算第一音頻能量；然后，在麥克風(fēng)拾音過程中，實(shí)時(shí)計(jì)算麥克風(fēng)所采集的音頻的第二音頻能量。其中，計(jì)算音頻能量的時(shí)候，采用計(jì)算聲波的平均能流密度的方式計(jì)算出音頻能量，具體來說是用單位時(shí)間流經(jīng)某處單位面積介質(zhì)的能量的平均值的多少，來表示這個(gè)地方聲音的能量。然后，針對(duì)每一個(gè)麥克風(fēng)，可以將第二音頻能量除以第一音頻能量，得到第二音頻能量與第一音頻能量的比例值，將該比例值作為麥克風(fēng)所采集的音頻的音頻能量比例量。

步驟203、確定音頻變化量屬于預(yù)設(shè)范圍的音頻，為待進(jìn)行音頻處理的音頻。

其中，在音頻變化量為音頻能量變化量時(shí)，預(yù)設(shè)范圍為最大的音頻能量變化量；在音頻變化量為音頻能量比例量時(shí)，預(yù)設(shè)范圍為最大的音頻能量比例量。

步驟203包括：

步驟2031、確定音頻變化量屬于預(yù)設(shè)范圍的音頻的個(gè)數(shù)是否唯一；

步驟2032、若不唯一，則根據(jù)音頻變化量屬于預(yù)設(shè)范圍的各音頻分別一一對(duì)應(yīng)的麥克風(fēng)的優(yōu)先級(jí)，確定優(yōu)先級(jí)最高的麥克風(fēng)所采集的音頻為待進(jìn)行音頻處理的音頻；

其中，步驟2032中，確定優(yōu)先級(jí)最高的麥克風(fēng)所采集的音頻為待進(jìn)行音頻處理的音頻，包括：確定優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)是否唯一；若不唯一，則根據(jù)優(yōu)先級(jí)最高的各麥克風(fēng)的排序，確定排序第一的麥克風(fēng)所采集的音頻為待進(jìn)行音頻處理的音頻；若唯一，確定優(yōu)先級(jí)最高的麥克風(fēng)所采集的音頻，為待進(jìn)行音頻處理的音頻。

步驟2033、若唯一，則確定音頻變化量屬于預(yù)設(shè)范圍的音頻，為待進(jìn)行音頻處理的音頻。

在本實(shí)施例中，具體的，在一種實(shí)現(xiàn)方式中，在音頻變化量為音頻能量變化量時(shí)，預(yù)設(shè)范圍為最大的音頻能量變化量；因?yàn)樵诎l(fā)生串音的時(shí)候，正對(duì)著麥克風(fēng)說話的發(fā)音人，其對(duì)應(yīng)的麥克風(fēng)里的聲音能量必定變化最大，而其它麥克風(fēng)聲音能量變化則較小；從而，可以選擇出音頻能量變化量最大的音頻，確定該音頻為有效的音頻數(shù)據(jù)，即為待進(jìn)行音頻處理的音頻。在這種實(shí)現(xiàn)方式中，具體來說，首先判斷音頻能量變化量最大的音頻的個(gè)數(shù)是否只有一個(gè)；如果音頻能量變化量最大的音頻的個(gè)數(shù)是一個(gè)，則直接將該音頻作為待進(jìn)行音頻處理的音頻；如果音頻能量變化量最大的音頻的個(gè)數(shù)有多個(gè)，因?yàn)橐呀?jīng)為每一個(gè)麥克風(fēng)分配了優(yōu)先級(jí)，那么可以查詢下音頻能量變化量最大的各音頻分別一一對(duì)應(yīng)的麥克風(fēng)的優(yōu)先級(jí)，然后判斷優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)是否唯一；若優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)是一個(gè)，那么就可以直接將優(yōu)先級(jí)最高的麥克風(fēng)所采集的音頻，作為待進(jìn)行音頻處理的音頻；如果優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)有多個(gè)，因?yàn)橐呀?jīng)為具有相同優(yōu)先級(jí)的麥克風(fēng)進(jìn)行排序，那么需要查詢優(yōu)先級(jí)最高的各麥克風(fēng)的排序，然后將排序第一的麥克風(fēng)所采集的音頻作為待進(jìn)行音頻處理的音頻。

在另一種實(shí)現(xiàn)方式中，在音頻變化量為音頻能量比例量時(shí)，預(yù)設(shè)范圍為最大的音頻能量比例量。從而，可以選擇出音頻能量比例量最大的音頻，確定該音頻為有效的音頻數(shù)據(jù)，即為待進(jìn)行音頻處理的音頻。在這種實(shí)現(xiàn)方式中，具體來說，首先判斷音頻能量比例量最大的音頻的個(gè)數(shù)是否只有一個(gè)；如果音頻能量比例量最大的音頻的個(gè)數(shù)是一個(gè)，則直接將該音頻作為待進(jìn)行音頻處理的音頻；如果音頻能量比例量最大的音頻的個(gè)數(shù)有多個(gè)，因?yàn)橐呀?jīng)為每一個(gè)麥克風(fēng)分配了優(yōu)先級(jí)，那么可以查詢下音頻能量比例量最大的各音頻分別一一對(duì)應(yīng)的麥克風(fēng)的優(yōu)先級(jí)，然后判斷優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)是否唯一；若優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)是一個(gè)，那么就可以直接將優(yōu)先級(jí)最高的麥克風(fēng)所采集的音頻，作為待進(jìn)行音頻處理的音頻；如果優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)有多個(gè)，因?yàn)橐呀?jīng)為具有相同優(yōu)先級(jí)的麥克風(fēng)進(jìn)行排序，那么需要查詢優(yōu)先級(jí)最高的各麥克風(fēng)的排序，然后將排序第一的麥克風(fēng)所采集的音頻作為待進(jìn)行音頻處理的音頻。

舉例來說，麥克風(fēng)1實(shí)時(shí)的采集到音頻a，麥克風(fēng)2實(shí)時(shí)的采集到音頻b，麥克風(fēng)3實(shí)時(shí)的采集到音頻c，麥克風(fēng)4實(shí)時(shí)的采集到音頻d，麥克風(fēng)5實(shí)時(shí)的采集到音頻e；然后計(jì)算出了音頻a的音頻能量變化量、音頻b的音頻能量變化量、音頻c的音頻能量變化量、音頻d的音頻能量變化量、音頻e的音頻能量變化量。然后如果確定各音頻能量變化量中最大的音頻能量變化量，是音頻a的音頻能量變化量，那么可以確定麥克風(fēng)1實(shí)時(shí)的采集到音頻a，為待進(jìn)行音頻處理的音頻。如果確定各音頻能量變化量中最大的音頻能量變化量，是音頻a的音頻能量變化量、音頻b的音頻能量變化量、音頻c的音頻能量變化量，因?yàn)樗鼈?個(gè)的變化量相同、且大于其他的音頻能量變化量；因?yàn)橐呀?jīng)為每一個(gè)麥克風(fēng)分配了優(yōu)先級(jí)，例如，第一優(yōu)先級(jí)包括了麥克風(fēng)1和麥克風(fēng)2，第一優(yōu)先級(jí)表征為當(dāng)前麥克風(fēng)為被分配給領(lǐng)導(dǎo)的麥克風(fēng)，第二優(yōu)先級(jí)包括了麥克風(fēng)3和麥克風(fēng)4，第二優(yōu)先級(jí)表征為當(dāng)前麥克風(fēng)為被分配給主持人的麥克風(fēng)，第三優(yōu)先級(jí)包括了麥克風(fēng)5，第三優(yōu)先級(jí)表征為當(dāng)前麥克風(fēng)為被分配給其他參與會(huì)議人員的麥克風(fēng)；則可以優(yōu)先級(jí)最高的麥克風(fēng)有麥克風(fēng)1和麥克風(fēng)2；然后，已經(jīng)為第一優(yōu)先級(jí)包括了麥克風(fēng)1和麥克風(fēng)2進(jìn)行排序，麥克風(fēng)2的次序大于麥克風(fēng)1的次序，那么就可以將麥克風(fēng)2采集的音頻b作為待進(jìn)行音頻處理的音頻。

步驟204、對(duì)待進(jìn)行音頻處理的音頻進(jìn)行語音識(shí)別處理，得到語音信息和/或文字信息；或者，只播放待進(jìn)行音頻處理的音頻。

在本實(shí)施例中，具體的，確定出了待進(jìn)行音頻處理的音頻之后，就可以認(rèn)為該音頻為正在發(fā)言的人所發(fā)出的聲音，然后屏蔽到不與該待進(jìn)行音頻處理的音頻對(duì)應(yīng)的麥克風(fēng)所采集到的音頻，只播放該待進(jìn)行音頻處理的音頻。

或者，確定出了待進(jìn)行音頻處理的音頻之后，就可以認(rèn)為該音頻為正在發(fā)言的人所發(fā)出的聲音，然后對(duì)該待進(jìn)行音頻處理的音頻進(jìn)行語音識(shí)別處理，得到語音信息，然后保存或播放該語音信息；或，進(jìn)行語音識(shí)別處理之后得到文字信息，在大屏幕上顯示文字信息；或進(jìn)行語音識(shí)別處理之后得到語音信息和文字信息，然后保存語音信息和文字信息，或顯示語音信息和文字信息。

本實(shí)施例通過獲取每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻；根據(jù)每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻，分別確定每一個(gè)麥克風(fēng)所采集的音頻的音頻變化量；確定音頻變化量屬于預(yù)設(shè)范圍的音頻，為待進(jìn)行音頻處理的音頻；其中，音頻變化量為音頻能量變化量或音頻能量比例量。在多個(gè)麥克風(fēng)同時(shí)分別采集音頻的時(shí)候，可以對(duì)多個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻進(jìn)行分析，確定出后續(xù)需要進(jìn)行處理的音頻，進(jìn)而提取出一路音頻；從而在多個(gè)麥克風(fēng)同時(shí)開著進(jìn)行收音的時(shí)候，麥克風(fēng)發(fā)生串音時(shí)，對(duì)多個(gè)麥克風(fēng)所采集的音頻進(jìn)行分析，去確定出哪一個(gè)是當(dāng)前需要收音的麥克風(fēng)所采集的音頻，該音頻為待進(jìn)行音頻處理的音頻，然后可以對(duì)待進(jìn)行音頻處理的音頻進(jìn)行播放、語音識(shí)別等處理。并且，本實(shí)施例提供的方法也不需要調(diào)低麥克風(fēng)的靈敏度，因?yàn)檎{(diào)低麥克風(fēng)的靈敏度雖然可以在一定程度上減少串音，但是會(huì)使麥克風(fēng)的收音距離變短，使得收音效果變差，從而本實(shí)施例提供的方法不會(huì)影響麥克風(fēng)的收音效果，不影響語音采集質(zhì)量。并且可以對(duì)待進(jìn)行音頻處理的音頻進(jìn)行語音識(shí)別處理，得到語音信息和/或文字信息。

圖3為本發(fā)明實(shí)施例三提供的基于麥克風(fēng)的音頻處理裝置的結(jié)構(gòu)示意圖，如圖3所示，本實(shí)施例的裝置，包括：

獲取模塊31，用于獲取每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻；

分析模塊32，用于根據(jù)每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻，分別確定每一個(gè)麥克風(fēng)所采集的音頻的音頻變化量；

確定模塊33，用于確定音頻變化量屬于預(yù)設(shè)范圍的音頻，為待進(jìn)行音頻處理的音頻。

本實(shí)施例提供的基于麥克風(fēng)的音頻處理裝置可執(zhí)行本發(fā)明實(shí)施例一提供的基于麥克風(fēng)的音頻處理方法，其實(shí)現(xiàn)原理相類似，此處不再贅述。

圖4為本發(fā)明實(shí)施例四提供的基于麥克風(fēng)的音頻處理裝置的結(jié)構(gòu)示意圖，在實(shí)施例三的基礎(chǔ)上，如圖4所示，本實(shí)施例的裝置，每一個(gè)麥克風(fēng)的靈敏度相同，音頻變化量為音頻能量變化量，預(yù)設(shè)范圍為最大的音頻能量變化量；分析模塊32，具體用于：

確定每一個(gè)麥克風(fēng)的第二音頻能量與第一音頻能量的差值，得到每一個(gè)麥克風(fēng)所采集的音頻的音頻能量變化量。

或者，每一個(gè)麥克風(fēng)的靈敏度不同，音頻變化量為音頻能量比例量，預(yù)設(shè)范圍為最大的音頻能量比例量；分析模塊32，具體用于：

確定每一個(gè)麥克風(fēng)的第二音頻能量與第一音頻能量的比例值，得到每一個(gè)麥克風(fēng)所采集的音頻的音頻能量比例量。

確定模塊33，包括：

判斷子模塊331，用于確定音頻變化量屬于預(yù)設(shè)范圍的音頻的個(gè)數(shù)是否唯一；

第一確定子模塊332，用于若不唯一，則根據(jù)音頻變化量屬于預(yù)設(shè)范圍的各音頻分別一一對(duì)應(yīng)的麥克風(fēng)的優(yōu)先級(jí)，確定優(yōu)先級(jí)最高的麥克風(fēng)所采集的音頻為待進(jìn)行音頻處理的音頻；

第二確定子模塊333，用于若唯一，則確定音頻變化量屬于預(yù)設(shè)范圍的音頻，為待進(jìn)行音頻處理的音頻。

其中，第一確定子模塊332，具體用于：

若優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)不唯一，則根據(jù)優(yōu)先級(jí)最高的各麥克風(fēng)的排序，確定排序第一的麥克風(fēng)所采集的音頻為待進(jìn)行音頻處理的音頻；

若優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)唯一，確定優(yōu)先級(jí)最高的麥克風(fēng)所采集的音頻，為待進(jìn)行音頻處理的音頻。

本實(shí)施例提供的裝置，還包括：

處理模塊41，用于在確定模塊33確定音頻變化量屬于預(yù)設(shè)范圍的音頻，為待進(jìn)行音頻處理的音頻之后，對(duì)待進(jìn)行音頻處理的音頻進(jìn)行語音識(shí)別處理，得到語音信息和/或文字信息，或者，只播放待進(jìn)行音頻處理的音頻。

本實(shí)施例提供的基于麥克風(fēng)的音頻處理裝置可執(zhí)行本發(fā)明實(shí)施例二提供的基于麥克風(fēng)的音頻處理方法，其實(shí)現(xiàn)原理相類似，此處不再贅述。

本實(shí)施例通過獲取每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻；根據(jù)每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻，分別確定每一個(gè)麥克風(fēng)所采集的音頻的音頻變化量；確定音頻變化量屬于預(yù)設(shè)范圍的音頻，為待進(jìn)行音頻處理的音頻；其中，音頻變化量為音頻能量變化量或音頻能量比例量。在多個(gè)麥克風(fēng)同時(shí)分別采集音頻的時(shí)候，可以對(duì)多個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻進(jìn)行分析，確定出后續(xù)需要進(jìn)行處理的音頻，進(jìn)而提取出一路音頻；從而在多個(gè)麥克風(fēng)同時(shí)開著進(jìn)行收音的時(shí)候，麥克風(fēng)發(fā)生串音時(shí)，對(duì)多個(gè)麥克風(fēng)所采集的音頻進(jìn)行分析，去確定出哪一個(gè)是當(dāng)前需要收音的麥克風(fēng)所采集的音頻，該音頻為待進(jìn)行音頻處理的音頻，然后可以對(duì)待進(jìn)行音頻處理的音頻進(jìn)行播放、語音識(shí)別等處理。并且，本實(shí)施例提供的方法也不需要調(diào)低麥克風(fēng)的靈敏度，因?yàn)檎{(diào)低麥克風(fēng)的靈敏度雖然可以在一定程度上減少串音，但是會(huì)使麥克風(fēng)的收音距離變短，使得收音效果變差，從而本實(shí)施例提供的方法不會(huì)影響麥克風(fēng)的收音效果，不影響語音采集質(zhì)量。并且可以對(duì)待進(jìn)行音頻處理的音頻進(jìn)行語音識(shí)別處理，得到語音信息和/或文字信息。

本領(lǐng)域普通技術(shù)人員可以理解：實(shí)現(xiàn)上述各方法實(shí)施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成。前述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。該程序在執(zhí)行時(shí)，執(zhí)行包括上述各方法實(shí)施例的步驟；而前述的存儲(chǔ)介質(zhì)包括：rom、ram、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。

最后應(yīng)說明的是：以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案，而非對(duì)其限制；盡管參照前述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說明，本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解：其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改，或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換；而這些修改或者替換，并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：黃大偉;李虹辰
技術(shù)所有人：北京中瑞智科技有限公司
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

雅蘭仕麥克風(fēng)使用方法相關(guān)技術(shù)

ps4麥克風(fēng)設(shè)置方法相關(guān)技術(shù)

win10麥克風(fēng)測(cè)試方法相關(guān)技術(shù)

麥克風(fēng)接藍(lán)牙音箱方法相關(guān)技術(shù)

途訊q7麥克風(fēng)使用方法相關(guān)技術(shù)

麥克風(fēng)測(cè)試方法相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于麥克風(fēng)的音頻處理方法和裝置與流程