本發(fā)明涉及麥克風(fēng)技術(shù)領(lǐng)域,尤其涉及一種基于麥克風(fēng)的音頻處理方法和裝置。
背景技術(shù):
在各類會(huì)議以及影視節(jié)目中,常常會(huì)需要使用到麥克風(fēng),麥克風(fēng)可以收集聲音。進(jìn)而在各類會(huì)議以及影視節(jié)目中,可以將通過麥克風(fēng)采集到的聲音,進(jìn)行播放或者進(jìn)行語音識(shí)別等等處理。
現(xiàn)有技術(shù)中,每一個(gè)用戶可以單獨(dú)持有一個(gè)麥克風(fēng),每一個(gè)麥克風(fēng)采集各自的音頻,進(jìn)而將一個(gè)麥克風(fēng)采集的音頻單獨(dú)生成一路音頻。從而可以區(qū)分出音頻是來自哪一個(gè)麥克風(fēng),以及哪一個(gè)用戶的。
然而現(xiàn)有技術(shù)中,由于麥克風(fēng)都會(huì)同時(shí)開著進(jìn)行收音,當(dāng)麥克風(fēng)與其他麥克風(fēng)距離比較近的時(shí)候,當(dāng)前麥克風(fēng)需要采集的聲音也會(huì)進(jìn)入到其他麥克風(fēng)中,會(huì)造成串音現(xiàn)象,即發(fā)音人a對(duì)著麥克風(fēng)1說話時(shí),發(fā)音人b的麥克風(fēng)2也能收到發(fā)聲人a的聲音。從而會(huì)造成一個(gè)用戶在說話,但是多個(gè)麥克風(fēng)都會(huì)采集到音頻,造成后續(xù)接收到的多個(gè)麥克風(fēng)所采集的音頻,進(jìn)而播放出的音頻是具有多路聲音的,并且不便于對(duì)具有多路聲音的音頻進(jìn)行語音識(shí)別等。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供一種基于麥克風(fēng)的音頻處理方法和裝置,用以解決現(xiàn)有技術(shù)中串音的時(shí)候,多個(gè)麥克風(fēng)都會(huì)采集到音頻,播放出的音頻是具有多路聲音的,并且不便于對(duì)具有多路聲音的音頻進(jìn)行語音識(shí)別的問題。
本發(fā)明的一方面是提供一種基于麥克風(fēng)的音頻處理方法,包括:
獲取每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻;
根據(jù)每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻,分別確定每一個(gè)麥克風(fēng)所采集的音頻的音頻變化量;
確定音頻變化量屬于預(yù)設(shè)范圍的音頻,為待進(jìn)行音頻處理的音頻。
進(jìn)一步地,每一個(gè)麥克風(fēng)的靈敏度相同,所述音頻變化量為音頻能量變化量,所述預(yù)設(shè)范圍為最大的音頻能量變化量;
所述根據(jù)每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻,分別確定每一個(gè)麥克風(fēng)所采集的音頻的音頻變化量,包括:
確定每一個(gè)麥克風(fēng)未采集音頻時(shí)的第一音頻能量,并在拾音過程中實(shí)時(shí)計(jì)算每一個(gè)麥克風(fēng)所采集的音頻的第二音頻能量;
確定每一個(gè)麥克風(fēng)的所述第二音頻能量與所述第一音頻能量的差值,得到每一個(gè)麥克風(fēng)所采集的音頻的所述音頻能量變化量。
進(jìn)一步地,每一個(gè)麥克風(fēng)的靈敏度不同,所述音頻變化量為音頻能量比例量,所述預(yù)設(shè)范圍為最大的音頻能量比例量;
所述根據(jù)每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻,分別確定每一個(gè)麥克風(fēng)所采集的音頻的音頻變化量,包括:
確定每一個(gè)麥克風(fēng)未采集音頻時(shí)的第一音頻能量,并在拾音過程中實(shí)時(shí)計(jì)算每一個(gè)麥克風(fēng)所采集的音頻的第二音頻能量;
確定每一個(gè)麥克風(fēng)的所述第二音頻能量與所述第一音頻能量的比例值,得到每一個(gè)麥克風(fēng)所采集的音頻的所述音頻能量比例量。
進(jìn)一步地,所述確定音頻變化量屬于預(yù)設(shè)范圍的音頻,為待進(jìn)行音頻處理的音頻,包括:
確定音頻變化量屬于預(yù)設(shè)范圍的音頻的個(gè)數(shù)是否唯一;
若不唯一,則根據(jù)音頻變化量屬于預(yù)設(shè)范圍的各音頻分別一一對(duì)應(yīng)的麥克風(fēng)的優(yōu)先級(jí),確定優(yōu)先級(jí)最高的麥克風(fēng)所采集的音頻為所述待進(jìn)行音頻處理的音頻;
若唯一,則確定音頻變化量屬于預(yù)設(shè)范圍的音頻,為所述待進(jìn)行音頻處理的音頻。
進(jìn)一步地,所述確定優(yōu)先級(jí)最高的麥克風(fēng)所采集的音頻為所述待進(jìn)行音頻處理的音頻,包括:
確定優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)是否唯一;
若不唯一,則根據(jù)優(yōu)先級(jí)最高的各麥克風(fēng)的排序,確定排序第一的麥克風(fēng)所采集的音頻為所述待進(jìn)行音頻處理的音頻;
若唯一,確定優(yōu)先級(jí)最高的麥克風(fēng)所采集的音頻,為所述待進(jìn)行音頻處理的音頻。
進(jìn)一步地,在所述確定音頻變化量屬于預(yù)設(shè)范圍的音頻,為待進(jìn)行音頻處理的音頻之后,還包括:
對(duì)所述待進(jìn)行音頻處理的音頻進(jìn)行語音識(shí)別處理,得到語音信息和/或文字信息;
或者,
只播放所述待進(jìn)行音頻處理的音頻。
本發(fā)明的另一方面是提供一種基于麥克風(fēng)的音頻處理裝置,包括:
獲取模塊,用于獲取每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻;
分析模塊,用于根據(jù)每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻,分別確定每一個(gè)麥克風(fēng)所采集的音頻的音頻變化量;
確定模塊,用于確定音頻變化量屬于預(yù)設(shè)范圍的音頻,為待進(jìn)行音頻處理的音頻。
進(jìn)一步地,每一個(gè)麥克風(fēng)的靈敏度相同,所述音頻變化量為音頻能量變化量,所述預(yù)設(shè)范圍為最大的音頻能量變化量;
所述分析模塊,具體用于:
確定每一個(gè)麥克風(fēng)未采集音頻時(shí)的第一音頻能量,并在拾音過程中實(shí)時(shí)計(jì)算每一個(gè)麥克風(fēng)所采集的音頻的第二音頻能量;
確定每一個(gè)麥克風(fēng)的所述第二音頻能量與所述第一音頻能量的差值,得到每一個(gè)麥克風(fēng)所采集的音頻的所述音頻能量變化量。
進(jìn)一步地,每一個(gè)麥克風(fēng)的靈敏度不同,所述音頻變化量為音頻能量比例量,所述預(yù)設(shè)范圍為最大的音頻能量比例量;
所述分析模塊,具體用于:
確定每一個(gè)麥克風(fēng)未采集音頻時(shí)的第一音頻能量,并在拾音過程中實(shí)時(shí)計(jì)算每一個(gè)麥克風(fēng)所采集的音頻的第二音頻能量;
確定每一個(gè)麥克風(fēng)的所述第二音頻能量與所述第一音頻能量的比例值,得到每一個(gè)麥克風(fēng)所采集的音頻的所述音頻能量比例量。
進(jìn)一步地,所述確定模塊,包括:
判斷子模塊,用于確定音頻變化量屬于預(yù)設(shè)范圍的音頻的個(gè)數(shù)是否唯一;
第一確定子模塊,用于若不唯一,則根據(jù)音頻變化量屬于預(yù)設(shè)范圍的各音頻分別一一對(duì)應(yīng)的麥克風(fēng)的優(yōu)先級(jí),確定優(yōu)先級(jí)最高的麥克風(fēng)所采集的音頻為所述待進(jìn)行音頻處理的音頻;
第二確定子模塊,用于若唯一,則確定音頻變化量屬于預(yù)設(shè)范圍的音頻,為所述待進(jìn)行音頻處理的音頻。
進(jìn)一步地,所述第一確定子模塊,具體用于:
若音頻變化量屬于預(yù)設(shè)范圍的音頻的個(gè)數(shù)不唯一,則根據(jù)音頻變化量屬于預(yù)設(shè)范圍的各音頻分別一一對(duì)應(yīng)的麥克風(fēng)的優(yōu)先級(jí),確定優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)是否唯一;
若優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)不唯一,則根據(jù)優(yōu)先級(jí)最高的各麥克風(fēng)的排序,確定排序第一的麥克風(fēng)所采集的音頻為所述待進(jìn)行音頻處理的音頻;
若優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)唯一,確定優(yōu)先級(jí)最高的麥克風(fēng)所采集的音頻,為所述待進(jìn)行音頻處理的音頻。
進(jìn)一步地,所述裝置,還包括:
處理模塊,用于在所述確定模塊確定音頻變化量屬于預(yù)設(shè)范圍的音頻,為待進(jìn)行音頻處理的音頻之后,對(duì)所述待進(jìn)行音頻處理的音頻進(jìn)行語音識(shí)別處理,得到語音信息和/或文字信息,或者,只播放所述待進(jìn)行音頻處理的音頻。
本發(fā)明的技術(shù)效果是:通過獲取每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻;根據(jù)每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻,分別確定每一個(gè)麥克風(fēng)所采集的音頻的音頻變化量;確定音頻變化量屬于預(yù)設(shè)范圍的音頻,為待進(jìn)行音頻處理的音頻。在多個(gè)麥克風(fēng)同時(shí)分別采集音頻的時(shí)候,可以對(duì)多個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻進(jìn)行分析,確定出后續(xù)需要進(jìn)行處理的音頻,進(jìn)而提取出一路音頻;從而在多個(gè)麥克風(fēng)同時(shí)開著進(jìn)行收音的時(shí)候,麥克風(fēng)發(fā)生串音時(shí),對(duì)多個(gè)麥克風(fēng)所采集的音頻進(jìn)行分析,去確定出哪一個(gè)是當(dāng)前需要收音的麥克風(fēng)所采集的音頻,該音頻為待進(jìn)行音頻處理的音頻,然后可以對(duì)待進(jìn)行音頻處理的音頻進(jìn)行播放、語音識(shí)別等處理。并且,本實(shí)施例提供的方法也不需要調(diào)低麥克風(fēng)的靈敏度,因?yàn)檎{(diào)低麥克風(fēng)的靈敏度雖然可以在一定程度上減少串音,但是會(huì)使麥克風(fēng)的收音距離變短,使得收音效果變差,從而本實(shí)施例提供的方法不會(huì)影響麥克風(fēng)的收音效果,不影響語音采集質(zhì)量。
附圖說明
圖1為本發(fā)明實(shí)施例一提供的基于麥克風(fēng)的音頻處理方法的流程圖;
圖2為本發(fā)明實(shí)施例二提供的基于麥克風(fēng)的音頻處理方法的流程圖;
圖3為本發(fā)明實(shí)施例三提供的基于麥克風(fēng)的音頻處理裝置的結(jié)構(gòu)示意圖
圖4為本發(fā)明實(shí)施例四提供的基于麥克風(fēng)的音頻處理裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
圖1為本發(fā)明實(shí)施例一提供的基于麥克風(fēng)的音頻處理方法的流程圖,如圖1所示,本實(shí)施例的方法,包括:
步驟101、獲取每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻。
在本實(shí)施例中,具體的,執(zhí)行主體可以為處理器、控制器或者其他可以執(zhí)行本實(shí)施例方法的裝置或設(shè)備等等。
在各類會(huì)議中,針對(duì)參與會(huì)議的每一個(gè)用戶會(huì)分別提供一個(gè)麥克風(fēng),每一個(gè)麥克風(fēng)分別采集音頻?;蛘?,在影視節(jié)目中,針對(duì)參與節(jié)目錄制的每一個(gè)用戶會(huì)分別提供一個(gè)麥克風(fēng),每一個(gè)麥克風(fēng)分別采集音頻?;蛘?,在庭審現(xiàn)場(chǎng)中,針對(duì)參與庭審的每一個(gè)用戶會(huì)分別提供一個(gè)麥克風(fēng),每一個(gè)麥克風(fēng)分別采集音頻。在以上各場(chǎng)景中,每一個(gè)麥克風(fēng)需要單獨(dú)采集音頻。
然后可以去獲取到每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻。
舉例來說,在一個(gè)會(huì)議中,有5個(gè)需要發(fā)言的用戶,用戶a使用麥克風(fēng)1,用戶b使用麥克風(fēng)2,用戶c使用麥克風(fēng)3,用戶d使用麥克風(fēng)4,用戶e使用麥克風(fēng)5;進(jìn)而麥克風(fēng)1、2、3、4、5實(shí)時(shí)的分別采集音頻,可以獲取到麥克風(fēng)1、2、3、4、5實(shí)時(shí)的分別采集的音頻。
步驟102、根據(jù)每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻,分別確定每一個(gè)麥克風(fēng)所采集的音頻的音頻變化量。
在本實(shí)施例中,具體的,針對(duì)每一個(gè)麥克風(fēng),對(duì)一個(gè)麥克風(fēng)所采集的音頻進(jìn)行計(jì)算,得到該麥克風(fēng)所采集的音頻的音頻變化量。例如,音頻變化量可以為音頻能量變化量、音頻能量比例量、音頻音量變化量等等。
步驟103、確定音頻變化量屬于預(yù)設(shè)范圍的音頻,為待進(jìn)行音頻處理的音頻。
在本實(shí)施例中,具體的,對(duì)各麥克風(fēng)所采集的音頻的音頻變化量進(jìn)行分析,確定出音頻變化量屬于預(yù)設(shè)范圍的音頻,然后將該音頻作為待進(jìn)行音頻處理的音頻。例如,音頻變化量為音頻能量變化量時(shí),則確定出音頻能量變化量最大的音頻;音頻變化量為音頻能量比例量時(shí),則確定出音頻能量比例量最大的音頻。
本實(shí)施例通過獲取每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻;根據(jù)每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻,分別確定每一個(gè)麥克風(fēng)所采集的音頻的音頻變化量;確定音頻變化量屬于預(yù)設(shè)范圍的音頻,為待進(jìn)行音頻處理的音頻。在多個(gè)麥克風(fēng)同時(shí)分別采集音頻的時(shí)候,可以對(duì)多個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻進(jìn)行分析,確定出后續(xù)需要進(jìn)行處理的音頻,進(jìn)而提取出一路音頻;從而在多個(gè)麥克風(fēng)同時(shí)開著進(jìn)行收音的時(shí)候,麥克風(fēng)發(fā)生串音時(shí),對(duì)多個(gè)麥克風(fēng)所采集的音頻進(jìn)行分析,去確定出哪一個(gè)是當(dāng)前需要收音的麥克風(fēng)所采集的音頻,該音頻為待進(jìn)行音頻處理的音頻,然后可以對(duì)待進(jìn)行音頻處理的音頻進(jìn)行播放、語音識(shí)別等處理。并且,本實(shí)施例提供的方法也不需要調(diào)低麥克風(fēng)的靈敏度,因?yàn)檎{(diào)低麥克風(fēng)的靈敏度雖然可以在一定程度上減少串音,但是會(huì)使麥克風(fēng)的收音距離變短,使得收音效果變差,從而本實(shí)施例提供的方法不會(huì)影響麥克風(fēng)的收音效果,不影響語音采集質(zhì)量。
圖2為本發(fā)明實(shí)施例二提供的基于麥克風(fēng)的音頻處理方法的流程圖,如圖2所示,本實(shí)施例的方法,包括:
步驟201、獲取每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻。
在本實(shí)施例中,具體的,可以參見圖1的步驟101,不再贅述。
步驟202、根據(jù)每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻,分別確定每一個(gè)麥克風(fēng)所采集的音頻的音頻變化量。
步驟202包括了以下幾種實(shí)現(xiàn)方式。
第一種實(shí)現(xiàn)方式:每一個(gè)麥克風(fēng)的靈敏度相同,音頻變化量為音頻能量變化量;確定每一個(gè)麥克風(fēng)未采集音頻時(shí)的第一音頻能量,并在拾音過程中實(shí)時(shí)計(jì)算每一個(gè)麥克風(fēng)所采集的音頻的第二音頻能量;確定每一個(gè)麥克風(fēng)的第二音頻能量與第一音頻能量的差值,得到每一個(gè)麥克風(fēng)所采集的音頻的音頻能量變化量。
第二種實(shí)現(xiàn)方式:每一個(gè)麥克風(fēng)的靈敏度不同,音頻變化量為音頻能量比例量;確定每一個(gè)麥克風(fēng)未采集音頻時(shí)的第一音頻能量,并在拾音過程中實(shí)時(shí)計(jì)算每一個(gè)麥克風(fēng)所采集的音頻的第二音頻能量;確定每一個(gè)麥克風(fēng)的第二音頻能量與第一音頻能量的比例值,得到每一個(gè)麥克風(fēng)所采集的音頻的音頻能量比例量。
在本實(shí)施例中,具體的,針對(duì)每一個(gè)麥克風(fēng),對(duì)一個(gè)麥克風(fēng)所采集的音頻進(jìn)行計(jì)算,得到該麥克風(fēng)所采集的音頻的音頻變化量。
在一種實(shí)現(xiàn)方式中,麥克風(fēng)的規(guī)格、型號(hào)相同,從而每一個(gè)麥克風(fēng)的靈敏度相同,或者,將麥克風(fēng)的靈敏度調(diào)成相同的數(shù)值,從而每一個(gè)麥克風(fēng)的靈敏度相同。針對(duì)每一個(gè)麥克風(fēng),首先確定出麥克風(fēng)還沒有采集音頻時(shí)的第一音頻能量,這個(gè)時(shí)候,因?yàn)辂溈孙L(fēng)還沒有采集到音頻,直接根據(jù)麥克風(fēng)開著的時(shí)候所采集的聲音去計(jì)算第一音頻能量;然后,在麥克風(fēng)拾音過程中,實(shí)時(shí)計(jì)算麥克風(fēng)所采集的音頻的第二音頻能量。其中,計(jì)算音頻能量的時(shí)候,采用計(jì)算聲波的平均能流密度的方式計(jì)算出音頻能量,具體來說是用單位時(shí)間流經(jīng)某處單位面積介質(zhì)的能量的平均值的多少,來表示這個(gè)地方聲音的能量。然后,針對(duì)每一個(gè)麥克風(fēng),可以將第二音頻能量減去第一音頻能量,得到第二音頻能量與第一音頻能量的差值,將該差值作為麥克風(fēng)所采集的音頻的音頻能量變化量。
在另一種實(shí)現(xiàn)方式中,麥克風(fēng)的規(guī)格、型號(hào)不同,從而每一個(gè)麥克風(fēng)的靈敏度不同。針對(duì)每一個(gè)麥克風(fēng),首先確定出麥克風(fēng)還沒有采集音頻時(shí)的第一音頻能量,這個(gè)時(shí)候,因?yàn)辂溈孙L(fēng)還沒有采集到音頻,直接根據(jù)麥克風(fēng)開著的時(shí)候所采集的聲音去計(jì)算第一音頻能量;然后,在麥克風(fēng)拾音過程中,實(shí)時(shí)計(jì)算麥克風(fēng)所采集的音頻的第二音頻能量。其中,計(jì)算音頻能量的時(shí)候,采用計(jì)算聲波的平均能流密度的方式計(jì)算出音頻能量,具體來說是用單位時(shí)間流經(jīng)某處單位面積介質(zhì)的能量的平均值的多少,來表示這個(gè)地方聲音的能量。然后,針對(duì)每一個(gè)麥克風(fēng),可以將第二音頻能量除以第一音頻能量,得到第二音頻能量與第一音頻能量的比例值,將該比例值作為麥克風(fēng)所采集的音頻的音頻能量比例量。
步驟203、確定音頻變化量屬于預(yù)設(shè)范圍的音頻,為待進(jìn)行音頻處理的音頻。
其中,在音頻變化量為音頻能量變化量時(shí),預(yù)設(shè)范圍為最大的音頻能量變化量;在音頻變化量為音頻能量比例量時(shí),預(yù)設(shè)范圍為最大的音頻能量比例量。
步驟203包括:
步驟2031、確定音頻變化量屬于預(yù)設(shè)范圍的音頻的個(gè)數(shù)是否唯一;
步驟2032、若不唯一,則根據(jù)音頻變化量屬于預(yù)設(shè)范圍的各音頻分別一一對(duì)應(yīng)的麥克風(fēng)的優(yōu)先級(jí),確定優(yōu)先級(jí)最高的麥克風(fēng)所采集的音頻為待進(jìn)行音頻處理的音頻;
其中,步驟2032中,確定優(yōu)先級(jí)最高的麥克風(fēng)所采集的音頻為待進(jìn)行音頻處理的音頻,包括:確定優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)是否唯一;若不唯一,則根據(jù)優(yōu)先級(jí)最高的各麥克風(fēng)的排序,確定排序第一的麥克風(fēng)所采集的音頻為待進(jìn)行音頻處理的音頻;若唯一,確定優(yōu)先級(jí)最高的麥克風(fēng)所采集的音頻,為待進(jìn)行音頻處理的音頻。
步驟2033、若唯一,則確定音頻變化量屬于預(yù)設(shè)范圍的音頻,為待進(jìn)行音頻處理的音頻。
在本實(shí)施例中,具體的,在一種實(shí)現(xiàn)方式中,在音頻變化量為音頻能量變化量時(shí),預(yù)設(shè)范圍為最大的音頻能量變化量;因?yàn)樵诎l(fā)生串音的時(shí)候,正對(duì)著麥克風(fēng)說話的發(fā)音人,其對(duì)應(yīng)的麥克風(fēng)里的聲音能量必定變化最大,而其它麥克風(fēng)聲音能量變化則較小;從而,可以選擇出音頻能量變化量最大的音頻,確定該音頻為有效的音頻數(shù)據(jù),即為待進(jìn)行音頻處理的音頻。在這種實(shí)現(xiàn)方式中,具體來說,首先判斷音頻能量變化量最大的音頻的個(gè)數(shù)是否只有一個(gè);如果音頻能量變化量最大的音頻的個(gè)數(shù)是一個(gè),則直接將該音頻作為待進(jìn)行音頻處理的音頻;如果音頻能量變化量最大的音頻的個(gè)數(shù)有多個(gè),因?yàn)橐呀?jīng)為每一個(gè)麥克風(fēng)分配了優(yōu)先級(jí),那么可以查詢下音頻能量變化量最大的各音頻分別一一對(duì)應(yīng)的麥克風(fēng)的優(yōu)先級(jí),然后判斷優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)是否唯一;若優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)是一個(gè),那么就可以直接將優(yōu)先級(jí)最高的麥克風(fēng)所采集的音頻,作為待進(jìn)行音頻處理的音頻;如果優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)有多個(gè),因?yàn)橐呀?jīng)為具有相同優(yōu)先級(jí)的麥克風(fēng)進(jìn)行排序,那么需要查詢優(yōu)先級(jí)最高的各麥克風(fēng)的排序,然后將排序第一的麥克風(fēng)所采集的音頻作為待進(jìn)行音頻處理的音頻。
在另一種實(shí)現(xiàn)方式中,在音頻變化量為音頻能量比例量時(shí),預(yù)設(shè)范圍為最大的音頻能量比例量。從而,可以選擇出音頻能量比例量最大的音頻,確定該音頻為有效的音頻數(shù)據(jù),即為待進(jìn)行音頻處理的音頻。在這種實(shí)現(xiàn)方式中,具體來說,首先判斷音頻能量比例量最大的音頻的個(gè)數(shù)是否只有一個(gè);如果音頻能量比例量最大的音頻的個(gè)數(shù)是一個(gè),則直接將該音頻作為待進(jìn)行音頻處理的音頻;如果音頻能量比例量最大的音頻的個(gè)數(shù)有多個(gè),因?yàn)橐呀?jīng)為每一個(gè)麥克風(fēng)分配了優(yōu)先級(jí),那么可以查詢下音頻能量比例量最大的各音頻分別一一對(duì)應(yīng)的麥克風(fēng)的優(yōu)先級(jí),然后判斷優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)是否唯一;若優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)是一個(gè),那么就可以直接將優(yōu)先級(jí)最高的麥克風(fēng)所采集的音頻,作為待進(jìn)行音頻處理的音頻;如果優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)有多個(gè),因?yàn)橐呀?jīng)為具有相同優(yōu)先級(jí)的麥克風(fēng)進(jìn)行排序,那么需要查詢優(yōu)先級(jí)最高的各麥克風(fēng)的排序,然后將排序第一的麥克風(fēng)所采集的音頻作為待進(jìn)行音頻處理的音頻。
舉例來說,麥克風(fēng)1實(shí)時(shí)的采集到音頻a,麥克風(fēng)2實(shí)時(shí)的采集到音頻b,麥克風(fēng)3實(shí)時(shí)的采集到音頻c,麥克風(fēng)4實(shí)時(shí)的采集到音頻d,麥克風(fēng)5實(shí)時(shí)的采集到音頻e;然后計(jì)算出了音頻a的音頻能量變化量、音頻b的音頻能量變化量、音頻c的音頻能量變化量、音頻d的音頻能量變化量、音頻e的音頻能量變化量。然后如果確定各音頻能量變化量中最大的音頻能量變化量,是音頻a的音頻能量變化量,那么可以確定麥克風(fēng)1實(shí)時(shí)的采集到音頻a,為待進(jìn)行音頻處理的音頻。如果確定各音頻能量變化量中最大的音頻能量變化量,是音頻a的音頻能量變化量、音頻b的音頻能量變化量、音頻c的音頻能量變化量,因?yàn)樗鼈?個(gè)的變化量相同、且大于其他的音頻能量變化量;因?yàn)橐呀?jīng)為每一個(gè)麥克風(fēng)分配了優(yōu)先級(jí),例如,第一優(yōu)先級(jí)包括了麥克風(fēng)1和麥克風(fēng)2,第一優(yōu)先級(jí)表征為當(dāng)前麥克風(fēng)為被分配給領(lǐng)導(dǎo)的麥克風(fēng),第二優(yōu)先級(jí)包括了麥克風(fēng)3和麥克風(fēng)4,第二優(yōu)先級(jí)表征為當(dāng)前麥克風(fēng)為被分配給主持人的麥克風(fēng),第三優(yōu)先級(jí)包括了麥克風(fēng)5,第三優(yōu)先級(jí)表征為當(dāng)前麥克風(fēng)為被分配給其他參與會(huì)議人員的麥克風(fēng);則可以優(yōu)先級(jí)最高的麥克風(fēng)有麥克風(fēng)1和麥克風(fēng)2;然后,已經(jīng)為第一優(yōu)先級(jí)包括了麥克風(fēng)1和麥克風(fēng)2進(jìn)行排序,麥克風(fēng)2的次序大于麥克風(fēng)1的次序,那么就可以將麥克風(fēng)2采集的音頻b作為待進(jìn)行音頻處理的音頻。
步驟204、對(duì)待進(jìn)行音頻處理的音頻進(jìn)行語音識(shí)別處理,得到語音信息和/或文字信息;或者,只播放待進(jìn)行音頻處理的音頻。
在本實(shí)施例中,具體的,確定出了待進(jìn)行音頻處理的音頻之后,就可以認(rèn)為該音頻為正在發(fā)言的人所發(fā)出的聲音,然后屏蔽到不與該待進(jìn)行音頻處理的音頻對(duì)應(yīng)的麥克風(fēng)所采集到的音頻,只播放該待進(jìn)行音頻處理的音頻。
或者,確定出了待進(jìn)行音頻處理的音頻之后,就可以認(rèn)為該音頻為正在發(fā)言的人所發(fā)出的聲音,然后對(duì)該待進(jìn)行音頻處理的音頻進(jìn)行語音識(shí)別處理,得到語音信息,然后保存或播放該語音信息;或,進(jìn)行語音識(shí)別處理之后得到文字信息,在大屏幕上顯示文字信息;或進(jìn)行語音識(shí)別處理之后得到語音信息和文字信息,然后保存語音信息和文字信息,或顯示語音信息和文字信息。
本實(shí)施例通過獲取每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻;根據(jù)每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻,分別確定每一個(gè)麥克風(fēng)所采集的音頻的音頻變化量;確定音頻變化量屬于預(yù)設(shè)范圍的音頻,為待進(jìn)行音頻處理的音頻;其中,音頻變化量為音頻能量變化量或音頻能量比例量。在多個(gè)麥克風(fēng)同時(shí)分別采集音頻的時(shí)候,可以對(duì)多個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻進(jìn)行分析,確定出后續(xù)需要進(jìn)行處理的音頻,進(jìn)而提取出一路音頻;從而在多個(gè)麥克風(fēng)同時(shí)開著進(jìn)行收音的時(shí)候,麥克風(fēng)發(fā)生串音時(shí),對(duì)多個(gè)麥克風(fēng)所采集的音頻進(jìn)行分析,去確定出哪一個(gè)是當(dāng)前需要收音的麥克風(fēng)所采集的音頻,該音頻為待進(jìn)行音頻處理的音頻,然后可以對(duì)待進(jìn)行音頻處理的音頻進(jìn)行播放、語音識(shí)別等處理。并且,本實(shí)施例提供的方法也不需要調(diào)低麥克風(fēng)的靈敏度,因?yàn)檎{(diào)低麥克風(fēng)的靈敏度雖然可以在一定程度上減少串音,但是會(huì)使麥克風(fēng)的收音距離變短,使得收音效果變差,從而本實(shí)施例提供的方法不會(huì)影響麥克風(fēng)的收音效果,不影響語音采集質(zhì)量。并且可以對(duì)待進(jìn)行音頻處理的音頻進(jìn)行語音識(shí)別處理,得到語音信息和/或文字信息。
圖3為本發(fā)明實(shí)施例三提供的基于麥克風(fēng)的音頻處理裝置的結(jié)構(gòu)示意圖,如圖3所示,本實(shí)施例的裝置,包括:
獲取模塊31,用于獲取每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻;
分析模塊32,用于根據(jù)每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻,分別確定每一個(gè)麥克風(fēng)所采集的音頻的音頻變化量;
確定模塊33,用于確定音頻變化量屬于預(yù)設(shè)范圍的音頻,為待進(jìn)行音頻處理的音頻。
本實(shí)施例提供的基于麥克風(fēng)的音頻處理裝置可執(zhí)行本發(fā)明實(shí)施例一提供的基于麥克風(fēng)的音頻處理方法,其實(shí)現(xiàn)原理相類似,此處不再贅述。
本實(shí)施例通過獲取每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻;根據(jù)每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻,分別確定每一個(gè)麥克風(fēng)所采集的音頻的音頻變化量;確定音頻變化量屬于預(yù)設(shè)范圍的音頻,為待進(jìn)行音頻處理的音頻。在多個(gè)麥克風(fēng)同時(shí)分別采集音頻的時(shí)候,可以對(duì)多個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻進(jìn)行分析,確定出后續(xù)需要進(jìn)行處理的音頻,進(jìn)而提取出一路音頻;從而在多個(gè)麥克風(fēng)同時(shí)開著進(jìn)行收音的時(shí)候,麥克風(fēng)發(fā)生串音時(shí),對(duì)多個(gè)麥克風(fēng)所采集的音頻進(jìn)行分析,去確定出哪一個(gè)是當(dāng)前需要收音的麥克風(fēng)所采集的音頻,該音頻為待進(jìn)行音頻處理的音頻,然后可以對(duì)待進(jìn)行音頻處理的音頻進(jìn)行播放、語音識(shí)別等處理。并且,本實(shí)施例提供的方法也不需要調(diào)低麥克風(fēng)的靈敏度,因?yàn)檎{(diào)低麥克風(fēng)的靈敏度雖然可以在一定程度上減少串音,但是會(huì)使麥克風(fēng)的收音距離變短,使得收音效果變差,從而本實(shí)施例提供的方法不會(huì)影響麥克風(fēng)的收音效果,不影響語音采集質(zhì)量。
圖4為本發(fā)明實(shí)施例四提供的基于麥克風(fēng)的音頻處理裝置的結(jié)構(gòu)示意圖,在實(shí)施例三的基礎(chǔ)上,如圖4所示,本實(shí)施例的裝置,每一個(gè)麥克風(fēng)的靈敏度相同,音頻變化量為音頻能量變化量,預(yù)設(shè)范圍為最大的音頻能量變化量;分析模塊32,具體用于:
確定每一個(gè)麥克風(fēng)未采集音頻時(shí)的第一音頻能量,并在拾音過程中實(shí)時(shí)計(jì)算每一個(gè)麥克風(fēng)所采集的音頻的第二音頻能量;
確定每一個(gè)麥克風(fēng)的第二音頻能量與第一音頻能量的差值,得到每一個(gè)麥克風(fēng)所采集的音頻的音頻能量變化量。
或者,每一個(gè)麥克風(fēng)的靈敏度不同,音頻變化量為音頻能量比例量,預(yù)設(shè)范圍為最大的音頻能量比例量;分析模塊32,具體用于:
確定每一個(gè)麥克風(fēng)未采集音頻時(shí)的第一音頻能量,并在拾音過程中實(shí)時(shí)計(jì)算每一個(gè)麥克風(fēng)所采集的音頻的第二音頻能量;
確定每一個(gè)麥克風(fēng)的第二音頻能量與第一音頻能量的比例值,得到每一個(gè)麥克風(fēng)所采集的音頻的音頻能量比例量。
確定模塊33,包括:
判斷子模塊331,用于確定音頻變化量屬于預(yù)設(shè)范圍的音頻的個(gè)數(shù)是否唯一;
第一確定子模塊332,用于若不唯一,則根據(jù)音頻變化量屬于預(yù)設(shè)范圍的各音頻分別一一對(duì)應(yīng)的麥克風(fēng)的優(yōu)先級(jí),確定優(yōu)先級(jí)最高的麥克風(fēng)所采集的音頻為待進(jìn)行音頻處理的音頻;
第二確定子模塊333,用于若唯一,則確定音頻變化量屬于預(yù)設(shè)范圍的音頻,為待進(jìn)行音頻處理的音頻。
其中,第一確定子模塊332,具體用于:
若音頻變化量屬于預(yù)設(shè)范圍的音頻的個(gè)數(shù)不唯一,則根據(jù)音頻變化量屬于預(yù)設(shè)范圍的各音頻分別一一對(duì)應(yīng)的麥克風(fēng)的優(yōu)先級(jí),確定優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)是否唯一;
若優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)不唯一,則根據(jù)優(yōu)先級(jí)最高的各麥克風(fēng)的排序,確定排序第一的麥克風(fēng)所采集的音頻為待進(jìn)行音頻處理的音頻;
若優(yōu)先級(jí)最高的麥克風(fēng)的個(gè)數(shù)唯一,確定優(yōu)先級(jí)最高的麥克風(fēng)所采集的音頻,為待進(jìn)行音頻處理的音頻。
本實(shí)施例提供的裝置,還包括:
處理模塊41,用于在確定模塊33確定音頻變化量屬于預(yù)設(shè)范圍的音頻,為待進(jìn)行音頻處理的音頻之后,對(duì)待進(jìn)行音頻處理的音頻進(jìn)行語音識(shí)別處理,得到語音信息和/或文字信息,或者,只播放待進(jìn)行音頻處理的音頻。
本實(shí)施例提供的基于麥克風(fēng)的音頻處理裝置可執(zhí)行本發(fā)明實(shí)施例二提供的基于麥克風(fēng)的音頻處理方法,其實(shí)現(xiàn)原理相類似,此處不再贅述。
本實(shí)施例通過獲取每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻;根據(jù)每一個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻,分別確定每一個(gè)麥克風(fēng)所采集的音頻的音頻變化量;確定音頻變化量屬于預(yù)設(shè)范圍的音頻,為待進(jìn)行音頻處理的音頻;其中,音頻變化量為音頻能量變化量或音頻能量比例量。在多個(gè)麥克風(fēng)同時(shí)分別采集音頻的時(shí)候,可以對(duì)多個(gè)麥克風(fēng)在同一時(shí)間內(nèi)所采集的音頻進(jìn)行分析,確定出后續(xù)需要進(jìn)行處理的音頻,進(jìn)而提取出一路音頻;從而在多個(gè)麥克風(fēng)同時(shí)開著進(jìn)行收音的時(shí)候,麥克風(fēng)發(fā)生串音時(shí),對(duì)多個(gè)麥克風(fēng)所采集的音頻進(jìn)行分析,去確定出哪一個(gè)是當(dāng)前需要收音的麥克風(fēng)所采集的音頻,該音頻為待進(jìn)行音頻處理的音頻,然后可以對(duì)待進(jìn)行音頻處理的音頻進(jìn)行播放、語音識(shí)別等處理。并且,本實(shí)施例提供的方法也不需要調(diào)低麥克風(fēng)的靈敏度,因?yàn)檎{(diào)低麥克風(fēng)的靈敏度雖然可以在一定程度上減少串音,但是會(huì)使麥克風(fēng)的收音距離變短,使得收音效果變差,從而本實(shí)施例提供的方法不會(huì)影響麥克風(fēng)的收音效果,不影響語音采集質(zhì)量。并且可以對(duì)待進(jìn)行音頻處理的音頻進(jìn)行語音識(shí)別處理,得到語音信息和/或文字信息。
本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述各方法實(shí)施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成。前述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。該程序在執(zhí)行時(shí),執(zhí)行包括上述各方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括:rom、ram、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
最后應(yīng)說明的是:以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。