一種基于環(huán)形麥克風(fēng)陣列的語音記錄方法及系統(tǒng)與流程

文檔序號：11624528閱讀：322來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

一種基于環(huán)形麥克風(fēng)陣列的語音記錄方法及系統(tǒng)與流程

本發(fā)明涉及語音信號處理領(lǐng)域，具體涉及一種基于環(huán)形麥克風(fēng)陣列的語音記錄方法及系統(tǒng)。

背景技術(shù)：

隨著語音處理技術(shù)的不斷發(fā)展，會議記錄工作逐漸由傳統(tǒng)的純?nèi)斯び涗涋D(zhuǎn)變?yōu)橛芍悄芑臅h記錄設(shè)備進(jìn)行記錄處理，大大降低了工作量，減少了人力投入。然而現(xiàn)實的會議環(huán)境中的聲學(xué)現(xiàn)象比較復(fù)雜，會議記錄的質(zhì)量受較多因素的影響，如外界噪聲、遠(yuǎn)場錄音、各說話人相互干擾等，使得整個記錄系統(tǒng)難以準(zhǔn)確地獲取各說話人數(shù)據(jù)，進(jìn)而實現(xiàn)后續(xù)的數(shù)據(jù)分析工作，如回聽、轉(zhuǎn)寫等。

傳統(tǒng)的語音降噪系統(tǒng)多是基于多個麥克風(fēng)采用譜減法或維納濾波等技術(shù)來抑制噪聲，例如：分布式近講話筒錄音系統(tǒng)在每個說話人面前均有一個麥克風(fēng)話筒，此麥克風(fēng)話筒不但具備擴(kuò)音的功能，還可以將說話人的聲音錄下來，多個發(fā)音人的聲音會通過混音器保存成一個文件；或基于環(huán)形麥克風(fēng)陣列利用麥克風(fēng)空間位置差異提取期望方向信號，抑制其余方向信號，從而實現(xiàn)降噪；還可以使用具備錄音模式的錄音筆，該錄音筆一般放置在會議室的一角，對會議全程中的語音進(jìn)行錄制。

然而，對于分布式近講話筒錄音系統(tǒng)，如果需要保證較高的記錄質(zhì)量，則每個說話人都需要配置一個近講話筒，因而該系統(tǒng)成本高，并且布置復(fù)雜，需要專業(yè)的施工團(tuán)隊才能完成安裝調(diào)試，因此這種系統(tǒng)一般只在高端會議室中采用；對于環(huán)形麥克風(fēng)陣列得到的信號對非期望方向干擾抑制能力有限，導(dǎo)致其余方向信號泄漏過多，波束指向性較差；對于采用錄音筆的記錄方式，由于錄音設(shè)備離大部分發(fā)音人都比較遠(yuǎn)，容易受環(huán)境噪聲以及房間混響的影響，從而導(dǎo)致錄音清晰度和可懂度不高，整體質(zhì)量較差。

技術(shù)實現(xiàn)要素：

本發(fā)明實施例提供一種基于環(huán)形麥克風(fēng)陣列的語音記錄方法及系統(tǒng)，以解決現(xiàn)有環(huán)形麥克風(fēng)陣列得到的信號對非期望方向干擾抑制能力有限，導(dǎo)致其余方向信號泄漏過多，并且波束指向性較差的問題。

為此，本發(fā)明實施例提供如下技術(shù)方案：

一種基于環(huán)形麥克風(fēng)陣列的語音記錄方法，包括：

通過環(huán)形麥克風(fēng)陣列實時采集語音信號，所述環(huán)形麥克風(fēng)陣列包括多個麥克風(fēng)；

將所述語音信號轉(zhuǎn)換為頻域信號；

對所述環(huán)形麥克風(fēng)陣列所處的空間進(jìn)行扇形劃分，形成多個包含至少一個麥克風(fēng)的扇形區(qū)域；

生成各扇形區(qū)域的固定波束；

對各固定波束逐幀進(jìn)行自適應(yīng)調(diào)整，以使其它固定波束對當(dāng)前固定波束的影響最小，得到各固定波束方向的語音信號；

記錄各固定波束方向的語音信號。

優(yōu)選地，所述生成各扇形區(qū)域的固定波束包括：

根據(jù)所述環(huán)形麥克風(fēng)陣列的各麥克風(fēng)權(quán)重系數(shù)生成各扇形區(qū)域的固定波束，確定所述環(huán)形麥克風(fēng)陣列的各麥克風(fēng)權(quán)重系數(shù)的準(zhǔn)則包括：

保證語音信號入射方向的固定波束的響應(yīng)為1，并且所述環(huán)形麥克風(fēng)陣列總體輸出功率最小化。

優(yōu)選地，所述對各固定波束逐幀進(jìn)行自適應(yīng)調(diào)整，以使其它固定波束對當(dāng)前固定波束的影響最小，得到各固定波束方向的語音信號包括：

對于每一個固定波束，將該固定波束作為待調(diào)整波束，將該固定波束之外的其它固定波束作為參考波束，逐幀對所述待調(diào)整波束進(jìn)行自適應(yīng)調(diào)整，直至所述語音信號結(jié)束；每幀所述待調(diào)整幀的自適應(yīng)調(diào)整過程包括：

獲取當(dāng)前幀各參考波束的自適應(yīng)權(quán)重系數(shù)；

在當(dāng)前幀各參考波束的自適應(yīng)權(quán)重系數(shù)下，計算當(dāng)前幀待調(diào)整波束的自適應(yīng)波束；

根據(jù)當(dāng)前幀各自適應(yīng)波束的二階統(tǒng)計特征確定其中用于權(quán)重系數(shù)調(diào)整的波束；

利用所述用于權(quán)重系數(shù)調(diào)整的波束更新當(dāng)前幀各參考波束的自適應(yīng)權(quán)重系數(shù)，并將更新后的各參考波束的自適應(yīng)權(quán)重系數(shù)作為當(dāng)前幀或下一幀各參考波束的自適應(yīng)權(quán)重系數(shù)。

優(yōu)選地，所述利用所述用于權(quán)重系數(shù)調(diào)整的波束更新當(dāng)前幀各參考波束的自適應(yīng)權(quán)重系數(shù)包括：

采用自適應(yīng)濾波算法更新當(dāng)前幀各參考波束的自適應(yīng)權(quán)重系數(shù)，使得自適應(yīng)波束輸出的能量均值最小。

優(yōu)選地，所述語音記錄方法還包括：獲取更新后的各參考波束的自適應(yīng)權(quán)重系數(shù)之后，判斷語音信號是否結(jié)束，如果是，則結(jié)束計算所述待調(diào)整波束的自適應(yīng)波束；如果否，則根據(jù)預(yù)設(shè)的權(quán)重系數(shù)更新步長確定各參考波束的自適應(yīng)權(quán)重系數(shù)的更新幅度，逐幀更新自適應(yīng)權(quán)重系數(shù)，并在更新后的自適應(yīng)權(quán)重系數(shù)下計算所述待調(diào)整波束的自適應(yīng)波束。

優(yōu)選地，所述計算當(dāng)前幀待調(diào)整波束的自適應(yīng)波束包括：

計算當(dāng)前幀待調(diào)整波束中含有參考波束的泄露成分，該泄露成分為當(dāng)前幀各參考波束的自適應(yīng)權(quán)重系數(shù)與參考波束的乘積；

將去除泄露成分的待調(diào)整波束輸出作為當(dāng)前幀待調(diào)整波束的自適應(yīng)波束。

優(yōu)選地，所述語音記錄方法還包括：

在計算當(dāng)前幀待調(diào)整波束的自適應(yīng)波束之前，從所述待調(diào)整波束的參考波束中選擇至少一個對所述待調(diào)整波束影響大的參考波束作為優(yōu)選參考波束，以便于從所述待調(diào)整波束中剔除優(yōu)選參考波束的泄露成分，其中，影響大的參考波束包括以下任意一種或多種：能量值、功率值、信噪比、直達(dá)混響比最大的指定個數(shù)/大于設(shè)定閾值的參考波束。

一種基于環(huán)形麥克風(fēng)陣列的語音記錄系統(tǒng)，包括：

信號采集模塊，用于通過環(huán)形麥克風(fēng)陣列實時采集語音信號，所述環(huán)形麥克風(fēng)陣列包括多個麥克風(fēng)；

頻域轉(zhuǎn)換模塊，用于將所述語音信號轉(zhuǎn)換為頻域信號；

區(qū)域劃分模塊，用于對所述環(huán)形麥克風(fēng)陣列所處的空間進(jìn)行扇形劃分，形成多個包含至少一個麥克風(fēng)的扇形區(qū)域；

固定波束形成模塊，用于生成各扇形區(qū)域的固定波束；

自適應(yīng)調(diào)整模塊，用于對各固定波束逐幀進(jìn)行自適應(yīng)調(diào)整，以使其它固定波束對當(dāng)前固定波束的影響最小，得到各固定波束方向的語音信號；

記錄模塊，用于記錄各固定波束方向的語音信號。

優(yōu)選地，所述自適應(yīng)調(diào)整模塊包括：

參考波束獲取單元，用于對于每一個固定波束，將該固定波束作為待調(diào)整波束，將該固定波束之外的其它固定波束作為參考波束；

系數(shù)獲取單元，用于獲取當(dāng)前幀各參考波束的自適應(yīng)權(quán)重系數(shù)；

自適應(yīng)計算單元，用于在當(dāng)前幀各參考波束的自適應(yīng)權(quán)重系數(shù)下，計算當(dāng)前幀待調(diào)整波束的自適應(yīng)波束；

調(diào)整波束確定單元，用于根據(jù)當(dāng)前幀各自適應(yīng)波束的二階統(tǒng)計特征確定其中用于權(quán)重系數(shù)調(diào)整的波束；

更新系數(shù)獲取單元，用于利用所述用于權(quán)重系數(shù)調(diào)整的波束更新當(dāng)前幀各參考波束的自適應(yīng)權(quán)重系數(shù)，并將更新后的各參考波束的自適應(yīng)權(quán)重系數(shù)作為當(dāng)前幀或下一幀各參考波束的自適應(yīng)權(quán)重系數(shù)。

優(yōu)選地，所述語音記錄系統(tǒng)還包括：

判斷模塊，用于判斷所述語音信號是否結(jié)束，如果是，則執(zhí)行記錄模塊；如果否，則執(zhí)行自適應(yīng)模塊。

優(yōu)選地，所述自適應(yīng)計算單元包括：

泄露成分獲取子單元，用于計算當(dāng)前幀待調(diào)整波束中含有參考波束的泄露成分，該泄露成分為當(dāng)前幀各參考波束的自適應(yīng)權(quán)重系數(shù)與參考波束的乘積；

自適應(yīng)波束獲取子單元，用于將去除泄露成分的待調(diào)整波束輸出作為當(dāng)前幀待調(diào)整波束的自適應(yīng)波束。

優(yōu)選地，所述語音記錄系統(tǒng)還包括：

選擇模塊，用于從所述待調(diào)整波束的參考波束中選擇至少一個對所述待調(diào)整波束影響大的參考波束作為優(yōu)選參考波束，以便于從所述待調(diào)整波束中剔除優(yōu)選參考波束的泄露成分，其中，影響大的參考波束包括以下任意一種或多種：能量值、功率值、信噪比、直達(dá)混響比最大的指定個數(shù)/大于設(shè)定閾值的參考波束。

優(yōu)選地，所述環(huán)形麥克風(fēng)陣列中的多個麥克風(fēng)為均勻分布或非均勻分布。

優(yōu)選地，所述環(huán)形麥克風(fēng)陣列為多環(huán)形麥克風(fēng)陣列。

本發(fā)明提供的一種基于環(huán)形麥克風(fēng)陣列的語音記錄方法及系統(tǒng)，該方法通過對環(huán)形麥克風(fēng)陣列進(jìn)行扇形劃分，并生成各扇形區(qū)域的固定波束，然后對各固定波束逐幀進(jìn)行自適應(yīng)調(diào)整，以使其它固定波束對當(dāng)前固定波束的影響最小，得到各固定波束方向的語音信號，并記錄各固定波束方向的語音信號。由于通過對各固定波束進(jìn)行自適應(yīng)調(diào)整，使其它固定波束對當(dāng)前固定波束的影響最小，有效地提高了環(huán)形麥克風(fēng)陣列得到的信號對非期望方向干擾抑制能力，進(jìn)而減小了其余方向信號泄漏過多的問題，提高了語音記錄效果。

附圖說明

為了更清楚地說明本申請實施例或現(xiàn)有技術(shù)中的技術(shù)方案，下面將對實施例中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本發(fā)明中記載的一些實施例，對于本領(lǐng)域普通技術(shù)人員來講，還可以根據(jù)這些附圖獲得其它的附圖。

圖1是本發(fā)明實施例基于環(huán)形麥克風(fēng)陣列的語音記錄方法的一種流程圖；

圖2至圖3是本發(fā)明實施例提供的單環(huán)麥克風(fēng)陣列的結(jié)構(gòu)示意圖；

圖4至圖6是本發(fā)明實施例提供的多環(huán)麥克風(fēng)陣列的結(jié)構(gòu)示意圖；

圖7是本發(fā)明實施例基于環(huán)形麥克風(fēng)陣列接收語音信號的示意圖；

圖8是本發(fā)明實施例基于環(huán)形麥克風(fēng)陣列的固定波束空間示意圖；

圖9是本發(fā)明實施例基于環(huán)形麥克風(fēng)陣列的當(dāng)前波束的自適應(yīng)波束形成示意圖；

圖10是本發(fā)明實施例基于環(huán)形麥克風(fēng)陣列的語音記錄系統(tǒng)的一種結(jié)構(gòu)示意圖。

具體實施方式

為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明實施例的方案，下面結(jié)合附圖和實施方式對本發(fā)明實施例作進(jìn)一步的詳細(xì)說明。

需要強(qiáng)調(diào)的是，本發(fā)明提供的記錄方法不僅僅適用于會議記錄，還適用于任何需要記錄語音的場景中，本發(fā)明提供的記錄方法能解決其余方向信號泄漏過多的問題，以提高語音記錄效果。此外，還可以應(yīng)用于其他使用環(huán)形麥克陣列采集語音信號的場景中，例如，使用環(huán)形麥克風(fēng)陣列的說話人識別場景、智能交互場景等，以提高環(huán)形麥克風(fēng)陣列輸出的語音信號的質(zhì)量，進(jìn)而提升語音識別率等，在此不作限定。

如圖1所示，是本發(fā)明實施例基于環(huán)形麥克風(fēng)陣列的語音記錄方法的一種流程圖，包括以下步驟：

步驟101，通過環(huán)形麥克風(fēng)陣列實時采集語音信號，所述環(huán)形麥克風(fēng)陣列包括多個麥克風(fēng)。

在本實施例中，通過環(huán)形麥克風(fēng)陣列可以采集全方位的用戶語音信號。本發(fā)明采用的環(huán)形麥克風(fēng)陣列可以是單環(huán)環(huán)形麥克風(fēng)陣列，其中麥克風(fēng)可以是均勻分布，也可以根據(jù)實際應(yīng)用情況非均勻分布，如預(yù)先得知在某些方位目標(biāo)說話人出現(xiàn)的概率較大，則可在其對應(yīng)方向多布局麥克風(fēng)，在其它位置麥克風(fēng)布置稀疏一些，以增強(qiáng)特定方向上的語音信號采集能力。具體地，為了能夠?qū)崿F(xiàn)空間360度拾音，所述麥克風(fēng)陣列為含m(通常m≥4)個麥克風(fēng)的環(huán)形麥克風(fēng)陣列，本實施例以拓?fù)浣Y(jié)構(gòu)為含m個麥克風(fēng)的環(huán)形麥克風(fēng)陣列為例進(jìn)行說明，如圖2、圖3所示，為麥克風(fēng)個數(shù)為4個和8個的環(huán)形麥克風(fēng)陣列的示意圖。當(dāng)然所述麥克風(fēng)陣列也可以是橢圓、不規(guī)則環(huán)形等其它環(huán)形結(jié)構(gòu)，對此本案不做限定。

此外，所述環(huán)形麥克風(fēng)陣列還可以為多環(huán)形麥克風(fēng)陣列，如圖4至圖6所示。對于麥克風(fēng)陣列，麥克風(fēng)個數(shù)越多，主瓣越窄，旁瓣越低，麥克風(fēng)陣列采集語音信號的能力越強(qiáng)，其中旁瓣的高低主要由零點個數(shù)決定，在實際使用中，麥克風(fēng)越多，自由度越多，可形成的零點個數(shù)越多，故多環(huán)形麥克風(fēng)陣列，可以得到更好的旁瓣效果，以增強(qiáng)麥克風(fēng)陣列采集語音信號的能力。

步驟s02，將所述語音信號轉(zhuǎn)換為頻域信號。

在實際應(yīng)用中，將所述語音信號轉(zhuǎn)換為頻域信號可以包括：對所述語音信號進(jìn)行分幀處理；對分幀后的每幀語音信號作加窗處理；對加窗處理后的每幀語音信號進(jìn)行離散傅里葉變換，得到每幀語音信號的頻域信號。

在一個具體實施例中，以單環(huán)形麥克風(fēng)陣列采集語音信號為例，假設(shè)語音信號sd(t)的入射方向角為θ，麥克風(fēng)陣列接收語音信號的示意圖如圖7所示，麥克風(fēng)的個數(shù)為m，第m個麥克風(fēng)相對于聲音信號sd(t)的時延為τm，則可以得到麥克風(fēng)陣列導(dǎo)向矢量如式(1)所示：

其中，a(θ)是導(dǎo)向矢量，表示不同麥克風(fēng)對于期望方向的空間響應(yīng)，τm與入射方向角度θ、麥克風(fēng)固定波束以及麥克風(fēng)陣列結(jié)構(gòu)有關(guān)。

第m個麥克風(fēng)采集到的聲音信號如式(2)所示：

xm(t)＝sd(t-τm)(2)

特別地，當(dāng)τm＝0時，表示參考麥克風(fēng)相對于期望方向的時延為0。

將接收的語音信號從時域變換到頻率域，可以包括：首先，對聲音信號進(jìn)行分幀處理；然后，將分幀后的每幀信號作加窗處理，其中，所述加窗可以為：哈明(hamming)窗、漢寧(hanning)窗等；最后，在加窗后的信號作離散傅里葉(dft)變換，得到入射的原始語音信號的頻域表示sd(k,l)，同時可以得到m個麥克風(fēng)的頻率信號x1(k,l)～xm(k,l)，其中，k表示信號的頻率，l表示幀序號，以下符號代表相同意義。第m個麥克風(fēng)接收到的頻率信號的公式如式(3)所示：

步驟s03，對所述環(huán)形麥克風(fēng)陣列所處的空間進(jìn)行扇形劃分，形成多個包含至少一個麥克風(fēng)的扇形區(qū)域。

在本實施例中，基于麥克風(fēng)陣列對所述環(huán)形麥克風(fēng)陣列所處的空間進(jìn)行扇形劃分，形成n個扇形區(qū)域，其中，每個扇形區(qū)域包含至少一個所述環(huán)形麥克風(fēng)陣列的麥克風(fēng)，每個扇形區(qū)域在后續(xù)步驟形成各固定波束。需要說明的是，每個扇形區(qū)域包含一個或多個麥克風(fēng)，因此區(qū)域個數(shù)n和麥克風(fēng)個數(shù)m的關(guān)系為n≤m。

步驟s04，生成各扇形區(qū)域的固定波束。

具體地，基于步驟s03劃分形成的n個扇形區(qū)域，在每個扇形區(qū)域中形成各固定波束，扇形區(qū)域個數(shù)為n時，固定波束個數(shù)也為n。固定波束形成的思想是確定環(huán)形麥克風(fēng)陣列的各麥克風(fēng)的一組權(quán)重系數(shù)，對各麥克風(fēng)采集到的語音信號進(jìn)行加權(quán)濾波，從而得到各方向的固定波束，固定波束空間示意圖如圖8所示。其中，確定所述環(huán)形麥克風(fēng)陣列的各麥克風(fēng)的一組權(quán)重系數(shù)的準(zhǔn)則可以包括：保證當(dāng)前語音信號所在扇形區(qū)域的波束的響應(yīng)為1，即從該入射方向的入射語音信號無失真；在保證當(dāng)前語音信號所在扇形區(qū)域的波束的響應(yīng)為1的基礎(chǔ)上，麥克風(fēng)陣列總體輸出功率最小化。

在一個具體實施例中，設(shè)每個區(qū)域的中心角度分別為θ1,θ2,…,θn,…,θn。假定環(huán)形麥克風(fēng)陣列的各麥克風(fēng)的權(quán)重系數(shù)如式(4)所示：

w(k,l)＝[w1(k,l),w2(k,l),……,wm(k,l)](4)

則環(huán)形麥克風(fēng)陣列的輸出可表示為式(5)所示：

y(k,l)＝x(k,l)w^h(k,l)＝sd(k,l)a(θ)w^h(k,l)(5)

其中x(k,l)＝[x1(k,l),x2(k,l),……,xm(k,l)]表示環(huán)形麥克風(fēng)陣列的各麥克風(fēng)的語音信號向量。上標(biāo)h表示向量的共軛轉(zhuǎn)置。每個固定波束有一個輸出，當(dāng)一個固定波束對應(yīng)區(qū)域包括兩個或更多個麥克風(fēng)時，通過加權(quán)求和等方式獲取該固定波束的輸出。

此時的環(huán)形麥克風(fēng)陣列輸出的功率如式(6)所示：

p(k,l)＝[x(k,l)w^h(k,l)]^hx(k,l)w^h(k,l)＝w(k,l)r(k,l)w^h(k,l)(6)

其中，r(k,l)＝x^h(k,l)x(k,l)表示麥克風(fēng)陣列采集聲音信號的功率譜密度矩陣。w(k,l)的計算公式如式(7)所示：

且a(θn)w^h(k，l)＝1(7)

式(7)意味著在期望方向，即想要獲得語音信號的方向的入射語音信號無失真的狀態(tài)下，使輸出功率最小化；a(θn)是在期望方向的導(dǎo)向矢量(steeringvector)。然后，利用利用拉格朗日乘數(shù)法，很容易求得滿足此條件的權(quán)重向量w(k,l)，如式(8)所示。

其中，a(θn)是在角度θn方向的導(dǎo)向矢量。通過使用該最佳權(quán)重向量w(k,l)，可以在沿期望的方向的靈敏度被設(shè)定為1的狀態(tài)下使輸出功率最小化，即最大限度的抑制噪聲。

同理，我們可以得到在角度θ1,θ2,…,θn,…,θn上形成波束的麥克風(fēng)權(quán)重系數(shù)，分別為：w1(k,l),w2(k,l),……,wm(k,l)。通過將麥克風(fēng)信號分別乘上這些系數(shù)，相當(dāng)于在環(huán)形麥克風(fēng)陣列所處空間的n個角度形成n個固定波束，即將空間劃分成了n份。

步驟s05，對各固定波束逐幀進(jìn)行自適應(yīng)調(diào)整，以使其它固定波束對當(dāng)前固定波束的影響最小，得到各固定波束方向的語音信號，參考圖9所示。

在本實施例中，所述對各固定波束逐幀進(jìn)行自適應(yīng)調(diào)整，以使其它固定波束對當(dāng)前固定波束的影響最小，得到各固定波束方向的語音信號包括：對于每一個固定波束，將該固定波束作為待調(diào)整波束，將該固定波束之外的其它固定波束作為參考波束，逐幀對所述待調(diào)整波束進(jìn)行自適應(yīng)調(diào)整，直至所述語音信號結(jié)束；每幀所述待調(diào)整幀的自適應(yīng)調(diào)整過程包括：獲取當(dāng)前幀各參考波束的自適應(yīng)權(quán)重系數(shù)；在當(dāng)前幀各參考波束的自適應(yīng)權(quán)重系數(shù)下，計算當(dāng)前幀待調(diào)整波束的自適應(yīng)波束；根據(jù)當(dāng)前幀各自適應(yīng)波束的二階統(tǒng)計特征確定其中用于權(quán)重系數(shù)調(diào)整的波束；利用所述用于權(quán)重系數(shù)調(diào)整的波束更新當(dāng)前幀各參考波束的自適應(yīng)權(quán)重系數(shù)，并將更新后的各參考波束的自適應(yīng)權(quán)重系數(shù)作為當(dāng)前幀或下一幀各參考波束的自適應(yīng)權(quán)重系數(shù)。其中，所述利用所述用于權(quán)重系數(shù)調(diào)整的波束更新當(dāng)前幀各參考波束的自適應(yīng)權(quán)重系數(shù)包括：采用自適應(yīng)濾波算法更新當(dāng)前幀各參考波束的自適應(yīng)權(quán)重系數(shù)，使得自適應(yīng)波束輸出的能量均值最??；所述計算當(dāng)前幀待調(diào)整波束的自適應(yīng)波束包括：計算當(dāng)前幀待調(diào)整波束中含有參考波束的泄露成分，該泄露成分為當(dāng)前幀各參考波束的自適應(yīng)權(quán)重系數(shù)與參考波束的乘積；將去除泄露成分的待調(diào)整波束輸出作為當(dāng)前幀待調(diào)整波束的自適應(yīng)波束。

所述自適應(yīng)濾波算法可以為最小均方誤差算法(leastmeansquare，lms)、遞歸最小二乘算法(recursiveleastsquares，rls)、自仿射投影算法(affineprojectionalgorithm，apa)等，在此不作限定，在本實施例中以lms算法為例進(jìn)行說明。

在實際應(yīng)用中，所述二階統(tǒng)計特征可以包括以下任意一種或多種：能量值、功率值、信噪比、直達(dá)混響比，通常采用能量值作為二階統(tǒng)計特征。

進(jìn)一步地，所述記錄方法還包括：獲取更新后的各參考波束的自適應(yīng)權(quán)重系數(shù)之后，判斷語音信號是否結(jié)束，如果是，則結(jié)束計算所述待調(diào)整波束的自適應(yīng)波束；如果否，則根據(jù)預(yù)設(shè)的權(quán)重系數(shù)更新步長確定各參考波束的自適應(yīng)權(quán)重系數(shù)的更新幅度，逐幀更新自適應(yīng)權(quán)重系數(shù)，并在更新后的自適應(yīng)權(quán)重系數(shù)下計算所述待調(diào)整波束的自適應(yīng)波束。

優(yōu)選地，所述記錄方法還包括：在計算當(dāng)前幀待調(diào)整波束的自適應(yīng)波束之前，從所述待調(diào)整波束的參考波束中選擇至少一個對所述待調(diào)整波束影響大的參考波束作為優(yōu)選參考波束，以便于從所述待調(diào)整波束中剔除優(yōu)選參考波束的泄露成分，其中，影響大的參考波束包括以下任意一種或多種：能量值、功率值、信噪比、直達(dá)混響比最大的指定個數(shù)/大于設(shè)定閾值的參考波束。

在一個具體實施例中，首先，初始化參考波束的自適應(yīng)權(quán)重系數(shù)，將當(dāng)前固定波束作為待調(diào)整波束，則其余方向的波束都稱為參考波束。本案中將參考波束的自適應(yīng)權(quán)重系數(shù)初始化為一個全零的向量，每一個當(dāng)前波束的參考波束權(quán)重系數(shù)是一個n-1維的向量，則當(dāng)前波束n的參考波束權(quán)重系數(shù)向量此時l＝0；然后，選取能量值小于設(shè)定閾值的固定波束作為基準(zhǔn)，例如，對于當(dāng)前幀各固定波束，計算各固定波束的能量值，如果能量值小于能量閾值(一般設(shè)為一個接近于零的較小值)，則以該固定波束的輸出作為基準(zhǔn)進(jìn)行權(quán)重系數(shù)更新調(diào)整；然后，對當(dāng)前波束進(jìn)行自適應(yīng)調(diào)整使得作為基準(zhǔn)的固定波束輸出的能量值趨于零，獲取其它固定波束的自適應(yīng)權(quán)重系數(shù)；接著，根據(jù)當(dāng)前幀的其它固定波束的自適應(yīng)權(quán)重系數(shù)計算權(quán)重系數(shù)更新值；根據(jù)當(dāng)前幀的權(quán)重系數(shù)更新值獲取下一幀的其它固定波束的自適應(yīng)權(quán)重系數(shù)。例如，可以采用自適應(yīng)輸出信號的最小均方誤差算法(lms)來進(jìn)行自適應(yīng)權(quán)重系數(shù)更新，即當(dāng)前波束輸出的能量均值最小，具體可以采用計算偏導(dǎo)等于0，最后計算出權(quán)重系數(shù)更新值為接著，根據(jù)其計算下一幀自適應(yīng)權(quán)重系數(shù)，如式(9)所示：

其中，μ表示各參考波束的自適應(yīng)權(quán)重系數(shù)的更新幅度(即更新步長)，其值可以根據(jù)經(jīng)驗或?qū)嶋H應(yīng)用情況確定；然后根據(jù)自適應(yīng)權(quán)重系數(shù)計算當(dāng)前波束的自適應(yīng)波束輸出，需要說明的是，可以根據(jù)當(dāng)前幀或下一幀的其它固定波束的自適應(yīng)權(quán)重系數(shù)計算當(dāng)前波束的自適應(yīng)波束輸出。

其中，計算當(dāng)前波束的自適應(yīng)波束輸出的過程可以如下所示：假設(shè)當(dāng)前波束為其它方向的波束向量即參考波束向量ynref(k,l)包括：則當(dāng)前波束n中含有其它波束的泄露成分可表示成式(10)所示：

式(10)還可以寫成向量的形式，如式(11)所示：

其中，為參考波束向量，為其它固定波束的自適應(yīng)權(quán)重系數(shù)，即參考波束向量的自適應(yīng)權(quán)重系數(shù)，當(dāng)然，也可以采用下一幀參考波束向量的自適應(yīng)權(quán)重系數(shù)

當(dāng)前波束的自適應(yīng)波束的輸出如式(12)所示：

在實際應(yīng)用中，在計算當(dāng)前波束的其它固定波束的泄露成分時，可以只在其它的n-1個固定波束中選擇p個影響較大的固定波束，其選擇依據(jù)可以是根據(jù)以下任意一種或多種：功率值、能量值、直達(dá)混響比、信噪比等進(jìn)行選擇，以能量值為例：即可以選能量值最大的p個固定波束，p值一般由實際應(yīng)用情況或經(jīng)驗確定的，也可以是能量值大于一定閾值的p個固定波束。

獲取當(dāng)前幀的當(dāng)前波束的自適應(yīng)波束輸出后，可以判斷所述語音信號是否結(jié)束，如果未結(jié)束，則根據(jù)預(yù)設(shè)的權(quán)重系數(shù)更新步長確定各參考波束的自適應(yīng)權(quán)重系數(shù)的更新幅度，逐幀更新自適應(yīng)權(quán)重系數(shù)，并在更新后的自適應(yīng)權(quán)重系數(shù)下計算所述待調(diào)整波束的自適應(yīng)波束。

步驟s06，記錄各固定波束方向的語音信號。

在本發(fā)明實施例中，首先形成各固定波束，然后對各固定波束逐幀進(jìn)行自適應(yīng)調(diào)整，以使其它固定波束對當(dāng)前固定波束的影響最小，得到各固定波束方向的語音信號，最終記錄各固定波束方向的語音信號。由于對當(dāng)前波束進(jìn)行自適應(yīng)調(diào)整，消除了當(dāng)前波束中含有的其它固定波束的泄露成分，提高語音記錄的準(zhǔn)確性。

相應(yīng)地，本發(fā)明還實施例提供了一種基于環(huán)形麥克風(fēng)陣列的語音記錄系統(tǒng)，如圖10所示，是該系統(tǒng)的一種結(jié)構(gòu)示意圖。

在本實施例中，所述語音記錄系統(tǒng)可以包括：

信號采集模塊111，用于通過環(huán)形麥克風(fēng)陣列實時采集語音信號，所述環(huán)形麥克風(fēng)陣列包括多個麥克風(fēng)；

頻域轉(zhuǎn)換模塊112，用于將所述語音信號轉(zhuǎn)換為頻域信號；

區(qū)域劃分模塊113，用于對所述環(huán)形麥克風(fēng)陣列所處的空間進(jìn)行扇形劃分，形成多個包含至少一個麥克風(fēng)的扇形區(qū)域；

固定波束形成模塊114，用于生成各扇形區(qū)域的固定波束；

自適應(yīng)調(diào)整模塊115，用于對各固定波束逐幀進(jìn)行自適應(yīng)調(diào)整，以使其它固定波束對當(dāng)前固定波束的影響最小，得到各固定波束方向的語音信號；

記錄模塊116，用于記錄各固定波束方向的語音信號。

具體地，所述自適應(yīng)調(diào)整模塊115包括：

參考波束獲取單元，用于對于每一個固定波束，將該固定波束作為待調(diào)整波束，將該固定波束之外的其它固定波束作為參考波束；

系數(shù)獲取單元，用于獲取當(dāng)前幀各參考波束的自適應(yīng)權(quán)重系數(shù)；

自適應(yīng)計算單元，用于在當(dāng)前幀各參考波束的自適應(yīng)權(quán)重系數(shù)下，計算當(dāng)前幀待調(diào)整波束的自適應(yīng)波束；

調(diào)整波束確定單元，用于根據(jù)當(dāng)前幀各自適應(yīng)波束的二階統(tǒng)計特征確定其中用于權(quán)重系數(shù)調(diào)整的波束；

當(dāng)然，所述語音記錄系統(tǒng)還可以包括：

判斷模塊138，用于判斷所述語音信號是否結(jié)束，如果是，則執(zhí)行記錄模塊116；如果否，則執(zhí)行自適應(yīng)調(diào)整模塊115。

在實際應(yīng)用中，所述自適應(yīng)計算單元包括：

自適應(yīng)波束獲取子單元，用于將去除泄露成分的待調(diào)整波束輸出作為當(dāng)前幀待調(diào)整波束的自適應(yīng)波束。

進(jìn)一步地，所述語音記錄系統(tǒng)還包括：

選擇模塊127，用于從所述待調(diào)整波束的參考波束中選擇至少一個對所述待調(diào)整波束影響大的參考波束作為優(yōu)選參考波束，以便于從所述待調(diào)整波束中剔除優(yōu)選參考波束的泄露成分，其中，影響大的參考波束包括以下任意一種或多種：能量值、功率值、信噪比、直達(dá)混響比最大的指定個數(shù)/大于設(shè)定閾值的參考波束。

需要說明的是，為了改善波束形成性能，所述環(huán)形麥克風(fēng)陣列中的多個麥克風(fēng)為均勻分布或非均勻分布。例如，當(dāng)已知某個方向的說話人數(shù)目明顯多于其它方向的說話人數(shù)目時，可以在該方向設(shè)置的麥克風(fēng)數(shù)量多一些，以提高記錄效果。此外，所述環(huán)形麥克風(fēng)陣列可以為單環(huán)麥克風(fēng)陣列或多環(huán)形麥克風(fēng)陣列，優(yōu)選地，所述環(huán)形麥克風(fēng)陣列為多環(huán)形麥克風(fēng)陣列。麥克風(fēng)越多，自由度越多，可形成的零點個數(shù)越多，故多環(huán)形麥克風(fēng)陣列，可以得到更好的旁瓣效果，以增強(qiáng)麥克風(fēng)陣列采集語音信號的能力。

當(dāng)然，該系統(tǒng)還可以進(jìn)一步包括存儲模塊(未圖示)，用于保存各扇形區(qū)域的麥克風(fēng)的權(quán)重系數(shù)、其它固定波束的自適應(yīng)權(quán)重系數(shù)等參數(shù)。這樣，以方便對接收的語音信號進(jìn)行自動降噪處理，并存儲記錄等相關(guān)信息。

本發(fā)明實施例提供的基于環(huán)形麥克風(fēng)陣列的語音記錄系統(tǒng)，通過頻域轉(zhuǎn)換模塊112將信號采集模塊111獲取的語音信號轉(zhuǎn)換為頻域信號，然后，通過區(qū)域劃分模塊113將所述環(huán)形麥克風(fēng)陣列所處的空間進(jìn)行扇形劃分，形成包含至少一個所述環(huán)形麥克風(fēng)陣列的麥克風(fēng)的各扇形區(qū)域，并由固定波束形成模塊114生成各扇形區(qū)域的固定波束，接著，通過自適應(yīng)調(diào)整模塊115對各固定波束逐幀進(jìn)行自適應(yīng)調(diào)整，以使其它固定波束對當(dāng)前固定波束的影響最小，得到各固定波束方向的語音信號，最終通過記錄模塊116記錄各固定波束方向的語音信號。由于自適應(yīng)調(diào)整模塊115對各固定波束逐幀進(jìn)行自適應(yīng)調(diào)整，以使其它固定波束對當(dāng)前固定波束的影響最小，減小了其余方向信號泄漏過多的問題，提高了用戶體驗效果。

本說明書中的各個實施例均采用遞進(jìn)的方式描述，各個實施例之間相同相似的部分互相參見即可，每個實施例重點說明的都是與其它實施例的不同之處。尤其，對于系統(tǒng)實施例而言，由于其基本相似于方法實施例，所以描述得比較簡單，相關(guān)之處參見方法實施例的部分說明即可。以上所描述的語音記錄系統(tǒng)實施例僅僅是示意性的，其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的，作為單元顯示的部件可以是或者也可以不是物理單元，即可以位于一個地方，或者也可以分布到多個網(wǎng)絡(luò)單元上?？梢愿鶕?jù)實際的需要選擇其中的部分或者全部模塊來實現(xiàn)本實施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動的情況下，即可以理解并實施。

以上對本發(fā)明實施例進(jìn)行了詳細(xì)介紹，本文中應(yīng)用了具體實施方式對本發(fā)明進(jìn)行了闡述，以上實施例的說明只是用于幫助理解本發(fā)明的方法及系統(tǒng)；同時，對于本領(lǐng)域的一般技術(shù)人員，依據(jù)本發(fā)明的思想，在具體實施方式及應(yīng)用范圍上均會有改變之處，綜上所述，本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：王海坤;徐東陽;馬峰;王智國;胡郁;劉慶峰
技術(shù)所有人：訊飛智元信息科技有限公司
我是此專利的發(fā)明人

上一篇：研磨用組合物及其制造方法以及磁研磨方法與流程
上一篇：一種在位測量方法與流程

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機(jī)構(gòu)動力學(xué)與控制
5、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

環(huán)形麥克風(fēng)陣列相關(guān)技術(shù)

麥克風(fēng)陣列語音增強(qiáng)相關(guān)技術(shù)

cad環(huán)形陣列相關(guān)技術(shù)

環(huán)形陣列相關(guān)技術(shù)

cad環(huán)形陣列快捷鍵相關(guān)技術(shù)

ai環(huán)形陣列相關(guān)技術(shù)

cad2014環(huán)形陣列相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于環(huán)形麥克風(fēng)陣列的語音記錄方法及系統(tǒng)與流程