用于音頻信號的處理的方法和裝置與流程

文檔序號：12698285閱讀：225來源：國知局

技術領域

本發(fā)明涉及用于音頻信號的處理的裝置。本發(fā)明進一步涉及，但不限于，用于在音頻設備中處理音頻和語音信號的裝置。

背景技術：

電信裝置中，麥克風或麥克風陣列典型地用于捕獲聲波，并將他們作為表示隨后可被處理并發(fā)送至其他設備或被存儲用以稍后回放的音頻或語音的電子信號輸出。目前，技術允許使用麥克風陣列中的多個麥克風來捕獲聲波，并且可將來自每個麥克風的結果音頻信號傳送至音頻處理器，以協(xié)助隔離期望的聲波。

通過高級的處理功能，可使用兩個或更多個麥克風，其中以應用于來自每個麥克風的音頻信號的可變增益和延遲因子的方式進行自適應濾波，以嘗試對麥克風陣列接收模式波束成形。換句話說，波束成形生成可調(diào)整的音頻敏感概況(profile)。

盡管對接收的音頻信號波束成形可協(xié)助提高來自背景噪聲的語音信號的信噪比，但是他對于麥克風陣列裝置和信號源的相對位置特別敏感。因此，裝置典型地設計有麥克風，并且具有寬的波束成形意味著全向聲音提取和低增益不敏感記錄，從而響亮的聲音不切斷系統(tǒng)。

此外，用于電子設備的視頻和音頻記錄或捕獲正變得普遍。隨著電子設備上圖像記錄質(zhì)量日益增加，他們變得更加可接受地用于事件(例如，音樂演奏會、家庭事件等)的每日記錄，這些事件之前需要使用專用的音頻和視頻記錄裝置。

移動裝置上的典型的視頻記錄功能使得用戶能夠快速調(diào)整圖像質(zhì)量或改變相機，從而用戶可放大或縮小(使用數(shù)字或光學或數(shù)字光學縮放技術的組合)，或可改變其他記錄參數(shù)，例如閃光、圖像亮度或?qū)Ρ榷鹊?。這些參數(shù)中任一個的改變的結果在這樣的實現(xiàn)方式下可被用戶清楚地看到，這樣，可快速地抓住差質(zhì)量的視頻捕獲并且調(diào)整參數(shù)以生成改進的記錄。然而，音頻記錄功能沒有趕上這樣的改進。典型地，音頻記錄裝置的用戶或操作者在技術上不知道正被記錄的聲音屬性，因此可能不知道聲音電平或聲音來自哪個方向，因此不能在差的或不精確的音頻記錄在機型中時抓住，所以無法選擇或調(diào)整設備的記錄功能以改進記錄。此外，即使當裝置已經(jīng)設計為向用戶提供某些協(xié)助，他通常以用戶無法與其交互的方式來顯示。

此外，傳統(tǒng)的視頻記錄設備典型地嘗試生成一種音頻捕獲裝置，其對于方位的范圍并且在相機指向的方向具有靜態(tài)概況。這樣的裝置中，難以分離視頻記錄的方向，換句話說，相機朝向的方向、以及視頻記錄裝備的方向/方位和概況。例如，通常將典型的視頻記錄器設計為僅在相同方向記錄視頻和音頻。

本發(fā)明考慮到信息的使用可在音頻記錄的控制下協(xié)助裝置，因此例如通過精確的音頻概況化協(xié)助所捕獲的音頻信號的噪聲的降低。

技術實現(xiàn)要素：

本發(fā)明的實施例旨在解決上述問題。

根據(jù)本發(fā)明的第一方面，提供一種方法，包括：提供與至少一個音頻信號相關的至少一個音頻參數(shù)的視覺表示；經(jīng)由接口檢測與所述音頻參數(shù)的視覺表示的交互；以及依據(jù)所述交互處理與所述音頻參數(shù)相關的所述至少一個音頻信號。

提供與至少一個音頻信號相關的至少一個音頻參數(shù)的視覺表示包括以下步驟的至少一個：確定所述至少一個音頻信號的捕獲聲壓電平；確定用于所述至少一個音頻信號的音頻波束成形概況；確定用于所述至少一個音頻信號的至少一個頻帶的音頻信號概況；以及確定與所述至少一個音頻信號有關的錯誤條件。

當所述參數(shù)是所述至少一個音頻信號的捕獲聲壓電平時提供與至少一個音頻信號相關的至少一個音頻參數(shù)的視覺表示包括以下步驟的至少一個：將當前捕獲聲壓電平作為當前電平來顯示；以及將用于預定時間段的峰值捕獲聲壓電平作為峰值電平來顯示。

控制與所述音頻參數(shù)相關的所述至少一個音頻信號的處理包括：改變所述至少一個音頻信號捕獲的增益。

當所述參數(shù)是用于所述至少一個音頻信號的音頻波束成形概況時提供與至少一個音頻信號相關的至少一個音頻參數(shù)的視覺表示包括以下步驟的至少一個：將所述音頻波束成形概況作為表示音頻波束成形角度的圓弧段來顯示；以及將所述音頻波束成形概況作為與反映視頻記錄角度的其他圓弧段相對的表示音頻波束成形角度的圓弧段來顯示。

當所述參數(shù)是用于所述至少一個音頻信號的至少一個頻帶的音頻信號概況時提供與至少一個音頻信號相關的至少一個音頻參數(shù)的視覺表示包括以下步驟的至少一個：顯示所述至少一個音頻信號的平均方位；顯示峰值聲壓電平音頻信號方位；顯示表示與段相關的角度的至少一個音頻信號的聲壓電平的所述段，其中所述段的半徑取決于所述聲壓電平；以及顯示表示所述至少一個音頻信號的聲壓電平的至少一個輪廓，其中所述輪廓半徑取決于所述聲壓電平。

控制與所述音頻參數(shù)相關的所述至少一個音頻信號的處理包括：改變所述音頻波束成形角度的方位或概況寬度。

所述波束成形角度定義關于所述至少一個音頻信號的空間過濾的中心點的角度。

當所述參數(shù)是與所述至少一個音頻信號有關的錯誤條件時提供與至少一個音頻信號相關的至少一個音頻參數(shù)的視覺表示包括以下步驟的至少一個：顯示剪輯警報；顯示所述至少一個音頻信號的捕獲錯誤條件；以及顯示與所述至少一個音頻信號的捕獲相關的硬件錯誤。

控制與所述音頻參數(shù)相關的所述至少一個音頻信號的處理包括以下步驟的至少一個：改變所述音頻波束成形角度的方位或概況寬度；改變所述至少一個音頻信號的增益；以及改變記錄模式。

根據(jù)本發(fā)明的第二方面，提供一種裝置，包括至少一個處理器和含有計算機程序代碼的至少一個存儲器，所述至少一個存儲器和計算機程序代碼被配置為，通過所述至少一個處理器，使得所述裝置至少執(zhí)行以下步驟：提供與至少一個音頻信號相關的至少一個音頻參數(shù)的視覺表示；經(jīng)由接口檢測與所述音頻參數(shù)的視覺表示的交互；以及依據(jù)所述交互處理與所述音頻參數(shù)相關的所述至少一個音頻信號。

提供與至少一個音頻信號相關的至少一個音頻參數(shù)的視覺表示使得所述裝置至少執(zhí)行以下步驟的至少一個：確定所述至少一個音頻信號的捕獲聲壓電平；確定用于所述至少一個音頻信號的音頻波束成形概況；確定用于所述至少一個音頻信號的至少一個頻帶的音頻信號概況；以及確定與所述至少一個音頻信號有關的錯誤條件。

當所述參數(shù)是所述至少一個音頻信號的捕獲聲壓電平時提供與至少一個音頻信號相關的至少一個音頻參數(shù)的視覺表示使得所述裝置至少執(zhí)行以下步驟的至少一個：將當前捕獲聲壓電平作為當前電平來顯示；以及將用于預定時間段的峰值捕獲聲壓電平作為峰值電平來顯示。

控制與所述音頻參數(shù)相關的所述至少一個音頻信號的處理使得所述裝置至少執(zhí)行以下步驟：改變所述至少一個音頻信號捕獲的增益。

當所述參數(shù)是用于所述至少一個音頻信號的音頻波束成形概況時提供與至少一個音頻信號相關的至少一個音頻參數(shù)的視覺表示使得所述裝置至少執(zhí)行以下步驟的至少一個：將所述音頻波束成形概況作為表示音頻波束成形角度的圓弧段來顯示；以及將所述音頻波束成形概況作為與反映視頻記錄角度的其他圓弧段相對的表示音頻波束成形角度的圓弧段來顯示。

當所述參數(shù)是用于所述至少一個音頻信號的至少一個頻帶的音頻信號概況時提供與至少一個音頻信號相關的至少一個音頻參數(shù)的視覺表示使得所述裝置至少執(zhí)行以下步驟的至少一個：顯示所述至少一個音頻信號的平均方位；顯示峰值聲壓電平音頻信號方位；顯示表示與段相關的角度的至少一個音頻信號的聲壓電平的所述段，其中所述段的半徑取決于所述聲壓電平；以及顯示表示所述至少一個音頻信號的聲壓電平的至少一個輪廓，其中所述輪廓半徑取決于所述聲壓電平。

控制與所述音頻參數(shù)相關的所述至少一個音頻信號的處理使得所述裝置至少執(zhí)行以下步驟：改變所述音頻波束成形角度的方位或概況寬度。

所述波束成形角度定義關于所述至少一個音頻信號的空間過濾的中心點的角度。

當所述參數(shù)是與所述至少一個音頻信號有關的錯誤條件時提供與至少一個音頻信號相關的至少一個音頻參數(shù)的視覺表示使得所述裝置至少執(zhí)行以下步驟：顯示剪輯警報；顯示所述至少一個音頻信號的捕獲錯誤條件；以及顯示與所述至少一個音頻信號的捕獲相關的硬件錯誤。

控制與所述音頻參數(shù)相關的所述至少一個音頻信號的處理使得所述裝置至少執(zhí)行以下步驟的至少一個：改變所述音頻波束成形角度的方位或概況寬度；改變所述至少一個音頻信號的增益；以及改變記錄模式。

根據(jù)本發(fā)明的第三方面，提供一種裝置，包括：顯示器處理器，配置為提供與至少一個音頻信號相關的至少一個音頻參數(shù)的視覺表示；交互視頻接口，配置為確定與所述音頻參數(shù)的視覺表示的交互；以及音頻處理器，配置為依據(jù)所述交互處理與所述音頻參數(shù)相關的所述至少一個音頻信號。

顯示器處理器還被配置為確定以下內(nèi)容的至少一個：所述至少一個音頻信號的捕獲聲壓電平；用于所述至少一個音頻信號的音頻波束成形概況；用于所述至少一個音頻信號的至少一個頻帶的音頻信號概況；以及與所述至少一個音頻信號有關的錯誤條件。

顯示器處理器可當所述參數(shù)是所述至少一個音頻信號的捕獲聲壓電平時進一步顯示以下內(nèi)容的至少一個：將當前捕獲聲壓電平作為當前電平來顯示；以及將用于預定時間段的峰值捕獲聲壓電平作為峰值電平來顯示。

所述處理器可被配置為改變所述至少一個音頻信號捕獲的增益。

顯示器處理器還被配置為確定以下內(nèi)容的至少一個：將所述音頻波束成形概況作為表示音頻波束成形角度的圓弧段；將所述音頻波束成形概況作為與反映視頻記錄角度的其他圓弧段相對的表示音頻波束成形角度的圓弧段。

顯示器處理器可當所述參數(shù)是用于所述至少一個音頻信號的至少一個頻帶的音頻信號概況時顯示以下內(nèi)容的至少一個：所述至少一個音頻信號的平均方位；峰值聲壓電平音頻信號方位；表示與段相關的角度的至少一個音頻信號的聲壓電平的所述段，其中所述段的半徑取決于所述聲壓電平；以及表示所述至少一個音頻信號的聲壓電平的至少一個輪廓，其中所述輪廓半徑取決于所述聲壓電平。

所述處理器可改變所述音頻波束成形角度的方位或概況寬度。

所述波束成形角度定義關于所述至少一個音頻信號的空間過濾的中心點的角度。

顯示器處理器還可被配置為顯示以下內(nèi)容的至少一個：剪輯警報；所述至少一個音頻信號的捕獲錯誤條件；以及與所述至少一個音頻信號的捕獲相關的硬件錯誤。

所述處理器可被配置為改變以下內(nèi)容的至少一個：所述音頻波束成形角度的方位或概況寬度；所述至少一個音頻信號的增益；以及記錄模式。

根據(jù)本發(fā)明的第四方面，提供一種裝置，包括：處理部件，配置為提供與至少一個音頻信號相關的至少一個音頻參數(shù)的視覺表示；接口處理部件，配置為經(jīng)由接口檢測與所述音頻參數(shù)的視覺表示的交互；以及音頻處理部件，配置為依據(jù)所述交互處理與所述音頻參數(shù)相關的所述至少一個音頻信號。

根據(jù)本發(fā)明的第五方面，提供一種通過指令編碼的計算機可讀介質(zhì)，當計算機執(zhí)行時其執(zhí)行以下步驟：提供與至少一個音頻信號相關的至少一個音頻參數(shù)的視覺表示；經(jīng)由接口檢測與所述音頻參數(shù)的視覺表示的交互；以及依據(jù)所述交互處理與所述音頻參數(shù)相關的所述至少一個音頻信號。

一種電子設備可包括上述裝置。

一種芯片可包括上述裝置。

附圖說明

為了更好地理解本發(fā)明，現(xiàn)在通過實例參照附圖，其中：

圖1示意性示出采用本申請的實施例的裝置；

圖2更詳細地示意性示出圖1中所示的裝置；

圖3示意性示出根據(jù)一些實施例的視覺化音頻參數(shù)的裝置和實例；

圖4更詳細地示意性示出實例的視覺化音頻參數(shù)；

圖5示意性示出根據(jù)其他一些實施例的實例的視覺化的音頻參數(shù)；

圖6示意性示出展現(xiàn)本申請的一些實施例的操作的流程圖；以及

圖7示出根據(jù)本申請的一些實施例的聲音定向參數(shù)視覺化的實例。

具體實施方式

下文描述了提供在麥克風陣列中提高音頻捕獲和記錄靈活性的裝置和方法。由此，首先參照圖1，其示出示例性電子設備10或裝置的示意性框圖，其可結合增強的音頻信號捕獲性能分量和方法。

裝置10例如可以是用于無線通信系統(tǒng)的移動終端或用戶裝備。其他實施例中，裝置可以是音頻播放器，例如mp3播放器或媒體播放器，配備有適當?shù)柠溈孙L陣列和傳感器，如下所述。

在一些實施例中，裝置10包括處理器21。處理器21可配置為執(zhí)行各個程序代碼。實現(xiàn)的程序代碼可包括音頻捕獲/記錄提高代碼。

實現(xiàn)的程序代碼23可例如存儲于存儲器22中，用于每當需要時又處理器21提取。存儲器22可進一步提供用于存儲數(shù)據(jù)的段24，例如，根據(jù)實施例處理了的數(shù)據(jù)。

實施例中，音頻捕獲/記錄提高代碼可至少部分地以硬件或固件實現(xiàn)。

在一些實施例中，處理器21可經(jīng)由數(shù)模轉(zhuǎn)換器(DAC)32鏈接至揚聲器33。

數(shù)模轉(zhuǎn)換器(DAC)32可以是任意適合的轉(zhuǎn)換器。

揚聲器33例如可以是用于為用戶的耳朵生成從DAC 32輸出的電子音頻信號生成的聲波的任意適當音頻變換器裝備。在一些實施例中，揚聲器33可以是耳機或回放揚聲器，并且可經(jīng)由頭戴式耳機連接器鏈接至電子設備10。在一些實施例中，揚聲器33可包括DAC 32。此外，在一些實施例中，揚聲器33可無線地鏈接至電子設備10，例如，通過使用如藍牙A2DP簡檔闡述的低功率射頻連接。

處理器21進一步鏈接至收發(fā)器(TX/RX)13，鏈接至用戶接口(UI)15以及存儲器22。

用戶接口15可使得用戶例如經(jīng)由鍵板向電子設備10輸入命令，和/或例如經(jīng)由顯示器(未示出)從電子設備10獲得信息。此外，可理解，在一些實施例中，用戶接口可以是輸入和顯示技術的任意適當組合，例如，適用于從用戶接收輸入和向用戶顯示信息的觸摸屏顯示器。

收發(fā)器13可以是任何適當?shù)耐ㄐ偶夹g，并且被配置為能夠例如經(jīng)由無線通信網(wǎng)絡與其他電子設備通信。

在一些實施例中，裝置10還可在麥克風陣列11中包括至少兩個麥克風，根據(jù)本申請的實施例用于輸入或捕獲聲波并輸出要處理的音頻或語音信號。根據(jù)一些實施例，音頻或語音信號可經(jīng)由收發(fā)器13發(fā)送至其他電子設備或可存儲于存儲器22的數(shù)據(jù)部分24用于稍后處理。

為此，用戶可經(jīng)由用戶接口15激活使用至少兩個麥克風控制音頻信號的捕獲的相應程序代碼或硬件。這樣的實施例中，裝置10還可包括數(shù)模轉(zhuǎn)換器(ADC)14，其被配置為將來自麥克風陣列11的輸入模擬音頻信號轉(zhuǎn)換成數(shù)字音頻信號并向處理器21提供數(shù)字音頻信號。

在一些實施例中，裝置10可從電子設備上沒有物理實現(xiàn)的麥克風陣列11接收音頻信號。例如，在一些實施例中，揚聲器33裝置可包括麥克風陣列。然后，揚聲器33裝置可發(fā)送來自麥克風陣列11的音頻信號，因此裝置10可經(jīng)由收發(fā)器從另一電子設備接收具有相應編碼的音頻數(shù)據(jù)的音頻信號比特流。

在一些實施例中，處理器21可執(zhí)行存儲器22中存儲的音頻捕獲/記錄增強程序代碼。這些實施例中，處理器21可處理接收的音頻信號數(shù)據(jù)，并輸出處理后的音頻數(shù)據(jù)。

在一些實施例中，也可代替立即處理，將接收的音頻數(shù)據(jù)存儲于存儲器22的數(shù)據(jù)段24中，例如，用于稍后處理和呈現(xiàn)或向另一電子設備轉(zhuǎn)發(fā)。

此外，電子設備可包括傳感器或傳感器庫16。傳感器庫16接收關于電子設備10正在運行的環(huán)境的信息，并將該信息傳送至處理器21，以影響音頻信號的處理，并且特別地，在音頻捕獲/記錄應用中影響處理器21。傳感器庫16可包括以下傳感器組的至少一個。

在一些實施例中，傳感器庫16可包括相機模塊。在一些實施例中，相機模塊包括至少一個相機，其具有將圖像聚焦于例如電荷耦合器件(CCD)的數(shù)字圖像捕獲裝置的鏡頭。在其他實施例中，數(shù)字圖像捕獲裝置可以是任意適合的圖像捕獲設備，例如互補金屬氧化物半導體(CMOS)圖像傳感器。在一些實施例中，相機模塊還包括閃光燈，其用于在捕獲對象的圖像之前照明對象。在這樣的實施例中，閃光燈鏈接至用于控制閃光燈的操作的相機處理器。在其他實施例中，相機可被配置為執(zhí)行用于低周邊光感測的紅外和近紅外感測。至少一個相機也可鏈接至用于在將處理后的圖像傳送至處理器之前處理從至少一個相機接收的信號的相機處理器。相機處理器可鏈接至可存儲用于相機處理器在捕獲圖像時執(zhí)行的程序代碼的本地相機存儲器。此外，在一些實施例中，可使用本地相機存儲器作為用于在本地處理之前和期間存儲捕獲的圖像的緩沖器。在一些實施例中，相機處理器和相機存儲器分別在處理器21和存儲器22中實現(xiàn)。

此外，在一些實施例中，相機模塊可在回放揚聲器裝置上物理地實現(xiàn)。

在一些實施例中，傳感器庫16包括位置/方位傳感器。在一些實施例中，方位傳感器可通過數(shù)字羅盤或固態(tài)羅盤實現(xiàn)，其被配置為確定電子設備對于水平軸的方位。在一些實施例中，位置/方位傳感器可以是重力傳感器，其被配置為輸出電子設備對于垂直軸的方位。重力傳感器例如可實現(xiàn)為以到垂直的各個角度設置的水銀開關的陣列，其中開關的輸出指示電子設備對于垂直軸的角度。在一些其他實施例中，位置/方位傳感器可以是加速度計或回轉(zhuǎn)儀。

也可理解，裝置10的結構可通過許多方式補充和改變。

可理解，圖2至5所述的示意性結構和圖6中的方法步驟僅代表包括圖1中所示的電子設備中實現(xiàn)的示例性所示的一些實施例的完整音頻捕獲/記錄鏈條的部分操作。

關于圖2和圖6，更詳細地示出實現(xiàn)和操作的應用的一些實施例。

關于圖2，對于本申請的一些實施例中采用的組件更詳細地示出裝置10的示意圖。

此外，關于圖6，示出本申請的一些實施例中可采用的一系列操作的流程圖。

在一些實施例中，本申請向裝置的用戶或操作者提供一種交互靈活的音頻和/或音頻視覺記錄方案。在這些實施例中，用戶接口15可通過實時測量和顯示聲域(sound field)向用戶提供來自記錄的音頻信號的所需的信息，從而裝置的操作者或用戶可理解正在記錄什么。此外，在一些實施例中，使用相同的用戶接口，裝置的操作者也可實時調(diào)整參數(shù)，因此可調(diào)整記錄的聲域，由此避免記錄或捕獲差質(zhì)量的音頻信號。

在一些實施例中，先前描述的裝置包括麥克風的陣列(至少兩個)。同樣先前所述的麥克風陣列11被配置為輸出來自陣列中的每個麥克風的捕獲的音頻信號。然后，在一些實施例中，音頻信號可被傳送至模數(shù)轉(zhuǎn)換器14。然后，模數(shù)轉(zhuǎn)換器可連接至波束成形器和增益控制處理器101。在一些實施例中，如圖2所示，每個麥克風可實現(xiàn)為數(shù)字麥克風，換句話說，具有集成的模數(shù)轉(zhuǎn)換器，并且來自每個麥克風的輸出直接輸出至波束成形器和增益控制處理器101。

可理解，盡管以下實例描述了音頻信號的捕獲，在一些其他實施例中可將相同的裝置配置為例如在存儲器22中存儲捕獲的音頻信號，或經(jīng)由收發(fā)器13將捕獲的音頻信號發(fā)送至其他裝置。

圖6中，通過步驟501示出初始化麥克風陣列的操作。

在一些實施例中，波束成形和增益控制處理器101接收來自麥克風陣列的音頻信號，并且被配置為對于來自相關的麥克風陣列的音頻信號執(zhí)行濾波或波束成形操作?？蓪崿F(xiàn)任意適當?shù)囊纛l信號波束成形操作。此外，在一些實施例中，波束成形和增益控制處理器101被配置為生成應用于從麥克風陣列中的“n”個麥克風接收的音頻信號的初始加權矩陣。

在一些實施例中，波束成形和增益控制處理器101可接收相機傳感器信息并生成初始波束成形和增益控制參數(shù)，從而麥克風陣列嘗試捕獲具有相同概況(方向和擴展)的音頻信號，作為視頻相機。

圖6中，通過步驟503示出初始波束成形和增益控制的操作。

在一些實施例中，波束成形和增益控制處理器101可進一步混合波束成形后的音頻信號，以生成“k”個不同的音頻通道。例如，波束成形和增益控制可將數(shù)目“n”個麥克風音頻信號數(shù)據(jù)流混合到數(shù)目“k”個音頻通道中。例如，在一些實施例中，波束成形器和增益控制器101可通過兩個音頻通道輸出立體聲信號輸出。在其他實施例中，可生成單通道或多通道輸出。例如，波束成形和增益控制處理器可通過6個音頻通道將波束成形的音頻流混合成5.1音頻輸出，或任意適合的通道組合輸出。在這些實施例中，波束成形和增益控制處理器101使用任意適當技術以生成這些音頻通道輸出。

在一些實施例中，如圖2所示，波束成形和增益控制處理器101可將混合后的波束成形信號輸出至音頻編解碼器103。此外，如圖2所示，在一些實施例中，波束成形和增益控制處理器可執(zhí)行第二混合，并將第二混合的“m”通道輸出至音頻表征視覺化處理器105。

在一些實施例中，音頻編解碼器103可處理音頻通道數(shù)據(jù)，以編碼音頻通道，生成適合于存儲或傳輸?shù)母行Ь幋a的數(shù)據(jù)流。音頻編解碼器103可采用任意適合的音頻編解碼操作，例如MPEG-4AAC LC、Enhanced aacPlus(還已知為AAC+、MPEG-4HE AAC v2)、Dolby Digital(還已知為AC-3)、和DTS。根據(jù)該實施例，音頻編解碼器103可被配置為將編碼后的音頻流輸出至存儲器22，或使用收發(fā)器13發(fā)送編碼后的音頻流，或在某個稍后日期解碼音頻流并經(jīng)由數(shù)目轉(zhuǎn)換器32將音頻流傳遞至回放揚聲器33。

在一些實施例中，音頻表征視覺化處理器105被配置為關于來自波束成形和增益控制處理器101的混合后的輸出信號執(zhí)行音頻參數(shù)評估方面的測試。例如，在一些實施例中，音頻表征視覺化處理器105可關于接收的音頻信號執(zhí)行電平確定計算。換句話說，計算捕獲的音頻信號的能量值。此外，在一些實施例中，音頻表征視覺化處理器105確定峰值電平，換句話說，對于先前(預定)時間段的最高電平。

在一些實施例中，音頻表征視覺化處理器105計算從波束成形的音頻信號輸入的音頻信號的方向。例如，在一些實施例中，對于每個通道輸出計算波束成形的麥克風陣列音頻信號能量電平，以生成近似音頻方向。

在一些其他實施例中，音頻表征視覺化處理器105還可對于接收的音頻信號檢查非最佳捕獲事件。例如，音頻表征視覺化處理器105可確定當前電平或峰值電平是否達到高值，其中當前記錄增益設置太高并且記錄變形或“剪輯”，因為最大振幅不能夠被精確編碼或捕獲。

類似地，音頻表征視覺化處理器105可確定接收的音頻信號的主角使得麥克風陣列沒有最佳地用于記錄或捕獲音頻信號。例如，如果麥克風的物理配備使得他們無法直接接收聲波。在這樣的實例中，某些方向或方位難以檢測并且可被指示，但是在這樣的實施例中，指示可能是穩(wěn)定的并且不變。此外，這樣的情形不會因為原始麥克風陣列設計。例如，可建立阻擋的或陰影的區(qū)域，其中用戶阻擋某些麥克風，例如，在一些實施例中，通過可被檢測和指示的手指。類似地，可指示陣列中的故障麥克風。

圖6中，通過步驟505示出例如電平確定、或峰值電平確定的至少一個音頻參數(shù)的計算。

此外，在一些實施例中，音頻表征視覺化處理器105可根據(jù)例如電平、峰值電平、和方向參數(shù)的音頻特征生成這些值的視覺化。

圖6中，通過步驟507示出視覺化計算。

然后，這些視覺化元素可傳遞至用戶接口顯示元件111，向裝置的操作者顯示。圖6中，通過步驟509示出顯示音頻特征的操作。

對于圖3，示出音頻參數(shù)的視覺化的顯示的實例。裝置10包括用戶接口15，和具體地用戶接口顯示元件。在用戶接口顯示器上顯示相機捕獲的圖像，在圖像上覆蓋了音頻特征視覺化201。對于圖4，更詳細地示出音頻特征視覺化的實例。音頻特征視覺化201包括聲壓電平視覺化307，其向裝置的用戶指示由裝置捕獲的當前和峰值音量電平。例如，當前音量電平可由第一條長度來指示，以及峰值音量電平可由背景條長度來指示。在一些實施例中，聲壓電平視覺化也可示出“增益”電平——應用于來自麥克風陣列的接收的音頻信號的當前增益。

此外，在一些實施例中，音頻特征視覺化包括聲音方向性指示符，其提供所捕獲的音頻信號的方向的指示。在一些實施例中，這可通過指示峰值音量來自哪個方向的羅盤點或向量來指示。在一些實施例中，可通過使用表示音頻信號的主頻率的不同顏色顯示羅盤點，來使用聲音方向性指示符以進一步指示記錄的聲音的頻率。

對于圖7，示出根據(jù)一些實施例的方向性指示符視覺化。示出上述羅盤方向性指示符601，其中羅盤點指示的方向指示峰值功率方向，或在一些實施例中，可通過其他適當方式實現(xiàn)平均功率指示符。在一些實施例中，也可在聲音方向性指示符305上指示不同可識別的“聲音源”的聲音方向性。例如，在這些實施例中，可使用相對線長度來顯示聲音源的各個相對振幅值，從而在第一方向用長線指示響亮的聲音源603a，在各個其他方向用更短的線長度指示兩個其他聲音源603b和603c。

在一些實施例中，還如圖7所示，可將音頻電平信息規(guī)則扇區(qū)，并且在這些顯示的扇區(qū)的每個中檢測和捕獲聲音電平。4個扇區(qū)605a、605b、605c和605d示出來自這些扇區(qū)的聲音的相對振幅，其中扇區(qū)半徑的長度取決于在該方向的扇區(qū)內(nèi)的相對音量。

此外，如圖7所示，在一些實施例中，扇區(qū)可以是不規(guī)則形狀。圖7示出指示第一區(qū)域的聲音方向性的第一不規(guī)則扇區(qū)607a；具有更高但更窄概況的第二不規(guī)則扇區(qū)607b，因此其指示非常本地化的聲音源；具有更低音量但是更大外形面積的第三不規(guī)則扇區(qū)607c，因此其可指示類似寬噪音的聲音源。

此外，在一些實施例中，圖7中還示出的方向性指示符視覺化示出輪廓組。每個輪廓對應于一定的頻率或頻帶以及從對應于聲音電平的中心與電平格/測量有關的距離。

在一些實施例中，音頻特征視覺化204還可包括波束成形的概況形式的當前波束成形配置的指示符。例如，如圖4所示，波束成形配置指示符303的音頻概況特征視覺化示出指示符扇區(qū)，其代表圓弧概況形式的由波束成形操作覆蓋的概況。例如，波束成形為全向(和360度)的圓弧概況也是360度。在一些實施例中，可顯示波束成形方向概況，以例如通過線的厚度或圓弧的面積或通過增益之間的顏色差來顯示相對波束成形增益。

在一些實施例中，還對于瀏覽概況視覺化301示出事件概況特征視覺化。瀏覽概況視覺化301示出由相機捕獲的當前瀏覽角度，并且可表示為圍繞中心視覺化部分的另一圓弧。因此，在一些實施例中，瀏覽概況視覺化301可依據(jù)對相機應用的縮放量來改變，從而縮放越大，瀏覽角度301越窄。

對于圖5，示出音頻特征視覺化的另一實例。這個實例中，音頻概況特征視覺化303指示波束成形焦點遠窄于瀏覽角度301。此外，對于圖5，示出音頻視覺化特征可包括可顯示警報消息401的文本信息。這個實例中，警報消息指示在音頻捕獲處理中存在剪輯或聲音變形的高可能性。

先前所述的用戶接口15還可用于提供輸入。例如，使用在用戶接口顯示器111上顯示的音頻特征視覺化，例如使用觸摸屏，用戶可提供隨后可控制音頻信號處理的輸入。

圖6中，通過步驟511示出使用用戶接口輸入113對輸入的檢測。

例如，在一些實施例中，裝置可依據(jù)在(聲壓電平)SPL條指示符307上感測的輸入調(diào)整增益控制。例如，觸控處理器107可檢測或確定觸摸屏上的輸入，其中輸入移動并朝向條的底部，通過向波束成形和增益控制處理器101輸出增益控制信號使得增益減小，而在檢測到輸入向上時觸控處理器107將通過向波束成形和增益控制處理器101輸出增益控制信號向上調(diào)整增益。這樣的實施例中，用戶接口輸入可通過觸控禮券107來處理，其被配置為在檢測到任意適合的識別輸入時向波束成形和增益控制處理器101輸出相關的控制信號。

圖6中，通過步驟513示出增益電平的調(diào)整的操作。然后，將通過隨后被視覺化的音頻特征來反映增益電平的任何調(diào)整。

此外，在一些實施例中，通過檢測到接近于音頻角度指示符的輸入，也可改變波束成形概況。例如，在觸摸屏上使用“多點觸摸”，在檢測到多個輸入的擠壓或打開，觸控處理器107可向波束成形和增益控制處理器101輸出控制信號，分別縮窄或擴寬波束成形概況。在一些其他實施例中，可使用觸控處理器107檢測的單獨輸入，通過向波束成形和增益控制處理器101發(fā)送的類似控制信號來改變波束成形的“中心”的方位。

這些實施例中，在檢測到指示波束成形改變請求的任何適當輸入時，觸控處理器107可隨后向波束成形和增益控制處理器101輸出適當?shù)目刂菩盘枺哉{(diào)整波束成形特征。

圖6中，通過步驟517示出波束成形特征的調(diào)整。然后，該操作向回循環(huán)，以進一步確定音頻信號的新電平和峰值電平確定。

此外，在一些實施例中，傳感器16可向波束成形和增益控制處理器101提供輸入。例如，在一些實施例中，裝置可希望保持聚焦于特定音頻方向，其方位不同于視頻角度方向。例如，在裝置記錄來自舞臺區(qū)的方向的音頻時，如圖3所示，但是隨后移動將裝置10的角度改變?yōu)榫劢褂诹硪蝗嘶驅(qū)ο?，但是仍舊保持從舞臺的音頻記錄。這樣的實施例中，傳感器可提供裝置的位置或方位的指示，其可用于檢測裝置的改變并因此控制波束成形操作。

因此，這些實施例中，相機位置的改變可使得波束成形和增益控制處理器101依據(jù)傳感器值調(diào)整瀏覽角度或波束成形參數(shù)，以保持在先前方向的音頻記錄。方位的這個改變也可通過視覺化處理器105來指示，其中顯示瀏覽角度和音頻角度的改變。

此外，可使用相機形式的傳感器來控制捕獲的音頻信號的波束成形和增益控制和/或音頻特征的視覺化。例如，在檢測到縮放的調(diào)整時相機的電平可進一步用作對于波束成形和增益控制處理器101的控制輸入。在一些實施例中，若將音頻角度關聯(lián)至瀏覽角度，當在波束成形中使用更窄角度中的相機縮放時或當相機取消縮放成更寬角度時，波束成形變寬。在其他實施例中，將瀏覽概況信息傳送至音頻特征視覺化處理器105，以計算和顯示音頻和視頻概況之間的正確概況關系。

因此，這樣的實施例中，可向用戶提供足夠信息，以作出智能的決定和控制機制，因此避免生成差質(zhì)量的音頻記錄。

此外，本申請的實施例圖形化示出在裝置周圍對于“音頻圖片”發(fā)生了什么以及與“音頻圖片”相關地當前音頻記錄參數(shù)是什么。使用這個信息，該裝置可被配置為這樣調(diào)整例如波束寬度和增益的音頻記錄參數(shù)，從而他們適合于當前記錄。

因此，例如，若該裝置被操作為記錄一大組參與者前方的呈現(xiàn)，該裝置可這樣操作以使用窄(但是高增益)的波束成形概況捕獲近來自參與者的語音，因此避免其他聲音源干擾語音的捕獲的可能性。

可理解，在一些實施例中，波束成形和增益控制處理器111、和/或特征確定和視覺化處理器105和/或觸控處理器107可實現(xiàn)為程序或處理器21的一部分。在一些其他實施例中，以上處理器可實現(xiàn)為硬件。

盡管對于作為增益或波束寬度的參數(shù)的控制描述了上述控制方法，但是本領域技術人員可理解，可根據(jù)顯示的信息改變其他捕獲或記錄參數(shù)。例如，在一些實施例中，可顯示信息，并且能夠被控制以改變記錄模式。記錄模式的改變可包括作為頻率濾波主頁的控制慚怍。例如，當注意到低頻率噪聲時，該裝置可提供建議或允許控制捕獲概況對麥克風信號高通濾波。在一些其他實施例中，記錄模式的改變可涉及在不同混音之間切換，以基于顯示的信息生成一個混音。例如，捕獲的立體聲信號可能由于噪聲電平而不被接受，并且該裝置可建議切換至單一信號捕獲模式。類似地，若信號電平足以使得多通道音頻捕獲處理，該裝置可通過顯示這個信息建議捕獲多通道混音，例如5.1音頻混音、或2.0立體聲混音。

因此，至少一個實施例中，提供一種方法，包括：提供與至少一個音頻信號相關的至少一個音頻參數(shù)的視覺表示；經(jīng)由接口檢測與所述音頻參數(shù)的視覺表示的交互；以及依據(jù)所述交互處理與所述音頻參數(shù)相關的所述至少一個音頻信號。

盡管以上實例描述了在電子設備10或裝置中操作的本發(fā)明的實施例，但是可理解，以下描述的本發(fā)明可實現(xiàn)為任意音頻處理器的一部分。因此，例如，本發(fā)明的實施例可實現(xiàn)于音頻處理器中，其可在固定或有線通信路徑的音頻處理。

因此，用戶設備可包括例如在上述本發(fā)明實施例中描述的音頻處理器。

可理解，術語“電子設備”和“用戶裝備”旨在覆蓋任意適合類型的無線用戶裝備，例如移動電話、便攜式數(shù)據(jù)處理設備或便攜式web瀏覽器。

一般地，本發(fā)明的各個實施例可實現(xiàn)于硬件或?qū)Ｓ秒娐?、軟件、邏輯或其任意組合中。例如，某些方面可實現(xiàn)于硬件中，而其他方面可實現(xiàn)于可由控制器、微處理器或其他計算設備執(zhí)行的估計或軟件中，但是本發(fā)明不限于此。盡管可將本發(fā)明的各個方面示例和描述為框圖、流程圖、或使用某些其他圖形表示，但是可很好地理解，這里所述的這些框圖、裝置、系統(tǒng)、技術或方法可實現(xiàn)于，作為非限制性實例的硬件、軟件、固件、專用電路或邏輯、通用硬件或控制器或其他計算設備、或其某些組合。

因此，概括地，至少一個實施例中提供一種裝置，包括：顯示器處理器，配置為提供與至少一個音頻信號相關的至少一個音頻參數(shù)的視覺表示；交互視頻接口，配置為確定與所述音頻參數(shù)的視覺表示的交互；以及音頻處理器，配置為依據(jù)所述交互處理與所述音頻參數(shù)相關的所述至少一個音頻信號。

本發(fā)明的實施例可通過移動設備(例如處理器實體中)的數(shù)據(jù)處理器可執(zhí)行的計算機軟件、或通過硬件、或通過軟件和硬件的組合來實現(xiàn)。此外，這個方面，應注意，附圖中的邏輯流程的任意方框可代表程序步驟、或互連的邏輯電路、方框和功能、或程序步驟和邏輯電路、方框和功能的組合。軟件可存儲于這樣的物理介質(zhì)上作為存儲器芯片、或處理器中實現(xiàn)的存儲器塊、例如硬盤或軟盤的磁介質(zhì)、以及例如DVD的光學介質(zhì)和其數(shù)據(jù)變形CD。

因此，至少一個實施例包括用在計算機執(zhí)行時執(zhí)行以下步驟的指令編碼的計算機可讀介質(zhì)，所述步驟包括：提供與至少一個音頻信號相關的至少一個音頻參數(shù)的視覺表示；經(jīng)由接口檢測與所述音頻參數(shù)的視覺表示的交互；以及依據(jù)所述交互處理與所述音頻參數(shù)相關的所述至少一個音頻信號。

存儲器可以是適合于本地技術環(huán)境的任意類型，并且可使用任意適合數(shù)據(jù)存儲技術來實現(xiàn)，例如基于半導體的存儲器設備、閃存、磁存儲器設備和系統(tǒng)、光存儲器設備和系統(tǒng)、固定存儲器和可移動存儲器。數(shù)據(jù)處理器可以是適合于本地技術環(huán)境的任意類型，并且可包括作為非限制性實例的通用計算機、專用計算機、微處理器、數(shù)字信號處理器(DSP)、專用集成電路(ASIC)、門電平電路和基于多核處理器架構的處理器中的一個或多個。

本發(fā)明的實施例可在例如集成電路模塊的各個組件中實踐。集成電路的設計基本上是高度自動化的處理。復雜的和強大的軟件工具可用于將邏輯級別的設計轉(zhuǎn)換成準備在半導體基板上蝕刻和形成的半導體電路設計。

程序(例如由Mountain View的Synopsys公司，California、San Jose的California and Cadence Design提供的那些)自動地使用很好建立的設計規(guī)則以及預先存儲的設計模塊的庫路由導體和定位組件。一旦完成了半導體電路的設計，可通過標準化的電子格式(例如Opus、GDSII等)將得到的設計發(fā)送至半導體制造設施或“工廠”用于制造。

本申請中，術語“電路”指的是如下全部：

(a)僅硬件的電路方案(例如僅邏輯和/或數(shù)字電路中的方案)；和

(b)電路和軟件(和/或固件)的組合，例如(i)處理器的組合或(ii)處理器/軟件(包括數(shù)字信號處理器)、軟件、和存儲器的一部分，他們在一起工作以使得例如移動電話或服務器的裝置執(zhí)行各個功能；和

(c)電路，例如微處理器或微處理器的一部分，其需要軟件或固件進行操作，即使軟件或固件不物理地存在。

這個“電路”的定義應用于本申請中的這個術語的所有使用，包括任何權利要求。作為進一步實例，如本申請中，術語“電路”還涵蓋僅處理器(或多個處理器)或處理器的一部分及其(或他們的)附加軟件和/或固件的實現(xiàn)。術語“電路”還涵蓋(例如并且如果適用于特定權利要求元素)用于移動電話的基帶集成電路或應用處理器集成電路或服務器中的類似集成電路、蜂窩網(wǎng)絡設備、或其他網(wǎng)絡設備。

以上描述通過示例性和非限制性實例提供了本發(fā)明的示例性實施例的完整和信息性的描述。然而，各個修改和改變當接合附圖和所附權利要求時在以上實施例的方面對于本領域技術人員可變得清楚。然而，本發(fā)明的技術的所有這些和類似修改將仍舊落入所附權利要求定義的本發(fā)明的范圍內(nèi)。

完整全部詳細技術資料下載

當前第1頁1 2 3