一種實現拍攝的方法及終端與流程

文檔序號：12359594閱讀：383來源：國知局

本發(fā)明涉及定位技術，尤指一種實現拍攝的方法及終端。

背景技術：

目前，用戶在使用移動終端進行拍攝(拍照或攝像)時，一般通過移動終端攜帶的面部捕捉功能，對拍攝用戶進行面部區(qū)域定位，通過面部區(qū)域定位進行拍攝的補光、優(yōu)化等拍攝處理，實現良好的拍攝效果。

申請?zhí)枮椤?01220249031.7”發(fā)明名稱為“一種面部識別裝置”的在先申請公開了，通過包含相互連接的面部識別系統和面部追控系統，該面部識別系統識別攝像頭捕捉的面部即時圖像信息，面部追控系統根據捕捉的即時圖像信息，向該驅動機構發(fā)出控制指令，以進行攝像裝置的控制。該方法利用捕捉的即時圖像進行面部區(qū)域分析，進而驅動機構基于分析的面部區(qū)域信息進行攝像裝置的控制，實現拍攝過程中，跟蹤拍攝拍攝對象的面部區(qū)域，對面部區(qū)域進行的良好效果；然而，通過即時圖像信息進行面部捕捉容易受到光線影響，尤其在夜晚或者光線較暗的環(huán)境中，將無法準確的捕捉拍攝者的面部區(qū)域，因此無法對拍攝對象進行拍照補光、優(yōu)化等拍攝處理。申請?zhí)枮椤?01310695643.8”發(fā)明名稱為“一種基于多個手機麥克風陣列的定位方法”的在先申請公開了，通過獲取不同位置的多個手機麥克風位置，通過歸一化構成麥克風對，根據誤差容忍的時間范圍來計算聲源位置，從而確定拍攝對象的面部區(qū)域。該方法在應用過程中，手機用戶作為相對獨立的個體，很難與其他手機達到位置信息共享，即無法構成計算生源位置的手機對，無法形成確定用戶面部區(qū)域的硬件基礎，因此，實用性差。

綜上，捕捉面部即時圖像信息的方法，容易受到光線影響，在光線較暗的環(huán)境中，無法準確確定拍攝對象的面部區(qū)域，影響拍攝過程的補光、優(yōu)化等拍攝處理。對于相對獨立的手機用戶而言，很難形成確定面部區(qū)域的多個手機麥克風陣列，因此很難實施該方法獲得拍攝對象的面部區(qū)域。因此，以上方法均無法確保在拍攝過程中，確定拍攝對象的面部區(qū)域，基于確定的面部區(qū)域進行拍攝處理。

技術實現要素：

為了解決上述技術問題，本發(fā)明提供一種實現拍攝的方法及終端，能夠實現拍攝對象的面部區(qū)域的確定，對拍攝對象的面部區(qū)域進行拍攝處理。

為了達到本發(fā)明目的，本發(fā)明提供了一種實現拍攝的方法，包括：

根據在終端上預先設置的麥克陣列，接收定位的拍攝對象的聲音信號；

根據接收的聲音信號的頻率點將聲音信號轉換為窄帶信號后，對窄帶信號進行轉換搜索獲得定位的拍攝對象的角度估計；

通過角度估計及麥克陣列分布對拍攝對象進行定位計算；

根據定位計算的結果確定面部區(qū)域，對確定的面部區(qū)域進行聚焦和捕捉，以進行拍攝處理。

進一步地，該方法之前還包括：

根據聲音信號的傳輸特性及所述終端的尺寸，設置所述陣元間距與入射波長的比值為0.5；

根據設置的所述陣元間距，通過兩個及兩個以上麥克形成的規(guī)則化圖形的陣列，作為所述預先設置的麥克陣列。

進一步地，該方法之前還包括：

根據所述陣元間距計算所述入射波長，計算聲音信號傳輸速率與入射波長的商獲得接收的聲音信號的所述頻率點。

進一步地，根據接收的聲音信號的頻率點將聲音信號轉換為窄帶信號包括：

將接收的所述聲音信號由時域信號經過濾波器組或離散傅里葉變換DFT轉換為頻域的陣列輸出信號；

將轉換的頻域的所述陣列輸出信號根據計算的所述頻率點，轉換為包含有相應個數的窄帶子段信號的所述窄帶信號。

進一步地，所述轉換搜索獲得定位的拍攝對象的角度估計包括：

根據轉換的窄帶信號獲取聲音信號的代價函數；

對代價函數進行一維搜索獲得定位的拍攝對象的角度估計。

進一步地，根據轉換的窄帶信號計算獲得聲音信號的代價函數包括：

計算所述窄帶信號在所述頻率點的協方差矩陣估計值及陣列導向矢量，根據協方差矩陣估計值及陣列導向矢量獲得所述窄帶信號的代價函數。

進一步地，計算窄帶信號在頻率點的協方差矩陣估計值包括：

對各窄帶子段信號，根據所述陣列輸出信號，將所有陣元在頻率點的向量排列組成陣元的列向量矩陣；根據所述陣列輸出信號及陣元的列向量矩陣獲得陣列信號的矢量模型；在陣列信號的矢量模型中添加均勻陣列的時間延遲表達式，獲得均勻陣列的陣列信號模型；根據均勻陣列的陣列信號模型獲得頻率點的陣列方差矩陣；

根據所有所述窄帶子段信號的陣列方差矩陣輸出協方差矩陣估計值。

進一步地，計算窄帶信號在頻率點的陣列導向矢量具體包括：

根據獲得的所述陣列信號的矢量模型，以所述各窄帶子段信號的陣列信號的矢量模型的導向矩陣的列生成所述窄帶信號在頻率點的陣列導向矢量。

進一步地，通過角度估計及麥克陣列分布進行拍攝對象的定位計算具體包括：

通過所述角度估計及所述麥克陣列的陣元間距，計算聲音信號到達各個陣元的路徑差值；

根據路徑差值確定聲音信號的位置，進而實現拍攝對象的定位的計算。

本申請還提供一種實現拍攝的終端，包括：陣列接收單元、角度估計單元、定位計算單元及拍攝處理單元；其中，

陣列接收單元，用于根據在終端上預先設置的麥克陣列，接收定位的拍攝對象的聲音信號；

角度估計單元，用于根據接收的聲音信號的頻率點將聲音信號轉換為窄帶信號后，對窄帶信號進行轉換搜索獲得定位的拍攝對象的角度估計；

定位計算單元，用于通過角度估計及麥克陣列分布對拍攝對象進行定位計算；

拍攝處理單元，用于根據定位計算的結果確定面部區(qū)域，對確定的面部區(qū)域進行聚焦和捕捉，以進行拍攝處理。

進一步地，陣列接收單元具體用于根據聲音信號的傳輸特性及所述終端的尺寸，設置所述陣元間距與入射波長的比值為0.5；根據設置的陣元間距，通過兩個及兩個以上麥克形成的規(guī)則化圖形的陣列作為所述預先設置的麥克陣列；

根據所述預先設置的麥克陣列，接收定位的拍攝對象的聲音信號。

進一步地，該終端還包括頻率點計算單元，用于根據所述陣元間距計算入射波長，計算聲音信號傳輸速率與入射波長的商獲得接收的聲音信號的所述頻率點。

進一步地，角度估計單元具體用于，將接收的聲音信號由時域信號經過濾波器組或離散傅里葉變換DFT轉換為頻域的陣列輸出信號；

將轉換的頻域的所述陣列輸出信號根據計算的所述頻率點，轉換為包含有相應個數的窄帶子段信號的所述窄帶信號；

計算所述窄帶信號在所述頻率點的協方差矩陣估計值及陣列導向矢量，根據協方差矩陣估計值及陣列導向矢量獲得所述窄帶信號的代價函數；

對所述代價函數進行一維搜索獲得定位的拍攝對象的所述角度估計。

進一步地，角度估計單元具體用于，

將接收的聲音信號由時域信號經過濾波器組或離散傅里葉變換DFT轉換為頻域的陣列輸出信號；

將轉換的頻域的所述陣列輸出信號根據計算的所述頻率點，轉換為包含有相應個數的窄帶子段信號的所述窄帶信號；

對所述各窄帶子段信號，根據陣列輸出信號，將所有陣元在頻率點的向量排列組成陣元的列向量矩陣；根據陣列輸出信號及陣元的列向量矩陣獲得陣列信號的矢量模型；在陣列信號的矢量模型中添加均勻陣列的時間延遲表達式，獲得均勻陣列的陣列信號模型；根據均勻陣列的陣列信號模型獲得頻率點的陣列方差矩陣；根據所有窄帶子段信號的陣列方差矩陣輸出協方差矩陣估計值；

根據獲得的所述陣列信號的矢量模型，以各窄帶子段信號的陣列信號的矢量模型的導向矩陣的列生成所述窄帶信號在頻率點的陣列導向矢量；

根據協方差矩陣估計值及陣列導向矢量獲得所述窄帶信號的代價函數；

對所述代價函數進行一維搜索獲得定位的拍攝對象的所述角度估計。

進一步地，定位計算單元具體用于，

通過角度估計及麥克陣列的陣元間距，計算聲音信號到達各個陣元的路徑差值；

根據路徑差值確定聲音信號的位置，進而實現拍攝對象的定位計算。

與現有技術相比，本申請技術方案包括：根據在終端上預先設置的麥克陣列，接收定位的拍攝對象的聲音信號；根據接收的聲音信號的頻率點將聲音信號轉換為窄帶信號后，對窄帶信號進行轉換搜索獲得定位的拍攝對象的角度估計；通過角度估計及麥克陣列分布對拍攝對象進行定位計算；根據定位計算的結果確定面部區(qū)域，對確定的面部區(qū)域進行聚焦和捕捉，以進行拍攝處理。本發(fā)明方法通過麥克陣列分析拍攝對象的面部區(qū)域，實現了對面部區(qū)域的確定，通過面部確定的確定，為拍攝處理提供面部區(qū)域信息，保證了拍攝過程中對拍攝對象的拍攝處理。

附圖說明

此處所說明的附圖用來提供對本發(fā)明的進一步理解，構成本申請的一部分，本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明，并不構成對本發(fā)明的不當限定。在附圖中：

圖1為本發(fā)明實現拍攝的方法的流程圖；

圖2為本發(fā)明實現拍攝的終端的結構框圖；

圖3為本發(fā)明第一實施例角度估計分析示意圖；

圖4為本實施例進行定位的示意圖。

具體實施方式

為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚明白，下文中將結合附圖對本發(fā)明的實施例進行詳細說明。需要說明的是，在不沖突的情況下，本申請中的實施例及實施例中的特征可以相互任意組合。

圖1為本發(fā)明實現拍攝的方法的流程圖，如圖1所示，包括：

步驟100、根據在終端上預先設置的麥克陣列，接收定位的拍攝對象的聲音信號；

本步驟之前還包括：根據聲音信號的傳輸特性及所述終端的尺寸，設置陣元間距與入射波長的比值為0.5；根據設置的陣元間距，通過兩個及兩個以上麥克形成的規(guī)則化圖形的陣列，作為預先設置的麥克陣列。

需要說明的是，這里的麥克陣列根據聲音信號的傳輸特性及終端的尺寸確定，以移動終端為例，目前移動終端尺寸一般寬度為8厘米、長度為15厘米；聲音在空氣中的傳播速度是340米每秒，聲音的頻率為0.3～3.4千赫茲(KHZ)，對應的入射波長范圍為110～10厘米。因此陣元間距可以取5厘米～55厘米之間。陣元間距相等的規(guī)則化圖形可以是直線、等邊三角形、正方形等規(guī)則圖形。麥克陣列中陣元個數(麥克個數)一般取2～4個即可，其中定位計算的精度隨著麥克數量的增加而增加，當麥克數大于4個時，定位計算精度的提高幅度很小，對于拍攝過程的定位目的而言，該部分定位計算精度的提高并不具備太大意義，考慮到成本和麥克設置，4個麥克組成麥克矩陣是本發(fā)明進行拍攝處理的優(yōu)選方案。

陣元間距與入射波長的比和通過麥克陣列進行定位時進行角度估計的精度有著密切的關系。一般而言，如果陣元間距與入射波長的比值大于1/2，則由于相位的周期性將導致陣列的空間譜中出現多個峰值，而無法正確判斷入射波方向，造成角度估計模糊；如果陣元間距與入射波長的比小于1/2，則陣列的主瓣寬度會隨著比值的減小迅速變寬，導致陣列的分辨率與角度估計精度下降。只有當陣元間距與入射波長比等于1/2時，通過麥克陣列進行角度估計的性能最佳。

步驟101、根據接收的聲音信號的頻率點將聲音信號轉換為窄帶信號后，對窄帶信號進行轉換搜索獲得定位的拍攝對象的角度估計；

本發(fā)明方法之前還包括：

根據陣元間距計算入射波長，計算聲音信號傳輸速率與入射波長的商獲得接收的聲音信號的頻率點。這里的入射波長是指本發(fā)明進行分析處理的入射波長。

需要說明的是，假設陣元間距設定為5厘米，則入射波長為10厘米，將聲音傳輸速率340米每秒除以入射波長，得到頻率點為340/0.1＝3400。

本步驟中，根據接收的聲音信號的頻率點將聲音信號轉換為窄帶信號包括：

將接收的聲音信號由時域信號經過濾波器組或離散傅里葉變換(DFT)轉換為頻域的陣列輸出信號；

將轉換的頻域的陣列輸出信號根據計算的所述頻率點，轉換為包含有相應個數的窄帶子段信號的所述窄帶信號。

需要說明的是，將聲音信號經過濾波器組轉換為頻域的陣列輸出信號，采用的濾波器組為本領域技術人員的公知常識，具體組成和處理不作贅述。

本步驟中，轉換搜索獲得定位的拍攝對象的角度估計包括：

根據轉換的窄帶信號獲取聲音信號的代價函數；

對代價函數進行一維搜索獲得定位的拍攝對象的角度估計。

獲取聲音信號的代價函數包括：

計算窄帶信號在頻率點的協方差矩陣估計值及陣列導向矢量，根據協方差矩陣估計值及陣列導向矢量獲得窄帶信號的代價函數；

優(yōu)選的，計算窄帶信號在頻率點的協方差矩陣估計值包括：

對各窄帶子段信號，根據陣列輸出信號，將所有陣元在頻率點的向量排列組成陣元的列向量矩陣；根據陣列輸出信號及陣元的列向量矩陣獲得陣列信號的矢量模型；在陣列信號的矢量模型中添加均勻陣列的時間延遲表達式，獲得均勻陣列的陣列信號模型；根據均勻陣列的陣列信號模型獲得頻率點的陣列方差矩陣；

根據所有窄帶子段信號的陣列方差矩陣輸出協方差矩陣估計值。

需要說明的是，根據陣列輸出信號及陣元的列向量矩陣獲得陣列信號的矢量模型的方法、添加均勻陣列的時間延遲表達式的方法、獲得頻率點的陣列方差矩陣及根據所有窄帶子段信號的陣列方差矩陣輸出協方差矩陣估計值屬于本領域技術人員的慣用技術手段，在此不再贅述。

計算窄帶信號在頻率點的陣列導向矢量具體包括：

根據獲得陣列信號的矢量模型，以各窄帶子段信號的陣列信號的矢量模型的導向矩陣的列生成所述窄帶信號在頻率點的陣列導向矢量。

需要說明的是，通過各窄帶子段信號的陣列信號的矢量模型的導向矩陣的列生成窄帶信號在頻率點的陣列導向矢量的方法，是本領域技術人員的公知常識，

步驟102、通過角度估計及麥克陣列分布對拍攝對象進行定位計算。

本步驟具體包括：

通過角度估計及麥克陣列的陣元間距，計算聲音信號到達各個陣元的路徑差值；

根據路徑差值確定聲音信號的位置，進而實現拍攝對象的定位的計算。

需要說明的是，根據角度估計及麥克陣列的陣元間距，計算聲音信號到達各個陣元的路徑差值，根據路徑差值確定聲音信號的位置屬于聲學領域技術人員的公知常識。

步驟103、根據定位計算的結果確定面部區(qū)域，對確定的面部區(qū)域進行聚焦和捕捉，以進行拍攝處理。

需要說明的是，當確定拍攝對象的面部區(qū)域時，攝像裝置對確定的面部區(qū)域進行聚焦和步驟屬于本領域技術人員的公知常識，通過聚焦和捕捉對拍攝對象的面部確定進行補光、優(yōu)化等攝像處理，最終實現對拍攝對象進行攝像處理的攝像過程。本發(fā)明方法中，攝像可以指拍攝圖像或者拍攝視頻。

本發(fā)明方法通過麥克陣列分析拍攝對象的面部區(qū)域，實現了對面部區(qū)域的確定，通過面部確定的確定，為拍攝處理提供面部區(qū)域信息，保證了拍攝過程中對拍攝對象的拍攝處理。本發(fā)明方法不受光線影響，在終端布置麥克陣列，實現條件簡單且容易實現；另外，本發(fā)明角度估計方法計算量小，在實際應用中實用性強。

圖2為本發(fā)明實現拍攝的終端的結構框圖，如圖2所示，包括：包括：陣列接收單元、角度估計單元、定位計算單元及拍攝處理單元；其中，

陣列接收單元，用于根據在終端上預先設置的麥克陣列，接收定位的拍攝對象的聲音信號；

陣列接收單元具體用于根據聲音信號的傳輸特性及所述終端的尺寸，設置陣元間距與入射波長的比值為0.5；根據設置的陣元間距，通過兩個及兩個以上麥克形成的規(guī)則化圖形的陣列作為所述預先設置的麥克陣列；

根據所述預先設置的麥克陣列，接收定位的拍攝對象的聲音信號。

角度估計單元，用于根據接收的聲音信號的頻率點將聲音信號轉換為窄帶信號后，對窄帶信號進行轉換搜索獲得定位的拍攝對象的角度估計；

角度估計單元具體用于，將接收的聲音信號由時域信號經過濾波器組或離散傅里葉變換(DFT)轉換為頻域的陣列輸出信號；

將轉換的頻域的陣列輸出信號根據計算的所述頻率點，轉換為包含有相應個數的窄帶子段信號的所述窄帶信號；

計算窄帶信號在所述頻率點的協方差矩陣估計值及陣列導向矢量，根據協方差矩陣估計值及陣列導向矢量獲得所述窄帶信號的代價函數；

對所述代價函數進行一維搜索獲得定位的拍攝對象的所述角度估計。

優(yōu)選的，角度估計單元具體用于，

將接收的聲音信號由時域信號經過濾波器組或DFT轉換為頻域的陣列輸出信號；

將轉換的頻域的陣列輸出信號根據計算的所述頻率點，轉換為包含有相應個數的窄帶子段信號的所述窄帶信號；

對各窄帶子段信號，根據陣列輸出信號，將所有陣元在頻率點的向量排列組成陣元的列向量矩陣；根據陣列輸出信號及陣元的列向量矩陣獲得陣列信號的矢量模型；在陣列信號的矢量模型中添加均勻陣列的時間延遲表達式，獲得均勻陣列的陣列信號模型；根據均勻陣列的陣列信號模型獲得頻率點的陣列方差矩陣；根據所有窄帶子段信號的陣列方差矩陣輸出協方差矩陣估計值；

根據獲得陣列信號的矢量模型，以各窄帶子段信號的陣列信號的矢量模型的導向矩陣的列生成所述窄帶信號在頻率點的陣列導向矢量；

根據協方差矩陣估計值及陣列導向矢量獲得所述窄帶信號的代價函數；

對所述代價函數進行一維搜索獲得定位的拍攝對象的所述角度估計。

定位計算單元，用于通過角度估計及麥克陣列分布對拍攝對象進行定位計算；

定位計算單元具體用于，

對代價函數進行一維搜索獲得定位的拍攝對象的角度估計；

通過角度估計及麥克陣列的陣元間距，計算聲音信號到達各個陣元的路徑差值；

根據路徑差值確定聲音信號的位置，進而實現拍攝對象的定位計算。

拍攝處理單元，用于根據定位計算的結果確定面部區(qū)域，對確定的面部區(qū)域進行聚焦和捕捉，以進行拍攝處理。

本發(fā)明終端還包括頻率點計算單元，用于根據陣元間距計算入射波長，計算聲音信號傳輸速率與入射波長的商獲得接收的聲音信號的所述頻率點。

以下通過具體實施例對本發(fā)明方法進行清楚詳細的說明，實施例僅用于陳述本發(fā)明，并不用于限制本發(fā)明方法的保護范圍。

實施例1

本發(fā)明方法終端是指手機、平板電腦等移動終端，本實施例以寬度為8厘米、長度為15厘米的手機作為具體終端。在終端背面預先設置麥克陣列，麥克陣列通過以下步驟設置：

根據手機尺寸，如果以角度估計效果較好的麥克陣列包含四個陣元的情況為例，設置麥克陣列的陣元間距為5～7厘米、構成規(guī)則圖形為正方形比較合適，當然，陣元間距可以根據手機尺寸和麥克大小等進行調整。假設陣元間距為7里面，則計算獲得的頻率點為：340/0.14＝2428.57。麥克陣列按照其他規(guī)則圖形進行設置，則根據手機尺寸確定相應的陣元間距即可。

拍攝對象假設為用戶A，用戶A在拍攝照片時為了進行拍攝處理，對著終端發(fā)出聲音信息，麥克矩陣中4個麥克矩陣分別接收到聲音信號，假設接收到的聲音信號為：

x_p(t)＝s(t-τ_p)+w_p(t) 式(1)

其中p用于標識不同陣元接收到的聲音信號，p＝1，2，3，4。s(t)和w_p(t)分別表示帶寬信號和帶寬白噪聲，式(1)表示的是聲音信號的時域信號。

需要說明的是，如果本實施例還包含有用戶B發(fā)出聲音信號時，用戶B與用戶A采用相同的麥克矩陣，接收的聲音信號處理過程與用戶A的處理過程完全分離進行。

假定寬帶信號具有相同的中心頻率f₀和帶寬B＝f_H-f_L，其中f_H和f_L分別表示信號的最高頻率和最低頻率。

將時域數據通過濾波器組或經過離散傅立葉變換(DFT)，轉換成頻域的陣列輸出信號，通過濾波器組或DFT轉換生成的頻域的陣列輸出信號通過以下公式表示：

$<mrow> <msub> <mi>X</mi> <mi>p</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mi>S</mi> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mi>i</mi> <mn>2</mn> <mi>π</mi> <msub> <mi>f</mi> <mi>j</mi> </msub> <msub> <mi>τ</mi> <mi>p</mi> </msub> </mrow> </msup> <mo>+</mo> <msub> <mi>W</mi> <mi>p</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </mrow>$ 式(2)

其中，f_j為：根據陣元間距計算入射波長，計算聲音信號傳輸速率與入射波長的商獲得接收的聲音信號獲得的頻率點，f_L≤f_j≤f_H，X_p(f_j)為第p個傳聲器接收到的頻域數據，W_p(f_j)為第p個傳聲器處噪聲的頻域信號。

將轉換的頻域的陣列輸出信號根據計算的頻率點，轉換為包含有相應個數的窄帶子段信號的窄帶信號，假設為L個，則各窄帶子段信號的編號分別為1、2、3…l…L。

將P個陣元在頻率點f_j處的信號排成一個列向量有X(f_j)＝[X₁(f_j),X₂(f_j),...,X_P(f_j)]^T，對各窄帶子段信號，

根據公式(2)陣列輸出信號，將所有陣元在頻率點的向量排列組成陣元的列向量矩陣；根據陣列輸出信號及陣元的列向量矩陣獲得陣列信號的矢量模型，陣列信號的矢量模型為：

X_l(f_j)＝A_l(f_j)S_l(f_j)+W_l(f_j) 式(3)

其中，l為窄帶子段信號的編號，頻率點f_j處的噪聲矢量W_l(f_j)＝[W₁(f_j),W₂(f_j),...,W_P(f_j)]^T，A_l(f_j)為頻率f_j處的導向矩陣；在陣列信號的矢量模型中添加均勻陣列的時間延遲表達式，獲得均勻陣列的陣列信號模型；根據均勻陣列的陣列信號模型獲得頻率點的陣列方差矩陣；陣列方差矩陣的每一列為頻率點f_j處的陣列導向矢量為： $<mrow> <mi>a</mi> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <msup> <mrow> <mo>[</mo> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mi>i</mi> <mn>2</mn> <mi>π</mi> <msub> <mi>f</mi> <mi>j</mi> </msub> <msub> <mi>τ</mi> <mn>1</mn> </msub> </mrow> </msup> <mo>,</mo> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mi>i</mi> <mn>2</mn> <mi>π</mi> <msub> <mi>f</mi> <mi>j</mi> </msub> <msub> <mi>τ</mi> <mn>2</mn> </msub> </mrow> </msup> <mo>,</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>,</mo> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mi>i</mi> <mn>2</mn> <mi>π</mi> <msub> <mi>f</mi> <mi>j</mi> </msub> <msub> <mi>τ</mi> <mi>P</mi> </msub> </mrow> </msup> <mo>]</mo> </mrow> <mi>T</mi> </msup> <mo>.</mo> </mrow>$

將均勻線陣的時間延遲表達式代入式(3)中，就可以得到均勻陣列的陣列信號模型，

X_l(f_j)＝A_l(f_j,θ)S_l(f_j)+W_l(f_j) 式(4)

其中導向矩陣A(f_j,θ)的每一列為 $<mrow> <mi>a</mi> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>,</mo> <mi>θ</mi> <mo>)</mo> </mrow> <mo>=</mo> <msup> <mrow> <mo>[</mo> <mn>1</mn> <mo>,</mo> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mi>i</mi> <mn>2</mn> <mi>π</mi> <msub> <mi>f</mi> <mi>j</mi> </msub> <mi>d</mi> <mi>sin</mi> <mi>θ</mi> </mrow> </msup> <mo>,</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>,</mo> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mi>i</mi> <mn>2</mn> <mi>π</mi> <msub> <mi>f</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mi>P</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <mi>d</mi> <mi>sin</mi> <mi>θ</mi> <mo>/</mo> <mi>c</mi> </mrow> </msup> <mo>]</mo> </mrow> <mi>T</mi> </msup> <mo>,</mo> </mrow>$ 其中，C為聲音信號傳輸速度，d為麥克陣列中麥克之間的距離。如果有多個用戶發(fā)出聲音信號，則各個用戶的時間延遲表達式中的θ需要進行區(qū)分；

根據式(4)可以得到頻率點f_j處的陣列協方差矩陣為

$<mrow> <msub> <mi>R</mi> <mi>x</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mi>E</mi> <mo>{</mo> <mi>X</mi> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <msup> <mi>X</mi> <mi>H</mi> </msup> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>}</mo> <mo>=</mo> <msub> <mi>A</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>,</mo> <mi>θ</mi> <mo>)</mo> </mrow> <msub> <mi>R</mi> <mi>s</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <msubsup> <mi>A</mi> <mi>j</mi> <mi>H</mi> </msubsup> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>,</mo> <mi>θ</mi> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>R</mi> <mi>w</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </mrow>$ 式(5)

其中R_s(f_j)＝E{S(f_j)S^H(f_j)}為頻率f_j處的信號協方差矩陣，R_w(f_j)＝E{W(f_j)W^H(f_j)}為頻率f_j處的噪聲協方差矩陣。進一步在高斯空時白噪聲的假設下則式(5)可以簡化為

$<mrow> <msub> <mi>R</mi> <mi>x</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>A</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>,</mo> <mi>θ</mi> <mo>)</mo> </mrow> <msub> <mi>R</mi> <mi>s</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <msubsup> <mi>A</mi> <mi>j</mi> <mi>H</mi> </msubsup> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>,</mo> <mi>θ</mi> <mo>)</mo> </mrow> <mo>+</mo> <msubsup> <mi>σ</mi> <mi>w</mi> <mn>2</mn> </msubsup> <mi>I</mi> </mrow>$ 式(6)

需要說明的是，在上述處理中，將聲音信號根據頻率點分為L個相鄰的窄帶子段信號，每一個窄帶子段信號稱為快拍，子段總數稱為快拍數。根據L個快拍的頻域陣列輸出矢量X_l(f_j)，l＝1,2,...,L，可以得到陣列輸出在頻率點f_j處的協方差矩陣估計值

$<mrow> <msub> <mover> <mi>R</mi> <mo>^</mo> </mover> <mi>x</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mi>L</mi> </mfrac> <munderover> <mi>Σ</mi> <mrow> <mi>l</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>L</mi> </munderover> <msub> <mi>X</mi> <mi>l</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <msubsup> <mi>X</mi> <mi>l</mi> <mi>H</mi> </msubsup> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>,</mo> <mi>j</mi> <mo>=</mo> <mn>1,2</mn> <mo>,</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>,</mo> <mi>K</mi> </mrow>$ 式(7)

其中，K為窄帶信號根據頻率點分為L個相鄰的窄帶子段信號的個數。

根據f_j頻率處的協方差矩陣估計值和陣列的導向矢量就可以得到聲音信號的代價函數，即通過聲音信號形成寬帶波束的代價函數：

$<mrow> <munder> <mi>max</mi> <mrow> <mo>(</mo> <mi>θ</mi> <mo>)</mo> </mrow> </munder> <mi>J</mi> <mrow> <mo>(</mo> <mi>θ</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mi>Σ</mi> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>K</mi> <mo>/</mo> <mn>2</mn> </mrow> </munderover> <mi>a</mi> <msup> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>,</mo> <mi>θ</mi> <mo>)</mo> </mrow> <mi>H</mi> </msup> <msub> <mover> <mi>R</mi> <mo>^</mo> </mover> <mi>x</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mi>a</mi> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>j</mi> </msub> <mo>,</mo> <mi>θ</mi> <mo>)</mo> </mrow> </mrow>$ 式(8)

通過對上式進行一維搜索就可以獲得聲音信號的角度估計。

需要說明的是，一維搜索獲的聲音信號的角度估計，即獲得用戶發(fā)出聲音位置與手機的角度估計，具體的，用戶嘴巴位置發(fā)出的聲音信號，與麥克陣列形成的角度估計。

圖3為本發(fā)明第一實施例角度估計分析示意圖，如圖3所示，圖3中的小方塊為聲音信號垂直到麥克陣列平面的落點，一般的，角度估計的誤差在5度左右，即一般從圖3的角度1到角度1加5度的范圍內。

通過角度估計及麥克陣列分布進行拍攝對象的定位計算；

具體的，通過角度估計及麥克陣列的陣元間距，計算聲音信號到達各個陣元的路徑差值；根據路徑差值確定聲音信號的位置，進而實現拍攝對象的定位的計算。

根據定位計算的結果確定面部區(qū)域，對確定的面部區(qū)域進行聚焦和捕捉，以進行拍攝處理。

這里，確定面部區(qū)域是指根據確定嘴巴的位置之后，結合人的面部結構判斷分析出拍攝對象的面部區(qū)域。

圖4為本實施例進行定位的示意圖，如圖4所示，S代表拍攝對象即用戶A嘴巴的位置，S＇標識用戶A的嘴巴在麥克陣列中的投影落點；

通過角度估計及麥克陣列的陣元間距，計算聲音信號到達各個陣元的路徑差值；根據路徑差值確定聲音信號的位置，進而實現拍攝對象的定位的計算。

通過麥克陣列中編號為1和號的麥克之間的路徑差可以確定S＇源投影在麥克陣列的X軸的偏移量。編號為2和4麥克可以確定Y軸的偏移量，通過X軸和Y軸的偏移量可進一步校準聲音信號的定位結果。

根據定位計算的結果確定面部區(qū)域，對確定的面部區(qū)域進行聚焦和捕捉，以進行拍攝處理。

雖然本發(fā)明所揭露的實施方式如上，但所述的內容僅為便于理解本發(fā)明而采用的實施方式，并非用以限定本發(fā)明。任何本發(fā)明所屬領域內的技術人員，在不脫離本發(fā)明所揭露的精神和范圍的前提下，可以在實施的形式及細節(jié)上進行任何的修改與變化，但本發(fā)明的專利保護范圍，仍須以所附的權利要求書所界定的范圍為準。

完整全部詳細技術資料下載

當前第1頁1 2 3