一種基于fastica算法的盲源分離技術(shù)控制聚焦系統(tǒng)的制作方法
【專利摘要】一種基于FASTICA算法的盲源分離技術(shù)控制聚焦系統(tǒng),包括盲源分離模塊、GCC?PHAT時延估計模塊、幾何定位模塊和相機(jī)模塊,各模塊依次相連;盲源分離模塊包括放大電路、數(shù)據(jù)同步采集電路、信號處理模塊;GCC?PHAT時延估計模塊包括多通道音頻輸入電路和數(shù)字信號處理器;幾何定位模塊包括多語音通道、數(shù)字信號處理器、控制邏輯CPLD;相機(jī)模塊包括圖像信息分析與聚焦權(quán)重調(diào)整模塊、數(shù)碼相機(jī)模塊。本發(fā)明根據(jù)在拍攝時測量出的拍攝距離,調(diào)整鏡頭內(nèi)部部件和感光組件的距離使拍攝物能在感光組件上清晰成像,即使在弱光、低反差條件下都能調(diào)整出最佳聚焦點實現(xiàn)聚焦。本發(fā)明將盲源分離技術(shù)與相機(jī)結(jié)合,使相機(jī)操作簡單、定位精準(zhǔn)、智能、聚焦時間短。
【專利說明】
-種基于FAST ICA算法的盲源分離技術(shù)控制聚焦系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及信號處理領(lǐng)域和光機(jī)一體化領(lǐng)域,具體設(shè)及盲源分離技術(shù)和自動對焦 技術(shù)。
【背景技術(shù)】
[0002] 自動對焦技術(shù)是從1963年化non公司在科隆博覽會展出的一架自動聚焦照相機(jī)的 樣機(jī)開始逐步發(fā)展的。它是利用基礎(chǔ)的物體光反射原理,將反射的光傳播到傳感器CCD,通 過智能忍片處理器,帶動電動對焦裝置進(jìn)行對焦。它可分為主動式和被動式。目前大多數(shù)數(shù) 碼相機(jī)采用被動式的自動對焦方式,即直接接收分析拍攝物的反射光,利用相位差原理進(jìn) 行對焦。其不需要發(fā)射裝置,減少耗能,節(jié)約空間利于小型化。但是在弱光條件、低反差等條 件下,聚焦能力差。
【發(fā)明內(nèi)容】
[0003] 為了提供更佳的拍照聚焦,給群體自拍提供方便,同時避免光多次折射等造成的 無法正常聚焦而導(dǎo)致的拍照不清晰等問題,本發(fā)明提供了一種基于FASTICA(快速獨立成分 分析)算法的盲源分離技術(shù)控制聚焦系統(tǒng)。
[0004] 本發(fā)明的技術(shù)解決方案如下:
[0005] -種基于FASTICA算法的盲源分離技術(shù)控制聚焦系統(tǒng),包括盲源分離模塊、相位變 換加權(quán)廣義互相關(guān)(GCC-PHAT)時延估計模塊、幾何定位模塊和相機(jī)模塊,各模塊依次相連。 其中盲源分離模塊包括聲音信號的獲取、數(shù)據(jù)采集、信號處理Ξ部分;GCC-PHAT時延估計模 塊包括多通道音頻輸入和數(shù)字信號處理器兩部分;幾何定位模塊定位出各源信號位置也是 在數(shù)字信號處理器上實現(xiàn)的;相機(jī)模塊包括圖像信息分析與聚焦權(quán)重調(diào)整模塊、數(shù)碼相機(jī) 模塊。
[0006] 所述的盲源分離模塊包括放大電路、數(shù)據(jù)同步采集電路、信號處理模塊,各模塊依 次相連。首先放大電路將麥克風(fēng)獲取的混合聲音信號進(jìn)行兩級放大,然后數(shù)據(jù)同步采集電 路中的數(shù)據(jù)采集忍片AD73360進(jìn)行64KHZ同步采樣,最后信號處理模塊將采集的信號進(jìn)行前 端修正、相關(guān)性分析、聲源分離處理得到各分離聲源。
[0007] 盲源分離模塊中的信號處理模塊的算法是基于最大賭原理,在FASTICA模型中,經(jīng) 過預(yù)處理,最大化負(fù)賭的優(yōu)化過程轉(zhuǎn)化成EG(wTx) I的優(yōu)化問題。并通過阻尼牛頓法迭代法 將其轉(zhuǎn)化成無約束極值問題,保證了優(yōu)化算法收斂到極值點,最終經(jīng)過變化和歸一化處理, 得到迭代學(xué)習(xí)算法。
[000引所述的GCC-PHAT時延估計模塊包括多通道音頻輸入電路和數(shù)字信號處理器。多通 道音頻輸入電路是實現(xiàn)多路立體聲音頻的輸入,可進(jìn)行編程增益調(diào)節(jié),同時將盲源分離模 塊分離出的各個聲源信號輸入到數(shù)字信號處理器進(jìn)行GCC-PHAT算法操作得到時延值。數(shù)字 信號處理器在控制核屯、的調(diào)度下適時啟動GCC-PHAT算法運算,并向控制核屯、返回時延值。 [0009] GCC-PHAT算法進(jìn)行時延估計。不同麥克風(fēng)接收信號,經(jīng)過盲源分離后的源信號,可 W由下列GCC函數(shù)的峰值決定:
[0010]
[0011] Wmn表示權(quán)重函數(shù),對于不同的噪聲和混響情況,表示不同的權(quán)重函數(shù)。Sm( W )和Sn (W)表示不同麥克風(fēng)信號接收的信號進(jìn)行盲源分離后的同一聲源的頻譜,假設(shè)信號與噪聲 是獨立的,則關(guān)于信號Xm(t)和Xn(t)互功率譜函數(shù)由下式確定:
[0012]
[0013] 利用PHAT加權(quán)函數(shù)Wmn(W) = l/|Gmn(W)|來改進(jìn)原算法。并提出一個由真實環(huán)境信 噪比決定的新參數(shù)P提高小信噪比和大混響情況下的時延精度。此時權(quán)重函數(shù)被替代為Wmn (w) = l/(Gmn(w)^+I Ym\(w) | ,0<P< l〇
[0014] 所述的幾何定位模塊包括多語音通道、數(shù)字信號處理器、控制邏輯CPLD。多語音通 道分別連接數(shù)字信號處理器、控制邏輯CPLD。數(shù)字信號處理器根據(jù)各聲源的具體位置計算 出初步聚焦點??刂七壿婥PLD根據(jù)相關(guān)指示信號通過控制總線協(xié)調(diào)控制多語音通道和數(shù)字 處理器完成幾何定位。在GCC-PHAT時延的基礎(chǔ)上根據(jù)麥克風(fēng)幾何位置確定各聲源的具體位 置。
[0015] 所述的相機(jī)模塊包括圖像信息分析與聚焦權(quán)重調(diào)整模塊、數(shù)碼相機(jī)模塊。圖像信 息分析與聚焦權(quán)重調(diào)整模塊根據(jù)各聲源的定位點計算出聚焦點,聚焦得到CCD輸出圖片信 息并進(jìn)行分析,根據(jù)圖像信息分析處理結(jié)果進(jìn)行合理的聚焦權(quán)重調(diào)整。數(shù)碼相機(jī)模塊是智 能忍片處理器根據(jù)圖像信息分析處理結(jié)果控制聚焦電機(jī)和變焦電機(jī)移動鏡頭內(nèi)部部件進(jìn) 行合理聚焦權(quán)重調(diào)整,直到聚焦最精準(zhǔn),CCD輸出圖片信息最佳。
[0016] 本發(fā)明是利用盲源分離技術(shù)分離出各源信號,再利用GCC-PHAT進(jìn)行時延估計,定 位出各源信號位置,經(jīng)過內(nèi)部智能忍片處理得到最佳聚焦點,帶動電動對焦裝置進(jìn)行聚焦。 即使在弱光、低反差條件下都能調(diào)整出最佳聚焦點。其中盲源分離技術(shù)是一種在不知源信 號和傳輸信道參數(shù)的情況下,根據(jù)輸入源信號的統(tǒng)計特性,僅由觀測信號恢復(fù)出各個源信 號的方法。
[0017] 本發(fā)明具有的優(yōu)點:(1)本發(fā)明可W實現(xiàn)多聲源語音定位,不需要人操作。(2)本發(fā) 明基于已有的成熟語音定位技術(shù),不需要安裝發(fā)射裝置,減少耗能。(3)本發(fā)明解決了弱光 條件、低反差等條件下聚焦困難等問題。(4)本發(fā)明避免光多次折射等造成的無法正常聚焦 而導(dǎo)致的拍照不清晰等問題。(5)本發(fā)明中GCC-PHAT算法考慮了不同的噪聲和混響情況,提 高定位的精確度。(6)本發(fā)明提出一個由真實環(huán)境信噪比決定的新參數(shù)P,提高小信噪比和 大混響情況下的時延精度。(7)本發(fā)明結(jié)合信號處理領(lǐng)域和光機(jī)一體化領(lǐng)域,將盲源分離技 術(shù)融合到相機(jī)拍照過程,使拍攝更加簡便。
【附圖說明】
[0018] 圖1為本發(fā)明所設(shè)計的基于FASTICA算法的盲源分離技術(shù)控制聚焦系統(tǒng)的總體框 圖。
[0019 ]圖2為本發(fā)明盲源分離模塊原理示意圖。
[0020]圖3為本發(fā)明盲源分離模塊中的放大電路原理示意圖。
[0021 ]圖4為本發(fā)明盲源分離的設(shè)計圖。
[0022] 圖5為本發(fā)明定位模塊框圖。
[0023] 圖6所示為本發(fā)明最基礎(chǔ)的聚焦原理圖。
【具體實施方式】
[0024] 下面結(jié)合附圖和具體功能對本發(fā)明作進(jìn)一步闡述。
[0025] 如圖1所示為本發(fā)明中基于FASTICA算法的盲源分離技術(shù)控制聚焦系統(tǒng)的總體框 圖。包括盲源分離模塊、GCC-PHAT時延估計模塊、幾何定位模塊和相機(jī)模塊,各模塊依次相 連。其中盲源分離模塊包括放大電路、數(shù)據(jù)同步采集電路、信號處理模塊Ξ部分;GCC-PHAT 時延估計模塊包括多通道音頻輸入和數(shù)字信號處理器兩部分;幾何定位模塊包括多語音通 道、數(shù)字信號處理器、控制邏輯CPLDS部分。;相機(jī)模塊的主要部分是目前常用數(shù)碼相機(jī)結(jié) 構(gòu)與功能模塊,主要添加功能是圖像信息分析與聚焦權(quán)重調(diào)整部分。
[0026] 如圖2所示為本發(fā)明中盲源分離的設(shè)計圖。該設(shè)計圖包括放大電路、數(shù)據(jù)同步采集 電路、信號處理模塊部分。麥克風(fēng)陣列獲取環(huán)境聲音變成電信號,放大電路對該信號進(jìn)行放 大處理,便于數(shù)據(jù)處理,其中放大電路采用兩級放大,第一級放大產(chǎn)生固定增益,第二級放 大電路產(chǎn)生可調(diào)增益,數(shù)據(jù)采集是用數(shù)據(jù)采集忍片AD73360對放大的音頻信號進(jìn)行64KHZ同 步采樣,將模擬音頻信號轉(zhuǎn)化為數(shù)字音頻信號,最后將采集的信號連接到信號處理模塊進(jìn) 行處理;信號處理模塊的功能主要是功能前端修正、相關(guān)性分析、聲源分離,它將采集得到 的數(shù)字音頻信號在數(shù)字信號處理器上進(jìn)行基于FASTICA算法的盲源分離運算,得到各個聲 源分離信號。
[0027] 如圖3所示為本發(fā)明中放大電路設(shè)計原理圖。由于麥克風(fēng)的輸出電壓在零到幾十 毫伏之間,信號非常微弱,無法滿足后期的工作要求,因此有必要對麥克風(fēng)陣列采集到的信 號進(jìn)行放大,在滿足放大的基礎(chǔ)上,還需要保證放大電路能在麥克風(fēng)的頻率范圍內(nèi)正常工 作(麥克風(fēng)的頻率范圍是50化~20kHz)。另外,所選擇的運算放大器要具有比較高的性噪 比,滿足系統(tǒng)對精度的要求。該放大電路可W正常工作,且能夠滿足本系統(tǒng)的需求。
[00%]放大電路采用兩級放大,由U1A、U2A兩個放大器構(gòu)成。U1A為第一級放大,產(chǎn)生固定 增益;U2A為第二級放大電路,產(chǎn)生可調(diào)增益,將第一級放大電路的輸出電壓調(diào)節(jié)到適合的 范圍。R7用來調(diào)整放大倍數(shù),R8用來調(diào)整輸出信號的偏置電壓。
[0029] 如圖4所示為本發(fā)明中盲源分離原理示意圖。其中Μ維觀測信號矢量表示為x(t) = [Xl(t),X2(t),···ΧΜ(?)]Τ,Ν維信源矢量表示為S(t) = [Sl(t),S2(t),···3Ν(?)]Τ,Μ維噪聲矢量 表示為〇(1:) = []11(1:),]12(1:),...1?(1:)]了。
[0030] 盲信號分離的目標(biāo)就是找到合適的分離系統(tǒng)W,使得輸出所得分離信號y(t) = [yi (t),y2(t),··ΤΝ(?)]τ盡可能的逼近源信號S(t) = [Sl(t),S2(t),…SN(t)]T。
[0031] 如圖5所示為本發(fā)明定位模塊框圖,GCC-PHAT模塊包括多語音通道、數(shù)字信號處理 器、控制邏輯CPLDS部分。多通道音頻輸入具有輸出放大、輸入兩種工作模式、低功耗和 ADC、DAC高信噪比等特點。數(shù)字信號處理器具有多個可軟件編程器件,支持多通道音頻處理 的McBSP接口連接。多通道音頻輸入是實現(xiàn)多路立體聲音頻的輸入,它通過McBSP接口將信 號輸入到數(shù)字信號處理器,C化D輔助數(shù)字信號處理器各模塊進(jìn)行邏輯控制,完成GCC-PHAT 算法操作得到時延值。幾何定位模塊根據(jù)GCC-PHAT時延估計模塊算出的時延值在數(shù)字信號 處理器上運算出各聲源的定位點。
[0032]如圖6所示為本發(fā)明中最基礎(chǔ)的聚焦原理圖。無論相機(jī)內(nèi)部結(jié)構(gòu)多么復(fù)雜,調(diào)焦過 程的實現(xiàn)都可W看成是凸透鏡聚焦的簡單光學(xué)原理。一幅清晰的圖片的組成都可W看成是 不同的點經(jīng)過光學(xué)聚焦后組成的焦平面。
【主權(quán)項】
1. 一種基于FASTICA算法的盲源分離技術(shù)控制聚焦系統(tǒng),其特征是包括盲源分離模塊、 GCC-PHAT時延估計模塊、幾何定位模塊和相機(jī)模塊,各模塊依次相連; 所述的盲源分離模塊包括放大電路、數(shù)據(jù)同步采集電路、信號處理模塊,各模塊依次相 連;放大電路將從麥克風(fēng)獲取的混合聲音信號進(jìn)行放大,然后數(shù)據(jù)同步采集電路中的數(shù)據(jù) 采集芯片進(jìn)行數(shù)據(jù)同步采集,信號處理模塊將采集的信號進(jìn)行前端修正、相關(guān)性分析、聲源 分離處理得到各分離聲源信號; 所述的GCC-PHAT時延估計模塊包括多通道音頻輸入電路和數(shù)字信號處理器;多通道音 頻輸入電路實現(xiàn)多路立體聲音頻的輸入,進(jìn)行編程增益調(diào)節(jié),同時將盲源分離模塊分離出 的各個聲源信號輸入到數(shù)字信號處理器進(jìn)行GCC-PHAT算法操作得到時延值;數(shù)字信號處理 器在控制核心的調(diào)度下適時啟動GCC-PHAT算法運算,并向控制核心返回時延值; 所述的幾何定位模塊包括多語音通道、數(shù)字信號處理器、控制邏輯CPLD;多語音通道分 別連接數(shù)字信號處理器、控制邏輯CPLD;數(shù)字信號處理器根據(jù)各聲源的具體位置計算出初 步聚焦點,控制邏輯CPLD根據(jù)相關(guān)指示信號通過控制總線協(xié)調(diào)控制多語音通道和數(shù)字處理 器完成幾何定位,在GCC-PHAT時延的基礎(chǔ)上根據(jù)麥克風(fēng)幾何位置確定各聲源的具體位置; 所述的相機(jī)模塊包括圖像信息分析與聚焦權(quán)重調(diào)整模塊、數(shù)碼相機(jī)模塊;圖像信息分 析與聚焦權(quán)重調(diào)整模塊根據(jù)各聲源的定位點計算出聚焦點,聚焦得到CCD輸出圖片信息并 進(jìn)行分析,根據(jù)圖像信息分析處理結(jié)果進(jìn)行合理的聚焦權(quán)重調(diào)整;數(shù)碼相機(jī)模塊是智能芯 片處理器根據(jù)圖像信息分析處理結(jié)果控制聚焦電機(jī)和變焦電機(jī)移動鏡頭內(nèi)部部件進(jìn)行合 理聚焦權(quán)重調(diào)整,直到聚焦最精準(zhǔn),C⑶輸出圖片信息最佳。2. 根據(jù)權(quán)利要求1所述的盲源分離技術(shù)控制聚焦系統(tǒng),其特征是所述的盲源分離模塊 中的信號處理模塊的算法是基于最大熵原理,在FASTICA模型中,經(jīng)過預(yù)處理,最大化負(fù)熵 的優(yōu)化過程轉(zhuǎn)化成E |G(wTx) |的優(yōu)化問題,并通過阻尼牛頓法迭代法將其轉(zhuǎn)化成無約束極 值問題,最終經(jīng)過變化和歸一化處理,得到迭代學(xué)習(xí)算法。3. 根據(jù)權(quán)利要求1所述的盲源分離技術(shù)控制聚焦系統(tǒng),其特征是所述的GCC-PHAT算法 時延估計,即:不同麥克風(fēng)接收信號,經(jīng)過盲源分離后的源信號,由下列GCC函數(shù)的峰值決 定:Wmn表不權(quán)重函數(shù),對于不同的噪聲和混響情況,表不不同的權(quán)重函數(shù);Sm ( W )和Sn ( W )表 示不同麥克風(fēng)信號接收的信號進(jìn)行盲源分離后的同一聲源的頻譜,假設(shè)信號與噪聲是獨立 的,則關(guān)于信號Xm(tWPx n(t)互功率譜函數(shù)由下式確定:利用PHAT加權(quán)函數(shù)Wmn(w) = l/|Gmn(w)|來改進(jìn)原算法;并提出一個由真實環(huán)境信噪比決 定的新參數(shù)P提高小信噪比和大混響情況下的時延精度;此時權(quán)重函數(shù)被替代為
【文檔編號】G10L21/0272GK105872366SQ201610190411
【公開日】2016年8月17日
【申請日】2016年3月30日
【發(fā)明人】廖慶洪, 胡婉如, 胡靚, 李三仟, 陳吳, 鄢秋榮
【申請人】南昌大學(xué)