專利名稱:一種機(jī)器人連續(xù)聲源定位方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種機(jī)器人領(lǐng)域的聲源定位處理技術(shù),尤其是基于麥克風(fēng)陣列的應(yīng)用在機(jī)器人上的連續(xù)聲源定位方法。
背景技術(shù):
機(jī)器人面臨著的世界是一個(gè)可以提供復(fù)雜多變信息的世界,要使得機(jī)器人為人類服務(wù)就需要它對各種應(yīng)用環(huán)境都具有相應(yīng)的信息獲取方式和處理方法,同時(shí)還需要它可以根據(jù)環(huán)境的變化做出不同的決策。而機(jī)器人一般通過傳感器來輸入外部環(huán)境信息,最重要的就是視覺傳感器和聽覺傳感器兩大信息輸入源。近些年,機(jī)器人視覺技術(shù)有了長足的發(fā)展,極大的拓展機(jī)器人的應(yīng)用范圍,提高了機(jī)器人的工作效率。但是視覺感知受光照、障礙物和能見度等因素的限制,在光線條件較差或者障礙物阻擋的情況下,視覺感知就會(huì)失效。 聽覺系統(tǒng)作為人類感官的重要組成部分,可以完全不受上述這些因素影響,就為機(jī)器人感知技術(shù)的研究提供了新的領(lǐng)域。同時(shí)機(jī)器人的視覺和聽覺可以結(jié)合起來,取長補(bǔ)短共同為人類社會(huì)提供服務(wù)。一般的機(jī)器人聲源定位技術(shù)是通過對人耳聽覺機(jī)制的模擬,利用機(jī)器人身上或者是放置在機(jī)器人環(huán)境中的麥克風(fēng)陣列等傳感器裝置接收聲波,由于麥克風(fēng)處于同樣的環(huán)境中,這些麥克風(fēng)采集到的聲音信號之間必然存在著某種相關(guān)性,通過電子裝置或者是算法, 利用這種相關(guān)性將聲信號進(jìn)行處理,從而實(shí)現(xiàn)聲源位置探測、語音識別或者對目標(biāo)的定位和跟蹤。這種技術(shù)受到機(jī)器人所處環(huán)境中的噪聲和混響影響、受到機(jī)器人運(yùn)動(dòng)的機(jī)體噪音的影響、以及受到聲源經(jīng)過障礙物的的反射與折射和一些環(huán)境參數(shù)的影響,使得對聲源進(jìn)行準(zhǔn)確定位變得十分困難。此外移動(dòng)機(jī)器人自身所擁有的最大的限制就是對聲源定位的速度要求高。機(jī)器人位于當(dāng)前某個(gè)位置,A發(fā)出聲音,假設(shè)機(jī)器人以勻速直線運(yùn)動(dòng),運(yùn)動(dòng)速度為 V,定位時(shí)間為t,即便不考慮聲音在空氣中傳播所花費(fèi)的時(shí)間,機(jī)器人在取得定位結(jié)果時(shí)實(shí)際聲源與機(jī)器人之間已經(jīng)產(chǎn)生了 v*t的位移,這種情況是需要仔細(xì)考慮的,特別是在機(jī)器人與聲源位置有相對運(yùn)動(dòng)的時(shí)候。現(xiàn)有的聲源定位方法多采用到達(dá)時(shí)間差技術(shù)。首先,將麥克風(fēng)陣列模型中的麥克風(fēng)分為每兩個(gè)一組,分為幾對,對于每個(gè)麥克風(fēng)對,計(jì)算聲音信號從聲源處到達(dá)兩個(gè)麥克風(fēng)的時(shí)間差,根據(jù)該時(shí)間差計(jì)算距離差;然后利用麥克風(fēng)陣列的拓?fù)浣Y(jié)構(gòu)參數(shù)、距離差、聲音傳播的速度來估計(jì)聲源的位置。這種方法的核心就是計(jì)算聲音到達(dá)每個(gè)麥克風(fēng)對的時(shí)間差。
圖1是基于時(shí)延估計(jì)定位算法原理圖。這里采用基于一種互功率譜相位(Cross-power spectrum phase,CSP)時(shí)延估計(jì)算法進(jìn)行計(jì)算。這種方法是利用互功率譜的相位信息來估計(jì)時(shí)延的,它對信號互功率譜的加權(quán)函數(shù)為
權(quán)利要求
1.一種機(jī)器人連續(xù)聲源定位方法,包括如下步驟1)機(jī)器人采用至少兩對麥克風(fēng)構(gòu)成的麥克風(fēng)陣列采集聲源信號,并將信號轉(zhuǎn)換為數(shù)字信號后存儲(chǔ);2)對采集的信號進(jìn)行有效音頻信號檢測,將包含有有效音頻的信號進(jìn)行傅里葉變換, 從時(shí)域轉(zhuǎn)換為頻域;3)對轉(zhuǎn)換為頻域的信號進(jìn)行分片處理,分別對每對麥克風(fēng)獲得的信號數(shù)據(jù)進(jìn)行相關(guān)性計(jì)算,將相關(guān)性計(jì)算的結(jié)果進(jìn)行傅里葉逆變換,從頻域轉(zhuǎn)換到時(shí)域;4)進(jìn)行最大值位置搜索,得到聲源到各麥克風(fēng)對的時(shí)間差τ;5)根據(jù)角度θ和時(shí)間差τ計(jì)算聲源相對于機(jī)器人的位置,其中θ為麥克風(fēng)陣列所處坐標(biāo)系的原點(diǎn)與聲源的連線與坐標(biāo)系X軸正向之間的夾角。
2.根據(jù)權(quán)利要求1所述的機(jī)器人連續(xù)聲源定位方法,其特征在于,所述機(jī)器人與聲源有相對運(yùn)動(dòng)時(shí),對f)步驟計(jì)算的角度θ進(jìn)行修正,修正方法為Α、調(diào)取當(dāng)次聲源定位運(yùn)算前第N次運(yùn)算獲得的角度;B、獲得當(dāng)次運(yùn)算的角度θ與前第N次運(yùn)算的角度的差A(yù)d,計(jì)算聲源與機(jī)器人相對運(yùn)動(dòng)的角速度Ad/ (N*Tf),Tf為當(dāng)次運(yùn)算與前第N次運(yùn)算的時(shí)間差;C、修正當(dāng)前角度為θ+Td*Ad/(N*Tf)其中,Td為機(jī)器人每次計(jì)算角度所需要的時(shí)間。
3.根據(jù)權(quán)利要求1或2所述的機(jī)器人連續(xù)聲源定位方法,其特征在于,所述聲源定位運(yùn)算在時(shí)間域每采集到設(shè)定量的有效音頻信號數(shù)據(jù)就進(jìn)行一次聲源定位的運(yùn)算。
4.根據(jù)權(quán)利要求3所述的機(jī)器人連續(xù)聲源定位方法,其特征在于,所述有效音頻信號數(shù)據(jù)為語音數(shù)據(jù)。
5.根據(jù)權(quán)利要求4所述的機(jī)器人連續(xù)聲源定位方法,其特征在于,所述設(shè)定量的數(shù)據(jù)為幀長大小的數(shù)據(jù)。
6.根據(jù)權(quán)利要求1或2所述的機(jī)器人連續(xù)聲源定位方法,其特征在于,所述機(jī)器人為移動(dòng)機(jī)器人或固定機(jī)器人。
7.根據(jù)權(quán)利要求1或2所述的機(jī)器人連續(xù)聲源定位方法,其特征在于,所述聲源為固定聲源或移動(dòng)聲源。
8.根據(jù)權(quán)利要求1或2所述的機(jī)器人連續(xù)聲源定位方法,其特征在于,所述傅里葉變換為快速傅里葉變換。
9.根據(jù)權(quán)利要求1或2所述的機(jī)器人連續(xù)聲源定位方法,其特征在于,所述機(jī)器人的麥克風(fēng)陣列為十字形陣列、三角形陣列、圓形陣列或直線陣列。
10.根據(jù)權(quán)利要求1或2所述的機(jī)器人連續(xù)聲源定位方法,其特征在于,所述的分片處理是將傅里葉變換后所有頻率點(diǎn)分為不同的組。
全文摘要
本發(fā)明公開了一種機(jī)器人連續(xù)聲源定位方法,包括1)機(jī)器人采用至少兩對麥克風(fēng)構(gòu)成的麥克風(fēng)陣列采集聲源信號,并將信號轉(zhuǎn)換為數(shù)字信號后存儲(chǔ);2)對采集的信號進(jìn)行有效音頻信號檢測,對包含有效音頻的信號進(jìn)行聲源定位運(yùn)算,獲得聲源相對于機(jī)器人的位置。本發(fā)明的方法應(yīng)用在機(jī)器人的聲源定位系統(tǒng)中,特別是機(jī)器人計(jì)算能力有限的時(shí)候,針對不同的應(yīng)用場景及聲源的頻率特性和噪聲特性可以將傅里葉變換以后的頻域信號進(jìn)行分片,對不同片的頻譜進(jìn)行不同的處理,大幅降低了機(jī)器人的定位運(yùn)算時(shí)間,定位速度快。同時(shí)針對機(jī)器人移動(dòng)的特點(diǎn),對其移動(dòng)位角度進(jìn)行運(yùn)動(dòng)修正以后,大幅提高了定位的準(zhǔn)確度跟實(shí)時(shí)性。
文檔編號G01S5/22GK102305925SQ20111020755
公開日2012年1月4日 申請日期2011年7月22日 優(yōu)先權(quán)日2011年7月22日
發(fā)明者劉宏, 沈苗 申請人:北京大學(xué)