基于視聽交互的虛擬聲重放校正裝置及方法
【專利摘要】本發(fā)明公開了一種基于視聽交互的虛擬聲重放校正裝置,包括:上位機(jī)控制模塊,用于合成不同空間方位虛擬聲信號、控制虛擬聲信號按一定順序和次數(shù)向聲音信號播放模塊及視覺信號播放模塊的發(fā)送,以及分析比較傾聽者的反饋信息以判斷校正是否符合預(yù)期;聽覺信號播放模塊,用于根據(jù)上位機(jī)控制模塊的控制信號播放合成的相應(yīng)空間方位的虛擬聲的音頻信號;視覺信號播放模塊,用于根據(jù)上位機(jī)控制模塊的控制信號可視化顯示虛擬聲的方位信息;反饋模塊。本發(fā)明還公開一種基于視聽交互的虛擬聲重放校正方法。本發(fā)明可校正虛擬聲重放中非個(gè)性化信號處理所導(dǎo)致的定位精度下降、前后混亂率高等缺陷,實(shí)現(xiàn)方式簡單、成本低廉,有利于廣泛推廣應(yīng)用。
【專利說明】基于視聽交互的虛擬聲重放校正裝置及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及虛擬聲重放技術(shù),具體涉及一種基于視聽交互的虛擬聲重放校正裝置及方法。
【背景技術(shù)】
[0002]人類通過雙耳感知外部的聲環(huán)境??臻g聲源發(fā)出的聲波,經(jīng)過傾聽者頭部、肩部、耳廓等生理結(jié)構(gòu)的散射、反射等物理過程后,傳輸?shù)诫p耳。這個(gè)過程可以視為一個(gè)線性時(shí)不變的聲濾波系統(tǒng),通常采用頭相關(guān)傳輸函數(shù)HRTF (Head-Related Transfer Funct1n)描述該系統(tǒng)的特性。在虛擬聲重放技術(shù)中,將單通路聲源信號(即沒有任何空間信息的聲源信號)和一對HRTF (左、右耳各一)進(jìn)行時(shí)間域卷積(或頻率域?yàn)V波),就可以人為地合成雙耳聲信號;采用耳機(jī)重放合成聲信號,就可以使傾聽者產(chǎn)生聲源位于特定空間方位的主觀效果。HRTF是空間方位的函數(shù);采用不同空間方位的HRTF數(shù)據(jù),通過虛擬聲技術(shù),就可以使傾聽者形成聲源位于不同空間方位的主觀效果。
[0003]由于HRTF描述了生理結(jié)構(gòu)(例如頭部、肩部、耳廓)對聲波的作用,所以它和生理結(jié)構(gòu)密切相關(guān)。由于不同個(gè)體具有不同的生理結(jié)構(gòu)特征(例如頭部尺寸、耳廓細(xì)微結(jié)構(gòu)),所以HRTF因人而異,具有個(gè)性化特征。研究表明,高質(zhì)量的虛擬聲重放系統(tǒng)需要采用傾聽者自身的HRTF (即個(gè)性化HRTF)數(shù)據(jù)進(jìn)行雙耳聲信號合成。然而,測量個(gè)性化HRTF需要特定的場所和專業(yè)的設(shè)備,且比較耗時(shí)。因此,在實(shí)際應(yīng)用中,無法獲取所有潛在傾聽者的個(gè)性化HRTF數(shù)據(jù),通常采用非個(gè)性化的通用HRTF數(shù)據(jù)。通用HRTF數(shù)據(jù)或取自假人(例如KEMAR,Knowles Electronics Manikin for Acoustic Research),或取自某個(gè)既定的真人數(shù)據(jù)。由于通用HRTF無法反映實(shí)際傾聽者HRTF的個(gè)性化特征,因此虛擬聲重放時(shí)往往產(chǎn)生聲源空間定位準(zhǔn)確性下降、前/后方聲像混淆率增加等缺陷。
【發(fā)明內(nèi)容】
[0004]本發(fā)明針對現(xiàn)有虛擬聲重放技術(shù)中存在的缺陷,提供了一種基于視聽交互的虛擬聲重放的校正裝置及方法,通過視聽交互的訓(xùn)練和學(xué)習(xí),校正畸變的聽覺信息。
[0005]為實(shí)現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:
基于視聽交互的虛擬聲重放校正裝置,包括:
上位機(jī)控制模塊,用于合成不同空間方位虛擬聲信號、控制虛擬聲信號按一定順序和次數(shù)向聲音信號播放模塊及視覺信號播放模塊的發(fā)送,以及分析比較傾聽者的反饋信息以判斷校正是否符合預(yù)期;
聽覺信號播放模塊,用于根據(jù)上位機(jī)控制模塊的控制信號播放合成的相應(yīng)空間方位的虛擬聲的音頻信號;
視覺信號播放模塊,用于根據(jù)上位機(jī)控制模塊的控制信號可視化顯示虛擬聲的方位信息;
反饋模塊,用于將傾聽者對虛擬聲空間方位的判斷結(jié)果反饋至上位機(jī)控制模塊進(jìn)行存貯。
[0006]進(jìn)一步地,所述上位機(jī)控制模塊包括:
虛擬聲合成模塊,用于通過頭相關(guān)傳輸函數(shù)HRTF和單通路聲源信號的時(shí)間域卷積合成不同空間方位的雙耳虛擬聲信號;
輸出控制模塊,用于控制虛擬聲的音頻信號和方位可視化信號的播放順序、播放次數(shù);
評估分析模塊,用于將傾聽者對虛擬聲空間方位的判斷進(jìn)行統(tǒng)計(jì)分析,并與虛擬聲空間方位理論值進(jìn)行比較,評估校正效果,形成評估報(bào)告。
[0007]進(jìn)一步地,所述聽覺信號播放模塊包括耳機(jī)和具有USB接口的外置聲卡,所述外置聲卡接收上位機(jī)控制模塊發(fā)來的合成虛擬聲信號和控制信號,進(jìn)行D/A轉(zhuǎn)換后,通過耳機(jī)按預(yù)定播放次數(shù)播放給傾聽者。
[0008]進(jìn)一步地,所述視覺信號播放模塊包括具有串行通信接口 UART和通用接口 GP1單片機(jī)及若干表示虛擬聲方位的LED燈,所述單片機(jī)通過串行通信接口 UART接收上位機(jī)控制模塊發(fā)來的包含虛擬聲方位信息的指令,解碼后通過通用接口 GP1控制相應(yīng)空間方位的LED燈。
[0009]進(jìn)一步地,所述單片機(jī)型號為AT89S52C。
[0010]采用所述的裝置進(jìn)行虛擬聲重放校正方法,包括步驟:
步驟1.選取訓(xùn)練空間方位的HRTF,將其和選定的單通路聲源信號進(jìn)行卷積,得到合成的13個(gè)空間方位的虛擬聲信號,所述13個(gè)空間方位取水平面Θ = O。?180°之間均勻間隔15°的13個(gè)空間方位,單通路聲源信號選取200毫秒長的白噪聲;
步驟2.設(shè)定訓(xùn)練流程,由上位機(jī)控制模塊設(shè)定耳機(jī)播放虛擬聲信號和LED燈開閉的順序以及虛擬聲重復(fù)播放的次數(shù);
步驟3.耳機(jī)按設(shè)定次數(shù)重復(fù)播放合成的某一空間方位的虛擬聲信號,同時(shí),表示該虛擬聲信號相應(yīng)空間方位的LED燈在單片機(jī)的控制下保持點(diǎn)亮,傾聽者反復(fù)接受視、聽信號的刺激,進(jìn)行視聽交互訓(xùn)練,實(shí)現(xiàn)對傾聽者的訓(xùn)練,校準(zhǔn)因采用通用HRTF數(shù)據(jù)而導(dǎo)致的空間定位誤差;
步驟4.關(guān)閉LED燈,播放虛擬聲信號,將傾聽者對虛擬聲信號空間方位的判斷結(jié)果反饋至上位機(jī)控制模塊,上位機(jī)控制模塊分析比較傾聽者感知的虛擬聲方位角與理論的虛擬聲方位角;若相差在誤差范圍內(nèi),則執(zhí)行步驟5,否則返回步驟3 ;
步驟5.根據(jù)待測虛擬聲應(yīng)用場景選取定位所需空間方位的HRTF,將其和選定的單通路聲源信號進(jìn)行卷積,得到合成的37個(gè)空間方位的雙耳虛擬聲信號,所述37個(gè)空間方位選取水平面Θ = O。?180°之間均勻間隔5°的37個(gè)空間方位,包括上述13個(gè)訓(xùn)練方位;步驟6.關(guān)閉所有LED燈,耳機(jī)隨機(jī)播放合成的各個(gè)空間方位的虛擬聲信號,傾聽者進(jìn)行虛擬聲空間方位的判斷,即指出其感知的聲像方位角β ’經(jīng)反饋模塊輸送至上位機(jī)控制模塊進(jìn)行存貯。
[0011]步驟7.上位機(jī)控制模塊分析比較傾聽者感知的虛擬聲方位值O ’與理論的虛擬聲方位角β ;若誤差在待測虛擬聲應(yīng)用場景的定位準(zhǔn)確性要求范圍內(nèi),則結(jié)束校正,否則返回步驟3。
[0012]進(jìn)一步地,步驟2中所述由上位機(jī)控制模塊設(shè)定耳機(jī)播放虛擬聲信號和LED燈開閉的順序以及虛擬聲重復(fù)播放的次數(shù)具體包括步驟:
步驟21、隨機(jī)地重復(fù)4次播放某空間方位的虛擬聲信號,每次播放時(shí)相應(yīng)空間方位的LED燈同步點(diǎn)亮;
步驟22、保持所述相應(yīng)空間方位的LED燈常亮,再將該空間方位的虛擬聲信號重復(fù)播放10次;
步驟23、重復(fù)步驟21至步驟22,直到將13個(gè)空間方位的虛擬聲信號播放完畢。
[0013]進(jìn)一步地,步驟6中所述耳機(jī)隨機(jī)播放合成的各個(gè)空間方位的虛擬聲信號時(shí),每個(gè)空間方位的虛擬聲信號重復(fù)播放4次。
[0014]進(jìn)一步地,所述步驟I和步驟5中的HRTF均選取美國麻省理工學(xué)院MIT數(shù)據(jù)庫中KEMAR假人的HRTF數(shù)據(jù),其長度為512點(diǎn)、采樣頻率為44.1kHz0
[0015]本發(fā)明的有益效果是:通過視聽交互的訓(xùn)練和學(xué)習(xí),校正虛擬聲重放中采用非個(gè)性化HRTF所導(dǎo)致的聲像畸變(包括定位不準(zhǔn)確、前/后方混亂);其軟硬件復(fù)雜程度低,成本低廉,有利于推廣,可作為虛擬聲重放相關(guān)應(yīng)用的輔助設(shè)備。
【專利附圖】
【附圖說明】
[0016]圖1是本發(fā)明模塊連接結(jié)構(gòu)示意圖。
[0017]圖2是本發(fā)明的信號流程圖。
【具體實(shí)施方式】
[0018]下面結(jié)合附圖和具體實(shí)施例對本發(fā)明作進(jìn)一步的描述。
[0019]如圖1所示,基于視聽交互的虛擬聲重放校正裝置,包括:
上位機(jī)控制模塊,用于合成不同空間方位虛擬聲信號、控制虛擬聲信號按一定順序和次數(shù)向聲音信號播放模塊及視覺信號播放模塊的發(fā)送,以及分析比較傾聽者的反饋信息以判斷校正是否符合預(yù)期;
聽覺信號播放模塊,用于根據(jù)上位機(jī)控制模塊的控制信號播放合成的相應(yīng)空間方位的虛擬聲的音頻信號;
視覺信號播放模塊,用于根據(jù)上位機(jī)控制模塊的控制信號可視化顯示虛擬聲的方位信息;
反饋模塊,用于將傾聽者對虛擬聲空間方位的判斷結(jié)果反饋至上位機(jī)控制模塊進(jìn)行存貯。
[0020]作為進(jìn)一步的實(shí)施方式,所述上位機(jī)控制模塊包括:
虛擬聲合成模塊,用于通過頭相關(guān)傳輸函數(shù)HRTF和單通路聲源信號的時(shí)間域卷積合成不同空間方位的雙耳虛擬聲信號;
輸出控制模塊,用于控制虛擬聲的音頻信號和方位可視化信號的播放順序、播放次數(shù);
評估分析模塊,用于將傾聽者對虛擬聲空間方位的判斷進(jìn)行統(tǒng)計(jì)分析,并與虛擬聲空間方位的理論值進(jìn)行比較,評估校正效果,形成評估報(bào)告。
[0021]本實(shí)施例所述上位機(jī)控制模塊包含在一臺個(gè)人電腦PC內(nèi),在PC上采用軟件編程,如可以具體采用Matlab軟件編寫代碼,實(shí)現(xiàn)不同空間方位虛擬聲的信號合成;同時(shí)采用軟件控制其與聲音信號播放模塊、視覺信號播放模塊的通訊。
[0022]所述聽覺信號播放模塊包括耳機(jī)和具有USB接口的外置聲卡,所述外置聲卡通過USB接口接收上位機(jī)控制模塊發(fā)來的合成虛擬聲信號和控制信號,進(jìn)行D/A轉(zhuǎn)換后,通過耳機(jī)按預(yù)定播放次數(shù)播放給傾聽者,具體可采用韓國ESI公司的MAYA22 USB外置聲卡,該聲卡采用AS1接口。采用AS1技術(shù)可以減少系統(tǒng)對音頻流信號的延遲,增強(qiáng)聲卡硬件的處理能力,以滿足視聽交互訓(xùn)練中視覺和聲音信號嚴(yán)格同步的需求。外置聲卡通過USB接口與PC連接,實(shí)現(xiàn)即插即用。外置聲卡接收上位機(jī)控制模塊發(fā)來的合成虛擬聲信號,進(jìn)行D/A轉(zhuǎn)換后,通過耳機(jī)播放給傾聽者。耳機(jī)具體可選用森海塞爾Sennheiser IE 80。
[0023]作為進(jìn)一步的實(shí)施方式,所述視覺信號播放模塊包括具有串行通信接口 UART和通用接口 GP1單片機(jī)及若干表示虛擬聲方位的LED燈,所述單片機(jī)通過串行通信接口 UART接收上位機(jī)控制模塊發(fā)來的包含虛擬聲方位信息的指令,解碼后通過通用接口 GP1控制相應(yīng)空間方位的LED燈。本實(shí)施例所述單片機(jī)型號為AT89S52C。該單片機(jī)是一種低功耗、高性能CMOS 8位微控制器,具有8K在系統(tǒng)可編程Flash存儲器。它使用Atmel公司高密度、非易失性存儲器技術(shù)制造,與工業(yè)80C51產(chǎn)品指令和引腳完全兼容。片上Flash允許程序存儲器在系統(tǒng)可編程,亦適于常規(guī)編程器。在單芯片上,擁有靈巧的8位CPU和在系統(tǒng)可編程Flash,使得AT89S52C單片機(jī)為眾多嵌入式控制應(yīng)用系統(tǒng)提供高靈活、超有效的解決方案,同時(shí),AT89S52C單片機(jī)具有全雙工串行通道,滿足我們與PC的通信要求;并且,AT89S52C具有多達(dá)32個(gè)GP10,能夠滿足我們控制多個(gè)LED燈的要求,以實(shí)現(xiàn)多個(gè)空間方位的視覺信號覆蓋。本發(fā)明采用AT89S52C單片機(jī)與上位機(jī)進(jìn)行串口 UART通信,接收上位機(jī)發(fā)來的指令,并且解碼,再控制相應(yīng)空間方位的LED燈。
[0024]可以理解的是,本實(shí)施例的視覺信號可以采用非LED燈或其它視覺顯示設(shè)備,如顯示屏等;再如聲音信號的播放也可以采用揚(yáng)聲器,只是需要增加串聲消除算法。
[0025]采用所述的裝置進(jìn)行虛擬聲重放校正方法,包括步驟:
步驟1.選取訓(xùn)練空間方位的HRTF,將其和選定的單通路聲源信號進(jìn)行卷積,得到合成的13個(gè)空間方位的虛擬聲信號,所述13個(gè)空間方位取水平面Θ = O。?180°之間均勻間隔15°的13個(gè)空間方位,單通路聲源信號選取200毫秒長的白噪聲,水平面上方位角沒=O。、90°、180°分別表示正前、正右、正后方向;
步驟2.設(shè)定訓(xùn)練流程,由上位機(jī)控制模塊設(shè)定耳機(jī)播放虛擬聲信號和LED燈開閉的順序以及虛擬聲重復(fù)播放的次數(shù);
步驟3.耳機(jī)按設(shè)定次數(shù)重復(fù)播放合成的某一空間方位的虛擬聲信號,同時(shí),表示該虛擬聲信號相應(yīng)空間方位的LED燈在單片機(jī)的控制下保持點(diǎn)亮,傾聽者反復(fù)接受視、聽信號的刺激,進(jìn)行視聽交互訓(xùn)練,實(shí)現(xiàn)對傾聽者的訓(xùn)練,校準(zhǔn)因采用通用HRTF數(shù)據(jù)而導(dǎo)致的空間定位誤差。訓(xùn)練過程中,要求傾聽者集中注意力感知LED燈指引的方向;
步驟4.關(guān)閉LED燈,播放虛擬聲信號,將傾聽者對虛擬聲信號空間方位的判斷結(jié)果反饋至上位機(jī)控制模塊,上位機(jī)控制模塊分析比較傾聽者感知的虛擬聲方位角與理論的虛擬聲方位角;若相差在誤差范圍內(nèi),則執(zhí)行步驟5,否則返回步驟3 ;
步驟5.根據(jù)待測虛擬聲應(yīng)用場景選取定位所需空間方位的HRTF,將其和選定的單通路聲源信號進(jìn)行卷積,得到合成的37個(gè)空間方位的雙耳虛擬聲信號,所述37個(gè)空間方位選取水平面Θ = O。?180°之間均勻間隔5°的37個(gè)空間方位,包括上述13個(gè)訓(xùn)練方位; 步驟6.關(guān)閉所有LED燈,耳機(jī)隨機(jī)播放合成的各個(gè)空間方位的虛擬聲信號,傾聽者進(jìn)行虛擬聲空間方位的判斷,即指出其感知的聲像方位角β ’經(jīng)反饋模塊輸送至上位機(jī)控制模塊進(jìn)行存貯。
[0026]步驟7.上位機(jī)控制模塊分析比較傾聽者感知的虛擬聲方位值O ’與理論的虛擬聲方位角β ;若誤差在待測虛擬聲應(yīng)用場景的定位準(zhǔn)確性要求范圍內(nèi),則結(jié)束校正,否則返回步驟3。
[0027]作為進(jìn)一步的實(shí)施方式,步驟2中所述由上位機(jī)控制模塊設(shè)定耳機(jī)播放虛擬聲信號和LED燈開閉的順序以及虛擬聲重復(fù)播放的次數(shù)具體包括步驟:
步驟21、隨機(jī)地重復(fù)4次播放某空間方位的虛擬聲信號,每次播放時(shí)相應(yīng)空間方位的LED燈同步點(diǎn)亮;
步驟22、保持所述相應(yīng)空間方位的LED燈常亮,再將該空間方位的虛擬聲信號重復(fù)播放10次;
步驟23、重復(fù)步驟21至步驟22,直到將13個(gè)空間方位的虛擬聲信號播放完畢。
[0028]作為進(jìn)一步的實(shí)施方式,步驟6中所述耳機(jī)隨機(jī)播放合成的各個(gè)空間方位的虛擬聲信號時(shí),每個(gè)空間方位的虛擬聲信號重復(fù)播放4次。
[0029]作為進(jìn)一步的實(shí)施方式,所述步驟I和步驟5中的HRTF均選取美國麻省理工學(xué)院MIT數(shù)據(jù)庫中KEMAR假人的HRTF數(shù)據(jù),其長度為512點(diǎn)、采樣頻率為44.1kHz0
[0030]需要指出的是,考慮訓(xùn)練時(shí)間的因素,訓(xùn)練通常只在有限的空間方位上進(jìn)行。由于人類的訓(xùn)練學(xué)習(xí)具有泛化的特性,即在訓(xùn)練方位上獲得的定位能力的提高可以在一定程度上“遷移”到非訓(xùn)練方位。因此,非為了全面了解訓(xùn)練方位和非訓(xùn)練方位的校正效果,定位實(shí)驗(yàn)方位包括訓(xùn)練方位和非訓(xùn)練方位。以水平面虛擬聲校正為例,定位實(shí)驗(yàn)方位選取水平面^ = 0°?180°之間均勻間隔5°的37個(gè)空間方位,包括上述13個(gè)訓(xùn)練方位。
[0031]本發(fā)明的工作原理是,該裝置在某目標(biāo)空間方位的虛擬聲信號播放的同時(shí),開啟相應(yīng)的位于目標(biāo)空間方位的LED燈。聲音和視覺信號多次同步呈現(xiàn)。利用這種視聽交互的訓(xùn)練和學(xué)習(xí)模式,將畸變的聽覺方位感知校正到LED燈所指示的目標(biāo)方位上,從而實(shí)現(xiàn)虛擬聲重放的聽覺校正,圖2是本實(shí)施例的信號流程示意圖。
[0032]盡管參照特定的優(yōu)選實(shí)施例示出并描述了本發(fā)明專利,但本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,本說明書中列舉的具體實(shí)施方案和實(shí)施例,只不過是為了理解本發(fā)明的技術(shù)內(nèi)容,不是對本發(fā)明的限制,在不背離本發(fā)明的主旨和范圍的情況下,本發(fā)明在形式上和細(xì)節(jié)上可以進(jìn)行改變,凡本領(lǐng)域的普通技術(shù)人員根據(jù)上述描述所做的潤飾、修改或等同替換,均屬于本發(fā)明所保護(hù)的范圍。
【權(quán)利要求】
1.基于視聽交互的虛擬聲重放校正裝置,其特征是,包括: 上位機(jī)控制模塊,用于合成不同空間方位虛擬聲信號、控制虛擬聲信號按一定順序和次數(shù)向聲音信號播放模塊及視覺信號播放模塊的發(fā)送,以及分析比較傾聽者的反饋信息以判斷校正是否符合預(yù)期; 聽覺信號播放模塊,用于根據(jù)上位機(jī)控制模塊的控制信號播放合成的相應(yīng)空間方位的虛擬聲的音頻信號; 視覺信號播放模塊,用于根據(jù)上位機(jī)控制模塊的控制信號可視化顯示虛擬聲的方位信息; 反饋模塊,用于將傾聽者對虛擬聲空間方位的判斷結(jié)果反饋至上位機(jī)控制模塊進(jìn)行存貯。
2.根據(jù)權(quán)利要求1所述的基于視聽交互的虛擬聲重放校正裝置,其特征是,所述上位機(jī)控制模塊包括: 虛擬聲合成模塊,用于通過頭相關(guān)傳輸函數(shù)HRTF和單通路聲源信號的時(shí)間域卷積合成不同空間方位的雙耳虛擬聲信號; 輸出控制模塊,用于控制虛擬聲的音頻信號和方位可視化信號的播放順序、播放次數(shù); 評估分析模塊,用于將傾聽者對虛擬聲空間方位的判斷進(jìn)行統(tǒng)計(jì)分析,并與虛擬聲空間方位理論值進(jìn)行比較,評估校正效果,形成評估報(bào)告。
3.根據(jù)權(quán)利要求1所述的基于視聽交互的虛擬聲重放校正裝置,其特征是, 所述聽覺信號播放模塊包括耳機(jī)和具有USB接口的外置聲卡,所述外置聲卡接收上位機(jī)控制模塊發(fā)來的合成虛擬聲信號和控制信號,進(jìn)行D/A轉(zhuǎn)換后,通過耳機(jī)按預(yù)定播放次數(shù)播放給傾聽者。
4.根據(jù)權(quán)利要求1所述的基于視聽交互的虛擬聲重放校正裝置,其特征是,所述視覺信號播放模塊包括具有串行通信接口 UART和通用接口 GP1單片機(jī)及若干表示虛擬聲方位的LED燈,所述單片機(jī)通過串行通信接口 UART接收上位機(jī)控制模塊發(fā)來的包含虛擬聲方位信息的指令,解碼后通過通用接口 GP1控制相應(yīng)空間方位的LED燈。
5.根據(jù)權(quán)利要求4所述的基于視聽交互的虛擬聲重放校正裝置,其特征是,所述單片機(jī)型號為AT89S52C。
6.采用權(quán)利要求1至4所述的裝置進(jìn)行虛擬聲重放校正方法,其特征在于,包括步驟: 步驟1.選取訓(xùn)練空間方位的HRTF,將其和選定的單通路聲源信號進(jìn)行卷積,得到合成的13個(gè)空間方位的虛擬聲信號,所述13個(gè)空間方位取水平面Θ = 0。?180°之間均勻間隔15°的13個(gè)空間方位,單通路聲源信號選取200毫秒長的白噪聲; 步驟2.設(shè)定訓(xùn)練流程,由上位機(jī)控制模塊設(shè)定耳機(jī)播放虛擬聲信號和LED燈開閉的順序以及虛擬聲重復(fù)播放的次數(shù); 步驟3.耳機(jī)按設(shè)定次數(shù)重復(fù)播放合成的某一空間方位的虛擬聲信號,同時(shí),表示該虛擬聲信號相應(yīng)空間方位的LED燈在單片機(jī)的控制下保持點(diǎn)亮,傾聽者反復(fù)接受視、聽信號的刺激,進(jìn)行視聽交互訓(xùn)練,實(shí)現(xiàn)對傾聽者的訓(xùn)練,校準(zhǔn)因采用通用HRTF數(shù)據(jù)而導(dǎo)致的空間定位誤差; 步驟4.關(guān)閉LED燈,播放虛擬聲信號,將傾聽者對虛擬聲信號空間方位的判斷結(jié)果反饋至上位機(jī)控制模塊,上位機(jī)控制模塊分析比較傾聽者感知的虛擬聲方位角與理論的虛擬聲方位角;若相差在誤差范圍內(nèi),則執(zhí)行步驟5,否則返回步驟3 ; 步驟5.根據(jù)待測虛擬聲應(yīng)用場景選取定位所需空間方位的HRTF,將其和選定的單通路聲源信號進(jìn)行卷積,得到合成的37個(gè)空間方位的雙耳虛擬聲信號,所述37個(gè)空間方位選取水平面Θ = 0。?180°之間均勻間隔5°的37個(gè)空間方位,包括上述13個(gè)訓(xùn)練方位; 步驟6.關(guān)閉所有LED燈,耳機(jī)隨機(jī)播放合成的各個(gè)空間方位的虛擬聲信號,傾聽者進(jìn)行虛擬聲空間方位的判斷,即指出其感知的聲像方位角β ’經(jīng)反饋模塊輸送至上位機(jī)控制模塊進(jìn)行存貯; 步驟7.上位機(jī)控制模塊分析比較傾聽者感知的虛擬聲方位值〃 ’與理論的虛擬聲方位角β ;若誤差在待測虛擬聲應(yīng)用場景的定位準(zhǔn)確性要求范圍內(nèi),則結(jié)束校正,否則返回步驟3。
7.根據(jù)權(quán)利要求6所述的虛擬聲重放校正方法,其特征在于,步驟2中由上位機(jī)控制模塊設(shè)定耳機(jī)播放虛擬聲信號和LED燈開閉的順序以及虛擬聲重復(fù)播放的次數(shù)具體包括步驟: 步驟21、隨機(jī)地重復(fù)4次播放某空間方位的虛擬聲信號,每次播放時(shí)相應(yīng)空間方位的LED燈同步點(diǎn)亮; 步驟22、保持所述相應(yīng)空間方位的LED燈常亮,再將該空間方位的虛擬聲信號重復(fù)播放10次; 步驟23、重復(fù)步驟21至步驟22,直到將13個(gè)空間方位的虛擬聲信號播放完畢。
8.根據(jù)權(quán)利要求6所述的虛擬聲重放校正方法,其特征在于,步驟6中所述耳機(jī)隨機(jī)播放合成的各個(gè)空間方位的虛擬聲信號時(shí),每個(gè)空間方位的虛擬聲信號重復(fù)播放4次。
9.根據(jù)權(quán)利要求6所述的虛擬聲重放校正方法,其特征在于,所述步驟1和步驟5中的HRTF均選取美國麻省理工學(xué)院MIT數(shù)據(jù)庫中KEMAR假人的HRTF數(shù)據(jù),其長度為512點(diǎn)、采樣頻率為44.lkHz0
【文檔編號】H04S7/00GK104394499SQ201410676824
【公開日】2015年3月4日 申請日期:2014年11月21日 優(yōu)先權(quán)日:2014年11月21日
【發(fā)明者】章杰, 鐘小麗 申請人:華南理工大學(xué)