欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于依照形態(tài)參數(shù)在數(shù)據(jù)庫中選擇感知最優(yōu)的hrtf濾波器的方法

文檔序號(hào):7850197閱讀:228來源:國知局
專利名稱:用于依照形態(tài)參數(shù)在數(shù)據(jù)庫中選擇感知最優(yōu)的hrtf濾波器的方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種依照形態(tài)參數(shù)在數(shù)據(jù)庫中選擇HRTF濾波器的方法。特別地,本發(fā)明旨在確保為特定用戶選擇的HRTF的可靠性。
背景技術(shù)
本發(fā)明在雙耳合成應(yīng)用領(lǐng)域中具有特別有利的應(yīng)用,該領(lǐng)域涉及為雙耳生成空間化的聲音。因此,本發(fā)明用于例如電話會(huì)議、助聽器、用于視障人士的助聽設(shè)備、3D音頻/視頻游戲、移動(dòng)電話、移動(dòng)音頻播放器、虛擬現(xiàn)實(shí)音頻以及增強(qiáng)現(xiàn)實(shí)。
人類具有利用聲學(xué)傳遞函數(shù)從入射聲音中解碼方向信息的能力。聽者的頭、外耳和身體借助于所稱的頭相關(guān)傳遞函數(shù)(HRTF)變換來自空間中的聲音的譜信息,這允許我們基于聲源的位置、距離等感知我們的聲學(xué)環(huán)境并且從而定位它們。HRTF濾波器由描述身體對(duì)給定位置處的聲源的濾波的一對(duì)濾波器(左和右)組成。公認(rèn)的是,一組大約200個(gè)位置足以描述個(gè)人感知的空間中的所有方向。這些HRTF濾波器基本上取決于耳朵的形態(tài)(尺寸、內(nèi)腔的維度等等)以及個(gè)人身體的其他物理參數(shù)。在本文的其余部分,術(shù)語“HRTF”代表給定受試者的用于所有HRTF型位置的濾波器。在音頻應(yīng)用中使用最可能接近聽者的HRTF濾波器的HRTF可以實(shí)現(xiàn)高質(zhì)量再現(xiàn)(render)。文獻(xiàn)中的若干研究證明了所謂的個(gè)性化HRTF的益處(例如參見發(fā)表于音頻工程學(xué)會(huì)日?qǐng)?bào) Journal of the Audio Engineering Society:44, 451-469 上的 Moller 等人的文章“雙耳技術(shù)我們需要個(gè)人錄音嗎?” “Binaural technique: do we need individualrecordings ”),尤其是在位置檢測(cè)精度方面的益處。HRTF濾波器可以通過利用聽者耳朵中的麥克風(fēng)進(jìn)行測(cè)量或者甚至通過數(shù)字仿真而獲得。盡管這些方法的性能尚可,但是它們?nèi)匀环浅7ξ?、非常昂貴并且不適合消費(fèi)應(yīng)用。而且,文件W0-01/54453中描述的一種已知方法規(guī)定在數(shù)據(jù)庫中選擇與用戶的HRTF最接近的HRTF。然而,不同于本發(fā)明的是,這種在統(tǒng)計(jì)學(xué)方面有效的方法沒有將HRTF選擇的感知質(zhì)量作為驗(yàn)證標(biāo)準(zhǔn),因而沒有選擇最佳的可能的HRTF。

發(fā)明內(nèi)容
因此,本發(fā)明的新穎性在于以下事實(shí)使用基于感知聆聽測(cè)試的感知評(píng)估標(biāo)準(zhǔn)來創(chuàng)建優(yōu)化的HRTF多維空間并且選擇最相關(guān)的形態(tài)參數(shù)。本發(fā)明也允許開發(fā)建立空間和形態(tài)參數(shù)之間的與感知有關(guān)的相關(guān)性的預(yù)測(cè)模型。對(duì)于任何用戶而言,本發(fā)明將允許僅使用形態(tài)參數(shù)的測(cè)量來選擇數(shù)據(jù)庫中包含的最適當(dāng)?shù)腍RTF。選擇的HRTF濾波器與空間感知強(qiáng)烈相關(guān)(并且不僅僅是一種數(shù)學(xué)計(jì)算),這提供了很好的舒適性和聲音質(zhì)量。因此,本發(fā)明涉及一種用于依照形態(tài)參數(shù)在數(shù)據(jù)庫中選擇感知最優(yōu)的HRTF的方法,該方法使用
-第一數(shù)據(jù)庫,其包括多個(gè)受試者的HRTF,
-第二數(shù)據(jù)庫,其包括來自第一數(shù)據(jù)庫的受試者的形態(tài)參數(shù),
其中該方法進(jìn)一步使用
-第三數(shù)據(jù)庫,其與使用聆聽測(cè)試執(zhí)行的考慮到受試者的判斷的、來自第一數(shù)據(jù)庫的HRTF的感知分類相應(yīng),所述聆聽測(cè)試與來自第一數(shù)據(jù)庫的不同HRTF相應(yīng),
并且其中該方法包括以下步驟
-通過將第二數(shù)據(jù)庫和第三數(shù)據(jù)庫相關(guān)在來自第二數(shù)據(jù)庫的所有形態(tài)參數(shù)之間揀選N個(gè)最有關(guān)的形態(tài)參數(shù),
-創(chuàng)建其維度是HRTF分量的組合的結(jié)果的多維空間,
-修改用于組合分量的規(guī)則以便依照其在第三數(shù)據(jù)庫中的分類優(yōu)化這些HRTF之間的空間間隔,從而獲得優(yōu)化的多維空間,
-計(jì)算優(yōu)化的投影模型,該投影模型適合于將提取自第二數(shù)據(jù)庫的K個(gè)揀選的形態(tài)參數(shù)與優(yōu)化空間中的HRTF的相應(yīng)位置相關(guān),所述K個(gè)提取的參數(shù)優(yōu)化所述投影模型,
-測(cè)量在第一數(shù)據(jù)庫中沒有HRTF的給定用戶的K個(gè)形態(tài)參數(shù),
-將先前計(jì)算的優(yōu)化投影模型應(yīng)用到提取的形態(tài)參數(shù)以便獲得用戶在優(yōu)化空間中的位
置,
-在優(yōu)化空間中選擇用戶投影位置附近的至少一個(gè)HRTF。依照一個(gè)實(shí)施例,為了執(zhí)行感知分類,受試者在其對(duì)于相應(yīng)于HRTF的聲音的至少一個(gè)聆聽標(biāo)準(zhǔn)的判斷中具有至少兩個(gè)選擇(好或者差)。依照一個(gè)實(shí)施例,例如從限定的聲音路徑的精度、總體空間質(zhì)量、前面再現(xiàn)質(zhì)量(用于位于前面的聲音對(duì)象)以及前面/后面源的間隔(能夠識(shí)別聲音對(duì)象位于聽者前面還是聽者后面)之中選擇聆聽標(biāo)準(zhǔn)。依照一個(gè)實(shí)施例,為了開發(fā)第三數(shù)據(jù)庫
-呈現(xiàn)聲音信號(hào),在該聲音信號(hào)上將來自第一數(shù)據(jù)庫的每個(gè)HRTF (包括受試者自身的HRTF)應(yīng)用到每個(gè)受試者,
-用于測(cè)試的聲音信號(hào)為通過漢寧窗獲得的具有諸如O. 23秒之類的短持續(xù)時(shí)間的寬帶白噪聲,
-在沿著按順序呈現(xiàn)的兩條軌線的點(diǎn)位置處再現(xiàn)聲音信號(hào)
-水平面(仰角=0度)內(nèi)特別地增量為30度的圓,該軌線在O度方位角和O度仰角下開始,
-路徑被重復(fù)一次,
-中垂面(方位角=0度)內(nèi)特別地增量為15度的從前面-45度仰角向上通過90度仰角至后面-45的弧,
-聲音路徑在-45度仰角下開始向前,繼續(xù)到所述后面的仰角并且然后沿著相同的路徑返回到開始位置。依照一個(gè)實(shí)施例,為了進(jìn)行第二數(shù)據(jù)庫和第三數(shù)據(jù)庫之間的相關(guān)以便獲得揀選的形態(tài)參數(shù),
-形態(tài)數(shù)據(jù)借助于通過將來自第二數(shù)據(jù)庫的形態(tài)值除以來自第二數(shù)據(jù)庫的每個(gè)受試者的形態(tài)值創(chuàng)建子數(shù)據(jù)庫而被歸一化, -對(duì)于相應(yīng)的受試者將每個(gè)子數(shù)據(jù)庫與來自第三數(shù)據(jù)庫的分類關(guān)聯(lián),
-應(yīng)用支持向量機(jī)(SVM)方法以便獲得從最高到最低排序的形態(tài)參數(shù),該排序?yàn)橐勒盏谌龜?shù)據(jù)庫中的類別的每個(gè)HRTF參數(shù)的分離質(zhì)量的函數(shù)。依照一個(gè)實(shí)施例,為了創(chuàng)建優(yōu)化的多維空間,
-在第一步驟中,將HRTF轉(zhuǎn)換成方向傳遞函數(shù)(DTF),所述方向傳遞函數(shù)僅包含具有方向依賴性的HRTF部分,
-在第二步驟中,對(duì)DTF進(jìn)行平滑,
-在第三步驟中,對(duì)DTF進(jìn)行預(yù)處理,
-在第四步驟中,變換數(shù)據(jù)維度以便根據(jù)使用的數(shù)據(jù)減少或者增加維度的數(shù)量,所述使用的數(shù)據(jù)是前一步驟的結(jié)果,
-在減少數(shù)據(jù)維度的選項(xiàng)中,在處理的DTF上執(zhí)行主分量分析(PCA)以便獲得代表原始數(shù)據(jù)投影到新軸(主分量)上的原始數(shù)據(jù)的新數(shù)據(jù)矩陣(評(píng)分),以及-從代表多維空間的維度的評(píng)分矩陣的每列創(chuàng)建多維空間,或者-在增加數(shù)據(jù)維度的選項(xiàng)中,使用多維縮放(MDS)創(chuàng)建多維空間,
-在第五步驟中,通過來自第三數(shù)據(jù)庫的分類的空間間隔的顯著水平評(píng)估優(yōu)化水平,
-利用不同的預(yù)處理參數(shù)和/或通過限制創(chuàng)建的多維空間中的維度數(shù)量重復(fù)先前的步驟,以及
-保留具有最優(yōu)的優(yōu)化水平的空間。依照一個(gè)實(shí)施例,依照聽覺系統(tǒng)的頻率分辨率極限執(zhí)行DTF的臨界頻帶平滑。依照一個(gè)實(shí)施例,使用以下方法之一執(zhí)行預(yù)處理頻率濾波、劃定頻率范圍、提取頻率峰和谷,或者計(jì)算頻率調(diào)整因子。依照一個(gè)實(shí)施例,通過以下方式評(píng)估優(yōu)化水平
-通過第三數(shù)據(jù)庫中的分類之間的空間間隔的顯著水平,該顯著水平例如通過使用ANOVA測(cè)試評(píng)估,或者
-通過計(jì)算最高類別中排序的HRTF在空間EM中十個(gè)最接近的HRTF之間的百分比并且通過對(duì)于每個(gè)受試者使用例如學(xué)生測(cè)試將該百分比與高類別中排序的HRTF在第三數(shù)據(jù)庫中的總百分比進(jìn)行比較。 依照一個(gè)實(shí)施例,為了計(jì)算用于將提取自第二數(shù)據(jù)庫的所述N個(gè)形態(tài)參數(shù)與優(yōu)化空間中HRTF的相應(yīng)位置相關(guān)的投影模型
-在第一步驟中,通過優(yōu)化的多維空間與排序的形態(tài)參數(shù)之間的多次線性回歸以便根據(jù)來自第二數(shù)據(jù)庫的排序的形態(tài)參數(shù)找到優(yōu)化的多維空間中的位置,計(jì)算投影模型,
-在第二步驟中,評(píng)估投影模型的質(zhì)量水平,
-在第三步驟中,將排序的形態(tài)參數(shù)的數(shù)量減少為前K個(gè)排序的形態(tài)參數(shù),并且根據(jù)每個(gè)K的質(zhì)量度量的第一和第二步驟從K等于I至K等于N重復(fù)模型的計(jì)算,該計(jì)算對(duì)于每個(gè)受試者進(jìn)行重復(fù),將其數(shù)據(jù)從第一數(shù)據(jù)庫和第二數(shù)據(jù)庫中移除,以及-保留對(duì)于其而言質(zhì)量水平最高的最優(yōu)K。
依照一個(gè)實(shí)施例,為了在優(yōu)化的多維空間中選擇用戶投影位置附近的至少一個(gè)HRTF,選擇優(yōu)化的多維空間中最接近該投影位置的HRTF。


當(dāng)閱讀以下描述并且研究伴隨它的附圖時(shí),將更好地理解本發(fā)明。這些附圖僅僅被提供用于說明的目的并且對(duì)于本發(fā)明不是限制性的。它們示出圖I :依照 本發(fā)明的方法的功能框的框圖;圖2 :本發(fā)明一個(gè)實(shí)施例的詳細(xì)實(shí)現(xiàn)的實(shí)例的框圖;圖3 :沿著水平軸示出受試者并且沿著豎直軸示出第三數(shù)據(jù)庫中排序的HRTF的圖形;圖4:來自CIPIC數(shù)據(jù)庫上的文章的示出該數(shù)據(jù)庫中使用的各種不同的形態(tài)參數(shù)的示意性表示。從一幅圖到下一幅圖,相同、相似或者類似的元素保持相同的附圖標(biāo)記。
具體實(shí)施例方式數(shù)據(jù)庫的創(chuàng)建對(duì)于多個(gè)受試者,將麥克風(fēng)置于受試者的耳朵中,并且將聲源散布在空間中的各個(gè)不同的點(diǎn)上,以便確定每個(gè)受試者的HRTF。對(duì)于每個(gè)受試者也測(cè)量形態(tài)參數(shù)。第一數(shù)據(jù)庫BDl包含HRTF,并且第二數(shù)據(jù)庫BD2包含關(guān)聯(lián)受試者的形態(tài)參數(shù)。在我們的實(shí)例中,存儲(chǔ)在第一數(shù)據(jù)庫BDl中的HRTF出自來自LISTEN項(xiàng)目的公共數(shù)據(jù)庫。來自該數(shù)據(jù)庫中的前M個(gè)受試者的數(shù)據(jù)被使用(在一個(gè)實(shí)例中,M=45)。LISTENHRTF測(cè)量在空間中的與范圍從-45度到90度、增量為15度的仰角以及開始于O度、增量為15度的方位角相應(yīng)的位置處進(jìn)行。對(duì)于總共187個(gè)位置而言,針對(duì)超過45度的仰角逐漸增加方位角增量以便均勻地采樣所述空間。如圖4中所示,第二數(shù)據(jù)庫BD2包括每個(gè)受試者的以下形態(tài)參數(shù)
Xl :頭寬度;
χ2 :頭高度; x3 :頭深度; x4 :耳廓向下偏移; x5 :耳廓向后偏移; x6 :頸寬度; x7 :頸高度; x8 :頸深度; x9 :軀干頂部寬度; x0 :軀干頂部高度; xll :軀干頂部深度; xl2 :肩寬; xl3 :頭圍; xl4 :肩圍;dl :耳甲腔高度; d2 :耳甲艇高度; d3 :耳甲腔寬度; d4 :窩高度; d5 :耳廓高度; d6 :耳廊覽度; d7 :耳屏間切跡寬度; d8 :耳甲腔深度;
Θ1; 耳廊旋轉(zhuǎn)角度;
02耳廊角度參數(shù)。存儲(chǔ)在第二數(shù)據(jù)庫BD2中的這些形態(tài)參數(shù)與受試者的HRTF相應(yīng)。而且,在步驟El中,創(chuàng)建第三數(shù)據(jù)庫BD3,其包含來自聆聽測(cè)試的感知評(píng)價(jià)結(jié)果。對(duì)于每個(gè)受試者,發(fā)射測(cè)試信號(hào),在該測(cè)試信號(hào)上應(yīng)用了來自數(shù)據(jù)庫BDl的HRTF。在一個(gè)實(shí)例中,用于測(cè)試的聲音信號(hào)為通過漢寧(Hanning)窗獲得的具有諸如
O.23秒之類的短持續(xù)時(shí)間的寬帶白噪聲,
-在沿著按順序呈現(xiàn)的兩條軌線的點(diǎn)位置處再現(xiàn)聲音信號(hào)
-水平面(仰角=0度)內(nèi)特別地增量為30度的圓,該軌線在O度方位角和O度仰角下開始,
-路徑被重復(fù)一次,
-中垂面(方位角=0度)內(nèi)特別地增量為15度的從前面-45度仰角向上通過90度仰角至后面-45的弧,
-聲音路徑在-45度仰角下開始向前,繼續(xù)到所述后面的仰角并且然后沿著相同的路徑返回到開始位置。每個(gè)受試者將所述HRTF中的每一個(gè)分類成以下三個(gè)類別之一優(yōu)、良或者差。優(yōu)被認(rèn)為是最高的判斷類別。這些判斷基于與HRTF相應(yīng)的用于聆聽聲音的至少一個(gè)標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)可以選自以下實(shí)例之一先前限定的路徑的精度、總體空間質(zhì)量、前面再現(xiàn)質(zhì)量(用于位于前面的聲音對(duì)象)以及前面/后面源的間隔(能夠識(shí)別聲音對(duì)象位于聽者前面還是聽者后面)。圖3示出了對(duì)于所有受試者利用這種類型的聆聽測(cè)試獲得的結(jié)果類型(“ + ”為優(yōu),“O”為良并且“X”為差)。受試者在水平軸上示出,并且排序的HRTF在豎直軸上示出。重要形態(tài)參數(shù)的選擇如圖I和圖2中所示,在步驟E2中,為了選擇重要的形態(tài)參數(shù),將第二數(shù)據(jù)庫BD2與第三數(shù)據(jù)庫BD3相關(guān)。為此目的,在子步驟E2. I中,形態(tài)數(shù)據(jù)通過創(chuàng)建子數(shù)據(jù)庫BD2i (i范圍從I至M,M為數(shù)據(jù)庫中受試者的數(shù)量)而被歸一化,該子數(shù)據(jù)庫BD2i通過將來自第二數(shù)據(jù)庫BD2的形態(tài)值除以第二數(shù)據(jù)庫中的每個(gè)受試者的形態(tài)值BD2[i]來創(chuàng)建。利用該歸一化(normalization),所述值代表一個(gè)受試者的形態(tài)參數(shù)相對(duì)于另一個(gè)受試者的形態(tài)參數(shù)的 百分比。在子步驟E2. 2中,將每個(gè)子數(shù)據(jù)庫BD2i與相應(yīng)的受試者的第三數(shù)據(jù)庫中的分類BD3[i]關(guān)聯(lián)。接著,在子步驟E2. 3中,應(yīng)用特征選擇方法以便獲得從最高到最低排序的形態(tài)參數(shù)Pmc。該分類基于它們依照它們?cè)诘谌龜?shù)據(jù)庫BD3中的分類分離HRTF的能力。所選擇的方法為支持向量機(jī)(SVM)方法。該方法基于在高維空間中構(gòu)造一組超平面以便對(duì)歸一化的數(shù)據(jù)分類。利用該方法,因而從最高到最低對(duì)參數(shù)排序。兩個(gè)變量控制利用SVM的分類??刂品治鲋械姆诸愓`差容限的復(fù)雜度值C引入懲罰函數(shù)。C的空值表明未考慮懲罰函數(shù),并且C的高值(無限地增大C)表明懲罰函數(shù)是占優(yōu)勢(shì)的。Epsilon值ε為在要分類的數(shù)據(jù)距離超平面小于ε的情況下將懲罰函數(shù)設(shè)置為零的不敏感值。形態(tài)參數(shù)的分類依照C和ε的不同值而改變。在C=I和ε =IxlO-25的情況下使用這種方法,在我們的實(shí)例中,從最高到最低排序的Pmc的前十個(gè)最高元素為xll、x2、 x8、d5、x3、d4、xl2、d2、dl 和 x6。優(yōu)化的多維空間的創(chuàng)建在步驟E3中,創(chuàng)建其維度由來自HRTF濾波器的分量的組合而產(chǎn)生的多維空間EM。為此目的,在第一步驟E3. I中,將HRTF轉(zhuǎn)換成所稱的方向傳遞函數(shù)(DTF),所述方向傳遞函數(shù)僅僅包含具有方向依賴性的HRTF部分。在步驟E3. 2中,依照聽覺系統(tǒng)的頻率分辨率極限對(duì)DTF進(jìn)行臨界頻帶平滑。在步驟E3. 3中,使用從以下選擇的方法對(duì)DTF進(jìn)行預(yù)處理頻率濾波、劃定頻率范圍、提取頻率的峰值和谷值,或者計(jì)算頻率調(diào)整因子(frequency alignment factor)。在步驟E3. 4中,變換數(shù)據(jù)維度以便根據(jù)使用的數(shù)據(jù)減少或者增加維度的數(shù)量,所述使用的數(shù)據(jù)是步驟E3. 3的結(jié)果。為了減少數(shù)據(jù)維度,在處理的DTF上執(zhí)行主分量分析(PCA)以便獲得代表投影到新軸(主分量)上的原始數(shù)據(jù)的新數(shù)據(jù)矩陣(評(píng)分),并且從代表空間EM的維度的評(píng)分矩陣的每列創(chuàng)建空間EM。為了增加數(shù)據(jù)維度,在處理的DTF上使用多維縮放(multidimensional scaling,MDS)分析,得到空間EM。在步驟E3. 5中,評(píng)估優(yōu)化水平。在第一實(shí)例中,通過來自第三數(shù)據(jù)庫BD3的分類之間的空間間隔的顯著水平評(píng)估優(yōu)化水平。在一個(gè)實(shí)例中,通過使用ANOVA測(cè)試以檢查值分布平均對(duì)于每個(gè)不同的維度數(shù)量是否在統(tǒng)計(jì)上不同來評(píng)估顯著水平。在第二實(shí)例中,計(jì)算最高類別中排序的HRTF在空間EM中十個(gè)最接近的HRTF之間的百分比,并且對(duì)于每個(gè)受試者使用例如學(xué)生測(cè)試將該百分比與高類別中排序的HRTF在第三數(shù)據(jù)庫中的總百分比進(jìn)行比較。利用不同的預(yù)處理參數(shù)和/或通過限制創(chuàng)建的空間中的維度數(shù)量重復(fù)先前的步驟。保留具有最優(yōu)的優(yōu)化水平的空間。該空間在我們的實(shí)例中是具有最高顯著水平的一個(gè)空間,或者在第二實(shí)例中是對(duì)于最接近的十個(gè)HRTF而言在最高類別中排序的HRTF的數(shù)量最大化的一個(gè)空間。這樣保留的空間是優(yōu)化的多維空間ΕΜ0。步驟E3. 5的目的是依照其在第三數(shù)據(jù)庫BD3中的分類優(yōu)化HRTF之間的空間間隔以便獲得優(yōu)化的空間。事實(shí)上,在空間EMO中,對(duì)于給定位置處的受試者而言,位于該位置附近的區(qū)域中的HRTF對(duì)于該受試者將被認(rèn)為是好的,而遠(yuǎn)離該位置的HRTF將被認(rèn)為是差的。換言之,用于組合HRTF分量的規(guī)則被改變以便最大化HRTF之間的空間間隔與第三數(shù)據(jù)庫BD3中的HRTF的分類之間的相關(guān)性。投影模型的開發(fā)在步驟E4中,計(jì)算用于將提取自第二數(shù)據(jù)庫BD2的所述N個(gè)形態(tài)參數(shù)與優(yōu)化空間EMO中相應(yīng)HRTF的位置相關(guān)的投影模型。為此目的,在步驟E4. I中,使用第二數(shù)據(jù)庫BD2通過EMO和Pmc之間的多次線性回歸計(jì)算投影模型,以便基于排序的形態(tài)參數(shù)Pmc找到空間EMO中的位置。在步驟E4. 2中,評(píng)估投影模型的質(zhì)量水平。該質(zhì)量水平通過使用E3. 5中使用的相同方法來計(jì)算。在步驟E4. 3中,將Pmc減少為前K個(gè)排序形態(tài)參數(shù),并且根據(jù)每個(gè)K的質(zhì)量度量的步驟E4. I和步驟E4. 2從K等于I至K等于N重復(fù)模型的計(jì)算。優(yōu)選地,對(duì)于每個(gè)受試者通過在步驟E3中將該受試者的數(shù)據(jù)從第一數(shù)據(jù)庫BDl和第二數(shù)據(jù)庫BD2中移除而重復(fù)該計(jì)算。保留對(duì)于其而言質(zhì)量水平最高的最優(yōu)K。因此,K個(gè)提取的參數(shù)最大化了優(yōu)化的多維空間EMO與由投影模型產(chǎn)生的空間之間的相關(guān)性。這提供了優(yōu)化的投影模型ΜΡ0。方法的實(shí)現(xiàn)在步驟E5中,在數(shù)據(jù)庫BDl中,為在該數(shù)據(jù)庫中沒有HRTF的任何用戶選擇至少一個(gè) HRTF。為此目的,在子步驟E5. I中,用戶測(cè)量先前識(shí)別的K個(gè)形態(tài)參數(shù)。為此目的,用戶在確定的位置拍攝其耳朵的照片,所述K個(gè)參數(shù)通過圖像處理方法提取。在步驟E5. 2中,將這K個(gè)參數(shù)作為來自先前計(jì)算的投影模型MPO的輸入注入提取的形態(tài)參數(shù)中,以便獲得用戶在優(yōu)化空間EMO中的位置。然后,在優(yōu)化空間中的用戶投影位置附近選擇至少一個(gè)!11^^(標(biāo)記為HRTF-S)。在一個(gè)實(shí)例中,選擇最接近投影位置的HRTF。
權(quán)利要求
1.一種用于依照形態(tài)參數(shù)在數(shù)據(jù)庫中選擇感知最優(yōu)的HRTF的方法,該方法使用 -第一數(shù)據(jù)庫(BDl ),其包括多個(gè)受試者的HRTF, -第二數(shù)據(jù)庫(BD2),其包括來自第一數(shù)據(jù)庫(BDl)的受試者的形態(tài)參數(shù), 其中該方法進(jìn)一步使用 -第三數(shù)據(jù)庫(BD3),其與使用聆聽測(cè)試執(zhí)行的考慮到受試者的判斷的、來自第一數(shù)據(jù)庫(BDl)的HRTF的感知分類相應(yīng),所述聆聽測(cè)試與來自第一數(shù)據(jù)庫的不同HRTF相應(yīng), 并且其中該方法包括以下步驟 -通過將第二數(shù)據(jù)庫(BD2)和第三數(shù)據(jù)庫(BD3)相關(guān)在來自第二數(shù)據(jù)庫(BD2)的所有形態(tài)參數(shù)之間揀選N個(gè)最有關(guān)的形態(tài)參數(shù), -創(chuàng)建其維度是HRTF分量的組合的結(jié)果的多維空間(EM), -修改用于組合分量的規(guī)則以便最大化這些HRTF之間的空間間隔與這些HRTF在第三數(shù)據(jù)庫(BD3)中的分類之間的相關(guān)性,從而獲得優(yōu)化的多維空間(EMO), -計(jì)算優(yōu)化的投影模型(MPO),該投影模型適合于將提取自第二數(shù)據(jù)庫(BD2)的K個(gè)揀選的形態(tài)參數(shù)與優(yōu)化空間(EMO)中的HRTF的相應(yīng)位置相關(guān),所述K個(gè)提取的參數(shù)最大化優(yōu)化的多維空間(EMO)與由投影模型產(chǎn)生的空間之間的相關(guān)性, -測(cè)量在第一數(shù)據(jù)庫(BDl)中沒有HRTF的給定用戶的K個(gè)形態(tài)參數(shù), -將先前計(jì)算的優(yōu)化投影模型(MPO)應(yīng)用到提取的形態(tài)參數(shù)以便獲得用戶在優(yōu)化空間(EMO)中的位置, -在優(yōu)化空間(EMO)中選擇用戶投影位置附近的至少一個(gè)HRTF (HRTF-S)。
2.依照權(quán)利要求I的方法,其中為了執(zhí)行感知分類,受試者在其對(duì)于相應(yīng)于HRTF的聲音的至少一個(gè)聆聽標(biāo)準(zhǔn)的判斷中具有至少兩個(gè)選擇(好或者差)。
3.依照權(quán)利要求2的方法,其中例如從限定的聲音路徑的精度、總體空間質(zhì)量、前面再現(xiàn)質(zhì)量(用于位于前面的聲音對(duì)象)以及前面/后面源的間隔(能夠識(shí)別聲音對(duì)象位于聽者前面還是聽者后面)之中選擇聆聽標(biāo)準(zhǔn)。
4.依照權(quán)利要求1-3之一的方法,其中為了開發(fā)第三數(shù)據(jù)庫(BD3) -呈現(xiàn)聲音信號(hào),在該聲音信號(hào)上將來自第一數(shù)據(jù)庫的每個(gè)HRTF (包括受試者自身的HRTF)應(yīng)用到每個(gè)受試者, -用于測(cè)試的聲音信號(hào)為通過漢寧窗獲得的具有諸如O. 23秒之類的短持續(xù)時(shí)間的寬帶白噪聲, -在沿著按順序呈現(xiàn)的兩條軌線的點(diǎn)位置處再現(xiàn)聲音信號(hào) -水平面(仰角=0度)內(nèi)特別地增量為30度的圓,該軌線在O度方位角和O度仰角下開始, -路徑被重復(fù)一次, -中垂面(方位角=0度)內(nèi)特別地增量為15度的從前面-45度仰角向上通過90度仰角至后面-45的弧, -聲音路徑在-45度仰角下開始向前,繼續(xù)到所述后面的仰角并且然后沿著相同的路徑返回到開始位置。
5.依照權(quán)利要求1-4之一的方法,其中為了進(jìn)行第二數(shù)據(jù)庫(BD2)和第三數(shù)據(jù)庫(BD3)之間的相關(guān)以便獲得揀選的形態(tài)參數(shù),-形態(tài)數(shù)據(jù)借助于通過將來自第二數(shù)據(jù)庫(BD2)的形態(tài)值除以來自第二數(shù)據(jù)庫的每個(gè)受試者的形態(tài)值(BD2[i])創(chuàng)建子數(shù)據(jù)庫(BD2i)而被歸一化, -對(duì)于相應(yīng)的受試者將每個(gè)子數(shù)據(jù)庫(BD2i )與來自第三數(shù)據(jù)庫的分類(BD3 [i])關(guān)聯(lián),-應(yīng)用支持向量機(jī)(SVM)方法以便獲得從最高到最低排序的形態(tài)參數(shù)(Pmc),該排序?yàn)橐勒盏谌龜?shù)據(jù)庫中的類別的每個(gè)HRTF參數(shù)的分離質(zhì)量的函數(shù)。
6.依照權(quán)利要求5的方法,其中為了創(chuàng)建優(yōu)化的多維空間(EMO), -在步驟E 3. I中,將HRTF轉(zhuǎn)換成方向傳遞函數(shù)(DTF),所述方向傳遞函數(shù)僅包含具有方向依賴性的HRTF部分, -在步驟E 3. 2中,對(duì)DTF進(jìn)行平滑, -在步驟E 3. 3中,對(duì)DTF進(jìn)行預(yù)處理, -在步驟E3. 4中,變換數(shù)據(jù)維度以便根據(jù)使用的數(shù)據(jù)減少或者增加維度的數(shù)量,所述使用的數(shù)據(jù)是步驟E3. 3的結(jié)果, -在減少數(shù)據(jù)維度的選項(xiàng)中,在處理的DTF上執(zhí)行主分量分析(PCA)以便獲得代表原始數(shù)據(jù)投影到新軸(主分量)上的新數(shù)據(jù)矩陣(評(píng)分),以及 -從代表空間EM的維度的評(píng)分矩陣的每列創(chuàng)建空間EM,或者 -在增加數(shù)據(jù)維度的選項(xiàng)中,使用多維縮放(MDS)創(chuàng)建空間EM, -在步驟E 3. 5中,通過來自第三數(shù)據(jù)庫BD3的分類之間的空間間隔的顯著水平評(píng)估優(yōu)化水平, -利用不同的預(yù)處理參數(shù)和/或通過限制創(chuàng)建的空間EM中的維度數(shù)量重復(fù)先前的步驟,以及 -保留具有最優(yōu)的優(yōu)化水平的空間。
7.依照權(quán)利要求6的方法,其中依照聽覺系統(tǒng)的頻率分辨率極限執(zhí)行DTF的臨界頻帶平滑。
8.依照權(quán)利要求6或7的方法,其中使用以下方法之一執(zhí)行預(yù)處理頻率濾波、劃定頻率范圍、提取頻率峰和谷,或者計(jì)算頻率調(diào)整因子。
9.依照權(quán)利要求6-8之一的方法,其中通過以下方式評(píng)估優(yōu)化水平 -通過第三數(shù)據(jù)庫(BD3)中的分類之間的空間間隔的顯著水平,該顯著水平例如通過使用ANOVA測(cè)試評(píng)估,或者 -通過計(jì)算最高類別中排序的HRTF在空間EM中十個(gè)最接近的HRTF之間的百分比并且通過對(duì)于每個(gè)受試者使用例如學(xué)生測(cè)試將該百分比與最高類別中排序的HRTF在第三數(shù)據(jù)庫(BD3)中的總百分比進(jìn)行比較。
10.依照權(quán)利要求1-9之一的方法,其中為了計(jì)算用于將提取自第二數(shù)據(jù)庫的所述N個(gè)形態(tài)參數(shù)與優(yōu)化空間中HRTF的相應(yīng)位置相關(guān)的投影模型 -在步驟E4. I中,通過EMO與Pmc之間的多次線性回歸以便根據(jù)來自第二數(shù)據(jù)庫(BD2 )的排序的形態(tài)參數(shù)Pmc找到空間EMO中的位置,計(jì)算投影模型, -在步驟E4. 2中,評(píng)估投影模型的質(zhì)量水平, -在步驟E4. 3中,將Pmc減少為前K個(gè)排序的形態(tài)參數(shù),并且根據(jù)每個(gè)K的質(zhì)量度量的模型E4. I和步驟E4. 2從K等于I至K等于N重復(fù)模型的計(jì)算,該計(jì)算對(duì)于每個(gè)受試者進(jìn)行重復(fù),將其數(shù)據(jù)從第一數(shù)據(jù)庫(BDl)和第二數(shù)據(jù)庫(BD2)中移除,以及-保留對(duì)于其而言質(zhì)量水平最高的最優(yōu)K。
11.依照權(quán)利要求1-10之一的方法,其中為了在優(yōu)化的空間(EMO)中選擇用戶投影位置附近的至少一個(gè)HRTF (HRTF-S),選擇優(yōu)化的空間(EMO)中最接近該投影位置的HRTF。
全文摘要
本發(fā)明涉及一種用于依照形態(tài)參數(shù)在數(shù)據(jù)庫中選擇感知最優(yōu)的HRTF的方法。所述方法使用第一數(shù)據(jù)庫,其包括多個(gè)受試者M(jìn)的HRTF;第二數(shù)據(jù)庫,其包括受試者的形態(tài)參數(shù);以及第三數(shù)據(jù)庫,其與HRTF的感知分類相應(yīng)。依照本發(fā)明,通過將第二數(shù)據(jù)庫和第三數(shù)據(jù)庫相關(guān)揀選N個(gè)最有關(guān)的形態(tài)參數(shù)。創(chuàng)建多維空間,該多維空間依照HRTF在第三數(shù)據(jù)庫中的分類優(yōu)化這些HRTF之間的空間間隔,從而獲得優(yōu)化的空間。計(jì)算優(yōu)化的投影模型MPO,該投影模型適合于將K個(gè)最優(yōu)的形態(tài)參數(shù)與優(yōu)化的空間中的HRTF濾波器的相應(yīng)位置相關(guān)。本發(fā)明因此對(duì)于其HRTF不包含在數(shù)據(jù)庫中的任何用戶允許依照所述用戶的參數(shù)K和優(yōu)化的投影模型MPO從數(shù)據(jù)庫BD1中選擇至少一個(gè)HRTF。
文檔編號(hào)H04S3/00GK102939771SQ201180028806
公開日2013年2月20日 申請(qǐng)日期2011年4月12日 優(yōu)先權(quán)日2010年4月12日
發(fā)明者布萊恩·Fg·卡茨, 大衛(wèi)·舍恩斯坦 申請(qǐng)人:阿嘉米斯, 法國國家科學(xué)研究中心
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
青龙| 滨海县| 肥东县| 九龙县| 定西市| 沁阳市| 镇安县| 乐都县| 丹寨县| 玛曲县| 益阳市| 鄱阳县| 马鞍山市| 二连浩特市| 沅陵县| 延川县| 惠水县| 都江堰市| 大港区| 安福县| 平果县| 邢台县| 梨树县| 丘北县| 嘉义市| 夏河县| 临高县| 吴江市| 丽水市| 绩溪县| 丹东市| 承德市| 广河县| 新和县| 明光市| 景东| 察哈| 平邑县| 新巴尔虎右旗| 长白| 无为县|