專利名稱:語音對(duì)剩余音頻交互助聽器及輔助設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明的實(shí)施例一般涉及處理音頻信號(hào),更具體地說,涉及用于處理音頻信號(hào)的方法及裝置,使聽力損傷者能夠調(diào)整語音對(duì)剩余音頻(VRAvoice-to-remaining audio)的水平來改善其聽力體驗(yàn)。
背景技術(shù):
當(dāng)人們步入老年時(shí),隨著時(shí)間的推移,由于多方面的因素,如年齡、遺傳、疾病以及環(huán)境影響等,人們的聽力會(huì)逐漸受到損害。這種損害通常特定為某些頻率范圍。
除了永久性的聽力損傷之外,由于特別高的聲級(jí)的影響,人們可能會(huì)遇到暫時(shí)性的聽力損傷。例如,在打靶或參加一場搖滾音樂會(huì)之后,人們可能會(huì)遇到暫時(shí)性聽力損傷的情況,這種情況會(huì)稍微有所改善,但隨著時(shí)間的推移,可能會(huì)積聚為永久性聽力損傷。即使是較低的聲級(jí),但如果持續(xù)時(shí)間較長,也可能會(huì)對(duì)人們的聽力帶來暫時(shí)的影響,例如在工廠工作或在小學(xué)教書。
通常,人們通過提高音頻的音量來補(bǔ)償聽力損失或聽力損傷。但是,這種方法只不過提高了全部信號(hào)中所有可聽頻率的音量。這種全部信號(hào)音量的提高在語音可懂度方面提供極少改善或沒有任何改善,對(duì)聽力損傷與頻率相關(guān)的人尤其如此。
雖然聽力損傷一般隨著年齡而增加,然而許多聽力損傷者不承認(rèn)他們有聽覺障礙,因此不使用改善其聽力質(zhì)量的裝置。雖然許多老年人隨著年齡漸增而配戴眼鏡,但這些老年人中的極少數(shù)會(huì)戴助聽器,盡管在減小助聽器的尺寸方面有重大的改進(jìn)。這種現(xiàn)象表現(xiàn)出與助聽器和/或聽力損傷相關(guān)的明顯社會(huì)偏見。因此,需要提供一種技術(shù),通過一種避免明顯相關(guān)社會(huì)偏見的方法,來改善聽力損傷者的聽力體驗(yàn)。
大多數(shù)音頻節(jié)目,無論是電視伴音、電影伴音或者音樂,均可以分為兩個(gè)不同的分量前景和背景。一般來說,前景聲音是用來吸引聽眾注意力并使他們集中注意的聲音,而背景聲音則起輔助作用,對(duì)聽眾來說不是主要的興趣所在。這方面的一個(gè)示例就是“連續(xù)劇”的電視節(jié)目,在其中傳遞主要人物的聲音并發(fā)展故事情節(jié),而聲音效果、聽眾的笑聲以及音樂則填補(bǔ)空白。
目前,所有類型的音頻媒體的聽眾都被限制于由音頻工程師在制作過程中所確定的混合效果。音頻工程師會(huì)按其喜好的級(jí)別,或者按他認(rèn)為具有某些歷史背景意義的標(biāo)準(zhǔn),將其它所有背景噪聲成份與前景聲音進(jìn)行混合。這種混合聲音隨后便以單一(單聲道)信號(hào)或有時(shí)以立體聲(左和右)信號(hào)發(fā)送給終端用戶,而沒有任何手段來調(diào)節(jié)前景聲音與背景聲音對(duì)比度。
對(duì)于聽力損傷者來說,缺乏調(diào)節(jié)前景聲音與背景聲音對(duì)比度的功能則更是一個(gè)困難。在許多情況下,由于背景聲音掩蓋了前景信號(hào),使節(jié)目難于(最大限度地)被理解。
可以采用許多新的數(shù)字音頻形式。其中一些形式嘗試提供用于聽力損傷者的功能。例如,杜比數(shù)字,又稱作AC-3(或音頻編解碼器第3版),是一種數(shù)字音頻壓縮技術(shù),它將更多數(shù)據(jù)壓縮到較小的空間中。數(shù)字音頻的未來是空間定位,它通過提供5.1獨(dú)立音頻通道來實(shí)現(xiàn)中置、左和右、左和右環(huán)繞。稱作0.1通道的第六通道指受限帶寬低頻效果(LFE)通道,由于其低頻,所以通常是非定向的。由于有5.1音頻通道來傳送,所以就需要壓縮來保證視頻和音頻兩者均保持在一定的帶寬限制之內(nèi)。目前,對(duì)于陸地傳送,與數(shù)字視頻光盤(DVD)相比,這些限制(由聯(lián)邦通信委員會(huì)(FCC)提出)更為嚴(yán)格。DVD中有超過足夠空間的空間來為終端用戶提供未經(jīng)壓縮的音頻(從收聽的觀點(diǎn)來說是更為需要的)。視頻數(shù)據(jù)通常通過MPEG(運(yùn)動(dòng)圖像專家組)開發(fā)技術(shù)來進(jìn)行壓縮,雖然它們也具有類似于杜比的音頻壓縮技術(shù)。
DVD行業(yè)采用了杜比數(shù)字(DD)作為其選擇的壓縮技術(shù)。大多數(shù)DVD采用DD進(jìn)行制作。ATSC(高級(jí)電視標(biāo)準(zhǔn)委員會(huì))也選擇了AC-3作為美國數(shù)字電視的音頻壓縮方案。這已經(jīng)擴(kuò)展到全球許多其它國家。這意味著,對(duì)于廣播或錄制,制作室(電影和電視)必須按DD對(duì)其音頻進(jìn)行編碼。
除了嚴(yán)格的編碼和解碼方案之外,經(jīng)常結(jié)合杜比數(shù)字討論的還有許多特點(diǎn)。這些特點(diǎn)其中一些是DD的一部分,有些則不是。發(fā)送壓縮比特流的同時(shí),DD還發(fā)送有關(guān)該比特流的信息,稱作元數(shù)據(jù),或“有關(guān)數(shù)據(jù)的數(shù)據(jù)”。主要是0和1,表示是否有終端用戶可用的選項(xiàng)。這些選項(xiàng)的其中三個(gè)分別是dialnorm(對(duì)話標(biāo)準(zhǔn)化)、dynrng(動(dòng)態(tài)范圍)以及bsmod(比特流模式,它控制主音頻業(yè)務(wù)(main audioservice)及相關(guān)音頻業(yè)務(wù)(associated audio service))。前兩個(gè)選項(xiàng)已經(jīng)是DD的組成部分,因?yàn)樵S多解碼器都處理這些變量,為終端用戶提供了對(duì)其進(jìn)行調(diào)節(jié)的功能。第三個(gè)信息位bsmod在ATSC文檔A/54中進(jìn)行了詳細(xì)說明(非杜比發(fā)布),但也作為DD比特流的部分而存在。bsmod的值通知解碼器有關(guān)輸入音頻業(yè)務(wù)的性質(zhì),包括是否存在任何相關(guān)音頻業(yè)務(wù)。現(xiàn)在還沒有已知的制造商采用這個(gè)參數(shù)。目前,通過在DVD的八個(gè)可用音頻軌道的其中之一上的多個(gè)完整主音頻節(jié)目來提供多語言DVD性能。
dialnorm參數(shù)用來使聽眾能夠相對(duì)于不變的語音級(jí)別來規(guī)一化所有音頻節(jié)目。在頻道之間以及在節(jié)目和廣播片之間,整體音頻級(jí)別波動(dòng)大。將來,制作者將被要求加入dialnorm參數(shù),指明錄制對(duì)話的聲壓級(jí)(SPL)。如果該值對(duì)于某個(gè)節(jié)目設(shè)置為80dB,而對(duì)于商業(yè)設(shè)置為90dB,則該電視將對(duì)信息進(jìn)行解碼,檢查終端用戶已輸入的所需級(jí)別(如85dB),并將電影調(diào)高5dB,將商業(yè)節(jié)目調(diào)低5dB。這是總音量級(jí)別調(diào)節(jié),它基于制作者輸入的dialnorm位值。
AC-3說明的一部分(摘自文檔A/52)提供了這種技術(shù)的最佳說明?!癲ynrng值通常指示在最大聲信號(hào)通過期間的增益減少,以及在靜音通過期間的增益增加。對(duì)于聽眾來說,希望將最大聲聲音級(jí)別降低為接近對(duì)話級(jí)別,而將靜音級(jí)別提高,同樣接近對(duì)話級(jí)別。與正常說話同樣響度的聲音的增益通常沒有改變?!眃ynrng變量為終端用戶提供了可調(diào)節(jié)參數(shù),這個(gè)參數(shù)將控制出現(xiàn)在總音量中有關(guān)對(duì)話級(jí)別的壓縮量。這主要將總音頻節(jié)目的動(dòng)態(tài)范圍限制在大約平均對(duì)話級(jí)別。但是,它并不提供任何方法獨(dú)立于剩余音頻級(jí)別來調(diào)節(jié)對(duì)話級(jí)別。
在ATSC的數(shù)字電視標(biāo)準(zhǔn)(附錄B)中提供了改善聽力損傷者聽力體驗(yàn)的一種嘗試。ATSC標(biāo)準(zhǔn)的附錄B第六部分說明了主音頻業(yè)務(wù)及相關(guān)音頻業(yè)務(wù)。AC-3基本流(elementary stream)包含單一音頻業(yè)務(wù)的編碼表示。多個(gè)音頻業(yè)務(wù)由多個(gè)基本流提供。每個(gè)基本流通過具有唯一PID的傳輸復(fù)用來傳送。有許多音頻業(yè)務(wù)類型,它們可以單獨(dú)地被編碼成各個(gè)基本流。其中一種音頻業(yè)務(wù)類型稱為完整的主音頻業(yè)務(wù)(CM)。CM類型的主音頻業(yè)務(wù)包含完整的音頻節(jié)目(包括對(duì)話、音樂以及聲音效果)。CM業(yè)務(wù)可以包含1至5.1音頻通道。CM業(yè)務(wù)還可以通過其它業(yè)務(wù)進(jìn)行擴(kuò)展。另一個(gè)音頻業(yè)務(wù)類型是聽力損傷業(yè)務(wù)(HI)。HI相關(guān)業(yè)務(wù)通常只包含對(duì)話,用于與CM業(yè)務(wù)同時(shí)再現(xiàn)。在這種情況下,HI業(yè)務(wù)為單音頻通道。如本文所述,這種對(duì)話可以被處理,用于實(shí)現(xiàn)聽力損傷聽眾改善的可懂度。CM和HI兩種業(yè)務(wù)的同時(shí)再現(xiàn)使聽力損傷聽眾能夠聽到CM和HI業(yè)務(wù)的混合聲音,以便突出對(duì)話,同時(shí)還提供一些音樂和聲音效果。除了提供HI業(yè)務(wù)作為單一的對(duì)話通道,HI業(yè)務(wù)也可以作為完整節(jié)目混合聲音來提供,其中包含音樂、聲音效果以及對(duì)話,具有提高了的可懂度。在這種情況下,該業(yè)務(wù)可以使用任何通道數(shù)量(最高為5.1)來進(jìn)行編碼。雖然這種業(yè)務(wù)可以改善某些聽力損傷者的聽力體驗(yàn),但它肯定不適合那些因?yàn)楹ε卤灰暈槁犃p傷者而不采用指定接收機(jī)的人們。最后,為聽力損傷者所進(jìn)行的任何對(duì)話處理禁止在為非聽力損傷者創(chuàng)建音頻節(jié)目中使用該通道。此外,附錄B中提出的HI業(yè)務(wù)和CM業(yè)務(wù)之間的關(guān)系仍然沒有對(duì)每個(gè)用來為聽力損傷者創(chuàng)建通道的相關(guān)信號(hào)級(jí)進(jìn)行定義。
其它技術(shù)已經(jīng)被用來嘗試改善音頻的可懂度。例如,美國專利No.4024344公開了一種創(chuàng)建電影聲音中對(duì)話的“中置音頻通道”的方法。其中公開的這種技術(shù)使左、右立體音頻通道相關(guān)聯(lián),并根據(jù)左、右音頻通道的相關(guān)程度來調(diào)節(jié)組合的和/或獨(dú)立的左或右音頻通道中的增益。假定左、右音頻通道之間較強(qiáng)的相關(guān)性表示是否出現(xiàn)對(duì)話。中置音頻通道是左、右音頻通道的過濾總和,它根據(jù)左、右音頻通道之間相關(guān)的程度被放大或衰減。這種方法的問題在于它沒有區(qū)別有意義的對(duì)話和簡單的相關(guān)聲音,也沒有針對(duì)語音頻帶中不希望的語音信息。因此,就不能為所有聽力損傷者改善所有音頻的可懂度。
總的來說,上述杜比及其它的發(fā)明均嘗試通過各種信號(hào)處理硬件或算法來修改音頻信號(hào)的某些內(nèi)容,但是,這些方法沒有滿足不同聽眾的個(gè)人需要或喜好??傊?,所有這些技術(shù)均為聽力損傷者以及非聽力損傷者提供了非最佳的聽力體驗(yàn)。
最后,微型化電子和高質(zhì)量數(shù)字音頻已經(jīng)在數(shù)字助聽技術(shù)中引起了技術(shù)革命。此外,最新的數(shù)字音頻傳輸標(biāo)準(zhǔn)以及包括DVD(所有格式的)、數(shù)字電視、因特網(wǎng)無線電廣播、數(shù)字無線電廣播在內(nèi)的錄音節(jié)目均結(jié)合復(fù)雜的壓縮方法,使終端用戶能夠?qū)σ纛l節(jié)目進(jìn)行前所未有的控制。這兩種技術(shù)的結(jié)合已經(jīng)提供了改進(jìn)的方法,用于為聽力損傷的終端用戶提供欣賞數(shù)字音頻節(jié)目的能力。但是,這種結(jié)合沒有針對(duì)不同聽力損傷終端用戶的所有需求和關(guān)注。
因此,本發(fā)明針對(duì)開發(fā)一種用于處理音頻信號(hào)的系統(tǒng)和方法的問題,本優(yōu)化聽力損傷者和非聽力損傷者的聽力體驗(yàn),無論是個(gè)人的還是集體的。
發(fā)明概述一種集成的用于接收音頻信號(hào)的個(gè)人收聽裝置和解碼器,它包括解碼器,用于通過將音頻信號(hào)分解為語音信號(hào)和背景信號(hào)來對(duì)音頻信號(hào)進(jìn)行解碼;第一終端用戶可調(diào)放大器,它被連接到語音信號(hào)并對(duì)語音信號(hào)進(jìn)行放大;第二終端用戶可調(diào)放大器,它被連接到背景信號(hào)并對(duì)背景信號(hào)進(jìn)行放大;加法放大器,它被連接到所述第一和第二終端用戶可調(diào)放大器并輸出總音頻信號(hào),所述總信號(hào)被連接到個(gè)人收聽裝置。
附圖概述
圖1說明按照本發(fā)明的一般方法,用于從錄制節(jié)目或廣播節(jié)目的普通背景音頻中分離有關(guān)語音信息。
圖2說明按照本發(fā)明的示意性實(shí)施例,用于接收和播放編碼節(jié)目信號(hào)。
圖3說明傳統(tǒng)的個(gè)人收聽裝置的示意性實(shí)施例,諸如助聽器。
圖4是方框圖,說明用于同時(shí)多終端用戶的語音對(duì)剩余音頻(VAR)系統(tǒng)。
圖5是方框圖,說明一種按照本發(fā)明實(shí)施例的向個(gè)人收聽裝置發(fā)送無線傳輸?shù)慕獯a器。
圖6說明到達(dá)助聽器麥克風(fēng)及終端用戶耳朵的環(huán)境聲。
圖7說明與圖6所示助聽器配合使用的耳塞。
圖8是信號(hào)通路的方框圖,其中信號(hào)通路通過按照本發(fā)明實(shí)施例的解碼器激活助聽器到達(dá)聽力損傷終端用戶。
圖9是信號(hào)通路的方框圖,其中信號(hào)通路到達(dá)聽力損傷終端用戶,它結(jié)合了自適應(yīng)噪聲消除算法。
圖10是信號(hào)通路的方框圖,其中信號(hào)通路通過按照本發(fā)明的另一個(gè)實(shí)施例的解碼器到達(dá)聽力損傷終端用戶。
圖11說明本發(fā)明的另一個(gè)實(shí)施例。
圖12說明本發(fā)明的另一個(gè)實(shí)施例。
詳細(xì)說明本發(fā)明的實(shí)施例針對(duì)集成的個(gè)人收聽裝置和解碼器。這種解碼器的一個(gè)示例是杜比數(shù)字(DD)解碼器。如上所述,杜比數(shù)字是一種音頻壓縮標(biāo)準(zhǔn),它在陸地廣播和記錄媒體方面得到廣泛應(yīng)用。雖然本文中的說明采用DD解碼器,但也可使用其它類型的解碼器,而不脫離本發(fā)明的精神和范圍。此外,不排除除杜比數(shù)字之外的其它數(shù)字音頻標(biāo)準(zhǔn)。本實(shí)施例使聽力損傷終端用戶可以在與其它聽眾一起的收聽環(huán)境中利用DD提供的“聽力損傷相關(guān)音頻業(yè)務(wù)”,而不影響其它聽眾的收聽興致。本文所使用的術(shù)語“終端用戶”是指客戶,或者是廣播或錄音的聽眾,又或者是接收通過錄音或廣播所發(fā)布的音頻媒體上的音頻信號(hào)的人。此外,術(shù)語“個(gè)人收聽裝置”是指助聽器、頭戴式耳機(jī)、助聽裝置、耳蝸插入物或其它有助于終端用戶能力的裝置。另外,術(shù)語“首選音頻”是指音頻信號(hào)的首選信號(hào)、語音成份、語音信息或主要語音成份,術(shù)語“剩余音頻”是指音頻信號(hào)的背景、音樂或非語音成份。
本發(fā)明的其它實(shí)施例涉及一種解碼器,它直接向諸如助聽器或耳蝸插入物的個(gè)人收聽裝置發(fā)送無線傳輸。“聽力損傷相關(guān)音頻業(yè)務(wù)”由DD提供,它提供隨同主節(jié)目一道的單獨(dú)對(duì)話,與“聽力損傷相關(guān)音頻業(yè)務(wù)”配合使用,解碼器為聽力損傷終端用戶提供調(diào)節(jié)能力,用于有其他聽眾也在同一收聽環(huán)境的情況下改善可懂度,同時(shí)其他聽眾可以欣賞未受影響的主音節(jié)目。
本發(fā)明的其它實(shí)施例涉及截取盒(interception box),它在廣播伴隨從模擬傳輸?shù)綌?shù)字傳輸過渡時(shí)為通信市場提供服務(wù)。截取盒使終端用戶可以利用聽力損傷方式(HI),而不需要具備完整功能的主/相關(guān)音頻業(yè)務(wù)解碼器。截取盒對(duì)發(fā)送的數(shù)字信息進(jìn)行解碼,并允許終端用戶采用模擬形式控制來調(diào)節(jié)聽力損傷參數(shù)。這種模擬信號(hào)還被直接饋送給諸如電視的模擬播放裝置。按照本發(fā)明,截取盒可以與諸如助聽器的個(gè)人收聽裝置一起使用,或者在過渡期間能允許數(shù)字業(yè)務(wù)為模擬終端用戶所使用。
首選音頻對(duì)剩余音頻的比率的意義本發(fā)明首先認(rèn)識(shí)到,首選音頻信號(hào)相對(duì)于任何剩余音頻的比率的收聽優(yōu)先范圍相當(dāng)大,無疑比所預(yù)計(jì)的要大。這個(gè)重大發(fā)現(xiàn)是對(duì)小樣本人口就其在首選音頻信號(hào)級(jí)對(duì)全部剩余音頻信號(hào)級(jí)的比率的喜好方面進(jìn)行的調(diào)查所得出的結(jié)果。
聽力損傷或正常聽眾的所需范圍的具體調(diào)節(jié)在了解正常和聽力損傷終端用戶是如何感覺到不同類型的音頻節(jié)目的對(duì)話和剩余音頻之間的比率方面,進(jìn)行了非常有針對(duì)的研究。已經(jīng)發(fā)現(xiàn),在語音和剩余音頻之間所需的調(diào)節(jié)范圍方面有極大的差別。
對(duì)包括小學(xué)生、中學(xué)生、中年居民以及老年居民在內(nèi)的隨機(jī)樣本人口進(jìn)行了兩個(gè)實(shí)驗(yàn)??偣?1個(gè)人進(jìn)行了測試。測試包括要求終端用戶調(diào)節(jié)一場足球賽(其中,剩余音頻是喧嘩噪聲)和一首流行歌曲(其中,剩余音頻是音樂)的語音級(jí)和剩余音頻級(jí)。對(duì)于每個(gè)選項(xiàng),通過用剩余音頻的音量的線性值除對(duì)話或語音的音量的線性值來產(chǎn)生稱作VRA(語音對(duì)剩余音頻)比率的量度。
這種測試說明了幾件事。第一,對(duì)于體育和音樂媒體兩者來說,不會(huì)有兩個(gè)人都喜好相同的語音和剩余音頻比率。這一點(diǎn)非常重要,因?yàn)樗鋈丝谝蕾囉谥谱髡邅硖峁?huì)吸引每個(gè)人的VRA(這是客戶無法調(diào)節(jié)的)。這顯然是不會(huì)出現(xiàn)的,測試結(jié)果如此。其次,盡管對(duì)于那些聽力損傷者,VRA通常較高(以便改善可懂度),但那些正常聽力的人也喜歡不同于目前制作者們所提供的比率。
同樣重要的是要強(qiáng)調(diào)一個(gè)事實(shí)提供VRA調(diào)節(jié)的任何裝置都必須提供至少與這些測試推斷的差不多的調(diào)節(jié)功能,以便使其滿足相當(dāng)大部分的所述人口。由于視頻和家庭影院媒體提供各種各樣的節(jié)目,我們應(yīng)該考慮,該比率應(yīng)至少從對(duì)任何媒體(音樂或體育賽事)的最低被測比率延伸到對(duì)音樂或體育賽事的最高被測比率。這為0.1至20.17,或者說是46dB的范圍。應(yīng)該指出,這只是對(duì)所述人口的抽樣調(diào)查,在理論上調(diào)節(jié)功能應(yīng)該是無限的,因?yàn)楹芸赡苣硞€(gè)人在觀看一場賽事廣播時(shí)可能不喜歡喧嘩噪聲,而另一個(gè)人卻不喜歡播音。注意,在文獻(xiàn)或先有技術(shù)中沒有報(bào)導(dǎo)或說明這種調(diào)查以及對(duì)于變化極大的VRA比率的要求。
在這個(gè)測試中,選取一組年長的男性,并要求他們?cè)诠潭ū尘霸肼暫筒ヒ魡T聲音之間進(jìn)行調(diào)節(jié)(稍后對(duì)一組學(xué)生進(jìn)行測試),其中,只有播音員的聲音可以改變,而背景噪聲則設(shè)置為6.00。年長組的測試結(jié)果如下表I
為了進(jìn)一步說明一個(gè)事實(shí),即各種年齡的人都有不同的聽力需求和喜好,選取一組21歲的大學(xué)生來聽語音和背景音的混合聲音,并通過對(duì)語音級(jí)進(jìn)行調(diào)節(jié)來選擇語音對(duì)背景音的比率。在這種情況下的背景噪聲為一場足球賽事的喧嘩噪聲,它被固定為六(6.00)的設(shè)置值,學(xué)生可以調(diào)節(jié)播音員解說聲的音量,其中,播音員的解說聲已經(jīng)單獨(dú)錄制并且是純語音或主要是純語音。換句話說,選取這些學(xué)生來進(jìn)行與年長的男性組所進(jìn)行的相同測試。選取學(xué)生的目的在于使年齡所引起的聽力衰退現(xiàn)象減到最小。這些學(xué)生全部為二十歲左右。測試結(jié)果如下表II
年長組(如表I所示)的年齡范圍從36至59歲,其中主要為40或50歲的人。正如測試結(jié)果所表明的,趨于相當(dāng)高的平均設(shè)置值表明全體人員均有某種程度的聽力損失。范圍也是在3.00至7.75之間變化,有4.75的差額,證實(shí)了人們喜好的語音對(duì)背景收聽比率或者說任何首選信號(hào)對(duì)剩余音頻(PSRA)比率的變化范圍。兩組測試對(duì)象的音量設(shè)置值的整個(gè)跨度范圍為2.0至7.75。這些級(jí)(level)表示有關(guān)用于進(jìn)行該實(shí)驗(yàn)所使用的音量調(diào)節(jié)機(jī)構(gòu)的實(shí)際值。它們提供了信號(hào)對(duì)噪聲值的范圍的指示(在與“噪聲”級(jí)6.0相比較時(shí)),可能是不同終端用戶所需的。
為了更好地了解這與不同終端用戶選擇的相對(duì)響度變化的聯(lián)系,認(rèn)為從2.0至7.75的非線性音量控制變化表示20dB或十(10)倍的增加。這樣,即使對(duì)于這樣小的人口抽樣調(diào)查和單一類型的音頻節(jié)目,均發(fā)現(xiàn)不同的聽眾的確喜歡“首選信號(hào)”關(guān)于“剩余音頻”的極為不同的級(jí)別。這種喜好貫穿于各年齡組,說明它符合個(gè)人喜好和基本的聽力,這迄今是完全未預(yù)料的。
測試結(jié)果表示,沒有因年齡而引起聽力衰退的被選學(xué)生組的范圍(如表II所示)變化大,從低設(shè)置值2.00至高設(shè)置值6.70,差額為4.70,即幾乎是1至10的總范圍的一半。這個(gè)測試說明,大多數(shù)錄制和廣播音頻信號(hào)的“一個(gè)大小適合全體(one size fits all)”之心理遠(yuǎn)遠(yuǎn)不能為個(gè)人聽眾提供能力來調(diào)節(jié)混合聲音以滿足其個(gè)人喜好或聽力需求。同樣,學(xué)生的設(shè)置值具有較大的范圍,與年長組相同,這表明在喜好和聽力需求方面的個(gè)人差異。該測試的一個(gè)結(jié)果是聽力喜好是十分不同的。
對(duì)更大的抽樣組的進(jìn)一步測試證實(shí)了這個(gè)測試結(jié)果。此外,這些結(jié)果根據(jù)音頻的類型有所改變。例如,當(dāng)音頻源是音樂時(shí),語音對(duì)剩余音頻的比率從接近零至大約10的范圍變化,而當(dāng)音頻源是體育節(jié)目時(shí),語音對(duì)剩余音頻的比率在接近零和大約20之間變化。此外,標(biāo)準(zhǔn)差增加約三倍,而平均值則比音樂的平均值增加兩倍以上。
上述測試的最終結(jié)果是如果選擇首選音頻對(duì)剩余音頻比率并將其一直固定為這個(gè)值,則很可能創(chuàng)建出一個(gè)低于大部分所述人口所需的音頻節(jié)目。并且,如上所述,首選的比率可能是短期和長期的時(shí)間變化函數(shù)。因此,需要對(duì)該首選音頻對(duì)剩余音頻比率的完全控制,以便滿足“正常”或非聽力損傷聽眾的聽力需求。另外,為終端用戶提供對(duì)所述比率的最終控制,以使終端用戶能夠優(yōu)化其聽力體驗(yàn)。
終端用戶對(duì)首選音頻信號(hào)和剩余音頻信號(hào)的獨(dú)立調(diào)節(jié)將是本發(fā)明一個(gè)方面的顯著的表現(xiàn)。為了說明本發(fā)明的詳細(xì)情況,考慮首選音頻信號(hào)是相關(guān)語音信息的應(yīng)用。
首選音頻信號(hào)和剩余音頻信號(hào)的創(chuàng)建圖1說明用于從錄制或廣播節(jié)目的普通背景音頻中分離相關(guān)語音信息的一般方法。首先就需要由節(jié)目導(dǎo)演關(guān)于相關(guān)語音定義作出決定。演出人員或解說員必須標(biāo)識(shí)為相關(guān)的說話者。
一旦標(biāo)識(shí)了相關(guān)的說話者,其聲音將由語音麥克風(fēng)301獲取。語音麥克風(fēng)1必須是近講麥克風(fēng)(close talking microphone)(在解說員的情況下)或用于錄音的強(qiáng)指向性麥克風(fēng)(highly directional shotgun)。除了強(qiáng)指向性之外,這些麥克風(fēng)301還必須是語音頻帶受限的,最好是200-5000Hz。定向性和帶通濾波的組合使錄制時(shí)在聲學(xué)上結(jié)合到相關(guān)語音信息的背景噪聲降到最小。在某種類型的節(jié)目的情況下,通過離線錄制對(duì)話的相關(guān)語音,以及通過適當(dāng)?shù)亟o節(jié)目的視頻部分配上對(duì)話,可以避免對(duì)防止聲結(jié)合的需求。背景麥克風(fēng)302應(yīng)該是寬帶的,以便提供豐富的背景信息(如音樂)音頻質(zhì)量。
攝像機(jī)303將用來提供節(jié)目的視頻部分。音頻信號(hào)(語音和相關(guān)語音)將在編碼器304中與視頻信號(hào)一起被編碼。一般來說,僅通過采用不同的載波頻率對(duì)音頻信號(hào)進(jìn)行調(diào)制,音頻信號(hào)常常與視頻信號(hào)分離。由于現(xiàn)在大多數(shù)廣播都是立體聲的,所以將相關(guān)語音信息與背景一起進(jìn)行編碼的一種方法是以大致相同的方式在獨(dú)立的立體聲通道上復(fù)用相關(guān)語音信息,其中,左前置通道和右前置通道被加到兩個(gè)立體聲通道,以便產(chǎn)生四聲道盤錄音。盡管這種方法會(huì)產(chǎn)生對(duì)附加廣播帶寬的需求,對(duì)于錄制媒體來說,這將不是問題,只要影碟或磁帶播放機(jī)中的音頻電路被設(shè)計(jì)成對(duì)相關(guān)語音信息進(jìn)行解調(diào)。
一旦采用適當(dāng)?shù)姆椒▽?duì)信號(hào)進(jìn)行編碼,編碼信號(hào)由廣播系統(tǒng)305通過天線313發(fā)出用于進(jìn)行廣播,或通過記錄系統(tǒng)306錄制在磁帶或盤上。在錄制的音頻視頻信息的情況下,背景和語音信息可以僅放置在獨(dú)立的記錄道上。
接收、解調(diào)首選音頻信號(hào)和剩余音頻圖2說明用于接收和播放編碼節(jié)目信號(hào)的一個(gè)示例性實(shí)施例。在廣播信息的情況下,接收機(jī)系統(tǒng)307對(duì)來自編碼音頻/視頻信號(hào)的主載波頻率進(jìn)行解調(diào)。在錄制媒體314的情況下,VCR的磁頭或CD播放器的激光讀取器308將產(chǎn)生編碼音頻/視頻信號(hào)。
在上述任何一種情況下,這些信號(hào)將被發(fā)送給解碼系統(tǒng)309。解碼器309結(jié)合頻分或時(shí)分解調(diào)利用諸如包絡(luò)檢波的標(biāo)準(zhǔn)解碼技術(shù)來把信號(hào)分離成視頻、語音音頻及背景音頻。背景音頻信號(hào)被發(fā)送給獨(dú)立的可變?cè)鲆娣糯笃?10,聽眾可以按照自己的喜好對(duì)其進(jìn)行調(diào)節(jié)。語音信號(hào)被發(fā)送給可變?cè)鲆娣糯笃?11,可以由聽眾按照其自己獨(dú)特的需求來進(jìn)行調(diào)節(jié),就想上面討論的那樣。
兩種經(jīng)過調(diào)節(jié)的信號(hào)由統(tǒng)一增益加法放大器(unity gain summingamplifier)132相加,以便產(chǎn)生最終的音頻輸出。另一方面,兩種經(jīng)過調(diào)節(jié)的信號(hào)由統(tǒng)一增益加法放大器312相加,并由可變?cè)鲆娣糯笃?15作進(jìn)一步調(diào)節(jié),以便產(chǎn)生最終的音頻輸出。照這樣,聽眾可以調(diào)節(jié)相關(guān)語音相對(duì)背景的級(jí)別,以便在播放音頻節(jié)目時(shí)按照其自己獨(dú)特的收聽要求來優(yōu)化該音頻節(jié)目。同一聽眾每次播放相同音頻時(shí),該比率設(shè)置值可能由于聽眾的聽力變化而需要改變,該設(shè)置值保持無限可調(diào),以便適應(yīng)這種靈活性。
典型的個(gè)人收聽裝置的配置圖3說明一個(gè)諸如助聽器的傳統(tǒng)個(gè)人收聽裝置10的示意性實(shí)施例。助聽器10包括麥克風(fēng)11、前置放大器12、可變放大器13、功率放大器14及激勵(lì)器15。麥克風(fēng)11通常位于助聽器10中,朝外放置,以便檢測貼近終端用戶耳朵的周圍環(huán)境聲音。麥克風(fēng)11接收作為聲壓的周圍環(huán)境聲,并將聲壓轉(zhuǎn)換成電信號(hào)。麥克風(fēng)11連接到接收電信號(hào)的前置放大器12。電信號(hào)由前置放大器12進(jìn)行處理,并產(chǎn)生較大幅值的電信號(hào)。這個(gè)較大幅值的電信號(hào)被轉(zhuǎn)發(fā)給終端用戶控制可變放大器。終端用戶控制可變放大器連接到助聽器外部的刻度盤(dial)。這樣,終端用戶便具備了控制麥克風(fēng)信號(hào)(即全部環(huán)境聲音的總和)音量的能力。終端用戶控制可變放大器13的輸出被發(fā)送給功率放大器14,在其中為電信號(hào)提供了功率,以便驅(qū)動(dòng)激勵(lì)器/喇叭15。激勵(lì)器/喇叭15被放在終端用戶的耳道內(nèi)。激勵(lì)器/喇叭15將來自功率放大器14的電信號(hào)轉(zhuǎn)換成聲信號(hào),該聲信號(hào)是代表環(huán)境聲音的麥克風(fēng)信號(hào)的放大形式。通過將激勵(lì)器/喇叭15放置在耳道中而將麥克風(fēng)11放置在耳道外,來避免從激勵(lì)器到麥克風(fēng)11的聲反饋。
雖然上面說明了助聽器的組件,但是,上述其它個(gè)人收聽裝置可以用于本發(fā)明中。
個(gè)人收聽裝置及解碼器在室內(nèi)收聽環(huán)境下,可能同時(shí)存在不同程度聽力損傷的聽眾以及正常聽力的聽眾。上述助聽器或其它收聽裝置可以配備解碼器,所述解碼器接收來自節(jié)目源的數(shù)字信號(hào)并單獨(dú)對(duì)該信號(hào)進(jìn)行解碼,使終端用戶能夠使用語音,例如聽力損傷相關(guān)音頻業(yè)務(wù),而不會(huì)影響其它聽眾的收聽環(huán)境。
如上所述,語音對(duì)剩余音頻的首選比率對(duì)于不同的人來說存在極大的差異,尤其是對(duì)聽力損傷者來說,并且對(duì)于不同類型的節(jié)目(體育賽事與音樂等)來說也存在差別。圖4是一個(gè)方框圖,說明按照本發(fā)明一個(gè)實(shí)施例的同時(shí)多終端用戶的VRA系統(tǒng)。該系統(tǒng)包括比特流源220、系統(tǒng)解碼器221、中繼器222以及多個(gè)個(gè)人VRA解碼器223,其中個(gè)人VRA解碼器223與個(gè)人收聽裝置224結(jié)合或與個(gè)人收聽裝置224連接。數(shù)字源(DVD、數(shù)字電視廣播等)通常提供數(shù)字信息信號(hào),其中包含壓縮數(shù)字和視頻信息。例如,杜比數(shù)字提供包含音頻節(jié)目的數(shù)字信息信號(hào),諸如音樂和效果(ME)信號(hào)、及作為杜比數(shù)字相關(guān)業(yè)務(wù)一部分的聽力損傷(HI)信號(hào)。按照本發(fā)明的一個(gè)實(shí)施例,數(shù)字信息信號(hào)包括獨(dú)立的語音成份信號(hào)(如HI信號(hào))和剩余音頻成份信號(hào)(如ME或CE信號(hào)),它們作為單一比特流同時(shí)被傳送給系統(tǒng)解碼器221。
按照本發(fā)明的一個(gè)實(shí)施例,來自比特流源220的比特流還被提供給中繼器222。中繼器222將該比特流重新發(fā)送給多個(gè)個(gè)人VRA解碼器223。每個(gè)個(gè)人VRA解碼器223包括解調(diào)器266和解碼器267,用于對(duì)比特流進(jìn)行解碼;可變放大器225和226,用于分別調(diào)節(jié)語音成份信號(hào)和剩余音頻信號(hào)成份。經(jīng)調(diào)節(jié)的信號(hào)成份由加法器227進(jìn)行混合(downmix),并且可由可變放大器281進(jìn)一步調(diào)節(jié)。經(jīng)調(diào)節(jié)的信號(hào)然后被發(fā)送給個(gè)人收聽裝置224。按照本發(fā)明的一個(gè)實(shí)施例,個(gè)人VRA解碼器與個(gè)人收聽裝置連接,并形成一個(gè)單元,表示為250。另一方面,個(gè)人VRA解碼器223和個(gè)人收聽裝置224可以是獨(dú)立的裝置,并以有線或無線的方式進(jìn)行通信。個(gè)人收聽裝置224可以是包含圖3所示組件的助聽器。同樣,個(gè)人VRA解碼器223的輸出被饋送給終端用戶控制放大器13,供終端用戶進(jìn)一步調(diào)節(jié)。雖然示出三個(gè)個(gè)人VRA解碼器及相關(guān)個(gè)人收聽裝置,但是,可以使用更多的個(gè)人VRA解碼器及相關(guān)個(gè)人收聽裝置,而不脫離本發(fā)明的精神和范圍。
對(duì)于5.1通道節(jié)目,語音主要置于中置通道,而剩余音頻則置于左、右、左環(huán)繞以及右環(huán)繞上。對(duì)于具有個(gè)人收聽裝置的終端用戶來說,聲音的空間定位是極少關(guān)心的事,因?yàn)樗麄冎械拇蠖鄶?shù)都對(duì)語音可懂度有極大的困難。通過使終端用戶調(diào)節(jié)中置通道關(guān)于其它4.1通道的級(jí)別,可以提供語音可懂度方面的改善。這些5.1通道則被混合為2通道,中置通道的音量調(diào)節(jié)允許改善語音可懂度方面,而不依賴于上述聽力損傷模式。本發(fā)明的這個(gè)方面優(yōu)于全功能AC3類型,這表現(xiàn)為終端用戶能夠獲得有限VRA調(diào)節(jié),而不需要諸如聽力損傷模式的獨(dú)立對(duì)話通道。
圖5說明一種解碼器,它直接向按照本發(fā)明一個(gè)實(shí)施例的個(gè)人收聽裝置發(fā)送無線傳輸。如上所述,數(shù)字比特流源220同前面一樣向系統(tǒng)解碼器221提供數(shù)字比特流。如果沒有元數(shù)據(jù)可供聽力損傷聽眾使用(即沒有HI模式),則沒有必要發(fā)送整個(gè)數(shù)字比特流,而只發(fā)送音頻信號(hào)。注意,這是與助聽器本身包含數(shù)字解碼器這一概念的一個(gè)小偏差,但它意味著向聽力損傷者提供相同的業(yè)務(wù)。在系統(tǒng)再現(xiàn)230中,5.1音頻通道被分離成中置(主要包含對(duì)話-取決于生產(chǎn)實(shí)踐)和其它,后者主要包含可能降低可懂度的音樂和效果。5.1音頻信號(hào)還被饋送給收發(fā)機(jī)260。收發(fā)機(jī)260接收信號(hào)和并向多個(gè)VRA接收裝置270重發(fā)所述信號(hào)。VRA接收裝置270包括諸如用于消除傳送信號(hào)的載波信號(hào)的解調(diào)器的電路。載波信號(hào)是用來傳送或“承載”輸出信號(hào)信息的信號(hào)。經(jīng)解調(diào)的信號(hào)建立左、右、左環(huán)繞、右環(huán)繞、亞(剩余音頻)和中置(首選)通道信號(hào)。利用可變放大器225來調(diào)節(jié)首選通道信號(hào),而利用可變放大器226來調(diào)節(jié)剩余音頻信號(hào)(左、右、左環(huán)繞、右環(huán)繞及亞低音)。這些可變放大器中每一個(gè)的輸出被饋送給加法器227,加法器227的輸出可以利用可變放大器281來調(diào)節(jié)。這種相加和調(diào)節(jié)的電信號(hào)被提供給終端用戶控制放大器13,隨后再被發(fā)送給功率放大器14。經(jīng)放大的電信號(hào)則被轉(zhuǎn)換成經(jīng)放大的聲信號(hào),提供給終端用戶。根據(jù)上述實(shí)施例,多個(gè)終端用戶可以同時(shí)接收用于VRA調(diào)節(jié)的輸出信號(hào)。
圖6至7說明幾個(gè)與本發(fā)明有關(guān)的相關(guān)特性。圖6說明到達(dá)助聽器麥克風(fēng)11和終端用戶耳朵的環(huán)境聲(包含相同的數(shù)字音頻節(jié)目)。麥克風(fēng)所接收的環(huán)境聲將不是與通過連接助聽器的個(gè)人VRA解碼器223到達(dá)的聲音完全同步的。其原因在于兩個(gè)傳輸通路具有極為不同的特性。個(gè)人VRA解碼器提供一種信號(hào),這個(gè)信號(hào)以光速通過純電子通路傳播,沒有增加的聲學(xué)特性。然而,環(huán)境聲則通過一條通路以音速從聲音源傳播到終端用戶,并且也包含終端用戶所處環(huán)境的聲學(xué)定義的回響因素。如果該終端用戶至少具有某種獨(dú)立聽力,那么關(guān)閉助聽器的環(huán)境麥克風(fēng)將不會(huì)完全糾正這個(gè)問題。終端用戶可以聽到的部分環(huán)境聲將會(huì)干擾個(gè)人音頻解碼器提供的節(jié)目。
本發(fā)明所考慮的一個(gè)解決方案是在從VRA個(gè)人解碼器提供信號(hào)時(shí),為終端用戶提供阻擋環(huán)境聲的能力。這可以通過使用如圖7所示的耳塞來實(shí)現(xiàn)。
雖然這種方法將逐漸達(dá)到耳塞環(huán)境噪聲抑制能力的極限,但是它有一個(gè)顯著的缺陷。對(duì)于與另一個(gè)人一起欣賞節(jié)目的某個(gè)人,可能需要在節(jié)目進(jìn)行當(dāng)中進(jìn)行輕松的交談。耳塞不僅阻擋了主要音頻源(干擾進(jìn)入助聽器的經(jīng)解碼的音頻),而且也不加區(qū)別地阻擋了其它環(huán)境噪聲。為了有選擇地阻擋主音頻再現(xiàn)系統(tǒng)所產(chǎn)生的環(huán)境噪聲而不影響其它(所需的)環(huán)境聲音,就要求更為復(fù)雜的方法。注意,同樣的說明可以用于有關(guān)使用頭戴式解碼器的可接受性。頭戴式耳套提供了對(duì)環(huán)境噪聲的一定衰減程度,但干擾了交談。如果這對(duì)于聽力損傷終端用戶不是太重要的話,這種方法是可以接受的。
所需要的是一種方法來避免與數(shù)字音頻節(jié)目的空氣傳播有關(guān)的潛在問題,同時(shí)還使聽力損傷聽眾能夠與同一個(gè)房間中的其它觀賞者互相交流。圖8示出信號(hào)通路的方框圖,其中,信號(hào)通路通過數(shù)字解碼器激活助聽器到達(dá)聽力損傷終端用戶。純(解碼的)數(shù)字音頻“S”直接到助聽器“HA”,并且可以由終端用戶可調(diào)放大器“w2”進(jìn)行修改。在送達(dá)助聽器變換器之前,這個(gè)數(shù)字音頻信號(hào)還通過主傳送系統(tǒng)和室內(nèi)音響裝置(G1)進(jìn)行傳播。除了這個(gè)信號(hào),“d”存在并表示所需的環(huán)境聲,諸如朋友的談話。這個(gè)到達(dá)麥克風(fēng)的總信號(hào)也是終端用戶通過增益(可能與頻率相關(guān))“w1”可調(diào)節(jié)的。顯然,出現(xiàn)了第一個(gè)問題,我們發(fā)現(xiàn),由G修改的信號(hào)s干擾來自助聽器解碼器的純數(shù)字音頻信號(hào);所需的室內(nèi)音頻通過相同的信號(hào)通路傳送。當(dāng)包含通過助聽器的物理通路時(shí)存在第二個(gè)問題,假定終端用戶在一定程度上具有通過該通路(由“G”表示)收聽音頻的能力。實(shí)際上到達(dá)耳朵的是由w1放大的室內(nèi)音頻、由w2放大的解碼器信號(hào)、和被“G”抑制的室內(nèi)音頻的組合。從整個(gè)系統(tǒng)中希望得到的是在聽力損傷修改解碼器輸出和室內(nèi)存在的所需信號(hào)之間的簡單終端用戶可調(diào)節(jié)的混合。由于存在發(fā)送給終端用戶的解碼器信號(hào)的單獨(dú)測量,所以通過使用自適應(yīng)前饋控制,這個(gè)最終結(jié)果是可能的。
圖9說明一個(gè)重構(gòu)的方框圖,其中加入了自適應(yīng)濾波器(標(biāo)記為“AF”)。有一個(gè)作為實(shí)施例提出的自適應(yīng)濾波的方法的基礎(chǔ)的重要假設(shè)通過圖8中“G”的傳送通路基本上是可以忽略的。在物理方面,這是指助聽器本身的無源噪聲控制性能足以抑制到達(dá)終端用戶耳朵的環(huán)境噪聲。(還要注意,G包括個(gè)人的聽力損傷量;如果非常高,那么這個(gè)聲音通路也可以忽略)。如果情況不是這樣,則應(yīng)當(dāng)進(jìn)行測量,以便對(duì)助聽器本身增加附加無源控制,使環(huán)境到終端用戶耳膜的物理通路(不是電子通路)具有極高的介入損耗。圖9中的虛線表示助聽器本身。存在音頻輸入助聽器麥克風(fēng)獲得所有環(huán)境噪聲(包括來自主要播放裝置喇叭的音頻節(jié)目,它沒有受前面所述的聽力損傷模式所改變)以及數(shù)字音頻信號(hào),后者經(jīng)解碼、調(diào)節(jié),用于優(yōu)化聽力損傷者收聽。如上所述,助聽器麥克風(fēng)的難題在于它獲得所需的環(huán)境聲音(談話)和潛在的音頻節(jié)目。這種音頻節(jié)目信號(hào)將會(huì)干擾聽力損傷音頻節(jié)目(單獨(dú)解碼的)。只降低助聽器麥克風(fēng)的音量級(jí)將會(huì)消除所需的音頻。如圖9所示的解決方案是使用解碼器信號(hào)作為參考,將自適應(yīng)噪聲消除算法置于麥克風(fēng)信號(hào)中。由于自適應(yīng)濾波器僅嘗試消除具有相關(guān)參考信號(hào)的一些信號(hào),而保持環(huán)境談話不受影響。因此,自適應(yīng)濾波器的輸出可以通過w1被單獨(dú)放大,而所需環(huán)境信號(hào)和經(jīng)解碼的音頻可以通過w2被單獨(dú)放大。這種方法固有的困難在于需要消除的音頻節(jié)目的帶寬可能超過自適應(yīng)濾波器的能力。
另外一個(gè)可用的可能性是將自適應(yīng)前饋控制與固定增益前饋控制結(jié)合。如圖10所示,這個(gè)選擇更為通用,因?yàn)樗灰笸ㄟ^助聽器的聲通路是可以忽略的。有可能確定助聽器本身的頻率響應(yīng)(傳輸損耗)、并利用這個(gè)估計(jì)來消除對(duì)沖擊耳朵的整體壓力的影響,通過利用這一事實(shí)來從沖擊耳朵的信號(hào)中消去所述通路。圖10說明整個(gè)助聽器設(shè)備與控制裝置的結(jié)合。首先說明所述設(shè)備組件。解碼器信號(hào)“S”被發(fā)送給助聽器解碼器(如上所述),用于聽力損傷或中置通道的處理以改善可懂度(處理未示出)。相同的信號(hào)還傳送給主要收聽環(huán)境,并通過全部由G1表示的那些音響裝置。音頻信號(hào)也在所述收聽環(huán)境中,諸如談話,由信號(hào)“d”表示。這兩種信號(hào)的組合(G1s+d)由位于聽眾耳朵表面的助聽器麥克風(fēng)接收。這個(gè)相同的聲學(xué)信號(hào)通過由G2表示的助聽器本身的物理組件進(jìn)行傳播。如果助聽器具有有效的無源控制,則這個(gè)傳送函數(shù)可能很小,如前面所假設(shè)的那樣。如果不是這樣,那么聲學(xué)或振動(dòng)傳送通路可能很重要。所述信號(hào)進(jìn)入助聽器后面的耳道,最后通過終端用戶可能有的任何聽力損傷(由G3表示)傳播到聽覺神經(jīng)。同樣通過助聽器傳播的是與(已經(jīng)調(diào)節(jié)的)聽力損傷解碼器信號(hào)(由w2放大)結(jié)合的環(huán)境噪聲的電子形式(由w1放大)。終端用戶調(diào)節(jié)的這兩種信號(hào)的組合表示環(huán)境噪聲和相同終端用戶已經(jīng)修改以提供改善的可懂度的純解碼器信號(hào)之間的混合聲音。為了了解兩種控制裝置的作用,認(rèn)為自適應(yīng)濾波器(AF)和設(shè)備估計(jì)G2(上加尖號(hào))均為零(即沒有控制)。到達(dá)終端用戶耳朵的最后所得到的生輸出為G3G2d+G3G2G1S+G3Hw2S+G3Hw1d+G3Hw1G1S理論上,助聽器(H)將轉(zhuǎn)化聽力損傷G3。因此,出現(xiàn)G3和H兩者的最后三項(xiàng)將具有接近1的系數(shù)。于是所產(chǎn)生的公式為w2S+w1d+G3G2d+G3G2G1S+w1G1S這沒有提供所需的聲音質(zhì)量。所需的和解碼器信號(hào)確實(shí)具有級(jí)調(diào)節(jié)功能,最后三項(xiàng)將通過電和物理信號(hào)通路來傳送主要的失真和潛在因素級(jí)。所需的結(jié)果是純解碼器信號(hào)和所需環(huán)境音頻信號(hào)的組合,其中終端用戶能夠控制在輸出中沒有其它信號(hào)的兩個(gè)信號(hào)之間的相對(duì)混合。變量“S”和“d+G1S”適合直接測量,值H、w1及w2是可由終端用戶控制的。變量的所述組合允許所需的調(diào)節(jié)能力。如果現(xiàn)在自適應(yīng)濾波器和設(shè)備估計(jì)值(G2上加尖號(hào))包含在輸出到終端用戶神經(jīng)的公式中,則公式為w1d+w2S+w1G1S-w1AFS+G3G2(d+G1S)-G3(G2上加尖號(hào))(d+G1S)現(xiàn)在,如果自適應(yīng)濾波器收斂于最佳解決方案,它將會(huì)和G1相同,使上述公式中的第三和第四項(xiàng)抵消。如果由于良好的系統(tǒng)識(shí)別使估計(jì)值G2接近G2,則在上述公式中的最后兩項(xiàng)也將抵消。這樣僅留下終端用戶通過w2修改的解碼器信號(hào)“S”及終端用戶通過w1修改的所需環(huán)境聲音“d”,這是所需的結(jié)果。這種方法的性能極限取決于自適應(yīng)濾波器的性能,并且還取決于當(dāng)終端用戶舒適地佩戴助聽器時(shí),從助聽器外部至助聽器內(nèi)部的系統(tǒng)標(biāo)識(shí)的準(zhǔn)確度。系統(tǒng)標(biāo)識(shí)步驟本身可以通過許多方式進(jìn)行,包括最小均方擬合(least meansquares fit)。
截取盒圖11說明按照本發(fā)明的另一個(gè)實(shí)施例。圖11示出用于同時(shí)傳送VRA可調(diào)節(jié)信號(hào)給多個(gè)終端用戶的VRA機(jī)頂盒終端的特性。
VRA機(jī)頂盒終端60包括解碼器61,用于對(duì)諸如數(shù)字TV、DVD等數(shù)字源提供的數(shù)字比特流進(jìn)行解碼。解碼器61對(duì)數(shù)字比特流進(jìn)行解碼,并輸出包含首選音頻成份(PA)和剩余音頻部分(RA)的數(shù)字信號(hào)。這些數(shù)字信號(hào)被饋送給數(shù)/模(D/A)轉(zhuǎn)換器62和69,數(shù)/模轉(zhuǎn)換器62和69將數(shù)字信號(hào)轉(zhuǎn)換成模擬信號(hào)。來自D/A轉(zhuǎn)換器62的模擬信號(hào)被饋送給發(fā)射機(jī)63,以便發(fā)送給接收機(jī),諸如圖5所示的接收機(jī)270。這樣,具有個(gè)人收聽裝置的多個(gè)終端用戶能夠?qū)ζ鋫€(gè)人裝置的語音對(duì)剩余音頻進(jìn)行調(diào)節(jié)。來自D/A轉(zhuǎn)換器69的輸出被發(fā)送給播放裝置,諸如模擬電視290。
圖12說明本發(fā)明的另一個(gè)實(shí)施例。與圖11相似,比特流由VRA機(jī)頂盒終端60的解碼器61來接收。解碼器輸出數(shù)字信號(hào),這些數(shù)字信號(hào)被發(fā)送到D/A轉(zhuǎn)換器62。D/A轉(zhuǎn)換器62的輸出是發(fā)送給發(fā)射機(jī)63的模擬信號(hào),用于這些信號(hào)向接收機(jī)270的傳送。D/A轉(zhuǎn)換器62還將其輸出的模擬信號(hào)饋送給可變放大器225及226,用于在加法器227進(jìn)行混合之前的終端用戶調(diào)節(jié)。該輸出信號(hào)按照上面關(guān)于圖11所述的類似方式饋送給模擬電視290,只是已經(jīng)進(jìn)行了VRA調(diào)節(jié)。按照本發(fā)明的本實(shí)施例,不僅使用接收機(jī)270的聽力損傷終端用戶將享有VRA調(diào)節(jié)能力,而且收聽模擬電視的終端用戶也具有同樣的能力。
雖然可以在后附權(quán)利要求書的范圍內(nèi)對(duì)本發(fā)明進(jìn)行多種變化和修改,但這些變化和修改在權(quán)利要求書的范圍之內(nèi)以及被其涵蓋。
權(quán)利要求
1.一種集成的個(gè)人收聽裝置及解碼器,它包括解碼器,用于對(duì)音頻信號(hào)進(jìn)行解碼,并將所述音頻信號(hào)分離為語音信號(hào)和背景信號(hào),第一終端用戶可調(diào)節(jié)放大器,它連接到所述語音信號(hào),并對(duì)所述語音信號(hào)進(jìn)行放大;第二終端用戶可調(diào)節(jié)放大器,它連接到所述背景信號(hào),并對(duì)所述背景信號(hào)進(jìn)行放大;加法放大器,它連接到所述第一和第二終端用戶可調(diào)節(jié)放大器的輸出端,并輸出總音頻信號(hào),所述總信號(hào)連接到個(gè)人收聽裝置。
2.如權(quán)利要求1所述的集成的個(gè)人收聽裝置及解碼器,其特征在于所述個(gè)人收聽裝置是助聽器。
3.如權(quán)利要求1所述的集成的個(gè)人收聽裝置及解碼器,其特征在于所述個(gè)人收聽裝置是頭戴式耳機(jī)。
4.如權(quán)利要求1所述的集成的個(gè)人收聽裝置及解碼器,其特征在于所述個(gè)人收聽裝置是輔助收聽裝置(assisitive listening device)。
5.如權(quán)利要求1所述的集成的個(gè)人收聽裝置及解碼器,其特征在于所述個(gè)人收聽裝置是耳蝸插入物(cochlear implant)。
6.如權(quán)利要求1所述的集成的個(gè)人收聽裝置及解碼器,其特征在于還包括第三終端用戶可調(diào)節(jié)放大器,它連接在所述加法放大器和所述個(gè)人收聽裝置之間,用于調(diào)節(jié)所述總信號(hào)。
7.一種語音對(duì)剩余音頻(VRA)接收裝置,它包括接收機(jī),用于接收音頻信號(hào)的語音信號(hào)和背景信號(hào),第一終端用戶可調(diào)節(jié)放大器,它連接到所述語音信號(hào),并對(duì)所述語音信號(hào)進(jìn)行放大;第二終端用戶可調(diào)節(jié)放大器,它連接到所述背景信號(hào),并對(duì)所述背景信號(hào)進(jìn)行放大;加法放大器,它連接到所述第一和第二終端用戶可調(diào)節(jié)放大器的輸出端,并輸出總音頻信號(hào),所述總信號(hào)連接到個(gè)人收聽裝置。
8.如權(quán)利要求7所述的接收機(jī),其特征在于所述個(gè)人收聽裝置是助聽器。
9.如權(quán)利要求7所述的接收機(jī),其特征在于所述個(gè)人收聽裝置是頭戴式耳機(jī)。
10.如權(quán)利要求7所述的接收機(jī),其特征在于所述個(gè)人收聽裝置是輔助收聽裝置。
11.如權(quán)利要求7所述的接收機(jī),其特征在于所述個(gè)人收聽裝置是耳蝸插入物。
12.如權(quán)利要求7所述的接收機(jī),其特征在于還包括第三終端用戶可調(diào)節(jié)放大器,它連接在所述加法放大器和所述個(gè)人收聽裝置之間,用于調(diào)節(jié)所述總信號(hào)。
13.一種用于提供語音對(duì)剩余音頻能力的機(jī)頂盒終端,它包括解碼器,用于對(duì)比特流進(jìn)行解碼,并生成作為其輸出的數(shù)字首選音頻信號(hào)和數(shù)字剩余音頻信號(hào);數(shù)/模(D/A)轉(zhuǎn)換器,它連接到所述解碼器,所述D/A轉(zhuǎn)換器將所述數(shù)字首選音頻信號(hào)和數(shù)字剩余音頻信號(hào)轉(zhuǎn)換成模擬首選音頻信號(hào)和模擬剩余音頻信號(hào);以及發(fā)射機(jī),它連接到所述D/A轉(zhuǎn)換器,并發(fā)送所述模擬首選音頻信號(hào)和所述模擬剩余音頻信號(hào)。
14.如權(quán)利要求13所述的機(jī)頂盒終端,其特征在于還包括第一終端用戶可調(diào)節(jié)放大器,它連接到所述模擬首選語音信號(hào),并放大所述模擬首選語音信號(hào);第二終端用戶可調(diào)節(jié)放大器,它連接到所述模擬剩余音頻信號(hào)和模擬剩余音頻信號(hào);加法放大器,它連接到所述第一和第二終端用戶可調(diào)節(jié)放大器的輸出端,并輸出總音頻信號(hào),所述總信號(hào)連接到模擬接收裝置。
全文摘要
集成的個(gè)人收聽裝置及解碼器(309),用于接收音頻信號(hào),它包括:解碼器(309),用于通過將音頻信號(hào)分離為語音信號(hào)和背景信號(hào)來對(duì)音頻信號(hào)進(jìn)行解碼;第一終端用戶可調(diào)節(jié)放大器(311),它連接到語音信號(hào),并放大語音信號(hào);第二終端用戶可調(diào)節(jié)放大器(310),它連接到背景信號(hào),并放大背景信號(hào);加法放大器(312),它連接到第一和第二終端用戶可調(diào)節(jié)放大器的輸出端,并輸出總音頻信號(hào),所述總信號(hào)連接到個(gè)人收聽裝置。
文檔編號(hào)G10L21/00GK1370386SQ00811618
公開日2002年9月18日 申請(qǐng)日期2000年6月15日 優(yōu)先權(quán)日1999年6月15日
發(fā)明者M·A·沃德雷, W·R·桑德斯 申請(qǐng)人:聽覺增強(qiáng)有限公司