欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于語(yǔ)音通信的帶寬擴(kuò)展的方法及系統(tǒng)的制作方法

文檔序號(hào):7638392閱讀:263來(lái)源:國(guó)知局
專利名稱:用于語(yǔ)音通信的帶寬擴(kuò)展的方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明通常涉及擴(kuò)展語(yǔ)音帶寬,并且更具體地,涉及將窄帶語(yǔ)音 信號(hào)擴(kuò)展為寬帶語(yǔ)音信號(hào)。
背景技術(shù)
近年來(lái),便攜式電子設(shè)備的使用迅猛增長(zhǎng)。特別是蜂窩電話已經(jīng) 相當(dāng)受公眾歡迎。蜂窩電話的主要用途是用于語(yǔ)音通信。蜂窩電話通 過(guò)壓縮語(yǔ)音并通過(guò)通信網(wǎng)絡(luò)發(fā)送語(yǔ)音信號(hào)來(lái)對(duì)語(yǔ)音信號(hào)進(jìn)行操作。壓 縮降低了表示語(yǔ)音信號(hào)及語(yǔ)音帶寬所需的數(shù)據(jù)量。例如,蜂窩電話上
的語(yǔ)音帶寬通常是限制在300Hz到3.4kHz之間的頻帶,然而,自然說(shuō)話 的語(yǔ)音主要存在于20Hz到10KHz的帶寬內(nèi)。語(yǔ)音頻帶限制過(guò)程是涉及 在蜂窩通信系統(tǒng)中有效發(fā)射及接收數(shù)字信號(hào)中的必要步驟。
幸運(yùn)的是,即使壓縮語(yǔ)音不包括原始數(shù)據(jù)的所有頻率分量,壓縮 語(yǔ)音也充分地保留了原始的語(yǔ)音特性及可懂度。特別地,語(yǔ)音壓縮移 除了語(yǔ)音的低頻率區(qū)域(即,300Hz以下)以及語(yǔ)音的高頻率區(qū)域(即 3.4KHz以上到10KHz)。盡管語(yǔ)音壓縮產(chǎn)生了用于無(wú)線通信令人滿意 的語(yǔ)音信號(hào),但是已經(jīng)測(cè)試并應(yīng)用了若干語(yǔ)音處理技術(shù),試圖恢復(fù)損 失的低頻及高頻語(yǔ)音分量,以生成較高質(zhì)量信號(hào)。然而,到目前為止, 還沒(méi)有開(kāi)發(fā)出有效地重建被移除頻率分量的技術(shù)。此外,現(xiàn)有的模擬 電話不實(shí)現(xiàn)任何壓縮。因此,它們?nèi)匀辉馐苡蓭资曛玫膫鬏敇?biāo)準(zhǔn) 引起的相似的帶寬限制。

發(fā)明內(nèi)容
本發(fā)明涉及一種用于語(yǔ)音通信帶寬擴(kuò)展的方法。該方法可以包括 如下步驟接收未知的語(yǔ)音信號(hào);識(shí)別接收到的未知語(yǔ)音信號(hào)的語(yǔ)音
帶寬;以及考慮接收到的語(yǔ)音信號(hào)的譜含量,來(lái)建立支持區(qū)域。該方 法還可以包括以下步驟從多個(gè)映射數(shù)據(jù)庫(kù)中選擇映射數(shù)據(jù)庫(kù)組合。 每個(gè)映射數(shù)據(jù)庫(kù)可以與用于擴(kuò)展語(yǔ)音帶寬的預(yù)定帶寬擴(kuò)展范圍相關(guān) 聯(lián)。
作為實(shí)例,識(shí)別語(yǔ)音帶寬可以包括執(zhí)行譜分析,以根據(jù)信號(hào)的 譜能量來(lái)確定未知語(yǔ)音信號(hào)的語(yǔ)音信號(hào)帶寬。此外,建立支持區(qū)域可 以包括如下步驟將請(qǐng)求發(fā)送到隱含對(duì)象(underlying object),以返 回到該對(duì)象能夠支持的采樣頻率列表;根據(jù)返回的采樣頻率,識(shí)別譜 界限;以及確定譜界限內(nèi)的譜帶,用于將語(yǔ)音帶寬擴(kuò)展到位于語(yǔ)音帶 寬之外的區(qū)域。建立支持區(qū)域可以進(jìn)一步包括以下步驟以對(duì)應(yīng)于至 少一個(gè)返回的采樣頻率的采樣頻率,重新釆樣語(yǔ)音信號(hào)。
在一個(gè)設(shè)置中,選擇映射數(shù)據(jù)庫(kù)組合的步驟可以是順序的操作。 該選擇步驟可以進(jìn)一步包括應(yīng)用映射數(shù)據(jù)庫(kù)的一系列組合,以共同 地將語(yǔ)音帶寬擴(kuò)展到對(duì)應(yīng)于所選擇帶寬擴(kuò)展范圍的增加部分的范圍。 作為實(shí)例,可以存在范圍從大約0到大約8KHz的第一映射數(shù)據(jù)庫(kù)、從大 約8KHz到大約16KHz的第二映射數(shù)據(jù)庫(kù)、以及從大約16KHz到大約 22KHz的第三映射數(shù)據(jù)庫(kù)。這三個(gè)映射數(shù)據(jù)庫(kù)可以是高斯混合模型 (Gaussian Mixture Model)。
該方法還可以包括如下步驟從語(yǔ)音信號(hào)中獲取表示譜包絡(luò)的窄 帶反射系數(shù)集合;以及,使用映射數(shù)據(jù)庫(kù),將窄帶反射系數(shù)集合擴(kuò)展 到寬帶反射系數(shù)集合,用來(lái)生成寬帶譜包絡(luò)。此外,可以通過(guò)將高斯 完全協(xié)方差矩陣壓縮為方差的對(duì)角向量,來(lái)將反射系數(shù)集合轉(zhuǎn)換為倒 譜系數(shù)集合,用來(lái)降低存儲(chǔ)器存儲(chǔ)。
在另一設(shè)置中,該方法可以進(jìn)一步包括如下步驟使用寬帶反射 系數(shù),從語(yǔ)音信號(hào)中提取窄帶激勵(lì)信號(hào);以及,使用調(diào)制及濾波,將 窄帶激勵(lì)信號(hào)擴(kuò)展為寬帶激勵(lì)信號(hào)。該方法可以進(jìn)一步包括如下步驟.-將寬帶激勵(lì)信號(hào)與寬帶譜包絡(luò)組合,以生成合成的寬帶語(yǔ)音信號(hào);從支持區(qū)域中的合成寬帶語(yǔ)音信號(hào)中提取補(bǔ)充寬帶語(yǔ)音信號(hào);以及,將原始語(yǔ)音信號(hào)添加到補(bǔ)充合成寬帶語(yǔ)音信號(hào)中,以生成寬帶語(yǔ)音信號(hào)。 本發(fā)明還涉及一種將窄帶反射系數(shù)集合擴(kuò)展為寬帶反射系數(shù)集合以用于語(yǔ)音帶寬擴(kuò)展的方法。該方法可以包括如下步驟生成低帶激 勵(lì);生成高帶激勵(lì);以及,將窄帶激勵(lì)添加到低帶激勵(lì)及高帶激勵(lì), 以創(chuàng)建半帶激勵(lì)。該方法還可以包括以下步驟從半帶激勵(lì)中生成寬 帶激勵(lì)。生成低帶激勵(lì)及高帶激勵(lì)的步驟可以包括以下步驟使用余 弦乘法來(lái)調(diào)制低帶激勵(lì)及高帶激勵(lì);以及,濾波低帶激勵(lì)及高帶激勵(lì)。
本發(fā)明還涉及一種機(jī)器可讀存儲(chǔ)器。機(jī)器可讀存儲(chǔ)器可以在其上 存儲(chǔ)計(jì)算機(jī)程序,該計(jì)算機(jī)程序具有通過(guò)便攜式計(jì)算設(shè)備執(zhí)行的多個(gè) 代碼部分。代碼部分可以使便攜式計(jì)算設(shè)備來(lái)執(zhí)行如下步驟接收未 知的語(yǔ)音信號(hào);識(shí)別接收到的未知語(yǔ)音信號(hào)的語(yǔ)音帶寬;以及,考慮 接收到語(yǔ)音信號(hào)的譜含量,來(lái)建立支持區(qū)域。該代碼部分可以進(jìn)一步 使便攜式計(jì)算設(shè)備來(lái)執(zhí)行以下步驟從多個(gè)映射數(shù)據(jù)庫(kù)中選擇映射數(shù) 據(jù)庫(kù)組合。與之前一樣,每個(gè)映射數(shù)據(jù)庫(kù)可以與用于擴(kuò)展語(yǔ)音帶寬的 預(yù)定帶寬擴(kuò)展范圍相關(guān)聯(lián)。代碼部分還可以使便攜式計(jì)算設(shè)備來(lái)執(zhí)行 上述其它方法步驟中的任何一個(gè)。
本發(fā)明還涉及一種用于人工地?cái)U(kuò)展語(yǔ)音帶寬的系統(tǒng)。該系統(tǒng)可以 包括評(píng)估部分、以協(xié)同方式耦合到評(píng)估部分的數(shù)據(jù)庫(kù)選擇器、以及 以協(xié)同方式地耦合到評(píng)估部分和數(shù)據(jù)庫(kù)選擇器的帶寬擴(kuò)展單元。評(píng)估 部分可以接收未知語(yǔ)音信號(hào)并且可以確定未知語(yǔ)音信號(hào)的語(yǔ)音帶寬的 允許限度。數(shù)據(jù)庫(kù)選擇器可以根據(jù)語(yǔ)音帶寬的允許限度來(lái)選擇映射數(shù) 據(jù)庫(kù)組合。此外,帶寬擴(kuò)展單元可以將未知語(yǔ)音信號(hào)的語(yǔ)音帶寬擴(kuò)展 到語(yǔ)音帶寬的允許限度。帶寬擴(kuò)展單元可以通過(guò)使用由數(shù)據(jù)庫(kù)選擇器 所選擇的映射數(shù)據(jù)庫(kù)組合來(lái)完成該擴(kuò)展。該系統(tǒng)還可以包括用于執(zhí)行 上述方法步驟中任何一個(gè)的合適的電路及軟件。


在所附的權(quán)利要求中,具體地陳述了被認(rèn)為是新穎的本發(fā)明的特 征。通過(guò)參考以下描述并結(jié)合附圖,可以最好地理解本發(fā)明及其進(jìn)一 步的目標(biāo)和優(yōu)勢(shì),在若干附圖中,相同的附圖標(biāo)記表示相同的元件, 其中
圖l圖示說(shuō)明了根據(jù)本發(fā)明設(shè)置的實(shí)施例用于人工地?cái)U(kuò)展語(yǔ)音帶 寬的系統(tǒng);
圖2更加詳細(xì)地圖示說(shuō)明了根據(jù)本發(fā)明設(shè)置的實(shí)施例的圖1的一些
組件;
圖3圖示說(shuō)明了根據(jù)本發(fā)明設(shè)置的實(shí)施例的多路徑激勵(lì)級(jí)的實(shí)例; 圖4圖示說(shuō)明了根據(jù)本發(fā)明設(shè)置的實(shí)施例用于語(yǔ)音帶寬擴(kuò)展的方 法的一部分;
圖5圖示說(shuō)明了根據(jù)本發(fā)明設(shè)置的實(shí)施例用于語(yǔ)音帶寬擴(kuò)展的方 法的另一部分;
圖6圖示說(shuō)明了根據(jù)本發(fā)明設(shè)置的實(shí)施例與擴(kuò)展語(yǔ)音信號(hào)帶寬相 關(guān)聯(lián)的若干曲線圖;以及
圖7圖示說(shuō)明了根據(jù)本發(fā)明設(shè)置的實(shí)施例用于將窄帶系數(shù)集合轉(zhuǎn) 換為寬帶系數(shù)集合的系統(tǒng)。
具體實(shí)施例方式
盡管說(shuō)明書(shū)以限定了被認(rèn)為是新穎的本發(fā)明特征的權(quán)利要求作為 結(jié)束,但是應(yīng)了解,從結(jié)合以下描述及附圖的角度考慮,本發(fā)明將更 易于理解,其中延續(xù)使用相同的附圖標(biāo)記。
按照需要,在此公開(kāi)本發(fā)明的詳細(xì)實(shí)施例;然而,應(yīng)了解,所公 開(kāi)的實(shí)施例僅僅是本發(fā)明的示例,其可以采用多種形式來(lái)實(shí)施。因此, 在此公開(kāi)的具體結(jié)構(gòu)及功能細(xì)節(jié)將不被解釋為限制性的,而僅僅作為 權(quán)利要求的基礎(chǔ)以及用于指導(dǎo)本領(lǐng)域技術(shù)人員在基本上任何合適的詳 細(xì)結(jié)構(gòu)中不同地使用本發(fā)明的代表性基礎(chǔ)。此外,在此使用的術(shù)語(yǔ)及
短語(yǔ)不意圖是限制性的,而是意圖提供本發(fā)明的可理解的描述。
在此使用的術(shù)語(yǔ)"一"或"一個(gè)"被限定為一個(gè)或多于一個(gè)。在 此使用的術(shù)語(yǔ)"多個(gè)"被限定為兩個(gè)或多于兩個(gè)。在此使用的術(shù)語(yǔ)"其 他"被限定為至少是第二或更多。在此使用的術(shù)語(yǔ)"包括"和/或"具 有"被限定為包括(即,開(kāi)放式語(yǔ)言)。在此使用的術(shù)語(yǔ)"耦合"被 限定為連接,盡管不必要是直接地以及不必要機(jī)械地連接。在此使用 的術(shù)語(yǔ)"程序"、"軟件應(yīng)用程序"等被限定為用于在計(jì)算機(jī)系統(tǒng)上 執(zhí)行而設(shè)計(jì)的指令序列。程序、計(jì)算機(jī)程序或者軟件應(yīng)用程序可以包 括子例程、函數(shù)、過(guò)程、對(duì)象方法、對(duì)象實(shí)現(xiàn)、可執(zhí)行應(yīng)用程序、小
應(yīng)用程序(applet)、小服務(wù)程序(serlet)、源代碼、目標(biāo)代碼、共享 庫(kù)/動(dòng)態(tài)加載庫(kù)、和/或?yàn)橛糜谠谟?jì)算機(jī)系統(tǒng)上執(zhí)行而設(shè)計(jì)的其它指令序 列。
語(yǔ)音帶寬擴(kuò)展的目標(biāo)是將壓縮語(yǔ)音的質(zhì)量恢復(fù)到匹配于原始語(yǔ)音 的主觀質(zhì)量水平的水平。本發(fā)明涉及一種用于改善通信系統(tǒng)中語(yǔ)音質(zhì) 量的語(yǔ)音帶寬擴(kuò)展方法及系統(tǒng)。該方法可以包括如下步驟接收未知 語(yǔ)音信號(hào);從接收到的未知語(yǔ)音信號(hào)的譜含量中識(shí)別語(yǔ)音帶寬;以及
考慮接收到的語(yǔ)音信號(hào)的譜含量來(lái)建立支持區(qū)域。該方法還可以包括
以下步驟從多個(gè)映射數(shù)據(jù)庫(kù)中選擇映射數(shù)據(jù)庫(kù)的組合,在該多個(gè)映
射數(shù)據(jù)庫(kù)中,每個(gè)映射數(shù)據(jù)庫(kù)可以與預(yù)定的帶寬擴(kuò)展范圍相關(guān)聯(lián),用 于將語(yǔ)音帶寬擴(kuò)展到支持區(qū)域。通過(guò)這些步驟以及將在下面描述的其 它過(guò)程,可以擴(kuò)展未知語(yǔ)音信號(hào)的帶寬。
參考圖l,示出了用于人工擴(kuò)展語(yǔ)音帶寬的系統(tǒng)100的實(shí)例。在一
個(gè)設(shè)置中,系統(tǒng)100可以包括評(píng)估部分110、以可協(xié)同方式耦合到評(píng)
估部分110的數(shù)據(jù)庫(kù)選擇器120、以及帶寬擴(kuò)展單元130。帶寬擴(kuò)展單元 130以可協(xié)同方式耦合到評(píng)估部分110和數(shù)據(jù)庫(kù)選擇器120。在一個(gè)實(shí)施 例中,評(píng)估部分IIO、數(shù)據(jù)庫(kù)選擇器120和帶寬擴(kuò)展單元130可以是類似 于蜂窩電話的移動(dòng)通信單元140的一部分。在這種情況下,移動(dòng)通信單
元140可以包括接收機(jī)150和/或發(fā)射機(jī)160,用于接收和/或發(fā)射語(yǔ)音或
數(shù)據(jù)信號(hào)。
評(píng)估部分110可以接收未知語(yǔ)音信號(hào)105,并且可以確定未知語(yǔ)音 信號(hào)105的語(yǔ)音帶寬的允許限度。該未知語(yǔ)音信號(hào)105,考慮隨后在其 上執(zhí)行的處理,也可以被簡(jiǎn)單地稱作語(yǔ)音信號(hào)105或者重新采樣的語(yǔ)音 信號(hào)105。語(yǔ)音帶寬的允許限度可以對(duì)應(yīng)于支持區(qū)域。作為實(shí)例,數(shù)據(jù) 庫(kù)選擇器120可以根據(jù)語(yǔ)音帶寬的允許限度,選擇映射數(shù)據(jù)庫(kù)組合(在 此沒(méi)有示出)。此外,帶寬擴(kuò)展單元130可以將未知語(yǔ)音信號(hào)105的語(yǔ) 音帶寬擴(kuò)展到語(yǔ)音帶寬的允許限度。例如,帶寬擴(kuò)展單元BO可以使用 由數(shù)據(jù)庫(kù)選擇器120所選擇的映射數(shù)據(jù)庫(kù)組合,來(lái)擴(kuò)展未知語(yǔ)音信號(hào) 105的語(yǔ)音帶寬。
參考圖2,示出了評(píng)估部分IIO、數(shù)據(jù)庫(kù)選擇器120和帶寬擴(kuò)展單元 130的更加詳細(xì)的方框圖。在一個(gè)設(shè)置中,評(píng)估部分110可以包括分 析模塊202、查詢模塊204以及采樣模塊206。分析模塊202可以耦合到 査詢模塊204,其可以耦合到采樣模塊206。此外,采樣模塊206可以耦 合到分析模塊202。
簡(jiǎn)單地說(shuō),分析模塊202能夠識(shí)別接收到的未知語(yǔ)音信號(hào)105的語(yǔ) 音帶寬。查詢模塊204能夠識(shí)別與系統(tǒng)100相關(guān)聯(lián)的所支持的采樣速率 列表,其中每個(gè)所支持的采樣速率可以揭示語(yǔ)音帶寬可以被擴(kuò)展到的 限度。作為實(shí)例,所支持的采樣速率可以與移動(dòng)單元140相關(guān)聯(lián)。采樣 模塊206可以以查詢模塊204所識(shí)別的采樣速率,來(lái)重新采樣未知語(yǔ)音 信號(hào)105,這可以產(chǎn)生重新采樣的語(yǔ)音信號(hào)105。因此,評(píng)估部分110可 以有效地1)分析未知語(yǔ)音信號(hào)105,以確定語(yǔ)音帶寬;2)識(shí)別系統(tǒng)100 能夠支持的采樣速率;3)確定語(yǔ)音帶寬的允許限度;以及,4)以識(shí)別到 的采樣速率之一來(lái)重新釆樣語(yǔ)音信號(hào)105。
在一個(gè)設(shè)置中,數(shù)據(jù)庫(kù)選擇器120可以包括多個(gè)映射數(shù)據(jù)庫(kù)210、
212和214,其中每個(gè)映射數(shù)據(jù)庫(kù)210、 212和214可以與預(yù)定的帶寬擴(kuò)展 范圍相關(guān)聯(lián),用于擴(kuò)展語(yǔ)音帶寬。數(shù)據(jù)庫(kù)選擇器120可以選擇映射數(shù)據(jù) 庫(kù)210、 212和214,以選擇性地將語(yǔ)音信號(hào)105的帶寬擴(kuò)展到系統(tǒng)所支 持的帶寬。特別地,映射數(shù)據(jù)庫(kù)210、 212和214可以根據(jù)所支持的系統(tǒng) 采樣頻率,提供用于擴(kuò)展語(yǔ)音帶寬的增加的能力。將在下面更詳細(xì)地 說(shuō)明這一過(guò)程。
在一個(gè)設(shè)置中,帶寬擴(kuò)展單元130可以包括包絡(luò)處理器220、激 勵(lì)處理器240、以及混合處理器260。包絡(luò)處理器220可以可通信方式耦 合到評(píng)估部分110及數(shù)據(jù)庫(kù)選擇器120。激勵(lì)處理器240可以可通信方式 耦合到評(píng)估部分110及包絡(luò)處理器220。此外,混合處理器260可以可通 信方式耦合到評(píng)估部分IIO、包絡(luò)處理器220及激勵(lì)處理器240。
簡(jiǎn)單地說(shuō),包絡(luò)處理器220可以從語(yǔ)音信號(hào)105中確定窄帶包絡(luò)并, 且隨后確定寬帶譜包絡(luò)。作為實(shí)例并且不作為限制,包絡(luò)處理器220可 以提供表示寬帶譜包絡(luò)的寬帶系數(shù)集合。使用由包絡(luò)處理器220所提供 的寬帶譜包絡(luò)(例如,寬帶系數(shù)集合),激勵(lì)處理器240可以從語(yǔ)音信 號(hào)105中確定窄帶激勵(lì)信號(hào),以隨后創(chuàng)建寬帶激勵(lì)信號(hào)。混合處理器260 可以從寬帶激勵(lì)信號(hào)及寬帶譜包絡(luò)中創(chuàng)建補(bǔ)充寬帶信號(hào),其隨后可以 與語(yǔ)音信號(hào)105組合在一起,以創(chuàng)建寬帶語(yǔ)音信號(hào)。
作為實(shí)例,包絡(luò)處理器220可以包括特征提取器222、窄帶轉(zhuǎn)換 器223、包絡(luò)估計(jì)器224、以及寬帶轉(zhuǎn)換器225。特征提取器222可以可 通信方式耦合到采樣模塊206,用于接收重新采樣的語(yǔ)音信號(hào)105,以 及用于獲取表示重新采樣語(yǔ)音信號(hào)105窄帶譜包絡(luò)的線性預(yù)測(cè)分析 (LPC)系數(shù)的集合。此外,窄帶轉(zhuǎn)換器223可以可通信方式耦合到特征 提取器222,且可以將LPC系數(shù)集合轉(zhuǎn)換為窄帶反射系數(shù)集合。
包絡(luò)估計(jì)器224可以可通信方式耦合到窄帶轉(zhuǎn)換器223,并且可以 接收表示窄帶譜包絡(luò)的窄帶反射系數(shù)集合。使用映射數(shù)據(jù)庫(kù)210、 212及214,包絡(luò)估計(jì)器224與數(shù)據(jù)庫(kù)選擇器120相結(jié)合,可以將窄帶反射系 數(shù)集合擴(kuò)展為寬帶反射系數(shù)集合,其可以使得包絡(luò)估計(jì)器224 (及數(shù)據(jù) 庫(kù)選擇器120)能夠從窄帶譜包絡(luò)中估計(jì)寬帶譜包絡(luò)。以可通信方式耦 合到包絡(luò)估計(jì)器224的寬帶轉(zhuǎn)換器225,可以將寬帶反射系數(shù)轉(zhuǎn)換為寬 帶LPC系數(shù)集合。
激勵(lì)處理器240可以包括寬帶分析部分242、以及多路徑激勵(lì)級(jí) 244, 二者均可以可通信方式互相耦合。寬帶分析部分242可以耦合到 采樣模塊206,用于接收重新采樣的語(yǔ)音信號(hào)105。 一旦進(jìn)行接收,寬 帶分析部分242可以使用由包絡(luò)估計(jì)器224所產(chǎn)生的寬帶譜包絡(luò),從重 新采樣的語(yǔ)音信號(hào)105中提取窄帶激勵(lì)信號(hào)。如將在后面討論的,其他 方案將使用窄帶譜包絡(luò)來(lái)從重新釆樣的語(yǔ)音信號(hào)105中提取窄帶激勵(lì) 信號(hào)。多路徑激勵(lì)級(jí)244可以從由寬帶分析部分242所提取的窄帶激勵(lì) 信號(hào)中,生成寬帶激勵(lì)信號(hào)。
混合處理器260可以包括寬帶合成部分262、帶阻濾波器264、以 及加法器266。寬帶合成部分262可以將由激勵(lì)處理器240所提供的寬帶 激勵(lì)信號(hào)與由包絡(luò)處理器220所提供的寬帶包絡(luò)組合在一起,以生成合 成的寬帶語(yǔ)音信號(hào)。帶阻濾波器264可以抑制在已經(jīng)由語(yǔ)音信號(hào)105所 占用的頻率區(qū)域內(nèi)的合成寬帶語(yǔ)音信號(hào)的譜含量。結(jié)果,帶阻濾波器 264可以提供補(bǔ)充的寬帶語(yǔ)音信號(hào),其包括在語(yǔ)音信號(hào)允許限度內(nèi)的頻 率信息。加法器266可以將從帶阻濾波器264接收到的補(bǔ)充寬帶信號(hào)與 來(lái)自釆樣模塊206的語(yǔ)音信號(hào)組合起來(lái),以創(chuàng)建寬帶語(yǔ)音信號(hào)。
盡管圖1和圖2表示了實(shí)現(xiàn)實(shí)踐本發(fā)明方法的系統(tǒng)及組件(硬件和 軟件)的實(shí)例,但是應(yīng)了解,本發(fā)明不受其所限。該方法可以在使用 包括軟件及硬件的任何合適組件組合的任何合適的語(yǔ)音處理系統(tǒng)中實(shí) 踐。
參考圖3,示出了多路徑激勵(lì)級(jí)244的更加詳細(xì)方框圖的實(shí)例。然 而,應(yīng)了解,多路徑激勵(lì)級(jí)244的該具體表示僅僅是這種組件的一個(gè)實(shí) 例。本領(lǐng)域的技術(shù)人員應(yīng)了解,可以在本發(fā)明中采用其它合適的布局。
在一個(gè)設(shè)置中,多路徑激勵(lì)級(jí)244可以包括低帶激勵(lì)級(jí)310、高 帶激勵(lì)級(jí)320、及通帶激勵(lì)級(jí)330,其組合能夠處理從寬帶分析部分242 (參見(jiàn)圖2)接收到的窄帶激勵(lì)信號(hào)。
低帶激勵(lì)級(jí)310可以包括調(diào)制器312及低通濾波器314。高帶激勵(lì)級(jí) 320可以包括調(diào)制器322及帶通濾波器324。通帶激勵(lì)級(jí)330可以傳遞未 經(jīng)處理的窄帶激勵(lì)信號(hào)。低帶激勵(lì)級(jí)310、高帶激勵(lì)級(jí)320及通帶激勵(lì) 級(jí)330的一個(gè)用途是人工地將激勵(lì)信號(hào)擴(kuò)展到通過(guò)査詢模塊204所識(shí)別 的頻率范圍。
多路徑激勵(lì)級(jí)244還可以包括加法器340,用來(lái)將低帶、高帶及 通帶激勵(lì)信號(hào)求和為復(fù)合(composite)半帶激勵(lì)信號(hào)。多路徑激勵(lì)級(jí) 244還可以具有調(diào)制器350,用于人工地將半帶激勵(lì)擴(kuò)展為寬帶激勵(lì), 其可以被認(rèn)為是全帶或?qū)拵Ъ?lì)。如早先所提到的,通過(guò)多路徑激勵(lì) 級(jí)244所生成的寬帶激勵(lì)信號(hào)可以與寬帶包絡(luò)組合在一起,以生成合成
的寬帶語(yǔ)音信號(hào)。
參考圖4至圖5,將使用方法400來(lái)說(shuō)明擴(kuò)展語(yǔ)音帶寬的實(shí)例。盡管 將使用圖1至圖3來(lái)幫助描述方法400,但是應(yīng)了解,可以使用任何合適 組件在任何其它合適的設(shè)備或系統(tǒng)中實(shí)現(xiàn)方法400。此外,本發(fā)明不限 于方法400中所列出步驟的順序。此外,方法400可以包含比圖4至圖5 中示出的步驟更多或更少個(gè)步驟。
在步驟410,方法400可以開(kāi)始。在步驟412,可以接收未知語(yǔ)音信 號(hào)。在該上下文中的術(shù)語(yǔ)"未知"可以指的是,接收到的語(yǔ)音信號(hào)的 采樣速率或帶寬是未知的。在步驟414,可以識(shí)別接收到的未知語(yǔ)音信 號(hào)的語(yǔ)音帶寬。作為實(shí)例,在步驟416,可以在未知語(yǔ)音信號(hào)上執(zhí)行譜
分析,以根據(jù)譜能量來(lái)確定語(yǔ)音信號(hào)帶寬。
例如,參考圖2,分析模塊202可以依照步驟412和414來(lái)接收未知 語(yǔ)音信號(hào)105,并且可以確定未知語(yǔ)音帶寬。本領(lǐng)域的技術(shù)人員應(yīng)了解, 存在很多不同的方式來(lái)確定語(yǔ)音信號(hào)的帶寬,并且本發(fā)明不限于任何 特定的技術(shù)。參考圖6,示出了未知語(yǔ)音信號(hào)的頻率響應(yīng)620的實(shí)例。 圖2的分析模塊202可以生成頻率響應(yīng)620,并且可以根據(jù)譜能量的分布 來(lái)識(shí)別語(yǔ)音帶寬。例如,頻率響應(yīng)620的語(yǔ)音帶寬625可以占用大約 300Hz和大約3.4KHz之間的區(qū)域,盡管在本發(fā)明中可以容易地使用其它 合適的值來(lái)代替。該語(yǔ)音帶寬可以表示語(yǔ)音信號(hào)105的后壓縮帶寬(即, 窄帶語(yǔ)音信號(hào))。
在此,語(yǔ)音信號(hào)105可以具有8KHz的采樣頻率,這意味著考慮奈 奎斯特(Nyquist)定理,從4KHz到8KHz將不存在譜含量。盡管不受奈 奎斯特定理所限制,但是對(duì)于語(yǔ)音信號(hào)105,可能不存在從0Hz到300Hz 或者從3.4KHz到4KHz的譜含量,這在很多無(wú)線通信系統(tǒng)中是常見(jiàn)的。
回過(guò)來(lái)參考圖4和圖5的方法400,在步驟418,可以考慮語(yǔ)音帶寬
來(lái)建立支持區(qū)域。作為實(shí)例,支持區(qū)域可以描述這樣的話音的頻率區(qū) 域,即,其中可能不存在譜含量以及其中可以應(yīng)用語(yǔ)音帶寬擴(kuò)展。步
驟420-426描述了可以如何建立支持區(qū)域的一個(gè)實(shí)例。具體地,在步驟 420,可以將請(qǐng)求發(fā)送到隱含對(duì)象,以列出該對(duì)象能夠支持的采樣頻率。 如在上面所確定的,由于采樣速率揭示了語(yǔ)音帶寬可以擴(kuò)展到的限度, 所以可能需要采樣頻率的知識(shí)。如步驟422所示,可以識(shí)別基于所支持 的采樣速率的譜界限。譜界限可以限定系統(tǒng)能夠?qū)⒆V含量添加到語(yǔ)音 信號(hào)上的頻率邊界。
在步驟424,可以確定譜界限內(nèi)用于將語(yǔ)音帶寬擴(kuò)展到駐留在語(yǔ)音 信號(hào)語(yǔ)音帶寬之外區(qū)域的譜帶。在步驟426,可以按照對(duì)應(yīng)于至少一個(gè) 返回采樣頻率的選定采樣速率,來(lái)對(duì)語(yǔ)音信號(hào)重新采樣。該過(guò)程可以
制定用于在窄帶語(yǔ)音信號(hào)內(nèi)擴(kuò)展譜含量的頻率范圍。
例如,參考圖2和圖6,查詢模塊204可以將請(qǐng)求發(fā)送到隱含對(duì)象,
以列出所支持的采樣頻率。隱含對(duì)象可以是物理設(shè)備或軟件接口,其 提供執(zhí)行信號(hào)處理的能力并且可以了解它能夠支持的采樣速率。例如,
音頻播放設(shè)備可以提供許多采樣速率,例如用于語(yǔ)音的8KHz、用于MP3 的22.5KHz、以及用于壓縮盤(pán)的44.1KHz。如在現(xiàn)有技術(shù)中已知的,隨 后可以使用奈奎斯特準(zhǔn)則,從采樣頻率中確定系統(tǒng)帶寬。因此,8KHz 的采樣頻率可以提供采樣頻率一半的語(yǔ)音帶寬,是4KHz。
給定未知語(yǔ)音信號(hào)105的語(yǔ)音帶寬以及可用系統(tǒng)帶寬的知識(shí),評(píng)估 部分110可以確定語(yǔ)音信號(hào)105中缺失譜含量的區(qū)域。特別地,依照方 法400的步驟422,評(píng)估部分110可以限定頻率邊界的譜界限,其中可以 將譜含量添加到語(yǔ)音信號(hào)105上。例如,通過(guò)界限723及627來(lái)對(duì)語(yǔ)音信 號(hào)105頻率響應(yīng)625的譜界限進(jìn)行劃界。在該實(shí)例中,這對(duì)應(yīng)于0到300Hz (界限623)的較低譜界限以及3.4KHz到8KHz (界限627)的較高譜 界限。
依照步驟424,評(píng)估單元110還可以確定識(shí)別到的譜界限內(nèi)的譜帶,
用于根據(jù)系統(tǒng)帶寬來(lái)確定語(yǔ)音帶寬的范圍。在一個(gè)設(shè)置中,譜帶可以 限定支持區(qū)域636。支持區(qū)域636描述了可將譜含量添加到語(yǔ)音帶寬上 的頻率區(qū)域,對(duì)于該語(yǔ)音帶寬當(dāng)前存在很少或不存在語(yǔ)音頻率含量。 因此,支持區(qū)域636固有地描述了語(yǔ)音帶寬的允許限度。
例如,分析模塊202可以執(zhí)行未知語(yǔ)音信號(hào)105的譜分析,這可以 揭示語(yǔ)音帶寬是在300Hz禾B3.4KHz之間,如在語(yǔ)音帶寬625中觀察到 的。如在現(xiàn)有技術(shù)中已知的,奈奎斯特定理規(guī)定,與未知語(yǔ)音信號(hào)相 關(guān)聯(lián)的采樣速率必須至少是信號(hào)帶寬的兩倍,在我們的實(shí)例中是8KHz 的采樣速率。對(duì)于隱含對(duì)象(underlying object)的查詢可以揭示出 8KHz、 16KHz、 22KHz和44 KHz的采樣速率是得到支持的。作為實(shí)例,
在8KHz的采樣速率,不是所有的上部支持區(qū)域(4KHz到8KHz)是可 用的(雖然可能存在下部支持區(qū)域(OHz到300Hz)以及上部支持區(qū)域 的一部分(3.4KHz到4KHz))。
然而,如果查詢模塊204識(shí)別到16KHz的所支持的較高采樣頻率, 那么上部支持區(qū)域是可能的。16KHz的系統(tǒng)所支持的采樣速率暗示了所 允許的上部支持區(qū)域637的至少一部分是4KHz,或者用于16KHz采樣頻 率的信號(hào)帶寬減去語(yǔ)音帶寬的上部窄帶界限(8KHz減去4Khz)。在該 實(shí)例中,以16KHz對(duì)語(yǔ)音信號(hào)采樣可以考慮到在4KHz和8KHz之間的上 部支持區(qū)域637處添加上部譜含量。這個(gè)添加的上部譜含量可以補(bǔ)充下 部譜含量,該補(bǔ)充下部譜含量可以被添加到0到300Hz之間的下部支持 區(qū)域633,以及添加到從3.4KHz到4KHz的上部支持區(qū)域637中。
在該實(shí)例中,支持區(qū)域636可以包括上部支持區(qū)域637、以及下 部支持區(qū)域633。然而,本領(lǐng)域的技術(shù)人員應(yīng)了解,本發(fā)明不限于這個(gè) 實(shí)例。特別地,支持區(qū)域636可以不包括上部和下部支持區(qū)域。此外, 支持區(qū)域636不是必要地必須覆蓋識(shí)別到的譜界限的全部范圍。
如在早先所提到的,采樣模塊206可以重新采樣語(yǔ)音信號(hào)105。評(píng) 估部分110可以選擇對(duì)應(yīng)于識(shí)別到的、系統(tǒng)所支持的采樣速率的重新采 樣速率。在一個(gè)設(shè)置中,評(píng)估部分110可以提供自動(dòng)或手動(dòng)選擇。在手 動(dòng)選擇配置中,使用系統(tǒng)100的用戶可以通過(guò)例如圖形用戶接口或任何 其它合適接口來(lái)選擇他或她選擇的采樣速率。例如,用戶可能需要高 質(zhì)量的話音并且可能選出最高可用采樣速率??商鎿Q地,在自動(dòng)選擇 配置中,諸如無(wú)線通信運(yùn)營(yíng)商的系統(tǒng)提供商可能控制采樣速率。例如, 系統(tǒng)提供商可能希望根據(jù)服務(wù)質(zhì)量措施或成本結(jié)構(gòu)來(lái)限制采樣速率, 其中系統(tǒng)提供商可以向需要較高質(zhì)量話音的用戶收取較高的服務(wù)費(fèi) 用。
通過(guò)采樣模塊206進(jìn)行的重新采樣實(shí)際上建立了可用的系統(tǒng)帶寬,
并且為帶寬擴(kuò)展制定了語(yǔ)音信號(hào)105。重新采樣有效地考慮到將語(yǔ)音帶 寬擴(kuò)展到支持區(qū)域636中。總體來(lái)說(shuō),如果系統(tǒng)所支持的采樣頻率高于 未知語(yǔ)音采樣頻率,那么由未知語(yǔ)音所占用的信號(hào)帶寬可以被認(rèn)為是 窄帶的。如果可以在任何區(qū)域內(nèi)將窄帶信號(hào)擴(kuò)展到所支持的系統(tǒng)帶寬, 那么信號(hào)將被認(rèn)為是寬帶信號(hào)。窄帶信號(hào)與寬帶信號(hào)之間頻率含量差 異可以是支持區(qū)域。然而,應(yīng)了解,本發(fā)明絕不限于關(guān)于窄帶或?qū)拵?信號(hào)或者支持區(qū)域的上述任何實(shí)例。
回過(guò)來(lái)參考圖4,在步驟428,可以從多個(gè)映射數(shù)據(jù)庫(kù)中選擇映射 數(shù)據(jù)庫(kù)組合,其中每個(gè)映射數(shù)據(jù)庫(kù)可以與用于擴(kuò)展語(yǔ)音帶寬的預(yù)定帶 寬擴(kuò)展范圍相關(guān)聯(lián)??紤]到支持區(qū)域,可以考慮這種選擇。如早先所 說(shuō)明的,支持區(qū)域可以反映語(yǔ)音帶寬可以擴(kuò)展到的允許限度。可以選 擇映射數(shù)據(jù)庫(kù)組合,來(lái)共同地將譜含量添加到支持區(qū)域。
可以這樣創(chuàng)建映射數(shù)據(jù)庫(kù)第一映射數(shù)據(jù)庫(kù)可以提供第一范圍,
第二映射數(shù)據(jù)庫(kù)可以提供開(kāi)始于第一范圍結(jié)束處的第二范圍,以及第 三映射數(shù)據(jù)庫(kù)可以提供開(kāi)始于第二范圍結(jié)束處的第三范圍。照這樣,
在步驟430,可以順次地將數(shù)據(jù)庫(kù)組合起來(lái),以共同擴(kuò)展語(yǔ)音帶寬,從 而提供支持區(qū)域內(nèi)的譜含量。
例如,參考圖2和圖6以及如早先所說(shuō)明的,譜分析可以揭示出, 在8KHz的采樣頻率時(shí),信號(hào)的語(yǔ)音帶寬在500到3.4Khz之間(參見(jiàn)語(yǔ)音 帶寬625) 。 4KHz和8KHz之間的頻率是由于奈奎斯特采樣定理而不可 以存在語(yǔ)音的頻率。因此,考慮8KHZ的采樣頻率,語(yǔ)音帶寬可以只被 擴(kuò)展到0Hz到300Hz的下部頻率以及3.4KHz到4KHz的上部頻率的一部 分。例如,如果以16KHz的較高速率對(duì)語(yǔ)音信號(hào)105重新采樣,那么可 以將語(yǔ)音帶寬從4KHz擴(kuò)展到8KHz。在我們的實(shí)例中,陰影線區(qū)域639 表示根據(jù)16KHz的采樣速率、由于奈奎斯特采樣定理而不可以存在語(yǔ)音 的區(qū)域(8KHz到16KHz)。
可以選擇映射數(shù)據(jù)庫(kù)210、 212和214中的一個(gè)或多個(gè),來(lái)填充下部 支持區(qū)域633及上部支持區(qū)域637。例如,第一映射數(shù)據(jù)庫(kù)可以考慮到 將帶寬擴(kuò)展到達(dá)到8KHz,這對(duì)于在16KHz采樣的語(yǔ)音可以是足夠的。 作為另一實(shí)例,對(duì)于22KHz的采樣速率,可以將映射數(shù)據(jù)庫(kù)210及映射 數(shù)據(jù)庫(kù)212組合在一起,以實(shí)現(xiàn)達(dá)到llKHz的語(yǔ)音頻帶擴(kuò)展,這可以幫 助填充陰影線區(qū)域639的一部分。也就是說(shuō),可以選擇映射數(shù)據(jù)庫(kù)210, 來(lái)幫助提供從0Hz到300Hz以及從3.4KHz到8KHz的譜含量,而映射數(shù)據(jù) 庫(kù)212可以幫助填充用于22KHz采樣頻率的從8KHz到llKHz的范圍???慮22KHz的較高采樣速率,陰影線區(qū)域639的一部分當(dāng)前可以是支持區(qū) 域636的一部分。如我們可以觀察到的,映射數(shù)據(jù)庫(kù)組合的選擇可以是 順序的操作,盡管本發(fā)明不是必須地限于這種設(shè)置。
在一個(gè)設(shè)置中,第一映射數(shù)據(jù)庫(kù)210可以與從大約0Hz到大約8KHz 的預(yù)定帶寬擴(kuò)展范圍相關(guān)聯(lián),以及第二映射數(shù)據(jù)庫(kù)212可以與從大約 8KHz到大約16KHz的預(yù)定帶寬擴(kuò)展范圍相關(guān)聯(lián)。此外,第三映射數(shù)據(jù) 庫(kù)214可以與從大約16KHz到大約22KHz的預(yù)定帶寬擴(kuò)展范圍相關(guān)聯(lián)。
當(dāng)然,本領(lǐng)域的技術(shù)人員應(yīng)了解,本發(fā)明不限于這些映射數(shù)據(jù)庫(kù) 210、 212及214。本發(fā)明可以包括與任何合適頻率相關(guān)聯(lián)的任何合適數(shù) 量的映射數(shù)據(jù)庫(kù)。此外,本發(fā)明不限于基于線性擴(kuò)展的頻率擴(kuò)展范圍 的映射數(shù)據(jù)庫(kù)。例如,映射數(shù)據(jù)庫(kù)可以全部支持相同的頻率范圍,但 是提供跨越共用頻率范圍的不同程度的放大或抑制。
回過(guò)來(lái)參考圖4,方法400可以通過(guò)步驟432繼續(xù)到圖5 。在步驟 434,可以在支持區(qū)域內(nèi)應(yīng)用帶寬擴(kuò)展。步驟436-456提供了可以如何執(zhí) 行該過(guò)程的實(shí)例。
在步驟436,可以從語(yǔ)音信號(hào)中創(chuàng)建寬帶譜包絡(luò)。特別地,可以通 過(guò)估計(jì)來(lái)確定寬帶譜包絡(luò),可以通過(guò)特征提取獲取該窄帶譜包絡(luò)。例 如,在步驟438,可以從語(yǔ)音信號(hào)中獲取表示窄帶譜包絡(luò)的窄帶反射系
數(shù)集合。在步驟440,可以使用映射數(shù)據(jù)庫(kù),將窄帶反射系數(shù)集合擴(kuò)展 到寬帶反射系數(shù)集合。
作為實(shí)例,參考圖2,特征提取器222可以接收重新采樣的語(yǔ)音信 號(hào)105,并且可以執(zhí)行窄帶線性預(yù)測(cè)分析(LPC)。依照公知的LPC原 理,特征提取器222可以從重新采樣的語(yǔ)音信號(hào)105中提取包絡(luò)。由于 重新采樣的語(yǔ)音信號(hào)105是窄帶的,所以包絡(luò)通常也是窄帶的。可以通 過(guò)LPC系數(shù)集合來(lái)表示窄帶包絡(luò),該LPC系數(shù)集合描述窄帶語(yǔ)音包絡(luò)的 全極點(diǎn)模型近似。
特征提取器222可以生成LPC系數(shù)集合,表示為A(z)。窄帶轉(zhuǎn)換器 223可以將LPC系數(shù)集合轉(zhuǎn)換為反射系數(shù)集合。由于反射系數(shù)可以更適 合于實(shí)現(xiàn)數(shù)字濾波器,所以它們?cè)诒景l(fā)明方法中可能是有用的。同樣, 反射系數(shù)與LPC系數(shù)相比,對(duì)于噪聲來(lái)說(shuō)更加魯棒。然而,本領(lǐng)域的技 術(shù)人員應(yīng)了解,本發(fā)明不受此限制,因此變換可能不是必要的并且可 以采用其它的系數(shù)表述。在任何情況下,窄帶反射系數(shù)集合可以近似 地表示譜包絡(luò),雖然以不同的數(shù)學(xué)形式。
此外,可以將反射系數(shù)轉(zhuǎn)換為倒譜(cepstral)系數(shù)集合,其對(duì)數(shù) 值噪聲也是魯棒的。反射系數(shù)在統(tǒng)計(jì)上彼此相關(guān),這意味著共有信息 被包含在反射系數(shù)集合的獨(dú)立系數(shù)中。相反地,倒譜系數(shù)在統(tǒng)計(jì)上彼 此無(wú)關(guān),并且在系數(shù)之間具有最少的共有信息。這種無(wú)關(guān)性對(duì)于存儲(chǔ) 器存儲(chǔ)用途來(lái)說(shuō)是重要的屬性,并且可以與下面對(duì)映射數(shù)據(jù)庫(kù)210、 212 及214的討論有關(guān)。因此,可以訓(xùn)練映射數(shù)據(jù)庫(kù)210、 212及214,來(lái)支 持反射系數(shù)或者倒譜系數(shù)。
包絡(luò)估計(jì)器224可以執(zhí)行從窄帶譜包絡(luò)中估計(jì)寬帶譜包絡(luò)的廣泛 任務(wù)。包絡(luò)估計(jì)器224可以從窄帶轉(zhuǎn)換器223接收窄帶反射系數(shù)集合作 為輸入,包絡(luò)估計(jì)器224可以將該窄帶反射系數(shù)集合提供給數(shù)據(jù)庫(kù)選擇 器120。數(shù)據(jù)庫(kù)選擇器120可以將窄帶反射系數(shù)集合轉(zhuǎn)換為寬帶反射系數(shù)集合。因此,包絡(luò)估計(jì)器224通過(guò)數(shù)據(jù)庫(kù)選擇器120,可以使用所選
擇的映射數(shù)據(jù)庫(kù)210、 212及214,根據(jù)窄帶反射系數(shù)的非線性變換,來(lái) 從窄帶包絡(luò)中估計(jì)寬帶譜包絡(luò)。
例如,數(shù)據(jù)庫(kù)選擇器120可以接收由窄帶轉(zhuǎn)換器223所生成的窄帶 反射系數(shù)集合作為輸入。通過(guò)統(tǒng)計(jì)建模,數(shù)據(jù)庫(kù)選擇器120可以將窄帶 反射系數(shù)集合轉(zhuǎn)換為寬帶反射系數(shù)集合。包絡(luò)估計(jì)器224可以隨后將寬 帶反射系數(shù)傳遞給寬帶轉(zhuǎn)換器225,其可以將它們轉(zhuǎn)換為寬帶LPC系數(shù) 集合。該LPC系數(shù)可以表示為B(z),其可以表示對(duì)寬帶譜包絡(luò)的全極點(diǎn) 近似。
如早先所提到的,數(shù)據(jù)庫(kù)選擇器120可以從評(píng)估部分110接收所選 擇的采樣速率信息。評(píng)估部分110可以根據(jù)系統(tǒng)所支持的采樣速率,來(lái) 識(shí)別支持區(qū)域。所選擇的釆樣速率可以確定通過(guò)數(shù)據(jù)庫(kù)選擇器120選擇 了哪個(gè)映射數(shù)據(jù)庫(kù)210、 212及214。作為實(shí)例,映射數(shù)據(jù)庫(kù)210、 212及 214可以是高斯混合模型。然而,必須注意的是,映射數(shù)據(jù)庫(kù)210、 212 及214不限于該具體的配置。例如,本領(lǐng)域的技術(shù)人員應(yīng)了解,存在不 同的方式來(lái)實(shí)現(xiàn)映射函數(shù),例如向量量化或隱馬爾可夫模型(Hidden Markov Models)。
在統(tǒng)計(jì)建模應(yīng)用中,GMM可以是有用的,在該統(tǒng)計(jì)建模應(yīng)用中, 必須從大量數(shù)據(jù)中提取表示通用特性或趨勢(shì)的信息。諸如GMM的映射 函數(shù)在統(tǒng)計(jì)地洞察大的數(shù)據(jù)量中是有用的,并用于應(yīng)用統(tǒng)計(jì)信息。 GMM在現(xiàn)有技術(shù)中是已知,不過(guò)簡(jiǎn)短的描述對(duì)于說(shuō)明將GMM應(yīng)用于將
窄帶系數(shù)集合轉(zhuǎn)換為寬帶系數(shù)集合的方式來(lái)說(shuō)將是有用的。
參考圖2和圖7,可以通過(guò)數(shù)據(jù)庫(kù)選擇器120,將由特征提取器222 所提供的窄帶系數(shù)集合作為輸入702提交給GMM700。例如,GMM 700 可以表示映射數(shù)據(jù)庫(kù)210、 212及214中的一個(gè)。在圖7的例示中,可以 存在表示為Xi至Xw的十四個(gè)輸入系數(shù),以及表示為X—est!至X—estw的
十四個(gè)相應(yīng)輸出系數(shù),不過(guò)GMM 700可以接收任何合適數(shù)量的系數(shù)作 為輸入,并輸出任何合適數(shù)量的系數(shù)。數(shù)據(jù)庫(kù)選擇器120可以判定GMM 700的哪一個(gè)組合被用于映射反射系數(shù)的集合。GMM 700的輸出將是寬 帶系數(shù)集合704,其表示寬帶譜包絡(luò)。給定所提交的窄帶系數(shù)集合, GMM 700可以統(tǒng)計(jì)地確定最佳表示寬帶包絡(luò)特性的寬帶系數(shù)集合。
如在現(xiàn)有技術(shù)中已知的,GMM試圖確定被稱作映射的最優(yōu)變換, 其可以被應(yīng)用到輸入信號(hào),以依照由GMM提供的統(tǒng)計(jì)信息將其轉(zhuǎn)換為 輸出信號(hào)。請(qǐng)注意,GMM可以根據(jù)現(xiàn)有技術(shù)中已知的被稱作訓(xùn)練的學(xué) 習(xí)過(guò)程,提供統(tǒng)計(jì)建模能力。總體來(lái)說(shuō),最初為GMM離線呈現(xiàn)輸入及 輸出訓(xùn)練數(shù)據(jù),以學(xué)習(xí)與輸入到輸出數(shù)據(jù)變換相關(guān)聯(lián)的統(tǒng)計(jì)信息。 GMM可以采用期望最大化(EM)算法來(lái)學(xué)習(xí)輸入及輸出系數(shù)集合之間
的映射。
參考圖7, GMM 700可以支持128個(gè)高斯706的集合,其中通過(guò)描述 單一高斯706統(tǒng)計(jì)信息的參數(shù)ii、 E、 w的集合來(lái)表示每個(gè)高斯。單一高 斯706可以表示可以通過(guò)下面的等式來(lái)描述的概率函數(shù)
(2")緒E I l 2 j 其中,x可以是長(zhǎng)度為14xl的反射系數(shù)向量,/i是長(zhǎng)度的平均反射 系數(shù)向量,E是十四個(gè)反射系數(shù)的大小為14xl4的協(xié)方差矩陣,以及D 可以是高斯706的維度,其等于向量x的長(zhǎng)度,是14。
每個(gè)高斯706可以捕獲整個(gè)統(tǒng)計(jì)信息的一部分,該統(tǒng)計(jì)信息包含在 窄帶及寬帶反射系數(shù)之間被訓(xùn)練的映射中。例如,維度D-2的單一高斯 706的概率分布可以被視為鐘形曲線(bell-curve) 740。高斯706可以是 描述在相關(guān)聯(lián)高斯706內(nèi)觀察到輸入反射系數(shù)的概率的概率分布函數(shù)。 每個(gè)高斯706可以為輸入中的每個(gè)反射系數(shù)提供概率值,表示為高斯 706的似然性測(cè)量(likelihood measure)。簡(jiǎn)而言之,將每個(gè)輸入的系 數(shù)集合與每個(gè)高斯706進(jìn)行比較,并且每個(gè)高斯706可以提供統(tǒng)計(jì)映射 信息708的某部分。
來(lái)自每個(gè)高斯706的概率信息可以被加權(quán)701,并被加在一起712, 以例示窄帶到寬帶的映射。在此上下文中的術(shù)語(yǔ)"加權(quán)"可以意味著, 由每個(gè)高斯706提供的概率信息乘以權(quán)重值。均值向量M以及協(xié)方差矩 陣E表示與每個(gè)高斯706相關(guān)聯(lián)的統(tǒng)計(jì)信息。
GMM 700可以支持任何數(shù)量的高斯706,不過(guò)當(dāng)從大的訓(xùn)練數(shù)據(jù)集 合中獲取充分的統(tǒng)計(jì)信息時(shí),包括128個(gè)高斯的GMM 700可以為反射系 數(shù)集合提供足夠的映射能力。還應(yīng)注意的是,可以將反射系數(shù)集合轉(zhuǎn) 換為倒譜系數(shù)集合,其可與GMM映射一起使用。由于該轉(zhuǎn)換可以將高 斯完全協(xié)方差矩陣壓縮為方差的對(duì)角向量,所以可以降低GMM 700所 需的存儲(chǔ)器量。
例如,該轉(zhuǎn)換可以包括線性數(shù)學(xué)變換,該線性數(shù)學(xué)變換可以將統(tǒng) 計(jì)上相關(guān)的反射系數(shù)集合轉(zhuǎn)換為統(tǒng)計(jì)上無(wú)關(guān)的倒譜系數(shù)集合。統(tǒng)計(jì)上 相關(guān)的系數(shù)集合通常需要完全協(xié)方差矩陣750。完全矩陣指的是,矩陣 中的所有項(xiàng)被用在GMM 700中。統(tǒng)計(jì)上無(wú)關(guān)的系數(shù)集合通常只需要協(xié) 方差矩陣760的對(duì)角向量。對(duì)角向量指的是,只有協(xié)方差矩陣的對(duì)角項(xiàng) 被用在GMM 700中。該過(guò)程可以降低需要存儲(chǔ)在GMM 700中的協(xié)方差 值的數(shù)量。例如,可以將大小為NxN的協(xié)方差矩陣降低為大小為Nxl 的向量,這可以將GMM 700的存儲(chǔ)器存儲(chǔ)需要降低因數(shù)N。
可以將輸入702的十四個(gè)反射系數(shù)的每一個(gè)呈現(xiàn)給128個(gè)高斯706 的每一個(gè)。每個(gè)高斯706,例如第128個(gè)高斯,可以以其均值^744和其 協(xié)方差E750為特征,均值/^44和其協(xié)方差r750—起可以描述高斯概率 函數(shù)740的形狀。GMM 700可以是根據(jù)輸入信號(hào)的特性混合在一起的 128個(gè)高斯的組??梢允褂脵?quán)重w710集合及加法操作412,將128個(gè)高斯 706混合在一起??梢栽贓M算法的訓(xùn)練期間確定權(quán)重w710。對(duì)于14維 的特征向量(即,14個(gè)反射系數(shù)),用于似然函數(shù)的混合操作712可以
這是均值向量為p及協(xié)方差矩陣為Zi的M-128個(gè)高斯706的加權(quán)
線性組合??梢詫⒒旌蠙?quán)重限制為21^=1。密度模型的參數(shù)可以是 ;i-(Wi, jii,2i〉,其中i- 1,.…M。
一旦找到p(x),可以如下確定對(duì)寬帶反射系數(shù)集合的估計(jì)
上述等式揭示了采用等式表達(dá)的GMM 700的映射屬性,并且將作 為輸入到GMM 700的窄帶反射系數(shù)集合關(guān)系到表示寬帶反射系數(shù)集合 的輸出704上??梢杂蒅MM 700來(lái)確定項(xiàng)p(x) (^是第i個(gè)高斯706的第i 個(gè)均值向量),以及x(例如,X,到X")表示輸入的窄帶反射系數(shù)集合。 此外,x—est (例如X—estJIjX—est14)反映了為窄帶反射系數(shù)的輸入集合 所評(píng)估的估計(jì)的寬帶反射系數(shù)集合。依照?qǐng)D4的步驟440,可以通過(guò)包 絡(luò)估計(jì)器224及圖2的數(shù)據(jù)庫(kù)選擇器120來(lái)實(shí)現(xiàn)上述GMM映射的數(shù)學(xué)操 作。
回過(guò)來(lái)參考圖5,在步驟442,可以從寬帶譜包絡(luò)及語(yǔ)音信號(hào)中創(chuàng) 建寬帶譜激勵(lì)。在步驟444至448中表示了該過(guò)程的實(shí)例。在步驟444, 可以使用寬帶反射系數(shù)集合或窄帶LPC系數(shù)集合來(lái),從語(yǔ)音信號(hào)中提取 窄帶譜激勵(lì),如在步驟440中所提供的。在步驟446,可以將窄帶激勵(lì) 信號(hào)擴(kuò)展為寬帶激勵(lì)信號(hào)。在步驟448A-448F中示出了如何執(zhí)行這種過(guò) 程的實(shí)例。
具體地,在步驟448A,可以生成低帶激勵(lì),以及在步驟448B,可 以生成高帶激勵(lì)。例如,在可選步驟448C,可以使用余弦乘法來(lái)調(diào)制低帶激勵(lì)和高帶激勵(lì)。在可選步驟448D,可以濾波低帶激勵(lì)和高帶激
勵(lì)。在步驟448E,可以將窄帶激勵(lì)(或通帶激勵(lì))添加到低帶激勵(lì)和 高帶激勵(lì),以創(chuàng)建半帶激勵(lì)。在步驟448F,可以從半帶激勵(lì)中生成寬 帶激勵(lì)。
例如,參考圖2,寬帶分析部分242可以通過(guò)采用反射系數(shù)集合 逆濾波重新采樣的語(yǔ)音信號(hào)105來(lái)生成窄帶激勵(lì)。逆濾波可能需要由 包絡(luò)估計(jì)器224提供的寬帶系數(shù)集合,或者可替換地,它可以使用在 特征提取器222處生成的窄帶LPC系數(shù)??梢栽趯拵Х治霾糠?42內(nèi) 使用窄帶或?qū)拵禂?shù)集合,用于生成窄帶激勵(lì)。由于重新采樣的語(yǔ)音 信號(hào)105本身是窄帶信號(hào),所以采用上述兩種系數(shù)集合中的任何一種 對(duì)重新采樣的語(yǔ)音信號(hào)105進(jìn)行逆濾波可以生成窄帶激勵(lì)信號(hào)。
可以通過(guò)多路徑激勵(lì)級(jí)244來(lái)傳遞窄帶激勵(lì),以創(chuàng)建寬帶激勵(lì)。 多路徑激勵(lì)級(jí)244的用途是在支持區(qū)域636內(nèi)創(chuàng)建人工激勵(lì)信號(hào)(參 見(jiàn)圖6)??梢酝ㄟ^(guò)復(fù)制并變動(dòng)重新采樣的窄帶激勵(lì)信號(hào)來(lái)生成補(bǔ)充激 勵(lì),這在某種意義上可以被認(rèn)為是人工的。
現(xiàn)在參考圖2、圖3和圖6,多路徑激勵(lì)級(jí)244可以接收來(lái)自寬帶 分析部分242的窄帶激勵(lì)。窄帶激勵(lì)可以通過(guò)可以在接收到的窄帶激 勵(lì)上構(gòu)建或可以擴(kuò)展接收到的窄帶激勵(lì)的各種路徑來(lái)發(fā)散。例如,窄 帶激勵(lì)可以通過(guò)低帶激勵(lì)級(jí)310、高帶激勵(lì)級(jí)320、以及通帶激勵(lì)級(jí)330。
低帶激勵(lì)級(jí)310的調(diào)制器312可以將窄帶激勵(lì)調(diào)制到例如出現(xiàn)在 下部頻支持區(qū)域633 (例如,OHz到300Hz)中的區(qū)域。高帶激勵(lì)級(jí)320 的調(diào)制器322可以將窄帶激勵(lì)調(diào)制到出現(xiàn)在較高頻率的上部支持區(qū)域 637的一部分(例如,3.4KHz至l」4KHz)中的區(qū)域。作為實(shí)例,可以使 用余弦乘法來(lái)將窄帶激勵(lì)信號(hào)調(diào)制到上述的支持區(qū)域633和637。
低帶激勵(lì)級(jí)310的低通濾波器314可以移除由于調(diào)制引起的偽信
號(hào)分量(aliased components)。相似地,高帶激勵(lì)級(jí)320的帶通濾波器 324可以移除由調(diào)制產(chǎn)生的偽信號(hào)分量。通帶激勵(lì)級(jí)330可以允許窄帶 激勵(lì)傳遞未經(jīng)處理的信號(hào),其可以允許它保留在其初始帶寬(例如, 300Hz到3.4KHz)內(nèi)。
加法器340可以將低帶、高帶及通帶激勵(lì)相加在一起,以生成半 帶激勵(lì),其根據(jù)我們的實(shí)例可以從0Hz擴(kuò)展到4KHz。接下來(lái),調(diào)制器 350例如使用余弦乘法,可以調(diào)制半帶激勵(lì),從而創(chuàng)建全帶或?qū)拵Ъ?lì)。 將半帶激勵(lì)調(diào)制到寬帶激勵(lì)可以對(duì)應(yīng)于從4KHz到8KHz的頻率。在多 路徑激勵(lì)級(jí)244完成時(shí),窄帶激勵(lì)信號(hào)可以被擴(kuò)展到寬帶激勵(lì)信號(hào)。
應(yīng)注意的是,低帶調(diào)制器312、高帶調(diào)制器322以及半帶調(diào)制器 350不限于將數(shù)據(jù)只調(diào)制到支持區(qū)域636。例如,在支持區(qū)域636的邊 界處,在變動(dòng)中有一些重疊可能是必要的。通過(guò)該重疊,寬帶激勵(lì)信 號(hào)的頻率響應(yīng)可以是非常平坦的,這是現(xiàn)有技術(shù)中已知的期望特性。
回過(guò)來(lái)參考圖5的方法400,在步驟450,可以通過(guò)將創(chuàng)建的寬帶 譜包絡(luò)與創(chuàng)建的寬帶激勵(lì)及語(yǔ)音信號(hào)組合在一起,來(lái)生成寬帶語(yǔ)音信 號(hào)。步驟452-456提供了如何完成該過(guò)程的實(shí)例。特別地,如步驟452 所示,由步驟436提供的寬帶包絡(luò)可以與由步驟442提供的寬帶激勵(lì) 組合在一起,以生成合成的寬帶語(yǔ)音信號(hào)。合成的寬帶語(yǔ)音信號(hào)可以 包含支持區(qū)域內(nèi)的譜含量,并且還可以包括原始的未知語(yǔ)音信號(hào)。
在步驟454,可以從支持區(qū)域中的合成寬帶語(yǔ)音信號(hào)中提取補(bǔ)充 的寬帶語(yǔ)音信號(hào)。如果原始的未知語(yǔ)音信號(hào)與補(bǔ)充寬帶語(yǔ)音信號(hào)組合 在一起,那么可以移除表示原始未知語(yǔ)音帶寬的相同頻率區(qū)域的合成 寬帶語(yǔ)音信號(hào)的譜含量。由于復(fù)制語(yǔ)音信號(hào)的原始譜含量不是必要的, 所以可以執(zhí)行該步驟。在步驟456,可以將補(bǔ)充寬帶語(yǔ)音信號(hào)添加到語(yǔ) 音信號(hào),以生成寬帶語(yǔ)音信號(hào)。方法400可以在步驟458結(jié)束。
作為實(shí)例并且參考圖2和圖6,混合處理器260可以將補(bǔ)充寬帶 語(yǔ)音信號(hào)與重新采樣的語(yǔ)音信號(hào)105混合,以生成寬帶語(yǔ)音信號(hào)???br> 以從合成寬帶語(yǔ)音信號(hào)中提取補(bǔ)充寬帶語(yǔ)音信號(hào)。例如,寬帶合成部 分262可以使用由寬帶轉(zhuǎn)換器225所提供的寬帶LPC系數(shù)作為合成濾 波系數(shù)。寬帶合成部分262還可以接收由多路徑激勵(lì)級(jí)244所提供的 寬帶激勵(lì)信號(hào)作為輸入。寬帶合成部分262可以通過(guò)采用寬帶LPC濾 波系數(shù)對(duì)寬帶激勵(lì)信號(hào)進(jìn)行濾波,來(lái)生成合成的寬帶語(yǔ)音信號(hào)。產(chǎn)生 的語(yǔ)音信號(hào)是合成的寬帶語(yǔ)音信號(hào)。在我們的實(shí)例中,合成寬帶語(yǔ)音 信號(hào)可以從0Hz擴(kuò)展到8KHz。
如之前所提到的,可以從合成寬帶語(yǔ)音信號(hào)中選擇性地移除譜含 量,以生成補(bǔ)充寬帶語(yǔ)音信號(hào)??梢酝ㄟ^(guò)通過(guò)帶阻濾波器264傳遞合 成寬帶語(yǔ)音信號(hào),來(lái)生成補(bǔ)充的寬帶語(yǔ)音信號(hào)。帶阻濾波器264可以 抑制支持取636內(nèi)部或外部的譜含量。
具體地,原始的未知語(yǔ)音信號(hào)已經(jīng)提供了語(yǔ)音帶寬625內(nèi)(例如, 從300Hz到3.4KHz)的譜含量。由于合成的寬帶語(yǔ)音信號(hào)還包含對(duì)應(yīng) 于包含在語(yǔ)音帶寬625內(nèi)的譜含量的譜含量,所以帶阻濾波器264可 以抑制合成寬帶語(yǔ)音信號(hào)中的、與重新采樣的語(yǔ)音信號(hào)105的譜含量 重疊的譜含量。因此,未知語(yǔ)音信號(hào)可以只需要其自己帶寬之外(例 如,0-300Hz以及3.4KHz到8KHz)的補(bǔ)充譜含量。加法器266可以 將重新采樣的語(yǔ)音信號(hào)105添加到補(bǔ)充寬帶語(yǔ)音信號(hào),以生成寬帶語(yǔ) 音信號(hào)。
在適當(dāng)時(shí),可以使用硬件、軟件或硬件與軟件的組合來(lái)實(shí)現(xiàn)本發(fā) 明。任何類型的計(jì)算機(jī)系統(tǒng)或者適用于執(zhí)行在此所述方法的其它裝置 是合適的。硬件與軟件的典型組合可以是帶有計(jì)算機(jī)程序的移動(dòng)通信 設(shè)備,在程序被加載并執(zhí)行時(shí),可以控制移動(dòng)通信設(shè)備,以便它執(zhí)行 在此所述的方法。也可以在計(jì)算機(jī)程序產(chǎn)品中嵌入本發(fā)明的一部分, 計(jì)算機(jī)程序產(chǎn)品包括支持實(shí)現(xiàn)在此所述方法的所有特征,并且當(dāng)將其被加載到計(jì)算機(jī)系統(tǒng)中時(shí),能夠執(zhí)行這些方法。
盡管已經(jīng)說(shuō)明并描述了本發(fā)明的優(yōu)選實(shí)施例,但是本發(fā)明不受此 限制是顯而易見(jiàn)的。在不背離由所附權(quán)利要求所限定的本發(fā)明主旨及 范圍的情況下,對(duì)本領(lǐng)域的技術(shù)人員來(lái)說(shuō),將出現(xiàn)許多修改、改變、 變化、替代以及等價(jià)物。
權(quán)利要求
1.一種用于語(yǔ)音通信帶寬擴(kuò)展的方法,包括接收未知語(yǔ)音信號(hào);識(shí)別所述接收到的未知語(yǔ)音信號(hào)的語(yǔ)音帶寬;考慮所述接收到的語(yǔ)音信號(hào)的譜含量,來(lái)建立支持區(qū)域;以及從多個(gè)映射數(shù)據(jù)庫(kù)中選擇映射數(shù)據(jù)庫(kù)組合,每個(gè)映射數(shù)據(jù)庫(kù)與用于擴(kuò)展所述語(yǔ)音帶寬的預(yù)定帶寬擴(kuò)展范圍相關(guān)聯(lián)。
2. 根據(jù)權(quán)利要求l所述的方法,其中,建立支持區(qū)域包括 將請(qǐng)求發(fā)送到隱含對(duì)象,以返回所述對(duì)象能夠支持的采樣頻率列表;根據(jù)所述返回的采樣頻率,識(shí)別譜界限;以及 確定所述譜界限內(nèi)的譜帶,用于將所述語(yǔ)音帶寬擴(kuò)展到位于所述 語(yǔ)音帶寬之外的區(qū)域。
3. 根據(jù)權(quán)利要求l所述的方法,其中,選擇映射數(shù)據(jù)庫(kù)組合是順 序的操作,并且進(jìn)一步包括應(yīng)用映射數(shù)據(jù)庫(kù)的一系列組合,以共同 地將所述語(yǔ)音帶寬擴(kuò)展到對(duì)應(yīng)于所選擇的帶寬擴(kuò)展范圍的增加部分的 范圍。
4. 根據(jù)權(quán)利要求l所述的方法,進(jìn)一步包括從所述語(yǔ)音信號(hào)中獲取表示所述譜包絡(luò)的窄帶反射系數(shù)集合;以及使用所述映射數(shù)據(jù)庫(kù),將所述窄帶反射系數(shù)集合擴(kuò)展為寬帶反射 系數(shù)集合,用于生成寬帶譜包絡(luò)。
5. 根據(jù)權(quán)利要求l所述的方法,進(jìn)一步包括-使用寬帶反射信號(hào)集合或窄帶線性預(yù)測(cè)分析系數(shù)集合,從所述語(yǔ) 音信號(hào)中提取窄帶激勵(lì)信號(hào);以及 使用調(diào)制及濾波,將所述窄帶激勵(lì)信號(hào)擴(kuò)展到寬帶激勵(lì)信號(hào)。
6. 根據(jù)權(quán)利要求l所述的方法,進(jìn)一步包括將寬帶激勵(lì)信號(hào)與寬帶譜包絡(luò)組合起來(lái),以生成合成的寬帶語(yǔ)音 信號(hào);從所述支持區(qū)域中的所述合成寬帶語(yǔ)音信號(hào)中,提取補(bǔ)充寬帶語(yǔ) 音信號(hào);以及將所述語(yǔ)音信號(hào)添加到所述補(bǔ)充合成寬帶語(yǔ)音信號(hào),以生成寬帶 語(yǔ)音信號(hào)。
7. —種用于人工擴(kuò)展語(yǔ)音帶寬的系統(tǒng),包括-評(píng)估部分,該評(píng)估部分接收未知語(yǔ)音信號(hào),并確定所述未知語(yǔ)音信號(hào)的語(yǔ)音帶寬的允許限度;以協(xié)同方式耦合到所述評(píng)估部分的數(shù)據(jù)庫(kù)選擇器,其中,所述數(shù) 據(jù)庫(kù)選擇器根據(jù)所述語(yǔ)音帶寬的允許限度選擇映射數(shù)據(jù)庫(kù)組合;以及以協(xié)同方式耦合到所述評(píng)估部分及所述數(shù)據(jù)庫(kù)選擇器的帶寬擴(kuò)展 單元,其中,所述帶寬擴(kuò)展單元使用由所述數(shù)據(jù)庫(kù)選擇器選擇的映射 數(shù)據(jù)庫(kù)組合,將所述未知語(yǔ)音信號(hào)的所述語(yǔ)音帶寬擴(kuò)展到所述語(yǔ)音帶 寬的允許限度。
8. 根據(jù)權(quán)利要求7所述的系統(tǒng),其中,所述評(píng)估部分包括-分析模塊,該分析模塊識(shí)別與所述未知語(yǔ)音信號(hào)相關(guān)聯(lián)的語(yǔ)音帶寬;以協(xié)同方式耦合到所述分析模塊的查詢模塊,其中,所述查詢模 塊識(shí)別所支持的采樣速率,其中,所述所支持的采樣速率揭示出所述語(yǔ)音帶寬可以被擴(kuò)展到的限度;以及以協(xié)同方式耦合到所述分析模塊及所述査詢模塊的采樣模塊,其 中,所述采樣模塊以由所述査詢模塊識(shí)別到的所述所支持的采樣速率 之一來(lái)重新采樣所述未知語(yǔ)音信號(hào),其中所述重新釆樣制定了用于帶 寬擴(kuò)展的所述語(yǔ)音信號(hào)。
9. 根據(jù)權(quán)利要求7所述的系統(tǒng),其中,所述帶寬擴(kuò)展單元包括 以協(xié)同方式耦合到所述評(píng)估部分及所述數(shù)據(jù)庫(kù)選擇器的包絡(luò)處理器,其中,所述包絡(luò)處理器從所述語(yǔ)音信號(hào)中確定窄帶譜包絡(luò),并且 隨后提供表示寬帶譜包絡(luò)的寬帶系數(shù)集合;以協(xié)同方式耦合到所述評(píng)估部分以及所述包絡(luò)處理器的激勵(lì)處理 器,其中,所述激勵(lì)處理器使用寬帶反射系數(shù)集合或窄帶線性預(yù)測(cè)分 析系數(shù)集合,從所述語(yǔ)音信號(hào)中確定窄帶激勵(lì)信號(hào),并隨后創(chuàng)建寬帶 激勵(lì)信號(hào);以及以協(xié)同方式耦合到所述評(píng)估部分、所述包絡(luò)處理器及所述激勵(lì)處 理器的混合處理器,其中,所述混合處理器將所述語(yǔ)音信號(hào)與所述寬 帶激勵(lì)信號(hào)及所述寬帶譜包絡(luò)組合在一起,用于創(chuàng)建寬帶語(yǔ)音信號(hào)。
10. 根據(jù)權(quán)利要求9所述的系統(tǒng),其中,所述包絡(luò)處理器包括特征提取器,該特征提取器獲取表示所述語(yǔ)音信號(hào)譜包絡(luò)的線性預(yù)測(cè)分析系數(shù)集合;以可通信方式耦合到所述特征提取器的窄帶轉(zhuǎn)換器,其中,所述 窄帶轉(zhuǎn)換器將所述線性預(yù)測(cè)分析系數(shù)集合轉(zhuǎn)換為窄帶反射系數(shù)集合;以可通信方式耦合到所述窄帶轉(zhuǎn)換器的估計(jì)器,其中,所述估計(jì) 器與所述數(shù)據(jù)庫(kù)選擇器相結(jié)合,使用所述映射數(shù)據(jù)庫(kù),將所述窄帶反 射系數(shù)集合擴(kuò)展到寬帶反射系數(shù)集合;以及以可通信方式耦合到所述估計(jì)器的寬帶轉(zhuǎn)換器,其中,所述寬帶 轉(zhuǎn)換器將所述寬帶反射系數(shù)轉(zhuǎn)換為寬帶線性預(yù)測(cè)分析系數(shù)集合。
全文摘要
本發(fā)明涉及一種語(yǔ)音帶寬擴(kuò)展的方法(400)及系統(tǒng)(100),用于改善通信系統(tǒng)中的語(yǔ)音質(zhì)量。所述方法可以包括如下步驟接收(412)未知語(yǔ)音信號(hào)(105);識(shí)別(414)接收到的未知語(yǔ)音信號(hào)的語(yǔ)音帶寬(625);以及,考慮接收到的語(yǔ)音信號(hào)的譜包絡(luò),來(lái)建立(418)支持區(qū)域(636)。所述方法可以進(jìn)一步包括以下步驟從多個(gè)映射數(shù)據(jù)庫(kù)中選擇(428)映射數(shù)據(jù)庫(kù)(210、212、214)組合。每個(gè)映射數(shù)據(jù)庫(kù)可以與用于擴(kuò)展語(yǔ)音帶寬的預(yù)定帶寬擴(kuò)展范圍相關(guān)聯(lián)。
文檔編號(hào)H04Q7/20GK101208972SQ200680023361
公開(kāi)日2008年6月25日 申請(qǐng)日期2006年6月27日 優(yōu)先權(quán)日2005年6月30日
發(fā)明者伊斯梅·烏伊薩爾, 哈沙·M·薩廷德拉, 約翰·G·哈里斯, 馬克·A·布瓦洛 申請(qǐng)人:摩托羅拉公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
营山县| 乃东县| 库尔勒市| 西乌珠穆沁旗| 葫芦岛市| 成都市| 中方县| 卢湾区| 永和县| 丹寨县| 平谷区| 林西县| 定州市| 丹东市| 武强县| 察雅县| 遵化市| 嘉禾县| 涞源县| 静乐县| 界首市| 阿坝| 盐山县| 双辽市| 肥城市| 聂荣县| 醴陵市| 都江堰市| 东阿县| 德江县| 柳州市| 肥城市| 楚雄市| 白城市| 凭祥市| 吕梁市| 台南市| 浦东新区| 新泰市| 双城市| 凤山市|