欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

估計(jì)音調(diào)滯后的制作方法

文檔序號(hào):2832846閱讀:232來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):估計(jì)音調(diào)滯后的制作方法
技術(shù)領(lǐng)域
本發(fā)明大體上涉及信號(hào)處理。更具體地說(shuō),本發(fā)明涉及估計(jì)音調(diào)滯后。
背景技術(shù)
在過(guò)去的幾十年中,電子裝置的使用已變得常見(jiàn)。明確地說(shuō),電子技術(shù)的進(jìn)步已降低了越來(lái)越復(fù)雜且有用的電子裝置的成本。成本降低和消費(fèi)者需求已使電子裝置的使用激增,使得其在現(xiàn)代社會(huì)中實(shí)際上為普遍存在的。隨著電子裝置的使用擴(kuò)大,對(duì)于電子裝置的新的且改進(jìn)的特征的需求也擴(kuò)大。更具體來(lái)說(shuō),常常找到更快、更有效或以更高質(zhì)量執(zhí)行功能的電子裝置。一些電子裝置(例如,蜂窩式電話(huà)、智能電話(huà)、計(jì)算機(jī)等)使用語(yǔ)音信號(hào)。這些電子裝置可編碼語(yǔ)音信號(hào)以供存儲(chǔ)或發(fā)射。舉例來(lái)說(shuō),蜂窩式電話(huà)使用麥克風(fēng)俘獲用戶(hù)的話(huà)音或語(yǔ)音。舉例來(lái)說(shuō),蜂窩式電話(huà)使用麥克風(fēng)將聲學(xué)信號(hào)轉(zhuǎn)換成電子信號(hào)??山又鴮⒋穗娮有盘?hào)進(jìn)行格式化以供發(fā)射到另一裝置(例如,蜂窩式電話(huà)、智能電話(huà)、計(jì)算機(jī)等)或供存儲(chǔ)。舉例來(lái)說(shuō),就帶寬和/或存儲(chǔ)資源來(lái)說(shuō),發(fā)射或發(fā)送未經(jīng)壓縮的語(yǔ)音信號(hào)可為代價(jià)較高的。存在試圖更有效率地(例如,使用較少數(shù)據(jù))表示語(yǔ)音信號(hào)的一些方案。然而,這些方案可能不會(huì)很好地表示語(yǔ)音信號(hào)的一些部分,從而導(dǎo)致性能降級(jí)。如從前述論述可理解,改進(jìn)語(yǔ)音信號(hào)譯碼的系統(tǒng)和方法可為有益的。

發(fā)明內(nèi)容
揭示一種用于估計(jì)音調(diào)滯后的電子裝置。所述電子裝置包括處理器和存儲(chǔ)于與所述處理器電子通信的存儲(chǔ)器中的指令。所述電子裝置獲得當(dāng)前幀。所述電子裝置還基于所述當(dāng)前幀獲得殘余信號(hào)。所述電子裝置另外基于所述殘余信號(hào)確定峰值位置集合。所述電子裝置進(jìn)一步基于所述峰值位置集合獲得音調(diào)滯后候選者集合。所述電子裝置還基于所述音調(diào)滯后候選者集合估計(jì)音調(diào)滯后。獲得所述殘余信號(hào)可進(jìn)一步基于經(jīng)量化線(xiàn)性預(yù)測(cè)系數(shù)集合。獲得所述音調(diào)滯后候選者集合可包括以遞增次序布置所述峰值位置集合以產(chǎn)生有序峰值位置集合以及計(jì)算所述有序峰值位置集合中的連續(xù)峰值位置對(duì)之間的距離。確定峰值位置集合可包括基于所述殘余信號(hào)的樣本的絕對(duì)值和窗口信號(hào)計(jì)算包絡(luò)信號(hào)。確定峰值位置集合還可包括基于所述包絡(luò)信號(hào)與所述包絡(luò)信號(hào)的時(shí)間移位版本之間的差計(jì)算第一梯度信號(hào)。確定峰值位置集合可另外包括基于所述第一梯度信號(hào)與所述第一梯度信號(hào)的時(shí)間移位版本之間的差計(jì)算第二梯度信號(hào)。確定峰值位置集合可進(jìn)一步包括選擇第二梯度信號(hào)值降低到第一閾值以下的第一位置索引集合。確定峰值位置集合還可包括通過(guò)消除包絡(luò)值相對(duì)于包絡(luò)中的最大值降低到第二閾值以下的位置索引來(lái)從所述第一位置索引集合確定第二位置索引集合。確定峰值位置集合還可包括通過(guò)消除相對(duì)于相鄰位置索引不滿(mǎn)足差閾值的位置索引來(lái)從所述第二位置索引集合確定第三位置索引集合。所述電子裝置還可使用所述當(dāng)前幀和在所述當(dāng)前幀之前的信號(hào)執(zhí)行線(xiàn)性預(yù)測(cè)分析以獲得線(xiàn)性預(yù)測(cè)系數(shù)集合。所述電子裝置還可基于所述線(xiàn)性預(yù)測(cè)系數(shù)集合確定經(jīng)量化線(xiàn)性預(yù)測(cè)系數(shù)集合。所述音調(diào)滯后可使用迭代修剪算法基于所述音調(diào)滯后候選者集合和所述置信測(cè)度集合來(lái)估計(jì)。所述電子裝置還可計(jì)算對(duì)應(yīng)于所述音調(diào)滯后候選者集合的置信測(cè)度集合。計(jì)算對(duì)應(yīng)于所述音調(diào)滯后候選者集合的所述置信測(cè)度集合可基于信號(hào)包絡(luò)和所述峰值位置的有序集合中的連續(xù)峰值位置對(duì)。計(jì)算所述置信測(cè)度集合可包括對(duì)于所述峰值位置的所述有序集合中的每一對(duì)峰值位置,基于圍繞一對(duì)峰值位置中的第一峰值位置的范圍選擇第一信號(hào)緩沖器,且基于圍繞所述對(duì)峰值位置中的第二峰值位置的范圍選擇第二信號(hào)緩沖器。計(jì)算置信測(cè)度集合還可包括對(duì)于所述峰值位置的所述有序集合中的每一對(duì)峰值位置,計(jì)算所述第一信號(hào)緩沖器與所述第二信號(hào)緩沖器之間的經(jīng)正規(guī)化的交叉相關(guān)性,且將所述經(jīng)正規(guī)化的交叉相關(guān)性添加到所述置信測(cè)度集合。所述電子裝置還可將基于所述當(dāng)前幀的所述殘余信號(hào)計(jì)算的第一近似音調(diào)滯后值添加到所述音調(diào)滯后候選者集合,且將對(duì)應(yīng)于所述第一近似音調(diào)滯后值的第一音調(diào)增益添加到所述置信測(cè)度集合。通過(guò)基于所述當(dāng)前幀的所述殘余信號(hào)估計(jì)自相關(guān)性值且搜索在某一位置范圍內(nèi)的所述自相關(guān)性值以查找最大值,可估計(jì)第一近似音調(diào)滯后值且可估計(jì)第一音調(diào)增益。通過(guò)將所述第一近似音調(diào)滯后值設(shè)置為出現(xiàn)所述最大值所在的位置且將所述第一音調(diào)增益值設(shè)置為所述第一近似音調(diào)滯后值處的經(jīng)正規(guī)化的自相關(guān)性,可進(jìn)一步估計(jì)第一近似音調(diào)滯后值且還可估計(jì)第一音調(diào)增益。所述電子裝置還可將基于先前幀的殘余信號(hào)計(jì)算的第二近似音調(diào)滯后值添加到所述音調(diào)滯后候選者集合,且可將對(duì)應(yīng)于所述第二近似音調(diào)滯后值的第二音調(diào)增益添加到所述置信測(cè)度集合。所述電子裝置還可發(fā)射所述音調(diào)滯后。所述電子裝置可為無(wú)線(xiàn)通信裝置。通過(guò)基于所述先前幀的所述殘余信號(hào)估計(jì)自相關(guān)性值且搜索在某一位置范圍內(nèi)的所述自相關(guān)性值以查找最大值,可估計(jì)所述第二近似音調(diào)滯后值且可估計(jì)所述第二音調(diào)增益。通過(guò)將所述第二近似音調(diào)滯后值設(shè)置為出現(xiàn)所述最大值所在的位置且將所述音調(diào)增益值設(shè)置為所述第二近似音調(diào)滯后值處的經(jīng)正規(guī)化的自相關(guān)性,可進(jìn)一步估計(jì)所述第二近似音調(diào)滯后值且可進(jìn)一步估計(jì)所述第二音調(diào)增益。使用迭代修剪算法基于所述音調(diào)滯后候選者集合和所述置信測(cè)度集合來(lái)估計(jì)所述音調(diào)滯后可包括使用所述音調(diào)滯后候選者集合和所述置信測(cè)度集合計(jì)算經(jīng)加權(quán)均值,且確定所述音調(diào)滯后候選者集合中的最遠(yuǎn)離所述經(jīng)加權(quán)均值的音調(diào)滯后候選者。使用迭代修剪算法基于所述音調(diào)滯后候選者集合和所述置信測(cè)度集合來(lái)估計(jì)所述音調(diào)滯后可進(jìn)一步包括從所述音調(diào)滯后候選者集合中移除最遠(yuǎn)離所述經(jīng)加權(quán)均值的所述音調(diào)滯后候選者,且從所述置信測(cè)度集合中移除對(duì)應(yīng)于最遠(yuǎn)離所述經(jīng)加權(quán)均值的所述音調(diào)滯后候選者的置信測(cè)度。使用迭代修剪算法基于所述音調(diào)滯后候選者集合和所述置信測(cè)度集合來(lái)估計(jì)所述音調(diào)滯后可進(jìn)一步包括確定剩余音調(diào)滯后候選者數(shù)目是否等于指定數(shù)目,且在所述剩余音調(diào)滯后候選者數(shù)目等于所述指定數(shù)目的情況下,基于一個(gè)或一個(gè)以上剩余音調(diào)滯后候選者確定所述音調(diào)滯后。所述電子裝置還可在所述剩余音調(diào)滯后候選者數(shù)目不等于所述指定數(shù)目的情況下反復(fù)進(jìn)行。
Zdici可根據(jù)方程式Mw:氣^來(lái)實(shí)現(xiàn)計(jì)算所述經(jīng)加權(quán)均值。Mw可為所述經(jīng)加權(quán)均
Ici
i=l
值,L可為音調(diào)滯后候選者數(shù)目,{dj可為所述音調(diào)滯后候選者集合,且IcJ可為所述置信測(cè)度集合??赏ㄟ^(guò)找到dk來(lái)實(shí)現(xiàn)確定所述音調(diào)滯后候選者集合中的最遠(yuǎn)離所述經(jīng)加權(quán)均值的音調(diào)滯后候選者,使得對(duì)于所有i,|Mw-dk|> IMw-Cli I,其中i關(guān)k。dk可為最遠(yuǎn)離所述經(jīng)加權(quán)均值的音調(diào)滯后候選者,Mw可為經(jīng)加權(quán)均值,{dj可為所述音調(diào)滯后候選者集合,且i可為索引編號(hào)。還揭示另一種用于估計(jì)音調(diào)滯后的電子裝置。所述電子裝置包括處理器和存儲(chǔ)于與所述處理器電子通信的存儲(chǔ)器中的指令。所述電子裝置獲得語(yǔ)音信號(hào)。所述電子裝置還基于所述語(yǔ)音信號(hào)獲得音調(diào)滯后候選者集合。所述電子裝置進(jìn)一步確定對(duì)應(yīng)于所述音調(diào)滯后候選者集合的置信測(cè)度集合。所述電子裝置另外使用迭代修剪算法基于所述音調(diào)滯后候選者集合和所述置信測(cè)度集合估計(jì)音調(diào)滯后。使用迭代修剪算法基于所述音調(diào)滯后候選者集合和所述置信測(cè)度集合來(lái)估計(jì)所述音調(diào)滯后可包括使用所述音調(diào)滯后候選者集合和所述置信測(cè)度集合計(jì)算經(jīng)加權(quán)均值,且確定所述音調(diào)滯后候選者集合中的最遠(yuǎn)離經(jīng)加權(quán)均值的音調(diào)滯后候選者。使用迭代修剪算法基于所述音調(diào)滯后候選者集合和`所述置信測(cè)度集合來(lái)估計(jì)所述音調(diào)滯后可進(jìn)一步包括從所述音調(diào)滯后候選者集合中移除最遠(yuǎn)離所述經(jīng)加權(quán)均值的音調(diào)滯后候選者,且從所述置信測(cè)度集合中移除對(duì)應(yīng)于最遠(yuǎn)離所述經(jīng)加權(quán)均值的所述音調(diào)滯后候選者的置信測(cè)度。使用迭代修剪算法基于所述音調(diào)滯后候選者集合和所述置信測(cè)度集合來(lái)估計(jì)所述音調(diào)滯后可另外包括確定剩余音調(diào)滯后候選者數(shù)目是否等于指定數(shù)目,且在所述剩余音調(diào)滯后候選者數(shù)目等于所述指定數(shù)目的情況下,基于一個(gè)或一個(gè)以上剩余音調(diào)滯后候選者確定所述音調(diào)滯后。還揭示一種用于在電子裝置上估計(jì)音調(diào)滯后的方法。所述方法包括獲得當(dāng)前幀。所述方法還包括基于所述當(dāng)前幀獲得殘余信號(hào)。所述方法進(jìn)一步包括基于所述殘余信號(hào)確定峰值位置集合。所述方法另外包括基于所述峰值位置集合獲得音調(diào)滯后候選者集合。所述方法還包括基于所述音調(diào)滯后候選者集合估計(jì)音調(diào)滯后。還揭示另一種用于在電子裝置上估計(jì)音調(diào)滯后的方法。所述方法包含獲得語(yǔ)音信號(hào)。所述方法還包括基于所述語(yǔ)音信號(hào)獲得音調(diào)滯后候選者集合。所述方法進(jìn)一步包括確定對(duì)應(yīng)于所述音調(diào)滯后候選者集合的置信測(cè)度集合。所述方法另外包括使用迭代修剪算法基于所述音調(diào)滯后候選者集合和所述置信測(cè)度集合估計(jì)音調(diào)滯后。還揭示一種用于估計(jì)音調(diào)滯后的計(jì)算機(jī)程序產(chǎn)品。所述計(jì)算機(jī)程序產(chǎn)品包括具有指令的非暫時(shí)性有形計(jì)算機(jī)可讀媒體。所述指令包括用于致使電子裝置獲得當(dāng)前幀的代碼。所述指令還包括用于致使所述電子裝置基于所述當(dāng)前幀獲得殘余信號(hào)的代碼。所述指令進(jìn)一步包括用于致使所述電子裝置基于所述殘余信號(hào)確定峰值位置集合的代碼。所述指令另外包括用于致使所述電子裝置基于所述峰值位置集合獲得音調(diào)滯后候選者集合的代碼。所述指令還包括用于致使所述電子裝置基于所述音調(diào)滯后候選者集合估計(jì)音調(diào)滯后的代碼。還揭示另一種用于估計(jì)音調(diào)滯后的計(jì)算機(jī)程序產(chǎn)品。所述計(jì)算機(jī)程序產(chǎn)品包括具有指令的非暫時(shí)性有形計(jì)算機(jī)可讀媒體。所述指令包括用于致使電子裝置獲得語(yǔ)音信號(hào)的代碼。所述指令還包括用于致使所述電子裝置基于語(yǔ)音信號(hào)獲得音調(diào)滯后候選者集合的代碼。所述指令進(jìn)一步包括用于致使所述電子裝置確定對(duì)應(yīng)于所述音調(diào)滯后候選者集合的置信測(cè)度集合的代碼。所述指令另外包括用于致使所述電子裝置使用迭代修剪算法基于所述音調(diào)滯后候選者集合和所述置信測(cè)度集合估計(jì)音調(diào)滯后的代碼。還揭示一種用于估計(jì)音調(diào)滯后的設(shè)備。所述設(shè)備包括用于獲得當(dāng)前幀的裝置。所述設(shè)備還包括用于基于所述當(dāng)前幀獲得殘余信號(hào)的裝置。所述設(shè)備進(jìn)一步包括用于基于所述殘余信號(hào)確定峰值位置集合的裝置。所述設(shè)備另外包括用于基于所述峰值位置集合獲得音調(diào)滯后候選者集合的裝置。所述設(shè)備還包括用于基于所述音調(diào)滯后候選者集合估計(jì)音調(diào)滯后的裝置。還揭示另一種用于估計(jì)音調(diào)滯后的設(shè)備。所述設(shè)備包括用于獲得語(yǔ)音信號(hào)的裝置。所述設(shè)備還包括用于基于所述語(yǔ)音信號(hào)獲得音調(diào)滯后候選者集合的裝置。所述設(shè)備進(jìn)一步包括用于確定對(duì)應(yīng)于所述音調(diào)滯后候選者集合的置信測(cè)度集合的裝置。所述設(shè)備另外包括用于使用迭代修剪算法基于所述音調(diào)滯后候選者集合和所述置信測(cè)度集合估計(jì)音調(diào)滯后的裝置。


圖1為說(shuō)明其中可實(shí)施用于估計(jì)音調(diào)滯后的系統(tǒng)和方法的電子裝置的一個(gè)配置的框圖;圖2為說(shuō)明用于估計(jì)音調(diào)滯后的方法的一個(gè)配置的流程圖;圖3為說(shuō)明來(lái)自殘余信號(hào)的峰值的一個(gè)實(shí)例的圖;圖4為說(shuō)明用于估計(jì)音調(diào)滯后的方法的另一配置的流程圖;圖5為說(shuō)明用于估計(jì)音調(diào)滯后的方法的較特定配置的流程圖;圖6為說(shuō)明用于使用迭代修剪算法估計(jì)音調(diào)滯后的方法的一個(gè)配置的流程圖;圖7為說(shuō)明其中可實(shí)施用于估計(jì)音調(diào)滯后的系統(tǒng)和方法的編碼器的一個(gè)配置的框圖;圖8為說(shuō)明解碼器的一個(gè)配置的框圖;圖9為說(shuō)明用于解碼語(yǔ)音信號(hào)的方法的一個(gè)配置的流程圖;圖10為說(shuō)明其中可實(shí)施用于估計(jì)音調(diào)滯后的系統(tǒng)和方法的電子裝置的一個(gè)實(shí)例的框圖;圖11為說(shuō)明其中可實(shí)施用于解碼語(yǔ)音信號(hào)的系統(tǒng)和方法的電子裝置的一個(gè)實(shí)例的框圖;圖12為說(shuō)明音調(diào)同步增益按比例縮放和LPC合成塊/模塊的一個(gè)配置的框圖13說(shuō)明可用于電子裝置中的各種組件;以及圖14說(shuō)明可包括于無(wú)線(xiàn)通信裝置內(nèi)的某些組件。
具體實(shí)施例方式本文中所揭示的系統(tǒng)和方法可應(yīng)用于多種裝置,例如電子裝置。電子裝置的實(shí)例包括話(huà)音記錄器、攝像機(jī)、音頻播放器(例如,移動(dòng)圖片專(zhuān)家小組I(MPEG-1)或MPEG-2音頻層3(MP3)播放器)、視頻播放器、音頻記錄器、桌上型計(jì)算機(jī)/膝上型計(jì)算機(jī)、個(gè)人數(shù)字助理(PDA)、游戲系統(tǒng)等。一種種類(lèi)的電子裝置為通信裝置,其可與另一裝置通信。通信裝置的實(shí)例包括電話(huà)、膝上型計(jì)算機(jī)、桌上型計(jì)算機(jī)、蜂窩式電話(huà)、智能電話(huà)、無(wú)線(xiàn)或有線(xiàn)調(diào)制解調(diào)器、電子閱讀器、平板裝置、游戲系統(tǒng)、蜂窩式電話(huà)基站或節(jié)點(diǎn)、接入點(diǎn)、無(wú)線(xiàn)網(wǎng)關(guān)和無(wú)線(xiàn)路由器。通信裝置可根據(jù)特定工業(yè)標(biāo)準(zhǔn)而操作,例如國(guó)際電信聯(lián)盟(ITU)標(biāo)準(zhǔn)和/或電氣與電子工程師學(xué)會(huì)(IEEE)標(biāo)準(zhǔn)(例如,無(wú)線(xiàn)保真或“W1-Fi”標(biāo)準(zhǔn),例如802.11a、802.lib,802.llg、802.1ln和/或802.llac)。通信裝置可遵照的標(biāo)準(zhǔn)的其它實(shí)例包括IEEE802.16 (例如,微波接入全球互通或“WiMAX”)、第三代合作伙伴計(jì)劃(3GPP)、3GPP長(zhǎng)期演進(jìn)(LTE)、全球移動(dòng)電信系統(tǒng)(GSM)和其它標(biāo)準(zhǔn)(其中通信裝置可被稱(chēng)為(例如)用戶(hù)設(shè)備(UE)、節(jié)點(diǎn)B、演進(jìn)型節(jié)點(diǎn)B (eNB)、移動(dòng)裝置、移動(dòng)臺(tái)、訂戶(hù)臺(tái)、遠(yuǎn)程臺(tái)、接入終端、移動(dòng)終端、終端、用戶(hù)終端、訂戶(hù)單元等)。雖然本文中所揭示的系統(tǒng)和方法中的一些系統(tǒng)和方法可能依據(jù)一個(gè)或一個(gè)以上標(biāo)準(zhǔn)來(lái)描述,但這不應(yīng)限制本發(fā)明的范圍,因?yàn)樗鱿到y(tǒng)和方法可適用于許多系統(tǒng)和/或標(biāo)準(zhǔn)。應(yīng)注意,一些通信裝置可以無(wú)線(xiàn)方式通信且/或可使用有線(xiàn)連接或鏈路通信。舉例來(lái)說(shuō),一些通信裝置可使用以太網(wǎng)協(xié)議與其它裝置通信。本文中所揭示的系統(tǒng)和方法可應(yīng)用于以無(wú)線(xiàn)方式通信和/或使用有線(xiàn)連接或鏈路通信的通信裝置。在一個(gè)配置中,本文中所揭示的系統(tǒng)和方法可應(yīng)用于使用衛(wèi)星來(lái)與另一裝置通信的通信裝置。本文中所揭示的系統(tǒng)和方法可應(yīng)用于如下描述的通信系統(tǒng)的一個(gè)實(shí)例。在此實(shí)例中,本文中所揭示的系統(tǒng)和方法可提供低位速率(例如,2千位/秒(Kbps))語(yǔ)音編碼用于地球移動(dòng)衛(wèi)星空中接口(GMSA)衛(wèi)星通信。更具體來(lái)說(shuō),本文中所揭示的系統(tǒng)和方法可用于集成的衛(wèi)星和移動(dòng)通信網(wǎng)絡(luò)中。這些網(wǎng)絡(luò)可提供無(wú)縫、透明、可共同操作且普遍存在的無(wú)線(xiàn)覆蓋范圍?;谛l(wèi)星的服務(wù)可用于陸地覆蓋范圍不可達(dá)到的遠(yuǎn)程位置中的通信。舉例來(lái)說(shuō),此服務(wù)可用于人為災(zāi)害或自然災(zāi)害、廣播和/或船隊(duì)管理以及資產(chǎn)跟蹤??墒褂肔和/或S頻帶(無(wú)線(xiàn))頻譜。在一個(gè)配置中,前向鏈路可使用Ix演進(jìn)數(shù)據(jù)優(yōu)化(EV-DO)版本A空中接口作為用于空中衛(wèi)星鏈路的基礎(chǔ)技術(shù)。反向鏈路可使用頻分多路復(fù)用(FDM)。舉例來(lái)說(shuō),反向鏈路頻譜的1.25兆赫(MHz)塊可劃分成192個(gè)窄帶頻道,每一窄帶頻道具有6.4千赫(kHz)的帶寬。可限制反向鏈路數(shù)據(jù)速率。這可提出對(duì)于低位速率編碼的需要。在一些情況下,例如,信道可能僅能夠支持2.4Kbps。然而,在較佳信道條件下,2個(gè)FDM信道可能為可用的,從而有可能提供4.8Kbps發(fā)射。在反向鏈路上,例如,可使用低位速率語(yǔ)音編碼器。這可允許2Kbps的固定速率用于反向鏈路上的單個(gè)FDM信道指派的活動(dòng)語(yǔ)音。在一個(gè)配置中,反向鏈路使用1/4卷積譯碼器用于基本信道編碼。在一些配置中,本文中所揭示的系統(tǒng)和方法可另外用于其它編碼模式。舉例來(lái)說(shuō),可結(jié)合使用原型音調(diào)周期波形內(nèi)插法(PPPWI)的四分之一速率濁音譯碼或替代使用原型音調(diào)周期波形內(nèi)插法(PPPWI)的四分之一速率濁音編碼而使用本文中所揭示的系統(tǒng)和方法。在PPPWI中,原型波形可用以產(chǎn)生可替代實(shí)際波形的內(nèi)插波形,從而允許減少的數(shù)目個(gè)樣本產(chǎn)生重構(gòu)的信號(hào)。舉例來(lái)說(shuō),PPPWI可在全速率或四分之一速率下可用,且/或可產(chǎn)生時(shí)間同步輸出。此外,可在PPPWI中在頻域中執(zhí)行量化。QQQ可用于濁音編碼模式中(例如,代替FQQ(有效二分之一速率))。QQQ為使用四分之一速率原型音調(diào)周期波形內(nèi)插法(QPPP-WI)以40位/幀(有效地,2千位/秒(kbps))來(lái)編碼三個(gè)連續(xù)濁音幀的譯碼型式。FQQ為分別使用全速率原型音調(diào)周期(PPP)、四分之一速率原型音調(diào)周期(QPPP)和QPPP來(lái)編碼三個(gè)連續(xù)濁音幀的譯碼型式。這可實(shí)現(xiàn)4kbps的平均速率。后者可不用于2kbps聲碼器中。應(yīng)注意,可以修改的方式使用四分之一速率原型音調(diào)周期(QPPP),其中不進(jìn)行頻域中的原型表示的振幅的差量編碼且進(jìn)行13位線(xiàn)譜頻率(LSF)量化。在一個(gè)配置中,QPPP可使用13個(gè)位用于LSF,12個(gè)位用于原型波形振幅,6個(gè)位用于原型波形功率,7個(gè)位用于音調(diào)滯后和2個(gè)位用于模式,從而產(chǎn)生總共40個(gè)位。明確地說(shuō),本文中所揭示的系統(tǒng)和方法可用于瞬時(shí)編碼模式(其可提供QPPP所需的種子)。此瞬時(shí)編碼模式(例如,在2Kbps聲碼器中)可使用統(tǒng)一模型用于譯碼上升瞬時(shí)、下降瞬時(shí)和濁音瞬時(shí)。雖然本文中所揭示的系統(tǒng)和方法可尤其應(yīng)用于瞬時(shí)編碼模式,但瞬時(shí)編碼模式并不是其中可應(yīng)用這些系統(tǒng)和方法的僅有上下文。其可另外或替代地應(yīng)用于其它編碼模式。本文中所揭示的系統(tǒng)和方法描述執(zhí)行音調(diào)估計(jì)。在一些配置中,估計(jì)音調(diào)滯后可部分地通過(guò)反復(fù)地修剪線(xiàn)性預(yù)測(cè)譯碼(LPC)殘余中的包括峰值間距離的候選音調(diào)值來(lái)實(shí)現(xiàn)。可需要準(zhǔn)確的音調(diào)估計(jì)以在位速率非常低的聲碼器中產(chǎn)生良好的經(jīng)譯碼語(yǔ)音質(zhì)量。一些傳統(tǒng)的音調(diào)估計(jì)算法使用信號(hào)的長(zhǎng)期統(tǒng)計(jì)從語(yǔ)音信號(hào)幀和/或?qū)?yīng)的LPC殘余估計(jì)音調(diào)。此估計(jì)通常對(duì)于非穩(wěn)定的瞬時(shí)幀為不可靠的。換句話(huà)說(shuō),這可能不會(huì)為非穩(wěn)定的瞬時(shí)語(yǔ)音幀給出準(zhǔn)確的估計(jì)。本文中所揭示的系統(tǒng)和方法可通過(guò)使用語(yǔ)音幀中的短時(shí)間(例如,局部)特性且/或通過(guò)使用迭代算法在若干候選者當(dāng)中選擇理想的(例如,最佳可用的)音調(diào)值來(lái)較可靠地估計(jì)音調(diào)。舉例來(lái)說(shuō),這可改進(jìn)低位速率聲碼器中的語(yǔ)音質(zhì)量,進(jìn)而改進(jìn)所記錄或所發(fā)射語(yǔ)音質(zhì)量。更具體來(lái)說(shuō),本文中所揭示的系統(tǒng)和方法可使用一種估計(jì)算法,其提供比傳統(tǒng)技術(shù)準(zhǔn)確的對(duì)音調(diào)的估計(jì)且因此在聲碼器中針對(duì)低位速率編碼模式產(chǎn)生改進(jìn)的語(yǔ)音質(zhì)量?,F(xiàn)參看各圖描述各種配置,其中相同參考數(shù)字可指示功能上相似的元件。如本文中各圖中大體描述和說(shuō)明的系統(tǒng)和方法可以廣泛多種不同配置來(lái)布置和設(shè)計(jì)。因此,如各圖中所表示的若干配置的以下較詳細(xì)描述并不希望限制如所主張的范圍,而是僅表示所述系統(tǒng)和方法。圖1為說(shuō)明其中可實(shí)施用于估計(jì)音調(diào)滯后的系統(tǒng)和方法的電子裝置102的一個(gè)配置的框圖。另外或替代地,可在電子裝置102中實(shí)施用于解碼語(yǔ)音信號(hào)的系統(tǒng)和方法。電子裝置A102可包括編碼器104。編碼器104的一個(gè)實(shí)例為線(xiàn)性預(yù)測(cè)譯碼(LPC)編碼器。編碼器104可由電子裝置A102使用以編碼語(yǔ)音信號(hào)106。舉例來(lái)說(shuō),編碼器104通過(guò)估計(jì)或產(chǎn)生可用以合成語(yǔ)音信號(hào)的參數(shù)集合來(lái)將語(yǔ)音信號(hào)106編碼成“經(jīng)壓縮”格式。在一個(gè)配置中,這些參數(shù)可表示可用以合成語(yǔ)音信號(hào)106的音調(diào)(例如,頻率)、振幅和共振峰(例如,共振)的估計(jì)。編碼器104可包括音調(diào)估計(jì)塊/模塊126,其根據(jù)本文中所揭示的系統(tǒng)和方法來(lái)估計(jì)音調(diào)滯后。如本文中所使用,術(shù)語(yǔ)“塊/模塊”可用以指示可以硬件、軟件或兩者的組合實(shí)施特定元件。應(yīng)注意,可以多種方式實(shí)施音調(diào)估計(jì)塊/模塊126。舉例來(lái)說(shuō),音調(diào)估計(jì)塊/模塊126可包含峰值搜索塊/模塊128、置信測(cè)度塊/模塊134和/或音調(diào)滯后確定塊/模塊138。在其它配置中,說(shuō)明為包括在音調(diào)估計(jì)塊/模塊126內(nèi)的塊/模塊中的一者或一者以上可被省略且/或由其它塊/模塊替代。另外或替代地,音調(diào)估計(jì)塊/模塊126可被定義為包括其它塊/模塊,例如線(xiàn)性預(yù)測(cè)譯碼(LPC)分析塊/模塊122。電子裝置A102可獲得語(yǔ)音信號(hào)106。在一個(gè)配置中,電子裝置A102通過(guò)使用麥克風(fēng)俘獲聲學(xué)信號(hào)且/或?qū)ζ淙觼?lái)獲得語(yǔ)音信號(hào)106。在另一配置中,電子裝置A102從另一裝置(例如,藍(lán)牙頭戴耳機(jī)、通用串行總線(xiàn)(USB)驅(qū)動(dòng)器、安全數(shù)字(SD)卡、網(wǎng)絡(luò)接口、無(wú)線(xiàn)麥克風(fēng)等)接收語(yǔ)音信號(hào)106。可將語(yǔ)音信號(hào)106提供到成幀塊/模塊108。電子裝置A102可使用成幀塊/模塊108將語(yǔ)音信號(hào)106分段成一個(gè)或一個(gè)以上幀110。舉例來(lái)說(shuō),幀110可包括特定數(shù)目個(gè)語(yǔ)音信號(hào)106樣本且/或包括某一時(shí)間量(例如,10到20毫秒)的語(yǔ)音信號(hào)106。當(dāng)語(yǔ)音信號(hào)106被分段成多個(gè)幀110時(shí),可根據(jù)其所含有的信號(hào)來(lái)對(duì)幀110進(jìn)行分類(lèi)。舉例來(lái)說(shuō),幀110可為濁音幀、清音幀、靜音幀或瞬時(shí)幀。本文中所揭示的系統(tǒng)和方法可用以估計(jì)幀110(例如,瞬時(shí)幀、濁音幀等)中的音調(diào)滯后。舉例來(lái)說(shuō),瞬時(shí)幀可位于一個(gè)語(yǔ)音類(lèi)別與另一語(yǔ)音類(lèi)別之間的邊界上。舉例來(lái)說(shuō),語(yǔ)音信號(hào)106可從清音(例如,f、s、sh、th等)轉(zhuǎn)變成池音(例如,a、e、1、O、u等)。一些瞬時(shí)類(lèi)型包括上升瞬時(shí)(例如,當(dāng)從語(yǔ)音信號(hào)106的清音部分轉(zhuǎn)變到濁音部分時(shí))、爆破音、濁音瞬時(shí)(例如,線(xiàn)性預(yù)測(cè)譯碼(LPC)改變和音調(diào)滯后變化)和下降瞬時(shí)(例如,當(dāng)從語(yǔ)音信號(hào)106的濁音部分轉(zhuǎn)變到清音或靜音部分(例如,詞結(jié)尾)時(shí))。在兩個(gè)語(yǔ)音類(lèi)別之間的幀110可為瞬時(shí)幀。本文中所揭示的系統(tǒng)和方法可有益地應(yīng)用于瞬時(shí)幀,因?yàn)閭鹘y(tǒng)的方法可能不會(huì)在瞬時(shí)幀中提供準(zhǔn)確的音調(diào)滯后估計(jì)。然而,應(yīng)注意,本文中所揭示的系統(tǒng)和方法可應(yīng)用于其它種類(lèi)的幀。編碼器104可使用線(xiàn)性預(yù)測(cè)譯碼(LPC)分析塊/模塊122來(lái)對(duì)幀110執(zhí)行線(xiàn)性預(yù)測(cè)分析(例如,LPC分析)。應(yīng)注意,LPC分析塊/模塊122可另外或替代地使用來(lái)自其它幀110 (例如,來(lái)自先前幀110)的一個(gè)或一個(gè)以上樣本。LPC分析塊/模塊122可產(chǎn)生一個(gè)或一個(gè)以上LPC系數(shù)120??蓪PC系數(shù)120提供到量化塊/模塊118,其可產(chǎn)生一個(gè)或一個(gè)以上經(jīng)量化LPC系數(shù)116??蓪⑺鼋?jīng)量化LPC系數(shù)116和來(lái)自一個(gè)或一個(gè)以上幀110的一個(gè)或一個(gè)以上樣本提供到殘余確定塊/模塊112,其可用以確定殘余信號(hào)114。舉例來(lái)說(shuō),殘余信號(hào)114可包括已使共振峰或共振峰的效應(yīng)從語(yǔ)音信號(hào)106移除的語(yǔ)音信號(hào)106的幀110??蓪堄嘈盘?hào)114提供到音調(diào)估計(jì)塊/模塊126。編碼器104可包括音調(diào)估計(jì)塊/模塊126。在圖1所說(shuō)明的實(shí)例中,音調(diào)估計(jì)塊/模塊126包括峰值搜索塊/模塊128、置信測(cè)度塊/模塊134和音調(diào)滯后確定塊/模塊138。然而,峰值搜索塊/模塊128和/或置信測(cè)度塊/模塊134可為任選的,且可用確定一個(gè)或一個(gè)以上音調(diào)(例如,音調(diào)滯后)候選者132和/或置信測(cè)度136的一個(gè)或一個(gè)以上其它塊/模塊替代。如圖1中所說(shuō)明,音調(diào)滯后確定塊/模塊138可使用迭代修剪算法140。然而,迭代修剪算法140可為任選的,且可在本文中所揭示的系統(tǒng)和方法的一些配置中省略。換句話(huà)說(shuō),音調(diào)滯后確定塊/模塊138可在一些配置中在不使用迭代修剪算法140的情況下確定音調(diào)滯后,且舉例來(lái)說(shuō),可使用某種其它方法或算法(例如平滑或平均算法)來(lái)確定首調(diào)滯后142。峰值搜索塊/模塊128可搜索殘余信號(hào)114中的峰值。換句話(huà)說(shuō),編碼器104可搜索殘余信號(hào)114中的峰值(例如,高能量的區(qū)域)??勺R(shí)別這些峰值以獲得峰值列表或集合。舉例來(lái)說(shuō),可依據(jù)樣本編號(hào)和/或時(shí)間來(lái)指定峰值列表或集合中的峰值位置。下文給出關(guān)于獲得峰值列表或集合的更多細(xì)節(jié)。峰值搜索塊/模塊128可包括候選者確定塊/模塊130。候選者確定塊/模塊130可使用所述峰值集合以便確定一個(gè)或一個(gè)以上候選者音調(diào)滯后132?!耙粽{(diào)滯后”可為幀110中的兩個(gè)連續(xù)音調(diào)尖峰之間的“距離”。舉例來(lái)說(shuō),可以樣本數(shù)目和/或時(shí)間量來(lái)指定音調(diào)滯后。在一個(gè)配置中,峰值搜索塊/模塊128可確定峰值之間的距離以便確定音調(diào)滯后候選者132。在非常穩(wěn)定的話(huà)音或語(yǔ)音信號(hào)中,音調(diào)滯后可保持幾乎恒定。用于估計(jì)音調(diào)滯后的一些傳統(tǒng)方法使用自相關(guān)。在那些方法中,使LPC殘余抵靠著其自身滑動(dòng)以進(jìn)行相關(guān)。在那些方法中可將具有最大自相關(guān)性值的任何相關(guān)性或音調(diào)滯后確定為幀的音調(diào)。那些方法可在語(yǔ)音幀非常穩(wěn)定時(shí)起作用。然而,存在其中音調(diào)結(jié)構(gòu)可能不非常穩(wěn)定的其它幀,例如在瞬時(shí)幀中。即使當(dāng)語(yǔ)音幀是穩(wěn)定的時(shí),傳統(tǒng)方法也可能歸因于系統(tǒng)中的噪聲而不會(huì)提供非常準(zhǔn)確的音調(diào)估計(jì)。噪聲可減小殘余的“有峰”程度。在此情況下,舉例來(lái)說(shuō),傳統(tǒng)方法可確定不是非常準(zhǔn)確的音調(diào)估計(jì)。峰值搜索塊/模塊128可使用相關(guān)方法獲得音調(diào)滯后候選者集合132。舉例來(lái)說(shuō),可首先由候選者確定塊/模塊130確定候選音調(diào)滯后集合132。接著,可由置信測(cè)度塊/模塊134基于候選音調(diào)滯后集合132而確定對(duì)應(yīng)于所述候選音調(diào)滯后集合的置信測(cè)度集合136。更具體來(lái)說(shuō),第一集合可為音調(diào)滯后候選者集合132,且第二集合可為用于音調(diào)滯后候選者132中的每一者的置信測(cè)度集合136。因此,舉例來(lái)說(shuō),第一置信測(cè)度或值可對(duì)應(yīng)于第一音調(diào)滯后候選者,等等。因此,可“構(gòu)建”或確定音調(diào)滯后候選者集合132和置信測(cè)度集合136。置信測(cè)度集合136可用以改進(jìn)所估計(jì)的音調(diào)滯后142的準(zhǔn)確性。在一個(gè)配置中,置信測(cè)度集合136可為相關(guān)性集合,其中每一值可為(在基礎(chǔ)方面中)對(duì)應(yīng)于音調(diào)滯后候選者的音調(diào)滯后處的相關(guān)性。換句話(huà)說(shuō),用于每一特定音調(diào)滯后的相關(guān)性系數(shù)可構(gòu)成用于音調(diào)滯后候選者132距離中的每一者的置信測(cè)度。可將音調(diào)滯后候選者集合132和/或置信測(cè)度集合136提供到音調(diào)滯后確定塊/模塊138。音調(diào)滯后確定塊/模塊138可基于一個(gè)或一個(gè)以上音調(diào)滯后候選者132確定音調(diào)滯后142。在一些配置中,音調(diào)滯后確定塊/模塊138可基于一個(gè)或一個(gè)以上置信測(cè)度136 (除所述一個(gè)或一個(gè)以上音調(diào)滯后候選者132之外)確定音調(diào)滯后142。舉例來(lái)說(shuō),音調(diào)滯后確定塊/模塊可使用迭代修剪算法140來(lái)選擇所述音調(diào)滯后值中的一者。下文給出關(guān)于迭代修剪算法140的更多細(xì)節(jié)。所選擇的音調(diào)滯后142值可為“真實(shí)”音調(diào)滯后的估計(jì)。在其它配置中,音調(diào)滯后確定塊/模塊138可使用某種其它方法來(lái)確定音調(diào)滯后142。舉例來(lái)說(shuō),代替迭代修剪算法140或除迭代修剪算法140之外,音調(diào)滯后確定塊/模塊138可使用平均或平滑算法。
可將由音調(diào)滯后確定塊/模塊138確定的音調(diào)滯后142提供到激勵(lì)合成塊/模塊148和比例因子確定塊/模塊152。激勵(lì)合成塊/模塊148可基于音調(diào)滯后142和由原型波形產(chǎn)生塊/模塊144提供的波形146產(chǎn)生或合成激勵(lì)150。在一個(gè)配置中,原型波形產(chǎn)生塊/模塊144可基于音調(diào)滯后142產(chǎn)生波形146??蓪⒓?lì)150、音調(diào)滯后142和/或經(jīng)量化LPC系數(shù)116提供到比例因子確定塊/模塊152,其可基于激勵(lì)150、音調(diào)滯后142和/或經(jīng)量化LPC系數(shù)116產(chǎn)生增益集合154??蓪⒃鲆婕?54提供到增益量化塊/模塊156,其量化增益集合154以產(chǎn)生經(jīng)量化增益集合158。音調(diào)滯后142、經(jīng)量化LPC系數(shù)116和/或經(jīng)量化增益158可被稱(chēng)為經(jīng)編碼的語(yǔ)音信號(hào)??山獯a所述經(jīng)編碼的語(yǔ)音信號(hào)以便產(chǎn)生經(jīng)合成的語(yǔ)音信號(hào)??蓪⒁粽{(diào)滯后142、經(jīng)量化LPC系數(shù)116和/或經(jīng)量化增益158 (例如,經(jīng)編碼的語(yǔ)音信號(hào))發(fā)射到另一裝置、將其存儲(chǔ)且/或解碼。在一個(gè)配置中,電子裝置A102可包括發(fā)射(TX)和/或接收(RX)塊/模塊160??蓪⒁粽{(diào)滯后142、經(jīng)量化LPC系數(shù)116和/或經(jīng)量化增益158提供到TX/RX塊/模塊160。TX/RX塊/模塊160可將音調(diào)滯后142、經(jīng)量化LPC系數(shù)116和/或經(jīng)量化增益158格式化為適合于發(fā)射的格式。舉例來(lái)說(shuō),TX/RX塊/模塊160可將音調(diào)滯后142、經(jīng)量化LPC系數(shù)116和/或經(jīng)量化增益158編碼、調(diào)節(jié)、按比例縮放(例如,放大)且/或以其它方式格式化為一個(gè)或一個(gè)以上消息166。TX/RX塊/模塊160可將所述一個(gè)或一個(gè)以上消息166發(fā)射到另一裝置,例如電子裝置B168。所述一個(gè)或一個(gè)以上消息166可使用無(wú)線(xiàn)和/或有線(xiàn)連接或鏈路來(lái)發(fā)射。在一些配置中,所述一個(gè)或一個(gè)以上消息166可通過(guò)衛(wèi)星、基站、路由器、交換器和/或其它裝置或媒體來(lái)中繼傳遞到電子裝置B168。電子裝置B168可使用TX/RX塊/模塊170接收由電子裝置A102發(fā)射的所述一個(gè)或一個(gè)以上消息166。所述TX/RX塊/模塊170可解碼、解調(diào)且/或以其它方式解格式化所述一個(gè)或一個(gè)以上所接收的消息166以產(chǎn)生經(jīng)編碼的語(yǔ)音信號(hào)172。舉例來(lái)說(shuō),所述經(jīng)編碼的語(yǔ)音信號(hào)172可包含音調(diào)滯后、經(jīng)量化LPC系數(shù)和/或經(jīng)量化增益。可將所述經(jīng)編碼的語(yǔ)音信號(hào)172提供到解碼器174 (例如,LPC解碼器),所述解碼器可解碼(例如,合成)所述經(jīng)編碼的語(yǔ)音信號(hào)172以便產(chǎn)生經(jīng)合成的語(yǔ)音信號(hào)176??墒褂脫Q能器(例如,揚(yáng)聲器)將所述經(jīng)合成的語(yǔ)音信號(hào)176轉(zhuǎn)換為聲學(xué)信號(hào)(例如,輸出)。應(yīng)注意,所述電子裝置B168對(duì)于本文中所揭示的系統(tǒng)和方法的使用來(lái)說(shuō)不是必要的,而是被說(shuō)明為其中可使用本文中所揭示的系統(tǒng)和方法的一個(gè)可能配置的一部分。在另一配置中,可將音調(diào)滯后142、經(jīng)量化LPC系數(shù)116和/或經(jīng)量化增益158 (例如,經(jīng)編碼的語(yǔ)音信號(hào))提供到解碼器162 (在電子裝置A102上)。解碼器162可使用音調(diào)滯后142、經(jīng)量化LPC系數(shù)116和/或經(jīng)量化增益158來(lái)產(chǎn)生經(jīng)合成的語(yǔ)音信號(hào)164。舉例來(lái)說(shuō),可使用揚(yáng)聲器輸出經(jīng)合成的語(yǔ)音信號(hào)164。舉例來(lái)說(shuō),電子裝置A102可為數(shù)字話(huà)音記錄器,其編碼語(yǔ)音信號(hào)106并將之存儲(chǔ)在存儲(chǔ)器中,所述語(yǔ)音信號(hào)106可接著被解碼以產(chǎn)生經(jīng)合成的語(yǔ)音信號(hào)164??墒褂脫Q能器(例如,揚(yáng)聲器)將經(jīng)合成的語(yǔ)音信號(hào)164轉(zhuǎn)換為聲學(xué)信號(hào)(例如,輸出)。應(yīng)注意,解碼器162并不是根據(jù)本文中所揭示的系統(tǒng)和方法來(lái)估計(jì)音調(diào)滯后所必要的,而是被說(shuō)明為其中可使用本文中所揭示的系統(tǒng)和方法的一個(gè)可能配置的一部分。電子裝置A102上的解碼器162與電子裝置B168上的解碼器174可執(zhí)行相似功倉(cāng)泛。
圖2為說(shuō)明用于估計(jì)音調(diào)滯后的方法200的一個(gè)配置的流程圖。舉例來(lái)說(shuō),電子裝置102可執(zhí)行圖2中所說(shuō)明的方法200以便估計(jì)語(yǔ)音信號(hào)106的幀110中的音調(diào)滯后。電子裝置102可獲得(202)當(dāng)前幀110。在一個(gè)配置中,電子裝置102可通過(guò)使用麥克風(fēng)俘獲聲學(xué)語(yǔ)音信號(hào)來(lái)獲得(202)電子語(yǔ)音信號(hào)106。另外或替代地,電子裝置102可從另一裝置接收語(yǔ)音信號(hào)106。電子裝置102可接著將語(yǔ)音信號(hào)106分段成一個(gè)或一個(gè)以上幀110。舉例來(lái)說(shuō),幀110可包括具有10到20毫秒的持續(xù)時(shí)間的若干個(gè)樣本。電子裝置102可使用當(dāng)前幀110和在當(dāng)前幀110之前的信號(hào)執(zhí)行(204)線(xiàn)性預(yù)測(cè)分析以獲得線(xiàn)性預(yù)測(cè)(例如,LPC)系數(shù)集合120。舉例來(lái)說(shuō),電子裝置102可使用先行緩沖器和含有語(yǔ)音信號(hào)106的在當(dāng)前語(yǔ)音幀110之前的至少一個(gè)樣本的緩沖器來(lái)獲得LPC系數(shù)120。電子裝置102可基于LPC系數(shù)集合120確定(206)經(jīng)量化線(xiàn)性預(yù)測(cè)(例如,LPC)系數(shù)集合116。舉例來(lái)說(shuō),電子裝置102可量化LPC系數(shù)集合120以確定(206)經(jīng)量化LPC系數(shù)集合116。電子裝置102可基于當(dāng)前幀110和經(jīng)量化LPC系數(shù)116獲得(208)殘余信號(hào)114。舉例來(lái)說(shuō),電子裝置102可從幀110移除LPC系數(shù)116(例如,共振峰)的效應(yīng)以獲得(208)殘余信號(hào)114。電子裝置102可基于殘余信號(hào)114確定(210)峰值位置集合。舉例來(lái)說(shuō),電子裝置可搜索LPC殘余信號(hào)114以確定峰值位置集合。舉例來(lái)說(shuō),可依據(jù)時(shí)間和/或樣本編號(hào)來(lái)描述峰值位置。在一個(gè)配置中,電子裝置102可如下確定(210)峰值位置集合。電子裝置102可基于(LPC)殘余信號(hào)114的樣本的絕對(duì)值和預(yù)定窗口信號(hào)計(jì)算包絡(luò)信號(hào)。電子裝置102可接著基于包絡(luò)信號(hào)與包絡(luò)信號(hào)的時(shí)間移位版本之間的差而計(jì)算第一梯度信號(hào)。電子裝置102可基于第一梯度信號(hào)與第一梯度信號(hào)的時(shí)間移位版本之間的差而計(jì)算第二梯度信號(hào)。電子裝置102可接著選擇第二梯度信號(hào)值降低到預(yù)定負(fù)閾值以下的第一位置索引集合。電子裝置102還可通過(guò)消除包絡(luò)值相對(duì)于包絡(luò)中的最大值降低到預(yù)定閾值以下的位置索引來(lái)從第一位置索引集合確定第二位置索引集合。另外,電子裝置102可通過(guò)消除相對(duì)于相鄰位置索引不滿(mǎn)足預(yù)定差閾值的位置索引來(lái)從第二位置索引集合確定第三位置索引集合。位置索引(例如,第一集合、第二集合和/或第三集合)可對(duì)應(yīng)于所確定的峰值集合的位置。電子裝置102可基于峰值位置集合獲得(212)音調(diào)滯后候選者集合132。舉例來(lái)說(shuō),電子裝置102可按遞增次序布置峰值位置集合以產(chǎn)生有序峰值位置集合。電子裝置102可接著計(jì)算有序峰值位置集合中的連續(xù)峰值位置對(duì)之間的距離。所述連續(xù)峰值位置對(duì)之間的距離可為音調(diào)滯后候選者集合132。在一些配置中,電子裝置102可將基于當(dāng)前幀的(LPC)殘余信號(hào)114計(jì)算的第一近似音調(diào)滯后值添加到音調(diào)滯后候選者集合132。在一個(gè)實(shí)例中,電子裝置102可如下計(jì)算或估計(jì)所述第一近似音調(diào)滯后值。電子裝置102可基于當(dāng)前幀110的(LPC)殘余信號(hào)114估計(jì)自相關(guān)性值。電子裝置102可搜索預(yù)定位置范圍內(nèi)的自相關(guān)性值以查找最大值。電子裝置102還可將所述第一近似音調(diào)滯后值設(shè)置或確定為出現(xiàn)最大值所在的位置??蓪⒋说谝唤埔粽{(diào)滯后值添加到音調(diào)滯后候選者集合132。第一近似音調(diào)滯后值可為由典型的音調(diào)估計(jì)自相關(guān)技術(shù)確定的音調(diào)滯后值??稍陬}為“增強(qiáng)型可變速率編解碼器,用于寬帶展頻數(shù)字系統(tǒng)的語(yǔ)音服務(wù)選項(xiàng) 3、68、70 和 73 (Enhanced Variable Rate Codec, Speech Service0ptions3, 68, 70, and73for Wideband Spread Spectrum Digital Systems) ”的 3GPP2 文獻(xiàn)C.S0014D的章節(jié)4.6.3中找到一種實(shí)例估計(jì)技術(shù)。在一些配置中,電子裝置102可進(jìn)一步將基于先前幀的(LPC)殘余信號(hào)114計(jì)算的第二近似音調(diào)滯后值添加到音調(diào)滯后候選者集合132。在一個(gè)實(shí)例中,電子裝置102可如下計(jì)算或估計(jì)第二近似音調(diào)滯后值。電子裝置102可基于先前幀110的(LPC)殘余信號(hào)114估計(jì)自相關(guān)性值。電子裝置102可搜索預(yù)定位置范圍內(nèi)的自相關(guān)性值以查找最大值。電子裝置102還可將所述第二近似音調(diào)滯后值設(shè)置或確定為出現(xiàn)最大值所在的位置。電子裝置102可將此第二近似音調(diào)滯后值添加到音調(diào)滯后候選者集合132。第二近似音調(diào)滯后值可為來(lái)自先前幀的音調(diào)滯后值。電子裝置102可基于音調(diào)滯后候選者集合132估計(jì)(214)音調(diào)滯后142。在一個(gè)配置中,電子裝置102可使用平滑或平均算法來(lái)估計(jì)(214)音調(diào)滯后142。舉例來(lái)說(shuō),音調(diào)滯后確定塊/模塊138可計(jì)算所有音調(diào)滯后候選者132的平均值以產(chǎn)生所估計(jì)的音調(diào)滯后142。在另一配置中,電子裝置102可使用迭代修剪算法140來(lái)估計(jì)(214)音調(diào)滯后142。下文給出關(guān)于迭代修剪算法140的更多細(xì)節(jié)。所估計(jì)的音調(diào)滯后142可用以產(chǎn)生經(jīng)合成的激勵(lì)150和/或增益因子154。另外或替代地,所估計(jì)的音調(diào)滯后142可被存儲(chǔ)、發(fā)射且/或提供到解碼器162、174。舉例來(lái)說(shuō),解碼器162、174可使用所估計(jì)的音調(diào)滯后142來(lái)產(chǎn)生經(jīng)合成的語(yǔ)音信號(hào)164、176。圖3為說(shuō)明來(lái)自殘余信號(hào)114的峰值378的一個(gè)實(shí)例的圖。如上文所描述,電子裝置102可使用殘余信號(hào)114來(lái)確定峰值378a位置集合,可從所述峰值378a位置集合確定(峰值間)距離集合380 (例如,音調(diào)滯后候選者集合132)。舉例來(lái)說(shuō),電子裝置102可確定(210)峰值位置集合378a到378d,如上文結(jié)合圖2所描述。電子裝置102還可確定峰值間距離集合380a到380c (例如,音調(diào)滯后候選者132)。應(yīng)注意,舉例來(lái)說(shuō),可以時(shí)間單位或樣本數(shù)目來(lái)指定峰值間距離380a到380c (例如,在連續(xù)峰值378之間)。在一個(gè)配置中,電子裝置102可獲得(212)音調(diào)滯后候選者集合132 (例如,峰值間距離380a到380c),如上文結(jié)合圖2所描述。峰值間距離集合380a到380c或音調(diào)滯后候選者集合132可用以估計(jì)音調(diào)滯后。在圖3中的一組軸上說(shuō)明峰值間距離集合380a到380c,其中以毫秒時(shí)間來(lái)說(shuō)明橫軸,且縱軸描繪波形的振幅(例如,信號(hào)振幅)。舉例來(lái)說(shuō),所說(shuō)明的信號(hào)振幅可為電壓、電流或壓力變化。圖4為說(shuō)明用于估計(jì)音調(diào)滯后的方法400的另一配置的流程圖。電子裝置102可獲得(402)語(yǔ)音信號(hào)106。舉例來(lái)說(shuō),電子裝置102可從另一裝置接收語(yǔ)音信號(hào)106且/或使用麥克風(fēng)俘獲語(yǔ)音信號(hào)106。電子裝置102可基于語(yǔ)音信號(hào)獲得(404)音調(diào)滯后候選者集合。舉例來(lái)說(shuō),電子裝置102可根據(jù)此項(xiàng)技術(shù)中已知的任何方法來(lái)獲得(404)音調(diào)滯后候選者集合?;蛘?,電子裝置102可根據(jù)本文中所揭示的系統(tǒng)和方法來(lái)獲得(404)音調(diào)滯后候選者集合132,如上文結(jié)合圖2所描述。電子裝置102可確定(406)對(duì)應(yīng)于音調(diào)滯后候選者集合132的置信測(cè)度集合136。在一個(gè)實(shí)例中,置信測(cè)度集合136可為相關(guān)性集合。舉例來(lái)說(shuō),電子裝置102可基于信號(hào)包絡(luò)和有序峰值位置集合中的連續(xù)峰值位置對(duì)計(jì)算對(duì)應(yīng)于音調(diào)滯后候選者集合132的相關(guān)性集合。在一個(gè)配置中,電子裝置102可如下計(jì)算相關(guān)性集合。對(duì)于有序峰值位置集合中的每一對(duì)峰值位置,電子裝置102可基于圍繞所述對(duì)峰值位置中的第一峰值位置的預(yù)定范圍選擇第一信號(hào)緩沖器。電子裝置102還可基于圍繞所述對(duì)峰值位置中的第二峰值位置的預(yù)定范圍選擇第二信號(hào)緩沖器。接著,電子裝置102可計(jì)算第一信號(hào)緩沖器與第二信號(hào)緩沖器之間的經(jīng)正規(guī)化的交叉相關(guān)性??蓪⒋私?jīng)正規(guī)化的交叉相關(guān)性添加到置信測(cè)度集合136或相關(guān)性集合??舍槍?duì)有序峰值位置集合中的每一對(duì)峰值位置進(jìn)行此過(guò)程。在一些配置中,電子裝置102可將基于當(dāng)前幀110的(LPC)殘余信號(hào)114計(jì)算的第一近似音調(diào)滯后值添加到音調(diào)滯后候選者集合132。電子裝置102還可將對(duì)應(yīng)于第一近似音調(diào)滯后值的第一音調(diào)增益添加到置信測(cè)度集合136或相關(guān)性集合。在一個(gè)實(shí)例中,電子裝置102可如下計(jì)算或估計(jì)第一近似音調(diào)滯后值和對(duì)應(yīng)的第一音調(diào)增益值。電子裝置102可基于當(dāng)前幀110的(LPC)殘余信號(hào)114估計(jì)自相關(guān)性值。電子裝置102可搜索預(yù)定位置范圍內(nèi)的自相關(guān)性值以查找最大值。電子裝置102還可將第一近似音調(diào)滯后值設(shè)置或確定為出現(xiàn)最大值所在的位置,且/或?qū)⒌谝灰粽{(diào)增益值設(shè)置或確定為所述音調(diào)滯后處的經(jīng)正規(guī)化的自相關(guān)性。電子裝置102可將基于先前幀110的(LPC)殘余信號(hào)114計(jì)算的第二近似音調(diào)滯后值添加到音調(diào)滯后候選者集合132。電子裝置102可進(jìn)一步將對(duì)應(yīng)于第二近似音調(diào)滯后值的第二音調(diào)增益添加到置信測(cè)度集合136或相關(guān)性集合。在一個(gè)配置中,電子裝置102可如下計(jì)算或估計(jì)第二近似音調(diào)滯后值和對(duì)應(yīng)的第二音調(diào)增益值。電子裝置102可基于先前幀110的(LPC)殘余信號(hào)114估計(jì)自相關(guān)性值。電子裝置102可搜索預(yù)定位置范圍內(nèi)的自相關(guān)性值以查找最大值。電子裝置102還可將第二近似音調(diào)滯后值設(shè)置或確定為出現(xiàn)最大值所在的位置,且/或?qū)⒌诙粽{(diào)增益值設(shè)置或確定為所述音調(diào)滯后處的經(jīng)正規(guī)化的自相關(guān)性。電子裝置102可使用迭代修剪算法基于音調(diào)滯后候選者集合和置信測(cè)度集合136估計(jì)(408)音調(diào)滯后。在迭代修剪算法的一個(gè)實(shí)例中,電子裝置102可基于音調(diào)滯后候選者集合132和置信測(cè)度集合136來(lái)計(jì)算經(jīng)加權(quán)均值。電子裝置102可確定音調(diào)滯后候選者集合132中的最遠(yuǎn)離經(jīng)加權(quán)均值的音調(diào)滯后候選者。電子裝置102可接著從音調(diào)滯后候選者集合132中移除最遠(yuǎn)離經(jīng)加權(quán)均值的音調(diào)滯后候選者??蓮闹眯艤y(cè)度集合136中移除對(duì)應(yīng)于所移除的音調(diào)滯后候選者的置信測(cè)度。可重復(fù)此過(guò)程,直到所剩余的音調(diào)滯后候選者132的數(shù)目減小到指定數(shù)目為止??山又谒鲆粋€(gè)或一個(gè)以上剩余的音調(diào)滯后候選者132來(lái)確定音調(diào)滯后142。舉例來(lái)說(shuō),如果僅剩余一個(gè)音調(diào)滯后候選者,則可將所剩余的最后一個(gè)音調(diào)滯后候選者確定為音調(diào)滯后。舉例來(lái)說(shuō),如果剩余一個(gè)以上音調(diào)滯后候選者,則電子裝置102可將音調(diào)滯后142確定為所剩余的候選者的平均值。圖5為說(shuō)明用于估計(jì)音調(diào)滯后的方法500的較特定配置的流程圖。電子裝置102可獲得(502)當(dāng)前幀110。在一個(gè)配置中,電子裝置102可通過(guò)使用麥克風(fēng)俘獲聲學(xué)語(yǔ)音信號(hào)來(lái)獲得(502)電子語(yǔ)音信號(hào)106。另外或替代地,電子裝置102可從另一裝置接收語(yǔ)音信號(hào)106。電子裝置102可接著將所述語(yǔ)音信號(hào)106分段成一個(gè)或一個(gè)以上幀110。電子裝置102可使用當(dāng)前幀110和在當(dāng)前幀110之前的信號(hào)執(zhí)行(504)線(xiàn)性預(yù)測(cè)分析以獲得線(xiàn)性預(yù)測(cè)(例如,LPC)系數(shù)集合120。舉例來(lái)說(shuō),電子裝置102可使用先行緩沖器和含有語(yǔ)音信號(hào)106的在當(dāng)前語(yǔ)音幀110之前的至少一個(gè)樣本的緩沖器來(lái)獲得LPC系數(shù)120。電子裝置102可基于LPC系數(shù)集合120確定(506)經(jīng)量化LPC系數(shù)集合116。舉例來(lái)說(shuō),電子裝置102可量化LPC系數(shù)集合120以確定(506)經(jīng)量化LPC系數(shù)集合116。電子裝置102可基于當(dāng)前幀110和經(jīng)量化LPC系數(shù)116獲得(508)殘余信號(hào)114。舉例來(lái)說(shuō),電子裝置102可從幀110移除LPC系數(shù)116(例如,共振峰)的效應(yīng)以獲得(508)殘余信號(hào)114。電子裝置102可基于殘余信號(hào)114確定(510)峰值位置集合。舉例來(lái)說(shuō),電子裝置可搜索LPC殘余信號(hào)114以確定峰值位置集合。舉例來(lái)說(shuō),可依據(jù)時(shí)間和/或樣本編號(hào)來(lái)描述峰值位置。在一個(gè)配置中,電子裝置102可如下確定(510)峰值位置集合。電子裝置102可基于(LPC)殘余信號(hào)114的樣本的絕對(duì)值和預(yù)定窗口信號(hào)計(jì)算包絡(luò)信號(hào)。電子裝置102可接著基于包絡(luò)信號(hào)與包絡(luò)信號(hào)的時(shí)間移位版本之間的差而計(jì)算第一梯度信號(hào)。電子裝置102可基于第一梯度信號(hào)與第一梯度信號(hào)的時(shí)間移位版本之間的差而計(jì)算第二梯度信號(hào)。電子裝置102可接著選擇第二梯度信號(hào)值降低到預(yù)定負(fù)閾值以下的第一位置索引集合。電子裝置102還可通過(guò)消除包絡(luò)值相對(duì)于包絡(luò)中的最大值降低到預(yù)定閾值以下的位置索引來(lái)從第一位置索引集合確定第二位置索引集合。另外,電子裝置102可通過(guò)消除相對(duì)于相鄰位置索引不為預(yù)定差閾值的位置索引來(lái)從第二位置索引集合確定第三位置索引集合。位置索引(例如,第一集合、第二集合和/或第三集合)可對(duì)應(yīng)于所確定的峰值集合的位置。電子裝置102可基于峰值位置集合`獲得(512)音調(diào)滯后候選者集合132。舉例來(lái)說(shuō),電子裝置102可按遞增次序布置峰值位置集合以產(chǎn)生有序峰值位置集合。電子裝置102可接著計(jì)算有序峰值位置集合中的連續(xù)峰值位置對(duì)之間的距離。所述連續(xù)峰值位置對(duì)之間的距離可為音調(diào)滯后候選者集合132。電子裝置102可確定(514)對(duì)應(yīng)于音調(diào)滯后候選者集合132的置信測(cè)度集合136。在一個(gè)實(shí)例中,置信測(cè)度集合136可為相關(guān)性集合。舉例來(lái)說(shuō),電子裝置102可基于信號(hào)包絡(luò)和有序峰值位置集合中的連續(xù)峰值位置對(duì)計(jì)算對(duì)應(yīng)于音調(diào)滯后候選者集合132的相關(guān)性集合。在一個(gè)配置中,電子裝置102可如下計(jì)算相關(guān)性集合。對(duì)于有序峰值位置集合中的每一對(duì)峰值位置,電子裝置102可基于圍繞所述對(duì)峰值位置中的第一峰值位置的預(yù)定范圍選擇第一信號(hào)緩沖器。電子裝置102還可基于圍繞所述對(duì)峰值位置中的第二峰值位置的預(yù)定范圍選擇第二信號(hào)緩沖器。接著,電子裝置102可計(jì)算第一信號(hào)緩沖器與第二信號(hào)緩沖器之間的經(jīng)正規(guī)化的交叉相關(guān)性??蓪⒋私?jīng)正規(guī)化的交叉相關(guān)性添加到置信測(cè)度集合136或相關(guān)性集合。可針對(duì)有序峰值位置集合中的每一對(duì)峰值位置進(jìn)行此過(guò)程。電子裝置102可將基于當(dāng)前幀110的(LPC)殘余信號(hào)114計(jì)算的第一近似音調(diào)滯后值添加(516)到音調(diào)滯后候選者集合132。電子裝置102還可將對(duì)應(yīng)于第一近似音調(diào)滯后值的第一音調(diào)增益添加(518)到置信測(cè)度集合136或相關(guān)性集合。在一個(gè)實(shí)例中,電子裝置102可如下計(jì)算或估計(jì)第一近似音調(diào)滯后值和對(duì)應(yīng)的第一音調(diào)增益值。電子裝置102可基于當(dāng)前幀110的(LPC)殘余信號(hào)114估計(jì)自相關(guān)性值。電子裝置102可搜索預(yù)定位置范圍內(nèi)的自相關(guān)性值以查找最大值。電子裝置102還可將第一近似音調(diào)滯后值設(shè)置或確定為出現(xiàn)最大值所在的位置,且/或?qū)⒌谝灰粽{(diào)增益值設(shè)置或確定為所述音調(diào)滯后處的經(jīng)正規(guī)化的自相關(guān)性。
電子裝置102可將基于先前幀110的(LPC)殘余信號(hào)114計(jì)算的第二近似音調(diào)滯后值添加(520)到音調(diào)滯后候選者集合132。電子裝置102可進(jìn)一步將對(duì)應(yīng)于第二近似音調(diào)滯后值的第二音調(diào)增益添加(522)到置信測(cè)度集合136或相關(guān)性集合。在一個(gè)配置中,電子裝置102可如下計(jì)算或估計(jì)第二近似音調(diào)滯后值和對(duì)應(yīng)的第二音調(diào)增益值。電子裝置102可基于先前幀110的(LPC)殘余信號(hào)114估計(jì)自相關(guān)性值。電子裝置102可搜索預(yù)定位置范圍內(nèi)的自相關(guān)性值以查找最大值。舉例來(lái)說(shuō),所述預(yù)定位置范圍可為20到140,其為在8千赫茲(kHz)取樣速率下用于人類(lèi)語(yǔ)音的典型的音調(diào)滯后范圍。電子裝置102還可將第二近似音調(diào)滯后值設(shè)置或確定為出現(xiàn)最大值所在的位置,且/或?qū)⒌诙粽{(diào)增益值設(shè)置或確定為所述音調(diào)滯后處的經(jīng)正規(guī)化的自相關(guān)性。電子裝置102可使用迭代修剪算法140基于音調(diào)滯后候選者集合132和置信測(cè)度集合136估計(jì)(524)音調(diào)滯后。在迭代修剪算法140的一個(gè)實(shí)例中,電子裝置102可基于音調(diào)滯后候選者集合132和置信測(cè)度集合136來(lái)計(jì)算經(jīng)加權(quán)均值。電子裝置102可確定音調(diào)滯后候選者集合132中的最遠(yuǎn)離經(jīng)加權(quán)均值的音調(diào)滯后候選者。電子裝置102可接著從音調(diào)滯后候選者集合132中移除最遠(yuǎn)離經(jīng)加權(quán)均值的音調(diào)滯后候選者??蓮闹眯艤y(cè)度集合136中移除對(duì)應(yīng)于所移除的音調(diào)滯后候選者的置信測(cè)度??芍貜?fù)此過(guò)程,直到所剩余的音調(diào)滯后候選者132的數(shù)目減小到指定數(shù)目為止??山又谒鲆粋€(gè)或一個(gè)以上剩余的音調(diào)滯后候選者132來(lái)確定音調(diào)滯后142。舉例來(lái)說(shuō),如果僅剩余一個(gè)音調(diào)滯后候選者,則可將所剩余的最后一個(gè)音調(diào)滯后候選者確定為音調(diào)滯后。舉例來(lái)說(shuō),如果剩余一個(gè)以上音調(diào)滯后候選者,則電子裝置102可將音調(diào)滯后142確定為所剩余的候選者的平均值。使用圖5中所說(shuō)明的方法500可為有益的,尤其是對(duì)于瞬時(shí)幀和其它種類(lèi)的幀,其中傳統(tǒng)的音調(diào)滯后估計(jì)可能不是非常準(zhǔn)確的。然而,圖5中所說(shuō)明的方法500可應(yīng)用于其它類(lèi)別或種類(lèi)的幀(例如,性質(zhì)良好的話(huà)音或語(yǔ)音幀)。在一些配置中,圖5中所說(shuō)明的方法500可選擇性地應(yīng)用于某些種類(lèi)的幀(例如,瞬時(shí)和/或有噪聲幀,等)。圖6為說(shuō)明用于使用迭代修剪算法140估計(jì)音調(diào)滯后的方法600的一個(gè)配置的流程圖。在一個(gè)配置中,可如下指定修`剪算法140。修剪算法140可使用音調(diào)滯后候選者集合132 (表示為{dj)和置信測(cè)度(例如,相關(guān)性)集合136 (表示為IcJ )。i=l,...,L,其中L為音調(diào)滯后候選者的數(shù)目,且L>N。N為可表示將在修剪之后剩余的音調(diào)滯后候選者的所要數(shù)目的指定數(shù)目。在一個(gè)配置中,N=I。電子裝置102可基于音調(diào)滯后候選者集合132 {dj和置信測(cè)度(例如,相關(guān)性)集合136 IcJ計(jì)算(602)經(jīng)加權(quán)均值(表示為1)。這可針對(duì)L個(gè)候選者來(lái)進(jìn)行,如方程式
(I)中所說(shuō)明。
EdiciM =—{^(U
i=l電子裝置102可確定(604)音調(diào)滯后候選者集合132中的最遠(yuǎn)離經(jīng)加權(quán)均值的音調(diào)滯后候選者(表示為dk)。舉例來(lái)說(shuō),電子裝置102可找到dk,使得dk的距均值的距離大于所有其它音調(diào)滯后候選者的距均值的距離。在方程式(2)中說(shuō)明此過(guò)程的一個(gè)實(shí)例。
找到dk,使得對(duì)于所有 i (i 關(guān) k),I Mw-dk I > I Mw-Cli I (2)電子裝置102可從音調(diào)滯后候選者集合132 {dj中移除(606)(例如,“修剪”)最遠(yuǎn)離經(jīng)加權(quán)均值的音調(diào)滯后候選者dk。電子裝置可從置信測(cè)度(例如,相關(guān)性)集合136 {Ci}中移除(608)對(duì)應(yīng)于最遠(yuǎn)離經(jīng)加權(quán)均值的音調(diào)滯后候選者的置信測(cè)度(例如,相關(guān)性)ck??蓪⑹S嘁粽{(diào)滯后候選者數(shù)目(例如,L的值)減小I (舉例來(lái)說(shuō),當(dāng)從其集合132移除(606)音調(diào)滯后候選者時(shí)和/或當(dāng)從其集合136移除置信測(cè)度時(shí))。舉例來(lái)說(shuō),L=L-1。電子裝置102可確定(610)剩余音調(diào)滯后候選者數(shù)目(例如,L)是否等于指定數(shù)目(例如,N)。舉例來(lái)說(shuō),電子裝置102可確定是否存在等于指定數(shù)目的一個(gè)或一個(gè)以上剩余音調(diào)滯后候選者(例如,L=N=I)。如果存在超過(guò)指定數(shù)目的剩余音調(diào)滯后候選者,則電子裝置102可返回到計(jì)算(602)經(jīng)加權(quán)均值以便找到并移除最遠(yuǎn)離經(jīng)加權(quán)均值的候選者。換句話(huà)說(shuō),可反復(fù)或重復(fù)進(jìn)行所述方法600中的前四個(gè)步驟602、604、606、608,直到剩余音調(diào)滯后候選者數(shù)目被減小到指定數(shù)目為止。如果剩余候選者數(shù)目(例如,L)等于指定數(shù)目(例如,N),則電子裝置102可基于所述一個(gè)或一個(gè)以上剩余音調(diào)滯后候選者(在音調(diào)滯后候選者集合132中)確定(612)音調(diào)滯后。舉例來(lái)說(shuō),在指定數(shù)目(例如,N)為一的情況下,則可將最后一個(gè)剩余音調(diào)滯后候選者確定(612)為音調(diào)滯后142。在另一實(shí)例中,如果指定數(shù)目(例如,N)大于一,則電子裝置102可將音調(diào)滯后142確定¢12)為剩余音調(diào)滯后候選者的平均值(例如,所述集合IdJ中的N個(gè)剩余音調(diào)滯后候選者的平均值)。圖7為說(shuō)明其中可實(shí)施用于估計(jì)音調(diào)滯后的系統(tǒng)和方法的編碼器704的一個(gè)配置的框圖。編碼器704的一個(gè)實(shí)例為線(xiàn)性預(yù)測(cè)譯碼(LPC)編碼器。編碼器704可由電子裝置用以編碼語(yǔ)音信號(hào)706。舉例來(lái)說(shuō),編碼器704通過(guò)估計(jì)或產(chǎn)生參數(shù)集合來(lái)將語(yǔ)音信號(hào)706編碼成“經(jīng)壓縮”格式。在一個(gè)配置中,這些參數(shù)可包括音調(diào)滯后742 (估計(jì))、一個(gè)或一個(gè)以上經(jīng)量化增益758和/或經(jīng)量化LPC系數(shù)716。這些參數(shù)可用以合成所述語(yǔ)音信號(hào)706。編碼器704可包括一個(gè)或一個(gè)以上塊/模塊,其可用以根據(jù)本文中所揭示的系統(tǒng)和方法來(lái)估計(jì)音調(diào)滯后。在一個(gè)`配置中,這些塊/模塊可被稱(chēng)為音調(diào)估計(jì)塊/模塊726。應(yīng)注意,可以多種方式實(shí)施音調(diào)估計(jì)塊/模塊726。舉例來(lái)說(shuō),音調(diào)估計(jì)塊/模塊726可包含峰值搜索塊/模塊728、置信測(cè)度塊/模塊734和/或音調(diào)滯后確定塊/模塊738。在其它配置中,音調(diào)估計(jì)塊/模塊726可省略這些塊/模塊728、734、738中的一者或一者以上或用其它塊/模塊替代這些塊/模塊728、734、738中的一者或一者以上。另外或替代地,音調(diào)估計(jì)塊/模塊726可被定義為包括其它塊/模塊,例如線(xiàn)性預(yù)測(cè)譯碼(LPC)分析塊/模塊 722。在圖7所說(shuō)明的實(shí)例中,編碼器704包括峰值搜索塊/模塊728、置信測(cè)度塊/模塊734和音調(diào)滯后確定塊/模塊738。然而,峰值搜索塊/模塊728和/或置信測(cè)度塊/模塊734可為任選的,且可用確定一個(gè)或一個(gè)以上音調(diào)(例如,音調(diào)滯后)候選者732和/或置信測(cè)度736的一個(gè)或一個(gè)以上其它塊/模塊替代。如圖7中所說(shuō)明,音調(diào)滯后確定塊/模塊738可使用迭代修剪算法740。然而,迭代修剪算法740可為任選的,且可在本文中所揭示的系統(tǒng)和方法的一些配置中省略。換句話(huà)說(shuō),音調(diào)滯后確定塊/模塊738可在一些配置中在不使用迭代修剪算法740的情況下確定音調(diào)滯后,且舉例來(lái)說(shuō),可使用某種其它方法或算法(例如平滑或平均算法)來(lái)確定音調(diào)滯后742???例如,由電子裝置)獲得語(yǔ)音信號(hào)706??蓪⒄Z(yǔ)音信號(hào)706提供到成幀塊/模塊708。成幀塊/模塊708可將語(yǔ)音信號(hào)706分段成一個(gè)或一個(gè)以上幀710。舉例來(lái)說(shuō),幀710可包括特定數(shù)目的語(yǔ)音信號(hào)706樣本且/或包括某一時(shí)間量(例如,10到20毫秒)的語(yǔ)音信號(hào)706。當(dāng)語(yǔ)音信號(hào)706被分段成多個(gè)幀710時(shí),可根據(jù)其含有的信號(hào)來(lái)對(duì)幀710進(jìn)行分類(lèi)。舉例來(lái)說(shuō),幀710可為濁音幀、清音幀、靜音幀或瞬時(shí)幀。本文中所揭示的系統(tǒng)和方法可用以估計(jì)幀710 (例如,瞬時(shí)幀、濁音幀等)中的音調(diào)滯后。舉例來(lái)說(shuō),瞬時(shí)幀可位于一個(gè)語(yǔ)音類(lèi)別與另一語(yǔ)音類(lèi)別之間的邊界上。舉例來(lái)說(shuō),語(yǔ)音信號(hào)706可從清音(例如,f、s、sh、th等)轉(zhuǎn)變成池音(例如,a、e、1、O、u等)。一些瞬時(shí)類(lèi)型包括上升瞬時(shí)(例如,當(dāng)從語(yǔ)音信號(hào)706的清音部分轉(zhuǎn)變到濁音部分時(shí))、爆破音、濁音瞬時(shí)(例如,線(xiàn)性預(yù)測(cè)譯碼(LPC)改變和音調(diào)滯后變化)和下降瞬時(shí)(例如,當(dāng)從語(yǔ)音信號(hào)706的濁音部分轉(zhuǎn)變到清音或靜音部分(例如,詞結(jié)尾)時(shí))。在兩個(gè)語(yǔ)音類(lèi)別之間的幀710可為瞬時(shí)幀。本文中所揭示的系統(tǒng)和方法可有益地應(yīng)用于瞬時(shí)幀,因?yàn)閭鹘y(tǒng)方法可能不會(huì)提供瞬時(shí)幀中準(zhǔn)確的音調(diào)滯后估計(jì)。然而,應(yīng)注意,本文中所揭示的系統(tǒng)和方法可應(yīng)用于其它種類(lèi)的幀。編碼器704可使用線(xiàn)性預(yù)測(cè)譯碼(LPC)分析塊/模塊722來(lái)對(duì)幀710執(zhí)行線(xiàn)性預(yù)測(cè)分析(例如,LPC分析)。應(yīng)注意,LPC分析塊/模塊722可另外或替代地使用來(lái)自其它幀710 (例如,來(lái)自先前幀710)的信號(hào)(例如,一個(gè)或一個(gè)以上樣本)。LPC分析塊/模塊722可產(chǎn)生一個(gè)或一個(gè)以上LPC系數(shù)720??蓪PC系數(shù)720提供到量化塊/模塊718且/或提供到LPC合成塊/模塊798。量化塊/模塊718可產(chǎn)生一個(gè)或一個(gè)以上經(jīng)量化LPC系數(shù)716。可將經(jīng)量化LPC系數(shù)716提供到比例因子確定塊/模塊752,且/或可從編碼器704輸出經(jīng)量化LPC系數(shù)716??蓪⒔?jīng)量化LPC系數(shù)716和來(lái)自一個(gè)或一個(gè)以上幀710的一個(gè)或一個(gè)以上樣本提供到殘余確定塊/模塊712,其可用以確定殘余信號(hào)714。舉例來(lái)說(shuō),殘余信號(hào)714可包括已使共振峰(例如,經(jīng)量化系數(shù)716)或共振峰的效應(yīng)從語(yǔ)音信號(hào)706移除(由殘余確定塊/模塊712)的語(yǔ)音信號(hào)706的幀710??蓪堄嘈盘?hào)714提供到規(guī)則化塊/模塊794。規(guī)則化塊/模塊794可使殘余信號(hào)714規(guī)則化,從而產(chǎn)生經(jīng)修改的(例如,經(jīng)規(guī)則化的)殘余信號(hào)796。規(guī)則化的一個(gè)實(shí)例在題為“增強(qiáng)型可變速率編解碼器,用于寬帶展頻數(shù)字系統(tǒng)的語(yǔ)音服務(wù)選項(xiàng) 3、68、70 和 73 (Enhanced Variable Rate Codec, Speech Service0ptions3, 68, 70, and73for Wideband Spread Spectrum Digital Systems)” 的 3GPP2 文獻(xiàn)C.S0014D的章節(jié)4.11.6中詳細(xì)描述。基本上,規(guī)則化可使當(dāng)前幀中的音調(diào)脈沖來(lái)回移動(dòng)以將其與平滑演進(jìn)的音調(diào)輪廓對(duì)齊??蓪⑺鼋?jīng)修改的殘余信號(hào)796提供到峰值搜索塊/模塊728且/或提供到LPC合成塊/模塊798。LPC合成塊/模塊798可產(chǎn)生(例如,合成)經(jīng)修改的語(yǔ)音信號(hào)701,其可被提供到比例因子確定塊/模塊752。峰值搜索塊/模塊728可搜索以查找經(jīng)修改的殘余信號(hào)796中的峰值。換句話(huà)說(shuō),編碼器704可搜索以查找經(jīng)修改的殘余信號(hào)796中的峰值(例如,高能量的區(qū)域)??勺R(shí)別這些峰值以獲得峰值位置集合707。舉例來(lái)說(shuō),可依據(jù)樣本編號(hào)和/或時(shí)間來(lái)指定峰值位置集合707中的峰值位置。在一些配置中,峰值搜索塊/模塊可將峰值位置集合707提供到一個(gè)或一個(gè)以上塊/模塊,例如比例因子確定塊/模塊752和/或峰值映射塊/模塊703。舉例來(lái)說(shuō),峰值位置集合707可表示經(jīng)修改的殘余信號(hào)796中的“實(shí)際”峰值的位置。峰值搜索塊/模塊728可包括候選者確定塊/模塊730。候選者確定塊/模塊730可使用峰值集合以便確定一個(gè)或一個(gè)以上候選音調(diào)滯后732?!耙粽{(diào)滯后”可為幀710中的兩個(gè)連續(xù)音調(diào)尖峰之間的“距離”。舉例來(lái)說(shuō),可以樣本數(shù)目和/或時(shí)間量來(lái)指定音調(diào)滯后。在一個(gè)配置中,峰值搜索塊/模塊728可確定峰值之間的距離以便確定音調(diào)滯后候選者732。舉例來(lái)說(shuō),這可通過(guò)采用兩個(gè)峰值位置(例如,按時(shí)間和/或樣本編號(hào))的差來(lái)進(jìn)行。用于估計(jì)音調(diào)滯后的一些傳統(tǒng)方法使用自相關(guān)。在那些方法中,使LPC殘余抵靠著其自身滑動(dòng)以進(jìn)行相關(guān)。可在那些方法中將具有最大自相關(guān)性值的任何相關(guān)性或音調(diào)滯后確定為幀的音調(diào)。那些方法可在語(yǔ)音幀非常穩(wěn)定時(shí)起作用。然而,存在其中音調(diào)結(jié)構(gòu)可能不非常穩(wěn)定的其它幀,例如在瞬時(shí)幀中。即使當(dāng)語(yǔ)音幀為穩(wěn)定的時(shí),傳統(tǒng)方法也可能歸因于系統(tǒng)中的噪聲而不會(huì)提供非常準(zhǔn)確的音調(diào)估計(jì)。噪聲可減小殘余的“有峰”程度。在此情況下,舉例來(lái)說(shuō),傳統(tǒng)方法可確定不是非常準(zhǔn)確的音調(diào)估計(jì)。峰值搜索塊/模塊728可使用相關(guān)方法獲得音調(diào)滯后候選者集合732。舉例來(lái)說(shuō),可首先由候選者確定塊/模塊730確定候選音調(diào)滯后集合732。接著,可由置信測(cè)度塊/模塊734基于音調(diào)滯后候選者集合732確定對(duì)應(yīng)于所述候選音調(diào)滯后集合的置信測(cè)度集合736。更具體來(lái)說(shuō),第一集合可為音調(diào)滯后候選者集合732,且第二集合可為用于音調(diào)滯后候選者732中的每一者的置信測(cè)度集合736。因此,舉例來(lái)說(shuō),第一置信測(cè)度或值可對(duì)應(yīng)于第一音調(diào)滯后候選者,等等。因此,可“構(gòu)建”或確定音調(diào)滯后候選者集合732和置信測(cè)度集合736。置信測(cè)度集合736可用以改進(jìn)所估計(jì)的音調(diào)滯后742的準(zhǔn)確性。在一個(gè)配置中,置信測(cè)度集合736可為相關(guān)性集合,其中每一值可為(在基礎(chǔ)方面中)對(duì)應(yīng)于音調(diào)滯后候選者的音調(diào)滯后處的相關(guān)性。換句話(huà)說(shuō),用于每一特定音調(diào)滯后的相關(guān)性系數(shù)可構(gòu)成用于音調(diào)滯后候選者732距離中的每一者的置信測(cè)度。在一些配置中,峰值搜索塊/模塊728可將基于當(dāng)前幀710的經(jīng)修改的殘余信號(hào)796計(jì)算的第一近似音調(diào)滯后值添加到音調(diào)滯后候選者集合732。置信測(cè)度塊/模塊734還可將對(duì)應(yīng)于第一近似音調(diào)滯后值的第一音調(diào)增益添加到置信測(cè)度集合736或相關(guān)性集合。在一個(gè)實(shí)例中,峰值搜索塊/模塊728可如下計(jì)算或估計(jì)第一近似音調(diào)滯后值??苫诋?dāng)前幀710的經(jīng)修改的殘余信號(hào)796來(lái)估計(jì)自相關(guān)性值。峰值搜索塊/模塊728可搜索預(yù)定位置范圍內(nèi)的自相關(guān)性值以查找最大值。峰值搜索塊/模塊728還可將第一近似音調(diào)滯后值設(shè)置或確定為出現(xiàn)最大值所在的位置。第一近似滯后可基于自相關(guān)性函數(shù)中的最大值。第一近似音調(diào)滯后值可作為音調(diào)滯后候選者添加到音調(diào)滯后候選者集合732,且/或可作為峰值位置添加到峰值位置集合707。置信測(cè)度塊/模塊734可將第一音調(diào)增益值(例如,置信測(cè)度)設(shè)置或確定為所述音調(diào)滯后處的經(jīng)正規(guī)化的自相關(guān)性。這可基于由峰值搜索塊/模塊728提供的第一近似音調(diào)滯后值來(lái)進(jìn)行??蓪⒌谝灰粽{(diào)增益值(例如,置信測(cè)度)添加到置信測(cè)度集合736。在一些配置中,峰值搜索塊/模塊728可將基于先前幀710的經(jīng)修改的殘余信號(hào)796計(jì)算的第二近似音調(diào)滯后值添加到音調(diào)滯后候選者集合732。置信測(cè)度塊/模塊734可進(jìn)一步將對(duì)應(yīng)于第二近似音調(diào)滯后值的第二音調(diào)增益添加到置信測(cè)度集合736或相關(guān)性集合。
在一個(gè)實(shí)例中,峰值搜索塊/模塊728可如下計(jì)算或估計(jì)第二近似音調(diào)滯后值??苫谙惹皫?10的經(jīng)修改的殘余信號(hào)796來(lái)估計(jì)自相關(guān)性值。峰值搜索塊/模塊728可搜索預(yù)定位置范圍內(nèi)的自相關(guān)性值以查找最大值。峰值搜索塊/模塊728還可將第二近似音調(diào)滯后值設(shè)置或確定為出現(xiàn)最大值所在的位置。第二近似音調(diào)滯后值可為來(lái)自先前幀的音調(diào)滯后值。第二近似音調(diào)滯后值可作為音調(diào)滯后候選者添加到音調(diào)滯后候選者集合732,且/或可作為峰值位置添加到峰值位置集合707。置信測(cè)度塊/模塊734可將第二音調(diào)增益值(例如,置信測(cè)度)設(shè)置或確定為所述音調(diào)滯后處的經(jīng)正規(guī)化的自相關(guān)性。這可基于由峰值搜索塊/模塊728提供的第二近似音調(diào)滯后值來(lái)進(jìn)行??蓪⒌诙粽{(diào)增益值(例如,置信測(cè)度)添加到置信測(cè)度集合736??蓪⒁粽{(diào)滯后候選者集合732和/或置信測(cè)度集合736提供到音調(diào)滯后確定塊/模塊738。音調(diào)滯后確定塊/模塊738可基于一個(gè)或一個(gè)以上音調(diào)滯后候選者732確定音調(diào)滯后742。在一些配置中,音調(diào)滯后確定塊/模塊738可基于一個(gè)或一個(gè)以上置信測(cè)度736 (除所述一個(gè)或一個(gè)以上音調(diào)滯后候選者732之外)確定音調(diào)滯后742。舉例來(lái)說(shuō),音調(diào)滯后確定塊/模塊738可使用迭代修剪算法740來(lái)選擇所述音調(diào)滯后值中的一者。上文給出關(guān)于迭代修剪算法740的更多細(xì)節(jié)。所選擇的音調(diào)滯后742值可為“真實(shí)”音調(diào)滯后的估計(jì)。在其它配置中,音調(diào)滯后確定塊/模塊738可使用某種其它方法來(lái)確定音調(diào)滯后742。舉例來(lái)說(shuō),代替迭代修剪算法740或除迭代修剪算法740之外,音調(diào)滯后確定塊/模塊738可使用平均或平滑算法??蓪⒂梢粽{(diào)滯后確定塊/模塊738確定的音調(diào)滯后742提供到激勵(lì)合成塊/模塊748和比例因子確定塊/模塊752??蓪?lái)自先前幀710的經(jīng)修改的殘余信號(hào)796提供到激勵(lì)合成塊/模塊748。另外或替代地,可由原型波形產(chǎn)生塊/模塊744將波形746提供到激勵(lì)合成塊/模塊748。在一個(gè)配置中,原型波形產(chǎn)生塊/模塊744可基于音調(diào)滯后742產(chǎn)生波形746。激勵(lì)合成塊/模塊748可基于音調(diào)滯后742、(先前幀)經(jīng)修改的殘余796和/或波形746產(chǎn)生或合成激勵(lì)750。經(jīng)合成的激勵(lì)750可包括經(jīng)合成的激勵(lì)中的峰值的位置。``在一個(gè)配置中,原型波形產(chǎn)生塊/模塊744和/或激勵(lì)合成塊/模塊748可根據(jù)方程式(3)到(5)來(lái)操作。舉例來(lái)說(shuō),原型波形產(chǎn)生塊/模塊744可產(chǎn)生一個(gè)或一個(gè)以上具有長(zhǎng)度PJ例如,音調(diào)滯后742的長(zhǎng)度)的原型波形746。
權(quán)利要求
1.一種用于估計(jì)音調(diào)滯后的電子裝置,其包含: 處理器; 與所述處理器電子通信的存儲(chǔ)器; 存儲(chǔ)在所述存儲(chǔ)器中的指令,所述指令可執(zhí)行以: 獲得當(dāng)前幀; 基于所述當(dāng)前幀獲得殘余信號(hào); 基于所述殘余信號(hào)確定峰值位置集合; 基于所述峰值位置集合獲得音調(diào)滯后候選者集合;以及 基于所述音調(diào)滯后候選者集合估計(jì)音調(diào)滯后。
2.根據(jù)權(quán)利要求 1所述的電子裝置,其中確定峰值位置集合包含: 基于所述殘余信號(hào)的樣本的絕對(duì)值和窗口信號(hào)計(jì)算包絡(luò)信號(hào); 基于所述包絡(luò)信號(hào)與所述包絡(luò)信號(hào)的時(shí)間移位版本之間的差計(jì)算第一梯度信號(hào);基于所述第一梯度信號(hào)與所述第一梯度信號(hào)的時(shí)間移位版本之間的差計(jì)算第二梯度信號(hào); 選擇其中第二梯度信號(hào)值降低到第一閾值以下的第一位置索引集合; 通過(guò)消除其中包絡(luò)值相對(duì)于包絡(luò)中的最大值降低到第二閾值以下的位置索引來(lái)從所述第一位置索引集合確定第二位置索引集合;以及 通過(guò)消除相對(duì)于相鄰位置索引不滿(mǎn)足差閾值的位置索引來(lái)從所述第二位置索引集合確定第三位置索引集合。
3.根據(jù)權(quán)利要求1所述的電子裝置,其中獲得所述音調(diào)滯后候選者集合包含: 以遞增次序布置所述峰值位置集合以產(chǎn)生有序峰值位置集合;以及 計(jì)算所述有序峰值位置集合中的連續(xù)峰值位置對(duì)之間的距離。
4.根據(jù)權(quán)利要求1所述的電子裝置,其中所述指令進(jìn)一步可執(zhí)行以: 使用所述當(dāng)前幀和在所述當(dāng)前幀之前的信號(hào)執(zhí)行線(xiàn)性預(yù)測(cè)分析以獲得線(xiàn)性預(yù)測(cè)系數(shù)集合;以及 基于所述線(xiàn)性預(yù)測(cè)系數(shù)集合確定經(jīng)量化線(xiàn)性預(yù)測(cè)系數(shù)集合。
5.根據(jù)權(quán)利要求4所述的電子裝置,其中獲得所述殘余信號(hào)進(jìn)一步基于所述經(jīng)量化線(xiàn)性預(yù)測(cè)系數(shù)集合。
6.根據(jù)權(quán)利要求1所述的電子裝置,其中所述指令進(jìn)一步可執(zhí)行以計(jì)算對(duì)應(yīng)于所述音調(diào)滯后候選者集合的置信測(cè)度集合。
7.根據(jù)權(quán)利要求6所述的電子裝置,其中計(jì)算對(duì)應(yīng)于所述音調(diào)滯后候選者集合的所述置信測(cè)度集合是基于信號(hào)包絡(luò)和所述峰值位置的有序集合中的連續(xù)峰值位置對(duì)。
8.根據(jù)權(quán)利要求7所述的電子裝置,其中計(jì)算所述置信測(cè)度集合包含對(duì)于所述峰值位置的所述有序集合中的每一對(duì)峰值位置: 基于圍繞一對(duì)峰值位置中的第一峰值位置的范圍選擇第一信號(hào)緩沖器; 基于圍繞所述對(duì)峰值位置中的第二峰值位置的范圍選擇第二信號(hào)緩沖器; 計(jì)算所述第一信號(hào)緩沖器與所述第二信號(hào)緩沖器之間的經(jīng)正規(guī)化的交叉相關(guān)性;以及 將所述經(jīng)正規(guī)化的交叉相關(guān)性添加到所述置信測(cè)度集合。
9.根據(jù)權(quán)利要求6所述的電子裝置,其中所述音調(diào)滯后是使用迭代修剪算法基于所述音調(diào)滯后候選者集合和所述置信測(cè)度集合來(lái)估計(jì)的。
10.根據(jù)權(quán)利要求6所述的電子裝置,其中所述指令進(jìn)一步可執(zhí)行以: 將基于所述當(dāng)前幀的所述殘余信號(hào)計(jì)算的第一近似音調(diào)滯后值添加到所述音調(diào)滯后候選者集合;以及 將對(duì)應(yīng)于所述第一近似音調(diào)滯后值的第一音調(diào)增益添加到所述置信測(cè)度集合。
11.根據(jù)權(quán)利要求10所述的電子裝置,其中所述第一近似音調(diào)滯后值是通過(guò)以下步驟來(lái)估計(jì)的且所述第一音調(diào)增益是通過(guò)以下步驟來(lái)估計(jì)的: 基于所述當(dāng)前幀的所述殘余信號(hào)估計(jì)自相關(guān)性值; 在某一位置范圍內(nèi)搜索所述自相關(guān)性值以查找最大值; 將所述第一近似音調(diào)滯后值設(shè)置為出現(xiàn)所述最大值所在的位置;以及 將所述第一音調(diào)增益值設(shè)置為所述第一近似音調(diào)滯后值處的經(jīng)正規(guī)化的自相關(guān)性。
12.根據(jù)權(quán)利要求10所 述的電子裝置,其中所述指令進(jìn)一步可執(zhí)行以: 將基于先前幀的殘余信號(hào)計(jì)算的第二近似音調(diào)滯后值添加到所述音調(diào)滯后候選者集合;以及 將對(duì)應(yīng)于所述第二近似音調(diào)滯后值的第二音調(diào)增益添加到所述置信測(cè)度集合。
13.根據(jù)權(quán)利要求12所述的電子裝置,其中所述第二近似音調(diào)滯后值是通過(guò)以下步驟來(lái)估計(jì)的且所述第二音調(diào)增益是通過(guò)以下步驟來(lái)估計(jì)的: 基于所述先前幀的所述殘余信號(hào)估計(jì)自相關(guān)性值; 在某一位置范圍內(nèi)搜索所述自相關(guān)性值以查找最大值; 將所述第二近似音調(diào)滯后值設(shè)置為出現(xiàn)所述最大值所在的位置;以及 將所述音調(diào)增益值設(shè)置為所述第二近似音調(diào)滯后值處的經(jīng)正規(guī)化的自相關(guān)性。
14.根據(jù)權(quán)利要求9所述的電子裝置,其中使用迭代修剪算法基于所述音調(diào)滯后候選者集合和所述置信測(cè)度集合估計(jì)所述音調(diào)滯后包含: 使用所述音調(diào)滯后候選者集合和所述置信測(cè)度集合計(jì)算經(jīng)加權(quán)均值; 確定所述音調(diào)滯后候選者集合中的最遠(yuǎn)離所述經(jīng)加權(quán)均值的音調(diào)滯后候選者; 從所述音調(diào)滯后候選者集合中移除最遠(yuǎn)離所述經(jīng)加權(quán)均值的所述音調(diào)滯后候選者;從所述置信測(cè)度集合中移除對(duì)應(yīng)于最遠(yuǎn)離所述經(jīng)加權(quán)均值的所述音調(diào)滯后候選者的置信測(cè)度; 確定剩余音調(diào)滯后候選者數(shù)目是否等于指定數(shù)目;以及 在所述剩余音調(diào)滯后候選者數(shù)目等于所述指定數(shù)目的情況下,基于一個(gè)或一個(gè)以上剩余音調(diào)滯后候選者確定所述音調(diào)滯后。
15.根據(jù)權(quán)利要求14所述的電子裝置,其中所述指令進(jìn)一步可執(zhí)行以在所述剩余音調(diào)滯后候選者數(shù)目不等于所述指定數(shù)目的情況下反復(fù)。
16.根據(jù)權(quán)利要求14所述的電子裝置,其中計(jì)算所述經(jīng)加權(quán)均值是根據(jù)方程式
17.根據(jù)權(quán)利要求14所述的電子裝置,其中確定所述音調(diào)滯后候選者集合中的最遠(yuǎn)離所述經(jīng)加權(quán)均值的音調(diào)滯后候選者是通過(guò)找到dk來(lái)實(shí)現(xiàn)的,使得對(duì)于所有i,|Mw-dk | > | Mw-di|,其中i≠k,其中dk為最遠(yuǎn)離所述經(jīng)加權(quán)均值的所述音調(diào)滯后候選者,Mw為所述經(jīng)加權(quán)均值,{di}為所述音調(diào)滯后候選者集合,且i為索引編號(hào)。
18.根據(jù)權(quán)利要求1所述的電子裝置,其中所述指令進(jìn)一步可執(zhí)行以發(fā)射所述音調(diào)滯后。
19.根據(jù)權(quán)利要求1所述的電子裝置,其中所述電子裝置為無(wú)線(xiàn)通信裝置。
20.一種用于估計(jì)音調(diào)滯后的電子裝置,其包含: 處理器; 與所述處理器電子通信的存儲(chǔ)器; 存儲(chǔ)在所述存儲(chǔ)器中的指令,所述指令可執(zhí)行以: 獲得語(yǔ)音信號(hào); 基于所述語(yǔ)音信號(hào)獲得音調(diào)滯后候選者集合; 確定對(duì)應(yīng)于所述音調(diào)滯后候選者集合的置信測(cè)度集合;以及 使用迭代修剪算法基于所述音調(diào)滯后候選者集合和所述置信測(cè)度集合估計(jì)音調(diào)滯后。
21.根據(jù)權(quán)利要求20所述的電子裝置,其中使用迭代修剪算法基于所述音調(diào)滯后候選者集合和所述置信測(cè)度集合估計(jì)所述音調(diào)滯后包含: 使用所述音調(diào)滯后候選者集合和所述置信測(cè)度集合計(jì)算經(jīng)加權(quán)均值; 確定所述音調(diào)滯后候選者集合中的最遠(yuǎn)離經(jīng)加權(quán)均值的音調(diào)滯后候選者; 從所述音調(diào)滯后候選者集合中移除最遠(yuǎn)離所述經(jīng)加權(quán)均值的音調(diào)滯后候選者; 從所述置信測(cè)度集合中移除對(duì)應(yīng)于最遠(yuǎn)離所述經(jīng)加權(quán)均值的所述音調(diào)滯后候選者的置信測(cè)度; 確定剩余音調(diào)滯后候選者數(shù)目是否等于指定數(shù)目;以及 在所述剩余音調(diào)滯后候選者數(shù)目等于所述指定數(shù)目的情況下,基于一個(gè)或一個(gè)以上剩余音調(diào)滯后候選者確定所述音調(diào)滯后。
22.一種用于在電子裝置上估計(jì)音調(diào)滯后的方法,其包含: 獲得當(dāng)前幀; 基于所述當(dāng)前幀獲得殘余信號(hào); 基于所述殘余信號(hào)確定峰值位置集合; 基于所述峰值位置集合獲得音調(diào)滯后候選者集合;以及 基于所述音調(diào)滯后候選者集合估計(jì)音調(diào)滯后。
23.根據(jù)權(quán)利要求22所述的方法,其中確定峰值位置集合包含: 基于所述殘余信號(hào)的樣本的絕對(duì)值和窗口信號(hào)計(jì)算包絡(luò)信號(hào); 基于所述包絡(luò)信號(hào)與所述包絡(luò)信號(hào)的時(shí)間移位版本之間的差計(jì)算第一梯度信號(hào);基于所述第一梯度信號(hào)與所述第一梯度信號(hào)的時(shí)間移位版本之間的差計(jì)算第二梯度信號(hào); 選擇其中第二梯度信號(hào)值降低到第一閾值以下的第一位置索引集合; 通過(guò)消除其中包絡(luò)值相對(duì)于包絡(luò)中的最大值降低到第二閾值以下的位置索引來(lái)從所述第一位置索引集合確定第二位置索引集合;以及 通過(guò)消除相對(duì)于相鄰位置索引不滿(mǎn)足差閾值的位置索引來(lái)從所述第二位置索引集合確定第三位置索引集合。
24.根據(jù)權(quán)利要求22所述的方法,其中獲得所述音調(diào)滯后候選者集合包含: 以遞增次序布置所述峰值位置集合以產(chǎn)生有序峰值位置集合;以及 計(jì)算所述有序峰值位置集合中的連續(xù)峰值位置對(duì)之間的距離。
25.根據(jù)權(quán)利要求22所述的方法,其進(jìn)一步包含: 使用所述當(dāng)前幀和在所述當(dāng)前幀之前的信號(hào)執(zhí)行線(xiàn)性預(yù)測(cè)分析以獲得線(xiàn)性預(yù)測(cè)系數(shù)集合;以及 基于所述線(xiàn)性預(yù)測(cè)系數(shù)集合確定經(jīng)量化線(xiàn)性預(yù)測(cè)系數(shù)集合。
26.根據(jù)權(quán)利要求25所述的方法,其中獲得所述殘余信號(hào)進(jìn)一步基于所述經(jīng)量化線(xiàn)性預(yù)測(cè)系數(shù)集合。
27.根據(jù)權(quán)利要求2 2所述的方法,其進(jìn)一步包含計(jì)算對(duì)應(yīng)于所述音調(diào)滯后候選者集合的置信測(cè)度集合。
28.根據(jù)權(quán)利要求27所述的方法,其中計(jì)算對(duì)應(yīng)于所述音調(diào)滯后候選者集合的所述置信測(cè)度集合是基于信號(hào)包絡(luò)和所述峰值位置的有序集合中的連續(xù)峰值位置對(duì)。
29.根據(jù)權(quán)利要求28所述的方法,其中計(jì)算所述置信測(cè)度集合包含對(duì)于所述峰值位置的所述有序集合中的每一對(duì)峰值位置: 基于圍繞一對(duì)峰值位置中的第一峰值位置的范圍選擇第一信號(hào)緩沖器; 基于圍繞所述對(duì)峰值位置中的第二峰值位置的范圍選擇第二信號(hào)緩沖器; 計(jì)算所述第一信號(hào)緩沖器與所述第二信號(hào)緩沖器之間的經(jīng)正規(guī)化的交叉相關(guān)性;以及 將所述經(jīng)正規(guī)化的交叉相關(guān)性添加到所述置信測(cè)度集合。
30.根據(jù)權(quán)利要求27所述的方法,其中使用迭代修剪算法基于所述音調(diào)滯后候選者集合和所述置信測(cè)度集合來(lái)估計(jì)所述音調(diào)滯后。
31.根據(jù)權(quán)利要求27所述的方法,其進(jìn)一步包含: 將基于所述當(dāng)前幀的所述殘余信號(hào)計(jì)算的第一近似音調(diào)滯后值添加到所述音調(diào)滯后候選者集合;以及 將對(duì)應(yīng)于所述第一近似音調(diào)滯后值的第一音調(diào)增益添加到所述置信測(cè)度集合。
32.根據(jù)權(quán)利要求31所述的方法,其中通過(guò)以下步驟來(lái)估計(jì)所述第一近似音調(diào)滯后值且估計(jì)所述第一音調(diào)增益: 基于所述當(dāng)前幀的所述殘余信號(hào)估計(jì)自相關(guān)性值; 在某一位置范圍內(nèi)搜索所述自相關(guān)性值以查找最大值; 將所述第一近似音調(diào)滯后值設(shè)置為出現(xiàn)所述最大值所在的位置;以及 將所述第一音調(diào)增益值設(shè)置為所述第一近似音調(diào)滯后值處的經(jīng)正規(guī)化的自相關(guān)性。
33.根據(jù)權(quán)利要求31所述的方法,其進(jìn)一步包含: 將基于先前幀的殘余信號(hào)計(jì)算的第二近似音調(diào)滯后值添加到所述音調(diào)滯后候選者集合;以及 將對(duì)應(yīng)于所述第二近似音調(diào)滯后值的第二音調(diào)增益添加到所述置信測(cè)度集合。
34.根據(jù)權(quán)利要求33所述的方法,其中通過(guò)以下步驟來(lái)估計(jì)所述第二近似音調(diào)滯后值且估計(jì)所述第二音調(diào)增益: 基于所述先前幀的所述殘余信號(hào)估計(jì)自相關(guān)性值; 在某一位置范圍內(nèi)搜索所述自相關(guān)性值以查找最大值; 將所述第二近似音調(diào)滯后值設(shè)置為出現(xiàn)所述最大值所在的位置;以及 將所述音調(diào)增益值設(shè)置為所述第二近似音調(diào)滯后值處的經(jīng)正規(guī)化的自相關(guān)性。
35.根據(jù)權(quán)利要求30所述的方法,其中使用迭代修剪算法基于所述音調(diào)滯后候選者集合和所述置信測(cè)度集合估計(jì)所述音調(diào)滯后包含: 使用所述音調(diào)滯后候選者集合和所述置信測(cè)度集合計(jì)算經(jīng)加權(quán)均值; 確定所述音調(diào)滯后候選者集合中的最遠(yuǎn)離所述經(jīng)加權(quán)均值的音調(diào)滯后候選者; 從所述音調(diào)滯后候選者集合中移除最遠(yuǎn)離所述經(jīng)加權(quán)均值的所述音調(diào)滯后候選者;從所述置信測(cè)度集合中移除對(duì)應(yīng)于最遠(yuǎn)離所述經(jīng)加權(quán)均值的所述音調(diào)滯后候選者的置信測(cè)度; 確定剩余音調(diào)滯后候選者數(shù)目是否等于指定數(shù)目;以及 在所述剩余音調(diào)滯后候選者數(shù)目等于所述指定數(shù)目的情況下,基于一個(gè)或一個(gè)以上剩余音調(diào)滯后候選者確定所述音調(diào)滯后。
36.根據(jù)權(quán)利要求35所述的方法,其進(jìn)一步包含在所述剩余音調(diào)滯后候選者數(shù)目不等于所述指定數(shù)目的情況下反復(fù)。
37.根據(jù)權(quán)利要求35所述的方法,其中根據(jù)方程式^來(lái)實(shí)現(xiàn)計(jì)算所述經(jīng)加
38.根據(jù)權(quán)利要求35所述的方法,其中通過(guò)找到dk來(lái)實(shí)現(xiàn)確定所述音調(diào)滯后候選者集合中的最遠(yuǎn)離所述經(jīng)加權(quán)均值的音調(diào)滯后候選者,使得對(duì)于所有i,iM^dkblM^dil,其中i古k,其中dk為最遠(yuǎn)離所述經(jīng)加權(quán)均值的所述音調(diào)滯后候選者,MW為所述經(jīng)加權(quán)均值,{dj為所述音調(diào)滯后候選者集合,且i為索引編號(hào)。
39.根據(jù)權(quán)利要求22所述的方法,其進(jìn)一步包含發(fā)射所述音調(diào)滯后。
40.根據(jù)權(quán)利要求22所述的方法,其中所述電子裝置為無(wú)線(xiàn)通信裝置。
41.一種用于在電子裝置上估計(jì)音調(diào)滯后的方法,其包含: 獲得語(yǔ)音信號(hào); 基于所述語(yǔ)音信號(hào)獲得音調(diào)滯后候選者集合; 確定對(duì)應(yīng)于所述音調(diào)滯后候選者集合的置信測(cè)度集合;以及 使用迭代修剪算法基于所述音調(diào)滯后候選者集合和所述置信測(cè)度集合估計(jì)音調(diào)滯后。
42.根據(jù)權(quán)利要求41所述的方法,其中使用迭代修剪算法基于所述音調(diào)滯后候選者集合和所述置信測(cè)度集合估計(jì)所述音調(diào)滯后包含: 使用所述音調(diào)滯后候選者集合和所述置信測(cè)度集合計(jì)算經(jīng)加權(quán)均值; 確定所述音調(diào)滯后候選者集合中的最遠(yuǎn)離經(jīng)加權(quán)均值的音調(diào)滯后候選者; 從所述音調(diào)滯后候選者集合中移除最遠(yuǎn)離所述經(jīng)加權(quán)均值的音調(diào)滯后候選者;從所述置信測(cè)度集合中移除對(duì)應(yīng)于最遠(yuǎn)離所述經(jīng)加權(quán)均值的所述音調(diào)滯后候選者的置信測(cè)度; 確定剩余音調(diào)滯后候選者數(shù)目是否等于指定數(shù)目;以及 在所述剩余音調(diào)滯后候選者數(shù)目等于所述指定數(shù)目的情況下,基于一個(gè)或一個(gè)以上剩余音調(diào)滯后候選者確定所述音調(diào)滯后。
43.一種用于估計(jì)音調(diào)滯后的計(jì)算機(jī)程序產(chǎn)品,其包含上面具有指令的非暫時(shí)性有形計(jì)算機(jī)可讀媒體,所述指令包含: 用于致使電子裝置獲得當(dāng)前幀的代碼; 用于致使所述電子裝置基于所述當(dāng)前幀獲得殘余信號(hào)的代碼; 用于致使所述電子裝置基于所述殘余信號(hào)確定峰值位置集合的代碼; 用于致使所述電子裝置基于所述峰值位置集合獲得音調(diào)滯后候選者集合的代碼;以及 用于致使所述電子裝置基于所述音調(diào)滯后候選者集合估計(jì)音調(diào)滯后的代碼。
44.根據(jù)權(quán)利要求43所述的計(jì)算機(jī)程序產(chǎn)品,其中所述用于致使所述電子裝置確定峰值位置集合的代碼包含: 用于致使所述電子裝置基于所述殘余信號(hào)的樣本的絕對(duì)值和窗口信號(hào)計(jì)算包絡(luò)信號(hào)的代碼; 用于致使所述電子裝置基于所述包絡(luò)信號(hào)與所述包絡(luò)信號(hào)的時(shí)間移位版本之間的差計(jì)算第一梯度信號(hào)的代碼;` 用于致使所述電子裝置基于所述第一梯度信號(hào)與所述第一梯度信號(hào)的時(shí)間移位版本之間的差計(jì)算第二梯度信號(hào)的代碼; 用于致使所述電子裝置選擇其中第二梯度信號(hào)值降低到第一閾值以下的第一位置索引集合的代碼; 用于致使所述電子裝置通過(guò)消除其中包絡(luò)值相對(duì)于包絡(luò)中的最大值降低到第二閾值以下的位置索引來(lái)從所述第一位置索引集合確定第二位置索引集合的代碼;以及 用于致使所述電子裝置通過(guò)消除相對(duì)于相鄰位置索引不滿(mǎn)足差閾值的位置索引來(lái)從所述第二位置索引集合確定第三位置索引集合的代碼。
45.一種用于估計(jì)音調(diào)滯后的計(jì)算機(jī)程序產(chǎn)品,其包含上面具有指令的非暫時(shí)性有形計(jì)算機(jī)可讀媒體,所述指令包含: 用于致使電子裝置獲得語(yǔ)音信號(hào)的代碼; 用于致使所述電子裝置基于所述語(yǔ)音信號(hào)獲得音調(diào)滯后候選者集合的代碼; 用于致使所述電子裝置確定對(duì)應(yīng)于所述音調(diào)滯后候選者集合的置信測(cè)度集合的代碼;以及 用于致使所述電子裝置使用迭代修剪算法基于所述音調(diào)滯后候選者集合和所述置信測(cè)度集合估計(jì)音調(diào)滯后的代碼。
46.根據(jù)權(quán)利要求45所述的計(jì)算機(jī)程序產(chǎn)品,其中所述用于致使所述電子裝置使用迭代修剪算法基于所述音調(diào)滯后候選者集合和所述置信測(cè)度集合估計(jì)所述音調(diào)滯后的代碼包含: 用于致使所述電子裝置使用所述音調(diào)滯后候選者集合和所述置信測(cè)度集合計(jì)算經(jīng)加權(quán)均值的代碼;用于致使所述電子裝置確定所述音調(diào)滯后候選者集合中的最遠(yuǎn)離經(jīng)加權(quán)均值的音調(diào)滯后候選者的代碼; 用于致使所述電子裝置從所述音調(diào)滯后候選者集合中移除最遠(yuǎn)離所述經(jīng)加權(quán)均值的音調(diào)滯后候選者的代碼; 用于致使所述電子裝置從所述置信測(cè)度集合中移除對(duì)應(yīng)于最遠(yuǎn)離所述經(jīng)加權(quán)均值的所述音調(diào)滯后候選者的置信測(cè)度的代碼; 用于致使所述電子裝置確定剩余音調(diào)滯后候選者數(shù)目是否等于指定數(shù)目的代碼;以及用于致使所述電子裝置在所述剩余音調(diào)滯后候選者數(shù)目等于所述指定數(shù)目的情況下基于一個(gè)或一個(gè)以上剩余音調(diào)滯后候選者確定所述音調(diào)滯后的代碼。
47.一種用于估計(jì)音調(diào)滯后的設(shè)備,其包含: 用于獲得當(dāng)前幀的裝置; 用于基于所述當(dāng)前幀獲得殘余信號(hào)的裝置; 用于基于所述殘余信號(hào)確定峰值位置集合的裝置; 用于基于所述峰值位 置集合獲得音調(diào)滯后候選者集合的裝置;以及 用于基于所述音調(diào)滯后候選者集合估計(jì)音調(diào)滯后的裝置。
48.根據(jù)權(quán)利要求47所述的設(shè)備,其中所述用于確定峰值位置集合的裝置包含: 用于基于所述殘余信號(hào)的樣本的絕對(duì)值和窗口信號(hào)計(jì)算包絡(luò)信號(hào)的裝置; 用于基于所述包絡(luò)信號(hào)與所述包絡(luò)信號(hào)的時(shí)間移位版本之間的差計(jì)算第一梯度信號(hào)的裝置; 用于基于所述第一梯度信號(hào)與所述第一梯度信號(hào)的時(shí)間移位版本之間的差計(jì)算第二梯度信號(hào)的裝置; 用于選擇其中第二梯度信號(hào)值降低到第一閾值以下的第一位置索引集合的裝置;用于通過(guò)消除其中包絡(luò)值相對(duì)于包絡(luò)中的最大值降低到第二閾值以下的位置索引來(lái)從所述第一位置索引集合確定第二位置索引集合的裝置;以及 用于通過(guò)消除相對(duì)于相鄰位置索引不滿(mǎn)足差閾值的位置索引來(lái)從所述第二位置索引集合確定第三位置索引集合的裝置。
49.一種用于估計(jì)音調(diào)滯后的設(shè)備,其包含: 用于獲得語(yǔ)音信號(hào)的裝置; 用于基于所述語(yǔ)音信號(hào)獲得音調(diào)滯后候選者集合的裝置; 用于確定對(duì)應(yīng)于所述音調(diào)滯后候選者集合的置信測(cè)度集合的裝置;以及用于使用迭代修剪算法基于所述音調(diào)滯后候選者集合和所述置信測(cè)度集合估計(jì)音調(diào)滯后的裝置。
50.根據(jù)權(quán)利要求49所述的設(shè)備,其中所述用于使用迭代修剪算法基于所述音調(diào)滯后候選者集合和所述置信測(cè)度集合估計(jì)所述音調(diào)滯后的裝置包含: 用于使用所述音調(diào)滯后候選者集合和所述置信測(cè)度集合計(jì)算經(jīng)加權(quán)均值的裝置; 用于確定所述音調(diào)滯后候選者集合中的最遠(yuǎn)離經(jīng)加權(quán)均值的音調(diào)滯后候選者的裝置; 用于從所述音調(diào)滯后候選者集合中移除最遠(yuǎn)離所述經(jīng)加權(quán)均值的音調(diào)滯后候選者的裝置;用于從所述置信測(cè)度集合中移除對(duì)應(yīng)于最遠(yuǎn)離所述經(jīng)加權(quán)均值的所述音調(diào)滯后候選者的置信測(cè)度的裝置; 用于確定剩余音調(diào)滯后候選者數(shù)目是否等于指定數(shù)目的裝置;以及用于在所述剩余音調(diào)滯后候選者數(shù)目等于所述指定數(shù)目的情況下基于一個(gè)或一個(gè)以上剩余音調(diào)滯后候選者確定所述音調(diào)`滯后的裝置。
全文摘要
本發(fā)明描述一種用于估計(jì)音調(diào)滯后的電子裝置。所述電子裝置包括處理器和存儲(chǔ)于與所述處理器電子通信的存儲(chǔ)器中的可執(zhí)行指令。所述電子裝置獲得當(dāng)前幀。所述電子裝置還基于所述當(dāng)前幀獲得殘余信號(hào)。所述電子裝置另外基于所述殘余信號(hào)確定峰值位置集合。此外,所述電子裝置基于所述峰值位置集合獲得音調(diào)滯后候選者集合。所述電子裝置還基于所述音調(diào)滯后候選者集合估計(jì)音調(diào)滯后。
文檔編號(hào)G10L25/90GK103109321SQ201180044585
公開(kāi)日2013年5月15日 申請(qǐng)日期2011年9月9日 優(yōu)先權(quán)日2010年9月16日
發(fā)明者文卡特什·克里希南, 斯特凡那·皮埃爾·維萊特 申請(qǐng)人:高通股份有限公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
南宁市| 报价| 湖口县| 鸡西市| 江城| 民勤县| 祁阳县| 双峰县| 鄢陵县| 赤水市| 博罗县| 内黄县| 炉霍县| 陆丰市| 海原县| 焉耆| 凌源市| 肥西县| 海原县| 浑源县| 泗阳县| 垣曲县| 深圳市| 石城县| 鱼台县| 荔波县| 邵武市| 关岭| 邵阳县| 郴州市| 东乌| 连江县| 东光县| 拉孜县| 仪陇县| 凌海市| 巴彦淖尔市| 永胜县| 江西省| 普定县| 嵊州市|