欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

針對恒定的比特率應(yīng)用的具有最佳比特分配的音頻和語音處理的制作方法

文檔序號:2824929閱讀:169來源:國知局
專利名稱:針對恒定的比特率應(yīng)用的具有最佳比特分配的音頻和語音處理的制作方法
技術(shù)領(lǐng)域
概括地說,本公開內(nèi)容涉及通信,具體地說,涉及用于處理音頻和語音信號的技術(shù)。
背景技術(shù)
在通信世界中,在帶寬是基本限制的情況下,音頻和語音處理在多媒體應(yīng)用中起到了重要的作用。音頻和語音處理通常包括各種形式的信號壓縮,以大幅減少表示音頻和語音信號所需的信息量,并從而減少傳輸帶寬。這些處理系統(tǒng)通常被稱為用于對音頻和語音進(jìn)行壓縮的編碼器以及用于對音頻和語音進(jìn)行解壓縮的解碼器。傳統(tǒng)的音頻和語音處理系統(tǒng)以高復(fù)雜度和延遲為代價使用復(fù)雜的心理聲學(xué)模型和濾波器實現(xiàn)顯著的壓縮比。然而,在人體局域網(wǎng)的上下文中,對功率和延遲要求的緊約束越簡單,信號壓縮的解決方案的復(fù)雜度越低。通常針對功率和延遲增益來對壓縮比進(jìn)行折中。

發(fā)明內(nèi)容
在本公開內(nèi)容的一個方面,一種音頻或語音處理的方法包括生成多個幀,所述幀中的每個幀包括多個變換系數(shù);以及,向所述幀中的每個幀中的所述變換系數(shù)分配比特,使得同一幀中的所述變換系數(shù)中的至少兩個具有不同的比特分配,并且向所述幀中的至少兩個幀中的變換系數(shù)分配的比特的總數(shù)相等。在本公開內(nèi)容的另一個方面,一種用于音頻或語音處理的裝置包括處理系統(tǒng),其配置為生成多個幀,所述幀中的每個幀包括多個變換系數(shù);以及向所述幀中的每個幀中的所述變換系數(shù)分配比特,使得同一幀中的所述變換系數(shù)中的至少兩個具有不同的比特分配,并且向所述幀中的至少兩個幀中的變換系數(shù)分配的比特的總數(shù)相等。在本公開內(nèi)容的另一個方面,一種用于音頻或語音處理的裝置包括用于生成多個幀的模塊,所述幀中的每個幀包括多個變換系數(shù);以及,用于向所述幀中的每個幀中的所述變換系數(shù)分配比特,使得同一幀中的所述變換系數(shù)中的至少兩個具有不同的比特分配并且向所述幀中的至少兩個幀中的變換系數(shù)分配的比特的總數(shù)相等的模塊。在本公開內(nèi)容的另一個方面,一種用于處理音頻或語音的計算機(jī)程序產(chǎn)品包括使用代碼進(jìn)行編碼的計算機(jī)可讀介質(zhì),所述代碼可以由一個或多個處理器執(zhí)行以進(jìn)行以下操作生成多個幀,所述幀中的每個幀包括多個變換系數(shù);以及,向所述幀中的每個幀中的所述變換系數(shù)分配比特,使得同一幀中的所述變換系數(shù)中的至少兩個具有不同的比特分配,并且向所述幀中的至少兩個幀中的變換系數(shù)分配的比特的總數(shù)相等。在本公開內(nèi)容的另一個方面,一種耳機(jī)包括換能器;處理系統(tǒng),其配置為根據(jù)從所述換能器輸出的音頻或語音生成多個幀,所述幀中的每個幀包括多個變換系數(shù);以及向所述幀中的每個幀中的所述變換系數(shù)分配比特,使得同一幀中的所述變換系數(shù)中的至少兩個具有不同的比特分配,并且向所述幀中的至少兩個幀中的變換系數(shù)分配的所述比特的總數(shù)相等;以及發(fā)射機(jī),其配置為發(fā)送所述幀。在本公開內(nèi)容的另一個方面,一種手表包括用戶接口 ;處理系統(tǒng),其配置為根據(jù)從所述用戶接口輸出的音頻或語音生成多個幀,所述幀中的每個幀包括多個變換系數(shù);以及,向所述幀中的每個幀中的所述變換系數(shù)分配比特,使得同一幀中的所述變換系數(shù)中的至少兩個具有不同的比特分配,并且向所述幀中的至少兩個幀中的變換系數(shù)分配的所述比特的總數(shù)相等;以及發(fā)射機(jī),其配置為發(fā)送所述幀。 在本公開內(nèi)容的另一個方面,一種感測裝置包括傳感器;處理系統(tǒng),其配置為根據(jù)從所述傳感器輸出的音頻或語音生成多個幀,所述幀中的每個幀包括多個變換系數(shù);以及向所述幀中的每個幀中的所述變換系數(shù)分配比特,使得同一幀中的所述變換系數(shù)中的至少兩個具有不同的比特分配,并且向所述幀中的至少兩個幀中的變換系數(shù)分配的所述比特的總數(shù)相等;以及發(fā)射機(jī),其配置為發(fā)送所述幀。


圖I是示出了無線通信網(wǎng)絡(luò)的示例的概念圖;圖2是示出了用于無線通信的裝置的概念框圖;圖3是示出了在發(fā)射裝置與接收裝置進(jìn)行通信的上下文中的音頻或語音處理系統(tǒng)的示例的概念框圖;圖4是示出了音頻或語音處理系統(tǒng)的示例的功能框圖;圖5是用于處理音頻或語音的算法的方法的示例的流程圖;圖6是示出了圖5的方法或算法中的向變換系數(shù)分配比特的過程的示例的流程圖;以及圖7是示出了圖5的算法的方法中的向變換系數(shù)分配比特的過程的替代示例的流程圖。
具體實施例方式下面將參照附圖來更全面地描述方法和裝置的各個方面。然而,這些方法和裝置可以用多種不同的形式來體現(xiàn),并且不應(yīng)當(dāng)被解釋為限制于本公開內(nèi)容中給出的任何具體的結(jié)構(gòu)或功能。相反,提供這些方面使得本公開內(nèi)容將是詳盡的和完整的,并且將向本領(lǐng)域技術(shù)人員充分地傳達(dá)這些方法和裝置的范圍。基于本文的教導(dǎo),本領(lǐng)域技術(shù)人員應(yīng)當(dāng)意識到的是,本公開內(nèi)容的范圍旨在涵蓋本文所公開的方法和裝置的任意方面,而不論其是獨立于本公開內(nèi)容的任何其它方面實現(xiàn)的還是與本公開內(nèi)容的任何其它方面相結(jié)合實現(xiàn)的。例如,可以使用本文闡述的任意數(shù)量的方面來實現(xiàn)裝置或者實踐方法。此外,本公開內(nèi)容的范圍旨在涵蓋除了貫穿本文的公開內(nèi)容所給出的方面以外或不同于貫穿本文的公開內(nèi)容所給出的方面,還使用其它結(jié)構(gòu)、功能、或結(jié)構(gòu)和功能實現(xiàn)的這種裝置或方法。應(yīng)當(dāng)理解的是,本文的公開內(nèi)容的任意方面可以由權(quán)利要求的一個或多個要素來體現(xiàn)?,F(xiàn)在將給出音頻和語音處理的多個方面。將參照無線通信網(wǎng)絡(luò)中的發(fā)射和接收裝置來給出這些方面。發(fā)射裝置包括用于對音頻或語音進(jìn)行壓縮以便通過無線介質(zhì)進(jìn)行傳輸?shù)木幋a器。接收裝置包括用于對通過無線介質(zhì)從發(fā)射裝置接收的音頻或語音進(jìn)行擴(kuò)展的解碼器。在很多應(yīng)用中,發(fā)射裝置可以是進(jìn)行接收以及發(fā)射的裝置的一部分。因此,這種裝置將需要解碼器,該解碼器可以是單獨的處理系統(tǒng)或者與編碼器一起集成在稱作“編解碼器”的單個處理系統(tǒng)中。類似地,接收裝置可以是進(jìn)行發(fā)射以及接收的裝置的一部分。因此,這種裝置將需要編碼器,該編碼器可以是單獨的處理系統(tǒng)或者與解碼器一起集成在編解碼器中。本領(lǐng)域技術(shù)人員將易于意識到的是,貫穿本公開內(nèi)容所描述的各個概念可應(yīng)用于任何適當(dāng)?shù)木幋a或解碼功能,而不論這種功能是實現(xiàn)在獨立的處理系統(tǒng)中,集成在編解碼器中, 還是分布在無線裝置或無線通信網(wǎng)絡(luò)中的多個實體之間。貫穿本公開內(nèi)容所給出的各種音頻和語音處理技術(shù)將非常適合于集成到各種無線裝置中,這些無線裝置包括耳機(jī)、電話(例如,蜂窩電話)、個人數(shù)字助理(PDA)、娛樂設(shè)備(例如,音樂或視頻設(shè)備)、麥克風(fēng)、醫(yī)療感測設(shè)備(例如,生物傳感器、心率監(jiān)測器、計步器、EKG設(shè)備、智能繃帶等)、用戶I/O設(shè)備(例如,手表、遙控器、電燈開關(guān)、鍵盤、鼠標(biāo)等)、可以接收來自醫(yī)療感測設(shè)備的數(shù)據(jù)的醫(yī)療監(jiān)測器、環(huán)境感測設(shè)備(例如,輪胎氣壓監(jiān)測器)、計算機(jī)、銷售點設(shè)備、娛樂設(shè)備、助聽器、機(jī)頂盒、或處理音頻或語音信號的任何其它設(shè)備。除了音頻或語音處理以外,無線裝置還可以包括其它功能。舉例說明,耳機(jī)、手表或傳感器可以包括用于用戶與裝置進(jìn)行交互的各種音頻或語音換能器(例如,麥克風(fēng)和揚聲器)。在圖I中示出了可以受益于貫穿本公開內(nèi)容給出的各種概念的無線通信網(wǎng)絡(luò)的示例。在該示例中,用戶佩戴的耳機(jī)102被示出為與各種無線裝置進(jìn)行通信,這些無線裝置包括蜂窩電話104、數(shù)字音頻播放器106 (例如,MP3播放器)和計算機(jī)108。在任何給定時間,耳機(jī)102可以向這些裝置中的一個或多個發(fā)送音頻或語音、或者從這些裝置中的一個或多個接收音頻或語音。舉例說明,音頻可以以存儲在數(shù)字音頻播放器106或計算機(jī)108的存儲器中的音頻文件的形式由耳機(jī)102進(jìn)行接收??商鎿Q地或此外,耳機(jī)102還可以通過與遠(yuǎn)程網(wǎng)絡(luò)(例如,因特網(wǎng))的連接從計算機(jī)108接收流式音頻。耳機(jī)102還可以在通過蜂窩網(wǎng)絡(luò)進(jìn)行呼叫期間支持與蜂窩電話104的語音通信。耳機(jī)可以包括使得用戶能夠參與呼叫的各種換能器(例如,麥克風(fēng)、揚聲器)。用戶還可以具有可穿戴的或者植入人體內(nèi)的多種其它移動或緊湊型裝置。舉例說明,用戶可以佩戴向計算機(jī)108發(fā)送來自用戶接口的時間和其它信息(其可以包括音頻或語音)的手表110,和/或監(jiān)測至關(guān)重要的身體參數(shù)的傳感器112 (例如,生物傳感器、心率監(jiān)測器、計步器、EKG設(shè)備等)。傳感器112將來自人體的信息(其可以包括音頻或語音)發(fā)送到計算機(jī)108,在計算機(jī)108處,可以將該信息通過去往因特網(wǎng)或其它遠(yuǎn)程網(wǎng)絡(luò)的回程連接轉(zhuǎn)發(fā)給醫(yī)療設(shè)施(例如,醫(yī)院、診所等)。貫穿本公開內(nèi)容給出的各種音頻和語音處理技術(shù)可以用于支持任何適當(dāng)?shù)臒o線技術(shù)或無線協(xié)議的無線裝置中。舉例說明,圖I中所示的無線裝置可以是被配置為支持超寬帶(UWB)技術(shù)的個域網(wǎng)的一部分。UWB是用于高速近程通信的常用技術(shù),并且被定義為具有占用大于中心頻率的20%的帶寬或者至少500MHz的帶寬的頻譜的任何無線技術(shù)?;蛘?,無線裝置可以被配置為支持藍(lán)牙或者用于個域網(wǎng)的某些其它適當(dāng)?shù)臒o線協(xié)議。蜂窩電話104可以被配置為支持去往使用以下標(biāo)準(zhǔn)的廣域網(wǎng)的連接碼分多址(CDMA) 2000、演進(jìn)數(shù)據(jù)優(yōu)化(EV-DO)、超移動寬帶(UMB)、通用陸地?zé)o線接入網(wǎng)絡(luò)(UTRAN)、長期演進(jìn)(LTE)、寬帶CDMA (W-CDMA)、高速下行鏈路分組數(shù)據(jù)(HSDPA)、時分碼分多址(TD-CDMA)、時分同步碼分多址(TD-SCDMA)、或者一些其它適當(dāng)?shù)碾娦艠?biāo)準(zhǔn)。計算機(jī)102可以被配置為還支持去往這些網(wǎng)絡(luò)中的一個或多個的連接和/或去往IEEE802. 11網(wǎng)絡(luò)的連接??商鎿Q地或此外,計算機(jī)102可以被配置為支持使用標(biāo)準(zhǔn)雙絞線、電纜調(diào)制解調(diào)器、數(shù)字用戶線(DSL)、光纖、以太網(wǎng)、HomeRF或者任何其它適當(dāng)?shù)挠芯€接入?yún)f(xié)議的有線連接。 圖2是示出了用于無線通信的裝置的概念框圖。裝置200被示出為具有音頻或語音源202、音頻或語音宿204、音頻或語音處理系統(tǒng)206、以及收發(fā)機(jī)208。在這個方面,裝置200是具有用作音頻或語音編解碼器的處理系統(tǒng)206的雙向通信裝置。術(shù)語“音頻或語音處理系統(tǒng)”旨在意指僅能夠處理音頻的處理系統(tǒng)、僅能夠處理語音的處理系統(tǒng)、或者能夠處理音頻和語音二者的處理系統(tǒng)。貫穿本公開內(nèi)容給出的各種概念旨在應(yīng)用于這些處理系統(tǒng)中的每一個。音頻或語音源202概念地表示任何適當(dāng)?shù)囊纛l或語音的源。舉例說明,音頻或語音源202可以表示在裝置200中運行的各種應(yīng)用,所述應(yīng)用從存儲器得到壓縮的音頻文件(例如,MP3文件),并且使用適當(dāng)?shù)奈募袷浇獯a方案來對其進(jìn)行解壓縮?;蛘撸纛l或語音源202可以表示用于將來自裝置的用戶的模擬語音信號處理成數(shù)字采樣的麥克風(fēng)和相關(guān)聯(lián)的電路。相反,音頻或語音源202可以表示能夠從有線或無線回程存取音頻或語音的收發(fā)機(jī)或調(diào)制解調(diào)器。本領(lǐng)域技術(shù)人員將易于意識到的是,實現(xiàn)音頻或語音源202的方式將取決于發(fā)射裝置200的特定設(shè)計和應(yīng)用。音頻或語音宿204概念地表示能夠接收音頻或語音的任何適當(dāng)?shù)膶嶓w。舉例說明,音頻或語音宿204可以表示在裝置200中運行的各種應(yīng)用,所述應(yīng)用使用適當(dāng)?shù)奈募袷骄幋a方案(例如,MP3文件)來壓縮音頻文件以便存儲在存儲器中。或者,音頻或語音宿204可以表示用于向裝置200的用戶提供音頻或語音的揚聲器和相關(guān)聯(lián)的電路。相反,音頻或語音宿204可以表示能夠通過有線或無線回程來發(fā)送音頻或語音的收發(fā)機(jī)或調(diào)制解調(diào)器。本領(lǐng)域技術(shù)人員將易于意識到的是,實現(xiàn)音頻或語音宿204的方式將取決于發(fā)射裝置200的特定設(shè)計和應(yīng)用。音頻或語音處理系統(tǒng)206可以實現(xiàn)壓縮算法以對音頻和語音進(jìn)行編碼和解碼。壓縮算法可以使用變換在采樣的音頻和語音與變換域(通常是頻域)之間進(jìn)行轉(zhuǎn)換。在變換域中,根據(jù)分量頻率的可聽度來向其分配比特。在該示例中,處理系統(tǒng)206可以利用任何變換域方法中涉及的逐幀處理來確保針對每個幀的最佳比特分配。雖然比特分配是專門針對每個幀而進(jìn)行的,但是處理系統(tǒng)206可以被配置為確??鐜暮愣ū忍芈省_@種方法使得能夠在所關(guān)注的整個信號上實現(xiàn)最佳的比特分配策略,這轉(zhuǎn)而確保了針對給定的質(zhì)量要求的最佳壓縮比,以及針對給定的壓縮比的最佳質(zhì)量。收發(fā)機(jī)208可以用于執(zhí)行與音頻或語音跨無線介質(zhì)的傳輸相結(jié)合的各種物理(PHY)和介質(zhì)訪問控制(MAC)層功能。PHY層功能可以包括多種信號處理功能,諸如前向糾錯(例如,Turbo編碼/解碼)、數(shù)字調(diào)制/解調(diào)(例如,F(xiàn)SK、PSK、QAM等)、以及RF載波的模擬調(diào)制/解調(diào)。MAC層功能可以包括對跨PHY層發(fā)送的音頻或語音內(nèi)容進(jìn)行管理,使得多個裝置可以共享對無線介質(zhì)的訪問。圖3是示出了在發(fā)射裝置與接收裝置進(jìn)行通信的上下文中的音頻或語音處理系統(tǒng)的更詳細(xì)的示例的概念框圖。在下面的討論中,術(shù)語發(fā)射裝置和接收裝置用于說明的目的,而并不暗指這種裝置不能執(zhí)行發(fā)射功能和接收功能二者。發(fā)射裝置300被示出為具有音頻或語音源302、音頻或語音處理系統(tǒng)304、以及發(fā)射機(jī)306。接收裝置310被示出為具有接收機(jī)312、音頻或語音處理系統(tǒng)314、以及音頻或語音宿316。發(fā)射裝置300中的音頻或語音源302和發(fā)射機(jī)306以及接收裝置310中的接收機(jī)312和音頻或語音宿316以與前面接合圖2所描述的方式相同的方式工作,并且因此將不進(jìn)行任何進(jìn)一步的描述。將在變換域?qū)?shù)壓縮擴(kuò)展的上下文中給出音頻和語音處理系統(tǒng)304、314,然而,本領(lǐng)域技術(shù)人員將容易意識到的是,這些概念可以擴(kuò)展到在其中音頻或語音壓縮涉及逐幀處理的任何域。、
發(fā)射裝置300中的音頻或語音處理系統(tǒng)304包括變換322。變換322可以是將來自源302的音頻或語音轉(zhuǎn)換為頻域中的一系列變換系數(shù)的離散余弦變換(DCT)。在稱作幀的系數(shù)集合中對變換322的輸出進(jìn)行處理。每個幀由N個變換系數(shù)構(gòu)成。在被輸入到量化器326中以前,每個幀中的N個變換系數(shù)由對數(shù)壓縮器324用對數(shù)進(jìn)行壓縮。在被提供給發(fā)射機(jī)306并且被調(diào)制到RF載波上以便通過無線介質(zhì)308進(jìn)行傳輸之前,量化器326對用對數(shù)壓縮的N個變換系數(shù)進(jìn)行量化。比特分配器328被配置為對由量化器326應(yīng)用于用對數(shù)壓縮的N個變換系數(shù)的量化水平進(jìn)行控制。在處理系統(tǒng)304的至少一種配置中,比特分配器328被配置為將固定數(shù)量的比特B分發(fā)到每個幀的用對數(shù)壓縮的N個系數(shù)。這可以通過基于與幀中的每個系數(shù)的能量有關(guān)的Mi (i=l,2,···,N)中的至少一個來計算度量Μ’來實現(xiàn)。舉例說明,M可以簡單地是系數(shù)的幅度的平方。Μ,也可以是在一個以上的幀上計算的,并且可以是每個變換頻段的方差。通過分發(fā)與Μ,成比例的B個比特來計算長度為N的理論上的最佳比特分配向量V.然后,將其映射到大小“最接近于”理想向量V的字典V 330中的K個可用的向量中的一個。K個可用的向量可以由dk表示。字典330包含向量集合dk,向量集合中的每個向量為N個元素長。向量dk中的每個元素表示針對幀中的相應(yīng)系數(shù)的可能的比特分配。字典330中的每個向量dk的元素的總額等于B。這確保跨幀和跨幀集合(例如,MAC分組)的恒定比特率。對于每個幀,一旦由比特分配器328選擇了向量dk,則可以將其提供給量化器326,以對所述幀的用對數(shù)壓縮的N個變換系數(shù)進(jìn)行量化。對于包括K個向量的字典V,需要ceiling(log2(K))個比特來對字典的元素進(jìn)行索弓I。一旦由比特分配器328針對幀選擇了向量dk,則可以將標(biāo)識所選擇的向量dk的相應(yīng)索引與該幀一起發(fā)送到接收裝置310以便對該幀進(jìn)行解碼??梢酝ㄟ^帶外信令、邊信道、在幀內(nèi)進(jìn)行交織、或者通過某些其它適當(dāng)?shù)氖侄蝸戆l(fā)送索引。字典330中的向量的數(shù)量通??梢允怯糜谠跓o線介質(zhì)308上發(fā)送索引的帶寬限制的函數(shù)??梢允褂酶鞣N方法來創(chuàng)建字典330。舉例說明,可以針對跨越訓(xùn)練數(shù)據(jù)庫的多個幀的每個頻段來計算統(tǒng)計度量Si。然后,可以在諸如k均值聚類的技術(shù)中使用統(tǒng)計度量Si來創(chuàng)建字典的元素。字典中的每個向量可以被構(gòu)造為確保其元素的總額等于B。此外,每個向量可以被限制為由正整數(shù)構(gòu)成。
在接收裝置310處,每個幀及其相應(yīng)的索引由接收機(jī)312從RF載波中恢復(fù),并且被提供給音頻或語音處理系統(tǒng)314。處理系統(tǒng)314包括逆量化器332,逆量化器332使用索引來擴(kuò)展幀中的系數(shù)。然后,在被提供給逆變換336以將幀中的系數(shù)轉(zhuǎn)換回時域中的數(shù)字采樣之前,可以將該幀的經(jīng)擴(kuò)展的系數(shù)提供給對數(shù)擴(kuò)展器334,對數(shù)擴(kuò)展器334執(zhí)行逆對數(shù)功能??梢詫r域采樣提供給音頻或語音宿316以便進(jìn)行進(jìn)一步的處理。音頻和語音處理技術(shù)可以擴(kuò)展為使用其聯(lián)合統(tǒng)計一次處理多個幀,以決定針對該幀的集合的理想比特分配向量。通過跨越多個連續(xù)的幀使用相同的比特分配向量,將減小需要在無線介質(zhì)上發(fā)送的信息量。這將適合于諸如在幀之間存在相當(dāng)大的關(guān)聯(lián)的語音或音頻之類的信號。在由于架構(gòu)和/或容量約束而需要單個比特分配向量的情況下,音頻或語音處理系統(tǒng)可以專用于單元素字典,該單元素字典不需要跨無線介質(zhì)與幀一起發(fā)送任何額外的信肩、O貫穿本公開內(nèi)容給出的多個概念提供了用于將壓縮因子專門化為幀水平的方法。該方法實質(zhì)上在確保每個語音或音頻幀被最佳壓縮的同時保持了恒定的比特率。該方法還滿足了對通常與動態(tài)比特分配方案相關(guān)聯(lián)的用于傳輸?shù)目勺儽忍芈使艿赖男枰?,這使得MAC/PHY的設(shè)計更加復(fù)雜。此外,這些構(gòu)思不知道信號結(jié)構(gòu),并且不需要對時域或變換域中的信號結(jié)構(gòu)的任何心理聲學(xué)或先驗知識。使用每個幀中的各個分量的能量來最優(yōu)化地做出比特分配決策。“音頻或語音處理系統(tǒng)”將被廣泛地解釋為意指執(zhí)行貫穿本公開內(nèi)容給出的各種功能的任何裝置、組件、設(shè)備、電路、塊、單元、模塊、元件或者任何其它實體,而不論其是實現(xiàn)為硬件、軟件還是這二者的組合。至于這種功能是實現(xiàn)為硬件還是軟件取決于特定的應(yīng)用和施加于整個系統(tǒng)的設(shè)計約束。熟練的技術(shù)人員可以以針對每個特定的應(yīng)用的不同的方式來實現(xiàn)所描述的功能??梢允褂靡粋€或多個處理器來實現(xiàn)處理系統(tǒng)。該一個或多個處理器或者其中的任意一個可以是用于執(zhí)行計算機(jī)可讀介質(zhì)上的軟件的專用硬件或軟件平臺。不論是被稱為軟件、固件、中間件、微代碼、硬件描述語言還是其它名稱,軟件都應(yīng)被廣義地解釋為指代指令、指令集、代碼、代碼段、程序代碼、程序、子程序、軟件模塊、應(yīng)用程序、軟件應(yīng)用程序、軟件包、例程、子例程、對象、可執(zhí)行程序、執(zhí)行的線程、進(jìn)程、功能等。舉例說明,所述一個或多個處理器可以包括以下各項的任意組合微處理器、微控制器、數(shù)字信號處理器(DSP)J!場可編程門陣列(FPGA)、可編程邏輯器件(PLD)、狀態(tài)機(jī)、門控邏輯、分立硬件電路、以及配置為執(zhí)行貫穿本公開內(nèi)容所描述的各種功能的其它適當(dāng)?shù)奶幚砥?。舉例說明,計算機(jī)可讀介質(zhì)可以包括磁存儲設(shè)備(例如,硬盤、軟盤、磁帶)、光盤(例如,壓縮光盤(CD)、數(shù)字多功能光盤(DVD))、智能卡、閃存設(shè)備(例如,卡、棒、鑰匙驅(qū)動器)、隨機(jī)存取存儲器(RAM)、只讀存儲器(ROM)、可編程ROM (PROM)、可擦寫PROM (EPROM)、電可擦寫PROM (EEPR0M)、寄存器、可移動磁盤、載波、傳輸線、或用于存儲或傳送軟件的任何其它適當(dāng)?shù)慕橘|(zhì)。計算機(jī)可讀介質(zhì)可以位于處理系統(tǒng)內(nèi)部、位于處理系統(tǒng)外部、或分布于包括處理系統(tǒng)的多個實體上。計算 機(jī)可讀介質(zhì)可以體現(xiàn)在計算機(jī)程序產(chǎn)品中。舉例說明,計算機(jī)程序產(chǎn)品可以包括位于封裝材料中的計算機(jī)可讀介質(zhì)。計算機(jī)可讀介質(zhì)還可以用于實現(xiàn)字典。所述處理系統(tǒng)或所述處理系統(tǒng)的任意部分可以提供用于執(zhí)行本文記載的功能的模塊。轉(zhuǎn)向圖4,處理系統(tǒng)400可以提供用于生成多個幀的電路402,其中,所述幀中的每個幀包括多個變換系數(shù);以及用于向所述幀中的每個幀中的變換系數(shù)分配比特,使得同一幀中的變換系數(shù)中的至少兩個具有不同的比特分配,并且向所述幀中的至少兩個幀中的變換系數(shù)分配的比特的總數(shù)相等的電路404?;蛘撸嬎銠C(jī)可讀介質(zhì)上的代碼可以提供用于執(zhí)行本文記載的功能的模塊。圖5是示出用于對音頻或語音進(jìn)行處理的方法或算法的示例的流程圖。該方法、處理或算法可以由音頻或語音處理系統(tǒng)或者由某些其它適當(dāng)?shù)哪K來實現(xiàn)。轉(zhuǎn)向圖5,在步驟502中,生成多個幀。所述幀中的每個幀包 括多個變換系數(shù)。在步驟504中,向所述幀中的每個幀中的變換系數(shù)分配比特,使得同一幀中的變換系數(shù)中的至少兩個具有不同的比特分配,并且向所述幀中的至少兩個幀中的變換系數(shù)分配的比特的總數(shù)相等。該分配可以基于包括多個比特分配向量的字典。所述比特分配向量中的每一個可以包括多個元素,其中,所述元素中的每一個代表針對所述幀中的任意一個幀中的變換系數(shù)中的相應(yīng)的一個變換系數(shù)的可能的比特分配。所述比特分配向量中的每一個中的元素的總額等于固定的數(shù)目。圖6是示出向多個幀中的每個幀中的變換系數(shù)分配比特的過程的示例的流程圖。在步驟602中,基于所述幀的變換系數(shù)中的至少一個的量級來計算度量。在步驟604中,基于所述度量從針對該幀的字典中選擇比特分配向量中的一個分配向量。在步驟606中,基于所選擇的比特分配向量來對該幀的變換系數(shù)進(jìn)行量化。在步驟608中,標(biāo)識所選擇的比特分配向量的索引與該幀一起進(jìn)行發(fā)送。索引可以在該幀中進(jìn)行發(fā)送或者獨立于該幀進(jìn)行發(fā)送。圖7是示出用于向多個幀中的每個幀中的變換系數(shù)分配比特的過程的替代示例的流程圖。在步驟702中,基于至少兩個幀的變換系數(shù)中的至少一個的量級來計算度量。在步驟704中,基于該度量,針對所述至少兩個幀來從字典中選擇比特分配向量中的一個分配向量。在步驟706中,基于所選擇的比特分配向量,對所述多個幀中的所述至少兩個幀中的每個幀的變換系數(shù)進(jìn)行量化。在步驟708中,將標(biāo)識所選擇的比特分配向量的索引與所述至少兩個幀中的每個幀一起進(jìn)行發(fā)送。應(yīng)該理解的是,在公開的過程中的步驟的特定順序或?qū)哟问鞘纠苑椒ǖ囊粋€例子。應(yīng)該理解的是,根據(jù)設(shè)計偏好,過程中的步驟的特定順序或?qū)哟慰梢员恢匦屡帕?。所附的方法?quán)利要求以示例性順序呈現(xiàn)了多個步驟的要素,而并不意味著受限于所呈現(xiàn)的特定順序或?qū)哟?。提供前面的描述以使本領(lǐng)域任何技術(shù)人員能夠?qū)崿F(xiàn)本文所描述的各個方面。對于本領(lǐng)域技術(shù)人員來說,對這些方面的各種修改將是顯而易見的,并且本文定義的總體原理可以應(yīng)用于其它方面。因此,權(quán)利要求并不旨在限于本文所示的各個方面,而是與符合書面權(quán)利要求的最廣范圍相一致,其中,除非另外指定,否則以單數(shù)形式引用某一要素并不旨在意味著“一個且僅僅一個”,而是“一個或多個”。除非另外專門指定,否則術(shù)語“一些”是指一個或多個。男性的代詞(例如,他的)包括女性和中性(例如,她的和它的),并且反之亦然。貫穿本發(fā)明所描述的各個方面的要素的所有結(jié)構(gòu)和功能等價物以引用方式明確地并入本文中并且旨在由權(quán)利要求涵蓋,這些結(jié)構(gòu)和功能等價物對于本領(lǐng)域普通技術(shù)人員來說是公知的或?qū)⒁枪?。此外,本文中沒有任何公開內(nèi)容是想要奉獻(xiàn)給公眾的,不管這樣的公開內(nèi)容是否明確地記載在權(quán)利要求書中。不應(yīng)依據(jù)35U.S.C. §112第6段的規(guī)定來解釋任何權(quán)利要求的要素,除非該要素是用短語“用于……的模塊”來明確地敘述的,或者在方 法權(quán)利的情況下,該要素是使用短語“用于……的步驟”來敘述的。
權(quán)利要求
1.一種音頻或語音處理的方法,包括 生成多個幀,所述幀中的每個幀包括多個變換系數(shù);以及 向所述幀中的每個幀中的所述變換系數(shù)分配比特,使得同一幀中的所述變換系數(shù)中的至少兩個具有不同的比特分配,并且向所述幀中的至少兩個幀中的所述變換系數(shù)分配的所述比特的總數(shù)相等。
2.根據(jù)權(quán)利要求I所述的方法,其中,所述比特的所述分配是基于包括多個比特分配向量的字典的。
3.根據(jù)權(quán)利要求2所述的方法,其中,所述比特分配向量中的每一個包括多個元素,所述元素中的每一個代表針對所述幀中的任一幀中的所述變換系數(shù)中的相應(yīng)的一個的可能的比特分配,其中,所述字典中的所有比特分配向量的所述元素的總額等于固定的數(shù)目。
4.根據(jù)權(quán)利要求2所述的方法,其中,所述分配包括針對所述幀中的每個幀從所述字典中選擇所述比特分配向量中的一個分配向量。
5.根據(jù)權(quán)利要求4所述的方法,其中,所述分配包括基于針對所述幀中的每個幀所選擇的比特分配向量來對該幀中的所述變換系數(shù)進(jìn)行量化。
6.根據(jù)權(quán)利要求4所述的方法,其中,所述選擇包括基于所述幀的所述變換系數(shù)中的至少一個的量級來計算度量,以及基于所述度量來選擇所述比特分配向量。
7.根據(jù)權(quán)利要求4所述的方法,其中,所述比特分配向量中的每一個是由索引來標(biāo)識的,所述方法還包括發(fā)送所述巾貞中的每個巾貞與針對該巾貞所選擇的所述比特分配向量的所述索引。
8.根據(jù)權(quán)利要求7所述的方法,其中,所述幀中的每個幀的所述索引是在所述幀中的每個幀中發(fā)送的。
9.根據(jù)權(quán)利要求7所述的方法,其中,所述幀中的每個幀的所述索引是獨立于所述幀中的每個幀的發(fā)送而發(fā)送的。
10.根據(jù)權(quán)利要求2所述的方法,其中,所述分配包括針對所述幀中的至少兩個幀從所述字典中選擇所述比特分配向量中的一個分配向量。
11.根據(jù)權(quán)利要求10所述的方法,其中,所述選擇包括基于所述幀中的所述至少兩個幀中的所述變換系數(shù)中的至少一個的量級來計算度量,以及基于所述度量來選擇所述比特分配向量。
12.根據(jù)權(quán)利要求10所述的方法,其中,所述分配還包括基于所選擇的比特分配向量來對所述幀中的所述至少兩個幀中的每個幀中的所述變換系數(shù)進(jìn)行量化。
13.根據(jù)權(quán)利要求10所述的方法,其中,所述比特分配向量中的每一個是由索引來標(biāo)識的,所述方法還包括發(fā)送所述幀中的所述至少兩個幀與所述比特分配向量的所述索引。
14.一種用于音頻或語音處理的裝置,包括 處理系統(tǒng),其配置為 生成多個幀,所述幀中的每個幀包括多個變換系數(shù);以及 向所述幀中的每個幀中的所述變換系數(shù)分配比特,使得同一幀中的所述變換系數(shù)中的至少兩個具有不同的比特分配,并且向所述幀中的至少兩個幀中的所述變換系數(shù)分配的所述比特的總數(shù)相等。
15.根據(jù)權(quán)利要求14所述的裝置,其中,所述處理系統(tǒng)還包括具有多個比特分配向量的字典,并且其中,所述處理系統(tǒng)還配置為基于所述字典來分配所述比特。
16.根據(jù)權(quán)利要求15所述的裝置,其中,所述比特分配向量中的每一個包括多個元素,所述元素中的每一個代表針對所述幀中的任意一個幀中的所述變換系數(shù)中的相應(yīng)的一個的可能的比特分配,其中,所述字典中的所有所述比特分配向量的所述元素的總額等于固定的數(shù)目。
17.根據(jù)權(quán)利要求15所述的裝置,其中,所述處理系統(tǒng)還配置為通過針對所述幀中的每個巾貞從所述字典中選擇所述比特分配向量中的一個分配向量來分配比特。
18.根據(jù)權(quán)利要求17所述的裝置,其中,所述處理系統(tǒng)還配置為通過基于針對所述幀中的每個幀所選擇的比特分配向量對該幀中的所述變換系數(shù)進(jìn)行量化來分配比特。
19.根據(jù)權(quán)利要求17所述的裝置,其中,所述處理系統(tǒng)還配置為通過下列操作來選擇所述比特分配向量中的一個分配向量基于所述幀中所述變換系數(shù)中的至少一個的量級來計算度量,并且基于所述度量選擇所述比特分配向量。
20.根據(jù)權(quán)利要求17所述的裝置,其中,所述比特分配向量中的每一個是由索引來標(biāo)識的,并且其中,所述裝置還包括發(fā)射機(jī),所述發(fā)射機(jī)配置為發(fā)送所述幀中的每個幀與針對該幀所選擇的所述比特分配向量的所述索引。
21.根據(jù)權(quán)利要求20所述的裝置,其中,所述發(fā)射機(jī)配置為在所述幀中的每個幀中發(fā)送該幀的所述索引。
22.根據(jù)權(quán)利要求20所述的裝置,其中,所述發(fā)射機(jī)配置為將所述幀中的每個幀的所述索引獨立于所述幀中的每個幀的傳輸來進(jìn)行發(fā)送。
23.根據(jù)權(quán)利要求15所述的裝置,其中,所述處理系統(tǒng)還配置為通過針對所述幀中的至少兩個幀從所述字典中選擇所述比特分配向量中的一個分配向量來分配比特。
24.根據(jù)權(quán)利要求23所述的裝置,其中,所述處理系統(tǒng)還配置為通過以下操作來選擇所述比特分配向量基于所述幀中的所述至少兩個幀的所述變換系數(shù)中的至少一個的量級來計算度量,并且基于所述度量來選擇所述比特分配向量。
25.根據(jù)權(quán)利要求23所述的裝置,其中,所述處理系統(tǒng)還配置為通過基于所選擇的比特分配向量對所述幀中的所述至少兩個幀中的每個幀的所述變換系數(shù)進(jìn)行量化來分配比特。
26.根據(jù)權(quán)利要求23所述的裝置,其中,所述比特分配向量中的每一個是由索引來標(biāo)識的,并且其中,所述裝置還包括發(fā)射機(jī),所述發(fā)射機(jī)配置為將所述幀中的所述至少兩個幀與針對所述幀中的所述至少兩個幀所選擇的所述比特分配向量的所述索引一起進(jìn)行發(fā)送。
27.一種用于音頻或語音處理的裝置,包括 用于生成多個幀的模塊,所述幀中的每個幀包括多個變換系數(shù);以及 用于向所述幀中的每個幀中的所述變換系數(shù)分配比特,使得同一幀中的所述變換系數(shù)中的至少兩個具有不同的比特分配,并且向所述幀中的至少兩個幀中的所述變換系數(shù)分配的所述比特的總數(shù)相等的模塊。
28.根據(jù)權(quán)利要求27所述的裝置,其中,所述用于分配比特的模塊包括用于基于包括多個比特分配向量的字典來分配所述比特的模塊。
29.根據(jù)權(quán)利要求28所述的裝置,其中,所述比特分配向量中的每一個包括多個元素,所述元素中的每一個代表針對所述幀中的任意一個幀中的所述變換系數(shù)中的相應(yīng)的一個的可能的比特分配,其中,所述字典中的所有所述比特分配向量的所述元素的總額等于固定的數(shù)目。
30.根據(jù)權(quán)利要求28所述的裝置,其中,所述用于分配比特的模塊包括用于針對所述幀中的每個幀從所述字典中選擇所述比特分配向量中的一個分配向量的模塊。
31.根據(jù)權(quán)利要求30所述的裝置,其中,所述用于分配的模塊包括用于基于針對所述幀中的每個幀所選擇的比特分配向量來對該幀中的所述變換系數(shù)進(jìn)行量化的模塊。
32.根據(jù)權(quán)利要求30所述的裝置,其中,所述用于選擇的模塊包括用于基于所述幀中的所述變換系數(shù)的量級來計算度量的模塊,以及用于基于所述度量來選擇所述比特分配向量的模塊。
33.根據(jù)權(quán)利要求30所述的裝置,其中,所述比特分配向量中的每一個是由索引來標(biāo)識的,所述裝置還包括用于發(fā)送所述幀中的每個幀與針對該幀所選擇的所述比特分配向量的所述索引的模塊。
34.根據(jù)權(quán)利要求33所述的裝置,其中,所述用于發(fā)送的模塊包括用于在所述幀中的每個幀中發(fā)送該幀的所述索引的模塊。
35.根據(jù)權(quán)利要求33所述的裝置,其中,所述用于發(fā)送的模塊包括用于將所述幀中的每個幀的所述索引獨立于所述幀中的每個幀的傳輸來進(jìn)行發(fā)送的模塊。
36.根據(jù)權(quán)利要求28所述的裝置,其中,用于分配比特的模塊還包括用于針對所述幀中的至少兩個幀從所述字典中選擇所述比特分配向量中的一個分配向量的模塊。
37.根據(jù)權(quán)利要求36所述的裝置,其中,所述用于選擇所述比特分配向量中的一個分配向量的模塊包括用于基于所述幀中的所述至少兩個幀的所述變換系數(shù)中的至少一個的量級來計算度量的模塊,以及用于基于所述度量來選擇所述比特分配向量的模塊。
38.根據(jù)權(quán)利要求36所述的裝置,其中,所述用于分配比特的模塊還包括用于基于所選擇的比特分配向量對所述幀中的所述至少兩個幀中的每個幀的所述變換系數(shù)進(jìn)行量化的模塊。
39.根據(jù)權(quán)利要求36所述的裝置,其中,所述比特分配向量中的每一個是由索引來標(biāo)識的,所述裝置還包括用于將所述幀中的所述至少兩個幀與針對所述幀中的所述至少兩個幀所選擇的所述比特分配向量的所述索引一起進(jìn)行發(fā)送的模塊。
40.一種用于處理音頻或語音的計算機(jī)程序產(chǎn)品,包括 使用代碼進(jìn)行編碼的計算機(jī)可讀介質(zhì),所述代碼可以由處理器執(zhí)行以進(jìn)行以下操作 生成多個幀,所述幀中的每個幀包括多個變換系數(shù);以及 向所述幀中的每個幀中的所述變換系數(shù)分配比特,使得同一幀中的所述變換系數(shù)中的至少兩個具有不同的比特分配,并且向所述幀中的至少兩個幀中的所述變換系數(shù)分配的所述比特的總數(shù)相等。
41.一種耳機(jī),包括 換能器; 處理系統(tǒng),其配置為 根據(jù)從所述換能器輸出的音頻或語音生成多個幀,所述幀中的每個幀包括多個變換系數(shù);以及 向所述幀中的每個幀中的所述變換系數(shù)分配比特,使得同一幀中的所述變換系數(shù)中的至少兩個具有不同的比特分配,并且向所述幀中的至少兩個幀中的所述變換系數(shù)分配的所述比特的總數(shù)相等;以及 發(fā)射機(jī),其配置為發(fā)送所述幀。
42.一種手表,包括 用戶接口 ; 處理系統(tǒng),其被配置為 根據(jù)從所述用戶接口輸出的音頻或語音生成多個幀,所述幀中的每個幀包括多個變換系數(shù);以及 向所述幀中的每個幀中的所述變換系數(shù)分配比特,使得同一幀中的所述變換系數(shù)中的至少兩個具有不同的比特分配,并且向所述幀中的至少兩個幀中的所述變換系數(shù)分配的所述比特的總數(shù)相等;以及發(fā)射機(jī),其配置為發(fā)送所述幀。
43.一種感測裝置,包括 傳感器; 處理系統(tǒng),其配置為 根據(jù)從所述傳感器輸出的音頻或語音生成多個幀,所述幀中的每個幀包括多個變換系數(shù);以及 向所述幀中的每個幀中的所述變換系數(shù)分配比特,使得同一幀中的所述變換系數(shù)中的至少兩個具有不同的比特分配,并且向所述幀中的至少兩個幀中的所述變換系數(shù)分配的所述比特的總數(shù)相等;以及 發(fā)射機(jī),其配置為發(fā)送所述幀。
全文摘要
用于音頻和語音處理的方法和裝置包括生成多個幀,其中所述幀中的每個幀包括多個變換系數(shù);以及向所述幀中的每個幀中的變換系數(shù)分配比特,使得同一幀中的變換系數(shù)中的至少兩個具有不同的比特分配并且向所述幀中的至少兩個幀中的變換系數(shù)分配的比特總數(shù)相等。
文檔編號G10L19/00GK102714037SQ201080058579
公開日2012年10月3日 申請日期2010年12月22日 優(yōu)先權(quán)日2009年12月22日
發(fā)明者A·法澤勒德庫爾迪, H·加魯達(dá)德里, S·馬宗達(dá) 申請人:高通股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
东乡族自治县| 滕州市| 大理市| 郓城县| 三穗县| 宝兴县| 赣榆县| 义马市| 东明县| 通河县| 九江县| 巴中市| 镇江市| 巴楚县| 讷河市| 阳信县| 雷州市| 富民县| 基隆市| 广饶县| 龙泉市| 南和县| 淮南市| 玛沁县| 岳普湖县| 黔南| 全椒县| 贞丰县| 东辽县| 两当县| 炎陵县| 新沂市| 神木县| 岗巴县| 兰溪市| 高州市| 扶余县| 门源| 徐汇区| 原平市| 昌江|