用于重新同步分組音頻流的方法和裝置的制作方法

文檔序號：2836964閱讀：235來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：用于重新同步分組音頻流的方法和裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明的實(shí)施例涉及通信，并且更具體地說，涉及對數(shù)據(jù)分組的處理。
背景技術(shù)：
無線電通信系統(tǒng)，例如蜂窩系統(tǒng)(例如擴(kuò)頻系統(tǒng)(例如碼分多址 (CDMA)網(wǎng)絡(luò))、或時分多址(TDMA)網(wǎng)絡(luò))和廣播系統(tǒng)(例如數(shù)字視頻廣播(DVB))，以豐富的服務(wù)和特征集合向用戶提供移動性的便利性。這種4更利性已經(jīng)導(dǎo)致數(shù)量不斷增長的消費(fèi)者大量采用無線電通信系統(tǒng) 作為商業(yè)和個人使用的公認(rèn)通信模式。為了促進(jìn)更多的采用，從制造商到服務(wù)提供商的電信產(chǎn)業(yè)已經(jīng)以龐大的開支和努力達(dá)成一致，來開發(fā)用于在各種服務(wù)和特征之下的通信協(xié)議的標(biāo)準(zhǔn)。一個努力的關(guān)鍵領(lǐng)域涉及語音或音頻流的傳輸，例如語音在互聯(lián)網(wǎng)協(xié)議上(VoIP)。已經(jīng)認(rèn)識到當(dāng)分組被延時或丟失時，傳統(tǒng)方式不能充分地解決與解碼過程相關(guān)聯(lián)的信號質(zhì)量。由于這些分組不,皮解碼，分組的延時或丟失引起解碼器內(nèi)同步的丟失。因此，這對播放的信號的質(zhì)量產(chǎn)生不利影響，尤其是關(guān)于基音(pitch)。
因此，需要當(dāng)語音或音頻數(shù)據(jù)被延時或丟失時有效地保持分組音頻流的信號質(zhì)量。

發(fā)明內(nèi)容
本發(fā)明解決這些和其它需求，其中，提出一種方法，用于保持語音或
音頻信號的自然基音(pitch)周期性。
根據(jù)本發(fā)明實(shí)施例一方面，一種方法，包括檢測包括音頻信息的遲到幀，其中基于所檢測的遲到幀執(zhí)行隱藏。所述方法還包括確定由所述隱藏引入的基音相位差異。所述方法還包括在播放隨所述遲到幀之后的后續(xù) 幀之前，補(bǔ)償所述基音相位差異。
根據(jù)本發(fā)明實(shí)施例的另一方面，一種裝置，包括基音相位補(bǔ)償邏輯，被配置為檢測包括音頻信息的遲到幀，其中基于所檢測的遲到幀執(zhí)行隱藏。所述基音相位補(bǔ)償邏輯被配置為確定所述隱藏引入的基音相位差異，并且在播放隨所述遲到幀之后的后續(xù)幀之前，補(bǔ)償所述基音相位差異。
根據(jù)本發(fā)明實(shí)施例的又一方面，一種系統(tǒng)，包括:用于檢測包括音頻信息的遲到幀的裝置，其中基于所檢測的遲到幀執(zhí)行隱藏；用于確定所述隱藏引入的基音相位差異的裝置，以及用于在播放隨所述遲到幀之后的后續(xù) 幀之前，補(bǔ)償所述基音相位差異的裝置。
簡單地通過示出多個特定實(shí)施例和實(shí)現(xiàn)方式一一其中包括構(gòu)思為執(zhí)4亍本發(fā)明實(shí)施例的最佳^t式，本發(fā)明的其它方面、特征和優(yōu)點(diǎn)從下面的詳細(xì) 描述就變得更加清楚。本發(fā)明還能夠具有其它不同的實(shí)施例，并且在不脫離本發(fā)明的精神和范圍的情況下，可以在各個明顯的方面修改一些細(xì)節(jié)。因此，附圖和說明書被看作是示例性的而不是限制性的。

在附圖中，以舉例而非限制的方式來示出本發(fā)明實(shí)施例，相似的標(biāo)號表示相似的元件，其中
圖1A和1B分別是根據(jù)本發(fā)明各個實(shí)施例、能夠提供音頻流的重新同步的示例接收機(jī)的示圖以及音頻恢復(fù)過程的流程圖2是與一個遲到幀相關(guān)聯(lián)的示例解碼器輸出的示圖3是傳統(tǒng)隱藏過程的解碼信號示圖和根據(jù)本發(fā)明實(shí)施例的遲到分組處理過程的解碼信號示圖4是涉及對傳統(tǒng)隱藏過程和遲到分組處理過程的使用的激勵信號示
圖5是根據(jù)本發(fā)明實(shí)施例的在重新同步過程中使用的信號之間關(guān)系的
示圖6是根據(jù)本發(fā)明實(shí)施例的重新同步過程的流程圖7是根據(jù)本發(fā)明實(shí)施例的、涉及重新同步過程的使用的激勵信號示
圖8A-D是根據(jù)本發(fā)明的各種實(shí)施例、與確定和說明基音相位差異相關(guān)聯(lián)的過程的流程；
圖9是可以用于實(shí)現(xiàn)本發(fā)明實(shí)施例的硬件的示圖10A和10B是能夠支持本發(fā)明各個實(shí)施例的不同蜂窩移動電話系統(tǒng) 的示圖11是才艮據(jù)本發(fā)明實(shí)施例、能夠在圖10A和圖10B的系統(tǒng)中運(yùn)行的移動站的示例性組件的示圖；以及
圖12是根據(jù)本發(fā)明實(shí)施例、能夠支持在此描述的過程的企業(yè)網(wǎng)絡(luò)的示圖。
M實(shí)施方式
公開了用于重新同步音頻流的裝置、方法和軟件。在以下描述中，為了解釋的目的，闡述大量特定細(xì)節(jié)，以提供對本發(fā)明實(shí)施例的透徹的理解。然而，本領(lǐng)域技術(shù)人員應(yīng)理解，可以在沒有這些特定細(xì)節(jié)的情況下或以等同方案來實(shí)踐本發(fā)明。在其它情況下，以;fe圖形式示出熟知的結(jié)構(gòu)和i殳備，以避免不必要地模糊本發(fā)明實(shí)施例。
雖然關(guān)于分組網(wǎng)絡(luò)來討論本發(fā)明實(shí)施例，但本領(lǐng)域技術(shù)人員應(yīng)理解，本發(fā)明實(shí)施例能夠應(yīng)用于任意類型的數(shù)據(jù)網(wǎng)絡(luò)，包括基于信元的網(wǎng)絡(luò)(例如，異步傳輸模式(ATM))。此外，可以預(yù)計(jì)這里描述的協(xié)議和過程不僅可以被移動和/或無線設(shè)備執(zhí)行，還可以被任何固定(或非移動)通信設(shè)備(例如，臺式計(jì)算機(jī)、網(wǎng)絡(luò)裝置等)或網(wǎng)絡(luò)元件或節(jié)點(diǎn)執(zhí)行。
除了其它電信業(yè)務(wù)外，分組網(wǎng)絡(luò)被用于傳輸分組的語音會話(或呼叫)。作為例子，這些網(wǎng)絡(luò)支持互聯(lián)網(wǎng)協(xié)議(IP)。分組網(wǎng)絡(luò)上的傳輸?shù)奶卣髟?于通過網(wǎng)絡(luò)的分組傳輸時間中的變化，在網(wǎng)絡(luò)中某些分組被完全丟失。分組的實(shí)際到達(dá)時間和按精確分組速率的參考時鐘之間的差異稱為抖動。
圖1A示意了根據(jù)本發(fā)明的各種實(shí)施例，能夠提供音頻流的重新同步的示例接收機(jī)的示圖。作為示意，在由數(shù)據(jù)幀或分組(例如分組的語音、具有音頻內(nèi)容的視頻流等)表示的音頻信息的情況下解釋音頻系統(tǒng)100，例如接收機(jī)。音頻系統(tǒng)100包括分組緩存器101，被配置為存儲已經(jīng)接收的分組。系統(tǒng)100還包括隱藏邏輯103，用于當(dāng)分組不可得到時，執(zhí)行產(chǎn) 生替代幀的隱藏過程?；粝辔谎a(bǔ)償邏輯105用于對隱藏輸出和后續(xù)輸出之間的過渡進(jìn)行平滑。隱藏邏輯103和基音相位補(bǔ)償邏輯105與解碼器(例如，預(yù)測解碼邏輯)107交互操作，解碼器107向播放模塊109輸出被解碼的幀。
作為典型應(yīng)用，音頻系統(tǒng)100可以被實(shí)現(xiàn)為語音在互聯(lián)網(wǎng)協(xié)議上 (VoIP)的接收機(jī)。在這種情況下，緩存器101還可以用于控制抖動的影響。因而，緩存器101把不規(guī)則的到達(dá)分組流轉(zhuǎn)換成規(guī)則的分組流，從而語音解碼器107可以向收聽者提供持續(xù)不斷的語音流。這些流可以是表示任何類型的聽覺信息——包括語音和音頻一一的數(shù)據(jù)流。然而，可以預(yù)計(jì) 這里所描述的方法還可以應(yīng)用到包括音頻信息的視頻流中。
分組緩存器101通過引入額外的延時來操作，該延時被稱為"播放延時，，(相對于參考時鐘來定義該延時，例如在第一分組的接收時開始)。例如，可以選擇播放延時以最小化因到達(dá)太晚而不能被解碼的分組的數(shù)量，同時保持整體的端到端延時在可接受限度內(nèi)。
在播放時間之前到達(dá)的分組被臨時存儲在接收緩存器中。當(dāng)?shù)竭_(dá)其播放時間時，這些分組被從緩存器中取出、解碼并通過播放模塊109播放。丟失的分組和在播放時間之后到達(dá)的分組不能被解碼；因此，計(jì)算了替代的語音或視頻片斷。此外，解碼器內(nèi)部狀態(tài)不正確。在這種情況下，調(diào)用通過隱藏邏輯103的隱藏過程而不是正常解碼過程以代替丟失的語音或音頻片斷。隱藏邏輯103維持內(nèi)部狀態(tài)信息103a，例如可以通過使用狀態(tài)機(jī)實(shí)現(xiàn)該狀態(tài)。同樣的，解碼器107為解碼過程維持狀態(tài)信息107a。
傳統(tǒng)隱藏過程具有在隱藏片斷中引入差錯的缺點(diǎn)。而且，該隱藏過程并不能正確地更新解碼器107的內(nèi)部狀態(tài)。因此，由于解碼器107的預(yù)測性特性，由隱藏過程引入的差錯通常在隨后的片斷中傳播。注意，由于每個分組是獨(dú)立的，非預(yù)測性編碼器/解碼器(編解碼器)不具有差錯傳播。
盡管在分組網(wǎng)絡(luò)上的語音情況下遲到分組通常被認(rèn)為丟失，這些遲到分組可以用于降低差錯傳播，如同1983年12月，巻SAC-l,第6期，的 IEEE Journal on Selected Areas in Communications,在題為"Techniques for Packet Voice Synchronization"中所解釋的，其全部內(nèi)容通過引用被合并在此。
當(dāng)分組不是丟失而是僅僅^^時時，其內(nèi)容可以用于更新解碼器107 的"后驗(yàn)的，，內(nèi)部狀態(tài)。這限制了，并且在某些情況下，停止了由隱藏引起的差錯傳播。注意到，必須非常注意以保證在隱藏的輸出片斷和利用更新的內(nèi)部狀態(tài)計(jì)算的后續(xù)"更新的，，輸出片斷之間的平滑過渡。在2003 年4月，ICASSP中由P.Gournay等人發(fā)表的題為"Improved packet loss recovery using late frames for prediction-based speech coder"的文章中詳細(xì)描述了這種技術(shù)，其全部內(nèi)容通過引用被合并在此。
預(yù)測性語音或音頻解碼器的隱藏邏輯103通常在濁音或準(zhǔn)周期片斷中引入基音相位差異。該基音相位差異對信號質(zhì)量有害，使得當(dāng)從隱藏的輸出片斷轉(zhuǎn)到隨后的利用正確的更新內(nèi)部狀態(tài)計(jì)算的"更新"輸出片斷時，使用傳統(tǒng)淡入、淡出技術(shù)變得非常困難。
與傳統(tǒng)"淡入淡出"過程相比，基音相位補(bǔ)償邏輯105提供了一種過程，以有效地平滑在這兩個片斷之間的過渡。尤其的，其解決了當(dāng)從一個片斷轉(zhuǎn)到另一片斷時如何維持語音或音頻信號的自然基音周期性的問題。
圖IB是根據(jù)本發(fā)明各種實(shí)施例的音頻恢復(fù)過程的示例流程。在步驟121，檢測遲到的或丟失的分組。因此，在步驟123，啟動隱藏過程以產(chǎn)生替代幀。之后，當(dāng)遲到幀被處理時，在步驟125確定由隱藏過程引起的基音相位差異。在步驟127，該過程基于確定的基音相位差異來平滑在隱藏幀和后續(xù)幀之間的過渡。
在示例實(shí)施例中，上述重新同步過程可以應(yīng)用到CDMA 2000 lx EV-DO (演進(jìn)-數(shù)據(jù)最優(yōu)化)系統(tǒng)中。本領(lǐng)域技術(shù)人員認(rèn)識到，本發(fā)明可以應(yīng)用到利用其它技術(shù)(例如一般而言的擴(kuò)頻系統(tǒng)，以及時分復(fù)用(TDM) 系統(tǒng))和通信協(xié)議的任何類型的無線電網(wǎng)絡(luò)中。
圖2是與一個遲到幀相關(guān)聯(lián)的示例解碼器輸出的示圖。特別的，該圖示意了當(dāng)遲到幀被認(rèn)為丟失(情況203)以及當(dāng)遲到幀用于更新解碼器107 的內(nèi)部狀態(tài)(情況201)時該遲到幀的影響。正確的輸出顯示為白色，并且差錯傳播顯示為灰色。情況205是在沒有丟失的或者遲到的幀的情況下，解碼器107的輸出。
作為例子，二進(jìn)制幀祐:接收并且被正常地解碼一直到幀《-1。幀w并不能凈皮及時得到以用于解碼。隱藏過程產(chǎn)生與期望的輸出不同的某些替代輸出。由于解碼器107的內(nèi)部狀態(tài)在原始解碼器中并不被正確地更新，由幀《引入的差錯在隨后的幀中傳播(情況203)。
現(xiàn)在假設(shè)幀w在對幀w+l的解碼之前到達(dá)分組緩存器IOI(情況201 )。考慮下面的情況(i)丟棄幀ii的內(nèi)容，并且使用由隱藏產(chǎn)生的"壞的" 內(nèi)部狀態(tài)，并且如同在解碼器107中正常執(zhí)行那樣，解碼幀w+l;或者(ii) 把解碼器107的內(nèi)部狀態(tài)恢復(fù)為在幀w-l結(jié)束時的值，解碼幀w而不輸出解碼的語音(這將導(dǎo)致把內(nèi)部狀態(tài)更新為其"好的"值)，以及(iii)解碼幀《+1，好像沒有出現(xiàn)差錯。
在一個實(shí)施例中，需要某些平滑以防止在幀w和幀w+l之間的邊界上的4壬何不連續(xù)性。這可以通過4吏用淡入、淡出窗口對(圖2中的)信號(i) 和(iii)加權(quán)并在該隱藏之后根據(jù)內(nèi)部狀態(tài)(例如，實(shí)際的過去的合成的采樣)取合成濾波器的記憶(memory)，來在激勵域執(zhí)行。
圖3是傳統(tǒng)隱藏過程的解碼信號和根據(jù)本發(fā)明的實(shí)施例的遲到分組處理過程的解碼信號的示圖。信號301是當(dāng)沒有幀丟失時解碼器的輸出。信號303是當(dāng)?shù)?個幀被丟失并且隱藏后的解碼器的輸出。由于在濁音開始期間發(fā)生丟失，其觸發(fā)強(qiáng)能量丟失(跨越一個完整的音素)以及較大的失真等級。在這種情況下，恢復(fù)時間較長(差錯信號307)。信號305是當(dāng) 使用尸.Go"r"fl^等人的文章中描述的方式在隱藏之后執(zhí)行更新時的解碼器的輸出。由于解碼器及時地可獲得所有所需的信息以進(jìn)行考慮，恢復(fù)比較快并且完整(差錯信號309)。所有的信號(包括差錯)以相同的幅度比例表示。盡管P.Gournay等人的技術(shù)對于降低在遲到分組后的差錯傳播非常有效，其并不能適當(dāng)?shù)靥幚碛呻[藏引入的基音相位差異。在某些情況下，為了平滑在隱藏的片斷和"更新"的片斷之間的過渡而執(zhí)行的淡入、淡出操作甚至?xí)茐男盘柕淖匀恢芷谛?。在這些情況下，產(chǎn)生了局部的但是可聽到的并且令人非常不愉快的失真。
圖4是涉及對傳統(tǒng)隱藏過程和傳統(tǒng)遲到分組處理過程的使用的激勵信號示圖。信號401是當(dāng)沒有幀丟失時由解碼器107計(jì)算的激勵信號。信號 403是當(dāng)?shù)诙徽J(rèn)為丟失并被隱藏時的激勵信號?；粝辔徊町愑呻[藏 103引入并且由解碼器107向后傳播；可以清楚地看到信號401和信號403 在第三幀中失去同步。信號405是當(dāng)相同幀被用于更新內(nèi)部狀態(tài)時的激勵信號。在執(zhí)行、^淡出操作的第三幀中，基音周期性被明顯地破壞(;i^、淡出過程在第三幀的中間附近產(chǎn)生了兩個基音脈沖，其在空間上太近，并且不具有足夠能量)。
現(xiàn)在更詳細(xì)的描述用于確定基音相位差異和利用基音相位差異來平滑在隱藏的幀和后續(xù)幀之間的過渡的方法。以并不破壞語音或音頻信號的自然基音周期性的方式來執(zhí)行該過渡。
圖5是根據(jù)本發(fā)明的一個實(shí)施例，在重新同步過程中利用的在信號之間關(guān)系的示圖。特別的，圖5顯示了緊跟在遲到幀之后的幀中的；,j'和《之間的關(guān)系。信號501是沒有差錯的原始幀，信號503是恰在丟失前面的幀之后的信號(注意基音信號的相位差異)，并且信號505是在更新和重新同步之后的信號(注意這里信號501已經(jīng)與信號503重新校準(zhǔn))。^標(biāo)識了在較好的激勵中用于尋找第一基音脈沖的窗口的開始，)是兩個信號之
間的偏移，并且《是合并信號501和503以形成信號505的最低能量點(diǎn)。注意)'不僅是信號501和503之間的偏移，還是信號505的額外長度。
圖6是根據(jù)本發(fā)明的一個實(shí)施例，重新同步過程的流程。依照本發(fā)明的一個實(shí)施例，在具有應(yīng)用于由圖1A的解碼器107所計(jì)算的激勵信號的修改的碼激勵線性預(yù)測(CELP)編碼器/解碼器(編解碼器)的情況下，解釋重新同步過程。然而，根據(jù)應(yīng)用，可替代地，可以在相似步驟之后對解碼的輸出信號執(zhí)行重新同步過程。為了示意的目的，下面提出的特定實(shí) 現(xiàn)方式用于可變多速率寬帶(VMR-WB)編解碼器，其它編解碼器中的參數(shù)可以不同，但是應(yīng)用相同的原理。在圖1A的系統(tǒng)中，該過程使用遲到幀把解碼器107的內(nèi)部狀態(tài)與編碼器(沒有顯示)的內(nèi)部狀態(tài)進(jìn)行重新同步。
在步驟601，音頻系統(tǒng)100確定接收到的分組是否為"濁音"分組。作為例子，"濁音"指示可以檢測到基音脈沖的周期性或準(zhǔn)周期性語音信號(例如，在聲音/a/， /e/等中)。相反的，清音信號更像噪聲并且由于缺少周期性不能檢測到基音脈沖(例如，/s/)。因此，框圖601區(qū)分濁音和清音語音幀。如果分組并不是濁音分組，則在步驟603,重新同步并不是必須的，并且因此不需要修改，由此保留了好的激勵。為了示意的目的，術(shù)語"好的"激勵表示圖2中的信號(iii)，而"壞的"激勵信號表示圖2 中的信號(i)。好的激勵是在前的幀沒有遲到而得到的激勵信號，并且壞的激勵是在前的幀沒有被恢復(fù)而得到的激勵信號。對好的激勵的記憶 (memory)還可以用于使用；假設(shè)與當(dāng)前的好的激勵相連續(xù)(因此，當(dāng)在當(dāng)前幀中開始"好的"激勵時，可以使用負(fù)索引)。符號"r0"用于表示基音周期，并且表示好的激勵中的第一子幀的基音(除非另外標(biāo)出)。r0 是在編碼的語音分組中傳輸?shù)囊阎獏?shù)。
然而，如果分組與濁音信號相關(guān)，則系統(tǒng)100，在步驟607，尋找具有好的激勵的第一脈沖。然后，系統(tǒng)在步驟609確定在脈沖中是否存在可接受的能量等級。如果是，則在步驟611，系統(tǒng)通過最大化相關(guān)性來尋找移位的采樣數(shù)。
更具體地說，下面解決了對兩個相位不同的濁音信號進(jìn)行重新同步的
問題。第一，尋找將在同步過程中使用的聲門脈沖(步驟607),這可以在好的或者壞的激勵中發(fā)現(xiàn)。第二，該脈沖被移位跨越另一激勵以尋找脈沖相關(guān)最好之處(步驟611)。第三，確定可以進(jìn)行從壞的激勵到好的激勵的轉(zhuǎn)換的、位于脈沖附近的最低能量點(diǎn)。
在示例的實(shí)施例中，聲門脈沖可以是好的激勵的第一脈沖。移位大小
為^的窗口而跨越好的激勵的第一 r。+M采樣，并且取具有最大能量的
位置，給出了聲門脈沖的位置(步驟607)?？梢允褂蒙远嘤趎的采樣以
避免當(dāng)脈沖的一部分位于第o或第n采樣時的臨界線情況。下面的式(l)
描述了用于尋找第一聲門脈沖的算法，^是包含該脈沖的^-采樣窗口的第一采樣
<formula>formula see original document page 14</formula>
并且g卯cf[n]是好的激勵的第w個采樣。對于VMR-WB編解碼器，^j可以械二沒定為10。
還可以使用在壞的激勵中尋找第一脈沖，然而，這種方式相對具有較少吸引力，由于隱藏的脈沖通常不如好的脈沖明確并且因此不能總是被正確地發(fā)現(xiàn)。對jc的其它邊界，例如把搜索集中在0上或者執(zhí)行更短或更長的搜索，也是可靠的，而通過式(1)中給出的邊界產(chǎn)生了關(guān)于VMR-WB 的較好的結(jié)果。
下面的式(2)測量存儲在從式(1)獲得的聲門脈沖中的能量與集中在門聲脈沖的固定時間段的能量數(shù)的百分比(表示編解碼器允許的最小的可能的基音周期)；E表示該百分比。這可以用于在E上設(shè)置一個下限(floor)以保證脈沖不被錯誤地識別(步驟609)。例如，該下限的可能值可以被設(shè)定為80%以防止虛假脈沖被識別為脈沖。該能量比較還防止信號被較差地同步并因此引起某些情況下聲音質(zhì)量比戶.G做mfl^等人所描述的方法還差。<formula>formula see original document page 15</formula>(2)
一旦發(fā)現(xiàn)好的激勵中的第一脈沖并且認(rèn)為滿足能量約束，則通過將脈沖移位跨越壞的激勵并且根據(jù)下式(3)最大化相關(guān)性，來尋找好的和壞的激勵被偏移的采樣總數(shù)(即，為了重新同步需要對其移位的量)，j'。
<formula>formula see original document page 15</formula> (3)
在該式中，F(xiàn)L (幀的長度)是標(biāo)準(zhǔn)大小的幀中的采樣數(shù)(例如，在 VWR-WB中為256)，并且『2是用于計(jì)算相關(guān)性的窗口大小(例如，『2 =15)。根據(jù)本發(fā)明的一個實(shí)施例，僅僅通過好的激勵中的能量來歸一化所實(shí)現(xiàn)的相關(guān)性。該參數(shù)是優(yōu)選的問題并且可以以其它方式歸一化(即，好的和壞的能量一起，或者僅僅壞的能量)。然而，使用不同的相關(guān)性計(jì) 算方法導(dǎo)致不同的j'，并且因此可以確定對于任何給定系統(tǒng)能最佳工作的方法。
如果在步驟613確定了可接受的相關(guān)性強(qiáng)度，則找到了在信號中用于切換激勵的低能量點(diǎn)。于是，該過程合并該激勵并計(jì)算子幀的長度(步驟 617和619)。
然而，如果過程沒有尋找到可接受的能量等級(步驟605)，則調(diào)用窗口函數(shù)來合并該激勵。作為例子，任何標(biāo)準(zhǔn)或傳統(tǒng)過程可以用于該窗口函數(shù)。
為了避免對沒有較好地對齊的信號進(jìn)行重新同步，在步驟613可以使用對于相關(guān)性的下限。例如，在當(dāng)前情況下所使用的值是0.6?？梢詫o出的相關(guān)性低于所選下限的任何信號進(jìn)行修改(例如，根據(jù)尸.G0"f7W^等人)。
由于幀的大小的限制，對于上采樣(upsampling)的目的，在該例子中，VMR-WB中的每個12.8kHz幀的長度應(yīng)當(dāng)可以被4除盡。因此，所發(fā)現(xiàn)的j接近4的倍數(shù)。
該示例方案允許采樣被增加到幀中并且不被移除，即，)一直大于或等于0。例如，執(zhí)行該過程以獲得適合IP網(wǎng)絡(luò)上實(shí)時語音的方案的有益邊緣效應(yīng)。然而，如果需要，還可以允許從幀中移除采樣，即，具有小于0 的)'。當(dāng)需要時，這可以通過修改式(3)中j的邊界以包括負(fù)的索引來實(shí) 現(xiàn)。
樣數(shù)量后，可以在信號中尋找低能量點(diǎn)，在該低能量點(diǎn)處可以進(jìn)行從壞的激勵到好的激勵的改變(步驟615)。為了避免由進(jìn)行突然的能量改變而引起的不想要的偽像，這是必要的。由于在激勵域中執(zhí)行所有的修改，合成濾波器將平滑這里的任何小的改變，這并不引起問題。
根據(jù)本發(fā)明的一個實(shí)施例，通過滑動『3采樣窗口 (例如，IO采樣) 跨越好的激勵中的第^采樣之前的r。/2個采樣，可以執(zhí)行對最低能量點(diǎn)《的尋找(參見式(4))。
<formula>formula see original document page 16</formula>
在某些情況下，當(dāng)；接近O時，該搜索使用好的激勵的記憶(即，好的激勵的負(fù)索引)，但是這將造成一個問題，如果
j + "0 (5) 在這種情況下，在脈沖之前發(fā)現(xiàn)的《出現(xiàn)在之前的幀中，其播放時間已經(jīng) 過去，甚至在將激勵移位)'之后。這實(shí)質(zhì)上指示解碼器107在幀實(shí)際開始一一這不是技術(shù)上的聲音一一之前從壞的激勵切換到好的激勵，。因此，可以在好的激勵的第一脈沖之后就執(zhí)行新的搜索以發(fā)現(xiàn)最低能量點(diǎn)。
如果(j + " 0)，貝'J使用-『3 " S -^ -『3重新進(jìn)行
2
(6)
既然已經(jīng)發(fā)現(xiàn)了移位的量以及在何處結(jié)合兩個信號，好的激勵和壞的 .集合(步驟617)。在包括好的激勵和壞的激勵的新幀中，最初的min j +《}個采樣屬于壞的激勵，而最后的F丄-《個采樣來自好的激勵，在)+ ￡>尸丄的情況下，在壞的激勵和好的激勵之間的()'+《)-F丄個采樣應(yīng)當(dāng)被設(shè)置為0。因此，新幀的長度是尸丄+ j。
根據(jù)示例實(shí)施例，在VMR-WB編解碼器中，定義兩個激勵信號一個用于適應(yīng)性碼本記憶，一個是后處理的并僅僅用于合成。在合成過程中，兩個信號都使用，因此對一個信號進(jìn)行的任何修改需要同樣地對另一信號進(jìn)行執(zhí)行這一點(diǎn)很重要。在這里采用的方法中，對單獨(dú)用于合成的激勵執(zhí) 行所有的計(jì)算，但是在算法的結(jié)尾，兩個激勵都獲得偏移并且如前面的段落所述的那樣被保存。
作為例子，VMR-WB編解碼器^f吏用4子幀，而其它編解碼器可以在這點(diǎn)上不同。在重新同步過程的結(jié)尾，如果幀的大小改變(即，如果力=0 ), 則在步驟619，正確子幀的大小被改變以反映這種差異。對信號的在后濾波是逐個子幀地來執(zhí)行的，因此，子幀長度的總和需要對應(yīng)于整個信號的長度。應(yīng)當(dāng)被修改的子幀長度是《所在的子幀，并且)'的整體值應(yīng)當(dāng)被增加到子幀的原始長度中。新的幀長度是F丄+ )，即，長度被增加j，并且這需要反映在子幀中。
在這種情況下，假設(shè))是正的(即，新幀一直大于正常幀的長度)。然而，如之前所提及的，還可以縮短幀，并且在這種情況下，應(yīng)該修改子幀的長度以反映信號的哪部分應(yīng)當(dāng)被保留或不保留。
如同所解釋的，為了示意的目的，對基于CELP的編解碼器中的激勵
信號執(zhí)行上述計(jì)算和修改。還可以使用基音同步疊加(PSOLA)或其它技術(shù)來對PCM信號執(zhí)行修改。然而，關(guān)于對激勵信號執(zhí)行修改，脈沖編碼調(diào)制(PCM)信號的計(jì)算更加復(fù)雜。
圖7是根據(jù)本發(fā)明實(shí)施例，涉及對重新同步過程的使用的激勵信號的示圖。信號701、 703和705與圖4的信號相似。信號707是由系統(tǒng)100 的遲到分組處理產(chǎn)生的激勵信號。由于之前沒有差錯，第一幀的激勵信號在所有線中相同。由于沒有改變隱藏過程，第二幀在信號703、 705和707 中也相同。可以在第三幀期間使用在尸.G卯rm^等人描述的方法執(zhí)行遲到幀處理?；糁芷谠谛盘?07中被明顯地很好地維持。箭頭指示在擴(kuò)展隱藏的激勵信號和在內(nèi)部狀態(tài)更新之后的(好的)激勵信號之間的切換點(diǎn)。切換點(diǎn)之前的激勵信號準(zhǔn)確地對應(yīng)于"擴(kuò)展的"隱藏的激勵。在切換點(diǎn)之后的激勵信號(最后兩個基音脈沖)準(zhǔn)確地(具有1/3幀延時)對應(yīng)于"好的，，激勵信號701。輸出幀比通常的幀長大約1/3并且比好的激勵多包括一個基音脈沖。
圖8A-8D是根據(jù)本發(fā)明的各種實(shí)施例，與確定和說明基音相位差異相關(guān)聯(lián)的過程的流程圖。在圖8A中，在上述實(shí)現(xiàn)方式中，在步驟801，通過執(zhí)行在一方面使用隱藏的內(nèi)部狀態(tài)(例如圖2的信號(i))計(jì)算的輸出信號和另一方面使用更新的內(nèi)部狀態(tài)(例如圖2的信號(iii))計(jì)算的輸出信號之間的相關(guān)，來尋找差異。注意可以在信號之間確定相關(guān)，其中該信號是解碼器輸出信號或者內(nèi)部解碼器信號(例如，激勵信號)。在步驟803，過程確定產(chǎn)生最大相關(guān)性的延時是所估計(jì)的基音相位差異，并根據(jù)確定的延時來輸出所估計(jì)的基音相位差異(步驟805)。
如圖8B所示，在步驟811，還可以通過首先在使用隱藏的內(nèi)部狀態(tài)中的信號(i)以及4吏用更新的內(nèi)部狀態(tài)的信號(iii)中尋找基音標(biāo)記，來確定基音相位差異(例如，使用基音同步疊加(PSOLA)算法)。在步驟813，該過程比較這些基音標(biāo)記的位置，并在步驟815根據(jù)所確定的延時來輸出所估計(jì)的基音相位差異?？商娲模瑘D8C顯示了在步驟821，通過首先確定隱藏前的最后的基音標(biāo)記的位置，然后使用隱藏的基音值和在遲到幀中發(fā)現(xiàn)的實(shí)際的基音值以確定信號(i)和信號(iii)中的基音標(biāo)記位置(步驟823)，來獲得基音差異。之后，在步驟825，過程根據(jù)確定的基音標(biāo)記位置來輸出所估算的基音相位差異。
在圖8D中，根據(jù)示例實(shí)施例(圖8D所示)，在步驟831，通過把信號(iii)延時相同的數(shù)量可以補(bǔ)償由隱藏引入的基音相位差異。這時，兩個信號(i)和(iii)"同相，，(步驟833)。因此，可以快速的從一個信號切換到另一信號同時不破壞周期性。然而，由于延時已經(jīng)應(yīng)用到信號 (iii),產(chǎn)生的"過渡"輸出幀比普通幀長。在某些應(yīng)用中，這并不導(dǎo)致問題并且甚至可以是令人期望的(即，當(dāng)解碼器與適應(yīng)性抖動緩存器結(jié)合時，較長的輸出幀增加了播放延時，這將降低接收另一遲到幀的可能性)。在需要恒定輸出幀持續(xù)時間的其它應(yīng)用中，可以通過把信號(i )和/或(iii ) 中的單獨(dú)的脈沖稍微移回所引入的一小部分差錯來獲得具有正常長度的 "過渡"輸出幀，其中該差錯是在從一個信號切換到另一信號之前在隱藏期間引入的。
上述方法的另一優(yōu)點(diǎn)是在處理了遲到分組之后改進(jìn)了解碼信號的主觀質(zhì)量。具體來說，確定了通常在濁音語音或周期或準(zhǔn)周期音頻信號期間由隱藏過程引入的基音相位差異，并且遲到分組處理過程考慮該基音相位差異，以便平滑在隱藏的輸出信號和使用更新的內(nèi)部狀態(tài)所計(jì)算的輸出信號之間的過渡。第二個優(yōu)點(diǎn)是允許在隱藏的輸出信號和"更新的"輸出信號之間的(相對于通常的"淡入、淡出"法)更快的切換。另一優(yōu)點(diǎn)在接收到遲到分組后產(chǎn)生通常比正常幀持續(xù)時間長的輸出幀。這增加了播放延時，并且因此降低了接收另一遲到幀的可能性。
本領(lǐng)域普通技術(shù)人員應(yīng)認(rèn)識到，基音相位重新同步的過程可以通過軟
件、硬件(例如普通處理器，數(shù)字信號處理器(DSP)芯片、特定應(yīng)用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)等)、固件或者其組合來實(shí)現(xiàn)。下面通過圖9詳細(xì)描述用于執(zhí)行所述功能的示例硬件。
圖9示出可以在其上實(shí)現(xiàn)本發(fā)明的各個實(shí)施例的示例性硬件。計(jì)算系統(tǒng)900包括總線901或其它通信機(jī)制，用于傳遞信息；以及處理器卯3，其耦合到總線901，以用于處理信息。計(jì)算系統(tǒng)900還包括主存儲器905，例如隨才;i^取存儲器(RAM)或其它動態(tài)存儲設(shè)備，其耦合到總線卯l, 以用于存儲信息和將由處理器903執(zhí)行的指令。主存儲器905還可以被使用以在處理器903執(zhí)行指令期間存儲臨時變量或其它中間信息。計(jì)算系統(tǒng) 900可以進(jìn)一步包括只讀存儲器(ROM)卯7或其它靜態(tài)存儲設(shè)備，其耦合到總線901,為處理器903存儲靜態(tài)信息和指令。存儲設(shè)備卯9 (例如磁盤或光盤)耦合到總線901，以長久存儲信息和指令。
計(jì)算系統(tǒng)卯0可以經(jīng)由總線901耦合到顯示器911，例如液晶顯示器或有源矩陣顯示器，以將信息顯示給用戶。輸入設(shè)備913，例如包括字母數(shù)字鍵和其它鍵的鍵盤，可以耦合到總線卯l，以將信息和命令選擇傳遞
給處理器903。輸入設(shè)備913可以包括光標(biāo)控制，例如鼠標(biāo)、軌跡球、或光標(biāo)方向鍵，以將方向信息和命令選擇傳遞給處理器卯3，并控制光標(biāo)在顯示器911上的運(yùn)動。
根據(jù)本發(fā)明各種實(shí)施例，可以響應(yīng)于處理器卯3執(zhí)行主存儲器卯5中所包含的指令安排，而由計(jì)算系統(tǒng)卯O提供在此描述的過程?？梢詫⑦@樣的指令從另一計(jì)算機(jī)可讀介質(zhì)(例如存儲設(shè)備909 )讀入主存儲器905。對主存儲器卯5所包含的指令安排的執(zhí)行導(dǎo)致了處理器903執(zhí)行在此描述的過程步驟。還可以采用多處理裝置中的一個或多個處理器，以執(zhí)行主存儲器905所包含的指令。在替換實(shí)施例中，可以使用硬連線電路來替代軟件指令或與軟件指令結(jié)合，以實(shí)現(xiàn)本發(fā)明的實(shí)施例。在另一示例中，可以使用可重新配置的^_件，例如現(xiàn)場可編程門陣列(FPGA)，其中，典型地根據(jù)編程存儲器查找表來在運(yùn)行時間定制其邏輯門的功能和連接拓樸。因此，本發(fā)明實(shí)施例不限于硬件電路和軟件的任意特定結(jié)合。
計(jì)算系統(tǒng)卯O還包括至少一個通信接口 915，其耦合到總線901。通信接口 915提自合到網(wǎng)絡(luò)鏈路(未示出)的雙向數(shù)據(jù)通信。通信接口 915 發(fā)送并接收電信號、電磁信號或光信號，這些信號承載了表示各種類型的信息的數(shù)字?jǐn)?shù)據(jù)流。進(jìn)一步地，通信接口 915可以包括外圍接口設(shè)備，例如通用串行總線(USB)接口、 PCMCIA (個人計(jì)算才A^儲器卡國際聯(lián)盟) 接口等。
處理器卯3可以在代碼被接收到的同時執(zhí)行所發(fā)送的代碼，并且/或者將代碼存儲在存^i殳備卯9或其它非易失性存儲器中以用于稍后執(zhí)行。按照該方式，計(jì)算系統(tǒng)900可以獲得載波形式的應(yīng)用代碼。
在此使用的術(shù)語"計(jì)算機(jī)可讀介質(zhì)"指的是參與將指令提供給處理器 903以用于執(zhí)行的任意介質(zhì)。這樣的介質(zhì)可以采用多種形式，包括非易失性介質(zhì)、易失性介質(zhì)和傳輸介質(zhì)，但不限于此。非易失性介質(zhì)包括例如光盤或磁盤，例如存儲設(shè)備909。易失性介質(zhì)包括動態(tài)存儲器，例如主存儲器905。傳輸介質(zhì)包括同軸電纜、銅導(dǎo)線和光纖，其包括包含了總線901 的導(dǎo)線。傳輸介質(zhì)也可以采用例如在射頻(RF)和中頻(IR)數(shù)據(jù)通信期間生成的聲波、光波或電磁波的形式。計(jì)算機(jī)可讀介質(zhì)的通用形式包括例如軟盤、軟磁盤、硬盤、磁帶、任意其它磁介質(zhì)、CD-ROM 、 CDRW、 DVD、任意其它光學(xué)介質(zhì)、打孔卡、紙帶、光標(biāo)記板、具有孔或其它光學(xué) 可識別標(biāo)記的圖案的任意其它物理介質(zhì)、RAM、 PROM、 EPROM和 FLASH-EPROM，任意其它存儲器芯片或盒式磁帶、栽波或計(jì)算機(jī)可讀的任意其它介質(zhì)。
在將指令提供給處理器用于執(zhí)行中，可以包括各種形式的計(jì)算機(jī)可讀介質(zhì)。例如，用于執(zhí)行本發(fā)明的至少一部分的指令可以初始被承載在遠(yuǎn)程計(jì)算機(jī)的磁盤上。在此情況下，遠(yuǎn)程計(jì)算機(jī)將指令加栽到主存儲器，并使用調(diào)制解調(diào)器在電話線路上發(fā)送所述指令。本地系統(tǒng)的調(diào)制解調(diào)器在電話線路上接收數(shù)據(jù)，并且利用紅外發(fā)射機(jī)來將該數(shù)據(jù)轉(zhuǎn)換成紅外信號并將該紅外信號發(fā)送給便攜式計(jì)算設(shè)備，例如個人數(shù)字助理(PDA )或膝上電腦。便攜式計(jì)算設(shè)備上的紅外檢測器接收由紅外信號承載的信息和指令，并將數(shù)據(jù)放到總線上?？偩€將所述數(shù)據(jù)傳送到主存儲器，處理器從主存儲器取得并執(zhí)行指令。主存儲器所接收的指令可選地可以在處理器執(zhí)行之前或之后被存儲在存儲i殳備中。
圖IOA和圖IOB是能夠支持本發(fā)明各個實(shí)施例的不同的蜂窩移動電話系統(tǒng)的示圖。圖IOA和圖IOB示出示例性蜂窩移動電話系統(tǒng)，其每一個既具有移動站(例如手機(jī))又具有基站，所述移動站和基站具有已安裝的收發(fā)器(作為移動站和基站中的數(shù)字信號處理器(DSP)、硬件、軟件、集成電路、和/或半導(dǎo)體設(shè)備的一部分)。例如，無線電網(wǎng)絡(luò)支持由國際電信聯(lián)盟(ITU)為國際移動通信2000 (IMT-2000)定義的第二代和第三代(2G 和3G)服務(wù)。為了解釋的目的，關(guān)于cdma2000架構(gòu)來解釋無線電網(wǎng)絡(luò)的載波和信道選擇性能。作為IS-95的第三代版本，cdma2000在第三代合作伙伴項(xiàng)目2 (3GPP2)中被標(biāo)準(zhǔn)化。
無線電網(wǎng)絡(luò)1000包括移動站1001 (例如手機(jī)、終端、站臺、單元、設(shè)備、或用于用戶的其它類型的接口 (例如"可佩戴"電路等))，其與
基站子系統(tǒng)(BSS) 1003通信。根據(jù)本發(fā)明一個實(shí)施例，無線電網(wǎng)絡(luò)支持國際電信聯(lián)盟(ITU )為國際移動通信2000( IMT-2000 )定義的第三代(3G) 服務(wù)。
在該示例中，BSS 1003包括基站收發(fā)器(BTS) 1005和基站控制器 (BSC) 1007。雖然示出單個BTS，但應(yīng)理解，多個BTS典型地通過例如點(diǎn)對點(diǎn)鏈路連接到BSC。每一BSS 1003通過傳輸控制實(shí)體或分組控制功能單元(PCF) 1011被鏈接到分組數(shù)據(jù)服務(wù)節(jié)點(diǎn)(PDSN) 1009。由于PDSN 1009充當(dāng)對外部網(wǎng)絡(luò)(例如互聯(lián)網(wǎng)1013或其它私有用戶網(wǎng)絡(luò)1015)的網(wǎng) 關(guān)，因此PDSN1009可以包"^問、授權(quán)和計(jì)費(fèi)系統(tǒng)(AAA) 1017，以安全地確定用戶的身份和特權(quán)并跟蹤每一用戶的活動。網(wǎng)絡(luò)1015包括網(wǎng)絡(luò)管理系統(tǒng)(NMS) 1031,其被鏈接到一個或多個數(shù)據(jù)庫1033，所述數(shù)據(jù)庫 1033通過由歸屬AAA 1037確保安全的歸屬代理(HA) 1035而被訪問。
雖然示出了單個BSS 1003，但應(yīng)理解，多個BSS 1003典型地被連接到移動交換中心(MSC) 1019。 MSC 1019提供對電路交換網(wǎng)絡(luò)(例如/> 共交換電話網(wǎng)(PSTN) 1021)的連接性。相似地，還應(yīng)理解，MSC 1019 可以連接到相同網(wǎng)絡(luò)1000上的其它MSC 1019，并且/或者連接到其它無線電網(wǎng)絡(luò)。MSC 1019通常搭配有訪問者位置寄存器(VLR) 1023數(shù)據(jù)庫，其保存對于該MSC 1019的有效訂戶的臨時信息。VLR 1023數(shù)據(jù)庫中的數(shù) 據(jù)很大程度上是歸屬位置寄存器(HLR) 1025數(shù)據(jù)庫的拷貝，HLR 1025 數(shù)據(jù)庫存儲詳細(xì)的訂戶服務(wù)訂購信息。在一些實(shí)現(xiàn)方式中，HLR 1025和 VLR 1023是相同的物理數(shù)據(jù)庫；然而，HLR1025可以位于通過例如7號信令系統(tǒng)(SS7)網(wǎng)絡(luò)訪問的遠(yuǎn)程位置。包含訂戶特定的認(rèn)證數(shù)據(jù)(例如秘密認(rèn)證密鑰)的認(rèn)證中心(AuC ) 1027與HLR 1025關(guān)聯(lián)，以認(rèn)證用戶。更進(jìn)一步地，MSC 1019被連接到短消息服務(wù)中心(SMSC) 1029， SMSC 1029存儲短消息并轉(zhuǎn)發(fā)來自無線網(wǎng)絡(luò)1000的短消息或?qū)⒍滔⑥D(zhuǎn)發(fā)到無線網(wǎng)絡(luò)IOOO。
在蜂窩電話系統(tǒng)的典型操作期間，BTS 1005接收并解調(diào)來自進(jìn)行電話呼叫或其它通信的多組移動單元1001的多組反向鏈路信號。由給定的BTS 1005接收的每一反向鏈路信號在該站臺中被處理。所得到的數(shù)據(jù)被轉(zhuǎn)發(fā)到 BSC 1007。 BSC 1007提供包括BTS 1005之間的軟切換配合的呼叫資源分配和移動性管理功能。BSC 1007還將接收到的數(shù)據(jù)路由到MSC 1019， MSC 1019依次提供用于與PSTN 1021的接口的附加路由和/或交換。MSC 1019還負(fù)責(zé)呼叫建立、呼叫終止、MSC間切換和輔助服務(wù)的管理、以及收集、收費(fèi)和計(jì)費(fèi)信息。相似地，無線電網(wǎng)絡(luò)1000發(fā)送前向鏈路消息。 PSTN 1021與MSC 1019進(jìn)行接口。 MSC 1019附加地與BSC 1007進(jìn)行接口， BSC 1007依次與BTS 1005通信，BTS 1005調(diào)制多組前向鏈路信號，并將其發(fā)送給多組移動單元1001。
如圖IOB所示，通用分組無線服務(wù)(GPRS)架構(gòu)1050的兩個關(guān)鍵元件;U艮務(wù)GPRS支持節(jié)點(diǎn)(SGSN) 1032和網(wǎng)關(guān)GPRS支持節(jié)點(diǎn)(GGSN) 1034。此外，GPRS架構(gòu)包括分組控制單元PCU ( 1036)和收費(fèi)網(wǎng)關(guān)功能單元(CGF) 1038, CGF 1038鏈接到計(jì)費(fèi)系統(tǒng)1039。 GPRS移動站(MS ) 1041釆用訂戶身份模塊(SIM) 1043。
PCU 1036是邏輯網(wǎng)絡(luò)元件，負(fù)責(zé)與GPRS有關(guān)的功能，例如空中接口訪問控制、空中接口上的分組調(diào)度以及分組組裝和重組。通常，PCU 1036 被物理集成到BSC 1045;然而，其可以與BTS 1047或SGSN 1032結(jié)合。 SGSN 1032提供與MSC 1049等同的功能，包括移動性管理、安全性和訪問控制功能，但是在分組交換域中的。更進(jìn)一步地，SGSN 1032使用BSS GPRS協(xié)議(BSSGP)通過例如基于幀中繼的接口與PCU 1036連接。雖然僅示出一個SGSN，但應(yīng)理解，可以采用多個SGSN 1031，并且可以將服務(wù)區(qū)域劃分為對應(yīng)的路由區(qū)域(RA) 。 SGSN/SGSN接口允許當(dāng)在正在進(jìn)行的個人發(fā)展計(jì)劃(PDP)上下文期間發(fā)生RA更新時將分組從舊的 SGSN隧穿到新的SGSN。雖然給定的SGSN可以服務(wù)于多個BSC 1045，但任意給定的BSC 1045通常與一個SGSN 1032進(jìn)行接口。此外，可選地， SGSN 1032使用GPRS增強(qiáng)的移動應(yīng)用部分(MAP)通過基于SS7的接口與HLR 1051連接，或使用信令連接控制部分(SCCP)通過基于SS7的接口與MSC 1049連接。SGSN/HLR接口允許SGSN 1032在SGSN服務(wù)區(qū)域內(nèi)將位置更新提供給HLR 1051并獲取與GPRS有關(guān)的訂購信息。 SGSN/MSC接口使得能夠在電路交換服務(wù)和分組數(shù)據(jù)服務(wù)(例如尋呼用于語音呼叫的訂戶)之間進(jìn)行協(xié)調(diào)。最后，SGSN 1032與SMSC 1053進(jìn)行接口，以能夠啟用網(wǎng)絡(luò)1050上的短消息傳送功能。
GGSN 1034是對外部分組數(shù)據(jù)網(wǎng)絡(luò)(例如互聯(lián)網(wǎng)1013或其它私人用戶網(wǎng)絡(luò)1055)的網(wǎng)關(guān)。網(wǎng)絡(luò)1055包括網(wǎng)絡(luò)管理系統(tǒng)(NMS) 1057，其鏈接到通過PDSN 1061訪問的一個或多個數(shù)據(jù)庫1059。 GGSN 1034分配互聯(lián)網(wǎng)協(xié)議(IP)地址，并還可以認(rèn)證充當(dāng)遠(yuǎn)程用戶^U^認(rèn)證服務(wù)主機(jī)的用戶。位于GGSN 1034的防火墻還執(zhí)行防火墻功能，以限制免授權(quán)流量。雖然僅示出一個GGSN 1034，但應(yīng)理解，給定的SGSN 1032可以與一個或多個GGSN 1033進(jìn)行接口，以允許在兩個實(shí)體之間以及在進(jìn)出網(wǎng)絡(luò)1050 之間隧穿用戶數(shù)據(jù)。當(dāng)外部數(shù)據(jù)網(wǎng)絡(luò)在GPRS網(wǎng)絡(luò)1050上初始化會話時， GGSN 1034向HLR 1051詢問當(dāng)前服務(wù)于MS 1041的SGSN 1032。
BTS 1047和BSC 1045管理無線電接口，包括控制哪一移動站(MS ) 1041何時具有對無線電信道的訪問。這些元件實(shí)際上在MS 1041和SGSN 1032之間中繼消息。SGSN 1032管理與MS 1041的通信，發(fā)送和接收數(shù) 據(jù)并保持對其位置的多艮蹤。SGSN 1032還注冊MS 1041, i人證MS1041, 并對發(fā)送給MS 1041的數(shù)據(jù)加密。
圖ll是根據(jù)本發(fā)明實(shí)施例的能夠在圖IOA和圖IOB的系統(tǒng)中運(yùn)行的移動站(例如手機(jī))的示例性組件的示圖。通常，經(jīng)常按照前端和后端特性來定義無線電接收機(jī)。接收機(jī)的前端包括所有射頻(RF)電路，而后端包括所有基帶處理電路。電話的有關(guān)內(nèi)部組件包括主控制單元(MCU) 1103、數(shù)字信號處理器(DSP) 1105以及包含麥克風(fēng)增益控制單元和揚(yáng)聲器增益控制單元的接收機(jī)/發(fā)射機(jī)單元。主顯示單元1107以各種應(yīng)用和移動站功能為支持，將顯示提供給用戶。音頻功能電路1109包括麥克風(fēng)1111 和對從麥克風(fēng)1111輸出的話音信號進(jìn)行放大的麥克風(fēng)放大器。被放大的從麥克風(fēng)llll輸出的話音信號被饋送到編碼器/解碼器(編解碼器)1113。無線電部分1115放大功率并轉(zhuǎn)換頻率，以經(jīng)由天線1117與基站通信，基站被包括在移動通信系統(tǒng)中(例如圖IOA和圖IOB的系統(tǒng))。功率放大器(PA) 1119和發(fā)射機(jī)/調(diào)制電路以來自耦合到雙工器1121或循環(huán)器或天線開關(guān)的PA1119的輸出，而操作性地響應(yīng)于MCU 1103，這為本領(lǐng)域/> 知。PA 1119還耦合到電池接口和電源控制單元1120 。
在使用中，移動站1101的用戶對麥克風(fēng)1111說話，并且他或她的語音連同檢測到的背景噪聲一起被轉(zhuǎn)換為模擬電壓。于是，模擬電壓通過模數(shù)轉(zhuǎn)換器(ADC) 1123被轉(zhuǎn)換為數(shù)字信號?？刂茊卧?103將數(shù)據(jù)信號路由到DSP1105，以在其中進(jìn)行處理，例如話音編碼、信道編碼、加密和交織。在示例性實(shí)施例中，通過使用碼分多址(CDMA)的蜂窩傳輸協(xié)議來由未單獨(dú)示出的單元對處理過的語音信號編碼，其在電信產(chǎn)業(yè)協(xié)會的 TIA/EIA/IS-95-A用于xM^寬帶擴(kuò)頻蜂窩系統(tǒng)的移動站-基站兼容性標(biāo)準(zhǔn)中被詳細(xì)描述；其通過引用被完全合并到此。
于是，被編碼的信號被路由到均衡器1125，以補(bǔ)償在通過空中傳輸期間出現(xiàn)的頻率相關(guān)性損傷(例如相位和幅度失真)。在對比特流進(jìn)行均衡之后，調(diào)制器1127將該信號與在RT接口 1129中生成的RF信號合并。調(diào)制器1127通過頻率和相位調(diào)制生成正弦波。為了準(zhǔn)備用于傳輸?shù)男盘枺?上變頻器1131將從調(diào)制器1127輸出的正弦波與由合成器1133生成的另一正弦波進(jìn)行合并，以實(shí)現(xiàn)期望的傳輸頻率。于是，通過PA1119發(fā)送所述信號，以將所述信號提升到合適的功率電平。在實(shí)際系統(tǒng)中，PA 1119充當(dāng)可變增益放大器，其增益由DSP 1105根據(jù)接收自網(wǎng)絡(luò)基站的信息來控制。于是，在雙工器1121內(nèi)對該信號濾波，并且可選地將該信號發(fā)送給天線耦合器1135，以進(jìn)行阻抗匹配，從而提供最大功率傳輸。最后，經(jīng)由天線1117將信號發(fā)送給本地基站?？梢蕴峁┳詣釉鲆婵刂?AGC)以控制接收機(jī)的末級增益?？梢詮慕邮諜C(jī)將信號轉(zhuǎn)發(fā)到遠(yuǎn)程電話，所述遠(yuǎn)程電話可以是另一蜂窩電話、其它移動電話，或連接到公共交換電話網(wǎng)(PSTN) 或其它電話網(wǎng)絡(luò)的地面線路。
經(jīng)由天線1117接收發(fā)送給移動站1101的語音信號，并由低噪聲放大器(LNA) 1137立即對其放大。下變頻器1139降低載波頻率，而解調(diào)器 1141移除RF,僅留下數(shù)字比特流。于是，信號通過均衡器1125，并由DSP 1105進(jìn)行處理。數(shù)模轉(zhuǎn)換器(DAC) 1143對該信號進(jìn)行轉(zhuǎn)換，所得到的輸出通過揚(yáng)聲器1145被發(fā)送給用戶，所有操作都在主控制單元(MCU) 1103的控制下，主控制單元(MCU) 1103可以被實(shí)現(xiàn)為中央處理單元 (CPU)(未示出)。
MCU 1103接收各種信號，包括來自鍵盤1147的輸入信號。MCU 1103 將顯示命令和轉(zhuǎn)換命令分別交付給顯示器1107和話音輸出轉(zhuǎn)換控制器。進(jìn) 一步地，MCU 1103與DSP 1105交換信息，并可以訪問可選地包括的SIM 卡1149和存儲器1151。此外，MCU 1103執(zhí)行站臺所需的各種控制功能。根據(jù)實(shí)現(xiàn)方式，DSP 1105可以對語音信號執(zhí)行任意的各種傳統(tǒng)數(shù)字處理功能。此外，DSP 1105從麥克風(fēng)1111所檢測的信號確定本地環(huán)境的背景噪聲電平，并將麥克風(fēng)llll的增益設(shè)置為所選擇的電平，以補(bǔ)償移動站1101 的用戶的自然傾向。
編解碼器1113包括ADC 1123和DAC 1143。存儲器1151存儲包括來電基音數(shù)據(jù)的各種數(shù)據(jù)，并能夠存儲包括例如經(jīng)由全球互聯(lián)網(wǎng)接收的音樂數(shù)據(jù)的其它數(shù)據(jù)。軟件模塊可以駐留在RAM存儲器、閃速存儲器、寄存器、或任意其它形式的本領(lǐng)域公知的可寫存儲介質(zhì)中。存儲器設(shè)備1151 可以是單式存儲器、CD、 DVD、 ROM、 RAM、 EEPROM、光學(xué)存儲器、或能夠存儲數(shù)字?jǐn)?shù)據(jù)的任意其它非易失性存儲介質(zhì)，但不限于此。
可選地包括的SIM卡1149承載例如重要信息，例如蜂窩電話號碼、運(yùn)營商提供服務(wù)、訂購細(xì)節(jié)以及安全性信息。SIM卡1149主要用于標(biāo)識無線電網(wǎng)絡(luò)上的移動站1101?？?149還包含存儲器，以用于存儲個人電話號碼注冊、文本消息和用戶特定移動站設(shè)置。
圖12示出示例性企業(yè)網(wǎng)絡(luò)，其可以是利用基于分組的和/或基于蜂窩的技術(shù)(例如異步傳輸模式(ATM)、以太網(wǎng)、基于IP等)的任意類型的數(shù)據(jù)通信網(wǎng)絡(luò)。企業(yè)網(wǎng)絡(luò)1101將連接性提供給有線節(jié)點(diǎn)1203和無線節(jié) 點(diǎn)1205-1209 (固定或移動的)，其均被配置為執(zhí)行上述處理。企業(yè)網(wǎng)絡(luò)1201可以與各種其它網(wǎng)絡(luò)(例如WLAN網(wǎng)絡(luò)1211 (例如IEEE 802.11)、 CDMA 2000蜂窩網(wǎng)絡(luò)1213、電話網(wǎng)絡(luò)1215 (例如PSTN)、或公共數(shù)據(jù) 網(wǎng)絡(luò)1217 (例如互聯(lián)網(wǎng)))通信。
雖然已經(jīng)結(jié)合多個實(shí)施例和實(shí)現(xiàn)方式描述了本發(fā)明，但本發(fā)明不限于此，而是覆蓋落入所附權(quán)利要求的范圍內(nèi)的各種明顯的修改和等同的配置。雖然在權(quán)利要求中以特定組合表達(dá)了本發(fā)明的特征，但應(yīng)理解，可以按任意組合和順序來安排這些特征。
權(quán)利要求
1.一種方法，包括檢測包括音頻信息的遲到幀，其中已經(jīng)執(zhí)行隱藏以替代所述遲到幀；確定由所述隱藏引入的基音相位差異；以及在播放隨所述遲到幀之后的后續(xù)幀之前，補(bǔ)償所述基音相位差異。
2. 如權(quán)利要求l所述的方法，進(jìn)一步包括使用所述遲到幀，來使解碼器的內(nèi)部狀態(tài)與編碼器的內(nèi)部狀態(tài)重新同步。
3. 如權(quán)利要求1所述的方法，其中通過以下來確定所述基音相位差異在第一信號和第二信號之間進(jìn)行相關(guān)；確定最大相關(guān)性；以及確定對應(yīng)于所述最大相關(guān)性的延時值。
4. 如權(quán)利要求3所述的方法，其中所述第一信號對應(yīng)于被隱藏的所述遲到幀，并且所述第二信號對應(yīng)于被適當(dāng)解碼的所述遲到幀。
5. 如權(quán)利要求3所述的方法，其中所述第一信號對應(yīng)于使用隱藏的內(nèi)部狀態(tài)而解碼的所述后續(xù)幀，并且所述第二信號對應(yīng)于使用更新的內(nèi)部狀態(tài)而解碼的所述后續(xù)幀。
6. 如權(quán)利要求1所述的方法，其中通過以下來確定所述基音相位差異確定對應(yīng)于第一信號的第一組基音標(biāo)記以及對應(yīng)于第二信號的第二組基音標(biāo)記；以及比較所述第一組基音標(biāo)記與所述第二組基音標(biāo)記的位置。
7. 如權(quán)利要求6所述的方法，其中所述第一信號對應(yīng)于被隱藏的所述遲到幀，并且所述第二信號對應(yīng)于被適當(dāng)解碼的所述遲到幀。
8. 如權(quán)利要求6所述的方法，其中所述第一信號對應(yīng)于使用隱藏的內(nèi)部狀態(tài)而解碼的所述后續(xù)幀，并且所述第二信號對應(yīng)于使用所述更新的內(nèi)部狀態(tài)而解碼的所述后續(xù)幀。
9. 如權(quán)利要求1所述的方法，通過以下來確定所述基音相位差異使用對所述遲到幀的隱藏之前的最后基音標(biāo)記的位置、隱藏的基音值以及從所述遲到幀中恢復(fù)的實(shí)際基音值，來確定隱藏的輸出信號的基音標(biāo)記位置以及正確的輸出信號的基音標(biāo)記位置；并且比較所述基音標(biāo)記位置。
10. 如權(quán)利要求1所述的方法，其中補(bǔ)償所述基音相位差異包括延時或時間縮放所述后續(xù)幀的一部分，從而使得當(dāng)從隱藏幀轉(zhuǎn) 到隨后的更新幀時，相應(yīng)語音信號的自然基音周期性不被破壞。
11. 一種裝置，包括隱藏邏輯，其被配置為替代遲到幀；配置為檢測包括音頻信息的遲到幀的邏輯，其中已經(jīng)執(zhí)行隱藏以替代所述遲到幀；以及基音相位補(bǔ)償邏輯，其被配置為確定由所述隱藏引入的基音相位差異，并且在播放隨所述遲到幀之后的后續(xù)幀之前補(bǔ)償所述基音相位差異。
12. 如權(quán)利要求11所述的裝置，進(jìn)一步包括具有內(nèi)部狀態(tài)的解碼邏輯，所述內(nèi)部狀態(tài)被使用所述遲到幀與編碼器的內(nèi)部狀態(tài)重新同步。
13. 如權(quán)利要求11所述的裝置，所述基音相位差異通過以下來確定對第一信號和第二信號進(jìn)行相關(guān)；確定最大相關(guān)性；以及確定對應(yīng)于所述最大相關(guān)性的延時值。
14. 如權(quán)利要求13所述的裝置，其中所述第一信號對應(yīng)于被隱藏的所述遲到幀，并且所述第二信號對應(yīng)于被適當(dāng)解碼的所述遲到幀。
15. 如權(quán)利要求13所述的裝置，其中所述第一信號對應(yīng)于使用隱藏的內(nèi)部狀態(tài)解碼的所述后續(xù)幀，并且所述第二信號對應(yīng)于使用更新的內(nèi)部狀態(tài)解碼的所述后續(xù)幀。
16. 如權(quán)利要求11所述的裝置，其中所述基音相位差異通過以下來確定確定對應(yīng)于第一信號的第一組基音標(biāo)記以及對應(yīng)于第二信號的第二組基音標(biāo)記；以及比較所述第一組基音標(biāo)記的位置與所述第二組基音標(biāo)記的位置。
17. 如權(quán)利要求16所述的裝置，其中所述第一信號對應(yīng)于被隱藏的所述遲到幀，并且所述第二信號對應(yīng)于被適當(dāng)解碼的所述遲到幀。
18. 如權(quán)利要求16所述的裝置，其中所述第一信號對應(yīng)于使用隱藏的內(nèi)部狀態(tài)而解碼的所述后續(xù)幀，并且所述第二信號對應(yīng) 于使用更新的內(nèi)部狀態(tài)而解碼的所述后續(xù)幀。
19. 如權(quán)利要求11所述的裝置，其中所述基音相位差異通過以下來確定使用隱藏的基音值以及從所述遲到幀中恢復(fù)的實(shí)際基音值，來確定隱藏的輸出信號的基音標(biāo)記位置以及正確的輸出信號的基音標(biāo)記位置；并且比較所述基音標(biāo)記位置。
20. 如權(quán)利要求11所述的裝置，其中補(bǔ)償所述基音相位差異包括延時或時間縮放所述后續(xù)幀的一部分，從而使得當(dāng)從隱藏幀轉(zhuǎn)到隨后的更新幀時，相應(yīng)語音信號的自然基音周期性不被破壞。
21. —種移動設(shè)備，包括權(quán)利要求11所述的裝置。
22. —種音頻設(shè)備，包括權(quán)利要求11所述的裝置。
23. —種芯片組，包括權(quán)利要求11所述的裝置。
24. —種系統(tǒng)，包括用于檢測包括音頻信息的遲到幀的裝置，其中已經(jīng)執(zhí)行隱藏以替代所述遲到幀；用于確定由所述隱藏引入的基音相位差異的裝置；以及用于在播放隨所述遲到幀之后的后續(xù)幀之前補(bǔ)償所述基音相位差異的裝置。
25. 如權(quán)利要求24所述的系統(tǒng)，進(jìn)一步包括用于使用所述遲到幀來使解碼器的內(nèi)部狀態(tài)與編碼器的內(nèi)部狀態(tài)重新同步的裝置。
全文摘要
提供了一種裝置，用于當(dāng)在預(yù)測解碼器中處理遲到幀時，維持語音或音頻信號的自然基音周期性。執(zhí)行隱藏以替代遲到幀。檢測包括音頻信息的遲到幀。確定由隱藏引入的基音相位差異。在播放隨所述遲到幀之后的后續(xù)幀之前補(bǔ)償所述基音相位差異。
文檔編號G10L19/00GK101310329SQ200680042807
公開日2008年11月19日申請日期2006年10月18日優(yōu)先權(quán)日2005年10月18日
發(fā)明者K·D·安德松, P·古爾納申請人:諾基亞公司

完整全部詳細(xì)技術(shù)資料下載