專利名稱:用于重新同步分組音頻流的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明的實(shí)施例涉及通信,并且更具體地說,涉及對數(shù)據(jù)分組的處理。
背景技術(shù):
無線電通信系統(tǒng),例如蜂窩系統(tǒng)(例如擴(kuò)頻系統(tǒng)(例如碼分多址 (CDMA)網(wǎng)絡(luò))、或時分多址(TDMA)網(wǎng)絡(luò))和廣播系統(tǒng)(例如數(shù)字 視頻廣播(DVB)),以豐富的服務(wù)和特征集合向用戶提供移動性的便利 性。這種4更利性已經(jīng)導(dǎo)致數(shù)量不斷增長的消費(fèi)者大量采用無線電通信系統(tǒng) 作為商業(yè)和個人使用的公認(rèn)通信模式。為了促進(jìn)更多的采用,從制造商到 服務(wù)提供商的電信產(chǎn)業(yè)已經(jīng)以龐大的開支和努力達(dá)成一致,來開發(fā)用于在 各種服務(wù)和特征之下的通信協(xié)議的標(biāo)準(zhǔn)。 一個努力的關(guān)鍵領(lǐng)域涉及語音或 音頻流的傳輸,例如語音在互聯(lián)網(wǎng)協(xié)議上(VoIP)。已經(jīng)認(rèn)識到當(dāng)分組被 延時或丟失時,傳統(tǒng)方式不能充分地解決與解碼過程相關(guān)聯(lián)的信號質(zhì)量。 由于這些分組不,皮解碼,分組的延時或丟失引起解碼器內(nèi)同步的丟失。因 此,這對播放的信號的質(zhì)量產(chǎn)生不利影響,尤其是關(guān)于基音(pitch)。
因此,需要當(dāng)語音或音頻數(shù)據(jù)被延時或丟失時有效地保持分組音頻流 的信號質(zhì)量。
發(fā)明內(nèi)容
本發(fā)明解決這些和其它需求,其中,提出一種方法,用于保持語音或
音頻信號的自然基音(pitch)周期性。
根據(jù)本發(fā)明實(shí)施例一方面, 一種方法,包括檢測包括音頻信息的遲 到幀,其中基于所檢測的遲到幀執(zhí)行隱藏。所述方法還包括確定由所述隱 藏引入的基音相位差異。所述方法還包括在播放隨所述遲到幀之后的后續(xù) 幀之前,補(bǔ)償所述基音相位差異。
根據(jù)本發(fā)明實(shí)施例的另一方面, 一種裝置,包括基音相位補(bǔ)償邏輯, 被配置為檢測包括音頻信息的遲到幀,其中基于所檢測的遲到幀執(zhí)行隱藏。 所述基音相位補(bǔ)償邏輯被配置為確定所述隱藏引入的基音相位差異,并且 在播放隨所述遲到幀之后的后續(xù)幀之前,補(bǔ)償所述基音相位差異。
根據(jù)本發(fā)明實(shí)施例的又一方面, 一種系統(tǒng),包括:用于檢測包括音頻信 息的遲到幀的裝置,其中基于所檢測的遲到幀執(zhí)行隱藏;用于確定所述隱 藏引入的基音相位差異的裝置,以及用于在播放隨所述遲到幀之后的后續(xù) 幀之前,補(bǔ)償所述基音相位差異的裝置。
簡單地通過示出多個特定實(shí)施例和實(shí)現(xiàn)方式一一其中包括構(gòu)思為執(zhí)4亍 本發(fā)明實(shí)施例的最佳^t式,本發(fā)明的其它方面、特征和優(yōu)點(diǎn)從下面的詳細(xì) 描述就變得更加清楚。本發(fā)明還能夠具有其它不同的實(shí)施例,并且在不脫 離本發(fā)明的精神和范圍的情況下,可以在各個明顯的方面修改一些細(xì)節(jié)。 因此,附圖和說明書被看作是示例性的而不是限制性的。
在附圖中,以舉例而非限制的方式來示出本發(fā)明實(shí)施例,相似的標(biāo)號 表示相似的元件,其中
圖1A和1B分別是根據(jù)本發(fā)明各個實(shí)施例、能夠提供音頻流的重新同 步的示例接收機(jī)的示圖以及音頻恢復(fù)過程的流程圖2是與一個遲到幀相關(guān)聯(lián)的示例解碼器輸出的示圖3是傳統(tǒng)隱藏過程的解碼信號示圖和根據(jù)本發(fā)明實(shí)施例的遲到分組處理過程的解碼信號示圖4是涉及對傳統(tǒng)隱藏過程和遲到分組處理過程的使用的激勵信號示
圖5是根據(jù)本發(fā)明實(shí)施例的在重新同步過程中使用的信號之間關(guān)系的
示圖6是根據(jù)本發(fā)明實(shí)施例的重新同步過程的流程圖7是根據(jù)本發(fā)明實(shí)施例的、涉及重新同步過程的使用的激勵信號示
圖8A-D是根據(jù)本發(fā)明的各種實(shí)施例、與確定和說明基音相位差異相 關(guān)聯(lián)的過程的流程;
圖9是可以用于實(shí)現(xiàn)本發(fā)明實(shí)施例的硬件的示圖10A和10B是能夠支持本發(fā)明各個實(shí)施例的不同蜂窩移動電話系統(tǒng) 的示圖11是才艮據(jù)本發(fā)明實(shí)施例、能夠在圖10A和圖10B的系統(tǒng)中運(yùn)行的 移動站的示例性組件的示圖;以及
圖12是根據(jù)本發(fā)明實(shí)施例、能夠支持在此描述的過程的企業(yè)網(wǎng)絡(luò)的示圖。
M實(shí)施方式
公開了用于重新同步音頻流的裝置、方法和軟件。在以下描述中,為 了解釋的目的,闡述大量特定細(xì)節(jié),以提供對本發(fā)明實(shí)施例的透徹的理解。 然而,本領(lǐng)域技術(shù)人員應(yīng)理解,可以在沒有這些特定細(xì)節(jié)的情況下或以等 同方案來實(shí)踐本發(fā)明。在其它情況下,以;fe圖形式示出熟知的結(jié)構(gòu)和i殳備, 以避免不必要地模糊本發(fā)明實(shí)施例。
雖然關(guān)于分組網(wǎng)絡(luò)來討論本發(fā)明實(shí)施例,但本領(lǐng)域技術(shù)人員應(yīng)理解, 本發(fā)明實(shí)施例能夠應(yīng)用于任意類型的數(shù)據(jù)網(wǎng)絡(luò),包括基于信元的網(wǎng)絡(luò)(例 如,異步傳輸模式(ATM))。此外,可以預(yù)計(jì)這里描述的協(xié)議和過程不 僅可以被移動和/或無線設(shè)備執(zhí)行,還可以被任何固定(或非移動)通信設(shè)備(例如,臺式計(jì)算機(jī)、網(wǎng)絡(luò)裝置等)或網(wǎng)絡(luò)元件或節(jié)點(diǎn)執(zhí)行。
除了其它電信業(yè)務(wù)外,分組網(wǎng)絡(luò)被用于傳輸分組的語音會話(或呼叫)。 作為例子,這些網(wǎng)絡(luò)支持互聯(lián)網(wǎng)協(xié)議(IP)。分組網(wǎng)絡(luò)上的傳輸?shù)奶卣髟?于通過網(wǎng)絡(luò)的分組傳輸時間中的變化,在網(wǎng)絡(luò)中某些分組被完全丟失。分 組的實(shí)際到達(dá)時間和按精確分組速率的參考時鐘之間的差異稱為抖動。
圖1A示意了根據(jù)本發(fā)明的各種實(shí)施例,能夠提供音頻流的重新同步 的示例接收機(jī)的示圖。作為示意,在由數(shù)據(jù)幀或分組(例如分組的語音、 具有音頻內(nèi)容的視頻流等)表示的音頻信息的情況下解釋音頻系統(tǒng)100, 例如接收機(jī)。音頻系統(tǒng)100包括分組緩存器101,被配置為存儲已經(jīng)接收 的分組。系統(tǒng)100還包括隱藏邏輯103,用于當(dāng)分組不可得到時,執(zhí)行產(chǎn) 生替代幀的隱藏過程?;粝辔谎a(bǔ)償邏輯105用于對隱藏輸出和后續(xù)輸出 之間的過渡進(jìn)行平滑。隱藏邏輯103和基音相位補(bǔ)償邏輯105與解碼器(例 如,預(yù)測解碼邏輯)107交互操作,解碼器107向播放模塊109輸出被解 碼的幀。
作為典型應(yīng)用,音頻系統(tǒng)100可以被實(shí)現(xiàn)為語音在互聯(lián)網(wǎng)協(xié)議上 (VoIP)的接收機(jī)。在這種情況下,緩存器101還可以用于控制抖動的影 響。因而,緩存器101把不規(guī)則的到達(dá)分組流轉(zhuǎn)換成規(guī)則的分組流,從而 語音解碼器107可以向收聽者提供持續(xù)不斷的語音流。這些流可以是表示 任何類型的聽覺信息——包括語音和音頻一一的數(shù)據(jù)流。然而,可以預(yù)計(jì) 這里所描述的方法還可以應(yīng)用到包括音頻信息的視頻流中。
分組緩存器101通過引入額外的延時來操作,該延時被稱為"播放延 時,,(相對于參考時鐘來定義該延時,例如在第一分組的接收時開始)。 例如,可以選擇播放延時以最小化因到達(dá)太晚而不能被解碼的分組的數(shù)量, 同時保持整體的端到端延時在可接受限度內(nèi)。
在播放時間之前到達(dá)的分組被臨時存儲在接收緩存器中。當(dāng)?shù)竭_(dá)其播 放時間時,這些分組被從緩存器中取出、解碼并通過播放模塊109播放。 丟失的分組和在播放時間之后到達(dá)的分組不能被解碼;因此,計(jì)算了替代 的語音或視頻片斷。此外,解碼器內(nèi)部狀態(tài)不正確。在這種情況下,調(diào)用通過隱藏邏輯103的隱藏過程而不是正常解碼過 程以代替丟失的語音或音頻片斷。隱藏邏輯103維持內(nèi)部狀態(tài)信息103a, 例如可以通過使用狀態(tài)機(jī)實(shí)現(xiàn)該狀態(tài)。同樣的,解碼器107為解碼過程維 持狀態(tài)信息107a。
傳統(tǒng)隱藏過程具有在隱藏片斷中引入差錯的缺點(diǎn)。而且,該隱藏過程 并不能正確地更新解碼器107的內(nèi)部狀態(tài)。因此,由于解碼器107的預(yù)測 性特性,由隱藏過程引入的差錯通常在隨后的片斷中傳播。注意,由于每 個分組是獨(dú)立的,非預(yù)測性編碼器/解碼器(編解碼器)不具有差錯傳播。
盡管在分組網(wǎng)絡(luò)上的語音情況下遲到分組通常被認(rèn)為丟失,這些遲到 分組可以用于降低差錯傳播,如同1983年12月,巻SAC-l,第6期,的 IEEE Journal on Selected Areas in Communications,在題為"Techniques for Packet Voice Synchronization"中所解釋的,其全部內(nèi)容通過引用被合 并在此。
當(dāng)分組不是丟失而是僅僅^^時時,其內(nèi)容可以用于更新解碼器107 的"后驗(yàn)的,,內(nèi)部狀態(tài)。這限制了,并且在某些情況下,停止了由隱藏引 起的差錯傳播。注意到,必須非常注意以保證在隱藏的輸出片斷和利用更 新的內(nèi)部狀態(tài)計(jì)算的后續(xù)"更新的,,輸出片斷之間的平滑過渡。在2003 年4月,ICASSP中由P.Gournay等人發(fā)表的題為"Improved packet loss recovery using late frames for prediction-based speech coder"的文章中詳 細(xì)描述了這種技術(shù),其全部內(nèi)容通過引用被合并在此。
預(yù)測性語音或音頻解碼器的隱藏邏輯103通常在濁音或準(zhǔn)周期片斷中 引入基音相位差異。該基音相位差異對信號質(zhì)量有害,使得當(dāng)從隱藏的輸 出片斷轉(zhuǎn)到隨后的利用正確的更新內(nèi)部狀態(tài)計(jì)算的"更新"輸出片斷時, 使用傳統(tǒng)淡入、淡出技術(shù)變得非常困難。
與傳統(tǒng)"淡入淡出"過程相比,基音相位補(bǔ)償邏輯105提供了一種過 程,以有效地平滑在這兩個片斷之間的過渡。尤其的,其解決了當(dāng)從一個 片斷轉(zhuǎn)到另一片斷時如何維持語音或音頻信號的自然基音周期性的問題。
圖IB是根據(jù)本發(fā)明各種實(shí)施例的音頻恢復(fù)過程的示例流程。在步驟121,檢測遲到的或丟失的分組。因此,在步驟123,啟動隱藏過程以產(chǎn)生 替代幀。之后,當(dāng)遲到幀被處理時,在步驟125確定由隱藏過程引起的基 音相位差異。在步驟127,該過程基于確定的基音相位差異來平滑在隱藏 幀和后續(xù)幀之間的過渡。
在示例實(shí)施例中,上述重新同步過程可以應(yīng)用到CDMA 2000 lx EV-DO (演進(jìn)-數(shù)據(jù)最優(yōu)化)系統(tǒng)中。本領(lǐng)域技術(shù)人員認(rèn)識到,本發(fā)明可以 應(yīng)用到利用其它技術(shù)(例如一般而言的擴(kuò)頻系統(tǒng),以及時分復(fù)用(TDM) 系統(tǒng))和通信協(xié)議的任何類型的無線電網(wǎng)絡(luò)中。
圖2是與一個遲到幀相關(guān)聯(lián)的示例解碼器輸出的示圖。特別的,該圖 示意了當(dāng)遲到幀被認(rèn)為丟失(情況203)以及當(dāng)遲到幀用于更新解碼器107 的內(nèi)部狀態(tài)(情況201)時該遲到幀的影響。正確的輸出顯示為白色,并 且差錯傳播顯示為灰色。情況205是在沒有丟失的或者遲到的幀的情況下, 解碼器107的輸出。
作為例子,二進(jìn)制幀祐:接收并且被正常地解碼一直到幀《-1。幀w并 不能凈皮及時得到以用于解碼。隱藏過程產(chǎn)生與期望的輸出不同的某些替代 輸出。由于解碼器107的內(nèi)部狀態(tài)在原始解碼器中并不被正確地更新,由 幀《引入的差錯在隨后的幀中傳播(情況203)。
現(xiàn)在假設(shè)幀w在對幀w+l的解碼之前到達(dá)分組緩存器IOI(情況201 )。 考慮下面的情況(i)丟棄幀ii的內(nèi)容,并且使用由隱藏產(chǎn)生的"壞的" 內(nèi)部狀態(tài),并且如同在解碼器107中正常執(zhí)行那樣,解碼幀w+l;或者(ii) 把解碼器107的內(nèi)部狀態(tài)恢復(fù)為在幀w-l結(jié)束時的值,解碼幀w而不輸出 解碼的語音(這將導(dǎo)致把內(nèi)部狀態(tài)更新為其"好的"值),以及(iii)解 碼幀《+1,好像沒有出現(xiàn)差錯。
在一個實(shí)施例中,需要某些平滑以防止在幀w和幀w+l之間的邊界上 的4壬何不連續(xù)性。這可以通過4吏用淡入、淡出窗口對(圖2中的)信號(i) 和(iii)加權(quán)并在該隱藏之后根據(jù)內(nèi)部狀態(tài)(例如,實(shí)際的過去的合成的 采樣)取合成濾波器的記憶(memory),來在激勵域執(zhí)行。
圖3是傳統(tǒng)隱藏過程的解碼信號和根據(jù)本發(fā)明的實(shí)施例的遲到分組處理過程的解碼信號的示圖。信號301是當(dāng)沒有幀丟失時解碼器的輸出。信 號303是當(dāng)?shù)?個幀被丟失并且隱藏后的解碼器的輸出。由于在濁音開始 期間發(fā)生丟失,其觸發(fā)強(qiáng)能量丟失(跨越一個完整的音素)以及較大的失 真等級。在這種情況下,恢復(fù)時間較長(差錯信號307)。信號305是當(dāng) 使用尸.Go"r"fl^等人的文章中描述的方式在隱藏之后執(zhí)行更新時的解碼器 的輸出。由于解碼器及時地可獲得所有所需的信息以進(jìn)行考慮,恢復(fù)比較 快并且完整(差錯信號309)。所有的信號(包括差錯)以相同的幅度比 例表示。盡管P.Gournay等人的技術(shù)對于降低在遲到分組后的差錯傳播非 常有效,其并不能適當(dāng)?shù)靥幚碛呻[藏引入的基音相位差異。在某些情況下, 為了平滑在隱藏的片斷和"更新"的片斷之間的過渡而執(zhí)行的淡入、淡出 操作甚至?xí)茐男盘柕淖匀恢芷谛?。在這些情況下,產(chǎn)生了局部的但是可 聽到的并且令人非常不愉快的失真。
圖4是涉及對傳統(tǒng)隱藏過程和傳統(tǒng)遲到分組處理過程的使用的激勵信 號示圖。信號401是當(dāng)沒有幀丟失時由解碼器107計(jì)算的激勵信號。信號 403是當(dāng)?shù)诙徽J(rèn)為丟失并被隱藏時的激勵信號?;粝辔徊町愑呻[藏 103引入并且由解碼器107向后傳播;可以清楚地看到信號401和信號403 在第三幀中失去同步。信號405是當(dāng)相同幀被用于更新內(nèi)部狀態(tài)時的激勵 信號。在執(zhí)行、^淡出操作的第三幀中,基音周期性被明顯地破壞(;i^、 淡出過程在第三幀的中間附近產(chǎn)生了兩個基音脈沖,其在空間上太近,并 且不具有足夠能量)。
現(xiàn)在更詳細(xì)的描述用于確定基音相位差異和利用基音相位差異來平滑 在隱藏的幀和后續(xù)幀之間的過渡的方法。以并不破壞語音或音頻信號的自 然基音周期性的方式來執(zhí)行該過渡。
圖5是根據(jù)本發(fā)明的一個實(shí)施例,在重新同步過程中利用的在信號之 間關(guān)系的示圖。特別的,圖5顯示了緊跟在遲到幀之后的幀中的;,j'和《之 間的關(guān)系。信號501是沒有差錯的原始幀,信號503是恰在丟失前面的幀 之后的信號(注意基音信號的相位差異),并且信號505是在更新和重新 同步之后的信號(注意這里信號501已經(jīng)與信號503重新校準(zhǔn))。^標(biāo)識了在較好的激勵中用于尋找第一基音脈沖的窗口的開始,)是兩個信號之
間的偏移,并且《是合并信號501和503以形成信號505的最低能量點(diǎn)。 注意)'不僅是信號501和503之間的偏移,還是信號505的額外長度。
圖6是根據(jù)本發(fā)明的一個實(shí)施例,重新同步過程的流程。依照本發(fā)明 的一個實(shí)施例,在具有應(yīng)用于由圖1A的解碼器107所計(jì)算的激勵信號的 修改的碼激勵線性預(yù)測(CELP)編碼器/解碼器(編解碼器)的情況下, 解釋重新同步過程。然而,根據(jù)應(yīng)用,可替代地,可以在相似步驟之后對 解碼的輸出信號執(zhí)行重新同步過程。為了示意的目的,下面提出的特定實(shí) 現(xiàn)方式用于可變多速率寬帶(VMR-WB)編解碼器,其它編解碼器中的參 數(shù)可以不同,但是應(yīng)用相同的原理。在圖1A的系統(tǒng)中,該過程使用遲到 幀把解碼器107的內(nèi)部狀態(tài)與編碼器(沒有顯示)的內(nèi)部狀態(tài)進(jìn)行重新同 步。
在步驟601,音頻系統(tǒng)100確定接收到的分組是否為"濁音"分組。 作為例子,"濁音"指示可以檢測到基音脈沖的周期性或準(zhǔn)周期性語音信 號(例如,在聲音/a/, /e/等中)。相反的,清音信號更像噪聲并且由于缺 少周期性不能檢測到基音脈沖(例如,/s/)。因此,框圖601區(qū)分濁音和 清音語音幀。如果分組并不是濁音分組,則在步驟603,重新同步并不是 必須的,并且因此不需要修改,由此保留了好的激勵。為了示意的目的, 術(shù)語"好的"激勵表示圖2中的信號(iii),而"壞的"激勵信號表示圖2 中的信號(i)。好的激勵是在前的幀沒有遲到而得到的激勵信號,并且壞 的激勵是在前的幀沒有被恢復(fù)而得到的激勵信號。對好的激勵的記憶 (memory)還可以用于使用;假設(shè)與當(dāng)前的好的激勵相連續(xù)(因此,當(dāng)在 當(dāng)前幀中開始"好的"激勵時,可以使用負(fù)索引)。符號"r0"用于表示 基音周期,并且表示好的激勵中的第一子幀的基音(除非另外標(biāo)出)。r0 是在編碼的語音分組中傳輸?shù)囊阎獏?shù)。
然而,如果分組與濁音信號相關(guān),則系統(tǒng)100,在步驟607,尋找具有 好的激勵的第一脈沖。然后,系統(tǒng)在步驟609確定在脈沖中是否存在可接 受的能量等級。如果是,則在步驟611,系統(tǒng)通過最大化相關(guān)性來尋找移位的采樣數(shù)。
更具體地說,下面解決了對兩個相位不同的濁音信號進(jìn)行重新同步的
問題。第一,尋找將在同步過程中使用的聲門脈沖(步驟607),這可以 在好的或者壞的激勵中發(fā)現(xiàn)。第二,該脈沖被移位跨越另一激勵以尋找脈 沖相關(guān)最好之處(步驟611)。第三,確定可以進(jìn)行從壞的激勵到好的激 勵的轉(zhuǎn)換的、位于脈沖附近的最低能量點(diǎn)。
在示例的實(shí)施例中,聲門脈沖可以是好的激勵的第一脈沖。移位大小
為^的窗口而跨越好的激勵的第一 r。+M采樣,并且取具有最大能量的
位置,給出了聲門脈沖的位置(步驟607)??梢允褂蒙远嘤趎的采樣以
避免當(dāng)脈沖的一部分位于第o或第n采樣時的臨界線情況。下面的式(l)
描述了用于尋找第一聲門脈沖的算法,^是包含該脈沖的^-采樣窗口的 第一采樣
<formula>formula see original document page 14</formula>
并且g卯cf[n]是好的激勵的第w個采樣。對于VMR-WB編解碼器,^j可 以械二沒定為10。
還可以使用在壞的激勵中尋找第一脈沖,然而,這種方式相對具有較 少吸引力,由于隱藏的脈沖通常不如好的脈沖明確并且因此不能總是被正 確地發(fā)現(xiàn)。對jc的其它邊界,例如把搜索集中在0上或者執(zhí)行更短或更長 的搜索,也是可靠的,而通過式(1)中給出的邊界產(chǎn)生了關(guān)于VMR-WB 的較好的結(jié)果。
下面的式(2)測量存儲在從式(1)獲得的聲門脈沖中的能量與集中 在門聲脈沖的固定時間段的能量數(shù)的百分比(表示編解碼器允許 的最小的可能的基音周期);E表示該百分比。這可以用于在E上設(shè)置一 個下限(floor)以保證脈沖不被錯誤地識別(步驟609)。例如,該下限 的可能值可以被設(shè)定為80%以防止虛假脈沖被識別為脈沖。該能量比較還 防止信號被較差地同步并因此引起某些情況下聲音質(zhì)量比戶.G做mfl^等人 所描述的方法還差。<formula>formula see original document page 15</formula>(2)
一旦發(fā)現(xiàn)好的激勵中的第 一脈沖并且認(rèn)為滿足能量約束,則通過將脈 沖移位跨越壞的激勵并且根據(jù)下式(3)最大化相關(guān)性,來尋找好的和壞的 激勵被偏移的采樣總數(shù)(即,為了重新同步需要對其移位的量),j'。
<formula>formula see original document page 15</formula> (3)
在該式中,F(xiàn)L (幀的長度)是標(biāo)準(zhǔn)大小的幀中的采樣數(shù)(例如,在 VWR-WB中為256),并且『2是用于計(jì)算相關(guān)性的窗口大小(例如,『2 =15)。根據(jù)本發(fā)明的一個實(shí)施例,僅僅通過好的激勵中的能量來歸一化 所實(shí)現(xiàn)的相關(guān)性。該參數(shù)是優(yōu)選的問題并且可以以其它方式歸一化(即, 好的和壞的能量一起,或者僅僅壞的能量)。然而,使用不同的相關(guān)性計(jì) 算方法導(dǎo)致不同的j',并且因此可以確定對于任何給定系統(tǒng)能最佳工作的 方法。
如果在步驟613確定了可接受的相關(guān)性強(qiáng)度,則找到了在信號中用于 切換激勵的低能量點(diǎn)。于是,該過程合并該激勵并計(jì)算子幀的長度(步驟 617和619)。
然而,如果過程沒有尋找到可接受的能量等級(步驟605),則調(diào)用 窗口函數(shù)來合并該激勵。作為例子,任何標(biāo)準(zhǔn)或傳統(tǒng)過程可以用于該窗口 函數(shù)。
為了避免對沒有較好地對齊的信號進(jìn)行重新同步,在步驟613可以使 用對于相關(guān)性的下限。例如,在當(dāng)前情況下所使用的值是0.6??梢詫o出 的相關(guān)性低于所選下限的任何信號進(jìn)行修改(例如,根據(jù)尸.G0"f7W^等人)。
由于幀的大小的限制,對于上采樣(upsampling)的目的,在該例子中,VMR-WB中的每個12.8kHz幀的長度應(yīng)當(dāng)可以被4除盡。因此,所 發(fā)現(xiàn)的j接近4的倍數(shù)。
該示例方案允許采樣被增加到幀中并且不被移除,即,)一直大于或 等于0。例如,執(zhí)行該過程以獲得適合IP網(wǎng)絡(luò)上實(shí)時語音的方案的有益邊 緣效應(yīng)。然而,如果需要,還可以允許從幀中移除采樣,即,具有小于0 的)'。當(dāng)需要時,這可以通過修改式(3)中j的邊界以包括負(fù)的索引來實(shí) 現(xiàn)。
樣數(shù)量后,可以在信號中尋找低能量點(diǎn),在該低能量點(diǎn)處可以進(jìn)行從壞的 激勵到好的激勵的改變(步驟615)。為了避免由進(jìn)行突然的能量改變而 引起的不想要的偽像,這是必要的。由于在激勵域中執(zhí)行所有的修改,合 成濾波器將平滑這里的任何小的改變,這并不引起問題。
根據(jù)本發(fā)明的一個實(shí)施例,通過滑動『3采樣窗口 (例如,IO采樣) 跨越好的激勵中的第^采樣之前的r。/2個采樣,可以執(zhí)行對最低能量點(diǎn)《 的尋找(參見式(4))。
<formula>formula see original document page 16</formula>
在某些情況下,當(dāng);接近O時,該搜索使用好的激勵的記憶(即,好 的激勵的負(fù)索引),但是這將造成一個問題,如果
j + "0 (5) 在這種情況下,在脈沖之前發(fā)現(xiàn)的《出現(xiàn)在之前的幀中,其播放時間已經(jīng) 過去,甚至在將激勵移位)'之后。這實(shí)質(zhì)上指示解碼器107在幀實(shí)際開 始一一這不是技術(shù)上的聲音一一之前從壞的激勵切換到好的激勵,。因此, 可以在好的激勵的第一脈沖之后就執(zhí)行新的搜索以發(fā)現(xiàn)最低能量點(diǎn)。
如果(j + " 0),貝'J使用-『3 " S -^ -『3重新進(jìn)行
2
(6)
既然已經(jīng)發(fā)現(xiàn)了移位的量以及在何處結(jié)合兩個信號,好的激勵和壞的 .集合(步驟617)。在包括好的激勵和壞的激勵的新幀中,最初的min j +《}個采樣屬于壞的激勵,而最后的F丄-《個采樣來自好的激 勵,在)+ £>尸丄的情況下,在壞的激勵和好的激勵之間的()'+《)-F丄個 采樣應(yīng)當(dāng)被設(shè)置為0。因此,新幀的長度是尸丄+ j。
根據(jù)示例實(shí)施例,在VMR-WB編解碼器中,定義兩個激勵信號一 個用于適應(yīng)性碼本記憶, 一個是后處理的并僅僅用于合成。在合成過程中, 兩個信號都使用,因此對一個信號進(jìn)行的任何修改需要同樣地對另一信號 進(jìn)行執(zhí)行這一點(diǎn)很重要。在這里采用的方法中,對單獨(dú)用于合成的激勵執(zhí) 行所有的計(jì)算,但是在算法的結(jié)尾,兩個激勵都獲得偏移并且如前面的段 落所述的那樣被保存。
作為例子,VMR-WB編解碼器^f吏用4子幀,而其它編解碼器可以在 這點(diǎn)上不同。在重新同步過程的結(jié)尾,如果幀的大小改變(即,如果力=0 ), 則在步驟619,正確子幀的大小被改變以反映這種差異。對信號的在后濾 波是逐個子幀地來執(zhí)行的,因此,子幀長度的總和需要對應(yīng)于整個信號的 長度。應(yīng)當(dāng)被修改的子幀長度是《所在的子幀,并且)'的整體值應(yīng)當(dāng)被增 加到子幀的原始長度中。新的幀長度是F丄+ ),即,長度被增加j,并且 這需要反映在子幀中。
在這種情況下,假設(shè))是正的(即,新幀一直大于正常幀的長度)。 然而,如之前所提及的,還可以縮短幀,并且在這種情況下,應(yīng)該修改子 幀的長度以反映信號的哪部分應(yīng)當(dāng)被保留或不保留。
如同所解釋的,為了示意的目的,對基于CELP的編解碼器中的激勵
信號執(zhí)行上述計(jì)算和修改。還可以使用基音同步疊加(PSOLA)或其它技 術(shù)來對PCM信號執(zhí)行修改。然而,關(guān)于對激勵信號執(zhí)行修改,脈沖編碼 調(diào)制(PCM)信號的計(jì)算更加復(fù)雜。
圖7是根據(jù)本發(fā)明實(shí)施例,涉及對重新同步過程的使用的激勵信號的 示圖。信號701、 703和705與圖4的信號相似。信號707是由系統(tǒng)100 的遲到分組處理產(chǎn)生的激勵信號。由于之前沒有差錯,第一幀的激勵信號 在所有線中相同。由于沒有改變隱藏過程,第二幀在信號703、 705和707 中也相同。可以在第三幀期間使用在尸.G卯rm^等人描述的方法執(zhí)行遲到幀處理?;糁芷谠谛盘?07中被明顯地很好地維持。箭頭指示在擴(kuò)展隱 藏的激勵信號和在內(nèi)部狀態(tài)更新之后的(好的)激勵信號之間的切換點(diǎn)。 切換點(diǎn)之前的激勵信號準(zhǔn)確地對應(yīng)于"擴(kuò)展的"隱藏的激勵。在切換點(diǎn)之 后的激勵信號(最后兩個基音脈沖)準(zhǔn)確地(具有1/3幀延時)對應(yīng)于"好 的,,激勵信號701。輸出幀比通常的幀長大約1/3并且比好的激勵多包括一 個基音脈沖。
圖8A-8D是根據(jù)本發(fā)明的各種實(shí)施例,與確定和說明基音相位差異相 關(guān)聯(lián)的過程的流程圖。在圖8A中,在上述實(shí)現(xiàn)方式中,在步驟801,通過 執(zhí)行在一方面使用隱藏的內(nèi)部狀態(tài)(例如圖2的信號(i))計(jì)算的輸出信 號和另一方面使用更新的內(nèi)部狀態(tài)(例如圖2的信號(iii))計(jì)算的輸出 信號之間的相關(guān),來尋找差異。注意可以在信號之間確定相關(guān),其中該信 號是解碼器輸出信號或者內(nèi)部解碼器信號(例如,激勵信號)。在步驟803, 過程確定產(chǎn)生最大相關(guān)性的延時是所估計(jì)的基音相位差異,并根據(jù)確定的 延時來輸出所估計(jì)的基音相位差異(步驟805)。
如圖8B所示,在步驟811,還可以通過首先在使用隱藏的內(nèi)部狀態(tài)中 的信號(i)以及4吏用更新的內(nèi)部狀態(tài)的信號(iii)中尋找基音標(biāo)記,來確 定基音相位差異(例如,使用基音同步疊加(PSOLA)算法)。在步驟813, 該過程比較這些基音標(biāo)記的位置,并在步驟815根據(jù)所確定的延時來輸出 所估計(jì)的基音相位差異??商娲模瑘D8C顯示了在步驟821,通過首先確 定隱藏前的最后的基音標(biāo)記的位置,然后使用隱藏的基音值和在遲到幀中 發(fā)現(xiàn)的實(shí)際的基音值以確定信號(i)和信號(iii)中的基音標(biāo)記位置(步 驟823),來獲得基音差異。之后,在步驟825,過程根據(jù)確定的基音標(biāo)記 位置來輸出所估算的基音相位差異。
在圖8D中,根據(jù)示例實(shí)施例(圖8D所示),在步驟831,通過把信 號(iii)延時相同的數(shù)量可以補(bǔ)償由隱藏引入的基音相位差異。這時,兩 個信號(i)和(iii)"同相,,(步驟833)。因此,可以快速的從一個信 號切換到另一信號同時不破壞周期性。然而,由于延時已經(jīng)應(yīng)用到信號 (iii),產(chǎn)生的"過渡"輸出幀比普通幀長。在某些應(yīng)用中,這并不導(dǎo)致問題并且甚至可以是令人期望的(即,當(dāng)解碼器與適應(yīng)性抖動緩存器結(jié)合 時,較長的輸出幀增加了播放延時,這將降低接收另一遲到幀的可能性)。 在需要恒定輸出幀持續(xù)時間的其它應(yīng)用中,可以通過把信號(i )和/或(iii ) 中的單獨(dú)的脈沖稍微移回所引入的一小部分差錯來獲得具有正常長度的 "過渡"輸出幀,其中該差錯是在從一個信號切換到另一信號之前在隱藏 期間引入的。
上述方法的另 一優(yōu)點(diǎn)是在處理了遲到分組之后改進(jìn)了解碼信號的主觀 質(zhì)量。具體來說,確定了通常在濁音語音或周期或準(zhǔn)周期音頻信號期間由 隱藏過程引入的基音相位差異,并且遲到分組處理過程考慮該基音相位差 異,以便平滑在隱藏的輸出信號和使用更新的內(nèi)部狀態(tài)所計(jì)算的輸出信號 之間的過渡。第二個優(yōu)點(diǎn)是允許在隱藏的輸出信號和"更新的"輸出信號 之間的(相對于通常的"淡入、淡出"法)更快的切換。另一優(yōu)點(diǎn)在接收 到遲到分組后產(chǎn)生通常比正常幀持續(xù)時間長的輸出幀。這增加了播放延時, 并且因此降低了接收另 一遲到幀的可能性。
本領(lǐng)域普通技術(shù)人員應(yīng)認(rèn)識到,基音相位重新同步的過程可以通過軟
件、硬件(例如普通處理器,數(shù)字信號處理器(DSP)芯片、特定應(yīng)用集 成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)等)、固件或者其組合來 實(shí)現(xiàn)。下面通過圖9詳細(xì)描述用于執(zhí)行所述功能的示例硬件。
圖9示出可以在其上實(shí)現(xiàn)本發(fā)明的各個實(shí)施例的示例性硬件。計(jì)算系 統(tǒng)900包括總線901或其它通信機(jī)制,用于傳遞信息;以及處理器卯3, 其耦合到總線901,以用于處理信息。計(jì)算系統(tǒng)900還包括主存儲器905, 例如隨才;i^取存儲器(RAM)或其它動態(tài)存儲設(shè)備,其耦合到總線卯l, 以用于存儲信息和將由處理器903執(zhí)行的指令。主存儲器905還可以被使 用以在處理器903執(zhí)行指令期間存儲臨時變量或其它中間信息。計(jì)算系統(tǒng) 900可以進(jìn)一步包括只讀存儲器(ROM)卯7或其它靜態(tài)存儲設(shè)備,其 耦合到總線901,為處理器903存儲靜態(tài)信息和指令。存儲設(shè)備卯9 (例如 磁盤或光盤)耦合到總線901,以長久存儲信息和指令。
計(jì)算系統(tǒng)卯0可以經(jīng)由總線901耦合到顯示器911,例如液晶顯示器或有源矩陣顯示器,以將信息顯示給用戶。輸入設(shè)備913,例如包括字母 數(shù)字鍵和其它鍵的鍵盤,可以耦合到總線卯l,以將信息和命令選擇傳遞
給處理器903。輸入設(shè)備913可以包括光標(biāo)控制,例如鼠標(biāo)、軌跡球、或 光標(biāo)方向鍵,以將方向信息和命令選擇傳遞給處理器卯3,并控制光標(biāo)在 顯示器911上的運(yùn)動。
根據(jù)本發(fā)明各種實(shí)施例,可以響應(yīng)于處理器卯3執(zhí)行主存儲器卯5中 所包含的指令安排,而由計(jì)算系統(tǒng)卯O提供在此描述的過程??梢詫⑦@樣 的指令從另 一計(jì)算機(jī)可讀介質(zhì)(例如存儲設(shè)備909 )讀入主存儲器905。對 主存儲器卯5所包含的指令安排的執(zhí)行導(dǎo)致了處理器903執(zhí)行在此描述的 過程步驟。還可以采用多處理裝置中的一個或多個處理器,以執(zhí)行主存儲 器905所包含的指令。在替換實(shí)施例中,可以使用硬連線電路來替代軟件 指令或與軟件指令結(jié)合,以實(shí)現(xiàn)本發(fā)明的實(shí)施例。在另一示例中,可以使 用可重新配置的^_件,例如現(xiàn)場可編程門陣列(FPGA),其中,典型地 根據(jù)編程存儲器查找表來在運(yùn)行時間定制其邏輯門的功能和連接拓樸。因 此,本發(fā)明實(shí)施例不限于硬件電路和軟件的任意特定結(jié)合。
計(jì)算系統(tǒng)卯O還包括至少一個通信接口 915,其耦合到總線901。通信 接口 915提自合到網(wǎng)絡(luò)鏈路(未示出)的雙向數(shù)據(jù)通信。通信接口 915 發(fā)送并接收電信號、電磁信號或光信號,這些信號承載了表示各種類型的 信息的數(shù)字?jǐn)?shù)據(jù)流。進(jìn)一步地,通信接口 915可以包括外圍接口設(shè)備,例 如通用串行總線(USB)接口 、 PCMCIA (個人計(jì)算才A^儲器卡國際聯(lián)盟) 接口等。
處理器卯3可以在代碼被接收到的同時執(zhí)行所發(fā)送的代碼,并且/或者 將代碼存儲在存^i殳備卯9或其它非易失性存儲器中以用于稍后執(zhí)行。按 照該方式,計(jì)算系統(tǒng)900可以獲得載波形式的應(yīng)用代碼。
在此使用的術(shù)語"計(jì)算機(jī)可讀介質(zhì)"指的是參與將指令提供給處理器 903以用于執(zhí)行的任意介質(zhì)。這樣的介質(zhì)可以采用多種形式,包括非易失 性介質(zhì)、易失性介質(zhì)和傳輸介質(zhì),但不限于此。非易失性介質(zhì)包括例如光 盤或磁盤,例如存儲設(shè)備909。易失性介質(zhì)包括動態(tài)存儲器,例如主存儲器905。傳輸介質(zhì)包括同軸電纜、銅導(dǎo)線和光纖,其包括包含了總線901 的導(dǎo)線。傳輸介質(zhì)也可以采用例如在射頻(RF)和中頻(IR)數(shù)據(jù)通信期 間生成的聲波、光波或電磁波的形式。計(jì)算機(jī)可讀介質(zhì)的通用形式包括例 如軟盤、軟磁盤、硬盤、磁帶、任意其它磁介質(zhì)、CD-ROM 、 CDRW、 DVD、任意其它光學(xué)介質(zhì)、打孔卡、紙帶、光標(biāo)記板、具有孔或其它光學(xué) 可識別標(biāo)記的圖案的任意其它物理介質(zhì)、RAM、 PROM、 EPROM和 FLASH-EPROM,任意其它存儲器芯片或盒式磁帶、栽波或計(jì)算機(jī)可讀的 任意其它介質(zhì)。
在將指令提供給處理器用于執(zhí)行中,可以包括各種形式的計(jì)算機(jī)可讀 介質(zhì)。例如,用于執(zhí)行本發(fā)明的至少一部分的指令可以初始被承載在遠(yuǎn)程 計(jì)算機(jī)的磁盤上。在此情況下,遠(yuǎn)程計(jì)算機(jī)將指令加栽到主存儲器,并使 用調(diào)制解調(diào)器在電話線路上發(fā)送所述指令。本地系統(tǒng)的調(diào)制解調(diào)器在電話 線路上接收數(shù)據(jù),并且利用紅外發(fā)射機(jī)來將該數(shù)據(jù)轉(zhuǎn)換成紅外信號并將該 紅外信號發(fā)送給便攜式計(jì)算設(shè)備,例如個人數(shù)字助理(PDA )或膝上電腦。 便攜式計(jì)算設(shè)備上的紅外檢測器接收由紅外信號承載的信息和指令,并將 數(shù)據(jù)放到總線上??偩€將所述數(shù)據(jù)傳送到主存儲器,處理器從主存儲器取 得并執(zhí)行指令。主存儲器所接收的指令可選地可以在處理器執(zhí)行之前或之 后被存儲在存儲i殳備中。
圖IOA和圖IOB是能夠支持本發(fā)明各個實(shí)施例的不同的蜂窩移動電話 系統(tǒng)的示圖。圖IOA和圖IOB示出示例性蜂窩移動電話系統(tǒng),其每一個既 具有移動站(例如手機(jī))又具有基站,所述移動站和基站具有已安裝的收 發(fā)器(作為移動站和基站中的數(shù)字信號處理器(DSP)、硬件、軟件、集 成電路、和/或半導(dǎo)體設(shè)備的一部分)。例如,無線電網(wǎng)絡(luò)支持由國際電信 聯(lián)盟(ITU)為國際移動通信2000 (IMT-2000)定義的第二代和第三代(2G 和3G)服務(wù)。為了解釋的目的,關(guān)于cdma2000架構(gòu)來解釋無線電網(wǎng)絡(luò)的 載波和信道選擇性能。作為IS-95的第三代版本,cdma2000在第三代合作 伙伴項(xiàng)目2 (3GPP2)中被標(biāo)準(zhǔn)化。
無線電網(wǎng)絡(luò)1000包括移動站1001 (例如手機(jī)、終端、站臺、單元、設(shè)備、或用于用戶的其它類型的接口 (例如"可佩戴"電路等)),其與
基站子系統(tǒng)(BSS) 1003通信。根據(jù)本發(fā)明一個實(shí)施例,無線電網(wǎng)絡(luò)支持 國際電信聯(lián)盟(ITU )為國際移動通信2000( IMT-2000 )定義的第三代(3G) 服務(wù)。
在該示例中,BSS 1003包括基站收發(fā)器(BTS) 1005和基站控制器 (BSC) 1007。雖然示出單個BTS,但應(yīng)理解,多個BTS典型地通過例如 點(diǎn)對點(diǎn)鏈路連接到BSC。每一BSS 1003通過傳輸控制實(shí)體或分組控制功 能單元(PCF) 1011被鏈接到分組數(shù)據(jù)服務(wù)節(jié)點(diǎn)(PDSN) 1009。由于PDSN 1009充當(dāng)對外部網(wǎng)絡(luò)(例如互聯(lián)網(wǎng)1013或其它私有用戶網(wǎng)絡(luò)1015)的網(wǎng) 關(guān),因此PDSN1009可以包"^問、授權(quán)和計(jì)費(fèi)系統(tǒng)(AAA) 1017,以安 全地確定用戶的身份和特權(quán)并跟蹤每一用戶的活動。網(wǎng)絡(luò)1015包括網(wǎng)絡(luò)管 理系統(tǒng)(NMS) 1031,其被鏈接到一個或多個數(shù)據(jù)庫1033,所述數(shù)據(jù)庫 1033通過由歸屬AAA 1037確保安全的歸屬代理(HA) 1035而被訪問。
雖然示出了單個BSS 1003,但應(yīng)理解,多個BSS 1003典型地被連接 到移動交換中心(MSC) 1019。 MSC 1019提供對電路交換網(wǎng)絡(luò)(例如/> 共交換電話網(wǎng)(PSTN) 1021)的連接性。相似地,還應(yīng)理解,MSC 1019 可以連接到相同網(wǎng)絡(luò)1000上的其它MSC 1019,并且/或者連接到其它無線 電網(wǎng)絡(luò)。MSC 1019通常搭配有訪問者位置寄存器(VLR) 1023數(shù)據(jù)庫, 其保存對于該MSC 1019的有效訂戶的臨時信息。VLR 1023數(shù)據(jù)庫中的數(shù) 據(jù)很大程度上是歸屬位置寄存器(HLR) 1025數(shù)據(jù)庫的拷貝,HLR 1025 數(shù)據(jù)庫存儲詳細(xì)的訂戶服務(wù)訂購信息。在一些實(shí)現(xiàn)方式中,HLR 1025和 VLR 1023是相同的物理數(shù)據(jù)庫;然而,HLR1025可以位于通過例如7號 信令系統(tǒng)(SS7)網(wǎng)絡(luò)訪問的遠(yuǎn)程位置。包含訂戶特定的認(rèn)證數(shù)據(jù)(例如 秘密認(rèn)證密鑰)的認(rèn)證中心(AuC ) 1027與HLR 1025關(guān)聯(lián),以認(rèn)證用戶。 更進(jìn)一步地,MSC 1019被連接到短消息服務(wù)中心(SMSC) 1029, SMSC 1029存儲短消息并轉(zhuǎn)發(fā)來自無線網(wǎng)絡(luò)1000的短消息或?qū)⒍滔⑥D(zhuǎn)發(fā)到無 線網(wǎng)絡(luò)IOOO。
在蜂窩電話系統(tǒng)的典型操作期間,BTS 1005接收并解調(diào)來自進(jìn)行電話呼叫或其它通信的多組移動單元1001的多組反向鏈路信號。由給定的BTS 1005接收的每一反向鏈路信號在該站臺中被處理。所得到的數(shù)據(jù)被轉(zhuǎn)發(fā)到 BSC 1007。 BSC 1007提供包括BTS 1005之間的軟切換配合的呼叫資源分 配和移動性管理功能。BSC 1007還將接收到的數(shù)據(jù)路由到MSC 1019, MSC 1019依次提供用于與PSTN 1021的接口的附加路由和/或交換。MSC 1019還負(fù)責(zé)呼叫建立、呼叫終止、MSC間切換和輔助服務(wù)的管理、以及 收集、收費(fèi)和計(jì)費(fèi)信息。相似地,無線電網(wǎng)絡(luò)1000發(fā)送前向鏈路消息。 PSTN 1021與MSC 1019進(jìn)行接口 。 MSC 1019附加地與BSC 1007進(jìn)行接 口, BSC 1007依次與BTS 1005通信,BTS 1005調(diào)制多組前向鏈路信號, 并將其發(fā)送給多組移動單元1001。
如圖IOB所示,通用分組無線服務(wù)(GPRS)架構(gòu)1050的兩個關(guān)鍵元 件;U艮務(wù)GPRS支持節(jié)點(diǎn)(SGSN) 1032和網(wǎng)關(guān)GPRS支持節(jié)點(diǎn)(GGSN) 1034。此外,GPRS架構(gòu)包括分組控制單元PCU ( 1036)和收費(fèi)網(wǎng)關(guān)功能 單元(CGF) 1038, CGF 1038鏈接到計(jì)費(fèi)系統(tǒng)1039。 GPRS移動站(MS ) 1041釆用訂戶身份模塊(SIM) 1043。
PCU 1036是邏輯網(wǎng)絡(luò)元件,負(fù)責(zé)與GPRS有關(guān)的功能,例如空中接 口訪問控制、空中接口上的分組調(diào)度以及分組組裝和重組。通常,PCU 1036 被物理集成到BSC 1045;然而,其可以與BTS 1047或SGSN 1032結(jié)合。 SGSN 1032提供與MSC 1049等同的功能,包括移動性管理、安全性和訪 問控制功能,但是在分組交換域中的。更進(jìn)一步地,SGSN 1032使用BSS GPRS協(xié)議(BSSGP)通過例如基于幀中繼的接口與PCU 1036連接。雖 然僅示出一個SGSN,但應(yīng)理解,可以采用多個SGSN 1031,并且可以將 服務(wù)區(qū)域劃分為對應(yīng)的路由區(qū)域(RA) 。 SGSN/SGSN接口允許當(dāng)在正在 進(jìn)行的個人發(fā)展計(jì)劃(PDP)上下文期間發(fā)生RA更新時將分組從舊的 SGSN隧穿到新的SGSN。雖然給定的SGSN可以服務(wù)于多個BSC 1045, 但任意給定的BSC 1045通常與一個SGSN 1032進(jìn)行接口 。此外,可選地, SGSN 1032使用GPRS增強(qiáng)的移動應(yīng)用部分(MAP)通過基于SS7的接 口與HLR 1051連接,或使用信令連接控制部分(SCCP)通過基于SS7的接口與MSC 1049連接。SGSN/HLR接口允許SGSN 1032在SGSN服 務(wù)區(qū)域內(nèi)將位置更新提供給HLR 1051并獲取與GPRS有關(guān)的訂購信息。 SGSN/MSC接口使得能夠在電路交換服務(wù)和分組數(shù)據(jù)服務(wù)(例如尋呼用于 語音呼叫的訂戶)之間進(jìn)行協(xié)調(diào)。最后,SGSN 1032與SMSC 1053進(jìn)行 接口,以能夠啟用網(wǎng)絡(luò)1050上的短消息傳送功能。
GGSN 1034是對外部分組數(shù)據(jù)網(wǎng)絡(luò)(例如互聯(lián)網(wǎng)1013或其它私人用 戶網(wǎng)絡(luò)1055)的網(wǎng)關(guān)。網(wǎng)絡(luò)1055包括網(wǎng)絡(luò)管理系統(tǒng)(NMS) 1057,其鏈 接到通過PDSN 1061訪問的一個或多個數(shù)據(jù)庫1059。 GGSN 1034分配互 聯(lián)網(wǎng)協(xié)議(IP)地址,并還可以認(rèn)證充當(dāng)遠(yuǎn)程用戶^U^認(rèn)證服務(wù)主機(jī)的用 戶。位于GGSN 1034的防火墻還執(zhí)行防火墻功能,以限制免授權(quán)流量。雖 然僅示出一個GGSN 1034,但應(yīng)理解,給定的SGSN 1032可以與一個或 多個GGSN 1033進(jìn)行接口,以允許在兩個實(shí)體之間以及在進(jìn)出網(wǎng)絡(luò)1050 之間隧穿用戶數(shù)據(jù)。當(dāng)外部數(shù)據(jù)網(wǎng)絡(luò)在GPRS網(wǎng)絡(luò)1050上初始化會話時, GGSN 1034向HLR 1051詢問當(dāng)前服務(wù)于MS 1041的SGSN 1032。
BTS 1047和BSC 1045管理無線電接口 ,包括控制哪一移動站(MS ) 1041何時具有對無線電信道的訪問。這些元件實(shí)際上在MS 1041和SGSN 1032之間中繼消息。SGSN 1032管理與MS 1041的通信,發(fā)送和接收數(shù) 據(jù)并保持對其位置的多艮蹤。SGSN 1032還注冊MS 1041, i人證MS1041, 并對發(fā)送給MS 1041的數(shù)據(jù)加密。
圖ll是根據(jù)本發(fā)明實(shí)施例的能夠在圖IOA和圖IOB的系統(tǒng)中運(yùn)行的 移動站(例如手機(jī))的示例性組件的示圖。通常,經(jīng)常按照前端和后端特 性來定義無線電接收機(jī)。接收機(jī)的前端包括所有射頻(RF)電路,而后端 包括所有基帶處理電路。電話的有關(guān)內(nèi)部組件包括主控制單元(MCU) 1103、數(shù)字信號處理器(DSP) 1105以及包含麥克風(fēng)增益控制單元和揚(yáng)聲 器增益控制單元的接收機(jī)/發(fā)射機(jī)單元。主顯示單元1107以各種應(yīng)用和移 動站功能為支持,將顯示提供給用戶。音頻功能電路1109包括麥克風(fēng)1111 和對從麥克風(fēng)1111輸出的話音信號進(jìn)行放大的麥克風(fēng)放大器。被放大的從 麥克風(fēng)llll輸出的話音信號被饋送到編碼器/解碼器(編解碼器)1113。無線電部分1115放大功率并轉(zhuǎn)換頻率,以經(jīng)由天線1117與基站通信, 基站被包括在移動通信系統(tǒng)中(例如圖IOA和圖IOB的系統(tǒng))。功率放大 器(PA) 1119和發(fā)射機(jī)/調(diào)制電路以來自耦合到雙工器1121或循環(huán)器或天 線開關(guān)的PA1119的輸出,而操作性地響應(yīng)于MCU 1103,這為本領(lǐng)域/> 知。PA 1119還耦合到電池接口和電源控制單元1120 。
在使用中,移動站1101的用戶對麥克風(fēng)1111說話,并且他或她的語 音連同檢測到的背景噪聲一起被轉(zhuǎn)換為模擬電壓。于是,模擬電壓通過模 數(shù)轉(zhuǎn)換器(ADC) 1123被轉(zhuǎn)換為數(shù)字信號??刂茊卧?103將數(shù)據(jù)信號路 由到DSP1105,以在其中進(jìn)行處理,例如話音編碼、信道編碼、加密和交 織。在示例性實(shí)施例中,通過使用碼分多址(CDMA)的蜂窩傳輸協(xié)議來 由未單獨(dú)示出的單元對處理過的語音信號編碼,其在電信產(chǎn)業(yè)協(xié)會的 TIA/EIA/IS-95-A用于xM^寬帶擴(kuò)頻蜂窩系統(tǒng)的移動站-基站兼容性標(biāo)準(zhǔn)中 被詳細(xì)描述;其通過引用被完全合并到此。
于是,被編碼的信號被路由到均衡器1125,以補(bǔ)償在通過空中傳輸期 間出現(xiàn)的頻率相關(guān)性損傷(例如相位和幅度失真)。在對比特流進(jìn)行均衡 之后,調(diào)制器1127將該信號與在RT接口 1129中生成的RF信號合并。 調(diào)制器1127通過頻率和相位調(diào)制生成正弦波。為了準(zhǔn)備用于傳輸?shù)男盘枺?上變頻器1131將從調(diào)制器1127輸出的正弦波與由合成器1133生成的另一 正弦波進(jìn)行合并,以實(shí)現(xiàn)期望的傳輸頻率。于是,通過PA1119發(fā)送所述 信號,以將所述信號提升到合適的功率電平。在實(shí)際系統(tǒng)中,PA 1119充 當(dāng)可變增益放大器,其增益由DSP 1105根據(jù)接收自網(wǎng)絡(luò)基站的信息來控 制。于是,在雙工器1121內(nèi)對該信號濾波,并且可選地將該信號發(fā)送給天 線耦合器1135,以進(jìn)行阻抗匹配,從而提供最大功率傳輸。最后,經(jīng)由天 線1117將信號發(fā)送給本地基站??梢蕴峁┳詣釉鲆婵刂?AGC)以控制 接收機(jī)的末級增益??梢詮慕邮諜C(jī)將信號轉(zhuǎn)發(fā)到遠(yuǎn)程電話,所述遠(yuǎn)程電話 可以是另一蜂窩電話、其它移動電話,或連接到公共交換電話網(wǎng)(PSTN) 或其它電話網(wǎng)絡(luò)的地面線路。
經(jīng)由天線1117接收發(fā)送給移動站1101的語音信號,并由低噪聲放大器(LNA) 1137立即對其放大。下變頻器1139降低載波頻率,而解調(diào)器 1141移除RF,僅留下數(shù)字比特流。于是,信號通過均衡器1125,并由DSP 1105進(jìn)行處理。數(shù)模轉(zhuǎn)換器(DAC) 1143對該信號進(jìn)行轉(zhuǎn)換,所得到的 輸出通過揚(yáng)聲器1145被發(fā)送給用戶,所有操作都在主控制單元(MCU) 1103的控制下,主控制單元(MCU) 1103可以被實(shí)現(xiàn)為中央處理單元 (CPU)(未示出)。
MCU 1103接收各種信號,包括來自鍵盤1147的輸入信號。MCU 1103 將顯示命令和轉(zhuǎn)換命令分別交付給顯示器1107和話音輸出轉(zhuǎn)換控制器。進(jìn) 一步地,MCU 1103與DSP 1105交換信息,并可以訪問可選地包括的SIM 卡1149和存儲器1151。此外,MCU 1103執(zhí)行站臺所需的各種控制功能。 根據(jù)實(shí)現(xiàn)方式,DSP 1105可以對語音信號執(zhí)行任意的各種傳統(tǒng)數(shù)字處理功 能。此外,DSP 1105從麥克風(fēng)1111所檢測的信號確定本地環(huán)境的背景噪 聲電平,并將麥克風(fēng)llll的增益設(shè)置為所選擇的電平,以補(bǔ)償移動站1101 的用戶的自然傾向。
編解碼器1113包括ADC 1123和DAC 1143。存儲器1151存儲包括來 電基音數(shù)據(jù)的各種數(shù)據(jù),并能夠存儲包括例如經(jīng)由全球互聯(lián)網(wǎng)接收的音樂 數(shù)據(jù)的其它數(shù)據(jù)。軟件模塊可以駐留在RAM存儲器、閃速存儲器、寄存 器、或任意其它形式的本領(lǐng)域公知的可寫存儲介質(zhì)中。存儲器設(shè)備1151 可以是單式存儲器、CD、 DVD、 ROM、 RAM、 EEPROM、光學(xué)存儲器、 或能夠存儲數(shù)字?jǐn)?shù)據(jù)的任意其它非易失性存儲介質(zhì),但不限于此。
可選地包括的SIM卡1149承載例如重要信息,例如蜂窩電話號碼、 運(yùn)營商提供服務(wù)、訂購細(xì)節(jié)以及安全性信息。SIM卡1149主要用于標(biāo)識 無線電網(wǎng)絡(luò)上的移動站1101???149還包含存儲器,以用于存儲個人電 話號碼注冊、文本消息和用戶特定移動站設(shè)置。
圖12示出示例性企業(yè)網(wǎng)絡(luò),其可以是利用基于分組的和/或基于蜂窩 的技術(shù)(例如異步傳輸模式(ATM)、以太網(wǎng)、基于IP等)的任意類型 的數(shù)據(jù)通信網(wǎng)絡(luò)。企業(yè)網(wǎng)絡(luò)1101將連接性提供給有線節(jié)點(diǎn)1203和無線節(jié) 點(diǎn)1205-1209 (固定或移動的),其均被配置為執(zhí)行上述處理。企業(yè)網(wǎng)絡(luò)1201可以與各種其它網(wǎng)絡(luò)(例如WLAN網(wǎng)絡(luò)1211 (例如IEEE 802.11)、 CDMA 2000蜂窩網(wǎng)絡(luò)1213、電話網(wǎng)絡(luò)1215 (例如PSTN)、或公共數(shù)據(jù) 網(wǎng)絡(luò)1217 (例如互聯(lián)網(wǎng)))通信。
雖然已經(jīng)結(jié)合多個實(shí)施例和實(shí)現(xiàn)方式描述了本發(fā)明,但本發(fā)明不限于 此,而是覆蓋落入所附權(quán)利要求的范圍內(nèi)的各種明顯的修改和等同的配置。 雖然在權(quán)利要求中以特定組合表達(dá)了本發(fā)明的特征,但應(yīng)理解,可以按任 意組合和順序來安排這些特征。
權(quán)利要求
1.一種方法,包括檢測包括音頻信息的遲到幀,其中已經(jīng)執(zhí)行隱藏以替代所述遲到幀;確定由所述隱藏引入的基音相位差異;以及在播放隨所述遲到幀之后的后續(xù)幀之前,補(bǔ)償所述基音相位差異。
2. 如權(quán)利要求l所述的方法,進(jìn)一步包括 使用所述遲到幀,來使解碼器的內(nèi)部狀態(tài)與編碼器的內(nèi)部狀態(tài)重新同步。
3. 如權(quán)利要求1所述的方法,其中通過以下來確定所述基音 相位差異在第 一 信號和第二信號之間進(jìn)行相關(guān); 確定最大相關(guān)性;以及 確定對應(yīng)于所述最大相關(guān)性的延時值。
4. 如權(quán)利要求3所述的方法,其中所述第一信號對應(yīng)于被隱 藏的所述遲到幀,并且所述第二信號對應(yīng)于被適當(dāng)解碼的所述遲 到幀。
5. 如權(quán)利要求3所述的方法,其中所述第一信號對應(yīng)于使用 隱藏的內(nèi)部狀態(tài)而解碼的所述后續(xù)幀,并且所述第二信號對應(yīng)于 使用更新的內(nèi)部狀態(tài)而解碼的所述后續(xù)幀。
6. 如權(quán)利要求1所述的方法,其中通過以下來確定所述基音 相位差異確定對應(yīng)于第一信號的第一組基音標(biāo)記以及對應(yīng)于第二信號 的第二組基音標(biāo)記;以及比較所述第一組基音標(biāo)記與所述第二組基音標(biāo)記的位置。
7. 如權(quán)利要求6所述的方法,其中所述第一信號對應(yīng)于被隱藏的所述遲到幀,并且所述第二信號對應(yīng)于被適當(dāng)解碼的所述遲 到幀。
8. 如權(quán)利要求6所述的方法,其中所述第一信號對應(yīng)于使用 隱藏的內(nèi)部狀態(tài)而解碼的所述后續(xù)幀,并且所述第二信號對應(yīng)于 使用所述更新的內(nèi)部狀態(tài)而解碼的所述后續(xù)幀。
9. 如權(quán)利要求1所述的方法,通過以下來確定所述基音相位 差異使用對所述遲到幀的隱藏之前的最后基音標(biāo)記的位置、隱藏 的基音值以及從所述遲到幀中恢復(fù)的實(shí)際基音值,來確定隱藏的 輸出信號的基音標(biāo)記位置以及正確的輸出信號的基音標(biāo)記位置; 并且比較所述基音標(biāo)記位置。
10. 如權(quán)利要求1所述的方法,其中補(bǔ)償所述基音相位差異包 括延時或時間縮放所述后續(xù)幀的一部分,從而使得當(dāng)從隱藏幀轉(zhuǎn) 到隨后的更新幀時,相應(yīng)語音信號的自然基音周期性不被破壞。
11. 一種裝置,包括 隱藏邏輯,其被配置為替代遲到幀;配置為檢測包括音頻信息的遲到幀的邏輯,其中已經(jīng)執(zhí)行隱 藏以替代所述遲到幀;以及基音相位補(bǔ)償邏輯,其被配置為確定由所述隱藏引入的基音 相位差異,并且在播放隨所述遲到幀之后的后續(xù)幀之前補(bǔ)償所述 基音相位差異。
12. 如權(quán)利要求11所述的裝置,進(jìn)一步包括 具有內(nèi)部狀態(tài)的解碼邏輯,所述內(nèi)部狀態(tài)被使用所述遲到幀與編碼器的內(nèi)部狀態(tài)重新同步。
13. 如權(quán)利要求11所述的裝置,所述基音相位差異通過以下 來確定對第一信號和第二信號進(jìn)行相關(guān);確定最大相關(guān)性;以及 確定對應(yīng)于所述最大相關(guān)性的延時值。
14. 如權(quán)利要求13所述的裝置,其中所述第一信號對應(yīng)于被 隱藏的所述遲到幀,并且所述第二信號對應(yīng)于被適當(dāng)解碼的所述 遲到幀。
15. 如權(quán)利要求13所述的裝置,其中所述第一信號對應(yīng)于使 用隱藏的內(nèi)部狀態(tài)解碼的所述后續(xù)幀,并且所述第二信號對應(yīng)于 使用更新的內(nèi)部狀態(tài)解碼的所述后續(xù)幀。
16. 如權(quán)利要求11所述的裝置,其中所述基音相位差異通過 以下來確定確定對應(yīng)于第一信號的第一組基音標(biāo)記以及對應(yīng)于第二信號 的第二組基音標(biāo)記;以及比較所述第一組基音標(biāo)記的位置與所述第二組基音標(biāo)記的位置。
17. 如權(quán)利要求16所述的裝置,其中所述第一信號對應(yīng)于被 隱藏的所述遲到幀,并且所述第二信號對應(yīng)于被適當(dāng)解碼的所述 遲到幀。
18. 如權(quán)利要求16所述的裝置,其中所述第一信號對應(yīng)于使 用隱藏的內(nèi)部狀態(tài)而解碼的所述后續(xù)幀,并且所述第二信號對應(yīng) 于使用更新的內(nèi)部狀態(tài)而解碼的所述后續(xù)幀。
19. 如權(quán)利要求11所述的裝置,其中所述基音相位差異通過 以下來確定使用隱藏的基音值以及從所述遲到幀中恢復(fù)的實(shí)際基音值, 來確定隱藏的輸出信號的基音標(biāo)記位置以及正確的輸出信號的基 音標(biāo)記位置;并且比較所述基音標(biāo)記位置。
20. 如權(quán)利要求11所述的裝置,其中補(bǔ)償所述基音相位差異 包括延時或時間縮放所述后續(xù)幀的一部分,從而使得當(dāng)從隱藏幀轉(zhuǎn)到隨后的更新幀時,相應(yīng)語音信號的自然基音周期性不被破壞。
21. —種移動設(shè)備,包括權(quán)利要求11所述的裝置。
22. —種音頻設(shè)備,包括權(quán)利要求11所述的裝置。
23. —種芯片組,包括權(quán)利要求11所述的裝置。
24. —種系統(tǒng),包括用于檢測包括音頻信息的遲到幀的裝置,其中已經(jīng)執(zhí)行隱藏以替代所述遲到幀;用于確定由所述隱藏引入的基音相位差異的裝置;以及 用于在播放隨所述遲到幀之后的后續(xù)幀之前補(bǔ)償所述基音相位差異的裝置。
25. 如權(quán)利要求24所述的系統(tǒng),進(jìn)一步包括用于使用所述遲到幀來使解碼器的內(nèi)部狀態(tài)與編碼器的內(nèi)部狀態(tài)重 新同步的裝置。
全文摘要
提供了一種裝置,用于當(dāng)在預(yù)測解碼器中處理遲到幀時,維持語音或音頻信號的自然基音周期性。執(zhí)行隱藏以替代遲到幀。檢測包括音頻信息的遲到幀。確定由隱藏引入的基音相位差異。在播放隨所述遲到幀之后的后續(xù)幀之前補(bǔ)償所述基音相位差異。
文檔編號G10L19/00GK101310329SQ200680042807
公開日2008年11月19日 申請日期2006年10月18日 優(yōu)先權(quán)日2005年10月18日
發(fā)明者K·D·安德松, P·古爾納 申請人:諾基亞公司