專利名稱:通信鏈路之間的延遲交換的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及通信網(wǎng)絡(luò)的終端之間的全雙工通信,具體涉及對(duì)這種通信系統(tǒng)中延遲的處置。
背景技術(shù):
延遲在各種通信服務(wù)中都是決定性的參數(shù),從簡(jiǎn)單的電話到高級(jí)多媒體通信莫不如此。會(huì)話式服務(wù)的特征在于通信鏈路末端的用戶之間的交互性。延遲,或者更準(zhǔn)確地說(shuō)往返延遲,對(duì)交互的感覺(jué)有重要影響并進(jìn)而影響服務(wù)質(zhì)量。通過(guò)通信鏈路交互的各方可能以好像他們處于同一地方的相同方式交互。通信裝置因此應(yīng)該盡可能地不可見(jiàn)。往返延遲高會(huì)導(dǎo)致響應(yīng)時(shí)間長(zhǎng)。這樣長(zhǎng)的響應(yīng)時(shí)間通常會(huì)干擾會(huì)話流并且可能會(huì)被交互者認(rèn)為是來(lái)自另一方的猶豫或者可能造成討厭的不活動(dòng)等待周期?,F(xiàn)代人習(xí)慣于接收非??焖俚幕貞?yīng),甚至相對(duì)較短的延遲都可能導(dǎo)致失敗。因而往返延遲高顯著地降低了交互性。此外,如果往返延遲過(guò)高,電子反射或回聲消除的不充分也可能影響通信質(zhì)量。
另一方面,從傳輸角度看在每條通信鏈路上都需要延遲。除了傳輸本身的基本延遲之外,對(duì)提高信源編碼效率以及更有效地戰(zhàn)勝傳輸缺陷的策略,都需要編碼延遲??偟貋?lái)說(shuō),可以用于信源編碼、信道編碼、頻譜交錯(cuò)、編碼調(diào)制等的編碼延遲都帶來(lái)了編碼增益,通過(guò)該編碼增益能夠降低傳輸功耗且不影響傳輸性能。在本公開(kāi)的上下文中,甚至分組傳輸情況下用于抖動(dòng)緩沖的延遲也被看作編碼延遲。因此延遲非常重要,甚至對(duì)提供無(wú)問(wèn)題傳輸是必要的。一條鏈路上的所有延遲加在一起構(gòu)成了端-到-端延遲,有時(shí)也稱過(guò)嘴-到-耳延遲。此外往返延遲是初始傳輸和緊跟著的回復(fù)的端-到-端延遲之和。
從傳輸?shù)挠^點(diǎn)來(lái)看,延遲是有益的,但對(duì)于為會(huì)話式服務(wù)提供可接受的服務(wù)質(zhì)量來(lái)說(shuō),延遲必須保持在特定限度內(nèi)。因此不得不以編碼延遲獲得的編碼增益換取由于產(chǎn)生的往返延遲導(dǎo)致的交互性損失。
在某些方面,所有通信服務(wù)都拿延遲換取編碼增益。今天GSM系統(tǒng)中的AMR電話技術(shù)就是采用電路交換傳輸?shù)恼Z(yǔ)音通信的一個(gè)例子。源編碼引入了25ms的延遲,信道編碼包括FR語(yǔ)音業(yè)務(wù)信道上的頻譜交錯(cuò)是37.5ms的延遲。在此之上,對(duì)(如)數(shù)字和模擬信號(hào)處理、無(wú)線電脈沖產(chǎn)生、調(diào)制和解調(diào)、無(wú)線電傳輸、基站和代碼轉(zhuǎn)換器之間Abis接口上的串行傳輸?shù)冗€有特定的延遲。這些延遲在語(yǔ)音連接期間是固定的。
Internet中的電話服務(wù)是采用分組交換傳輸?shù)恼Z(yǔ)音通信的一個(gè)例子。這里,不考慮其它因數(shù),從發(fā)送端的模擬信號(hào)輸入到接收端的模擬信號(hào)輸出的端-到-端延遲是由從發(fā)送者到接收者的數(shù)據(jù)分組傳輸時(shí)間、目標(biāo)是應(yīng)付傳輸延遲變化的抖動(dòng)緩沖以及在發(fā)送端和接收端向彼此對(duì)準(zhǔn)異步樣本時(shí)鐘的樣本同步技術(shù)造成的。接收端的抖動(dòng)緩沖延遲可以看作等價(jià)于電路交換傳輸?shù)睦又杏捎谛诺谰幋a而產(chǎn)生的延遲。與此相反,端-到-端延遲是可變的。這些變化由自適應(yīng)抖動(dòng)緩沖技術(shù)導(dǎo)致,該技術(shù)試圖在保持端-到-端延遲較低的同時(shí)使分組丟失的數(shù)量最小。(如)由于擁塞造成的傳輸條件的變化可能導(dǎo)致抖動(dòng)緩沖區(qū)大小的調(diào)整,而這又會(huì)導(dǎo)致端-到-端延遲的變化。對(duì)樣本同步存在或多或少的高級(jí)技術(shù),在更改抖動(dòng)緩沖區(qū)大小時(shí)它們也適用。從信號(hào)樣本的簡(jiǎn)單插入或刪除到時(shí)標(biāo)更改,這些技術(shù)能夠在不引起顯著人為現(xiàn)象的前提下以不同速度放出信號(hào)。
半雙工通信信道能夠在任一方向上傳送數(shù)據(jù),但不能同時(shí)在兩個(gè)方向上傳送數(shù)據(jù)。這意味著,如果用半雙工信道進(jìn)行語(yǔ)音通信,那么只有起自主動(dòng)方的信號(hào)被傳輸?shù)奖粍?dòng)方,但沒(méi)有信號(hào)從被動(dòng)方傳輸?shù)街鲃?dòng)方。這樣,根據(jù)通信方當(dāng)前的活動(dòng)性而在它們之間輪換傳輸資源。通過(guò)半雙工信道進(jìn)行的通信利用每次只有一個(gè)會(huì)話鏈路活動(dòng)的不對(duì)稱特性。半雙工信道上的交互性因而受到了極大的限制,因?yàn)楸仨殱M足一次一個(gè)的原則。
在美國(guó)6,182,032 B1中,給出了一種適用于半雙工或單向通信的通信方法。在單向通信中,實(shí)際延遲最不重要,因?yàn)椴淮嬖谌魏畏答?,因此如果發(fā)現(xiàn)鏈路是單向通信鏈路的話允許信號(hào)延遲增加。因此可以更改(如)編碼延遲并降低位速率。這將減少對(duì)無(wú)線電資源的需求并導(dǎo)致對(duì)可用系統(tǒng)資源的更有效利用。該方法在預(yù)期進(jìn)行單向通信的地方是有用的,例如在語(yǔ)音郵件、消息服務(wù)等情況下,即在一個(gè)終端充當(dāng)語(yǔ)音數(shù)據(jù)的源或宿但不會(huì)同時(shí)充當(dāng)這兩種角色的情況下。但是,也是在這個(gè)公開(kāi)中得出了這個(gè)解決方案不適用于全雙工情況的結(jié)論。
發(fā)明內(nèi)容
現(xiàn)有技術(shù)的全雙工通信系統(tǒng)的一般問(wèn)題是,在通信系統(tǒng)中有限的可用資源內(nèi)必須在交互性體驗(yàn)和服務(wù)質(zhì)量之間進(jìn)行折衷。
因而本發(fā)明的一般目標(biāo)是提供增大延遲折衷的可能性的方法和系統(tǒng)。本發(fā)明進(jìn)一步的目標(biāo)是,提供為延遲折衷目的而使用會(huì)話式通信的不對(duì)稱特性的方法和系統(tǒng)。
上述目標(biāo)是由依照所附權(quán)利要求的方法和系統(tǒng)實(shí)現(xiàn)的。一般來(lái)說(shuō),全雙工通信的可用延遲預(yù)算根據(jù)鏈路的活動(dòng)性、當(dāng)前和最近的歷史而在鏈路之間進(jìn)行分配的。通過(guò)跟蹤全雙工通信系統(tǒng)中的鏈路活動(dòng)或不活動(dòng),即知道所傳輸?shù)臄?shù)據(jù)的信息值,如果相對(duì)的鏈路同時(shí)不活動(dòng)的話,可以將比通常接受的編碼過(guò)程有較大編碼延遲的編碼過(guò)程用于活動(dòng)鏈路。因?yàn)橛脩魧?duì)延遲的靈敏度在鏈路開(kāi)始活動(dòng)的那個(gè)時(shí)刻最大,因而在鏈路開(kāi)始活動(dòng)時(shí)的那個(gè)時(shí)刻可以分配編碼延遲比通常使用的編碼延遲較小的編碼過(guò)程。隨后增加編碼延遲。優(yōu)選的,控制往返延遲總是低于所需最大值。
本發(fā)明的優(yōu)勢(shì)是,它能夠在部署會(huì)話式服務(wù)的系統(tǒng)中帶來(lái)服務(wù)質(zhì)量的提高和系統(tǒng)容量的擴(kuò)大。這些提高不會(huì)損害所體驗(yàn)到的往返延遲或者真正的全雙工可能性。
附圖概述參考下面結(jié)合附圖進(jìn)行的描述可以最好地理解本發(fā)明以及它的更多目標(biāo)和優(yōu)勢(shì),附圖中
圖1是示出了使用現(xiàn)有技術(shù)的系統(tǒng)的會(huì)話的時(shí)序圖;圖2是示出了依照本發(fā)明的一種實(shí)施方案的會(huì)話的時(shí)序圖;圖3是示出了依照本發(fā)明的一個(gè)實(shí)施方案包括同時(shí)發(fā)生的語(yǔ)音的會(huì)話的時(shí)序圖;圖4是示出了依照本發(fā)明的一種通用方法的流程圖;圖5示出了依照本發(fā)明的一種實(shí)施方案的通信系統(tǒng);圖6示出了依照本發(fā)明的另一實(shí)施方案的用戶終端;圖7示出了仍是依照本發(fā)明的另一實(shí)施方案的另一用戶終端;
圖8示出了依照本發(fā)明為不活動(dòng)鏈路帶來(lái)低延遲的用戶終端的詳細(xì)實(shí)施方案;圖9示出了依照本發(fā)明為不活動(dòng)鏈路帶來(lái)高延遲的用戶終端的另一詳細(xì)實(shí)施方案;圖10示出了依照本發(fā)明為不活動(dòng)鏈路帶來(lái)低延遲并有響應(yīng)時(shí)間控制的用戶終端的詳細(xì)實(shí)施方案;圖11示出了依照本發(fā)明為不活動(dòng)鏈路帶來(lái)高延遲并有響應(yīng)時(shí)間控制的用戶終端的詳細(xì)實(shí)施方案;圖12示出了在本發(fā)明中有用的抖動(dòng)緩沖控制的一種實(shí)施方案的流程圖。
具體實(shí)施例詳細(xì)說(shuō)明在現(xiàn)有技術(shù)的系統(tǒng)中,當(dāng)討論往返延遲時(shí),通常假定系統(tǒng)是對(duì)稱的,即在任一方向上傳輸?shù)攘康男畔ⅰR虼诉€有一個(gè)共同的假設(shè)是,兩個(gè)通信方向應(yīng)該看作是等同的,并且因此編碼延遲預(yù)算也被均分到兩個(gè)通信方向上。
但是,即使不同方向上傳輸?shù)臄?shù)據(jù)的長(zhǎng)時(shí)間平均屬性通常是對(duì)稱的,但全雙工會(huì)話式通信中鏈路的瞬時(shí)特性卻不是這樣。事實(shí)上,它們有很強(qiáng)的不對(duì)稱性。因而很多會(huì)話式服務(wù)的一個(gè)重要特征是,在特定時(shí)間上所需的傳輸資源是對(duì)稱的。這是由于在會(huì)話中通??偸且环交顒?dòng)而另一方在聽(tīng),或者在多方通信時(shí)總是一方活動(dòng)其它人都在聽(tīng)。考慮到這個(gè)事實(shí),往返延遲是與時(shí)間變化關(guān)聯(lián)的。決定性的時(shí)間點(diǎn)是通信方向改變時(shí),因?yàn)槟菚r(shí)它等于響應(yīng)時(shí)間。對(duì)應(yīng)于不活動(dòng)性的數(shù)據(jù)(即其信息值可以忽略的數(shù)據(jù))被延遲或者以較差的質(zhì)量到達(dá),對(duì)系統(tǒng)的用戶來(lái)說(shuō)并不要緊。
目前采用電路交換傳輸或分組交換傳輸?shù)慕鉀Q方案都忽略了在會(huì)話式服務(wù)中傳輸?shù)男盘?hào)根據(jù)當(dāng)前信號(hào)類型其編碼增益和延遲需求都隨時(shí)間變化的事實(shí)。例如,活動(dòng)語(yǔ)音比不活動(dòng)信號(hào)有高得多的信息內(nèi)容,因而需要更有效的資源和帶來(lái)更高編碼延遲的信道編碼。
但是,今天的移動(dòng)語(yǔ)音通信系統(tǒng)利用了會(huì)話式語(yǔ)音是由源受控速率(SCR)操作隨(如)活動(dòng)語(yǔ)音和無(wú)聲片斷而隨時(shí)間變化的過(guò)程這一事實(shí)。這種操作使(如)瞬時(shí)位速率適應(yīng)輸入信號(hào)的當(dāng)前位速率需求,并且以不連續(xù)傳輸(DTX)模式用在系統(tǒng)中,不連續(xù)模式主要停止語(yǔ)音中斷期間的傳輸。SCR操作有時(shí)意味著不活動(dòng)噪音信號(hào)的更高編碼延遲。SCR操作利用聲音活動(dòng)性檢測(cè)器(VAD),VAD檢測(cè)當(dāng)前信號(hào)是活動(dòng)語(yǔ)音或無(wú)聲。因而,SCR操作利用了語(yǔ)音信號(hào)根據(jù)它的內(nèi)容需要隨時(shí)間變化的位速率這樣一個(gè)事實(shí)。但是,有或沒(méi)有SCR操作,目前還沒(méi)有通過(guò)使延遲適應(yīng)信號(hào)而控制編碼增益的任何嘗試,因?yàn)閷⒊霈F(xiàn)定時(shí)困難。編碼也沒(méi)有應(yīng)有的效率。
為了顯現(xiàn)本發(fā)明的好處,圖1中首先說(shuō)明了傳統(tǒng)會(huì)話情況下的現(xiàn)有技術(shù)的過(guò)程。這里假定所需的最大往返延遲為500ms。假定回聲消除較好的情況下這個(gè)值近似于大多數(shù)系統(tǒng)中都可接受的值,但下面例子中延遲的值僅是為了有所計(jì)算的例子而已。本發(fā)明可以使用任意大小的延遲。在依照現(xiàn)有技術(shù)的第一個(gè)例子中,可用延遲被分成兩個(gè)相等的部分,每個(gè)方向上250ms。
兩個(gè)用戶U1和U2在通話。在時(shí)間t0,用戶U1活動(dòng)并說(shuō)話。以用戶U1部分的T(傳輸)電平上的陰影區(qū)域表示的語(yǔ)音被以250ms延遲傳輸給用戶U2,用戶U2接收以用戶U2部分的R(接收)電平上的陰影區(qū)域表示的語(yǔ)音。因而由用戶U1在時(shí)間t0給出的信息由用戶U2在時(shí)間t1收到。用戶U1繼續(xù)說(shuō)話直到時(shí)間t2。該語(yǔ)音的結(jié)束觸發(fā)了來(lái)自用戶U2的響應(yīng)。這個(gè)語(yǔ)音結(jié)束在時(shí)間t3到達(dá)用戶U2,延遲是通常的250ms。用戶U2用反應(yīng)時(shí)間Δt1啟動(dòng)他的回答,并且在時(shí)間t4用戶U2開(kāi)始活動(dòng)并開(kāi)始講話。U2語(yǔ)音的開(kāi)始在時(shí)間t5到達(dá)U1。用戶U1經(jīng)歷了整個(gè)響應(yīng)時(shí)間Δt2,它是實(shí)際的反應(yīng)時(shí)間Δt1和兩個(gè)通信方向上的延遲之和,即所經(jīng)歷的延遲時(shí)間變成Δt2=Δt1+250ms+250ms如果響應(yīng)時(shí)間Δt2變得過(guò)大,會(huì)話就變得難以進(jìn)行。但是,這個(gè)響應(yīng)時(shí)間或多或少只與其中一個(gè)方向上的語(yǔ)音的絕對(duì)開(kāi)始有關(guān)。在連續(xù)的語(yǔ)音流中,對(duì)延遲的敏感性通常要小得多。
U2繼續(xù)講話。在時(shí)間t6,U2提供的信息觸發(fā)U1到中斷回答。這個(gè)信息在時(shí)間t7到達(dá)U1。用戶U1在時(shí)間t8上的語(yǔ)音開(kāi)始之前用掉的反應(yīng)時(shí)間是Δt3。這個(gè)開(kāi)始在時(shí)間t9到達(dá)U2,總共的響應(yīng)時(shí)間是Δt4。與上面類似Δt4=Δt3+250ms+250ms在圖1中,容易認(rèn)識(shí)到在大部分時(shí)間至少有一個(gè)用戶是不活動(dòng)的。在這種階段當(dāng)中,代表沉默的數(shù)據(jù)的延遲與會(huì)話輕松程度的體驗(yàn)完全不相關(guān)。很多情況下,如上所述,甚至沒(méi)有傳輸真正的沉默信號(hào)而是舒適噪音或SID(沉默描述符)參數(shù)。本發(fā)明使用這個(gè)不對(duì)稱性來(lái)改進(jìn)該系統(tǒng)。
在這個(gè)說(shuō)明性的例子以及下面的兩個(gè)例子中,假定實(shí)際的傳輸延遲已知。通常,傳輸延遲有特定的統(tǒng)計(jì)分布。這些細(xì)節(jié)將在下面進(jìn)一步討論,并且在第一個(gè)說(shuō)明性例子中,為簡(jiǎn)單起見(jiàn)傳輸延遲被看作是已知且固定的。
在圖2中,示出了依照本發(fā)明的情況。在這第一個(gè)簡(jiǎn)單例子中,為了促進(jìn)對(duì)本發(fā)明的基本思想的理解,假定每次只有一個(gè)用戶講話。在該圖的頂部,與圖1類似,示出了兩個(gè)會(huì)話用戶的活動(dòng)周期,以及延遲時(shí)間和語(yǔ)音到達(dá)時(shí)間。在圖2的中部,指出了不同方向上的傳輸?shù)难舆t時(shí)間。T1是從用戶U1到U2的傳輸,T2是從用戶U2到U1的傳輸。
在時(shí)間t10,用戶U1講話而用戶U2沉默。這個(gè)語(yǔ)音是根據(jù)圖2中部的延遲方案,在它的編碼/解碼以及傳輸?shù)経2等等的過(guò)程中延遲了350ms。因而用戶U2在時(shí)間t11聽(tīng)到了該語(yǔ)音。相反方向上的數(shù)據(jù)延遲時(shí)間并不重要,因?yàn)樵谶@個(gè)方向上沒(méi)有傳輸任何有信息值的數(shù)據(jù)。用戶U1在時(shí)間t12停止講話,用戶U2在時(shí)間t13意識(shí)到了這一點(diǎn),延遲了350ms。用戶U2在Δt5的反應(yīng)時(shí)間內(nèi)反應(yīng)這個(gè)停止并在時(shí)間t14開(kāi)始回答。當(dāng)用戶U2開(kāi)始活動(dòng)時(shí),這個(gè)傳輸方向上的延遲就變得重要了。因而在語(yǔ)音的開(kāi)始采用降低了延遲的傳輸模式,見(jiàn)圖2中部的T2延遲圖。在這個(gè)例子中采用了延遲為150ms的傳輸模式。因而在t14創(chuàng)建的語(yǔ)音開(kāi)始在時(shí)間t15到達(dá)用戶U1。用戶U1經(jīng)歷了Δt6的響應(yīng)時(shí)間Δt6=Δt5+350ms+150ms因而回答的開(kāi)始以和傳統(tǒng)技術(shù)中完全相同的往返延遲到達(dá)用戶U1。
但是,延遲時(shí)間為150ms的傳輸對(duì)資源要求很高或者會(huì)導(dǎo)致較低的語(yǔ)音質(zhì)量。因此,需要改變?yōu)橛休^高延遲的傳輸模式。用戶U1不活動(dòng),并且在一段短暫的時(shí)間之后,在時(shí)間t16,傳輸模式在這個(gè)實(shí)施方案中被改為有350ms延遲的傳輸模式。變化在時(shí)間t17進(jìn)行,即延遲逐步達(dá)到最終值。在U2端間隔Δt7的語(yǔ)音被傳輸?shù)経1端,以在Δt8的時(shí)間間隔內(nèi)被接收。因?yàn)棣8的持續(xù)時(shí)間大于Δt7,不得不逐步延遲該語(yǔ)音??梢?如)通過(guò)伸展技術(shù)或通過(guò)在(如)兩個(gè)字之間插入短暫的沉默間隔而在發(fā)送端或者優(yōu)選地在接收端維護(hù)這個(gè)延遲。下面將進(jìn)一步更詳細(xì)地論述這一點(diǎn)。這種情況下,用戶U1將很難注意到語(yǔ)音中間的額外延遲。
現(xiàn)在以增加到350ms的延遲傳輸從U2到U1的語(yǔ)音。用戶U2在時(shí)間t18開(kāi)始不活動(dòng),并且這個(gè)不活動(dòng)性在時(shí)間t19到達(dá)用戶U1。用戶U1然后可以準(zhǔn)備他的回答。
馬上注意到,依照本發(fā)明的通信的主要部分是用延遲增加了的傳輸模式(本例中是350ms)進(jìn)行的。同時(shí),保持了語(yǔ)音開(kāi)始的往返延遲(本例中為500ms)。
可以不同的方式利用可用的額外延遲時(shí)間。在圖2的底部給出了兩個(gè)例子。在第一個(gè)例子中,增加的延遲被用來(lái)減少傳輸資源需求。虛線對(duì)應(yīng)于使用傳統(tǒng)延遲分布的資源需求。實(shí)線表示使用本發(fā)明的本實(shí)施方案時(shí)的資源需求。注意結(jié)果是對(duì)資源的總體需求減少。在時(shí)間t14,即在用戶U2的回答的開(kāi)始,所用傳輸模式的延遲僅為150ms,這意味著是以比通常更高的程度使用傳輸資源。但是,需要利用這種較高資源的時(shí)間周期很短,并且還顯著降低了平均資源利用。因?yàn)檫@種資源利用高峰發(fā)生在語(yǔ)音的開(kāi)始,這種情況將統(tǒng)計(jì)性地分布在時(shí)間上,并且對(duì)一個(gè)處理大量會(huì)話的大型系統(tǒng)來(lái)說(shuō),這只會(huì)導(dǎo)致資源利用很小的增長(zhǎng)。但是,與剩下的時(shí)間中資源利用的大量下降相比,這種增加實(shí)際上非常小。
另一利用增加的可用延遲時(shí)間的途徑是轉(zhuǎn)而增加語(yǔ)音質(zhì)量。因?yàn)槟軌蜻_(dá)到更好的編碼,所以質(zhì)量也得到了提高。圖2的最下部示出了這種情況。這里對(duì)整個(gè)會(huì)話通信質(zhì)量的測(cè)量被描繪為時(shí)間的函數(shù)。認(rèn)識(shí)到會(huì)話的平均質(zhì)量提高了。但是,與資源利用情況相似,當(dāng)使用低延遲時(shí),情況也只是在語(yǔ)音的開(kāi)始才有所不同。這意味著,語(yǔ)音質(zhì)量?jī)H在語(yǔ)音開(kāi)始時(shí)下降,但在增加了所用延遲后會(huì)快速恢復(fù)。
作為本領(lǐng)域的技術(shù)人員,認(rèn)識(shí)到還可以用多種其它途徑利用增加的可用延遲。例如,可以采用質(zhì)量提高和資源需求的組合。
實(shí)現(xiàn)這些優(yōu)勢(shì)所付出的代價(jià)不過(guò)是在每次語(yǔ)音方向變化時(shí)在整個(gè)會(huì)話上總共200ms的延遲。因?yàn)檫@個(gè)延遲優(yōu)選地被隱藏在連續(xù)的語(yǔ)音中,用戶根本就感覺(jué)不到它的存在。但是,響應(yīng)時(shí)間,即語(yǔ)音開(kāi)始處的往返時(shí)間(它對(duì)保持會(huì)話不受影響是一個(gè)關(guān)鍵時(shí)間),保持不變。
在上面的例子中,交談中的用戶表現(xiàn)非常好,等待另一方結(jié)束他的講話然后再回答。但是,對(duì)話通常還包括中斷、同時(shí)雙向講話等。上述方案實(shí)際上在這種情況中也提供了改進(jìn)。當(dāng)一個(gè)用戶對(duì)與延遲有關(guān)的噪音非常敏感時(shí),最關(guān)鍵的地方在用戶之一的講話開(kāi)始時(shí)。即使當(dāng)講話開(kāi)始發(fā)生在另一用戶的連續(xù)講話中時(shí),上面提供的解決方案也解決了那個(gè)問(wèn)題。但是,因?yàn)樵陂_(kāi)始之后延遲時(shí)間增加了,如果雙方繼續(xù)交談,實(shí)際的往返延遲也將增加。可能這不太重要,因?yàn)閷?duì)話者忙于他們自己的交談,因此對(duì)微小的額外延遲不太敏感。
但是,可能出現(xiàn)這種增加的響應(yīng)時(shí)間無(wú)法忍受的情況。例如,這種情況出現(xiàn)在很強(qiáng)的背景噪音環(huán)境中,那里包括背景噪音的不活動(dòng)性被錯(cuò)誤地歸類為主動(dòng)的講話。但本發(fā)明的優(yōu)選實(shí)施方案也遵從這些情況。
在圖3中示出了另一個(gè)例子。這里也假定總的往返延遲最多是500ms,并且可能采用延遲時(shí)間從150ms到350ms的傳輸模式。
在時(shí)間t20,用戶U1講話。語(yǔ)音被以350ms的延遲傳輸并在時(shí)間t 21到達(dá)用戶U2。到達(dá)用戶U2的信息觸發(fā)該用戶中斷,即在用戶U1結(jié)束他的講話之前即開(kāi)始回應(yīng)。在反應(yīng)時(shí)間Δt9之后,用戶U2在t22開(kāi)始他的回答,采用150ms的延遲時(shí)間?;卮鸬拈_(kāi)始在t23到達(dá)用戶U1,總的回答延遲是Δt10。這個(gè)延遲與上面的類似Δt10=Δt9+150ms+350ms當(dāng)回答到達(dá)用戶U1時(shí),兩個(gè)通信方向同時(shí)活動(dòng)。因此,用于用戶U1的講話的傳輸模式必須改變?yōu)檠舆t更短的傳輸模式,優(yōu)選地是所允許的往返延遲的一半,即250ms。將以高延遲傳輸剛好在用戶U2講話的開(kāi)始到達(dá)之前(即在t23之前)傳輸?shù)挠脩鬠1的講話。在時(shí)間間隔Δt11內(nèi),傳輸模式被逐步改變?yōu)榻咏⒆罱K采用250ms延遲。因此這個(gè)語(yǔ)音段的結(jié)尾在時(shí)間t25到達(dá)用戶U2。間隔Δt11的講話因此將在略短的時(shí)間間隔Δt12期間到達(dá)用戶U1。這意味著,多少會(huì)出現(xiàn)一些語(yǔ)音壓縮或信息丟失。下面對(duì)此會(huì)有更詳細(xì)地論述。這里,我們只需注意到會(huì)發(fā)生一些語(yǔ)音壓縮。
當(dāng)從用戶U1到用戶U2的語(yǔ)音傳輸?shù)难舆t被降低后,將允許相反方向使用更高比例的可用延遲預(yù)算。因此,增加了從U2到U1的傳輸延遲,優(yōu)選的是逐步增加。在本實(shí)施方案中,這個(gè)增加發(fā)生在時(shí)間間隔Δt12中,這意味著在時(shí)間t25創(chuàng)建的語(yǔ)音將經(jīng)歷250ms的傳輸延遲。間隔Δt12中U2的講話將在間隔Δt13內(nèi)到達(dá)用戶U1。因?yàn)棣13的持續(xù)時(shí)間大于Δt12的持續(xù)時(shí)間,必須應(yīng)用語(yǔ)音伸展技術(shù)。下面對(duì)此有更詳細(xì)的論述。
在時(shí)間t26,用戶U1的講話結(jié)束,并且從U1到U2的鏈路開(kāi)始不活動(dòng)。因?yàn)閭鬏斞舆t是250ms,該講話的結(jié)尾在時(shí)間t27到達(dá)U2?,F(xiàn)在其中一個(gè)方向不活動(dòng),依照本發(fā)明這意味著活動(dòng)鏈路可以使用更大比例的延遲緩沖。結(jié)果是,在時(shí)間間隔Δt14內(nèi),從U2到U1的信息傳輸延遲從250ms增加到了350ms。在接收端,語(yǔ)音是在時(shí)間間隔Δt15內(nèi)接收到的,這再次意味著,必須進(jìn)行語(yǔ)音伸展過(guò)程。最終,由U2在t28創(chuàng)建的語(yǔ)音在傳輸中經(jīng)過(guò)350ms的延遲后到達(dá)用戶U1。
在時(shí)間t29,用戶U1再次開(kāi)始活動(dòng),并且這次活動(dòng)的開(kāi)始在時(shí)間t30到達(dá)用戶U2。這個(gè)事件再次觸發(fā)了兩個(gè)方向上數(shù)據(jù)傳輸延遲的動(dòng)態(tài)調(diào)節(jié)。
在圖3的底部,這些圖表示出了在不同場(chǎng)合不同方向上采用的傳輸延遲??梢钥吹?,當(dāng)兩個(gè)用戶同時(shí)講話時(shí),本發(fā)明的效率提高基本消失。但是,在只有一個(gè)用戶講話的時(shí)間段內(nèi),本發(fā)明與現(xiàn)有技術(shù)的系統(tǒng)相比創(chuàng)建了整體優(yōu)勢(shì)。
從上面的例子可以看出,當(dāng)真正的同時(shí)全雙工會(huì)話發(fā)生時(shí),也可以采用本發(fā)明的基本原理。優(yōu)選地,在這種情況下,使用考慮了語(yǔ)音壓縮和語(yǔ)音伸展的機(jī)制,使語(yǔ)音盡可能平滑地到達(dá)用戶,并且沒(méi)有煩人的丟失或顯著的停頓。
通過(guò)獲取對(duì)不同方向上的數(shù)據(jù)中攜帶的信息值的測(cè)定,可以進(jìn)行傳輸模式(例如有不同編碼延遲的傳輸模式)的動(dòng)態(tài)分配。因而結(jié)果是編碼延遲取決于對(duì)傳輸數(shù)據(jù)的內(nèi)容的值的測(cè)定。信息值可以是傳送數(shù)據(jù)的鏈路活動(dòng)或不活動(dòng)。通過(guò)測(cè)定兩個(gè)方向上的信息值,可以確定只有一個(gè)方向活動(dòng)的周期。在這些周期內(nèi),可以使用比通常所用有較大編碼延遲的傳輸模式。當(dāng)相反的鏈路不活動(dòng)時(shí),可以像這樣增加活動(dòng)鏈路中的延遲超過(guò)所要求的最大往返延遲的一半。但是,這樣增大后的延遲和最大往返延遲之間的差必須能夠容納由回復(fù)傳輸導(dǎo)致的延遲。但這個(gè)回復(fù)延遲的編碼延遲可能非常低,因?yàn)樗辉诤芏痰某掷m(xù)時(shí)間上使用。
本發(fā)明可以用在不同種類的會(huì)話式系統(tǒng)中。所傳輸?shù)男畔⒖梢员硎疽纛l信號(hào)以及視頻信號(hào)。在音頻信號(hào)情況下,不活動(dòng)可以定義為例如沉默、背景噪音和/或恒定時(shí)間的恒定信號(hào)。在視頻情況下,不活動(dòng)可以定義為如根據(jù)沒(méi)有圖像、背景噪音和/或不活動(dòng)。這些“不活動(dòng)”情況的共同點(diǎn)是,所傳輸?shù)臄?shù)據(jù)的信息值沒(méi)有或非常少,并且內(nèi)容不影響接收方。
本發(fā)明甚至可以用在超過(guò)2個(gè)參與者的多方通信系統(tǒng)(例如會(huì)議)中。這種情況下,通常一方活動(dòng)并且在到所有其它(不活動(dòng))方的鏈路上獲得高編碼延遲。在活動(dòng)方改變的情況下,對(duì)要從開(kāi)始活動(dòng)的一方傳輸?shù)较惹?或者一直)的活動(dòng)方的開(kāi)始應(yīng)用低編碼延遲。在從新的活動(dòng)方到先前不活動(dòng)的其它方的鏈路上,對(duì)開(kāi)始甚至可以使用高延遲。
在上面的例子中,已經(jīng)應(yīng)用了三個(gè)延遲級(jí)。但是,可以應(yīng)用多于一個(gè)的任何數(shù)量的延遲級(jí),以及基于連續(xù)或偽-連續(xù)延遲級(jí)變化的解決方案。有更多可用的延遲級(jí),該方案的效率就越高,并且數(shù)據(jù)的壓縮/伸展的麻煩也越少。延遲級(jí)別的這種數(shù)量?jī)?yōu)選地基于一組預(yù)定的編碼方案。
可以用兩個(gè)進(jìn)一步的例子闡明上述解決方案的實(shí)際增益,一個(gè)涉及分組交換傳輸,一個(gè)涉及電路交換傳輸。
對(duì)于作為例證的分組交換傳輸,假定要在主動(dòng)和被動(dòng)鏈路之間分配的總的延遲預(yù)算是400ms。為簡(jiǎn)單起見(jiàn),假定從發(fā)送端到接收端的分組傳輸延遲分布為在兩個(gè)方向上相等。可以假定典型的延遲分布為對(duì)低延遲有很高的可能性但對(duì)高延遲的可能性較小但不為零。現(xiàn)有技術(shù)的解決方案將分配最多200ms給兩個(gè)通信方案上的抖動(dòng)緩沖。這樣能夠正確地解碼在200ms窗口內(nèi)到達(dá)的所有分組。所有后來(lái)的分組將被視為丟失的分組。在這個(gè)例子中,假定延遲分布使分組不及時(shí)到達(dá)的概率是3%。
依照本發(fā)明的一種解決方案,可以為活動(dòng)鏈路分配(如)350ms。對(duì)于活動(dòng)鏈路,沒(méi)有及時(shí)接收到分組的概率將下降到,例如1%,這導(dǎo)致了質(zhì)量的提高。對(duì)于不活動(dòng)鏈路有兩個(gè)基本選擇。兩者使用不超過(guò)延遲預(yù)算中剩下的50ms延遲。這會(huì)導(dǎo)致分組丟失速率增加,但這是可以忍受的,因?yàn)樗婕暗氖侵匾暂^低的不活動(dòng)信號(hào)?;蛘咧灰溌凡换顒?dòng)就維持高編碼延遲(例如,抖動(dòng)緩沖區(qū)長(zhǎng)度)。無(wú)論如何,最終當(dāng)鏈路開(kāi)始活動(dòng)時(shí),50ms的低延遲是應(yīng)該遵守的,因?yàn)樗鼈魉偷氖菚?huì)話中的回應(yīng)。因此在接收到攜帶語(yǔ)音開(kāi)始的第一個(gè)包時(shí),調(diào)整抖動(dòng)緩沖區(qū)。當(dāng)不活動(dòng)鏈路交替切換到50ms時(shí),可以丟棄350ms抖動(dòng)緩沖區(qū)中剩余的信息而不會(huì)丟失任何重要的信息。為了補(bǔ)償由于短的抖動(dòng)緩沖區(qū)造成的編碼增益的損失,可以對(duì)開(kāi)始應(yīng)用代價(jià)更高的傳輸技術(shù),例如冗余分組傳輸和以較小分組傳輸。在開(kāi)始的這種快速傳輸之后,編碼延遲即抖動(dòng)緩沖區(qū)大小會(huì)一直增加到用于活動(dòng)鏈路的350ms延遲,優(yōu)選地盡可能地連續(xù)增加。最后當(dāng)抖動(dòng)緩沖區(qū)已經(jīng)到達(dá)它的最大長(zhǎng)度時(shí),可以將分組模式變回沒(méi)有額外冗余且采用正常大小分組的常規(guī)模式。
上述例子中的解決方案的收益是通信質(zhì)量增加了。
在一個(gè)電路交換傳輸?shù)睦又?,假定可用于編碼的總延遲預(yù)算是125ms。對(duì)2-方通信的現(xiàn)有技術(shù)的解決方案將平均分配預(yù)算,使得前向和后向鏈路各獲得62.5ms的可用編碼延遲。例如,25ms用于源編碼,37.5ms用于包括交錯(cuò)在內(nèi)的信道編碼。進(jìn)一步假定活動(dòng)鏈路上的傳輸需要能級(jí)TX1ev_A-B,以便實(shí)現(xiàn)0.5%的幀消除率。在不活動(dòng)的反向鏈路上使用的DTX是TX1ev_A-B的1/8的平均能級(jí)。依照本發(fā)明的一種解決方案,將活動(dòng)鏈路上的延遲增加到82.5ms,將不活動(dòng)鏈路上的延遲降低至42.5ms。這會(huì)導(dǎo)致如活動(dòng)鏈路上的編碼增益提高1dB,而不活動(dòng)鏈路上的編碼增益降低3dB。這樣用活動(dòng)鏈路上降低了1dB的功率和不活動(dòng)鏈路上提供了3dB的功率實(shí)現(xiàn)了相同的傳輸性能??紤]前向和后向兩個(gè)通信鏈路的總傳輸功率預(yù)算從(1+1/8)*TX1ev_A-B=1.125*TX1ev_A-B降到了(1*10-1/10+1/8*103/10)*TX1ev_A-B=1.044*TX1ev_A-B因而可以斷定,該解決方案為系統(tǒng)提供了整體增益,例如該增益可以用于提高容量。
考慮到對(duì)不活動(dòng)信號(hào)可以接受更高的編碼延遲,能夠獲得的增益甚至?xí)?總傳輸預(yù)算=0.919*TX1ev_A-B)。不需要降低不活動(dòng)信號(hào)的編碼延遲,并且編碼增益中也沒(méi)有損失需要補(bǔ)償。這種情況下,必須確保當(dāng)不活動(dòng)鏈路由于傳送會(huì)話中的回應(yīng)而開(kāi)始活動(dòng)時(shí)延遲預(yù)算不被超出。為了不管低編碼延遲而確保正在開(kāi)始活動(dòng)的鏈路的信號(hào)開(kāi)始的正確傳輸,可以通過(guò)(暫時(shí))增加傳輸功率而補(bǔ)償降低的編碼增益。在開(kāi)始的快速傳輸以后,編碼切換到延遲更高的更有效的編碼。切換到更高延遲的編碼需要及時(shí)伸展輸出信號(hào)。這可以根據(jù)任何現(xiàn)有技術(shù)的時(shí)標(biāo)更改算法完成。
原則上,本發(fā)明的基本思想可以自主地應(yīng)用到每個(gè)通信方向上。如果鏈路活動(dòng),編碼延遲就被增加到某個(gè)最大值。如果鏈路剛剛開(kāi)始活動(dòng),就將延遲降低到某個(gè)較低的界限,隨后再提高延遲。只要每次只有一條鏈路活動(dòng),即依照?qǐng)D2中所示例子,這些解決方案就可以不考慮相反方向上的通信而工作。這里,只需知道一條通信鏈路上的活動(dòng)級(jí)別。這種解決方案實(shí)際上真正確保了保持活動(dòng)周期開(kāi)始時(shí)總共需求的響應(yīng)時(shí)間,這對(duì)用戶對(duì)延遲的反應(yīng)是最重要的瞬間。但是,這種解決方案沒(méi)有對(duì)兩條鏈路同時(shí)活動(dòng)時(shí)的特定情形提供對(duì)響應(yīng)時(shí)間的完全控制。因?yàn)閮蓷l鏈路都應(yīng)用了長(zhǎng)編碼延遲,響應(yīng)時(shí)間將超出預(yù)定的最大界限。
如圖3所示對(duì)這個(gè)問(wèn)題的一種解決方案,可以應(yīng)用一種響應(yīng)時(shí)間控制機(jī)制。這種機(jī)制確保響應(yīng)時(shí)間絕不超出預(yù)定界限。它首先要求測(cè)量?jī)蓚€(gè)通信方向上活動(dòng)或延遲的量,然后要求適應(yīng)活動(dòng)所允許的最大延遲。
一種簡(jiǎn)單的解決方案是根據(jù)兩條鏈路的活動(dòng)性獲得所要求的測(cè)量。假定兩條鏈路關(guān)于活動(dòng)信號(hào)的可用編碼延遲對(duì)稱的話,這在每個(gè)通信端都是可行的。檢測(cè)到進(jìn)入和流出鏈路同時(shí)活動(dòng),允許假定總共使用的編碼延遲是在每個(gè)通信端導(dǎo)致的編碼延遲的兩倍。由各個(gè)通信端導(dǎo)致的延遲顯然對(duì)各個(gè)通信端可用。
更通用但要求更高的方法是在通信端之間交換與當(dāng)前在每端使用的編碼延遲有關(guān)的端信息,或者對(duì)它們進(jìn)行真正的往返延遲測(cè)量,例如RTCP(IETF RFC 1889)P24-17提供支持。
如果測(cè)量出的總編碼延遲超出了所允許的編碼延遲預(yù)算,就必須更改對(duì)活動(dòng)允許的最大編碼延遲,例如結(jié)合圖3以及更上面的例子。一種簡(jiǎn)單的可能性是給每條鏈路分配編碼延遲預(yù)算的一半。
可以由圖4的流程圖說(shuō)明依照本發(fā)明的通用方法。該過(guò)程在步驟200開(kāi)始。在步驟202,進(jìn)行數(shù)據(jù)的全雙工傳輸。在步驟204獲得對(duì)所傳輸?shù)臄?shù)據(jù)的信息值的測(cè)定,優(yōu)選地測(cè)定是關(guān)于活動(dòng)和不活動(dòng)。最終,在步驟206,該測(cè)定被用于動(dòng)態(tài)分配適當(dāng)?shù)木幋a延遲。當(dāng)鏈路活動(dòng)時(shí),至少當(dāng)相反方向上的鏈路不活動(dòng)時(shí),分配較高的編碼延遲。此外,優(yōu)選地在活動(dòng)的開(kāi)始,分配較低的編碼延遲。該過(guò)程在步驟208結(jié)束。
圖5依照本發(fā)明示出了用于會(huì)話式服務(wù)的全雙工通信的通信系統(tǒng)1。通信系統(tǒng)1包括網(wǎng)絡(luò)10,它連接多個(gè)用戶終端20,圖中只示出了其中少量用戶。用戶終端20由包括輸入連接32和輸出連接34的全雙工連接30連接在一起。輸出和輸入連接32、34可以實(shí)現(xiàn)為公共裝置或單獨(dú)裝置。用戶終端20包括收發(fā)器裝置22,它負(fù)責(zé)分別在輸出和輸入連接上發(fā)送和接收數(shù)據(jù)。收發(fā)器22包括像終端20連接的特定網(wǎng)絡(luò)所需的以全雙工方式傳輸數(shù)據(jù)的裝置以及編碼/解碼裝置等。收發(fā)器裝置還包括傳輸模式控制裝置26,負(fù)責(zé)選擇輸入和/或輸出流量的傳輸模式。這些傳輸模式可以包括不同的編碼、緩沖等。終端20還包括檢測(cè)器24,用于檢測(cè)全雙工連接30中的數(shù)據(jù)所攜帶的信息值。在這個(gè)實(shí)施方案中,檢測(cè)器24包括活動(dòng)性檢測(cè)裝置,以檢測(cè)輸出連接34以及輸出連接32中的活動(dòng)性。檢測(cè)器24與收發(fā)器裝置22的傳輸模式控制裝置26相連。傳輸模式控制裝置26依照本發(fā)明被安排根據(jù)檢測(cè)器24的測(cè)定動(dòng)態(tài)分配傳輸模式。在這個(gè)實(shí)施方案中,通信中的兩條鏈路都被關(guān)于活動(dòng)級(jí)別進(jìn)行監(jiān)控,這能夠啟動(dòng)真正的響應(yīng)時(shí)間控制。
在圖6中,示出了依照本發(fā)明的用戶終端20的另一實(shí)施方案。這里,只安排檢測(cè)器24監(jiān)控其中一條鏈路的活動(dòng)性。這種情況下,如果系統(tǒng)中沒(méi)有交換任何進(jìn)一步的信息,只能在活動(dòng)周期的開(kāi)始確保響應(yīng)時(shí)間控制。
在圖7中,示出了依照本發(fā)明的用戶終端的另一實(shí)施方案。這里,檢測(cè)器24只關(guān)于活動(dòng)性監(jiān)控輸出連接。但是,在這個(gè)實(shí)施方案中,收發(fā)器裝置22還包括裝置28,用于交換和延遲有關(guān)的信息。用于交換延遲有關(guān)信息的裝置28被安排接收涉及延遲問(wèn)題的控制信令。例如,另一用戶終端可以傳輸應(yīng)用了有特定延遲的特定傳輸模式的消息。這一信息連同通過(guò)檢測(cè)器24得到的輸出連接32上的活動(dòng)性信息使得傳輸模式控制裝置能夠?yàn)檩敵鰯?shù)據(jù)選擇適當(dāng)?shù)难舆t。優(yōu)選地,用于延遲信息交換的裝置28還將來(lái)自檢測(cè)器24的結(jié)果轉(zhuǎn)換成控制信號(hào),該控制信號(hào)被傳輸?shù)较鄬?duì)的用戶終端。
圖8示出了依照本發(fā)明的終端20的一種實(shí)施方案。假定這個(gè)實(shí)施方案中的傳輸系統(tǒng)只用分組交換傳輸操作,即通信網(wǎng)絡(luò)10在這個(gè)實(shí)施方案中是一個(gè)分組網(wǎng)絡(luò)。此外,假定在依照?qǐng)D8或有對(duì)應(yīng)功能的兩個(gè)終端之間進(jìn)行通信。由用戶給出的輸入語(yǔ)音(SPEECH IN)被提供給終端20。A/D轉(zhuǎn)換器40將輸入的模擬信號(hào)數(shù)字化并用特定的采樣速率(SFIN)(例如8kHZ)逐個(gè)樣本輸出數(shù)字化的信號(hào)。由于有效的語(yǔ)音編譯碼器通常以幀為單位工作,在語(yǔ)音編碼器(SPE)44的前端有一個(gè)幀緩沖區(qū)42,它收集樣本幀(例如20ms長(zhǎng)度),所收集的樣本幀隨后由SPE44處理。組幀由組幀時(shí)鐘信號(hào)(FRAME CLK)控制。SPE44以幀為單位操作并輸出編碼后的語(yǔ)音數(shù)據(jù)。編碼后的語(yǔ)音數(shù)據(jù)(每組數(shù)據(jù)代表一個(gè)語(yǔ)音幀)隨后被傳播到分組組裝器46,它收集多個(gè)語(yǔ)音數(shù)據(jù)幀以形成一個(gè)語(yǔ)音數(shù)據(jù)分組并添加一個(gè)分組標(biāo)題。隨后在發(fā)射器信道50上傳輸該分組,然后經(jīng)過(guò)輸出鏈路34到達(dá)分組網(wǎng)絡(luò)10。
網(wǎng)絡(luò)上的傳輸其特征是特定的延遲特征,這導(dǎo)致每個(gè)分組都會(huì)由于某些統(tǒng)計(jì)延遲分布被延遲某個(gè)最小傳輸延遲,如50ms。另外,傳輸?shù)姆纸M的特定部分將會(huì)丟失并且永遠(yuǎn)到達(dá)不了接收端的輸入鏈路32.
在接收端,到達(dá)的分組被輸入分組拆分器52,隨后進(jìn)入抖動(dòng)緩沖區(qū)54,目的是將不連續(xù)的分組輸入流轉(zhuǎn)換成連續(xù)的語(yǔ)音數(shù)據(jù)幀流,它可由語(yǔ)音解碼器(SPD)56解碼。抖動(dòng)緩沖區(qū)54響應(yīng)輸出時(shí)鐘信號(hào)輸出語(yǔ)音數(shù)據(jù)幀,下面會(huì)描述輸出時(shí)鐘信號(hào)。SPD56解碼語(yǔ)音數(shù)據(jù)幀并響應(yīng)它們輸出解碼后的語(yǔ)音幀到樣本同步器58。樣本同步器58采用的是它的最簡(jiǎn)單形式,即一個(gè)緩沖器加一個(gè)緩沖器控制機(jī)制,樣本同步器以給定的采樣頻率(Sfout)輸出語(yǔ)音樣本給D/A轉(zhuǎn)換器60,D/A轉(zhuǎn)換器60接著產(chǎn)生模擬語(yǔ)音輸出信號(hào)(SPEECH OUT)。樣本同步器可以簡(jiǎn)單插入或丟棄樣本,或者還可以處理更高級(jí)的語(yǔ)音壓縮或伸展過(guò)程。下面對(duì)此有更詳細(xì)的論述。
有兩種基本的途徑控制抖動(dòng)緩沖區(qū)操作。一種簡(jiǎn)單途徑是設(shè)置輸出時(shí)鐘使D/A轉(zhuǎn)換器時(shí)鐘Sfout的若干分之一等于語(yǔ)音編解碼器幀速率,例如20ms。這意味著,樣本同步器降低到僅僅和串行轉(zhuǎn)換器并行,并且不需要任何樣本插入或刪除。為了確保發(fā)送者/接收者幀同步,抖動(dòng)緩沖區(qū)控制包括根據(jù)平均(某些短時(shí)平均)緩沖區(qū)填充電平低于或高于特定的目標(biāo)抖動(dòng)緩沖電平插入或丟棄語(yǔ)音數(shù)據(jù)幀的裝置。
第二種抖動(dòng)緩沖區(qū)控制途徑是操縱抖動(dòng)緩沖區(qū)輸出時(shí)鐘。這種方法的優(yōu)勢(shì)是,發(fā)送者/接收者同步是以樣本而不是幀為基礎(chǔ)進(jìn)行的。在正常操作中(如果通信方向沒(méi)有改變),理想情況下抖動(dòng)緩沖區(qū)輸出時(shí)鐘的頻率與SPE44用來(lái)產(chǎn)生語(yǔ)音數(shù)據(jù)幀的時(shí)鐘頻率相對(duì)應(yīng)。但是,實(shí)踐中這個(gè)時(shí)鐘在接收器中是由抖動(dòng)緩沖區(qū)控制裝置26中所包括的特定控制機(jī)制獲得的,該控制機(jī)制基于抖動(dòng)緩沖區(qū)狀態(tài),例如填充電平。控制抖動(dòng)緩沖區(qū)時(shí)鐘有已知的方法,它們通??刂圃摃r(shí)鐘使得抖動(dòng)緩沖區(qū)54的平均填充電平像先前描述的抖動(dòng)緩沖區(qū)控制方法中那樣恒定。
在本發(fā)明的上下文中,強(qiáng)調(diào)平均抖動(dòng)緩沖電平和延遲之間的關(guān)系很重要;低平均抖動(dòng)緩沖電平對(duì)應(yīng)低的端-到-端延遲,而高平均抖動(dòng)緩沖級(jí)對(duì)應(yīng)高的端-到-端延遲。由于抖動(dòng)緩沖區(qū)下溢的高可能性,低平均抖動(dòng)緩沖電平和延遲導(dǎo)致很多語(yǔ)音幀丟失,高平均抖動(dòng)緩沖區(qū)電平和延遲導(dǎo)致幀丟失的數(shù)量減少并進(jìn)而提高了接收端的語(yǔ)音質(zhì)量。
在涉及上述傳輸系統(tǒng)的典型的端-到-端延遲的一個(gè)例子中,可以識(shí)別出下列主要延遲貢獻(xiàn)者,忽略其它不太相關(guān)的延遲貢獻(xiàn)者(如處理延遲)1.語(yǔ)音幀緩沖-20ms2.帶兩個(gè)語(yǔ)音數(shù)據(jù)幀的分組組裝器-20ms3.從分組組裝器的輸出到分組的第一個(gè)語(yǔ)音數(shù)據(jù)幀的抖動(dòng)緩沖區(qū)的輸出的分組延遲-100ms或300ms,換句話說(shuō)包括3a.根據(jù)最小傳輸延遲為40ms的特定延遲特征的分組傳輸延遲。
3b.補(bǔ)償隨著3個(gè)語(yǔ)音數(shù)據(jù)幀(60ms)或13個(gè)語(yǔ)音數(shù)據(jù)幀(260ms)的抖動(dòng)緩沖區(qū)深度的分組延遲變化的抖動(dòng)緩沖和分組拆分。
4.樣本同步緩沖-10ms因而端到端延遲根據(jù)抖動(dòng)緩沖區(qū)深度是150ms或350ms。
假定本終端的用戶沉默,但從另一終端接收到了活動(dòng)語(yǔ)音。在輸入鏈路32上有活動(dòng)語(yǔ)音的傳輸,而在輸出鏈路上只有編碼的靜音信號(hào)(背景噪音)的傳輸。因此,輸入傳輸必須盡可能地高效,意味著必須給這個(gè)鏈路分配盡可能多的可用編碼延遲。通常,接收器抖動(dòng)緩沖區(qū)使用這個(gè)編碼延遲,即它用13個(gè)語(yǔ)音數(shù)據(jù)幀深的抖動(dòng)緩沖區(qū)工作,結(jié)果是從發(fā)送者到接收者的端-到-端延遲是350ms。由于這個(gè)高延遲,在接收端再生的語(yǔ)音質(zhì)量很高。在相反的方向,使用小抖動(dòng)緩沖區(qū)嘗試的配置導(dǎo)致端-到-端延遲為150ms。
現(xiàn)在,考慮通信方向改變。首先,另一端變成不活動(dòng)。這導(dǎo)致在輸入鏈路32上傳輸?shù)膸幋a后的靜音信號(hào)。對(duì)應(yīng)的幀被標(biāo)記上對(duì)應(yīng)的靜音標(biāo)記,假定在發(fā)送端有VAD。另外,如本發(fā)明中所說(shuō)明的那樣,終端20可以采用VAD或其它活動(dòng)性檢測(cè)器24與SPD56相連并在本地獲得這個(gè)標(biāo)記。當(dāng)靜音標(biāo)記生效時(shí),向抖動(dòng)緩沖區(qū)控制裝置26產(chǎn)生一個(gè)信號(hào),降低抖動(dòng)緩沖區(qū)深度到它的最小值,即3個(gè)幀。結(jié)果,端到端延遲降低。抖動(dòng)緩沖區(qū)深度的降低可以通過(guò)丟棄幀或提高抖動(dòng)緩沖區(qū)時(shí)鐘來(lái)完成。抖動(dòng)緩沖區(qū)時(shí)鐘提高進(jìn)一步導(dǎo)致SPD56在每個(gè)時(shí)間單元產(chǎn)生更多解碼后的靜音幀,這些靜音幀接著填滿了樣本同步緩沖區(qū)。這將導(dǎo)致一個(gè)簡(jiǎn)單的樣本同步過(guò)程以丟棄多余的樣本。由于丟棄的樣本是靜音信號(hào)樣本,所以很難聽(tīng)到這個(gè)信號(hào)改變。
接著,本終端20的用戶開(kāi)始活動(dòng)。因?yàn)檩敵鲦溌?4之前不活動(dòng),接收端的抖動(dòng)緩沖區(qū)深度較低。因而,用只有150ms的端-到-端延遲傳輸活動(dòng)語(yǔ)音的開(kāi)始。因而產(chǎn)生的響應(yīng)時(shí)間是500ms。但是,因?yàn)橄鄬?duì)的接收者的抖動(dòng)緩沖區(qū)深度較低,所以幀丟失速率增加并且導(dǎo)致語(yǔ)音質(zhì)量也很低。為了補(bǔ)償這一點(diǎn),對(duì)語(yǔ)音開(kāi)始(即一段靜音之后的前n個(gè)語(yǔ)音幀)的傳輸使用更高的傳輸資源。例如,n可以是100,對(duì)應(yīng)的時(shí)間是2秒。控制這種行為的開(kāi)始信號(hào)可以從由輸出鏈路中的VAD獲得的語(yǔ)音活動(dòng)性標(biāo)記得到。通過(guò)發(fā)送只包括一個(gè)而不是兩個(gè)語(yǔ)音數(shù)據(jù)幀的分組和/或發(fā)送每個(gè)分組兩次而使用更高的傳輸資源。減少每個(gè)分組中的幀數(shù)的額外優(yōu)勢(shì)是,它進(jìn)一步降低了端-到-端延遲。相對(duì)的接收者在接收到活動(dòng)語(yǔ)音幀(由編碼器VAD或與SPD56相連采用的本地解碼器VAD24產(chǎn)生的標(biāo)記來(lái)標(biāo)識(shí))時(shí)開(kāi)始增大抖動(dòng)緩沖區(qū)深度。這是通過(guò)在抖動(dòng)緩沖區(qū)插入額外的幀(例如通過(guò)幀重復(fù))或者通過(guò)將活動(dòng)語(yǔ)音幀標(biāo)記作為抖動(dòng)緩沖區(qū)控制裝置26降低時(shí)鐘直到抖動(dòng)緩沖區(qū)深度已經(jīng)達(dá)到了它的最大值13個(gè)幀為止的信號(hào)而實(shí)現(xiàn)的。在前一情況下,附加的幀可以由(如)現(xiàn)有幀的重復(fù)而生成。優(yōu)選地,為了不影響最后得到的語(yǔ)音質(zhì)量,重復(fù)那些傳送像噪音的語(yǔ)音部分或者低電平的語(yǔ)音部分。后一情況的結(jié)果是,SPD將在給定的時(shí)間產(chǎn)生更少的解碼后的語(yǔ)音幀,這又導(dǎo)致樣本同步緩沖區(qū)填充電平降低。簡(jiǎn)單的樣本同步方法則插入樣本(例如通過(guò)樣本重復(fù)),以便避免樣本同步緩沖區(qū)下溢。下面會(huì)進(jìn)一步論述更多精心設(shè)計(jì)的方法。在這個(gè)例子中,語(yǔ)音變化和抖動(dòng)緩沖延遲的累加占用了2m,意味著10%的語(yǔ)音時(shí)間變化.
圖8的實(shí)施方案因而導(dǎo)致不活動(dòng)鏈路的低延遲和活動(dòng)鏈路的高延遲,而且沒(méi)有任何特殊的往返延遲控制。
圖9示出了依照本發(fā)明的終端20的另一類似的實(shí)施方案。與前面的實(shí)施方案類似的部分以相同的引用號(hào)碼表示,并且如果對(duì)本實(shí)施方案的操作沒(méi)有特殊的重要性就不再論述。假定這個(gè)實(shí)施方案中的傳輸系統(tǒng)與圖8的實(shí)施方案的傳輸系統(tǒng)相同。與圖8的實(shí)施方案相比圖9的實(shí)施方案的主要區(qū)別是,連接了活動(dòng)性檢查裝置24,以在抖動(dòng)緩沖區(qū)54之前確定輸入鏈路的活動(dòng)性,并且活動(dòng)性檢查裝置24到抖動(dòng)緩沖區(qū)54有直接控制連接62。分組拆分器52還包括SID轉(zhuǎn)換器64。
假定輸入鏈路活動(dòng),并且輸出鏈路不活動(dòng)。在輸入鏈路上有活動(dòng)語(yǔ)音的傳輸而在輸出鏈路上只有編碼后的靜音信號(hào)的傳輸。因此,對(duì)輸入流量的處理必須盡可能地高效,意味著要為這條鏈路分配盡可能多的可用編碼延遲。通常,接收者抖動(dòng)緩沖區(qū)使用這個(gè)編碼延遲,即它用深度為13個(gè)語(yǔ)音數(shù)據(jù)幀的抖動(dòng)緩沖區(qū)工作,導(dǎo)致端-到-端延遲為350ms。由于這個(gè)高延遲,在接收端再生的語(yǔ)音質(zhì)量很高。在輸出方向,對(duì)靜音信號(hào)的端-到-端傳輸延遲同樣是350ms。
如果現(xiàn)在輸入鏈路開(kāi)始活動(dòng),這在本實(shí)施方案中根本不會(huì)導(dǎo)致任何抖動(dòng)緩沖區(qū)變化并且端-到-端延遲也沒(méi)有變化。
轉(zhuǎn)而假定兩個(gè)鏈路都不活動(dòng),都有深抖動(dòng)緩沖區(qū)。現(xiàn)在,輸入鏈路開(kāi)始活動(dòng)。為了得到低響應(yīng)時(shí)間,第一個(gè)活動(dòng)語(yǔ)音幀的接收導(dǎo)致抖動(dòng)緩沖區(qū)被清洗到3個(gè)幀的低抖動(dòng)緩沖區(qū)深度。因?yàn)閬G棄的幀只是靜音信號(hào)幀,所以對(duì)接收端重新構(gòu)造的信號(hào)沒(méi)有什么意義。對(duì)活動(dòng)語(yǔ)音的檢查在這個(gè)實(shí)施方案中是在分組拆分后立即完成的并且可以基于活動(dòng)標(biāo)記(由編碼器VAD產(chǎn)生)完成或由解碼器VAD24在本地完成,如圖中所示。這里,設(shè)置VAD24直接刷新抖動(dòng)緩沖器。因?yàn)槎秳?dòng)緩沖區(qū)被刷新到較低的抖動(dòng)緩沖區(qū)深度,抖動(dòng)緩沖區(qū)延遲也已經(jīng)幾乎同時(shí)降低到了下限并且因此僅用150ms的端-到-端延遲傳輸活動(dòng)語(yǔ)音開(kāi)始。因而最后的響應(yīng)時(shí)間是500ms。再一次,可以通過(guò)增加傳輸資源的使用補(bǔ)償幀丟失速率的增加。在抖動(dòng)緩沖區(qū)深度最初的清洗和下降之后,在接收到活動(dòng)語(yǔ)音幀時(shí),接收者抖動(dòng)緩沖區(qū)深度接著開(kāi)始再次增大。這是通過(guò)將活動(dòng)語(yǔ)音幀作為抖動(dòng)緩沖區(qū)控制裝置的信號(hào),再次增加抖動(dòng)緩沖區(qū)深度直到13個(gè)幀的最大值而實(shí)現(xiàn)的。如前所述,必須插入附加的語(yǔ)音幀或者樣本同步器58必須補(bǔ)償語(yǔ)音幀速率的降低。
本實(shí)施方案還包括DTX功能。這意味著,不是傳輸實(shí)際的背景噪音,而是偶爾傳輸舒適的噪音幀。對(duì)這個(gè)靜音的實(shí)際端-到-端延遲甚至可以超過(guò)350ms,因?yàn)橹皇桥紶杺鬏斣胍魩?,例如每隔八?每160ms)一次。如果分組拆分器額外包括SID(靜音描述符)幀轉(zhuǎn)換器64,對(duì)這種情況的處理就和沒(méi)有DTX的情況相同,SID幀轉(zhuǎn)換器64將輸入SID幀的不連續(xù)流轉(zhuǎn)換成一系列連續(xù)的靜音信號(hào)幀。每個(gè)輸入SID幀就由8個(gè)SID幀代替,每20ms一個(gè)SID幀。在這個(gè)舒適噪音幀中可能發(fā)生參數(shù)內(nèi)插,這通常是在SPD的舒適噪音合成中完成的。
圖10示出了依照本發(fā)明的終端20的另一類似的實(shí)施方案。對(duì)與前面的實(shí)現(xiàn)方案中相同的部分使用了相同的引用號(hào),并且如果對(duì)本實(shí)施方案的操作沒(méi)有特殊重要性的話就不再進(jìn)一步論述。這個(gè)實(shí)施方案為雙重談話響應(yīng)時(shí)間控制引入了解決方案。原理是在發(fā)送端感知語(yǔ)音活動(dòng)性并在屬于接收到的信號(hào)的活動(dòng)性標(biāo)記之外,傳播發(fā)送端活動(dòng)性標(biāo)志到抖動(dòng)緩沖區(qū)控制裝置26。這是通過(guò)提供(如)VAD70而實(shí)現(xiàn)的,VAD70被安排感知發(fā)送端的狀況并與抖動(dòng)緩沖區(qū)控制裝置26相連。在兩上標(biāo)記通知活動(dòng)語(yǔ)音的情況下,抖動(dòng)緩沖區(qū)控制裝置26操縱抖動(dòng)緩沖區(qū)深度到可能的最大和最小抖動(dòng)緩沖區(qū)深度之間的平均值,即在本實(shí)施方案中是8個(gè)幀。如果本抖動(dòng)緩沖區(qū)深度低于8幀,那么就分別插入幀或降低抖動(dòng)緩沖區(qū)時(shí)鐘,如果高于8幀就分別丟棄幀或提高時(shí)鐘。
抖動(dòng)緩沖區(qū)控制裝置26還可以包括用于推遲增加抖動(dòng)緩沖區(qū)深度一段預(yù)定時(shí)間的裝置,以便使相對(duì)的一端能夠開(kāi)始調(diào)整不同鏈路中活動(dòng)性變化。
圖11中,在有不活動(dòng)鏈路高延遲的系統(tǒng)中引入了雙重談話響應(yīng)時(shí)間控制,轉(zhuǎn)圖9.
迄今為止所論述的例子允許根據(jù)兩條鏈路各自的活動(dòng)性狀態(tài)在它們之間分配總的可用編碼延遲預(yù)算,并由此確保特定的響應(yīng)時(shí)間。但是,通常這些方法不允許維持給定的絕對(duì)響應(yīng)時(shí)間。一個(gè)原因是,通常通過(guò)分組網(wǎng)絡(luò)的分組傳輸延遲是未知的。目前為止給出的解決方案是基于抖動(dòng)緩沖區(qū)狀態(tài)而不是實(shí)際的響應(yīng)時(shí)間。為了確保特定的絕對(duì)響應(yīng)時(shí)間,必須估計(jì)真正的傳輸時(shí)間。這可以通過(guò)(如)往返延遲測(cè)量來(lái)完成,在往返延遲測(cè)量中消息從一端A傳輸?shù)搅硪欢薆,并在B端接收到該消息(可能在抖動(dòng)緩沖區(qū)輸出)之后回復(fù)給A端。這種測(cè)量當(dāng)然可以在兩端進(jìn)行。根據(jù)這種往返延遲測(cè)量,可以容易地得到真正的響應(yīng)時(shí)間并據(jù)此調(diào)節(jié)最大和最小目標(biāo)抖動(dòng)緩沖區(qū)深度。例如,如果往返延遲測(cè)量導(dǎo)致真正的響應(yīng)時(shí)間是600ms而不是所需要的500ms,就需要降低目標(biāo)抖動(dòng)緩沖區(qū)深度。例如,最小目標(biāo)緩沖抖動(dòng)緩沖區(qū)深度可以降低到2個(gè)語(yǔ)音數(shù)據(jù)幀(=40ms),最大目標(biāo)抖動(dòng)緩沖區(qū)深度可以達(dá)到9幀(=180ms),這樣就可以節(jié)省總共100ms的響應(yīng)時(shí)間。
最后的實(shí)施方案依賴于適當(dāng)?shù)亩秳?dòng)緩沖區(qū)控制。下面將結(jié)合圖12中所示流程圖論述它的基本原理。如果沒(méi)有特別說(shuō)明的話,這個(gè)流程圖對(duì)應(yīng)于圖10中的實(shí)施方案。該過(guò)程在步驟210開(kāi)始。通常,進(jìn)行抖動(dòng)緩沖區(qū)控制,以根據(jù)接收到的可能還有發(fā)送的語(yǔ)音信號(hào)的活動(dòng)性滿足特定的目標(biāo)抖動(dòng)緩沖區(qū)深度。在步驟212,檢測(cè)接收到的語(yǔ)音的任何活動(dòng)性標(biāo)記。在步驟214,檢測(cè)發(fā)送出的語(yǔ)音的任何活動(dòng)性標(biāo)記。該邏輯的主要輸入是接收到的語(yǔ)音的活動(dòng)性標(biāo)記。在步驟216,檢查接收到的語(yǔ)音是否有活動(dòng)性標(biāo)記。如果接收到的語(yǔ)音不是活動(dòng)語(yǔ)音,那么將在步驟218中設(shè)置目標(biāo)抖動(dòng)緩沖區(qū)深度為最小目標(biāo)抖動(dòng)緩沖區(qū)深度dmin。如果總的延遲預(yù)算不保持恒定,例如根據(jù)圖9,目標(biāo)抖動(dòng)緩沖區(qū)反而保持不變。
如果步驟216中的標(biāo)記表示活動(dòng)性,該過(guò)程繼續(xù)到步驟220,在步驟220中檢查對(duì)發(fā)送出的語(yǔ)音是否有活動(dòng)性標(biāo)記。如果發(fā)送出的語(yǔ)音不是活動(dòng)語(yǔ)音,就在步驟222中設(shè)置目標(biāo)抖動(dòng)緩沖區(qū)深度為最大目標(biāo)抖動(dòng)緩沖區(qū)深度dmax。但是,如果發(fā)送出的信號(hào)是活動(dòng)語(yǔ)音,就在步驟224中設(shè)置目標(biāo)抖動(dòng)緩沖區(qū)深度為平均目標(biāo)抖動(dòng)緩沖區(qū)深度(dmin+dmax)/2。如果不應(yīng)用任何響應(yīng)時(shí)間控制,例如像圖8中那樣,就總是選擇步驟222。
隨后在步驟226中比較如上所述得到的目標(biāo)抖動(dòng)緩沖區(qū)深度和平均抖動(dòng)緩沖區(qū)填充電平。如果平均填充電平小于該目標(biāo),就在步驟228中插入附加的幀(例如通過(guò)幀重復(fù))或用降低的時(shí)鐘速率為抖動(dòng)緩沖區(qū)輸出計(jì)時(shí)。如果平均填充值高于目標(biāo),就在步驟230中從緩沖區(qū)丟棄幀或用提高的時(shí)鐘速率為抖動(dòng)緩沖區(qū)輸出計(jì)時(shí)。在一種替代實(shí)施方案中,步驟228卻是包括插入幀以提高填充電平,步驟230卻是包括丟棄幀以降低填充級(jí)。該過(guò)程在步驟232結(jié)束。盡管為所提供的本流程圖具有開(kāi)始和結(jié)束,但該控制過(guò)程實(shí)際上是連續(xù)的,實(shí)際流程通常是沿著返回到步驟212的虛線。
重要的是指出,在接收端采用對(duì)抖動(dòng)緩沖區(qū)目標(biāo)的控制是平常的。這是因?yàn)樵诮邮斩俗钊菀走M(jìn)行和平均抖動(dòng)緩沖區(qū)深度的比較的情況。但是,在發(fā)送端就也不是不可能用語(yǔ)音幀插入(或重復(fù))和刪除或控制幀緩沖區(qū)的輸出時(shí)鐘而采用對(duì)應(yīng)的時(shí)鐘控制。在后一種情況下,幀緩沖區(qū)需要包括輸入語(yǔ)音信號(hào)的時(shí)標(biāo)變化,這能夠在不降低語(yǔ)音質(zhì)量的情況下,以變化的時(shí)鐘速率校驗(yàn)語(yǔ)音幀。
例如,本發(fā)明中所用的活動(dòng)性檢測(cè)器可以與傳統(tǒng)DTX的類型相同。但是,可以使用確定發(fā)關(guān)送出的和/或接收到的信號(hào)的信息內(nèi)容的值的任意類型的檢測(cè)器。為了確定語(yǔ)音活動(dòng)性可以使用VAD算法,如根據(jù)3GPP TS 26.094(Re1-4,V.4.0.0)7-15頁(yè)。對(duì)確定視頻活動(dòng)性算法可以基于連續(xù)視頻幀之間的不同。低差異意味著信號(hào)的不活動(dòng)。
如上所述,可以用樣本同步裝置以簡(jiǎn)單方式進(jìn)行語(yǔ)音伸展和語(yǔ)音壓縮。例如,語(yǔ)音伸展可以在需要時(shí)通過(guò)重復(fù)的樣本或完整的樣本來(lái)進(jìn)行。例如,語(yǔ)音壓縮可以在需要的時(shí)候通過(guò)丟棄語(yǔ)音樣本或幀來(lái)進(jìn)行。這種情況下會(huì)影響語(yǔ)音質(zhì)量。但是,如果限制語(yǔ)音伸展的程度,語(yǔ)音的降級(jí)將不會(huì)非常特殊。更精細(xì)的方法如時(shí)標(biāo)變更會(huì)伸展或壓縮根本難以聽(tīng)到語(yǔ)音變化的解碼后的語(yǔ)音信號(hào)。例如,如果語(yǔ)音變更和抖動(dòng)延遲的累加占2秒,200ms延遲的時(shí)標(biāo)變更只有10%。進(jìn)一步可以在難以聽(tīng)到的語(yǔ)音部分中進(jìn)行時(shí)標(biāo)變更,例如在類似噪音的部分、在低級(jí)部分或通過(guò)重復(fù)/丟棄完整的音調(diào)周期。由Yi J.Liang,N.Farber,和B.Girod發(fā)表在IEEE Transactions on Multimedia,April 2001上的“Adaptive playout scheduling and lossconcealment for voice communication over IP networks”中描述了用于語(yǔ)音的時(shí)標(biāo)變更的現(xiàn)有技術(shù)的方法。
本領(lǐng)域的技術(shù)人員將會(huì)理解在不偏離由所附權(quán)利要求定義的本發(fā)明的范圍的前提下可以對(duì)本發(fā)明進(jìn)行各種變更和改變。
權(quán)利要求
1.一種用于全雙工通信的方法,包括以下步驟以全雙工方式傳輸(202)數(shù)據(jù);和獲得(204)對(duì)所述數(shù)據(jù)攜帶的信息值的測(cè)定,該方法的特征在于步驟根據(jù)所述測(cè)定動(dòng)態(tài)分配(206)編碼延遲。
2.依照權(quán)利要求1的方法,其特征在于為較高的信息值分配較高的編碼延遲。
3.依照權(quán)利要求2的方法,其特征在于還包括以下步驟當(dāng)應(yīng)用較高的編碼延遲時(shí),用所分配的較低的傳輸資源發(fā)送;所述傳輸資源是下列之一傳輸功率;用于傳輸?shù)奈凰俾剩挥糜趥鬏數(shù)姆纸M數(shù);和所分配的傳輸信道的數(shù)量。
4.依照權(quán)利要求2或3的方法,其特征在于所述測(cè)定是對(duì)所述數(shù)據(jù)分別對(duì)應(yīng)于攜帶所述數(shù)據(jù)的鏈路(32、34)的活動(dòng)性或不活動(dòng)性的測(cè)定。
5.依照權(quán)利要求4的方法,其特征在于所述傳輸步驟依次包括,第一方向(32)上的數(shù)據(jù)傳輸和第二方向上的數(shù)據(jù)傳輸(34);所述獲得步驟依次包括,對(duì)在所述第一方向(32)上傳輸?shù)乃鰯?shù)據(jù)對(duì)應(yīng)于活動(dòng)或不活動(dòng)的第一個(gè)測(cè)定;并且所述動(dòng)態(tài)分配步驟依次包括根據(jù)所述第一測(cè)定動(dòng)態(tài)分配所述第一方向(32)上的編碼延遲。
6.依照權(quán)利要求5的方法,其特征在于所述分配步驟依次包括,如果所述第一測(cè)定表示活動(dòng),就控制所述第一方向上的所述編碼延遲到接近最大編碼延遲的步驟。
7.依照權(quán)利要求6的方法,其特征在于所述接近是逐步接近。
8.依照權(quán)利要求6的方法,其特征在于所述接近通過(guò)多個(gè)預(yù)定的編碼延遲級(jí)發(fā)生。
9.依照權(quán)利要求6的方法,其特征在于所述編碼延遲級(jí)基于一組預(yù)定的編碼方案。
10.依照權(quán)利要求7的方法,其特征在于所述分配步驟還包括,在所述第一測(cè)定表示活動(dòng)的地方,在一個(gè)周期開(kāi)始處設(shè)置所述第一方向(32)上的所述編碼延遲為最小編碼延遲。
11.依照權(quán)利要求10的方法,其特征在于還包括下列步驟當(dāng)應(yīng)用較低編碼延遲級(jí)別時(shí),用所分配的較高的傳輸資源發(fā)送;所述傳輸資源為下列之一傳輸功率;用于傳輸?shù)奈凰俾?;用于傳輸?shù)姆纸M數(shù);和所分配的傳輸信道的數(shù)量。
12.依照權(quán)利要求10或11的方法,其特征在于所述逐步接近被延遲,直到所述開(kāi)始后的一個(gè)預(yù)定時(shí)間。
13.依照5到12任意一個(gè)權(quán)利要求的方法,其特征在于所述分配步驟依次包括,如果所述第一測(cè)定表示不活動(dòng),控制所述第一方向(32)上的所述編碼延遲接近最小編碼延遲的步驟。
14.依照權(quán)利要求5的方法,其特征在于所述系統(tǒng)具有所請(qǐng)求的最大往返延遲;所述獲取步驟還包括對(duì)所述第二方向(34)上傳輸?shù)乃鰯?shù)據(jù)對(duì)應(yīng)于活動(dòng)或不活動(dòng)的第二個(gè)測(cè)定;以及所述動(dòng)態(tài)分配步驟依次包括,根據(jù)所述第一測(cè)定和所述第二測(cè)定,動(dòng)態(tài)分配所述第一方向(32)上的編碼延遲。
15.依照權(quán)利要求14的方法,其特征在于所述分配步驟依次包括,如果所述第一測(cè)定表示活動(dòng)且所述第二測(cè)定表示不活動(dòng)時(shí),控制所述第一方向上的所述編碼延遲接近最大編碼延遲的步驟。
16.依照權(quán)利要求15的方法,其特征在于所述分配步驟還包括如果所述第一測(cè)定和所述第二測(cè)定都表示活動(dòng)時(shí),控制所述第一方向(32)上的所述編碼延遲接近中間編碼延遲的步驟。
17.依照權(quán)利要求16的方法,其特征在于所述中間編碼延遲使得所述第一方向(32)上的所述數(shù)據(jù)傳輸?shù)目傃舆t實(shí)際上是所述要求的最大往返延遲的一半。
18.依照15到17任意一個(gè)權(quán)利要求的方法,其特征在于所述分配步驟還包括,在所述第一測(cè)定表示活動(dòng)的地方,在一個(gè)周期的開(kāi)始設(shè)置所述第一方向(32)上的所述編碼延遲為最小編碼延遲的步驟。
19.依照權(quán)利要求18的方法,其特征在于所述最大編碼延遲給出所述第一方向上所述數(shù)據(jù)傳輸?shù)牡谝豢傃舆t;所述最小編碼延遲給出所述第一方向上所述數(shù)據(jù)傳輸?shù)牡诙傃舆t;所述第一和第二總延遲之和實(shí)際上等于所述要求的最大往返延遲。
20.依照權(quán)利要求18的方法,其特征在于所述最大編碼延遲給出所述第一方向上所述數(shù)據(jù)傳輸?shù)牡谝豢傃舆t;所述最小編碼延遲給出所述第二方向上所述數(shù)據(jù)傳輸?shù)牡诙傃舆t;所述第一和第二總延遲之和實(shí)際上等于所述要求的最大往返延遲。
21.依照15到20任意一個(gè)權(quán)利要求的方法,其特征在于編碼延遲的任何增加都被推遲一個(gè)預(yù)定的時(shí)間段。
22.依照4到21任意一個(gè)權(quán)利要求的方法,其特征在于所述數(shù)據(jù)表示音頻信號(hào),由此不活動(dòng)由下列中的至少一個(gè)定義無(wú)聲;背景噪音;和恒定信號(hào)。
23.依照4到21任意一個(gè)權(quán)利要求的方法,其特征在于所述數(shù)據(jù)表示視頻信號(hào),由此不活動(dòng)由下列中的至少一個(gè)定義沒(méi)有圖像;背景噪音;和靜止。
24.依照權(quán)利要求18的方法,其特征在于還包括以下步驟對(duì)要在所述系統(tǒng)中來(lái)回發(fā)送的消息測(cè)量實(shí)際的響應(yīng)時(shí)間;使所述最小和最大編碼延遲適合于使所述實(shí)際響應(yīng)時(shí)間等于所述要求的最大往返延遲。
25.依照1到24任意一個(gè)權(quán)利要求的方法,其特征在于所述編碼延遲取決于抖動(dòng)緩沖區(qū)深度。
26.依照權(quán)利要求25的方法,其特征在于所述編碼延遲動(dòng)態(tài)分配依次包括下列步驟根據(jù)所述測(cè)定設(shè)置目標(biāo)抖動(dòng)緩沖區(qū)填充電平;調(diào)整抖動(dòng)緩沖區(qū)時(shí)鐘,以實(shí)現(xiàn)平均填充電平等于所述目標(biāo)抖動(dòng)緩沖區(qū)填充電平。
27.依照權(quán)利要求25的方法,其特征在于,所述編碼延遲動(dòng)態(tài)分配依次包括以下步驟根據(jù)所述測(cè)定設(shè)置目標(biāo)抖動(dòng)緩沖區(qū)填充電平;插入或丟棄幀,以實(shí)現(xiàn)平均填充電平等于所述目標(biāo)抖動(dòng)緩沖區(qū)填充電平。
28.依照1到27任意一個(gè)權(quán)利要求的方法,其特征在于所述全雙工通信是多方通信。
29.一種全雙工通信系統(tǒng)(1),包括至少兩個(gè)終端(20);連接所述至少兩個(gè)終端(20)的網(wǎng)絡(luò)(10);在所述至少兩個(gè)終端(20)中的任意兩個(gè)之間,以全雙工方式傳輸數(shù)據(jù)的傳輸裝置(30);和與所述至少兩個(gè)終端(20)相關(guān)的編碼/解碼裝置(22)。其特征在于用于測(cè)定由所述數(shù)據(jù)攜帶的信息值的檢測(cè)器裝置(24、70);和用于控制所述編碼/解碼裝置(22)的編碼延遲的編碼控制裝置(26),所述編碼控制裝置(26)被安排根據(jù)所述測(cè)定,動(dòng)態(tài)分配與大量可能的編碼延遲相關(guān)的編碼/解碼。
30.依照權(quán)利要求29的系統(tǒng),其特征在于,對(duì)于所述信息值的較高值,所述相關(guān)編碼延遲較高。
31.依照權(quán)利要求30的系統(tǒng),其特征在于所述傳輸裝置依次包括根據(jù)應(yīng)用的編碼延遲分配傳輸資源的裝置;所述傳輸資源是下列中的至少一個(gè)傳輸功率;用于傳輸?shù)奈凰俾剩挥糜趥鬏數(shù)姆纸M數(shù);和所分配的傳輸信道的數(shù)量。
32.依照權(quán)利要求30到31的系統(tǒng),其特征在于所述檢測(cè)器裝置(24、70)是用于測(cè)定所述數(shù)據(jù)分別對(duì)應(yīng)于攜帶所述數(shù)據(jù)的鏈路(32、34)的活動(dòng)或不活動(dòng)的檢測(cè)器。
33.依照權(quán)利要求32的系統(tǒng),其特征在于所述傳輸裝置包括,在至少兩個(gè)終端的兩個(gè)之間的第一方向上傳輸數(shù)據(jù)的裝置和在與所述第一方向相反的第二方向上傳輸數(shù)據(jù)的裝置;所述檢測(cè)器裝置依次包括,用于檢測(cè)在所述第一方向上傳輸?shù)乃鰯?shù)據(jù)攜帶的所述數(shù)據(jù)對(duì)應(yīng)于活動(dòng)或不活動(dòng)的第一檢測(cè)器(24);并且所述編碼控制裝置(26)被安排根據(jù)所述第一檢測(cè)器(24)的輸出動(dòng)態(tài)地分配編碼/解碼。
34.依照權(quán)利要求33的系統(tǒng),其特征在于所述第一檢測(cè)器(24)與所述終端(20)中的至少一個(gè)的輸入鏈路(32)相連,所述編碼控制裝置(26)被安排根據(jù)所述第一檢測(cè)器(24)的輸出動(dòng)態(tài)地分配解碼。
35.依照權(quán)利要求33或34的系統(tǒng),其特征在于所述檢測(cè)器裝置還包括用于檢測(cè)在所述第二方向上傳輸?shù)乃鰯?shù)據(jù)對(duì)應(yīng)于活動(dòng)或不活動(dòng)的第二檢測(cè)器(70);并且所述編碼控制裝置(26)被安排根據(jù)所述第一檢測(cè)器(24)和所述第二檢測(cè)器(70)的輸出動(dòng)態(tài)分配編碼/解碼。
36.依照權(quán)利要求35的系統(tǒng),其特征在于所述第一檢測(cè)器(24)與所述終端(20)中的至少一個(gè)的輸入鏈路(32)相連,所述第二檢測(cè)器(70)與所述終端中所述至少一個(gè)的輸出鏈路(34)相連,所述編碼控制裝置(26)被安排根據(jù)所述第一檢測(cè)器(24)和所述第二檢測(cè)器(70)的輸出動(dòng)態(tài)分配解碼。
37.依照32到36任意一個(gè)權(quán)利要求的系統(tǒng),其特征在于所述編碼/解碼裝置(22)依次包括抖動(dòng)緩沖區(qū)(54),所述編碼控制裝置是抖動(dòng)緩沖區(qū)控制裝置(26)。
38.依照權(quán)利要求37的系統(tǒng),其特征在于所述抖動(dòng)緩沖區(qū)控制裝置(26)被安排控制抖動(dòng)緩沖區(qū)時(shí)鐘。
39.依照權(quán)利要求37的系統(tǒng),其特征在于所述抖動(dòng)緩沖區(qū)控制裝置(26)被安排插入或丟棄幀。
40.依照32到39任意一個(gè)權(quán)利要求的系統(tǒng),其特征在于所述數(shù)據(jù)表示音頻數(shù)據(jù),由此所述檢測(cè)器(24、70)至少對(duì)下列之一敏感無(wú)聲;背景噪音;和恒定信號(hào)。
41.依照32到39任意一個(gè)權(quán)利要求的系統(tǒng),其特征在于所述數(shù)據(jù)表示視頻信號(hào),由此所述檢測(cè)器(24、70)至少對(duì)下列之一敏感沒(méi)有圖像;背景噪音;和靜止。
42.依照權(quán)利要求29的系統(tǒng),其特征在于還包括用于為將在所述系統(tǒng)中來(lái)回發(fā)送的消息測(cè)量實(shí)際響應(yīng)時(shí)間的裝置;和用于響應(yīng)所述用于測(cè)量實(shí)際響應(yīng)時(shí)間的裝置的輸出,而調(diào)整最小和最大編碼延遲的裝置。
43.依照29到42任意一個(gè)權(quán)利要求的方法,其特征在于還包括用于支持多方通信的裝置。
44.一種終端(20),包括以全雙工方式從所述終端(20)或向其傳輸數(shù)據(jù)的傳輸裝置;與輸出鏈路(32)相關(guān)的編碼裝置(22);和與輸入鏈路(34)相關(guān)的解碼裝置(22),該終端的特征在于用于測(cè)定由所述數(shù)據(jù)攜帶的信息值的檢測(cè)器裝置(24、70);和用于控制所述編碼裝置和解碼裝置中的至少一個(gè)的編碼控制裝置(26),所述編碼控制裝置(26)被安排根據(jù)所述測(cè)定動(dòng)態(tài)分配與多個(gè)可能的編碼延遲關(guān)聯(lián)的編碼/解碼。
45.依照權(quán)利要求44的終端,其特征在于所述編碼控制裝置(26)被安排動(dòng)態(tài)分配與多個(gè)預(yù)定的編碼延遲級(jí)關(guān)聯(lián)的編碼/解碼。
46.依照權(quán)利要求44的終端,其特征在于所述編碼控制裝置(26)被安排根據(jù)一組預(yù)定的編碼方案,動(dòng)態(tài)分配與多個(gè)編碼延遲級(jí)關(guān)聯(lián)的編碼/解碼。
47.依照權(quán)利要求44到46的終端,其特征在于所述檢測(cè)器裝置是測(cè)定所述數(shù)據(jù)分別對(duì)應(yīng)于攜帶所述數(shù)據(jù)的鏈路(32、34)的活動(dòng)或不活動(dòng)的檢測(cè)器(24、70)。
48.依照權(quán)利要求47的終端,其特征在于所述檢測(cè)器依次包括用于檢測(cè)在所述輸入鏈路(32)上傳輸?shù)乃鰯?shù)據(jù)攜帶的所述數(shù)據(jù)對(duì)應(yīng)于活動(dòng)或不活動(dòng)的第一檢測(cè)器(24);并且所述編碼控制裝置(26)被安排根據(jù)所述第一檢測(cè)器(24)的輸出動(dòng)態(tài)分配解碼。
49.依照權(quán)利要求48的終端,其特征在于所述檢測(cè)器裝置還包括用于測(cè)定在所述輸出鏈路(34)上傳輸?shù)乃鰯?shù)據(jù)對(duì)應(yīng)活動(dòng)或不活動(dòng)的第二檢測(cè)器在(70);并且所述編碼控制裝置(26)被安排根據(jù)所述第一檢測(cè)器(24)和所述第二檢測(cè)器(70)的輸出動(dòng)態(tài)分配解碼。
50.依照權(quán)利要求49的終端,其特征在于所述解碼裝置(22)包括抖動(dòng)緩沖區(qū)(54),所述編碼控制裝置是抖動(dòng)緩沖區(qū)控制裝置(26)。
51.依照權(quán)利要求50的終端,其特征在于所述抖動(dòng)緩沖區(qū)控制裝置(26)被安排控制抖動(dòng)緩沖區(qū)時(shí)鐘。
52.依照權(quán)利要求50的終端,其特征在于所述抖動(dòng)緩沖區(qū)控制裝置(26)被安排插入或丟棄幀。
全文摘要
在本發(fā)明中,根據(jù)鏈路當(dāng)前以及最近的活動(dòng)性在鏈路間分配全雙工通信的可用延遲預(yù)算。通過(guò)跟蹤全雙工通信系統(tǒng)中的鏈路活動(dòng)或不活動(dòng),即知道所傳輸?shù)臄?shù)據(jù)的信息值,如果相對(duì)的鏈路同時(shí)不活動(dòng)的話可以為活動(dòng)鏈路使用編碼延遲比通常接受的較大的編碼過(guò)程。因?yàn)橛脩魧?duì)延遲的敏感性在鏈路開(kāi)始活動(dòng)的瞬間最大,在鏈路開(kāi)始活動(dòng)的瞬間要分配編碼延遲比通常使用的要小的編碼過(guò)程。因此增加了編碼延遲。優(yōu)選的,控制往返延遲保持低于要求的最大值。
文檔編號(hào)H04L5/14GK1689264SQ03824626
公開(kāi)日2005年10月26日 申請(qǐng)日期2003年9月11日 優(yōu)先權(quán)日2002年10月25日
發(fā)明者S·布魯恩 申請(qǐng)人:艾利森電話股份有限公司