專(zhuān)利名稱(chēng):語(yǔ)音通信的聲頻信號(hào)處理的制作方法
背景本發(fā)明涉及語(yǔ)音通信的聲頻信號(hào)處理。
在有線或無(wú)線通信網(wǎng)絡(luò)上的典型語(yǔ)音通信中,某處收聽(tīng)者附近的環(huán)境噪聲會(huì)使從另一位置處說(shuō)話者接收到的語(yǔ)音變得模糊。
附圖描述
圖1是語(yǔ)音的通信路徑簡(jiǎn)圖。
圖2是近端裝置101的簡(jiǎn)圖。
圖3是RX-AVC模塊150的簡(jiǎn)圖。
圖4是用于存儲(chǔ)關(guān)于幀能量的信息的方法簡(jiǎn)圖。
圖5是以8KHz采樣的流行音樂(lè)的振幅圖。
圖6是圖5中聲音采樣的自相關(guān)函數(shù)圖。
詳細(xì)描述參考圖1中的示例,遠(yuǎn)端裝置102,檢測(cè)可包括語(yǔ)音的遠(yuǎn)端聲音105。聲音105被轉(zhuǎn)換成信號(hào)106(遠(yuǎn)端信號(hào)),通過(guò)調(diào)制射頻信號(hào)、與諸如因特網(wǎng)這樣的網(wǎng)絡(luò)接口、或在波導(dǎo)上發(fā)送信號(hào)而把信號(hào)106發(fā)送到近端裝置101。信號(hào)106的傳輸還可以包括已知信號(hào)傳輸模式的組合,譬如那些使用電、光、微波、紅外和無(wú)線電信號(hào)的傳輸模式,以及任何數(shù)量的媒介物,譬如開(kāi)關(guān)、計(jì)算機(jī)服務(wù)器和衛(wèi)星。
近端裝置101再現(xiàn)遠(yuǎn)端聲音105。近端裝置101還檢測(cè)可包括環(huán)境噪聲103的近端聲音。近端裝置101根據(jù)環(huán)境噪聲103處理信號(hào)106,以便遠(yuǎn)端聲音105再現(xiàn)為人類(lèi)更易翻譯的方式提供給近端裝置101的用戶(hù)。
在圖1所述的示例中,近端裝置101是從遠(yuǎn)端裝置102接收遠(yuǎn)端信號(hào)的手提電話,遠(yuǎn)端裝置102是遠(yuǎn)程位置處的電話。
還參考圖2中的示例,近端裝置101用麥克風(fēng)112檢測(cè)近端上的聲音120。近端聲音120的模擬信號(hào)可以由處理器CODEC(編解碼器)130轉(zhuǎn)換成數(shù)字信號(hào)128。數(shù)字信號(hào)128由話音活動(dòng)檢測(cè)器(VAD)140以及接收信號(hào)自動(dòng)音量控制(RX-AVC)模塊150所評(píng)估。RX-AVC模塊150用周期性檢測(cè)器157來(lái)檢測(cè)近端信號(hào)128的特定分量。RX-AVC模塊150還可以有噪聲估計(jì)器156,用于提供對(duì)信號(hào)內(nèi)噪聲的估計(jì)。噪聲估計(jì)器可以由來(lái)自VAD 140和周期性檢測(cè)器157的觸發(fā)器所控制。動(dòng)態(tài)范圍控制器(DRC)155用來(lái)自噪聲估計(jì)器156的值來(lái)改變遠(yuǎn)端信號(hào)106。
近端聲音120的數(shù)字信號(hào)128可以由編碼器110進(jìn)行編碼,用于發(fā)射(TX)到遠(yuǎn)端裝置102。
近端裝置101在接收機(jī)(RX)處接收遠(yuǎn)端聲音105的信號(hào)106。信號(hào)106由解碼器145解碼,并由接收路徑聲音活動(dòng)檢測(cè)器(RX-VAD)162進(jìn)行分析。已解碼的信號(hào)106由DRC模塊155進(jìn)行調(diào)制,例如,用于根據(jù)來(lái)自噪聲估計(jì)器156的噪聲估計(jì)和來(lái)自RX-VAD 162的標(biāo)志而調(diào)節(jié)信號(hào)。經(jīng)調(diào)節(jié)的信號(hào)由CODEC 130轉(zhuǎn)換成模擬信號(hào),并由揚(yáng)聲器170作為聲音提供。
還參考圖3,可以用RX-AVC處理器151實(shí)現(xiàn)噪聲估計(jì)器156和周期性檢測(cè)器157。RX-AVC處理器151分析除所關(guān)心分量以外的分量的信號(hào)。這些分量可以包括未被VAD 140檢測(cè)的環(huán)境噪聲形式,例如,像音樂(lè)這樣非靜止并且是周期性的噪聲形式。所關(guān)心的分量一般是人類(lèi)語(yǔ)音。RX-AVC模塊150按照已檢測(cè)噪聲103的函數(shù)控制遠(yuǎn)端聲音105的電平和動(dòng)態(tài)范圍,例如,通過(guò)把近端103處的噪聲估計(jì)drc_noise_estimate傳遞到DRC 155來(lái)實(shí)現(xiàn)。
RX-AVC處理器151可以存儲(chǔ)關(guān)于近端信號(hào)128的信息,用于稍后的分析。例如,處理器151可用于執(zhí)行幀能量采樣例程,它用與近端信號(hào)128每個(gè)最新接收到的信號(hào)幀(如,幀F(xiàn)1、F2、...、F200)的能量有關(guān)的信息來(lái)更新靜態(tài)存儲(chǔ)緩沖器152。該例程可以用新信息來(lái)重寫(xiě)與平均分段210外的能量有關(guān)的信息,并且更新指針P1以指明新信息在靜態(tài)存儲(chǔ)器152內(nèi)的位置。
為了減少對(duì)系統(tǒng)資源的需求,可以以緊縮形式存儲(chǔ)與平均分段210內(nèi)幀能量有關(guān)的信息。每個(gè)幀能量在存儲(chǔ)在靜態(tài)存儲(chǔ)緩沖器152內(nèi)之前被處理。
參考圖4,與信號(hào)幀F(xiàn)2有關(guān)的信息最初被計(jì)算為32位值410。由于在RX-AVC模塊150的環(huán)境中可能不關(guān)心非常低的幀能量,且高電平能量的區(qū)別可能不會(huì)改進(jìn)性能,因此通過(guò)截短402和四舍五入403多余比特從32位值410中提取16個(gè)有效位420。如果幀能量超出某一閾值,該能量就被存儲(chǔ)為最大16位值。例如,在16個(gè)有效位右面的32位值410的位被四舍五入。結(jié)果是指示幀能量的16位值420。
在圖4所述的示例中,從32位值410的位27到12獲得16位值420。經(jīng)提取的16位值420的位置是可調(diào)的,例如,在另一情況下可提取位25到10,等等。
通過(guò)計(jì)算其余16位值420的平方根并將其存儲(chǔ)為8位值425,可以獲得幀能量信息的比特?cái)?shù)的進(jìn)一步減少。該8位值425可以與類(lèi)似從相鄰幀(如,F(xiàn)1)獲得的8位值427一起被緊縮。這些值可被存儲(chǔ)在靜態(tài)存儲(chǔ)器中。對(duì)于處理而言,可以從靜態(tài)存儲(chǔ)器152中檢取這些值,并對(duì)其解緊縮??梢云椒矫總€(gè)解緊縮的8位值425以獲得經(jīng)處理的16位值440。
在其它實(shí)施例中,僅為信號(hào)幀的子集存儲(chǔ)幀能量,如,每秒、或每三個(gè)幀。可以按照每個(gè)信號(hào)幀的尺寸來(lái)選擇存儲(chǔ)信息的程度。例如,如果每幀對(duì)應(yīng)于5ms,則通過(guò)每?jī)蓭?、每三幀、或每四幀的系列存?chǔ)信息,可能獲得足夠的性能。
分析與信號(hào)有關(guān)的已存儲(chǔ)信息,從而為具有規(guī)則周期的間歇聲音確定信號(hào)的存在,此類(lèi)聲音如流行音樂(lè)中的擊鼓聲。在某些實(shí)施例中,RX-AVC處理器151用自相關(guān)函數(shù)157來(lái)檢測(cè)這種不感興趣的周期性分量,它們與所關(guān)心的人類(lèi)語(yǔ)音同時(shí)發(fā)生。
一般而言,自相關(guān)函數(shù)157定義如下R[i]=NN-iΣfrm=0N-1·P[frm+i]·P[frm],i>=0---(157)]]>其中N是平均分段尺寸,且P[frm]=Σn=0159s[n]2]]>表示幀frm的平均采樣能量,而s[n]是幀內(nèi)離散時(shí)間下標(biāo)處的信號(hào)電平。包括以8kHz采樣的聲音信息的20ms幀具有160個(gè)時(shí)間下標(biāo)的采樣。
例如,該算法使用了20ms幀能量在平均分段210上的自相關(guān),平均分段的持續(xù)時(shí)間為4秒。平均分段210的幀能量存儲(chǔ)在靜態(tài)存儲(chǔ)器152中,如上所討論的。自相關(guān)函數(shù)157評(píng)估平均分段210內(nèi)幀能量之間的相關(guān),分段由固定數(shù)量幀所分開(kāi),分開(kāi)間距對(duì)應(yīng)于一周期。函數(shù)一般限于搜索周期為0.25到1秒(即,對(duì)應(yīng)于1到4Hz)的相關(guān)。后面的周期范圍(可以是某些節(jié)奏的特性)在圖5中被標(biāo)識(shí)為搜索窗220。
RX-AVC處理器151根據(jù)下列示例性標(biāo)準(zhǔn)評(píng)估自相關(guān)函數(shù)157內(nèi)的峰值a.y[max]>Threshold_1;b.Σi=max-3max+3(y[max]-y[i])2>Threshold_2;]]>c.y[max]-y[min]>Threshold_3;其中y[i]是標(biāo)準(zhǔn)化的自相關(guān)函數(shù)(R[i]/R
);
max=argimax{y[i]},i=13,...,48;以及min=argimin{y[i]},i=13,...,48。參考圖6,關(guān)于Threshold_3評(píng)估的峰值高度630被描述為用于評(píng)估Threshold_2的范圍620。
在該例中分析幀周期13到48,如果使用20ms幀,則這些對(duì)應(yīng)于上述的0.25到1秒的周期。
可以根據(jù)經(jīng)驗(yàn)確定或者用其它算法設(shè)定閾值Threshold_1、Threshold_2和Threshold_3。例如,當(dāng)閾值Threshold_1、Threshold_2和Threshold_3用于表征有節(jié)奏音樂(lè)的自相關(guān)峰值時(shí),它們可以分別被設(shè)為0.70、0.0625和0.25。自相關(guān)函數(shù)的使用和閾值的調(diào)諧可以便于檢測(cè)不完全規(guī)律的周期性。因此,這種可檢測(cè)的不完全周期性在此被視作周期性的。
由RX-AVC處理器151檢測(cè)的周期信號(hào)在約0.3Hz到6Hz或約1Hz到4Hz的頻域內(nèi)是周期性的,并且不對(duì)應(yīng)于會(huì)在較短時(shí)間分析內(nèi)檢測(cè)到的音樂(lè)或語(yǔ)言節(jié)距。這種周期性信號(hào)可以用諸如打擊樂(lè)器等樂(lè)器來(lái)產(chǎn)生。此外,任何產(chǎn)生已定義節(jié)距的樂(lè)器還能由模塊來(lái)檢測(cè),只要它以節(jié)奏方式打擊(如,具有重復(fù)噪聲脈沖串的方式)。
參考圖5中的示例,包括流行音樂(lè)的信號(hào)以8KHz被采樣,音樂(lè)具有周期為0.5秒的擊鼓聲。模塊所使用的平均分段210的持續(xù)時(shí)間為4秒,自相關(guān)函數(shù)157在0.25到1.0秒(即,在1Hz和4Hz之間)的搜索窗內(nèi)搜索周期信號(hào)。自相關(guān)函數(shù)157的峰值指示打擊周期。圖5所示平均分段210的標(biāo)準(zhǔn)化自相關(guān)函數(shù)在圖6中畫(huà)出。函數(shù)610的峰值在20ms的25幀處,它對(duì)應(yīng)于0.5秒的打擊周期。
當(dāng)RX-AVC處理器151檢測(cè)到上述信號(hào)的周期分量時(shí),模塊150觸發(fā)信號(hào)調(diào)制器改變?cè)撔盘?hào),以便改進(jìn)所關(guān)心分量(如,人類(lèi)語(yǔ)音)的感知和/或解釋。
在某些實(shí)施例中,調(diào)制器是DRC 155。DRC 155可以根據(jù)噪聲電平drc_noise_estimate壓縮信號(hào)的動(dòng)態(tài)范圍,噪聲電平是根據(jù)VAD 140和RX-AVC 150計(jì)算的。噪聲電平可以根據(jù)表1中的偽碼被采樣。
表1.噪聲判決的偽碼1. update_noise_flag1=FALSE2. 如果NOT(VAD_trigger)→update_noise_flag1=TRUE3. update_noise_flag2=FALSE4. 如果(rhythm_detect)→update_noise_flag2=TRUE5. 如果(update_noise_flag1=TRUE)→用current_energy_estimate更新drc_noise_estimate
6. 否則如果(the_r_update_flag=TRUE)→用averaged_energy_estimate更新drc_noise_estimateVAD模塊140可用于通過(guò)檢測(cè)近端信號(hào)128內(nèi)的平穩(wěn)性和非音調(diào)作為隨機(jī)噪聲的指示而評(píng)估非周期噪聲的每個(gè)噪聲幀。隨機(jī)噪聲可包括傳輸期間招致的高斯噪聲。一般而言,VAD模塊140在發(fā)覺(jué)所關(guān)心的信號(hào)時(shí)激活觸發(fā)器VAD_trigger。
當(dāng)VAD模塊140未發(fā)覺(jué)所關(guān)心的信號(hào)時(shí),VAD模塊140使噪聲估計(jì)器156更新drc_noise_estimate值。例如,如果信號(hào)電平低于某一閾值時(shí),或如果信號(hào)是平穩(wěn)且非音調(diào)時(shí),VAD指示符VAD_trigger不被激活。狀態(tài)(NOT VAD_trigger)激活update_noise_flag1標(biāo)志(表1,第二行)。因此,用當(dāng)前的能量估計(jì)curret_energy_estimate來(lái)更新drc_noise_estimate(表1,第5行)。噪聲電平可以如下更新drc_noise_estimate=α*drc_noise_estimate+(1-α)*current_noise_estimate,其中α是平滑常數(shù)。
VAD模塊140也許不能分辨像節(jié)奏音樂(lè)這樣不受關(guān)心的周期信號(hào)分量以及像語(yǔ)音這樣所關(guān)心的分量。當(dāng)檢測(cè)到周期信號(hào)分量時(shí),RX-AVC處理器151提供超越VAD噪聲估計(jì)的第二噪聲估計(jì)。例如,當(dāng)處理器151檢測(cè)到周期分量時(shí)(表1,第4行),它觸發(fā)update_noise_flag2,使噪聲估計(jì)drc_noise_estimate被來(lái)自?xún)蓚€(gè)連續(xù)打擊區(qū)間的平均幀能量averaged_energy_estimate重寫(xiě)(表1,第6行)。該平均所用的幀可以來(lái)自平均分段210中間,如,判決瞬間前的兩秒。該噪聲值比VAD噪聲估計(jì)current_energy_estimate更準(zhǔn)確地反映出由像音樂(lè)這樣的周期分量所造成的環(huán)境噪聲電平,VAD噪聲估計(jì)current_energy_estimate未平均周期分量完整周期上的能量電平。
表1中提出的噪聲判決例程的不同步驟可以用不同頻率運(yùn)行。例如,RX-AVC處理器151會(huì)以約0.25秒的正則區(qū)間評(píng)估平均分段210。相對(duì)應(yīng)連續(xù)循環(huán)而言,這樣的評(píng)估頻率減少了沒(méi)有有損檢測(cè)所需的處理時(shí)間量。每次評(píng)估包括重置update_noise_flag2(表1,第3行),以及重新評(píng)估節(jié)奏的經(jīng)更新的平均分段210(表1,第4行)。相反,VAD 140會(huì)評(píng)估每個(gè)噪聲幀。
上述示例性配置可以用于手提電話中,如果手提電話在本地檢測(cè)到節(jié)奏音樂(lè),它就提高了來(lái)自信號(hào)的聲音的再現(xiàn)。
除了上述內(nèi)容之外,可以用許多不同實(shí)施例根據(jù)本地檢測(cè)到的聲音處理信號(hào),以便改進(jìn)通信。
在某些實(shí)施例中,噪聲判決例程包括從信號(hào)的區(qū)間中估計(jì)噪聲電平,信號(hào)包括周期分量,但沒(méi)有第二分量,如人類(lèi)語(yǔ)音。語(yǔ)音識(shí)別算法可以與RX-AVC 150接口以識(shí)別這樣的區(qū)間。
而且,RX-AVC模塊150可以檢測(cè)多種環(huán)境噪聲,譬如節(jié)奏音樂(lè)及其它周期背景聲音。
在其它實(shí)施例中,模塊可包括節(jié)距檢測(cè)例程。模塊可以被編程或被訓(xùn)練成,以分辨具有話音節(jié)距和/或音色的聲音以及具有樂(lè)器節(jié)距和/或音色的聲音。
多種方法的任一種都可以用來(lái)識(shí)別周期分量。該方法可以在信號(hào)的時(shí)域或頻域內(nèi)搜索周期或近似周期的分量。例如,傅立葉變換可以應(yīng)用于幀能量序列來(lái)識(shí)別頻域內(nèi)的復(fù)現(xiàn)信號(hào)。
多種方法的任一種都可以用來(lái)使遠(yuǎn)端信號(hào)106在作為聲音被提供時(shí)更易被人類(lèi)解釋。例如,可以觸發(fā)近端裝置來(lái)產(chǎn)生反噪聲,反噪聲包括消去環(huán)境噪聲周期分量的聲波。
而且,為了分析數(shù)字或模擬信號(hào),技術(shù)可以用硬件、軟件或兩者的組合來(lái)實(shí)現(xiàn)。
上述技術(shù)還不限于電話或上述示例性配置;它們可能應(yīng)用于通信的任何計(jì)算或處理環(huán)境中。例如,與計(jì)算機(jī)網(wǎng)絡(luò)相連的臺(tái)式機(jī)可以用于交換包括人類(lèi)語(yǔ)音和環(huán)境噪聲的聲音通信。一般而言,每個(gè)裝置可能包括像麥克風(fēng)這樣的聲音輸入裝置以及像揚(yáng)聲器這樣的聲音輸出裝置。
其它實(shí)現(xiàn)也在所附權(quán)利要求的范圍內(nèi)。
權(quán)利要求
1.一種方法,包括在第一裝置處,從遠(yuǎn)程裝置接收包括人類(lèi)可解釋聲頻信息的信號(hào);在第一裝置處檢測(cè)聲音;分析所檢測(cè)的聲音以確定是否存在周期大于0.1秒的間歇分量;以及如果存在間歇分量,則改變信號(hào),使得在信號(hào)被轉(zhuǎn)換成聲音時(shí),聲頻信息更易被人類(lèi)解釋。
2.如權(quán)利要求1所述的方法,其特征在于,所述間歇分量的周期大于0.2秒且小于1.4秒。
3.如權(quán)利要求1所述的方法,其特征在于,所述人類(lèi)可解釋聲頻信息包括語(yǔ)音。
4.如權(quán)利要求1所述的方法,其特征在于,所述分析可以區(qū)分間歇分量和語(yǔ)音。
5.如權(quán)利要求1所述的方法,其特征在于,所述檢測(cè)包括在一系列時(shí)間區(qū)間內(nèi)存儲(chǔ)關(guān)于所檢測(cè)聲音的電平的信息,且所述分析包括評(píng)估所存儲(chǔ)的信息以確定是否存在間歇分量。
6.如權(quán)利要求5所述的方法,其特征在于,所述分析包括將第一電平子集與第二電平子集相比較,每個(gè)子集包括對(duì)應(yīng)于周期間隔的時(shí)間區(qū)間的電平,第一和第二子集具有不同的規(guī)則的間距。
7.如權(quán)利要求5所述的方法,其特征在于,所述分析包括確定應(yīng)用于已存儲(chǔ)信息的自相關(guān)函數(shù)的參數(shù)是否滿(mǎn)足某一準(zhǔn)則。
8.如權(quán)利要求5所述的方法,其特征在于,所述已存儲(chǔ)信息在時(shí)間區(qū)間內(nèi)縮短信號(hào)高電平和低電平的至少某些信息。
9.如權(quán)利要求1所述的方法,其特征在于,所述第一裝置用無(wú)線連接來(lái)接收信號(hào)。
10.如權(quán)利要求1所述的方法,其特征在于,改變信號(hào)的動(dòng)態(tài)范圍,從而在實(shí)行信號(hào)時(shí)提供更易被人類(lèi)解釋的聲頻信息。
11.如權(quán)利要求10所述的方法,其特征在于,改變信號(hào)的動(dòng)態(tài)范圍,作為未檢測(cè)到間歇分量時(shí)非周期噪聲估計(jì)以及檢測(cè)到間歇分量時(shí)周期噪聲的估計(jì)的函數(shù)。
12.如權(quán)利要求11所述的方法,其特征在于還包括,在對(duì)應(yīng)于至少一個(gè)間歇分量周期的區(qū)間內(nèi)分析信號(hào)電平以產(chǎn)生周期噪聲的估計(jì)。
13.如權(quán)利要求12所述的方法,其特征在于,所述區(qū)間對(duì)應(yīng)于間歇分量的大約一個(gè)周期。
14.如權(quán)利要求1所述的方法,其特征在于,在信號(hào)被轉(zhuǎn)換成聲音時(shí),改變信號(hào)以增加從信號(hào)產(chǎn)生的聲音的幅度。
15.如權(quán)利要求1所述的方法,其特征在于,所述聲頻分量包括音樂(lè)。
16.一種方法,包括在裝置處,接收包括聲頻信息的信號(hào);檢測(cè)裝置處的聲音;存儲(chǔ)與所檢測(cè)聲音的能量或幅度有關(guān)的值,每個(gè)值都對(duì)應(yīng)于所檢測(cè)聲音的一個(gè)區(qū)間;分析這些值以確定是否存在周期在0.2秒和2秒之間的間歇分量;如果確定存在間歇分量則改變信號(hào);以及把經(jīng)改變的信號(hào)作為聲音提供。
17.如權(quán)利要求16所述的方法,其特征在于,所述聲頻信號(hào)是以數(shù)字格式接收的。
18.如權(quán)利要求16所述的方法,其特征在于,所述改變包括壓縮信號(hào)的動(dòng)態(tài)范圍。
19.如權(quán)利要求16所述的方法,其特征在于,所述分析包括將第一電平子集與第二電平子集相比較,每個(gè)子集包括對(duì)應(yīng)于規(guī)則間隔的時(shí)間區(qū)間的電平,第一和第二子集具有不同的規(guī)則的間距。
20.如權(quán)利要求18所述的方法,其特征在于,改變信號(hào)的動(dòng)態(tài)范圍,作為未檢測(cè)到間歇分量時(shí)非周期噪聲估計(jì)以及檢測(cè)到間歇分量時(shí)周期噪聲的估計(jì)的函數(shù)。
21.如權(quán)利要求16所述的方法,其特征在于,在存儲(chǔ)前改變每個(gè)值從而去除與對(duì)應(yīng)于高值的值的比特以及對(duì)應(yīng)于低值的值的比特有關(guān)的信息。
22.如權(quán)利要求21所述的方法,其特征在于,所述每個(gè)值以緊縮格式被存儲(chǔ),并且在分析時(shí)被解緊縮。
23.一種裝置,包括接收機(jī),用于從無(wú)線傳輸接收表示聲頻信息的信號(hào);信號(hào)調(diào)制器,用于根據(jù)噪聲估計(jì)改變信號(hào);以及檢測(cè)器,用于為了具有規(guī)則的周期性的間歇分量而分析裝置處的聲音,在檢測(cè)到間歇分量時(shí)產(chǎn)生間歇分量的噪聲估計(jì),以及把噪聲估計(jì)傳遞到信號(hào)調(diào)制器。
24.如權(quán)利要求23所述的裝置,其特征在于,如果間歇分量的周期在0.2和1.0秒之間則產(chǎn)生噪聲估計(jì)。
25.如權(quán)利要求23所述的裝置,其特征在于,所述信號(hào)調(diào)制器按照噪聲估計(jì)的函數(shù)改變信號(hào)的動(dòng)態(tài)范圍。
26.如權(quán)利要求23所述的裝置,其特征在于,所述信號(hào)檢測(cè)器包括存儲(chǔ)器,用于存儲(chǔ)與一系列時(shí)間區(qū)間內(nèi)信號(hào)電平有關(guān)的信息;以及處理器,用于為間歇分量而分析已存儲(chǔ)的信息。
27.如權(quán)利要求26所述的裝置,其特征在于,所述處理器用于(1)把第一電平子集與第二電平子集相比較,每個(gè)子集包括對(duì)應(yīng)于規(guī)則間隔的時(shí)間區(qū)間的電平,第一和第二子集具有不同的規(guī)則的間距;以及(2)如果第一和第二子集滿(mǎn)足一標(biāo)準(zhǔn)則產(chǎn)生間歇分量的噪聲估計(jì)。
28.如權(quán)利要求26所述的裝置,其特征在于,所述處理器用于把自相關(guān)函數(shù)應(yīng)用于已存儲(chǔ)的信息,且如果自相關(guān)函數(shù)的參數(shù)滿(mǎn)足一準(zhǔn)則則產(chǎn)生間歇分量的噪聲估計(jì)。
29.如權(quán)利要求26所述的裝置,其特征在于,所述與信號(hào)電平有關(guān)的信息以緊縮格式被存儲(chǔ)。
30.如權(quán)利要求26所述的裝置,其特征在于,修改所述與信號(hào)電平有關(guān)的信息,使得僅保持與信號(hào)電平中間范圍有關(guān)的信息。
全文摘要
一裝置接收包括人類(lèi)可翻譯的聲頻信息的信號(hào)。裝置在本地檢測(cè)聲音并對(duì)其進(jìn)行分析以確定是否存在間歇分量。如果存在間歇分量,則改變接收到的信號(hào),使得聲頻信息在執(zhí)行信號(hào)時(shí)更容易被人類(lèi)翻譯。裝置可以是便攜式電話??梢栽诶缫魳?lè)中檢測(cè)到間歇分量。
文檔編號(hào)G10L21/00GK1507689SQ02809491
公開(kāi)日2004年6月23日 申請(qǐng)日期2002年5月2日 優(yōu)先權(quán)日2001年5月7日
發(fā)明者A·伊瑞爾, A·克萊恩斯坦恩, A 伊瑞爾, 扯魎固茍 申請(qǐng)人:英特爾公司