欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基音滯后估計的制作方法

文檔序號:2830576閱讀:386來源:國知局
專利名稱:基音滯后估計的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及音頻信號中的基音(pitch)滯后估計
背景技術(shù)
基音是語音信號的基本頻率。它是語音編碼和處理中的關(guān)鍵參 數(shù)之一。利用基音檢測的應(yīng)用包括語音增強、自動語音識別和理 解、韻律分析和建模、以及語音編碼,特別是低比特率語音編碼。 基音檢測的可靠性常常是整個系統(tǒng)輸出質(zhì)量的決定性因素。
通常,語音編解碼器處理10-30 ms片段中的語音。這些片段稱 為幀。出于不同目的,幀通常劃分為具有5-10ms長度的片段,稱為 子幀。
基音直接與基音滯后相關(guān),其中基音滯后是信號在基本頻率處 的周期持續(xù)時間?;魷罄缈梢酝ㄟ^對音頻信號片段應(yīng)用自相 關(guān)計算來確定。在這些自相關(guān)計算中,將原始音頻信號片段的采樣 乘以相同音頻信號片段的已校準采樣,其中所述已校準采樣已經(jīng)延 遲了相應(yīng)的量。利用特定延遲的乘積的和是相關(guān)值。最高相關(guān)值由 延遲得到,其對應(yīng)于基音滯后?;魷笠卜Q為基音延遲。
在確定最高相關(guān)值之前,可以對相關(guān)值進行預處理,以提高結(jié) 果的精度。還可以將所考慮的延遲的范圍劃分為區(qū)段(section),并
值。自相關(guān)計算在區(qū)段之間可以有所不同,例如在所考慮采樣的數(shù) 目方面。此外,在確定最高相關(guān)值之前應(yīng)用于相關(guān)值的預處理中, 可以利用區(qū)段化。
基音軌跡是針對音頻信號的片段序列而確定的基音滯后的序列。
所采用的音頻處理系統(tǒng)的框架為基音檢測設(shè)定了要求。特別是對于對話式語音編碼方案,復雜性和延遲要求常常相當嚴格。而且, 基音估計的精度和基音軌跡的穩(wěn)定性在很多音頻處理系統(tǒng)中是重要問題。
準確的基音估計是一項困難的任務(wù)。盡管低復雜性的基音檢測 可能能夠提供總體上非??煽康幕艄烙?,但是其常常無法維持穩(wěn) 定的基音軌跡??梢岳脧碗s的方法來實現(xiàn)非常有效的基音估計, 但是這些方法常常產(chǎn)生在所使用的框架中不是十分優(yōu)化的基音軌跡 和/或為對話應(yīng)用引入過大的延遲。

發(fā)明內(nèi)容
本發(fā)明適于增強傳統(tǒng)的基音估計方法。
提出了一種方法,包括確定音頻信號片段的第一自相關(guān)值。將 第 一所考慮延遲范圍劃分為第 一組區(qū)段,并且針對該第 一組區(qū)段的 多個區(qū)段中的延遲來確定所述第一自相關(guān)值。該方法還包括確定音 頻信號片段的第二自相關(guān)值。將第二所考慮延遲范圍劃分為第二組 區(qū)段,使得第一組區(qū)段和第二組區(qū)段重疊。針對該第二組區(qū)段的多 個區(qū)段中的延遲來確定第二自相關(guān)值。該方法還包括提供所確定的 第 一 自相關(guān)值和所確定的第二自相關(guān)值,以用于音頻信號片段中的 基音滯后估計。
提出了一種裝置,包括相關(guān)器。該相關(guān)器配置用于確定音頻信 號片段的第一自相關(guān)值,其中第一所考慮延遲范圍被劃分為第一組 區(qū)段,所述第 一 自相關(guān)值是針對該第 一組區(qū)段的多個區(qū)段中的延遲 而確定的。該相關(guān)器還配置用于確定該音頻信號片段的第二自相關(guān) 值,其中第二所考慮延遲范圍被劃分為第二組區(qū)段,使得第一組區(qū) 段和第二組區(qū)段重疊,所述第二自相關(guān)值是針對該第二組區(qū)段的多 個區(qū)段中的延遲而確定的。該相關(guān)器還配置用于提供所確定的第一 自相關(guān)值和所確定的第二自相關(guān)值,以用于音頻信號片段中的基音 滯后估計。
該裝置例如可以是基音分析器,比如開環(huán)基音分析器、音頻編碼器或者包括音頻編碼器的實體。
注意,該裝置的相關(guān)器以及可選的其他組件可以通過硬件和/或 軟件來實現(xiàn)。如果通過硬件實現(xiàn),該裝置例如可以是芯片或者芯片 組,比如集成電路。如果通過軟件實現(xiàn),組件可以是計算機程序代 碼的模塊。在這種情況下,該裝置例如也可以是存儲計算機程序代 碼的存儲器。
而且,提出了一種設(shè)備,其包括所提出的裝置以及音頻輸入組件。
該設(shè)備例如可以是無線通信網(wǎng)絡(luò)的無線終端或者基站,但是同 樣可以是執(zhí)行需要基音估計的音頻處理的任何其他設(shè)備。該設(shè)備的 音頻輸入組件例如可以是麥克風或者與提供音頻數(shù)據(jù)的其他設(shè)備的 接口 。
而且,提出了一種系統(tǒng),其包括包含所提出裝置的音頻編碼 器以及音頻解碼器。
最后,提出了一種計算機程序產(chǎn)品,其中計算機代碼存儲在計 算機可讀介質(zhì)中。當該計算機代碼由處理器執(zhí)行時,其實現(xiàn)所提出 的方法。
該計算機程序產(chǎn)品例如可以是獨立的存儲器設(shè)備,或者集成在 電子設(shè)備中的存儲器。
應(yīng)當將本發(fā)明理解為還包括獨立于計算機程序產(chǎn)品和計算機可 讀介質(zhì)的計算機程序代碼。
本發(fā)明從以下考慮出發(fā)將針對應(yīng)用于音頻信號片段的自相關(guān) 計算而考慮的延遲范圍劃分為區(qū)段,盡管這樣做可能有利于基音估 計,但也引起了區(qū)段之間邊界處的不連續(xù)。因此提出并行地提供 延遲的兩組區(qū)段,并且針對這兩組的區(qū)段中的延遲來確定自相關(guān)值。 如果 一 組的區(qū)段與另 一 組的區(qū)段重疊,則 一 組中區(qū)段之間的不連續(xù) 區(qū)域總是由另 一組中的區(qū)段覆蓋。
因此,可以實現(xiàn)改進的基音估計精度和改進的基音軌跡穩(wěn)定性。 改進的基音估計性能還提高了采用基音估計的總體處理的輸出質(zhì)量。
本發(fā)明可以在各種基音估計方法的范圍內(nèi)使用。與采用沒有重 疊特性的類似區(qū)段化的已有基音估計方法相比,必須確定更多的相 關(guān)值,盡管如此,但是由于區(qū)段的重疊特性,因此很多計算可以重 用,從而可以將復雜性的增加保持在最小。
本發(fā)明例如還可以用于新的音頻編解碼器或者用于對現(xiàn)有音頻
編解碼器(例如,傳統(tǒng)的碼激勵線性預測(CELP)編解碼器)的增 強。在CELP語音編碼器中,通常在兩步中執(zhí)行基音估計,即開環(huán) 分析,用以發(fā)現(xiàn)正確的基音區(qū)域;以及閉環(huán)分析,用以圍繞開環(huán)估 計選擇最佳自適應(yīng)碼本索引。本發(fā)明例如適于提供對這種CELP語 音編碼器的開環(huán)分析的增強。
在示例性實施方式中,音頻信號劃分為幀的序列,并且每個幀 進一步劃分為前半幀和后半幀。繼而,前半幀可以是音頻信號的第 一片段,針對其來確定第一和第二自相關(guān)值,而后半幀可以是音頻 信號的第二片段,針對其來確定第一和第二自相關(guān)值。此外,后續(xù)
幀的前半幀可以是音頻信號的第三片段,針對其來確定第 一和第二 自相關(guān)值。后續(xù)幀的后半幀作為當前幀的超前(lookahead)幀。
第一組區(qū)段和第二組區(qū)段可以包括任意適當數(shù)目的區(qū)段。兩組 中的區(qū)段數(shù)目可以相同或者不同。此外,兩組所覆蓋的延遲范圍可 以相同或者略有不同。而且,自相關(guān)值可以針對每組區(qū)革殳來確定, 或者僅針對一組的某些區(qū)段來確定。在一些情況下,例如,與具有 最低延遲的區(qū)段相對應(yīng)的非常高的基本頻率對于系統(tǒng)質(zhì)量而言可能 并不重要。在示例性實施方式中,兩組都包括四個區(qū)段,并且針對 每組區(qū)段的至少三個區(qū)段中的延遲來確定自相關(guān)值。
在示例性實施方式中,從所提供的自相關(guān)值中選擇每組的每個 區(qū)段中的最強自相關(guān)值。繼而可以將相關(guān)聯(lián)的延遲視為選定的基音 滯后候選。
在每組區(qū)段的每個區(qū)段中選擇最強自相關(guān)值之前,可以基于針 對在前幀而估計的基音滯后來加強自相關(guān)值。
10在從每組區(qū)段的每個區(qū)段中選擇最強自相關(guān)值之后,可以基于 對相應(yīng)區(qū)段組中基音滯后的倍數(shù)的檢測來加強選定的自相關(guān)值???以將延遲范圍劃分為區(qū)段,使得區(qū)段不包含基音滯后倍數(shù)。換言之, 區(qū)段中的最大延遲小于該區(qū)段中最小延遲的兩倍。這保證了僅需從 一個區(qū)段到下 一 區(qū)段來搜索基音滯后倍數(shù)。
在從每組區(qū)段的每個區(qū)段中選擇最強自相關(guān)值之后,并且可選 地在對選定的自相關(guān)值進行某些進一步處理之前或者之后,可以對 跨越音頻信號的片段而穩(wěn)定的選定自相關(guān)值進行加強。針對穩(wěn)定性 而考慮的片段可以是兩個連續(xù)的片段,但是同樣可以是在其間具有 一個或多個其他片段的兩個片段。穩(wěn)定性例如可以跨越幀中的片段 和超前幀來考慮。與在跨越音頻信號片段的不同區(qū)段中穩(wěn)定的自相 關(guān)值相比,可以將在跨越音頻信號片段的相同區(qū)段中穩(wěn)定的自相關(guān) 值加強得更強。
這種針對區(qū)段的穩(wěn)定性加強提高了輸出的穩(wěn)定性,而沒有為軌 跡引入不正確的基音滯后候選。
跨越區(qū)段的穩(wěn)定性例如可以通過如下確定確定兩個片段中的 自相關(guān)值的相應(yīng)配對之間的一致性。換言之,如果彼此之間的值的 差異小于預定量,則可以假設(shè)穩(wěn)定。
的采樣而確定的,以下這樣可能是適當?shù)脑趫?zhí)行分別與不同的區(qū) 段或者延遲相關(guān)聯(lián)的自相關(guān)的任何比較之前,最后對值進行規(guī)范化。 應(yīng)當理解,所有給出實施方式的特征和步驟可以按照任何適當 的方式來組合。
還應(yīng)注意,針對區(qū)段的加強的方面也可以獨立于對用于自相關(guān) 計算的兩組區(qū)段的使用而實現(xiàn)。
這可以通過一種方法來實現(xiàn),該方法包括確定音頻信號片段 的自相關(guān)值,其中所考慮的延遲范圍被劃分為區(qū)段,所述自相關(guān)值 是針對這些區(qū)段的多個區(qū)段中的延遲而確定的;在每個區(qū)段中,從 得到的自相關(guān)值中選擇最強的自相關(guān)值;對在跨越音頻信號片段而穩(wěn)定的選定自相關(guān)值進行加強,其中與在跨越音頻信號區(qū)段的不同 分區(qū)中穩(wěn)定的自相關(guān)值相比,將在跨越音頻信號片段的相同區(qū)段中 穩(wěn)定的自相關(guān)值加強的更強;以及提供得到的自相關(guān)值,以用于音 頻信號片段中的基音滯后估計。
一種相應(yīng)的計算機程序產(chǎn)品,可以存儲計算機代碼,當該代碼 由處理器執(zhí)行時,其實現(xiàn)該方法。
一種相應(yīng)的裝置、設(shè)備和系統(tǒng),
可以包括配置用于執(zhí)行這種自相關(guān)計算機的相關(guān)器,或者用于執(zhí) 行這種自相關(guān)計算機的裝置;配置用于執(zhí)行這種選擇的選擇組件, 或者用于執(zhí)行這種選擇的裝置;以及配置用于執(zhí)行這種加強以及提 供得到的自相關(guān)值的加強組件,或者用于執(zhí)行這種加強以及提供得 到的自相關(guān)值的裝置。
通過結(jié)合附圖來考慮下文的詳細描述,本發(fā)明的其他目的和特 征將變得易見。然而,應(yīng)當理解,設(shè)計附圖僅僅是為了示范目的, 而并非作為對本發(fā)明限制的限定,本發(fā)明的限定應(yīng)當參考所附權(quán)利 要求書。還應(yīng)當理解,附圖不是按比例繪制的,其僅僅意在從概念 上示出在此描述的結(jié)構(gòu)和過程。


圖1是根據(jù)本發(fā)明示例性實施方式的系統(tǒng)的示意性框圖2是示出圖1系統(tǒng)中的示例性編碼器的示意性框圖3是示出圖2中編碼器的操作的流程圖4是示出圖2的編碼器所使用的重疊區(qū)段以及針對區(qū)段的基 音滯后選擇的圖示;
圖5是表示標準VMR-WB基音估計與利用本發(fā)明實施方式的基 音估計之間的性能對比的圖示;以及
圖6是根據(jù)本發(fā)明示例性實施方式的設(shè)備的示意性框圖。
具體實施例方式
盡管本發(fā)明可以通過各種框架來使用,但是將以示例的形式給出本發(fā)明的第一實施方式,該示例作為對以下中定義的語音編碼的
增強3GPP2標準C.S0052-0,版本1.0: "Source-Controlled Variable-Rate Multimode Wideband Speech Codec (VMR畫WB), Service Option 62 for Spread Spectrum Systems" , 2004年6月11日。以全
速率或者半速率幀按照此標準使用的編碼技術(shù)是關(guān)于代數(shù)CELP (ACELP)編碼建模的。
圖1是一個系統(tǒng)的示意性框圖,該系統(tǒng)支持按照本發(fā)明第一實 施方式的增強基音跟蹤。在本文件的上下文中,基音跟蹤主要表示 基音檢測方法,其通過結(jié)合音頻信號的后續(xù)片段上的暫時基音信息 來提供更為可靠的基音估計。然而,為了有助于某些編碼方法以及 避免贗像(artifact),還期望對基音估計進行選擇,其在發(fā)聲語音 期間得到穩(wěn)定的總體基音軌跡。
該系統(tǒng)包括第一電子設(shè)備IIO和第二電子設(shè)備120。設(shè)備110、 120中的一個例如可以是無線終端,而另一個設(shè)備120、 110例如可 以是該無線終端可以通過空中接口訪問的無線通信網(wǎng)絡(luò)的基站。這 種無線通信網(wǎng)絡(luò)例如可以是移動通信網(wǎng)絡(luò),但是同樣可以是無線局 域網(wǎng)(WLAN)等。相應(yīng)地,這種無線終端例如可以是移動終端, 但是同樣可以是適于訪問WLAN等的任何設(shè)備。
第一電子設(shè)備110包括音頻數(shù)據(jù)源111,其經(jīng)由編碼器112鏈接 至發(fā)射部件(TX) 114。應(yīng)當理解,所示的連接可以通過各種其他未 示出的元件來實現(xiàn)。
如果第一電子設(shè)備IIO是無線終端,則音頻數(shù)據(jù)源lll例如可 以是麥克風,其允許用戶輸入模擬音頻信號。在這種情況下,音頻 數(shù)據(jù)源111可以經(jīng)由包括模數(shù)轉(zhuǎn)換器的處理組件鏈接至編碼器112。 如果第一電子設(shè)備110是基站,則音頻數(shù)據(jù)源111例如可以是與提 供數(shù)字音頻信號的、無線通信網(wǎng)絡(luò)的其他網(wǎng)絡(luò)組件的接口。在這兩 種情況下,音頻數(shù)據(jù)源111也可以是存儲數(shù)字音頻信號的存儲器。
編碼器112可以是電路,其實現(xiàn)在集成電路(IC) 113中。可以 在相同的集成電路113中實現(xiàn)其他組件,例如解碼器、模數(shù)轉(zhuǎn)換器或者數(shù)模轉(zhuǎn)換器。
第二電子設(shè)備120包括接收組件(RX) 121,其經(jīng)由解碼器122 鏈接至音頻數(shù)據(jù)宿(data sink) 123。應(yīng)當理解,所示連接可以通過 各種其他未示出的元件來實現(xiàn)。
如果第二電子設(shè)備120是無線終端,則音頻數(shù)據(jù)宿123例如可 以是輸出模擬音頻信號的揚聲器。在這種情況下,解碼器122可以 經(jīng)由包括數(shù)模轉(zhuǎn)換器的處理組件鏈接至音頻數(shù)據(jù)宿123 。如果第二電 子設(shè)備120是基站,則音頻數(shù)據(jù)宿123例如可以是與數(shù)字音頻信號 將要轉(zhuǎn)發(fā)至的無線通信網(wǎng)絡(luò)的其他網(wǎng)絡(luò)組件的接口 。在這兩種情況 下,音頻數(shù)據(jù)宿123也可以是存儲數(shù)字音頻信號的存儲器。
圖2是表示第一電子設(shè)備110的編碼器112的細節(jié)的示意性框圖。
編碼器112包括第一塊210,其概括了未在本文件中詳細考慮的
各種組件。
第一塊210鏈接至根據(jù)本發(fā)明實施方式而配置的開環(huán)基音分析 器220。開環(huán)基音分析器220包括相關(guān)器221、加強和選擇組件222、 加強組件223和基音滯后選擇器224。
開環(huán)基音分析器220還鏈接至其他塊230,該其他塊230同樣概 括了未在本文件中詳細考慮的各種組件。
第一塊210的組件還直接連接至其他塊230的組件。
編碼器112、集成電路113或者開環(huán)基音分析器220可以視作按 照本發(fā)明的示例性裝置,而第一電子設(shè)備IIO可以視作按照本發(fā)明 的示例性設(shè)備。
現(xiàn)在將參考圖3來描述圖1系統(tǒng)的操作。圖3是示出了第一電 子設(shè)備110的編碼器112的開環(huán)基音分析器220中操作的流程圖。
當充當?shù)谝浑娮釉O(shè)備110的基站通過充當音頻數(shù)據(jù)源111的接 口從無線通信網(wǎng)絡(luò)接收數(shù)字音頻信號以便發(fā)射給充當?shù)诙娮釉O(shè)備 120的無線終端時,其將數(shù)字音頻信號提供給編碼器112。類似地, 當充當?shù)谝浑娮釉O(shè)備110的無線終端經(jīng)由充當音頻數(shù)據(jù)源111的麥
14克風接收到音頻輸入以便發(fā)射給服務(wù)提供者或者充當?shù)诙娮釉O(shè)備 120的其他無線終端時,其將模擬音頻信號轉(zhuǎn)換為數(shù)字音頻信號,并
且將數(shù)字音頻信號提供給編碼器112。
第一塊210的組件負責對接收的數(shù)字音頻信號的預處理,包括 采樣轉(zhuǎn)換、高通濾波以及頻譜預加重。第一塊210的組件還執(zhí)行頻 譜分析,其每幀兩次地提供每個關(guān)鍵頻帶的能量。而且,其執(zhí)行語 音活躍檢測(VAD),降噪以及LP分析,其中LP分析得到LP合 成濾波器系數(shù)。此外,對通過根據(jù)LP合成濾波器系數(shù)得出的感知加 權(quán)濾波器的數(shù)字音頻信號進行濾波,從而執(zhí)行感知加權(quán),以便得到 經(jīng)過加權(quán)的語音信號。這些處理步驟的細節(jié)可以在上文提到的標準 C.S0052-0中找到。
第一塊210將經(jīng)過加權(quán)的語音信號以及其他信息提供給開環(huán)基 音分析器220。
開環(huán)基音分析器220 二取一地對經(jīng)過加權(quán)的信號執(zhí)行開環(huán)基音 分析(步驟301-310)。在此開環(huán)基音分析中,開環(huán)基音分析器220 針對每個幀計算基音滯后的三個估計,當前幀的每半幀中一個,下 一幀的前半幀中一個,其中下一幀用作超前幀。三個半幀對應(yīng)于所
按照標準C.S0052-0,基音延遲范圍(2取1)分為四個區(qū)段[IO, 16]、 [17,31]、 [32, 61]以及[62, 115],并且至少針對后三個區(qū)段中的 延遲,針對三個半幀中的每一個確定相關(guān)值。
相反,對于給出的實施方式的開環(huán)基音分析,將基音延遲兩次 劃分為四個重疊的區(qū)段。以此方式, 一組中的區(qū)段之間的不連續(xù)區(qū) 域總是由其他組中的區(qū)段覆蓋。第 一組區(qū)段例如可以包括與標準 C.S0052-0中定義的相同的區(qū)段,即[10,16]、 [17,31]、 [32,61〗以及 [62,115]。第二組區(qū)段例如可以包括區(qū)段[12,21]、 [22,40]、 [41,77] 以及[78,115]。應(yīng)當理解,兩組也可以基于不同的分割。
圖4中輸出了對基音延遲范圍的雙重區(qū)段化。用于前半幀的區(qū) 段化在左側(cè)給出,用于后半幀的區(qū)段化在中間給出,而用于超前幀的區(qū)段化在右側(cè)給出。相同的區(qū)段化用于三個半幀中的每一個。
對于每個半幀,通過布置在彼此頂部的四個矩形來表示四個區(qū)
段的第一組S1-1、 S2-l、 S3-l (基于標準C.S0052-0)。對于每個半 幀,通過布置在彼此頂部的四個矩形來表示四個區(qū)段的第二組Sl-2、 S2-2、 S3-2。為了示范目的,相應(yīng)的第二組Sl-2、 S2-2、 S3-2與相 應(yīng)的第一組S1-1、 S2-l、 S3-l相比略微向右偏移。區(qū)段所覆蓋的延 遲從下到上增加??梢钥吹剑鄳?yīng)的第一組S1-1、 S2-l、 S3-l和相 應(yīng)的第二組Sl-2、 S2-2、 S3-2中的區(qū)段具有不同的邊界,并且區(qū)段 因此重疊。
在標準C.S0052-0中,選擇區(qū)段以便使其不包括基音滯后倍數(shù)。 如果針對所給出實施方式的兩組區(qū)段都遵循在任何區(qū)段中不允許潛 在基音滯后倍數(shù)這一原則,則一個組中的區(qū)段將無法覆蓋基音延遲 的所有候選值。更具體地,在一個組中,具有最短延遲的區(qū)段將不 覆蓋如下這些延遲,該延遲對應(yīng)于允許估計器搜索的最高基音頻率。 例如,在上面給出的示例性第二組中,第一區(qū)段沒有覆蓋10個和11 個采樣的最小延遲。然而,測試已經(jīng)表明,該人為限制并不影響系 統(tǒng)的性能。而且,還可以通過如下來克服該限制向第二組區(qū)段添 加一個區(qū)段,以便也覆蓋最高基音頻率。然而,在標準C.S0052-0 或者任何類似方法的情況下,第二組區(qū)段中的額外區(qū)段需要使其延 遲范圍適應(yīng)最短延遲區(qū)段的使用決策。
在開環(huán)基音分析器220中,相關(guān)器接收經(jīng)過加權(quán)的信號釆樣, 并且對幀的兩個半幀的每個以及超前幀分別應(yīng)用自相關(guān)計算。換言 之,每個半幀的采樣乘以相同輸入信號的延遲采樣,并將得到的乘 積相加,以獲得相關(guān)值。延遲采樣例如可以來自相同的半幀,來自 前一半幀,或者甚至這之前的半幀,或者來自這些的組合。此外, 相關(guān)范圍還可以考慮隨后半幀中的某些采樣。
一方面,對于每個半幀,從區(qū)段的第一組S1-1、 S2-l、 S3-l的 第二、第三和第四區(qū)段選擇用于自相關(guān)計算的延遲(步驟301)。
另一方面,對于每個半幀,從區(qū)段的第二組Sl-2、 S2-2、 S3-2的第二、第三和第四區(qū)段選擇用于自相關(guān)計算的延遲(步驟302 )。 在特定的環(huán)境下,還可以考慮每組的第一區(qū)段。
例如可以按照標準C.S0052-0中提供的公式來針對每組區(qū)段計 算相關(guān)值。這里,通過以下公式,針對相應(yīng)區(qū)段中的每個延遲來計 算相關(guān)值
其中爻/")是加權(quán)的、抽取的語音信號,其中d是區(qū)段中的不同延遲,
其中C(^是延遲d處的相關(guān),并且其中丄,ec是求和極限,其取決于延 遲所屬的區(qū)段。
由于相關(guān)值是在兩組區(qū)段中確定的,得到的相關(guān)值cr力的總數(shù)
幾乎是按照標準C.S0052-0得到的相關(guān)值CY《的數(shù)量的兩倍。
接下來,加強和選擇組件222對每個半幀的每組區(qū)段的相關(guān)值 執(zhí)行第一加強。在此第一加強中,對相關(guān)值進行加權(quán),以強調(diào)與針 對在前幀而確定的音頻滯后的鄰域內(nèi)的延遲相對應(yīng)的相關(guān)值(步驟 303 )。接下來,針對每組的每個區(qū)段,選擇已加權(quán)的相關(guān)值的最大 值,并且將相關(guān)聯(lián)的延遲標識為基音延遲候選。而且,對選定的相 關(guān)值進行規(guī)范化,以補償在針對不同區(qū)段的自相關(guān)計算中所使用的 不同求和極限丄^。針對一組區(qū)段的加權(quán)、選擇以及規(guī)范化的示例性 細節(jié)可以從標準C.S0052-0獲得。
其余處理僅使用經(jīng)過規(guī)范化的相關(guān)值來執(zhí)行。
在圖4中,18個選定的相關(guān)值通過圓點(黑色和白色)在示例 性的關(guān)聯(lián)延遲位置示出,其中每個半幀的兩組區(qū)段中的第二、第三 和第四區(qū)段的每一個都具有一個相關(guān)值。
例如對于前半幀的第一組,針對第二區(qū)段保留相關(guān)值C1-1-2, 針對第三區(qū)段保留相關(guān)值Cl-l-3,并且針對第四區(qū)段保留相關(guān)值 Cl-l-4。對于前半幀的第二組,針對第二區(qū)段保留相關(guān)值C1-2-2, 針對第三區(qū)段保留相關(guān)值C1 -2-3,并且針對第四區(qū)段保留相關(guān)值 Cl-2-4,等。
選定的相關(guān)值的數(shù)目是按照標準C.S0052-0在此階段保留的相
17關(guān)值數(shù)目的兩倍。
而且,加強和選擇組件222對每個半幀的每組的相關(guān)值執(zhí)行第
二加強,以避免選擇基音滯后的倍數(shù)(步驟304)。在此第二加強中,
區(qū)段的較高區(qū)段中的選定相關(guān)值相關(guān)聯(lián)的延遲的鄰域內(nèi),則進一步 強調(diào)所述與較低區(qū)段中的延遲相關(guān)聯(lián)的選定相關(guān)值。針對一組區(qū)段 的這種加強的示例性細節(jié)可以從標準C.S0052-0獲得。
加強組件223對相關(guān)值執(zhí)行第三加強,其不同于標準C.S0052-0 中所定義的第三加強。
標準C.S0052-0定義如果一個半幀中的相關(guān)值具有另 一半幀的 任何區(qū)段中的一致相關(guān)值,則對其進一步加重。
如果滿足以下條件,則認為兩個半幀的相關(guān)值是一致的
其中max—vfl/we和w/"—va/we分別表示兩個相關(guān)值的最大值和最小值。
這種方法帶來的問題是當最佳軌跡跨越區(qū)段邊界時,將潛在 地選擇當前幀的次佳軌跡。由于跨越可能導致軌跡之一的不連續(xù), 錯誤的相關(guān)值可能得到加強并由此被選擇。
相反,圖2的加強組件223針對區(qū)段來加重所選的相關(guān)值,以 便加強產(chǎn)生當前幀的最穩(wěn)定基音軌跡的基音延遲候選。
如果一個半幀的區(qū)段中所考慮的相關(guān)值與另 一半幀中的相同組 的最大相關(guān)值是一致的,并且該最大相關(guān)值與所考慮的相關(guān)值屬于 相同的區(qū)段,則著重加重所考慮的相關(guān)值(步驟305、 306 )。如果 一個半幀的區(qū)段中所考慮的相關(guān)值與另一半幀中的相同組的最大相 關(guān)值是一致的,并且該最大相關(guān)值與所考慮的相關(guān)值屬于不同區(qū)段, 或考慮的相關(guān)值與另 一半幀中另 一組最大相關(guān)值 一致,則僅僅較弱 地加重所考慮的相關(guān)值(步驟305、 307、 308 )。與另一半幀的相同 組或者另一組中的最大相關(guān)值不一致的候選沒有被進行加強(步驟 305、 307、 309)。由此,針對區(qū)段的穩(wěn)定性測量對與每個半幀的最佳候選位于相 同區(qū)段的那些相鄰候選應(yīng)用了更多加強,而對那些不同區(qū)段中的候 選應(yīng)用較為適度的加強。這樣,顯示出對最佳候選的穩(wěn)定性的所有 相鄰候選得到了用于最終選擇的正權(quán)重,而這確保了與可能不正確 的候選相比,對那些期望是正確的候選給予了更多權(quán)重。
圖4中的圓點表示所有選擇的相關(guān)值,同時白色的圓點標記在 第三加強之后每個半幀的每組中的最高相關(guān)值。在前半幀中,例如
對于第一組Sl-l是相關(guān)值Cl-l-2,而對于第二組S2-l是相關(guān)值 Cl畫2-2。
如果沒有針對區(qū)段的穩(wěn)定性的方案,在某些情況下,最高相關(guān) 值可能是與按照穩(wěn)定基音軌跡的次優(yōu)延遲相關(guān)聯(lián)的相關(guān)值,例如超 前幀的第一組S3-l中的相關(guān)值C3-l-2。相反,在使用針對區(qū)段的穩(wěn) 定性方案時,更有可能選擇與超前幀的第一組S3-l中的相關(guān)值 C3-l-3相關(guān)聯(lián)的最優(yōu)基音滯后。
最后,對于每個半幀,基音滯后選擇器224從兩組區(qū)段中的所 有區(qū)段中選擇最優(yōu)相關(guān)值(步驟310)。基音滯后選擇器224提供三 個延遲作為對第二塊230的最終基音滯后,這三個延遲與三個最終 相關(guān)值相關(guān)聯(lián)。這三個最終基音滯后形成當前幀的基音軌跡。
第二塊230的組件執(zhí)行噪聲消除,并將相應(yīng)的反饋提供給第一 塊210。此外,其應(yīng)用信號修改,其對原始信號進行修改以使得編碼 對于語音編類型而言較為容易,并且其包含用于對適合于半速率語 音編碼的那些幀進行分類的固有分類器。第二塊230的組件還執(zhí)行
確定其他編碼技術(shù)的速率選擇。而且,其使用適當?shù)木幋a技術(shù)在子 幀回路中處理活躍語音。該處理包括閉環(huán)基音分析,其從上文描述
的開環(huán)基音分析中確定的基音滯后進行。第二塊230的組建還負責 舒適噪聲生成。將語音編碼和舒適噪聲生成的結(jié)果作為編碼器112 的輸出比特流來提供。
該輸出比特流可以由發(fā)射組件114經(jīng)由空中接口發(fā)射至第二電 子設(shè)備120。第二電子設(shè)備120的接收組件121接收比特流,并將其提供給解碼器122。解碼器122對比特流進行解碼,并將得到的解碼 音頻信號提供給音頻數(shù)據(jù)宿i23,以便呈現(xiàn)、傳輸或者存儲。
與標準C.S0052-0的方法相比,在所給出的本發(fā)明實施方式中, 在相關(guān)計算中使用重疊區(qū)段以及使用針對區(qū)段的穩(wěn)定性計算,使得 某些有問題的語音片段中的基音軌跡的精度和穩(wěn)定性得到改進。繼 而,這適于提高輸出語音質(zhì)量。
圖5給出了不具有和具有所提出修改的標準C.S0052-0的 VMR-WB基音估計之間的對比。
圖5頂部的第一圖示示出了 5幀的示例性輸入語音信號。圖5 中間的第二圖示示出了在將標準C.S0052-0的VMR-WB基音估計應(yīng) 用于所描述的輸入語音信號時得到的基音滯后的軌跡。多數(shù)時間下, VMR-WB基音估計具有非常好的性能。然而,在某些情況下, VMR-WB可能不穩(wěn)定,例如在幀2的后半幀和幀3的前半幀。圖5 底部的第三圖示示出了在將上面給出的經(jīng)過修改的VMR-WB基音 估計應(yīng)用于所描述的輸入語音信號時得到的基音滯后的軌跡。可以 看出,在標準C.S0052-0的VMR-WB基音估計失效的多數(shù)情況下, 經(jīng)修改的VMR-WB基音估計也適于提供可靠的和穩(wěn)定的基音軌跡。
當結(jié)合不同于標準C.S0052-0的基音估計的某些其他類型的基 音估計來使用本發(fā)明時,可以期待類似的效果。
相關(guān)器211所示的功能也可以視作用于確定音頻信號片段的第 一自相關(guān)值的裝置,其中第 一所考慮的延遲范圍被劃分為第 一組區(qū) 段,針對該第 一組區(qū)段的多個區(qū)段中的延遲來確定第 一 自相關(guān)值。 相關(guān)器221所示的功能同樣可以視作用于確定音頻信號片段的第二 自相關(guān)值的裝置,其中第二所考慮延遲范圍被劃分為第二組區(qū)段, 使得第 一組區(qū)段和第二組區(qū)段重疊,針對該第二組區(qū)段的多個區(qū)段 中的延遲來確定第二自相關(guān)值。相關(guān)器221所示的功能還可以視作 用于提供所確定的第 一 自相關(guān)值和所確定的第二自相關(guān)值以便估計 音頻信號片段中的基音滯后的裝置。
加強和選擇組件222所示的功能也可以視作用于在每組區(qū)段的每個區(qū)段中從所提供的自相關(guān)值中選擇最強的自相關(guān)值。
加強組件223所示的功能也可以視作用于對跨越音頻信號的片 段而穩(wěn)定的所選自相關(guān)值進行加強的裝置,其中與跨越在音頻信號 片段的不同區(qū)段中穩(wěn)定的自相關(guān)值相比,將在跨越音頻信號片段的 相同區(qū)段中穩(wěn)定的自相關(guān)值加強得更強。
圖6是按照本發(fā)明另一實施方式的設(shè)備600的示意性框圖。設(shè) 備600例如可以是移動電話。其包括麥克風611,其經(jīng)由模數(shù)轉(zhuǎn)換器 (ADC) 612鏈接至處理器631。處理器631進一步經(jīng)由數(shù)模轉(zhuǎn)換器 (DAC )621鏈接至揚聲器622。處理器631還鏈接至收發(fā)機(RX/TX ) 632和存儲器633。應(yīng)當理解,所示連接可以通過各種其他未示出的 元件來實現(xiàn)。
處理器631配置用于執(zhí)行計算機程序代碼。存儲器633包括用 于計算機程序代碼的部分634和用于數(shù)據(jù)的部分。所存儲的計算機 程序代碼包括編碼代碼和解碼代碼。處理器631可以在需要時從存 儲器633取回例如計算機程序代碼以便執(zhí)行。應(yīng)當理解,同樣可以 執(zhí)行各種其他計算機程序代碼,例如操作程序代碼和用于各種應(yīng)用 的程序代碼。
存儲的編碼計算機程序代碼或者與存儲器633相結(jié)合的處理器 631可以視作按照本發(fā)明的示例性裝置。存儲器633也可以視作按照 本發(fā)明的示例性時計算機程序產(chǎn)品。
當用戶選擇移動電話600的功能時(該功能需要對音頻輸入的 編碼),提供該功能的應(yīng)用使處理器631從存儲器633取回編碼代 碼。
當用戶現(xiàn)在經(jīng)由麥克風611輸入例如語音的模擬音頻信號時, 該模擬音頻信號由模數(shù)轉(zhuǎn)換器612轉(zhuǎn)換為數(shù)字語音信號,并且被提 供給處理器631。處理器631執(zhí)行取回的編碼軟件,以便對數(shù)字語音 信號進行編碼。經(jīng)過編碼的語音信號或者存儲在存儲器633的數(shù)據(jù) 存儲部分635中以備后用,或者由收發(fā)機632發(fā)射給移動通信網(wǎng)絡(luò) 的基站。再次,編碼可以給予具有與參考上文第一實施方式而描述的類
似修改的標準C.S0052-0的VMR-WB編解碼器。在這種情況下,上 文參考圖3描述的處理僅有所執(zhí)行的計算機程序代碼來執(zhí)行,而不 由電路執(zhí)行。備選地,編碼可以基于某些其他編碼方法,該方法通 過使用基于至少兩組重疊區(qū)段和/或針對區(qū)段的加強而得以增強。
處理器631還可以從存儲器633取回解碼軟件,并執(zhí)行它以便 對經(jīng)由收發(fā)機632接收到的、或者從存儲器633的數(shù)據(jù)存儲部分635 取回的經(jīng)過編碼的語音信號進行解碼。經(jīng)過解碼的數(shù)字語音信號繼 而由數(shù)模轉(zhuǎn)換器621轉(zhuǎn)換為模擬音頻信號,并且經(jīng)由揚聲器622呈 現(xiàn)給用戶。備選地,經(jīng)過解碼的數(shù)字語音信號可以存儲在存儲器633 的數(shù)據(jù)存儲部分635中。
總體上,所給出的實施方式中的重疊區(qū)段確保了最佳軌跡總是 包括在 一 個區(qū)段中,并且所給出的實施方式中的針對區(qū)段的穩(wěn)定性 加強繼而相應(yīng)地偏向這些4九跡。
盡管已經(jīng)示出、描述和指出了本發(fā)明應(yīng)用于其優(yōu)選實施方式的 基本的新穎特征,但是將會理解,在不脫離本發(fā)明精神的情況下, 本領(lǐng)域的技術(shù)人員可以在形式上和細節(jié)上對所描述的設(shè)備和方法進 行各種省略、替換和改變。例如,顯然的意圖是,以基本上相同的 方式執(zhí)行基本上相同的功能以實現(xiàn)相同結(jié)果的、這些元件和/或方法 步驟的所有組合都屬于本發(fā)明的范圍。而且,應(yīng)當認識到,結(jié)合本 發(fā)明的任何所公開形式或者實施方式而示出和/或描述的結(jié)構(gòu)和/或 元件和/或方法步驟可以作為一般性內(nèi)容并入任何其他所公開或者描 述或者建議的形式或者實施方式。因此,本發(fā)明僅受到所附權(quán)利要 求書的范圍所指示的限制。此外,在權(quán)利要求書中,裝置加功能的 條款意在將在此描述的結(jié)構(gòu)涵蓋為執(zhí)行所記載的功能,并且不僅是 結(jié)構(gòu)性等效物,而且還有等效的結(jié)構(gòu)。
權(quán)利要求
1.一種方法,包括確定音頻信號片段的第一自相關(guān)值,其中將第一所考慮延遲范圍劃分為第一組區(qū)段,所述第一自相關(guān)值是針對所述第一組區(qū)段的多個區(qū)段中的延遲來確定的;確定音頻信號的所述片段的第二自相關(guān)值,其中將第二所考慮延遲范圍劃分為第二組區(qū)段,使得所述第一組的區(qū)段和所述第二組的區(qū)段重疊,所述第二自相關(guān)值是針對所述第二組區(qū)段的多個區(qū)段中的延遲來確定的;以及提供所述確定的第一自相關(guān)值和所述確定的第二自相關(guān)值,以用于所述音頻信號的所述片段中的基音滯后估計。
2. 如權(quán)利要求1的方法,其中將所述音頻信號劃分為幀的序列, 并且其中將每個幀進一步劃分為前半幀和后半幀,并且其中對于每 個幀,分別針對作為所述音頻信號第 一 片段的所述幀的所述前半幀、 針對作為所述音頻信號第二片段的所述幀的所述后半幀、以及針對 作為所述音頻信號第三片段的后續(xù)幀的前半幀,來確定第 一 自相關(guān) 值和第二自相關(guān)值。
3. 如權(quán)利要求l的方法,其中所述第一組區(qū)段和所述第二組區(qū) 段的每一個包括四個區(qū)段,并且其中所述自相關(guān)值是針對每組區(qū)段 的至少三個區(qū)段中的延遲來確定的。
4. 如權(quán)利要求l的方法,其中選擇所述第一組區(qū)段中和所述第 二組區(qū)段中的所述區(qū)段,使得區(qū)段不包括基音滯后倍數(shù)。
5. 如權(quán)利要求l的方法,還包括在每組區(qū)段的每個區(qū)段中從 所述提供的自相關(guān)值中選擇最強的自相關(guān)值。
6. 如權(quán)利要求5的方法,還包括在每組區(qū)段的每個區(qū)段中選 擇最強的自相關(guān)值之前,基于針對在前幀而估計的基音滯后來加強 自相關(guān)值。
7. 如權(quán)利要求5的方法,還包括基于針對相應(yīng)區(qū)段組的基音滯后倍數(shù)檢測來加強所選的自相關(guān)值。
8. 如權(quán)利要求5的方法,還包括加強跨越所述音頻信號的片 段穩(wěn)定的所選自相關(guān)值,其中與在跨越所述音頻信號片段的不同區(qū) 段中穩(wěn)定的自相關(guān)值相比,將在跨越所述音頻信號片段的相同區(qū)段 中穩(wěn)定的自相關(guān)值加強得更強。
9. 如權(quán)利要求l的方法,其中所述自相關(guān)值是在開環(huán)基音分析 的范圍內(nèi)確定的。
10. —種裝置,包括相關(guān)器,所述相關(guān)器配置用于確定音頻信號片段的第一自相關(guān)值,其中 將第 一所考慮延遲范圍劃分為第 一組區(qū)段,所述第 一 自相關(guān)值是針 對所述第 一組區(qū)段的多個區(qū)段中的延遲來確定的;所述相關(guān)器配置用于確定音頻信號的所述片段的第二自相關(guān) 值,其中將第二所考慮延遲范圍劃分為第二組區(qū)段,使得所述第一 組的區(qū)段和所述第二組的區(qū)段重疊,所述第二自相關(guān)值是針對所述 第二組區(qū)段的多個區(qū)段中的延遲來確定的;以及所述相關(guān)器配置用于提供所述確定的第一自相關(guān)值和所述確定 的第二自相關(guān)值,以用于所述音頻信號的所述片段中的基音滯后估計。
11. 如權(quán)利要求10的裝置,其中所述音頻信號被劃分為幀的序 列,并且其中每個幀進一步劃分為前半幀和后半幀,并且其中所述 相關(guān)器配置用于對于每個幀,分別針對作為所述音頻信號第一片 段的所述幀的所述前半幀、針對作為所述音頻信號第二片段的所述 幀的所述后半幀、以及針對作為所述音頻信號第三片段的后續(xù)幀的 前半幀,來確定第一自相關(guān)值和第二自相關(guān)值。
12. 如權(quán)利要求10的裝置,其中所述第一組區(qū)段和所述第二組 區(qū)段的每一個包括四個區(qū)段,并且其中所述相關(guān)器配置用于針對 每組區(qū)段的至少三個區(qū)段中的延遲來確定所述自相關(guān)值。
13. 如權(quán)利要求10的裝置,其中選擇所述第一組區(qū)段中和所述 第二組區(qū)段中的所述區(qū)段,使得區(qū)段不包括基音滯后倍數(shù)。
14. 如權(quán)利要求10的裝置,還包括選擇組件,其配置用于在I , 、、、、 、 、
15. 如權(quán)利要求14的裝置,還包括加強組件,其配置用于加 強跨越所述音頻信號的片段而穩(wěn)定的所選自相關(guān)值,其中與在跨越 所述音頻信號片段的不同區(qū)段中穩(wěn)定的自相關(guān)值相比,將在跨越所 述音頻信號片段的相同區(qū)段中穩(wěn)定的自相關(guān)值加強得吏強。
16. 如權(quán)利要求10的裝置,其中所述裝置是開環(huán)基音分析器。
17. 如權(quán)利要求10的裝置,其中所述裝置是音頻編碼器。
18. —種設(shè)備,包括 如權(quán)利要求10的裝置;以及 音頻輸入組件。
19. 如權(quán)利要求18的設(shè)備,其中所述音頻輸入組件是以下之一 麥克風,以及與其他設(shè)備的接口。
20. 如權(quán)利要求18的設(shè)備,其中所述設(shè)備是以下之一無線終 端,以及無線通信網(wǎng)絡(luò)的網(wǎng)元。
21. —種系統(tǒng),包括音頻編碼器,包括如權(quán)利要求10的裝置;以及 音頻解碼器。
22. —種計算機程序產(chǎn)品,其中程序代碼存儲在計算機可讀介質(zhì) 中,當所述程序代碼由處理器執(zhí)行時,其實現(xiàn)以下內(nèi)容確定音頻信號片段的第一自相關(guān)值,其中將第一所考慮延遲范圍 劃分為第 一組區(qū)段,并且所述第 一 自相關(guān)值是針對所述第 一組區(qū)段 的多個區(qū)段中的延遲來確定的;確定音頻信號的所述片段的第二自相關(guān)值,其中將第二所考慮延 遲范圍劃分為第二組區(qū)段,使得所述第 一 組的區(qū)段和所述第二組的 區(qū)段重疊,所述第二自相關(guān)值是針對所述第二組區(qū)段的多個區(qū)段中 的延遲來確定的;以及提供所述確定的第 一 自相關(guān)值和所述確定的第二自相關(guān)值,以用于所述音頻信號的所述片段中的基音滯后估計。
23. 如權(quán)利要求22的計算機程序產(chǎn)品,其中所述音頻信號被劃 分為幀的序列,并且其中每個幀進一步劃分為前半幀和后半幀,并 且其中對于每個幀,分別針對作為所述音頻信號第一片段的所述幀 的所述前半幀、針對作為所述音頻信號第二片段的所述幀的所述后 半幀、以及針對作為所述音頻信號第三片段的后續(xù)幀的前半幀,來 確定第 一 自相關(guān)值和第二自相關(guān)值。
24. 如權(quán)利要求22的計算機程序產(chǎn)品,其中所述第一組區(qū)段和 所述第二組區(qū)段的每一個包括四個區(qū)段,并且其中所述自相關(guān)值是 針對每組區(qū)段的至少三個區(qū)段中的延遲來確定的。
25. 如權(quán)利要求22的計算機程序產(chǎn)品,其中選擇所述第一組區(qū) 段中和所述第二組區(qū)段中的所述區(qū)段,使得區(qū)段不包括基音滯后倍 數(shù)。
26. 如權(quán)利要求22的計算機程序產(chǎn)品,所述程序代碼還在每組 區(qū)段的每個區(qū)段中從所述提供的自相關(guān)值中選擇最強的自相關(guān)值。
27. 如權(quán)利要求26的計算機程序產(chǎn)品,所述程序代碼還加強跨 越所述音頻信號的片段而穩(wěn)定的所選自相關(guān)值,其中與在跨越所述 音頻信號片段的不同區(qū)段中穩(wěn)定的自相關(guān)值相比,將在跨越所述音 頻信號片段的相同區(qū)段中穩(wěn)定的自相關(guān)值加強得更強。
28. 如權(quán)利要求22的計算機程序產(chǎn)品,其中所述自相關(guān)值是在 開環(huán)基音分析的范圍內(nèi)確定的。
29. —種裝置,包括用于確定音頻信號片段的第一自相關(guān)值的裝置,其中第一所考慮 延遲范圍被劃分為第一組區(qū)段,并且所述第一自相關(guān)值是針對所述 第 一 組區(qū)段的多個區(qū)段中的延遲來確定的;用于確定所述音頻信號片段的第二自相關(guān)值的裝置,其中第二所 考慮延遲范圍被劃分為第二組區(qū)段,使得所述第一組的區(qū)段和所述 第二組的區(qū)段重疊,所述第二自相關(guān)值是針對所述第二組區(qū)段的多 個區(qū)段中的延遲來確定的;以及用于提供所述確定的第 一 自相關(guān)值和所述確定的第二自相關(guān)值 以便估計所述音頻信號的所述片段中的基音滯后的裝置。
30. 如權(quán)利要求29的裝置,還包括用于在每組區(qū)段的每個區(qū) 段中從所述提供的自相關(guān)值中選擇最強的自相關(guān)值的裝置。
31. 如權(quán)利要求30的裝置,還包括用于加強跨越所述音頻信 號的片段而穩(wěn)定的所選自相關(guān)值的裝置,其中與在跨越所述音頻信 號片段的不同區(qū)段中穩(wěn)定的自相關(guān)值相比,將在跨越所述音頻信號 片段的相同區(qū)段中穩(wěn)定的自相關(guān)值加強得更強。
全文摘要
確定自相關(guān)值,作為音頻信號片段中的基音滯后估計的基礎(chǔ)。將用于自相關(guān)計算的第一所考慮延遲范圍劃分為第一組區(qū)段,針對該第一組區(qū)段的多個區(qū)段中的延遲來確定第一自相關(guān)值。將用于自相關(guān)計算的第二所考慮延遲范圍劃分為第二組區(qū)段,使得第一組的區(qū)段和第二組的區(qū)段重疊。針對該第二組區(qū)段的多個區(qū)段中的延遲來確定第二自相關(guān)值。
文檔編號G10L11/04GK101542589SQ200780043838
公開日2009年9月23日 申請日期2007年10月1日 優(yōu)先權(quán)日2006年10月13日
發(fā)明者A·拉莫, A·瓦西拉謝, L·拉克索南 申請人:諾基亞公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
云南省| 文登市| 景宁| 淄博市| 张家口市| 柏乡县| 富裕县| 清水县| 中宁县| 东至县| 浮山县| 兴山县| 钦州市| 临洮县| 云龙县| 吉首市| 潜山县| 称多县| 张家口市| 饶河县| 南靖县| 陆川县| 嵊州市| 综艺| 贡觉县| 七台河市| 天津市| 兴安盟| 巨野县| 宝山区| 明星| 黔东| 萝北县| 多伦县| 楚雄市| 西畴县| 铁岭县| 伊川县| 达孜县| 乾安县| 阿巴嘎旗|