專利名稱:編碼和解碼統(tǒng)合的語音與音頻信號的設(shè)備與方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于統(tǒng)合地編碼和解碼語音信號(speech signal)與音頻信號 (audio signal)的設(shè)備與方法。更特別是,本發(fā)明涉及一種方法和設(shè)備,其可包括針對語音 信號和音頻信號以不同的結(jié)構(gòu)操作的編碼模塊和解碼模塊,并可根據(jù)輸入信號的特征有效 地選擇內(nèi)部模塊,從而有效地編碼語音信號和音頻信號。
背景技術(shù):
語音信號和音頻信號有不同的特征。因此,以往使用語音信號和音頻信號的獨特 特征來獨立研究語音信號的語音編解碼器和音頻信號的音頻編解碼器。近來廣泛使用中 的語音編解碼器,如自適應(yīng)多速率寬帶加AMR-WB+(Adaptive Multi-Rate Wideband Plus) 編解碼器,具有代碼激勵線性預(yù)測CELP(Code Excitation Linear Prediction)結(jié)構(gòu),并 可根據(jù)語音的語音模型基于線性預(yù)測編碼LPC(Linear Predictive Code)提取和量化語 音參數(shù)。廣泛使用中的音頻編解碼器,如高效高級編碼版本2HE-AAC V2 (High-Efficiency Advanced Coding version 2)編解碼器,可考慮人類在頻域的聲學(xué)特征在心理聲學(xué)方面最 佳量化頻率系數(shù)。因此,需要一種技術(shù),其可根據(jù)輸入信號特征來有效選擇內(nèi)部模塊,從而更有效地 進行編碼和解碼。
發(fā)明內(nèi)容
技術(shù)目的如上所述,根據(jù)本發(fā)明的實施例,可根據(jù)輸入信號的特征有效地選擇內(nèi)部模塊,以 在不同的比特率針對語音信號和音頻信號提供完美的聲音質(zhì)量。根據(jù)本發(fā)明的實施例,本發(fā)明的另一個方面,還提供一種統(tǒng)合地編碼和解碼語音 信號和音頻信號的設(shè)備和方法,其可合適地將語音編碼器與音頻編碼器結(jié)合,以在不同的 比特率針對語音信號和音頻信號提供完美的聲音質(zhì)量。技術(shù)方案跟據(jù)本發(fā)明的一個方面,提供了一種用于統(tǒng)合地編碼語音信號和音頻信號的編碼 設(shè)備,所述編碼設(shè)備包括輸入信號分析器,其分析輸入信號的特征;第一轉(zhuǎn)換編碼器,當 輸入信號是音頻特征信號時,其將輸入信號轉(zhuǎn)換成頻域信號,并將輸入信號編碼;線性預(yù)測編碼(LPC =Linear Predictive Coding)編碼器,當輸入信號是語音特征 信號時,其執(zhí)行輸入信號的LPC編碼;和比特流生成器,其使用第一轉(zhuǎn)換編碼器的輸出信號 和LPC編碼器的輸出信號,來生成比特流。在這種情況下,所述編碼設(shè)備可進一步包括立體聲編碼器,其將輸入信號降混頻 (down-mix)為單聲道信號(mono signal),并提取立體聲聲音圖像信息;和頻帶擴展器,其 將輸入信號擴展為高頻帶信號。此外,所述立體聲編碼器,根據(jù)輸入信號的特征,控制用于立體聲編碼的參數(shù)值。此外,所述頻帶擴展器,可根據(jù)輸入信號的特征,選擇性地應(yīng)用至少一個頻帶復(fù)制(SBR Spectral Band Replication)標準。此外,所述編碼設(shè)備可進一步包括心理聲學(xué)單元,其使用人類的聲學(xué)特征,控制 第一轉(zhuǎn)換編碼器。此外,所述LPC編碼器可包括時域編碼器,當輸入信號是語音特征信號時,其執(zhí) 行輸入信號的時域編碼;和第二轉(zhuǎn)換編碼器,當輸入信號是音頻特征信號時,其執(zhí)行輸入信 號的快速傅立葉變換(FFT :fast Fourier transform)編碼。此外,所述輸入信號分析器,可將輸入信號分類為音頻特征信號、語音特征信號、 和低能量信號中的任何一種。此外,所述語音特征信號可被分類為穩(wěn)定諧波狀態(tài)、低穩(wěn)定諧波狀態(tài)、穩(wěn)定噪聲狀 態(tài)中的任何一種,且所述音頻特征信號可被分類為復(fù)雜諧波狀態(tài)、復(fù)雜噪聲狀態(tài)中的任何一種。跟據(jù)本發(fā)明的另一個方面,提供了一種用于統(tǒng)合地編碼語音信號和音頻信號的編 碼設(shè)備,所述編碼設(shè)備包括輸入信號分析器,其分析輸入信號的特征;立體聲編碼器,其 將輸入信號降混頻為單聲道信號,并提取立體聲聲音圖像信息;頻帶擴展器,其生成用于將 輸入信號擴展為高頻帶信號的信息;第一轉(zhuǎn)換編碼器,當輸入信號是音頻特征信號時,其 將高頻帶信號轉(zhuǎn)換成頻帶,并將高頻帶信號編碼;LPC編碼器,當輸入信號是語音特征信號 時,其執(zhí)行高頻帶信號的LPC編碼;和比特流生成器,其使用所述立體聲聲音圖像信息、所 述用于將輸入信號擴展為高頻帶信號的信息、第一轉(zhuǎn)換編碼器的輸出信號和LPC編碼器的 輸出信號,來生成比特流。跟據(jù)本發(fā)明的另一個方面,提供了一種用于統(tǒng)合地解碼語音信號和音頻信號的解 碼設(shè)備,所解碼設(shè)備包括比特流分析器,其分析輸入比特流信號;轉(zhuǎn)換解碼器,當比特流 信號是音頻比特流信號時,其將比特流信號轉(zhuǎn)換為頻域信號,并將比特流信號解碼;LPC解 碼器,當比特流信號是語音比特流信號時,其執(zhí)行比特流信號的LPC解碼;頻帶合成器,其 合成比特流信號的頻帶;和立體聲解碼器,其將比特流信號解碼為立體聲信號。技術(shù)效果根據(jù)實施例,用于統(tǒng)合地編碼和解碼語音信號與音頻信號的設(shè)備與方法,可根據(jù) 輸入信號的特征有效地選擇內(nèi)部模塊,以在不同的比特率針對語音信號和音頻信號提供完
美的聲音質(zhì)量。根據(jù)實施例,用于統(tǒng)合地編碼和解碼語音信號和音頻信號的設(shè)備和方法,可合適 地將語音編碼器與音頻編碼器結(jié)合,以在不同的比特率針對語音信號和音頻信號提供完美
的聲音質(zhì)量。
圖1是示出根據(jù)本發(fā)明一個實施例的用于統(tǒng)合地編碼語音信號和音頻信號的編 碼設(shè)備的框圖;圖2是示出根據(jù)本發(fā)明另一個實施例的用于統(tǒng)合地編碼語音信號和音頻信號的 編碼設(shè)備的框圖;圖3是示出圖2的立體聲編碼器的一個例子的框圖4是示出圖2的頻帶擴展器的一個例子的框圖;圖5是示出根據(jù)本發(fā)明一個實施例的用于統(tǒng)合地解碼語音信號和音頻信號的解 碼設(shè)備的框圖。
具體實施例方式現(xiàn)在將參照附圖對本發(fā)明的實施例進行詳細描述,所述實施例的示例在附圖中被 示出,其中相同的參考數(shù)字始終表示相同的元素。下面將參照數(shù)字描述實施例以對本發(fā)明 進行說明。圖1是示出根據(jù)本發(fā)明一個實施例的用于統(tǒng)合地編碼語音信號和音頻信號的編 碼設(shè)備100的框圖。參照圖1,編碼設(shè)備100可包括輸入信號分析器110、第一轉(zhuǎn)換編碼器120、線性預(yù) 測編碼(LPC)編碼器130、和比特流生成器140。輸入信號分析器110可分析輸入信號的特征。在這種情況下,輸入信號分析器110 可分析輸入信號的特征來把輸入信號分離成音頻特征信號、語音特征信號、和無音狀態(tài)信 號(silence state signal)中的任何一禾中。在這里,所述語音特征信號可被分類為穩(wěn)定諧波狀態(tài)(steady-harmonic state)、 低穩(wěn)定諧波狀態(tài)(low steady-harmonic state)、穩(wěn)定噪聲狀態(tài)(steady-noise state)中 的任何一種。此外,音頻特征信號可被分類為復(fù)雜諧波狀態(tài)(complex-harmonic state)、復(fù) 雜噪聲狀態(tài)(complex-noisy state)中的任何一種。輸入信號的狀態(tài)可進一步歸類如下。第一,穩(wěn)定諧波(SH steady-harmonic)狀 態(tài)SH狀態(tài)可對應(yīng)信號明確并穩(wěn)定出現(xiàn)的諧波狀態(tài)的信號區(qū)間。例如,該信號區(qū)間可包括 語音區(qū)間。單個(singleton)的正弦信號可分至SH狀態(tài)。第二,低穩(wěn)定諧波(LSH =Iow steady-harmonic)狀態(tài)LSH狀態(tài)可與SH狀態(tài)類似, 但是,其可以有相對較長的諧波頻率,并在低頻帶中呈現(xiàn)出強勁和穩(wěn)定的特點。特別是,男 性語音的語音區(qū)間可對應(yīng)LSH狀態(tài)。第三,穩(wěn)定噪聲(SN :steady-noise)狀態(tài)白噪聲可對應(yīng)SN狀態(tài)。例如,無語音區(qū) 間可被包含在SN狀態(tài)中。第四,復(fù)雜諧波(CH :complex-harmonic)狀態(tài)其多個單獨的成分被混合來構(gòu)建 復(fù)雜諧波結(jié)構(gòu)的信號區(qū)間,可對應(yīng)CH狀態(tài)。一般來說,音頻的播放區(qū)間可被包含在CH狀態(tài) 中。第五,復(fù)雜噪聲(CN complex-noisy)狀態(tài)包含不穩(wěn)定噪聲成分的信號可分類至 CN狀態(tài)中。例如,普通周邊噪音、音頻播放區(qū)間中的攻擊信號等,可對應(yīng)CN狀態(tài)。第六,無聲(Si =Silence)的狀態(tài)具有低能量的區(qū)間可被分類至Si狀態(tài)中。輸入信號分析器110的輸出結(jié)果可用于選擇一個第一轉(zhuǎn)換編碼器120和LPC編碼 器130。此外,在執(zhí)行LPC編碼時,輸入信號分析器110的輸出結(jié)果可用于選擇一個時域編 碼器131和第二轉(zhuǎn)換編碼器。當輸入信號是音頻特征信號時,第一轉(zhuǎn)換編碼器120可將輸入信號的核心頻帶轉(zhuǎn) 換至頻域信號,并將輸入信號的核心頻帶編碼。此外,當輸入信號是語音特征信號時,LPC編 碼器130可執(zhí)行輸入信號的核心頻帶的LPC編碼。所述LPC編碼器130可包括時域編碼器131和第二轉(zhuǎn)換編碼器132。當輸入信號是話音特征信號時,時域編碼器131可進行輸入信號的時域編碼。 當輸入信號是音頻特征信號時,第二次轉(zhuǎn)換編碼器132執(zhí)行輸入信號的快速傅里葉變換 (FFT)編碼。比特流生成器140可使用第一轉(zhuǎn)換編碼器120的信息和LPC編碼器130的信息生 成比特流。編碼設(shè)備100可進一步包括立體聲編碼器(未示出)來將輸入信號降混頻 (down-mix)為單聲道信號(mono signal),并提取立體聲聲音圖像信息。立體聲編碼器可 根據(jù)輸入信號的特征有選擇地應(yīng)用至少一個參數(shù)。此外,編碼設(shè)備100可進一步包括頻帶擴展器(未示出),來將輸入信號擴展為 高頻帶信號。頻帶擴展器可根據(jù)輸入信號的特征,選擇性地應(yīng)用至少一個頻帶復(fù)制(SBR Spectral Band Replication)標準。此外,編碼設(shè)備100可進一步包括心理聲學(xué)單元(未示出),其使用人類的聲學(xué)特 征,控制第一轉(zhuǎn)換編碼器120。圖2是示出根據(jù)本發(fā)明另一個實施例的用于統(tǒng)合地編碼語音信號和音頻信號的 編碼設(shè)備200的框圖。參考圖2,編碼設(shè)備200可包括輸入信號分析器210、第一轉(zhuǎn)換編碼器220、LPC編 碼器230、比特流生成器對0、立體聲編碼器250、頻帶擴展器沈0。輸入信號分析器210可分析輸入信號的特征。立體聲編碼器250可將輸入信號降混頻(down-mix)為單聲道信號(mono signal),并提取立體聲聲音圖像信息。例如,當輸入信號是立體聲時,立體聲編碼器250可 將輸入信號降混頻為單聲道信號,并可提取立體聲聲音圖像信息。立體聲編碼器250的操 作將參考圖3進一步詳細說明。圖3是示出圖2的立體聲編碼器250的一個例子的框圖。參考圖3,立體聲編碼器250可包括基礎(chǔ)處理器351、語音信號處理器352、音頻 信號處理器353。在這里,立體聲編碼器250可根據(jù)輸入信號的特征,利用不同的編碼模塊。 例如,由輸入信號分析器210分析的輸入信號的信息可被編碼器250利用。立體聲編碼器 250中使用的參數(shù),可根據(jù)析的輸入信號來調(diào)整。例如,當輸入信號的特征對應(yīng)復(fù)雜的狀態(tài), 輸入信號可具有很強的音頻特征。因此,為了更清楚地呈現(xiàn)立體聲聲音圖像,音頻信號處理 器353可以以高分辨率傳送在立體聲編碼器250中使用的基本參數(shù),還可以傳送用于送立 體聲聲音圖像的額外信息。例如,當輸入信號的特征對應(yīng)復(fù)雜狀態(tài),立體聲編碼器250可使 用8級量化將通道間的相關(guān)性ICCanter-Charmel Correlation)的參數(shù)擴展為16級參數(shù), 由此來傳送參數(shù)。于此,可提高立體聲圖像的特征。當輸入信號的特征對應(yīng)穩(wěn)定狀態(tài),輸入信號處理器352可處理語音信號。其它信 號可由基礎(chǔ)處理器351處理。頻帶擴展器260可生成用于將輸入信號擴展為高頻帶信號的信息。頻帶擴展器 260可根據(jù)輸入信號的特征選擇應(yīng)用至少一種SBR標準。以下將參照圖4的細節(jié),對頻帶擴 展器260進行進一步說明。圖4是示出圖2的頻帶擴展器沈0的一個例子的框圖。
7
參考圖4,頻帶擴展器260可包括音頻信號處理器461、SH處理器462、LSH處理 器463。具體來說,輸入信號分析器210分析的信息可被頻帶擴展器260使用。當輸入信 號的特征對應(yīng)復(fù)雜狀態(tài),語音信號處理器461可使用與現(xiàn)有編碼體系相同的體系來執(zhí)行編 碼。當輸入信號的特征對應(yīng)復(fù)雜噪聲狀態(tài),它可表明,大量的信息被包含在高頻帶,由 此音頻信號處理器461可分配并處理相對大量比特。當輸入信號是語音時,大部分高頻帶 信號可能是非嗓音噪聲信號。因此在穩(wěn)定狀態(tài)的情況下,頻帶擴展器260可被與復(fù)雜狀態(tài) 不同地應(yīng)用。具體來說,為了較準確地表現(xiàn)白噪聲,需要應(yīng)用頻帶擴展標準。特別是,由于 男性語音的諧波狀態(tài)顯然與女性語的音諧波狀態(tài)不同,所以男性語音與女性語音相比可能 會對高頻率信息相對不敏感。因此,SH處理器462可能會針對男性語音削弱白噪聲編碼, 并同時可以設(shè)置編碼,由此高頻域未被預(yù)測。LSH處理器463可將輸入信號編碼為適合女性 語音特征的。當輸入信號是音頻特征信號時,第一轉(zhuǎn)換編碼器220可將高頻帶信號轉(zhuǎn)換成頻域 信號,并由此編碼高頻帶信號。當輸入信號的特征對應(yīng)復(fù)雜狀態(tài)時,第一轉(zhuǎn)換編碼器220可 執(zhí)行未執(zhí)行頻帶擴展的核心頻帶的編碼。例如,第一轉(zhuǎn)換編碼器220可使用改進的離散余 弦變換 MDCT (Modified Discrete Cosine Transform)編碼體系。當輸入信號是語音特征信號時,LPC編碼器230可執(zhí)行高頻帶信號的LPC編碼。當 輸入信號的特點對應(yīng)穩(wěn)定狀態(tài)時,LPC編碼器230可執(zhí)行未執(zhí)行頻帶擴展的核心頻帶的LPC 編碼。LPC編碼器230可包括時域編碼器231和第二轉(zhuǎn)換編碼器232。當輸入信號是語音特征信號時,時域編碼器231可執(zhí)行輸入信號的時域編碼。具 體來說,根據(jù)諧波狀態(tài)是穩(wěn)定還是低,例如,根據(jù)穩(wěn)定狀態(tài)結(jié)果,時域編碼器231可使用代 碼激勵線性預(yù)測CELP體系,針對LPC處理的信號執(zhí)行時域編碼,當輸入信號是音頻特征信號時,第二轉(zhuǎn)換編碼器232可執(zhí)行輸入信號的FFT編碼。 具體來說,第二轉(zhuǎn)換編碼器232可使用傳送輸入信號至頻域信號的的FFT體系,在頻域根據(jù) 諧波狀態(tài)執(zhí)行編碼。在這里,第二轉(zhuǎn)換編碼器232可基于輸入信號的特征構(gòu)建不同的協(xié)議。比特流生成器240可使用立體聲聲像信息、用于將輸入信號擴展為高頻帶信號的 信息、第一轉(zhuǎn)換編碼器信息220的信息和LPC編碼器230的信息,生成比特流。編碼器設(shè)備200可進一步包括心理聲學(xué)單元270,其使用人類的聲學(xué)特征,控制第 一轉(zhuǎn)換編碼器220。圖5是示出根據(jù)本發(fā)明一個實施例的用于統(tǒng)合地解碼語音信號和音頻信號的解 碼設(shè)備500的框圖。參考圖5,解碼設(shè)備500可包括比特流分析器510、第一轉(zhuǎn)換解碼器520、LPC解碼 器530、頻帶合成器MO,和立體聲解碼器550。比特流分析器510可分析輸入比特流信號。當比特流信號是音頻比特流信號時,第一轉(zhuǎn)換解碼器520可將比特流信號轉(zhuǎn)換為 頻域信號,并將比特流信號解碼。當比特流信號是語音比特流信號時,LPC解碼器530可執(zhí)行比特流信號的LPC解碼。LPC解碼器可包括時域解碼器531,用于在時域解碼輸入比特流;和第二轉(zhuǎn)換解碼器532,用于根據(jù)輸入比特流的特征來在頻帶解碼輸入比特流。頻帶合成器M0,可合成比特流信號的頻帶。立體聲解碼器550可將比特流信號解碼為立體聲信號具體來說,解碼設(shè)備500可執(zhí)行編碼設(shè)備100和200的逆運算操作。如上所述,根據(jù)一本發(fā)明實施例,通過根據(jù)輸入信號的特征有效地選擇內(nèi)部模塊, 可以在不同比特率針對語音信號和音頻信號提供極佳的音質(zhì)。雖然本發(fā)明一些實施例已被展示和描述,但是本發(fā)明不僅限于所描述的實施例。 相反,本技術(shù)領(lǐng)域的技術(shù)人員應(yīng)當明白,在不脫離本發(fā)明的原則和精神范圍內(nèi),可對實施例 進行改變,其范圍由權(quán)利要求書及其等同物定義。
權(quán)利要求
1.一種用于統(tǒng)合地編碼語音信號和音頻信號的編碼設(shè)備,所述編碼設(shè)備包括 輸入信號分析器,其分析輸入信號的特征;第一轉(zhuǎn)換編碼器,當輸入信號是音頻特征信號時,其將輸入信號轉(zhuǎn)換成頻域信號,并將 輸入信號編碼;線性預(yù)測編碼(LPC)編碼器,當輸入信號是語音特征信號時,其執(zhí)行輸入信號的LPC編 碼;和比特流生成器,其使用第一轉(zhuǎn)換編碼器的輸出信號和LPC編碼器的輸出信號,來生成 比特流。
2.如權(quán)利要求1所述的編碼設(shè)備,其進一步包括立體聲編碼器,其將輸入信號降混頻為單聲道信號,并提取立體聲聲音圖像信息。
3.如權(quán)利要求2所述的編碼設(shè)備,其中,所述立體聲編碼器,根據(jù)輸入信號的特征,控 制用于立體聲編碼的參數(shù)值。
4.如權(quán)利要求1所述的編碼設(shè)備,其進一步包括 頻帶擴展器,其將輸入信號擴展為高頻帶信號。
5.如權(quán)利要求4所述的編碼設(shè)備,其中,所述頻帶擴展器,根據(jù)輸入信號的特征,選擇 性地應(yīng)用至少一個頻帶復(fù)制(SBR)標準。
6.如權(quán)利要求1所述的編碼設(shè)備,其進一步包括心理聲學(xué)單元,其使用人類的聲學(xué)特征,控制第一轉(zhuǎn)換編碼器。
7.如權(quán)利要求1所述的編碼設(shè)備,其中,所述LPC編碼器包括時域編碼器,當輸入信號是語音特征信號時,其執(zhí)行輸入信號的時域編碼;和 第二轉(zhuǎn)換編碼器,當輸入信號是音頻特征信號時,其執(zhí)行輸入信號的快速傅立葉變換 (FFT)編碼。
8.如權(quán)利要求1所述的編碼設(shè)備,其中,所述輸入信號分析器,將輸入信號分類為音頻 特征信號、語音特征信號、和低能量信號中的任何一種。
9.如權(quán)利要求8所述的編碼設(shè)備,其中,語音特征信號被分類為穩(wěn)定諧波狀態(tài)、低穩(wěn)定 諧波狀態(tài)、穩(wěn)定噪聲狀態(tài)中的任何一種,且音頻特征信號被分類為復(fù)雜諧波狀態(tài)、復(fù)雜噪聲 狀態(tài)中的任何一種。
10.一種用于統(tǒng)合地編碼語音信號和音頻信號的編碼設(shè)備,所述編碼設(shè)備包括 輸入信號分析器,其分析輸入信號的特征;立體聲編碼器,其將輸入信號降混頻為單聲道信號,并提取立體聲聲音圖像信息; 頻帶擴展器,其生成用于將輸入信號擴展為高頻帶信號的信息; 第一轉(zhuǎn)換編碼器,當輸入信號是音頻特征信號時,其將高頻帶信號轉(zhuǎn)換成頻帶,并將高 頻帶信號編碼;LPC編碼器,當輸入信號是語音特征信號時,其執(zhí)行高頻帶信號的LPC編碼;和 比特流生成器,其使用所述立體聲聲音圖像信息、所述用于將輸入信號擴展為高頻帶 信號的信息、第一轉(zhuǎn)換編碼器的輸出信號和LPC編碼器的輸出信號,來生成比特流。
11.如權(quán)利要求10所述的編碼設(shè)備,其進一步包括心理聲學(xué)單元,其使用人類的聲學(xué)特征,控制第一轉(zhuǎn)換編碼器。
12.如權(quán)利要求10所述的編碼設(shè)備,其中,所述立體聲編碼器,根據(jù)輸入信號的特征,控制用于立體聲編碼的參數(shù)值。
13.如權(quán)利要求10所述的編碼設(shè)備,其中,所述頻帶擴展器,根據(jù)輸入信號的特征,選 擇性地應(yīng)用至少一個SBR標準。
14.如權(quán)利要求10所述的編碼設(shè)備,其中,所述LPC編碼器包括 時域編碼器,當輸入信號是語音特征信號時,其執(zhí)行輸入信號的時域編碼; 第二轉(zhuǎn)換編碼器,當輸入信號是音頻特征信號時,其執(zhí)行輸入信號的FFT編碼。
15.一種用于統(tǒng)合地解碼語音信號和音頻信號的解碼設(shè)備,所述解碼設(shè)備包括 比特流分析器,其分析輸入比特流信號;轉(zhuǎn)換解碼器,當比特流信號是音頻比特流信號時,其將比特流信號轉(zhuǎn)換為頻域信號,并 將比特流信號解碼;LPC解碼器,當比特流信號是語音比特流信號時,其執(zhí)行比特流信號的LPC解碼; 頻帶合成器,其合成比特流信號的頻帶;和 立體聲解碼器,其將比特流信號解碼為立體聲信號。
全文摘要
本發(fā)明提供了一種用于統(tǒng)合地編碼和解碼語音信號(speech signal)和音頻信號(audio signal)的設(shè)備與方法。所述編碼設(shè)備(100)可包括輸入信號分析器(110),其分析輸入信號的特征;第一轉(zhuǎn)換編碼器(120),當輸入信號是音頻特征信號時,其將輸入信號轉(zhuǎn)換成頻域信號,并將輸入信號編碼;線性預(yù)測編碼(LPCLinear Predictive Coding)編碼器(130),當輸入信號是語音特征信號時,其執(zhí)行輸入信號的LPC編碼;和比特流生成器(140),其使用第一轉(zhuǎn)換編碼器(120)的輸出信號和LPC編碼器(130)的輸出信號,來生成比特流。
文檔編號G01L19/14GK102150024SQ200980135842
公開日2011年8月10日 申請日期2009年7月14日 優(yōu)先權(quán)日2008年7月14日
發(fā)明者姜京玉, 張大永, 徐廷一, 樸浩綜, 樸榮喆, 李泰辰, 洪鎮(zhèn)佑, 白承權(quán), 金珉第 申請人:光云大學(xué)校產(chǎn)學(xué)協(xié)力團, 韓國電子通信研究院