專利名稱:語音頻帶擴(kuò)展裝置和語音頻帶擴(kuò)展方法
技術(shù)領(lǐng)域:
本文中所討論的實施方式致力于語音頻帶擴(kuò)展裝置和語音頻帶擴(kuò)展方法。
背景技術(shù):
為了高效利用通信頻帶,通信工具(如,移動電話)通過去除語音信號的低音分量和高音分量來執(zhí)行語音通信。但是,如果去除了語音信號的低音分量和高音分量,則會降低聲音質(zhì)量,因此,已經(jīng)提出了改善已降低聲音質(zhì)量的技術(shù)。例如,存在通過人工生成已丟失的高音分量的語音信號來提高聲音質(zhì)量的常規(guī)技術(shù)1。圖沈至圖觀是用于說明常規(guī)技術(shù)1的示意圖。圖沈至圖觀中的水平軸代表頻率, 而垂直軸代表音量。如圖沈所示,語音信號是例如0至6千赫的寬帶信號。當(dāng)發(fā)送寬帶信號時,如果限制頻帶為O至4千赫,則丟失4至6千赫的高音分量。換句話說,如圖27所示,所發(fā)送的語音信號降級到0至4千赫的窄帶信號。根據(jù)常規(guī)技術(shù)1,接收窄帶信號作為輸入信號,通過使用丟失頻帶相鄰的2至4千赫的信號,人工生成用于補(bǔ)償丟失信號的擴(kuò)展信號。如圖 28所示,接著,將擴(kuò)展信號與窄帶信號相加,使得0至4千赫的頻帶擴(kuò)展到0至6千赫的頻帶,因此,提高了聲音質(zhì)量。由虛線所示的信號表示擴(kuò)展信號。而且,當(dāng)輸入信號包括許多噪聲時,可使用常規(guī)技術(shù)2,該常規(guī)技術(shù)2在抑制噪聲影響的同時提高聲音質(zhì)量。圖四至圖32是用于說明常規(guī)技術(shù)2的示意圖。根據(jù)圖四至圖32,下面說明丟失了 4至6千赫的高音分量并且通過使用2至4千赫的相鄰頻帶中的信號,生成擴(kuò)展信號的情況。圖四和圖31中的水平軸表示頻率,而垂直軸表示音量。圖四和圖31中的陰影部分表示語音信號中所包括的噪聲電平,并且由虛線所示的信號表示擴(kuò)展信號。而且,圖30表示與圖四相對應(yīng)的信噪比(SNR=Signal noise ratio)的大小,并且圖32表示與圖31相對應(yīng)的SNR的大小。SNR表示語音大小與噪聲大小的比,并且SNR的值越高,表示語音的大小越高。如圖四至圖30所示,根據(jù)常規(guī)技術(shù)2,當(dāng)相鄰頻帶的SNR較高,噪聲較少時,通過使用相鄰頻帶中的信號來生成擴(kuò)展信號,由此提高聲音質(zhì)量。但是,如圖31至圖32所示, 當(dāng)相鄰頻帶的SNR較小,噪聲很多時,如果通過使用相鄰頻帶中的信號生成擴(kuò)展信號,則包括許多噪聲,因此,不利地降低了聲音質(zhì)量。由此,根據(jù)常規(guī)技術(shù)2,當(dāng)擴(kuò)展信號包括許多噪聲時,使整個擴(kuò)展信號的電平衰減,由此在抑制噪聲影響的同時提高了聲音質(zhì)量。下面說明根據(jù)常規(guī)技術(shù)2的語音頻帶擴(kuò)展裝置的構(gòu)造的一個示例。圖33是用于說明根據(jù)常規(guī)技術(shù)2的語音頻帶擴(kuò)展裝置的構(gòu)造的一個示例的示意圖。如圖33所示,語音頻帶擴(kuò)展裝置10包括擴(kuò)展信號生成單元11、SNR計算單元12和加權(quán)相加單元13。擴(kuò)展信號生成單元11通過使用所輸入的輸入信號中的相鄰頻帶的信號來生成擴(kuò)展信號。SNR計算單元12計算相鄰頻帶的SNR。加權(quán)相加單元13將擴(kuò)展信號與輸入信號相加,并且生成由輸入信號頻帶擴(kuò)展的輸出信號。而且,當(dāng)相鄰頻帶的SNR低時,加權(quán)相加單元13使整個擴(kuò)展信號的電平衰減,使得擴(kuò)展信號中包括的噪聲電平下降至預(yù)定值之下,然后將擴(kuò)展信號與輸入信號相加。專利文獻(xiàn)1 日本待審專利公報No.特開平8-130494專利文獻(xiàn)2 日本待審專利公報No.特開2008-176328但是,常規(guī)技術(shù)存在的問題是當(dāng)輸入信號中包括許多噪聲時,即使通過擴(kuò)展頻帶, 也無法確保提高聲音質(zhì)量。例如,根據(jù)常規(guī)技術(shù)1,當(dāng)輸入信號中包括許多噪聲時,擴(kuò)展信號也包括許多噪聲,因此,無法提高聲音質(zhì)量。而且,根據(jù)常規(guī)技術(shù)2,為了抑制噪聲影響,衰減整個擴(kuò)展信號的電平,因此,未充分補(bǔ)償丟失信號的電平,無法提高聲音質(zhì)量。因此,本發(fā)明實施方式的一個方面的目的是提供可以提高聲音質(zhì)量的語音頻帶擴(kuò)展裝置和語音頻帶擴(kuò)展方法。
發(fā)明內(nèi)容
根據(jù)本發(fā)明的實施方式的一個方面,語音頻帶擴(kuò)展裝置包括評估單元,該評估單元針對從外部輸入的輸入信號中的各個頻帶評估噪聲電平和信噪比中的一個;頻帶選擇單元,該頻帶選擇單元基于所述評估單元的評估結(jié)果,從所述輸入信號中選擇噪聲少的頻帶; 生成單元,該生成單元使用由所述頻帶選擇單元選擇的頻帶的信號,生成擴(kuò)展輸入信號的頻帶的擴(kuò)展信號;以及加法單元,其將由所述生成單元生成的所述擴(kuò)展信號與所述輸入信號相加。根據(jù)本發(fā)明的實施方式的另一個方面,一種由計算機(jī)執(zhí)行的語音頻帶擴(kuò)展方法, 該語音頻帶擴(kuò)展方法包括以下步驟評估步驟,針對從外部輸入的輸入信號中的各個頻帶, 評估噪聲電平和信噪比中的一個;選擇步驟,基于評估所述噪聲電平的處理的評估結(jié)果,從所述輸入信號中選擇包括噪聲少的頻帶;生成步驟,通過選擇頻帶的處理而選擇的頻帶的信號,生成擴(kuò)展輸入信號的頻帶的擴(kuò)展信號;以及相加步驟,將通過生成所述擴(kuò)展信號的處理而生成的所述擴(kuò)展信號與所述輸入信號相加。
圖1是示出了根據(jù)本發(fā)明的第一實施方式的語音頻帶擴(kuò)展裝置的構(gòu)造的示意圖;圖2是示出了圖1中所示的信噪比(SNR)計算處理單元的構(gòu)造的示意圖;圖3是示出了各頻帶的SNR的示意圖(1);圖4是示出了頻率BIN和應(yīng)用增益大小之間的關(guān)系的示意圖;圖5是用于說明由擴(kuò)展信號生成單元執(zhí)行的擴(kuò)展信號生成處理的示意圖(1);圖6是示出了頻率BIN和調(diào)節(jié)增益之間的關(guān)系的示意圖;圖7是用于說明由擴(kuò)展信號生成單元執(zhí)行的電平調(diào)節(jié)處理的示意圖;圖8是示出了由根據(jù)第一實施方式的語音頻帶擴(kuò)展裝置執(zhí)行的處理過程的流程圖;圖9是用于說明根據(jù)第一實施方式的語音頻帶擴(kuò)展裝置的效果的示意圖;圖10是用于說明根據(jù)第一實施方式的語音頻帶擴(kuò)展裝置的效果的示意圖;圖11是示出了各頻帶的SNR的示意圖(2);圖12是示出了根據(jù)本發(fā)明的第二實施方式的語音頻帶擴(kuò)展裝置的構(gòu)造的示意圖13是示出了各頻帶的SNR的示意圖(3);圖14是示出了由根據(jù)第二實施方式的語音頻帶擴(kuò)展裝置執(zhí)行的處理過程的流程圖;圖15是示出了根據(jù)本發(fā)明的第三實施方式的語音頻帶擴(kuò)展裝置的構(gòu)造的示意圖;圖16是示出了各頻帶的SNR的示意圖⑷;圖17是示出了各頻帶的SNR的示意圖(5);圖18是用于說明由擴(kuò)展信號生成單元執(zhí)行的擴(kuò)展信號生成處理的示意圖(2);圖19是示出了由根據(jù)第三實施方式的語音頻帶擴(kuò)展裝置執(zhí)行的處理過程的流程圖;圖20是示出了根據(jù)本發(fā)明的第四實施方式的語音頻帶擴(kuò)展裝置的構(gòu)造的示意圖;圖21是示出了各頻帶的SNR的示意圖(6);圖22是示出了各頻帶的SNR的示意圖(7);圖23是示出了由根據(jù)第四實施方式的語音頻帶擴(kuò)展裝置執(zhí)行的處理過程的流程圖;圖M是用于說明根據(jù)第四實施方式的語音頻帶擴(kuò)展裝置的效果的示意圖;圖25是用于說明根據(jù)第四實施方式的語音頻帶擴(kuò)展裝置的效果的示意圖;圖沈是用于說明常規(guī)技術(shù)1的示意圖;圖27是用于說明常規(guī)技術(shù)1的示意圖;圖觀是用于說明常規(guī)技術(shù)1的示意圖;圖四是用于說明常規(guī)技術(shù)2的示意圖;圖30是用于說明常規(guī)技術(shù)2的示意圖;圖31是用于說明常規(guī)技術(shù)2的示意圖;圖32是用于說明常規(guī)技術(shù)2的示意圖;以及圖33是用于說明根據(jù)常規(guī)技術(shù)2的語音頻帶擴(kuò)展裝置的構(gòu)造的示例的示意圖。
具體實施例方式將參照
本發(fā)明的優(yōu)選實施方式。但是,本發(fā)明不限于這些實施方式。在處理細(xì)節(jié)不彼此沖突的范圍之內(nèi),可以適當(dāng)?shù)亟M合各實施方式。[a]第一實施方式下面說明根據(jù)本發(fā)明的第一實施方式的語音頻帶擴(kuò)展裝置的構(gòu)造的示例。圖1是示出了根據(jù)第一實施方式的語音頻帶擴(kuò)展裝置的構(gòu)造的示意圖。如圖1所示,語音頻帶擴(kuò)展裝置100包括快速傅里葉變換(FFT)單元110、信噪比(SNR)計算處理單元120、頻帶選擇單元130、擴(kuò)展信號生成單元140、加法單元150和快速傅里葉逆變換(IFFT)單元160。FFT單元110對從外面輸入的輸入信號執(zhí)行傅里葉變換,并且向SNR計算處理單元120、頻帶選擇單元130和加法單元150輸出傅里葉變換后的輸入信號。輸入到FFT單元 110的輸入信號例如是0至4千赫的窄帶信號。FFT單元110基于下面的表達(dá)式⑴計算輸入信號的各幀的頻譜Fin(j)。在表達(dá)式⑴中,η表示幀號,^表示第η幀中的輸入信號,N表示FFT分析長度,并且j表示頻率 BIN。在該情況下,假設(shè)頻率BINO至192分別與0赫茲至6千赫茲的頻率相對應(yīng)。
權(quán)利要求
1.一種語音頻帶擴(kuò)展裝置,該語音頻帶擴(kuò)展裝置包括評估單元,該評估單元針對從外部輸入的輸入信號中的各個頻帶,評估噪聲電平和信噪比中的一個;頻帶選擇單元,該頻帶選擇單元基于所述評估單元的評估結(jié)果,從所述輸入信號中選擇噪聲少的頻帶;生成單元,該生成單元使用由所述頻帶選擇單元選擇的頻帶的信號,生成擴(kuò)展輸入信號的頻帶的擴(kuò)展信號;以及加法單元,其將由所述生成單元生成的所述擴(kuò)展信號與所述輸入信號相加。
2.根據(jù)權(quán)利要求1所述的語音頻帶擴(kuò)展裝置,其中,所述生成單元設(shè)置應(yīng)用增益,該應(yīng)用增益根據(jù)由所述頻帶選擇單元選擇的頻帶的頻率而變化,并且所述生成單元將所設(shè)置的應(yīng)用增益應(yīng)用于由所述頻帶選擇單元選擇的頻帶的信號,由此生成所述擴(kuò)展信號。
3.根據(jù)權(quán)利要求1所述的語音頻帶擴(kuò)展裝置,其中,所述評估單元針對待評估帶寬縮窄后的各子頻帶評估噪聲電平和信噪比中的一個, 所述頻帶選擇單元基于所述評估單元的評估結(jié)果,從所述輸入信號選擇噪聲少的子頻帶,并且所述生成單元利用所述頻帶選擇單元選擇的子頻帶的信號,來生成所述擴(kuò)展信號。
4.根據(jù)權(quán)利要求1所述的語音頻帶擴(kuò)展裝置,其中,該語音頻帶擴(kuò)展裝置還包括存儲器,該存儲器內(nèi)存儲從外部輸入的輸入信號,其中,當(dāng)所述輸入信號不包括噪聲少的頻帶時,所述評估單元針對所述存儲器存儲的過去輸入信號中的各個頻帶,評估噪聲電平和信噪比中的一個,并且所述頻帶選擇單元基于所述評估單元的評估結(jié)果,從所述過去輸入信號中選擇噪聲少的頻帶。
5.一種由計算機(jī)執(zhí)行的語音頻帶擴(kuò)展方法,所述語音頻帶擴(kuò)展方法包括以下步驟評估步驟,針對從外部輸入的輸入信號中的各個頻帶,評估噪聲電平和信噪比中的一個;選擇步驟,基于評估所述噪聲電平的處理的評估結(jié)果,從所述輸入信號中選擇噪聲少的頻帶;生成步驟,使用通過選擇頻帶的處理而選擇的頻帶的信號,生成擴(kuò)展輸入信號中的頻帶的擴(kuò)展信號;以及相加步驟,將通過生成所述擴(kuò)展信號的處理而生成的所述擴(kuò)展信號與所述輸入信號相加。
6.根據(jù)權(quán)利要求5所述的語音頻帶擴(kuò)展方法,其中,所述生成步驟包括通過設(shè)置應(yīng)用增益,并且將所設(shè)置的應(yīng)用增益應(yīng)用于在所述選擇步驟中選擇的頻帶的信號,來生成所述擴(kuò)展信號,所述應(yīng)用增益根據(jù)在所述選擇步驟中選擇的頻帶的頻率而變化。
7.根據(jù)權(quán)利要求5所述的語音頻帶擴(kuò)展方法,其中,所述評估步驟包括針對待評估帶寬縮窄后的各子頻帶評估噪聲電平和信噪比中的一個,所述選擇步驟包括基于所述評估步驟的評估結(jié)果,從所述輸入信號中選擇噪聲少的子頻帶,并且所述生成步驟包括利用在所述選擇步驟中選擇的子頻帶的信號來生成所述擴(kuò)展信號。
8.根據(jù)權(quán)利要求5所述的語音頻帶擴(kuò)展方法,其中,當(dāng)所述輸入信號不包括噪聲少的頻帶時,所述評估步驟包括針對存儲器所存儲的過去輸入信號中的各個頻帶,評估噪聲電平和信噪比中的一個,其中,所述存儲器內(nèi)存儲從外部輸入的輸入信號,并且所述選擇步驟包括基于所述評估步驟的評估結(jié)果,從所述過去輸入信號中選擇噪聲少的頻帶。
全文摘要
本發(fā)明涉及語音頻帶擴(kuò)展裝置和語音頻帶擴(kuò)展方法。語音頻帶擴(kuò)展裝置包括快速傅里葉變換(FFT)單元、信噪比(SNR)計算處理單元、頻帶選擇單元、擴(kuò)展信號生成單元、加法單元和快速傅里葉逆變換(IFFT)單元。FFT單元對從外部輸入的輸入信號執(zhí)行傅里葉變換。SNR計算處理單元計算輸入信號中各個頻帶的SNR。頻帶選擇單元基于各頻帶的SNR選擇其SNR超過閾值并且是最大SNR的頻帶。擴(kuò)展信號生成單元基于由頻帶選擇單元獲取的信號,生成擴(kuò)展信號。加法單元將擴(kuò)展信號與輸入信號相加,并且生成頻帶擴(kuò)展后的信號。IFFT單元對頻帶擴(kuò)展后的信號執(zhí)行快速傅里葉逆變換,并且生成輸出信號。
文檔編號G10L21/02GK102419980SQ20111017976
公開日2012年4月18日 申請日期2011年6月29日 優(yōu)先權(quán)日2010年9月27日
發(fā)明者伊藤周作, 外川太郎, 大田恭士, 大谷猛, 鈴木政直 申請人:富士通株式會社