語音處理方法、裝置及終端設(shè)備的制作方法
【專利摘要】本發(fā)明公開了一種語音處理方法、裝置及終端設(shè)備,屬于通訊【技術(shù)領(lǐng)域】。所述方法包括:獲取原始語音信號;對所述原始語音信號進行聲紋分析處理,獲取所述原始語音信號的聲紋信息;根據(jù)所述原始語音信號的聲紋信息,判斷所述原始語音信號是否包括預(yù)設(shè)人員的語音信號;當(dāng)根據(jù)所述原始語音信號的聲紋信息確定所述原始語音信號中包括預(yù)設(shè)人員語音信號時,對所述原始語音信號中所述預(yù)設(shè)人員語音信號以外的環(huán)境噪音信號進行降噪處理,獲取第一語音信號。采用本發(fā)明實施例的技術(shù)方案,通過在語音處理過程中結(jié)合聲紋識別技術(shù),提高了針對性人群的語音清晰度,實現(xiàn)了對特定人員的語音進行加強的目的,完善并提高語音通話降噪的水平。
【專利說明】語音處理方法、裝置及終端設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通訊【技術(shù)領(lǐng)域】,特別涉及一種語音處理方法、裝置及終端設(shè)備。
【背景技術(shù)】
[0002]隨著通訊技術(shù)的發(fā)展,對通話過程中手機所獲取的語音的處理一般包括降噪處理、增益處理等。目前,多數(shù)手機支持雙麥克風(fēng)(MIC)降噪或者單MIC的降噪技術(shù)和語音增益技術(shù),只要是在降噪范圍以外的部分聲音都會被削減,不能針對某些特定人員進行語音加強。
【發(fā)明內(nèi)容】
[0003]為了解決現(xiàn)有技術(shù)的問題,本發(fā)明實施例提供了一種語音處理方法、裝置及終端設(shè)備。所述技術(shù)方案如下:
[0004]第一方面,本發(fā)明實施例提供了一種語音處理方法,所述方法包括:
[0005]獲取原始語音信號;
[0006]對所述原始語音信號進行聲紋分析處理,獲取所述原始語音信號的聲紋信息;
[0007]根據(jù)所述原始語音信號的聲紋信息,判斷所述原始語音信號是否包括預(yù)設(shè)人員的語音信號;
[0008]當(dāng)根據(jù)所述原始語音信號的聲紋信息確定所述原始語音信號中包括預(yù)設(shè)人員的語音信號時,對所述原始語音信號中所述預(yù)設(shè)人員語音信號以外的環(huán)境噪音信號進行降噪處理,獲取第一語音信號。
[0009]結(jié)合第一方面,在本發(fā)明實施例的第一種可能實現(xiàn)方式中,根據(jù)所述原始語音信號的聲紋信息,判斷所述原始語音信號是否包括預(yù)設(shè)人員的語音信號之前,所述方法還包括:
[0010]獲取預(yù)設(shè)人員的語音信號;
[0011]對所述預(yù)設(shè)人員語音信號進行聲紋分析處理,獲取所述預(yù)設(shè)人員語音信號的聲紋信息。
[0012]結(jié)合第一種可能實現(xiàn)方式,在本發(fā)明實施例的第二種可能實現(xiàn)方式中,根據(jù)所述原始語音信號的聲紋信息,判斷所述原始語音信號是否包括預(yù)設(shè)人員的語音信號之后,所述方法還包括:
[0013]當(dāng)根據(jù)所述原始語音信號的聲紋信息確定所述原始語音信號中包括預(yù)設(shè)人員的語音信號時,根據(jù)所述預(yù)設(shè)人員語音信號的聲紋信息,對所述原始語音信號進行聲紋濾波,獲取僅包含所述預(yù)設(shè)人員語音信號的第二語音信號。
[0014]結(jié)合第一種可能實現(xiàn)方式,在本發(fā)明實施例的第三種可能實現(xiàn)方式中,根據(jù)所述原始語音信號的聲紋信息,判斷所述原始語音信號是否包括預(yù)設(shè)人員的語音信號之后,所述方法還包括:
[0015]當(dāng)根據(jù)所述原始語音信號的聲紋信息確定所述原始語音信號中包括預(yù)設(shè)人員的語音信號時,對所述原始語音信號進行語音增益處理,獲得第三語音信號。
[0016]結(jié)合第一種可能實現(xiàn)方式,在本發(fā)明實施例的第四種可能實現(xiàn)方式中,根據(jù)所述原始語音信號的聲紋信息,判斷所述原始語音信號是否包括預(yù)設(shè)人員的語音信號,包括:
[0017]根據(jù)所述原始語音信號的聲紋信息和預(yù)設(shè)人員語音信號的聲紋信息進行比較,當(dāng)所述原始語音信號的聲紋信息包括所述預(yù)設(shè)人員語音信號的聲紋信息時,則確定所述原始語音信號中包括預(yù)設(shè)人員語音信號;當(dāng)所述原始語音信號的聲紋信息不包括所述預(yù)設(shè)人員語音信號的聲紋信息時,則確定所述原始語音信號中不包括預(yù)設(shè)人員語音信號。
[0018]第二方面,本發(fā)明實施例提供了一種語音處理裝置,所述裝置包括:
[0019]語音獲取模塊,用于獲取原始語音信號;
[0020]聲紋分析模塊,用于對所述原始語音信號進行聲紋分析處理,獲取所述原始語音信號的聲紋信息;
[0021]判斷模塊,用于根據(jù)所述原始語音信號的聲紋信息,判斷所述原始語音信號是否包括預(yù)設(shè)人員的語音信號;
[0022]第一語音信號獲取模塊,用于當(dāng)根據(jù)所述原始語音信號的聲紋信息確定所述原始語音信號中包括預(yù)設(shè)人員語音信號時,對所述原始語音信號中所述預(yù)設(shè)人員語音信號以外的環(huán)境噪音信號進行降噪處理,獲取第一語音信號。
[0023]結(jié)合第二方面,在本發(fā)明實施例的第一種可能實現(xiàn)方式中,所述裝置還包括:
[0024]預(yù)設(shè)人員語音信號獲取模塊,用于獲取預(yù)設(shè)人員語音信號;
[0025]預(yù)設(shè)人員語音信號分析模塊,用于對所述預(yù)設(shè)人員語音信號進行聲紋分析處理,獲取所述預(yù)設(shè)人員語音信號的聲紋信息。
[0026]結(jié)合第一種可能實現(xiàn)方式,在本發(fā)明實施例的第二種可能實現(xiàn)方式中,所述裝置還包括:
[0027]聲紋濾波模塊,用于當(dāng)根據(jù)所述原始語音信號的聲紋信息確定所述原始語音信號中包括預(yù)設(shè)人員的語音信號時,根據(jù)所述預(yù)設(shè)人員語音信號的聲紋信息,對所述原始語音信號進行聲紋濾波,獲取僅包含所述預(yù)設(shè)人員語音信號的第二語音信號。
[0028]結(jié)合第一種可能實現(xiàn)方式,在本發(fā)明實施例的第三種可能實現(xiàn)方式中,所述裝置還包括:
[0029]語音增益模塊,用于當(dāng)根據(jù)所述原始語音信號的聲紋信息確定所述原始語音信號中包括預(yù)設(shè)人員的語音信號時,對所述原始語音信號進行語音增益處理,獲得第三語音信號。
[0030]結(jié)合第一種可能實現(xiàn)方式,在本發(fā)明實施例的第四種可能實現(xiàn)方式中,所述聲紋識別模塊用于根據(jù)所述原始語音信號的聲紋信息和預(yù)設(shè)人員語音信號的聲紋信息進行比較,當(dāng)所述原始語音信號的聲紋信息包括所述預(yù)設(shè)人員語音信號的聲紋信息時,則確定所述原始語音信號中包括預(yù)設(shè)人員語音信號;當(dāng)所述原始語音信號的聲紋信息不包括所述預(yù)設(shè)人員語音信號的聲紋信息時,則確定所述原始語音信號中不包括預(yù)設(shè)人員語音信號。
[0031]第三方面,本發(fā)明實施例提供了一種終端設(shè)備,所述終端設(shè)備包括:
[0032]接收器,用于獲取原始語音信號;
[0033]處理器,用于對所述原始語音信號進行聲紋分析處理,獲取所述原始語音信號的聲紋信息;[0034]所述處理器還用于根據(jù)所述原始語音信號的聲紋信息,判斷所述原始語音信號是否包括預(yù)設(shè)人員的語音信號;
[0035]所述處理器還用于當(dāng)根據(jù)所述原始語音信號的聲紋信息確定所述原始語音信號中包括預(yù)設(shè)人員語音信號時,對所述原始語音信號中所述預(yù)設(shè)人員語音信號以外的環(huán)境噪音信號進行降噪處理,獲取第一語音信號。
[0036]本發(fā)明實施例提供的一種語音處理方法、裝置及終端設(shè)備,通過獲取原始語音信號;對所述原始語音信號進行聲紋分析處理,獲取所述原始語音信號的聲紋信息;根據(jù)所述原始語音信號的聲紋信息,判斷所述原始語音信號是否包括預(yù)設(shè)人員的語音信號;當(dāng)根據(jù)所述原始語音信號的聲紋信息確定所述原始語音信號中包括預(yù)設(shè)人員語音信號時,對所述原始語音信號中所述預(yù)設(shè)人員語音信號以外的環(huán)境噪音信號進行降噪處理,獲取第一語音信號。采用本發(fā)明實施例的技術(shù)方案,通過在語音處理過程中結(jié)合聲紋識別技術(shù),提高了針對性人群的語音清晰度,實現(xiàn)了對特定人員的語音進行加強的目的,完善并提高語音通話降噪的水平。
【專利附圖】
【附圖說明】
[0037]為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0038]圖1是本發(fā)明實施例提供的一種語音處理方法的流程圖;
[0039]圖2是本發(fā)明實施例提供的一種語音處理方法的流程圖;
[0040]圖3是本發(fā)明實施例提供的一種語音處理裝置的結(jié)構(gòu)示意圖;
[0041]圖4是本發(fā)明實施例提供的一種終端設(shè)備的結(jié)構(gòu)示意圖。
【具體實施方式】
[0042]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖對本發(fā)明實施方式作進一步地詳細(xì)描述。
[0043]本發(fā)明實施例中,終端設(shè)備指向用戶提供語音和/或數(shù)據(jù)連通性的設(shè)備,包括無線終端或有線終端。無線終端可以是具有無線連接功能的手持式設(shè)備、或連接到無線調(diào)制解調(diào)器的其他處理設(shè)備,經(jīng)無線接入網(wǎng)與一個或多個核心網(wǎng)進行通信的移動終端。例如,無線終端可以是移動電話(或稱為“蜂窩”電話)和具有移動終端的計算機。又如,無線終端也可以是便攜式、袖珍式、手持式、計算機內(nèi)置的或者車載的移動裝置。
[0044]圖1是本發(fā)明實施例提供的一種語音處理方法的流程圖。該實施例的執(zhí)行主體為終端設(shè)備,參見圖1,該實施例具體包括:
[0045]101、獲取原始語音信號;
[0046]其中,該原始語音信號是指終端設(shè)備的麥克風(fēng)接收到的語音信號,該語音信號尚未經(jīng)過降噪、增益等處理。
[0047]在另一發(fā)明實施例中,該原始語音信號還可以是該終端設(shè)備的通信對端通過語音通道發(fā)送,經(jīng)過語音通道傳輸,而由終端設(shè)備的射頻單元接收到的語音信號。[0048]102、對所述原始語音信號進行聲紋分析處理,獲取所述原始語音信號的聲紋信息;
[0049]103、根據(jù)所述原始語音信號的聲紋信息,判斷所述原始語音信號是否包括預(yù)設(shè)人員的語音信號;
[0050]上述步驟102和103可以整體被看做是對原始語音信號進行聲紋識別,以便確定該原始語音信號中是否包括預(yù)設(shè)人員的語音信號的過程。根據(jù)語音信號進行聲紋分析以獲取聲紋信息,并根據(jù)聲紋信息進行聲紋識別是現(xiàn)有技術(shù)中公知的技術(shù),主要通過特征提取技術(shù)、模式匹配準(zhǔn)則及模型訓(xùn)練技術(shù)等實現(xiàn),在此不再贅述。
[0051]104、當(dāng)根據(jù)所述原始語音信號的聲紋信息確定所述原始語音信號中包括預(yù)設(shè)人員語音信號時,對所述原始語音信號中所述預(yù)設(shè)人員語音信號以外的環(huán)境噪音信號進行降噪處理,獲取第一語音信號。
[0052]環(huán)境噪音信號可以是原始語音信號中預(yù)設(shè)人員以外人員的信號,該環(huán)境噪音信號中還可以包含其他音源的信號,如人員對話中的背景音等,在本發(fā)明實施例中不對環(huán)境噪音信號的具體構(gòu)成進行限定。
[0053]本發(fā)明實施例提供的方法,通過在語音處理過程中結(jié)合聲紋識別技術(shù),排除了環(huán)境噪音信號對預(yù)設(shè)人員語音信號的干擾,實現(xiàn)了對特定人員的語音進行加強的目的,完善并提高語音通話降噪的水平。
[0054]圖2是本發(fā)明實施例提供的一種語音處理方法的流程圖。該實施例的執(zhí)行主體為終端設(shè)備,參見圖2,該實施例具體包括:
[0055]201、終端設(shè)備獲取預(yù)設(shè)人員語音信號;
[0056]終端設(shè)備用戶可以錄制一段預(yù)設(shè)人員語音信號,保存在終端設(shè)備上;或,終端設(shè)備用戶可以從已經(jīng)存儲在終端設(shè)備上的語音信號中,獲取預(yù)設(shè)人員語音信號。
[0057]本領(lǐng)域技術(shù)人員可以獲知,優(yōu)選地,該語音信號需具有一定的長度和聲音元素,以便根據(jù)該語音信號獲取該語音信號的聲紋信息。
[0058]202、終端設(shè)備對所述預(yù)設(shè)人員語音信號進行聲紋分析處理,獲取所述預(yù)設(shè)人員語音信號的聲紋信息;
[0059]聲紋信息是攜帶言語信息的聲波頻譜,聲紋信息不僅具有特定性,而且有相對穩(wěn)定性的特點,因此,通過對預(yù)設(shè)人員語音信號進行聲紋分析得到的聲紋信息可以用于唯一確定某個特定人員,也正是因為如此,可以通過聲紋信息的比較,可以確定語音信號中特定人員的語音信號,從而有針對性的對特定人員的語音信號進行處理。
[0060]需要說明的是,在獲取預(yù)設(shè)人員語音信號時,還可以對包含該預(yù)設(shè)人員語音信號的處理方式進行設(shè)置,而當(dāng)獲取到的原始語音信號包括與所述預(yù)設(shè)人員語音信號相符的語音信號時,按照該設(shè)置的處理方式對原始語音信號進行處理。
[0061]優(yōu)選地,處理方式可以包括但不限于:對原始語音信號中預(yù)設(shè)人員語音信號以外的語音信號進行降噪,得到第一語音信號;對得到的第一語音信號進行聲紋濾波,得到第二語音信號;對第二語音信號中的預(yù)設(shè)人員語音信號進行語音增強等。該降噪、聲紋濾波和語音增強可以通過對處理參數(shù)的調(diào)整實現(xiàn)。
[0062]203、終端設(shè)備獲取原始語音信號;
[0063]該原始語音信號可以是終端設(shè)備在通話過程中麥克風(fēng)接收到的語音信號,還可以是通信對端設(shè)備用戶發(fā)來的語音信號。
[0064]優(yōu)選地,該原始語音信號是終端設(shè)備通過麥克風(fēng)接收到語音信號,該原始語音信號經(jīng)過處理,將通過射頻單元發(fā)送至通信對端設(shè)備。
[0065]204、終端設(shè)備對所述原始語音信號進行聲紋分析處理,獲取所述原始語音信號的聲紋信息;
[0066]具體地,對獲取到的原始語音信號進行聲紋分析處理,獲取所述原始語音信號的聲紋信息,可以確定該原始語音信號中是否包括預(yù)設(shè)人員語音信號,從而確定是否對該原始語音信號進行后續(xù)的聲紋濾波處理。
[0067]205、終端設(shè)備根據(jù)所述原始語音信號的聲紋信息和預(yù)設(shè)人員語音信號的聲紋信息進行比較;
[0068]當(dāng)所述原始語音信號的聲紋信息包括所述預(yù)設(shè)人員語音信號的聲紋信息時,則確定所述原始語音信號中包括預(yù)設(shè)人員語音信號;當(dāng)所述原始語音信號的聲紋信息不包括所述預(yù)設(shè)人員語音信號的聲紋信息時,則確定所述原始語音信號中不包括預(yù)設(shè)人員語音信號;
[0069]本領(lǐng)域技術(shù)人員可以獲知,根據(jù)不同語音信號的聲紋信息進行比較,以獲知語音信號是否包含同一人的語音為現(xiàn)有技術(shù)所公開,在此不做贅述。
[0070]進一步地,當(dāng)所述獲取到的語音包括與所述預(yù)設(shè)語音的聲紋相符的第一語音時,還可以根據(jù)語音中的詞語和語氣等分析預(yù)測語音長度,以確定對后續(xù)語音的處理方式,如果通過預(yù)測獲知該語音的持續(xù)時長,則可在該持續(xù)時長內(nèi)不對獲取到的語音進行任何處理,或是關(guān)閉該調(diào)整參數(shù)的功能,或是調(diào)整默認(rèn)參數(shù),以降低對語音處理的力度,減少了語音處理階段的耗電量。
[0071]206、當(dāng)根據(jù)所述原始語音信號的聲紋信息確定所述原始語音信號中包括預(yù)設(shè)人員語音信號時,終端設(shè)備對所述原始語音信號中所述預(yù)設(shè)人員語音信號以外的環(huán)境噪音信號進行降噪處理,獲取第一語音信號;
[0072]具體地,當(dāng)確定所述原始語音信號中包括預(yù)設(shè)人員語音信號時,可以有針對性的對原始語音信號中該預(yù)設(shè)人員語音信號以外的信號進行降噪處理,由于降噪處理可能會導(dǎo)致語音信號的衰減,因此,僅對預(yù)設(shè)人員語音信號以外的信號進行降噪處理,可以最大程度的保證預(yù)設(shè)人員語音信號不受影響,保持原始度。降噪處理后的第一語音信號還需進行增益處理和調(diào)制解調(diào)等處理,該增益處理和調(diào)制解調(diào)等處理均為現(xiàn)有的語音處理方法,在本發(fā)明實施例中不對此進行限定。
[0073]如,該原始語音信號中至少包含人員A、B和C的語音信號,而由于移動終端預(yù)存了人員A的語音信號,則根據(jù)聲紋比較可以獲知,需要突出A的語音信號,則對A以外的語音信號進行降噪處理。
[0074]需要說明的是,該降噪處理還可以是針對原始語音信號整體的,對原始語音信號中的預(yù)設(shè)人員語音信號,應(yīng)用第一降噪?yún)?shù)進行降噪處理,而對原始語音信號中預(yù)設(shè)人員語音信號以外的語音信號,應(yīng)用第二降噪?yún)?shù)進行降噪處理。其中,第一降噪?yún)?shù)小于第二降噪?yún)?shù)。該第一和第二降噪?yún)?shù)均可以由技術(shù)人員在開發(fā)時設(shè)置,也可以由用戶根據(jù)自身需求進行設(shè)置。
[0075]207、終端設(shè)備根據(jù)所述預(yù)設(shè)人員語音信號的聲紋信息,對所述第一語音信號進行聲紋濾波,獲取僅包含所述預(yù)設(shè)人員語音信號的第二語音信號;
[0076]具體地,當(dāng)確定所述原始語音信號中包括預(yù)設(shè)人員語音信號時,可以有針對性的濾除掉降噪后的第一語音信號中該預(yù)設(shè)人員語音信號以外的信號,以最大程度的避免環(huán)境噪音信號對預(yù)設(shè)人員語音信號的干擾,因此,根據(jù)預(yù)設(shè)人員語音信號的聲紋信息對第一語音信號進行聲紋濾波,可以最大程度的保證預(yù)設(shè)人員語音信號不受影響,而在最大程度濾除掉環(huán)境噪音信號。
[0077]如,該第一語音信號中至少包含人員A、B和C降噪后的語音信號,而由于移動終端預(yù)存了人員A的語音信號,則根據(jù)聲紋濾波可以濾除大部分B、C以及其他環(huán)境噪音信號,以達(dá)到突出A的語音信號的目的。
[0078]208、終端設(shè)備對所述第二語音信號進行語音增強處理,獲得第三語音信號。
[0079]具體地,當(dāng)確定所述原始語音信號中包括預(yù)設(shè)人員語音信號時,可以有針對性的對原始語音信號中該預(yù)設(shè)人員語音信號進行語音增強處理,由于語音增強處理可以進一步提高預(yù)設(shè)人員語音信號的質(zhì)量,因此,僅對預(yù)設(shè)人員語音信號以外的信號進行語音增強處理,可以最大程度的提高預(yù)設(shè)人員語音信號的清晰度。
[0080]如,該第三語音信號中至少包含人員A的語音信號以及一些環(huán)境噪音信號,為了突出A的語音信號,對A的語音信號進行語音增強處理。
[0081]需要說明的是,該語音增強處理還可以是針對原始語音信號整體的,對原始語音信號中的預(yù)設(shè)人員語音信號,應(yīng)用第一增益參數(shù)進行語音增強處理,而對原始語音信號中預(yù)設(shè)人員語音信號以外的語音信號,應(yīng)用第二增益參數(shù)進行語音增強處理。其中,第一增益參數(shù)大于第二增益參數(shù)。
[0082]通過提高對預(yù)設(shè)人員語音信號進行語音增強所應(yīng)用的放大增益參數(shù),達(dá)到了有針對性的提高預(yù)設(shè)人員的語音清晰度的目的,實現(xiàn)了對特定人員的語音進行加強的目的。
[0083]該步驟208之后還可以包括:輸出該第三語音信號。當(dāng)該方法應(yīng)用于通話過程的發(fā)送端時,可以是將第三語音信號通過語音通道傳輸給通信對端,而當(dāng)該方法應(yīng)用于通話過程的接收端時,可以是將第三語音信號通過揚聲器輸出。
[0084]另外,在本發(fā)明實施例中,僅是以根據(jù)原始語音信號經(jīng)過降噪處理,得到第一語音信號,再根據(jù)第一語音信號進行聲紋濾波,得到第二語音信號,又根據(jù)第二語音信號進行語音增強處理,得到第三語音信號為例進行說明的。而在本發(fā)明實施例還可以采用以下任一方式進行:(I)對原始語音信號進行降噪處理、聲紋濾波或語音增強中的任一項,以得到處理后的語音信號;(2)對原始語音信號進行降噪處理、聲紋濾波或語音增強中的任兩項,以得到處理后的語音信號,且該兩項處理為順序處理,其具體前后順序不限。(3)對原始語音信號進行降噪處理、聲紋濾波以及語音增強,則該處理順序的前后順序不限。
[0085]本發(fā)明實施例提供的技術(shù)方案,可應(yīng)用于通話過程的發(fā)送端,通過對本端麥克風(fēng)所獲取到的原始語音信號的聲紋識別,獲知本端麥克風(fēng)獲取到的原始語音信號包含與所述預(yù)設(shè)人員語音信號的聲紋信息相符的語音信號,則對預(yù)設(shè)人員語音信號進行聲紋濾波、語音增強等強化處理,使得通話過程的通信對端接收到的語音中的預(yù)設(shè)人員的語音清晰度突出,辨識度高。
[0086]而本發(fā)明實施例提供的技術(shù)方案,還可應(yīng)用于通話過程的接收端,通過對接收到的對端的原始語音信號的聲紋識別,獲知接收到的原始語音信號包含與所述預(yù)設(shè)人員語音信號的聲紋信息相符的語音信號,則對預(yù)設(shè)人員語音信號進行聲紋濾波、語音增強等強化處理,使得通話過程本端接收到的語音中的預(yù)設(shè)人員的語音清晰度突出,辨識度高。
[0087]進一步地,當(dāng)所述獲取到的原始語音信號不包括與所述預(yù)設(shè)人員語音信號的聲紋信息相符的語音信號時,可以關(guān)閉語音降噪處理、聲紋濾波以及語音增強等功能,不對所述獲取到的原始語音信號進行有區(qū)別的降噪處理、聲紋濾波以及語音增強等區(qū)別處理,而降低了終端設(shè)備的耗電量。
[0088]采用本發(fā)明實施例的技術(shù)方案,通過在語音處理過程中結(jié)合聲紋識別技術(shù),提高了針對性人群的語音清晰度,實現(xiàn)了對特定人員的語音進行加強的目的,完善并提高語音通話降噪的水平。
[0089]圖3是本發(fā)明實施例提供的一種語音處理裝置的結(jié)構(gòu)示意圖。參見圖3,所述裝置包括:
[0090]語音獲取模塊301,用于獲取原始語音信號;
[0091]聲紋分析模塊302,用于對所述原始語音信號進行聲紋分析處理,獲取所述原始語音信號的聲紋信息;
[0092]判斷模塊303,用于根據(jù)所述原始語音信號的聲紋信息,判斷所述原始語音信號是否包括預(yù)設(shè)人員的語音信號;
[0093]第一語音信號獲取模塊304,用于當(dāng)根據(jù)所述原始語音信號的聲紋信息確定所述原始語音信號中包括預(yù)設(shè)人員語音信號時,對所述原始語音信號中所述預(yù)設(shè)人員語音信號以外的環(huán)境噪音信號進行降噪處理,獲取第一語音信號。
[0094]可選地,所述裝置還包括:
[0095]預(yù)設(shè)人員語音信號獲取模塊,用于獲取預(yù)設(shè)人員語音信號;
[0096]預(yù)設(shè)人員語音信號分析模塊,用于對所述預(yù)設(shè)人員語音信號進行進行聲紋分析處理,獲取所述預(yù)設(shè)人員語音信號的聲紋信息。
[0097]可選地,所述裝置還包括:
[0098]聲紋濾波模塊,用于當(dāng)根據(jù)所述原始語音信號的聲紋信息確定所述原始語音信號中包括預(yù)設(shè)人員的語音信號時,根據(jù)所述預(yù)設(shè)人員語音信號的聲紋信息,對所述原始語音信號進行聲紋濾波,獲取僅包含所述預(yù)設(shè)人員語音信號的第二語音信號。
[0099]可選地,所述裝置還包括:
[0100]語音增益模塊,用于當(dāng)根據(jù)所述原始語音信號的聲紋信息確定所述原始語音信號中包括預(yù)設(shè)人員的語音信號時,對所述原始語音信號進行語音增益處理,獲得第三語音信號。
[0101]可選地,所述聲紋識別模塊用于根據(jù)所述原始語音信號的聲紋信息和預(yù)設(shè)人員語音信號的聲紋信息進行比較,當(dāng)所述原始語音信號的聲紋信息包括所述預(yù)設(shè)人員語音信號的聲紋信息時,則確定所述原始語音信號中包括預(yù)設(shè)人員語音信號;當(dāng)所述原始語音信號的聲紋信息不包括所述預(yù)設(shè)人員語音信號的聲紋信息時,則確定所述原始語音信號中不包括預(yù)設(shè)人員語音信號。
[0102]需要說明的是:上述實施例提供的語音處理裝置在語音處理時,僅以上述各功能模塊的劃分進行舉例說明,實際應(yīng)用中,可以根據(jù)需要而將上述功能分配由不同的功能模塊完成,即將設(shè)備的內(nèi)部結(jié)構(gòu)劃分成不同的功能模塊,以完成以上描述的全部或者部分功能。另外,上述實施例提供的語音處理裝置與語音處理方法實施例屬于同一構(gòu)思,其具體實現(xiàn)過程詳見方法實施例,這里不再贅述。
[0103]本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例的全部或部分步驟可以通過硬件來完成,也可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計算機可讀存儲介質(zhì)中,上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。
[0104]圖4是本發(fā)明實施例提供的一種終端設(shè)備的結(jié)構(gòu)示意圖。參見圖4,所述終端設(shè)備包括:
[0105]接收器401,用于獲取原始語音信號;
[0106]處理器402,用于對所述原始語音信號進行聲紋分析處理,獲取所述原始語音信號的聲紋信息;
[0107]所述處理器402還用于根據(jù)所述原始語音信號的聲紋信息,判斷所述原始語音信號是否包括預(yù)設(shè)人員的語音信號;
[0108]所述處理器402還用于當(dāng)根據(jù)所述原始語音信號的聲紋信息確定所述原始語音信號中包括預(yù)設(shè)人員語音信號時,對所述原始語音信號中所述預(yù)設(shè)人員語音信號以外的環(huán)境噪音信號進行降噪處理,獲取第一語音信號。
[0109]可選地,所述接收器401還用于獲取預(yù)設(shè)人員語音信號;
[0110]所述處理器402還用于對所述預(yù)設(shè)人員語音信號進行聲紋分析處理,獲取所述預(yù)設(shè)人員語音信號的聲紋信息。
[0111]可選地,所述處理器402還用于當(dāng)根據(jù)所述原始語音信號的聲紋信息確定所述原始語音信號中包括預(yù)設(shè)人員的語音信號時,根據(jù)所述預(yù)設(shè)人員語音信號的聲紋信息,對所述原始語音信號進行聲紋濾波,獲取僅包含所述預(yù)設(shè)人員語音信號的第二語音信號。
[0112]可選地,所述處理器402還用于當(dāng)根據(jù)所述原始語音信號的聲紋信息確定所述原始語音信號中包括預(yù)設(shè)人員的語音信號時,對所述原始語音信號進行語音增益處理,獲得第二語首彳目號。
[0113]可選地,所述處理器402還用于根據(jù)所述原始語音信號的聲紋信息和預(yù)設(shè)人員語音信號的聲紋信息進行比較,當(dāng)所述原始語音信號的聲紋信息包括所述預(yù)設(shè)人員語音信號的聲紋信息時,則確定所述原始語音信號中包括預(yù)設(shè)人員語音信號;當(dāng)所述原始語音信號的聲紋信息不包括所述預(yù)設(shè)人員語音信號的聲紋信息時,則確定所述原始語音信號中不包括預(yù)設(shè)人員語音信號。
[0114]具體地,該語音處理設(shè)備還包括:射頻電路、音頻電路和電源電路,
[0115]所述射頻電路,用于建立手機與無線網(wǎng)絡(luò)的通信,實現(xiàn)手機與無線網(wǎng)絡(luò)的數(shù)據(jù)接收和發(fā)送;
[0116]所述音頻電路,用于采集聲音并將采集的聲音轉(zhuǎn)化為聲音數(shù)據(jù),以便所述手機通過所述射頻電路向無線網(wǎng)絡(luò)發(fā)送所述聲音數(shù)據(jù),和/或?qū)⑺鍪謾C通過所述射頻電路從無線網(wǎng)絡(luò)接收的聲音數(shù)據(jù),還原為聲音并向用戶播放該聲音;
[0117]所述電源電路,用于為所述手機的各個電路或器件供電,保證手機的正常工作。
[0118]上述終端設(shè)備可以為手機、人機交互終端、電子書或其他具有語音識別功能的終端設(shè)備。在終端設(shè)備為手機的情下,該手機還包括:外殼,電路板、麥克風(fēng)、和揚聲器以便完成手機的基本功能,下面對外殼,電路板、麥克風(fēng)、和揚聲器分別進行介紹:[0119]所述電路板安置在所述外殼內(nèi)部。
[0120]所述麥克風(fēng),用于采集聲音并將采集的聲音轉(zhuǎn)化為聲音數(shù)據(jù),以便所述手機通過所述射頻電路向無線網(wǎng)絡(luò)發(fā)送所述聲音數(shù)據(jù);
[0121]所述揚聲器,用于將所述手機通過所述射頻電路從無線網(wǎng)絡(luò)接收的聲音數(shù)據(jù),還原為聲音并向用戶播放該聲音。
[0122]以上所述僅為本發(fā)明的較佳實施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。
【權(quán)利要求】
1.一種語音處理方法,其特征在于,所述方法包括: 獲取原始語音信號; 對所述原始語音信號進行聲紋分析處理,獲取所述原始語音信號的聲紋信息; 根據(jù)所述原始語音信號的聲紋信息,判斷所述原始語音信號是否包括預(yù)設(shè)人員的語音信號; 當(dāng)根據(jù)所述原始語音信號的聲紋信息確定所述原始語音信號中包括預(yù)設(shè)人員的語音信號時,對所述原始語音信號中所述預(yù)設(shè)人員語音信號以外的環(huán)境噪音信號進行降噪處理,獲取第一語音信號。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述原始語音信號的聲紋信息,判斷所述原始語音信號是否包括預(yù)設(shè)人員的語音信號之前,所述方法還包括: 獲取預(yù)設(shè)人員的語音信號; 對所述預(yù)設(shè)人員語音信號進行聲紋分析處理,獲取所述預(yù)設(shè)人員語音信號的聲紋信肩、O
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,根據(jù)所述原始語音信號的聲紋信息,判斷所述原始語音信號是否包括預(yù)設(shè)人員的語音信號之后,所述方法還包括: 當(dāng)根據(jù)所述原始語音信號的聲紋信息確定所述原始語音信號中包括預(yù)設(shè)人員的語音信號時,根據(jù)所述預(yù)設(shè)人員語音信號的聲紋信息,對所述原始語音信號進行聲紋濾波,獲取僅包含所述預(yù)設(shè)人員語音信號的第二語音信號。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,根據(jù)所述原始語音信號的聲紋信息,判斷所述原始語音信號是否包括預(yù)設(shè)人員的語音信號之后,所述方法還包括: 當(dāng)根據(jù)所述原始語音信號的聲紋信息確定所述原始語音信號中包括預(yù)設(shè)人員的語音信號時,對所述原始語音信號進行語音增益處理,獲得第三語音信號。
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,根據(jù)所述原始語音信號的聲紋信息,判斷所述原始語音信號是否包括預(yù)設(shè)人員的語音信號,包括: 根據(jù)所述原始語音信號的聲紋信息和預(yù)設(shè)人員語音信號的聲紋信息進行比較,當(dāng)所述原始語音信號的聲紋信息包括所述預(yù)設(shè)人員語音信號的聲紋信息時,則確定所述原始語音信號中包括預(yù)設(shè)人員語音信號;當(dāng)所述原始語音信號的聲紋信息不包括所述預(yù)設(shè)人員語音信號的聲紋信息時,則確定所述原始語音信號中不包括預(yù)設(shè)人員語音信號。
6.一種語音處理裝置,其特征在于,所述裝置包括: 語音獲取模塊,用于獲取原始語音信號; 聲紋分析模塊,用于對所述原始語音信號進行聲紋分析處理,獲取所述原始語音信號的聲紋信息; 判斷模塊,用于根據(jù)所述原始語音信號的聲紋信息,判斷所述原始語音信號是否包括預(yù)設(shè)人員的語音信號; 第一語音信號獲取模塊,用于當(dāng)根據(jù)所述原始語音信號的聲紋信息確定所述原始語音信號中包括預(yù)設(shè)人員語音信號時,對所述原始語音信號中所述預(yù)設(shè)人員語音信號以外的環(huán)境噪音信號進行降噪處理,獲取第一語音信號。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述裝置還包括: 預(yù)設(shè)人員語音信號獲取模塊,用于獲取預(yù)設(shè)人員語音信號;預(yù)設(shè)人員語音信號分析模塊,用于對所述預(yù)設(shè)人員語音信號進行聲紋分析處理,獲取所述預(yù)設(shè)人員語音信號的聲紋信息。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括: 聲紋濾波模塊,用于當(dāng)根據(jù)所述原始語音信號的聲紋信息確定所述原始語音信號中包括預(yù)設(shè)人員的語音信號時,根據(jù)所述預(yù)設(shè)人員語音信號的聲紋信息,對所述原始語音信號進行聲紋濾波,獲取僅包含所述預(yù)設(shè)人員語音信號的第二語音信號。
9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括: 語音增益模塊,用于當(dāng)根據(jù)所述原始語音信號的聲紋信息確定所述原始語音信號中包括預(yù)設(shè)人員的語音信號時,對所述原始語音信號進行語音增益處理,獲得第三語音信號。
10.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述聲紋識別模塊用于根據(jù)所述原始語音信號的聲紋信息和預(yù)設(shè)人員語音信號的聲紋信息進行比較,當(dāng)所述原始語音信號的聲紋信息包括所述預(yù)設(shè)人員語 音信號的聲紋信息時,則確定所述原始語音信號中包括預(yù)設(shè)人員語音信號;當(dāng)所述原始語音信號的聲紋信息不包括所述預(yù)設(shè)人員語音信號的聲紋信息時,則確定所述原始語音信號中不包括預(yù)設(shè)人員語音信號。
11.一種終端設(shè)備,其特征在于,所述終端設(shè)備包括: 接收器,用于獲取原始語音信號; 處理器,用于對所述原始語音信號進行聲紋分析處理,獲取所述原始語音信號的聲紋信息; 所述處理器還用于根據(jù)所述原始語音信號的聲紋信息,判斷所述原始語音信號是否包括預(yù)設(shè)人員的語音信號; 所述處理器還用于當(dāng)根據(jù)所述原始語音信號的聲紋信息確定所述原始語音信號中包括預(yù)設(shè)人員語音信號時,對所述原始語音信號中所述預(yù)設(shè)人員語音信號以外的環(huán)境噪音信號進行降噪處理,獲取第一語音信號。
【文檔編號】G10L21/02GK103971696SQ201310036167
【公開日】2014年8月6日 申請日期:2013年1月30日 優(yōu)先權(quán)日:2013年1月30日
【發(fā)明者】任艷輝 申請人:華為終端有限公司