語音信號自適應調整方法、裝置、移動終端及存儲介質與流程

文檔序號：11254173閱讀：1006來源：國知局

本發(fā)明涉及移動終端技術領域，尤其涉及一種語音信號自適應調整方法、裝置、移動終端及存儲介質。

背景技術：

目前，手機的應用已經(jīng)非常普遍，手機常用的通話模式包括手持通話模式和免提通話模式，在免提通話模式下，由于每個用戶拿手機的姿勢、習慣不同，手機與本機用戶之間的距離也會有很大的差異，手機在進行收音時，這些差異會導致手機采集到的語音信號的音量各不相同，且整體音量偏小。為了通話中另一端的通話對象能夠聽清楚通話內容，需要對采集到的語音信號進行放大處理后再發(fā)送給通話對象。

現(xiàn)有技術中，在免提通話模式下，是通過自動增益控制(automaticgaincontrol，agc)自適應調整增益的方式，增大手機發(fā)送給另一端通話對象的語音信號的音量，以提升免提通話的質量。然而，通過agc自適應調整增益的方式，會對采集到的語音信號進行放大，勢必會把語音信號中的環(huán)境噪聲也放的很大，導致通話的質量降低，用戶通話體驗不好。

技術實現(xiàn)要素：

本發(fā)明的主要目的在于提供一種語音信號自適應調整方法、裝置、移動終端及存儲介質，可以解決現(xiàn)有技術中agc自適應調整增益的方式會將環(huán)境噪聲放大，導致通話的質量降低，用戶通話體驗不好。

為實現(xiàn)上述目的，本發(fā)明第一方面提供一種語音信號自適應調整方法，方法包括：

在移動終端處于免提通話模式下，實時采集環(huán)境中的語音信號，并實時獲取所述移動終端與通話者之間的距離；

解析所述語音信號，獲取所述語音信號中不同來源的各聲音的聲紋特征；

識別所述各聲音的聲紋特征中屬于所述通話者的目標聲紋特征，并確定所述目標聲紋特征所屬的聲音在所述語音信號中的語音幅值；

根據(jù)所述語音幅值及所述距離，調整所述語音信號中所述目標聲紋特征所屬的聲音的響度值及頻率值。

為實現(xiàn)上述目的，本發(fā)明第二方面提供一種語音信號自適應調整裝置，裝置包括：采集獲取模塊，用于在移動終端處于免提通話模式下，實時采集環(huán)境中的語音信號，并實時獲取所述移動終端與通話者之間的距離；

解析獲取模塊，用于解析所述語音信號，獲取所述語音信號中不同來源的各聲音的聲紋特征；

識別確定模塊，用于識別所述各聲音的聲紋特征中屬于所述通話者的目標聲紋特征，并確定所述目標聲紋特征所屬的聲音在所述語音信號中的語音幅值；

調整模塊，用于根據(jù)所述語音幅值及所述距離，調整所述語音信號中所述目標聲紋特征所屬的聲音的響度值及頻率值。

為實現(xiàn)上述目的，本發(fā)明第三方面提供一種移動終端，包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序，所述處理器執(zhí)行所述計算機程序時，實現(xiàn)第一方面提供的語音信號自適應調整方法中的各個步驟。

為實現(xiàn)上述目的，本發(fā)明第四方面提供一種存儲介質，所述存儲介質為計算機可讀存儲介質，其上存儲有計算機程序，所述計算機程序被處理器執(zhí)行時，實現(xiàn)第一方面提供的語音信號自適應調整方法中的各個步驟。

本發(fā)明提供一種語音信號自適應調整方法、裝置、移動終端及存儲介質，該方法包括：在移動終端處于免提通話模式下，實時采集環(huán)境中的語音信號，并實時獲取該移動終端與通話者之間的距離，解析該語音信號，獲取該語音信號中不同來源的各聲音的聲紋特征，識別該各聲音的聲紋特征中屬于通話者的目標聲紋特征，并確定該目標聲紋特征所屬的聲音在語音信號中的語音幅值，根據(jù)該語音幅值及上述距離，調整該語音信號中目標聲紋特征所屬的聲音的響度值及頻率值。相對于現(xiàn)有技術，在免提通話模式下，針對采集到的語音信號，通過識別該語音信號中通話者的目標聲紋特征，使得能夠根據(jù)該目標聲紋特征所屬的聲音的語音幅值及通話者與移動終端之間的距離，對目標聲紋特征所屬的聲音的響度值及頻率值進行調整，以實現(xiàn)針對通話者的聲音的調整，相對于agc自適應增益調節(jié)方式，能夠有效避免對環(huán)境噪聲放大的問題，提升通話質量，改善使用體驗。

附圖說明

為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案，下面將對實施例或現(xiàn)有技術描述中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本發(fā)明的一些實施例，對于本領域技術人員來講，在不付出創(chuàng)造性勞動的前提下，還可以根據(jù)這些附圖獲得其他的附圖。

圖1為一種移動終端的結構框圖；

圖2為本發(fā)明第一實施例中語音信號自適應調整方法的流程示意圖；

圖3為本發(fā)明第二實施例中語音信號自適應調整方法的流程示意圖；

圖4為本發(fā)明第三實施例中語音信號自適應調整方法的流程示意圖；

圖5為本發(fā)明第四實施例中語音信號自適應調整裝置的程序模塊的示意圖；

圖6為本發(fā)明第五實施例中語音信號自適應調整裝置的程序模塊的示意圖；

圖7為本發(fā)明第六實施例中語音信號自適應調整裝置的程序模塊的示意圖。

具體實施方式

為使得本發(fā)明的發(fā)明目的、特征、優(yōu)點能夠更加的明顯和易懂，下面將結合本發(fā)明實施例中的附圖，對本發(fā)明實施例中的技術方案進行清楚、完整地描述，顯然，所描述的實施例僅僅是本發(fā)明一部分實施例，而非全部實施例?；诒景l(fā)明中的實施例，本領域技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例，都屬于本發(fā)明保護的范圍。

圖1示出了一種移動終端的結構框圖。本發(fā)明實施例提供的語音信號自適應調整方法可應用于如圖1所示的移動終端10中，移動終端10可以但不限于包括：需依靠電池維持正常運行且支持網(wǎng)絡及下載功能的智能手機、筆記本、平板電腦、穿戴智能設備等。

如圖1所示，移動終端10包括存儲器101、存儲控制器102，一個或多個(圖中僅示出一個)處理器103、外設接口104、射頻模塊105、按鍵模塊106、音頻模塊107以及觸控屏幕108。這些組件通過一條或多條通訊總線/信號線109相互通訊。

可以理解，圖1所示的結構僅為示意，其并不對移動終端的結構造成限定。移動終端10還可包括比圖1所示更多或者更少的組件，或者具有與圖1所示不同的配置。圖1所示的各組件可以采用硬件、軟件或其組合實現(xiàn)。

存儲器101可用于存儲軟件程序以及模塊，如本發(fā)明實施例中的語音信號自適應調整方法及裝置對應的程序指令/模塊，處理器103通過運行存儲在存儲器101內的軟件程序以及模塊，從而執(zhí)行各種功能應用以及數(shù)據(jù)處理，即實現(xiàn)上述的語音信號自適應調整方法及裝置。

存儲器101可包括高速隨機存儲器，還可包括非易失性存儲器，如一個或者多個磁性存儲裝置、閃存、或者其他非易失性固態(tài)存儲器。在一些實例中，存儲器101可進一步包括相對于處理器103遠程設置的存儲器，這些遠程存儲器可以通過網(wǎng)絡連接至移動終端10。上述網(wǎng)絡的實例包括但不限于互聯(lián)網(wǎng)、企業(yè)內部網(wǎng)、局域網(wǎng)、移動通信網(wǎng)及其組合。處理器103以及其他可能的組件對存儲器101的訪問可在存儲控制器102的控制下進行。

外設接口104將各種輸入/輸入裝置耦合至cpu以及存儲器101。處理器103運行存儲器101內的各種軟件、指令以執(zhí)行移動終端10的各種功能以及進行數(shù)據(jù)處理。

在一些實施例中，外設接口104，處理器103以及存儲控制器102可以在單個芯片中實現(xiàn)。在其他一些實例中，他們可以分別由獨立的芯片實現(xiàn)。

射頻模塊105用于接收以及發(fā)送電磁波，實現(xiàn)電磁波與電信號的相互轉換，從而與通訊網(wǎng)絡或者其他設備進行通訊。射頻模塊105可包括各種現(xiàn)有的用于執(zhí)行這些功能的電路元件，例如，天線、射頻收發(fā)器、數(shù)字信號處理器、加密/解密芯片、用戶身份模塊(sim)卡、存儲器等等。射頻模塊105可與各種網(wǎng)絡如互聯(lián)網(wǎng)、企業(yè)內部網(wǎng)、預置類型的無線網(wǎng)絡進行通訊或者通過預置類型的無線網(wǎng)絡與其他設備進行通訊。上述的預置類型的無線網(wǎng)絡可包括蜂窩式電話網(wǎng)、無線局域網(wǎng)或者城域網(wǎng)。上述的預置類型的無線網(wǎng)絡可以使用各種通信標準、協(xié)議及技術，包括但并不限于全球移動通信系統(tǒng)(globalsystemformobilecommunication，gsm)，增強型移動通信技術(enhanceddatagsmenvironment，edge)，寬帶碼分多址技術(widebandcodedivisionmultipleaccess，w-cdma)，碼分多址技術(codedivisionaccess，cdma)，時分多址技術(timedivisionmultipleaccess，tdma)，藍牙，無線保真技術(wireless-fidelity，wifi)(如美國電氣和電子工程師協(xié)會標準ieee802.11a、ieee802.11b、ieee802.11g和/或ieee802.11n)，網(wǎng)絡電話(voiceoverinternetprotocal,voip)，全球微波互聯(lián)接入(worldwideinteroperabilityformicrowaveaccess，wi-max)，其他用于郵件、即時通訊及短消息的協(xié)議，以及任何其他合適的通訊協(xié)議。

按鍵模塊106提供用戶向移動終端進行輸入的接口，用戶可以通過按下不同的按鍵以使移動終端10執(zhí)行不同的功能。

音頻模塊107向用戶提供音頻接口，其可包括一個或多個麥克風、一個或者多個揚聲器以及音頻電路。音頻電路從外設接口104處接收聲音數(shù)據(jù)，將聲音數(shù)據(jù)轉換為電信息，將電信息傳輸至揚聲器。揚聲器將電信息轉換為人耳能聽到的聲波。音頻電路還從麥克風處接收電信息，將電信號轉換為聲音數(shù)據(jù)，并將聲音數(shù)據(jù)傳輸至外設接口104中以進行進一步的處理。音頻數(shù)據(jù)可以從存儲器101處或者通過射頻模塊105獲取。此外，音頻數(shù)據(jù)也可以存儲至存儲器101中或者通過射頻模塊105進行發(fā)送。在一些實例中，音頻模塊107還可包括一個耳機播孔，用于向耳機或者其他設備提供音頻接口。

觸控屏幕108在移動終端與用戶之間同時提供一個輸出及輸入界面。具體地，觸控屏幕108向用戶顯示視頻輸出，這些視頻輸出的內容可包括文字、圖形、視頻、及其任意組合。一些輸出結果是對應于一些用戶界面對象。觸控屏幕108還接收用戶的輸入，例如用戶的點擊、滑動等手勢操作，以便用戶界面對象對這些用戶的輸入做出響應。檢測用戶輸入的技術可以是基于電阻式、電容式或者其他任意可能的觸控檢測技術。觸控屏幕108顯示單元的具體實例包括但并不限于液晶顯示器或發(fā)光聚合物顯示器。

基于上述移動終端描述本發(fā)明實施例中語音信號自適應調整方法。

由于現(xiàn)有技術中，通過agc自適應調整增益的方式會將語音信號中的環(huán)境噪聲放大，存在導致通話質量下降，用戶通話體驗不好的技術問題。

為了解決上述問題，本發(fā)明提出一種語音信號自適應調整方法，在免提通話模式下，針對采集到的語音信號，通過識別該語音信號中通話者的目標聲紋特征，使得能夠根據(jù)該目標聲紋特征所屬的聲音的語音幅值及通話者與移動終端之間的距離，對目標聲紋特征所屬的聲音的響度值及頻率值進行調整，以實現(xiàn)針對通話者的聲音的調整，相對于agc自適應增益調節(jié)方式，能夠有效避免對環(huán)境噪聲放大的問題，提升通話質量，改善使用體驗。

請參閱圖2，為本發(fā)明第一實施例中語音信號的自適應調整方法的流程示意圖，該方法包括：

步驟201、在移動終端處于免提通話模式下，實時采集環(huán)境中的語音信號，并實時獲取所述移動終端與通話者之間的距離；

在本發(fā)明實施例中，上述的語音信號自適應調整方法由語音信號自適應調整裝置(以下簡稱為：調整裝置)實現(xiàn)，該調整裝置為程序模塊，存儲在移動終端的計算機可讀存儲介質中，可以由處理器執(zhí)行以實現(xiàn)上述方法。

在通話過程中，若移動終端處于免提通話模式下，表明當前的通話者與移動終端之間存在距離，其中，該通話者是指該移動終端的本機用戶。此時，移動終端上的麥克風將采集環(huán)境中的語音信號，該調整裝置將實時獲取到麥克風采集到的語音信號，可以理解的是，在通話者有說話的情況下，該語音信號中至少包含該通話者的聲音，且若環(huán)境中有其他聲音，麥克風也將采集到環(huán)境中存在的其他聲音。

其中，調整裝置還將實時獲取移動終端與通話者之間的距離，該距離可以通過移動終端內設置的距離傳感器檢測得到，該距離傳感器可以為光學式位移傳感器、線性接近傳感器或超聲波位移傳感器。該距離傳感器可以設置在移動終端的聽筒的兩側，或者是移動終端的聽筒的凹槽中，或者是設置在移動終端側面等等，在實際應用中，可以根據(jù)具體的需要設置距離傳感器的設置位置及使用的距離傳感器的具體類型，此次不做限定。

步驟202、解析所述語音信號，獲取所述語音信號中不同來源的各聲音的聲紋特征；

聲紋在用電學儀器顯示時，是可以觀看到的攜帶語言信息的聲波頻譜，人類語言產生時，人體語言中樞與發(fā)音器官之間有一個復雜的生物物理過程，人在講話時所使用的發(fā)聲器官包括：舌、喉頭、肺、鼻腔等等，由于每一個人的發(fā)聲器官在尺寸和形態(tài)上各不相同，所以彼此的聲紋圖譜也會存在差異。聲紋特征是聲紋所具備的特征參數(shù)，是使得聲紋可靠的參數(shù)，不同的聲紋特征可以區(qū)分不同的聲音。

在本發(fā)明實施例中，對于采集到的語音信號，將解析該語音信號，獲取該語音信號中不同來源的各聲音的聲紋特征，其中，來源可以是通話者、電視、動物、機器等等各種各樣的能夠產生聲音的人或物或設備。

步驟203、識別所述各聲音的聲紋特征中屬于所述通話者的目標聲紋特征，并確定所述目標聲紋特征所屬的聲音在所述語音信號中的語音幅值；

步驟204、根據(jù)所述語音幅值及所述距離，調整所述語音信號中所述目標聲紋特征所屬的聲音的響度值及頻率值。

在本發(fā)明實施例中，調整裝置將從不同來源的各聲音的聲紋特征中，識別哪個才是當前的通話者的聲紋特征，并將識別的聲紋特征作為目標聲紋特征，可以理解的是，通話者可以是一個或多個，且每一個通話者都有一組目標聲紋特征。且進一步的，調整裝置還將確定該目標聲紋特征所屬的聲音在語音信號中的語音幅值，其中，該目標聲紋特征所屬的聲音即是通話者的聲音，且該語音幅值是指通話者的聲音所形成的聲波中波幅的平均值，或者是波幅的最小值。

其中，調整裝置將根據(jù)語音幅值及通過距離傳感器獲取到的距離，調整語音信號中目標聲紋特征所屬的聲音的響度值及頻率值，即調整語音信號中通話者的聲音的響度值及頻率值。

其中，響度值用于衡量音量的大小，頻率值用于衡量聲音的清晰度。

需要說明的是，在完成對語音信號的調整之后，可以將該語音信號發(fā)送給另一端的通話對象所使用的移動終端，以便該通話對象能夠收聽到清晰且音量合適的語音。

在本發(fā)明實施例中，在移動終端處于免提通話模式下，實時采集環(huán)境中的語音信號，并實時獲取該移動終端與通話者之間的距離，解析該語音信號，獲取該語音信號中不同來源的各聲音的聲紋特征，識別該各聲音的聲紋特征中屬于通話者的目標聲紋特征，并確定該目標聲紋特征所屬的聲音在語音信號中的語音幅值，根據(jù)該語音幅值及上述距離，調整該語音信號中目標聲紋特征所屬的聲音的響度值及頻率值。相對于現(xiàn)有技術，在免提通話模式下，針對采集到的語音信號，通過識別該語音信號中通話者的目標聲紋特征，使得能夠根據(jù)該目標聲紋特征所屬的聲音的語音幅值及通話者與移動終端之間的距離，對目標聲紋特征所屬的聲音的響度值及頻率值進行調整，以實現(xiàn)針對通話者的聲音的調整，相對于agc自適應增益調節(jié)方式，能夠有效避免對環(huán)境噪聲放大的問題，提升通話質量，改善使用體驗。

請參閱圖3，為本發(fā)明第二實施例中語音信號自適應調整方法的流程示意圖，包括：

步驟301、在移動終端處于免提通話模式下，實時采集環(huán)境中的語音信號，并實時獲取所述移動終端與通話者之間的距離；

步驟302、解析所述語音信號，獲取所述語音信號中不同來源的各聲音的聲紋特征；

可以理解的是，步驟301和步驟302分別與第一實施例中的步驟201和步驟202描述的內容相似，請參閱第一實施例中的相關內容，此處不做贅述。

步驟303、查找預置的聲紋特征庫，判斷所述各聲音的聲紋特征中，是否存在與所述聲紋特征庫中的聲紋特征匹配的聲紋特征；

步驟304、若存在匹配的聲紋特征，則將所述匹配的聲紋特征確定為所述通話者的目標聲紋特征，并確定所述目標聲紋特征所屬的聲音在所述語音信號中的語音幅值；

在本發(fā)明實施例中，移動終端內預置了聲紋特征庫，包括一個或多個永不的聲紋特征，具體設置方式可以是：用戶通過點擊操作進入移動終端的設置界面，并選擇聲紋設置功能，以便移動終端的顯示界面顯示聲紋設置的開始按鈕，用戶點擊該按鈕之后說任意的內容，或者念出顯示界面顯示的內容，由移動終端上的麥克風采集用戶說的內容，并進行聲紋特征的分析，判斷分析得到的聲紋特征是否符合要求，若符合要求，則保存該聲紋特征至聲紋特征庫中，以完成聲紋特征的設置，若不符合要求，則顯示提示消息，提示用戶重新進行設置。通過該種方式，可以實現(xiàn)一個或多個用戶在一臺移動終端上的聲紋特征的設置。

在獲取到語音信號中各聲音的聲紋特征之后，調整裝置將查找預置的聲紋特征庫，判斷在該各聲音的聲紋特征中，是否存在與聲紋特征庫中的聲紋特征匹配的聲紋特征，具體的，對于已獲取的各種聲音的聲紋特征，依次將每一種聲音的聲紋特征與預置的聲紋特征庫中的各聲紋特征進行匹配，若聲紋特征庫中存在與某一種聲音的聲紋特征匹配的聲紋特征，則將該匹配的聲紋特征確定為通話者的目標聲紋特征，并確定該目標聲紋特征所屬的聲音在語音信號中的語音幅值。

步驟305、確定所述語音幅值與預設閾值之間的幅值差值；

步驟306、查找預置的差值與調整參數(shù)表之間的映射關系，確定與所述幅值差值對應的調整參數(shù)表；

步驟307、查找與所述幅值差值對應的調整參數(shù)表，確定與所述距離對應的目標響度值及目標頻率值；

步驟308、根據(jù)所述目標響度值及目標頻率值調整所述目標聲紋特征所屬的聲音的響度值及頻率值。

在本發(fā)明實施例中，調整裝置在得到目標聲紋特征的語音幅值及通話者與移動終端之間的距離之后，將確定該語音幅值與預設閾值之間的幅值差值，其中，該預設閾值是用于控制聲音的調整程度的。

其中，該幅值差值是用于確定調整的參數(shù)的。具體的，移動終端內預置了差值與調整參數(shù)表之間的映射關系，使得對于不同的差值需要使用不同的調整參數(shù)表，其中，該調整參數(shù)表中包含了距離、響度值及頻率值之間的映射關系。

調整裝置在查找到與幅值差值對應的調整參數(shù)表之后，將查找該調整參數(shù)表，確定與距離對應的目標響度值及目標頻率值。

進一步的，調整裝置將根據(jù)該目標響度值及目標頻率值調整該目標聲紋特征所屬的聲音的響度值及頻率值，具體的：從采集到的語音信號中提取目標聲紋特征所屬的聲音，作為目標語音信號；將該目標語音信號的響度值調整至目標響度值，將所述目標語音信號的頻率值調整至目標頻率值。

在本發(fā)明實施例中，通過預置聲紋特征庫，使得在得到語音信號中各聲音的聲紋特征之后，能夠利用該聲紋特征庫進行匹配，以便得到目標聲紋特征，并通過預置差值與調整參數(shù)表之間的映射關系，及預置調整參數(shù)表，使得能夠利用目標聲紋特征的語音幅值與預置閾值之間的差值查找上述的映射關系以確定調整參數(shù)表，并進一步的利用距離查找該調整參數(shù)表得到目標響度值及目標頻率值，以便對目標聲紋特征所屬的聲音進行細致的調整。且通過針對語音信號中目標聲紋特征所屬的聲音進行調整，相對于agc自適應增益調節(jié)方式，能夠有效避免對環(huán)境噪聲放大的問題，提升通話質量，改善使用體驗。

請參閱圖4，為本發(fā)明第三實施例中語音信號自適應調整方法的流程示意圖，包括：

步驟401、在移動終端處于免提通話模式下，實時采集環(huán)境中的語音信號，并實時獲取所述移動終端與通話者之間的距離；

步驟402、解析所述語音信號，獲取所述語音信號中不同來源的各聲音的聲紋特征；

步驟403、識別所述各聲音的聲紋特征中屬于所述通話者的目標聲紋特征，并確定所述目標聲紋特征所屬的聲音在所述語音信號中的語音幅值；

步驟404、根據(jù)所述語音幅值及所述距離，調整所述語音信號中所述目標聲紋特征所屬的聲音的響度值及頻率值；

步驟405、從所述語音信號中提取除所述目標聲紋特征以外的其他聲紋特征所屬的聲音，得到干擾語音信號；

步驟406、對所述干擾語音信號進行降噪處理。

可以理解的是，步驟401至步驟404分別與第一實施例中的步驟201至步驟204描述的內容相似，具體可以參閱第一實施例，此處不做贅述。

可以理解的是，第三實施例是在第一實施例的基礎上描述的，在另一種可行的實現(xiàn)方式中，第三實施例還可以在第二實施例的基礎上描述，此處不做贅述。

在本發(fā)明實施例中，在針對目標聲紋特征所屬的聲音進行調整后，為了進一步提高通話質量，還可以針對其他的聲音進行調整，具體的：調整裝置將從語音信號中提取除目標聲紋特征以外的其他聲紋特征所屬的聲音，得到干擾語音信號，例如，若語音信號中包含通話者的聲音、電機機播放廣告的聲音，則該通話者的聲音即為目標聲紋特征所屬的聲音，調整裝置將從該語音信號中提取電視機播放廣告的聲音，并作為干擾語音信號。進一步的，調整裝置將對該干擾語音信號進行降噪處理，以便在將調整后的語音信號發(fā)送給另一端的通話對象之后，該通話對象收聽到的語音信號中有效信號(即通話者的聲音)更加清晰且音量合適，而無效信號(即干擾語音信號)更弱。

其中，該降噪處理可以采用的方式有多種，如噪聲門降噪法、采樣降噪法、濾波降噪法等等。

在本發(fā)明實施例中，在對語音信號中目標聲紋特征所屬的聲音進行調整后，還將進一步的對語音信號中的干擾語音信號進行降噪處理，以便進一步的提升通話質量，改善通話體驗。

請參閱圖5，為本發(fā)明第四實施例中語音信號自適應調整裝置的程序模塊的示意圖，該裝置包括：

采集獲取模塊501，用于在移動終端處于免提通話模式下，實時采集環(huán)境中的語音信號，并實時獲取所述移動終端與通話者之間的距離；

在本發(fā)明實施例中，上述的語音信號自適應調整裝置為程序模塊，存儲在移動終端的計算機可讀存儲介質中，可以由處理器執(zhí)行。

在通話過程中，若移動終端處于免提通話模式下，表明當前的通話者與移動終端之間存在距離，其中，該通話者是指該移動終端的本機用戶。此時，移動終端上的麥克風將采集環(huán)境中的語音信號，采集獲取模塊501將實時獲取到麥克風采集到的語音信號，可以理解的是，在通話者有說話的情況下，該語音信號中至少包含該通話者的聲音，且若環(huán)境中有其他聲音，麥克風也將采集到環(huán)境中存在的其他聲音。

其中，采集獲取模塊501還將實時獲取移動終端與通話者之間的距離，該距離可以通過移動終端內設置的距離傳感器檢測得到，該距離傳感器可以為光學式位移傳感器、線性接近傳感器或超聲波位移傳感器。該距離傳感器可以設置在移動終端的聽筒的兩側，或者是移動終端的聽筒的凹槽中，或者是設置在移動終端側面等等，在實際應用中，可以根據(jù)具體的需要設置距離傳感器的設置位置及使用的距離傳感器的具體類型，此次不做限定。

解析獲取模塊502，用于解析所述語音信號，獲取所述語音信號中不同來源的各聲音的聲紋特征；

在本發(fā)明實施例中，對于采集到的語音信號，解析獲取模塊502將解析該語音信號，獲取該語音信號中不同來源的各聲音的聲紋特征，其中，來源可以是通話者、電視、動物、機器等等各種各樣的能夠產生聲音的人或物或設備。

識別確定模塊503，用于識別所述各聲音的聲紋特征中屬于所述通話者的目標聲紋特征，并確定所述目標聲紋特征所屬的聲音在所述語音信號中的語音幅值；

調整模塊504，用于根據(jù)所述語音幅值及所述距離，調整所述語音信號中所述目標聲紋特征所屬的聲音的響度值及頻率值。

在本發(fā)明實施例中，識別確定模塊503將從不同來源的各聲音的聲紋特征中，識別哪個才是當前的通話者的聲紋特征，并將識別的聲紋特征作為目標聲紋特征，可以理解的是，通話者可以是一個或多個，且每一個通話者都有一組目標聲紋特征。且進一步的，識別確定模塊503還將確定該目標聲紋特征所屬的聲音在語音信號中的語音幅值，其中，該目標聲紋特征所屬的聲音即是通話者的聲音，且該語音幅值是指通話者的聲音所形成的聲波中波幅的平均值，或者是波幅的最小值。

其中，調整模塊504將根據(jù)語音幅值及通過距離傳感器獲取到的距離，調整語音信號中目標聲紋特征所屬的聲音的響度值及頻率值，即調整語音信號中通話者的聲音的響度值及頻率值。

其中，響度值用于衡量音量的大小，頻率值用于衡量聲音的清晰度。

請參閱圖6，為本發(fā)明第五實施例中語音信號自適應調整裝置的程序模塊的示意圖，該裝置包括第四實施例中的采集獲取模塊501、解析獲取模塊502、識別確定模塊503及調整模塊，且與第四實施例中描述的內容相似，此處不做贅述。

在本發(fā)明實施例中，識別確定模塊503包括：

查找判斷模塊601，用于查找預置的聲紋特征庫，判斷所述各聲音的聲紋特征中，是否存在與所述聲紋特征庫中的聲紋特征匹配的聲紋特征；

目標確定模塊602，用于若存在匹配的聲紋特征，則將所述匹配的聲紋特征確定為所述通話者的目標聲紋特征；

幅值確定模塊603，用于確定所述目標聲紋特征所屬的聲音在所述語音信號中的語音幅值。

在獲取到語音信號中各聲音的聲紋特征之后，查找判斷模塊601將查找預置的聲紋特征庫，判斷在該各聲音的聲紋特征中，是否存在與聲紋特征庫中的聲紋特征匹配的聲紋特征，具體的，對于已獲取的各種聲音的聲紋特征，依次將每一種聲音的聲紋特征與預置的聲紋特征庫中的各聲紋特征進行匹配，若聲紋特征庫中存在與某一種聲音的聲紋特征匹配的聲紋特征，則目標確定模塊602將該匹配的聲紋特征確定為通話者的目標聲紋特征，并由幅值確定模塊603確定該目標聲紋特征所屬的聲音在語音信號中的語音幅值。

在本發(fā)明實施例中，調整模塊504包括：

差值確定模塊604，用于確定所述語音幅值與預設閾值之間的幅值差值；

第一查找模塊605，用于查找預置的差值與調整參數(shù)表之間的映射關系，確定與所述幅值差值對應的調整參數(shù)表；

第二查找模塊606，用于查找與所述幅值差值對應的調整參數(shù)表，確定與所述距離對應的目標響度值及目標頻率值，所述調整參數(shù)表中包含距離、響度值及頻率值之間的映射關系；

目標調整模塊607，用于根據(jù)所述目標響度值及目標頻率值調整所述目標聲紋特征所屬的聲音的響度值及頻率值。

其中，該目標調整模塊607包括：

第一提取模塊608，用于從所述語音信號中提取所述目標聲紋特征所屬的聲音，作為目標語音信號；

數(shù)據(jù)調整模塊609，用于將所述目標語音信號的響度值調整至所述目標響度值，將所述目標語音信號的頻率值調整至所述目標頻率值。

在本發(fā)明實施例中，在得到目標聲紋特征的語音幅值及通話者與移動終端之間的距離之后，差值確定模塊604將確定該語音幅值與預設閾值之間的幅值差值，其中，該預設閾值是用于控制聲音的調整程度的。

在第一查找模塊605查找到與幅值差值對應的調整參數(shù)表之后，第二查找模塊606將查找該調整參數(shù)表，確定與距離對應的目標響度值及目標頻率值。

進一步的，目標調整模塊607將根據(jù)該目標響度值及目標頻率值調整該目標聲紋特征所屬的聲音的響度值及頻率值，具體的：第一提取模塊608從采集到的語音信號中提取目標聲紋特征所屬的聲音，作為目標語音信號；數(shù)據(jù)調整模塊609將該目標語音信號的響度值調整至目標響度值，將所述目標語音信號的頻率值調整至目標頻率值。

請參閱圖7，為本發(fā)明第六實施例中語音信號自適應調整裝置的程序模塊的示意圖，包括：第四實施例中的采集獲取模塊501、解析獲取模塊502、識別確定模塊503及調整模塊504，且與第四實施例中描述的內容相似，此處不做贅述。

可以理解的是，第六實施例是在第四實施例的基礎上描述的，此外，該第六實施例還可以在第五實施例的基礎上進行描述。

在本發(fā)明實施例中，該裝置還包括：

第二提取模塊701，用于從所述語音信號中提取除所述目標聲紋特征以外的其他聲紋特征所屬的聲音，得到干擾語音信號；

降噪模塊702，用于對所述干擾語音信號進行降噪處理。

在本發(fā)明實施例中，在針對目標聲紋特征所屬的聲音進行調整后，為了進一步提高通話質量，還可以針對其他的聲音進行調整，具體的：第二提取模塊701將從語音信號中提取除目標聲紋特征以外的其他聲紋特征所屬的聲音，得到干擾語音信號，例如，若語音信號中包含通話者的聲音、電機機播放廣告的聲音，則該通話者的聲音即為目標聲紋特征所屬的聲音，調整裝置將從該語音信號中提取電視機播放廣告的聲音，并作為干擾語音信號。進一步的，降噪模塊702將對該干擾語音信號進行降噪處理，以便在將調整后的語音信號發(fā)送給另一端的通話對象之后，該通話對象收聽到的語音信號中有效信號(即通話者的聲音)更加清晰且音量合適，而無效信號(即干擾語音信號)更弱。

其中，該降噪處理可以采用的方式有多種，如噪聲門降噪法、采樣降噪法、濾波降噪法等等。

本發(fā)明實施例還提供一種移動終端，包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序，處理器執(zhí)行計算機程序時，實現(xiàn)第一實施例至第三實施例中任意一實施例中的語音信號自適應調整方法中的各個步驟。

本發(fā)明實施例還提供一種存儲介質，該存儲介質具體可以為計算機可讀存儲介質，其上存儲有計算機程序，計算機程序被處理器執(zhí)行時，實現(xiàn)第一實施例至第三實施例中任意一實施例中的語音信號自適應調整方法中的各個步驟。

在本申請所提供的幾個實施例中，應該理解到，所揭露的裝置和方法，可以通過其它的方式實現(xiàn)。例如，以上所描述的裝置實施例僅僅是示意性的，例如，所述模塊的劃分，僅僅為一種邏輯功能劃分，實際實現(xiàn)時可以有另外的劃分方式，例如多個模塊或組件可以結合或者可以集成到另一個系統(tǒng)，或一些特征可以忽略，或不執(zhí)行。另一點，所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口，裝置或模塊的間接耦合或通信連接，可以是電性，機械或其它的形式。

所述作為分離部件說明的模塊可以是或者也可以不是物理上分開的，作為模塊顯示的部件可以是或者也可以不是物理模塊，即可以位于一個地方，或者也可以分布到多個網(wǎng)絡模塊上。可以根據(jù)實際的需要選擇其中的部分或者全部模塊來實現(xiàn)本實施例方案的目的。

另外，在本發(fā)明各個實施例中的各功能模塊可以集成在一個處理模塊中，也可以是各個模塊單獨物理存在，也可以兩個或兩個以上模塊集成在一個模塊中。上述集成的模塊既可以采用硬件的形式實現(xiàn)，也可以采用軟件功能模塊的形式實現(xiàn)。

所述集成的模塊如果以軟件功能模塊的形式實現(xiàn)并作為獨立的產品銷售或使用時，可以存儲在一個計算機可讀取存儲介質中?；谶@樣的理解，本發(fā)明的技術方案本質上或者說對現(xiàn)有技術做出貢獻的部分或者該技術方案的全部或部分可以以軟件產品的形式體現(xiàn)出來，該計算機軟件產品存儲在一個存儲介質中，包括若干指令用以使得一臺計算機設備(可以是個人計算機，服務器，或者網(wǎng)絡設備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。而前述的存儲介質包括：u盤、移動硬盤、只讀存儲器(rom，read-onlymemory)、隨機存取存儲器(ram，randomaccessmemory)、磁碟或者光盤等各種可以存儲程序代碼的介質。

需要說明的是，對于前述的各方法實施例，為了簡便描述，故將其都表述為一系列的動作組合，但是本領域技術人員應該知悉，本發(fā)明并不受所描述的動作順序的限制，因為依據(jù)本發(fā)明，某些步驟可以采用其它順序或者同時進行。其次，本領域技術人員也應該知悉，說明書中所描述的實施例均屬于優(yōu)選實施例，所涉及的動作和模塊并不一定都是本發(fā)明所必須的。

在上述實施例中，對各個實施例的描述都各有側重，某個實施例中沒有詳述的部分，可以參見其它實施例的相關描述。

以上為對本發(fā)明所提供的一種語音信號自適應調整方法、裝置、移動終端及存儲介質的描述，對于本領域的技術人員，依據(jù)本發(fā)明實施例的思想，在具體實施方式及應用范圍上均會有改變之處，綜上，本說明書內容不應理解為對本發(fā)明的限制。

完整全部詳細技術資料下載

當前第1頁1 2