一種語音處理的方法和終端的制作方法

文檔序號：8261272閱讀：304來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

一種語音處理的方法和終端的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通信技術(shù)領(lǐng)域，尤其涉及一種語音處理的方法和終端。
【背景技術(shù)】
[0002]進入90年代以后，在語音識別的系統(tǒng)框架方面和語音識別技術(shù)的應(yīng)用及產(chǎn)品化方面出現(xiàn)了很大的進展。語音識別技術(shù)的應(yīng)用領(lǐng)域非常廣泛，例如工業(yè)控制、教育、通信等。隨著3G手機逐漸走進普通消費者的生活，人們可以使用手機進行越來越多的功能，隨著時代的發(fā)展和進步，通過語音轉(zhuǎn)成文字或拼音；文字或拼音轉(zhuǎn)成語音的技術(shù)越來越成熟，語音模型庫的容量也越做越大，一般地在用于進行語音識別以及說話者識別的語音處理中，涉及的語音模型庫的信息量都比較大。
[0003]移動終端的內(nèi)存容量有限，目前一種方式是通過云服務(wù)器來存儲語音模式數(shù)據(jù)庫，是一種基于WEB (網(wǎng)頁)服務(wù)，整合了計算、存儲與網(wǎng)絡(luò)資源的服務(wù)，具備按需使用遠程查詢服務(wù)。
[0004]但是，這樣的語音識別方式在進行語音識別時由于網(wǎng)絡(luò)連接原因容易造成查詢響應(yīng)不及時的問題，尤其是網(wǎng)絡(luò)鏈路情況不是很好的情況下容易出現(xiàn)無法識別或者錯誤識另IJ，使之進行錯誤的操作。并且當(dāng)設(shè)備進行語音識別判斷時輸入語音信號，由于服務(wù)器端存儲的語音模型庫信息量較大，導(dǎo)致語音識別查詢匹配過程耗時較長，容易導(dǎo)致反應(yīng)速度下降甚至判斷時識別率下降。
[0005]因此在進行語音識別時，在保證識別率的前提下，如何提高語音識別靈活性、可控性、擴展性及資源復(fù)用性，是一個待解決的問題。

【發(fā)明內(nèi)容】

[0006]本發(fā)明要解決的技術(shù)問題是提供一種語音處理的方法和終端，減少了用戶在遠端服務(wù)器進行模式數(shù)據(jù)庫匹配查詢的耗時。
[0007]為了解決上述技術(shù)問題，本發(fā)明提供了一種語音處理的方法，包括:
[0008]調(diào)取服務(wù)器端中使用頻率達到指定值的語音信息，將所述語音信息保存到本地；
[0009]接收到輸入的信息后，從所述信息中識別出語音特征信息并轉(zhuǎn)化為語音指令；
[0010]根據(jù)所述語音指令在本地保存的語音信息中進行匹配，如未匹配到對應(yīng)的語音信息，則將所述語音指令發(fā)送到服務(wù)器端進行匹配。
[0011]進一步地，上述方法還具有下面特點:所述調(diào)取服務(wù)器端中使用頻率達到指定值的語音信息，包括:
[0012]接收到指令后或定期調(diào)取服務(wù)器端中使用頻率達到指定值的語音信息。
[0013]進一步地，上述方法還具有下面特點:將所述語音信息保存到本地，包括:
[0014]當(dāng)所述語音信息的數(shù)目超出本地指定緩存模塊的存儲空間時，將所述緩存模塊中棧底的數(shù)據(jù)刪除，然后保存所述語音信息。
[0015]為了解決上述問題，本發(fā)明還提供了一種終端，其中，包括:
[0016]調(diào)取模塊，用于調(diào)取服務(wù)器端中使用頻率達到指定值的語音信息，將所述語音信息保存到本地；
[0017]識別模塊，用于接收到輸入的信息后，從所述信息中識別出語音特征信息并轉(zhuǎn)化為語首指令；
[0018]匹配模塊，用于根據(jù)所述語音指令在本地保存的語音信息中進行匹配，如未匹配到對應(yīng)的語音信息，則將所述語音指令發(fā)送到服務(wù)器端進行匹配。
[0019]進一步地,上述終端還具有下面特點:
[0020]所述調(diào)取模塊，具體用于接收到指令后或定期調(diào)取服務(wù)器端中使用頻率達到指定值的語首?目息。
[0021]進一步地,上述終端還具有下面特點:還包括，
[0022]所述語音緩存模塊，用于保存所述調(diào)取模塊調(diào)取的所述語音信息。
[0023]進一步地,上述終端還具有下面特點:
[0024]所述語音緩存模塊，具體用于當(dāng)所述語音信息的數(shù)目超出本地存儲空間時，將棧底的數(shù)據(jù)刪除，然后保存所述語音信息。
[0025]綜上，本發(fā)明提供一種語音處理的方法和終端，可以在保證識別率的前提下，提高語音識別靈活性、可控性、擴展性及資源復(fù)用性。本發(fā)明在保證設(shè)備的語音識別率不下降的前提下，對語音識別系統(tǒng)進行了優(yōu)化，減少了用戶根據(jù)語音做識別時產(chǎn)生的錯誤概率，通過從服務(wù)器端的語音模型庫中根據(jù)用戶使用頻率動態(tài)調(diào)取出優(yōu)先級最高的一部分語音信息保存到終端本地進行優(yōu)先匹配查詢操作，使語音判別時識別速度大大提高，通過云服務(wù)器中保存全部的語音模型庫，節(jié)約了終端本地的存儲空間。
【附圖說明】
[0026]圖1為本發(fā)明實施例的語音識別系統(tǒng)的示意圖。
[0027]圖2為本發(fā)明實施例的一種語音處理的方法的流程圖。
[0028]圖3為本發(fā)明應(yīng)用示例的語音處理方法的流程圖。
【具體實施方式】
[0029]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚明白，下文中將結(jié)合附圖對本發(fā)明的實施例進行詳細說明。需要說明的是，在不沖突的情況下，本申請中的實施例及實施例中的特征可以相互任意組合。
[0030]圖1為本發(fā)明實施例的語音識別系統(tǒng)的示意圖，本實施例的語音識別系統(tǒng)包括通過網(wǎng)絡(luò)互相連接的至少一用戶終端和至少一服務(wù)器端。
[0031]所述用戶終端為移動設(shè)備終端，可以包括手機和平板電腦等移動終端。用戶終端根據(jù)語音識別匹配數(shù)據(jù)庫相關(guān)信息的頻率設(shè)置存在服務(wù)器端中的語音模型庫，可以動態(tài)調(diào)整將一定時間段內(nèi)使用頻率最高的一部分數(shù)據(jù)庫信息保存到終端本地，在進行語音識別匹配時優(yōu)先在終端本地查詢匹配，終端判斷本地的語音模型庫是否已經(jīng)檢索完畢，如果是繼續(xù)在遠端服務(wù)器進行匹配查詢。
[0032]如圖1所示，本實施例的終端可以包括以下模塊:
[0033]調(diào)取模塊，用于調(diào)取服務(wù)器端中使用頻率達到指定值的語音信息，將所述語音信息保存到本地；
[0034]識別模塊，用于接收到輸入的信息后，從所述信息中識別出語音特征信息并轉(zhuǎn)化為語首指令；
[0035]匹配模塊，用于根據(jù)所述語音指令在本地保存的語音信息中進行匹配，如未匹配到對應(yīng)的語音信息，則將所述語音指令發(fā)送到服務(wù)器端進行匹配。
[0036]其中，所述調(diào)取模塊可以接收到指令后或定期調(diào)取服務(wù)器端中使用頻率達到指定值的語首?目息。
[0037]在一優(yōu)選實施例中，所述終端還可以包括:
[0038]語音緩存模塊，用于保存所述調(diào)取模塊調(diào)取的所述語音信息。
[0039]其中，所述語音緩存模塊，具體用于當(dāng)所述語音信息的數(shù)目超出本地存儲空間時，將棧底的數(shù)據(jù)刪除，然后保存所述語音信息。
[0040]語音緩存模塊設(shè)置一定的存儲空間；保存當(dāng)從服務(wù)器端中查詢匹配的語音信息，當(dāng)數(shù)目超出所述語音緩存模塊的存儲空間時，將語音緩存模塊中的棧底的數(shù)據(jù)進行刪除操作，直至存儲空間足夠存放。
[0041]其中，所述識別模塊用于收集用戶發(fā)出的語音，將語音轉(zhuǎn)為文字或語音指令；或者用于收集用戶輸入的文本，將文字轉(zhuǎn)為語音。
[0042]所述服務(wù)器端為服務(wù)器包括一語音模型庫，語音模型庫包含所有用戶語音識別信息，語音模型庫負責(zé)將用戶終端提取的語音信號或

完整全部詳細技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：賈鑫;
技術(shù)所有人：中興通訊股份有限公司;
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

其他終端正在語音通話相關(guān)技術(shù)

語音對講終端相關(guān)技術(shù)

語音對講終端系列相關(guān)技術(shù)

語音終端相關(guān)技術(shù)

好易終端處理違章相關(guān)技術(shù)

電伴熱帶終端怎樣處理相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種語音處理的方法和終端的制作方法