一種語音處理的方法和終端的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其涉及一種語音處理的方法和終端。
【背景技術(shù)】
[0002]進入90年代以后,在語音識別的系統(tǒng)框架方面和語音識別技術(shù)的應(yīng)用及產(chǎn)品化方面出現(xiàn)了很大的進展。語音識別技術(shù)的應(yīng)用領(lǐng)域非常廣泛,例如工業(yè)控制、教育、通信等。隨著3G手機逐漸走進普通消費者的生活,人們可以使用手機進行越來越多的功能,隨著時代的發(fā)展和進步,通過語音轉(zhuǎn)成文字或拼音;文字或拼音轉(zhuǎn)成語音的技術(shù)越來越成熟,語音模型庫的容量也越做越大,一般地在用于進行語音識別以及說話者識別的語音處理中,涉及的語音模型庫的信息量都比較大。
[0003]移動終端的內(nèi)存容量有限,目前一種方式是通過云服務(wù)器來存儲語音模式數(shù)據(jù)庫,是一種基于WEB (網(wǎng)頁)服務(wù),整合了計算、存儲與網(wǎng)絡(luò)資源的服務(wù),具備按需使用遠程查詢服務(wù)。
[0004]但是,這樣的語音識別方式在進行語音識別時由于網(wǎng)絡(luò)連接原因容易造成查詢響應(yīng)不及時的問題,尤其是網(wǎng)絡(luò)鏈路情況不是很好的情況下容易出現(xiàn)無法識別或者錯誤識另IJ,使之進行錯誤的操作。并且當(dāng)設(shè)備進行語音識別判斷時輸入語音信號,由于服務(wù)器端存儲的語音模型庫信息量較大,導(dǎo)致語音識別查詢匹配過程耗時較長,容易導(dǎo)致反應(yīng)速度下降甚至判斷時識別率下降。
[0005]因此在進行語音識別時,在保證識別率的前提下,如何提高語音識別靈活性、可控性、擴展性及資源復(fù)用性,是一個待解決的問題。
【發(fā)明內(nèi)容】
[0006]本發(fā)明要解決的技術(shù)問題是提供一種語音處理的方法和終端,減少了用戶在遠端服務(wù)器進行模式數(shù)據(jù)庫匹配查詢的耗時。
[0007]為了解決上述技術(shù)問題,本發(fā)明提供了一種語音處理的方法,包括:
[0008]調(diào)取服務(wù)器端中使用頻率達到指定值的語音信息,將所述語音信息保存到本地;
[0009]接收到輸入的信息后,從所述信息中識別出語音特征信息并轉(zhuǎn)化為語音指令;
[0010]根據(jù)所述語音指令在本地保存的語音信息中進行匹配,如未匹配到對應(yīng)的語音信息,則將所述語音指令發(fā)送到服務(wù)器端進行匹配。
[0011]進一步地,上述方法還具有下面特點:所述調(diào)取服務(wù)器端中使用頻率達到指定值的語音信息,包括:
[0012]接收到指令后或定期調(diào)取服務(wù)器端中使用頻率達到指定值的語音信息。
[0013]進一步地,上述方法還具有下面特點:將所述語音信息保存到本地,包括:
[0014]當(dāng)所述語音信息的數(shù)目超出本地指定緩存模塊的存儲空間時,將所述緩存模塊中棧底的數(shù)據(jù)刪除,然后保存所述語音信息。
[0015]為了解決上述問題,本發(fā)明還提供了一種終端,其中,包括:
[0016]調(diào)取模塊,用于調(diào)取服務(wù)器端中使用頻率達到指定值的語音信息,將所述語音信息保存到本地;
[0017]識別模塊,用于接收到輸入的信息后,從所述信息中識別出語音特征信息并轉(zhuǎn)化為語首指令;
[0018]匹配模塊,用于根據(jù)所述語音指令在本地保存的語音信息中進行匹配,如未匹配到對應(yīng)的語音信息,則將所述語音指令發(fā)送到服務(wù)器端進行匹配。
[0019]進一步地,上述終端還具有下面特點:
[0020]所述調(diào)取模塊,具體用于接收到指令后或定期調(diào)取服務(wù)器端中使用頻率達到指定值的語首?目息。
[0021]進一步地,上述終端還具有下面特點:還包括,
[0022]所述語音緩存模塊,用于保存所述調(diào)取模塊調(diào)取的所述語音信息。
[0023]進一步地,上述終端還具有下面特點:
[0024]所述語音緩存模塊,具體用于當(dāng)所述語音信息的數(shù)目超出本地存儲空間時,將棧底的數(shù)據(jù)刪除,然后保存所述語音信息。
[0025]綜上,本發(fā)明提供一種語音處理的方法和終端,可以在保證識別率的前提下,提高語音識別靈活性、可控性、擴展性及資源復(fù)用性。本發(fā)明在保證設(shè)備的語音識別率不下降的前提下,對語音識別系統(tǒng)進行了優(yōu)化,減少了用戶根據(jù)語音做識別時產(chǎn)生的錯誤概率,通過從服務(wù)器端的語音模型庫中根據(jù)用戶使用頻率動態(tài)調(diào)取出優(yōu)先級最高的一部分語音信息保存到終端本地進行優(yōu)先匹配查詢操作,使語音判別時識別速度大大提高,通過云服務(wù)器中保存全部的語音模型庫,節(jié)約了終端本地的存儲空間。
【附圖說明】
[0026]圖1為本發(fā)明實施例的語音識別系統(tǒng)的示意圖。
[0027]圖2為本發(fā)明實施例的一種語音處理的方法的流程圖。
[0028]圖3為本發(fā)明應(yīng)用示例的語音處理方法的流程圖。
【具體實施方式】
[0029]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚明白,下文中將結(jié)合附圖對本發(fā)明的實施例進行詳細說明。需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互任意組合。
[0030]圖1為本發(fā)明實施例的語音識別系統(tǒng)的示意圖,本實施例的語音識別系統(tǒng)包括通過網(wǎng)絡(luò)互相連接的至少一用戶終端和至少一服務(wù)器端。
[0031]所述用戶終端為移動設(shè)備終端,可以包括手機和平板電腦等移動終端。用戶終端根據(jù)語音識別匹配數(shù)據(jù)庫相關(guān)信息的頻率設(shè)置存在服務(wù)器端中的語音模型庫,可以動態(tài)調(diào)整將一定時間段內(nèi)使用頻率最高的一部分數(shù)據(jù)庫信息保存到終端本地,在進行語音識別匹配時優(yōu)先在終端本地查詢匹配,終端判斷本地的語音模型庫是否已經(jīng)檢索完畢,如果是繼續(xù)在遠端服務(wù)器進行匹配查詢。
[0032]如圖1所示,本實施例的終端可以包括以下模塊:
[0033]調(diào)取模塊,用于調(diào)取服務(wù)器端中使用頻率達到指定值的語音信息,將所述語音信息保存到本地;
[0034]識別模塊,用于接收到輸入的信息后,從所述信息中識別出語音特征信息并轉(zhuǎn)化為語首指令;
[0035]匹配模塊,用于根據(jù)所述語音指令在本地保存的語音信息中進行匹配,如未匹配到對應(yīng)的語音信息,則將所述語音指令發(fā)送到服務(wù)器端進行匹配。
[0036]其中,所述調(diào)取模塊可以接收到指令后或定期調(diào)取服務(wù)器端中使用頻率達到指定值的語首?目息。
[0037]在一優(yōu)選實施例中,所述終端還可以包括:
[0038]語音緩存模塊,用于保存所述調(diào)取模塊調(diào)取的所述語音信息。
[0039]其中,所述語音緩存模塊,具體用于當(dāng)所述語音信息的數(shù)目超出本地存儲空間時,將棧底的數(shù)據(jù)刪除,然后保存所述語音信息。
[0040]語音緩存模塊設(shè)置一定的存儲空間;保存當(dāng)從服務(wù)器端中查詢匹配的語音信息,當(dāng)數(shù)目超出所述語音緩存模塊的存儲空間時,將語音緩存模塊中的棧底的數(shù)據(jù)進行刪除操作,直至存儲空間足夠存放。
[0041]其中,所述識別模塊用于收集用戶發(fā)出的語音,將語音轉(zhuǎn)為文字或語音指令;或者用于收集用戶輸入的文本,將文字轉(zhuǎn)為語音。
[0042]所述服務(wù)器端為服務(wù)器包括一語音模型庫,語音模型庫包含所有用戶語音識別信息,語音模型庫負責(zé)將用戶終端提取的語音信號或