者文字信息與語音模型數(shù)據(jù)庫進行匹配;在語音命令中判斷語音指令對應的數(shù)據(jù)庫信息在終端本地不存在后傳送給服務器端,服務器端完成語音識別匹配過程。
[0043]圖2為本發(fā)明實施例的一種語音處理的方法的流程圖,如圖2所示,本實施例的方法可以包括:
[0044]S11、調(diào)取服務器端中使用頻率達到指定值的語音信息,將所述語音信息保存到本地;
[0045]S12、接收到用戶輸入的信息后,從所述信息中識別出語音特征信息并轉(zhuǎn)化為語音指令;
[0046]S13、根據(jù)所述語音指令在本地保存的語音信息中進行匹配,如未匹配到對應的語音信息,則將所述語音指令發(fā)送到服務器端進行匹配。
[0047]其中,步驟Sll中,終端可以在接收到指令后調(diào)取服務器端中使用頻率達到指定值的語音信息,也可以定期調(diào)取服務器端中使用頻率達到指定值的語音信息。
[0048]其中,步驟S12中,從所述信息中識別出語音特征信息并轉(zhuǎn)化為語音指令,具體可以包括3個步驟:
[0049]1、對輸入的語音或者文字進行特征提取,識別出語音特征信息;
[0050]2、將提取的語音信號或者文字信息與語音模型數(shù)據(jù)庫進行匹配;
[0051]3、將匹配結(jié)果進行輸出或轉(zhuǎn)化為特定的語音指令。
[0052]總之,本發(fā)明實施例的方法在保證設(shè)備的語音識別率不下降的前提下及識別速度不降低的基礎(chǔ)上,對語音識別系統(tǒng)進行了優(yōu)化,減少了用戶根據(jù)語音做識別時產(chǎn)生的錯誤概率,通過從語音模型庫中調(diào)取出所需的一部分語音數(shù)據(jù)信息到語音識別終端進行優(yōu)先識別判斷操作,使語音判別時識別能力增強,減少用戶終端的空間浪費;同時也加快了語音識別操作,使識別速度加快。
[0053]如圖3所示,為本發(fā)明應用示例的語音處理方法的流程圖,其具體步驟如下:
[0054]步驟S110、用戶終端設(shè)置存在本地的語音模型庫,對語音模型庫中的語音信息根據(jù)用戶使用頻率選取保存到本地;將設(shè)置好的語音數(shù)據(jù)庫信息存放于本地語音模型庫中,下載到終端本地并動態(tài)更新終端本地的語音模型庫;
[0055]步驟S120、用戶通過一語音識別終端發(fā)送要操作設(shè)備的語音,所述語音識別終端設(shè)置有一語音識別模塊,該語音識別模塊接收用戶發(fā)出的語音;用戶在使用一語音識別終端時,首先發(fā)出的語音被進行特征提取進入下一步的數(shù)據(jù)庫匹配過程;
[0056]步驟S130、語音識別終端接收到語音特征信息后,傳輸?shù)秸Z音緩存模塊搜索對應的優(yōu)先級最高的語音模式數(shù)據(jù)庫,搜索對應的語音信息進行模式匹配;
[0057]步驟S140、終端判斷是否所有的語音指令在語音緩存模塊中都搜索到對應的語音信息,如果是則執(zhí)行步驟S160,否則執(zhí)行步驟S150 ;
[0058]步驟S150、語音識別終端通過網(wǎng)絡(luò)將轉(zhuǎn)化后語音指令傳輸發(fā)送到服務器端中進行語音模型庫搜索對比,如搜索到對應的語音信息則進行模式匹配,將模式匹配結(jié)果傳輸給語音識別終端中的語音識別模塊;
[0059]步驟S160、在語音識別匹配結(jié)束后,根據(jù)匹配結(jié)果完成特定的操作,完成語音識別。
[0060]其中,從服務器端中發(fā)送過來的語音信息數(shù)目超出所述語音緩存模塊空間時,查詢棧底的語音信息將其從語音緩存模塊中的棧底中刪除操作,直至指令空間足夠存放。
[0061]本發(fā)明實施例可以減少了用戶在遠端服務器進行模式數(shù)據(jù)庫匹配查詢的耗時和根據(jù)語音做識別時產(chǎn)生的錯誤概率,并盡可能的所需要的存儲空間小,便于在處理器速度較低的中低端手機上實施本方法,且成本低廉。
[0062]本領(lǐng)域普通技術(shù)人員可以理解上述方法中的全部或部分步驟可通過程序來指令相關(guān)硬件完成,所述程序可以存儲于計算機可讀存儲介質(zhì)中,如只讀存儲器、磁盤或光盤等??蛇x地,上述實施例的全部或部分步驟也可以使用一個或多個集成電路來實現(xiàn)。相應地,上述實施例中的各模塊/單元可以采用硬件的形式實現(xiàn),也可以采用軟件功能模塊的形式實現(xiàn)。本發(fā)明不限制于任何特定形式的硬件和軟件的結(jié)合。
[0063]以上僅為本發(fā)明的優(yōu)選實施例,當然,本發(fā)明還可有其他多種實施例,在不背離本發(fā)明精神及其實質(zhì)的情況下,熟悉本領(lǐng)域的技術(shù)人員當可根據(jù)本發(fā)明作出各種相應的改變和變形,但這些相應的改變和變形都應屬于本發(fā)明所附的權(quán)利要求的保護范圍。
【主權(quán)項】
1.一種語音處理的方法,包括: 調(diào)取服務器端中使用頻率達到指定值的語音信息,將所述語音信息保存到本地; 接收到輸入的信息后,從所述信息中識別出語音特征信息并轉(zhuǎn)化為語音指令; 根據(jù)所述語音指令在本地保存的語音信息中進行匹配,如未匹配到對應的語音信息,則將所述語音指令發(fā)送到服務器端進行匹配。
2.如權(quán)利要求1所述的方法,其特征在于:所述調(diào)取服務器端中使用頻率達到指定值的語音信息,包括: 接收到指令后或定期調(diào)取服務器端中使用頻率達到指定值的語音信息。
3.如權(quán)利要求1所述的方法,其特征在于:將所述語音信息保存到本地,包括: 當所述語音信息的數(shù)目超出本地指定緩存模塊的存儲空間時,將所述緩存模塊中棧底的數(shù)據(jù)刪除,然后保存所述語音信息。
4.一種終端,其特征在于,包括: 調(diào)取模塊,用于調(diào)取服務器端中使用頻率達到指定值的語音信息,將所述語音信息保存到本地; 識別模塊,用于接收到輸入的信息后,從所述信息中識別出語音特征信息并轉(zhuǎn)化為語首指令; 匹配模塊,用于根據(jù)所述語音指令在本地保存的語音信息中進行匹配,如未匹配到對應的語音信息,則將所述語音指令發(fā)送到服務器端進行匹配。
5.如權(quán)利要求4所述的終端,其特征在于: 所述調(diào)取模塊,具體用于接收到指令后或定期調(diào)取服務器端中使用頻率達到指定值的語首?目息。
6.如權(quán)利要求4所述的終端,其特征在于:還包括, 所述語音緩存模塊,用于保存所述調(diào)取模塊調(diào)取的所述語音信息。
7.如權(quán)利要求6所述的終端,其特征在于: 所述語音緩存模塊,具體用于當所述語音信息的數(shù)目超出本地存儲空間時,將棧底的數(shù)據(jù)刪除,然后保存所述語音信息。
【專利摘要】本發(fā)明提供一種語音處理的方法和終端,該方法包括:調(diào)取服務器端中使用頻率達到指定值的語音信息,將所述語音信息保存到本地;接收到輸入的信息后,從所述信息中識別出語音特征信息并轉(zhuǎn)化為語音指令;根據(jù)所述語音指令在本地保存的語音信息中進行匹配,如未匹配到對應的語音信息,則將所述語音指令發(fā)送到服務器端進行匹配。本發(fā)明可以在保證識別率的前提下,提高語音識別靈活性、可控性、擴展性及資源復用性。
【IPC分類】G10L15-08, G10L15-28, G06F17-30
【公開號】CN104575494
【申請?zhí)枴緾N201310486244
【發(fā)明人】賈鑫
【申請人】中興通訊股份有限公司
【公開日】2015年4月29日
【申請日】2013年10月16日
【公告號】WO2014176894A1...