一種語音識別方法及系統(tǒng)的制作方法
【技術領域】
[0001]本發(fā)明涉及智能處理技術領域,尤其涉及一種語音識別方法及系統(tǒng)。
【背景技術】
[0002]與機器進行語音交流,實現(xiàn)對機器的控制,這是人們長期以來夢寐以求的事情。從上世紀50年代開始各國就已經(jīng)開始了語音識別技術的研宄,到如今已經(jīng)開始大規(guī)模應用。針對發(fā)音人的差異可以對語音識別技術分為:特定人語音識別和非特定人語音識別;非特定人語音識別技術已經(jīng)得到了廣泛的應用,特定人語音識別技術由于受限于受眾范圍,應用相對比較少,得不到廣泛應用。
[0003]目前,每個人的發(fā)音特點不一樣,很多國家的語言不一樣,各個地區(qū)的語言差異等,這些因素一直制約著語音識別技術的發(fā)展,影響語音識別的準確度。為了語音的準確識另O,每個人都很小心的放慢語速盡量標準的發(fā)音;但是每個人不可能都能實現(xiàn)準確的發(fā)音,極大的影響了大家的體驗,影響語音技術的廣泛應用和推廣。
【發(fā)明內(nèi)容】
[0004]有鑒于此,本發(fā)明實施例提供一種語音識別方法及系統(tǒng),以解決現(xiàn)有技術中的技術問題。
[0005]第一方面,本發(fā)明實施例提供了一種語音識別方法,所述的語音識別方法包括:
[0006]更新語音數(shù)據(jù)庫;
[0007]根據(jù)語音數(shù)據(jù)庫的語音信息對用戶指令語音進行識別。
[0008]進一步的,所述更新語音數(shù)據(jù)庫包括:
[0009]用戶登陸后,對用戶的語音和相應的文字說明進行采集和儲存;
[0010]調(diào)用文字說明,并根據(jù)文字說明將用戶的語音和標準語音庫的語音文件進行關聯(lián),使之匹配;
[0011]將用戶的語音和文字說明以及標準語音庫的語音文件上傳至云端語音數(shù)據(jù)庫,其中,用戶的語音和文字說明作為用戶專屬的語音數(shù)據(jù)庫存儲。
[0012]進一步的,所述文字說明和用戶的語音包含的信息相同。
[0013]進一步的,所述根據(jù)語音數(shù)據(jù)庫信息對用戶指令語音進行識別包括:
[0014]對用戶指令語音進行采集;
[0015]調(diào)用云端語音數(shù)據(jù)庫的信息與用戶指令語音進行匹配;
[0016]根據(jù)用戶的指令語音操作設備。
[0017]進一步的,所述調(diào)用云端語音數(shù)據(jù)庫的信息與用戶指令語音進行匹配包括:
[0018]調(diào)用云端語音數(shù)據(jù)庫中的預存的用戶專屬語音數(shù)據(jù)庫與用戶的指令語音進行匹配,如果預存的用戶專屬語音庫中存在與用戶的指令語音匹配的語音文件,則調(diào)用用戶專屬語音庫中的語音文件;否則,調(diào)用云端語音數(shù)據(jù)庫中的預存的標準語音庫中的語音文件進行匹配。
[0019]第二方面,本發(fā)明實施例還提供了一種語音識別系統(tǒng),所述語音識別系統(tǒng),包括登陸模塊、第一語音采集模塊、文字采集模塊、第一控制模塊、標準語音庫、本地數(shù)據(jù)庫和云端語音數(shù)據(jù)庫;
[0020]所述登陸模塊,用于用戶使用注冊名登陸;
[0021]所述第一語音采集模塊,用于對用戶的語音進行采集;
[0022]所述文字采集模塊,用于對與用戶的語音相對應的文字說明進行文字輸入和采集;
[0023]所述本地數(shù)據(jù)庫分別與第一語音模塊和文字采集模塊連接,用于存儲第一語音采集模塊中用戶的語音和與語音相對應的文字采集模塊中的文字說明;
[0024]標準語音庫,用于存儲標準的語音文件;
[0025]所述第一控制模塊分別與本地數(shù)據(jù)庫、標準語音庫和云端語音數(shù)據(jù)庫連接,用于調(diào)用文字說明,根據(jù)文字說明將用戶的語音和標準語音庫的語音文件進行關聯(lián),使之匹配,并且將用戶的語音和文字說明以及與標準語音庫的語音文件上傳至云端語音數(shù)據(jù)庫。
[0026]進一步的,所述的語音識別系統(tǒng)還包括第二語音采集模塊、第二控制模塊和控制器;
[0027]所述第二語音采集模塊與第二控制模塊,用于采集用戶的指令語音,并將用戶的指令傳遞給第二控制模塊;
[0028]所述的第二控制模塊與云端語音數(shù)據(jù)庫連接;用于將用戶的指令語音與云端語音數(shù)據(jù)庫中的語音文件進行匹配調(diào)用,并發(fā)送用戶指令;其中,如果云端語音數(shù)據(jù)庫中預存的用戶專屬語音庫中存在與用戶的指令語音匹配的語音文件,則第二控制模塊調(diào)用用戶專屬語音庫中的語音文件;否則,第二控制模塊調(diào)用云端語音數(shù)據(jù)庫中的預存的標準語音庫中的語音文件進行匹配;
[0029]所述控制器分別與第二控制模塊和外部的設備連接,用于處理用戶指令,并根據(jù)用戶指令,控制設備進行工作。
[0030]本發(fā)明的有益效果是:每個用戶都可以建立一個自己專屬的語音數(shù)據(jù)庫,并可以關聯(lián)到標準語音數(shù)據(jù)庫的對應信息;用戶專屬語音數(shù)據(jù)庫會根據(jù)用戶的使用不斷更新,不斷完善和強大,用戶專屬的語音數(shù)據(jù)庫和標準語音庫可以保存到云端語音數(shù)據(jù)庫,在任何設備上登錄后即可輕松調(diào)用自己的專屬的語音數(shù)據(jù)庫輕松進行語音操控,也可以與云端語音數(shù)據(jù)庫中標準語音庫進行匹配實現(xiàn)語音操控。
【附圖說明】
[0031]通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本發(fā)明的其它特征、目的和優(yōu)點將會變得更明顯:
[0032]圖1是本發(fā)明實施例中語音識別方法的流程圖;
[0033]圖2是本發(fā)明實施例中語音識別方法的具體實施流程圖;
[0034]圖3是本發(fā)明實施例中語音識別系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實施方式】
[0035]下面結(jié)合附圖和實施例對本發(fā)明作進一步的詳細說明??梢岳斫獾氖?,此處所描述的具體實施例僅僅用于解釋本發(fā)明,而非對本發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關的部分而非全部內(nèi)容。
[0036]如圖1所示,本發(fā)明實施例提供了一種語音識別方法,所述的語音識別方法包括:
[0037]步驟S1:更新語音數(shù)據(jù)庫;
[0038]步驟S2:根據(jù)語音數(shù)據(jù)庫的語音信息對用戶指令語音進行識別。
[0039]如圖2所示,步驟SI中所述更新語音數(shù)據(jù)庫包括:
[0040]步驟Slll:用戶登陸后,對用戶的語音和相應的文字說明進行采集和儲存;
[0041]具體的,登陸后,首先進行語音錄制,完成對用戶語音的采集,將語音進行保存;然后,輸入相對應的文字說明,完成對文字說明的采集后,將文字說明進行保存。
[0042]步驟S112:調(diào)用文字說明,并根據(jù)文字說明將用戶的語音和標準語音庫的語音文件進行關聯(lián),使之匹配;
[0043]具體的,所述文字說明和用戶的語音包含的信息相同。
[0044]步驟S113 ;將用戶的語音和文字說明以及標準語音庫的語音文件上傳至云端語音數(shù)據(jù)庫;其中,用戶的語音和文字說明作為用戶專屬的語音數(shù)據(jù)庫存儲;
[0045]具體的,云端語音數(shù)據(jù)庫中包含兩個語音庫,其中一個為標準語音庫,另一個為用戶專屬的語音庫,用戶專屬的語音數(shù)據(jù)庫中包含用戶的語音以及與之對應的文字說明。
[0046]執(zhí)行完步驟SI的更新數(shù)據(jù)庫后,執(zhí)行步驟S2:根據(jù)語音數(shù)據(jù)庫信息對用戶指令語音進行識別,其中根據(jù)語音數(shù)據(jù)庫信息對用戶指令語音進行識別包括:
[0047]步驟S114:對用戶指令語音進行采集;
[0048]具體的,對用戶指令語音進行采集時,需要用戶使用用戶名進行登錄。
[0049]步驟S115:調(diào)用云端語音數(shù)據(jù)庫的信息與用戶指令語音進行匹配;
[0050]具體的,所述調(diào)用云端語音數(shù)據(jù)庫的信息與用戶指令語音進行匹配包括:
[0051]調(diào)用云端語音數(shù)據(jù)庫中的預存的用戶專屬語音數(shù)據(jù)庫與用戶的指令語音進行匹配,如果預存的用戶專屬語音庫中存在與用戶的指令語音匹配的語音文件,則調(diào)用用戶專屬語音庫中的語音文件;否則,調(diào)用云端語音數(shù)據(jù)庫中的預存的標準語音庫中的語音文件進行匹配。
[0052]具體