本發(fā)明涉及語音識別領(lǐng)域,具體涉及一種離線可切換喚醒詞的非特定音語音識別喚醒方法。
背景技術(shù):
目前喚醒詞技術(shù)已有廣泛應(yīng)用,比如叮咚音箱的喚醒詞“叮咚,叮咚”,小智機器人的喚醒詞“你好,小智“等,這些喚醒詞的特點是單一且基于在線系統(tǒng),而基于離線語音系統(tǒng)的喚醒詞寥寥無幾,且具有多條喚醒詞切換功能的喚醒詞系統(tǒng)就更少了。目前基于離線語音識別的喚醒詞種類較為單一,且在一個系統(tǒng)中只有一個詞匯作為喚醒詞,而無法實現(xiàn)用戶所希望的喚醒效果。其原理為:當系統(tǒng)采集用戶語音信號后和離線系統(tǒng)內(nèi)的模型進行匹配,如果比配率超過標準即為識別,而沒有達到標準即為沒有通過識別,這樣的非特定音喚醒識別方式具有地域及個人口語誤差的局限性,且喚醒詞用戶往往很被動,無法使用合適自己的喚醒詞來開啟語音識別系統(tǒng)。
技術(shù)實現(xiàn)要素:
為了解決上述不足的缺陷,本發(fā)明提供了一種離線可切換喚醒詞的非特定音語音識別喚醒方法,本發(fā)明通過設(shè)置多條喚醒詞模型供用戶選擇切換后,在針對用戶所選擇的喚醒詞模型進行識別,這樣就大大提高了喚醒詞的識別率和用戶體驗。
本發(fā)明提供了一種離線可切換喚醒詞的非特定音語音識別喚醒方法,包括:
建立多條喚醒詞模型;
用戶根據(jù)喚醒詞模型選擇相應(yīng)的喚醒詞;
監(jiān)聽用戶所選擇的喚醒詞并確認是否是用戶選擇的喚醒詞;
若監(jiān)聽到的喚醒詞是用戶選擇的,則開啟語音識別狀態(tài);若監(jiān)聽到的喚醒詞不是用戶選擇的,則返回讓用戶重新選擇。
上述的方法,其中,所述建立多條喚醒詞模型的步驟中,所述喚醒詞模型包括:“你好,思樂智”、“思樂智聲控管家”、“思樂智,智能聲控管家”中的至少一種。
上述的方法,其中,所述建立多條喚醒詞模型的步驟中,其中多條喚醒詞模型之間可以進行切換。
上述的方法,其中,當用戶選擇的喚醒詞為“你好,思樂智”后,對思樂智智能聲控管家設(shè)備便會監(jiān)聽用戶是否說出“你好思樂智”,當監(jiān)聽到用戶說出該條“你好,思樂智”后,語音識別系統(tǒng)將會被喚醒。
上述的方法,其中,當用戶切換到“思樂智聲控管家”作為喚醒詞后,當識別監(jiān)聽到用戶說出“思樂智聲控管家”后,該識別語音識別系統(tǒng)將會被喚醒。
上述的方法,其中,當用戶切換到“思樂智,智能聲控管家”作為喚醒詞后,當識別監(jiān)聽到用戶說出“思樂智智能聲控管家”后,該識別語音識別系統(tǒng)將會被喚醒。
本發(fā)明具有以下優(yōu)點:1、通過切換不同喚醒詞,可以讓更多的用戶通過離線語音識別系統(tǒng)的喚醒識別,更為有效的開啟和進入語音識別系統(tǒng),從而提高語音喚醒詞的識別率;2、通過設(shè)置多條喚醒詞模型供用戶選擇切換,在針對用戶所選擇的喚醒詞模型進行識別,這樣就大大提高了喚醒詞的識別率和用戶體驗;3、每條喚醒詞的識別人群和拒識別人群皆不相同,而多條更換的喚醒詞,擴大了系統(tǒng)喚醒詞針對識別的群體范圍,也縮小了拒識別群體的范圍,這樣大大提高了語音識別系統(tǒng)喚醒詞的識別效果,也給用戶帶來了更好的用戶體驗。
附圖說明
通過閱讀參照以下附圖對非限制性實施例所作的詳細描述,本發(fā)明及其特征、外形和優(yōu)點將會變得更明顯。在全部附圖中相同的標記指示相同的部分。并未刻意按照比例繪制附圖,重點在于示出本發(fā)明的主旨。
圖1為本發(fā)明一種離線可切換喚醒詞的非特定音語音識別喚醒方法的流程示意圖。
具體實施方式
在下文的描述中,給出了大量具體的細節(jié)以便提供對本發(fā)明更為徹底的理解。然而,對于本領(lǐng)域技術(shù)人員而言顯而易見的是,本發(fā)明可以無需一個或多個這些細節(jié)而得以實施。在其他的例子中,為了避免與本發(fā)明發(fā)生混淆,對于本領(lǐng)域公知的一些技術(shù)特征未進行描述。
為了徹底理解本發(fā)明,將在下列的描述中提出詳細的步驟以及詳細的結(jié)構(gòu),以便闡釋本發(fā)明的技術(shù)方案。本發(fā)明的較佳實施例詳細描述如下,然而除了這些詳細描述外,本發(fā)明還可以具有其他實施方式。
在本發(fā)明中要說明的是,在本發(fā)明中涉及到的第一、第二等數(shù)量限定是為了便于區(qū)分,沒有特別限定的含義。
參照圖1所示,本發(fā)明提供了一種離線可切換喚醒詞的非特定音語音識別喚醒方法,包括:
建立多條喚醒詞模型,其中喚醒詞模型包括:“你好,思樂智”、“思樂智聲控管家”、“思樂智,智能聲控管家”中的至少一種,但是并不限于上述的喚醒詞模型。
用戶根據(jù)喚醒詞模型選擇相應(yīng)的喚醒詞,例如是“你好,思樂智”、“思樂智聲控管家”、“思樂智,智能聲控管家”中的任一一種喚醒詞。
監(jiān)聽用戶所選擇的喚醒詞并確認是否是用戶選擇的喚醒詞;
若監(jiān)聽到的喚醒詞是用戶選擇的,則開啟語音識別狀態(tài);若監(jiān)聽到的喚醒詞不是用戶選擇的,則返回讓用戶重新選擇。本發(fā)明實現(xiàn)的原理為:首先用戶根據(jù)系統(tǒng)所提供的喚醒詞組中選擇一條喚醒詞設(shè)定為系統(tǒng)監(jiān)聽的喚醒詞,當用戶說出該條喚醒詞后,系統(tǒng)識別到此喚醒詞,即喚醒成功,當用戶需要更換其他喚醒詞時,則可以根據(jù)系統(tǒng)所提供喚醒詞,選擇所需要更換的喚醒詞。在本發(fā)明中,在離線非特定音的語音識別條件下,設(shè)置了三條可切換的喚醒詞,分別為:“你好,思樂智”“思樂智聲控管家”及“思樂智,智能聲控管家”由于每條喚醒詞針對的識別群體不同,而可切換的喚醒詞方法大大提高了整個語音識別系統(tǒng)喚醒詞識別的人群范圍,從而提高了該語音識別系統(tǒng)的效率。進一步,用戶可以設(shè)置自己所希望使用的喚醒詞,使得喚醒詞更符合用戶的發(fā)音習慣,從而更好的,更有效的使用基于本發(fā)明的語音識別系統(tǒng)。
本發(fā)明一優(yōu)選而非限制性的實施例中,當用戶選擇的喚醒詞為“你好,思樂智”后,對思樂智智能聲控管家設(shè)備便會監(jiān)聽用戶是否說出“你好思樂智”,當監(jiān)聽到用戶說出該條“你好,思樂智”后,語音識別系統(tǒng)將會被喚醒。
本發(fā)明一優(yōu)選而非限制性的實施例中,當用戶切換到“思樂智聲控管家”作為喚醒詞后,當識別監(jiān)聽到用戶說出“思樂智聲控管家”后,該識別語音識別系統(tǒng)將會被喚醒。
本發(fā)明一優(yōu)選而非限制性的實施例中,當用戶切換到“思樂智,智能聲控管家”作為喚醒詞后,當識別監(jiān)聽到用戶說出“思樂智智能聲控管家”后,該識別語音識別系統(tǒng)將會被喚醒。
本發(fā)明一優(yōu)選而非限制性的實施例中,本發(fā)明含有三條喚醒詞“你好,思樂智”“思樂智聲控管家”“思樂智,智能聲控管家”,系統(tǒng)用戶可以更具自身需求,選擇不同的喚醒詞,本發(fā)明所在的系統(tǒng)將會更具用戶選擇的不同喚醒詞,對用戶的語音進行監(jiān)聽,當監(jiān)聽到用戶所選擇的喚醒詞后,將會開啟語音識別狀態(tài)。其中涉及的三條喚醒詞,每一條都有適應(yīng)的識別對象,和識別效果不好的群提,當三條喚醒詞可以切換后,則大大增大了可以識別人群的群體范圍,也大大提高了該方法所在系統(tǒng)的識別效率。
以上對本發(fā)明的較佳實施例進行了描述。需要理解的是,本發(fā)明并不局限于上述特定實施方式,其中未盡詳細描述的設(shè)備和結(jié)構(gòu)應(yīng)該理解為用本領(lǐng)域中的普通方式予以實施;任何熟悉本領(lǐng)域的技術(shù)人員,在不脫離本發(fā)明技術(shù)方案范圍情況下,都可利用上述揭示的方法和技術(shù)內(nèi)容對本發(fā)明技術(shù)方案做出許多可能的變動和修飾,或修改為等同變化的等效實施例,這并不影響本發(fā)明的實質(zhì)內(nèi)容。因此,凡是未脫離本發(fā)明技術(shù)方案的內(nèi)容,依據(jù)本發(fā)明的技術(shù)實質(zhì)對以上實施例所做的任何簡單修改、等同變化及修飾,均仍屬于本發(fā)明技術(shù)方案保護的范圍內(nèi)。