本發(fā)明屬于語音識別領(lǐng)域,尤其涉及一種語音操作方法及裝置。
背景技術(shù):
現(xiàn)在的超級應(yīng)用越來越多,例如微信已經(jīng)成為一個超級app,社交、資訊、游戲、郵箱、音樂、地圖、購物、支付、理財、生活服務(wù)等各種功能一應(yīng)俱全,由此帶來的遺憾是,微信越來越臃腫了,其負(fù)面作用是,用戶不論使用任何功能,都只能按照用戶的,一步步的操作。這要求用戶不僅要準(zhǔn)確地記住微信的功能的入口,就算記住了也要進(jìn)行繁瑣的操作,才能調(diào)用相關(guān)功能,系統(tǒng)的學(xué)習(xí)成本和操作復(fù)雜度都太高。
技術(shù)實現(xiàn)要素:
本發(fā)明實施例的目的在于提供一種語音操作方法,旨在解決目前的控制方式,打開功能模塊的步驟繁瑣,操作復(fù)雜度高的問題。
本發(fā)明實施例是這樣實現(xiàn)的,一種語音操作方法,包括:
配置語音輸入的觸發(fā)操作;
利用所述語音輸入的觸發(fā)操作,接收并識別輸入的語音信號,生成語音輸入文本;
根據(jù)所述語音輸入文本獲取待操作的功能模塊,利用到達(dá)所述功能模塊的操作路徑,對所述功能模塊執(zhí)行預(yù)設(shè)操作。
本發(fā)明實施例的另一目的在于提供一種語音操作裝置,包括:
配置模塊,用于配置語音輸入的觸發(fā)操作;
識別模塊,用于利用所述語音輸入的觸發(fā)操作,接收并識別輸入的語音信號,生成語音輸入文本;
操作模塊,用于根據(jù)所述語音輸入文本獲取待操作的功能模塊,利用到達(dá)所述功能模塊的操作路徑,對所述功能模塊執(zhí)行預(yù)設(shè)操作。
在本發(fā)明實施例中,根據(jù)所述語音輸入文本獲取待操作的功能模塊,利用到達(dá)所述功能模塊的操作路徑,對所述功能模塊執(zhí)行預(yù)設(shè)操作,解決了目前的控制方式,打開功能模塊的步驟繁瑣,操作復(fù)雜度高的問題。有益效果在于將到達(dá)功能模塊的操作路徑和語音輸入相結(jié)合,提升了控制功能模塊的便捷性,進(jìn)而提高了語音操作的效率。
附圖說明
圖1是本發(fā)明實施例提供的語音操作方法的實現(xiàn)流程圖;
圖2是本發(fā)明實施例提供的語音操作方法步驟s103的實現(xiàn)流程圖;
圖3是本發(fā)明實施例提供的語音操作方法較佳的流程示意圖;
圖4是本發(fā)明實施例提供的語音操作方法,在微信上使用的較佳示意圖;
圖5是本發(fā)明實施例提供的語音操作裝置的結(jié)構(gòu)框圖。
具體實施方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
應(yīng)當(dāng)理解,當(dāng)在本說明書和所附權(quán)利要求書中使用時,術(shù)語“包括”和“包含”指示所描述特征、整體、步驟、操作、元素和/或組件的存在,但并不排除一個或多個其它特征、整體、步驟、操作、元素、組件和/或其集合的存在或添加。
還應(yīng)當(dāng)理解,在此本發(fā)明說明書中所使用的術(shù)語僅僅是出于描述特定實施例的目的而并不意在限制本發(fā)明。如在本發(fā)明說明書和所附權(quán)利要求書中所使用的那樣,除非上下文清楚地指明其它情況,否則單數(shù)形式的“一”、“一個”及“該”意在包括復(fù)數(shù)形式。
還應(yīng)當(dāng)進(jìn)一步理解,在本發(fā)明說明書和所附權(quán)利要求書中使用的術(shù)語“和/或”是指相關(guān)聯(lián)列出的項中的一個或多個的任何組合以及所有可能組合,并且包括這些組合。
如在本說明書和所附權(quán)利要求書中所使用的那樣,術(shù)語“倘若”可以依據(jù)上下文被解釋為“當(dāng)...時”或“一旦”或“響應(yīng)于確定”或“響應(yīng)于檢測到”。類似地,短語“倘若確定”或“倘若讀取到[所描述條件或事件]”可以依據(jù)上下文被解釋為意指“一旦確定”或“響應(yīng)于確定”或“一旦檢測到[所描述條件或事件]”或“響應(yīng)于檢測到[所描述條件或事件]”。
實施例一
圖1是本發(fā)明實施例提供的語音操作方法的實現(xiàn)流程圖,詳述如下:
在步驟s101中,配置語音輸入的觸發(fā)操作;
在步驟s102中,利用所述語音輸入的觸發(fā)操作,接收并識別輸入的語音信號,生成語音輸入文本;
其中,接收輸入的語音信號時,屏蔽來電鈴聲、短信鈴聲以及鬧鈴聲。
在步驟s103中,根據(jù)所述語音輸入文本獲取待操作的功能模塊,利用到達(dá)所述功能模塊的操作路徑,對所述功能模塊執(zhí)行預(yù)設(shè)操作。
其中,對所述語音輸入文本進(jìn)行解析,獲取到待操作的功能模塊,利用到達(dá)所述功能模塊的操作路徑,對所述功能模塊執(zhí)行預(yù)設(shè)操作。
其中,所述預(yù)設(shè)操作包括點擊操作、按壓操作、選擇操作之一或其組合。
其中,獲取到達(dá)所述功能模塊的操作路徑,利用獲取到的操作路徑,對所述功能模塊執(zhí)行預(yù)設(shè)操作。
其中,獲取到達(dá)所述功能模塊的操作路徑,具體為:
獲取所述語音輸入文本的關(guān)鍵詞;
在記錄的內(nèi)容中,查找是否存在包括所述關(guān)鍵詞的操作路徑;
倘若存在包括所述關(guān)鍵詞的操作路徑,且操作路徑不止一條時,顯示多個操作路徑;
在預(yù)設(shè)時間內(nèi),檢測指定的操作路徑;
倘若在預(yù)設(shè)時間內(nèi),沒有檢測到指定的操作路徑,則默認(rèn)選擇第一操作路徑作為到達(dá)所述功能模塊的操作路徑。
其中,倘若存在包括所述關(guān)鍵詞的操作路徑,且操作路徑不止一條時,顯示多個操作路徑,具體為:
倘若存在包括所述關(guān)鍵詞的操作路徑,且操作路徑不止一條時,獲取操作路徑的使用次數(shù),按使用次數(shù)的高低,依次顯示多個操作路徑。
其中,操作路徑以縮略簡圖的方式顯示。
其中,以關(guān)鍵詞為華夏星光舉例,如果華夏星光出現(xiàn)在聯(lián)系人列表、消息列表或者影院,則出現(xiàn)這三個地方的縮略簡圖,由用戶選擇。
其中,采集具備語音輸入權(quán)限的功能模塊的操作路徑,通過存儲具備語音輸入權(quán)限的功能模塊的操作路徑,生成配置文件profile。
其中,配置具備語音輸入權(quán)限的功能模塊,具體為:
顯示功能模塊列表,所述功能模塊列表中包括系統(tǒng)中的功能模塊;
檢測在所述功能模塊列表中指定的功能模塊;
獲取指定的功能模塊;
為指定的功能模塊配置語音輸入權(quán)限。
在本發(fā)明實施例中,通過根據(jù)所述語音輸入文本獲取待操作的功能模塊,利用到達(dá)所述功能模塊的操作路徑,對所述功能模塊執(zhí)行預(yù)設(shè)操作,有益效果在于以下幾個方面,詳述如下:
第一方面,通過配置語音輸入的觸發(fā)操作,當(dāng)用戶對移動終端的操作為語音輸入的觸發(fā)操作時,調(diào)起麥克風(fēng)輸入接口進(jìn)行語音輸入操作,相比原有的打開應(yīng)用程序—點擊搜索框操作—調(diào)用輸入法(文本輸入或語音輸入)—觸發(fā)搜索操作,需要的四步操作,變?yōu)橹恍枰醋≥斎胝Z音、松開觸發(fā)搜索一步操作,不但可以減少操作步驟、降低操作復(fù)雜度,而且系統(tǒng)就有了一個統(tǒng)一的語音輸入操作的入口,從而可以降低語音輸入的時間,提升系統(tǒng)使用效率。
第二方面,由于語音識別為一個系統(tǒng)級的操作,各個應(yīng)用程序也就沒有必要申請麥克風(fēng)的使用權(quán)限,或者說,系統(tǒng)可以直接限制需要安裝的應(yīng)用程序使用麥克風(fēng)功能,在大多數(shù)情況下,只有少數(shù)幾個照相功能的應(yīng)用程序可以使用麥克風(fēng),大多數(shù)只需要使用語音輸入功能的應(yīng)用程序不需要使用麥克風(fēng),這也有利于保護(hù)用戶隱私;
第三方面,將到達(dá)功能模塊的操作路徑和語音輸入相結(jié)合,提升了控制功能模塊的便捷性,進(jìn)而提高了語音操作的效率。
實施例二
本發(fā)明實施例描述了語音輸入的觸發(fā)操作的組成,詳述如下:
所述語音輸入的觸發(fā)操作包括但不限于按住應(yīng)用程序圖標(biāo)的操作、搖動移動終端的操作,拖拽應(yīng)用程序圖標(biāo)到功能入口的操作、拖拽應(yīng)用程序圖標(biāo)移動的操作,手指與圖標(biāo)區(qū)域大面積接觸的操作以及按住設(shè)定按鍵后同時點擊應(yīng)用程序圖標(biāo)的操作之一或其組合。
實施例三
本發(fā)明實施例描述了當(dāng)所述語音輸入的觸發(fā)操作為按住應(yīng)用程序圖標(biāo)的操作時,語音操作方法步驟s102的實現(xiàn)流程,詳述如下:
按住應(yīng)用程序圖標(biāo),接收并識別輸入的語音信號,生成語音輸入文本。
實施例四
本發(fā)明實施例描述了當(dāng)所述語音輸入的觸發(fā)操作為按住應(yīng)用程序圖標(biāo)的操作時,語音操作方法步驟s103的實現(xiàn)流程,詳述如下:
松開所述應(yīng)用程序圖標(biāo),根據(jù)所述語音輸入文本獲取待操作的功能模塊,利用到達(dá)所述功能模塊的操作路徑,對所述功能模塊執(zhí)行預(yù)設(shè)操作。
實施例五
本發(fā)明實施例描述了當(dāng)所述語音輸入的觸發(fā)操作不為按住應(yīng)用程序圖標(biāo)的操作時,語音操作方法步驟s103的實現(xiàn)流程,詳述如下:
根據(jù)所述語音輸入文本獲取待操作的功能模塊,啟動應(yīng)用程序,獲取所述應(yīng)用程序到達(dá)功能模塊的操作路徑,利用所述操作路徑,對所述功能模塊執(zhí)行預(yù)設(shè)操作;或者,
根據(jù)所述語音輸入文本獲取待操作的功能模塊,獲取直接到達(dá)功能模塊的操作路徑,利用直接到達(dá)功能模塊的操作路徑,對所述功能模塊執(zhí)行預(yù)設(shè)操作。
其中,直接到達(dá)所述功能模塊的操作路徑為:能夠跳過功能模塊所在的應(yīng)用程序前面的功能層級,直接操作功能模塊的路徑。
其中,在利用直接到達(dá)所述功能模塊的操作路徑之前,還包括:
檢測功能模塊所在的應(yīng)用程序是否支持輸入?yún)?shù);
倘若功能模塊所在的應(yīng)用程序不支持輸入?yún)?shù),則將語音輸入的內(nèi)容顯示在粘貼板,便于從粘貼板中提取相關(guān)的內(nèi)容,建立到達(dá)所述功能模塊的操作路徑。
其中,從粘貼板中提取相關(guān)的內(nèi)容,通過建立提取到的關(guān)鍵詞與功能模塊之間的關(guān)聯(lián),建立直接到達(dá)所述功能模塊的操作路徑。
實施例六
圖2是本發(fā)明實施例提供的語音操作方法步驟s103的實現(xiàn)流程圖,詳述如下:
在步驟s201中,檢測所述語音輸入文本的確認(rèn)操作;
在步驟s202中,倘若所述語音輸入文本得到確認(rèn),則關(guān)閉麥克風(fēng),啟動應(yīng)用程序,獲取所述應(yīng)用程序到達(dá)功能模塊的操作路徑,利用所述操作路徑,對所述功能模塊執(zhí)行預(yù)設(shè)操作。
實施例七
本發(fā)明實施例描述了語音操作方法步驟s103的另一實現(xiàn)流程,詳述如下:
根據(jù)所述語音輸入文本獲取待操作的功能模塊,在到達(dá)所述功能模塊的操作路徑的配置文件profile基礎(chǔ)上,從底層起,逐層產(chǎn)生模擬點擊事件,直至到達(dá)所述功能模塊的操作界面
實施例八
圖3是本發(fā)明實施例提供的語音操作方法較佳的流程示意圖;
1.檢測到語音輸入的觸發(fā)操作;
通過檢測用戶對移動終端進(jìn)行的操作,檢測到語音輸入的觸發(fā)操作。
2.根據(jù)所述語音輸入的觸發(fā)操作,調(diào)用系統(tǒng)的語音輸入接口,錄音并將相關(guān)的語音進(jìn)行識別,得到語音識別文本;
3.通過獲取用戶對語音識別文本的確認(rèn),判斷語音識別是否正確,如果接收到取消操作,則關(guān)閉麥克風(fēng),系統(tǒng)不做任何操作;否則,如果松開應(yīng)用程序圖標(biāo),則關(guān)閉麥克風(fēng),并打開應(yīng)用程序,并將所述輸入的文本作為應(yīng)用程序參數(shù)發(fā)送至所述應(yīng)用程序;
如果接收到取消操作,表示用戶不確認(rèn)語音識別文本;
如果接收到松開應(yīng)用程序圖標(biāo)的操作,表示用戶確認(rèn)語音識別文本。
4.根據(jù)所述輸入?yún)?shù),應(yīng)用程序調(diào)用并執(zhí)行相關(guān)的功能模塊。對于不支持所述輸入?yún)?shù)的應(yīng)用程序,系統(tǒng)可以建立到達(dá)相關(guān)功能的操作路徑的profile,并根據(jù)所述profile產(chǎn)生模擬用戶點擊的動作,直接到達(dá)相關(guān)功能模塊,執(zhí)行相關(guān)操作。
實施例九
圖4是本發(fā)明實施例提供的語音操作方法,在微信上使用的較佳示意圖,詳述如下:
比如用戶到其家附近的華夏星光是其常使用的功能之一,參照圖4,按照目前的方式,用戶在準(zhǔn)確地記住操作路徑的情況下,需要點擊6次才能到達(dá)華夏星光的操作界面,點擊順序為:微信、我、錢包、電影演出賽事、影院、華夏星光。但如果采用本發(fā)明實施例中的語音操作方法,只需要一步就可以。其過程是:
1.建立微信各個功能模塊的入口,圖4是其中一個簡單的縮略圖。該入口可以是微信提供的各功能模塊的應(yīng)用程序接口api,也可以是系統(tǒng)建立的各功能模塊的操作路徑的配置文件profile,通過系統(tǒng)或用戶維護(hù)和更新。
2.按住微信圖標(biāo),調(diào)用系統(tǒng)的麥克風(fēng)輸入接口,錄音并將相關(guān)的語音識別成文本;
3.獲取用戶對識別內(nèi)容的確認(rèn),如果不正確,用戶將手指向上滑動可以取消相關(guān)操作;否則,如果松開應(yīng)用程序圖標(biāo),則關(guān)閉麥克風(fēng),并打開應(yīng)用程序,并將所述輸入的文本作為應(yīng)用程序參數(shù)發(fā)送至所述應(yīng)用程序;
4.根據(jù)所述輸入?yún)?shù),應(yīng)用程序調(diào)用并執(zhí)行相關(guān)的功能模塊。對于不支持所述輸入?yún)?shù)的應(yīng)用程序,系統(tǒng)可以建立到達(dá)相關(guān)功能的操作路徑的profile,并根據(jù)所述profile產(chǎn)生模擬用戶點擊的動作,直接到達(dá)相關(guān)功能模塊,執(zhí)行相關(guān)操作。例如,參照圖4,用戶如果需要點擊華夏星光,在系統(tǒng)已經(jīng)建立好到達(dá)此功能模塊的路徑的profile基礎(chǔ)上,系統(tǒng)軟件從底層依次產(chǎn)生6次模擬點擊事件,到達(dá)華夏星光的操作界面,點擊順序為:微信、我、錢包、電影演出賽事、影院、華夏星光,就可以很快地直接到達(dá)用戶需要的相關(guān)功能模塊。
其中,如果華夏星光出現(xiàn)在聯(lián)系人列表、消息列表或者影院,則出現(xiàn)這三個地方的縮略簡圖,由用戶選擇,以提高語音操作方法的靈活性。
實施例十
圖5是本發(fā)明實施例提供的語音操作裝置的結(jié)構(gòu)框圖,該裝置可以運行該裝置可以運行于具備麥克風(fēng)的用戶設(shè)備中。用戶設(shè)備包括但不限于移動電話、口袋計算機(jī)(pocketpersonalcomputer,ppc)、掌上電腦、計算機(jī)、筆記本電腦、個人數(shù)字助理(personaldigitalassistant,pda)、mp4、mp3。為便于說明,僅示出了與本實施例相關(guān)的部分。
為了便于說明,僅示出了與本實施例相關(guān)的部分。
參照圖5,該語音操作裝置,包括:
配置模塊51,用于配置語音輸入的觸發(fā)操作;
識別模塊52,用于利用所述語音輸入的觸發(fā)操作,接收并識別輸入的語音信號,生成語音輸入文本;
操作模塊53,用于根據(jù)所述語音輸入文本獲取待操作的功能模塊,利用到達(dá)所述功能模塊的操作路徑,對所述功能模塊執(zhí)行預(yù)設(shè)操作。
作為本實施例的一種實現(xiàn)方式,在所述語音操作裝置中,所述語音輸入的觸發(fā)操作包括按住應(yīng)用程序圖標(biāo)的操作、搖動移動終端的操作,拖拽應(yīng)用程序到功能入口的操作、拖拽應(yīng)用程序圖標(biāo)移動的操作,手指與圖標(biāo)區(qū)域大面積接觸的操作以及按住設(shè)定按鍵后同時點擊應(yīng)用程序圖標(biāo)的操作之一或其組合。
作為本實施例的一種實現(xiàn)方式,在所述語音操作裝置中,所述識別模塊具體用于按住應(yīng)用程序圖標(biāo),接收并識別輸入的語音信號,生成語音輸入文本;
所述操作模塊具體用于松開所述應(yīng)用程序圖標(biāo),根據(jù)所述語音輸入文本獲取待操作的功能模塊,利用到達(dá)所述功能模塊的操作路徑,對所述功能模塊執(zhí)行預(yù)設(shè)操作。
作為本實施例的一種實現(xiàn)方式,在所述語音操作裝置中,所述操作模塊具體用于根據(jù)所述語音輸入文本獲取待操作的功能模塊,啟動應(yīng)用程序,獲取所述應(yīng)用程序到達(dá)功能模塊的操作路徑,利用所述操作路徑,對所述功能模塊執(zhí)行預(yù)設(shè)操作;或者,
根據(jù)所述語音輸入文本獲取待操作的功能模塊,獲取直接到達(dá)功能模塊的操作路徑,利用直接到達(dá)功能模塊的操作路徑,對所述功能模塊執(zhí)行預(yù)設(shè)操作。
作為本實施例的一種實現(xiàn)方式,在所述語音操作裝置中,所述操作模塊,還包括:
檢測單元,用于檢測所述語音輸入文本的確認(rèn)操作;
操作單元,用于倘若所述語音輸入文本得到確認(rèn),則關(guān)閉麥克風(fēng),啟動應(yīng)用程序,獲取所述應(yīng)用程序到達(dá)功能模塊的操作路徑,利用所述操作路徑,對所述功能模塊執(zhí)行預(yù)設(shè)操作。
本發(fā)明實施例方法中的步驟可以根據(jù)實際需要進(jìn)行順序調(diào)整、合并和刪減。
本發(fā)明實施例裝置和裝置中的單元可以根據(jù)實際需要進(jìn)行合并、劃分和刪減。
本發(fā)明實施例提供的裝置可以應(yīng)用在前述對應(yīng)的方法實施例中,詳情參見上述實施例的描述,在此不再贅述。
通過以上的實施方式的描述,所屬領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助軟件加必需的通用硬件的方式來實現(xiàn)。所述的程序可以存儲于可讀取存儲介質(zhì)中,所述的存儲介質(zhì),如隨機(jī)存儲器、閃存、只讀存儲器、可編程只讀存儲器、電可擦寫可編程存儲器、寄存器等。該存儲介質(zhì)位于存儲器,處理器讀取存儲器中的信息,結(jié)合其硬件執(zhí)行本發(fā)明各個實施例所述的方法。
以上所述,僅為本發(fā)明的具體實施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以權(quán)利要求的保護(hù)范圍為準(zhǔn)。