一種語音輸入方法和裝置制造方法

文檔序號：6549689閱讀：223來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種語音輸入方法和裝置制造方法
【專利摘要】本發(fā)明實施例提供了一種語音輸入方法和裝置，所述方法包括：判斷在非語音輸入模式中是否監(jiān)聽到指定的操作事件；若是，則切換至語音輸入模式；其中，所述指定的操作事件包括指定按鍵的長按事件；在所述語音輸入模式中進行語音輸入處理。本發(fā)明實施例通過復(fù)用已有的按鍵，一物多用，避免了用戶進行點擊語音輸入按鍵/入口等操作，提高了用戶操作的簡便性，降低了語音輸入模式的切換時間，降低了輸入成本開銷。
【專利說明】一種語音輸入方法和裝置

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及輸入法的【技術(shù)領(lǐng)域】，特別是涉及一種語音輸入方法和一種語音輸入裝置。

【背景技術(shù)】
[0002] 目前，移動互聯(lián)網(wǎng)的快速發(fā)展帶動了移動智能設(shè)備如手機、平板電腦、穿戴式設(shè)備等的廣泛普及，而作為移動設(shè)備上人機交互最方便自然的方式之一，語音輸入正逐漸被廣大用戶所接受。
[0003] 語音輸入的過程，是一種典型的數(shù)據(jù)輸入和數(shù)據(jù)輸出過程。具體來說，涉及到錄音，錄音數(shù)據(jù)的存儲和傳送，錄音數(shù)據(jù)被語音識別引擎加工處理，最后獲取到語音識別結(jié)果等步驟。
[0004] 而傳統(tǒng)的鍵盤輸入，首先需要繪制鍵盤和實現(xiàn)按鍵監(jiān)聽，然后通過響應(yīng)按鍵事件，來完成文字輸入。
[0005] 上述語音輸入和鍵盤輸入的技術(shù)區(qū)別，決定了語音輸入和鍵盤輸入是兩套獨立的模塊。
[0006] 在某些環(huán)境，例如坐車比較顛簸，用戶使用鍵盤輸入不是很方便，此時用戶可以通過切換到語音輸入。但是，由于語音輸入獨立于鍵盤輸入，因此，用戶需要在鍵盤輸入時點擊語音輸入按鍵/入口，將鍵盤輸入切換至語音輸入，然后在語音輸入的界面中使用點擊或長按等操作進行語音輸入。使得語音切換操作繁瑣，語音輸入切換時間長。

【發(fā)明內(nèi)容】

[0007] 本發(fā)明實施例所要解決的技術(shù)問題是提供一種語音輸入方法，以提高語音輸入的操作簡便性，減少語音輸入的切換時間。
[0008] 相應(yīng)的，本發(fā)明實施例還提供了一種語音輸入裝置，用以保證上述方法的實現(xiàn)及應(yīng)用。
[0009] 為了解決上述問題，本發(fā)明公開了一種語音輸入方法，包括：
[0010] 判斷在非語音輸入模式中是否監(jiān)聽到指定的操作事件；
[0011] 若是，則切換至語音輸入模式；其中，所述指定的操作事件包括指定按鍵的長按事件、指定的滑動事件、指定的移動設(shè)備翻轉(zhuǎn)事件、指定按鍵的雙擊事件、指定手勢事件中的至少一種；
[0012] 在所述語音輸入模式中進行語音輸入處理。
[0013] 優(yōu)選地，所述判斷在非語音輸入模式中是否監(jiān)聽到指定的操作事件的步驟包括：
[0014] 在非語音輸入模式中觸發(fā)觸控位置對應(yīng)按鍵的按下事件；
[0015] 判斷是否監(jiān)聽到指定按鍵的按下事件；
[0016] 若監(jiān)聽到指定按鍵的按下事件，則判斷在預(yù)設(shè)的延遲時間內(nèi)是否監(jiān)聽到指定按鍵的松開事件；
[0017] 若未在預(yù)設(shè)的延遲時間內(nèi)監(jiān)聽到指定按鍵的松開事件，則判斷監(jiān)聽到指定按鍵的長按事件。
[0018] 優(yōu)選地，所述在非語音輸入模式中觸發(fā)屏幕點擊位置對應(yīng)按鍵的按下事件的步驟包括：
[0019] 查找觸控位置對應(yīng)的實際按鍵位置；
[0020] 觸發(fā)所述實際按鍵位置對應(yīng)按鍵的按下事件。
[0021] 優(yōu)選地，所述預(yù)設(shè)的延遲時間為N倍的按鍵時間；其中，所述按鍵時間為預(yù)先采集的，當前用戶點擊按鍵的平均按下時間，所述N為正數(shù)。
[0022] 優(yōu)選地，所述在所述語音輸入模式中進行語音輸入處理的步驟包括：
[0023] 在切換至所述語音輸入模式后預(yù)設(shè)的采集時間，采集語音數(shù)據(jù)；
[0024] 獲取根據(jù)所述語音數(shù)據(jù)所識別出的文本信息；
[0025] 顯示所述文本信息。
[0026] 優(yōu)選地，所述預(yù)設(shè)的采集時間為在預(yù)先采集當前用戶的，從監(jiān)測到觸控位置至采集到語音數(shù)據(jù)之間的平均時間。
[0027] 優(yōu)選地，所述語音數(shù)據(jù)包括一個或多個語音子數(shù)據(jù)，所述識別文本包括由所述一個或多個語音子數(shù)據(jù)識別出的一個或多個第一文本信息，所述顯示所述文本信息的步驟包括：
[0028] 當檢測到指定按鍵的按下事件時，在當前界面顯示所述一個或多個第一文本信息。
[0029] 優(yōu)選地，所述識別文本還包括由所述一個或多個語音子數(shù)據(jù)識別出的，用于替換所述第一識別文本的一個或多個第二識別文本，所述顯示所述文本信息的步驟還包括：
[0030] 當所述第一識別文本被觸發(fā)時，在當前界面顯示所述第一文本信息對應(yīng)的一個或多個第二文本信息。
[0031] 優(yōu)選地，所述在所述語音輸入模式中進行語音輸入處理的步驟包括：
[0032] 在切換至所述語音輸入模式后預(yù)設(shè)的采集時間，采集語音數(shù)據(jù)；
[0033] 輸出所述語音數(shù)據(jù)。
[0034] 優(yōu)選地，還包括：
[0035] 當監(jiān)聽到所述指定的操作事件結(jié)束時，切換至所述非語音輸入模式。
[0036] 優(yōu)選地，所述當監(jiān)聽到所述指定的操作事件結(jié)束時，切換至所述非語音輸入模式的步驟包括：
[0037] 當監(jiān)聽到所述指定按鍵的松開事件時，切換至所述非語音輸入模式。
[0038] 優(yōu)選地，還包括：
[0039] 在非語音輸入模式中未監(jiān)聽到指定的操作事件時，執(zhí)行按鍵輸入操作、信息發(fā)送操作、圖像導(dǎo)入操作、拍攝操作、位置信息導(dǎo)入操作、記錄操作、用戶信息導(dǎo)入操作、界面滾動操作、界面翻轉(zhuǎn)操作中的至少一種。
[0040] 本發(fā)明實施例還公開了一種語音輸入裝置，包括：
[0041] 操作事件判斷模塊，用于判斷在非語音輸入模式中是否監(jiān)聽到指定的操作事件；若是，則調(diào)用切換模塊；其中，所述指定的操作事件包括指定按鍵的長按事件、指定的滑動事件、指定的移動設(shè)備翻轉(zhuǎn)事件、指定按鍵的雙擊事件、指定手勢事件中的至少一種；
[0042] 語音輸入模式切換模塊，用于切換至語音輸入模式；
[0043] 語音輸入處理模塊，用于在所述語音輸入模式中進行語音輸入處理。
[0044] 優(yōu)選地，所述操作事件判斷模塊包括：
[0045] 按鍵觸發(fā)子模塊，用于在非語音輸入模塊中觸發(fā)觸控位置對應(yīng)按鍵的按下事件；
[0046] 按下事件判斷子模塊，用于判斷是否監(jiān)聽到指定按鍵的按下事件；若是，則調(diào)用松開事件判斷子模塊；
[0047] 松開事件判斷子模塊，用于判斷在預(yù)設(shè)的延遲時間內(nèi)監(jiān)聽到指定按鍵的松開事件；若否，則調(diào)用長按事件判斷子模塊；
[0048] 長按事件判斷子模塊，用于判斷監(jiān)聽到指定按鍵的長按事件。
[0049] 優(yōu)選地，所述按鍵觸發(fā)子模塊包括：
[0050] 實際按鍵位置查找子模塊，用于查找觸控位置對應(yīng)的實際按鍵位置；
[0051] 按下事件觸發(fā)子模塊，用于觸發(fā)所述實際按鍵位置對應(yīng)按鍵的按下事件。
[0052] 優(yōu)選地，所述預(yù)設(shè)的延遲時間為N倍的按鍵時間；其中，所述按鍵時間為在先采集的，當前用戶點擊按鍵的平均按下時間，所述N為正數(shù)。
[0053] 優(yōu)選地，所述語音輸入處理模塊包括：
[0054] 語音數(shù)據(jù)采集子模塊，用于在切換至所述語音輸入模式后預(yù)設(shè)的采集時間，采集語音數(shù)據(jù)；
[0055] 文本信息獲取子模塊，用于獲取根據(jù)所述語音數(shù)據(jù)所識別出的文本信息；
[0056] 文本信息顯示子模塊，用于顯示所述文本信息。
[0057] 優(yōu)選地，所述預(yù)設(shè)的采集時間為在先采集當前用戶的，從監(jiān)測到觸控位置至采集到語音數(shù)據(jù)之間的平均時間。
[0058] 優(yōu)選地，所述語音數(shù)據(jù)包括一個或多個語音子數(shù)據(jù)，所述識別文本包括由所述一個或多個語音子數(shù)據(jù)識別出的一個或多個第一文本信息，所述文本信息顯示子模塊包括：
[0059] 第一顯示子模塊，用于在檢測到指定按鍵的按下事件時，在當前界面顯示所述一個或多個第一文本信息。
[0060] 優(yōu)選地，所述識別文本還包括由所述一個或多個語音子數(shù)據(jù)識別出的，用于替換所述第一識別文本的一個或多個第二識別文本，所述文本信息顯示子模塊還包括：
[0061] 第二顯示子模塊，用于在所述第一識別文本被觸發(fā)時，在當前界面顯示所述第一文本信息對應(yīng)的一個或多個第二文本信息。
[0062] 優(yōu)選地，所述語音輸入處理模塊包括：
[0063] 語音數(shù)據(jù)采集子模塊，用于在切換至所述語音輸入模式后預(yù)設(shè)的采集時間，采集語音數(shù)據(jù)；
[0064] 語音數(shù)據(jù)輸出子模塊，用于輸出所述語音數(shù)據(jù)。
[0065] 優(yōu)選地，還包括：
[0066] 非語音輸入模式切換模塊，用于在監(jiān)聽到所述指定的操作事件結(jié)束時，切換至所述非語音輸入模式。
[0067] 優(yōu)選地，所非語音輸入模式切換模塊包括：
[0068] 指定按鍵切換子模塊，用于在監(jiān)聽到所述指定按鍵的松開事件時，切換至所述非語音輸入模式。
[0069] 優(yōu)選地，還包括：
[0070] 原操作執(zhí)行模塊，用于在非語音輸入模式中未監(jiān)聽到指定的操作事件時，執(zhí)行按鍵輸入操作、信息發(fā)送操作、圖像導(dǎo)入操作、拍攝操作、位置信息導(dǎo)入操作、記錄操作、用戶信息導(dǎo)入操作、界面滾動操作、界面翻轉(zhuǎn)操作中的至少一種。
[0071] 與【背景技術(shù)】相比，本發(fā)明實施例包括以下優(yōu)點：
[0072] 本發(fā)明實施例中在非語音輸入模式中監(jiān)聽到如指定按鍵的長按事件等指定的操作事件時，直接切換至語音輸入模式，通過復(fù)用已有的按鍵，一物多用，避免了用戶進行點擊語音輸入按鍵/入口等操作，提高了用戶操作的簡便性，降低了語音輸入模式的切換時間，降低了輸入成本開銷，并且對輸入法的修改少，開發(fā)成本低，使得可以直接在語音輸入模式中進行語音輸入處理，提高了語音輸入的效率。
[0073] 本發(fā)明實施例預(yù)先采集用戶的按鍵習慣，通過查找觸控位置對應(yīng)的實際按鍵位置，觸發(fā)該時間案件位置對應(yīng)按鍵的按下事件，提高了按鍵的觸發(fā)成功率，進而減少輸入法對錯誤按鍵的響應(yīng)，以及減少了用戶重新按鍵的操作，大大提高了按鍵的效率。
[0074] 本發(fā)明實施例可以根據(jù)用戶點擊按鍵的平均按下時間設(shè)置延遲時間，作為用戶長按操作的判斷標準，減少了默認延遲時間造成的長按操作失敗錯誤等問題的出現(xiàn)，提高了長按操作的識別準確性。
[0075] 本發(fā)明實施例可以根據(jù)用戶的輸入語音數(shù)據(jù)的習慣設(shè)定語音采集時間，即從監(jiān)測到觸控位置至采集到語音數(shù)據(jù)之間的平均時間，進行語音數(shù)據(jù)的采集，減少了默認采集時間造成的采集到空白的語音數(shù)據(jù)，或者未采集到開始部分的語音數(shù)據(jù)等問題的出現(xiàn)，提高了語音采集的效率。
[0076] 本發(fā)明實施例在監(jiān)聽到諸如指定按鍵的長按事件等指定的操作事件結(jié)束時，可以直接切換至非語音輸入模式，通過復(fù)用已有的按鍵，一物多用，避免了用戶進行點擊退回鍵等操作，提高了用戶操作的簡便性，降低了非語音輸入模式的切換時間，降低了輸入成本開銷，并且對輸入法的修改少，開發(fā)成本低，實現(xiàn)了非語音輸入模式和語音輸入模式之間的無痕切換。

【專利附圖】

【附圖說明】
[0077] 圖1是本發(fā)明的一種語音輸入方法實施例1的步驟流程圖；
[0078] 圖2是本發(fā)明的一種九宮格鍵盤的示例圖；
[0079] 圖3是本發(fā)明的一種全鍵盤的示例圖；
[0080] 圖4是本發(fā)明的一種語音輸入方法實施例2的步驟流程圖；
[0081] 圖5是本發(fā)明的一種語音輸入裝置實施例1的結(jié)構(gòu)框圖；
[0082] 圖6是本發(fā)明的一種語音輸入裝置實施例2的結(jié)構(gòu)框圖。

【具體實施方式】
[0083] 為使本發(fā)明的上述目的、特征和優(yōu)點能夠更加明顯易懂，下面結(jié)合附圖和具體實施方式對本發(fā)明作進一步詳細的說明。
[0084] 參照圖1，示出了本發(fā)明的一種語音輸入方法實施例1的步驟流程圖，具體可以包括如下步驟：
[0085] 步驟101，判斷在非語音輸入模式中是否監(jiān)聽到指定的操作事件；若是，則執(zhí)行步驟 102 ;
[0086] 需要說明的是，本發(fā)明實施例可以應(yīng)用于輸入法中，該輸入法可以為一個 APP (Application，第三方應(yīng)用程序），安裝在具有觸摸屏幕的設(shè)備中。該設(shè)備可以包括平板電腦、個人數(shù)字助理、手機等等，本發(fā)明實施例對此不作限制。
[0087] 在該輸入法中，可以存在至少兩種輸入模式，即語音輸入模式和非語音輸入模式。
[0088] 語音輸入模式，可以為米用語音的方式輸入文本信息的模式。在語音輸入模式中，輸入法可以識別出用戶輸入的語音數(shù)據(jù)所對應(yīng)的文本信息。
[0089] 非語音輸入模式，可以為米用非語音的方式輸入文本信息的模式。
[0090] 其中，非語音輸入模式可以包括鍵盤輸入模式、手寫輸入模式等等。
[0091] 鍵盤輸入模式，可以為米用鍵盤的方式輸入文本信息的模式。在鍵盤輸入模式中，輸入法可以根據(jù)鍵盤中的按鍵，按照拼音、筆畫、五筆等編碼規(guī)則計算出文本信息。
[0092] 其中，該鍵盤可以為如圖2所示的九宮格鍵盤，即以1-9共9個數(shù)字按鍵作為輸入鍵盤；該鍵盤也可以為如圖3所示的全鍵盤，即以A-Z共26個字母按鍵作為輸入鍵盤，等等。
[0093] 手寫輸入模式，可以為米用手寫的方式輸入文本信息的模式。在手寫模式中，輸入法可以根據(jù)用戶在觸控屏幕中的滑動軌跡，識別出與該滑動軌跡相似或相同的文本信息。 [0094] 當然，上述非語音輸入模式只是作為示例，在實施本發(fā)明實施例時，可以根據(jù)實際情況設(shè)置其他非語音輸入模式，本發(fā)明實施例對此不加以限制。另外，除了上述非語音輸入模式外，本領(lǐng)域技術(shù)人員還可以根據(jù)實際需要采用其它非語音輸入模式，本發(fā)明實施例對此也不加以限制。
[0095] 在具體實現(xiàn)中，所述指定的操作事件可以包括指定按鍵的長按事件，而該指定按鍵可以在非語音輸入模式中，預(yù)設(shè)有除觸發(fā)語音模式以外的功能。例如，空格鍵可以預(yù)設(shè)有輸入空格的功能，刪除鍵可以預(yù)設(shè)有刪除文本信息的功能，等等。
[0096] 所述指定的操作事件也可以包括指定的滑動事件，即本發(fā)明實施例可以根據(jù)指定的滑動方向和軌跡觸發(fā)語音輸入模式。
[0097] 當然，所述指定的操作事件也可以包括其他操作事件，例如指定的移動設(shè)備翻轉(zhuǎn) 事件、指定按鍵的雙擊事件、指定手勢事件等等，本發(fā)明實施例對此不加以限制。
[0098] 為使本領(lǐng)域技術(shù)人員更好地理解本發(fā)明實施例，在本說明書中，將指定按鍵的長按事件作為指定的操作事件的一種示例進行說明。
[0099] 在本發(fā)明的一種優(yōu)選實施例中，步驟101可以包括如下子步驟：
[0100] 子步驟S11，在非語音輸入模塊中觸發(fā)觸控位置對應(yīng)按鍵的按下事件；
[0101] 觸控位置可以為用戶在設(shè)備的觸摸屏幕上按下的位置。
[0102] 在本發(fā)明實施例的一種優(yōu)選示例中，本發(fā)明實施例可以不對觸控位置進行修正，即直接觸發(fā)觸控位置所在按鍵的按下事件。
[0103] 在本發(fā)明實施例的另一種優(yōu)選示例中，步驟S11可以包括如下子步驟：
[0104] 子步驟S111，查找觸控位置對應(yīng)的實際按鍵位置；
[0105] 子步驟S112,觸發(fā)所述實際按鍵位置對應(yīng)按鍵的按下事件。
[0106] 在實際應(yīng)用中，每個用戶的按鍵習慣都可能有所不同。但是，同一個用戶按鍵習慣一般會有一定的規(guī)律性。例如，某個用戶習慣用右手拿著手機，再采用右手拇指點擊按鍵，使得觸控位置經(jīng)常出現(xiàn)在按鍵偏右的位置。
[0107] 因此，在本示例中，可以預(yù)先采集用戶的按鍵習慣，即用戶在使用輸入法輸入文本信息時，觸控位置與實際按鍵位置之間的關(guān)系，再采用改按鍵習慣對觸控位置進行修正。
[0108] 則按鍵習慣可以決定觸控位置是否觸發(fā)按鍵的按下事件，如果用戶的按鍵習慣是觸控位置相對于實際按鍵位置整體偏右，則即使用戶本次的觸控位置相較于實際按鍵位置偏右，也會認為是需要點擊相應(yīng)的實際按鍵位置。
[0109] 本發(fā)明實施例預(yù)先采集用戶的按鍵習慣，通過查找觸控位置對應(yīng)的實際按鍵位置，觸發(fā)該時間案件位置對應(yīng)按鍵的按下事件，提高了按鍵的觸發(fā)成功率，進而減少輸入法對錯誤按鍵的響應(yīng)，以及減少了用戶重新按鍵的操作，大大提高了按鍵的效率。
[0110] 子步驟S12,判斷是否監(jiān)聽到指定按鍵的按下事件；若是，則執(zhí)行子步驟S13 ;
[0111] 在具體實現(xiàn)中，可以預(yù)先在輸入法的配置文件中定義指定按鍵的長按事件。
[0112] 以下以空格鍵作為示例進行說明，該配置文件可以為如下設(shè)置：
[0113] [Key_Space_py9]
[0114] Η = 0.232
[0115] W = 0.2833
[0116] S_KEYS = Key_Space
[0117] L_KEY = Key_Voice
[0118] TYPE = 2
[0119] S_FLAG = 0
[0120] 其中，通過Key_Space_py9和L_KEY，可以看到在九空格鍵盤上，空格鍵的長按事件由Key_Voice對應(yīng)的按鍵事件邏輯處理。
[0121] 在本不例，可以通過覆蓋ViewGroup類的onTouchEvent (MotionEvent me)方法來監(jiān)聽屏幕的觸摸事件，如按鍵的按下、滑動和松開等事件。
[0122] 子步驟S13,判斷在預(yù)設(shè)的延遲時間內(nèi)是否監(jiān)聽到指定按鍵的松開事件；若否，則執(zhí)行子步驟S14 ;
[0123] 子步驟S14,判斷監(jiān)聽到指定按鍵的長按事件。
[0124] 如果onTouchEvent方法監(jiān)測到按下事件對應(yīng)的按鍵是指定按鍵（例如空格鍵），那么輸入法將可以發(fā)送一個延遲消息。
[0125] 以Android (安卓）系統(tǒng)的設(shè)備為例，輸入法可以通過Handler機制發(fā)送一個延遲消息。
[0126] Android系統(tǒng)的Handler機制支持消息隊列和消息調(diào)度，調(diào)用者可以指定消息發(fā) 送的延遲時間，也可以隨時刪除已經(jīng)在消息隊列的消息。
[0127] Handler機制使用到的原型函數(shù)可以為：
[0128] sendEmptyMessageDelayed(int what, long delayMillis)；
[0129] removeMessages(int what)〇
[0130] 如果在指定的延遲時間內(nèi)，沒有監(jiān)測到指定按鍵（例如空格鍵）的松開事件，即指定按鍵（例如空格鍵）沒有被松開，那么可以認為監(jiān)聽到指定按鍵（例如空格鍵）的長按事件。
[0131] 當然，上述指定按鍵只是作為示例，在實施本發(fā)明實施例時，可以根據(jù)實際情況設(shè) 置其他指定按鍵，例如刪除鍵、數(shù)字鍵、字母鍵等等，本發(fā)明實施例對此不加以限制。另外，除了上述指定按鍵外，本領(lǐng)域技術(shù)人員還可以根據(jù)實際需要采用其它指定按鍵，本發(fā)明實施例對此也不加以限制。
[0132] 在本發(fā)明實施例的一種優(yōu)選示例中，該預(yù)設(shè)的采集時間可以為一個默認值，例如 500ms〇
[0133] 在本發(fā)明實施例的另一種優(yōu)選示例中，所述預(yù)設(shè)的延遲時間可以為N倍的按鍵時間；其中，所述按鍵時間可以為在先采集的，當前用戶點擊按鍵的平均按下時間，所述N為正數(shù)。
[0134] 由于不同用戶的輸入速度有所不同，即按鍵時間間隔會有所不同，造成了不同用戶按鍵的按下時間也有所不同。則在本示例中，可以根據(jù)用戶按鍵的按下時間作為該用戶長按操作的判斷標準。
[0135] 具體而言，可以預(yù)先收集用戶按鍵的按下時間，然后計算平均值。如果某次點擊按鍵的按下時間超過平均按下時間的N(例如2)倍，即可判斷該操作為長按。
[0136] 例如，某用戶點擊按鍵的平均按下時間為200ms，假設(shè)N為2,則在某次按下按鍵的按下時間超過400ms后，便可以響應(yīng)該操作為長按操作。
[0137] 本發(fā)明實施例可以根據(jù)用戶點擊按鍵的平均按下時間設(shè)置延遲時間，作為用戶長按操作的判斷標準，減少了默認延遲時間造成的長按操作失敗錯誤等問題的出現(xiàn)，提高了長按操作的識別準確性。
[0138] 步驟102,切換至語音輸入模式；
[0139] 在輸入法中，非語音輸入模式和語音輸入模式均可具有對應(yīng)的模塊，當需要切換至語音輸入模式時，啟動該語音輸入模式對應(yīng)的模塊即可。
[0140] 較佳地，在切換至語音輸入模式時，可以根據(jù)當前非語音輸入模式的界面屬性，例如鍵盤類型、鍵盤大小、屏幕尺寸等等等，繪制出語音交互視圖，以提示用戶輸入法切換至語音輸入模式。
[0141] 步驟103,在所述語音輸入模式中進行語音輸入處理。
[0142] 在切換至語音輸入模式后，用戶可以進行語音輸入，輸入法則可以進行語音輸入處理。
[0143] 在本發(fā)明的一種優(yōu)選實施例中，步驟103可以包括如下子步驟：
[0144] 子步驟S21，在切換至所述語音輸入模式后預(yù)設(shè)的采集時間，采集語音數(shù)據(jù)；
[0145] 在本發(fā)明實施例的一種優(yōu)選示例中，該預(yù)設(shè)的采集時間可以為一個默認值。
[0146] 在本發(fā)明實施例的另一種優(yōu)選示例中，所述預(yù)設(shè)的采集時間可以為在先采集當前用戶的，從監(jiān)測到觸控位置至采集到語音數(shù)據(jù)之間的平均時間。
[0147] 則在本示例中，可以記錄在先用戶在按下按鍵（即監(jiān)測到觸控位置）后，到采集到語音數(shù)據(jù)的時間差，取該時間的平均值作為從按下后開始采集語音數(shù)據(jù)的采集時間。
[0148] 本發(fā)明實施例可以根據(jù)用戶的輸入語音數(shù)據(jù)的習慣設(shè)定語音采集時間，即從監(jiān)測到觸控位置至采集到語音數(shù)據(jù)之間的平均時間，進行語音數(shù)據(jù)的采集，減少了默認采集時間造成的采集到空白的語音數(shù)據(jù)，或者未采集到開始部分的語音數(shù)據(jù)等問題的出現(xiàn)，提高了語音采集的效率。
[0149] 子步驟S22,獲取根據(jù)所述語音數(shù)據(jù)所識別出的文本信息；
[0150] 語音識別技術(shù)，也可以稱為自動語音識別（Automatic Speech Recognition, ASR)，其任務(wù)是把用戶所發(fā)出的語音數(shù)據(jù)中的詞匯內(nèi)容轉(zhuǎn)換為計算機可讀入的文本。語音識別技術(shù)是一種綜合性的技術(shù)，它涉及到多個學(xué)科領(lǐng)域，如發(fā)聲機理和聽覺機理、信號處理、概率論和信息論、模式識別以及人工智能等等。
[0151] 在具體實現(xiàn)中，可以將語音數(shù)據(jù)發(fā)送至服務(wù)器，由服務(wù)器識別出該語音數(shù)據(jù)對應(yīng) 的文本信息。
[0152] 應(yīng)用本發(fā)明實施例，可以在服務(wù)器部署的語音識別系統(tǒng)，其可以在聲學(xué)模型 (Acoustic Model，AM)與語言模型（Language Model,LM)的指導(dǎo)下針對接收到的語音數(shù)據(jù) 識別得到一個或多個文本信息，該文本信息可以具有對應(yīng)的識別評分。
[0153] 聲學(xué)模型（Acoustic Model，AM)是自動語音識別系統(tǒng)的模型中最底層的部分，同時也是自動語音識別系統(tǒng)中最關(guān)鍵的組成單元，聲學(xué)模型建模的好壞會直接從根本上影響語音識別系統(tǒng)的識別效果和魯棒性。聲學(xué)模型實驗概率統(tǒng)計的模型對帶有聲學(xué)信息的語音基本單元建立模型，描述其統(tǒng)計特性。通過對聲學(xué)模型的建模，可以較有效地衡量語音的特征矢量序列和每一個發(fā)音模板之間的相似度，可以有助于判斷該段語音的聲學(xué)信息，即語音的內(nèi)容。語者的語音內(nèi)容都是由一些基本的語音單元組成，這些基本的語音單元可以是句子、詞組、詞、音節(jié)（syllable)、子音節(jié)（Sub-syllable)或者音素等。
[0154] 由于語音信號的時變性、噪聲和其它一些不穩(wěn)定因素，單純靠聲學(xué)模型無法達到較高的語音識別的準確率。在人類語言中，每一句話的單詞直接有密切的聯(lián)系，這些單詞層面的信息可以減少聲學(xué)模型上的搜索范圍，有效地提高識別的準確性，要完成這項任務(wù)，語言模型是必不可少的，它提供了語言中詞之間的上下文信息以及語義信息。語言模型 (Language Model，LM)具體可以包括N-Gram模型、馬爾可夫N兀模型（Markov N-gram)、指數(shù)模型（Exponential Models)、決策樹模型（Decision Tree Models)等等。而N-Gram模型是最常被使用的統(tǒng)計語言模型，特別是二元語言模型（bigram)、三元語言模型（trigram)。
[0155] 當然，應(yīng)用本發(fā)明實施例，也可以在設(shè)備本地部署語音識別系統(tǒng)針對接收到的語音數(shù)據(jù)識別得到一個或多個文本信息，該文本信息可以具有對應(yīng)的識別評分。
[0156] 子步驟S23,顯示所述文本信息。
[0157] 在本發(fā)明實施例中，當接收到文本信息后，可以進行輸入法界面顯示處理。
[0158] 在本發(fā)明實施例的一種優(yōu)選示例中，所述語音數(shù)據(jù)可以包括一個或多個語音子數(shù) 據(jù)，所述識別文本可以包括由所述一個或多個語音子數(shù)據(jù)識別出的一個或多個第一文本信息，步驟S23可以包括如下子步驟：
[0159] 子步驟S231，當檢測到指定按鍵的按下事件時，在當前界面顯示所述一個或多個第一文本信息。
[0160] 本發(fā)明實施例中，可以采用連續(xù)語音識別技術(shù)，將語音數(shù)據(jù)通過靜音檢測被劃分為多個語音子數(shù)據(jù)，對于每個語音子數(shù)據(jù)，都可以通過聲學(xué)模型和通過語言模型識別出多個候選識別文本，然后再通過用戶語言模型重排序，再分別計算置信度。
[0161] 而靜音檢測會可以按照時間順序檢測語音數(shù)據(jù)中存在的靜音，將輸入的語音數(shù)據(jù) 根據(jù)語音數(shù)據(jù)中一定長度的靜音進行了切分，分為了很多語音子數(shù)據(jù)。比如，語音數(shù)據(jù)為 "我今天想吃面條[0. 2秒靜音]但是食堂沒有賣面食的[0. 3秒靜音]我們出去吃吧"，靜音檢測會判斷語音數(shù)據(jù)中的靜音長度，然后按照一定的閾值（上例中選用0. 15秒作為判定是否要切分語音數(shù)據(jù)的閾值）將上述語音切為3段語音子數(shù)據(jù)"我今天想吃面條"、"但是食堂沒有賣面食的" "我們出去吃吧"。
[0162] 其中，該第一文本信息可以為識別語音數(shù)據(jù)時識別評分最高的文本信息，可以優(yōu) 先在輸入法界面顯示。
[0163] 例如，用戶輸入的語音數(shù)據(jù)，原話可以為"今天天氣很好"，進行語義識別后，可以分別識別為"今天"、"天氣"和"很好"，在當前輸入法界面顯示。
[0164] 當然，本發(fā)明實施例中，也可以不進行文本信息的切分，即第一文本信息可以為語音數(shù)據(jù)所識別出的文本信息本身。
[0165] 在本發(fā)明實施例的另一種優(yōu)選示例中，所述識別文本還可以包括用于替換所述第一識別文本的一個或多個第二識別文本，步驟S23還可以包括如下子步驟：
[0166] 子步驟S232,當所述第一識別文本被觸發(fā)時，在當前界面顯示所述第一文本信息對應(yīng)的一個或多個第二文本信息。
[0167] 在具體實現(xiàn)中，該第二文本信息可以為識別語音數(shù)據(jù)時識別評分比第一文本信息低的文本信息。
[0168] 當用戶點擊輸入法界面顯示的第一文本信息后，輸入法可以判斷出光標當前位于哪一個區(qū)間（即第一文本信息），并展示出該區(qū)間的其他候選結(jié)果（即第二文本信息）供用戶選擇。
[0169] 例如，用戶輸入的語音數(shù)據(jù)，原話可以為"今天天氣很好"，進行語義識別后，可以分別識別為"今天"、"天氣"和"很好"，在當前輸入法界面顯示。當用戶點擊"今天"時，可以顯示用于替代"今天"的"金田"、"金天"等詞語。當用戶點擊"金田"時，則可以用"金田" 替代"今天"。
[0170] 在本發(fā)明的另一種優(yōu)選實施例中，步驟103可以包括如下子步驟：
[0171] 子步驟S31，在切換至所述語音輸入模式后預(yù)設(shè)的采集時間，采集語音數(shù)據(jù)；
[0172] 子步驟S32,輸出所述語音數(shù)據(jù)。
[0173] 本發(fā)明實施例中，可以直接輸出所采集到的語音數(shù)據(jù)。
[0174] 例如，用戶之間可以采用即時通訊工具中進行交流，輸入法可以當前用戶發(fā)出的語音數(shù)據(jù)發(fā)送至對方，使得用戶雙方可以基于語音數(shù)據(jù)進行交流。
[0175] 本發(fā)明實施例中在非語音輸入模式中監(jiān)聽到如指定按鍵的長按事件等指定的操作事件時，直接切換至語音輸入模式，通過復(fù)用已有的按鍵，一物多用，避免了用戶進行點擊語音輸入按鍵/入口等操作，提高了用戶操作的簡便性，降低了語音輸入模式的切換時間，降低了輸入成本開銷，并且對輸入法的修改少，開發(fā)成本低，使得可以直接在語音輸入模式中進行語音輸入處理，提高了語音輸入的效率。
[0176] 參照圖4,示出了本發(fā)明的一種語音輸入方法實施例2的步驟流程圖，具體可以包括如下步驟：
[0177] 步驟401，判斷在非語音輸入模式中是否監(jiān)聽到指定的操作事件；若是，則執(zhí)行步驟402 ;若否，則執(zhí)行步驟405 ;其中，所述指定的操作事件包括指定按鍵的長按事件、指定的滑動事件、指定的移動設(shè)備翻轉(zhuǎn)事件、指定按鍵的雙擊事件、指定手勢事件中的至少一種；
[0178] 步驟402,切換至語音輸入模式；
[0179] 步驟403,在所述語音輸入模式中進行語音輸入處理；
[0180] 步驟404,當監(jiān)聽到所述指定的操作事件結(jié)束時，切換至所述非語音輸入模式；
[0181] 在傳統(tǒng)的輸入法中，用戶若要在非語音輸入模式時進行語音輸入，首先需要點擊語音輸入按鍵啟動語音輸入模式，然后進行語音輸入。在語音輸入完成后，若要再切回到非語音輸入模式，則還需要點擊退回鍵才能回到非語音輸入模式，同樣操作繁瑣復(fù)雜，輸入成本開銷高。
[0182] 本發(fā)明實施例在監(jiān)聽到諸如指定按鍵的長按事件等指定的操作事件結(jié)束時，可以直接切換至非語音輸入模式，通過復(fù)用已有的按鍵，一物多用，避免了用戶進行點擊退回鍵等操作，提高了用戶操作的簡便性，降低了非語音輸入模式的切換時間，降低了輸入成本開銷，并且對輸入法的修改少，開發(fā)成本低，實現(xiàn)了非語音輸入模式和語音輸入模式之間的無痕切換。
[0183] 在本發(fā)明實施例的一種優(yōu)選示例中，步驟404可以包括如下子步驟：
[0184] 子步驟S41，當監(jiān)聽到所述指定按鍵的松開事件時，切換至所述非語音輸入模式。
[0185] 在本不例中，可以通過覆蓋ViewGroup類的onTouchEvent (MotionEvent me)方法來監(jiān)聽屏幕的觸摸事件，如按鍵的按下、滑動和松開等事件。
[0186] 如果onTouchEvent方法監(jiān)測到松開事件對應(yīng)的按鍵是指定按鍵（例如空格鍵），則表明用戶已經(jīng)松開了指定按鍵，表示當次語音輸入已經(jīng)結(jié)束，可以切換回非語音輸入模式。
[0187] 步驟405,執(zhí)行按鍵輸入操作、信息發(fā)送操作、圖像導(dǎo)入操作、拍攝操作、位置信息導(dǎo)入操作、記錄操作、用戶信息導(dǎo)入操作、界面滾動操作、界面翻轉(zhuǎn)操作中的至少一種。
[0188] 本發(fā)明實施例中，若指定的操作事件為指定按鍵的長按事件、指定按鍵的雙擊事件時，而指定按鍵可以在非語音輸入模式中，預(yù)設(shè)有除觸發(fā)語音模式以外的功能，若沒有監(jiān) 聽到該指定的操作事件，則可以觸發(fā)該指定按鍵預(yù)設(shè)有除觸發(fā)語音模式以外的功能。
[0189] 對于鍵盤能按鍵，則可以執(zhí)行按鍵輸入操作，輸入該指定按鍵，包括空格鍵、確定鍵、字母鍵、數(shù)字鍵、符號鍵等等。例如，如果在指定的延遲時間內(nèi)，監(jiān)測到指定按鍵（例如空格鍵）的松開事件，即指定按鍵（例如空格鍵）被松開，那么可以認為未監(jiān)聽到指定按鍵 (例如空格鍵）的長按事件，輸入法將響應(yīng)指定按鍵（例如空格鍵）的松開事件，刪除之前發(fā)送的延遲消息，并在文本框響應(yīng)該指定按鍵原有的功能（例如空格鍵對應(yīng)的輸入空格）。
[0190] 對于功能按鍵，則可以執(zhí)行信息發(fā)送操作，以在通訊中發(fā)送信息；或者，可以執(zhí)行圖像導(dǎo)入操作，以導(dǎo)入用戶指定的圖像；或者，可以執(zhí)行拍攝操作，以啟動攝像設(shè)備拍攝照片/錄像；或者，可以執(zhí)行位置信息導(dǎo)入操作，以導(dǎo)入用戶當前的位置信息；或者，可以執(zhí)行記錄操作，以標記當前信息；或者，可以執(zhí)行用戶信息導(dǎo)入操作，以導(dǎo)入用戶需要的用戶信息，可以是當前用戶的用戶信息，也可以其他用戶的用戶信息；等等。
[0191] 若指定的操作事件為指定的滑動事件、指定的手勢事件時，若沒有監(jiān)聽到該指定的操作事件，例如滑動事件的持續(xù)時間少于預(yù)設(shè)時間閾值、手勢的軌跡不符合預(yù)設(shè)的軌跡等等，則可以認為該操作為普通的滑動操作，可以在非語音輸入模式中，觸發(fā)界面滾動操作。
[0192] 若指定的操作事件為指定的移動設(shè)備翻轉(zhuǎn)事件時，若沒有監(jiān)聽到該指定的操作事件，例如移動設(shè)備的翻轉(zhuǎn)的角度少于預(yù)設(shè)角度閾值等等，則可以認為該操作為普通的移動設(shè)備翻轉(zhuǎn)操作，可以在非語音輸入模式中，觸發(fā)界面翻轉(zhuǎn)操作。
[0193] 當然，上述操作只是作為示例，在實施本發(fā)明實施例時，可以根據(jù)實際情況設(shè)置其他操作，本發(fā)明實施例對此不加以限制。另外，除了上述操作外，本領(lǐng)域技術(shù)人員還可以根據(jù)實際需要采用其它操作，本發(fā)明實施例對此也不加以限制。
[0194] 特別地，步驟405中的按鍵輸入操作、信息發(fā)送操作、圖像導(dǎo)入操作、拍攝操作、位置信息導(dǎo)入操作、記錄操作、用戶信息導(dǎo)入操作、界面滾動操作、界面翻轉(zhuǎn)操作中的至少一種，也可以在除輸入法以外的情景中執(zhí)行，例如，在通訊工具中執(zhí)行信息發(fā)送操作，以轉(zhuǎn)發(fā) 信息到對方用戶，本發(fā)明實施例對此不加以限制。
[0195] 需要說明的是，對于方法實施例，為了簡單描述，故將其都表述為一系列的動作組合，但是本領(lǐng)域技術(shù)人員應(yīng)該知悉，本發(fā)明實施例并不受所描述的動作順序的限制，因為依據(jù)本發(fā)明實施例，某些步驟可以采用其他順序或者同時進行。其次，本領(lǐng)域技術(shù)人員也應(yīng)該知悉，說明書中所描述的實施例均屬于優(yōu)選實施例，所涉及的動作并不一定是本發(fā)明實施例所必須的。
[0196] 參照圖5,示出了本發(fā)明一種語音輸入裝置實施例1的結(jié)構(gòu)框圖，具體可以包括如下模塊：
[0197] 操作事件判斷模塊501，用于判斷在非語音輸入模式中是否監(jiān)聽到指定的操作事件；若是，則調(diào)用切換模塊502 ;其中，所述指定的操作事件可以包括指定按鍵的長按事件、指定的滑動事件、指定的移動設(shè)備翻轉(zhuǎn)事件、指定按鍵的雙擊事件、指定手勢事件中的至少一種；
[0198] 語音輸入模式切換模塊502,用于切換至語音輸入模式；
[0199] 語音數(shù)據(jù)處理模塊503,用于在所述語音輸入模式中進行語音輸入處理。
[0200] 在本發(fā)明的一種優(yōu)選實施例中，所述操作事件判斷模塊501可以包括如下子模塊：
[0201] 按鍵觸發(fā)子模塊，用于在非語音輸入模塊中觸發(fā)觸控位置對應(yīng)按鍵的按下事件；
[0202] 按下事件判斷子模塊，用于判斷是否監(jiān)聽到指定按鍵的按下事件；若是，則調(diào)用松開事件判斷子模塊；
[0203] 松開事件判斷子模塊，用于判斷在預(yù)設(shè)的延遲時間內(nèi)是否監(jiān)聽到指定按鍵的松開事件；若否，則調(diào)用長按事件判斷子模塊；
[0204] 長按事件判斷子模塊，用于判斷監(jiān)聽到指定按鍵的長按事件。
[0205] 在本發(fā)明實施例的一種優(yōu)選示例中，所述按鍵觸發(fā)子模塊包括：
[0206] 實際按鍵位置查找子模塊，用于查找觸控位置對應(yīng)的實際按鍵位置；
[0207] 按下事件觸發(fā)子模塊，用于觸發(fā)所述實際按鍵位置對應(yīng)按鍵的按下事件。
[0208] 在本發(fā)明實施例的一種優(yōu)選示例中，所述預(yù)設(shè)的延遲時間可以為N倍的按鍵時間；其中，所述按鍵時間為在先采集的，當前用戶點擊按鍵的平均按下時間，所述N為正數(shù)。
[0209] 在本發(fā)明的一種優(yōu)選實施例中，所述語音輸入處理模塊503可以包括如下子模塊：
[0210] 語音數(shù)據(jù)采集子模塊，用于在切換至所述語音輸入模式后預(yù)設(shè)的采集時間，采集語音數(shù)據(jù)；
[0211] 文本信息獲取子模塊，用于獲取根據(jù)所述語音數(shù)據(jù)所識別出的文本信息；
[0212] 文本信息顯示子模塊，用于顯示所述文本信息。
[0213] 在本發(fā)明實施例的一種優(yōu)選示例中，所述預(yù)設(shè)的采集時間可以為在先采集當前用戶的，從監(jiān)測到觸控位置至采集到語音數(shù)據(jù)之間的平均時間。
[0214] 在本發(fā)明實施例的一種優(yōu)選示例中，所述語音數(shù)據(jù)可以包括一個或多個語音子數(shù) 據(jù)，所述識別文本可以包括由所述一個或多個語音子數(shù)據(jù)識別出的一個或多個第一文本信息，所述文本信息顯示子模塊可以包括如下子模塊：
[0215] 第一顯示子模塊，用于在檢測到指定按鍵的按下事件時，在當前界面顯示所述一個或多個第一文本信息。
[0216] 在本發(fā)明實施例的一種優(yōu)選示例中，所述識別文本還可以包括由所述一個或多個語音子數(shù)據(jù)識別出的，用于替換所述第一識別文本的一個或多個第二識別文本，所述文本信息顯示子模塊還可以包括如下子模塊：
[0217] 第二顯示子模塊，用于在所述第一識別文本被觸發(fā)時，在當前界面顯示所述第一文本信息對應(yīng)的一個或多個第二文本信息。
[0218] 在本發(fā)明的一種優(yōu)選實施例中，所述語音輸入處理模塊503可以包括如下子模塊：
[0219] 語音數(shù)據(jù)采集子模塊，用于在切換至所述語音輸入模式后預(yù)設(shè)的采集時間，采集語音數(shù)據(jù)；
[0220] 語音數(shù)據(jù)輸出子模塊，用于輸出所述語音數(shù)據(jù)。
[0221] 參照圖6,示出了本發(fā)明一種語音輸入裝置實施例2的結(jié)構(gòu)框圖，具體可以包括如下模塊：
[0222] 操作事件判斷模塊601，用于判斷在非語音輸入模式中是否監(jiān)聽到指定的操作事件；若是，則調(diào)用切換模塊602,若否，則調(diào)用原操作執(zhí)行模塊605 ;其中，所述指定的操作事件可以包括指定按鍵的長按事件、指定的滑動事件、指定的移動設(shè)備翻轉(zhuǎn)事件、指定按鍵的雙擊事件、指定手勢事件中的至少一種；
[0223] 語音輸入模式切換模塊602,用于切換至語音輸入模式；
[0224] 語音輸入處理模塊603,用于在所述語音輸入模式中進行語音輸入處理；
[0225] 非語音輸入模式切換模塊604,用于在監(jiān)聽到所述指定的操作事件結(jié)束時，切換至所述非語音輸入模式；
[0226] 原操作執(zhí)行模塊605,用于在非語音輸入模式中未監(jiān)聽到指定的操作事件時，執(zhí)行按鍵輸入操作、信息發(fā)送操作、圖像導(dǎo)入操作、拍攝操作、位置信息導(dǎo)入操作、記錄操作、用戶信息導(dǎo)入操作、界面滾動操作、界面翻轉(zhuǎn)操作中的至少一種。
[0227] 在本發(fā)明實施例的一種優(yōu)選示例中，所述非語音輸入模式切換模塊604可以包括如下子模塊：
[0228] 指定按鍵切換子模塊，用于在監(jiān)聽到所述指定按鍵的松開事件時，切換至所述非語音輸入模式。
[0229] 對于裝置實施例而言，由于其與方法實施例基本相似，所以描述的比較簡單，相關(guān) 之處參見方法實施例的部分說明即可。
[0230] 本說明書中的各個實施例均采用遞進的方式描述，每個實施例重點說明的都是與其他實施例的不同之處，各個實施例之間相同相似的部分互相參見即可。
[0231] 本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白，本發(fā)明實施例的實施例可提供為方法、裝置、或計算機程序產(chǎn)品。因此，本發(fā)明實施例可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且，本發(fā)明實施例可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(zhì)（包括但不限于磁盤存儲器、CD-ROM、光學(xué)存儲器等）上實施的計算機程序產(chǎn)品的形式。
[0232] 本發(fā)明實施例是參照根據(jù)本發(fā)明實施例的方法、終端設(shè)備（系統(tǒng)）、和計算機程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合。可提供這些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理終端設(shè)備的處理器以產(chǎn)生一個機器，使得通過計算機或其他可編程數(shù)據(jù)處理終端設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
[0233] 這些計算機程序指令也可存儲在能引導(dǎo)計算機或其他可編程數(shù)據(jù)處理終端設(shè)備以特定方式工作的計算機可讀存儲器中，使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品，該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
[0234] 這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理終端設(shè)備上，使得在計算機或其他可編程終端設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理，從而在計算機或其他可編程終端設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
[0235] 盡管已描述了本發(fā)明實施例的優(yōu)選實施例，但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念，則可對這些實施例做出另外的變更和修改。所以，所附權(quán)利要求意欲解釋為包括優(yōu)選實施例以及落入本發(fā)明實施例范圍的所有變更和修改。
[0236] 最后，還需要說明的是，在本文中，諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個實體或者操作與另一個實體或操作區(qū)分開來，而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關(guān)系或者順序。而且，術(shù)語"包括"、"包含"或者其任何其他變體意在涵蓋非排他性的包含，從而使得包括一系列要素的過程、方法、物品或者終端設(shè)備不僅包括那些要素，而且還包括沒有明確列出的其他要素，或者是還包括為這種過程、方法、物品或者終端設(shè)備所固有的要素。在沒有更多限制的情況下，由語句"包括一個……"限定的要素，并不排除在包括所述要素的過程、方法、物品或者終端設(shè)備中還存在另外的相同要素。
[0237] 以上對本發(fā)明所提供的一種語音輸入方法和一種語音輸入裝置，進行了詳細介紹，本文中應(yīng)用了具體個例對本發(fā)明的原理及實施方式進行了闡述，以上實施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想；同時，對于本領(lǐng)域的一般技術(shù)人員，依據(jù)本發(fā) 明的思想，在【具體實施方式】及應(yīng)用范圍上均會有改變之處，綜上所述，本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。
【權(quán)利要求】
1. 一種語音輸入方法，其特征在于，包括：判斷在非語音輸入模式中是否監(jiān)聽到指定的操作事件；若是，則切換至語音輸入模式；其中，所述指定的操作事件包括指定按鍵的長按事件、指定的滑動事件、指定的移動設(shè)備翻轉(zhuǎn)事件、指定按鍵的雙擊事件、指定手勢事件中的至少一種；在所述語音輸入模式中進行語音輸入處理。
2. 根據(jù)權(quán)利要求1所述的方法，其特征在于，所述判斷在非語音輸入模式中是否監(jiān)聽到指定的操作事件的步驟包括：在非語音輸入模式中觸發(fā)觸控位置對應(yīng)按鍵的按下事件；判斷是否監(jiān)聽到指定按鍵的按下事件；若監(jiān)聽到指定按鍵的按下事件，則判斷在預(yù)設(shè)的延遲時間內(nèi)是否監(jiān)聽到指定按鍵的松開事件；若未在預(yù)設(shè)的延遲時間內(nèi)監(jiān)聽到指定按鍵的松開事件，則判斷監(jiān)聽到指定按鍵的長按事件。
3. 根據(jù)權(quán)利要求2所述的方法，其特征在于，所述在非語音輸入模式中觸發(fā)屏幕點擊位置對應(yīng)按鍵的按下事件的步驟包括：查找觸控位置對應(yīng)的實際按鍵位置；觸發(fā)所述實際按鍵位置對應(yīng)按鍵的按下事件。
4. 根據(jù)權(quán)利要求2所述的方法，其特征在于，所述預(yù)設(shè)的延遲時間為N倍的按鍵時間；其中，所述按鍵時間為預(yù)先采集的，當前用戶點擊按鍵的平均按下時間，所述N為正數(shù)。
5. 根據(jù)權(quán)利要求1或2或3或4所述的方法，其特征在于，所述在所述語音輸入模式中進行語音輸入處理的步驟包括：在切換至所述語音輸入模式后預(yù)設(shè)的采集時間，采集語音數(shù)據(jù)；獲取根據(jù)所述語音數(shù)據(jù)所識別出的文本信息；顯示所述文本信息。
6. 根據(jù)權(quán)利要求5所述的方法，其特征在于，所述預(yù)設(shè)的采集時間為在預(yù)先采集當前用戶的，從監(jiān)測到觸控位置至采集到語音數(shù)據(jù)之間的平均時間。
7. 根據(jù)權(quán)利要求5所述的方法，其特征在于，所述語音數(shù)據(jù)包括一個或多個語音子數(shù) 據(jù)，所述識別文本包括由所述一個或多個語音子數(shù)據(jù)識別出的一個或多個第一文本信息，所述顯示所述文本信息的步驟包括：當檢測到指定按鍵的按下事件時，在當前界面顯示所述一個或多個第一文本信息。
8. 根據(jù)權(quán)利要求7所述的方法，其特征在于，所述識別文本還包括由所述一個或多個語音子數(shù)據(jù)識別出的，用于替換所述第一識別文本的一個或多個第二識別文本，所述顯示所述文本信息的步驟還包括：當所述第一識別文本被觸發(fā)時，在當前界面顯示所述第一文本信息對應(yīng)的一個或多個第二文本信息。
9. 根據(jù)權(quán)利要求1或2或3或4所述的方法，其特征在于，所述在所述語音輸入模式中進行語音輸入處理的步驟包括：在切換至所述語音輸入模式后預(yù)設(shè)的采集時間，采集語音數(shù)據(jù)；輸出所述語音數(shù)據(jù)。
10. 根據(jù)權(quán)利要求1或2或3或4或6或7或8所述的方法，其特征在于，還包括：當監(jiān)聽到所述指定的操作事件結(jié)束時，切換至所述非語音輸入模式。
11. 根據(jù)權(quán)利要求10所述的方法，其特征在于，所述當監(jiān)聽到所述指定的操作事件結(jié) 束時，切換至所述非語音輸入模式的步驟包括：當監(jiān)聽到所述指定按鍵的松開事件時，切換至所述非語音輸入模式。
12. 根據(jù)權(quán)利要求1所述的方法，其特征在于，還包括：在非語音輸入模式中未監(jiān)聽到指定的操作事件時，執(zhí)行按鍵輸入操作、信息發(fā)送操作、圖像導(dǎo)入操作、拍攝操作、位置信息導(dǎo)入操作、記錄操作、用戶信息導(dǎo)入操作、界面滾動操作、界面翻轉(zhuǎn)操作中的至少一種。
13. -種語音輸入裝置，其特征在于，包括：操作事件判斷模塊，用于判斷在非語音輸入模式中是否監(jiān)聽到指定的操作事件；若是，則調(diào)用切換模塊；其中，所述指定的操作事件包括指定按鍵的長按事件、指定的滑動事件、指定的移動設(shè)備翻轉(zhuǎn)事件、指定按鍵的雙擊事件、指定手勢事件中的至少一種；語音輸入模式切換模塊，用于切換至語音輸入模式；語音輸入處理模塊，用于在所述語音輸入模式中進行語音輸入處理。
14. 根據(jù)權(quán)利要求13所述的裝置，其特征在于，所述操作事件判斷模塊包括：按鍵觸發(fā)子模塊，用于在非語音輸入模塊中觸發(fā)觸控位置對應(yīng)按鍵的按下事件；按下事件判斷子模塊，用于判斷是否監(jiān)聽到指定按鍵的按下事件；若是，則調(diào)用松開事件判斷子模塊；松開事件判斷子模塊，用于判斷在預(yù)設(shè)的延遲時間內(nèi)監(jiān)聽到指定按鍵的松開事件；若否，則調(diào)用長按事件判斷子模塊；長按事件判斷子模塊，用于判斷監(jiān)聽到指定按鍵的長按事件。
15. 根據(jù)權(quán)利要求14所述的裝置，其特征在于，所述按鍵觸發(fā)子模塊包括：實際按鍵位置查找子模塊，用于查找觸控位置對應(yīng)的實際按鍵位置；按下事件觸發(fā)子模塊，用于觸發(fā)所述實際按鍵位置對應(yīng)按鍵的按下事件。
16. 根據(jù)權(quán)利要求14所述的裝置，其特征在于，所述預(yù)設(shè)的延遲時間為N倍的按鍵時間；其中，所述按鍵時間為在先采集的，當前用戶點擊按鍵的平均按下時間，所述N為正數(shù)。
17. 根據(jù)權(quán)利要求13或14或15或16所述的裝置，其特征在于，所述語音輸入處理模塊包括：語音數(shù)據(jù)采集子模塊，用于在切換至所述語音輸入模式后預(yù)設(shè)的采集時間，采集語音數(shù)據(jù)；文本信息獲取子模塊，用于獲取根據(jù)所述語音數(shù)據(jù)所識別出的文本信息；文本信息顯示子模塊，用于顯示所述文本信息。
18. 根據(jù)權(quán)利要求17所述的裝置，其特征在于，所述預(yù)設(shè)的采集時間為在先采集當前用戶的，從監(jiān)測到觸控位置至采集到語音數(shù)據(jù)之間的平均時間。
19. 根據(jù)權(quán)利要求17所述的裝置，其特征在于，所述語音數(shù)據(jù)包括一個或多個語音子數(shù)據(jù)，所述識別文本包括由所述一個或多個語音子數(shù)據(jù)識別出的一個或多個第一文本信息，所述文本信息顯示子模塊包括：第一顯示子模塊，用于在檢測到指定按鍵的按下事件時，在當前界面顯示所述一個或多個第一文本信息。
20. 根據(jù)權(quán)利要求19所述的裝置，其特征在于，所述識別文本還包括由所述一個或多個語音子數(shù)據(jù)識別出的，用于替換所述第一識別文本的一個或多個第二識別文本，所述文本信息顯示子模塊還包括：第二顯示子模塊，用于在所述第一識別文本被觸發(fā)時，在當前界面顯示所述第一文本信息對應(yīng)的一個或多個第二文本信息。
21. 根據(jù)權(quán)利要求13或14或15或16所述的裝置，其特征在于，所述語音輸入處理模塊包括：語音數(shù)據(jù)采集子模塊，用于在切換至所述語音輸入模式后預(yù)設(shè)的采集時間，采集語音數(shù)據(jù)；語音數(shù)據(jù)輸出子模塊，用于輸出所述語音數(shù)據(jù)。
22. 根據(jù)權(quán)利要求13或14或15或16或18或19或20所述的裝置，其特征在于，還包括：非語音輸入模式切換模塊，用于在監(jiān)聽到所述指定的操作事件結(jié)束時，切換至所述非語音輸入模式。
23. 根據(jù)權(quán)利要求22所述的裝置，其特征在于，所非語音輸入模式切換模塊包括：指定按鍵切換子模塊，用于在監(jiān)聽到所述指定按鍵的松開事件時，切換至所述非語音輸入模式。
24. 根據(jù)權(quán)利要求13所述的裝置，其特征在于，還包括：原操作執(zhí)行模塊，用于在非語音輸入模式中未監(jiān)聽到指定的操作事件時，執(zhí)行按鍵輸入操作、信息發(fā)送操作、圖像導(dǎo)入操作、拍攝操作、位置信息導(dǎo)入操作、記錄操作、用戶信息導(dǎo)入操作、界面滾動操作、界面翻轉(zhuǎn)操作中的至少一種。
【文檔編號】G06F9/44GK104090652SQ201410265882
【公開日】2014年10月8日申請日期:2014年6月13日優(yōu)先權(quán)日:2014年6月13日
【發(fā)明者】王輝, 劉玨, 宋春偉申請人:北京搜狗科技發(fā)展有限公司

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：王輝;劉玨;宋春偉
技術(shù)所有人：北京搜狗科技發(fā)展有限公司
我是此專利的發(fā)明人

上一篇：基于知識庫的告警關(guān)聯(lián)分析方法
上一篇：一種多角度的彩色圖像的防偽識別方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

搜狗語音輸入使用方法相關(guān)技術(shù)

語音輸入相關(guān)技術(shù)

語音輸入軟件相關(guān)技術(shù)

搜狗語音輸入相關(guān)技術(shù)

win10語音輸入相關(guān)技術(shù)

h1z1語音輸入設(shè)備相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種語音輸入方法和裝置制造方法