一種語音輸入方法和裝置制造方法
【專利摘要】本發(fā)明實施例提供了一種語音輸入方法和裝置,所述方法包括:判斷在非語音輸入模式中是否監(jiān)聽到指定的操作事件;若是,則切換至語音輸入模式;其中,所述指定的操作事件包括指定按鍵的長按事件;在所述語音輸入模式中進行語音輸入處理。本發(fā)明實施例通過復(fù)用已有的按鍵,一物多用,避免了用戶進行點擊語音輸入按鍵/入口等操作,提高了用戶操作的簡便性,降低了語音輸入模式的切換時間,降低了輸入成本開銷。
【專利說明】一種語音輸入方法和裝置
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及輸入法的【技術(shù)領(lǐng)域】,特別是涉及一種語音輸入方法和一種語音輸入裝 置。
【背景技術(shù)】
[0002] 目前,移動互聯(lián)網(wǎng)的快速發(fā)展帶動了移動智能設(shè)備如手機、平板電腦、穿戴式設(shè)備 等的廣泛普及,而作為移動設(shè)備上人機交互最方便自然的方式之一,語音輸入正逐漸被廣 大用戶所接受。
[0003] 語音輸入的過程,是一種典型的數(shù)據(jù)輸入和數(shù)據(jù)輸出過程。具體來說,涉及到錄 音,錄音數(shù)據(jù)的存儲和傳送,錄音數(shù)據(jù)被語音識別引擎加工處理,最后獲取到語音識別結(jié)果 等步驟。
[0004] 而傳統(tǒng)的鍵盤輸入,首先需要繪制鍵盤和實現(xiàn)按鍵監(jiān)聽,然后通過響應(yīng)按鍵事件, 來完成文字輸入。
[0005] 上述語音輸入和鍵盤輸入的技術(shù)區(qū)別,決定了語音輸入和鍵盤輸入是兩套獨立的 模塊。
[0006] 在某些環(huán)境,例如坐車比較顛簸,用戶使用鍵盤輸入不是很方便,此時用戶可以通 過切換到語音輸入。但是,由于語音輸入獨立于鍵盤輸入,因此,用戶需要在鍵盤輸入時點 擊語音輸入按鍵/入口,將鍵盤輸入切換至語音輸入,然后在語音輸入的界面中使用點擊 或長按等操作進行語音輸入。使得語音切換操作繁瑣,語音輸入切換時間長。
【發(fā)明內(nèi)容】
[0007] 本發(fā)明實施例所要解決的技術(shù)問題是提供一種語音輸入方法,以提高語音輸入的 操作簡便性,減少語音輸入的切換時間。
[0008] 相應(yīng)的,本發(fā)明實施例還提供了一種語音輸入裝置,用以保證上述方法的實現(xiàn)及 應(yīng)用。
[0009] 為了解決上述問題,本發(fā)明公開了一種語音輸入方法,包括:
[0010] 判斷在非語音輸入模式中是否監(jiān)聽到指定的操作事件;
[0011] 若是,則切換至語音輸入模式;其中,所述指定的操作事件包括指定按鍵的長按事 件、指定的滑動事件、指定的移動設(shè)備翻轉(zhuǎn)事件、指定按鍵的雙擊事件、指定手勢事件中的 至少一種;
[0012] 在所述語音輸入模式中進行語音輸入處理。
[0013] 優(yōu)選地,所述判斷在非語音輸入模式中是否監(jiān)聽到指定的操作事件的步驟包括:
[0014] 在非語音輸入模式中觸發(fā)觸控位置對應(yīng)按鍵的按下事件;
[0015] 判斷是否監(jiān)聽到指定按鍵的按下事件;
[0016] 若監(jiān)聽到指定按鍵的按下事件,則判斷在預(yù)設(shè)的延遲時間內(nèi)是否監(jiān)聽到指定按鍵 的松開事件;
[0017] 若未在預(yù)設(shè)的延遲時間內(nèi)監(jiān)聽到指定按鍵的松開事件,則判斷監(jiān)聽到指定按鍵的 長按事件。
[0018] 優(yōu)選地,所述在非語音輸入模式中觸發(fā)屏幕點擊位置對應(yīng)按鍵的按下事件的步驟 包括:
[0019] 查找觸控位置對應(yīng)的實際按鍵位置;
[0020] 觸發(fā)所述實際按鍵位置對應(yīng)按鍵的按下事件。
[0021] 優(yōu)選地,所述預(yù)設(shè)的延遲時間為N倍的按鍵時間;其中,所述按鍵時間為預(yù)先采集 的,當前用戶點擊按鍵的平均按下時間,所述N為正數(shù)。
[0022] 優(yōu)選地,所述在所述語音輸入模式中進行語音輸入處理的步驟包括:
[0023] 在切換至所述語音輸入模式后預(yù)設(shè)的采集時間,采集語音數(shù)據(jù);
[0024] 獲取根據(jù)所述語音數(shù)據(jù)所識別出的文本信息;
[0025] 顯示所述文本信息。
[0026] 優(yōu)選地,所述預(yù)設(shè)的采集時間為在預(yù)先采集當前用戶的,從監(jiān)測到觸控位置至采 集到語音數(shù)據(jù)之間的平均時間。
[0027] 優(yōu)選地,所述語音數(shù)據(jù)包括一個或多個語音子數(shù)據(jù),所述識別文本包括由所述一 個或多個語音子數(shù)據(jù)識別出的一個或多個第一文本信息,所述顯示所述文本信息的步驟包 括:
[0028] 當檢測到指定按鍵的按下事件時,在當前界面顯示所述一個或多個第一文本信 息。
[0029] 優(yōu)選地,所述識別文本還包括由所述一個或多個語音子數(shù)據(jù)識別出的,用于替換 所述第一識別文本的一個或多個第二識別文本,所述顯示所述文本信息的步驟還包括:
[0030] 當所述第一識別文本被觸發(fā)時,在當前界面顯示所述第一文本信息對應(yīng)的一個或 多個第二文本信息。
[0031] 優(yōu)選地,所述在所述語音輸入模式中進行語音輸入處理的步驟包括:
[0032] 在切換至所述語音輸入模式后預(yù)設(shè)的采集時間,采集語音數(shù)據(jù);
[0033] 輸出所述語音數(shù)據(jù)。
[0034] 優(yōu)選地,還包括:
[0035] 當監(jiān)聽到所述指定的操作事件結(jié)束時,切換至所述非語音輸入模式。
[0036] 優(yōu)選地,所述當監(jiān)聽到所述指定的操作事件結(jié)束時,切換至所述非語音輸入模式 的步驟包括:
[0037] 當監(jiān)聽到所述指定按鍵的松開事件時,切換至所述非語音輸入模式。
[0038] 優(yōu)選地,還包括:
[0039] 在非語音輸入模式中未監(jiān)聽到指定的操作事件時,執(zhí)行按鍵輸入操作、信息發(fā)送 操作、圖像導(dǎo)入操作、拍攝操作、位置信息導(dǎo)入操作、記錄操作、用戶信息導(dǎo)入操作、界面滾 動操作、界面翻轉(zhuǎn)操作中的至少一種。
[0040] 本發(fā)明實施例還公開了一種語音輸入裝置,包括:
[0041] 操作事件判斷模塊,用于判斷在非語音輸入模式中是否監(jiān)聽到指定的操作事件; 若是,則調(diào)用切換模塊;其中,所述指定的操作事件包括指定按鍵的長按事件、指定的滑動 事件、指定的移動設(shè)備翻轉(zhuǎn)事件、指定按鍵的雙擊事件、指定手勢事件中的至少一種;
[0042] 語音輸入模式切換模塊,用于切換至語音輸入模式;
[0043] 語音輸入處理模塊,用于在所述語音輸入模式中進行語音輸入處理。
[0044] 優(yōu)選地,所述操作事件判斷模塊包括:
[0045] 按鍵觸發(fā)子模塊,用于在非語音輸入模塊中觸發(fā)觸控位置對應(yīng)按鍵的按下事件;
[0046] 按下事件判斷子模塊,用于判斷是否監(jiān)聽到指定按鍵的按下事件;若是,則調(diào)用松 開事件判斷子模塊;
[0047] 松開事件判斷子模塊,用于判斷在預(yù)設(shè)的延遲時間內(nèi)監(jiān)聽到指定按鍵的松開事 件;若否,則調(diào)用長按事件判斷子模塊;
[0048] 長按事件判斷子模塊,用于判斷監(jiān)聽到指定按鍵的長按事件。
[0049] 優(yōu)選地,所述按鍵觸發(fā)子模塊包括:
[0050] 實際按鍵位置查找子模塊,用于查找觸控位置對應(yīng)的實際按鍵位置;
[0051] 按下事件觸發(fā)子模塊,用于觸發(fā)所述實際按鍵位置對應(yīng)按鍵的按下事件。
[0052] 優(yōu)選地,所述預(yù)設(shè)的延遲時間為N倍的按鍵時間;其中,所述按鍵時間為在先采集 的,當前用戶點擊按鍵的平均按下時間,所述N為正數(shù)。
[0053] 優(yōu)選地,所述語音輸入處理模塊包括:
[0054] 語音數(shù)據(jù)采集子模塊,用于在切換至所述語音輸入模式后預(yù)設(shè)的采集時間,采集 語音數(shù)據(jù);
[0055] 文本信息獲取子模塊,用于獲取根據(jù)所述語音數(shù)據(jù)所識別出的文本信息;
[0056] 文本信息顯示子模塊,用于顯示所述文本信息。
[0057] 優(yōu)選地,所述預(yù)設(shè)的采集時間為在先采集當前用戶的,從監(jiān)測到觸控位置至采集 到語音數(shù)據(jù)之間的平均時間。
[0058] 優(yōu)選地,所述語音數(shù)據(jù)包括一個或多個語音子數(shù)據(jù),所述識別文本包括由所述一 個或多個語音子數(shù)據(jù)識別出的一個或多個第一文本信息,所述文本信息顯示子模塊包括:
[0059] 第一顯示子模塊,用于在檢測到指定按鍵的按下事件時,在當前界面顯示所述一 個或多個第一文本信息。
[0060] 優(yōu)選地,所述識別文本還包括由所述一個或多個語音子數(shù)據(jù)識別出的,用于替換 所述第一識別文本的一個或多個第二識別文本,所述文本信息顯示子模塊還包括:
[0061] 第二顯示子模塊,用于在所述第一識別文本被觸發(fā)時,在當前界面顯示所述第一 文本信息對應(yīng)的一個或多個第二文本信息。
[0062] 優(yōu)選地,所述語音輸入處理模塊包括:
[0063] 語音數(shù)據(jù)采集子模塊,用于在切換至所述語音輸入模式后預(yù)設(shè)的采集時間,采集 語音數(shù)據(jù);
[0064] 語音數(shù)據(jù)輸出子模塊,用于輸出所述語音數(shù)據(jù)。
[0065] 優(yōu)選地,還包括:
[0066] 非語音輸入模式切換模塊,用于在監(jiān)聽到所述指定的操作事件結(jié)束時,切換至所 述非語音輸入模式。
[0067] 優(yōu)選地,所非語音輸入模式切換模塊包括:
[0068] 指定按鍵切換子模塊,用于在監(jiān)聽到所述指定按鍵的松開事件時,切換至所述非 語音輸入模式。
[0069] 優(yōu)選地,還包括:
[0070] 原操作執(zhí)行模塊,用于在非語音輸入模式中未監(jiān)聽到指定的操作事件時,執(zhí)行按 鍵輸入操作、信息發(fā)送操作、圖像導(dǎo)入操作、拍攝操作、位置信息導(dǎo)入操作、記錄操作、用戶 信息導(dǎo)入操作、界面滾動操作、界面翻轉(zhuǎn)操作中的至少一種。
[0071] 與【背景技術(shù)】相比,本發(fā)明實施例包括以下優(yōu)點:
[0072] 本發(fā)明實施例中在非語音輸入模式中監(jiān)聽到如指定按鍵的長按事件等指定的操 作事件時,直接切換至語音輸入模式,通過復(fù)用已有的按鍵,一物多用,避免了用戶進行點 擊語音輸入按鍵/入口等操作,提高了用戶操作的簡便性,降低了語音輸入模式的切換時 間,降低了輸入成本開銷,并且對輸入法的修改少,開發(fā)成本低,使得可以直接在語音輸入 模式中進行語音輸入處理,提高了語音輸入的效率。
[0073] 本發(fā)明實施例預(yù)先采集用戶的按鍵習慣,通過查找觸控位置對應(yīng)的實際按鍵位 置,觸發(fā)該時間案件位置對應(yīng)按鍵的按下事件,提高了按鍵的觸發(fā)成功率,進而減少輸入法 對錯誤按鍵的響應(yīng),以及減少了用戶重新按鍵的操作,大大提高了按鍵的效率。
[0074] 本發(fā)明實施例可以根據(jù)用戶點擊按鍵的平均按下時間設(shè)置延遲時間,作為用戶長 按操作的判斷標準,減少了默認延遲時間造成的長按操作失敗錯誤等問題的出現(xiàn),提高了 長按操作的識別準確性。
[0075] 本發(fā)明實施例可以根據(jù)用戶的輸入語音數(shù)據(jù)的習慣設(shè)定語音采集時間,即從監(jiān)測 到觸控位置至采集到語音數(shù)據(jù)之間的平均時間,進行語音數(shù)據(jù)的采集,減少了默認采集時 間造成的采集到空白的語音數(shù)據(jù),或者未采集到開始部分的語音數(shù)據(jù)等問題的出現(xiàn),提高 了語音采集的效率。
[0076] 本發(fā)明實施例在監(jiān)聽到諸如指定按鍵的長按事件等指定的操作事件結(jié)束時,可以 直接切換至非語音輸入模式,通過復(fù)用已有的按鍵,一物多用,避免了用戶進行點擊退回鍵 等操作,提高了用戶操作的簡便性,降低了非語音輸入模式的切換時間,降低了輸入成本開 銷,并且對輸入法的修改少,開發(fā)成本低,實現(xiàn)了非語音輸入模式和語音輸入模式之間的無 痕切換。
【專利附圖】
【附圖說明】
[0077] 圖1是本發(fā)明的一種語音輸入方法實施例1的步驟流程圖;
[0078] 圖2是本發(fā)明的一種九宮格鍵盤的示例圖;
[0079] 圖3是本發(fā)明的一種全鍵盤的示例圖;
[0080] 圖4是本發(fā)明的一種語音輸入方法實施例2的步驟流程圖;
[0081] 圖5是本發(fā)明的一種語音輸入裝置實施例1的結(jié)構(gòu)框圖;
[0082] 圖6是本發(fā)明的一種語音輸入裝置實施例2的結(jié)構(gòu)框圖。
【具體實施方式】
[0083] 為使本發(fā)明的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結(jié)合附圖和具體實 施方式對本發(fā)明作進一步詳細的說明。
[0084] 參照圖1,示出了本發(fā)明的一種語音輸入方法實施例1的步驟流程圖,具體可以包 括如下步驟:
[0085] 步驟101,判斷在非語音輸入模式中是否監(jiān)聽到指定的操作事件;若是,則執(zhí)行步 驟 102 ;
[0086] 需要說明的是,本發(fā)明實施例可以應(yīng)用于輸入法中,該輸入法可以為一個 APP (Application,第三方應(yīng)用程序),安裝在具有觸摸屏幕的設(shè)備中。該設(shè)備可以包括平板 電腦、個人數(shù)字助理、手機等等,本發(fā)明實施例對此不作限制。
[0087] 在該輸入法中,可以存在至少兩種輸入模式,即語音輸入模式和非語音輸入模式。
[0088] 語音輸入模式,可以為米用語音的方式輸入文本信息的模式。在語音輸入模式中, 輸入法可以識別出用戶輸入的語音數(shù)據(jù)所對應(yīng)的文本信息。
[0089] 非語音輸入模式,可以為米用非語音的方式輸入文本信息的模式。
[0090] 其中,非語音輸入模式可以包括鍵盤輸入模式、手寫輸入模式等等。
[0091] 鍵盤輸入模式,可以為米用鍵盤的方式輸入文本信息的模式。在鍵盤輸入模式中, 輸入法可以根據(jù)鍵盤中的按鍵,按照拼音、筆畫、五筆等編碼規(guī)則計算出文本信息。
[0092] 其中,該鍵盤可以為如圖2所示的九宮格鍵盤,即以1-9共9個數(shù)字按鍵作為輸入 鍵盤;該鍵盤也可以為如圖3所示的全鍵盤,即以A-Z共26個字母按鍵作為輸入鍵盤,等 等。
[0093] 手寫輸入模式,可以為米用手寫的方式輸入文本信息的模式。在手寫模式中,輸入 法可以根據(jù)用戶在觸控屏幕中的滑動軌跡,識別出與該滑動軌跡相似或相同的文本信息。 [0094] 當然,上述非語音輸入模式只是作為示例,在實施本發(fā)明實施例時,可以根據(jù)實際 情況設(shè)置其他非語音輸入模式,本發(fā)明實施例對此不加以限制。另外,除了上述非語音輸入 模式外,本領(lǐng)域技術(shù)人員還可以根據(jù)實際需要采用其它非語音輸入模式,本發(fā)明實施例對 此也不加以限制。
[0095] 在具體實現(xiàn)中,所述指定的操作事件可以包括指定按鍵的長按事件,而該指定按 鍵可以在非語音輸入模式中,預(yù)設(shè)有除觸發(fā)語音模式以外的功能。例如,空格鍵可以預(yù)設(shè)有 輸入空格的功能,刪除鍵可以預(yù)設(shè)有刪除文本信息的功能,等等。
[0096] 所述指定的操作事件也可以包括指定的滑動事件,即本發(fā)明實施例可以根據(jù)指定 的滑動方向和軌跡觸發(fā)語音輸入模式。
[0097] 當然,所述指定的操作事件也可以包括其他操作事件,例如指定的移動設(shè)備翻轉(zhuǎn) 事件、指定按鍵的雙擊事件、指定手勢事件等等,本發(fā)明實施例對此不加以限制。
[0098] 為使本領(lǐng)域技術(shù)人員更好地理解本發(fā)明實施例,在本說明書中,將指定按鍵的長 按事件作為指定的操作事件的一種示例進行說明。
[0099] 在本發(fā)明的一種優(yōu)選實施例中,步驟101可以包括如下子步驟:
[0100] 子步驟S11,在非語音輸入模塊中觸發(fā)觸控位置對應(yīng)按鍵的按下事件;
[0101] 觸控位置可以為用戶在設(shè)備的觸摸屏幕上按下的位置。
[0102] 在本發(fā)明實施例的一種優(yōu)選示例中,本發(fā)明實施例可以不對觸控位置進行修正, 即直接觸發(fā)觸控位置所在按鍵的按下事件。
[0103] 在本發(fā)明實施例的另一種優(yōu)選示例中,步驟S11可以包括如下子步驟:
[0104] 子步驟S111,查找觸控位置對應(yīng)的實際按鍵位置;
[0105] 子步驟S112,觸發(fā)所述實際按鍵位置對應(yīng)按鍵的按下事件。
[0106] 在實際應(yīng)用中,每個用戶的按鍵習慣都可能有所不同。但是,同一個用戶按鍵習慣 一般會有一定的規(guī)律性。例如,某個用戶習慣用右手拿著手機,再采用右手拇指點擊按鍵, 使得觸控位置經(jīng)常出現(xiàn)在按鍵偏右的位置。
[0107] 因此,在本示例中,可以預(yù)先采集用戶的按鍵習慣,即用戶在使用輸入法輸入文本 信息時,觸控位置與實際按鍵位置之間的關(guān)系,再采用改按鍵習慣對觸控位置進行修正。
[0108] 則按鍵習慣可以決定觸控位置是否觸發(fā)按鍵的按下事件,如果用戶的按鍵習慣是 觸控位置相對于實際按鍵位置整體偏右,則即使用戶本次的觸控位置相較于實際按鍵位置 偏右,也會認為是需要點擊相應(yīng)的實際按鍵位置。
[0109] 本發(fā)明實施例預(yù)先采集用戶的按鍵習慣,通過查找觸控位置對應(yīng)的實際按鍵位 置,觸發(fā)該時間案件位置對應(yīng)按鍵的按下事件,提高了按鍵的觸發(fā)成功率,進而減少輸入法 對錯誤按鍵的響應(yīng),以及減少了用戶重新按鍵的操作,大大提高了按鍵的效率。
[0110] 子步驟S12,判斷是否監(jiān)聽到指定按鍵的按下事件;若是,則執(zhí)行子步驟S13 ;
[0111] 在具體實現(xiàn)中,可以預(yù)先在輸入法的配置文件中定義指定按鍵的長按事件。
[0112] 以下以空格鍵作為示例進行說明,該配置文件可以為如下設(shè)置:
[0113] [Key_Space_py9]
[0114] Η = 0.232
[0115] W = 0.2833
[0116] S_KEYS = Key_Space
[0117] L_KEY = Key_Voice
[0118] TYPE = 2
[0119] S_FLAG = 0
[0120] 其中,通過Key_Space_py9和L_KEY,可以看到在九空格鍵盤上,空格鍵的長按事 件由Key_Voice對應(yīng)的按鍵事件邏輯處理。
[0121] 在本不例,可以通過覆蓋ViewGroup類的onTouchEvent (MotionEvent me)方法來 監(jiān)聽屏幕的觸摸事件,如按鍵的按下、滑動和松開等事件。
[0122] 子步驟S13,判斷在預(yù)設(shè)的延遲時間內(nèi)是否監(jiān)聽到指定按鍵的松開事件;若否,則 執(zhí)行子步驟S14 ;
[0123] 子步驟S14,判斷監(jiān)聽到指定按鍵的長按事件。
[0124] 如果onTouchEvent方法監(jiān)測到按下事件對應(yīng)的按鍵是指定按鍵(例如空格鍵), 那么輸入法將可以發(fā)送一個延遲消息。
[0125] 以Android (安卓)系統(tǒng)的設(shè)備為例,輸入法可以通過Handler機制發(fā)送一個延遲 消息。
[0126] Android系統(tǒng)的Handler機制支持消息隊列和消息調(diào)度,調(diào)用者可以指定消息發(fā) 送的延遲時間,也可以隨時刪除已經(jīng)在消息隊列的消息。
[0127] Handler機制使用到的原型函數(shù)可以為:
[0128] sendEmptyMessageDelayed(int what, long delayMillis);
[0129] removeMessages(int what)〇
[0130] 如果在指定的延遲時間內(nèi),沒有監(jiān)測到指定按鍵(例如空格鍵)的松開事件,即指 定按鍵(例如空格鍵)沒有被松開,那么可以認為監(jiān)聽到指定按鍵(例如空格鍵)的長按 事件。
[0131] 當然,上述指定按鍵只是作為示例,在實施本發(fā)明實施例時,可以根據(jù)實際情況設(shè) 置其他指定按鍵,例如刪除鍵、數(shù)字鍵、字母鍵等等,本發(fā)明實施例對此不加以限制。另外, 除了上述指定按鍵外,本領(lǐng)域技術(shù)人員還可以根據(jù)實際需要采用其它指定按鍵,本發(fā)明實 施例對此也不加以限制。
[0132] 在本發(fā)明實施例的一種優(yōu)選示例中,該預(yù)設(shè)的采集時間可以為一個默認值,例如 500ms〇
[0133] 在本發(fā)明實施例的另一種優(yōu)選示例中,所述預(yù)設(shè)的延遲時間可以為N倍的按鍵時 間;其中,所述按鍵時間可以為在先采集的,當前用戶點擊按鍵的平均按下時間,所述N為 正數(shù)。
[0134] 由于不同用戶的輸入速度有所不同,即按鍵時間間隔會有所不同,造成了不同用 戶按鍵的按下時間也有所不同。則在本示例中,可以根據(jù)用戶按鍵的按下時間作為該用戶 長按操作的判斷標準。
[0135] 具體而言,可以預(yù)先收集用戶按鍵的按下時間,然后計算平均值。如果某次點擊按 鍵的按下時間超過平均按下時間的N(例如2)倍,即可判斷該操作為長按。
[0136] 例如,某用戶點擊按鍵的平均按下時間為200ms,假設(shè)N為2,則在某次按下按鍵的 按下時間超過400ms后,便可以響應(yīng)該操作為長按操作。
[0137] 本發(fā)明實施例可以根據(jù)用戶點擊按鍵的平均按下時間設(shè)置延遲時間,作為用戶長 按操作的判斷標準,減少了默認延遲時間造成的長按操作失敗錯誤等問題的出現(xiàn),提高了 長按操作的識別準確性。
[0138] 步驟102,切換至語音輸入模式;
[0139] 在輸入法中,非語音輸入模式和語音輸入模式均可具有對應(yīng)的模塊,當需要切換 至語音輸入模式時,啟動該語音輸入模式對應(yīng)的模塊即可。
[0140] 較佳地,在切換至語音輸入模式時,可以根據(jù)當前非語音輸入模式的界面屬性,例 如鍵盤類型、鍵盤大小、屏幕尺寸等等等,繪制出語音交互視圖,以提示用戶輸入法切換至 語音輸入模式。
[0141] 步驟103,在所述語音輸入模式中進行語音輸入處理。
[0142] 在切換至語音輸入模式后,用戶可以進行語音輸入,輸入法則可以進行語音輸入 處理。
[0143] 在本發(fā)明的一種優(yōu)選實施例中,步驟103可以包括如下子步驟:
[0144] 子步驟S21,在切換至所述語音輸入模式后預(yù)設(shè)的采集時間,采集語音數(shù)據(jù);
[0145] 在本發(fā)明實施例的一種優(yōu)選示例中,該預(yù)設(shè)的采集時間可以為一個默認值。
[0146] 在本發(fā)明實施例的另一種優(yōu)選示例中,所述預(yù)設(shè)的采集時間可以為在先采集當前 用戶的,從監(jiān)測到觸控位置至采集到語音數(shù)據(jù)之間的平均時間。
[0147] 則在本示例中,可以記錄在先用戶在按下按鍵(即監(jiān)測到觸控位置)后,到采集到 語音數(shù)據(jù)的時間差,取該時間的平均值作為從按下后開始采集語音數(shù)據(jù)的采集時間。
[0148] 本發(fā)明實施例可以根據(jù)用戶的輸入語音數(shù)據(jù)的習慣設(shè)定語音采集時間,即從監(jiān)測 到觸控位置至采集到語音數(shù)據(jù)之間的平均時間,進行語音數(shù)據(jù)的采集,減少了默認采集時 間造成的采集到空白的語音數(shù)據(jù),或者未采集到開始部分的語音數(shù)據(jù)等問題的出現(xiàn),提高 了語音采集的效率。
[0149] 子步驟S22,獲取根據(jù)所述語音數(shù)據(jù)所識別出的文本信息;
[0150] 語音識別技術(shù),也可以稱為自動語音識別(Automatic Speech Recognition, ASR),其任務(wù)是把用戶所發(fā)出的語音數(shù)據(jù)中的詞匯內(nèi)容轉(zhuǎn)換為計算機可讀入的文本。語音 識別技術(shù)是一種綜合性的技術(shù),它涉及到多個學(xué)科領(lǐng)域,如發(fā)聲機理和聽覺機理、信號處 理、概率論和信息論、模式識別以及人工智能等等。
[0151] 在具體實現(xiàn)中,可以將語音數(shù)據(jù)發(fā)送至服務(wù)器,由服務(wù)器識別出該語音數(shù)據(jù)對應(yīng) 的文本信息。
[0152] 應(yīng)用本發(fā)明實施例,可以在服務(wù)器部署的語音識別系統(tǒng),其可以在聲學(xué)模型 (Acoustic Model,AM)與語言模型(Language Model,LM)的指導(dǎo)下針對接收到的語音數(shù)據(jù) 識別得到一個或多個文本信息,該文本信息可以具有對應(yīng)的識別評分。
[0153] 聲學(xué)模型(Acoustic Model,AM)是自動語音識別系統(tǒng)的模型中最底層的部分,同 時也是自動語音識別系統(tǒng)中最關(guān)鍵的組成單元,聲學(xué)模型建模的好壞會直接從根本上影響 語音識別系統(tǒng)的識別效果和魯棒性。聲學(xué)模型實驗概率統(tǒng)計的模型對帶有聲學(xué)信息的語音 基本單元建立模型,描述其統(tǒng)計特性。通過對聲學(xué)模型的建模,可以較有效地衡量語音的特 征矢量序列和每一個發(fā)音模板之間的相似度,可以有助于判斷該段語音的聲學(xué)信息,即語 音的內(nèi)容。語者的語音內(nèi)容都是由一些基本的語音單元組成,這些基本的語音單元可以是 句子、詞組、詞、音節(jié)(syllable)、子音節(jié)(Sub-syllable)或者音素等。
[0154] 由于語音信號的時變性、噪聲和其它一些不穩(wěn)定因素,單純靠聲學(xué)模型無法達到 較高的語音識別的準確率。在人類語言中,每一句話的單詞直接有密切的聯(lián)系,這些單詞 層面的信息可以減少聲學(xué)模型上的搜索范圍,有效地提高識別的準確性,要完成這項任務(wù), 語言模型是必不可少的,它提供了語言中詞之間的上下文信息以及語義信息。語言模型 (Language Model,LM)具體可以包括N-Gram模型、馬爾可夫N兀模型(Markov N-gram)、指 數(shù)模型(Exponential Models)、決策樹模型(Decision Tree Models)等等。而N-Gram模型 是最常被使用的統(tǒng)計語言模型,特別是二元語言模型(bigram)、三元語言模型(trigram)。
[0155] 當然,應(yīng)用本發(fā)明實施例,也可以在設(shè)備本地部署語音識別系統(tǒng)針對接收到的語 音數(shù)據(jù)識別得到一個或多個文本信息,該文本信息可以具有對應(yīng)的識別評分。
[0156] 子步驟S23,顯示所述文本信息。
[0157] 在本發(fā)明實施例中,當接收到文本信息后,可以進行輸入法界面顯示處理。
[0158] 在本發(fā)明實施例的一種優(yōu)選示例中,所述語音數(shù)據(jù)可以包括一個或多個語音子數(shù) 據(jù),所述識別文本可以包括由所述一個或多個語音子數(shù)據(jù)識別出的一個或多個第一文本信 息,步驟S23可以包括如下子步驟:
[0159] 子步驟S231,當檢測到指定按鍵的按下事件時,在當前界面顯示所述一個或多個 第一文本信息。
[0160] 本發(fā)明實施例中,可以采用連續(xù)語音識別技術(shù),將語音數(shù)據(jù)通過靜音檢測被劃分 為多個語音子數(shù)據(jù),對于每個語音子數(shù)據(jù),都可以通過聲學(xué)模型和通過語言模型識別出多 個候選識別文本,然后再通過用戶語言模型重排序,再分別計算置信度。
[0161] 而靜音檢測會可以按照時間順序檢測語音數(shù)據(jù)中存在的靜音,將輸入的語音數(shù)據(jù) 根據(jù)語音數(shù)據(jù)中一定長度的靜音進行了切分,分為了很多語音子數(shù)據(jù)。比如,語音數(shù)據(jù)為 "我今天想吃面條[0. 2秒靜音]但是食堂沒有賣面食的[0. 3秒靜音]我們出去吃吧",靜 音檢測會判斷語音數(shù)據(jù)中的靜音長度,然后按照一定的閾值(上例中選用0. 15秒作為判定 是否要切分語音數(shù)據(jù)的閾值)將上述語音切為3段語音子數(shù)據(jù)"我今天想吃面條"、"但是食 堂沒有賣面食的" "我們出去吃吧"。
[0162] 其中,該第一文本信息可以為識別語音數(shù)據(jù)時識別評分最高的文本信息,可以優(yōu) 先在輸入法界面顯示。
[0163] 例如,用戶輸入的語音數(shù)據(jù),原話可以為"今天天氣很好",進行語義識別后,可以 分別識別為"今天"、"天氣"和"很好",在當前輸入法界面顯示。
[0164] 當然,本發(fā)明實施例中,也可以不進行文本信息的切分,即第一文本信息可以為語 音數(shù)據(jù)所識別出的文本信息本身。
[0165] 在本發(fā)明實施例的另一種優(yōu)選示例中,所述識別文本還可以包括用于替換所述第 一識別文本的一個或多個第二識別文本,步驟S23還可以包括如下子步驟:
[0166] 子步驟S232,當所述第一識別文本被觸發(fā)時,在當前界面顯示所述第一文本信息 對應(yīng)的一個或多個第二文本信息。
[0167] 在具體實現(xiàn)中,該第二文本信息可以為識別語音數(shù)據(jù)時識別評分比第一文本信息 低的文本信息。
[0168] 當用戶點擊輸入法界面顯示的第一文本信息后,輸入法可以判斷出光標當前位于 哪一個區(qū)間(即第一文本信息),并展示出該區(qū)間的其他候選結(jié)果(即第二文本信息)供用 戶選擇。
[0169] 例如,用戶輸入的語音數(shù)據(jù),原話可以為"今天天氣很好",進行語義識別后,可以 分別識別為"今天"、"天氣"和"很好",在當前輸入法界面顯示。當用戶點擊"今天"時,可 以顯示用于替代"今天"的"金田"、"金天"等詞語。當用戶點擊"金田"時,則可以用"金田" 替代"今天"。
[0170] 在本發(fā)明的另一種優(yōu)選實施例中,步驟103可以包括如下子步驟:
[0171] 子步驟S31,在切換至所述語音輸入模式后預(yù)設(shè)的采集時間,采集語音數(shù)據(jù);
[0172] 子步驟S32,輸出所述語音數(shù)據(jù)。
[0173] 本發(fā)明實施例中,可以直接輸出所采集到的語音數(shù)據(jù)。
[0174] 例如,用戶之間可以采用即時通訊工具中進行交流,輸入法可以當前用戶發(fā)出的 語音數(shù)據(jù)發(fā)送至對方,使得用戶雙方可以基于語音數(shù)據(jù)進行交流。
[0175] 本發(fā)明實施例中在非語音輸入模式中監(jiān)聽到如指定按鍵的長按事件等指定的操 作事件時,直接切換至語音輸入模式,通過復(fù)用已有的按鍵,一物多用,避免了用戶進行點 擊語音輸入按鍵/入口等操作,提高了用戶操作的簡便性,降低了語音輸入模式的切換時 間,降低了輸入成本開銷,并且對輸入法的修改少,開發(fā)成本低,使得可以直接在語音輸入 模式中進行語音輸入處理,提高了語音輸入的效率。
[0176] 參照圖4,示出了本發(fā)明的一種語音輸入方法實施例2的步驟流程圖,具體可以包 括如下步驟:
[0177] 步驟401,判斷在非語音輸入模式中是否監(jiān)聽到指定的操作事件;若是,則執(zhí)行步 驟402 ;若否,則執(zhí)行步驟405 ;其中,所述指定的操作事件包括指定按鍵的長按事件、指定 的滑動事件、指定的移動設(shè)備翻轉(zhuǎn)事件、指定按鍵的雙擊事件、指定手勢事件中的至少一 種;
[0178] 步驟402,切換至語音輸入模式;
[0179] 步驟403,在所述語音輸入模式中進行語音輸入處理;
[0180] 步驟404,當監(jiān)聽到所述指定的操作事件結(jié)束時,切換至所述非語音輸入模式;
[0181] 在傳統(tǒng)的輸入法中,用戶若要在非語音輸入模式時進行語音輸入,首先需要點擊 語音輸入按鍵啟動語音輸入模式,然后進行語音輸入。在語音輸入完成后,若要再切回到非 語音輸入模式,則還需要點擊退回鍵才能回到非語音輸入模式,同樣操作繁瑣復(fù)雜,輸入成 本開銷高。
[0182] 本發(fā)明實施例在監(jiān)聽到諸如指定按鍵的長按事件等指定的操作事件結(jié)束時,可以 直接切換至非語音輸入模式,通過復(fù)用已有的按鍵,一物多用,避免了用戶進行點擊退回鍵 等操作,提高了用戶操作的簡便性,降低了非語音輸入模式的切換時間,降低了輸入成本開 銷,并且對輸入法的修改少,開發(fā)成本低,實現(xiàn)了非語音輸入模式和語音輸入模式之間的無 痕切換。
[0183] 在本發(fā)明實施例的一種優(yōu)選示例中,步驟404可以包括如下子步驟:
[0184] 子步驟S41,當監(jiān)聽到所述指定按鍵的松開事件時,切換至所述非語音輸入模式。
[0185] 在本不例中,可以通過覆蓋ViewGroup類的onTouchEvent (MotionEvent me)方法 來監(jiān)聽屏幕的觸摸事件,如按鍵的按下、滑動和松開等事件。
[0186] 如果onTouchEvent方法監(jiān)測到松開事件對應(yīng)的按鍵是指定按鍵(例如空格鍵), 則表明用戶已經(jīng)松開了指定按鍵,表示當次語音輸入已經(jīng)結(jié)束,可以切換回非語音輸入模 式。
[0187] 步驟405,執(zhí)行按鍵輸入操作、信息發(fā)送操作、圖像導(dǎo)入操作、拍攝操作、位置信息 導(dǎo)入操作、記錄操作、用戶信息導(dǎo)入操作、界面滾動操作、界面翻轉(zhuǎn)操作中的至少一種。
[0188] 本發(fā)明實施例中,若指定的操作事件為指定按鍵的長按事件、指定按鍵的雙擊事 件時,而指定按鍵可以在非語音輸入模式中,預(yù)設(shè)有除觸發(fā)語音模式以外的功能,若沒有監(jiān) 聽到該指定的操作事件,則可以觸發(fā)該指定按鍵預(yù)設(shè)有除觸發(fā)語音模式以外的功能。
[0189] 對于鍵盤能按鍵,則可以執(zhí)行按鍵輸入操作,輸入該指定按鍵,包括空格鍵、確定 鍵、字母鍵、數(shù)字鍵、符號鍵等等。例如,如果在指定的延遲時間內(nèi),監(jiān)測到指定按鍵(例如 空格鍵)的松開事件,即指定按鍵(例如空格鍵)被松開,那么可以認為未監(jiān)聽到指定按鍵 (例如空格鍵)的長按事件,輸入法將響應(yīng)指定按鍵(例如空格鍵)的松開事件,刪除之前 發(fā)送的延遲消息,并在文本框響應(yīng)該指定按鍵原有的功能(例如空格鍵對應(yīng)的輸入空格)。
[0190] 對于功能按鍵,則可以執(zhí)行信息發(fā)送操作,以在通訊中發(fā)送信息;或者,可以執(zhí)行 圖像導(dǎo)入操作,以導(dǎo)入用戶指定的圖像;或者,可以執(zhí)行拍攝操作,以啟動攝像設(shè)備拍攝照 片/錄像;或者,可以執(zhí)行位置信息導(dǎo)入操作,以導(dǎo)入用戶當前的位置信息;或者,可以執(zhí)行 記錄操作,以標記當前信息;或者,可以執(zhí)行用戶信息導(dǎo)入操作,以導(dǎo)入用戶需要的用戶信 息,可以是當前用戶的用戶信息,也可以其他用戶的用戶信息;等等。
[0191] 若指定的操作事件為指定的滑動事件、指定的手勢事件時,若沒有監(jiān)聽到該指定 的操作事件,例如滑動事件的持續(xù)時間少于預(yù)設(shè)時間閾值、手勢的軌跡不符合預(yù)設(shè)的軌跡 等等,則可以認為該操作為普通的滑動操作,可以在非語音輸入模式中,觸發(fā)界面滾動操 作。
[0192] 若指定的操作事件為指定的移動設(shè)備翻轉(zhuǎn)事件時,若沒有監(jiān)聽到該指定的操作事 件,例如移動設(shè)備的翻轉(zhuǎn)的角度少于預(yù)設(shè)角度閾值等等,則可以認為該操作為普通的移動 設(shè)備翻轉(zhuǎn)操作,可以在非語音輸入模式中,觸發(fā)界面翻轉(zhuǎn)操作。
[0193] 當然,上述操作只是作為示例,在實施本發(fā)明實施例時,可以根據(jù)實際情況設(shè)置其 他操作,本發(fā)明實施例對此不加以限制。另外,除了上述操作外,本領(lǐng)域技術(shù)人員還可以根 據(jù)實際需要采用其它操作,本發(fā)明實施例對此也不加以限制。
[0194] 特別地,步驟405中的按鍵輸入操作、信息發(fā)送操作、圖像導(dǎo)入操作、拍攝操作、位 置信息導(dǎo)入操作、記錄操作、用戶信息導(dǎo)入操作、界面滾動操作、界面翻轉(zhuǎn)操作中的至少一 種,也可以在除輸入法以外的情景中執(zhí)行,例如,在通訊工具中執(zhí)行信息發(fā)送操作,以轉(zhuǎn)發(fā) 信息到對方用戶,本發(fā)明實施例對此不加以限制。
[0195] 需要說明的是,對于方法實施例,為了簡單描述,故將其都表述為一系列的動作組 合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明實施例并不受所描述的動作順序的限制,因為依 據(jù)本發(fā)明實施例,某些步驟可以采用其他順序或者同時進行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該 知悉,說明書中所描述的實施例均屬于優(yōu)選實施例,所涉及的動作并不一定是本發(fā)明實施 例所必須的。
[0196] 參照圖5,示出了本發(fā)明一種語音輸入裝置實施例1的結(jié)構(gòu)框圖,具體可以包括如 下模塊:
[0197] 操作事件判斷模塊501,用于判斷在非語音輸入模式中是否監(jiān)聽到指定的操作事 件;若是,則調(diào)用切換模塊502 ;其中,所述指定的操作事件可以包括指定按鍵的長按事件、 指定的滑動事件、指定的移動設(shè)備翻轉(zhuǎn)事件、指定按鍵的雙擊事件、指定手勢事件中的至少 一種;
[0198] 語音輸入模式切換模塊502,用于切換至語音輸入模式;
[0199] 語音數(shù)據(jù)處理模塊503,用于在所述語音輸入模式中進行語音輸入處理。
[0200] 在本發(fā)明的一種優(yōu)選實施例中,所述操作事件判斷模塊501可以包括如下子模 塊:
[0201] 按鍵觸發(fā)子模塊,用于在非語音輸入模塊中觸發(fā)觸控位置對應(yīng)按鍵的按下事件;
[0202] 按下事件判斷子模塊,用于判斷是否監(jiān)聽到指定按鍵的按下事件;若是,則調(diào)用松 開事件判斷子模塊;
[0203] 松開事件判斷子模塊,用于判斷在預(yù)設(shè)的延遲時間內(nèi)是否監(jiān)聽到指定按鍵的松開 事件;若否,則調(diào)用長按事件判斷子模塊;
[0204] 長按事件判斷子模塊,用于判斷監(jiān)聽到指定按鍵的長按事件。
[0205] 在本發(fā)明實施例的一種優(yōu)選示例中,所述按鍵觸發(fā)子模塊包括:
[0206] 實際按鍵位置查找子模塊,用于查找觸控位置對應(yīng)的實際按鍵位置;
[0207] 按下事件觸發(fā)子模塊,用于觸發(fā)所述實際按鍵位置對應(yīng)按鍵的按下事件。
[0208] 在本發(fā)明實施例的一種優(yōu)選示例中,所述預(yù)設(shè)的延遲時間可以為N倍的按鍵時 間;其中,所述按鍵時間為在先采集的,當前用戶點擊按鍵的平均按下時間,所述N為正數(shù)。
[0209] 在本發(fā)明的一種優(yōu)選實施例中,所述語音輸入處理模塊503可以包括如下子模 塊:
[0210] 語音數(shù)據(jù)采集子模塊,用于在切換至所述語音輸入模式后預(yù)設(shè)的采集時間,采集 語音數(shù)據(jù);
[0211] 文本信息獲取子模塊,用于獲取根據(jù)所述語音數(shù)據(jù)所識別出的文本信息;
[0212] 文本信息顯示子模塊,用于顯示所述文本信息。
[0213] 在本發(fā)明實施例的一種優(yōu)選示例中,所述預(yù)設(shè)的采集時間可以為在先采集當前用 戶的,從監(jiān)測到觸控位置至采集到語音數(shù)據(jù)之間的平均時間。
[0214] 在本發(fā)明實施例的一種優(yōu)選示例中,所述語音數(shù)據(jù)可以包括一個或多個語音子數(shù) 據(jù),所述識別文本可以包括由所述一個或多個語音子數(shù)據(jù)識別出的一個或多個第一文本信 息,所述文本信息顯示子模塊可以包括如下子模塊:
[0215] 第一顯示子模塊,用于在檢測到指定按鍵的按下事件時,在當前界面顯示所述一 個或多個第一文本信息。
[0216] 在本發(fā)明實施例的一種優(yōu)選示例中,所述識別文本還可以包括由所述一個或多個 語音子數(shù)據(jù)識別出的,用于替換所述第一識別文本的一個或多個第二識別文本,所述文本 信息顯示子模塊還可以包括如下子模塊:
[0217] 第二顯示子模塊,用于在所述第一識別文本被觸發(fā)時,在當前界面顯示所述第一 文本信息對應(yīng)的一個或多個第二文本信息。
[0218] 在本發(fā)明的一種優(yōu)選實施例中,所述語音輸入處理模塊503可以包括如下子模 塊:
[0219] 語音數(shù)據(jù)采集子模塊,用于在切換至所述語音輸入模式后預(yù)設(shè)的采集時間,采集 語音數(shù)據(jù);
[0220] 語音數(shù)據(jù)輸出子模塊,用于輸出所述語音數(shù)據(jù)。
[0221] 參照圖6,示出了本發(fā)明一種語音輸入裝置實施例2的結(jié)構(gòu)框圖,具體可以包括如 下模塊:
[0222] 操作事件判斷模塊601,用于判斷在非語音輸入模式中是否監(jiān)聽到指定的操作事 件;若是,則調(diào)用切換模塊602,若否,則調(diào)用原操作執(zhí)行模塊605 ;其中,所述指定的操作事 件可以包括指定按鍵的長按事件、指定的滑動事件、指定的移動設(shè)備翻轉(zhuǎn)事件、指定按鍵的 雙擊事件、指定手勢事件中的至少一種;
[0223] 語音輸入模式切換模塊602,用于切換至語音輸入模式;
[0224] 語音輸入處理模塊603,用于在所述語音輸入模式中進行語音輸入處理;
[0225] 非語音輸入模式切換模塊604,用于在監(jiān)聽到所述指定的操作事件結(jié)束時,切換至 所述非語音輸入模式;
[0226] 原操作執(zhí)行模塊605,用于在非語音輸入模式中未監(jiān)聽到指定的操作事件時,執(zhí)行 按鍵輸入操作、信息發(fā)送操作、圖像導(dǎo)入操作、拍攝操作、位置信息導(dǎo)入操作、記錄操作、用 戶信息導(dǎo)入操作、界面滾動操作、界面翻轉(zhuǎn)操作中的至少一種。
[0227] 在本發(fā)明實施例的一種優(yōu)選示例中,所述非語音輸入模式切換模塊604可以包括 如下子模塊:
[0228] 指定按鍵切換子模塊,用于在監(jiān)聽到所述指定按鍵的松開事件時,切換至所述非 語音輸入模式。
[0229] 對于裝置實施例而言,由于其與方法實施例基本相似,所以描述的比較簡單,相關(guān) 之處參見方法實施例的部分說明即可。
[0230] 本說明書中的各個實施例均采用遞進的方式描述,每個實施例重點說明的都是與 其他實施例的不同之處,各個實施例之間相同相似的部分互相參見即可。
[0231] 本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明實施例的實施例可提供為方法、裝置、或計算 機程序產(chǎn)品。因此,本發(fā)明實施例可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和 硬件方面的實施例的形式。而且,本發(fā)明實施例可采用在一個或多個其中包含有計算機可 用程序代碼的計算機可用存儲介質(zhì)(包括但不限于磁盤存儲器、CD-ROM、光學(xué)存儲器等)上 實施的計算機程序產(chǎn)品的形式。
[0232] 本發(fā)明實施例是參照根據(jù)本發(fā)明實施例的方法、終端設(shè)備(系統(tǒng))、和計算機程序 產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機程序指令實現(xiàn)流程圖和/或方框 圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合。可提 供這些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理 終端設(shè)備的處理器以產(chǎn)生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理終端設(shè)備的處 理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多 個方框中指定的功能的裝置。
[0233] 這些計算機程序指令也可存儲在能引導(dǎo)計算機或其他可編程數(shù)據(jù)處理終端設(shè)備 以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包 括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方 框或多個方框中指定的功能。
[0234] 這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理終端設(shè)備上,使得 在計算機或其他可編程終端設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理,從而在 計算機或其他可編程終端設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程 和/或方框圖一個方框或多個方框中指定的功能的步驟。
[0235] 盡管已描述了本發(fā)明實施例的優(yōu)選實施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基 本創(chuàng)造性概念,則可對這些實施例做出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為 包括優(yōu)選實施例以及落入本發(fā)明實施例范圍的所有變更和修改。
[0236] 最后,還需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將 一個實體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作 之間存在任何這種實際的關(guān)系或者順序。而且,術(shù)語"包括"、"包含"或者其任何其他變體意 在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者終端設(shè)備不僅包 括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品 或者終端設(shè)備所固有的要素。在沒有更多限制的情況下,由語句"包括一個……"限定的要 素,并不排除在包括所述要素的過程、方法、物品或者終端設(shè)備中還存在另外的相同要素。
[0237] 以上對本發(fā)明所提供的一種語音輸入方法和一種語音輸入裝置,進行了詳細介 紹,本文中應(yīng)用了具體個例對本發(fā)明的原理及實施方式進行了闡述,以上實施例的說明只 是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā) 明的思想,在【具體實施方式】及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理 解為對本發(fā)明的限制。
【權(quán)利要求】
1. 一種語音輸入方法,其特征在于,包括: 判斷在非語音輸入模式中是否監(jiān)聽到指定的操作事件; 若是,則切換至語音輸入模式;其中,所述指定的操作事件包括指定按鍵的長按事件、 指定的滑動事件、指定的移動設(shè)備翻轉(zhuǎn)事件、指定按鍵的雙擊事件、指定手勢事件中的至少 一種; 在所述語音輸入模式中進行語音輸入處理。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述判斷在非語音輸入模式中是否監(jiān)聽 到指定的操作事件的步驟包括: 在非語音輸入模式中觸發(fā)觸控位置對應(yīng)按鍵的按下事件; 判斷是否監(jiān)聽到指定按鍵的按下事件; 若監(jiān)聽到指定按鍵的按下事件,則判斷在預(yù)設(shè)的延遲時間內(nèi)是否監(jiān)聽到指定按鍵的松 開事件; 若未在預(yù)設(shè)的延遲時間內(nèi)監(jiān)聽到指定按鍵的松開事件,則判斷監(jiān)聽到指定按鍵的長按 事件。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述在非語音輸入模式中觸發(fā)屏幕點擊 位置對應(yīng)按鍵的按下事件的步驟包括: 查找觸控位置對應(yīng)的實際按鍵位置; 觸發(fā)所述實際按鍵位置對應(yīng)按鍵的按下事件。
4. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述預(yù)設(shè)的延遲時間為N倍的按鍵時間; 其中,所述按鍵時間為預(yù)先采集的,當前用戶點擊按鍵的平均按下時間,所述N為正數(shù)。
5. 根據(jù)權(quán)利要求1或2或3或4所述的方法,其特征在于,所述在所述語音輸入模式中 進行語音輸入處理的步驟包括: 在切換至所述語音輸入模式后預(yù)設(shè)的采集時間,采集語音數(shù)據(jù); 獲取根據(jù)所述語音數(shù)據(jù)所識別出的文本信息; 顯示所述文本信息。
6. 根據(jù)權(quán)利要求5所述的方法,其特征在于,所述預(yù)設(shè)的采集時間為在預(yù)先采集當前 用戶的,從監(jiān)測到觸控位置至采集到語音數(shù)據(jù)之間的平均時間。
7. 根據(jù)權(quán)利要求5所述的方法,其特征在于,所述語音數(shù)據(jù)包括一個或多個語音子數(shù) 據(jù),所述識別文本包括由所述一個或多個語音子數(shù)據(jù)識別出的一個或多個第一文本信息, 所述顯示所述文本信息的步驟包括 : 當檢測到指定按鍵的按下事件時,在當前界面顯示所述一個或多個第一文本信息。
8. 根據(jù)權(quán)利要求7所述的方法,其特征在于,所述識別文本還包括由所述一個或多個 語音子數(shù)據(jù)識別出的,用于替換所述第一識別文本的一個或多個第二識別文本,所述顯示 所述文本信息的步驟還包括: 當所述第一識別文本被觸發(fā)時,在當前界面顯示所述第一文本信息對應(yīng)的一個或多個 第二文本信息。
9. 根據(jù)權(quán)利要求1或2或3或4所述的方法,其特征在于,所述在所述語音輸入模式中 進行語音輸入處理的步驟包括: 在切換至所述語音輸入模式后預(yù)設(shè)的采集時間,采集語音數(shù)據(jù); 輸出所述語音數(shù)據(jù)。
10. 根據(jù)權(quán)利要求1或2或3或4或6或7或8所述的方法,其特征在于,還包括: 當監(jiān)聽到所述指定的操作事件結(jié)束時,切換至所述非語音輸入模式。
11. 根據(jù)權(quán)利要求10所述的方法,其特征在于,所述當監(jiān)聽到所述指定的操作事件結(jié) 束時,切換至所述非語音輸入模式的步驟包括: 當監(jiān)聽到所述指定按鍵的松開事件時,切換至所述非語音輸入模式。
12. 根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 在非語音輸入模式中未監(jiān)聽到指定的操作事件時,執(zhí)行按鍵輸入操作、信息發(fā)送操作、 圖像導(dǎo)入操作、拍攝操作、位置信息導(dǎo)入操作、記錄操作、用戶信息導(dǎo)入操作、界面滾動操 作、界面翻轉(zhuǎn)操作中的至少一種。
13. -種語音輸入裝置,其特征在于,包括: 操作事件判斷模塊,用于判斷在非語音輸入模式中是否監(jiān)聽到指定的操作事件;若是, 則調(diào)用切換模塊;其中,所述指定的操作事件包括指定按鍵的長按事件、指定的滑動事件、 指定的移動設(shè)備翻轉(zhuǎn)事件、指定按鍵的雙擊事件、指定手勢事件中的至少一種; 語音輸入模式切換模塊,用于切換至語音輸入模式; 語音輸入處理模塊,用于在所述語音輸入模式中進行語音輸入處理。
14. 根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述操作事件判斷模塊包括: 按鍵觸發(fā)子模塊,用于在非語音輸入模塊中觸發(fā)觸控位置對應(yīng)按鍵的按下事件; 按下事件判斷子模塊,用于判斷是否監(jiān)聽到指定按鍵的按下事件;若是,則調(diào)用松開事 件判斷子模塊; 松開事件判斷子模塊,用于判斷在預(yù)設(shè)的延遲時間內(nèi)監(jiān)聽到指定按鍵的松開事件;若 否,則調(diào)用長按事件判斷子模塊; 長按事件判斷子模塊,用于判斷監(jiān)聽到指定按鍵的長按事件。
15. 根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述按鍵觸發(fā)子模塊包括: 實際按鍵位置查找子模塊,用于查找觸控位置對應(yīng)的實際按鍵位置; 按下事件觸發(fā)子模塊,用于觸發(fā)所述實際按鍵位置對應(yīng)按鍵的按下事件。
16. 根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述預(yù)設(shè)的延遲時間為N倍的按鍵時 間;其中,所述按鍵時間為在先采集的,當前用戶點擊按鍵的平均按下時間,所述N為正數(shù)。
17. 根據(jù)權(quán)利要求13或14或15或16所述的裝置,其特征在于,所述語音輸入處理模 塊包括: 語音數(shù)據(jù)采集子模塊,用于在切換至所述語音輸入模式后預(yù)設(shè)的采集時間,采集語音 數(shù)據(jù); 文本信息獲取子模塊,用于獲取根據(jù)所述語音數(shù)據(jù)所識別出的文本信息; 文本信息顯示子模塊,用于顯示所述文本信息。
18. 根據(jù)權(quán)利要求17所述的裝置,其特征在于,所述預(yù)設(shè)的采集時間為在先采集當前 用戶的,從監(jiān)測到觸控位置至采集到語音數(shù)據(jù)之間的平均時間。
19. 根據(jù)權(quán)利要求17所述的裝置,其特征在于,所述語音數(shù)據(jù)包括一個或多個語音子 數(shù)據(jù),所述識別文本包括由所述一個或多個語音子數(shù)據(jù)識別出的一個或多個第一文本信 息,所述文本信息顯示子模塊包括: 第一顯示子模塊,用于在檢測到指定按鍵的按下事件時,在當前界面顯示所述一個或 多個第一文本信息。
20. 根據(jù)權(quán)利要求19所述的裝置,其特征在于,所述識別文本還包括由所述一個或多 個語音子數(shù)據(jù)識別出的,用于替換所述第一識別文本的一個或多個第二識別文本,所述文 本信息顯示子模塊還包括: 第二顯示子模塊,用于在所述第一識別文本被觸發(fā)時,在當前界面顯示所述第一文本 信息對應(yīng)的一個或多個第二文本信息。
21. 根據(jù)權(quán)利要求13或14或15或16所述的裝置,其特征在于,所述語音輸入處理模 塊包括: 語音數(shù)據(jù)采集子模塊,用于在切換至所述語音輸入模式后預(yù)設(shè)的采集時間,采集語音 數(shù)據(jù); 語音數(shù)據(jù)輸出子模塊,用于輸出所述語音數(shù)據(jù)。
22. 根據(jù)權(quán)利要求13或14或15或16或18或19或20所述的裝置,其特征在于,還包 括: 非語音輸入模式切換模塊,用于在監(jiān)聽到所述指定的操作事件結(jié)束時,切換至所述非 語音輸入模式。
23. 根據(jù)權(quán)利要求22所述的裝置,其特征在于,所非語音輸入模式切換模塊包括: 指定按鍵切換子模塊,用于在監(jiān)聽到所述指定按鍵的松開事件時,切換至所述非語音 輸入模式。
24. 根據(jù)權(quán)利要求13所述的裝置,其特征在于,還包括: 原操作執(zhí)行模塊,用于在非語音輸入模式中未監(jiān)聽到指定的操作事件時,執(zhí)行按鍵輸 入操作、信息發(fā)送操作、圖像導(dǎo)入操作、拍攝操作、位置信息導(dǎo)入操作、記錄操作、用戶信息 導(dǎo)入操作、界面滾動操作、界面翻轉(zhuǎn)操作中的至少一種。
【文檔編號】G06F9/44GK104090652SQ201410265882
【公開日】2014年10月8日 申請日期:2014年6月13日 優(yōu)先權(quán)日:2014年6月13日
【發(fā)明者】王輝, 劉玨, 宋春偉 申請人:北京搜狗科技發(fā)展有限公司