本發(fā)明涉及信息輸入領(lǐng)域,特別是涉及一種基于語音識別的信息輸入方法及裝置,電子設(shè)備。
背景技術(shù):
隨著語音識別技術(shù)的發(fā)展,越來越多的電子設(shè)備或應(yīng)用通過語音識別進行信息輸入。現(xiàn)有技術(shù)中的語音輸入方法通常為:首先,獲取用戶輸入的語音數(shù)據(jù);然后,對獲取的語音數(shù)據(jù)進行識別;最后,直接輸入語音識別結(jié)果?;蛘撸?dāng)語音識別結(jié)果有多個時,以列表形式展示多個識別結(jié)果,然后,根據(jù)用戶的選擇輸入用戶選擇的識別結(jié)果。但是,當(dāng)用戶輸入的語音不標(biāo)準(zhǔn)或者輸入同音詞時,某個或某些詞語的識別結(jié)果可能不準(zhǔn)確或存在多個候選識別結(jié)果,因此,直接輸入的語音識別結(jié)果或者列表顯示的識別結(jié)果可能不是用戶真正要輸入的信息,這種情況下,用戶只能刪除識別錯誤的語音識別結(jié)果,然后重新進行語音輸入。現(xiàn)有技術(shù)中,還有一種做法是將多條語音識別結(jié)果一列表形式顯示出來,供用戶選擇輸入。這種方法同樣存在多條語音識別結(jié)果均不是用戶真正要輸入的信息的問題。
可見,現(xiàn)有技術(shù)中的基于語音識別的信息輸入方法至少存在:由于單個詞語語音識別結(jié)果不準(zhǔn)確或存在多個候選,致使輸入或展示給用戶的識別結(jié)果不準(zhǔn)確,需要用戶重新輸入,從而導(dǎo)致的輸入效率低下的問題。
技術(shù)實現(xiàn)要素:
本申請所要解決的技術(shù)問題是:現(xiàn)有技術(shù)中的基于語音識別的信息輸入方法存在的輸入效率低下的問題。
為了解決上述問題,本發(fā)明實施例提供了一種基于語音識別的信息輸入方法,包括:
對輸入語音進行識別,獲取至少兩條語音識別結(jié)果;其中,每條所述語音識別結(jié)果為由所述輸入語音中每個詞語語音對應(yīng)的詞語識別結(jié)果組成的詞語識別結(jié)果序列;
確定所述每個詞語語音對應(yīng)的所述至少兩條語音識別結(jié)果中的全部詞語識別結(jié)果;
按照所述詞語語音的輸入順序,顯示所述每個詞語語音對應(yīng)的至少部分詞語識別結(jié)果;
根據(jù)用戶對顯示的所述至少部分詞語識別結(jié)果的選擇操作,生成待輸入信息。
另一方面,本發(fā)明實施例提供了一種基于語音識別的信息輸入裝置,包括:
語音識別模塊,用于對輸入語音進行識別,獲取至少兩條語音識別結(jié)果;其中,每條所述語音識別結(jié)果為由所述輸入語音中每個詞語語音對應(yīng)的詞語識別結(jié)果組成的詞語識別結(jié)果序列;
詞語識別結(jié)果確定模塊,用于確定所述每個詞語語音對應(yīng)的所述至少兩條語音識別結(jié)果中的全部詞語識別結(jié)果;
詞語識別結(jié)果顯示模塊,用于按照所述詞語語音的輸入順序,顯示所述詞語識別結(jié)果確定模塊確定的每個詞語語音對應(yīng)的至少部分詞語識別結(jié)果;
輸入信息生成模塊,用于根據(jù)用戶對所述詞語識別結(jié)果顯示模塊顯示的所述至少部分詞語識別結(jié)果的選擇操作,生成待輸入信息。
第三方面,本發(fā)明實施例提供了一種電子設(shè)備,包括存儲器、處理器及存儲在所述存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)本發(fā)明實施例所述的基于語音識別的信息輸入方法。
第三方面,本發(fā)明實施例提供了一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,該程序被處理器執(zhí)行時實現(xiàn)本發(fā)明實施例所述的基于語音識別的信息輸入方法的步驟。
本發(fā)明的實施例公開的基于語音識別的信息輸入方法,通過對輸入語音進行識別,獲取至少兩條語音識別結(jié)果;其中,每條所述語音識別結(jié)果為由所述輸入語音中每個詞語語音對應(yīng)的詞語識別結(jié)果組成的詞語識別結(jié)果序列;確定所述每個詞語語音對應(yīng)的所述至少兩條語音識別結(jié)果中的全部詞語識別結(jié)果;并按照所述詞語識別結(jié)果序列中的順序,顯示所述每個詞語對應(yīng)的至少部分詞語識別結(jié)果;最后,根據(jù)用戶對顯示的詞語識別結(jié)果的選擇操作,生成待輸入信息,解決了現(xiàn)有技術(shù)中基于語音識別的信息輸入方法存在的輸入效率低下的問題。通過將每個詞語語音對應(yīng)的多個詞語識別結(jié)果進行顯示,并根據(jù)用戶的選擇組成待輸入信息,準(zhǔn)確生成待輸入信息并完成輸入,進一步提高了語音輸入的效率。
附圖說明
為了更清楚地說明本發(fā)明實施例的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明實施例一的基于語音識別的信息輸入方法流程圖;
圖2是本發(fā)明實施例二的基于語音識別的信息輸入方法流程圖;
圖3是實施例二中詞語識別結(jié)果顯示示意圖之一;
圖4是實施例二中詞語識別結(jié)果顯示示意圖之一;
圖5是本發(fā)明實施例三的基于語音識別的信息輸入方法流程圖;
圖6是實施例三中詞語識別結(jié)果顯示示意圖之一;
圖7是實施例三中詞語識別結(jié)果顯示示意圖之二;
圖8是本發(fā)明實施例四基于語音識別的信息輸入裝置結(jié)構(gòu)示意圖之一;
圖9是本發(fā)明實施例四基于語音識別的信息輸入裝置結(jié)構(gòu)示意圖之二;
圖10是本發(fā)明實施例四基于語音識別的信息輸入裝置結(jié)構(gòu)示意圖之三。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
實施例一
本發(fā)明公開的一種基于語音識別的信息輸入方法,如圖1所示,所述方法包括:步驟100至步驟130。
步驟100,對輸入語音進行識別,獲取至少兩條語音識別結(jié)果。
其中,每條所述語音識別結(jié)果為由所述輸入語音中每個詞語語音對應(yīng)的詞語識別結(jié)果組成的詞語識別結(jié)果序列。
當(dāng)用戶通過應(yīng)用,如輸入法界面的語音輸入控件輸入語音之后,通過調(diào)用系統(tǒng)提供的接口,可以獲取用戶的輸入語音。然后,應(yīng)用將進一步調(diào)用語音識別引擎對獲取的輸入語音進行識別,以得到語音識別結(jié)果。
通常,語音識別引擎首先根據(jù)語音數(shù)據(jù)的音頻特性對輸入的語音進行分段處理,然后,對每一段語音分別進行識別。用戶在輸入語音時,不同詞語之間通常會由短暫的發(fā)音間隔,因此,經(jīng)過分段處理之后,每段語音將對應(yīng)一個詞語的語音。語音識別引擎對每段語音進行識別后,將會得到每個詞語語音的詞語識別結(jié)果。由于不同用戶咬字和口音的差別,具體實施時,同一個詞語語音可能會識別的到多個詞語識別結(jié)果?;蛘撸瑢τ谟脩糨斎胪糇只蛲粼~的情況,語音識別引擎可能會識別得到多個詞語識別結(jié)果。因此,通常,每個詞語語音將會得到至少一個詞語識別結(jié)果。
然后,語音識別引擎通過語言模型對輸入語音中每個詞語語音對應(yīng)的詞語識別結(jié)果進行修正,并進一步組合成詞語序列。當(dāng)某個詞語語音有多個詞語識別結(jié)果時,語音識別引擎將得到輸入語音的至少兩條語音識別結(jié)果。
步驟110,確定所述每個詞語語音對應(yīng)的所述至少兩條語音識別結(jié)果中的全部詞語識別結(jié)果。
語音識別引擎根據(jù)每段語音的詞語識別結(jié)果,結(jié)合語言模型,得到至少兩條語音識別結(jié)果之后,根據(jù)語音識別引擎輸出的至少兩條語音識別結(jié)果可以確定每段語音分別對應(yīng)的詞語識別結(jié)果,即每個詞語語音分別對應(yīng)的詞語識別結(jié)果。以語音識別引擎輸出的語音識別結(jié)果為:“can’tyouhelpme”和“canyouhelpme”為例,可以確定輸入語音中:第一個詞語語音對應(yīng)的詞語識別結(jié)果為:“can’t”和“can”、第二個詞語語音對應(yīng)的詞語識別結(jié)果為:“you”、第三個詞語語音對應(yīng)的詞語識別結(jié)果為:“help”、第四個詞語語音對應(yīng)的詞語識別結(jié)果為:“me”。具體實施時,根據(jù)語音識別引擎輸出的語音識別結(jié)果的數(shù)據(jù)格式可以確定每個詞語語音分別對應(yīng)的詞語識別結(jié)果。
步驟120,按照所述詞語語音的輸入順序,顯示所述每個詞語語音對應(yīng)的至少部分詞語識別結(jié)果。
輸入語音中每個詞語語音對應(yīng)的詞語識別結(jié)果可能為一個,也可能為多個,為了便于通過選擇每個詞語語音對應(yīng)的詞語識別結(jié)果以組成所述輸入語音對應(yīng)的輸入信息,本發(fā)明將每個詞語語音對應(yīng)的詞語識別結(jié)果采用相應(yīng)的方式進行顯示。例如:按照詞語識別結(jié)果對應(yīng)的詞語語音在輸入語音中的先后順序,在相應(yīng)的位置列表顯示每個詞語語音的詞語識別結(jié)果。如某個詞語語音對應(yīng)的詞語識別結(jié)果大于1個,則采用列表的形式顯示該詞語語音對應(yīng)的全部詞語識別結(jié)果或識別得分最高的部分詞語識別結(jié)果?;蛘撸缒硞€詞語語音對應(yīng)的詞語識別結(jié)果大于1個,則采用撥盤的形式顯示該詞語語音對應(yīng)的全部詞語識別結(jié)果或識別得分最高的部分詞語識別結(jié)果。或者,如某個詞語語音對應(yīng)的詞語識別結(jié)果大于1個,則采用突出顯示格式顯示該詞語語音中識別得分最高的一個詞語識別結(jié)果,以指示用戶通過觸發(fā)該詞語識別結(jié)果可以選擇該詞語語音的其他詞語識別結(jié)果。
步驟130,根據(jù)用戶對顯示的詞語識別結(jié)果的選擇操作,生成待輸入信息。
用戶可以通過點擊、滑動等操作選擇顯示的詞語識別結(jié)果,然后由選擇的詞語識別結(jié)果組成詞組或句子,作為待輸入信息。
本發(fā)明實施例公開的基于語音識別的信息輸入方法,通過對輸入語音進行識別,獲取至少兩條語音識別結(jié)果;其中,每條所述語音識別結(jié)果為由所述輸入語音中每個詞語語音對應(yīng)的詞語識別結(jié)果組成的詞語識別結(jié)果序列;確定所述每個詞語語音對應(yīng)的所述至少兩條語音識別結(jié)果中的全部詞語識別結(jié)果;并按照所述詞語識別結(jié)果序列中的順序,顯示所述每個詞語對應(yīng)的至少部分詞語識別結(jié)果;最后,根據(jù)用戶對顯示的詞語識別結(jié)果的選擇操作,生成待輸入信息,解決了現(xiàn)有技術(shù)中基于語音識別的信息輸入方法存在的輸入效率低下的問題。通過將每個詞語語音對應(yīng)的多個詞語識別結(jié)果進行顯示,并根據(jù)用戶的選擇組成待輸入信息,準(zhǔn)確生成待輸入信息并完成輸入,進一步提高了語音輸入的效率。
實施例二
本發(fā)明實施例公開的一種基于語音識別的信息輸入方法,如圖2所示,所述方法包括:步驟200至步驟230。
步驟200,對輸入語音進行識別,獲取至少兩條語音識別結(jié)果。
其中,每條所述語音識別結(jié)果為由所述輸入語音中每個詞語語音對應(yīng)的詞語識別結(jié)果組成的詞語識別結(jié)果序列。
對輸入語音進行識別,獲取至少兩條語音識別結(jié)果的具體實施方式參見實施例一,此處不再贅述。
步驟210,確定所述每個詞語語音對應(yīng)的所述至少兩條語音識別結(jié)果中的全部詞語識別結(jié)果。
確定所述每個詞語語音對應(yīng)的所述至少兩條語音識別結(jié)果中的全部詞語識別結(jié)果的具體實施方式參見實施例一,此處不再贅述。
本實施例中,以語音識別引擎輸出的語音識別結(jié)果為:“can’tyouhitit”和“canyouheatit”為例,可以確定輸入語音中:第一個詞語語音對應(yīng)的詞語識別結(jié)果為:“can’t”和“can”、第二個詞語語音對應(yīng)的詞語識別結(jié)果為:“you”、第三個詞語語音對應(yīng)的詞語識別結(jié)果為:“hit”和“heat”、第四個詞語語音對應(yīng)的詞語識別結(jié)果為:“it”。
步驟220,按照所述詞語語音的輸入順序,在相應(yīng)位置并列顯示對應(yīng)同一詞語語音的多個詞語識別結(jié)果。
當(dāng)語音識別引擎輸出的語音識別結(jié)果中,存在于同一詞語語音對應(yīng)的多個詞語識別結(jié)果時,顯示所述每個詞語語音對應(yīng)的至少部分詞語識別結(jié)果的步驟進一步包括:在相應(yīng)位置并列顯示對應(yīng)同一詞語語音的多個詞語識別結(jié)果。
仍以上一步驟中確定的詞語識別結(jié)果為例,第一個詞語語音和第三個詞語語音分別對應(yīng)多個詞語識別結(jié)果“can’t”和“can”,因此,在第一個位置并列顯示第一個詞語語音對應(yīng)的兩個詞語識別結(jié)果,在第三個位置并列顯示第三個詞語語音對應(yīng)的兩個詞語識別結(jié)果“hit”和“heat”。第二個詞語語音和第四個詞語語音分別與詞語識別結(jié)果一一對應(yīng),在相應(yīng)位置僅顯示一個詞語識別結(jié)果。具體詞語識別結(jié)果顯示示意圖如圖3所示。
具體實施時,為了直觀的體現(xiàn)詞語語音的輸入順序,以及由詞語識別結(jié)果組成輸入信息的可能性,可以通過箭頭將詞語識別結(jié)果連接起來,形成詞語鏈條,如圖4所示,即以詞語鏈條的形式顯示所述每個詞語語音對應(yīng)的詞語識別結(jié)果;其中,將對應(yīng)同一詞語語音的多個詞語識別結(jié)果作為不同詞語鏈條的并列節(jié)點;將與詞語語音一一對應(yīng)的詞語識別結(jié)果作為所述不同詞語鏈條的共同節(jié)點。由圖4中顯示的詞語識別結(jié)果可以看出,所述詞語識別結(jié)果可以組成的輸入的信息有四種,分別是:“can’tyouhitit”、“canyouheatit”、“can’tyouheatit”和“canyouhitit”。通過在相應(yīng)位置并列顯示對應(yīng)同一詞語語音的多個詞語識別結(jié)果,增加了用戶輸入信息的可選性。
步驟230,根據(jù)用戶對并列顯示的所述多個詞語識別結(jié)果的選擇操作,生成包括所述選擇操作針對的詞語識別結(jié)果的待輸入信息。
具體實施時,當(dāng)語音識別引擎輸出的語音識別結(jié)果中,存在于同一詞語語音對應(yīng)的多個詞語識別結(jié)果時,根據(jù)用戶對顯示的所述至少部分詞語識別結(jié)果的選擇操作,生成待輸入信息,進一步包括:根據(jù)用戶對并列顯示的所述多個詞語識別結(jié)果的選擇操作,生成包括所述選擇操作針對的詞語識別結(jié)果的待輸入信息。
具體實施時,所述選擇操作包括:點擊并列顯示的所述詞語識別結(jié)果、執(zhí)行滑動手勢經(jīng)過并列顯示的所述詞語識別結(jié)果和與詞語語音一一對應(yīng)的詞語識別結(jié)果。以圖3和圖4中顯示的詞語識別結(jié)果為例,用戶可以通過依次點擊“can’t”和“hit”,選擇詞語識別結(jié)果,然后,根據(jù)用戶對并列顯示的所述多個詞語識別結(jié)果的選擇操作,生成包括所述選擇操作針對的詞語識別結(jié)果“can’t”和“hit”的待輸入信息,如:“can’tyouhitit”。用戶還可以通過執(zhí)行滑動手勢來選擇詞語識別結(jié)果。例如,用戶通過手指沿圖4中顯示的詞語鏈條滑動,手指依次經(jīng)過詞語鏈條上第一至第四個節(jié)點,即“can”、“you”、“heat”、“it”所在節(jié)點,由所述滑動操作經(jīng)過的節(jié)點處的詞語識別結(jié)果,組成待輸入信息:“canyouheatit”。
用戶可以通過點擊、滑動等操作選擇顯示的詞語識別結(jié)果,然后由選擇的詞語識別結(jié)果組成詞組或句子,作為待輸入信息。
本發(fā)明實施例公開的基于語音識別的信息輸入方法,通過對輸入語音進行識別,獲取至少兩條語音識別結(jié)果;其中,每條所述語音識別結(jié)果為由所述輸入語音中每個詞語語音對應(yīng)的詞語識別結(jié)果組成的詞語識別結(jié)果序列;確定所述每個詞語語音對應(yīng)的所述至少兩條語音識別結(jié)果中的全部詞語識別結(jié)果;按照所述詞語語音的輸入順序,在相應(yīng)位置并列顯示對應(yīng)同一詞語語音的多個詞語識別結(jié)果;最后,根據(jù)用戶對并列顯示的所述多個詞語識別結(jié)果的選擇操作,生成包括所述選擇操作針對的詞語識別結(jié)果的待輸入信息,解決了現(xiàn)有技術(shù)中基于語音識別的信息輸入方法存在的輸入效率低下的問題。通過將每個詞語語音對應(yīng)的多個詞語識別結(jié)果進行顯示,并根據(jù)用戶的選擇組成待輸入信息,準(zhǔn)確生成待輸入信息并完成輸入,進一步提高了語音輸入的效率。并且,通過并列顯示多個詞語識別結(jié)果,有效地提高了待輸入信息的可選性。
實施例三
相應(yīng)地,本發(fā)明實施例還公開了一種基于語音識別的信息輸入方法,如圖5所示,所述方法包括:步驟500至步驟540。
步驟500,對輸入語音進行識別,獲取至少兩條語音識別結(jié)果。
其中,每條所述語音識別結(jié)果為由所述輸入語音中每個詞語語音對應(yīng)的詞語識別結(jié)果組成的詞語識別結(jié)果序列。
對輸入語音進行識別,獲取至少兩條語音識別結(jié)果的具體實施方式參見實施例一,此處不再贅述。
步驟510,確定所述每個詞語語音對應(yīng)的所述至少兩條語音識別結(jié)果中的全部詞語識別結(jié)果。
確定所述每個詞語語音對應(yīng)的所述至少兩條語音識別結(jié)果中的全部詞語識別結(jié)果的具體實施方式參見實施例一,此處不再贅述。
本實施例中,以語音識別引擎輸出的語音識別結(jié)果為:“can’tyouhelpme”和“canyouhelpme”為例,可以確定輸入語音中:第一個詞語語音對應(yīng)的詞語識別結(jié)果為:“can’t”和“can”、第二個詞語語音對應(yīng)的詞語識別結(jié)果為:“you”、第三個詞語語音對應(yīng)的詞語識別結(jié)果為:“help”、第四個詞語語音對應(yīng)的詞語識別結(jié)果為:“me”。
步驟520,按照所述詞語語音的輸入順序,以第一樣式顯示與同一詞語語音對應(yīng)的多個詞語識別結(jié)果,及以第二樣式顯示與詞語語音一一對應(yīng)的詞語識別結(jié)果。
其中,所述第一樣式區(qū)別于所述第二樣式,所述第一樣式用于指示該詞語識別結(jié)果可編輯。
當(dāng)語音識別引擎輸出的語音識別結(jié)果中,存在于同一詞語語音對應(yīng)的多個詞語識別結(jié)果時,顯示所述每個詞語語音對應(yīng)的至少部分詞語識別結(jié)果的步驟進一步包括:以第一樣式顯示與同一詞語語音對應(yīng)的多個詞語識別結(jié)果,及以第二樣式顯示與詞語語音一一對應(yīng)的詞語識別結(jié)果。
仍以上一步驟中確定的詞語識別結(jié)果為例,第一個詞語語音和第三個詞語語音分別對應(yīng)多個詞語識別結(jié)果“can’t”和“can”,因此,在第一個位置以第一樣式顯示第一個詞語語音對應(yīng)的兩個詞語識別結(jié)果。第二個詞語語音、第三個詞語語音和第四個詞語語音分別與詞語識別結(jié)果一一對應(yīng),在相應(yīng)位置以第二樣式顯示一個詞語識別結(jié)果。具體實施時,所述第一樣式為區(qū)別于第二樣式的顯示樣式,如第一樣式為:高亮顯示、下劃線格式顯示、氣泡顯示等。圖6為第一樣式為下劃線格式的具體顯示示意圖。
具體實施時,當(dāng)語音識別引擎輸出的語音識別結(jié)果中,存在于同一詞語語音對應(yīng)的多個詞語識別結(jié)果時,根據(jù)用戶對顯示的所述至少部分詞語識別結(jié)果的選擇操作,生成待輸入信息,進一步包括:根據(jù)用戶的觸發(fā)操作,顯示所述觸發(fā)操作針對的詞語識別結(jié)果對應(yīng)的候選詞語識別結(jié)果,所述候選詞語識別結(jié)果選自于所述觸發(fā)操作針對的詞語識別結(jié)果對應(yīng)的詞語語音的多個詞語識別結(jié)果;根據(jù)用戶對顯示的所述候選詞語識別結(jié)果的選擇操作,生成待輸入信息。
步驟530,根據(jù)用戶的觸發(fā)操作,顯示所述觸發(fā)操作針對的詞語識別結(jié)果對應(yīng)的候選詞語識別結(jié)果。
具體實施時,當(dāng)用戶觸發(fā)以第一樣式顯示的詞語識別結(jié)果時,如點擊圖6中的“can’t”,則彈出下拉菜單或子窗口,如圖7中的700,在所述下拉菜單或子窗口中顯示用戶觸發(fā)的詞語識別結(jié)果“can’t”對應(yīng)的候選詞語識別結(jié)果,如:“can”。
步驟540,根據(jù)用戶對顯示的所述候選詞語識別結(jié)果的選擇操作,生成包括所述選擇操作針對的候選詞語識別結(jié)果的待輸入信息。
檢測用戶對下拉菜單或彈出窗口中顯示的候選詞語識別結(jié)果的選擇操作,如:檢測用戶點擊某個候選詞語識別結(jié)果的操作,然后,將用戶點擊的候選詞語識別結(jié)果作為用戶選擇的候選詞語識別結(jié)果,并根據(jù)用戶選擇的候選詞語識別結(jié)果和其他詞語識別結(jié)果共同組成待輸入信息。其中,所述候選詞語識別結(jié)果選自于所述觸發(fā)操作針對的詞語識別結(jié)果“can’t”對應(yīng)的詞語語音的多個詞語識別結(jié)果,如:“can’t”、“can”、“count”。以圖7中用戶點擊詞語識別結(jié)果“can’t”后,彈出下拉菜單顯示“can”和“count”為例,用戶可以進一步點擊候選詞語識別結(jié)果“can”,以選擇“can”作為第一個詞語語音的詞語識別結(jié)果。最后,根據(jù)用戶選擇的候選詞語識別結(jié)果“can”和其他詞語識別結(jié)果:“you”、“help”和“me”共同組成待輸入信息:“canyouhelpme”。
具體實施時,在根據(jù)用戶對顯示的所述至少部分詞語識別結(jié)果的選擇操作,生成待輸入信息時,當(dāng)根據(jù)用戶的觸發(fā)操作,顯示所述觸發(fā)操作針對的詞語識別結(jié)果對應(yīng)的候選詞語識別結(jié)果的步驟之后,所述方法還包括:顯示語音輸入控件,用于重新輸入所述觸發(fā)操作針對的詞語識別結(jié)果對應(yīng)的詞語語音,如圖7中的語音輸入圖標(biāo)710。通過顯示語音輸入控件可以指示用戶重新輸入語音,對當(dāng)前詞語識別結(jié)果進行修改。通過實時檢測用戶對所述語音輸入控件的觸發(fā)操作,并獲取語音輸入控件的輸出,即重新輸入的詞語語音。
所述通過重新輸入的詞語語音的詞語識別結(jié)果,更新所述觸發(fā)操作針對的詞語識別結(jié)果對應(yīng)的候選詞語識別結(jié)果,包括:結(jié)合所述輸入語音對所述重新輸入的詞語語音進行語音識別,得到更新的詞語識別結(jié)果;通過所述更新的詞語識別結(jié)果,更新觸發(fā)操作針對的詞語識別結(jié)果對應(yīng)的候選詞語識別結(jié)果。當(dāng)獲取到重新輸入的詞語語音之后,通過重新輸入的詞語語音替換原始輸入語音中相應(yīng)分段,將重新輸入的語音和原始以輸入語音進行語音融合,并再一次調(diào)用語音識別引擎對融合后的語音進行識別,得到重新輸入的詞語語音的更新詞語識別結(jié)果。最后,通過所述更新的詞語識別結(jié)果,更新觸發(fā)操作針對的詞語識別結(jié)果對應(yīng)的候選詞語識別結(jié)果。
本發(fā)明實施例公開的基于語音識別的信息輸入方法,通過對輸入語音進行識別,獲取至少兩條語音識別結(jié)果;其中,每條所述語音識別結(jié)果為由所述輸入語音中每個詞語語音對應(yīng)的詞語識別結(jié)果組成的詞語識別結(jié)果序列;確定所述每個詞語語音對應(yīng)的所述至少兩條語音識別結(jié)果中的全部詞語識別結(jié)果;按照所述詞語語音的輸入順序,以第一樣式顯示與同一詞語語音對應(yīng)的多個詞語識別結(jié)果,及以第二樣式顯示與詞語語音一一對應(yīng)的詞語識別結(jié)果;然后,根據(jù)用戶的觸發(fā)操作,顯示所述觸發(fā)操作針對的詞語識別結(jié)果對應(yīng)的候選詞語識別結(jié)果;最后,根據(jù)用戶對顯示的所述候選詞語識別結(jié)果的選擇操作,生成待輸入信息,解決了現(xiàn)有技術(shù)中基于語音識別的信息輸入方法存在的輸入效率低下的問題。
通過以不同樣式顯示具有多個候選的詞語識別結(jié)果,以顯示樣式作為指示用戶和詞語識別結(jié)果是否可選擇,當(dāng)需要選擇時才觸發(fā)顯示候選詞語識別結(jié)果,可以有效的節(jié)省顯示詞語識別結(jié)果占用的顯示空間。通過在顯示候選詞語識別結(jié)果同時顯示語音輸入控件,便于用戶在詞語語音的語音識別結(jié)果不是用戶真正想輸入的信息時,快速更新輸入語音,進一步提升了通過語音是被輸入信息的效率。
實施例四
相應(yīng)地,本發(fā)明實施例還公開了一種基于語音識別的信息輸入裝置,如圖8所示,所述裝置包括:
語音識別模塊810,用于對輸入語音進行識別,獲取至少兩條語音識別結(jié)果;其中,每條所述語音識別結(jié)果為由所述輸入語音中每個詞語語音對應(yīng)的詞語識別結(jié)果組成的詞語識別結(jié)果序列;
詞語識別結(jié)果確定模塊820,用于確定所述每個詞語語音對應(yīng)的所述至少兩條語音識別結(jié)果中的全部詞語識別結(jié)果;
詞語識別結(jié)果顯示模塊830,用于按照所述詞語語音的輸入順序,顯示所述詞語識別結(jié)果確定模塊820確定的每個詞語語音對應(yīng)的至少部分詞語識別結(jié)果;
輸入信息生成模塊840,用于根據(jù)用戶對所述詞語識別結(jié)果顯示模塊830顯示的所述至少部分詞語識別結(jié)果的選擇操作,生成待輸入信息。
可選的,如圖9所示,所述詞語識別結(jié)果顯示模塊830包括:
第一顯示單元8301,用于在相應(yīng)位置并列顯示對應(yīng)同一詞語語音的多個詞語識別結(jié)果。
可選的,所述輸入信息生成模塊840進一步包括:
第一輸入信息生成單元8401,用于根據(jù)用戶對并列顯示的所述多個詞語識別結(jié)果的選擇操作,生成包括所述選擇操作針對的詞語識別結(jié)果的待輸入信息。
可選的,所述選擇操作包括:點擊并列顯示的所述詞語識別結(jié)果、執(zhí)行滑動手勢經(jīng)過并列顯示的所述詞語識別結(jié)果和與詞語語音一一對應(yīng)的詞語識別結(jié)果。
可選的,如圖10所示,所述詞語識別結(jié)果顯示模塊830包括:
第二顯示單元8302,用于以第一樣式顯示與同一詞語語音對應(yīng)的多個詞語識別結(jié)果,及以第二樣式顯示與詞語語音一一對應(yīng)的詞語識別結(jié)果;其中,所述第一樣式用于指示該詞語識別結(jié)果可編輯。
可選的,所述詞語識別結(jié)果顯示模塊830進一步包括:
第三顯示單元8303,用于根據(jù)用戶的觸發(fā)操作,顯示所述觸發(fā)操作針對的詞語識別結(jié)果對應(yīng)的候選詞語識別結(jié)果,所述候選詞語識別結(jié)果選自于所述觸發(fā)操作針對的詞語識別結(jié)果對應(yīng)的詞語語音的多個詞語識別結(jié)果;
可選的,所述輸入信息生成模塊840進一步包括:
第二輸入信息生成單元8402,用于根據(jù)用戶對顯示的所述候選詞語識別結(jié)果的選擇操作,生成包括所述選擇操作針對的候選詞語識別結(jié)果的待輸入信息生成待輸入信息。
可選的,如圖10所示,所述詞語識別結(jié)果顯示模塊830還包括:
第四顯示單元8304,用于顯示語音輸入控件,用于重新輸入所述觸發(fā)操作針對的詞語識別結(jié)果對應(yīng)的詞語語音;
詞語識別結(jié)果更新單元8305,用于通過重新輸入的詞語語音的詞語識別結(jié)果,更新所述觸發(fā)操作針對的詞語識別結(jié)果對應(yīng)的候選詞語識別結(jié)果。
可選的,所述詞語識別結(jié)果更新單元8305具體用于:
結(jié)合所述輸入語音對所述重新輸入的詞語語音進行語音識別,得到更新的詞語識別結(jié)果;通過所述更新的詞語識別結(jié)果,更新觸發(fā)操作針對的詞語識別結(jié)果對應(yīng)的候選詞語識別結(jié)果。
本發(fā)明實施例公開的基于語音識別的信息輸入裝置,通過對輸入語音進行識別,獲取至少兩條語音識別結(jié)果;其中,每條所述語音識別結(jié)果為由所述輸入語音中每個詞語語音對應(yīng)的詞語識別結(jié)果組成的詞語識別結(jié)果序列;確定所述每個詞語語音對應(yīng)的所述至少兩條語音識別結(jié)果中的全部詞語識別結(jié)果;按照所述詞語語音的輸入順序,以第一樣式顯示與同一詞語語音對應(yīng)的多個詞語識別結(jié)果,及以第二樣式顯示與詞語語音一一對應(yīng)的詞語識別結(jié)果;然后,根據(jù)用戶的觸發(fā)操作,顯示所述觸發(fā)操作針對的詞語識別結(jié)果對應(yīng)的候選詞語識別結(jié)果;最后,根據(jù)用戶對顯示的所述候選詞語識別結(jié)果的選擇操作,生成待輸入信息,解決了現(xiàn)有技術(shù)中基于語音識別的信息輸入方法存在的輸入效率低下的問題。
通過以不同樣式顯示具有多個候選的詞語識別結(jié)果,以顯示樣式作為指示用戶和詞語識別結(jié)果是否可選擇,當(dāng)需要選擇時才觸發(fā)顯示候選詞語識別結(jié)果,可以有效的節(jié)省顯示詞語識別結(jié)果占用的顯示空間。通過在顯示候選詞語識別結(jié)果同時顯示語音輸入控件,便于用戶在詞語語音的語音識別結(jié)果不是用戶真正想輸入的信息時,快速更新輸入語音,進一步提升了通過語音是被輸入信息的效率。
相應(yīng)地,本發(fā)明還公開的一種電子設(shè)備,包括存儲器、處理器及存儲在所述存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)本發(fā)明實施例一至實施例三所述的基于語音識別的信息輸入方法。所述電子設(shè)備可以為:智能手機、平板電腦、游戲機、電子閱讀器等。
相應(yīng)地,本發(fā)明還公開的一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,該程序被處理器執(zhí)行時實現(xiàn)本發(fā)明實施例一至實施例三所述的基于語音識別的信息輸入方法的步驟。
本說明書中的各個實施例均采用遞進的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似的部分互相參見即可。對于裝置和電子設(shè)備實施例而言,由于其與方法實施例基本相似,所以描述的比較簡單,相關(guān)之處參見方法實施例的部分說明即可。
以上對本申請對提供的一種基于語音識別的信息輸入方法、裝置和電子設(shè)備進行了詳細(xì)介紹,本文中應(yīng)用了具體個例對本申請的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本申請的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本申請的思想,在具體實施方式及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本申請的限制。
通過以上的實施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到各實施方式可借助軟件加必需的通用硬件平臺的方式來實現(xiàn),當(dāng)然也可以通過硬件實現(xiàn)?;谶@樣的理解,上述技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品可以存儲在計算機可讀存儲介質(zhì)中,如rom/ram、磁碟、光盤等,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機,服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行各個實施例或者實施例的某些部分所述的方法。