欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

語音輸入的字詞級糾正的制作方法

文檔序號:6359587閱讀:177來源:國知局
專利名稱:語音輸入的字詞級糾正的制作方法
技術領域
本說明書涉及糾正從向計算設備的語音輸入轉(zhuǎn)錄的文字中的一個或者多個字詞。
背景技術
語音輸入的轉(zhuǎn)錄是一種越來越流行的向計算設備中輸入信息的方式。對于移動計 算設備(比如移動電話和智能電話)而言甚至更是如此,其中可用于容用戶進行用戶輸入的接口不如桌面型計算機中的用戶接口(比如全尺寸鍵盤)那樣易于操縱。例如一些移動計算設備使用最小硬件鍵盤(例如完全QWERTY鍵盤的子集)、虛擬/軟件鍵盤(例如觸屏鍵盤)或者甚至十二個鍵的電話鍵區(qū)(例如ITU-T文字錄入)。通常,這些用戶輸入接口比傳統(tǒng)桌面型用戶接口更小,并且用戶經(jīng)常使用他們的拇指來鍵入或者在鍵入之時看一個鍵打一個字。這可以至少部分說明越來越多地使用向移動計算設備的語音輸入。

發(fā)明內(nèi)容
總體上,本文獻描述糾正從向計算設備的語音輸入轉(zhuǎn)錄的文字中的一個或者多個字詞。在一些實施方式中,計算設備是無線移動設備(比如移動電話或者智能電話)。計算設備例如從用戶接收語音輸入并且向與計算設備分離的轉(zhuǎn)錄系統(tǒng)發(fā)送語音輸入。轉(zhuǎn)錄系統(tǒng)轉(zhuǎn)錄語音輸入并且向計算設備提供對應字詞網(wǎng)格。計算設備允許用戶使用來自字詞網(wǎng)格的替代字詞和/或短語對轉(zhuǎn)錄的文字中的一個或者多個字詞進行糾正。在第一方面中,一種用于糾正轉(zhuǎn)錄的文字中的字詞的計算機實施的方法包括從移動計算設備中的麥克風接收語音音頻數(shù)據(jù)。該方法還包括向轉(zhuǎn)錄系統(tǒng)發(fā)送來自移動計算設備的語音音頻數(shù)據(jù)。該方法還包括在移動計算設備接收轉(zhuǎn)錄系統(tǒng)從語音音頻數(shù)據(jù)轉(zhuǎn)錄的字詞網(wǎng)格。該方法還包括在移動計算設備的顯示器屏幕上呈現(xiàn)來自字詞網(wǎng)格的一個或者多個轉(zhuǎn)錄的字詞。該方法還包括在移動計算設備接收呈現(xiàn)的轉(zhuǎn)錄的字詞中的至少一個轉(zhuǎn)錄的字詞的用戶選擇。該方法還包括響應于接收轉(zhuǎn)錄的字詞的用戶選擇,在顯示器屏幕上呈現(xiàn)來自字詞網(wǎng)格的用于所選轉(zhuǎn)錄的字詞的一個或者多個替代字詞。該方法還包括在移動計算設備接收替代字詞中的至少一個替代字詞的用戶選擇。該方法還包括響應于接收替代字詞的用戶選擇,用所選替代字詞取代呈現(xiàn)的轉(zhuǎn)錄的字詞中的所選轉(zhuǎn)錄的字詞。實施方式可以包括以下特征中的任何、所有或者零個特征。該方法可以包括響應于接收轉(zhuǎn)錄的字詞的用戶選擇,在顯示器屏幕上呈現(xiàn)用于所選轉(zhuǎn)錄的字詞的去除命令;在移動計算設備接收去除命令的用戶選擇;并且響應于接收去除命令的用戶選擇,從呈現(xiàn)的轉(zhuǎn)錄的字詞去除所選轉(zhuǎn)錄的字詞。該方法可以包括在顯示器屏幕上呈現(xiàn)來自字詞網(wǎng)格的用于呈現(xiàn)的轉(zhuǎn)錄的字詞的至少一個替代短語;在移動計算設備接收替代短語的用戶選擇;并且響應于接收替代短語的用戶選擇,用所選替代短語取代呈現(xiàn)的轉(zhuǎn)錄的字詞。該方法可以包括響應于接收去除命令或者替代字詞的用戶選擇,自動基于所選替代字詞或者去除的轉(zhuǎn)錄的字詞從字詞網(wǎng)格選擇至少 一個新的替代短語;并且用新的替代短語取代呈現(xiàn)的替代短語。接收呈現(xiàn)的字詞的用戶選擇和替代字詞的用戶選擇可以包括通過移動計算設備的觸屏接口接收呈現(xiàn)的字詞的用戶選擇和替代字詞的用戶選擇。字詞網(wǎng)格可以包括與轉(zhuǎn)錄的字詞和替代字詞對應的節(jié)點、在節(jié)點之間的邊,邊標識經(jīng)過字詞網(wǎng)格的可能路徑,并且每個路徑可以具有路徑正確的關聯(lián)概率。該方法可以包括從字詞網(wǎng)格中所選轉(zhuǎn)錄的字詞的開始節(jié)點與結束節(jié)點之間的一個或者多個替代路徑識別用于所選轉(zhuǎn)錄的字詞的替代字詞。該方法可以包括從字詞網(wǎng)格中呈現(xiàn)的轉(zhuǎn)錄的字詞的開始節(jié)點與結束節(jié)點之間的至少一個替代路徑識別用于呈現(xiàn)的轉(zhuǎn)錄的字詞的替代短語。在第二方面中,一種在計算機可讀介質(zhì)上編碼的計算機程序產(chǎn)品,可操作用于使一個或者多個處理器執(zhí)行用于糾正轉(zhuǎn)錄的文字中的字詞的操作,操作包括從移動計算設備中的麥克風接收語音音頻數(shù)據(jù)。操作還包括向轉(zhuǎn)錄系統(tǒng)發(fā)送來自移動計算設備的語音音頻數(shù)據(jù)。操作還包括在移動計算設備接收轉(zhuǎn)錄系統(tǒng)從語音音頻數(shù)據(jù)轉(zhuǎn)錄的字詞網(wǎng)格。操作還包括在移動計算設備的顯示器屏幕上呈現(xiàn)來自字詞網(wǎng)格的一個或者多個轉(zhuǎn)錄的字詞。操作還包括在移動計算設備接收呈現(xiàn)的轉(zhuǎn)錄的字詞中的至少一個轉(zhuǎn)錄的字詞的用戶選擇。操作還包括響應于接收轉(zhuǎn)錄的字詞的用戶選擇,在顯示器屏幕上呈現(xiàn)來自字詞網(wǎng)格的用于所選轉(zhuǎn)錄的字詞的一個或者多個替代字詞。操作還包括在移動計算設備接收替代字詞中的至少一個替代字詞的用戶選擇。操作還包括響應于接收替代字詞的用戶選擇,用所選替代字詞取代呈現(xiàn)的轉(zhuǎn)錄的字詞中的所選轉(zhuǎn)錄的字詞。實施方式可以包括以下特征中的任何、所有或者零個特征。操作可以包括響應于接收轉(zhuǎn)錄的字詞的用戶選擇,在顯示器屏幕上呈現(xiàn)用于所選轉(zhuǎn)錄的字詞的去除命令;在移動計算設備接收去除命令的用戶選擇;并且響應于接收去除命令的用戶選擇,從呈現(xiàn)的轉(zhuǎn)錄的字詞去除所選轉(zhuǎn)錄的字詞。操作可以包括在顯示器屏幕上呈現(xiàn)來自字詞網(wǎng)格的用于呈現(xiàn)的轉(zhuǎn)錄的字詞的至少一個替代短語;在移動計算設備接收替代短語的用戶選擇;并且響應于接收替代短語的用戶選擇,用所選替代短語取代呈現(xiàn)的轉(zhuǎn)錄的字詞。操作可以包括響應于接收去除命令或者替代字詞的用戶選擇,自動基于所選替代字詞或者去除的轉(zhuǎn)錄的字詞從字詞網(wǎng)格選擇至少一個新的替代短語;并且用新的替代短語取代呈現(xiàn)的替代短語。接收呈現(xiàn)的字詞的用戶選擇和替代字詞的用戶選擇可以包括通過移動計算設備的觸屏接口接收呈現(xiàn)的字詞的用戶選擇和替代字詞的用戶選擇。字詞網(wǎng)格可以包括與轉(zhuǎn)錄的字詞和替代字詞對應的節(jié)點、在節(jié)點之間的邊,邊標識經(jīng)過字詞網(wǎng)格的可能路徑,并且每個路徑可以具有路徑正確的關聯(lián)概率。操作可以包括從字詞網(wǎng)格中所選轉(zhuǎn)錄的字詞的開始節(jié)點與結束節(jié)點之間的一個或者多個替代路徑識別用于所選轉(zhuǎn)錄的字詞的替代字詞。操作可以包括從字詞網(wǎng)格中呈現(xiàn)的轉(zhuǎn)錄的字詞的開始節(jié)點與結束節(jié)點之間的至少一個替代路徑識別用于呈現(xiàn)的轉(zhuǎn)錄的字詞的替代短語。在第三方面中,一種用于糾正轉(zhuǎn)錄的文字中的字詞的計算機實施的系統(tǒng)包括轉(zhuǎn)錄系統(tǒng),可操作用于接收語音音頻數(shù)據(jù)并且作為響應將語音音頻數(shù)據(jù)轉(zhuǎn)錄成字詞網(wǎng)格。該系統(tǒng)還包括移動計算設備,移動計算設備包括麥克風,可操作用于接收語音音頻并且生成語音音頻數(shù)據(jù),網(wǎng)絡接口,可操作用于向轉(zhuǎn)錄系統(tǒng)發(fā)送語音音頻數(shù)據(jù)并且作為響應從轉(zhuǎn)錄系統(tǒng)接收字詞網(wǎng)格,顯示器屏幕,可操作用于呈現(xiàn)來自字詞網(wǎng)格的一個或者多個轉(zhuǎn)錄的字詞,用戶接口,可操作用于接收轉(zhuǎn)錄的字詞中的至少一個轉(zhuǎn)錄的字詞的用戶選擇,一個或者多個處理器和存儲指令的存儲器,指令在由處理器執(zhí)行時執(zhí)行以下操作在顯示器屏幕上呈現(xiàn)來自字詞網(wǎng)格的用于所選轉(zhuǎn)錄的字詞的一個或者多個替代字詞;接收替代字詞中的至少一個替代字詞的用戶選擇;并且用所選替代字詞取代呈現(xiàn)的轉(zhuǎn)錄的字詞中的所選轉(zhuǎn)錄的字詞。這里描述的系統(tǒng)和技術可以提供以下優(yōu)點中的一個或者多個優(yōu)點。首先,系統(tǒng)可以用最少用戶輸入(比如一個、兩個或者三個用戶輸入)對轉(zhuǎn)錄的文字中的一個或者多個字詞進行糾正。第二,系統(tǒng)可以提供在遠程轉(zhuǎn)錄系統(tǒng)的對語音輸入向文字的轉(zhuǎn)錄而在糾正轉(zhuǎn)錄的文字中的一個或者多個字詞期間無或者最少的與遠程轉(zhuǎn)錄系統(tǒng)的附加通信。第三,系統(tǒng)可以在具有有限輸入接口(比如小型觸屏)的計算設備中提供對轉(zhuǎn)錄的文字的糾正的高效用戶選擇。 在附圖和下文描述中闡述一個或者多個實施方式的細節(jié)。根據(jù)說明書和附圖并且根據(jù)權利要求書將清楚其它特征和優(yōu)點。


圖I是示出了用于糾正轉(zhuǎn)錄的文字中的一個或者多個字詞的系統(tǒng)的例子的示意圖。圖2是示出了用于糾正轉(zhuǎn)錄的文字中的一個或者多個字詞的移動計算設備的例子的框圖。圖3A-B是用于糾正轉(zhuǎn)錄的文字中的一個或者多個字詞的字詞網(wǎng)格的例子。圖4A-D是用于糾正轉(zhuǎn)錄的文字中的一個或者多個字詞的圖形用戶接口的例子。圖5是示出了用于糾正轉(zhuǎn)錄的文字中的一個或者多個字詞的過程的例子的流程圖。圖6示出了可以與在本文中描述的計算機實施的方法和系統(tǒng)結合使用的計算設備和移動計算設備的例子。在各圖中的相似標號指示相似要素。
具體實施例方式圖I是示出了用于糾正轉(zhuǎn)錄的文字中的一個或者多個字詞的系統(tǒng)100的例子的示意圖。一般而言,系統(tǒng)允許用戶的設備向服務器系統(tǒng)發(fā)送語音的音頻數(shù)據(jù)并且讓服務器系統(tǒng)發(fā)送回用于轉(zhuǎn)錄語音的可能解決方案的排列,從而如果第一建議解決方案不準確,則用戶可以容易替換被服務器系統(tǒng)確定為其它可能解決方案的其它字詞或者字詞集。系統(tǒng)100包括通過網(wǎng)絡106與轉(zhuǎn)錄系統(tǒng)104通信的移動計算設備102。移動計算設備102從用戶接收語音音頻輸入并且將語音音頻轉(zhuǎn)換成語音數(shù)據(jù)輸出108。移動計算設備102通過網(wǎng)絡106向轉(zhuǎn)錄系統(tǒng)104發(fā)送語音數(shù)據(jù)輸出108。轉(zhuǎn)錄系統(tǒng)104將語音數(shù)據(jù)輸108轉(zhuǎn)錄成多個字詞并且在字詞網(wǎng)格110中排列字詞。字詞網(wǎng)格110包括用于語音數(shù)據(jù)輸出108轉(zhuǎn)錄的最可能或者最佳假設以及替代轉(zhuǎn)錄或者假設。轉(zhuǎn)錄系統(tǒng)104向移動計算設備102發(fā)送字詞網(wǎng)格110。移動計算設備102向用戶呈現(xiàn)來自字詞網(wǎng)格110的最可能轉(zhuǎn)錄。移動計算設備102然后從用戶接收一個或者多個字詞選擇112、呈現(xiàn)用于所選字詞的對應替代字詞并且從用戶接收一個或者多個替代選擇114。字詞選擇112指示向用 戶呈現(xiàn)的轉(zhuǎn)錄的文字中的一個或者多個不正確轉(zhuǎn)錄的字詞。在一些實施方式中,替代字詞是用于不正確字詞的下一最佳假設。響應于替代選擇114,移動計算設備102用所選替代字詞替換呈現(xiàn)的轉(zhuǎn)錄的文字中的不正確字詞。在一些實施方式中,移動計算設備102也呈現(xiàn)用于轉(zhuǎn)錄的文字的一個或者多個替代短語。例如替代短語可以是用于語音數(shù)據(jù)輸出108或者語音數(shù)據(jù)輸出108的包括多個字詞的部分的轉(zhuǎn)錄的下一最佳假設。移動計算設備102可以從用戶接收替代短語的選擇并且用所選替代短語取代呈現(xiàn)的轉(zhuǎn)錄的文字的對應部分。在一些實施方式中,移動計算設備102是移動電話或者智能電話并且包括有限的用戶輸入接口(比如小型QWERTY硬件鍵盤、小型觸屏或者數(shù)字鍵區(qū))。移動計算設備102使用無線連接(比如蜂窩電話數(shù)據(jù)連接、Wi-Fi連接或者可以用于向轉(zhuǎn)錄系統(tǒng)104發(fā)送數(shù)據(jù)和從轉(zhuǎn)錄系統(tǒng)104接收數(shù)據(jù)的其它無線連接)來接入網(wǎng)絡106。在一些實施方式中,網(wǎng)絡106包括一個或者多個網(wǎng)絡(比如局域網(wǎng)、廣域網(wǎng)和/或因特網(wǎng))。網(wǎng)絡106中的一個或者多個網(wǎng)絡可以是無線的(比如蜂窩電話網(wǎng)絡或者Wi-Fi網(wǎng)絡)。轉(zhuǎn)錄系統(tǒng)104包括將語音數(shù)據(jù)輸出108轉(zhuǎn)錄成字詞網(wǎng)格110的語音識別器。一般而言,字詞網(wǎng)格110包括用于語音數(shù)據(jù)輸出108轉(zhuǎn)錄的多個假設。在一些實施方式中,字詞網(wǎng)格110包括特定字詞在轉(zhuǎn)錄的文字中出現(xiàn)于特定位置的一個或者多個加權因子或者概率。用于說話聲轉(zhuǎn)錄的每個假設代表經(jīng)過字詞網(wǎng)格110的可能路徑。在一些實施方式中,從假設中的一個字詞向下一字詞的分叉點依賴于假設中的其它字詞。例如字詞網(wǎng)格110中的特定字詞可以具有依賴于假設中包括的其它字詞的多個權值或者概率。此外,字詞網(wǎng)格110可以包括用于字詞網(wǎng)格110中包括的字詞集或者來自字詞網(wǎng)格110的字詞的最可能組合的子集的所有可能假設。移動計算設備102選擇通過字詞網(wǎng)格110的最有可能路徑,并且向用戶呈現(xiàn)該假設。圖2是示出了用于糾正轉(zhuǎn)錄的文字中的一個或者多個字詞的移動計算設備200的例子的框圖。移動計算設備200包括負責呈現(xiàn)從用戶說話聲轉(zhuǎn)錄的文字并且用于接收一個或者多個用戶輸入以糾正轉(zhuǎn)錄的文字的字詞糾正模塊202。具體而言,移動計算設備200包括從用戶接收語音音頻輸入206的語音輸入接口204。例如語音輸入接口 204可以是將來自用戶的說話聲中的聲音轉(zhuǎn)換成語音數(shù)據(jù)輸出208的麥克風。語音輸入接口 204向字詞糾正模塊202傳遞語音數(shù)據(jù)輸出208,并且字詞糾正模塊202向轉(zhuǎn)錄系統(tǒng)發(fā)送語音數(shù)據(jù)輸出208。轉(zhuǎn)錄系統(tǒng)對語音數(shù)據(jù)輸出208執(zhí)行語音識別操作以生成字詞網(wǎng)格210。轉(zhuǎn)錄系統(tǒng)向移動計算設備200發(fā)送字詞網(wǎng)格210。字詞糾正模塊202接收字詞網(wǎng)格210并且在顯示器接口 214中呈現(xiàn)來自字詞網(wǎng)格210的轉(zhuǎn)錄的文字212。在一些實施方式中,顯示器接口 214是硬件顯示器屏幕(比如液晶顯示器(IXD)屏幕)。呈現(xiàn)的轉(zhuǎn)錄的文字212包括來自字詞網(wǎng)格210的多個字詞,并且轉(zhuǎn)錄的字詞網(wǎng)格212包括待由用戶糾正的一個或者多個字詞。字詞糾正模塊202從用戶接收轉(zhuǎn)錄的文字212中的不正確字詞(即不是用戶說出的字詞)的選擇216。字詞糾正模塊202通過用戶輸入接口 218 (比如觸屏、跟蹤球或者其它指示設備或者鍵盤)接收選擇216。字詞糾正模塊202呈現(xiàn)用于選擇216的一個或者多個替代字詞220。字詞糾正模塊202使用顯示器接口 214來顯示替代字詞220。字詞糾正模塊202通過用戶輸入接口 218從用戶接收呈現(xiàn)的替代字詞之一的選擇222。字詞糾正模塊202用從替代字詞的選擇222取代從轉(zhuǎn)錄的文字212的選擇216并且在顯示器接口 214中向用戶呈現(xiàn)更新的轉(zhuǎn)錄的字
o圖3A是用于糾正轉(zhuǎn)錄的字詞中的一個或者多個字詞的字詞網(wǎng)格300的例子。這里呈現(xiàn)字詞網(wǎng)格300為有限狀態(tài)轉(zhuǎn)錄器。字詞網(wǎng)格300包括與在字詞之間的可能邊界對應的一個或者多個節(jié)點302a-g。字詞網(wǎng)格300包括用于由字詞網(wǎng)格300產(chǎn)生的轉(zhuǎn)錄假設中的可能字詞的多個邊304a-I。此外,每個邊304a-I可以具有該邊是來自對應節(jié)點的正確邊的一個或者多個權值或者概率。權值由轉(zhuǎn)錄系統(tǒng)確定并且可以例如基于在語音數(shù)據(jù)與用于該邊的字詞之間的匹配的置信度以及字詞有多么好地在語法和/或詞匯上與字詞網(wǎng)格300中的其它字詞相配。例如起初,經(jīng)過字詞網(wǎng)格300的最可能路徑可以包括具有文字“We’re comingabout 11:30”的邊304c、304e、304i和304k。第二最佳路徑可以包括具有文字“deerhunting scouts 7:30” 的邊 304d、304h、304j 和 3041。每對節(jié)點可以具有與各種轉(zhuǎn)錄假設中的替代字詞對應的一個或者多個路徑。例如開始于節(jié)點302a并且結束于節(jié)點302c的在節(jié)點對之間的初始最可能路徑是邊304c “we’re”。這一路徑具有包括邊304a_b “we are”和邊304d “deer”的替代路徑。因而邊304e “coming”具有包括邊304f-g “come at”和邊304h “hunting”的替代字詞。邊304i “about”具有包括邊304j “scouts”的替代字詞,并且邊304k “11:30”具有包括邊3041 “7:30”的替代字詞。 圖3B是用于糾正轉(zhuǎn)錄的文字中的一個或者多個字詞的字詞網(wǎng)格350的例子。字詞網(wǎng)格350是分層次的。字詞網(wǎng)格350包括多個節(jié)點352a-I,這些節(jié)點代表用于轉(zhuǎn)錄的文字的各種假設中的字詞。在節(jié)點352a-I之間的邊示出了可能假設包括節(jié)點352c、352e、352i和352k “we,re coming about 11:30”、節(jié)點 352a、352b、352e、352i 和 352k “we are comingabout 11:30,,、節(jié)點 352a、352b、352f、352g、352i 和 352k“we are come at about 11:30,,、節(jié)點 352d、352f、352g、352i 和 352k “deer come at about 11:30”、節(jié)點 352d、352h、352j和 352k “deer hunting scouts 11:30”以及節(jié)點 352d、352h、352j 和 3521 “deer huntingscouts 7:30”。同樣,在節(jié)點352a_I之間的邊可以具有基于語音識別的置信度和所得文字的語法/詞匯分析的關聯(lián)權值或者概率。在這一例子中,“we’re coming about 11:30”目前可以是最佳假設,并且“deer hunting scouts 7:30”可以是次最佳假設??梢栽谧衷~網(wǎng)格350中進行將字詞及其替代分組在一起的一個或者多個劃分354a-d。例如劃分354a包括字詞“we,re”以及替代“we are”和“deer”。劃分354b包括字詞“coming”以及替代“comeat”和“hunting”。劃分354c包括字詞“about”和替代“scouts”,并且劃分354d包括字詞“11:30” 和替代 “7:30”。隨著用戶從最佳假設選擇字詞用于糾正而從其它假設選擇替代用于取代不正確字詞,其它假設之一可以變成最佳假設。例如,如果用戶選擇“we’ re”、然后選擇替代“deer” 以取代 “we,re,,,則 “deer hunting scouts 7:30” 可以變成最佳假設。在一些實施方式中,字詞糾正模塊僅呈現(xiàn)和/或允許用戶選擇如下替代,存在從這些替代到轉(zhuǎn)錄的文字中的其它字詞的邊。例如,如果當前呈現(xiàn)“we’ re coming about11:30”作為最佳假設,則字詞糾正模塊可以呈現(xiàn)“we are”而不是“deer”作為用于“we’re”的替代,因為“deer”無如下邊,該邊連接到轉(zhuǎn)錄的文字的其余字詞“…coming about 11:30”。字詞“we are”具有通向“…coming about 11:30”的邊,因此包含于“we’ re”的替代列表中。在另一例子中,如果用戶選擇字詞“coming”用于糾正,則字詞糾正模塊可以擴展選擇以包括“we’ re coming”、然后呈現(xiàn)包括“we are come at”和“deer come at”的替代。圖4A是用于糾正轉(zhuǎn)錄的文字中的一個或者多個字詞的⑶I 400的例子。⑶I 400可以與接收文字輸入的應用(比如即時消息應用、電子郵件應用或者字處理器應用)關聯(lián)。⑶I 400包括文字輸入?yún)^(qū)域402和用于向文字輸入?yún)^(qū)域402中輸入文字的鍵盤404。在一些實施方式中,鍵盤404是觸屏鍵盤。在一些實施方式中提供GUI 400的計算設備可以包括用于向文字輸入?yún)^(qū)域402中進行輸入的物理鍵盤。此外,提供⑶I 400的計算設備可以接收發(fā)聲或者語音輸入。例如鍵盤404可以包括用于發(fā)起向文字輸入?yún)^(qū)域402中的語音到文字輸入的控件或者圖標。字詞糾正模塊向轉(zhuǎn)錄系統(tǒng)發(fā)送接收的語音數(shù)據(jù)并且接收字詞。GUI 400在文字輸入?yún)^(qū)域402中呈現(xiàn)最佳假設“we,re coming about 11:30”。用戶可以通過選擇字詞來請求糾正字詞。例如用戶可以通過在屏幕上按壓來進行字詞“we’re”的選擇406。取而代之,⑶I 400可以具有用于選擇文字輸入?yún)^(qū)域402中的字詞的關聯(lián)指示設備或者其它導航控件。⑶I在替代短語控件408中呈現(xiàn)次最佳假設“Deer hunting scouts 7:30”。用戶可以選擇替代短語控件408以用替代短語控件408中所示文字取代文字輸入?yún)^(qū)域402中的轉(zhuǎn)錄的文字。圖4B是用于糾正轉(zhuǎn)錄的文字中的一個或者多個字詞的⑶I 420的例子。⑶I 420示出了來自字詞網(wǎng)格的用于所選字詞“we’re”的替代字詞的列表422。列表422包括替代“we are”和“deer”。列表422也包括用于從文字輸入?yún)^(qū)域402去除字詞而未用替代取代它的去除控件。這里,用戶對去除控件進行選擇424以請求⑶I 420從文字輸入?yún)^(qū)域402去除字詞“we’ re”。圖4C是用于糾正轉(zhuǎn)錄的文字中的一個或者多個字詞的⑶I 440的例子。字詞糾正模塊已經(jīng)更新⑶I 440以不再在呈現(xiàn)于文字輸入?yún)^(qū)域402中的轉(zhuǎn)錄假設中包括字詞“we’re”。此外,字詞糾正模塊已經(jīng)基于文字輸入?yún)^(qū)域402中的由于用戶進行的糾正而產(chǎn)生的當前最佳假設來更新替代短語控件408以包括新的次最佳假設“Come at about 11:30”。用戶可以對替代短語控件408進行選擇442以請求用“come at about 11:30”取代文字輸入?yún)^(qū)域402中的文字。圖4D是用于糾正轉(zhuǎn)錄的文字中的一個或者多個字詞的⑶I 460的例子。字詞糾正模塊已經(jīng)更新⑶I 460以包括通過用戶選擇替代短語控件408來請求的新的最佳轉(zhuǎn)錄假設“Come at about 11:30”。在一些實施方式中,字詞糾正模塊允許用戶通過進行僅兩個簡單用戶輸入來糾正字詞。例如用戶可以觸摸屏幕以選擇不正確字詞、然后第二次觸摸屏幕以選擇用于取代不正確字詞的替代。在一些實施方式中,字詞選擇模塊可以響應于單個用戶輸入來糾正一個或者多個字詞。例如用戶可以選擇替代短語控件408以用次最優(yōu)假設取代最優(yōu)假設。在另一例子中,當僅一個替代字詞存在時,字詞糾正模塊可以自動響應于選擇不正確字詞來取代不正確字詞而未提供替代列表。在又一例子中,當一個替代正確的概率明顯大于其它替代時,字詞糾正模塊可以自動響應于選擇不正確字詞用最佳替代取代不正確字詞而未提供替代列表。替代正確的概率明顯更大可以例如包括概率接近百分之一百的最佳替代和概率接近零的其它替代或者概率比次最佳替代大若干倍的最佳替代。在一些實施方式中,對字詞的長按可以指示應當從文字輸入?yún)^(qū)域402和假設去除字詞。取而代之,對不正確字詞的長按可以指 示對用次最佳替代取代不正確字詞的請求。圖5是示出了用于糾正轉(zhuǎn)錄的文字中的一個或者多個字詞的過程500的例子的流程圖。過程500可以例如由系統(tǒng)(比如系統(tǒng)100、移動計算設備200、字詞網(wǎng)格300和/或⑶I 400、420、440和460)執(zhí)行。為了呈現(xiàn)清楚,下文描述使用系統(tǒng)100、移動計算設備200、字詞網(wǎng)格300和/或⑶I 400、420、440和460作為用于描述過程500的例子的基礎。然而另一系統(tǒng)或者系統(tǒng)組合可以用來執(zhí)行過程500。過程500開始于從移動計算設備中的麥克風接收(502)語音音頻數(shù)據(jù)。例如用戶可以向蜂窩電話或者智能電話上的麥克風中輸入說話聲。過程500向轉(zhuǎn)錄系統(tǒng)發(fā)送(504)來自移動計算設備的語音音頻數(shù)據(jù)。例如移動計算設備102可以向轉(zhuǎn)錄系統(tǒng)104發(fā)送語音數(shù)據(jù)輸出108。過程500在移動計算設備接收轉(zhuǎn)錄系統(tǒng)從語音音頻數(shù)據(jù)轉(zhuǎn)錄的字詞網(wǎng)格。例如移動計算設備200可以接收從語音數(shù)據(jù)輸出208轉(zhuǎn)錄的字詞網(wǎng)格210。過程500在移動計算設備的顯示器屏幕上呈現(xiàn)(508)來自字詞網(wǎng)格的一個或者多個轉(zhuǎn)錄的字詞。例如字詞糾正模塊202可以在⑶I 400中呈現(xiàn)轉(zhuǎn)錄的文字212。如果過程500在移動計算設備接收(510)呈現(xiàn)的轉(zhuǎn)錄字詞中的至少一個轉(zhuǎn)錄的字詞的用戶選擇,則響應于接收轉(zhuǎn)錄的字詞的用戶選擇,過程500在顯示器屏幕上呈現(xiàn)(512)來自字詞網(wǎng)格的用于所選轉(zhuǎn)錄的字詞的一個或者多個替代字詞。例如字詞糾正模塊202可以接收轉(zhuǎn)錄的字詞“we’ re”的選擇406并且作為響應呈現(xiàn)替代字詞的列表422。過程500在移動計算設備接收(514)替代字詞中的至少一個替代字詞的用戶選擇。例如字詞糾正模塊202可以接收去除控件的選擇424或者列表422中的替代字詞“weare”和“deer”中的一個或者多個替代字詞的選擇。響應于接收替代字詞的用戶選擇,過程500用所選替代字詞取代(508)呈現(xiàn)的轉(zhuǎn)錄的字詞中的所選轉(zhuǎn)錄的字詞。例如字詞糾正模塊202可以在GUI 440的文字輸入?yún)^(qū)域402中呈現(xiàn)更新的轉(zhuǎn)錄的文字“coming about 11:30”。圖6示出了可以用來實施這里描述的技術的計算設備600和移動計算設備的例子。計算設備600旨在于代表各種形式的數(shù)字計算機(比如膝上型計算機、桌面型計算機、工作站、個人數(shù)字助理、服務器、刀片服務器、大型機和其它適當計算機)。移動計算設備旨在于代表各種形式的移動設備(比如個人數(shù)字助理、蜂窩電話、智能電話和其它相似計算設備)。這里所示部件、它們的連接和關系以及它們的功能是為了僅舉例并且不是為了限制本文中描述和/或要求保護的本發(fā)明的實施方式。計算設備600包括處理器602、存儲器604、存儲設備606、連接到存儲器604和多個高速擴展端口 610的高速接口 608以及連接到 低速擴展端口 614和存儲設備606的低速接口 612。處理器602、存儲器604、存儲設備606、高速接口 608、高速擴展端口 610和低速接口 612中的每個部件使用各種總線來互連并且可以裝配于公共母板上或者以如適當?shù)钠渌绞絹硌b配。處理器602可以處理用于在計算設備600內(nèi)執(zhí)行的指令(包括存儲于存儲器604中或者存儲設備606上以在外部輸入/輸出設備(比如耦合到高速接口 608的顯示器616)上顯示CTI的圖形信息的指令)。在其它實施方式中,多個處理器和/或多個總線可以如適當?shù)哪菢优c多個存儲器和存儲器類型一起使用。也可以連接多個計算設備而每個設備提供必需操作的部分(例如作為服務器組、一組刀片服務器或者多處理器系統(tǒng))。存儲器604存儲計算設備600內(nèi)的信息。在一些實施方式中,存儲器604是一個或者多個易失性存儲器單元。在一些實施方式中,存儲器604是一個或者多個非易失性存儲器單元。存儲器604也可以是另一形式的計算機可讀介質(zhì)(比如磁盤或者光盤)。存儲設備606能夠提供用于計算設備600的海量存儲。在一些實施方式中,存儲設備606可以是或者包含計算機可讀介質(zhì)(比如軟盤設備、硬盤設備、光盤設備或者磁帶設備、閃存或者其它相似固態(tài)存儲器設備或者設備陣列(包括在存儲區(qū)域網(wǎng)絡或者其它配置中的設備))。計算機程序產(chǎn)品可以有形地具體化于信息載體中。計算機程序產(chǎn)品也可以包含在被執(zhí)行時執(zhí)行一種或者多種方法(比如上文描述的方法)的指令。計算機程序產(chǎn)品也可以有形地具體化于計算機或者機器可讀介質(zhì)(比如存儲器604、存儲設備606或者處理器602上的存儲器)中。高速接口 608管理用于計算設備600的帶寬密集操作,而低速接口 612管理較低帶寬密集操作。這樣的功能分配僅為舉例。在一些實施方式中,高速接口 608耦合到存儲器604、顯示器616 (例如通過圖形處理器或者加速器)并且耦合到可以接受各種擴展卡(未示出)的高速擴展端口 610。在該實施方式中,低速接口 612耦合到存儲設備606和低速擴展端口 614??梢园ǜ鞣N通信端口(例如USB、藍牙、以太網(wǎng)、無線以太網(wǎng))的低速擴展端口 614可以耦合到一個或者多個輸入/輸出設備(比如鍵盤、指示設備、掃描儀或者通過網(wǎng)絡適配器連接到網(wǎng)絡設備(比如交換機或者路由器))??梢匀鐖D中所示以多個不同形式實施計算設備600。例如它可以實施為標準服務器620或者多次實施于一組這樣的服務器中。此外,它可以實施于個人計算機(比如膝上型計算機622)中。它也可以實施為機架服務器系統(tǒng)624的部分。取而代之,來自計算設備600的部件可以與移動設備(比如移動計算設備650)中的其它部件(未示出)組合。這樣的設備中的每個設備可以包含計算設備600和移動計算設備650中的一個或者多個設備,并且整個系統(tǒng)可以由相互通信的多個計算設備組成。移動計算設備650包括處理器652、存儲器664、輸入/輸出設備(比如顯示器654)、通信接口 666和收發(fā)器668以及其它部件。移動計算設備650也可以具有用于提供附加存儲的存儲設備(比如微驅(qū)動或者其它設備)。使用各種總線來互連處理器652、存儲器664、顯不器654、通信接口 666和收發(fā)器668中的每個部件,并且若干部件可以裝配于公共母板上或者如適當?shù)哪菢右云渌绞絹硌b配。處理器652可以執(zhí)行移動計算設備650內(nèi)的指令(包括存儲于存儲器664中的指令)。處理器652可以實施為包括單獨和多個模擬和數(shù)字處理器的芯片的芯片組。處理器652可以例如提供移動計算設備650的其它部件的協(xié)調(diào)(比如控制用戶接口、移動計算設備650運行的應用和移動計算設備650的無線通信)。處理器652可以通過耦合到顯示器654的控制接口 658和顯示器接口 656來與用戶通信。顯示器654可以例如是TFT (薄膜晶體管液晶顯示器)顯示器或者OLED (有機發(fā)光二極管)顯示器或者其它適當顯示器技術。顯示器接口 656可以包括用于驅(qū)動顯示器654以向用戶呈現(xiàn)圖形和其它信息的適當電路??刂平涌?658可以從用戶接收命令并且轉(zhuǎn)換它們用于向處理器652提交。此外,外部接口 662可以提供與處理器652的通信以便實現(xiàn)移動計算設備650與其它設備的近場通信。外部接口 662可以在一些實施方式中提供有線通 信或者在其它實施方式中提供無線通信,并且也可以使用多個接口。存儲器664存儲移動計算設備650內(nèi)的信息。存儲器664可以實施為一個或者多個計算機可讀介質(zhì)、一個或者多個易失性存儲器單元或者一個或者多個非易失性存儲器單元中的一項或者多項。擴展存儲器674也可以被提供并且通過可以例如包括SIMM (單列直插式存儲器模塊)卡接口的擴展接口 672連接到移動計算設備650。擴展存儲器674可以提供用于移動計算設備650的額外存儲空間或者也可以存儲用于移動計算設備650的應用或者其它信息。具體而言,擴展存儲器674可以包括用于實現(xiàn)或者補充上文描述的過程的指令并且也可以包括安全信息。因此例如擴展存儲器674可以被提供作為用于移動計算設備650的安全模塊并且可以用允許安全使用移動計算設備650的指令來編程。此外,可以經(jīng)由SIMM卡將安全應用與附加信息一起提供(比如以不可黑客方式在SIMM卡上放置識別信息)。如上文討論的那樣,存儲器可以例如包括閃存和/或NVRAM存儲器(非易失性隨機存取存儲器)。在一些實施方式中,計算機程序產(chǎn)品有形地具體化于信息載體中。計算機程序產(chǎn)品包含在執(zhí)行時執(zhí)行一種或者多種方法(比如上文描述的方法)的指令。計算機程序產(chǎn)品可以是計算機或者機器可讀介質(zhì)(比如存儲器664、擴展存儲器674或者處理器652上的存儲器)。在一些實施方式中,可以例如通過收發(fā)器668或者外部接口 662在傳播的信號中接收計算機程序產(chǎn)品。移動計算設備650可以通過可以在必需時包括數(shù)字信號處理電路的通信接口 666進行無線通信。通信接口 666可以提供在各種模式或者協(xié)議(比如GSM(全球移動通信系統(tǒng))語音呼叫、SMS (短消息服務)、EMS (增強型消息接發(fā)服務)或者MMS消息接發(fā)(多媒體消息接發(fā)服務)、CDMA (碼分多址)、TDMA (時分多址)、I3DC (個人數(shù)字蜂窩)、WCDMA (寬帶碼分多址)、CDMA2000或者GPRS (通用分組無線電服務)以及其它模式或者協(xié)議)之下的通信。這樣的通信例如可以通過使用射頻的收發(fā)器668來出現(xiàn)。此外,短程通信可以比如使用藍牙、WiFi或者其它這樣的收發(fā)器(未示出)來出現(xiàn)。此外,GPS(全球定位系統(tǒng))接收器模塊670可以向移動計算設備650提供附加的與導航和位置有關的無線數(shù)據(jù),該數(shù)據(jù)可以如適當?shù)哪菢佑稍谝苿佑嬎阍O備650上運行的應用使用。移動計算設備650也可以使用音頻編碼解碼器660來可聽地通信,該編碼解碼器可以從用戶接收口頭信息并且將它轉(zhuǎn)換成可用數(shù)字信息。音頻編碼解碼器660可以類似地比如通過例如移動計算設備650的聽筒中的揚聲器生成用于用戶的可聽聲音。這樣的聲音可以包括來自語音電話呼叫的聲音、可以包括記錄的聲音(例如語音消息、音樂文件等)并且也可以包括由在移動計算設備650上操作的應用生成的聲音??梢匀鐖D中所示以多個不同形式實施移動計算設備650。例如它可以實施為蜂窩電話680。它也可以實施為智能電話682、個人數(shù)字助理或者其它相似移動設備的部分。這里描述的系統(tǒng)和技術的各種實施方式可以實施于數(shù)字電子電路、集成電路、專門設計的ASIC(專用集成電路)、計算機硬件、固件、軟件和/或其組合中。這些各種實施方式可以包括在包括可以是專用或者通用的至少一個可編程處理器(該處理器被耦合成從 存儲系統(tǒng)、至少一個輸入設備和至少一個輸出設備接收數(shù)據(jù)和指令并且向存儲系統(tǒng)、至少一個輸入設備和至少一個輸出設備發(fā)送數(shù)據(jù)和指令)的可編程系統(tǒng)上可執(zhí)行和/或可解譯的一個或者多個計算機程序中的實施方式。這些計算機程序(也稱為程序、軟件、軟件應用或者代碼)包括用于可編程處理器的機器指令并且可以用高級過程和/或面向?qū)ο蟮木幊陶Z言和/或用匯編/機器語言來實施。如這里所用,術語機器可讀介質(zhì)和計算機可讀介質(zhì)指代用來向可編程處理器提供機器指令和/或數(shù)據(jù)的任何計算機程序產(chǎn)品、裝置和/或設備(例如磁盤、光盤、存儲器、可編程邏輯器件(PLD))(包括接收作為機器可讀信號的機器指令的機器可讀介質(zhì))。術語機器可讀信號指代用來向可編程處理器提供機器指令和/或數(shù)據(jù)的任何信號。為了提供與用戶的交互,這里描述的系統(tǒng)和技術可以實施于如下計算機上,該計算機具有用于向用戶顯示信息的顯示器設備(例如CRT (陰極射線管)或者LCD (液晶顯示器)監(jiān)視器)以及用戶可以向計算機提供輸入的鍵盤和指示設備(例如鼠標或者跟蹤球)。其它種類的設備也可以用來提供與用戶的交互;例如向用戶提供的反饋可以是任何形式的感官反饋(例如視覺反饋、聽覺反饋或者觸覺反饋);并且可以用包括聲學、語音或者觸覺輸入的任何形式接收來自用戶的輸入。這里描述的系統(tǒng)和技術可以實施于如下計算系統(tǒng)中,該計算系統(tǒng)包括后端部件(例如作為數(shù)據(jù)服務器)或者包括中間件部件(例如應用服務器)或者包括前端部件(例如具有如下圖形用戶接口或者Web瀏覽器的客戶端計算機,用戶可以通過該圖形用戶接口或者Web瀏覽器來與這里描述的系統(tǒng)和技術的實施交互)或者這樣的后端、中間件或者前端部件的任何組合。系統(tǒng)的部件可以由任何數(shù)字數(shù)據(jù)通信形式或者介質(zhì)(例如通信網(wǎng)絡)互連。通信網(wǎng)絡的例子包括局域網(wǎng)(LAN)、廣域網(wǎng)(WAN)和因特網(wǎng)。計算系統(tǒng)可以包括客戶端和服務器。客戶端和服務器一般相互遠離并且通常通過通信網(wǎng)絡交互。客戶端和服務器的關系借助在相應計算機上運行并且相互具有客戶端-服務器關系的計算機程序來產(chǎn)生。雖然上文已經(jīng)具體描述少數(shù)實施方式,但是其它修改是可能的。此外,在圖中描繪的邏輯流程無需所示特定順序或者依次順序以實現(xiàn)希望的結果。此外,可以提供其它步驟或者可以從描繪的流程消除步驟,并且可以向描述的系統(tǒng)添加或者從描述的系統(tǒng)去除其它部件。因而其它實施方式在所附權利要求的范圍內(nèi)。
權利要求
1.一種計算機實施的方法,用于糾正轉(zhuǎn)錄的文字中的字詞,所述方法包括 從移動計算設備中的麥克風接收語音音頻數(shù)據(jù); 向轉(zhuǎn)錄系統(tǒng)發(fā)送來自所述移動計算設備的所述語音音頻數(shù)據(jù); 在所述移動計算設備接收由所述轉(zhuǎn)錄系統(tǒng)從所述語音音頻數(shù)據(jù)轉(zhuǎn)錄的字詞網(wǎng)格;在所述移動計算設備的顯示器屏幕上呈現(xiàn)來自所述字詞網(wǎng)格的一個或者多個轉(zhuǎn)錄的字詞; 在所述移動計算設備接收對所述呈現(xiàn)的轉(zhuǎn)錄的字詞中的至少一個轉(zhuǎn)錄的字詞的用戶選擇; 響應于接收到對所述轉(zhuǎn)錄的字詞的所述用戶選擇,在所述顯示器屏幕上呈現(xiàn)來自所述字詞網(wǎng)格的用于所述選擇的至少一個字詞的一個或者多個替代字詞; 在所述移動計算設備接收對所述替代字詞中的至少一個替代字詞的用戶選擇;以及響應于接收到對所述至少一個替代字詞的所述用戶選擇,用所述選擇的替代字詞取代所述呈現(xiàn)的轉(zhuǎn)錄的字詞中的所述選擇的轉(zhuǎn)錄的字詞。
2.根據(jù)權利要求I所述的方法,還包括 響應于接收到對所述轉(zhuǎn)錄的字詞的所述用戶選擇,在所述顯示器屏幕上呈現(xiàn)用于所述選擇的轉(zhuǎn)錄的字詞的去除命令; 在所述移動計算設備接收對所述去除命令的用戶選擇;以及 響應于接收到對所述去除命令的所述用戶選擇,從所述呈現(xiàn)的轉(zhuǎn)錄的字詞去除所述選擇的轉(zhuǎn)錄的字詞。
3.根據(jù)權利要求2所述的方法,還包括 在所述顯示器屏幕上呈現(xiàn)來自所述字詞網(wǎng)格的用于所述呈現(xiàn)的轉(zhuǎn)錄的字詞的至少一個替代短語; 在所述移動計算設備接收對所述替代短語的用戶選擇;以及 響應于接收到對所述替代短語的所述用戶選擇,用所述選擇的替代短語取代所述呈現(xiàn)的轉(zhuǎn)錄的字詞。
4.根據(jù)權利要求3所述的方法,還包括 響應于接收到對所述去除命令或者所述替代字詞的所述用戶選擇,自動基于所述選擇的替代字詞或者所述去除的轉(zhuǎn)錄的字詞從所述字詞網(wǎng)格選擇至少一個新的替代短語;以及用所述新的替代短語取代所述呈現(xiàn)的替代短語。
5.根據(jù)權利要求I所述的方法,其中接收對所述呈現(xiàn)的字詞的所述用戶選擇和對所述替代字詞的所述用戶選擇包括通過所述移動計算設備的觸屏接口接收對所述呈現(xiàn)的字詞的所述用戶選擇和對所述替代字詞的所述用戶選擇。
6.根據(jù)權利要求I所述的方法,其中所述字詞網(wǎng)格包括與所述轉(zhuǎn)錄的字詞和所述替代字詞對應的節(jié)點、在所述節(jié)點之間的邊,所述邊標識經(jīng)過所述字詞網(wǎng)格的可能路徑,并且每個路徑具有所述路徑正確的關聯(lián)概率。
7.根據(jù)權利要求6所述的方法,還包括從所述字詞網(wǎng)格中所述選擇的轉(zhuǎn)錄的字詞的開始節(jié)點與結束節(jié)點之間的一個或者多個替代路徑識別用于所述選擇的轉(zhuǎn)錄的字詞的所述替代字詞。
8.根據(jù)權利要求6所述的方法,還包括從所述字詞網(wǎng)格中所述呈現(xiàn)的轉(zhuǎn)錄的字詞的開始節(jié)點與結束節(jié)點之間的至少一個替代路徑識別用于所述呈現(xiàn)的轉(zhuǎn)錄的字詞的所述替代短語。
9.一種在計算機可讀介質(zhì)上編碼的計算機程序產(chǎn)品,可操作用于使一個或者多個處理器執(zhí)行用于糾正轉(zhuǎn)錄的文字中的字詞的操作,所述操作包括 從移動計算設備中的麥克風接收語音音頻數(shù)據(jù); 向轉(zhuǎn)錄系統(tǒng)發(fā)送來自所述移動計算設備的所述語音音頻數(shù)據(jù); 在所述移動計算設備接收由所述轉(zhuǎn)錄系統(tǒng)從所述語音音頻數(shù)據(jù)轉(zhuǎn)錄的字詞網(wǎng)格;在所述移動計算設備的顯示器屏幕上呈現(xiàn)來自所述字詞網(wǎng)格的一個或者多個轉(zhuǎn)錄的字詞; 在所述移動計算設備接收對所述呈現(xiàn)的轉(zhuǎn)錄的字詞中的至少一個轉(zhuǎn)錄的字詞的用戶選擇; 響應于接收到對所述轉(zhuǎn)錄的字詞的所述用戶選擇,在所述顯示器屏幕上呈現(xiàn)來自所述字詞網(wǎng)格的用于所述選擇的轉(zhuǎn)錄的字詞的一個或者多個替代字詞; 在所述移動計算設備接收對所述替代字詞中的至少一個替代字詞的用戶選擇;以及響應于接收到對所述替代字詞的所述用戶選擇,用所述選擇的替代字詞取代所述呈現(xiàn)的轉(zhuǎn)錄的字詞中的所述選擇的轉(zhuǎn)錄的字詞。
10.根據(jù)權利要求9所述的計算機程序產(chǎn)品,所述操作還包括 響應于接收到對所述轉(zhuǎn)錄的字詞的所述用戶選擇,在所述顯示器屏幕上呈現(xiàn)用于所述選擇的轉(zhuǎn)錄的字詞的去除命令; 在所述移動計算設備接收對所述去除命令的用戶選擇;以及 響應于接收到對所述去除命令的所述用戶選擇,從所述呈現(xiàn)的轉(zhuǎn)錄的字詞去除所述選擇的轉(zhuǎn)錄的字詞。
11.根據(jù)權利要求10所述的計算機程序產(chǎn)品,所述操作還包括 在所述顯示器屏幕上呈現(xiàn)來自所述字詞網(wǎng)格的用于所述呈現(xiàn)的轉(zhuǎn)錄的字詞的至少一個替代短語; 在所述移動計算設備接收對所述替代短語的用戶選擇;以及 響應于接收到對所述替代短語的所述用戶選擇,用所述選擇的替代短語取代所述呈現(xiàn)的轉(zhuǎn)錄的字詞。
12.根據(jù)權利要求11所述的計算機程序產(chǎn)品,所述操作還包括 響應于接收到對所述去除命令或者所述替代字詞的所述用戶選擇,自動基于所述選擇的替代字詞或者所述去除的轉(zhuǎn)錄的字詞從所述字詞網(wǎng)格選擇至少一個新的替代短語;以及用所述新的替代短語取代所述呈現(xiàn)的替代短語。
13.根據(jù)權利要求9所述的計算機程序產(chǎn)品,其中接收對所述呈現(xiàn)的字詞的所述用戶選擇和對所述替代字詞的所述用戶選擇包括通過所述移動計算設備的觸屏接口接收對所述呈現(xiàn)的字詞的所述用戶選擇和對所述替代字詞的所述用戶選擇。
14.根據(jù)權利要求9所述的計算機程序產(chǎn)品,其中所述字詞網(wǎng)格包括與所述轉(zhuǎn)錄的字詞和所述替代字詞對應的節(jié)點、在所述節(jié)點之間的邊,所述邊標識經(jīng)過所述字詞網(wǎng)格的可能路徑,并且每個路徑具有所述路徑正確的關聯(lián)概率。
15.根據(jù)權利要求14所述的計算機程序產(chǎn)品,所述操作還包括從所述字詞網(wǎng)格中所述選擇的轉(zhuǎn)錄的字詞的開始節(jié)點與結束節(jié)點之間的一個或者多個替代路徑識別用于所述選擇的轉(zhuǎn)錄的字詞的所述替代字詞。
16.根據(jù)權利要求14所述的計算機程序產(chǎn)品,所述操作還包括從所述字詞網(wǎng)格中所述呈現(xiàn)的轉(zhuǎn)錄的字詞的開始節(jié)點與結束節(jié)點之間的至少一個替代路徑識別用于所述呈現(xiàn)的轉(zhuǎn)錄的字詞的所述替代短語。
17.一種計算機實施的系統(tǒng),用于糾正轉(zhuǎn)錄的文字中的字詞,所述系統(tǒng)包括 轉(zhuǎn)錄系統(tǒng),可操作用于接收語音音頻數(shù)據(jù)并且作為響應將所述語音音頻數(shù)據(jù)轉(zhuǎn)錄成字詞網(wǎng)格;以及 移動計算設備,包括 麥克風,可操作用于接收語音音頻并且生成所述語音音頻數(shù)據(jù), 網(wǎng)絡接口,可操作用于向所述轉(zhuǎn)錄系統(tǒng)發(fā)送所述語音音頻數(shù)據(jù)并且作為響應從所述轉(zhuǎn)錄系統(tǒng)接收所述字詞網(wǎng)格, 顯示器屏幕,可操作用于呈現(xiàn)來自所述字詞網(wǎng)格的一個或者多個轉(zhuǎn)錄的字詞,用戶接口,可操作用于接收對所述轉(zhuǎn)錄的字詞中的至少一個轉(zhuǎn)錄的字詞的用戶選擇,一個或者多個處理器和存儲指令的存儲器,所述指令在由所述處理器執(zhí)行時執(zhí)行以下操作在所述顯示器屏幕上呈現(xiàn)來自所述字詞網(wǎng)格的用于所述選擇的轉(zhuǎn)錄的字詞的一個或者多個替代字詞;接收對所述替代字詞中的至少一個替代字詞的用戶選擇;以及用所述選擇的替代字詞取代所述呈現(xiàn)的轉(zhuǎn)錄的字詞中的所述選擇的轉(zhuǎn)錄的字詞。
全文摘要
可以在一種計算機實施的方法以及其它實施方式中實施本說明書的主題內(nèi)容,其中該方法用于糾正轉(zhuǎn)錄的文字中的字詞,該方法包括從麥克風接收語音音頻數(shù)據(jù)。該方法還包括向轉(zhuǎn)錄系統(tǒng)發(fā)送語音音頻數(shù)據(jù)。該方法還包括接收轉(zhuǎn)錄系統(tǒng)從語音音頻數(shù)據(jù)轉(zhuǎn)錄的字詞網(wǎng)格。該方法還包括呈現(xiàn)來自字詞網(wǎng)格的一個或者多個轉(zhuǎn)錄的字詞。該方法還包括接收呈現(xiàn)的轉(zhuǎn)錄的字詞中的至少一個轉(zhuǎn)錄的字詞的用戶選擇。該方法還包括呈現(xiàn)來自字詞網(wǎng)格的用于所選轉(zhuǎn)錄的字詞的一個或者多個替代字詞。該方法還包括接收替代字詞中的至少一個替代字詞的用戶選擇。該方法還包括用所選替代字詞取代呈現(xiàn)的轉(zhuǎn)錄的字詞中的所選轉(zhuǎn)錄的字詞。
文檔編號G06F17/27GK102971725SQ201180008973
公開日2013年3月13日 申請日期2011年1月5日 優(yōu)先權日2010年1月5日
發(fā)明者M·J·勒鮑, W·J·伯恩, J·N·吉科夫, B·M·巴林格爾, T·克里斯簡森 申請人:谷歌公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
集贤县| 安庆市| 临猗县| 黄梅县| 延安市| 鹤峰县| 苍溪县| 弋阳县| 嘉义市| 台北市| 同德县| 景宁| 太白县| 济阳县| 潍坊市| 贵定县| 瓮安县| 岑溪市| 宁武县| 吴忠市| 北流市| 南岸区| 大连市| 洪泽县| 高密市| 苗栗县| 永胜县| 修武县| 望都县| 郑州市| 若羌县| 醴陵市| 潍坊市| 霍州市| 临高县| 铜川市| 安福县| 南木林县| 云浮市| 偏关县| 靖江市|