欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種語音輸入方法和系統(tǒng)的制作方法

文檔序號:6524453閱讀:275來源:國知局
一種語音輸入方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供了一種語音輸入方法和系統(tǒng),所述方法包括采集語音數(shù)據(jù),并將所述語音數(shù)據(jù)發(fā)送至服務器;接收所述服務器識別出的所述語音數(shù)據(jù)對應的第一識別評分最高的前M個候選識別文本及其識別信息,其中,所述識別信息包括第一識別評分;采用當前用戶的個性化文本數(shù)據(jù)計算所述前M個候選識別文本的第二識別評分;采用所述第一識別評分和第二識別評分計算所述前M個候選識別文本的第三識別評分;計算第三識別評分最高的前N個候選識別文本的置信度;按照所述置信度展示所述前N個候選識別文本。多候選結果的展示,可以方便用戶選擇,提高識別成功的準確率,采用用戶的個性化數(shù)據(jù)進行重新排序,可以盡量保證符合用戶習慣使得識別精度高提高。
【專利說明】一種語音輸入方法和系統(tǒng)
【技術領域】
[0001]本發(fā)明涉及輸入法【技術領域】,特別是涉及一種語音輸入方法,以及,一種語音輸入法系統(tǒng)。
【背景技術】
[0002]目前,移動互聯(lián)網(wǎng)的快速發(fā)展帶動了移動智能設備如手機、平板電腦、穿戴式設備等的廣泛普及,而作為移動設備上人機交互最方便自然的方式之一,語音輸入法正逐漸被廣大用戶所接受。
[0003]盡管隨著語音識別技術的發(fā)展,語音輸入法性能取得了較大進步,但是受模型精度、噪聲以及口音等因素的影響,反饋至客戶端的結果有可能并非用戶真實的語音輸入。例如,用戶采用語音輸入“國慶節(jié)后是什么節(jié)”,識別評分最高的結果可以為“國慶前后是什么節(jié)”。
[0004]其次,目前使用的語言模型為通用語言模型,使用前基于多來源以及多用戶的大量文本進行學習得到,并不適合用戶個性化需求。例如,用戶經(jīng)常使用“泉州”,而當用戶采用語音輸入“我想去泉州”,由于大多數(shù)用戶對“全州”的使用率可能高于“泉州”,則基于通用語言模型其識別結果可能為“我想去全州”,多次輸入后結果未改變,均不符合用戶期望。
[0005]而用戶使用鍵盤輸入會存在一定的輸入誤差(如錯別字等),因此構建的用戶模型精度會受到一定影響。例如,用戶在鍵盤輸入時經(jīng)常會輸入“你趕進去吃飯吧”,其中“趕進”是錯誤輸入,應該為“趕緊”,如果基于上述類型的文本構建用戶模型,會影響模型的精度。

【發(fā)明內(nèi)容】

[0006]本發(fā)明提供了一種語音輸入方法,以解決語音識別準確率低的問題。
[0007]相應的,本發(fā)明還提供了一種語音輸入系統(tǒng),用以保證上述方法的實現(xiàn)及應用。
[0008]為了解決上述問題,本發(fā)明公開了一種語音輸入方法,包括:
[0009]采集語音數(shù)據(jù),并將所述語音數(shù)據(jù)發(fā)送至服務器;
[0010]接收所述服務器識別出的所述語音數(shù)據(jù)對應的第一識別評分最高的前M個候選識別文本及其識別信息,其中,所述識別信息包括第一識別評分;
[0011]采用當前用戶的個性化文本數(shù)據(jù)計算所述前M個候選識別文本的第二識別評分;
[0012]采用所述第一識別評分和第二識別評分計算所述前M個候選識別文本的第三識別評分;
[0013]計算第三識別評分最高的前N個候選識別文本的置信度;
[0014]按照所述置信度展示所述前N個候選識別文本。
[0015]優(yōu)選地,所述個性化文本數(shù)據(jù)包括以下的一種或多種:
[0016]輸入行為文本數(shù)據(jù)、自定義詞庫、設備文本數(shù)據(jù)、置信度高于預置閾值的語音識別文本。
[0017]優(yōu)選地,所述候選識別文本包括多個語音候選詞,所述識別信息還包括所述多個語音候選詞的出現(xiàn)概率;講怎么算第二識別評分的
[0018]所述采用當前用戶的個性化文本數(shù)據(jù)計算所述前M個候選識別文本的第二識別評分的步驟包括:
[0019]對所述前M個候選識別文本進行分詞,獲得第一分詞;
[0020]分別將所述第一分詞映射為預置的第二分詞,其中,所述第二分詞為當前用戶的個性化文本數(shù)據(jù)的分詞,且所述第二分詞具有詞頻數(shù);
[0021]分別采用所述第二分詞查找所述第一分詞的出現(xiàn)概率;所述出現(xiàn)概率為第一詞頻數(shù)與第二詞頻數(shù)的比值,其中,所述第一詞頻數(shù)為當前第一分詞對應的第二分詞,出現(xiàn)在當前第一分詞前面一個或多個第一分詞對應的第二分詞后面的詞頻數(shù),所述第二詞頻數(shù)為所述前面一個或多個第一分詞對應的第二分詞的總詞頻數(shù);
[0022]采用所述第一分詞的出現(xiàn)概率進行乘法運算以獲得所述候選識別文本的連接概率;
[0023]分別采用所述多個語音候選詞的出現(xiàn)概率和所述候選識別文本的連接概率計算所述候選識別文本的第二識別評分。
[0024]優(yōu)選地,采用以下公式計算所述候選識別文本的第二識別評分:
[0025]
【權利要求】
1.一種語音輸入方法,其特征在于,包括: 采集語音數(shù)據(jù),并將所述語音數(shù)據(jù)發(fā)送至服務器; 接收所述服務器識別出的所述語音數(shù)據(jù)對應的第一識別評分最高的前M個候選識別文本及其識別信息,其中,所述識別信息包括第一識別評分; 采用當前用戶的個性化文本數(shù)據(jù)計算所述前M個候選識別文本的第二識別評分; 采用所述第一識別評分和第二識別評分計算所述前M個候選識別文本的第三識別評分; 計算第三識別評分最高的前N個候選識別文本的置信度; 按照所述置信度展示所述前N個候選識別文本。
2.根據(jù)權利要求1所述的方法,其特征在于,所述個性化文本數(shù)據(jù)包括以下的一種或多種: 輸入行為文本數(shù)據(jù)、自定義詞庫、設備文本數(shù)據(jù)、置信度高于預置閾值的語音識別文本。
3.根據(jù)權利要求1或2所述的方法,其特征在于,所述候選識別文本包括多個語音候選詞,所述識別信息還包括所述多個語音候選詞的出現(xiàn)概率; 所述采用當前用戶的個性化文本數(shù)據(jù)計算所述前M個候選識別文本的第二識別評分的步驟包括: 對所述前M個候選識別文本進行分詞,獲得第一分詞; 分別將所述第一分詞映射為預置的第二分詞,其中,所述第二分詞為當前用戶的個性化文本數(shù)據(jù)的分詞,且所述第二分詞具有詞頻數(shù); 分別采用所述第二分詞查找所述第一分詞的出現(xiàn)概率;所述出現(xiàn)概率為第一詞頻數(shù)與第二詞頻數(shù)的比值,其中,所述第一詞頻數(shù)為當前第一分詞對應的第二分詞,出現(xiàn)在當前第一分詞前面一個或多個第一分詞對應的第二分詞后面的詞頻數(shù),所述第二詞頻數(shù)為所述前面一個或多個第一分詞對應的第二分詞的總詞頻數(shù); 采用所述第一分詞的出現(xiàn)概率進行乘法運算以獲得所述候選識別文本的連接概率;分別采用所述多個語音候選詞的出現(xiàn)概率和所述候選識別文本的連接概率計算所述候選識別文本的第二識別評分。
4.根據(jù)權利要求3所述的方法,其特征在于,采用以下公式計算所述候選識別文本的第二識別評分:
5.根據(jù)權利要求1所述的方法,其特征在于,采用以下公式計算第三識別評分:
MS (i) = a ^si+ β 其中,MS(i)為第i個候選識別文本的第三識別評分,Si為第i個候選識別文本的第一識別評分,Ui為第i個候選識別文本的第二識別評分,α和β為非負數(shù)。
6.根據(jù)權利要求1所述的方法,其特征在于,所述置信度為當前候選識別文本的第三識別評分與所述前N個候選識別文本的第三識別評分的和的比值。
7.—種語音輸入方法,其特征在于,包括: 接收客戶端發(fā)送的語音數(shù)據(jù); 將所述語音數(shù)據(jù)識別出多個候選識別文本及其識別信息;所述識別信息包括第一識別評分; 采用當前用戶的個性化文本數(shù)據(jù)計算第一識別評分最高的前M個候選識別文本的第二識別評分; 采用所述第一識別 評分和第二識別評分計算所述前M個候選識別文本的第三識別評分; 計算第三識別評分最高的前N個候選識別文本的置信度; 將所述前N個候選識別文本及其置信度發(fā)送至客戶端;所述客戶端用于按照所述置信度展示所述前N個候選識別文本。
8.—種語音輸入方法,其特征在于,包括: 采集語音數(shù)據(jù),并將所述語音數(shù)據(jù)發(fā)送至服務器; 接收所述服務器返回的每個語音子數(shù)據(jù)中第一識別評分最高的前M個候選識別文本及其識別評分,其中,所述語音子數(shù)據(jù)為所述語音數(shù)據(jù)被所述服務器切分成的多個語音子數(shù)據(jù),所述識別評分包括第一識別評分;分別采用當前用戶的個性化文本數(shù)據(jù)計算每個語音子數(shù)據(jù)對應的前M個候選識別文本的第二識別評分; 分別采用所述第一識別評分和第二識別評分計算每個語音子數(shù)據(jù)對應的前M個候選識別文本的第三識別評分; 分別計算每個語音子數(shù)據(jù)的第三識別評分最高的前N個候選識別文本的置信度; 分別展示每個語音子數(shù)據(jù)中置信度最高的候選識別文本。
9.根據(jù)權利要求8所述的方法,其特征在于,所述個性化文本數(shù)據(jù)包括以下的一種或多種: 輸入行為文本數(shù)據(jù)、自定義詞庫、設備文本數(shù)據(jù)、置信度高于預置閾值的語音識別文本。
10.根據(jù)權利要求8或9所述的方法,其特征在于,所述候選識別文本包括多個語音候選詞,所述識別信息還包括所述多個語音候選詞的出現(xiàn)概率; 所述分別采用當前用戶的個性化文本數(shù)據(jù)計算每個語音子數(shù)據(jù)對應的前M個候選識別文本的第二識別評分的步驟包括: 分別對每個語音子數(shù)據(jù)對應的前M個候選識別文本進行分詞,獲得第一分詞; 分別將所述第一分詞映射為預置的第二分詞,其中,所述第二分詞為當前用戶的個性化文本數(shù)據(jù)的分詞,且所述第二分詞具有詞頻數(shù); 分別采用所述第二分詞查找所述第一分詞的出現(xiàn)概率;所述出現(xiàn)概率為第一詞頻數(shù)與第二詞頻數(shù)的比值,其中,所述第一詞頻數(shù)為當前第一分詞對應的第二分詞出現(xiàn)在當前第一分詞前面一個或多個第一分詞對應的第二分詞后面的詞頻數(shù),所述第二詞頻數(shù)為所述前面一個或多個第一分詞對應的第二分詞的總詞頻數(shù); 分別采用所述第一分詞的出現(xiàn)概率進行乘法運算以獲得所述候選識別文本的連接概率; 采用所述多個語音候選詞的出現(xiàn)概率和所述候選識別文本的連接概率計算所述候選識別文本的第二識別評分。
11.根據(jù)權利要求10所述的方法,其特征在于,采用以下公式計算所述候選識別文本的第二識別評分: logρ{θ? |^) + λ*logP(^)+WP 其中,扒斤?^7)為所述多個語音候選詞的出現(xiàn)概率,為所述候選識別文本的連接概率,λ為權重,WP為詞插入懲罰參數(shù)。
12.根據(jù)權利要求8所述的方法,其特征在于,采用以下公式計算第三識別評分:
MS (i) = a ^si+ β 其中,MS(i)為第i個候選識別文本的第三識別評分,Si為第i個候選識別文本的第一識別評分,Ui為第i個候選識別文本的第二識別評分,α和β為非負數(shù)。
13.根據(jù)權利要求8所述的方法,其特征在于,所述置信度為當前候選識別文本的第三識別評分與所述前N個候選識別文本的第三識別評分的和的比值。
14.根據(jù)權利要求8所述的方法,其特征在于,還包括: 當所述置信度最高的候選識別文本被觸發(fā)時,展示其他候選識別文本;所述其他文本為所述前N個候選識別文本中除置信度最高的候選識別文本外的候選識別文本。
15.—種語音輸入方法,其特征在于,包括:` 接收客戶端發(fā)送的語音數(shù)據(jù); 將所述語音數(shù)據(jù)切分為多個語音子數(shù)據(jù); 分別識別出每個語音子數(shù)據(jù)的多個候選識別文本及其識別信息;所述識別信息包括第一識別評分; 分別采用當前用戶的個性化文本數(shù)據(jù)計算每個語音子數(shù)據(jù)對應的第一識別評分最高的前M個候選識別文本的第二識別評分; 分別采用所述第一識別評分和第二識別評分計算每個語音子數(shù)據(jù)對應的前M個候選識別文本的第三識別評分; 分別計算每個語音子數(shù)據(jù)的第三識別評分最高的前N個候選識別文本的置信度; 將每個語音子數(shù)據(jù)的第三識別評分最高的前N個候選識別文本及其置信度發(fā)送至客戶端;所述客戶端用于分別展示每個語音子數(shù)據(jù)中置信度最高的候選識別文本。
16.—種語音輸入系統(tǒng),其特征在于,包括: 第一語音數(shù)據(jù)采集模塊,用于采集語音數(shù)據(jù); 第一語音數(shù)據(jù)發(fā)送模塊,用于將所述語音數(shù)據(jù)發(fā)送至服務器; 第一接收模塊,用于接收所述服務器識別出的所述語音數(shù)據(jù)對應的第一識別評分最高的前M個候選識別文本及其識別信息,其中,所述識別信息包括第一識別評分; 第一評分計算模塊,用于采用當前用戶的個性化文本數(shù)據(jù)計算所述前M個候選識別文本的第二識別評分; 第二評分計算模塊,用于采用所述第一識別評分和第二識別評分計算所述前M個候選識別文本的第三識別評分; 第一置信度計算模塊,用于計算第三識別評分最高的前N個候選識別文本的置信度; 第一展示模塊,用于按照所述置信度展示所述前N個候選識別文本。
17.根據(jù)權利要求16所述的系統(tǒng),其特征在于,所述個性化文本數(shù)據(jù)包括以下的一種或多種: 輸入行為文本數(shù)據(jù)、自定義詞庫、設備文本數(shù)據(jù)、置信度高于預置閾值的語音識別文本。
18.根據(jù)權利要求16或17所述的系統(tǒng),其特征在于,所述候選識別文本包括多個語音候選詞,所述識別評分還包括所述多個語音候選詞的出現(xiàn)概率; 所述第一評分計算模塊包括: 第一分詞子模塊,用于對所述前M個候選識別文本進行分詞,獲得第一分詞; 第一映射子模塊,用于分別將所述第一分詞映射為預置的第二分詞,其中,所述第二分詞為當前用戶的個性化文本數(shù)據(jù)的分詞,且所述第二分詞具有詞頻數(shù); 第一查找子模塊,用于分別采用所述第二分詞查找所述第一分詞的出現(xiàn)概率;所述出現(xiàn)概率為第一詞頻數(shù)與第二詞頻數(shù)的比值,其中,所述第一詞頻數(shù)為當前第一分詞對應的第二分詞,出現(xiàn)在當前第一分詞前面一個或多個第一分詞對應的第二分詞后面的詞頻數(shù),所述第二詞頻數(shù)為所述前面一個或多個第一分詞對應的第二分詞的總詞頻數(shù); 第一連接概率獲得子模塊,用于采用所述第一分詞的出現(xiàn)概率進行乘法運算以獲得所述候選識別文本的連接概率; 第一候選識別文本評分計算子模塊,用于分別采用所述多個語音候選詞的出現(xiàn)概率和所述候選識別文本的連接概率計算所述候選識別文本的第二識別評分。
19.根據(jù)權利要求18所述的系統(tǒng),其特征在于,采用以下公式計算所述候選識別文本的第二識別評分:

20.根據(jù)權利要求16所述的系統(tǒng),其特征在于,采用以下公式計算第三識別評分:
MS (i) = a ^si+ β 其中,MS(i)為第i個候選識別文本的第三識別評分,Si為第i個候選識別文本的第一識別評分,Ui為第i個候選識別文本的第二識別評分,α和β為非負數(shù)。
21.根據(jù)權利要求16所述的系統(tǒng),其特征在于,所述置信度為當前候選識別文本的第三識別評分與所述前N個候選識別文本的第三識別評分的和的比值。
22.—種語音輸入系統(tǒng),其特征在于,包括: 第二語音數(shù)據(jù)接收模塊,用于接收客戶端發(fā)送的語音數(shù)據(jù); 第二識別模塊,用于將所述語音數(shù)據(jù)識別出多個候選識別文本及其識別信息;所述識別信息包括第一識別評分; 第四評分計算模塊,用于采用當前用戶的個性化文本數(shù)據(jù)計算第一識別評分最高的前M個候選識別文本的第二識別評分; 第五評分計算模塊,用于采用所述第一識別評分和第二識別評分計算所述前M個候選識別文本的第三識別評分; 第二置信度模塊,用于計算第三識別評分最高的前N個候選識別文本的置信度;第二發(fā)送模塊,用于將所述前N個候選識別文本及其置信度發(fā)送至客戶端;所述客戶端用于按照所述置信度展示所述前N個候選識別文本。
23.—種語音輸入系統(tǒng),其特征在于,包括: 第二語音數(shù)據(jù)采集模塊,用于采集語音數(shù)據(jù); 第二語音數(shù)據(jù)發(fā)送模塊,用于將所述語音數(shù)據(jù)發(fā)送至服務器;第二接收模塊,用于接收所述服務器返回的每個語音子數(shù)據(jù)中第一識別評分最高的前M個候選識別文本及其識別評分,其中,所述語音子數(shù)據(jù)為所述語音數(shù)據(jù)被所述服務器切分成的多個語音子數(shù)據(jù),所述識別評分包括第一識別評分; 第六評分計算模塊,用于分別采用當前用戶的個性化文本數(shù)據(jù)計算每個語音子數(shù)據(jù)對應的前M個候選識別文本的第二識別評分; 第七評分計算模塊,用于分別采用所述第一識別評分和第二識別評分計算每個語音子數(shù)據(jù)對應的前M個候選識別文本的第三識別評分; 第三置信度計算模塊,用于分別計算每個語音子數(shù)據(jù)的第三識別評分最高的前N個候選識別文本的置信度; 第二展示模塊,用于分別展示每個語音子數(shù)據(jù)中置信度最高的候選識別文本。
24.根據(jù)權利要求23所述的系統(tǒng),其特征在于,所述個性化文本數(shù)據(jù)包括以下的一種或多種: 輸入行為文本數(shù)據(jù)、自定義詞庫、設備文本數(shù)據(jù)、置信度高于預置閾值的語音識別文本。
25.根據(jù)權利要求23或24所述的系統(tǒng),其特征在于,所述候選識別文本包括多個語音候選詞,所述識別信息還包括所述多個語音候選詞的出現(xiàn)概率; 所述第六評分計算模塊包括: 第二分詞子模塊,用于分別對每個語音子數(shù)據(jù)對應的前M個候選識別文本進行分詞,獲得第一分詞; 第二映射子模塊,用于分別將所述第一分詞映射為預置的第二分詞,其中,所述第二分詞為當前用戶的個性化文本數(shù)據(jù)的分詞,且所述第二分詞具有詞頻數(shù); 第二查找子模塊,用于分別采用所述第二分詞查找所述第一分詞的出現(xiàn)概率;所述出現(xiàn)概率為第一詞頻數(shù)與第二詞頻數(shù)的比值,其中,所述第一詞頻數(shù)為當前第一分詞對應的第二分詞,出現(xiàn)在當前第一分詞前面一個或多個第一分詞對應的第二分詞后面的詞頻數(shù),所述第二詞頻數(shù)為所述前面一個或多個第一分詞對應的第二分詞的總詞頻數(shù); 第二連接概率獲得子模塊,用于分別采用所述第一分詞的出現(xiàn)概率進行乘法運算以獲得所述候選識別文本的連接概率; 第二候選識別文本評分計算子模塊,用于采用所述多個語音候選詞的出現(xiàn)概率和所述候選識別文本的連接概率計算所述候選識別文本的第二識別評分。
26.根據(jù)權利要求25所述的系統(tǒng),其特征在于,采用以下公式計算所述候選識別文本的第二識別評分: log ρ{θ?+ log )+WP 其中,lW)為所述多個語音候選詞的出現(xiàn)概率,P(W)為所述候選識別文本的連接概率,λ為權重,WP為詞插入懲罰參數(shù)。
27.根據(jù)權利要求23所述的方法,其特征在于,采用以下公式計算第三識別評分:
MS (i) = a ^si+ β 其中,MS(i)為第i個候選識別文本的第三識別評分,Si為第i個候選識別文本的第一識別評分,Ui為第i個候選識別文本的第二識別評分,α和β為非負數(shù)。
28.根據(jù)權利要求23所述的系統(tǒng),其特征在于,所述置信度為當前候選識別文本的第三識別評分與所述前N個候選識別文本的第三識別評分的和的比值。
29.根據(jù)權利要求23所述的系統(tǒng),其特征在于,還包括: 第三展示模塊,用于在所述置信度最高的候選識別文本被觸發(fā)時,展示其他候選識別文本;所述其他文本為所述前N個候選識別文本中除置信度最高的候選識別文本外的候選識別文本。
30.一種語音輸入系統(tǒng),其特征在于,包括: 第四語音數(shù)據(jù)接收模塊,用于接收客戶端發(fā)送的語音數(shù)據(jù); 第二語音數(shù)據(jù)切分模塊,用于將所述語音數(shù)據(jù)切分為多個語音子數(shù)據(jù); 第三識別模塊,用于分別識別出每個語音子數(shù)據(jù)的多個候選識別文本及其識別信息;所述識別信息包括第一識別評分; 第九評分計算模塊,用 于分別采用當前用戶的個性化文本數(shù)據(jù)計算每個語音子數(shù)據(jù)對應的前M個候選識別文本的第二識別評分; 第十評分計算模塊,用于分別采用所述第一識別評分和第二識別評分計算每個語音子數(shù)據(jù)對應的第一識別評分最高的前M個候選識別文本的第三識別評分; 第四置信度計算模塊,用于分別計算每個語音子數(shù)據(jù)的第三識別評分最高的前N個候選識別文本的置信度; 第四發(fā)送模塊,用于將每個語音子數(shù)據(jù)的第三識別評分最高的前N個候選識別文本及其置信度發(fā)送至客戶端;所述客戶端用于分別展示每個語音子數(shù)據(jù)中置信度最高的候選識別文本。
【文檔編號】G06F3/16GK103677729SQ201310701517
【公開日】2014年3月26日 申請日期:2013年12月18日 優(yōu)先權日:2013年12月18日
【發(fā)明者】陳偉, 梁偉文 申請人:北京搜狗科技發(fā)展有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
丹江口市| 黔西县| 江津市| 开封县| 连州市| 小金县| 黄大仙区| 沽源县| 鲁甸县| 天长市| 高陵县| 乡城县| 科尔| 静宁县| 那曲县| 巴南区| 濮阳市| 平利县| 芜湖县| 荥经县| 大安市| 长海县| 安仁县| 诸城市| 个旧市| 奎屯市| 柘荣县| 佛学| 梅州市| 福贡县| 宽城| 禄丰县| 宿迁市| 银川市| 法库县| 香河县| 容城县| 福海县| 西充县| 临邑县| 田林县|