欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種語音識(shí)別結(jié)果的篩選方法及裝置與流程

文檔序號(hào):11834559閱讀:337來源:國(guó)知局
一種語音識(shí)別結(jié)果的篩選方法及裝置與流程

本申請(qǐng)涉及語音識(shí)別技術(shù)領(lǐng)域,尤其涉及一種語音識(shí)別結(jié)果的篩選方法及裝置。



背景技術(shù):

語音識(shí)別系統(tǒng)通常由聲學(xué)模型和語言模型兩部分組成其中聲學(xué)模型的建立需要依賴大量的語音數(shù)據(jù),以及語音數(shù)據(jù)對(duì)應(yīng)的正確的文本信息,從而得到語音與文字的統(tǒng)計(jì)對(duì)應(yīng)關(guān)系,積累語音數(shù)據(jù)以及語音數(shù)據(jù)對(duì)應(yīng)的正確的文本信息這個(gè)過程也被稱作模型的訓(xùn)練,將語音數(shù)據(jù)對(duì)應(yīng)的正確的文本信息定義為該語音數(shù)據(jù)對(duì)應(yīng)的標(biāo)注數(shù)據(jù),比如語音數(shù)據(jù)“bǐ’jì”對(duì)應(yīng)的標(biāo)注數(shù)據(jù)為“筆記”和“筆跡”;而“比既”不具備詞語的意義,就不是標(biāo)注數(shù)據(jù)。標(biāo)注數(shù)據(jù)越多(包括同一語音數(shù)據(jù)對(duì)應(yīng)越多的標(biāo)注數(shù)據(jù),和越多不同語音數(shù)據(jù)對(duì)應(yīng)的標(biāo)注數(shù)據(jù)),語音識(shí)別的準(zhǔn)確率就越高,全面性就越廣。例如對(duì)不同技術(shù)領(lǐng)域的專業(yè)術(shù)語的識(shí)別、對(duì)地方方言描述相同事物所用不同詞語的識(shí)別、對(duì)不同年齡段人群語言習(xí)慣的識(shí)別等問題,都依賴于聲學(xué)模型;可以說,聲學(xué)模型的優(yōu)劣直接影響了語音識(shí)別系統(tǒng)的性能。

現(xiàn)有技術(shù)中積累標(biāo)注數(shù)據(jù)的方法,是使用人工聽寫的方式將語音數(shù)據(jù)先轉(zhuǎn)錄為文本信息;再通過人工判斷,結(jié)合語意語境等因素,挑選出正確的文本信息并確定為標(biāo)注數(shù)據(jù)。但一般人腦可以利用生活經(jīng)驗(yàn)直接將語音數(shù)據(jù)轉(zhuǎn)錄為標(biāo)注數(shù)據(jù),比如,有一段音頻格式的標(biāo)準(zhǔn)普通話語音“míng’tiān’tiān’qì’zěn’me’yàng(明天天氣什么樣)”,工作人員利用生活經(jīng)驗(yàn)可以直接將此段語音轉(zhuǎn)錄,得到標(biāo)注數(shù)據(jù)“明天天氣什么樣”。語音數(shù)據(jù)“míng’tiān’tiān’qì’zěn’me’yàng”可以包含三個(gè)語音單元:“míng’tiān’tiān”、“tiān’qì”、“z ěn’me’yàng”,所以就對(duì)應(yīng)了三個(gè)標(biāo)注數(shù)據(jù)“明天”、“天氣”、“怎么樣”;也可以將整句話劃分為一個(gè)語音單元“míng’tiān’tiān’qì’zěn’me’yàng”,所以就對(duì)應(yīng)了一個(gè)標(biāo)注數(shù)據(jù),積累標(biāo)注數(shù)據(jù)可以是積累一個(gè)語音數(shù)據(jù)的標(biāo)注數(shù)據(jù),也可以是積累語音單元的標(biāo)注數(shù)據(jù)。由于該例很簡(jiǎn)單,所以很容易得到標(biāo)注數(shù)據(jù),但如果語意很復(fù)雜,人腦也會(huì)反應(yīng)出很多詞語,比如,聽到“bǐ’jì”,就會(huì)反應(yīng)出“筆記”和“筆跡”,如果“bǐ’jì”只作為語音數(shù)據(jù)中的一個(gè)語音單元,那么就需要再根據(jù)語音數(shù)據(jù)的語境語意等因素,確定出該語音數(shù)據(jù)的標(biāo)注數(shù)據(jù)。但目前這種將語音數(shù)據(jù)進(jìn)行識(shí)別,并挑選出標(biāo)注數(shù)據(jù)的過程是一種依賴于人力勞動(dòng)的活動(dòng),效率很低。



技術(shù)實(shí)現(xiàn)要素:

本申請(qǐng)實(shí)施例提供一種語音識(shí)別結(jié)果的篩選方法,用于提高篩選語音識(shí)別結(jié)果的效率。

本申請(qǐng)實(shí)施例提供一種語音識(shí)別結(jié)果的篩選裝置,用于提高篩選語音識(shí)別結(jié)果的效率。

本申請(qǐng)實(shí)施例采用下述技術(shù)方案:

一種語音識(shí)別結(jié)果的篩選方法,包括:利用語音識(shí)別系統(tǒng)對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,得到語音數(shù)據(jù)對(duì)應(yīng)的文本信息;確定文本信息包含的信息單元的置信度;根據(jù)置信度,選取滿足置信條件的信息單元。

一種語音識(shí)別結(jié)果的篩選裝置,包括:識(shí)別單元,用于利用語音識(shí)別系統(tǒng)對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,得到語音數(shù)據(jù)對(duì)應(yīng)的文本信息;計(jì)算單元,用于確定文本信息包含的信息單元的置信度;選取單元,用于根據(jù)置信度,選取滿足置信條件的信息單元。

本申請(qǐng)實(shí)施例采用的上述至少一個(gè)技術(shù)方案能夠達(dá)到以下有益效果:

由于可以利用語音識(shí)別系統(tǒng)來對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,再對(duì)識(shí)別結(jié)果進(jìn)行篩選,所以可以代替人工對(duì)語音數(shù)據(jù)進(jìn)行轉(zhuǎn)錄并挑選的工作,解決了目前依賴于 人力勞動(dòng)導(dǎo)致的效率低的問題。

附圖說明

此處所說明的附圖用來提供對(duì)本申請(qǐng)的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本申請(qǐng)的示意性實(shí)施例及其說明用于解釋本申請(qǐng),并不構(gòu)成對(duì)本申請(qǐng)的不當(dāng)限定。在附圖中:

圖1為本申請(qǐng)實(shí)施例1提供的一種語音識(shí)別結(jié)果的篩選方法的具體實(shí)現(xiàn)流程示意圖;

圖2為本申請(qǐng)實(shí)施例2提供的一種語音識(shí)別結(jié)果的篩選裝置的具體結(jié)構(gòu)示意圖;

圖3為本申請(qǐng)實(shí)施例3提供的一種補(bǔ)充本地聲學(xué)模型標(biāo)注數(shù)據(jù)的方法的示意圖。

具體實(shí)施方式

為使本申請(qǐng)的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本申請(qǐng)具體實(shí)施例及相應(yīng)的附圖對(duì)本申請(qǐng)技術(shù)方案進(jìn)行清楚、完整地描述。顯然,所描述的實(shí)施例僅是本申請(qǐng)一部分實(shí)施例,而不是全部的實(shí)施例?;诒旧暾?qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本申請(qǐng)保護(hù)的范圍。

以下結(jié)合附圖,詳細(xì)說明本申請(qǐng)各實(shí)施例提供的技術(shù)方案。

實(shí)施例1

實(shí)施例1提供了一種語音識(shí)別結(jié)果的篩選方法,用于提高篩選語音識(shí)別結(jié)果的效率。該方法的具體流程示意圖如圖1所示,包括下述步驟:

步驟11,利用語音識(shí)別系統(tǒng)對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,得到語音數(shù)據(jù)對(duì)應(yīng)的文本信息;

其中,在語音數(shù)據(jù)的識(shí)別過程中,可以根據(jù)不同需求和目的,采用單個(gè)或 多個(gè)不同領(lǐng)域的非本地識(shí)別系統(tǒng),來得到識(shí)別結(jié)果,即語音數(shù)據(jù)對(duì)應(yīng)的文本信息。比如,需要對(duì)本地聲學(xué)模型中藥物專業(yè)的標(biāo)注數(shù)據(jù)庫(kù)進(jìn)行擴(kuò)充,就需要先得到包含藥物名稱的語音數(shù)據(jù),再利用單個(gè)或多個(gè)具備醫(yī)學(xué)專業(yè)術(shù)語識(shí)別能力的語音識(shí)別系統(tǒng)對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,得到對(duì)應(yīng)的藥物名稱文本信息。類似的,對(duì)于地名、品牌、商品、生活、服務(wù)等領(lǐng)域的詞匯和語句,需要具備相應(yīng)的專業(yè)術(shù)語識(shí)別能力的語音識(shí)別系統(tǒng)。

具體而言,在一種實(shí)施方式中,利用語音識(shí)別系統(tǒng)對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,得到語音數(shù)據(jù)對(duì)應(yīng)的文本信息,可以包括:利用一個(gè)語音識(shí)別系統(tǒng),對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,得到語音數(shù)據(jù)對(duì)應(yīng)的文本信息。

比如,利用一個(gè)具備醫(yī)學(xué)專業(yè)術(shù)語識(shí)別能力的語音識(shí)別系統(tǒng),對(duì)一些包含藥物名稱的語音數(shù)據(jù)進(jìn)行識(shí)別,得到語音數(shù)據(jù)對(duì)應(yīng)的文本信息,文本信息中包含若干藥物名稱。

在一種實(shí)施方式中,利用語音識(shí)別系統(tǒng)對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,得到語音數(shù)據(jù)對(duì)應(yīng)的文本信息,可以包括:利用至少兩個(gè)語音識(shí)別系統(tǒng),分別對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,得到語音數(shù)據(jù)對(duì)應(yīng)的文本信息。

比如,利用至少兩個(gè)具備醫(yī)學(xué)專業(yè)術(shù)語識(shí)別能力的語音識(shí)別系統(tǒng),對(duì)一些包含藥物名稱的語音數(shù)據(jù)進(jìn)行識(shí)別,得到語音數(shù)據(jù)對(duì)應(yīng)的文本信息,文本信息中包含若干藥物名稱。

需要說明的是,一個(gè)語音數(shù)據(jù)中包含至少一個(gè)語音單元,如,語音數(shù)據(jù)“ā’sī’pǐ’lín’de’gōng’xiào(阿司匹林的功效)”??梢园ā皑 痵ī’pǐ’lín’de’gōng’xiào”這一個(gè)語音單元;也可以包括“ā’sī’pǐ’lín”“de”“gōng’xiào”這三個(gè)語音單元。具體語音單元的劃分,可以由語音識(shí)別系統(tǒng)隨機(jī)劃分,也可以通過人工設(shè)定,在隨機(jī)劃分時(shí),不同的語音識(shí)別系統(tǒng)可能也會(huì)出現(xiàn)劃分出不同語音單元的情況。可以依據(jù)對(duì)語音數(shù)據(jù)的不同利用效果,進(jìn)行設(shè)定。比如,隨機(jī)劃分時(shí),兩個(gè)語音識(shí)別系統(tǒng)把“ā’sī’pǐ’lín’de’gōng’xiào”分別劃分為三個(gè)語音單元(“ā’sī’pǐ’lín”“de”“gōng’xiào”)和兩 個(gè)語音單元(“ā’sī’pǐ’lín”和“de’gōng’xiào”),目的在于得到藥物名稱的標(biāo)注數(shù)據(jù);也可以人工設(shè)定為一個(gè)語音數(shù)據(jù)即為一個(gè)語音單元,目的在于得到對(duì)于一個(gè)業(yè)務(wù)請(qǐng)求的標(biāo)注數(shù)據(jù)。

步驟12,確定文本信息包含的信息單元的置信度;

置信度表征了利用語音識(shí)別系統(tǒng)(后文簡(jiǎn)稱識(shí)別系統(tǒng))對(duì)語音單元進(jìn)行識(shí)別,得到的信息單元的可信程度。每個(gè)識(shí)別系統(tǒng)都有輸出置信度的能力,當(dāng)識(shí)別系統(tǒng)中有包含越多的標(biāo)注數(shù)據(jù)時(shí),識(shí)別出的結(jié)果就越可信。置信度通常以數(shù)值的形式表達(dá),在特定值域內(nèi),根據(jù)值域的兩端代表的意義,可以將最大值(或最小值)設(shè)定為理想值,輸出的置信度越接近理想值,表明識(shí)別結(jié)果越準(zhǔn)確。識(shí)別系統(tǒng)對(duì)于置信度的計(jì)算是一種現(xiàn)有技術(shù),可以近似認(rèn)為計(jì)算結(jié)果能夠準(zhǔn)確的表征識(shí)別結(jié)果,具體算法不在本專利申請(qǐng)中描述。比如,某一識(shí)別系統(tǒng)具備豐富的識(shí)別地名的能力,即其聲學(xué)模型中包含大量對(duì)于地名的標(biāo)注數(shù)據(jù),當(dāng)該識(shí)別系統(tǒng)接收到語音數(shù)據(jù)“cháng’ān’jiē”時(shí),可以識(shí)別出“長(zhǎng)安街”這個(gè)文本信息,計(jì)算出的置信度為0.1,由于其置信度值域?yàn)閇0,1],且識(shí)別系統(tǒng)對(duì)于小于0.15置信度的識(shí)別結(jié)果有95%的把握是正確的,那么0.1的表示識(shí)別結(jié)果是可用的。

針對(duì)步驟12而言,可以利用語音識(shí)別系統(tǒng),也可以利用特定的系統(tǒng)計(jì)算出文本信息包含的信息單元的置信度,。比如,利用語音識(shí)別系統(tǒng)A(后文簡(jiǎn)稱A)和語音識(shí)別系統(tǒng)B(后文簡(jiǎn)稱B)分別對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,分別得到語音數(shù)據(jù)對(duì)應(yīng)的文本信息后,可以再分別計(jì)算文本信息中包含的信息單元對(duì)于語音數(shù)據(jù)中包含的語音單元的置信度。再如,利用A和B分別對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,分別得到語音數(shù)據(jù)對(duì)應(yīng)的文本信息后,可以再由其它特定系統(tǒng),分別計(jì)算文本信息中包含的信息單元對(duì)于語音數(shù)據(jù)中包含的語音單元的置信度。

步驟13,根據(jù)置信度,選取滿足置信條件的信息單元。

在一種實(shí)施方式中,當(dāng)利用一個(gè)語音識(shí)別系統(tǒng),對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,得到語音數(shù)據(jù)對(duì)應(yīng)的文本信息時(shí),且當(dāng)信息單元的可信程度與置信度正相關(guān)時(shí), 根據(jù)置信度,選取滿足置信條件的信息單元,可以包括:根據(jù)置信度,選取置信度大于預(yù)設(shè)的置信度第一閾值的信息單元。比如,一個(gè)語音識(shí)別系統(tǒng)計(jì)算出的置信度的值域?yàn)閇0,1],設(shè)定置信度第一閾值為0.85,選取置信度大于0.85的信息單元。

在一種實(shí)施方式中,當(dāng)信息單元的可信程度與置信度負(fù)相關(guān)時(shí),根據(jù)置信度,選取滿足置信條件的信息單元,可以包括:根據(jù)置信度,選取置信度小于預(yù)設(shè)的置信度第二閾值的信息單元。比如,一個(gè)語音識(shí)別系統(tǒng)計(jì)算出的置信度的值域?yàn)閇0,1],設(shè)定置信度第二閾值為0.25,選取置信度小于0.25的信息單元。

當(dāng)利用一個(gè)語音識(shí)別系統(tǒng)對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,并且利用該語音識(shí)別系統(tǒng)計(jì)算信息單元的置信度時(shí),計(jì)算出的置信度表征的準(zhǔn)確性可以利用同一置信度閾值進(jìn)行篩選。但當(dāng)利用至少兩個(gè)語音識(shí)別系統(tǒng)對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,并且利用該至少兩個(gè)語音識(shí)別系統(tǒng)分別計(jì)算信息單元的置信度時(shí),會(huì)出現(xiàn)標(biāo)準(zhǔn)不一致的情況,對(duì)篩選造成不便,比如,A計(jì)算出的置信度值域?yàn)閇0,1],越接近0準(zhǔn)確性越高,B計(jì)算出的置信度值域?yàn)閇0,10],越接近10準(zhǔn)確性越高,由于標(biāo)準(zhǔn)不一致的情況,就會(huì)對(duì)篩選造成不便。

所以,在一種實(shí)施方式中,為了達(dá)到置信度標(biāo)準(zhǔn)化的效果,當(dāng)利用至少兩個(gè)語音識(shí)別系統(tǒng),分別對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,得到語音數(shù)據(jù)對(duì)應(yīng)的文本信息時(shí),且當(dāng)信息單元的可信程度與歸一化置信度正相關(guān)時(shí),根據(jù)置信度,選取滿足置信條件的信息單元,可以包括:將文本信息包含的信息單元的置信度做歸一化處理,得到信息單元的歸一化置信度;根據(jù)歸一化置信度,選取滿足歸一化置信條件的信息單元。比如,把A和B的值域歸一化到[0,100]的區(qū)間內(nèi),越接近100準(zhǔn)確性越高;或把A和B的值域歸一化到[0,5]的區(qū)間內(nèi),越接近0準(zhǔn)確性越高,所以,可以根據(jù)歸一化置信度,選取滿足歸一化置信條件的信息單元。

具體地,根據(jù)歸一化置信度,選取大于預(yù)設(shè)的歸一化置信度第一閾值的信息單元。比如,將A和B兩個(gè)語音識(shí)別系統(tǒng)計(jì)算出的置信度值域歸一化到[0,100]的區(qū)間內(nèi),選取大于歸一化置信度第一閾值95的信息單元。

當(dāng)信息單元的可信程度與歸一化置信度負(fù)相關(guān)時(shí),根據(jù)歸一化置信度,選取小于預(yù)設(shè)的歸一化置信度第二閾值的信息單元。比如,將A和B兩個(gè)語音識(shí)別系統(tǒng)計(jì)算出的置信度值域歸一化到[0,10]的區(qū)間內(nèi),選取小于歸一化置信度第二閾值2的信息單元。

在實(shí)際應(yīng)用中,當(dāng)利用至少兩個(gè)語音識(shí)別系統(tǒng),分別對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,分別得到語音數(shù)據(jù)對(duì)應(yīng)的文本信息時(shí),可能會(huì)出現(xiàn)文本信息包含信息單元有相同的情況。比如,A和B,對(duì)語音數(shù)據(jù)“ā’sī’pǐ’lín’de’gōng’xiào”中對(duì)語音單元“ā’sī’pǐ’lín”的識(shí)別結(jié)果分別都是“阿司匹林”這樣的信息單元,且在[0,10]的區(qū)間內(nèi),歸一化后置信度分別是1.1和1.3,設(shè)定歸一化置信度第二閾值為2,則可以認(rèn)為A和B分別識(shí)別得到的信息單元“阿司匹林”都是準(zhǔn)確的。

所以,在一種實(shí)施方式中,根據(jù)歸一化置信度,選取滿足歸一化置信條件的信息單元,可以包括:從滿足歸一化置信條件的信息單元中,選取信息單元;其中,選取的信息單元滿足:由除該選取的信息單元外的其他滿足歸一化置信條件的信息單元構(gòu)成的集合中,存在與該選取的信息單元的內(nèi)容相同的至少一個(gè)信息單元,且所述至少一個(gè)信息單元與該選取的信息單元均對(duì)應(yīng)語音數(shù)據(jù)中包含的同一語音單元。比如,依然以上文為例,兩個(gè)信息單元“阿司匹林”構(gòu)成了滿足歸一化置信條件的信息單元集合,該集合中,存在兩個(gè)內(nèi)容相同的信息單元,且均對(duì)應(yīng)語音數(shù)據(jù)中包含的同一語音單元“ā’sī’pǐ’lín”。所以,從兩個(gè)信息單元“阿司匹林”中選取其中一個(gè)信息單元即可。

在實(shí)際應(yīng)用中,為了在各個(gè)領(lǐng)域都能提供高質(zhì)量的服務(wù),可以利用其它的識(shí)別系統(tǒng)來擴(kuò)充本地識(shí)別系統(tǒng)的聲學(xué)模型,所以,在一種實(shí)施方式中,為了完善本地識(shí)別系統(tǒng)的聲學(xué)模型,方法還包括:將選取的信息單元確定為語音數(shù)據(jù)包含的語音單元對(duì)應(yīng)的標(biāo)注數(shù)據(jù)。比如,想要完善本地的識(shí)別系統(tǒng)對(duì)于醫(yī)藥名稱的識(shí)別能力,可以先利用具備醫(yī)學(xué)專業(yè)術(shù)語識(shí)別能力的語音識(shí)別系統(tǒng),得到選取的信息單元,再把選取的信息單元,確定為語音數(shù)據(jù)包含的語音單元對(duì)應(yīng) 的標(biāo)注數(shù)據(jù),將語音單元和對(duì)應(yīng)的標(biāo)注數(shù)據(jù)補(bǔ)充到本地聲學(xué)模型中,以便提升本地識(shí)別系統(tǒng)對(duì)于醫(yī)藥專業(yè)術(shù)語的識(shí)別能力,從而在該領(lǐng)域提供更好的服務(wù)。

采用實(shí)施例1提供的該方法,由于可以利用語音識(shí)別系統(tǒng)來對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,再對(duì)識(shí)別結(jié)果進(jìn)行篩選,所以可以代替人工對(duì)語音數(shù)據(jù)進(jìn)行轉(zhuǎn)錄并挑選的工作,解決了目前依賴于人力勞動(dòng)導(dǎo)致的效率低的問題。

需要說明的是,實(shí)施例1所提供方法的各步驟的執(zhí)行主體均可以是同一設(shè)備,或者,該方法的各步驟也可以由不同設(shè)備作為執(zhí)行主體。比如,步驟11和步驟12的執(zhí)行主體可以為設(shè)備1,步驟13的執(zhí)行主體可以為設(shè)備2;又比如,步驟11的執(zhí)行主體可以為設(shè)備1,步驟12和步驟13的執(zhí)行主體可以為設(shè)備2;等等。

實(shí)施例2

基于相同的發(fā)明構(gòu)思,實(shí)施例2提供了一種語音識(shí)別結(jié)果的篩選裝置,用于提高篩選語音識(shí)別結(jié)果的效率。如圖2所示,該語音識(shí)別結(jié)果的篩選裝置包括:

識(shí)別單元21,可以用于利用語音識(shí)別系統(tǒng)對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,得到語音數(shù)據(jù)對(duì)應(yīng)的文本信息;

計(jì)算單元22,可以用于確定文本信息包含的信息單元的置信度;

選取單元23,可以用于根據(jù)置信度,選取滿足置信條件的信息單元。

在一種實(shí)施方式中,該裝置還包括:

確定單元24,可以用于將選取的信息單元確定為語音數(shù)據(jù)包含的語音單元對(duì)應(yīng)的標(biāo)注數(shù)據(jù)。

在一種實(shí)施方式中,識(shí)別裝置21,可以用于:

利用一個(gè)語音識(shí)別系統(tǒng),對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,得到語音數(shù)據(jù)對(duì)應(yīng)的文本信息。

在一種實(shí)施方式中,選取裝置23,可以用于:

當(dāng)信息單元的可信程度與置信度正相關(guān)時(shí),根據(jù)置信度,選取置信度大于預(yù)設(shè)的置信度第一閾值的信息單元。

在一種實(shí)施方式中,選取裝置23,可以用于:

當(dāng)信息單元的可信程度與置信度負(fù)相關(guān)時(shí),根據(jù)置信度,選取置信度小于預(yù)設(shè)的置信度第二閾值的信息單元。

在一種實(shí)施方式中,識(shí)別裝置21,可以用于:

利用至少兩個(gè)語音識(shí)別系統(tǒng),分別對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,得到語音數(shù)據(jù)對(duì)應(yīng)的文本信息。

在一種實(shí)施方式中,選取裝置23,可以用于:

將文本信息包含的信息單元的置信度做歸一化處理,得到信息單元的歸一化置信度;

根據(jù)歸一化置信度,選取滿足歸一化置信條件的信息單元。

在一種實(shí)施方式中,選取裝置23,可以用于:

當(dāng)信息單元的可信程度與歸一化置信度正相關(guān)時(shí),根據(jù)歸一化置信度,選取歸一化置信度大于預(yù)設(shè)的歸一化置信度第一閾值的信息單元。

在一種實(shí)施方式中,選取裝置23,可以用于:

當(dāng)信息單元的可信程度與歸一化置信度負(fù)相關(guān)時(shí),根據(jù)歸一化置信度,選取歸一化置信度小于預(yù)設(shè)的歸一化置信度第二閾值的信息單元。

在一種實(shí)施方式中,選取裝置23,可以用于:

從滿足歸一化置信條件的信息單元中,選取信息單元;其中,選取的信息單元滿足:由除該選取的信息單元外的其他滿足歸一化置信條件的信息單元構(gòu)成的集合中,存在與該選取的信息單元的內(nèi)容相同的至少一個(gè)信息單元,且所述至少一個(gè)信息單元與該選取的信息單元均對(duì)應(yīng)語音數(shù)據(jù)中包含的同一語音單元。

采用實(shí)施例2提供的該裝置,由于可以利用語音識(shí)別系統(tǒng)來對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,再對(duì)識(shí)別結(jié)果進(jìn)行篩選,所以可以代替人工對(duì)語音數(shù)據(jù)進(jìn)行轉(zhuǎn)錄并挑 選的工作,解決了目前依賴于人力勞動(dòng)導(dǎo)致的效率低的問題。

實(shí)施例3

基于相同的發(fā)明構(gòu)思,實(shí)施例3提供了一種補(bǔ)充本地聲學(xué)模型標(biāo)注數(shù)據(jù)的方法,用于補(bǔ)充北京地區(qū)的住宅小區(qū)的標(biāo)注數(shù)據(jù),為導(dǎo)航軟件提供更好的識(shí)別用戶目的地的服務(wù)。該方法的示意圖如圖3所示,包括下述步驟:

步驟31,獲取導(dǎo)航軟件客戶端的語音數(shù)據(jù)。

例如,“yīng’tè’gōng’yù”、“dōng’fēng’jiā’yuán”。

步驟32,利用具備識(shí)別地名地物類別能力的語音識(shí)別系統(tǒng),對(duì)獲取到的語音數(shù)據(jù)分別進(jìn)行識(shí)別、得到文本信息。

例如,得到文本信息:“英特公寓”、“東風(fēng)家園”。

步驟33,利用該語音識(shí)別系統(tǒng),計(jì)算出文本信息的置信度,該語音識(shí)別系統(tǒng)對(duì)于置信度的說明為:文本信息的可信程度與置信度正相關(guān)時(shí),值域?yàn)閇0,1],置信度閾值為0.9,大于0.9為準(zhǔn)確范圍。

例如,“英特公寓”的置信度為0.91、“東風(fēng)家園”的置信度為0.96。

步驟34,選取“英特公寓”、“東風(fēng)家園”這兩個(gè)信息單元,并將這兩個(gè)信息單元確定為“yīng’tè’gōng’yù”、“dōng’fēng’jiā’yuán”的標(biāo)注數(shù)據(jù)。

步驟35,將語音數(shù)據(jù)“yīng’tè’gōng’yù”、“dōng’fēng’jiā’yuán”和語音數(shù)據(jù)對(duì)應(yīng)的標(biāo)注數(shù)據(jù)“英特公寓”、“東風(fēng)家園”補(bǔ)充到本地的聲學(xué)模型中。

采用實(shí)施例3提供的補(bǔ)充本地聲學(xué)模型標(biāo)注數(shù)據(jù)的方法,可以將獲取到的語音數(shù)據(jù),利用具備特定專業(yè)領(lǐng)域識(shí)別能力的語音識(shí)別系統(tǒng),補(bǔ)充本地的語音識(shí)別系統(tǒng)的聲學(xué)模型,提升特定專業(yè)領(lǐng)域的服務(wù)品質(zhì)。

本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本申請(qǐng)的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此,本申請(qǐng)可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié) 合軟件和硬件方面的實(shí)施例的形式。而且,本申請(qǐng)可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器、CD-ROM、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。

本申請(qǐng)是參照根據(jù)本申請(qǐng)實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。

這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。

這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。

在一個(gè)典型的配置中,計(jì)算設(shè)備包括一個(gè)或多個(gè)處理器(CPU)、輸入/輸出接口、網(wǎng)絡(luò)接口和內(nèi)存。

內(nèi)存可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲(chǔ)器,隨機(jī)存取存儲(chǔ)器(RAM)和/或非易失性內(nèi)存等形式,如只讀存儲(chǔ)器(ROM)或閃存(flash RAM)。內(nèi)存是計(jì)算機(jī)可讀介質(zhì)的示例。

計(jì)算機(jī)可讀介質(zhì)包括永久性和非永久性、可移動(dòng)和非可移動(dòng)媒體可以由任何方法或技術(shù)來實(shí)現(xiàn)信息存儲(chǔ)。信息可以是計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模塊或其他數(shù)據(jù)。計(jì)算機(jī)的存儲(chǔ)介質(zhì)的例子包括,但不限于相變內(nèi)存 (PRAM)、靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM)、動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DRAM)、其他類型的隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、電可擦除可編程只讀存儲(chǔ)器(EEPROM)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤只讀存儲(chǔ)器(CD-ROM)、數(shù)字多功能光盤(DVD)或其他光學(xué)存儲(chǔ)、磁盒式磁帶,磁帶磁磁盤存儲(chǔ)或其他磁性存儲(chǔ)設(shè)備或任何其他非傳輸介質(zhì),可用于存儲(chǔ)可以被計(jì)算設(shè)備訪問的信息。按照本文中的界定,計(jì)算機(jī)可讀介質(zhì)不包括暫存電腦可讀媒體(transitory media),如調(diào)制的數(shù)據(jù)信號(hào)和載波。

還需要說明的是,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、商品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、商品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個(gè)……”限定的要素,并不排除在包括要素的過程、方法、商品或者設(shè)備中還存在另外的相同要素。

本領(lǐng)域技術(shù)人員應(yīng)明白,本申請(qǐng)的實(shí)施例可提供為方法、系統(tǒng)或計(jì)算機(jī)程序產(chǎn)品。因此,本申請(qǐng)可采用完全硬件實(shí)施例、完全軟件實(shí)施例或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本申請(qǐng)可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器、CD-ROM、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。

以上僅為本申請(qǐng)的實(shí)施例而已,并不用于限制本申請(qǐng)。對(duì)于本領(lǐng)域技術(shù)人員來說,本申請(qǐng)可以有各種更改和變化。凡在本申請(qǐng)的精神和原理之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本申請(qǐng)的權(quán)利要求范圍之內(nèi)。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
青海省| 孟州市| 武平县| 汉川市| 桦甸市| 顺昌县| 武宁县| 鹿邑县| 和顺县| 隆昌县| 杨浦区| 高淳县| 咸宁市| 仪陇县| 金乡县| 丰都县| 庆安县| 晋城| 泰州市| 海口市| 金门县| 广灵县| 安龙县| 资源县| 龙江县| 宜宾县| 磐安县| 甘南县| 伊宁市| 常州市| 桑日县| 广平县| 潜山县| 大埔区| 金阳县| 大冶市| 竹北市| 泗水县| 中牟县| 莱州市| 荥阳市|