欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于語(yǔ)音和字幕同步的高精度識(shí)別方法及系統(tǒng)的制作方法

文檔序號(hào):6521623閱讀:254來源:國(guó)知局
基于語(yǔ)音和字幕同步的高精度識(shí)別方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種基于語(yǔ)音和字幕同步的高精度識(shí)別方法,包括步驟:S1、進(jìn)行自動(dòng)語(yǔ)音識(shí)別,獲取語(yǔ)音識(shí)別的前M條優(yōu)選識(shí)別路徑,以及每條優(yōu)選識(shí)別路徑對(duì)應(yīng)的識(shí)別結(jié)果;S2、進(jìn)行字幕識(shí)別,獲取字幕識(shí)別的前L條優(yōu)選識(shí)別路徑,以及每條優(yōu)選路徑對(duì)應(yīng)的識(shí)別結(jié)果;S3、將所述的語(yǔ)音識(shí)別的前M條優(yōu)選識(shí)別路徑和所述的字幕識(shí)別的前L條優(yōu)選識(shí)別路徑合并為候選序列集合;S4、對(duì)所述候選序列集合中的每個(gè)候選字集,根據(jù)投票得分規(guī)則選擇得分最高的字作為該節(jié)點(diǎn)對(duì)應(yīng)的字,得到融合的識(shí)別結(jié)果。本發(fā)明使用了融合兩種識(shí)別方法,利用兩種不同信號(hào)源的信息可以達(dá)到更高精度的識(shí)別結(jié)果,使用了字出現(xiàn)的頻率信息以及字的置信度信息,使得結(jié)果選擇更加可靠。
【專利說明】基于語(yǔ)音和字幕同步的高精度識(shí)別方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及模式識(shí)別【技術(shù)領(lǐng)域】,特別涉及一種基于語(yǔ)音和字幕同步的高精度識(shí)別方法及系統(tǒng)。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)和數(shù)字多媒體內(nèi)容的發(fā)展,數(shù)字視頻尤其是廣播電視視頻傳播迅速,如何對(duì)廣播電視視頻進(jìn)行快速有效的檢索具有重要的應(yīng)用價(jià)值。想達(dá)到對(duì)廣播電視視頻的內(nèi)容進(jìn)行檢索的需求,需要對(duì)廣播電視的內(nèi)容進(jìn)行識(shí)別,比如語(yǔ)音識(shí)別為文本,字幕識(shí)別文本,然后利用文本進(jìn)行檢索,這其中語(yǔ)音識(shí)別和字幕識(shí)別起到重要的作用。
[0003]然而單獨(dú)的語(yǔ)音識(shí)別方法受到方言、口語(yǔ)等因素的影響,目前無法達(dá)到高準(zhǔn)確率的水平;單獨(dú)的字幕識(shí)別方法受到復(fù)雜背景、多樣的字體形態(tài)的影響,目前也無法達(dá)到高準(zhǔn)確率的水平。由于語(yǔ)音識(shí)別的結(jié)果和字幕識(shí)別的結(jié)果來源于不同信源的信號(hào),因此這兩種識(shí)別方法得到的結(jié)果具有很好的互補(bǔ)性和差異性,很自然的可以將兩種識(shí)別方法的結(jié)果融合起來。目前文獻(xiàn)中幾乎沒有融合語(yǔ)音識(shí)別和字幕識(shí)別結(jié)果的識(shí)別方法。唯一檢索到的相關(guān)的一篇是〈〈Improved parcel sorting by combining automatic speech and characterrecognition)),該文章僅僅采用了簡(jiǎn)單的規(guī)則將兩種識(shí)別結(jié)果融合起來。

【發(fā)明內(nèi)容】
[0004](一)要解決的技術(shù)問題
[0005]本發(fā)明所要解決的技術(shù)問題是:如何提供一種基于語(yǔ)音和字幕同步的高精度識(shí)別方法,以提高同時(shí)具有語(yǔ)音和字幕的視頻的識(shí)別精度。
[0006](二)技術(shù)方案
[0007]為解決上述問題,本發(fā)明提供一種基于語(yǔ)音和字幕同步的高精度識(shí)別方法,包括步驟:S1、進(jìn)行自動(dòng)語(yǔ)音識(shí)別,獲取語(yǔ)音識(shí)別的前M條優(yōu)選識(shí)別路徑,以及每條優(yōu)選識(shí)別路徑對(duì)應(yīng)的識(shí)別結(jié)果;其中,M取值1,2,…N;
[0008]S2、進(jìn)行字幕識(shí)別,獲取字幕識(shí)別的前L條優(yōu)選識(shí)別路徑,以及每條優(yōu)選路徑對(duì)應(yīng)的識(shí)別結(jié)果;其中,L取值1,2,…N;
[0009]S3、將所述的語(yǔ)音識(shí)別的前M條優(yōu)選識(shí)別路徑和所述的字幕識(shí)別的前L條優(yōu)選識(shí)別路徑合并為新的候選序列集合;
[0010]S4、對(duì)所述候選序列集合中的每個(gè)候選字集,根據(jù)投票得分規(guī)則選擇得分最高的字作為該節(jié)點(diǎn)對(duì)應(yīng)的字,得到融合的識(shí)別結(jié)果。
[0011 ] 優(yōu)選地,所述步驟S3具體包括:
[0012]S31、選擇任一條語(yǔ)音識(shí)別的優(yōu)選路徑或字幕識(shí)別的優(yōu)選路徑作為候選序列集合的初始路徑;
[0013]S32、根據(jù)最小編輯距離準(zhǔn)則,將其他優(yōu)選路徑中的一條優(yōu)選路徑與該候選序列集合中的初始路徑對(duì)齊,得到該條優(yōu)選路徑上的字與初始路徑上的字的對(duì)齊關(guān)系;[0014]S33、根據(jù)對(duì)齊關(guān)系和合并規(guī)則,將該條優(yōu)選路徑與候選序列集合中的初始路徑進(jìn)行合并,得到初始候選序列集合;
[0015]S34、將步驟S33中得到的初始候選序列集合作為下一次與其他優(yōu)選路徑進(jìn)行對(duì)齊的新的初始路徑,重復(fù)步驟S32和S33 ;
[0016]S35、直至將所有的優(yōu)選路徑與上一次的初始路徑合并后,形成候選序列集合。
[0017]優(yōu)選地,所述投票得分規(guī)則為:
[0018]Score (w) = α (N (w, i) /Ni) + (1- α ) C (w, i)
[0019]其中w表示一個(gè)獨(dú)立的字,N(w,i)表示w在候選序列集合的某個(gè)候選字集i上出現(xiàn)的次數(shù),Ni表示候選字集i上出現(xiàn)的所有字的次數(shù),C(w, i)表示w由所述的進(jìn)行自動(dòng)語(yǔ)音識(shí)別或字幕識(shí)別給出的w的平均置信度,α表示調(diào)整兩種權(quán)重的比例的參數(shù)。
[0020]優(yōu)選地,對(duì)其關(guān)系包括:刪除項(xiàng)、正確項(xiàng)、替換項(xiàng)和插入項(xiàng)。
[0021]本發(fā)明還提供一種基于語(yǔ)音和字幕同步的高精度識(shí)別系統(tǒng),包括:第一模塊,用于進(jìn)行自動(dòng)語(yǔ)音識(shí)別,獲取語(yǔ)音識(shí)別的前M條優(yōu)選識(shí)別路徑,以及每條優(yōu)選識(shí)別路徑對(duì)應(yīng)的識(shí)別結(jié)果;其中,M取值1,2,…N;
[0022]第二模塊,用于進(jìn)行字幕識(shí)別,獲取字幕識(shí)別的前L條優(yōu)選識(shí)別路徑,以及每條優(yōu)選路徑對(duì)應(yīng)的識(shí)別結(jié)果;其中,L取值1,2,…N;
[0023]第三模塊,用于將所述的語(yǔ)音識(shí)別的前M條優(yōu)選識(shí)別路徑和所述的字幕識(shí)別的前L條優(yōu)選識(shí)別路徑合并為新的候選序列集合;第四模塊,用于對(duì)所述候選序列集合中的每個(gè)候選字集,根據(jù)投票得分規(guī)則選擇得分最高的字作為該節(jié)點(diǎn)對(duì)應(yīng)的字,得到融合的識(shí)別結(jié)果。
[0024]優(yōu)選地,所述第三模塊包括:
[0025]第一子模塊,用于選擇任一條語(yǔ)音識(shí)別的優(yōu)選路徑或字幕識(shí)別的優(yōu)選路徑作為候選序列集合的初始路徑;
[0026]第二子模塊,用于根據(jù)最小編輯距離準(zhǔn)則,將其他優(yōu)選路徑中的一條優(yōu)選路徑與該候選序列集合中的初始路徑對(duì)齊,得到該條優(yōu)選路徑上的字與初始路徑上的字的對(duì)齊關(guān)系;
[0027]第三子模塊,用于根據(jù)對(duì)齊關(guān)系和合并規(guī)則,將該條優(yōu)選路徑與候選序列集合中的初始路徑進(jìn)行合并,得到初始候選序列集合;
[0028]第四子模塊,用于將第三子模塊得到的初始候選序列集合作為下一次與其他優(yōu)選路徑進(jìn)行對(duì)齊的新的初始路徑,重復(fù)第二子模塊和第三子模塊的動(dòng)作;
[0029]第五子模塊,用于直至將所有的優(yōu)選路徑與上一次的初始路徑合并后,形成候選序列集合。
[0030]優(yōu)選地,其中所述的投票得分規(guī)則為:
[0031 ] Score (w) = α (N (w, i) /Ni) + (1- α ) C (w, i)
[0032]其中w表示一個(gè)獨(dú)立的字,N(w,i)表示w在候選序列集合的某個(gè)候選字集i上出現(xiàn)的次數(shù),Ni表示候選字集i上出現(xiàn)的所有字的次數(shù),C(w, i)表示w由所述的進(jìn)行自動(dòng)語(yǔ)音識(shí)別或字幕識(shí)別給出的w的平均置信度,α表示調(diào)整兩種權(quán)重的比例的參數(shù)。
`[0033]優(yōu)選地,對(duì)齊關(guān)系包括:刪除項(xiàng)、正確項(xiàng)、替換項(xiàng)和插入項(xiàng)。
[0034](三)有益效果[0035]本發(fā)明實(shí)施例提供一種基于語(yǔ)音和字幕同步的高精度識(shí)別方法及系統(tǒng),從語(yǔ)音識(shí)別方法和字幕識(shí)別方法的結(jié)果入手,將兩種識(shí)別結(jié)果融合為候選序列集合,并從候選序列集合中的每個(gè)節(jié)點(diǎn)中選出最優(yōu)的結(jié)果。該方法使用了融合了兩種識(shí)別方法,利用了兩種不同信號(hào)源的信息可以達(dá)到更高精度的識(shí)別結(jié)果。在最優(yōu)結(jié)果選擇時(shí),同時(shí)使用了字出現(xiàn)的頻率信息以及字的置信度信息,使得結(jié)果選擇更加可靠。
【專利附圖】

【附圖說明】
[0036]圖1為依照本發(fā)明實(shí)施例的基于語(yǔ)音和字幕同步的高精度識(shí)別方法的流程示意圖;
[0037]圖2為依照本發(fā)明實(shí)施例的構(gòu)建候選序列集合的流程示意圖。
【具體實(shí)施方式】
[0038]下面結(jié)合附圖和實(shí)施例,對(duì)本發(fā)明的【具體實(shí)施方式】作進(jìn)一步詳細(xì)描述。以下實(shí)施例用于說明本發(fā)明,但不用來限制本發(fā)明的范圍。
[0039]圖1是根據(jù)本發(fā)明優(yōu)選實(shí)施例的基于語(yǔ)音和字幕同步的高精度識(shí)別方法,下面結(jié)合圖1詳細(xì)說明本發(fā)明的方法。對(duì)于任意一次新聞節(jié)目條目分割處理而言,都是基于執(zhí)行步驟S1-S3而完成。
[0040]步驟SI,利用自動(dòng)語(yǔ)音識(shí)別方法,得到語(yǔ)音識(shí)別的前M條優(yōu)選識(shí)別路徑,以及每條優(yōu)選識(shí)別路徑對(duì)應(yīng)的識(shí)別結(jié)果。其中,M取值為1,2,3…N?,F(xiàn)有的語(yǔ)音識(shí)別方法在識(shí)別時(shí)大都采用基于隱馬爾可夫模型的方法,通過對(duì)模型采用維特比解碼得到識(shí)別的路徑。通常情況下,取最優(yōu)的識(shí)別路徑即作為識(shí)別結(jié)果。而本實(shí)施例中選擇選取路徑得分最高的前M條優(yōu)選識(shí)別路徑,作為融合的最優(yōu)路徑。
[0041] 此外,系統(tǒng)還可輸出識(shí)別結(jié)果中每個(gè)字的識(shí)別置信度。
[0042]步驟S2,利用字幕識(shí)別方法,得到語(yǔ)音識(shí)別的前L條優(yōu)選識(shí)別路徑,以及每條優(yōu)選識(shí)別路徑對(duì)應(yīng)的識(shí)別結(jié)果。其中,L取值為1、2、3…N;現(xiàn)有的字幕識(shí)別方法在識(shí)別時(shí)也大都采用基于隱馬爾可夫模型的方法,通過對(duì)模型采用維特比解碼得到識(shí)別的路徑。通常情況下,取最優(yōu)的識(shí)別路徑即作為識(shí)別結(jié)果。本文選選取路徑得分最高的前N條優(yōu)選識(shí)別路徑,作為融合的最優(yōu)路徑。
[0043]此外,系統(tǒng)還可輸出識(shí)別結(jié)果中每個(gè)字的識(shí)別置信度。
[0044]本實(shí)施例中,M的取值可以與L的取值相同,也可以不同。
[0045]步驟S3,將所述的語(yǔ)音識(shí)別的前M條優(yōu)選識(shí)別路徑和所述的字幕識(shí)別的前L條優(yōu)選識(shí)別路徑合并為候選序列集合,其具體步驟如下:
[0046]步驟S31,選擇任一條語(yǔ)音識(shí)別的優(yōu)選路徑或字幕識(shí)別的優(yōu)選路徑作為候選序列集合的初始路徑。如圖2所示,共有三條優(yōu)選路徑Seql,Seq2和Seq3,我們選擇Seql作為候選序列集合的初始路徑Seq-base。
[0047]步驟S32,根據(jù)最小編輯距離準(zhǔn)則,將其他優(yōu)選路徑中的一條優(yōu)選路徑與該候選序列集合中的初始路徑對(duì)齊,得到該條優(yōu)選路徑上的字與初始路徑上的字的對(duì)齊關(guān)系。
[0048]如圖2所示,將Seq-base和Seq2根據(jù)最小編輯距離準(zhǔn)則對(duì)齊,對(duì)比Seq-base和Seq2,其對(duì)齊關(guān)系是:a是刪除項(xiàng),b、d是正確項(xiàng),c和z是替換項(xiàng),e是插入項(xiàng)。[0049]步驟S33,根據(jù)對(duì)齊關(guān)系和合并規(guī)則,將該條優(yōu)選路徑與候選序列集合中的初始路徑進(jìn)行合并,得到初始候選序列集合。合并規(guī)則為:
[0050]正確項(xiàng),直接將該字加入到候選序列圖中相應(yīng)的弧中,如圖2中b和d所示。
[0051]替換項(xiàng),直接將替換的字加入到候選序列圖中相應(yīng)的弧中,如圖2中z所示。
[0052]刪除項(xiàng),在候選序列圖中加入一個(gè)空的字轉(zhuǎn)移弧,用符號(hào)“?”表示,如圖2所示,在Seq-base中a所對(duì)應(yīng)的的位置添加弧“?”。
[0053]插入項(xiàng),在候選序列圖中插入一個(gè)轉(zhuǎn)移項(xiàng),如圖2中e所在的位置所示。
[0054]步驟S34、將步驟S33中得到的初始候選序列集合作為下一次與其他優(yōu)選路徑進(jìn)行對(duì)齊的新的初始路徑,重復(fù)步驟S32和S33 ;
[0055]步驟S35、直至將所有的優(yōu)選路徑與上一次的初始路徑合并后,形成候選序列集

口 ο
[0056]步驟S4,對(duì)所述的候選序列集合中的每個(gè)候選字集,根據(jù)投票得分規(guī)則選擇得分最高的字作該為節(jié)點(diǎn)對(duì)應(yīng)的字,最終得到融合的識(shí)別結(jié)果。其中所述的投票得分規(guī)則為:
[0057]Score (w) = α (N (w, i) /Ni) + (1- α ) C (w, i) (I)
[0058]其中w表示一個(gè)獨(dú)立的字,N(w, i)表示w在候選序列集合的某個(gè)節(jié)點(diǎn)i上出現(xiàn)的次數(shù),Ni表示節(jié)點(diǎn)i上出現(xiàn)的所有字的次數(shù),C (w,i)表示w由所述的自動(dòng)語(yǔ)音識(shí)別方法或字幕識(shí)別方法給出的w的平均置信度,α是由實(shí)驗(yàn)確定的參數(shù),用來調(diào)整兩種權(quán)重的比例。在候選序列集合中空弧“?”的置信度用Conf (?)表示。α和Conf (?)是兩個(gè)參數(shù),由訓(xùn)練數(shù)據(jù)訓(xùn)練得到。其中,具體步驟為:
[0059]S41,將帶標(biāo)注的數(shù)據(jù)分成兩份,優(yōu)選的比例為1:1,其中一份作為訓(xùn)練數(shù)據(jù)集,另一份作為測(cè)試數(shù)據(jù)集。
[0060]S42,在訓(xùn)練數(shù)據(jù)集上調(diào)整α和Conf (?),優(yōu)選的采用格型搜索,使最終的字錯(cuò)誤率(Word Error Rate, WER)最小,得到最優(yōu)的α和Conf (?)的參數(shù)分別為opt ( α )和opt (Conf (?))。
[0061]S43,在測(cè)試數(shù)據(jù)集上將opt ( α )和opt (Conf (?))帶入公式(I)中,在每個(gè)候選字集上,根據(jù)公式(I)計(jì)算該候選字集上每個(gè)獨(dú)立不同的字的得分,選擇得分最大的字作為該候選字集的輸出的結(jié)果。
[0062]本發(fā)明的有益效果在于:從語(yǔ)音識(shí)別方法和字幕識(shí)別方法的結(jié)果入手,將兩種識(shí)別結(jié)果融合為候選序列集合,并從候選序列集合中的每個(gè)節(jié)點(diǎn)中選出最優(yōu)的結(jié)果。該方法使用了融合了兩種識(shí)別方法,利用了兩種不同信號(hào)源的信息可以達(dá)到更高精度的識(shí)別結(jié)果。在最優(yōu)結(jié)果選擇時(shí),同時(shí)使用了字出現(xiàn)的頻率信息以及字的置信度信息,使得結(jié)果選擇更加可靠。
[0063]通過結(jié)合附圖對(duì)本發(fā)明具體實(shí)施例的描述,本發(fā)明的其它方面及特征對(duì)本領(lǐng)域的技術(shù)人員而言是顯而易見的。
[0064]以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本【技術(shù)領(lǐng)域】的普通技術(shù)人員來說,在不脫離本發(fā)明技術(shù)原理的前提下,還可以做出若干改進(jìn)和替換,這些改進(jìn)和替換也應(yīng)視為本發(fā)明的保護(hù)范圍。
【權(quán)利要求】
1.一種基于語(yǔ)音和字幕同步的高精度識(shí)別方法,其特征在于,包括步驟: 51、進(jìn)行自動(dòng)語(yǔ)音識(shí)別,獲取語(yǔ)音識(shí)別的前M條優(yōu)選識(shí)別路徑,以及每條優(yōu)選識(shí)別路徑對(duì)應(yīng)的識(shí)別結(jié)果;其中,M取值1,2,…N; 52、進(jìn)行字幕識(shí)別,獲取字幕識(shí)別的前L條優(yōu)選識(shí)別路徑,以及每條優(yōu)選路徑對(duì)應(yīng)的識(shí)別結(jié)果;其中,L取值1,2,…N; 53、將所述的語(yǔ)音識(shí)別的前M條優(yōu)選識(shí)別路徑和所述的字幕識(shí)別的前L條優(yōu)選識(shí)別路徑合并為候選序列集合; 54、對(duì)所述候選序列集合中的每個(gè)候選字集,根據(jù)投票得分規(guī)則選擇得分最高的字作為該節(jié)點(diǎn)對(duì)應(yīng)的字,得到融合的識(shí)別結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其中所述步驟S3具體包括: 531、選擇任一條語(yǔ)音識(shí)別的優(yōu)選路徑或字幕識(shí)別的優(yōu)選路徑作為候選序列集合的初始路徑; 532、根據(jù)最小編輯距離準(zhǔn)則,將其他優(yōu)選路徑中的一條優(yōu)選路徑與該候選序列集合中的初始路徑對(duì)齊,得到該條優(yōu)選路徑上的字與初始路徑上的字的對(duì)齊關(guān)系; 533、根據(jù)對(duì)齊關(guān)系和合并規(guī)則,將該條優(yōu)選路徑與候選序列集合中的初始路徑進(jìn)行合并,得到初始候選序列集合; 534、將步驟S33中得到的初始候選序列集合作為下一次與其他優(yōu)選路徑進(jìn)行對(duì)齊的新的初始路徑,重復(fù)步驟S32和S33 ; 535、直至將所有的優(yōu)選`路徑與上一次的初始路徑合并后,形成候選序列集合。
3.根據(jù)權(quán)利要求1或2所述的方法,所述步驟S4中,所述投票得分規(guī)則為:
Score (w) = α (N (w, i) /Ni) + (1- α ) C (w, i) 其中w表示一個(gè)獨(dú)立的字,N(w,i)表示w在候選序列集合的某個(gè)候選字集i上出現(xiàn)的次數(shù),Ni表示候選字集i上出現(xiàn)的所有字的次數(shù),C(w, i)表示w由所述的進(jìn)行自動(dòng)語(yǔ)音識(shí)別或字幕識(shí)別給出的w的平均置信度,α表示調(diào)整兩種權(quán)重的比例的參數(shù)。
4.根據(jù)權(quán)利要求2所述的方法,所述對(duì)齊關(guān)系包括:刪除項(xiàng)、正確項(xiàng)、替換項(xiàng)和插入項(xiàng)。
5.一種基于語(yǔ)音和字幕同步的高精度識(shí)別系統(tǒng),其特征在于,包括: 第一模塊,用于進(jìn)行自動(dòng)語(yǔ)音識(shí)別,獲取語(yǔ)音識(shí)別的前M條優(yōu)選識(shí)別路徑,以及每條優(yōu)選識(shí)別路徑對(duì)應(yīng)的識(shí)別結(jié)果;其中,M取值1,2,…N; 第二模塊,用于進(jìn)行字幕識(shí)別,獲取字幕識(shí)別的前L條優(yōu)選識(shí)別路徑,以及每條優(yōu)選路徑對(duì)應(yīng)的識(shí)別結(jié)果;其中,L取值1,2,…N; 第三模塊,用于將所述的語(yǔ)音識(shí)別的前M條優(yōu)選識(shí)別路徑和所述的字幕識(shí)別的前L條優(yōu)選識(shí)別路徑合并為新的候選序列集合; 第四模塊,用于對(duì)所述候選序列集合中的每個(gè)候選字集,根據(jù)投票得分規(guī)則選擇得分最高的字作為該節(jié)點(diǎn)對(duì)應(yīng)的字,得到融合的識(shí)別結(jié)果。
6.根據(jù)權(quán)利要求5所述的系統(tǒng),其中,所述第三模塊包括: 第一子模塊,用于選擇任一條語(yǔ)音識(shí)別的優(yōu)選路徑或字幕識(shí)別的優(yōu)選路徑作為候選序列集合的初始路徑; 第二子模塊,用于根據(jù)最小編輯距離準(zhǔn)則,將其他優(yōu)選路徑中的一條優(yōu)選路徑與該候選序列集合中的初始路徑對(duì)齊,得到該條優(yōu)選路徑上的字與初始路徑上的字的對(duì)齊關(guān)系;第三子模塊,用于根據(jù)對(duì)齊關(guān)系和合并規(guī)則,將該條優(yōu)選路徑與候選序列集合中的初始路徑進(jìn)行合并,得到初始候選序列集合; 第四子模塊,用于將第三子模塊得到的初始候選序列集合作為下一次與其他優(yōu)選路徑進(jìn)行對(duì)齊的新的初始路徑,重復(fù)第二子模塊和第三子模塊的動(dòng)作; 第五子模塊,用于直至將所有的優(yōu)選路徑與上一次的初始路徑合并后,形成候選序列集合 O
7.根據(jù)權(quán)利要求5或6所述的系統(tǒng),其中所述的投票得分規(guī)則為:
Score (w) = α (N (w, i) /Ni) + (1- α ) C (w, i) 其中w表示一個(gè)獨(dú)立的字,N(w,i)表示w在候選序列集合的某個(gè)候選字集i上出現(xiàn)的次數(shù),Ni表示候選字集i上出現(xiàn)的所有字的次數(shù),C(w, i)表示w由所述的進(jìn)行自動(dòng)語(yǔ)音識(shí)別或字幕識(shí)別給出的w的平均置信度,α表示調(diào)整兩種權(quán)重的比例的參數(shù)。
8.根據(jù)權(quán)利要求6所述的方法,所述對(duì)齊關(guān)系包括:刪除項(xiàng)、正確項(xiàng)、替換項(xiàng)和插入項(xiàng)。
【文檔編號(hào)】G06F17/30GK103680499SQ201310632270
【公開日】2014年3月26日 申請(qǐng)日期:2013年11月29日 優(yōu)先權(quán)日:2013年11月29日
【發(fā)明者】陳見聳, 徐波 申請(qǐng)人:北京中科模識(shí)科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
读书| 奉新县| 八宿县| 上饶市| 仙游县| 云浮市| 阿拉善左旗| 开江县| 乌苏市| 桐城市| 商南县| 安达市| 衡山县| 汕头市| 砚山县| 平昌县| 远安县| 垦利县| 库伦旗| 会泽县| 商河县| 普陀区| 阿拉善盟| 吕梁市| 伊川县| 称多县| 西城区| 宁都县| 阳西县| 宜兴市| 铜陵市| 即墨市| 金寨县| 桦甸市| 民乐县| 威信县| 南京市| 抚州市| 高密市| 辽阳市| 融水|