基于語(yǔ)音和字幕同步的高精度識(shí)別方法及系統(tǒng)的制作方法

文檔序號(hào)：6521623閱讀：254來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

基于語(yǔ)音和字幕同步的高精度識(shí)別方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種基于語(yǔ)音和字幕同步的高精度識(shí)別方法，包括步驟：S1、進(jìn)行自動(dòng)語(yǔ)音識(shí)別，獲取語(yǔ)音識(shí)別的前M條優(yōu)選識(shí)別路徑，以及每條優(yōu)選識(shí)別路徑對(duì)應(yīng)的識(shí)別結(jié)果；S2、進(jìn)行字幕識(shí)別，獲取字幕識(shí)別的前L條優(yōu)選識(shí)別路徑，以及每條優(yōu)選路徑對(duì)應(yīng)的識(shí)別結(jié)果；S3、將所述的語(yǔ)音識(shí)別的前M條優(yōu)選識(shí)別路徑和所述的字幕識(shí)別的前L條優(yōu)選識(shí)別路徑合并為候選序列集合；S4、對(duì)所述候選序列集合中的每個(gè)候選字集，根據(jù)投票得分規(guī)則選擇得分最高的字作為該節(jié)點(diǎn)對(duì)應(yīng)的字，得到融合的識(shí)別結(jié)果。本發(fā)明使用了融合兩種識(shí)別方法，利用兩種不同信號(hào)源的信息可以達(dá)到更高精度的識(shí)別結(jié)果，使用了字出現(xiàn)的頻率信息以及字的置信度信息，使得結(jié)果選擇更加可靠。
【專利說明】基于語(yǔ)音和字幕同步的高精度識(shí)別方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及模式識(shí)別【技術(shù)領(lǐng)域】，特別涉及一種基于語(yǔ)音和字幕同步的高精度識(shí)別方法及系統(tǒng)。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)和數(shù)字多媒體內(nèi)容的發(fā)展，數(shù)字視頻尤其是廣播電視視頻傳播迅速，如何對(duì)廣播電視視頻進(jìn)行快速有效的檢索具有重要的應(yīng)用價(jià)值。想達(dá)到對(duì)廣播電視視頻的內(nèi)容進(jìn)行檢索的需求，需要對(duì)廣播電視的內(nèi)容進(jìn)行識(shí)別，比如語(yǔ)音識(shí)別為文本，字幕識(shí)別文本，然后利用文本進(jìn)行檢索，這其中語(yǔ)音識(shí)別和字幕識(shí)別起到重要的作用。
[0003]然而單獨(dú)的語(yǔ)音識(shí)別方法受到方言、口語(yǔ)等因素的影響，目前無法達(dá)到高準(zhǔn)確率的水平；單獨(dú)的字幕識(shí)別方法受到復(fù)雜背景、多樣的字體形態(tài)的影響，目前也無法達(dá)到高準(zhǔn)確率的水平。由于語(yǔ)音識(shí)別的結(jié)果和字幕識(shí)別的結(jié)果來源于不同信源的信號(hào)，因此這兩種識(shí)別方法得到的結(jié)果具有很好的互補(bǔ)性和差異性，很自然的可以將兩種識(shí)別方法的結(jié)果融合起來。目前文獻(xiàn)中幾乎沒有融合語(yǔ)音識(shí)別和字幕識(shí)別結(jié)果的識(shí)別方法。唯一檢索到的相關(guān)的一篇是〈〈Improved parcel sorting by combining automatic speech and characterrecognition)),該文章僅僅采用了簡(jiǎn)單的規(guī)則將兩種識(shí)別結(jié)果融合起來。

【發(fā)明內(nèi)容】
[0004](一)要解決的技術(shù)問題
[0005]本發(fā)明所要解決的技術(shù)問題是:如何提供一種基于語(yǔ)音和字幕同步的高精度識(shí)別方法，以提高同時(shí)具有語(yǔ)音和字幕的視頻的識(shí)別精度。
[0006](二)技術(shù)方案
[0007]為解決上述問題，本發(fā)明提供一種基于語(yǔ)音和字幕同步的高精度識(shí)別方法，包括步驟:S1、進(jìn)行自動(dòng)語(yǔ)音識(shí)別，獲取語(yǔ)音識(shí)別的前M條優(yōu)選識(shí)別路徑，以及每條優(yōu)選識(shí)別路徑對(duì)應(yīng)的識(shí)別結(jié)果；其中，M取值1，2，…N;
[0008]S2、進(jìn)行字幕識(shí)別，獲取字幕識(shí)別的前L條優(yōu)選識(shí)別路徑，以及每條優(yōu)選路徑對(duì)應(yīng)的識(shí)別結(jié)果；其中，L取值1，2，…N;
[0009]S3、將所述的語(yǔ)音識(shí)別的前M條優(yōu)選識(shí)別路徑和所述的字幕識(shí)別的前L條優(yōu)選識(shí)別路徑合并為新的候選序列集合；
[0010]S4、對(duì)所述候選序列集合中的每個(gè)候選字集，根據(jù)投票得分規(guī)則選擇得分最高的字作為該節(jié)點(diǎn)對(duì)應(yīng)的字，得到融合的識(shí)別結(jié)果。
[0011 ] 優(yōu)選地,所述步驟S3具體包括:
[0012]S31、選擇任一條語(yǔ)音識(shí)別的優(yōu)選路徑或字幕識(shí)別的優(yōu)選路徑作為候選序列集合的初始路徑；
[0013]S32、根據(jù)最小編輯距離準(zhǔn)則，將其他優(yōu)選路徑中的一條優(yōu)選路徑與該候選序列集合中的初始路徑對(duì)齊，得到該條優(yōu)選路徑上的字與初始路徑上的字的對(duì)齊關(guān)系；[0014]S33、根據(jù)對(duì)齊關(guān)系和合并規(guī)則，將該條優(yōu)選路徑與候選序列集合中的初始路徑進(jìn)行合并，得到初始候選序列集合；
[0015]S34、將步驟S33中得到的初始候選序列集合作為下一次與其他優(yōu)選路徑進(jìn)行對(duì)齊的新的初始路徑，重復(fù)步驟S32和S33 ；
[0016]S35、直至將所有的優(yōu)選路徑與上一次的初始路徑合并后，形成候選序列集合。
[0017]優(yōu)選地，所述投票得分規(guī)則為:
[0018]Score (w) = α (N (w, i) /Ni) + (1- α ) C (w, i)
[0019]其中w表示一個(gè)獨(dú)立的字，N(w，i)表示w在候選序列集合的某個(gè)候選字集i上出現(xiàn)的次數(shù)，Ni表示候選字集i上出現(xiàn)的所有字的次數(shù)，C(w, i)表示w由所述的進(jìn)行自動(dòng)語(yǔ)音識(shí)別或字幕識(shí)別給出的w的平均置信度，α表示調(diào)整兩種權(quán)重的比例的參數(shù)。
[0020]優(yōu)選地，對(duì)其關(guān)系包括:刪除項(xiàng)、正確項(xiàng)、替換項(xiàng)和插入項(xiàng)。
[0021]本發(fā)明還提供一種基于語(yǔ)音和字幕同步的高精度識(shí)別系統(tǒng)，包括:第一模塊，用于進(jìn)行自動(dòng)語(yǔ)音識(shí)別，獲取語(yǔ)音識(shí)別的前M條優(yōu)選識(shí)別路徑，以及每條優(yōu)選識(shí)別路徑對(duì)應(yīng)的識(shí)別結(jié)果；其中，M取值1，2，…N;
[0022]第二模塊，用于進(jìn)行字幕識(shí)別，獲取字幕識(shí)別的前L條優(yōu)選識(shí)別路徑，以及每條優(yōu)選路徑對(duì)應(yīng)的識(shí)別結(jié)果；其中，L取值1，2，…N;
[0023]第三模塊，用于將所述的語(yǔ)音識(shí)別的前M條優(yōu)選識(shí)別路徑和所述的字幕識(shí)別的前L條優(yōu)選識(shí)別路徑合并為新的候選序列集合；第四模塊，用于對(duì)所述候選序列集合中的每個(gè)候選字集，根據(jù)投票得分規(guī)則選擇得分最高的字作為該節(jié)點(diǎn)對(duì)應(yīng)的字，得到融合的識(shí)別結(jié)果。
[0024]優(yōu)選地，所述第三模塊包括:
[0025]第一子模塊，用于選擇任一條語(yǔ)音識(shí)別的優(yōu)選路徑或字幕識(shí)別的優(yōu)選路徑作為候選序列集合的初始路徑；
[0026]第二子模塊，用于根據(jù)最小編輯距離準(zhǔn)則，將其他優(yōu)選路徑中的一條優(yōu)選路徑與該候選序列集合中的初始路徑對(duì)齊，得到該條優(yōu)選路徑上的字與初始路徑上的字的對(duì)齊關(guān)系;
[0027]第三子模塊，用于根據(jù)對(duì)齊關(guān)系和合并規(guī)則，將該條優(yōu)選路徑與候選序列集合中的初始路徑進(jìn)行合并，得到初始候選序列集合；
[0028]第四子模塊，用于將第三子模塊得到的初始候選序列集合作為下一次與其他優(yōu)選路徑進(jìn)行對(duì)齊的新的初始路徑，重復(fù)第二子模塊和第三子模塊的動(dòng)作；
[0029]第五子模塊，用于直至將所有的優(yōu)選路徑與上一次的初始路徑合并后，形成候選序列集合。
[0030]優(yōu)選地，其中所述的投票得分規(guī)則為:
[0031 ] Score (w) = α (N (w, i) /Ni) + (1- α ) C (w, i)
[0032]其中w表示一個(gè)獨(dú)立的字，N(w，i)表示w在候選序列集合的某個(gè)候選字集i上出現(xiàn)的次數(shù)，Ni表示候選字集i上出現(xiàn)的所有字的次數(shù)，C(w, i)表示w由所述的進(jìn)行自動(dòng)語(yǔ)音識(shí)別或字幕識(shí)別給出的w的平均置信度，α表示調(diào)整兩種權(quán)重的比例的參數(shù)。
`[0033]優(yōu)選地，對(duì)齊關(guān)系包括:刪除項(xiàng)、正確項(xiàng)、替換項(xiàng)和插入項(xiàng)。
[0034](三)有益效果[0035]本發(fā)明實(shí)施例提供一種基于語(yǔ)音和字幕同步的高精度識(shí)別方法及系統(tǒng)，從語(yǔ)音識(shí)別方法和字幕識(shí)別方法的結(jié)果入手，將兩種識(shí)別結(jié)果融合為候選序列集合，并從候選序列集合中的每個(gè)節(jié)點(diǎn)中選出最優(yōu)的結(jié)果。該方法使用了融合了兩種識(shí)別方法，利用了兩種不同信號(hào)源的信息可以達(dá)到更高精度的識(shí)別結(jié)果。在最優(yōu)結(jié)果選擇時(shí)，同時(shí)使用了字出現(xiàn)的頻率信息以及字的置信度信息，使得結(jié)果選擇更加可靠。
【專利附圖】

【附圖說明】
[0036]圖1為依照本發(fā)明實(shí)施例的基于語(yǔ)音和字幕同步的高精度識(shí)別方法的流程示意圖；
[0037]圖2為依照本發(fā)明實(shí)施例的構(gòu)建候選序列集合的流程示意圖。
【具體實(shí)施方式】
[0038]下面結(jié)合附圖和實(shí)施例，對(duì)本發(fā)明的【具體實(shí)施方式】作進(jìn)一步詳細(xì)描述。以下實(shí)施例用于說明本發(fā)明，但不用來限制本發(fā)明的范圍。
[0039]圖1是根據(jù)本發(fā)明優(yōu)選實(shí)施例的基于語(yǔ)音和字幕同步的高精度識(shí)別方法，下面結(jié)合圖1詳細(xì)說明本發(fā)明的方法。對(duì)于任意一次新聞節(jié)目條目分割處理而言，都是基于執(zhí)行步驟S1-S3而完成。
[0040]步驟SI，利用自動(dòng)語(yǔ)音識(shí)別方法，得到語(yǔ)音識(shí)別的前M條優(yōu)選識(shí)別路徑，以及每條優(yōu)選識(shí)別路徑對(duì)應(yīng)的識(shí)別結(jié)果。其中，M取值為1，2，3…N?，F(xiàn)有的語(yǔ)音識(shí)別方法在識(shí)別時(shí)大都采用基于隱馬爾可夫模型的方法，通過對(duì)模型采用維特比解碼得到識(shí)別的路徑。通常情況下，取最優(yōu)的識(shí)別路徑即作為識(shí)別結(jié)果。而本實(shí)施例中選擇選取路徑得分最高的前M條優(yōu)選識(shí)別路徑，作為融合的最優(yōu)路徑。
[0041] 此外，系統(tǒng)還可輸出識(shí)別結(jié)果中每個(gè)字的識(shí)別置信度。
[0042]步驟S2，利用字幕識(shí)別方法，得到語(yǔ)音識(shí)別的前L條優(yōu)選識(shí)別路徑，以及每條優(yōu)選識(shí)別路徑對(duì)應(yīng)的識(shí)別結(jié)果。其中，L取值為1、2、3…N;現(xiàn)有的字幕識(shí)別方法在識(shí)別時(shí)也大都采用基于隱馬爾可夫模型的方法，通過對(duì)模型采用維特比解碼得到識(shí)別的路徑。通常情況下，取最優(yōu)的識(shí)別路徑即作為識(shí)別結(jié)果。本文選選取路徑得分最高的前N條優(yōu)選識(shí)別路徑，作為融合的最優(yōu)路徑。
[0043]此外，系統(tǒng)還可輸出識(shí)別結(jié)果中每個(gè)字的識(shí)別置信度。
[0044]本實(shí)施例中，M的取值可以與L的取值相同，也可以不同。
[0045]步驟S3，將所述的語(yǔ)音識(shí)別的前M條優(yōu)選識(shí)別路徑和所述的字幕識(shí)別的前L條優(yōu)選識(shí)別路徑合并為候選序列集合，其具體步驟如下:
[0046]步驟S31，選擇任一條語(yǔ)音識(shí)別的優(yōu)選路徑或字幕識(shí)別的優(yōu)選路徑作為候選序列集合的初始路徑。如圖2所示，共有三條優(yōu)選路徑Seql，Seq2和Seq3，我們選擇Seql作為候選序列集合的初始路徑Seq-base。
[0047]步驟S32，根據(jù)最小編輯距離準(zhǔn)則，將其他優(yōu)選路徑中的一條優(yōu)選路徑與該候選序列集合中的初始路徑對(duì)齊，得到該條優(yōu)選路徑上的字與初始路徑上的字的對(duì)齊關(guān)系。
[0048]如圖2所示,將Seq-base和Seq2根據(jù)最小編輯距離準(zhǔn)則對(duì)齊，對(duì)比Seq-base和Seq2,其對(duì)齊關(guān)系是:a是刪除項(xiàng)，b、d是正確項(xiàng)，c和z是替換項(xiàng)，e是插入項(xiàng)。[0049]步驟S33，根據(jù)對(duì)齊關(guān)系和合并規(guī)則，將該條優(yōu)選路徑與候選序列集合中的初始路徑進(jìn)行合并，得到初始候選序列集合。合并規(guī)則為:
[0050]正確項(xiàng)，直接將該字加入到候選序列圖中相應(yīng)的弧中，如圖2中b和d所示。
[0051]替換項(xiàng)，直接將替換的字加入到候選序列圖中相應(yīng)的弧中，如圖2中z所示。
[0052]刪除項(xiàng)，在候選序列圖中加入一個(gè)空的字轉(zhuǎn)移弧，用符號(hào)“?”表示，如圖2所示，在Seq-base中a所對(duì)應(yīng)的的位置添加弧“?”。
[0053]插入項(xiàng)，在候選序列圖中插入一個(gè)轉(zhuǎn)移項(xiàng)，如圖2中e所在的位置所示。
[0054]步驟S34、將步驟S33中得到的初始候選序列集合作為下一次與其他優(yōu)選路徑進(jìn)行對(duì)齊的新的初始路徑，重復(fù)步驟S32和S33 ；
[0055]步驟S35、直至將所有的優(yōu)選路徑與上一次的初始路徑合并后，形成候選序列集
八
口 ο
[0056]步驟S4，對(duì)所述的候選序列集合中的每個(gè)候選字集，根據(jù)投票得分規(guī)則選擇得分最高的字作該為節(jié)點(diǎn)對(duì)應(yīng)的字，最終得到融合的識(shí)別結(jié)果。其中所述的投票得分規(guī)則為:
[0057]Score (w) = α (N (w, i) /Ni) + (1- α ) C (w, i) (I)
[0058]其中w表示一個(gè)獨(dú)立的字,N(w, i)表示w在候選序列集合的某個(gè)節(jié)點(diǎn)i上出現(xiàn)的次數(shù)，Ni表示節(jié)點(diǎn)i上出現(xiàn)的所有字的次數(shù)，C (w，i)表示w由所述的自動(dòng)語(yǔ)音識(shí)別方法或字幕識(shí)別方法給出的w的平均置信度，α是由實(shí)驗(yàn)確定的參數(shù)，用來調(diào)整兩種權(quán)重的比例。在候選序列集合中空弧“?”的置信度用Conf (?)表示。α和Conf (?)是兩個(gè)參數(shù)，由訓(xùn)練數(shù)據(jù)訓(xùn)練得到。其中，具體步驟為:
[0059]S41，將帶標(biāo)注的數(shù)據(jù)分成兩份，優(yōu)選的比例為1:1，其中一份作為訓(xùn)練數(shù)據(jù)集，另一份作為測(cè)試數(shù)據(jù)集。
[0060]S42，在訓(xùn)練數(shù)據(jù)集上調(diào)整α和Conf (?)，優(yōu)選的采用格型搜索，使最終的字錯(cuò)誤率(Word Error Rate, WER)最小,得到最優(yōu)的α和Conf (?)的參數(shù)分別為opt ( α )和opt (Conf (?))。
[0061]S43,在測(cè)試數(shù)據(jù)集上將opt ( α )和opt (Conf (?))帶入公式(I)中，在每個(gè)候選字集上，根據(jù)公式(I)計(jì)算該候選字集上每個(gè)獨(dú)立不同的字的得分，選擇得分最大的字作為該候選字集的輸出的結(jié)果。
[0062]本發(fā)明的有益效果在于:從語(yǔ)音識(shí)別方法和字幕識(shí)別方法的結(jié)果入手，將兩種識(shí)別結(jié)果融合為候選序列集合，并從候選序列集合中的每個(gè)節(jié)點(diǎn)中選出最優(yōu)的結(jié)果。該方法使用了融合了兩種識(shí)別方法，利用了兩種不同信號(hào)源的信息可以達(dá)到更高精度的識(shí)別結(jié)果。在最優(yōu)結(jié)果選擇時(shí)，同時(shí)使用了字出現(xiàn)的頻率信息以及字的置信度信息，使得結(jié)果選擇更加可靠。
[0063]通過結(jié)合附圖對(duì)本發(fā)明具體實(shí)施例的描述，本發(fā)明的其它方面及特征對(duì)本領(lǐng)域的技術(shù)人員而言是顯而易見的。
[0064]以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式，應(yīng)當(dāng)指出，對(duì)于本【技術(shù)領(lǐng)域】的普通技術(shù)人員來說，在不脫離本發(fā)明技術(shù)原理的前提下，還可以做出若干改進(jìn)和替換，這些改進(jìn)和替換也應(yīng)視為本發(fā)明的保護(hù)范圍。
【權(quán)利要求】
1.一種基于語(yǔ)音和字幕同步的高精度識(shí)別方法，其特征在于，包括步驟: 51、進(jìn)行自動(dòng)語(yǔ)音識(shí)別，獲取語(yǔ)音識(shí)別的前M條優(yōu)選識(shí)別路徑，以及每條優(yōu)選識(shí)別路徑對(duì)應(yīng)的識(shí)別結(jié)果；其中，M取值1，2，…N; 52、進(jìn)行字幕識(shí)別，獲取字幕識(shí)別的前L條優(yōu)選識(shí)別路徑，以及每條優(yōu)選路徑對(duì)應(yīng)的識(shí)別結(jié)果；其中，L取值1，2，…N; 53、將所述的語(yǔ)音識(shí)別的前M條優(yōu)選識(shí)別路徑和所述的字幕識(shí)別的前L條優(yōu)選識(shí)別路徑合并為候選序列集合； 54、對(duì)所述候選序列集合中的每個(gè)候選字集，根據(jù)投票得分規(guī)則選擇得分最高的字作為該節(jié)點(diǎn)對(duì)應(yīng)的字，得到融合的識(shí)別結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法，其中所述步驟S3具體包括: 531、選擇任一條語(yǔ)音識(shí)別的優(yōu)選路徑或字幕識(shí)別的優(yōu)選路徑作為候選序列集合的初始路徑； 532、根據(jù)最小編輯距離準(zhǔn)則，將其他優(yōu)選路徑中的一條優(yōu)選路徑與該候選序列集合中的初始路徑對(duì)齊，得到該條優(yōu)選路徑上的字與初始路徑上的字的對(duì)齊關(guān)系； 533、根據(jù)對(duì)齊關(guān)系和合并規(guī)則，將該條優(yōu)選路徑與候選序列集合中的初始路徑進(jìn)行合并，得到初始候選序列集合； 534、將步驟S33中得到的初始候選序列集合作為下一次與其他優(yōu)選路徑進(jìn)行對(duì)齊的新的初始路徑，重復(fù)步驟S32和S33 ； 535、直至將所有的優(yōu)選`路徑與上一次的初始路徑合并后，形成候選序列集合。
3.根據(jù)權(quán)利要求1或2所述的方法，所述步驟S4中，所述投票得分規(guī)則為:
Score (w) = α (N (w, i) /Ni) + (1- α ) C (w, i) 其中w表示一個(gè)獨(dú)立的字，N(w，i)表示w在候選序列集合的某個(gè)候選字集i上出現(xiàn)的次數(shù)，Ni表示候選字集i上出現(xiàn)的所有字的次數(shù)，C(w, i)表示w由所述的進(jìn)行自動(dòng)語(yǔ)音識(shí)別或字幕識(shí)別給出的w的平均置信度，α表示調(diào)整兩種權(quán)重的比例的參數(shù)。
4.根據(jù)權(quán)利要求2所述的方法，所述對(duì)齊關(guān)系包括:刪除項(xiàng)、正確項(xiàng)、替換項(xiàng)和插入項(xiàng)。
5.一種基于語(yǔ)音和字幕同步的高精度識(shí)別系統(tǒng)，其特征在于，包括: 第一模塊，用于進(jìn)行自動(dòng)語(yǔ)音識(shí)別，獲取語(yǔ)音識(shí)別的前M條優(yōu)選識(shí)別路徑，以及每條優(yōu)選識(shí)別路徑對(duì)應(yīng)的識(shí)別結(jié)果；其中，M取值1，2，…N; 第二模塊，用于進(jìn)行字幕識(shí)別，獲取字幕識(shí)別的前L條優(yōu)選識(shí)別路徑，以及每條優(yōu)選路徑對(duì)應(yīng)的識(shí)別結(jié)果；其中，L取值1，2，…N; 第三模塊，用于將所述的語(yǔ)音識(shí)別的前M條優(yōu)選識(shí)別路徑和所述的字幕識(shí)別的前L條優(yōu)選識(shí)別路徑合并為新的候選序列集合；第四模塊，用于對(duì)所述候選序列集合中的每個(gè)候選字集，根據(jù)投票得分規(guī)則選擇得分最高的字作為該節(jié)點(diǎn)對(duì)應(yīng)的字，得到融合的識(shí)別結(jié)果。
6.根據(jù)權(quán)利要求5所述的系統(tǒng)，其中，所述第三模塊包括: 第一子模塊，用于選擇任一條語(yǔ)音識(shí)別的優(yōu)選路徑或字幕識(shí)別的優(yōu)選路徑作為候選序列集合的初始路徑；第二子模塊，用于根據(jù)最小編輯距離準(zhǔn)則，將其他優(yōu)選路徑中的一條優(yōu)選路徑與該候選序列集合中的初始路徑對(duì)齊，得到該條優(yōu)選路徑上的字與初始路徑上的字的對(duì)齊關(guān)系；第三子模塊，用于根據(jù)對(duì)齊關(guān)系和合并規(guī)則，將該條優(yōu)選路徑與候選序列集合中的初始路徑進(jìn)行合并，得到初始候選序列集合；第四子模塊，用于將第三子模塊得到的初始候選序列集合作為下一次與其他優(yōu)選路徑進(jìn)行對(duì)齊的新的初始路徑，重復(fù)第二子模塊和第三子模塊的動(dòng)作；第五子模塊，用于直至將所有的優(yōu)選路徑與上一次的初始路徑合并后，形成候選序列集合 O
7.根據(jù)權(quán)利要求5或6所述的系統(tǒng)，其中所述的投票得分規(guī)則為:
Score (w) = α (N (w, i) /Ni) + (1- α ) C (w, i) 其中w表示一個(gè)獨(dú)立的字，N(w，i)表示w在候選序列集合的某個(gè)候選字集i上出現(xiàn)的次數(shù)，Ni表示候選字集i上出現(xiàn)的所有字的次數(shù)，C(w, i)表示w由所述的進(jìn)行自動(dòng)語(yǔ)音識(shí)別或字幕識(shí)別給出的w的平均置信度，α表示調(diào)整兩種權(quán)重的比例的參數(shù)。
8.根據(jù)權(quán)利要求6所述的方法，所述對(duì)齊關(guān)系包括:刪除項(xiàng)、正確項(xiàng)、替換項(xiàng)和插入項(xiàng)。
【文檔編號(hào)】G06F17/30GK103680499SQ201310632270
【公開日】2014年3月26日申請(qǐng)日期:2013年11月29日優(yōu)先權(quán)日:2013年11月29日
【發(fā)明者】陳見聳, 徐波申請(qǐng)人:北京中科模識(shí)科技有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：陳見聳;徐波;
技術(shù)所有人：北京中科模識(shí)科技有限公司;
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

自動(dòng)識(shí)別語(yǔ)音生成字幕相關(guān)技術(shù)

視頻語(yǔ)音識(shí)別字幕軟件相關(guān)技術(shù)

語(yǔ)音識(shí)別字幕相關(guān)技術(shù)

語(yǔ)音識(shí)別字幕軟件相關(guān)技術(shù)

語(yǔ)音識(shí)別自動(dòng)字幕軟件相關(guān)技術(shù)

語(yǔ)音識(shí)別生成字幕相關(guān)技術(shù)

語(yǔ)音識(shí)別自動(dòng)添加字幕相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于語(yǔ)音和字幕同步的高精度識(shí)別方法及系統(tǒng)的制作方法