欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

語音識(shí)別后處理方法及系統(tǒng)的制作方法_3

文檔序號(hào):9490330閱讀:來源:國知局
時(shí)容易出錯(cuò)的詞 對(duì)時(shí),可以基于以下原則:
[0129] 如果分別使用識(shí)別詞向量與通用詞向量計(jì)算得到的兩詞之間的距離基本一致,則 語音識(shí)別得到的詞為正確的識(shí)別詞;如果分別使用識(shí)別詞向量與通用詞向量計(jì)算到的兩詞 之間的距離差別較大,即使用識(shí)別詞向量計(jì)算到的兩詞之間的距離較小,使用通用詞向量 計(jì)算到的兩詞之間的距離較大,并且聲學(xué)相似度較高時(shí),則該詞對(duì)為語音識(shí)別時(shí)容易出錯(cuò) 的詞對(duì)。
[0130] 因此,根據(jù)聲學(xué)相似度及通用語義相似度將每個(gè)聚類中的詞分為四類,分別落在 四個(gè)象限中。如圖4為每個(gè)聚類中詞與詞之間的關(guān)系象限圖。
[0131] 落在第一象限中的詞對(duì),兩詞之間的聲學(xué)相似度高,通用語義相似度低,即落在第 一象限內(nèi)的兩詞使用識(shí)別詞向量計(jì)算得到的兩詞之間的距離較近,而使用通用詞向量計(jì)算 的兩詞之間的距離較遠(yuǎn),二者差別較大,并且落在該象限內(nèi)的兩詞之間的聲學(xué)相似度較高, 則可以確定落在該象限內(nèi)的詞為語音識(shí)別容易出錯(cuò)的詞對(duì),如"美國-沒過","查詢-查 循"。
[0132] 落在第二象限中的詞對(duì),兩詞之間的聲學(xué)相似度高,通用語義相似度高,在語音識(shí) 別時(shí),不易出錯(cuò),該象限中的詞一般為比較相近的同義詞,如"網(wǎng)銀-網(wǎng)上銀行"。
[0133] 落在第三象限中的詞對(duì),兩詞之間的聲學(xué)相似度低,通用語義相似度高,語音識(shí)別 不易出錯(cuò),如"安徽-皖"。
[0134] 落在第四象限中的詞對(duì),兩詞之間的聲學(xué)相似度低,通用語義相似度低,語音識(shí)別 不易出錯(cuò)。
[0135] 由此可見,落在第二至第四象限內(nèi)的詞對(duì)在語音識(shí)別時(shí)不容易出錯(cuò),只有落在第 一象限內(nèi)的詞對(duì)在語音識(shí)別時(shí)容易出錯(cuò)。
[0136] 如圖5所示,是本發(fā)明實(shí)施例中利用錯(cuò)詞對(duì)集合構(gòu)建錯(cuò)詞檢測(cè)模型的流程圖,包 括以下步驟:
[0137] 步驟501,提取錯(cuò)詞對(duì)集合中每個(gè)錯(cuò)詞對(duì)的標(biāo)注信息。
[0138] 所述標(biāo)注信息用于表示所述錯(cuò)詞對(duì)中其中一個(gè)詞是否應(yīng)該識(shí)別為其中另一個(gè)詞, 如詞對(duì)"沒過-美國"表示"沒過"的正確識(shí)別詞為"美國",根據(jù)訓(xùn)練語音數(shù)據(jù)"我在美國辦 理的信用卡"的識(shí)別結(jié)果"我在沒過辦理的信用卡",可以確定當(dāng)前詞對(duì)中"沒過"應(yīng)該識(shí)別 為"美國",則當(dāng)前詞對(duì)為正確的詞對(duì),因此,詞對(duì)"美國-沒過"的標(biāo)注信息為:正確詞對(duì)。
[0139] 需要說明的是,當(dāng)一個(gè)詞對(duì)中的兩個(gè)詞都出現(xiàn)在訓(xùn)練語料中,并且相互識(shí)別成對(duì) 方,如詞對(duì)"美國-沒過",語料中的語音數(shù)據(jù)"我在美國辦理的信用卡"的識(shí)別結(jié)果為"我 在沒過辦理的信用卡",語料中的語音數(shù)據(jù)"我這次考試沒過"的識(shí)別結(jié)果為"我這次考試美 國",則可以將當(dāng)前詞對(duì)作為兩個(gè)正確詞對(duì),即詞對(duì)"美國-沒過"的標(biāo)注信息為:正確詞對(duì); 詞對(duì)"沒過-美國"的標(biāo)注信息為:正確詞對(duì)。所述標(biāo)注信息可以通過人工進(jìn)行標(biāo)注得到。
[0140] 步驟502,提取錯(cuò)詞對(duì)集合中識(shí)別錯(cuò)誤詞的語義特征。
[0141] 所述語義特征包括:錯(cuò)詞的上下文相關(guān)環(huán)境特征、錯(cuò)詞的識(shí)別詞向量、錯(cuò)詞的通用 詞向量。其中,所述上下文相關(guān)環(huán)境特征如當(dāng)前詞前一個(gè)詞的詞性、當(dāng)前詞在句中的位置、 當(dāng)前詞后一個(gè)詞的詞性等;所述識(shí)別詞向量和通用詞向量前面已有詳細(xì)說明,在此不再贅 述。需要說明的是,在進(jìn)行上述信息標(biāo)注時(shí)可以同時(shí)記錄識(shí)別錯(cuò)誤詞所在的識(shí)別文本,這 樣,從這些識(shí)別文本中即可方便地提取到錯(cuò)詞的上下文相關(guān)環(huán)境特征。
[0142] 步驟503,提取所述錯(cuò)詞集合中每個(gè)詞所對(duì)應(yīng)語音數(shù)據(jù)的聲學(xué)特征。
[0143] 所述聲學(xué)特征可以是基頻特征和/或頻譜特征,基頻特征如F0,頻譜特征如 MFCC(MelFrequencyCepstrumCoefficient)特征,所述聲學(xué)特征還可以是錯(cuò)詞對(duì)中每個(gè) 詞的拼音信息。
[0144] 步驟504,利用提取的錯(cuò)詞對(duì)的標(biāo)注信息、語義特征及聲學(xué)特征,構(gòu)建錯(cuò)詞檢測(cè)模 型。
[0145] 所述錯(cuò)詞檢測(cè)模型可以采用統(tǒng)計(jì)學(xué)中常用的分類模型,如支持向量機(jī)模型、神經(jīng) 網(wǎng)絡(luò)模型等。模型的輸入為當(dāng)前詞對(duì)的標(biāo)注信息、語義特征及聲學(xué)特征,其中標(biāo)注信息可以 作為錯(cuò)詞檢測(cè)模型的分類標(biāo)簽;模型的輸出為當(dāng)前詞對(duì)為正確詞對(duì)的概率。
[0146] 進(jìn)一步地,當(dāng)前詞對(duì)的語義特征還可以包括詞對(duì)中非識(shí)別結(jié)果中詞的識(shí)別語義向 量和通用語義向量,所述識(shí)別語義向量和通用語義向量在前面已有詳細(xì)說明,在此不再贅 述。
[0147] 可見,由于錯(cuò)詞檢測(cè)模型的構(gòu)建是通過預(yù)先收集大量語音數(shù)據(jù),并進(jìn)行語音識(shí)別, 根據(jù)識(shí)別文本發(fā)現(xiàn)語音識(shí)別容易出錯(cuò)的詞,得到錯(cuò)詞對(duì)集合,然后根據(jù)該錯(cuò)詞對(duì)集合中的 各詞對(duì)與語音識(shí)別相關(guān)的一些特征來構(gòu)建的,從而使后續(xù)對(duì)語音識(shí)別結(jié)果進(jìn)行后處理的過 程不依賴于由專家構(gòu)建的語義知識(shí)庫,有效地避免了語音識(shí)別后處理過程受人為因素的影 響,進(jìn)一步提高了處理效果。
[0148] 相應(yīng)地,本發(fā)明實(shí)施例還提供一種語音識(shí)別后處理系統(tǒng),如圖6所示,是該系統(tǒng)的 一種結(jié)構(gòu)不意圖。
[0149] 在該實(shí)施例中,所述系統(tǒng)包括:
[0150] 檢測(cè)模型構(gòu)建模塊600,用于預(yù)先利用語音識(shí)別容易出錯(cuò)的詞對(duì)構(gòu)建錯(cuò)詞檢測(cè)模 型;
[0151] 接收模塊601,用于接收待識(shí)別語音數(shù)據(jù);
[0152] 語音識(shí)別模塊602,用于對(duì)所述接收模塊601接收的語音數(shù)據(jù)進(jìn)行語音識(shí)別,得到 識(shí)別結(jié)果;
[0153] 特征提取模塊603,用于依次將所述識(shí)別結(jié)果中的各詞與通用詞典中的每個(gè)詞組 成詞對(duì),并提取詞對(duì)中所述識(shí)別結(jié)果中各詞的語義特征及聲學(xué)特征,以及詞典詞的聲學(xué)特 征,各特征的具體解釋可參照前面本發(fā)明方法實(shí)施例中的說明;
[0154] 修正模塊604,用于利用所述詞對(duì)的語義特征和聲學(xué)特征、以及所述錯(cuò)詞檢測(cè)模 型,依次檢測(cè)所述識(shí)別結(jié)果中的各詞,并且如果檢測(cè)得到的對(duì)應(yīng)當(dāng)前詞的詞對(duì)為正確詞對(duì) 的概率大于設(shè)定閾值,則將所述詞對(duì)中的詞典詞替換所述當(dāng)前詞;
[0155] 輸出模塊605,用于在所述修正模塊604對(duì)所述識(shí)別結(jié)果中的各詞檢測(cè)完成后,輸 出修正后的識(shí)別結(jié)果。
[0156] 上述語音識(shí)別模塊602具體可以采用現(xiàn)有的語音識(shí)別技術(shù)對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別, 對(duì)此本發(fā)明實(shí)施例不做限定。
[0157] 上述檢測(cè)模型構(gòu)建模塊600具體可以首先確定語音識(shí)別容易出錯(cuò)的詞對(duì),得到錯(cuò) 詞對(duì)集合,然后利用所述錯(cuò)詞對(duì)集合構(gòu)建錯(cuò)詞檢測(cè)模型。相應(yīng)地,檢測(cè)模型構(gòu)建模塊600的 一種具體結(jié)構(gòu)包括:錯(cuò)詞對(duì)集合生成模塊和模型構(gòu)建模塊,其中,所述錯(cuò)詞對(duì)集合生成模塊 用于通過聚類方式確定語音識(shí)別容易出錯(cuò)的詞對(duì),得到錯(cuò)詞對(duì)集合;所述模型構(gòu)建模塊用 于利用所述錯(cuò)詞對(duì)集合構(gòu)建錯(cuò)詞檢測(cè)模型。
[0158] 如圖7所示,是本發(fā)明實(shí)施例中錯(cuò)詞對(duì)集合生成模塊的一種結(jié)構(gòu)示意圖。
[0159] 所述錯(cuò)詞對(duì)集合生成模型包括以下各單元:
[0160] 訓(xùn)練數(shù)據(jù)獲取單元71,用于獲取訓(xùn)練語音數(shù)據(jù);
[0161] 識(shí)別文本獲取單元72,用于調(diào)用語音識(shí)別模塊對(duì)所述訓(xùn)練語音數(shù)據(jù)進(jìn)行語音識(shí) 另IJ,得到識(shí)別文本;
[0162] 通用文本獲取單元73,用于獲取包含所述識(shí)別文本中各詞的通用文本;
[0163] 詞向量訓(xùn)練單元74,用于利用所述識(shí)別文本訓(xùn)練得到所述識(shí)別文本中各詞的詞向 量,并將其作為所述詞的識(shí)別詞向量,并利用所述通用文本訓(xùn)練得到所述通用文本中各詞 的詞向量,并將其作為所述詞的通用詞向量;
[0164] 聚類單元75,用于對(duì)所述識(shí)別文本中各詞的識(shí)別詞向量進(jìn)行聚類,得到各詞的類 另IJ,比如,可以利用各詞的識(shí)別詞向量之間的距離進(jìn)行聚類,得到各識(shí)別詞向量的類別,該 類別即為所述識(shí)別詞向量對(duì)應(yīng)的詞的類別;
[0165] 通用語義相似度計(jì)算單元76,用于根據(jù)所述通用詞向量計(jì)算每個(gè)類別中兩個(gè)詞之 間的通用語義相似度;
[0166] 聲學(xué)相似度計(jì)算單元77,用于計(jì)算每個(gè)類別中兩個(gè)詞之間的聲學(xué)相似度;
[0167] 判斷單元78,用于判斷每個(gè)類別中兩個(gè)詞的通用語義相似度是否低于設(shè)定的第一 閾值,并且所述兩個(gè)詞的聲學(xué)相似度是否高于設(shè)定的第二閾值,如果是,則將所述兩個(gè)詞作 為錯(cuò)詞對(duì)加入到錯(cuò)詞對(duì)集合中。
[0168] 上述詞向量訓(xùn)練單元74對(duì)識(shí)別詞向量及通用詞向量的訓(xùn)練是相同的,只是用到 的訓(xùn)練文本是不同的。具體地,識(shí)別詞向量的訓(xùn)練過程如下:首先對(duì)所述識(shí)別文本包含的 詞進(jìn)行去重,即去除其中重復(fù)的詞,將去重后的各詞進(jìn)行向量初始化,得到各詞的初始詞向 量,然后利用神經(jīng)網(wǎng)絡(luò)對(duì)各詞的初始詞向量進(jìn)行訓(xùn)練,得到所述識(shí)別文本中各詞的詞向量。 通用詞向量的訓(xùn)練過程如下:首先對(duì)所述通用文本包含的詞進(jìn)行去重,即去除其中重復(fù)的 詞,將去重后的各詞進(jìn)行向量初始化,得到各詞的初始詞向量,然后利用神經(jīng)網(wǎng)絡(luò)對(duì)各詞的 初始詞向量進(jìn)行訓(xùn)練,得到所述通用文本中各詞的詞向量。
[0169] 上述通用語義相似度計(jì)算單元76具體可以計(jì)算每個(gè)類別中兩個(gè)詞的通用詞向量 之間的距離,并根據(jù)計(jì)算得到兩個(gè)詞的通用詞向量之間的距離確定所述兩個(gè)詞之間的通用 語義相似度,具體計(jì)算過程可參照前面本發(fā)明方法實(shí)施例中的描述。
[0170] 上述聲學(xué)相似度計(jì)算單元77具體可以計(jì)算每個(gè)類別中兩個(gè)詞的聲學(xué)距離,并根 據(jù)計(jì)算得到的兩個(gè)詞的聲學(xué)距離確定所述兩個(gè)詞之間的聲學(xué)相似度,具體計(jì)算過程可參照 前面本發(fā)明方法實(shí)施例中的描述。
[0171] 如圖8所示,是本發(fā)明實(shí)施例中模型構(gòu)建模塊的一種結(jié)構(gòu)示意圖。
[0172] 所述模型構(gòu)建模塊包括:
[0173] 標(biāo)注信息提取單元81,用于提取錯(cuò)詞對(duì)集合中每個(gè)錯(cuò)詞對(duì)的標(biāo)注信息,所述標(biāo)注 信息用于表示所述錯(cuò)詞對(duì)中其中一個(gè)詞是否應(yīng)該識(shí)別為其中另一個(gè)詞;
[0174] 語義特征提取單元82,用于提取錯(cuò)詞對(duì)集合中識(shí)別錯(cuò)誤詞的語義特征,所述語義 特征包括;錯(cuò)詞的上下文相關(guān)環(huán)境特征、錯(cuò)詞的識(shí)別詞向量、錯(cuò)詞的通用詞向量;
[0175] 聲學(xué)特征提取單元83,用于提取錯(cuò)詞對(duì)集合中每個(gè)詞所
當(dāng)前第3頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
阆中市| 松原市| 延吉市| 平乡县| 郴州市| 洛浦县| 灵川县| 稷山县| 河间市| 西乡县| 连山| 北碚区| 怀安县| 常宁市| 柳河县| 巴青县| 博白县| 安新县| 儋州市| 油尖旺区| 桐梓县| 郧西县| 满城县| 昆山市| 甘肃省| 常熟市| 垫江县| 同江市| 子洲县| 井研县| 香港| 深水埗区| 科技| 柞水县| 隆昌县| 金沙县| 黄山市| 淮滨县| 洞头县| 上栗县| 阿瓦提县|