1.一種語音識(shí)別結(jié)果的篩選方法,其特征在于,包括:
利用語音識(shí)別系統(tǒng)對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,得到語音數(shù)據(jù)對(duì)應(yīng)的文本信息;
確定文本信息包含的信息單元的置信度;
根據(jù)置信度,選取滿足置信條件的信息單元。
2.如權(quán)利要求1所述的方法,其特征在于,方法還包括:
將選取的信息單元確定為語音數(shù)據(jù)包含的語音單元對(duì)應(yīng)的標(biāo)注數(shù)據(jù)。
3.如權(quán)利要求2所述的方法,其特征在于,當(dāng)信息單元的可信程度與置信度正相關(guān)時(shí),根據(jù)置信度,選取滿足置信條件的信息單元,包括:
根據(jù)置信度,選取置信度大于預(yù)設(shè)的置信度第一閾值的信息單元。
4.如權(quán)利要求2所述的方法,其特征在于,當(dāng)信息單元的可信程度與置信度負(fù)相關(guān)時(shí),根據(jù)置信度,選取滿足置信條件的信息單元,包括:
根據(jù)置信度,選取置信度小于預(yù)設(shè)的置信度第二閾值的信息單元。
5.如權(quán)利要求1所述的方法,其特征在于,利用語音識(shí)別系統(tǒng)對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,得到語音數(shù)據(jù)對(duì)應(yīng)的文本信息,包括:
利用至少兩個(gè)語音識(shí)別系統(tǒng),分別對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,得到語音數(shù)據(jù)對(duì)應(yīng)的文本信息。
6.如權(quán)利要求5所述的方法,其特征在于,根據(jù)置信度,選取滿足置信條件的信息單元,包括:
將文本信息包含的信息單元的置信度做歸一化處理,得到信息單元的歸一化置信度;
根據(jù)歸一化置信度,選取滿足歸一化置信條件的信息單元。
7.如權(quán)利要求6所述的方法,其特征在于,當(dāng)信息單元的可信程度與歸一化置信度正相關(guān)時(shí),根據(jù)歸一化置信度,選取滿足歸一化置信條件的信息單元,包括:
根據(jù)歸一化置信度,選取歸一化置信度大于預(yù)設(shè)的歸一化置信度第一閾值 的信息單元。
8.如權(quán)利要求6所述的方法,其特征在于,當(dāng)信息單元的可信程度與歸一化置信度負(fù)相關(guān)時(shí),根據(jù)歸一化置信度,選取滿足歸一化置信條件的信息單元,包括:
根據(jù)歸一化置信度,選取歸一化置信度小于預(yù)設(shè)的歸一化置信度第二閾值的信息單元。
9.如權(quán)利要求6所述的方法,其特征在于,根據(jù)歸一化置信度,選取滿足歸一化置信條件的信息單元,包括:
根據(jù)歸一化置信度,從滿足歸一化置信條件的信息單元中,選取信息單元;其中,選取的信息單元滿足:由除該選取的信息單元外的其他滿足歸一化置信條件的信息單元構(gòu)成的集合中,存在與該選取的信息單元的內(nèi)容相同的至少一個(gè)信息單元,且所述至少一個(gè)信息單元與該選取的信息單元均對(duì)應(yīng)語音數(shù)據(jù)中包含的同一語音單元。
10.一種語音識(shí)別結(jié)果的篩選裝置,其特征在于,包括:
識(shí)別單元,用于利用語音識(shí)別系統(tǒng)對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,得到語音數(shù)據(jù)對(duì)應(yīng)的文本信息;
計(jì)算單元,用于確定文本信息包含的信息單元的置信度;
選取單元,用于根據(jù)置信度,選取滿足置信條件的信息單元。
11.如權(quán)利要求10所述的裝置,其特征在于,還包括:
確定單元,用于將選取的信息單元確定為語音數(shù)據(jù)包含的語音單元對(duì)應(yīng)的標(biāo)注數(shù)據(jù)。
12.如權(quán)利要求11所述的裝置,其特征在于,選取裝置,用于:
當(dāng)信息單元的可信程度與置信度正相關(guān)時(shí),根據(jù)置信度,選取置信度大于預(yù)設(shè)的置信度第一閾值的信息單元。
13.如權(quán)利要求11所述的裝置,其特征在于,選取裝置,用于:
當(dāng)信息單元的可信程度與置信度負(fù)相關(guān)時(shí),根據(jù)置信度,選取置信度小于 預(yù)設(shè)的置信度第二閾值的信息單元。
14.如權(quán)利要求11所述的裝置,其特征在于,識(shí)別裝置,用于:
利用至少兩個(gè)語音識(shí)別系統(tǒng),分別對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,得到語音數(shù)據(jù)對(duì)應(yīng)的文本信息。
15.如權(quán)利要求14所述的裝置,其特征在于,選取裝置,用于:
將文本信息包含的信息單元的置信度做歸一化處理,得到信息單元的歸一化置信度;
根據(jù)歸一化置信度,選取滿足歸一化置信條件的信息單元。
16.如權(quán)利要求15所述的裝置,其特征在于,選取裝置,用于:
當(dāng)信息單元的可信程度與歸一化置信度正相關(guān)時(shí),根據(jù)歸一化置信度,選取歸一化置信度大于預(yù)設(shè)的歸一化置信度第一閾值的信息單元。
17.如權(quán)利要求15所述的裝置,其特征在于,選取裝置,用于:
當(dāng)信息單元的可信程度與歸一化置信度負(fù)相關(guān)時(shí),根據(jù)歸一化置信度,選取歸一化置信度小于預(yù)設(shè)的歸一化置信度第二閾值的信息單元。
18.如權(quán)利要求15所述的裝置,其特征在于,選取裝置,用于:
根據(jù)歸一化置信度,從滿足歸一化置信條件的信息單元中,選取信息單元;其中,選取的信息單元滿足:由除該選取的信息單元外的其他滿足歸一化置信條件的信息單元構(gòu)成的集合中,存在與該選取的信息單元的內(nèi)容相同的至少一個(gè)信息單元,且所述至少一個(gè)信息單元與該選取的信息單元均對(duì)應(yīng)語音數(shù)據(jù)中包含的同一語音單元。