本發(fā)明屬于機(jī)器學(xué)習(xí)中語(yǔ)音識(shí)別分離
技術(shù)領(lǐng)域:
,具體涉及一種基于唱段和念白提取的戲曲分類方法。
背景技術(shù):
:目前在相關(guān)技術(shù)中,對(duì)于唱段和念白的提取技術(shù),目前沒(méi)有人在該領(lǐng)域內(nèi)實(shí)現(xiàn)過(guò)對(duì)戲曲中唱段和念白的提取。在與之類似的語(yǔ)音樂(lè)音分離領(lǐng)域內(nèi),也尚處于正在發(fā)展階段,相關(guān)技術(shù)也不是特別的完善。目前的在語(yǔ)音樂(lè)音分離領(lǐng)域內(nèi)主要運(yùn)用的方法有正弦模型技術(shù),非負(fù)矩陣分解和稀疏編碼等方法。目前的語(yǔ)音分離技術(shù)的大多數(shù)算法的計(jì)算量都比較大,效率也不是很高,對(duì)語(yǔ)音信號(hào)的平穩(wěn)性可能適應(yīng)度也不夠。因此,目前的語(yǔ)音分離技術(shù)還需要很長(zhǎng)時(shí)間的發(fā)展。對(duì)于戲曲的分類技術(shù),在該領(lǐng)域的研究也屈指可數(shù)。更多的是對(duì)于樂(lè)音語(yǔ)音的分類研究,目前現(xiàn)有的研究技術(shù)是針對(duì)音色,音高,節(jié)奏等在不同的時(shí)域和頻域上對(duì)其進(jìn)行特征提取,然后進(jìn)行特征融合,最后運(yùn)用融合的特征來(lái)分類進(jìn)而得出最后的結(jié)果。戲曲分類也可以沿用這種技術(shù),但是目前的戲曲研究,都是對(duì)一首戲曲的整體進(jìn)行研究,數(shù)據(jù)量大且繁雜,特征提取的效率也不高。而唱段和念白是戲曲中兩個(gè)比較有特點(diǎn),有區(qū)分度的戲曲組成部分,目前沒(méi)有研究者注意這兩者。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的目的在于克服現(xiàn)有的語(yǔ)音識(shí)別方法的缺點(diǎn)和不足,將節(jié)段CDP算法應(yīng)用在戲曲的唱段和念白提取上,從而提供一種基于唱段和念白提取的戲曲分類方法,為當(dāng)前在戲曲片段提取領(lǐng)域開拓了一種全新的方法。本發(fā)明的技術(shù)方案是提供一種基于唱段和念白提取的戲曲分類方法,具體包括如下步驟:步驟(1):對(duì)聲學(xué)時(shí)域數(shù)據(jù)進(jìn)行特征提取,得到特征向量時(shí)間序列數(shù)據(jù);步驟(2):對(duì)上述步驟(1)得到的時(shí)間序列數(shù)據(jù)運(yùn)行節(jié)段CDP算法,得出相似段對(duì)的候選;步驟(3):從上述步驟(2)相似段對(duì)的候選中進(jìn)行選擇,得出相似段對(duì);步驟(4):在對(duì)上述步驟(3)得出的相似段進(jìn)行圖形化,描述出直方圖;步驟(5):得出唱段邊界,并進(jìn)行唱段和念白提取;步驟(6):將處理得到的唱段和念白作為傳統(tǒng)分類算法的輸入,得出最后的結(jié)果,并進(jìn)行準(zhǔn)確率和效率的分析。所述步驟(1)中的特征提取主要是在分類前對(duì)數(shù)據(jù)時(shí)間采樣值上進(jìn)行適當(dāng)?shù)臍w約,以達(dá)到減少數(shù)據(jù)量的同時(shí)提高分類準(zhǔn)確率;根據(jù)其特點(diǎn),特征提取的方法主要有:基于統(tǒng)計(jì)方法的特征提取、基于模型的特征提取、基于變換的特征提取和基于分型維數(shù)的特征提取。所述步驟(1)中的特征提取的方法是基于變換的特征提取。所述步驟(1)中的特征提取使用的是梅爾頻率倒譜系數(shù)MFCC作為特征向量,來(lái)對(duì)聲學(xué)數(shù)據(jù)進(jìn)行處理。所述步驟(2)中的節(jié)段CDP算法的具體步驟為:a、分割片斷;b、對(duì)于段內(nèi)的每一幀,求出與當(dāng)前時(shí)間橫軸點(diǎn)的距離;c、將距離進(jìn)行累加,選擇極小值距離;d、累加后的距離即為段與段之間的距離,根據(jù)閾值判斷是否為相似段對(duì)。所述步驟(3)具體為:節(jié)段CDP算法先前規(guī)定了一個(gè)閾值TH,如果某兩個(gè)段之間的最佳距離小于閾值TH,可以稱為這兩個(gè)段為一對(duì)相似段對(duì);這些得出的相似段對(duì)作為候選,然后進(jìn)一步的控制數(shù)量,縮小閾值,選出更為精確的相似段對(duì)。所述步驟(4)在繪制直方圖時(shí),以時(shí)間為橫軸,頻率為縱軸,在確定的一對(duì)相似段對(duì)之間畫橫線,然后對(duì)于橫軸上的每一個(gè)時(shí)間點(diǎn),可以得出經(jīng)過(guò)這個(gè)時(shí)間點(diǎn)的相似段對(duì)橫線的數(shù)目,從而得出縱軸的數(shù)值。所述步驟(5)具體步驟為:根據(jù)上述步驟(4)繪出的直方圖,在直方圖中相似的片段之間會(huì)形成峰值,這其中的每一個(gè)峰可以看作是戲曲的唱段部分,直方圖中的低平段可以看作是戲曲的念白部分,這樣就得到了戲曲中的唱段和念白。所述步驟(6)中的傳統(tǒng)分類算法是在時(shí)域和頻域上提取了19種基于變換的特征,并將其19種特征每一種單獨(dú)的用極限學(xué)習(xí)機(jī)分類器進(jìn)行分類得出結(jié)果后,選擇分類效果最好的6種進(jìn)行特征融合,將融合后的特征用極限學(xué)習(xí)機(jī)分類器進(jìn)行分類,最后進(jìn)行十步交叉驗(yàn)證得到最優(yōu)結(jié)果。所述步驟(6)具體為:將處理得到的唱段和念白作為傳統(tǒng)分類算法的輸入,最后得出戲曲分類的結(jié)果;然后對(duì)準(zhǔn)確率和效率進(jìn)行分析,把數(shù)據(jù)與傳統(tǒng)采用整首戲曲或片段進(jìn)行分類的算法結(jié)果進(jìn)行比較,分析得出是否有提高。本發(fā)明的有益效果:本發(fā)明開拓性的將節(jié)段CDP算法使用在對(duì)戲曲的唱段和念白的提取,避免人為的去處理大量的數(shù)據(jù),導(dǎo)致費(fèi)時(shí)費(fèi)力且效率很低;然后將傳統(tǒng)的戲曲分類的算法數(shù)據(jù)部分用上述方法進(jìn)行改進(jìn),從而達(dá)到提高傳統(tǒng)戲曲分類算法的準(zhǔn)確流程和效率。附圖說(shuō)明圖1為本發(fā)明的方法流程圖。圖2為節(jié)段CDP算法流程圖。具體實(shí)施方式下面通過(guò)具體實(shí)施例和附圖對(duì)本發(fā)明作進(jìn)一步的說(shuō)明。本發(fā)明的實(shí)施例是為了更好地使本領(lǐng)域的技術(shù)人員更好地理解本發(fā)明,并不對(duì)本發(fā)明作任何的限制。如圖1所示,本發(fā)明的方法具體包括如下步驟:步驟1、對(duì)聲學(xué)時(shí)域數(shù)據(jù)進(jìn)行特征提取,得到特征向量時(shí)間序列數(shù)據(jù)。特征提取主要是在分類前對(duì)數(shù)據(jù)時(shí)間采樣值上進(jìn)行適當(dāng)?shù)臍w約,以達(dá)到減少數(shù)據(jù)量的同時(shí)提高分類準(zhǔn)確率。本發(fā)明的特征提取的方法是基于變換的特征提取。本發(fā)明的特征提取使用的是梅爾頻率倒譜系數(shù)MFCC作為特征向量,來(lái)對(duì)聲學(xué)數(shù)據(jù)進(jìn)行處理。步驟2、對(duì)上述步驟1得到的時(shí)間序列數(shù)據(jù)運(yùn)行節(jié)段CDP算法,得出相似段對(duì)的候選,如圖2所示,節(jié)段CDP算法的主要流程步驟如下:a、分割片斷:我們需要將經(jīng)過(guò)特征提取后得到的時(shí)間序列數(shù)據(jù)劃分為若干片段,每個(gè)片段的長(zhǎng)度為NCDP,然后定義一個(gè)幀長(zhǎng)度τ,依據(jù)業(yè)內(nèi)經(jīng)驗(yàn)值為21ms。b、對(duì)于段內(nèi)的每一幀,求出與當(dāng)前時(shí)間橫軸點(diǎn)的距離:我們將劃分后的片段依次輸入程序,規(guī)定第一個(gè)片段開始輸入時(shí)時(shí)間為0,開始計(jì)時(shí)。對(duì)于輸入片段的每一幀,我們都計(jì)算該幀與從0開始到當(dāng)前的時(shí)間點(diǎn)之間以毫秒為單位的所有時(shí)間點(diǎn)之間的距離,因?yàn)檩斎霐?shù)據(jù)都是時(shí)間序列數(shù)據(jù),所以此時(shí)的距離即為歐氏距離,計(jì)算完1ms后更新起點(diǎn)。c、將距離進(jìn)行累加,選擇極小值距離:步驟a中有每個(gè)片段的長(zhǎng)度NCDP,所以從時(shí)間0開始到第一個(gè)NCDP為一個(gè)片段,另一個(gè)片段中的每一個(gè)時(shí)間點(diǎn)到達(dá)這個(gè)片段里每一個(gè)時(shí)間點(diǎn)的距離的累加,即為我們所求的段與段之間的距離。我們需要得到段與段之間的距離。具體:步驟a中有每個(gè)片段的長(zhǎng)度,所以從時(shí)間0開始到第一個(gè)NCDP為一個(gè)片段,另一個(gè)片段中的每一個(gè)時(shí)間點(diǎn)到達(dá)這個(gè)片段里每一個(gè)時(shí)間點(diǎn)的距離的累加,即為我們所求的段與段之間的距離。比如說(shuō),我們?cè)跁r(shí)間t這個(gè)點(diǎn),我們可以求出當(dāng)前時(shí)間t和一個(gè)段H內(nèi)每一個(gè)時(shí)間點(diǎn)的距離,這樣就有NCDP個(gè)距離,然后將這些距離累加即為時(shí)間t到這一個(gè)段H之間的距離,記為L(zhǎng),然后如果t為另一個(gè)段Q的起點(diǎn),則我們?cè)趖到t+NCDP這個(gè)時(shí)間段內(nèi)可以得到NCDP個(gè)距離L,將這些距離再次累加,即為段H與段Q之間的距離。d、累加后的距離即為段與段之間的距離,根據(jù)閾值判斷是否為相似段對(duì):如果這個(gè)距離小于閾值TH,則我們認(rèn)為這兩個(gè)段之間是相似段對(duì)。步驟3、從上述步驟2相似段對(duì)的候選中進(jìn)行選擇,得出相似段對(duì)。在步驟1和2的基礎(chǔ)上得到段與段之間的最佳距離進(jìn)行進(jìn)一步處理,具體為:節(jié)段CDP算法先前規(guī)定了一個(gè)閾值TH,如果某兩個(gè)段之間的最佳距離小于閾值TH,可以稱為這兩個(gè)段為一對(duì)相似段對(duì);這些得出的相似段對(duì)作為候選,然后進(jìn)一步的控制數(shù)量,縮小閾值,選出更為精確的相似段對(duì)。步驟4、在對(duì)上述步驟3得出的相似段進(jìn)行圖形化,描述出直方圖。在繪制直方圖時(shí),以時(shí)間為橫軸,頻率為縱軸,在確定的一對(duì)相似段對(duì)之間畫橫線,然后對(duì)于橫軸上的每一個(gè)時(shí)間點(diǎn),可以得出經(jīng)過(guò)這個(gè)時(shí)間點(diǎn)的相似段對(duì)橫線的數(shù)目,從而得出縱軸的數(shù)值。步驟5、得出唱段邊界,并進(jìn)行唱段和念白提取,具體步驟為:根據(jù)上述步驟4繪出的直方圖,在直方圖中相似的片段之間會(huì)形成峰值,這其中的每一個(gè)峰可以看作是戲曲的唱段部分,直方圖中的低平段可以看作是戲曲的念白部分,這樣就得到了戲曲中的唱段和念白。步驟6、將處理得到的唱段和念白作為傳統(tǒng)分類算法的輸入,得出最后的結(jié)果,并進(jìn)行準(zhǔn)確率和效率的分析,具體步驟為:將處理得到的唱段和念白作為傳統(tǒng)分類算法的輸入,最后得出戲曲分類的結(jié)果;然后對(duì)準(zhǔn)確率和效率進(jìn)行分析,把數(shù)據(jù)與傳統(tǒng)采用整首戲曲或片段進(jìn)行分類的算法結(jié)果進(jìn)行比較,分析得出是否有提高。為了說(shuō)明本發(fā)明所提供的方法的效果,下面實(shí)驗(yàn)數(shù)據(jù)選擇六個(gè)流派,共300首中國(guó)傳統(tǒng)戲曲,為了方便,此處只統(tǒng)計(jì)了10首戲曲,10首戲曲分別來(lái)自六個(gè)流派,10首戲曲的長(zhǎng)度都在3分鐘到5分鐘左右,因最后的結(jié)果得出的為戲曲片段,可見算法將片段分的很雜亂,且每個(gè)分割后的片段時(shí)長(zhǎng)很短;實(shí)驗(yàn)結(jié)果如表1所示,其中念白的分割準(zhǔn)確率在30%左右,且浮動(dòng)比較大,唱段的分割準(zhǔn)確率雖然也在75%左右,但是分割的片段過(guò)于的雜碎,這樣無(wú)法作為下一步實(shí)驗(yàn)的輸入。表1為10首戲曲唱段念白分割結(jié)果把上述的唱段和念白處理成長(zhǎng)度在90秒到120秒之間的片段,進(jìn)行下一步實(shí)驗(yàn),最后得出的戲曲分類結(jié)果表2所示。從表2中可以看出,相比于用整體戲曲作為輸入的傳統(tǒng)戲曲分類方法,用唱段和念白作為輸入時(shí),不僅在特征提取的用時(shí)上要快很多,并且效率也很不錯(cuò),唱段對(duì)于戲曲分類的效果相比于整體戲曲的效果要優(yōu)秀??梢钥闯龀魏湍畎自谔卣魈崛〉臅r(shí)間上明顯優(yōu)于整體戲曲,算法運(yùn)行的效率也得到了提高。唱段念白整體戲曲特征提取時(shí)間(s)33038110484327算法運(yùn)行時(shí)間(s)10692224準(zhǔn)確率0.8870.7870.857表2為唱段念白與整體戲曲的分類結(jié)果比較應(yīng)當(dāng)理解的是,這里所討論的實(shí)施方案及實(shí)例只是為了說(shuō)明,對(duì)本領(lǐng)域技術(shù)人員來(lái)說(shuō),可以加以改進(jìn)或變換,而所有這些改進(jìn)和變換都應(yīng)屬于本發(fā)明所附權(quán)利要求的保護(hù)范圍。當(dāng)前第1頁(yè)1 2 3