欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于測度學習改進支持向量機的鋼琴樂譜難度識別算法的制作方法

文檔序號:12124160閱讀:320來源:國知局
基于測度學習改進支持向量機的鋼琴樂譜難度識別算法的制作方法與工藝

本發(fā)明屬于機器學習領(lǐng)域,尤其涉及一種鋼琴樂譜難度識別方法。



背景技術(shù):

鋼琴樂譜難度自動識別即用一種方法自動識別出特定鋼琴樂譜的難度等級。隨著互聯(lián)網(wǎng)的飛速發(fā)展,現(xiàn)如今大量的鋼琴樂譜可以從網(wǎng)絡(luò)中購買甚至很多網(wǎng)站提供免費下載服務(wù)。但對于業(yè)余愛好者,由于缺少專業(yè)知識和指導,不知如何從網(wǎng)絡(luò)中海量的鋼琴樂譜中選擇適合自己難度等級的樂譜而止步不前。對于專業(yè)音樂學習者,學習過程中有一套固定的進階教材,但長時間練習同樣的樂曲,過程過于單調(diào)和枯燥,也不利于針對個人制定個性化的學習方案以增加學習者的學習熱情,提高學習效率。現(xiàn)在絕大部分的鋼琴樂譜難度等級仍然需要專業(yè)人士去主觀判斷,然而對于現(xiàn)今網(wǎng)絡(luò)中海量的數(shù)字樂譜,人為一個個去判斷其難度等級將會是一個耗時耗力的巨大工程,是不現(xiàn)實的。所以,如果設(shè)計一種方法能夠自動識別出待定樂譜難度等級標簽,不僅對于音樂學習與教學有很大的實際意義,并且能夠提高音樂網(wǎng)站的用戶體驗,也有助于音樂的傳播與發(fā)展。

鋼琴難度等級自動識別技術(shù)是一個較新但很有發(fā)展?jié)摿Φ募夹g(shù)領(lǐng)域。Shih-Chuan Chiu等人最早提出自動識別鋼琴難度等級的方法。他們將此問題看作分類問題,定義一些和鋼琴難度相關(guān)的特征,用線性回歸方法去實現(xiàn)鋼琴難度的自動識別。此方法最終效果不令人滿意,原因在于:沒有考慮特征數(shù)據(jù)本身的特點,而直接簡化模型——假設(shè)特征和難度等級是線性關(guān)系,用線性回歸方法去擬合,此模型過于簡化特征和難度等級之間的實際關(guān)系。

Véronique Sébastien等人根據(jù)音樂教學的過程,提出一種基于樂譜分析的方法實現(xiàn)鋼琴樂譜難度識別。首先也定義一些難度相關(guān)特征,然后利用主成分分析(PrincipalComponentAnalysis,PCA)降維,將特征投影到二維空間,經(jīng)過分層聚類(hierarchicalclustering)和k均值聚類(k-means clustering)得到難度類別標簽。此方法不足在于:無論PCA還是聚類方法都是非監(jiān)督方法,雖然能充分利用特征和難度等級之間的分布關(guān)系,但無法利用已有的難度等級標簽作為先驗知識幫助分類。



技術(shù)實現(xiàn)要素:

本發(fā)明提供一種具有較高識別穩(wěn)定性和識別準確率的鋼琴樂譜難度識別算法。技術(shù)方案如下:

一種基于測度學習改進支持向量機的鋼琴樂譜難度識別算法,包括以下步驟:

1)建立分類數(shù)字鋼琴樂譜代表集;

2)提取難度相關(guān)特征,構(gòu)建特征向量空間,并對提取到的特征進行歸一化預處理;

3)利用測度學習從訓練樣本中有監(jiān)督的得到新的距離測度,并用新的距離測度改進高斯徑向基核函數(shù),方法如下:

a).利用測度學習知識,基于相同難度標簽的樂譜拉近距離,而不同類別標簽樂譜之間的間隔盡可能大思想,建立優(yōu)化目標,通過求解大間隔優(yōu)化問題,得到投影矩陣M,基于投影矩陣M得到新的距離測度DM

DM(xi,xj)=(xi-xj)TM(xi-xj)

其中xi,xj{i,j∈1,...,n},n表示訓練樣本的數(shù)目,表示序號分別為i和j的特征向量。

b).利用新的距離測度DM改進高斯徑向基核函數(shù)中的歐氏距離測度,得到新的高斯徑向基核函數(shù)形式為:

其中,σ是高斯徑向基核函數(shù)參數(shù),exp表示以自然常數(shù)e為底的指數(shù)函數(shù)。

c).建立基于上述新的高斯徑向基核函數(shù)的支持向量機分類模型。

4)用one-versus-all方法將SVM擴展到多分類;

5)基于網(wǎng)格搜索算法選擇最優(yōu)的高斯徑向基核函數(shù)參數(shù),建立多分類支持向量機模型;

6)對于待識別數(shù)字樂譜,重復第2)步,依據(jù)訓練好的多分類支持向量機模型得到的決策函數(shù),計算各子分類器的決策值,將待識別數(shù)字樂譜歸為所有決策值中最大值所對應(yīng)的類別。

本發(fā)明基于測度學習,從數(shù)據(jù)本身有監(jiān)督的學習到一個新的距離測度,進而改進基于高斯徑向基核函數(shù)的SVM,并用one-versus-all方法擴展SVM到多分類,基于網(wǎng)格搜索算法選擇最優(yōu)的模型參數(shù)組合,建立分類模型,最終實現(xiàn)特定鋼琴樂譜難度等級識別。在仿真實驗中,用測試集對建立的模型進行準確率檢測,結(jié)果表明本發(fā)明有最好的識別準確率,且有效提高了基于高斯徑向基核函數(shù)多分類SVM的分類性能。

附圖說明

圖1.本發(fā)明基于測度學習改進多分類SVM的鋼琴樂譜難度識別算法總體流程圖

圖2.(a)和(b)分別是邏輯回歸LR,基于線性核函數(shù)(LM-SVM),多項式核函數(shù)(PM-SVM),原始高斯徑向基核函數(shù)(OM-SVM)以及本發(fā)明提出的基于測度學習改進高斯徑向基核函數(shù)(MM-SVM)的多分類SVM算法在九類數(shù)據(jù)集(NineS Set)和四類數(shù)據(jù)集(FourS Set)下各自的識別準確率及結(jié)果的90%置信空間。

具體實施方式

1.建立分類數(shù)字鋼琴樂譜代表集

針對應(yīng)用問題有目的的采集不同難度標簽的鋼琴樂譜數(shù)據(jù),難度等級編號為1~K,K為自然數(shù)。從每個類別中隨機選取80%作為訓練樣本,其余作為測試樣本。

2.特征提取和預處理

根據(jù)人為判斷樂譜難度等級的準則,并結(jié)合數(shù)字樂譜中節(jié)拍,音高,時間,音符變化(note alter)和手的移動(handdisplacement)等信息,提取難度相關(guān)特征,構(gòu)成特征空間集合。

特征提取后,由于不同特征值范圍差別較大,為防止數(shù)值較大的特征對整體分類影響,對特征空間進行歸一化處理,用Min-Max歸一化方法,公式如下:

將特征向量的值歸一化到[0,1]區(qū)間。其中min和max分別表示特征xi的最小和最大值,表示特征xi經(jīng)過歸一化處理后的特征。

3.測度學習得到新的距離測度,并改進高斯徑向基核函數(shù)

測度學習(metric learning),即從問題本身的先驗知識中有監(jiān)督的學習到一個距離(distance)或者相似(similarity)測度。首先利用問題和數(shù)據(jù)本身的先驗知識有監(jiān)督的得到一個映射關(guān)系,然后在投影(映射)后的樣本空間,用原始距離測度(比如最常用的Euclidean distance)計算樣本距離。

為得到新的距離測度,關(guān)鍵在于找到最佳的特征投影。考慮用線性變換矩陣L實現(xiàn)特征空間投影,則距離測度為:

其中xi,xj{i,j∈1,...,n}(n表示訓練樣本的數(shù)目)表示特征向量。為避免求均方且保證距離為正值,取距離的平方并用矩陣形式表示,得到距離測度DM為:

DM=dL2=[L(xi-xj)]T[L(xi-xj)]

=(xi-xj)TLTL(xi-xj)

=(xi-xj)TM(xi-xj)

其中矩陣M=LTL,并且M是半正定矩陣。T表示矩陣轉(zhuǎn)置。通過矩陣M實現(xiàn)特征空間投影,期望在投影后的特征空間中類別區(qū)分度更高,即希望投影后,相同難度標簽的樂譜被拉近,而不同類別標簽樂譜之間的間隔盡可能大?;谝陨纤枷?,將求解投影矩陣M的過程歸為求解如下目標函數(shù):

取得最小值時的M。其中S表示由相同難度等級的兩首樂譜組成的數(shù)據(jù)對集,R表示在S的基礎(chǔ)上,每個對集加入一個不同難度等級的樂譜組成三集合;[z]+=max(0,z),λ是一個常數(shù),用交叉驗證得到;∑表示求和運算。

然后,利用新的距離測度DM代替原始高斯徑向基核函數(shù)中的歐式距離測度,改進后的核函數(shù)kM為:

其中σ是高斯徑向基核函數(shù)參數(shù),可用網(wǎng)格搜索算法得到,exp表示以自然常數(shù)e為底的指數(shù)函數(shù)。

在進一步特定的但非限制性的形式中,求解投影矩陣M,改進高斯徑向基核函數(shù)的具體過程如下:

1).分別從數(shù)據(jù)代表集中隨機取一部分數(shù)據(jù)構(gòu)成訓練集(80%作為訓練集),其余為驗證集;

2).給M賦初值,如單位矩陣I;

3).采用由粗到細的策略,給λ(從0~1選取,跨度為0.1)賦若干不同的值,對每個λ值用訓練集求解f(M)取得最小值時M的最優(yōu)值M*

4).對步驟3)中的每一個M*,用驗證集根據(jù)交叉驗證法,驗證距離測度函數(shù)識別出樂譜難度等級的誤差,找到誤差最小的M*,記為表示本輪訓練結(jié)果;

5).和上一輪訓練結(jié)果比,若小于設(shè)定的收斂誤差ε,即則訓練結(jié)束,否則回到步驟3),開始下一輪訓練,訓練次數(shù)t>2。

6).求解得到投影矩陣M后,用新的距離測度DM代替原始高斯徑向基核函數(shù):

中的歐式距離測度方程,得到改進后的核函數(shù):

4.one-versus-all擴展SVM到多分類

支持向量機的出現(xiàn)主要是為了解決二分類問題,而本發(fā)明的實際應(yīng)用是多分類問題,故本發(fā)明采用經(jīng)典的one-versus-all方法擴展SVM到多分類情形。主要思想是:對于K類分類問題,通過建立K個支持向量機子分類器,在構(gòu)造第j個子分類器時,將屬于第j類別的樣本標記為正樣本,將所有不屬于第j類別的其他類別的樣本標記為負樣本。對于待識別的樣本,依次調(diào)用訓練好的K個SVM模型,計算它在各個SVM中決策函數(shù)的值,選擇決策函數(shù)值最大的SVM給出的類別,作為待識別樣本類別。

5.基于網(wǎng)格搜索算法選擇最優(yōu)的核函數(shù)參數(shù)組合,建立分類模型。

網(wǎng)格搜索算法是一種比較直觀的參數(shù)優(yōu)化方法,利用網(wǎng)格搜索算法優(yōu)化基于高斯徑向基核函數(shù)SVM中的參數(shù)C和g(C是一個可調(diào)節(jié)的參數(shù)稱為懲罰因子,用來權(quán)衡最大化分類間隔和最小化訓練誤差,高斯徑向基核函數(shù)參數(shù)g,g=1/σ2,則優(yōu)化σ,就是優(yōu)化g),建立分類模型。

在進一步特定的但非限制性的形式中,用網(wǎng)格搜索算法求最優(yōu)參數(shù)組合并建立分類模型的具體過程如下:

1).設(shè)定參數(shù)C、g的范圍在2-10到210范圍內(nèi),搜索步長0.5,在C、g坐標系上構(gòu)建二維網(wǎng)格,網(wǎng)格節(jié)點就是C、g組成的參數(shù)對;

2).對每一組C、g的值,從數(shù)據(jù)集中隨機取80%作為訓練樣本,訓練支持向量機分類器,方法如下:

對于給定訓練數(shù)據(jù)樣本xi∈Rp(i=1,2,…,n)是樣本的特征向量(維度為p),yi∈{-1,+1}為對應(yīng)樣本的標簽,表示兩個不同的類別;n為樣本數(shù)目。則基于測度學習得到新的距離測度DM,改進高斯徑向基核函數(shù)后的支持向量機求解最優(yōu)超平面的問題即為求解下列優(yōu)化問題:

0≤αi≤C,i=1,...n

其中

得到最優(yōu)解α*是訓練得到的SVM分類模型的系數(shù)。選擇α*的一個小于參數(shù)C的正分量并據(jù)此計算:

超平面的偏移量b:

最終決策函數(shù)為:

sgn(number)函數(shù),當number>0則返回1,小于0,則返回-1。

利用數(shù)據(jù)集中另外的20%作為驗證集,用上述訓練得到的決策函數(shù)判斷難度等級,并計算分類準確率R。

3).將各組C、g值對應(yīng)的分類準確率R用等高線畫出,得到等高線圖,由此確定最優(yōu)C、g值。

4).如果求得的分類準確率R不能達到目標要求,可以在現(xiàn)有等高線圖基礎(chǔ)上選定一個更小的搜索區(qū)域,減小搜索步長進行細搜索,直到確定最優(yōu)C、g值。

5).最優(yōu)的C,g值組合得到的決策函數(shù)作為最終的分類模型。

6).根據(jù)實際數(shù)據(jù)集中的難度等級數(shù)目K,重復步驟1)~5)過程K次,每次需要訓練所有的訓練樣本,但訓練樣本中只將某一個類別記為正,其余所有類別記為負。最終建立K個分類模型。

6.利用測試樣本對建立的模型進行準確率檢測。

利用測試集對建立的分類模型性能進行測試。對于待識別難度等級的數(shù)字鋼琴樂譜,首先經(jīng)過特征提取和預處理,然后依據(jù)訓練好K個SVM模型,計算它在各個SVM模型中決策函數(shù)的值,選擇決策函數(shù)值最大的SVM給出的類別,作為待識別樣本類別,并計算識別準確率。

為更好的驗證本發(fā)明的泛化性能,貼合實際應(yīng)用,仿真實驗在兩個有不同特性的數(shù)據(jù)集中進行:一個是從大型音樂網(wǎng)站http://www.pianostreet.com收集到,包含九個難度等級,每個難度等級有50首midi樂譜的數(shù)據(jù),命名為NineS數(shù)據(jù)集,和從另一個提供免費下載和音樂服務(wù)的大型音樂網(wǎng)站http://www.8notes.com收集到400首MIDI鋼琴樂譜文件組成有四個難度等級的數(shù)據(jù)集,每一個難度等級有100首MIDI樂譜文件,命名為FourS數(shù)據(jù)集。

仿真實驗在兩個有不同特性的NineS和FourS數(shù)據(jù)集中,將本發(fā)明所述方法(Metric learning improvedMulticlass SVM,記為MM-SVM)與邏輯回歸(Logistic Regression,記為LR),基于原始高斯徑向基核函數(shù)的支持向量機(Original Gaussianradialbasis kernel Multiclass SVM,記為OM-SVM),基于線性核函數(shù)的SVM(Linearkernel Multiclass SVM,記為LM-SVM)和基于多項式核函數(shù)的SVM(Polynomial kernel Multiclass SVM,記為PM-SVM)分類算法做對比試驗。每個實驗獨立重復5次,每次用5折交叉驗證,取平均準確率作為分類性能指標,同時也給出各個算法實驗結(jié)果的90%置信空間,實驗結(jié)果如圖2中(a)和(b)所示。

圖2.(a)和(b)分別是邏輯回歸LR,基于線性核函數(shù)(LM-SVM),多項式核函數(shù)(PM-SVM),原始高斯徑向基核函數(shù)(OM-SVM)以及本發(fā)明提出的基于測度學習改進高斯徑向基核函數(shù)(MM-SVM)的多分類SVM算法在九類數(shù)據(jù)集(NineS Set)和四類數(shù)據(jù)集(FourS Set)下各自的識別準確率及結(jié)果的90%置信空間。

從圖2柱狀圖中可以看出,在兩個不同特性的數(shù)據(jù)集中,本發(fā)明基于測度學習改進高斯徑向基核函數(shù)的多分類SVM(MM-SVM)相對邏輯回歸和基于別的核函數(shù)的多分類SVM,均表現(xiàn)出最好的識別準確率。兩個數(shù)據(jù)集合中,本發(fā)明最終識別準確率均高于基于原始高斯徑向基核函數(shù)的多分類SVM(OM-SVM),尤其在FourS數(shù)據(jù)集中,本發(fā)明得到83.67%的識別準確率,相對原始高斯徑向基核函數(shù)的多分類SVM(OM-SVM),識別準確率有較大提高且結(jié)果更穩(wěn)定(有更窄的置信空間),這說明本發(fā)明能夠有效提高基于高斯徑向基核函數(shù)多分類SVM的分類性能。

當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
黄石市| 合水县| 安乡县| 保靖县| 永德县| 邯郸县| 卓资县| 五指山市| 新巴尔虎左旗| 汾西县| 姜堰市| 绥阳县| 冀州市| 阳春市| 姚安县| 岗巴县| 文昌市| 临沭县| 麻阳| 山东省| 慈利县| 偏关县| 封丘县| 双鸭山市| 崇左市| 黄大仙区| 淮滨县| 德阳市| 张家口市| 故城县| 德保县| 和田县| 宁晋县| 耿马| 安龙县| 勃利县| 永嘉县| 海盐县| 晋城| 贺兰县| 普定县|