欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種單音旋律曲線的匹配方法

文檔序號(hào):2837482閱讀:469來(lái)源:國(guó)知局
專利名稱:一種單音旋律曲線的匹配方法
技術(shù)領(lǐng)域
本發(fā)明屬于語(yǔ)音信號(hào)處理技術(shù)領(lǐng)域,具體地說(shuō),本發(fā)明涉及一種旋律 匹配方法。
背景技術(shù)
單音旋律曲線的匹配通常在音符級(jí)(note-based)或幀級(jí)(frame-based)上 進(jìn)行。理想情況下的旋律匹配路徑是線性的(如圖l)。但在實(shí)際中,待匹 配旋律的最優(yōu)匹配路徑往往是非線性的?,F(xiàn)有的非線性旋律匹配方法包 括,動(dòng)態(tài)時(shí)間彎折DTW ( J.S.R. Jang and M.Y. Gao. A Query-by-Singing System based on Dynamic Programming. In隱ternational Workshop on Intelligent systems Resolutions, 12:2, 2000 ),音符動(dòng)態(tài)規(guī)劃(S. Pauws. Cubyhum: A fully operational query by humming system. ISMIR 2002 Conference Proceedings, pages 187-196, 2002 )。這些方法使用的都是從局部 到整體的自下而上的匹配策略。在這種策略下,旋律首先在局部片段的小 范圍內(nèi)進(jìn)行比配,然后由這些局部片段的匹配解決方案構(gòu)成較大片段的解 決方案,進(jìn)而得到整個(gè)旋律的匹配方案。但是,這種方案是從局部出發(fā), 無(wú)法充分利用全局的旋律線特征,導(dǎo)致容易出現(xiàn)匹配錯(cuò)誤,將整體不相似 的旋律牽強(qiáng)匹配在一起。

發(fā)明內(nèi)容
本發(fā)明的目的是,克服現(xiàn)有技術(shù)的不足,提出一種從整體到局部進(jìn)行 匹配的單音旋律曲線匹配方法。
為實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明提供的單音旋律曲線的匹配方法,包括 如下步驟(參照?qǐng)D3):
1)將待匹配的兩段單音旋律分幀,分別提取每一幀的基頻,得到兩 個(gè)基頻序列,記為d和A,,,其中L.,"和i,.,",分別表示兩段單音旋律的 幀號(hào);2) 選擇劃分點(diǎn)A:,將所述基頻序列々.., 劃分為前、后兩個(gè)子序列,選 擇劃分點(diǎn)/,將所述基頻序列A,,也劃分為前、后兩個(gè)子序列,然后分別計(jì)
算兩個(gè)前子序列的線性匹配代價(jià)和兩個(gè)后子序列的線性匹配代價(jià),再將所得 的兩個(gè)線性匹配代價(jià)相加得到以A、 /為劃分點(diǎn)組合的基頻序列々.. 、 A,,的
折線匹配代價(jià);選擇不同的劃分點(diǎn)組合,找出使得該折線匹配代價(jià)最小的最
優(yōu)劃分點(diǎn)組合yt、 / (參考圖2);
3) 判斷以所述最優(yōu)劃分點(diǎn)組合/U /進(jìn)行劃分得到的兩個(gè)前子序列和
兩個(gè)后子序列的長(zhǎng)度是否小于預(yù)先設(shè)定的門限值,如果判斷為是,則匹配 過(guò)程結(jié)束;如果判斷為否,則將基頻序列々.., 和^1,..., 1的匹配問(wèn)題分解為對(duì)
右圖),回到步驟2),找出前子序列和后子序列各自的最優(yōu)劃分點(diǎn)組合, 這樣不斷循環(huán),直到劃分得出的子序列長(zhǎng)度小于預(yù)先設(shè)定的門限值。
上述技術(shù)方案中,所述步驟2)中,以劃分點(diǎn)6對(duì)所述基頻序列4,.., 進(jìn) 行劃分是將基頻序列劃分為前子序列々.^和后子序列;以劃分點(diǎn)/ 對(duì)所述基頻序列A,.,進(jìn)行劃分是將基頻序列5,.,劃分為前子序列A,...,,和后
子序列A,.,。
上述技術(shù)方案中,所述步驟2)中,所述劃分點(diǎn)A:在0.45"至0.55"的范 圍內(nèi)選擇,所述劃分點(diǎn)/在0.45m至0.55附的范圍內(nèi)選擇。
上述技術(shù)方案中,所述步驟2)中,所述劃分點(diǎn)A:和劃分點(diǎn)/的選擇可 以窮盡各自所述范圍內(nèi)的所有點(diǎn),也可以在各自所述范圍內(nèi)以 一定間隔進(jìn) 行采樣。
上述技術(shù)方案中,所述步驟2)中,所述線性匹配代價(jià)的計(jì)算方法為 先將兩旋律線性對(duì)齊,然后利用歐式距離、絕對(duì)值距離或高斯距離計(jì)算 每對(duì)對(duì)應(yīng)點(diǎn)的代價(jià),然后將所有對(duì)應(yīng)點(diǎn)的代價(jià)相加。
上述技術(shù)方案中,所述步驟3)中,所述子序列的長(zhǎng)度可以是該子序 列所對(duì)應(yīng)的旋律段的時(shí)間長(zhǎng)度。
上述技術(shù)方案中,所述步驟3)中,所述門限值在1至5秒范圍內(nèi)選擇。
本發(fā)明具有如下技術(shù)效果相對(duì)于已有的非線性旋律匹配方法,本發(fā)明 中的方法采用自上而下的遞歸方式解決旋律匹配問(wèn)題,能夠更好地強(qiáng)調(diào)整體 旋律線的匹配,具有更好的匹配效果,也更符合人對(duì)音樂(lè)的感知。同時(shí),本發(fā)明的方法具有較低的算法復(fù)雜度。設(shè)旋律長(zhǎng)度為/7,常用的動(dòng)態(tài)規(guī)劃由于
需要構(gòu)成一個(gè)w2大小的搜索圖,故它的算法復(fù)雜度為(9W);本發(fā)明提出的方 案,由于每級(jí)遞歸需要o(")的計(jì)算量,而遞歸級(jí)數(shù)(深度)為常數(shù),故整體 的算法復(fù)雜度仍為O("),比動(dòng)態(tài)規(guī)劃低一個(gè)量級(jí)。


以下,結(jié)合附圖來(lái)詳細(xì)說(shuō)明本發(fā)明的實(shí)施例,其中
圖1是基頻序列A和基頻序列B的線性對(duì)齊路徑;其中,坐標(biāo)軸表示基
頻序列,對(duì)焦斜線表示對(duì)齊路徑是線性的——對(duì)應(yīng)。
圖2說(shuō)明遞歸匹配的過(guò)程;其中,4,.., 和匹配的問(wèn)題被劃分為
和A...,匹配,以及 和5,... m匹配兩個(gè)子問(wèn)題;
圖3是本發(fā)明進(jìn)行旋律曲線匹配的流程圖。
具體實(shí)施例方式
下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步地描述。 實(shí)施例
本發(fā)明是一種自上而下的單音旋律曲線的匹配方法,包括如下步驟
(1) 將待匹配的旋律(可以是音頻、樂(lè)譜記號(hào)、MIDI)分幀,幀長(zhǎng)為 15ms—64ms,相鄰幀交疊為10ms—50ms且不大于幀長(zhǎng),每一幀用其基頻值(MIDI 刻度)標(biāo)示。于是,兩個(gè)待匹配的旋律可以表示成一維的數(shù)值序列,在本文
中表示為4,.., 和馬,,。
(2) 將《.. 分成兩部分4,..,4和《.,",其中劃分點(diǎn)A:滿足0.45" <A < 0.55"。
A的選"t奪可以窮盡該范圍內(nèi)的所有點(diǎn),也可以在該范圍內(nèi)以 一 定間隔采樣。 將51,,分成兩部分51,..,/和瑪,,,其中劃分點(diǎn)/滿足0.45w〈/〈0.55m, /的選擇可 以窮盡該范圍內(nèi)的所有點(diǎn),也可以在該范圍內(nèi)以一定間隔采樣。計(jì)算《j和 的線性匹配代價(jià)記為Cl 。其計(jì)算方法為計(jì)算線性匹配因子^^it〃,對(duì)于A,..,中每一個(gè)點(diǎn)5,,其在《..t對(duì)應(yīng)的匹配 點(diǎn)為4叫,兩點(diǎn)匹配代價(jià)用歐氏距離計(jì)算&《=(+.$」-A)2。為了限制單對(duì)匹 配點(diǎn)對(duì)整體的影響,該&w值不得高于6。于是,4,..>和51,..,/的線性匹配代價(jià) 為所有的力A的累加t cfo,,。
同理,計(jì)算《..., 和^,,.,的線性匹配代價(jià),記為c,。于是4,.,和A,,的折
線匹配代價(jià)為q+q。
(3)對(duì)于可能的切分組合OU),選擇折線匹配代價(jià)最小的作為最優(yōu)劃分。 如果4,.., 或于丑1,,短于1500ms,則最終匹配路徑是該最優(yōu)劃分下的折線匹
配。否則,4,..,n和A,,的匹配問(wèn)題分解為4,.》和A,..,/匹配,以及d和A,, 匹配兩個(gè)子問(wèn)題。子問(wèn)題的解決同上述(2)的步驟。
值得指出的是本實(shí)施例在計(jì)算線性匹配代價(jià)時(shí)采用的雖然是歐式距 離,但可以理解本發(fā)明也可以使用絕對(duì)值距離或高斯距離等其它計(jì)算方 式。
最后,最后所應(yīng)說(shuō)明的是,以上實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案 而非限制。盡管參照實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)說(shuō)明,本領(lǐng)域的普通技術(shù) 人員應(yīng)當(dāng)理解,對(duì)本發(fā)明的技術(shù)方案進(jìn)行修改或者等同替換,都不脫離本 發(fā)明技術(shù)方案的精神和范圍,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求范圍當(dāng)中。
權(quán)利要求
1. 一種單音旋律曲線的匹配方法,包括如下步驟1)將待匹配的兩段單音旋律分幀,分別提取每一幀的基頻,得到兩個(gè)基頻序列,記為A1,...,n和B1,...,m,其中1,...,n和1,...,m分別表示兩段單音旋律的幀號(hào);2)選擇劃分點(diǎn)k,將所述基頻序列A1,...,n劃分為前、后兩個(gè)子序列,選擇劃分點(diǎn)l,將所述基頻序列B1,...,m也劃分為前、后兩個(gè)子序列,然后分別計(jì)算兩個(gè)前子序列的線性匹配代價(jià)和兩個(gè)后子序列的線性匹配代價(jià),再將所得的兩個(gè)線性匹配代價(jià)相加得到以k、l為劃分點(diǎn)組合的基頻序列A1,...,n、B1,...,m的折線匹配代價(jià);選擇不同的劃分點(diǎn)組合,找出使得該折線匹配代價(jià)最小的最優(yōu)劃分點(diǎn)組合k、l;3)判斷以所述最優(yōu)劃分點(diǎn)組合k、l進(jìn)行劃分得到的兩個(gè)前子序列和兩個(gè)后子序列的長(zhǎng)度是否小于預(yù)先設(shè)定的門限值,如果判斷為是,則匹配過(guò)程結(jié)束;如果判斷為否,則將基頻序列A1,...,n和B1,...,m的匹配問(wèn)題分解為對(duì)兩個(gè)前子序列進(jìn)行匹配和對(duì)兩個(gè)后子序列進(jìn)行匹配的兩個(gè)子問(wèn)題,回到步驟2),找出前子序列和后子序列各自的最優(yōu)劃分點(diǎn)組合,這樣不斷循環(huán),直到劃分得出的子序列長(zhǎng)度小于預(yù)先設(shè)定的門限值。
2. 根據(jù)權(quán)利要求1所述的單音旋律曲線的匹配方法,其特征在于, 所述步驟2 )中,以劃分點(diǎn)it對(duì)所述基頻序列《.., 進(jìn)行劃分是將基頻序列《... 劃分為前子序列4,...》和后子序列《.., ;以劃分點(diǎn)/對(duì)所述基頻序列A,...,m進(jìn)行 劃分是將基頻序列A,...,m劃分為前子序列A,..,,和后子序列S,,..,m 。
3. 根據(jù)權(quán)利要求2所述的單音旋律曲線的匹配方法,所述步驟2)中, 所述劃分點(diǎn)A在0.45"至0.55"的范圍內(nèi)選擇,所述劃分點(diǎn)/在0.45w至0.55w的 范圍內(nèi)選擇。
4. 根據(jù)權(quán)利要求3所述的單音旋律曲線的匹配方法,所述步驟2)中, 所述劃分點(diǎn)*和劃分點(diǎn)/的選擇可以窮盡各自所述范圍內(nèi)的所有點(diǎn),也可以 在各自所述范圍內(nèi)以一定間隔進(jìn)行采樣。
5. 根據(jù)權(quán)利要求1所述的單音旋律曲線的匹配方法,所述步驟2)中, 所述線性匹配代價(jià)的計(jì)算方法為先將兩旋律線性對(duì)齊,然后利用歐式距 離、絕對(duì)值距離或高斯距離計(jì)算每對(duì)對(duì)應(yīng)點(diǎn)的代價(jià),然后將所有對(duì)應(yīng)點(diǎn)的代價(jià)相加。
6. 根據(jù)權(quán)利要求1所述的單音旋律曲線的匹配方法,所述步驟3)中,
7. 根據(jù)權(quán)利要求6所述的單音旋律曲線的匹配方法,所述步驟3 )中, 所述門限值在1至5秒范圍內(nèi)選擇。
全文摘要
本發(fā)明提供一種單音旋律曲線的匹配方法,包括1)將待匹配的兩段單音旋律分幀,分別提取每一幀的基頻,得到兩個(gè)基頻序列;2)選擇劃分點(diǎn)k,l,將所述基頻序列A<sub>1,…,n</sub>和B<sub>1,…,m</sub>分別劃分為前、后兩個(gè)子序列,然后計(jì)算折線匹配代價(jià);選擇不同的劃分點(diǎn)組合,找出使得該折線匹配代價(jià)最小的最優(yōu)劃分點(diǎn)組合k、l;3)回到步驟2),進(jìn)一步找出前子序列和后子序列各自的最優(yōu)劃分點(diǎn)組合,這樣不斷循環(huán),直到劃分得出的子序列長(zhǎng)度小于預(yù)先設(shè)定的門限值。相對(duì)于已有的非線性旋律匹配方法,本發(fā)明中的方法采用自上而下的遞歸方式解決旋律匹配問(wèn)題,能夠更好地強(qiáng)調(diào)整體旋律線的匹配,具有更好的匹配效果,也更符合人對(duì)音樂(lè)的感知。同時(shí),本發(fā)明的方法具有較低的算法復(fù)雜度。
文檔編號(hào)G10L15/00GK101447186SQ200710178220
公開日2009年6月3日 申請(qǐng)日期2007年11月28日 優(yōu)先權(quán)日2007年11月28日
發(fā)明者建 劉, 曉 吳, 明 李, 潘接林, 顏永紅 申請(qǐng)人:中國(guó)科學(xué)院聲學(xué)研究所;北京中科信利技術(shù)有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
五原县| 南陵县| 宝应县| 永新县| 张家港市| 象山县| 阿克陶县| 温州市| 额敏县| 双流县| 昭通市| 许昌县| 宾川县| 灌阳县| 兴和县| 桐庐县| 循化| 堆龙德庆县| 石河子市| 木兰县| 卢龙县| 定安县| 阿勒泰市| 固阳县| 赤峰市| 巴林左旗| 永泰县| 海安县| 麻江县| 汉寿县| 十堰市| 渝中区| 衢州市| 德钦县| 蕉岭县| 临洮县| 永宁县| 乌兰县| 永嘉县| 柳州市| 吴江市|