專利名稱:利用樂器的聲音分析音樂的設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于樂器的聲音信息分析音樂的設(shè)備,本發(fā)明特別涉及一種通過將輸入數(shù)字聲音信號(hào)的頻率成分與預(yù)先按音調(diào)和強(qiáng)度存儲(chǔ)的樂器聲音信息的頻率成分進(jìn)行比較來對(duì)以數(shù)字聲音的形式輸入的音樂進(jìn)行分析的設(shè)備。
背景技術(shù):
自從個(gè)人計(jì)算機(jī)在20世紀(jì)80年代開始普及以來,計(jì)算機(jī)技術(shù)、性能和環(huán)境已經(jīng)得到快速發(fā)展。在20世紀(jì)90年代,因特網(wǎng)迅速擴(kuò)展到辦公和個(gè)人生活的各個(gè)方面。因此,在21世紀(jì),在全世界的每個(gè)領(lǐng)域中計(jì)算機(jī)的使用都已非常重要,并且已開發(fā)出了將計(jì)算機(jī)應(yīng)用于音樂領(lǐng)域的技術(shù)。特別是,從不同的方面開發(fā)出了使用計(jì)算機(jī)技術(shù)和數(shù)字信號(hào)處理技術(shù)的音樂分析技術(shù),但還沒有獲得令人滿意的結(jié)果。
發(fā)明內(nèi)容
本發(fā)明提供了一種用于對(duì)以數(shù)字聲音的形式輸入的音樂進(jìn)行分析的設(shè)備,其中按音調(diào)和強(qiáng)度預(yù)先存儲(chǔ)了各種樂器的聲音信息,并且將輸入數(shù)字聲音信號(hào)的頻率成分與該預(yù)先存儲(chǔ)的樂器聲音信息的頻率成分進(jìn)行比較,從而能夠獲得更精確的音樂演奏分析結(jié)果,并且可以以定量數(shù)據(jù)的形式提取該分析結(jié)果。
本發(fā)明還提供了一種基于按音調(diào)和強(qiáng)度預(yù)先存儲(chǔ)的樂器聲音信息和關(guān)于待演奏的樂譜的樂譜信息來分析以數(shù)字聲音的形式輸入的音樂的設(shè)備。
根據(jù)本發(fā)明的一個(gè)方面,提供了一種用于分析音樂的設(shè)備。該設(shè)備包括聲音信息存儲(chǔ)單元,所述聲音信息存儲(chǔ)單元按照樂器的類型分別存儲(chǔ)聲音信息;聲音信息選擇單元,所述聲音信息選擇單元從所述聲音信息存儲(chǔ)單元中存儲(chǔ)的不同類型的樂器的聲音信息中選擇一種特定樂器的聲音信息,并輸出所選擇的聲音信息;數(shù)字聲音輸入單元,所述數(shù)字聲音輸入單元接收外部演奏的音樂,并且將其轉(zhuǎn)換成數(shù)字聲音信號(hào);頻率分析單元,所述頻率分析單元從所述數(shù)字聲音輸入單元接收數(shù)字聲音信號(hào),將其分解成多個(gè)頻率成分,并且以幀為單位輸出這些頻率成分;比較/分析單元,所述比較/分析單元接收從所述聲音信息選擇單元輸出的聲音信息和從所述頻率分析單元以幀為單位輸出的頻率成分,從由所述頻率分析單元輸出的各個(gè)幀中的頻率成分的峰值頻率中選擇最低的峰值頻率,并且從由所述聲音信息選擇單元輸出的聲音信息中檢測(cè)出包含該最低峰值頻率的聲音信息;單音分量檢測(cè)單元,所述單音分量檢測(cè)單元從所述比較/分析單元接收所檢測(cè)到的聲音信息、數(shù)字聲音信號(hào)的頻率成分和最低峰值頻率,并且在聲音信息中檢測(cè)出具有與聲音信息中的所述最低峰值頻率最接近的峰值信息的聲音信息作為單音分量;單音分量去除單元,所述單音分量去除單元從所述單音分量檢測(cè)單元接收已被用于檢測(cè)所述單音分量的最低峰值頻率和數(shù)字聲音信號(hào)的頻率成分,從所述頻率成分中去除最低峰值頻率,并且將去除的結(jié)果傳送到所述比較/分析單元;演奏聲音信息檢測(cè)單元,所述演奏聲音信息檢測(cè)單元組合由所述單音分量檢測(cè)單元檢測(cè)到的各個(gè)單音分量以檢測(cè)演奏聲音信息;以及演奏聲音信息輸出單元,所述演奏聲音信息輸出單元輸出所述演奏聲音信息。
根據(jù)本發(fā)明的另一個(gè)方面,提供了一種用于分析音樂的設(shè)備。該設(shè)備包括聲音信息存儲(chǔ)單元,所述聲音信息存儲(chǔ)單元按照樂器的類型分別存儲(chǔ)聲音信息;聲音信息選擇單元,所述聲音信息選擇單元從所述聲音信息存儲(chǔ)單元中存儲(chǔ)的不同類型的樂器的聲音信息中選擇一種特定樂器的聲音信息,并輸出所選擇的聲音信息;樂譜信息存儲(chǔ)單元,所述樂譜信息存儲(chǔ)單元存儲(chǔ)關(guān)于由特定樂器演奏的樂譜的信息,即,樂譜信息;數(shù)字聲音輸入單元,所述數(shù)字聲音輸入單元接收外部演奏的音樂,并且將其轉(zhuǎn)換成數(shù)字聲音信號(hào);頻率分析單元,所述頻率分析單元從所述數(shù)字聲音輸入單元接收數(shù)字聲音信號(hào),將其分解成多個(gè)頻率成分,并且以幀為單位輸出這些頻率成分;預(yù)期演奏值生成單元,所述預(yù)期演奏值生成單元響應(yīng)于外部控制信號(hào)而開始工作,自它開始工作起隨著時(shí)間的推移基于存儲(chǔ)在樂譜信息存儲(chǔ)單元中的樂譜信息以幀為單位生成預(yù)期演奏值,并且以幀為單位輸出所述預(yù)期演奏值;比較/分析單元,所述比較/分析單元接收從所述聲音信息選擇單元輸出的聲音信息、從所述頻率分析單元以幀為單位輸出的頻率成分以及從所述預(yù)期演奏值生成單元輸出的所述預(yù)期演奏值,從還未與所述頻率成分進(jìn)行比較的所述預(yù)期演奏值中選擇最低的預(yù)期演奏值,檢測(cè)出對(duì)應(yīng)于所述最低預(yù)期演奏值的聲音信息,并且判斷所檢測(cè)到的對(duì)應(yīng)于所述最低預(yù)期演奏值的聲音信息是否被包含在所述頻率成分中;單音分量檢測(cè)單元,所述單音分量檢測(cè)單元接收對(duì)應(yīng)于所述最低預(yù)期演奏值的聲音信息和所述頻率成分,并且當(dāng)比較/分析單元判斷對(duì)應(yīng)于所述最低預(yù)期演奏值的聲音信息被包含在所述頻率成分中時(shí),檢測(cè)出所述接收的聲音信息作為單音分量;單音分量去除單元,所述單音分量去除單元從所述單音分量檢測(cè)單元接收所述單音分量和數(shù)字聲音信號(hào)的頻率成分,從所述頻率成分中去除單音分量,并且將去除的結(jié)果傳送到所述比較/分析單元;演奏聲音信息檢測(cè)單元,所述演奏聲音信息檢測(cè)單元組合所述單音分量檢測(cè)單元檢測(cè)到的單音分量以檢測(cè)演奏聲音信息;以及演奏聲音信息輸出單元,所述演奏聲音信息輸出單元輸出所述演奏聲音信息。
圖1示出了樂器的聲音信息的示例。
圖2是根據(jù)本發(fā)明第一實(shí)施例的用于分析音樂的設(shè)備的示意性框圖。
圖3是利用根據(jù)本發(fā)明第一實(shí)施例的音樂分析設(shè)備來分析音樂的過程的流程圖。
圖3A是利用根據(jù)本發(fā)明第一實(shí)施例的音樂分析設(shè)備來檢測(cè)幀的單音信息的過程的流程圖。
圖3B是利用根據(jù)本發(fā)明第一實(shí)施例的音樂分析設(shè)備來比較和分析幀的頻率成分的過程的流程圖。
圖4A至圖4C示出了多個(gè)頻率波形,用以說明利用本發(fā)明第一實(shí)施例的音樂分析設(shè)備從多個(gè)演奏音符中檢測(cè)單音符的過程。
圖5是根據(jù)本發(fā)明第二實(shí)施例的用于分析音樂的設(shè)備的示意性框圖。
圖6是利用本發(fā)明第二實(shí)施例的音樂分析設(shè)備來分析音樂的過程的流程圖。
圖6A是利用本發(fā)明第二實(shí)施例的音樂分析設(shè)備來檢測(cè)當(dāng)前幀的單音信息和演奏錯(cuò)誤信息的過程的流程圖。
圖6B和圖6C是利用本發(fā)明第二實(shí)施例的音樂分析設(shè)備對(duì)幀的頻率成分進(jìn)行比較和分析的過程的流程圖。
圖6D是利用本發(fā)明第二實(shí)施例的音樂分析設(shè)備修正預(yù)期演奏值的流程圖。
具體實(shí)施例方式
下面將參照附圖對(duì)本發(fā)明的音樂分析設(shè)備的優(yōu)選實(shí)施例進(jìn)行詳細(xì)描述。
圖1示出了各種樂器的聲音信息的示例。圖1表明,在不同類型的樂器中聲音信息是不同的。聲音信息(a)表示處于音調(diào)C5的鋼琴聲。聲音信息(b)表示處于音調(diào)C5的小號(hào)聲。聲音信息(c)表示處于音調(diào)C5的小提琴聲。聲音信息(d)表示處于音調(diào)C5的女聲。
參照?qǐng)D1(a),由于按下鍵盤時(shí)音錘擊打一條琴弦,鋼琴聲的強(qiáng)度在整個(gè)頻率范圍內(nèi)都增大,各個(gè)頻率成分都明顯地出現(xiàn)。同時(shí),隨著時(shí)間推移,鋼琴聲的強(qiáng)度迅速減弱。
參照?qǐng)D1(b),由于管樂器的特性,小號(hào)聲具有細(xì)且清晰的諧波分量。但是,隨著諧波升高,振動(dòng)慢慢地逐漸發(fā)生。
參照?qǐng)D1(c),由于弦樂器的特性,小提琴聲具有上下擴(kuò)展的頻率成分。隨著諧波升高,明顯地出現(xiàn)頻率擴(kuò)展。
參照?qǐng)D1(d),由于音調(diào)不準(zhǔn),女聲具有大幅振動(dòng)的頻率成分,并且沒有很多諧波分量。
利用這個(gè)事實(shí),即,如上所述即使演奏相同的音調(diào),在不同類型的樂器中聲音信息也是不同的,可獲得準(zhǔn)確的分析結(jié)果。
圖2是根據(jù)本發(fā)明第一實(shí)施例的音樂分析設(shè)備的示意性框圖。參照?qǐng)D2,根據(jù)本發(fā)明第一實(shí)施例的音樂分析設(shè)備包括聲音信息存儲(chǔ)單元10;數(shù)字聲音輸入單元110、頻率分析單元120、比較/分析單元130、單音分量檢測(cè)單元140、單音分量去除單元150、演奏聲音信息檢測(cè)單元160、演奏聲音信息輸出單元170和聲音信息選擇單元180。
聲音信息存儲(chǔ)單元10按照樂器的類型分別存儲(chǔ)聲音信息。聲音信息選擇單元180從所述聲音信息存儲(chǔ)單元10中存儲(chǔ)的不同類型的樂器的聲音信息中選擇一種所需樂器的聲音信息“A”,并輸出所選擇的聲音信息“A”。這里,聲音信息存儲(chǔ)單元10以波形數(shù)據(jù)或者不同頻率成分的強(qiáng)度的形式存儲(chǔ)聲音信息。在以波形數(shù)據(jù)的形式存儲(chǔ)聲音信息的情況下,如果聲音信息選擇單元180生成了聲音信息請(qǐng)求,則聲音信息存儲(chǔ)單元10從波形數(shù)據(jù)中檢測(cè)出所請(qǐng)求的聲音的頻率成分,并且提供它們。
數(shù)字聲音輸入單元110接收外部演奏的音樂并且將其轉(zhuǎn)換成數(shù)字聲音信號(hào)。頻率分析單元120從數(shù)字聲音輸入單元110接收數(shù)字聲音信號(hào),以幀為單位將其分解成多個(gè)頻率成分“F”,并且以幀為單位輸出頻率成分“F”。
比較/分析單元130接收從聲音信息選擇單元180輸出的聲音信息“A”和從頻率分析單元120以幀為單位輸出的頻率成分“F”,并且對(duì)它們進(jìn)行比較。具體而言,在頻率分析單元120輸出的一個(gè)幀中,比較/分析單元130從頻率成分“F”的峰值頻率中選擇最低的峰值頻率“FPL1”,并且從聲音信息選擇單元180輸出的聲音信息“A”中檢測(cè)出包含該最低峰值頻率“FPL1”的聲音信息“APL1”。
單音分量檢測(cè)單元140從比較/分析單元130接收所檢測(cè)到的聲音信息“APL1”、頻率成分“F”和最低峰值頻率“FPL1”,并且檢測(cè)出峰值信息與聲音信息“APL1”中的最低峰值頻率“FPL1”最接近的聲音信息作為單音分量“AS”。
同時(shí),單音分量檢測(cè)單元140檢測(cè)每一幀的時(shí)間信息,接著檢測(cè)各幀中包含的各個(gè)單音符的音調(diào)和強(qiáng)度。另外,當(dāng)檢測(cè)到的單音分量“AS”是未包含在先前幀中的新的單音分量時(shí),單音分量檢測(cè)單元140將包含該新單音分量“AS”的當(dāng)前幀劃分成多個(gè)子幀,找出包含該新單音分量“AS”的子幀,并且檢測(cè)所找到的子幀的時(shí)間信息以及單音分量“AS”,即音調(diào)和強(qiáng)度信息。
單音分量去除單元150從單音分量檢測(cè)單元140接收最低峰值頻率“FPL1”和頻率成分“F”,從頻率成分“F”中去除最低峰值頻率“FPL1”,并且將去除的結(jié)果(F←F-FPL1)傳送到比較/分析單元130。
接著,比較/分析單元130判斷從單音分量去除單元150接收到的頻率成分“F”是否包含有效的峰值頻率信息。當(dāng)確定從單音分量去除單元150接收到的頻率成分“F”中包含有效的峰值頻率信息時(shí),比較/分析單元130從頻率成分“F”中選擇最低的峰值頻率“FPL2”,并且檢測(cè)出包含該最低峰值頻率“FPL2”的聲音信息“APL2”。但是,當(dāng)確定從單音分量去除單元150接收到的頻率成分“F”中不包含有效的峰值頻率信息時(shí),如上所述,比較/分析單元130從頻率分析單元120接收下一幀的頻率成分,在所接收到的頻率成分中包含的峰值頻率成分中選擇最低的峰值頻率,并且檢測(cè)出包含該最低峰值頻率的聲音信息。換言之,將從頻率分析單元120輸出的當(dāng)前幀的頻率成分“F”與待分析的從聲音信息選擇單元180傳送的聲音信息進(jìn)行比較,同時(shí)利用比較/分析單元130、單音分量檢測(cè)單元140和單音分量去除單元150順序地和反復(fù)地進(jìn)行處理,直到檢測(cè)出了當(dāng)前幀中包含的所有單音信息。
演奏聲音信息檢測(cè)單元160組合由單音分量檢測(cè)單元140檢測(cè)到的各個(gè)單音分量“AS”以檢測(cè)演奏聲音信息。顯然,即使演奏多音符,演奏聲音信息檢測(cè)單元160也可檢測(cè)演奏聲音信息。演奏聲音信息檢測(cè)單元160檢測(cè)關(guān)于多音符的演奏聲中包含的各個(gè)單音符的信息,并且組合檢測(cè)到的單音信息,從而檢測(cè)出對(duì)應(yīng)于多音符的演奏聲音信息。
演奏聲音信息輸出單元170輸出由演奏聲音信息檢測(cè)單元160檢測(cè)到的演奏聲音信息。
圖3至圖3B是根據(jù)本發(fā)明第一實(shí)施例的音樂分析設(shè)備所執(zhí)行的方法的流程圖。
圖3是利用根據(jù)本發(fā)明第一實(shí)施例的音樂分析設(shè)備分析音樂的流程圖。參照?qǐng)D3,在生成和存儲(chǔ)(未示出)不同類型的樂器的聲音信息后,在步驟s100中從所存儲(chǔ)的不同類型的樂器的聲音信息中選擇將實(shí)際演奏的一種特定樂器的聲音信息。
接著,如果在步驟s200中輸入了數(shù)字聲音信號(hào),則在步驟s400中以幀為單位把數(shù)字聲音信號(hào)分解成多個(gè)頻率成分。在步驟s500中,把數(shù)字聲音信號(hào)的頻率成分與所選擇的特定樂器的聲音信息的頻率成分進(jìn)行比較和分析,以在以幀為單位的數(shù)字聲音信號(hào)中檢測(cè)出單聲信息。在步驟s600中輸出所檢測(cè)到的單聲信息。
重復(fù)步驟s200至步驟s600,直至數(shù)字聲音信號(hào)的輸入停止或者在步驟s300中輸入了結(jié)束指令。
圖3A是利用根據(jù)本發(fā)明第一實(shí)施例的音樂分析設(shè)備檢測(cè)各幀的單音信息的步驟s500的流程圖。參照?qǐng)D3A,在步驟s510中檢測(cè)當(dāng)前幀的時(shí)間信息。在步驟s520中將當(dāng)前幀的頻率成分與所選擇的特定樂器的聲音信息的頻率成分比較和分析,以檢測(cè)當(dāng)前幀中包含的各個(gè)單音符的音調(diào)、強(qiáng)度和時(shí)間信息。在步驟s530中檢測(cè)到的音調(diào)、強(qiáng)度和時(shí)間信息構(gòu)成了檢測(cè)單音分量。
如果在步驟s540中確定在步驟s530中所檢測(cè)到的單音符是沒有包含在先前幀中的新的單音符,則在步驟s550中把當(dāng)前幀劃分成多個(gè)子幀。在步驟s560中從這多個(gè)子幀中檢測(cè)包含該新單音符的子幀。在步驟s570中檢測(cè)所檢測(cè)到的子幀的時(shí)間信息。在步驟s580中將該子幀的時(shí)間信息設(shè)定為當(dāng)前單音符的時(shí)間信息。當(dāng)檢測(cè)到的單音符處于低頻范圍內(nèi)時(shí),即,檢測(cè)音符頻率的最小采樣數(shù)大于子幀規(guī)格時(shí),或者不要求時(shí)間信息的精度時(shí),可以省略步驟s540至步驟s580。
圖3B是利用根據(jù)本發(fā)明第一實(shí)施例的音樂分析設(shè)備來比較和分析當(dāng)前幀的頻率成分的步驟s520的流程圖。參照?qǐng)D3B,在步驟s521中選擇輸入數(shù)字聲音信號(hào)的當(dāng)前幀中包含的最低峰值頻率。接著,在步驟s522中從特定樂器的聲音信息中檢測(cè)包含所選擇的峰值頻率的聲音信息。在步驟s523中,在步驟s522中檢測(cè)到的聲音信息中檢測(cè)出具有與所選擇的峰值頻率的分量最接近的峰值信息的聲音信息作為單音信息。
在檢測(cè)出對(duì)應(yīng)于最低峰值頻率的單音信息后,在步驟s524中從當(dāng)前幀中包含的頻率成分中去除所檢測(cè)的單音信息中包含的頻率成分。接著,在步驟s525中判斷在當(dāng)前幀中是否存在任何峰值頻率成分。如果確定在當(dāng)前幀中存在峰值頻率成分,則重復(fù)步驟s521至s524。
圖4A至圖4C是表示頻率波形的圖表,是為了說明利用根據(jù)本發(fā)明第一實(shí)施例的音樂分析設(shè)備從多個(gè)演奏音符中檢測(cè)單音符的過程。X軸表示音調(diào),即,快速傅里葉變換(FFT)指數(shù),而Y軸表示各個(gè)頻率成分的強(qiáng)度,即,作為FFT的結(jié)果的量值。
下面將參照?qǐng)D4A至圖4C詳細(xì)描述步驟s520。
在圖4A中,波形(a)表示輸入的當(dāng)前幀的數(shù)字聲音信號(hào)包含三個(gè)音符D3、F3#和A3的情況。在這種情況下,在步驟s521中將音符D3的基頻分量選擇為當(dāng)前幀中包含的峰值頻率成分中的最低峰值頻率。在步驟s522中,在特定樂器的聲音信息中,檢測(cè)出包含音符D3的基頻分量的聲音信息。在步驟s522中,可檢測(cè)出許多音符的聲音信息,如D3、D2和A1。
接著在步驟s523中,在步驟s522中檢測(cè)到的聲音信息中,檢測(cè)出具有與在步驟s521中選擇的峰值頻率成分最接近的峰值頻率成分的音符D3的聲音信息,作為所選擇的峰值頻率成分的單音信息。在圖4A中的波形(b)中示出了音符D3的單音信息。
接著,在步驟s524中,從數(shù)字聲音信號(hào)的當(dāng)前幀中包含的音符D3、F3#和A3的頻率成分中去除音符D3的單音信息(圖4A(b))。
然后,如圖4A(c)中所示,音符F3#和A3的頻率成分保留在當(dāng)前幀中。重復(fù)步驟s521至步驟s524,直至當(dāng)前幀中沒有頻率成分,從而可以檢測(cè)出當(dāng)前幀中包含的所有音符的單音信息。
在上述情況下,可通過三次重復(fù)執(zhí)行步驟s521至步驟s524來檢測(cè)出所有音符D3、F3#和A3的單音信息。
圖4B用于說明在上述情況下檢測(cè)和去除音符F3#的過程。圖4B(a)示出了在將音符D3從音符D3、F3#和A3中去除后保留在當(dāng)前幀的聲音信息中的音符F3#和A3的頻率成分。圖4B(b)示出了通過上述步驟檢測(cè)到的音符F3#的頻率成分。圖4B(c)示出了在將音符F3#(圖4B(b))從圖4B(a)中所示的波形中去除后留下的音符A3的頻率成分。
圖4C用于說明在上述情況下檢測(cè)和去除音符A3的過程。圖4C(a)示出了在將音符F3#從音符F3#和A3中去除后留在當(dāng)前幀的聲音信息中的音符A3的頻率成分。圖4C(b)示出了通過上述步驟檢測(cè)到的音符A3的頻率成分。圖4C(c)示出了在將音符A3(圖4C(b))從圖4C(a)所示的波形中去除后剩余的頻率成分。由于所有三個(gè)演奏音符都已經(jīng)被檢測(cè)出來,因此剩余的頻率成分具有接近零的強(qiáng)度。因此,剩余的頻率成分被認(rèn)為是由噪聲生成的。
圖5是根據(jù)本發(fā)明第二實(shí)施例的音樂分析設(shè)備的示意性框圖。
在本發(fā)明的第二實(shí)施例中,使用了樂器的聲音信息和待演奏的樂譜的信息。如果可以把具有不同頻率成分的各個(gè)音符的所有信息構(gòu)建到各種樂器的聲音信息中,則可準(zhǔn)確地分析輸入的數(shù)字聲音信號(hào)。但是,實(shí)際上由于難以將各個(gè)音符的所有信息構(gòu)建到各種樂器的聲音信息中,因此提供本發(fā)明的第二實(shí)施例以解決該問題。換言之,在本發(fā)明的第二實(shí)施例中,檢測(cè)音樂演奏的樂譜信息,基于特定的樂器的聲音信息和樂譜信息預(yù)測(cè)待輸入的音符,并且利用關(guān)于所預(yù)測(cè)的音符的信息來分析輸入的數(shù)字聲音。
參照?qǐng)D5,根據(jù)本發(fā)明第二實(shí)施例的音樂分析設(shè)備包含聲音信息存儲(chǔ)單元10、樂譜信息存儲(chǔ)單元20、數(shù)字聲音輸入單元210、頻率分析單元220、比較/分析單元230、單音分量檢測(cè)單元240、單音分量去除單元250、預(yù)期演奏值生成單元290、演奏聲音信息檢測(cè)單元160、演奏聲音信息輸出單元270和聲音信息選擇單元280。
聲音信息存儲(chǔ)單元10按照樂器的類型分別存儲(chǔ)聲音信息。聲音信息選擇單元280從聲音信息存儲(chǔ)單元10中存儲(chǔ)的不同類型的樂器的聲音信息中選擇所需樂器的聲音信息“A”,并輸出所選擇的聲音信息“A”。這里,聲音信息存儲(chǔ)單元10以波形數(shù)據(jù)或者不同頻率成分的強(qiáng)度的形式存儲(chǔ)聲音信息。在以波形數(shù)據(jù)的形式存儲(chǔ)聲音信息的情況下,如果聲音信息選擇單元280生成了聲音信息請(qǐng)求,則聲音信息存儲(chǔ)單元10從波形數(shù)據(jù)中檢測(cè)出所請(qǐng)求的聲音的頻率成分并且提供它們。
樂譜信息存儲(chǔ)單元20存儲(chǔ)關(guān)于要由特定樂器演奏的樂譜的信息。樂譜信息存儲(chǔ)單元20根據(jù)待演奏的樂譜來存儲(chǔ)和管理音調(diào)信息、音符長(zhǎng)度信息、節(jié)拍信息、節(jié)奏信息、音符強(qiáng)度信息、詳細(xì)演奏信息(例如,斷音、短斷音、逆波音)以及用于辨別用雙手演奏或者用多種樂器演奏的信息中的至少一種信息。
數(shù)字聲音輸入單元210接收外部演奏的音樂并且將其轉(zhuǎn)換成數(shù)字聲音信號(hào)。頻率分析單元220從數(shù)字聲音輸入單元210接收數(shù)字聲音信號(hào),將其分解成以幀為單位的頻率成分“F”,并且以幀為單位輸出頻率成分“F”。
當(dāng)通過數(shù)字聲音輸入單元210輸入了音樂聲時(shí),預(yù)期演奏值生成單元290開始工作,自它開始工作起隨著時(shí)間的推移,基于存儲(chǔ)在樂譜信息存儲(chǔ)單元20中的樂譜信息,以幀為單位生成預(yù)期演奏值“E”,并且以幀為單位輸出預(yù)期演奏值“E”。
比較/分析單元230接收從聲音信息選擇單元280輸出的聲音信息“A”、從頻率分析單元220以幀為單位輸出的頻率成分“F”以及從預(yù)期演奏值生成單元290輸出的預(yù)期演奏值“E”;從還未與頻率成分“F”進(jìn)行比較的預(yù)期演奏值“E”中選擇最低的預(yù)期演奏值“EL1”,檢測(cè)出對(duì)應(yīng)于該最低預(yù)期演奏值“EL1”的聲音信息“AL1”;并且判斷該聲音信息“AL1”是否包含在頻率成分“F”中。
單音分量檢測(cè)單元240接收對(duì)應(yīng)于該最低預(yù)期演奏值“EL1”的聲音信息“AL1”和頻率成分“F”。當(dāng)比較/分析單元230確定聲音信息“AL1”包含在頻率成分“F”中時(shí),單音分量檢測(cè)單元240檢測(cè)出聲音信息“AL1”作為單音分量“AS”。
同時(shí),單音分量檢測(cè)單元240檢測(cè)各幀的時(shí)間信息和包含在各幀中的各個(gè)單音符的音調(diào)和強(qiáng)度。另外,當(dāng)檢測(cè)到的單音分量“AS”是未包含在先前幀中的新的單音分量時(shí),單音分量檢測(cè)單元240將包含該新單音分量“AS”的當(dāng)前幀劃分成多個(gè)子幀,找出包含該新單音分量“AS”的子幀,并且檢測(cè)所找到的子幀的時(shí)間信息以及單音分量“AS”,即音調(diào)和強(qiáng)度信息。
當(dāng)比較/分析單元230確定聲音信息“AL1”未包含在頻率成分“F”中時(shí),單音分量檢測(cè)單元240檢測(cè)出表示聲音信息“AL1”被包含在多少各連續(xù)的幀中的歷史信息,并且當(dāng)聲音信息“AL1”沒有被包含在預(yù)定數(shù)量的連續(xù)幀中時(shí),從預(yù)期演奏值“E”中去除聲音信息“AL1”。
單音分量去除單元250從單音分量檢測(cè)單元240接收單音分量“AS”和頻率成分“F”,從頻率成分“F”中去除單音分量“AS”,并且將去除的結(jié)果(F←F-AS)傳送到比較/分析單元230。
同時(shí),當(dāng)預(yù)期演奏值生成單元290還沒有生成相對(duì)于已由頻率分析單元220生成了頻率成分的幀的預(yù)期演奏值時(shí),比較/分析單元230從聲音信息選擇單元290輸出的聲音信息“A”和從頻率分析單元220以幀為單位輸出的頻率成分“F”。接著,比較/分析單元230從當(dāng)前幀中的頻率成分“F”的各個(gè)峰值頻率中選擇出最低的峰值頻率“FPL”,并且從由聲音信息選擇單元280輸出的聲音信息“A”中檢測(cè)出包含該最低峰值頻率“FPL”的聲音信息“APL”。
單音分量檢測(cè)單元240從比較/分析單元230接收聲音信息“APL”、頻率成分“F”和最低峰值頻率“FPL”并且檢測(cè)具有與聲音信息“APL”中的最低峰值頻率“FPL”最接近的峰值信息的聲音信息“AF”,作為演奏錯(cuò)誤信息“Er”。另外,單音分量檢測(cè)單元240搜索樂譜信息,判斷在樂譜信息中接下來要演奏的音符中是否包含該演奏錯(cuò)誤信息“Er”。如果確定在樂譜信息中接下來要演奏的音符中包含演奏錯(cuò)誤信息“Er”,則單音分量檢測(cè)單元240將演奏錯(cuò)誤信息“Er”加到預(yù)期演奏值“E”上并且輸出對(duì)應(yīng)于演奏錯(cuò)誤信息“Er”的聲音信息作為單音分量“AS”。如果確定在樂譜信息中接下來要演奏的音符中不包含演奏錯(cuò)誤信息“Er”,則單音分量檢測(cè)單元240輸出對(duì)應(yīng)于演奏錯(cuò)誤信息“Er”的聲音信息作為錯(cuò)誤音符分量“ES”。
當(dāng)單音分量檢測(cè)單元240檢測(cè)到錯(cuò)誤音符分量“ES”時(shí),單音分量去除單元250從單音分量檢測(cè)單元240接收錯(cuò)誤音符分量“ES”和頻率成分“F”,從頻率成分“F”中去除錯(cuò)誤音符分量“ES”,并且將去除的結(jié)果(F←F-ES)傳送到比較/分析單元230。
接著,比較/分析單元230判斷從單音分量去除單元250接收到的頻率成分“F”是否包含有效的峰值頻率信息。當(dāng)確定在從單音分量去除單元250接收到的頻率成分“F”中包含有效的峰值頻率信息時(shí),比較/分析單元230執(zhí)行上述對(duì)單音分量去除單元250所接收的頻率成分“F”進(jìn)行的操作。但是,當(dāng)確定在從單音分量去除單元250接收到的頻率成分“F”中不包含有效的峰值頻率信息時(shí),比較/分析單元230從頻率分析單元220接收輸入數(shù)字聲音信號(hào)的下一幀的頻率成分,并且對(duì)該下一幀的頻率成分執(zhí)行上述操作。
演奏聲音信息檢測(cè)單元260和演奏聲音信息輸出單元270執(zhí)行與本發(fā)明第一實(shí)施例中的演奏聲音信息檢測(cè)單元160和演奏聲音信息輸出單元170相同的功能,因此這里省略對(duì)其詳細(xì)描述。
圖6是利用根據(jù)本發(fā)明第二實(shí)施例的音樂分析設(shè)備分析音樂的過程的流程圖。
下面的描述涉及利用根據(jù)本發(fā)明第二實(shí)施例的音樂分析設(shè)備基于不同類型的樂器的聲音信息分析外部輸入數(shù)字聲音的過程。
在生成和存儲(chǔ)(未示出)不同類型的樂器的聲音信息和待演奏的音樂的樂譜信息后,在步驟t100和t200中從所存儲(chǔ)的不同類型的樂器的聲音信息和樂譜信息中選擇出將實(shí)際演奏的一種特定樂器的聲音信息和實(shí)際演奏的音樂的樂譜信息。生成待演奏的音樂的樂譜信息的方法不在本發(fā)明的范圍之內(nèi)。目前,具有許多能夠掃描印刷在紙上的樂譜、將掃描的樂譜轉(zhuǎn)換成樂器數(shù)字接口(MIDI)音樂的演奏信息以及存儲(chǔ)演奏信息的技術(shù)。因此,將省略對(duì)生成和存儲(chǔ)樂譜信息的詳細(xì)描述。
樂譜信息包括,例如音調(diào)信息、音符長(zhǎng)度信息、節(jié)拍信息、節(jié)奏信息、音符強(qiáng)度信息、詳細(xì)演奏信息(例如,斷音、短斷音、逆波音)以及用于辨別利用雙手演奏或者利用多種樂器演奏的辨別信息。
在步驟t100和t200中選擇聲音信息和樂譜信息后,如果在步驟t300中輸入了數(shù)字聲音信號(hào),則在步驟t500中將數(shù)字聲音信號(hào)分解成以幀為單位的頻率成分。在步驟t600中,將數(shù)字聲音信號(hào)的頻率成分與所選擇的樂譜信息和所選擇的聲音信息的頻率成分進(jìn)行比較,并且進(jìn)行分析,以從數(shù)字聲音信號(hào)中檢測(cè)出當(dāng)前幀的演奏錯(cuò)誤信息和單聲信息。
接著,在步驟t700中輸出檢測(cè)到的單聲信息。
在步驟t800中可基于演奏錯(cuò)誤信息評(píng)估演奏準(zhǔn)確性。如果演奏錯(cuò)誤信息對(duì)應(yīng)于由演奏者有意演奏的音符(例如,變調(diào)),則在步驟t900中將演奏錯(cuò)誤信息添加到樂譜信息上。可選擇性地執(zhí)行步驟t800和t900。
圖6A是利用根據(jù)本發(fā)明第二實(shí)施例的音樂分析設(shè)備檢測(cè)當(dāng)前幀的單音信息和演奏錯(cuò)誤信息的步驟t600的流程圖。參照?qǐng)D6A,在步驟t610中檢測(cè)當(dāng)前幀的時(shí)間信息。在步驟t620中,將當(dāng)前幀的頻率成分與所選擇的特定樂器的聲音信息的頻率成分進(jìn)行比較并與樂譜信息進(jìn)行比較,并進(jìn)行分析以檢測(cè)出當(dāng)前幀中包含的各個(gè)單音符的音調(diào)、強(qiáng)度和時(shí)間信息。在步驟t640中,作為分析的結(jié)果,檢測(cè)當(dāng)前幀的單音信息和演奏錯(cuò)誤信息。
如果在步驟t650中確定對(duì)應(yīng)于所檢測(cè)到的單音信息的單音符是沒有包含在先前幀中的新的單音符,則在步驟t660中將當(dāng)前幀劃分成多個(gè)子幀。在步驟t670中,從這多個(gè)子幀中檢測(cè)出包含該新單音符的子幀。在步驟t680中檢測(cè)所檢測(cè)到的子幀的時(shí)間信息。在步驟t690中將該子幀的時(shí)間信息設(shè)定為該單音信息的時(shí)間信息。與第一實(shí)施例類似,當(dāng)該單音符處于低頻范圍內(nèi)時(shí)或者不要求時(shí)間信息的精度時(shí),可以省略步驟t650至步驟t690。
圖6B和圖6C是利用根據(jù)本發(fā)明第二實(shí)施例的音樂分析設(shè)備對(duì)當(dāng)前幀的頻率成分進(jìn)行比較和分析的步驟t620的流程圖。參照?qǐng)D6B和圖6C,在步驟t621中,對(duì)于演奏特定樂器時(shí)實(shí)時(shí)生成的數(shù)字聲音信號(hào),生成當(dāng)前幀的預(yù)期演奏值,并且判斷在當(dāng)前幀中是否存在還未與實(shí)際演奏聲音,即數(shù)字聲音信號(hào)比較過的預(yù)期演奏值。
如果在步驟t621中確定在當(dāng)前幀中不存在還未與數(shù)字聲音信號(hào)比較的預(yù)期演奏值,則在步驟t622至t628中,判斷當(dāng)前幀中的數(shù)字聲音信號(hào)的頻率成分是否對(duì)應(yīng)于演奏錯(cuò)誤信息;檢測(cè)演奏錯(cuò)誤信息和單音信息;并從當(dāng)前幀中的數(shù)字聲音信號(hào)中去除對(duì)應(yīng)于演奏錯(cuò)誤信息和單音信息的聲音信息的頻率成分。
具體而言,在步驟t622中選擇當(dāng)前幀中的輸入數(shù)字聲音信號(hào)的最低峰值頻率。在步驟t623中從特定樂器的聲音信息中檢測(cè)出包含所選峰值頻率的聲音信息。在步驟t624中,從步驟t623中檢測(cè)到的聲音信息中檢測(cè)出具有與所選峰值頻率的分量最接近的峰值信息的聲音信息,作為演奏錯(cuò)誤信息。如果在步驟t625中確定在根據(jù)樂譜信息而接下來要演奏的音符中包含該演奏錯(cuò)誤信息,則在步驟t626中將對(duì)應(yīng)于該演奏錯(cuò)誤信息的音符添加到預(yù)期演奏值上。接著,在步驟t627中將該演奏錯(cuò)誤信息設(shè)定為單音信息。在步驟t628中,將步驟t624或者步驟t627中檢測(cè)出的作為演奏錯(cuò)誤信息或者單音信息的聲音信息的頻率成分從數(shù)字聲音信號(hào)的當(dāng)前幀中去除。
如果在步驟t621中確定在當(dāng)前幀中存在還未與數(shù)字聲音信號(hào)比較的預(yù)期演奏值,則將數(shù)字聲音信號(hào)與一個(gè)或者多個(gè)預(yù)期演奏值進(jìn)行比較和分析,以檢測(cè)當(dāng)前幀的單音信息,并且在步驟t630至t634中,從數(shù)字聲音信號(hào)的當(dāng)前幀中去除對(duì)應(yīng)于單音信息的聲音信息的頻率成分。
具體而言,在步驟t630中,從對(duì)應(yīng)于一個(gè)或者多個(gè)預(yù)期演奏值的聲音信息中選擇出還未與數(shù)字聲音信號(hào)的當(dāng)前幀中包含的頻率成分進(jìn)行比較的最低音調(diào)的聲音信息。如果在步驟t631中確定在步驟t630中選擇的聲音信息的頻率成分被包含在數(shù)字聲音信號(hào)的當(dāng)前幀中所包含的頻率成分中,則在步驟t632中,把所選擇的聲音信息設(shè)定為單音信息。接著,在步驟t633中,從數(shù)字聲音信號(hào)的當(dāng)前幀中去除所選擇的聲音信息的頻率成分。如果在步驟t631中確定所選擇的聲音信息的頻率成分未被包含在數(shù)字聲音信號(hào)的當(dāng)前幀中所包含的頻率成分中,則在步驟t635中,對(duì)這一個(gè)或者多個(gè)預(yù)期演奏值進(jìn)行修正。重復(fù)步驟t630至t633,直至在步驟t634中確定對(duì)應(yīng)于這一個(gè)或者多個(gè)預(yù)期演奏值的每一個(gè)音符都已與當(dāng)前幀的數(shù)字聲音信號(hào)進(jìn)行了比較。
重復(fù)在圖6B和6C中所示的步驟t621至t628以及步驟t630至t635,直至在步驟t629中確定沒有峰值頻率成分留在當(dāng)前幀中的數(shù)字聲音信號(hào)中。
圖6D是利用根據(jù)本發(fā)明第二實(shí)施例的音樂分析設(shè)備修正一個(gè)或多個(gè)預(yù)期演奏值的步驟635的流程圖。參照?qǐng)D6D,如果在步驟t636中確定在步驟t630中選擇的聲音信息的頻率成分沒有被包含在至少預(yù)定數(shù)量的N個(gè)連續(xù)的先前幀N中,并且如果在步驟t637中確定所選擇的聲音信息的頻率成分已經(jīng)被包含在數(shù)字聲音信號(hào)的至少一個(gè)先前幀中,則在步驟t639中去除對(duì)應(yīng)于所選聲音信息的預(yù)期演奏值。或者,如果在步驟t636中確定所選聲音信息的頻率成分沒有被包含在至少預(yù)定數(shù)量的N個(gè)連續(xù)先前幀N中,并且如果在步驟t637中確定所選聲音信息的頻率成分從未包含在數(shù)字聲音信號(hào)的任何一個(gè)先前幀中,則在步驟t638中將所選擇的聲音信息設(shè)定為演奏錯(cuò)誤信息,并且在步驟t639中去除對(duì)應(yīng)于所選聲音信息的預(yù)期演奏值。
上述內(nèi)容僅涉及本發(fā)明的實(shí)施例。本發(fā)明不限于上述實(shí)施例,并且可在由附屬的權(quán)利要求所限定的保護(hù)范圍內(nèi)進(jìn)行各種改進(jìn)。例如,可改變?cè)趯?shí)施例中定義的各個(gè)元件的形狀和結(jié)構(gòu)。
工業(yè)實(shí)用性根據(jù)本發(fā)明的音樂分析設(shè)備使用聲音信息或者聲音信息和樂譜信息,從而快速地分析所輸入的數(shù)字聲音,并且提高了分析的準(zhǔn)確性。在分析數(shù)字聲音的常規(guī)方法中,不能分析由多音調(diào)構(gòu)成的音樂,例如,鋼琴音樂。但是,根據(jù)本發(fā)明,可快速準(zhǔn)確地分析數(shù)字聲音中包含的單音調(diào)以及多音調(diào)。
因此,根據(jù)本發(fā)明的分析數(shù)字聲音的結(jié)果可直接用于電子樂譜,并且可以利用該分析結(jié)果定量地檢測(cè)演奏信息。該分析結(jié)果可廣泛地應(yīng)用于從兒童的音樂教育到專業(yè)演奏家的練習(xí)。即,利用本發(fā)明的能夠?qū)崿F(xiàn)輸入數(shù)字聲音實(shí)時(shí)分析的技術(shù),可以實(shí)時(shí)識(shí)別電子樂譜上的當(dāng)前演奏音符的位置,并且可以在電子樂譜上自動(dòng)地指示接下來要演奏的音符的位置,從而演奏者可以專注于演奏而無需進(jìn)行紙質(zhì)樂譜的翻頁。
另外,本發(fā)明將作為分析結(jié)果而獲得的演奏信息與先前存儲(chǔ)的樂譜信息進(jìn)行比較以檢測(cè)演奏準(zhǔn)確性,從而演奏者可以知道錯(cuò)誤演奏。所檢測(cè)的演奏準(zhǔn)確性可用作對(duì)演奏者的演奏進(jìn)行評(píng)估的數(shù)據(jù)。
權(quán)利要求
1.一種用于分析音樂的設(shè)備,包括聲音信息存儲(chǔ)單元,其按照樂器的類型分別存儲(chǔ)聲音信息;聲音信息選擇單元,其從所述聲音信息存儲(chǔ)單元中存儲(chǔ)的不同類型的樂器的聲音信息中選擇出特定樂器的聲音信息,并輸出所選擇的聲音信息;數(shù)字聲音輸入單元,其接收外部演奏的音樂并且將其轉(zhuǎn)換成數(shù)字聲音信號(hào);頻率分析單元,其從所述數(shù)字聲音輸入單元接收數(shù)字聲音信號(hào),將其分解成多個(gè)頻率成分,并且以幀為單位輸出這些頻率成分;比較/分析單元,其接收從所述聲音信息選擇單元輸出的聲音信息和從所述頻率分析單元以幀為單位輸出的頻率成分,從所述頻率分析單元輸出的各個(gè)幀中的頻率成分的各個(gè)峰值頻率中選擇出最低的峰值頻率,并且從所述聲音信息選擇單元輸出的聲音信息中檢測(cè)出包含所述最低峰值頻率的聲音信息;單音分量檢測(cè)單元,其從所述比較/分析單元接收所檢測(cè)到的聲音信息、數(shù)字聲音信號(hào)的頻率成分和最低峰值頻率,并且檢測(cè)出具有與所述聲音信息中的最低峰值頻率最接近的峰值信息的聲音信息作為單音分量;單音分量去除單元,其從所述單音分量檢測(cè)單元接收已被用于檢測(cè)數(shù)字聲音信號(hào)的單音分量和頻率成分的最低峰值頻率,從所述頻率成分中去除所述最低峰值頻率,并且將該去除結(jié)果傳送到所述比較/分析單元;演奏聲音信息檢測(cè)單元,其組合所述單音分量檢測(cè)單元檢測(cè)到的各個(gè)單音分量以檢測(cè)演奏聲音信息;以及演奏聲音信息輸出單元,其輸出所述演奏聲音信息。
2.如權(quán)利要求1所述的設(shè)備,其中所述聲音信息存儲(chǔ)單元以波形數(shù)據(jù)的形式存儲(chǔ)不同類型樂器的聲音信息,當(dāng)由外部裝置生成了聲音信息請(qǐng)求時(shí),所述聲音信息存儲(chǔ)單元從所述波形數(shù)據(jù)中檢測(cè)出對(duì)應(yīng)于所述聲音信息請(qǐng)求的聲音信息的頻率成分,并且提供它們。
3.如權(quán)利要求1所述的設(shè)備,其中所述聲音信息存儲(chǔ)單元以可直接表示的不同頻率成分的強(qiáng)度的形式存儲(chǔ)不同類型樂器的聲音信息。
4.如權(quán)利要求1所述的設(shè)備,其中所述單音分量檢測(cè)單元檢測(cè)各個(gè)幀的時(shí)間信息,接著檢測(cè)各個(gè)幀中包含的各個(gè)單音符的音調(diào)和強(qiáng)度。
5.如權(quán)利要求4所述的設(shè)備,其中當(dāng)檢測(cè)到的單音分量是未包含在先前幀中的新的單音分量時(shí),單音分量檢測(cè)單元將包含該新單音分量的當(dāng)前幀分成多個(gè)子幀,找出包含該新單音分量的子幀,并且檢測(cè)所找到的子幀的時(shí)間信息以及對(duì)應(yīng)于各個(gè)單音分量的單音符的音調(diào)和強(qiáng)度信息。
6.如權(quán)利要求1所述的設(shè)備,其中當(dāng)確定從所述單音分量去除單元接收到的頻率成分中包含有效的峰值頻率信息時(shí),比較/分析單元從所述有效峰值頻率信息中選擇最低的峰值頻率,并且檢測(cè)出包含所選最低峰值頻率的聲音信息,當(dāng)確定從所述單音分量去除單元接收到的頻率成分中不包含有效的峰值頻率信息時(shí),比較/分析單元從頻率分析單元接收下一幀的頻率成分,從所接收的頻率成分中包含的各個(gè)峰值頻率中選擇最低的峰值頻率,并且檢測(cè)出包含該最低峰值頻率的聲音信息。
7.一種用于分析音樂的設(shè)備,包括聲音信息存儲(chǔ)單元,其按照樂器的類型分別存儲(chǔ)聲音信息;聲音信息選擇單元,其從所述聲音信息存儲(chǔ)單元中存儲(chǔ)的不同類型的樂器的聲音信息中選擇特定樂器的聲音信息,并輸出所選擇的聲音信息;樂譜信息存儲(chǔ)單元,其存儲(chǔ)關(guān)于要由特定樂器演奏的樂譜的信息,即樂譜信息;數(shù)字聲音輸入單元,其接收外部演奏的音樂并且將其轉(zhuǎn)換成數(shù)字聲音信號(hào);頻率分析單元,其從所述數(shù)字聲音輸入單元接收數(shù)字聲音信號(hào),將其分解成多個(gè)頻率成分,并且以幀為單位輸出這些頻率成分;預(yù)期演奏值生成單元,其響應(yīng)于外部控制信號(hào)而開始工作,自它開始工作起隨著時(shí)間的推移而基于所述樂譜信息存儲(chǔ)單元中存儲(chǔ)的樂譜信息以幀為單位生成預(yù)期演奏值,并且以幀為單位輸出所述預(yù)期演奏值;比較/分析單元,其接收從所述聲音信息選擇單元輸出的聲音信息、從所述頻率分析單元以幀為單位輸出的頻率成分、以及從所述預(yù)期演奏值生成單元輸出的預(yù)期演奏值,從還未與所述頻率成分進(jìn)行比較的預(yù)期演奏值中選擇最低的預(yù)期演奏值,檢測(cè)出對(duì)應(yīng)于所述最低預(yù)期演奏值的聲音信息,并且判斷所檢測(cè)到的對(duì)應(yīng)于所述最低預(yù)期演奏值的聲音信息是否被包含在所述頻率成分中;單音分量檢測(cè)單元,其接收對(duì)應(yīng)于所述最低預(yù)期演奏值的聲音信息和所述頻率成分,當(dāng)比較/分析單元確定在所述頻率成分中包含對(duì)應(yīng)于所述最低預(yù)期演奏值的聲音信息時(shí),檢測(cè)出所接收的聲音信息作為單音分量;單音分量去除單元,其從所述單音分量檢測(cè)單元接收所述單音分量和數(shù)字聲音信號(hào)的頻率成分,從所述頻率成分中去除所述單音分量,并且將去除結(jié)果傳送到所述比較/分析單元;演奏聲音信息檢測(cè)單元,其組合所述單音分量檢測(cè)單元檢測(cè)到的各個(gè)單音分量以檢測(cè)演奏聲音信息;以及演奏聲音信息輸出單元,其輸出所述演奏聲音信息。
8.如權(quán)利要求7所述的設(shè)備,其中所述單音分量檢測(cè)單元檢測(cè)各個(gè)幀的時(shí)間信息,接著檢測(cè)各個(gè)幀中包含的各個(gè)單音符的音調(diào)和強(qiáng)度。
9.如權(quán)利要求8所述的設(shè)備,其中當(dāng)檢測(cè)到的單音分量是未包含在先前幀中的新的單音分量時(shí),單音分量檢測(cè)單元將包含該新單音分量的當(dāng)前幀分成多個(gè)子幀,找出包含該新單音分量的子幀,并且檢測(cè)所找到的子幀的時(shí)間信息以及對(duì)應(yīng)于各個(gè)單音分量的單音符的音調(diào)和強(qiáng)度信息。
10.如權(quán)利要求7到9中任何一項(xiàng)所述的設(shè)備,其中當(dāng)比較/分析單元確定對(duì)應(yīng)于所述最低預(yù)期演奏值的聲音信息未被包含在所述頻率成分中時(shí),單音分量檢測(cè)單元檢測(cè)指示在多少個(gè)連續(xù)的幀中包含對(duì)應(yīng)于所述最低預(yù)期演奏值的聲音信息的歷史信息,并且當(dāng)對(duì)應(yīng)于所述最低預(yù)期演奏值的聲音信息沒有被包含在預(yù)定數(shù)量的連續(xù)幀中時(shí),從預(yù)期演奏值中去除對(duì)應(yīng)于所述最低預(yù)期演奏值的聲音信息。
11.如權(quán)利要求10所述的設(shè)備,其中當(dāng)由頻率分析單元生成了頻率成分的幀的預(yù)期演奏值還沒有生成時(shí),比較/分析單元接收從聲音信息選擇單元輸出的特定樂器的聲音信息和從頻率分析單元以幀為單位輸出的頻率成分,在當(dāng)前幀中的各個(gè)頻率成分的峰值頻率中選擇出最低的峰值頻率,并且從所述聲音信息選擇單元輸出的聲音信息中檢測(cè)出包含該最低峰值頻率的聲音信息。
12.如權(quán)利要求11所述的設(shè)備,其中單音分量檢測(cè)單元從所述比較/分析單元接收所檢測(cè)到的聲音信息、頻率成分和最低峰值頻率,從所述比較/分析單元檢測(cè)到的聲音信息中檢測(cè)出具有與所述最低峰值頻率最接近的峰值信息的聲音信息作為演奏錯(cuò)誤信息,當(dāng)確定樂譜信息中接下來要演奏的音符中包含該演奏錯(cuò)誤信息時(shí),把該演奏錯(cuò)誤信息添加到預(yù)期演奏值上,并且輸出對(duì)應(yīng)于該演奏錯(cuò)誤信息的聲音信息作為單音分量。
13.如權(quán)利要求12所述的設(shè)備,其中當(dāng)確定樂譜信息中接下來要演奏的音符中不包含演奏錯(cuò)誤信息時(shí),單音分量檢測(cè)單元輸出對(duì)應(yīng)于演奏錯(cuò)誤信息的聲音信息作為錯(cuò)誤音符分量。
14.如權(quán)利要求13所述的設(shè)備,其中單音分量去除單元從所述單音分量檢測(cè)單元接收錯(cuò)誤音符分量和頻率成分,從所述頻率成分中去除所述錯(cuò)誤音符分量,并且將去除結(jié)果傳送到所述比較/分析單元。
15.如權(quán)利要求13所述的設(shè)備,其中當(dāng)確定從單音分量去除單元接收到的頻率成分中包含有效的峰值頻率信息時(shí),比較/分析單元從單音分量去除單元接收所述頻率成分作為輸入,當(dāng)確定從單音分量去除單元接收到的頻率成分中不包含有效的峰值頻率信息時(shí),比較/分析單元從頻率分析單元接收下一幀輸入數(shù)字聲音信號(hào)的頻率成分。
16.如權(quán)利要求7所述的設(shè)備,其中所述聲音信息存儲(chǔ)單元以波形數(shù)據(jù)的形式存儲(chǔ)不同類型樂器的聲音信息,當(dāng)由外部裝置生成了聲音信息請(qǐng)求時(shí),所述聲音信息存儲(chǔ)單元從所述波形數(shù)據(jù)中檢測(cè)出對(duì)應(yīng)于所述聲音信息請(qǐng)求的聲音信息的頻率成分,并且提供它們。
17.如權(quán)利要求7所述的設(shè)備,其中所述聲音信息存儲(chǔ)單元以可直接表示的不同頻率成分的強(qiáng)度的形式存儲(chǔ)不同類型樂器的聲音信息。
全文摘要
本發(fā)明提供了一種基于樂器的聲音信息分析音樂的設(shè)備。該設(shè)備使用樂器的聲音信息或者聲音信息和樂譜信息來分析數(shù)字聲音。預(yù)先按照音調(diào)和強(qiáng)度存儲(chǔ)演奏而生成數(shù)字聲音的樂器的聲音信息,從而可以容易地分析樂器演奏的單音符和多音符。另外,同時(shí)利用樂器的聲音信息和樂譜信息,能準(zhǔn)確地分析輸入數(shù)字聲音并且能以定量數(shù)據(jù)的形式進(jìn)行檢測(cè)。
文檔編號(hào)G10H3/12GK1605096SQ02825414
公開日2005年4月6日 申請(qǐng)日期2002年12月10日 優(yōu)先權(quán)日2001年12月18日
發(fā)明者鄭道一 申請(qǐng)人:愉悅泰克株式會(huì)社