專利名稱:人聲自動校正的混音系統(tǒng)及其混音方法
技術領域:
本發(fā)明涉及一種混音系統(tǒng)及混音方法,特別是指一種人聲自動校正的混 音系統(tǒng)及其混音方法。
背景技術:
唱歌已經(jīng)成為現(xiàn)代人的休閑活動之一,因此當有人對自己的聲音與歌唱 技巧有一定的自信之后,便會進一步的想要把自己的聲音記錄下來,藉以分 享給其他人,因此錄音的需求也就不斷的提高。
錄音是指將聲音轉(zhuǎn)為類比信號或數(shù)位信號的過程。錄音的品質(zhì)受取樣頻
率和取樣解析度的影響。對于不同的聲音,適合的取樣頻率也有所不同音 樂的取樣頻率為10至20000赫茲(Hz );而人聲的取樣頻率為300至3400 赫茲。
雖然錄音的需求有所提高,但錄音設備過于昂貴以致于一般人買不起, 因此目前常見的錄音的方法通常是使用電腦播放伴奏歌曲,并使用連接電腦 的麥克風進行錄音,這樣的方式卻容易因為人為的失誤而造成人聲與伴奏歌 曲無法唱在最合適的時間,造成人聲與伴奏歌曲的不同歩,使得錄制后的歌 曲并不理想。
發(fā)明內(nèi)容
鑒于以上在先前技術中所提出目前常見的錄音方式容易發(fā)生人聲與伴 奏歌曲不同步的現(xiàn)況,本發(fā)明目的在于提供一種可以自動將人聲對正的混音 系統(tǒng)及混音方法,可以用來解決人聲無法唱在最合適的時間的問題。
于本發(fā)明所揭露的人聲自動校正的混音系統(tǒng),其包括有儲存模塊、分 析模塊、混音模塊。
于本發(fā)明所揭露的人聲自動校正的混音方法,其包括有記錄伴奏歌曲 與相對應的原始歌曲所有不同處的起始時間為第 一時間標記;讀取包含有人 聲的錄音歌曲;分析錄音歌曲中出現(xiàn)人聲的起始時間,并記錄為第二時間標 記;依序?qū)⒏鞯谝粫r間標記對應至各第二時間標記;依據(jù)各第一時間標記與 各第二時間標記的對應關系將錄音歌曲混合至伴奏歌曲中。
本發(fā)明的錄音系統(tǒng)及錄音方法是通過對應伴奏歌曲中有人聲的起始時 間與錄音歌曲中有人聲的起始時間的方式,來混合伴奏歌曲以及錄音歌曲, 藉以解決人聲無法唱在最合適的時間的問題。
對照于已知使用電腦與麥克風錄音所無法達到的對正人聲的功效,本發(fā) 明可以自動將人聲校正至正確的時間,使得錄音歌曲中的人聲可自動對應至 伴奏歌曲中最適合的位置,解決已知技術所無法達成的功效。
有關本發(fā)明的詳細特征與實作,茲配合圖示在實施方式中詳細i兌明如
且根據(jù)本說明書所揭露的內(nèi)容及圖式,任何熟習相關技藝者可輕易地理解本 發(fā)明相關的目的及優(yōu)點。
圖l是本發(fā)明所提的人聲自動校正的混音系統(tǒng)的系統(tǒng)架構圖。
圖2是本發(fā)明所提的人聲自動校正的混音方法的方法流程圖。
圖3A是本發(fā)明實施例所提的伴奏歌曲示意圖。
圖3B是本發(fā)明實施例所提的錄音歌曲示意圖。
圖3C是本發(fā)明實施例所提的混音歌曲示意圖。
具體實施例方式
以下先以圖1本發(fā)明所提的人聲自動校正的混音系統(tǒng)架構圖來說明本 發(fā)明的系統(tǒng)運作。如圖所示,本發(fā)明的系統(tǒng)含有儲存模塊110、分析模塊120、 混音模塊130。
本發(fā)明所提的原始歌曲是指包含有原唱歌手所唱的人聲以及有背景旋律的歌曲;本發(fā)明所提的伴奏歌曲是指有背景旋律而沒有原唱歌手所唱的人
聲的歌曲;而本發(fā)明所提的錄音歌曲是為錄音者跟隨伴奏歌曲進行啐唱所錄 下的聲音,可能僅只有人聲,也可能包含有人聲與伴奏歌曲。
儲存模塊110負責儲存伴奏歌曲、對應伴奏歌曲的錄音歌曲、及第一時 間標記,其中第一時間標記是伴奏歌曲與相對應的原始歌曲間,播放后的聲 音不同處的起始時間,也就是在原始歌曲中應該出現(xiàn)人聲的起始時間。
分析模塊120負責由儲存模塊110中讀出包含至少一人聲的錄音歌曲 后,分析錄音歌曲中出現(xiàn)人聲的起始時間,并記錄出現(xiàn)人聲的起始時間為第 二時間標記。由于分析人聲的技術已為已知技術,例如判斷聲音是否落在特 定(人聲)的頻率區(qū)間等方式,故不在本實施例中詳加說明。
混音模塊130負責依序?qū)⒌谝粫r間標記所包含的伴奏歌曲中應該有人 聲的起始時間對應至第二時間標記所包含的錄音歌曲中有人聲的起始時間, 并依據(jù)第一時間標記與第二時間標記的對應關系,將錄音歌曲混合至伴奏歌 曲中。
接著以一個實施例來解說本發(fā)明的運作系統(tǒng)與方法,并請參照圖2本發(fā) 明所提的人聲自動校正的混音方法流程圖。
由于伴奏歌曲310與相對應的原始歌曲差別在于伴奏歌曲310沒有人 聲,而原始歌曲有原唱歌手的人聲,因此,在前奏以及間奏等部分,也就是 沒有人聲的部分,伴奏歌曲310與相對應的原始歌曲,在同一個播放的時間 點的聲音將會是相同的,而在原唱歌手發(fā)出人聲進行唱歌時,伴奏歌曲310 與原始歌曲在同 一個播放的時間點的聲音會不同。在本實施例中所4是的伴奏 歌曲310,如圖3A所示,在0:22至2:13、 2:33至3:59、以及4:15至4:33 處,與伴奏歌曲310相對應的原始歌曲有人聲。
在本發(fā)明中,儲存模塊IIO會預先儲存伴奏歌曲310以及第一時間標記 (步驟210)。 一般而言,原始歌曲的人聲會有多個段落,所以第一時間標 記通常是由好幾個應該有人聲的起始時間所組成,因此,本實施例的第一時 間標i己為0:22、 2:33、以及4:15。
本發(fā)明的分析模塊120會由儲存模塊110中讀出對應伴奏歌曲310的錄
音歌曲320 (步驟230),若錄音歌曲320中只有人聲,并未包含伴奏歌曲 310或其他旋律,則分析模塊120可以輕易的分析出錄音歌曲320中有人聲 的部分,并將有人聲的部分的起始時間記錄下來,成為第二時間標記(步驟 240),如圖3B所示,在0:23至2:13、 2:33至3:58、以及4:15至4:34處有 人聲,因此第二時間標記為0:23、 2:33、以及4:15。
接著,本發(fā)明的混音模塊130會分別將第一時間標記依序?qū)恋诙r 間標記,并依據(jù)對應的關系進行混音,也就是混音模塊130會將伴奏歌曲 310的0:22對應至錄音歌曲320的0:23、伴奏歌曲310的2:33對應至錄音 歌曲320的2:33、伴奏歌曲310的4:15對應至錄音歌曲320的4:15,在對 應完成之后,混音模塊130會把伴奏歌曲310由0:22開始,把錄音歌曲320 由0:23開始進行混音,意即錄音歌曲320是由0:23處開始混入伴奏歌曲310 的0:22處,同樣的,混音模塊130會依序把錄音歌曲320由2:33、及4:15 處開始混入伴奏歌曲310的2:33、及4:15處(步驟260 ),混合后即可產(chǎn)生 混音完成的混音歌曲330,如圖3C所示。
在圖3C中亦可以發(fā)現(xiàn),雖然錄音歌曲在2:33處所開始的人聲并非在 3:59結(jié)束,而是提前于3:58結(jié)束;另外由4:15處開始的人聲亦非于4:33結(jié) 束,而是延后于4:34結(jié)束,但本發(fā)明僅進行混音而沒有對提前結(jié)束或延后 結(jié)束的部分進行額外的處理。
如此,本發(fā)明即可以自動的4巴錄音歌曲320中的人聲對應至伴奏歌曲 310中最適合的時間點,解決先前技術所提的錄音時容易因為人為失誤而造 成人聲與伴奏歌曲不同步的問題。
事實上,本發(fā)明并不僅限于被動的等待第 一時間標記被使用者儲存至儲 存模塊110中,因此本發(fā)明更包含了偵測模塊160,負責在儲存模塊110儲 存有原始歌曲時,偵測原始歌曲與伴奏歌曲310播放的聲音不同之處,并將 之記錄至儲存模塊110中藉以形成第一時間標記,偵測模塊160偵測的原理 如本實施例開始時所述,偵測同一個播放的時間點伴奏歌曲310與原始歌曲 播放出的聲音是否相同, 一旦聲音不同,偵測模塊160即會將伴奏歌曲310 與原始歌曲播放出的聲音不同的時間點偵測出來,并將之記錄為第 一時間標 記。而偵測的方式可由偵測模塊160直接開啟儲存于儲存模塊110中的原始
歌曲與伴奏歌曲310的檔案進行比對,不一定需要將原始歌曲與伴奏歌曲
310進行播放才可比對,由于比對的方式為已知技術,因此在本實施例中不 詳細說明。另外,偵測模塊160也可以直接偵測伴奏歌曲310所對應的原始 歌曲中有人聲的部分,藉以將有人聲的起始時間記錄為第一時間標記,藉以 提供混音模塊130混合伴奏歌曲310及錄音歌曲320,其中偵測人聲的技術 亦為已知,因此不再額外i兌明。
本發(fā)明亦可以包含錄音模塊170,用以接收使用者所發(fā)出的聲音,并將 之儲存至儲存模塊110中形成錄音歌曲320 (步驟220 ),使得分析模塊120 得以讀取錄音歌曲320 (步驟230)并進行人聲的分析而獲得第二時間標記 并將之記錄(步驟240)。也就是說,本發(fā)明所提的錄音歌曲320可以預先 儲存至儲存模塊110中,也可以經(jīng)由錄音模塊170錄下人聲而儲存。
此外,本發(fā)明更可以包含過濾模塊190,用以由儲存模塊110中讀出錄 音歌曲320,并依據(jù)分析模塊120分析后所得知的沒有人聲的時間過濾錄音 歌曲320中無人聲的部分的雜音(步驟250),使得混音模塊130在混合伴 奏歌曲310與錄音歌曲320時,錄音歌曲320中的雜音可以被過濾模塊190 去除,提高混音后的品質(zhì)。
當本發(fā)明包含過濾模塊190時,若錄音歌曲320并不只包含人聲,而也 包含了伴奏歌曲310,則分析模塊120在讀出錄音歌曲320后(步驟230), 將對錄音歌曲320進行分析,藉以分析出錄音歌曲320中有人聲的部分,并 將有人聲的部分的起始時間記錄為第二時間標記(步驟240),而后過濾模 塊190便會依據(jù)分析模塊120的分析結(jié)果,將只有伴奏而沒有人聲的部分過 濾成為靜音(步驟250),如此混音才莫塊130便可以混合伴奏歌曲310及錄 音歌曲320中有人聲的部分。
再者,本發(fā)明的人聲自動校正的混音方法,可實現(xiàn)于硬件、軟件或硬件 與軟件的組合中,亦可在電腦系統(tǒng)中以集中方式實現(xiàn)或以不同元件散布于若 干互連的電腦系統(tǒng)的分散方式實現(xiàn)。
雖然本發(fā)明以前述的實施例揭露如上,然其并非用以限定本發(fā)明,任何 熟習本發(fā)明所屬技術領域的技藝者,在不脫離本發(fā)明的精神和范圍內(nèi),所為 的更動與潤飾,均屬本發(fā)明的專利保護范圍,因此本發(fā)明的專利保護范圍須 視本說明書所附的權利要求范圍所界定者為準。
權利要求
1、一種人聲自動校正的混音方法,該混音方法包含下列步驟記錄一伴奏歌曲對應的一原始歌曲中有人聲的起始時間為第一時間標記;讀取包含有至少一人聲的一錄音歌曲,其中該錄音歌曲對應該伴奏歌曲;分析該錄音歌曲,并將該錄音歌曲中出現(xiàn)該人聲的起始時間記錄為第二時間標記;依序?qū)⒏髟摰诙r間標記對應至各該第一時間標記;及依據(jù)各該第一時間標記與各該第二時間標記的對應關系將該錄音歌曲混合至該伴奏歌曲中。
2、 如權利要求1所述的人聲自動校正的混音方法,其中該記錄該第一 時間標記的步驟更包含比對該原始歌曲與該伴奏歌曲,當該原始歌曲與該伴 奏歌曲于同 一時間點所播放的聲音不同時,記錄該不同處的起始時間為該第 一時間標記的步驟。
3、 如權利要求1所述的人聲自動校正的混音方法,其中該記錄該第一 時間標記的步驟更包含偵測該原始歌曲中有人聲的起始時間,記錄該起始時 間為該第 一 時間標記的步驟。
4、 如權利要求1所述的人聲自動校正的混音方法,更包含過濾該錄音 歌曲中無人聲的部分,使該無人聲的部分形成靜音的步驟。
5、 如權利要求4所述的人聲自動4交正的混音方法,其中該過濾該錄音據(jù)分析結(jié)果過濾該錄音歌曲中無人聲的部分的步驟。
6、 一種人聲自動校正的混音系統(tǒng),該混音系統(tǒng)包含一儲存模塊,用以儲存一伴奏歌曲、與該伴奏歌曲相對應且包含有至少 一人聲的一錄音歌曲,及記錄與該伴奏歌曲對應的一原始歌曲中有人聲的起始時間為第一時間標記;一分析模塊,用以分析該錄音歌曲中出現(xiàn)該人聲的起始時間,并記錄為第二時間標記;及一混音模塊,用以將各該第二時間標記依序?qū)粮髟摰谝粫r間標記, 并依據(jù)各該第 一 時間標記與各該第二時間標記的對應關系將該錄音歌曲混 合至該伴奏歌曲中。
7、 如權利要求6所述的人聲自動校正的混音系統(tǒng),其中該儲存模塊更 用以儲存該原始歌曲。
8、 如權利要求7所述的人聲自動校正的混音系統(tǒng),更包含一偵測模塊, 用以比對該原始歌曲與該伴奏歌曲于同 一個時間點被播放時的聲音,當該原 始歌曲與該伴奏歌曲的聲音不同時,將該不同處的起始時間定義為該第 一時 間標記并儲存至該儲存模塊中。
9、 如權利要求7所述的人聲自動校正的混音系統(tǒng),更包含一偵測模塊, 用以偵測該原始歌曲中有人聲的起始時間,將該起始時間儲存至該儲存模塊 中成為該第一時間標記。
10、 如權利要求6所述的人聲自動校正的混音系統(tǒng),更包含一過濾模 塊,用以依據(jù)該分析模塊分析該錄音歌曲的結(jié)果,過濾該錄音歌曲中無人聲 的部分,使該無人聲的部分形成靜音。
全文摘要
一種人聲自動校正的混音系統(tǒng)及其混音方法,目的在于解決錄音時人聲不易對正伴奏歌曲的問題,于本發(fā)明所揭露的人聲自動校正的混音方法,其包括有記錄伴奏歌曲與相對應的原始歌曲所有不同處的起始時間為第一時間標記;讀取包含有人聲的錄音歌曲;分析錄音歌曲中出現(xiàn)人聲的起始時間,并記錄為第二時間標記;依序?qū)⒏鞯谝粫r間標記對應至各第二時間標記;依據(jù)各第一時間標記與各第二時間標記的對應關系將錄音歌曲混合至伴奏歌曲中。其依序?qū)浺舾枨杏腥寺暤钠鹗紩r間對應至伴奏歌曲中應該有人聲的起始時間,進而混合錄音歌曲以及伴奏歌曲,藉以達到人聲自動校正的功效。
文檔編號G10H1/36GK101345047SQ20071012942
公開日2009年1月14日 申請日期2007年7月12日 優(yōu)先權日2007年7月12日
發(fā)明者劉曉安, 邱全成 申請人:英業(yè)達股份有限公司