專利名稱:歌聲合成系統(tǒng)、方法以及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種歌聲合成技術(shù),尤其涉及一種能夠產(chǎn)生擬真歌聲的歌聲合成系 統(tǒng)、裝置及方法。
背景技術(shù):
近年來,隨著信息科技的發(fā)展逐漸成熟,電子計(jì)算裝置所具備的處理能力也大 幅提升,使得許多復(fù)雜的應(yīng)用得以實(shí)現(xiàn),其中之一便是語(yǔ)音或歌聲合成的相關(guān)技術(shù)。一 般而言,語(yǔ)音合成可泛指為以人工方式產(chǎn)生接近真人語(yǔ)音的技術(shù),目前已有許多相關(guān)應(yīng) 用存在,例如虛擬歌手、電子寵物、練唱軟件、作曲家與歌手的仿真組合等,其相應(yīng) 的需求也逐日漸增。而在傳統(tǒng)架構(gòu)上,如圖1所示,普遍的語(yǔ)音、歌聲合成方法必須預(yù)先 錄制真人的語(yǔ)音數(shù)據(jù)以建立語(yǔ)料庫(kù)(Corpus Database) 20,以此作為文字與語(yǔ)音之間轉(zhuǎn)換 的依據(jù),其中語(yǔ)料的輸入又可分為單音節(jié)語(yǔ)料6ingle-Syllable-basedCorpus)21的輸入, 以中文為例iI、夕、π等中文單音節(jié),還有字詞語(yǔ)料(Coarticulation-basedCorpus)22 的輸入,如明天、后天等等,以及歌曲詞句語(yǔ)料6ong-basedCorpus)23的輸入。
圖1為顯示傳統(tǒng)歌聲合成方法的流程圖。首先,輸入選定歌曲的樂器數(shù)字接口 (Musical Instrument Digital Interface, MIDI)文件與歌詞數(shù)據(jù),其中該樂器數(shù)字接口文件 包含有選定歌曲的樂譜(score),包括節(jié)拍與音符等信息,在步驟S101,根據(jù)所輸入的樂 器數(shù)字接口文件與歌詞數(shù)據(jù)進(jìn)行字詞切割(Word Segmentation)取得語(yǔ)音卷標(biāo)(Phonetic Label),然后在步驟S102進(jìn)行字詞推導(dǎo),從語(yǔ)料庫(kù)20中挑選出最符合的語(yǔ)料,而后在步 驟S103調(diào)校音長(zhǎng)(duration)與音高(pitch),最后,在步驟S103進(jìn)行音與音之間的連接與 平滑處理、加入回音效果、伴奏音樂,并得到合成的歌聲。然而,上述傳統(tǒng)技術(shù)卻存在 下列缺點(diǎn)
(一)建立語(yǔ)料庫(kù)需耗費(fèi)長(zhǎng)時(shí)間進(jìn)行語(yǔ)料的錄制,且語(yǔ)料庫(kù)需要龐大的儲(chǔ)存空 間。
(二)字詞推導(dǎo)程序復(fù)雜,需耗費(fèi)大量系統(tǒng)資源,且容易發(fā)生字詞切割錯(cuò)誤的問 題。
(三)以中文語(yǔ)言而言,歌聲合成的效果不佳,聽起來有明顯的機(jī)械音。
(四)受限于預(yù)錄的語(yǔ)料庫(kù),只能產(chǎn)出固定音色,若要更換音色則必須重新錄制 語(yǔ)料庫(kù)。
(五)整體程序復(fù)雜,產(chǎn)生合成歌聲所需時(shí)間較長(zhǎng),無法實(shí)時(shí)取得合成歌聲。
因此,整體而言,傳統(tǒng)的歌聲合成方法在成本上、效率上以及合成歌聲的流暢 度上,無法滿足一般使用者的需求。發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種直覺式的歌聲合成系統(tǒng)、方法以及裝置,讓使用者 不必熟習(xí)樂理或擅長(zhǎng)歌唱,只要用口語(yǔ)的方式按照節(jié)拍輸入聲音信號(hào),即可得到擁有個(gè)人音色的歌聲。
本發(fā)明所提供的歌聲合成系統(tǒng),包括一儲(chǔ)存單元、一節(jié)拍單元、一輸入單元、 以及一處理單元。儲(chǔ)存單元用以儲(chǔ)存至少一旋律;節(jié)拍單元用以依據(jù)上述至少一旋律中 一特定旋律來提示一節(jié)拍;輸入單元用以接收多個(gè)聲音信號(hào),其中上述聲音信號(hào)對(duì)應(yīng)上 述特定旋律;處理單元用以依據(jù)上述特定旋律及上述聲音信號(hào)產(chǎn)生一合成歌聲信號(hào)。
本發(fā)明所提供的歌聲合成方法,適用于一電子計(jì)算裝置,其步驟包括根據(jù)一旋 律提示一節(jié)拍;透過上述電子計(jì)算裝置的一收音模塊接收多個(gè)聲音信號(hào),其中上述聲音 信號(hào)對(duì)應(yīng)上述特定旋律;依據(jù)上述特定旋律及上述聲音信號(hào)產(chǎn)生一合成歌聲信號(hào),并透 過上述電子計(jì)算裝置的一播音模塊輸出上述合成歌聲信號(hào)。
本發(fā)明所提供的歌聲合成裝置,包括一殼體、一儲(chǔ)存器、一節(jié)拍機(jī)構(gòu)、一收音 器、以及一處理器。儲(chǔ)存器設(shè)置于上述殼體內(nèi)部,連接至上述處理器,儲(chǔ)存有至少一旋 律;節(jié)拍機(jī)構(gòu)設(shè)置于上述殼體外部,連接至上述處理器,依據(jù)上述至少一旋律中一特定 旋律來提示一節(jié)拍;由收音器設(shè)置于上述殼體外部,連接至上述處理器,接收多個(gè)聲音 信號(hào),其中上述聲音信號(hào)對(duì)應(yīng)上述特定旋律;以及,處理器設(shè)置于上述殼體內(nèi)部,依據(jù) 上述特定旋律及上述聲音信號(hào)產(chǎn)生一合成歌聲信號(hào)。
本發(fā)明實(shí)施例中的聲音信號(hào)是使用者依據(jù)該旋律、節(jié)拍所誦讀或哼唱所產(chǎn)生, 因此每個(gè)聲音信號(hào)分別對(duì)應(yīng)至該旋律及其節(jié)拍,可直接將該聲音信號(hào)進(jìn)行處理,節(jié)省現(xiàn) 有技術(shù)中需大量預(yù)先錄制的大量使用者語(yǔ)料庫(kù)的時(shí)間和成本,達(dá)到節(jié)省系統(tǒng)資源以及加 速歌曲合成速度的效果,而且最終獲得的合成歌聲更具有使用者的音色,且效果相當(dāng)擬直ο
此處所說明的附圖用來提供對(duì)本發(fā)明的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,并 不構(gòu)成對(duì)本發(fā)明的限定。在附圖中
圖1為根據(jù)傳統(tǒng)語(yǔ)音合成架構(gòu)所述的歌聲合成方法的流程圖。
圖2為根據(jù)本發(fā)明一實(shí)施例所述的歌聲合成裝置的架構(gòu)圖。
圖3為根據(jù)本發(fā)明一實(shí)施例所述的語(yǔ)音輸入誤差偵測(cè)示意圖。
圖4為根據(jù)本發(fā)明一實(shí)施例所述使用基周同步疊加法的音高調(diào)校示意圖。
圖5為根據(jù)本發(fā)明一實(shí)施例所述使用交叉消退法的音高調(diào)校示意圖。
圖6A、6B為根據(jù)本發(fā)明一實(shí)施例所述使用重新取樣法的音高調(diào)校示意圖。
圖7A、7B、7C為根據(jù)本發(fā)明一實(shí)施例所述使用貝茲曲線的平滑處理示意圖。
圖8為根據(jù)本發(fā)明一實(shí)施例所述的歌聲合成方法的流程圖。
圖9A、9B、9C、9D為根據(jù)本發(fā)明其它實(shí)施例所述的歌聲合成方法的流程圖。
圖10為根據(jù)本發(fā)明一實(shí)施例所述的歌聲合成裝置的架構(gòu)圖。
附圖標(biāo)號(hào)
20 語(yǔ)料庫(kù);
21 單音節(jié)語(yǔ)料;
22 字詞語(yǔ)料;
23 歌曲詞句語(yǔ)料;
200 -歌聲合成系統(tǒng);
201 -儲(chǔ)存單元;
202 -節(jié)拍單元;
203 -輸入單元;
204 -處理單元;
1000 歌聲合成裝置
1010 夕卜殼;
1020 儲(chǔ)存器;
1030 節(jié)拍機(jī)構(gòu);
1040 收音器;
1050 處理器。
具體實(shí)施方式
為使本發(fā)明的目的、特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉一些較佳實(shí)施例,并 配合附圖作詳細(xì)說明如下
圖2為根據(jù)本發(fā)明一實(shí)施例所述的歌聲合成系統(tǒng)的架構(gòu)圖。歌聲合成系統(tǒng)200中 包含有儲(chǔ)存單元201、節(jié)拍單元202、輸入單元203以及處理單元204。當(dāng)一歌曲要進(jìn)行歌 聲合成時(shí),儲(chǔ)存單元201儲(chǔ)存有多首歌曲的旋律,可提供該歌曲的旋律給節(jié)拍單元202, 節(jié)拍單元202再根據(jù)該歌曲的旋律提示對(duì)應(yīng)的節(jié)拍(tempo),該節(jié)拍指的是依據(jù)該歌曲旋 律的固定頻率的拍子,可輔助使用者以口語(yǔ)的方式誦讀或哼唱該歌曲的歌詞,輸入單元 203則用以接收上述使用者誦讀或哼唱所產(chǎn)生的多個(gè)聲音信號(hào),上述聲音信號(hào)對(duì)應(yīng)上述該 旋律,且符合該節(jié)拍。最后,處理單元204再依據(jù)該旋律和上述聲音信號(hào)進(jìn)行處理,產(chǎn) 生一合成歌聲信號(hào)。
在某些實(shí)施例中,上述旋律可為一聲波(WaveformAudio,WAV)文件,節(jié)拍單元202可通過拍子追蹤(beat tracking)的技術(shù)標(biāo)記出該歌曲的節(jié)拍。而在其它實(shí)施例中, 上述旋律可為一樂器數(shù)字接口(Musical Instrument Digitalbiterface,MIDI)文件,節(jié)拍單元202可直接抓取樂器數(shù)字接口文件中的節(jié)拍事件(tempo event)數(shù)據(jù)以得到該歌曲的節(jié) 拍。而節(jié)拍單元202依據(jù)旋律來提示的節(jié)拍,可以有多種實(shí)施方式,如經(jīng)由一顯示單元 所產(chǎn)生的視覺信號(hào),例如移動(dòng)、跳躍、閃爍或變色的符號(hào);或?yàn)橛梢惠敵鰡卧a(chǎn)生的 聲音信號(hào),例如模仿節(jié)拍器的「答、答 」聲,或是由一機(jī)械結(jié)構(gòu)所提供的節(jié)拍動(dòng)作, 例如搖擺、旋轉(zhuǎn)、跳動(dòng)或是如節(jié)拍器的擺針擺動(dòng);亦或是由一發(fā)光單元所產(chǎn)生燈光的閃 爍、變色等。
在某些實(shí)施例中,為了讓使用者所輸入的多個(gè)聲音信號(hào)的節(jié)奏(rhythm)具有一 定程度的正確性,節(jié)奏分析單元(未繪示)在接收到使用者所輸入的多個(gè)聲音信號(hào)后, 根據(jù)該歌曲的旋律判斷該聲音信號(hào)所具有的既定節(jié)奏是否超過一預(yù)設(shè)容許誤差值,該節(jié) 奏指的是歌詞的每個(gè)字配合旋律出現(xiàn)的快慢狀態(tài)。如果上述既定節(jié)奏超過預(yù)設(shè)容許誤差 值,則節(jié)奏分析單元(未繪示)提示使用者重復(fù)上述輸入聲音信號(hào)的步驟;此關(guān)于判斷節(jié) 奏誤差的運(yùn)作細(xì)節(jié)將在稍后在圖3進(jìn)一步描述?;蛘撸?jié)奏分析單元(未繪示)也可以 設(shè)計(jì)成在接收到使用者所輸入的多個(gè)語(yǔ)音信號(hào)后,再進(jìn)一步將該聲音信號(hào)輸出由使用者自行決定是否接受此錄制版本,若不接受,則提供一操作接口以供使用者操作選擇重新 輸入多個(gè)聲音信號(hào),以取代舊聲音信號(hào)。另外,在其它實(shí)施例中,使用者也可以歌唱的 方式產(chǎn)生并輸入該聲音信號(hào),或者也可輸入事先所錄制或處理過的聲音信號(hào)。
上述處理單元204主要是依據(jù)該旋律和上述聲音信號(hào)進(jìn)行處理,產(chǎn)生一合成歌 聲信號(hào)。在一些實(shí)施例中,所進(jìn)行的處理包括將上述聲音信號(hào)執(zhí)行音高拉平以取得多個(gè) 相同音高信號(hào),以及依據(jù)該旋律,將上述相同音高信號(hào)調(diào)校至對(duì)應(yīng)于該歌曲的旋律所指 示的多個(gè)標(biāo)準(zhǔn)音高,以取得多個(gè)調(diào)校后聲音信號(hào)。更進(jìn)一步時(shí),可再將該調(diào)校過的多個(gè) 調(diào)校后聲音信號(hào)執(zhí)行平滑處理,以產(chǎn)生一平滑處理后聲音信號(hào)。以下再以一些詳細(xì)實(shí)施 例來進(jìn)行說明。
在一些實(shí)施例中,處理單元204可執(zhí)行一音高分析程序,透過音高追蹤(Pitch Tracking),音高標(biāo)記(Pitch Marking),以將上述聲音信號(hào)執(zhí)行音高拉平以取得多個(gè)相同 音高信號(hào)。接著,處理單元204針對(duì)多個(gè)相同音高信號(hào)執(zhí)行音高調(diào)校程序,例如運(yùn)用基 周同步疊加法(Pitch SynchronousOverLap-Add,PSOLA)、交叉消退法(Cross-Fadding) 或重新取樣法(Resample),將多個(gè)相同音高信號(hào)分別調(diào)校至對(duì)應(yīng)于該歌曲的旋律所指示 的多個(gè)標(biāo)準(zhǔn)音高,以取得多個(gè)調(diào)校后聲音信號(hào);此關(guān)于基周同步疊加法、交叉消退法以 及重新取樣法的運(yùn)作細(xì)節(jié)將在稍后分別在圖4、圖5、圖6A與圖6B中進(jìn)一步描述。然 后,處理單元204再針對(duì)多個(gè)調(diào)校后聲音信號(hào)執(zhí)行平滑處理程序,例如運(yùn)用線性內(nèi)插法 (interpolation)、雙線性內(nèi)插法或多項(xiàng)式內(nèi)插法將上述調(diào)校后聲音信號(hào)連接起來以取得一 平滑處理后聲音信號(hào);其中關(guān)于多項(xiàng)式內(nèi)插法的運(yùn)作細(xì)節(jié)將在稍后在圖7A 7C中進(jìn)一 步描述。
在另一些實(shí)施例中,處理單元204進(jìn)一步將該平滑處理后聲音信號(hào)執(zhí)行歌聲特 效處理程序,其可根據(jù)歌聲合成系統(tǒng)200的系統(tǒng)負(fù)載狀況決定取樣音框的大小,然后將 該平滑處理后聲音信號(hào)以取樣音框大小依序進(jìn)行音量調(diào)整、加入抖音以及加入回音效 果,產(chǎn)生一特效處理后聲音信號(hào)。在另一些實(shí)施例中,處理單元204可針對(duì)上述的多 種聲音信號(hào),如多個(gè)調(diào)校后聲音信號(hào)、平滑處理后聲音信號(hào)或特效處理后聲音信號(hào)等, 執(zhí)行伴奏合成程序,將該歌曲的伴奏音樂與上述各種聲音信號(hào)合成以取得一伴奏歌聲信 號(hào)。前述的調(diào)校后聲音信號(hào)、平滑處理后聲音信號(hào)、特效處理后聲音信號(hào)、伴奏歌聲信 號(hào)等,皆為本發(fā)明的合成歌聲信號(hào)的實(shí)施樣態(tài),一合成歌聲信號(hào)可以是一包含有多個(gè)聲 音信號(hào)(如上述調(diào)校后、平滑處理后、特效處理后或伴奏處理后的聲音信號(hào))的檔案, 且該合成歌聲即具有該使用者的音色。在某些實(shí)施例中,歌聲合成系統(tǒng)200可再包括一 輸出單元,用以將合成歌聲信號(hào)輸出,而該輸出單元可更進(jìn)一步結(jié)合節(jié)拍單元202或其 它顯示單元,在輸出該合成歌聲信號(hào)時(shí),依據(jù)該合成歌聲信號(hào)來顯示節(jié)拍,如上述的搖 擺、旋轉(zhuǎn)、跳動(dòng)等動(dòng)作,或移動(dòng)、跳躍、閃爍、變色等視覺符號(hào),或模仿節(jié)拍器「答、 答 」聲的聲音信號(hào)等。
圖3為根據(jù)本發(fā)明一實(shí)施例所述的判斷節(jié)奏誤差的示意圖。如圖3所示,一段 歌詞的聲音信號(hào)輸入包括有歌詞1 歌詞3。在某些實(shí)施例中,儲(chǔ)存單元201中除了儲(chǔ)存 上述歌曲的旋律之外,可進(jìn)一步儲(chǔ)存對(duì)應(yīng)該旋律的歌詞,以及對(duì)應(yīng)于歌詞的節(jié)奏。節(jié)奏 分析單元(未繪示)根據(jù)歌曲的旋律取得這段歌詞的標(biāo)準(zhǔn)節(jié)拍r(i),其中r(l)、rO)代表 歌詞1的時(shí)間區(qū)間端點(diǎn),r(3)、r(4)代表歌詞2的時(shí)間區(qū)間端點(diǎn),r(5)、r(6)代表歌詞3的時(shí)間區(qū)間端點(diǎn),位于時(shí)間區(qū)間端點(diǎn)前的虛線代表提前輸入的誤差容許時(shí)間,位于時(shí)間 區(qū)間端點(diǎn)后的虛線代表延遲輸入的誤差容許時(shí)間,所以截線與虛線所形成的區(qū)間即為誤 差容許值μ。而使用者所輸入的多個(gè)語(yǔ)音信號(hào)具有一既定節(jié)奏,該既定節(jié)奏以c(i)表 示,那么在此實(shí)施例中,累計(jì)誤差值可用計(jì)算公式(1)表示
權(quán)利要求
1.一種歌聲合成系統(tǒng),其特征在于,所述歌聲合成系統(tǒng)包括一儲(chǔ)存單元,用以儲(chǔ)存至少一旋律;一節(jié)拍單元,用以依據(jù)所述至少一旋律中一特定旋律來提示一節(jié)拍;一輸入單元,用以接收多個(gè)聲音信號(hào),其中所述聲音信號(hào)對(duì)應(yīng)所述特定旋律;以及一處理單元,用以依據(jù)所述特定旋律處理所述聲音信號(hào)并產(chǎn)生一合成歌聲信號(hào)。
2.如權(quán)利要求1所述的歌聲合成系統(tǒng),其特征在于,所述聲音信號(hào)是由一使用者根據(jù) 一歌詞信息與所述節(jié)拍所產(chǎn)生,且所述聲音信號(hào)依序分別對(duì)應(yīng)至所述歌詞信息中的每一 歌詞。
3.如權(quán)利要求1所述的歌聲合成系統(tǒng),其特征在于,所述聲音信號(hào)具有一既定節(jié)奏, 且所述歌聲合成系統(tǒng)進(jìn)一步包括一節(jié)奏分析單元,用以判斷所述既定節(jié)奏是否超過一預(yù) 設(shè)容許誤差值。
4.如權(quán)利要求1所述的歌聲合成系統(tǒng),其特征在于,所述處理單元針對(duì)所述聲音信號(hào) 所進(jìn)行的處理包括執(zhí)行一音高分析程序與一音高調(diào)校程序以取得多個(gè)調(diào)校后聲音信號(hào),并以所述調(diào)校 后聲音信號(hào)為所述合成歌聲信號(hào),其中所述音高分析程序透過音高追蹤取得分別對(duì)應(yīng)至所述聲音信號(hào)的多個(gè)音高,再 將所述音高拉平以取得多個(gè)相同音高。
5.如權(quán)利要求4所述的歌聲合成系統(tǒng),其特征在于,所述處理單元針對(duì)所述聲音信號(hào) 所進(jìn)行的處理進(jìn)一步包括針對(duì)所述調(diào)校后聲音信號(hào)執(zhí)行一平滑處理程序以取得一平滑處理后聲音信號(hào),并以 所述平滑處理后聲音信號(hào)為所述合成歌聲信號(hào)。
6.如權(quán)利要求5所述的歌聲合成系統(tǒng),其特征在于,所述處理單元針對(duì)所述聲音信號(hào) 所進(jìn)行的處理進(jìn)一步包括針對(duì)所述平滑處理后聲音信號(hào)執(zhí)行一歌聲特效處理程序以取得一特效處理后聲音信 號(hào),并以所述特效處理后聲音信號(hào)為所述合成歌聲信號(hào)。
7.如權(quán)利要求6所述的歌聲合成系統(tǒng),其特征在于,所述處理單元針對(duì)所述聲音信號(hào) 所進(jìn)行的處理進(jìn)一步包括針對(duì)所述調(diào)校后聲音信號(hào)、所述平滑處理后聲音信號(hào)以及所述特效處理后聲音信號(hào) 中的其中之一,執(zhí)行一伴奏合成程序以取得一伴奏歌聲信號(hào),并以所述伴奏歌聲信號(hào)為 所述合成歌聲信號(hào)。
8.—種歌聲合成方法,適用于一電子計(jì)算裝置,其特征在于,所述歌聲合成方法包括依據(jù)至少一旋律中一特定旋律提示一節(jié)拍;透過所述電子計(jì)算裝置的一收音模塊接收多個(gè)聲音信號(hào),其中所述聲音信號(hào)對(duì)應(yīng)所 述特定旋律;以及依據(jù)所述特定旋律處理所述聲音信號(hào)并透過所述電子計(jì)算裝置的一播音模塊輸出一 合成歌聲信號(hào)。
9.如權(quán)利要求8所述的歌聲合成方法,其特征在于,所述聲音信號(hào)由一使用者根據(jù)一 歌詞信息與所述節(jié)拍所產(chǎn)生,且所述聲音信號(hào)具有一既定節(jié)奏并依序分別對(duì)應(yīng)至所述歌詞信息中的每一歌詞,而所述歌聲合成方法判斷所述既定節(jié)奏是否超過一預(yù)設(shè)容許誤差 值,若是,則重復(fù)所述輸入聲音信號(hào)的步驟。
10.如權(quán)利要求8所述的歌聲合成方法,其特征在于,針對(duì)所述聲音信號(hào)所進(jìn)行的處 理進(jìn)一步包括執(zhí)行一音高分析程序與一音高調(diào)校程序以取得多個(gè)調(diào)校后聲音信號(hào),并以所述調(diào)校 后聲音信號(hào)為所述合成歌聲信號(hào),其中所述音高分析程序透過音高追蹤取得分別對(duì)應(yīng)至所述聲音信號(hào)的多個(gè)音高,再 將所述音高拉平以取得多個(gè)相同音高。
11.如權(quán)利要求10所述的歌聲合成方法,其特征在于,針對(duì)所述聲音信號(hào)所進(jìn)行的處 理進(jìn)一步包括針對(duì)所述調(diào)校后聲音信號(hào)執(zhí)行一平滑處理程序以取得一平滑處理后聲音信號(hào),并以 所述平滑處理后聲音信號(hào)為所述合成歌聲信號(hào)。
12.如權(quán)利要求11所述的歌聲合成方法,其特征在于,針對(duì)所述聲音信號(hào)所進(jìn)行的處 理進(jìn)一步包括針對(duì)所述平滑處理后聲音信號(hào)執(zhí)行一歌聲特效處理程序以取得一特效處理后聲音信 號(hào),并以所述特效處理后聲音信號(hào)為所述合成歌聲信號(hào)。
13.如權(quán)利要求12所述的歌聲合成方法,其特征在于,針對(duì)所述聲音信號(hào)所進(jìn)行的處 理進(jìn)一步包括針對(duì)所述調(diào)校后聲音信號(hào)、所述平滑處理后聲音信號(hào)以及所述特效處理后聲音信號(hào) 中的其中之一,執(zhí)行一伴奏合成程序以取得一伴奏歌聲信號(hào),并以所述伴奏歌聲信號(hào)為 所述合成歌聲信號(hào)。
14.一種歌聲合成裝置,其特征在于,所述歌聲合成裝置至少包括一殼體、一儲(chǔ)存 器、一節(jié)拍機(jī)構(gòu)、一收音器、一處理器,其中所述儲(chǔ)存器設(shè)置于所述殼體內(nèi)部,連接至所述處理器,儲(chǔ)存至少一旋律;所述節(jié)拍機(jī)構(gòu)設(shè)置于所述殼體外部,連接至所述處理器,依據(jù)所述旋律的一特定旋 律提示一節(jié)拍;所述收音器設(shè)置于所述殼體外部,連接至所述處理器,接收多個(gè)聲音信號(hào),且所述 聲音信號(hào)對(duì)應(yīng)所述特定旋律;以及所述處理器設(shè)置于所述殼體內(nèi)部,依據(jù)所述特定旋律將所述聲音信號(hào)進(jìn)行處理并產(chǎn) 生一合成歌聲信號(hào)。
15.如權(quán)利要求14所述的歌聲合成裝置,其特征在于,所述儲(chǔ)存器為一內(nèi)存;所述 節(jié)拍機(jī)構(gòu)為一發(fā)光器、一可動(dòng)式機(jī)械結(jié)構(gòu)、一顯示器或一播音器;所述收音器為一麥克 風(fēng)、一集音器或一錄音器;以及,所述處理器為一嵌入式微型處理器。
16.如權(quán)利要求14所述的歌聲合成裝置,其特征在于,所述聲音信號(hào)是由一使用者根 據(jù)一歌詞信息與所述節(jié)拍所產(chǎn)生,且所述聲音信號(hào)具有一既定節(jié)奏并依序分別對(duì)應(yīng)至所 述歌詞信息中的每一歌詞,而所述處理器進(jìn)一步判斷所述既定節(jié)奏是否超過一預(yù)設(shè)容許 誤差值,若是,則提示所述使用者重復(fù)所述輸入聲音信號(hào)的步驟。
17.如權(quán)利要求14所述的歌聲合成裝置,其特征在于,所述處理器針對(duì)所述聲音信號(hào) 所進(jìn)行的處理為執(zhí)行一音高分析處理與一音高調(diào)校處理以取得一多個(gè)調(diào)校后聲音信號(hào),并以所述調(diào)校后聲音信號(hào)為所述合成歌聲信號(hào),所述音高分析處理透過音高追蹤取得分 別對(duì)應(yīng)至所述聲音信號(hào)的多個(gè)音高,再將所述音高拉平以取得多個(gè)相同音高。
18.如權(quán)利要求17所述的歌聲合成裝置,其特征在于,所述處理器對(duì)所述聲音信號(hào)所 進(jìn)行的處理,進(jìn)一步包括將所述調(diào)校后聲音信號(hào)執(zhí)行一平滑處理以取得一平滑處理后聲 音信號(hào),并以所述平滑處理后聲音信號(hào)為所述合成歌聲信號(hào)。
19.如權(quán)利要求18所述的歌聲合成裝置,其特征在于,所述處理器對(duì)所述聲音信號(hào)所 進(jìn)行的處理,進(jìn)一步包括對(duì)所述平滑處理后聲音信號(hào)執(zhí)行一歌聲特效處理以取得一特效 處理后聲音信號(hào),并以所述特效處理后聲音信號(hào)為所述合成歌聲信號(hào)。
20.如權(quán)利要求19所述的歌聲合成裝置,其特征在于,所述處理器對(duì)所述聲音信號(hào)所 進(jìn)行的處理,進(jìn)一步包括將所述調(diào)校后聲音信號(hào)、所述平滑處理后聲音信號(hào)以及所述特 效處理后聲音信號(hào)中的其中之一,執(zhí)行一伴奏合成處理以取得一伴奏歌聲信號(hào),并以所 述伴奏歌聲信號(hào)為所述合成歌聲信號(hào)。
21.如權(quán)利要求14所述的歌聲合成裝置,其特征在于,所述歌聲合成裝置進(jìn)一步包括一播音器,輸出所述合成歌聲信號(hào)。
全文摘要
本發(fā)明公開了一種歌聲合成系統(tǒng),所述系統(tǒng)具有儲(chǔ)存單元、節(jié)拍單元、輸入單元以及處理單元。其中儲(chǔ)存單元用以儲(chǔ)存至少一旋律;節(jié)拍單元用以提示節(jié)拍;輸入單元用以接收多個(gè)聲音信號(hào);處理單元用以針對(duì)聲音信號(hào)進(jìn)行處理并產(chǎn)生合成歌聲信號(hào)。本發(fā)明實(shí)施例中的聲音信號(hào)是使用者依據(jù)該旋律、節(jié)拍所誦讀或哼唱所產(chǎn)生,因此每個(gè)聲音信號(hào)分別對(duì)應(yīng)至該旋律及其節(jié)拍,可直接將該聲音信號(hào)進(jìn)行處理,節(jié)省需大量預(yù)先錄制的大量使用者語(yǔ)料庫(kù)的時(shí)間和成本,達(dá)到節(jié)省系統(tǒng)資源以及加速歌曲合成速度的效果,而且最終獲得的合成歌聲更具有使用者的音色,效果相當(dāng)擬真。
文檔編號(hào)G10L13/00GK102024453SQ20091016942
公開日2011年4月20日 申請(qǐng)日期2009年9月9日 優(yōu)先權(quán)日2009年9月9日
發(fā)明者張智星, 徐志浩, 李宏儒, 李幸輯, 王文男 申請(qǐng)人:財(cái)團(tuán)法人資訊工業(yè)策進(jìn)會(huì)