專利名稱:用于語(yǔ)音處理的方法與系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于語(yǔ)音處理的方法與系統(tǒng),更具體地講,涉及一種能夠使用語(yǔ)音模板對(duì)語(yǔ)音進(jìn)行處理的方法與系統(tǒng)。
背景技術(shù):
近年來(lái),隨著語(yǔ)音處理技術(shù)的快速發(fā)展,人們對(duì)語(yǔ)音的認(rèn)識(shí)越來(lái)越深入,并出現(xiàn)了多種關(guān)于語(yǔ)音的應(yīng)用,例如,語(yǔ)音識(shí)別、錄音、鸚鵡學(xué)舌等。由于各種語(yǔ)音應(yīng)用的出發(fā)點(diǎn)有所不同,因而這些應(yīng)用各具特色,并能夠滿足各類人群的不同需求。盡管在現(xiàn)有技術(shù)中已出現(xiàn)了關(guān)于語(yǔ)音處理中的語(yǔ)音變聲的許多應(yīng)用和方法,但是大多數(shù)變聲應(yīng)用只能以預(yù)先確定的模式對(duì)語(yǔ)音進(jìn)行處理,而難以對(duì)多樣性的、變化性的語(yǔ) 音進(jìn)行有效處理和變聲,使得用戶無(wú)法根據(jù)實(shí)際需求來(lái)對(duì)語(yǔ)音進(jìn)行靈活處理。因此,隨著數(shù)字裝置的廣泛應(yīng)用以及數(shù)字裝置的用戶需求的不斷變化,現(xiàn)有的變聲應(yīng)用已無(wú)法滿足當(dāng)前和未來(lái)發(fā)展的需要。在這種情況下,需要一種能夠靈活地根據(jù)用戶的需求來(lái)對(duì)語(yǔ)音進(jìn)行處理以實(shí)現(xiàn)變聲的方法和系統(tǒng)。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種能夠根據(jù)用戶需求來(lái)生成語(yǔ)音模板并使用語(yǔ)音模板對(duì)語(yǔ)音進(jìn)行處理的方法與系統(tǒng),從而使得用戶能夠更加靈活和有效地對(duì)語(yǔ)音進(jìn)行處理,其中,可通過(guò)提取語(yǔ)音信號(hào)的語(yǔ)音特性參數(shù)來(lái)產(chǎn)生語(yǔ)音模板。根據(jù)本發(fā)明的一方面,提供了一種語(yǔ)音處理系統(tǒng),所述系統(tǒng)包括語(yǔ)音特性參數(shù)獲取模塊,用于獲取表現(xiàn)第一語(yǔ)音和第二語(yǔ)音的語(yǔ)音特性的語(yǔ)音特性參數(shù);語(yǔ)音模版生成模塊,用于將第一語(yǔ)音的語(yǔ)音特性參數(shù)生成為語(yǔ)音模版;語(yǔ)音處理模塊,用于根據(jù)語(yǔ)音模板調(diào)整第二語(yǔ)音的語(yǔ)音特性參數(shù),并將調(diào)整后的語(yǔ)音特性參數(shù)應(yīng)用于第二語(yǔ)音。所述系統(tǒng)還可包括語(yǔ)音獲取模塊,用于獲取第一語(yǔ)音和/或第二語(yǔ)音。所述系統(tǒng)還可包括存儲(chǔ)模塊,用于存儲(chǔ)語(yǔ)音模板。所述語(yǔ)音特性可包括語(yǔ)音的音量、音調(diào)和音色特性中的至少一個(gè)。所述語(yǔ)音獲取模塊可從預(yù)先存儲(chǔ)的語(yǔ)音中選取第一語(yǔ)音和/或第二語(yǔ)音。所述語(yǔ)音獲取模塊可使用錄音設(shè)備錄制第一語(yǔ)音和/或第二語(yǔ)音。所述語(yǔ)音特性參數(shù)可包括下述參數(shù)中的至少一個(gè)表現(xiàn)音量特性的音量大小參數(shù)、表現(xiàn)音調(diào)特性的基音的頻率和幅度參數(shù)、表現(xiàn)音色特性的預(yù)定數(shù)量的泛音的頻率和幅度參數(shù)。語(yǔ)音特性參數(shù)獲取模塊可直接設(shè)置形成語(yǔ)音模板所需的第一語(yǔ)音的各項(xiàng)語(yǔ)音特性參數(shù),使得設(shè)置的語(yǔ)音特性參數(shù)被語(yǔ)音模板生成模塊生成為語(yǔ)音模板。語(yǔ)音處理模塊對(duì)從存儲(chǔ)的語(yǔ)音模板中選擇的語(yǔ)音模板所包含的語(yǔ)音特性參數(shù)進(jìn)行調(diào)整,并根據(jù)調(diào)整后的語(yǔ)音特性參數(shù)由語(yǔ)音模板生成模塊生成與選擇的語(yǔ)音模板不同的另一語(yǔ)音模板。
根據(jù)本發(fā)明的另一方面,還提供了一種語(yǔ)音處理方法,所述方法包括獲取表現(xiàn)第一語(yǔ)音和第二語(yǔ)音的語(yǔ)音特性的語(yǔ)音特性參數(shù);將第一語(yǔ)音的語(yǔ)音特性參數(shù)生成為語(yǔ)音模版;根據(jù)語(yǔ)音模板調(diào)整第二語(yǔ)音的語(yǔ)音特性參數(shù),并將調(diào)整后的語(yǔ)音特性參數(shù)應(yīng)用于第二語(yǔ)音。所述方法還可包括獲取第一語(yǔ)音和/或第二語(yǔ)音。所述方法還可包括存儲(chǔ)語(yǔ)音模板。所述語(yǔ)音特性可包括語(yǔ)音的音量、音調(diào)和音色特性中的至少一個(gè)??蓮念A(yù)先存儲(chǔ)的語(yǔ)音中選取第一語(yǔ)音和/或第二語(yǔ)音??墒褂娩浺粼O(shè)備錄制第一語(yǔ)音和/或第二語(yǔ)音。 所述語(yǔ)音特性參數(shù)可包括下述參數(shù)中的至少一個(gè)表現(xiàn)音量特性的音量大小參數(shù)、表現(xiàn)音調(diào)特性的基音的頻率和幅度參數(shù)、表現(xiàn)音色特性的預(yù)定數(shù)量的泛音的頻率和幅度參數(shù)??芍苯釉O(shè)置形成語(yǔ)音模板所需的第一語(yǔ)音的各項(xiàng)語(yǔ)音特性參數(shù),使得設(shè)置的語(yǔ)音特性參數(shù)被生成為語(yǔ)音模板。對(duì)從存儲(chǔ)的語(yǔ)音模板中選擇的語(yǔ)音模板所包含的語(yǔ)音特性參數(shù)進(jìn)行調(diào)整,并根據(jù)調(diào)整后的語(yǔ)音特性參數(shù)生成與選擇的語(yǔ)音模板不同的另一語(yǔ)音模板。通過(guò)使用本發(fā)明的語(yǔ)音處理方法和系統(tǒng),可更靈活地按照用戶的需求對(duì)語(yǔ)音進(jìn)行處理,使得語(yǔ)音處理的結(jié)果更加逼真和多樣,實(shí)現(xiàn)豐富用戶的娛樂(lè)生活的目的。將在接下來(lái)的描述中部分闡述本發(fā)明另外的方面和/或優(yōu)點(diǎn),還有一部分通過(guò)描述將是清楚的,或者可以經(jīng)過(guò)本發(fā)明的實(shí)施而得知。
通過(guò)下面結(jié)合附圖進(jìn)行的詳細(xì)描述,本發(fā)明的上述和/或其它目的、特點(diǎn)和優(yōu)點(diǎn)將會(huì)變得更加清楚,其中圖I是示出根據(jù)本發(fā)明的示例性實(shí)施例的語(yǔ)音處理系統(tǒng)的框圖;圖2是示出根據(jù)本發(fā)明的示例性實(shí)施例的語(yǔ)音處理方法的流程圖;圖3是示出根據(jù)本發(fā)明的另一示例性實(shí)施例的語(yǔ)音模板生成方法的流程圖;圖4是示出根據(jù)本發(fā)明的又一示例性實(shí)施例的語(yǔ)音模板生成方法的流程圖。
具體實(shí)施例方式以下,將參照附圖更充分地描述本發(fā)明的示例性實(shí)施例,示例性實(shí)施例在附圖中示出。然而,可以以許多不同的形式實(shí)施示例性實(shí)施例,并且不應(yīng)被解釋為局限于在此闡述的示例性實(shí)施例。相反,提供這些實(shí)施例從而本公開(kāi)將會(huì)徹底和完整,并將完全地將示例性實(shí)施例的范圍傳達(dá)給本領(lǐng)域的技術(shù)人員。在附圖中,相同的標(biāo)號(hào)表示相同的部分。圖I是示出根據(jù)本發(fā)明的示例性實(shí)施例的語(yǔ)音處理系統(tǒng)100的框圖。參照?qǐng)D1,根據(jù)本發(fā)明的示例性實(shí)施例的語(yǔ)音處理系統(tǒng)100包括語(yǔ)音特性參數(shù)獲取模塊120、語(yǔ)音模版生成模塊130以及語(yǔ)音處理模塊140。參照?qǐng)D1,語(yǔ)音特性參數(shù)獲取模塊120可用于獲取表現(xiàn)至少一種語(yǔ)音特性(例如,語(yǔ)音的音量、音調(diào)以及音色特性等)的語(yǔ)音特性參數(shù)。僅作為示例,下面將描述使用PCM流格式的語(yǔ)音音頻信號(hào)(以下,簡(jiǎn)稱為“PCM音頻信號(hào)”)來(lái)獲取表現(xiàn)音量、音調(diào)和音色特性中的至少一種語(yǔ)音特性的語(yǔ)音特性參數(shù)的方法。音量是指人耳對(duì)所聽(tīng)到的聲音大小強(qiáng)弱的主觀感受,其客觀評(píng)價(jià)尺度是聲音的幅度大小。因此可使用PCM音頻信號(hào)的幅度來(lái)表現(xiàn)語(yǔ)音的音量大小。音調(diào)通常指具有特定且穩(wěn)定音高的信號(hào),是聲音聽(tīng)起來(lái)調(diào)子的高低,主要取決于頻率。頻率高的聲音人耳的反應(yīng)是音調(diào)高,頻率低的聲音人耳的反應(yīng)是音調(diào)低。音調(diào)主要由聲音的基頻決定,因此,可以通過(guò)提取PCM音頻信號(hào)的基音的頻率(即,基頻)和幅度來(lái)獲取音調(diào)參數(shù)。音色是聲音的特色,每一個(gè)人的語(yǔ)音有不同的音色,因此可以根據(jù)其音色辨別出不同的人,音色的不同取決于不同的泛音,在每一種樂(lè)器、不同的人以及所有能發(fā)聲的物體發(fā)出的聲音中,除了一個(gè)基音外,還有許多不同頻率的泛音伴隨,正是這些泛音的頻率和幅度的不同組合決定了不同的音色。因此,可通過(guò)提取音頻信號(hào)的預(yù)定數(shù)量的泛音的頻率和幅度來(lái)獲取音色特性參數(shù)。 常用的語(yǔ)音特性還可以概括為基音、共振峰、線性預(yù)測(cè)倒譜系數(shù)、Mel頻率倒譜系數(shù)等數(shù)字參數(shù),通過(guò)目前現(xiàn)有的一些主流技術(shù),如基于LPCC的特征提取技術(shù)、基于MFCC的特征提取技術(shù)、短時(shí)傅里葉變換(處理平穩(wěn)信號(hào)的傳統(tǒng)方法)技術(shù),可獲取表現(xiàn)語(yǔ)音特性的至少一個(gè)以下參數(shù)表現(xiàn)音量特性的音量大小參數(shù)、表現(xiàn)音調(diào)特性的基音的頻率和幅度參數(shù)、表現(xiàn)音色特性的預(yù)定數(shù)量的泛音的頻率和幅度參數(shù)。在提取操作完成之后,語(yǔ)音特性參數(shù)獲取模塊120可將獲取的語(yǔ)音特性參數(shù)發(fā)送到語(yǔ)音模板生成模塊130以生成語(yǔ)音模板,或者保留所述參數(shù),以利用這些參數(shù)隨后對(duì)該語(yǔ)音進(jìn)行處理。語(yǔ)音模版生成模塊130根據(jù)從語(yǔ)音特性參數(shù)獲取模塊120獲得的多個(gè)語(yǔ)音特性參數(shù)來(lái)生成語(yǔ)音模版,并將生成的語(yǔ)音模版存儲(chǔ)在存儲(chǔ)模塊150中,其中,所述語(yǔ)音模版是指表現(xiàn)特定語(yǔ)音的多種語(yǔ)音特性的語(yǔ)音特性參數(shù)的集合,所述語(yǔ)音特性可包括,但不限于,音量、音色和音調(diào)特性中的至少一個(gè)??蛇x擇地,根據(jù)另一實(shí)施例,語(yǔ)音模版生成模塊130也可直接將生成的語(yǔ)音模板輸入到語(yǔ)音處理模塊140來(lái)對(duì)一語(yǔ)音進(jìn)行處理。此外,還可通過(guò)語(yǔ)音特性參數(shù)獲取模塊120按照形成語(yǔ)音模板所需的各種參數(shù)來(lái)直接設(shè)置各個(gè)語(yǔ)音特性參數(shù),并將設(shè)置的語(yǔ)音特性參數(shù)傳遞到語(yǔ)音模板生成模塊130,以生成自定義的語(yǔ)音模版。具體地講,在本發(fā)明的實(shí)施例中,可由用戶直接設(shè)置音量大小,基音的頻率和幅度以及預(yù)定數(shù)量的泛音的頻率和幅度,并將設(shè)置好的語(yǔ)音特性參數(shù)發(fā)送到語(yǔ)音模板生成模塊130,以生成用戶期望的語(yǔ)音模板。此外,還可通過(guò)對(duì)已有的語(yǔ)音模板的參數(shù)進(jìn)行修改來(lái)生成新的語(yǔ)音模板。通過(guò)這種方式,可容易增加能夠生成和應(yīng)用的語(yǔ)音模版的種類,從而實(shí)現(xiàn)更豐富的語(yǔ)音處理效果。語(yǔ)音處理模塊140用于對(duì)待處理的語(yǔ)音進(jìn)行處理??筛鶕?jù)用戶需求選擇用戶期望的語(yǔ)音模版,并將選擇的語(yǔ)音模板輸出到語(yǔ)音處理模塊140,以使用戶能夠根據(jù)所選擇的語(yǔ)音模版對(duì)語(yǔ)音進(jìn)行處理。詳細(xì)地說(shuō),語(yǔ)音處理模塊140可根據(jù)選擇的語(yǔ)音模版中記錄的語(yǔ)音特性參數(shù)來(lái)對(duì)由語(yǔ)音特性參數(shù)獲取模塊120從待處理的語(yǔ)音提取的語(yǔ)音特性參數(shù)進(jìn)行調(diào)整,并將調(diào)整后的語(yǔ)音特性參數(shù)應(yīng)用于待處理的語(yǔ)音,從而使待處理的語(yǔ)音具有用戶期望的語(yǔ)音特性。
例如,可將待處理的語(yǔ)音的基音頻率和幅度分別調(diào)整為與選擇的語(yǔ)音模版中記錄的基音的頻率和幅度一致,可將待處理的語(yǔ)音的各個(gè)泛音的頻率和幅度分別調(diào)整為與選擇的語(yǔ)音模版中記錄的各個(gè)對(duì)應(yīng)的泛音的頻率和幅度一致,還可將待處理的語(yǔ)音音量大小調(diào)整為與選擇的語(yǔ)音模版中記錄的音量大小一致,從而使獲取的語(yǔ)音的音量、音調(diào)和音色特性與語(yǔ)音模版能夠表現(xiàn)的音量、音調(diào)和音色特性一致,實(shí)現(xiàn)模仿語(yǔ)音模版所表現(xiàn)的語(yǔ)音的效果。僅作為示例,假設(shè)通過(guò)語(yǔ)音特性參數(shù)獲取模塊120獲得的待處理語(yǔ)音的參數(shù)如下基音的頻率和幅度參數(shù)為(fo,Ctl),并且提取了 16組泛音參數(shù),每個(gè)泛音的頻率和幅度
參數(shù)分別為(f\,C1)、(f2,C2)........(f16,C16),音量大小為V,其中,&,f1; ... f16是頻率
參數(shù),C0, C1, . . . C16是幅度參數(shù)。用戶使用語(yǔ)音模板I對(duì)待處理的語(yǔ)音進(jìn)行處理,其中,語(yǔ)音模板I中包含的語(yǔ)音特性參數(shù)為基音的頻率和幅度分別為(4,QJ,泛音的頻率和幅度
參數(shù)為(fK1,CE1)、(fE2, CE2)........(fE16, CK16),音量大小為 VK,其中,fKQ,fE1, · · · fE16 是頻率
參數(shù),CK(I,CK1,. . . Ce16是幅度參數(shù)。為使待處理的語(yǔ)音在進(jìn)行處理之后能夠與語(yǔ)音模板中的語(yǔ)音特性參數(shù)所表現(xiàn)出的語(yǔ)音特點(diǎn)相同或相似,分別將待處理語(yǔ)音的基音、泛音以及音量參數(shù)調(diào)整為模板中的記錄的基音、泛音以及音量參數(shù),具體地講,使得待處理的語(yǔ)音的語(yǔ)音參數(shù)值分別被調(diào)整為fQ = fE0> fl = fEl> f2 = fE2> …、fl6 = fR16,C0 = Ceo> C1 = CR1 > …、C2 = CE2, C16 = CE16,并使得待處理的語(yǔ)音的音量大小V調(diào)整為也就是說(shuō),使得音量大小
V = vK。在完成對(duì)待處理語(yǔ)音的語(yǔ)音特性參數(shù)的調(diào)整之后,將調(diào)整過(guò)的語(yǔ)音參數(shù)應(yīng)用于待處理的語(yǔ)音,從而完成變聲過(guò)程。具體地講,在本實(shí)施例中,通過(guò)使用與提取語(yǔ)音特性參數(shù)信息的操作相應(yīng)的逆操作,將調(diào)整后的語(yǔ)音特性參數(shù)應(yīng)用到待處理的語(yǔ)音,從而完成對(duì)待處理的語(yǔ)音的變聲處理。應(yīng)該理解,上述方法僅是示例性的,應(yīng)用語(yǔ)音模板對(duì)待處理的語(yǔ)音進(jìn)行處理的方法不限于于此,可根據(jù)用戶需要或是預(yù)定的設(shè)置來(lái)應(yīng)用語(yǔ)音模板對(duì)待處理的語(yǔ)音進(jìn)行處理?;蛘哂脩艨刹皇褂谜Z(yǔ)音模板對(duì)待處理的聲音進(jìn)行變聲,而是在語(yǔ)音處理模塊140中直接調(diào)整提取的待處理的語(yǔ)音的各個(gè)語(yǔ)音特性參數(shù)來(lái)完成待處理的語(yǔ)音的變聲過(guò)程。此外,還可在語(yǔ)音處理模塊140中實(shí)現(xiàn)對(duì)經(jīng)過(guò)處理的語(yǔ)音進(jìn)行調(diào)整和美化處理,從而使得所述語(yǔ)音能夠獲得更加逼真的音效。作為示例,這里僅描述通過(guò)使用調(diào)整泛音參數(shù)來(lái)調(diào)整語(yǔ)音的音色效果的方法。無(wú)論人聲、歌聲,還是樂(lè)器的語(yǔ)音,它們都不是一個(gè)單音,而是一個(gè)復(fù)合音。也就是由語(yǔ)音的基音和一系列的泛音所構(gòu)成。這些泛音都是基音頻率的倍數(shù),并對(duì)音色的特性有非常重要的影響。泛音可分為低頻泛音、中頻泛音和高頻泛音。如果低頻泛音的幅度較強(qiáng),音色就表現(xiàn)得混厚;中頻泛音的幅度比較強(qiáng),音色就表現(xiàn)得圓潤(rùn)、自然、和諧;高頻泛音的幅度比較強(qiáng),音色就表現(xiàn)得明亮、清透、解析力強(qiáng)。泛音的數(shù)量和泛音幅度的不同構(gòu)成音色的頻率特性曲線。這條曲線就體現(xiàn)了音色的表現(xiàn)力。音色的頻率特性曲線各不相同。將基音到第16個(gè)泛音的強(qiáng)度在坐標(biāo)上連成一條直線,這條直線就被稱為最佳美聲線。音色的頻率特性曲線越接近這條直線,所述音色的低、中、高頻泛音的比例也最為均衡,其音色的表現(xiàn)力也最好??梢酝ㄟ^(guò)四段均衡器對(duì)音色進(jìn)行頻率處理,來(lái)提高音色的藝術(shù)表現(xiàn)力??蓪⒁纛l分為4個(gè)大的頻率段,即HF :6kHz-16kHz,影響音色的表現(xiàn)力、解析力;MID HF :600Hz 6kHz,影響音色的明亮度、清晰度;MID LF :200Hz 600Hz,影響音色和力度和結(jié)實(shí)度;LF :20Hz 200Hz,影響音色的混厚度和豐滿度。如果高頻段頻率過(guò)弱,音色就變得色彩、韻味、個(gè)性的失落;如果高頻段頻率過(guò)強(qiáng),音色就會(huì)變得尖噪、撕?jiǎn)?、刺耳。如果中高頻段的頻率過(guò)弱,音色就變得暗淡、朦朧;如果中高頻段的頻率過(guò)強(qiáng),其音色就會(huì)變得呆板。如果中低頻段的頻率過(guò)弱,音色會(huì)變得空虛、無(wú)力、軟綿綿的;如果中低頻段的頻率過(guò)強(qiáng),音色會(huì)變得生硬、失去活力。如果低頻段的頻率過(guò)弱,音色將會(huì)變得單薄、蒼白;如果低頻段的頻率過(guò)強(qiáng),音色會(huì)變得渾濁不清。
要使音色有美感,就要泛音豐富、有層次。提升某一頻段后,還要考慮對(duì)其他頻段的影響,要總體地考慮歌聲的清晰度和豐滿度。例如,女聲在高頻部分容易產(chǎn)生S音(撕聲),則可在7-lOKHz衰減3dB來(lái)消除S音;男語(yǔ)音域比女聲低一個(gè)8度音程,頻率低一個(gè)倍頻,在IOOHz衰減3dB左右,可以增加清晰度。通過(guò)這種方式,可完成對(duì)音色信息的調(diào)整。如上所述,盡管已描述了通過(guò)調(diào)整泛音來(lái)對(duì)語(yǔ)音做進(jìn)一步的調(diào)整和美化的方法,但本發(fā)明不限于此,還可使用其他方法實(shí)現(xiàn)對(duì)語(yǔ)音的調(diào)整和美化。此外,根據(jù)本發(fā)明的示例性實(shí)施例,語(yǔ)音處理系統(tǒng)100還可包括語(yǔ)音獲取模塊110和存儲(chǔ)模塊150。如圖I所示,語(yǔ)音獲取模塊110用于獲取待處理的語(yǔ)音,在本發(fā)明的示例性實(shí)施例中,語(yǔ)音獲取模塊110可至少使用兩種語(yǔ)音獲取方式來(lái)獲取待處理的語(yǔ)音可通過(guò)語(yǔ)音獲取裝置(例如,麥克風(fēng))從外界錄制語(yǔ)音;還可直接從預(yù)先存儲(chǔ)的語(yǔ)音中選擇待處理的語(yǔ)音。在完成獲取之后,語(yǔ)音獲取模塊110可將待處理的語(yǔ)音輸出到語(yǔ)音特性參數(shù)獲取模塊120。存儲(chǔ)模塊150用于存儲(chǔ)生成的語(yǔ)音模板,并將用戶選擇的語(yǔ)音模板提供給語(yǔ)音處理模塊140,以幫助完成對(duì)待處理的語(yǔ)音的變聲處理。此外,根據(jù)本發(fā)明的示例性實(shí)施例,所述語(yǔ)音處理系統(tǒng)100還可包括播放模塊(未示出)來(lái)播放語(yǔ)音。圖2是示出根據(jù)本發(fā)明的示例性實(shí)施例的語(yǔ)音處理的流程圖。以下將參照?qǐng)D2描述使用本發(fā)明的語(yǔ)音處理方法完成對(duì)語(yǔ)音的處理的過(guò)程。在步驟201,語(yǔ)音獲取模塊110可利用錄音裝置從外界錄制待處理的語(yǔ)音,或者從預(yù)先存儲(chǔ)的語(yǔ)音中選擇待處理的語(yǔ)音,然后將獲取的待處理的語(yǔ)音輸出到語(yǔ)音特性參數(shù)獲取模塊120。在步驟203,語(yǔ)音特性參數(shù)獲取模塊120將待處理的語(yǔ)音解碼為可用于語(yǔ)音特性參數(shù)提取的格式(例如,PCM流格式),然后對(duì)解碼的語(yǔ)音進(jìn)行分析,以提取各語(yǔ)音特性參數(shù)(例如,音量、音調(diào)和音色特性中的至少一種的語(yǔ)音特性參數(shù))。在步驟205,確定是否將在步驟203中提取的語(yǔ)音特性參數(shù)生成為語(yǔ)音模版。如果確定生成語(yǔ)音模版,則進(jìn)入步驟207 ;如果確定不將所述語(yǔ)音特性信息生成為語(yǔ)音模版,則進(jìn)入步驟209。在步驟207,在語(yǔ)音模版生成模塊130中根據(jù)接收的語(yǔ)音特性參數(shù)生成相應(yīng)的語(yǔ)音模版,并將所述語(yǔ)音模版保存在存儲(chǔ)模塊150中。可選擇地,根據(jù)另一實(shí)施例,也可直接將語(yǔ)音模版生成模塊130生成的語(yǔ)音模板輸入到語(yǔ)音處理模塊140來(lái)對(duì)一語(yǔ)音進(jìn)行處理。
在步驟209,確定是否對(duì)獲取的語(yǔ)音進(jìn)行處理,如果需要對(duì)獲取的語(yǔ)音進(jìn)行處理,則進(jìn)入步驟211。在步驟211,從存儲(chǔ)模塊150選擇用戶期望的語(yǔ)音模版,然后將選擇的語(yǔ)音模版與在步驟203中提取的語(yǔ)音特性參數(shù)一起輸入到語(yǔ)音處理模塊140。在步驟213,根據(jù)步驟211中選擇的語(yǔ)音模版對(duì)待處理的語(yǔ)音的語(yǔ)音特性參數(shù)進(jìn)行調(diào)整,已結(jié)合圖I描述了詳細(xì)的參數(shù)調(diào)整過(guò)程,因此在此不再對(duì)其進(jìn)行描述。將調(diào)整后的語(yǔ)音特性參數(shù)應(yīng)用到待處理的語(yǔ)音以獲得新的語(yǔ)音,從而實(shí)現(xiàn)模仿語(yǔ)音模版的語(yǔ)音效果的目的。此外,還可在步驟213實(shí)現(xiàn)對(duì)語(yǔ)音的美化調(diào)整處理,例如,可通過(guò)調(diào)整語(yǔ)音的音色(即,泛音的頻率和幅度參數(shù))以使所述變化后的語(yǔ)音音效更加逼真。
圖3是示出根據(jù)本發(fā)明的另一示例性實(shí)施例的生成語(yǔ)音模板的流程圖。如圖3所示,在步驟301,在語(yǔ)音特性參數(shù)獲取模塊120直接設(shè)置生成語(yǔ)音模板所需的各項(xiàng)語(yǔ)音特性參數(shù),具體地說(shuō),僅作為示例,在本發(fā)明的示例性實(shí)施例中,可直接設(shè)置音量大小、基音的幅度和頻率以及泛音的幅度和頻率。在步驟303,確定語(yǔ)音特性參數(shù)的設(shè)置是否完成。如果在步驟303確定完成了語(yǔ)音特性參數(shù)的設(shè)置,則在步驟305,在語(yǔ)音模板生成模塊130使用設(shè)置的各個(gè)語(yǔ)音特性參數(shù)來(lái)生成相應(yīng)的語(yǔ)音模板,并在步驟307將生成的語(yǔ)音模板保存在存儲(chǔ)模塊150。如果在步驟303語(yǔ)音特性參數(shù)的設(shè)置還沒(méi)有結(jié)束,則可繼續(xù)設(shè)置參數(shù),或者根據(jù)另一實(shí)施例,可選擇直接結(jié)束圖3中示出的處理圖4是示出根據(jù)本發(fā)明的又一示例性實(shí)施例的生成語(yǔ)音模板的流程圖。如圖4所示,在步驟401,從存儲(chǔ)模塊150選擇語(yǔ)音模板。在步驟403,通過(guò)語(yǔ)音處理模塊140修改選擇的模板中的各語(yǔ)音特性參數(shù)。在步驟405,確定語(yǔ)音特性參數(shù)的修改是否完成。如果在步驟405確定已完成對(duì)選擇的語(yǔ)音模板的語(yǔ)音特性參數(shù)的修改,則在步驟407,在語(yǔ)音模板生成模塊130中使用修改后的各個(gè)語(yǔ)音特性參數(shù)來(lái)生成新的語(yǔ)音模板,并將所述新的語(yǔ)音模板保存在存儲(chǔ)模塊150中。如果在步驟405語(yǔ)音特性參數(shù)的修改還沒(méi)有結(jié)束,則可繼續(xù)修改語(yǔ)音特性參數(shù),或者根據(jù)另一實(shí)施例,可選擇直接結(jié)束圖4中示出的處理。應(yīng)該理解,在完成對(duì)選擇的語(yǔ)音模板的語(yǔ)音特性參數(shù)的修改之后,也可不生成的新的語(yǔ)音模板,而是直接在所選擇的語(yǔ)音模板上保存修改后的語(yǔ)音特性參數(shù),從而實(shí)現(xiàn)調(diào)整語(yǔ)音模板的效果。盡管已經(jīng)參照其示例性實(shí)施例具體顯示和描述了本發(fā)明,但是本領(lǐng)域的技術(shù)人員應(yīng)該理解,在不脫離權(quán)利要求所限定的本發(fā)明的精神和范圍的情況下,可以對(duì)其進(jìn)行形式和細(xì)節(jié)上的各種改變。
權(quán)利要求
1.一種語(yǔ)音處理系統(tǒng),所述系統(tǒng)包括 語(yǔ)音特性參數(shù)獲取模塊,用于獲取表現(xiàn)第一語(yǔ)音和第二語(yǔ)音的語(yǔ)音特性的語(yǔ)音特性參數(shù); 語(yǔ)音模版生成模塊,用于將第一語(yǔ)音的語(yǔ)音特性參數(shù)生成為語(yǔ)音模版; 語(yǔ)音處理模塊,用于根據(jù)語(yǔ)音模板調(diào)整第二語(yǔ)音的語(yǔ)音特性參數(shù),并將調(diào)整后的語(yǔ)音特性參數(shù)應(yīng)用于第二語(yǔ)音。
2.如權(quán)利要求I所述的系統(tǒng),還包括語(yǔ)音獲取模塊,用于獲取第一語(yǔ)音和/或第二語(yǔ)曰
3.如權(quán)利要求I所述的系統(tǒng),還包括存儲(chǔ)模塊,用于存儲(chǔ)語(yǔ)音模板。
4.如權(quán)利要求I所述的系統(tǒng),其中,所述語(yǔ)音特性包括語(yǔ)音的音量、音調(diào)和音色特性中的至少一個(gè)。
5.如權(quán)利要求2所述的系統(tǒng),其中,所述語(yǔ)音獲取模塊從預(yù)先存儲(chǔ)的語(yǔ)音中選取第一語(yǔ)音和/或第二語(yǔ)音。
6.如權(quán)利要求2所述的系統(tǒng),其中,所述語(yǔ)音獲取模塊使用錄音設(shè)備錄制第一語(yǔ)音和/或第二語(yǔ)音。
7.如權(quán)利要求4所述的系統(tǒng),其中,所述語(yǔ)音特性參數(shù)包括下述參數(shù)中的至少一個(gè)表現(xiàn)音量特性的音量大小參數(shù)、表現(xiàn)音調(diào)特性的基音的頻率和幅度參數(shù)、表現(xiàn)音色特性的預(yù)定數(shù)量的泛音的頻率和幅度參數(shù)。
8.如權(quán)利要求I所述的系統(tǒng),其中,語(yǔ)音特性參數(shù)獲取模塊直接設(shè)置形成語(yǔ)音模板所需的第一語(yǔ)音的各語(yǔ)音特性參數(shù),使得設(shè)置的語(yǔ)音特性參數(shù)被語(yǔ)音模板生成模塊生成為語(yǔ)音模板。
9.如權(quán)利要求3所述的系統(tǒng),其中,語(yǔ)音處理模塊對(duì)從存儲(chǔ)的語(yǔ)音模板中選擇的語(yǔ)音模板所包含的語(yǔ)音特性參數(shù)進(jìn)行調(diào)整,并根據(jù)調(diào)整后的語(yǔ)音特性參數(shù)由語(yǔ)音模板生成模塊生成與選擇的語(yǔ)音模板不同的另一語(yǔ)音模板。
10.一種語(yǔ)音處理方法,所述方法包括 獲取表現(xiàn)第一語(yǔ)音和第二語(yǔ)音的語(yǔ)音特性的語(yǔ)音特性參數(shù); 將第一語(yǔ)音的語(yǔ)音特性參數(shù)生成為語(yǔ)音模版; 根據(jù)語(yǔ)音模板調(diào)整第二語(yǔ)音的語(yǔ)音特性參數(shù),并將調(diào)整后的語(yǔ)音特性參數(shù)應(yīng)用于第二語(yǔ)音。
11.如權(quán)利要求10所述的方法,還包括獲取第一語(yǔ)音和/或第二語(yǔ)音。
12.如權(quán)利要求10所述的方法,還包括存儲(chǔ)語(yǔ)音模板。
13.如權(quán)利要求10所述的方法,其中,所述語(yǔ)音特性包括語(yǔ)音的音量、音調(diào)和音色特性中的至少一個(gè)。
14.如權(quán)利要求11所述的方法,其中,從預(yù)先存儲(chǔ)的語(yǔ)音中選取第一語(yǔ)音和/或第二語(yǔ)曰
15.如權(quán)利要求11所述的方法,其中,使用錄音設(shè)備錄制第一語(yǔ)音和/或第二語(yǔ)音。
16.如權(quán)利要求13所述的方法,其中,所述語(yǔ)音特性參數(shù)包括下述參數(shù)中的至少一個(gè)表現(xiàn)音量特性的音量大小參數(shù)、表現(xiàn)音調(diào)特性的基音的頻率和幅度參數(shù)、表現(xiàn)音色特性的預(yù)定數(shù)量的泛音的頻率和幅度參數(shù)。
17.如權(quán)利要求10所述的方法,其中,直接設(shè)置形成語(yǔ)音模板所需的第一語(yǔ)音的各項(xiàng)語(yǔ)音特性參數(shù),使得設(shè)置的語(yǔ)音特性參數(shù)被生成為語(yǔ)音模板。
18.如權(quán)利要求12所述的方法,其中,對(duì)從存儲(chǔ)的語(yǔ)音模版中選擇的語(yǔ)音模板所包含的語(yǔ)音特性參數(shù)進(jìn)行調(diào)整,并根據(jù)調(diào)整后的語(yǔ)音特性參數(shù)生成與選擇的語(yǔ)音模板不同的另一語(yǔ)音模板。
全文摘要
提供了一種用于語(yǔ)音處理的方法和系統(tǒng),所述系統(tǒng)包括語(yǔ)音特性參數(shù)獲取模塊,用于獲取表現(xiàn)第一語(yǔ)音和第二語(yǔ)音的語(yǔ)音特性的語(yǔ)音特性參數(shù);語(yǔ)音模版生成模塊,用于將第一語(yǔ)音的語(yǔ)音特性參數(shù)生成為語(yǔ)音模版;語(yǔ)音處理模塊,用于根據(jù)語(yǔ)音模版調(diào)整第二語(yǔ)音的語(yǔ)音特性參數(shù),并將調(diào)整后的語(yǔ)音特性參數(shù)應(yīng)用于第二語(yǔ)音。
文檔編號(hào)G10L15/06GK102881283SQ20111020439
公開(kāi)日2013年1月16日 申請(qǐng)日期2011年7月13日 優(yōu)先權(quán)日2011年7月13日
發(fā)明者陳曉曉, 李遠(yuǎn)友, 向春 申請(qǐng)人:三星電子(中國(guó))研發(fā)中心, 三星電子株式會(huì)社