用于語(yǔ)音處理的方法與系統(tǒng)的制作方法

文檔序號(hào)：2825274閱讀：235來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：用于語(yǔ)音處理的方法與系統(tǒng)的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種用于語(yǔ)音處理的方法與系統(tǒng)，更具體地講，涉及一種能夠使用語(yǔ)音模板對(duì)語(yǔ)音進(jìn)行處理的方法與系統(tǒng)。
背景技術(shù)：
近年來(lái)，隨著語(yǔ)音處理技術(shù)的快速發(fā)展，人們對(duì)語(yǔ)音的認(rèn)識(shí)越來(lái)越深入，并出現(xiàn)了多種關(guān)于語(yǔ)音的應(yīng)用，例如，語(yǔ)音識(shí)別、錄音、鸚鵡學(xué)舌等。由于各種語(yǔ)音應(yīng)用的出發(fā)點(diǎn)有所不同，因而這些應(yīng)用各具特色，并能夠滿足各類人群的不同需求。盡管在現(xiàn)有技術(shù)中已出現(xiàn)了關(guān)于語(yǔ)音處理中的語(yǔ)音變聲的許多應(yīng)用和方法，但是大多數(shù)變聲應(yīng)用只能以預(yù)先確定的模式對(duì)語(yǔ)音進(jìn)行處理，而難以對(duì)多樣性的、變化性的語(yǔ) 音進(jìn)行有效處理和變聲，使得用戶無(wú)法根據(jù)實(shí)際需求來(lái)對(duì)語(yǔ)音進(jìn)行靈活處理。因此，隨著數(shù)字裝置的廣泛應(yīng)用以及數(shù)字裝置的用戶需求的不斷變化，現(xiàn)有的變聲應(yīng)用已無(wú)法滿足當(dāng)前和未來(lái)發(fā)展的需要。在這種情況下，需要一種能夠靈活地根據(jù)用戶的需求來(lái)對(duì)語(yǔ)音進(jìn)行處理以實(shí)現(xiàn)變聲的方法和系統(tǒng)。

發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種能夠根據(jù)用戶需求來(lái)生成語(yǔ)音模板并使用語(yǔ)音模板對(duì)語(yǔ)音進(jìn)行處理的方法與系統(tǒng)，從而使得用戶能夠更加靈活和有效地對(duì)語(yǔ)音進(jìn)行處理，其中，可通過(guò)提取語(yǔ)音信號(hào)的語(yǔ)音特性參數(shù)來(lái)產(chǎn)生語(yǔ)音模板。根據(jù)本發(fā)明的一方面，提供了一種語(yǔ)音處理系統(tǒng)，所述系統(tǒng)包括語(yǔ)音特性參數(shù)獲取模塊，用于獲取表現(xiàn)第一語(yǔ)音和第二語(yǔ)音的語(yǔ)音特性的語(yǔ)音特性參數(shù)；語(yǔ)音模版生成模塊，用于將第一語(yǔ)音的語(yǔ)音特性參數(shù)生成為語(yǔ)音模版；語(yǔ)音處理模塊，用于根據(jù)語(yǔ)音模板調(diào)整第二語(yǔ)音的語(yǔ)音特性參數(shù)，并將調(diào)整后的語(yǔ)音特性參數(shù)應(yīng)用于第二語(yǔ)音。所述系統(tǒng)還可包括語(yǔ)音獲取模塊，用于獲取第一語(yǔ)音和/或第二語(yǔ)音。所述系統(tǒng)還可包括存儲(chǔ)模塊，用于存儲(chǔ)語(yǔ)音模板。所述語(yǔ)音特性可包括語(yǔ)音的音量、音調(diào)和音色特性中的至少一個(gè)。所述語(yǔ)音獲取模塊可從預(yù)先存儲(chǔ)的語(yǔ)音中選取第一語(yǔ)音和/或第二語(yǔ)音。所述語(yǔ)音獲取模塊可使用錄音設(shè)備錄制第一語(yǔ)音和/或第二語(yǔ)音。所述語(yǔ)音特性參數(shù)可包括下述參數(shù)中的至少一個(gè)表現(xiàn)音量特性的音量大小參數(shù)、表現(xiàn)音調(diào)特性的基音的頻率和幅度參數(shù)、表現(xiàn)音色特性的預(yù)定數(shù)量的泛音的頻率和幅度參數(shù)。語(yǔ)音特性參數(shù)獲取模塊可直接設(shè)置形成語(yǔ)音模板所需的第一語(yǔ)音的各項(xiàng)語(yǔ)音特性參數(shù)，使得設(shè)置的語(yǔ)音特性參數(shù)被語(yǔ)音模板生成模塊生成為語(yǔ)音模板。語(yǔ)音處理模塊對(duì)從存儲(chǔ)的語(yǔ)音模板中選擇的語(yǔ)音模板所包含的語(yǔ)音特性參數(shù)進(jìn)行調(diào)整，并根據(jù)調(diào)整后的語(yǔ)音特性參數(shù)由語(yǔ)音模板生成模塊生成與選擇的語(yǔ)音模板不同的另一語(yǔ)音模板。
根據(jù)本發(fā)明的另一方面，還提供了一種語(yǔ)音處理方法，所述方法包括獲取表現(xiàn)第一語(yǔ)音和第二語(yǔ)音的語(yǔ)音特性的語(yǔ)音特性參數(shù)；將第一語(yǔ)音的語(yǔ)音特性參數(shù)生成為語(yǔ)音模版；根據(jù)語(yǔ)音模板調(diào)整第二語(yǔ)音的語(yǔ)音特性參數(shù)，并將調(diào)整后的語(yǔ)音特性參數(shù)應(yīng)用于第二語(yǔ)音。所述方法還可包括獲取第一語(yǔ)音和/或第二語(yǔ)音。所述方法還可包括存儲(chǔ)語(yǔ)音模板。所述語(yǔ)音特性可包括語(yǔ)音的音量、音調(diào)和音色特性中的至少一個(gè)?？蓮念A(yù)先存儲(chǔ)的語(yǔ)音中選取第一語(yǔ)音和/或第二語(yǔ)音?？墒褂娩浺粼O(shè)備錄制第一語(yǔ)音和/或第二語(yǔ)音。所述語(yǔ)音特性參數(shù)可包括下述參數(shù)中的至少一個(gè)表現(xiàn)音量特性的音量大小參數(shù)、表現(xiàn)音調(diào)特性的基音的頻率和幅度參數(shù)、表現(xiàn)音色特性的預(yù)定數(shù)量的泛音的頻率和幅度參數(shù)?？芍苯釉O(shè)置形成語(yǔ)音模板所需的第一語(yǔ)音的各項(xiàng)語(yǔ)音特性參數(shù)，使得設(shè)置的語(yǔ)音特性參數(shù)被生成為語(yǔ)音模板。對(duì)從存儲(chǔ)的語(yǔ)音模板中選擇的語(yǔ)音模板所包含的語(yǔ)音特性參數(shù)進(jìn)行調(diào)整，并根據(jù)調(diào)整后的語(yǔ)音特性參數(shù)生成與選擇的語(yǔ)音模板不同的另一語(yǔ)音模板。通過(guò)使用本發(fā)明的語(yǔ)音處理方法和系統(tǒng)，可更靈活地按照用戶的需求對(duì)語(yǔ)音進(jìn)行處理，使得語(yǔ)音處理的結(jié)果更加逼真和多樣，實(shí)現(xiàn)豐富用戶的娛樂(lè)生活的目的。將在接下來(lái)的描述中部分闡述本發(fā)明另外的方面和/或優(yōu)點(diǎn)，還有一部分通過(guò)描述將是清楚的，或者可以經(jīng)過(guò)本發(fā)明的實(shí)施而得知。

通過(guò)下面結(jié)合附圖進(jìn)行的詳細(xì)描述，本發(fā)明的上述和/或其它目的、特點(diǎn)和優(yōu)點(diǎn)將會(huì)變得更加清楚，其中圖I是示出根據(jù)本發(fā)明的示例性實(shí)施例的語(yǔ)音處理系統(tǒng)的框圖；圖2是示出根據(jù)本發(fā)明的示例性實(shí)施例的語(yǔ)音處理方法的流程圖；圖3是示出根據(jù)本發(fā)明的另一示例性實(shí)施例的語(yǔ)音模板生成方法的流程圖；圖4是示出根據(jù)本發(fā)明的又一示例性實(shí)施例的語(yǔ)音模板生成方法的流程圖。
具體實(shí)施例方式以下，將參照附圖更充分地描述本發(fā)明的示例性實(shí)施例，示例性實(shí)施例在附圖中示出。然而，可以以許多不同的形式實(shí)施示例性實(shí)施例，并且不應(yīng)被解釋為局限于在此闡述的示例性實(shí)施例。相反，提供這些實(shí)施例從而本公開(kāi)將會(huì)徹底和完整，并將完全地將示例性實(shí)施例的范圍傳達(dá)給本領(lǐng)域的技術(shù)人員。在附圖中，相同的標(biāo)號(hào)表示相同的部分。圖I是示出根據(jù)本發(fā)明的示例性實(shí)施例的語(yǔ)音處理系統(tǒng)100的框圖。參照?qǐng)D1，根據(jù)本發(fā)明的示例性實(shí)施例的語(yǔ)音處理系統(tǒng)100包括語(yǔ)音特性參數(shù)獲取模塊120、語(yǔ)音模版生成模塊130以及語(yǔ)音處理模塊140。參照?qǐng)D1，語(yǔ)音特性參數(shù)獲取模塊120可用于獲取表現(xiàn)至少一種語(yǔ)音特性(例如，語(yǔ)音的音量、音調(diào)以及音色特性等)的語(yǔ)音特性參數(shù)。僅作為示例，下面將描述使用PCM流格式的語(yǔ)音音頻信號(hào)(以下，簡(jiǎn)稱為“PCM音頻信號(hào)”)來(lái)獲取表現(xiàn)音量、音調(diào)和音色特性中的至少一種語(yǔ)音特性的語(yǔ)音特性參數(shù)的方法。音量是指人耳對(duì)所聽(tīng)到的聲音大小強(qiáng)弱的主觀感受，其客觀評(píng)價(jià)尺度是聲音的幅度大小。因此可使用PCM音頻信號(hào)的幅度來(lái)表現(xiàn)語(yǔ)音的音量大小。音調(diào)通常指具有特定且穩(wěn)定音高的信號(hào)，是聲音聽(tīng)起來(lái)調(diào)子的高低，主要取決于頻率。頻率高的聲音人耳的反應(yīng)是音調(diào)高，頻率低的聲音人耳的反應(yīng)是音調(diào)低。音調(diào)主要由聲音的基頻決定，因此，可以通過(guò)提取PCM音頻信號(hào)的基音的頻率(即，基頻)和幅度來(lái)獲取音調(diào)參數(shù)。音色是聲音的特色，每一個(gè)人的語(yǔ)音有不同的音色，因此可以根據(jù)其音色辨別出不同的人，音色的不同取決于不同的泛音，在每一種樂(lè)器、不同的人以及所有能發(fā)聲的物體發(fā)出的聲音中，除了一個(gè)基音外，還有許多不同頻率的泛音伴隨，正是這些泛音的頻率和幅度的不同組合決定了不同的音色。因此，可通過(guò)提取音頻信號(hào)的預(yù)定數(shù)量的泛音的頻率和幅度來(lái)獲取音色特性參數(shù)。常用的語(yǔ)音特性還可以概括為基音、共振峰、線性預(yù)測(cè)倒譜系數(shù)、Mel頻率倒譜系數(shù)等數(shù)字參數(shù)，通過(guò)目前現(xiàn)有的一些主流技術(shù)，如基于LPCC的特征提取技術(shù)、基于MFCC的特征提取技術(shù)、短時(shí)傅里葉變換(處理平穩(wěn)信號(hào)的傳統(tǒng)方法)技術(shù)，可獲取表現(xiàn)語(yǔ)音特性的至少一個(gè)以下參數(shù)表現(xiàn)音量特性的音量大小參數(shù)、表現(xiàn)音調(diào)特性的基音的頻率和幅度參數(shù)、表現(xiàn)音色特性的預(yù)定數(shù)量的泛音的頻率和幅度參數(shù)。在提取操作完成之后，語(yǔ)音特性參數(shù)獲取模塊120可將獲取的語(yǔ)音特性參數(shù)發(fā)送到語(yǔ)音模板生成模塊130以生成語(yǔ)音模板，或者保留所述參數(shù)，以利用這些參數(shù)隨后對(duì)該語(yǔ)音進(jìn)行處理。語(yǔ)音模版生成模塊130根據(jù)從語(yǔ)音特性參數(shù)獲取模塊120獲得的多個(gè)語(yǔ)音特性參數(shù)來(lái)生成語(yǔ)音模版，并將生成的語(yǔ)音模版存儲(chǔ)在存儲(chǔ)模塊150中，其中，所述語(yǔ)音模版是指表現(xiàn)特定語(yǔ)音的多種語(yǔ)音特性的語(yǔ)音特性參數(shù)的集合，所述語(yǔ)音特性可包括，但不限于，音量、音色和音調(diào)特性中的至少一個(gè)?？蛇x擇地，根據(jù)另一實(shí)施例，語(yǔ)音模版生成模塊130也可直接將生成的語(yǔ)音模板輸入到語(yǔ)音處理模塊140來(lái)對(duì)一語(yǔ)音進(jìn)行處理。此外，還可通過(guò)語(yǔ)音特性參數(shù)獲取模塊120按照形成語(yǔ)音模板所需的各種參數(shù)來(lái)直接設(shè)置各個(gè)語(yǔ)音特性參數(shù)，并將設(shè)置的語(yǔ)音特性參數(shù)傳遞到語(yǔ)音模板生成模塊130，以生成自定義的語(yǔ)音模版。具體地講，在本發(fā)明的實(shí)施例中，可由用戶直接設(shè)置音量大小，基音的頻率和幅度以及預(yù)定數(shù)量的泛音的頻率和幅度，并將設(shè)置好的語(yǔ)音特性參數(shù)發(fā)送到語(yǔ)音模板生成模塊130，以生成用戶期望的語(yǔ)音模板。此外，還可通過(guò)對(duì)已有的語(yǔ)音模板的參數(shù)進(jìn)行修改來(lái)生成新的語(yǔ)音模板。通過(guò)這種方式，可容易增加能夠生成和應(yīng)用的語(yǔ)音模版的種類，從而實(shí)現(xiàn)更豐富的語(yǔ)音處理效果。語(yǔ)音處理模塊140用于對(duì)待處理的語(yǔ)音進(jìn)行處理?？筛鶕?jù)用戶需求選擇用戶期望的語(yǔ)音模版，并將選擇的語(yǔ)音模板輸出到語(yǔ)音處理模塊140，以使用戶能夠根據(jù)所選擇的語(yǔ)音模版對(duì)語(yǔ)音進(jìn)行處理。詳細(xì)地說(shuō)，語(yǔ)音處理模塊140可根據(jù)選擇的語(yǔ)音模版中記錄的語(yǔ)音特性參數(shù)來(lái)對(duì)由語(yǔ)音特性參數(shù)獲取模塊120從待處理的語(yǔ)音提取的語(yǔ)音特性參數(shù)進(jìn)行調(diào)整，并將調(diào)整后的語(yǔ)音特性參數(shù)應(yīng)用于待處理的語(yǔ)音，從而使待處理的語(yǔ)音具有用戶期望的語(yǔ)音特性。
例如，可將待處理的語(yǔ)音的基音頻率和幅度分別調(diào)整為與選擇的語(yǔ)音模版中記錄的基音的頻率和幅度一致，可將待處理的語(yǔ)音的各個(gè)泛音的頻率和幅度分別調(diào)整為與選擇的語(yǔ)音模版中記錄的各個(gè)對(duì)應(yīng)的泛音的頻率和幅度一致，還可將待處理的語(yǔ)音音量大小調(diào)整為與選擇的語(yǔ)音模版中記錄的音量大小一致，從而使獲取的語(yǔ)音的音量、音調(diào)和音色特性與語(yǔ)音模版能夠表現(xiàn)的音量、音調(diào)和音色特性一致，實(shí)現(xiàn)模仿語(yǔ)音模版所表現(xiàn)的語(yǔ)音的效果。僅作為示例，假設(shè)通過(guò)語(yǔ)音特性參數(shù)獲取模塊120獲得的待處理語(yǔ)音的參數(shù)如下基音的頻率和幅度參數(shù)為(fo，Ctl),并且提取了 16組泛音參數(shù)，每個(gè)泛音的頻率和幅度
參數(shù)分別為(f\，C1)、(f2，C2)........(f16，C16)，音量大小為V，其中，&，f1； ... f16是頻率
參數(shù)，C0, C1, . . . C16是幅度參數(shù)。用戶使用語(yǔ)音模板I對(duì)待處理的語(yǔ)音進(jìn)行處理，其中，語(yǔ)音模板I中包含的語(yǔ)音特性參數(shù)為基音的頻率和幅度分別為(4，QJ，泛音的頻率和幅度
參數(shù)為(fK1，CE1)、(fE2, CE2)........(fE16, CK16)，音量大小為 VK，其中，fKQ，fE1, · · · fE16 是頻率
參數(shù)，CK(I，CK1，. . . Ce16是幅度參數(shù)。為使待處理的語(yǔ)音在進(jìn)行處理之后能夠與語(yǔ)音模板中的語(yǔ)音特性參數(shù)所表現(xiàn)出的語(yǔ)音特點(diǎn)相同或相似，分別將待處理語(yǔ)音的基音、泛音以及音量參數(shù)調(diào)整為模板中的記錄的基音、泛音以及音量參數(shù)，具體地講，使得待處理的語(yǔ)音的語(yǔ)音參數(shù)值分別被調(diào)整為fQ = fE0> fl = fEl> f2 = fE2> …、fl6 = fR16，C0 = Ceo> C1 = CR1 > …、C2 = CE2, C16 = CE16,并使得待處理的語(yǔ)音的音量大小V調(diào)整為也就是說(shuō)，使得音量大小
V = vK。在完成對(duì)待處理語(yǔ)音的語(yǔ)音特性參數(shù)的調(diào)整之后，將調(diào)整過(guò)的語(yǔ)音參數(shù)應(yīng)用于待處理的語(yǔ)音，從而完成變聲過(guò)程。具體地講，在本實(shí)施例中，通過(guò)使用與提取語(yǔ)音特性參數(shù)信息的操作相應(yīng)的逆操作，將調(diào)整后的語(yǔ)音特性參數(shù)應(yīng)用到待處理的語(yǔ)音，從而完成對(duì)待處理的語(yǔ)音的變聲處理。應(yīng)該理解，上述方法僅是示例性的，應(yīng)用語(yǔ)音模板對(duì)待處理的語(yǔ)音進(jìn)行處理的方法不限于于此，可根據(jù)用戶需要或是預(yù)定的設(shè)置來(lái)應(yīng)用語(yǔ)音模板對(duì)待處理的語(yǔ)音進(jìn)行處理?；蛘哂脩艨刹皇褂谜Z(yǔ)音模板對(duì)待處理的聲音進(jìn)行變聲，而是在語(yǔ)音處理模塊140中直接調(diào)整提取的待處理的語(yǔ)音的各個(gè)語(yǔ)音特性參數(shù)來(lái)完成待處理的語(yǔ)音的變聲過(guò)程。此外，還可在語(yǔ)音處理模塊140中實(shí)現(xiàn)對(duì)經(jīng)過(guò)處理的語(yǔ)音進(jìn)行調(diào)整和美化處理，從而使得所述語(yǔ)音能夠獲得更加逼真的音效。作為示例，這里僅描述通過(guò)使用調(diào)整泛音參數(shù)來(lái)調(diào)整語(yǔ)音的音色效果的方法。無(wú)論人聲、歌聲，還是樂(lè)器的語(yǔ)音，它們都不是一個(gè)單音，而是一個(gè)復(fù)合音。也就是由語(yǔ)音的基音和一系列的泛音所構(gòu)成。這些泛音都是基音頻率的倍數(shù)，并對(duì)音色的特性有非常重要的影響。泛音可分為低頻泛音、中頻泛音和高頻泛音。如果低頻泛音的幅度較強(qiáng)，音色就表現(xiàn)得混厚；中頻泛音的幅度比較強(qiáng)，音色就表現(xiàn)得圓潤(rùn)、自然、和諧；高頻泛音的幅度比較強(qiáng)，音色就表現(xiàn)得明亮、清透、解析力強(qiáng)。泛音的數(shù)量和泛音幅度的不同構(gòu)成音色的頻率特性曲線。這條曲線就體現(xiàn)了音色的表現(xiàn)力。音色的頻率特性曲線各不相同。將基音到第16個(gè)泛音的強(qiáng)度在坐標(biāo)上連成一條直線，這條直線就被稱為最佳美聲線。音色的頻率特性曲線越接近這條直線，所述音色的低、中、高頻泛音的比例也最為均衡，其音色的表現(xiàn)力也最好?？梢酝ㄟ^(guò)四段均衡器對(duì)音色進(jìn)行頻率處理，來(lái)提高音色的藝術(shù)表現(xiàn)力?？蓪⒁纛l分為4個(gè)大的頻率段，即HF :6kHz-16kHz,影響音色的表現(xiàn)力、解析力；MID HF :600Hz 6kHz，影響音色的明亮度、清晰度；MID LF :200Hz 600Hz，影響音色和力度和結(jié)實(shí)度；LF :20Hz 200Hz，影響音色的混厚度和豐滿度。如果高頻段頻率過(guò)弱，音色就變得色彩、韻味、個(gè)性的失落；如果高頻段頻率過(guò)強(qiáng)，音色就會(huì)變得尖噪、撕?jiǎn)?、刺耳。如果中高頻段的頻率過(guò)弱，音色就變得暗淡、朦朧；如果中高頻段的頻率過(guò)強(qiáng)，其音色就會(huì)變得呆板。如果中低頻段的頻率過(guò)弱，音色會(huì)變得空虛、無(wú)力、軟綿綿的；如果中低頻段的頻率過(guò)強(qiáng)，音色會(huì)變得生硬、失去活力。如果低頻段的頻率過(guò)弱，音色將會(huì)變得單薄、蒼白；如果低頻段的頻率過(guò)強(qiáng)，音色會(huì)變得渾濁不清。
要使音色有美感，就要泛音豐富、有層次。提升某一頻段后，還要考慮對(duì)其他頻段的影響，要總體地考慮歌聲的清晰度和豐滿度。例如，女聲在高頻部分容易產(chǎn)生S音(撕聲)，則可在7-lOKHz衰減3dB來(lái)消除S音；男語(yǔ)音域比女聲低一個(gè)8度音程，頻率低一個(gè)倍頻，在IOOHz衰減3dB左右，可以增加清晰度。通過(guò)這種方式，可完成對(duì)音色信息的調(diào)整。如上所述，盡管已描述了通過(guò)調(diào)整泛音來(lái)對(duì)語(yǔ)音做進(jìn)一步的調(diào)整和美化的方法，但本發(fā)明不限于此，還可使用其他方法實(shí)現(xiàn)對(duì)語(yǔ)音的調(diào)整和美化。此外，根據(jù)本發(fā)明的示例性實(shí)施例，語(yǔ)音處理系統(tǒng)100還可包括語(yǔ)音獲取模塊110和存儲(chǔ)模塊150。如圖I所示，語(yǔ)音獲取模塊110用于獲取待處理的語(yǔ)音，在本發(fā)明的示例性實(shí)施例中，語(yǔ)音獲取模塊110可至少使用兩種語(yǔ)音獲取方式來(lái)獲取待處理的語(yǔ)音可通過(guò)語(yǔ)音獲取裝置(例如，麥克風(fēng))從外界錄制語(yǔ)音；還可直接從預(yù)先存儲(chǔ)的語(yǔ)音中選擇待處理的語(yǔ)音。在完成獲取之后，語(yǔ)音獲取模塊110可將待處理的語(yǔ)音輸出到語(yǔ)音特性參數(shù)獲取模塊120。存儲(chǔ)模塊150用于存儲(chǔ)生成的語(yǔ)音模板，并將用戶選擇的語(yǔ)音模板提供給語(yǔ)音處理模塊140，以幫助完成對(duì)待處理的語(yǔ)音的變聲處理。此外，根據(jù)本發(fā)明的示例性實(shí)施例，所述語(yǔ)音處理系統(tǒng)100還可包括播放模塊(未示出)來(lái)播放語(yǔ)音。圖2是示出根據(jù)本發(fā)明的示例性實(shí)施例的語(yǔ)音處理的流程圖。以下將參照?qǐng)D2描述使用本發(fā)明的語(yǔ)音處理方法完成對(duì)語(yǔ)音的處理的過(guò)程。在步驟201，語(yǔ)音獲取模塊110可利用錄音裝置從外界錄制待處理的語(yǔ)音，或者從預(yù)先存儲(chǔ)的語(yǔ)音中選擇待處理的語(yǔ)音，然后將獲取的待處理的語(yǔ)音輸出到語(yǔ)音特性參數(shù)獲取模塊120。在步驟203，語(yǔ)音特性參數(shù)獲取模塊120將待處理的語(yǔ)音解碼為可用于語(yǔ)音特性參數(shù)提取的格式(例如，PCM流格式)，然后對(duì)解碼的語(yǔ)音進(jìn)行分析，以提取各語(yǔ)音特性參數(shù)(例如，音量、音調(diào)和音色特性中的至少一種的語(yǔ)音特性參數(shù))。在步驟205，確定是否將在步驟203中提取的語(yǔ)音特性參數(shù)生成為語(yǔ)音模版。如果確定生成語(yǔ)音模版，則進(jìn)入步驟207 ;如果確定不將所述語(yǔ)音特性信息生成為語(yǔ)音模版，則進(jìn)入步驟209。在步驟207，在語(yǔ)音模版生成模塊130中根據(jù)接收的語(yǔ)音特性參數(shù)生成相應(yīng)的語(yǔ)音模版，并將所述語(yǔ)音模版保存在存儲(chǔ)模塊150中。可選擇地，根據(jù)另一實(shí)施例，也可直接將語(yǔ)音模版生成模塊130生成的語(yǔ)音模板輸入到語(yǔ)音處理模塊140來(lái)對(duì)一語(yǔ)音進(jìn)行處理。
在步驟209，確定是否對(duì)獲取的語(yǔ)音進(jìn)行處理，如果需要對(duì)獲取的語(yǔ)音進(jìn)行處理，則進(jìn)入步驟211。在步驟211，從存儲(chǔ)模塊150選擇用戶期望的語(yǔ)音模版，然后將選擇的語(yǔ)音模版與在步驟203中提取的語(yǔ)音特性參數(shù)一起輸入到語(yǔ)音處理模塊140。在步驟213，根據(jù)步驟211中選擇的語(yǔ)音模版對(duì)待處理的語(yǔ)音的語(yǔ)音特性參數(shù)進(jìn)行調(diào)整，已結(jié)合圖I描述了詳細(xì)的參數(shù)調(diào)整過(guò)程，因此在此不再對(duì)其進(jìn)行描述。將調(diào)整后的語(yǔ)音特性參數(shù)應(yīng)用到待處理的語(yǔ)音以獲得新的語(yǔ)音，從而實(shí)現(xiàn)模仿語(yǔ)音模版的語(yǔ)音效果的目的。此外，還可在步驟213實(shí)現(xiàn)對(duì)語(yǔ)音的美化調(diào)整處理，例如，可通過(guò)調(diào)整語(yǔ)音的音色(即，泛音的頻率和幅度參數(shù))以使所述變化后的語(yǔ)音音效更加逼真。
圖3是示出根據(jù)本發(fā)明的另一示例性實(shí)施例的生成語(yǔ)音模板的流程圖。如圖3所示，在步驟301，在語(yǔ)音特性參數(shù)獲取模塊120直接設(shè)置生成語(yǔ)音模板所需的各項(xiàng)語(yǔ)音特性參數(shù)，具體地說(shuō)，僅作為示例，在本發(fā)明的示例性實(shí)施例中，可直接設(shè)置音量大小、基音的幅度和頻率以及泛音的幅度和頻率。在步驟303，確定語(yǔ)音特性參數(shù)的設(shè)置是否完成。如果在步驟303確定完成了語(yǔ)音特性參數(shù)的設(shè)置，則在步驟305，在語(yǔ)音模板生成模塊130使用設(shè)置的各個(gè)語(yǔ)音特性參數(shù)來(lái)生成相應(yīng)的語(yǔ)音模板，并在步驟307將生成的語(yǔ)音模板保存在存儲(chǔ)模塊150。如果在步驟303語(yǔ)音特性參數(shù)的設(shè)置還沒(méi)有結(jié)束，則可繼續(xù)設(shè)置參數(shù)，或者根據(jù)另一實(shí)施例，可選擇直接結(jié)束圖3中示出的處理圖4是示出根據(jù)本發(fā)明的又一示例性實(shí)施例的生成語(yǔ)音模板的流程圖。如圖4所示，在步驟401，從存儲(chǔ)模塊150選擇語(yǔ)音模板。在步驟403，通過(guò)語(yǔ)音處理模塊140修改選擇的模板中的各語(yǔ)音特性參數(shù)。在步驟405，確定語(yǔ)音特性參數(shù)的修改是否完成。如果在步驟405確定已完成對(duì)選擇的語(yǔ)音模板的語(yǔ)音特性參數(shù)的修改，則在步驟407，在語(yǔ)音模板生成模塊130中使用修改后的各個(gè)語(yǔ)音特性參數(shù)來(lái)生成新的語(yǔ)音模板，并將所述新的語(yǔ)音模板保存在存儲(chǔ)模塊150中。如果在步驟405語(yǔ)音特性參數(shù)的修改還沒(méi)有結(jié)束，則可繼續(xù)修改語(yǔ)音特性參數(shù)，或者根據(jù)另一實(shí)施例，可選擇直接結(jié)束圖4中示出的處理。應(yīng)該理解，在完成對(duì)選擇的語(yǔ)音模板的語(yǔ)音特性參數(shù)的修改之后，也可不生成的新的語(yǔ)音模板，而是直接在所選擇的語(yǔ)音模板上保存修改后的語(yǔ)音特性參數(shù)，從而實(shí)現(xiàn)調(diào)整語(yǔ)音模板的效果。盡管已經(jīng)參照其示例性實(shí)施例具體顯示和描述了本發(fā)明，但是本領(lǐng)域的技術(shù)人員應(yīng)該理解，在不脫離權(quán)利要求所限定的本發(fā)明的精神和范圍的情況下，可以對(duì)其進(jìn)行形式和細(xì)節(jié)上的各種改變。
權(quán)利要求
1.一種語(yǔ)音處理系統(tǒng)，所述系統(tǒng)包括語(yǔ)音特性參數(shù)獲取模塊，用于獲取表現(xiàn)第一語(yǔ)音和第二語(yǔ)音的語(yǔ)音特性的語(yǔ)音特性參數(shù)；語(yǔ)音模版生成模塊，用于將第一語(yǔ)音的語(yǔ)音特性參數(shù)生成為語(yǔ)音模版；語(yǔ)音處理模塊，用于根據(jù)語(yǔ)音模板調(diào)整第二語(yǔ)音的語(yǔ)音特性參數(shù)，并將調(diào)整后的語(yǔ)音特性參數(shù)應(yīng)用于第二語(yǔ)音。
2.如權(quán)利要求I所述的系統(tǒng)，還包括語(yǔ)音獲取模塊，用于獲取第一語(yǔ)音和/或第二語(yǔ)曰
3.如權(quán)利要求I所述的系統(tǒng)，還包括存儲(chǔ)模塊，用于存儲(chǔ)語(yǔ)音模板。
4.如權(quán)利要求I所述的系統(tǒng)，其中，所述語(yǔ)音特性包括語(yǔ)音的音量、音調(diào)和音色特性中的至少一個(gè)。
5.如權(quán)利要求2所述的系統(tǒng)，其中，所述語(yǔ)音獲取模塊從預(yù)先存儲(chǔ)的語(yǔ)音中選取第一語(yǔ)音和/或第二語(yǔ)音。
6.如權(quán)利要求2所述的系統(tǒng)，其中，所述語(yǔ)音獲取模塊使用錄音設(shè)備錄制第一語(yǔ)音和/或第二語(yǔ)音。
7.如權(quán)利要求4所述的系統(tǒng)，其中，所述語(yǔ)音特性參數(shù)包括下述參數(shù)中的至少一個(gè)表現(xiàn)音量特性的音量大小參數(shù)、表現(xiàn)音調(diào)特性的基音的頻率和幅度參數(shù)、表現(xiàn)音色特性的預(yù)定數(shù)量的泛音的頻率和幅度參數(shù)。
8.如權(quán)利要求I所述的系統(tǒng)，其中，語(yǔ)音特性參數(shù)獲取模塊直接設(shè)置形成語(yǔ)音模板所需的第一語(yǔ)音的各語(yǔ)音特性參數(shù)，使得設(shè)置的語(yǔ)音特性參數(shù)被語(yǔ)音模板生成模塊生成為語(yǔ)音模板。
9.如權(quán)利要求3所述的系統(tǒng)，其中，語(yǔ)音處理模塊對(duì)從存儲(chǔ)的語(yǔ)音模板中選擇的語(yǔ)音模板所包含的語(yǔ)音特性參數(shù)進(jìn)行調(diào)整，并根據(jù)調(diào)整后的語(yǔ)音特性參數(shù)由語(yǔ)音模板生成模塊生成與選擇的語(yǔ)音模板不同的另一語(yǔ)音模板。
10.一種語(yǔ)音處理方法，所述方法包括獲取表現(xiàn)第一語(yǔ)音和第二語(yǔ)音的語(yǔ)音特性的語(yǔ)音特性參數(shù)；將第一語(yǔ)音的語(yǔ)音特性參數(shù)生成為語(yǔ)音模版；根據(jù)語(yǔ)音模板調(diào)整第二語(yǔ)音的語(yǔ)音特性參數(shù)，并將調(diào)整后的語(yǔ)音特性參數(shù)應(yīng)用于第二語(yǔ)音。
11.如權(quán)利要求10所述的方法，還包括獲取第一語(yǔ)音和/或第二語(yǔ)音。
12.如權(quán)利要求10所述的方法，還包括存儲(chǔ)語(yǔ)音模板。
13.如權(quán)利要求10所述的方法，其中，所述語(yǔ)音特性包括語(yǔ)音的音量、音調(diào)和音色特性中的至少一個(gè)。
14.如權(quán)利要求11所述的方法，其中，從預(yù)先存儲(chǔ)的語(yǔ)音中選取第一語(yǔ)音和/或第二語(yǔ)曰
15.如權(quán)利要求11所述的方法，其中，使用錄音設(shè)備錄制第一語(yǔ)音和/或第二語(yǔ)音。
16.如權(quán)利要求13所述的方法，其中，所述語(yǔ)音特性參數(shù)包括下述參數(shù)中的至少一個(gè)表現(xiàn)音量特性的音量大小參數(shù)、表現(xiàn)音調(diào)特性的基音的頻率和幅度參數(shù)、表現(xiàn)音色特性的預(yù)定數(shù)量的泛音的頻率和幅度參數(shù)。
17.如權(quán)利要求10所述的方法，其中，直接設(shè)置形成語(yǔ)音模板所需的第一語(yǔ)音的各項(xiàng)語(yǔ)音特性參數(shù)，使得設(shè)置的語(yǔ)音特性參數(shù)被生成為語(yǔ)音模板。
18.如權(quán)利要求12所述的方法，其中，對(duì)從存儲(chǔ)的語(yǔ)音模版中選擇的語(yǔ)音模板所包含的語(yǔ)音特性參數(shù)進(jìn)行調(diào)整，并根據(jù)調(diào)整后的語(yǔ)音特性參數(shù)生成與選擇的語(yǔ)音模板不同的另一語(yǔ)音模板。
全文摘要
提供了一種用于語(yǔ)音處理的方法和系統(tǒng)，所述系統(tǒng)包括語(yǔ)音特性參數(shù)獲取模塊，用于獲取表現(xiàn)第一語(yǔ)音和第二語(yǔ)音的語(yǔ)音特性的語(yǔ)音特性參數(shù)；語(yǔ)音模版生成模塊，用于將第一語(yǔ)音的語(yǔ)音特性參數(shù)生成為語(yǔ)音模版；語(yǔ)音處理模塊，用于根據(jù)語(yǔ)音模版調(diào)整第二語(yǔ)音的語(yǔ)音特性參數(shù)，并將調(diào)整后的語(yǔ)音特性參數(shù)應(yīng)用于第二語(yǔ)音。
文檔編號(hào)G10L15/06GK102881283SQ20111020439
公開(kāi)日2013年1月16日申請(qǐng)日期2011年7月13日優(yōu)先權(quán)日2011年7月13日
發(fā)明者陳曉曉, 李遠(yuǎn)友, 向春申請(qǐng)人:三星電子(中國(guó))研發(fā)中心, 三星電子株式會(huì)社

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：陳曉曉;李遠(yuǎn)友;向春
技術(shù)所有人：三星電子(中國(guó))研發(fā)中心;三星電子株式會(huì)社
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

語(yǔ)音處理系統(tǒng)相關(guān)技術(shù)

matlab語(yǔ)音處理相關(guān)技術(shù)

語(yǔ)音處理相關(guān)技術(shù)

語(yǔ)音處理軟件相關(guān)技術(shù)

matlab語(yǔ)音處理工具箱相關(guān)技術(shù)

語(yǔ)音處理芯片相關(guān)技術(shù)

自然語(yǔ)音處理相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于語(yǔ)音處理的方法與系統(tǒng)的制作方法