專利名稱:漢語(yǔ)語(yǔ)音合成處理方法
技術(shù)領(lǐng)域:
本發(fā)明屬于計(jì)算機(jī)領(lǐng)域,特別是在計(jì)算機(jī)上處理漢語(yǔ)語(yǔ)音的方法。
目前在計(jì)算機(jī)上進(jìn)行漢語(yǔ)語(yǔ)音合成的系統(tǒng)很多,但是它們的主要缺點(diǎn)有,一個(gè)是語(yǔ)音一次合成,發(fā)音效果不可改動(dòng),另一個(gè)是音庫(kù)的語(yǔ)音信息不全,這也是語(yǔ)音發(fā)音效果不可改動(dòng)的原因。比如,現(xiàn)在處理的漢語(yǔ)語(yǔ)音處理方法其大至過(guò)程為,將待處理的漢語(yǔ)文本放進(jìn)內(nèi)存,由漢語(yǔ)語(yǔ)音編輯處理軟件包,自動(dòng)將漢語(yǔ)文本文件中的漢字組詞并賦音,每個(gè)漢字經(jīng)賦音后,自動(dòng)產(chǎn)生一個(gè)漢語(yǔ)拼音代碼串,經(jīng)用算法表示的漢語(yǔ)語(yǔ)流一般性發(fā)音規(guī)律處理,代表每個(gè)漢語(yǔ)單字音節(jié)的音節(jié)屬性代碼中的音高、音長(zhǎng)及音節(jié)間的靜音間隔各項(xiàng)即被賦上值,形成音節(jié)屬性代碼串,并直接送語(yǔ)音卡放音,用以上方法放出的聲音,可聽(tīng)性差,語(yǔ)調(diào)單一,也就是沒(méi)有抑揚(yáng)頓挫的感覺(jué)和輕重緩急的效果,更不能對(duì)同一句話處理出不同的發(fā)音效果或編輯出不同的感情色彩。
本發(fā)明的目的是為了克服上述缺點(diǎn),提供一種可在計(jì)算機(jī)鍵盤上編輯調(diào)整音高、音長(zhǎng)及音節(jié)的漢語(yǔ)合成處理方法。
漢語(yǔ)是單音節(jié)語(yǔ)系,即一個(gè)漢字是一個(gè)音節(jié),一個(gè)音節(jié)由輔音和元音組成,音節(jié)具有音高、音長(zhǎng)、音強(qiáng)三個(gè)基本物理屬性。一個(gè)音節(jié)在不同語(yǔ)流中.它的物理三屬性的物理量會(huì)依據(jù)說(shuō)話人當(dāng)時(shí)想要表達(dá)的意思或要抒發(fā)的情感而發(fā)生變化,也就是說(shuō),一個(gè)音節(jié)在不同情況下,物理三屬性的物理量是變化的、不定的。
根據(jù)語(yǔ)音流中音節(jié)的這些特點(diǎn),我們對(duì)音素庫(kù)的錄制采用以輔音和元音為基本音素單元的結(jié)構(gòu)。對(duì)元音的采制做兩項(xiàng)改進(jìn),使音素庫(kù)達(dá)到極大的信息量,以保證了對(duì)語(yǔ)流的編輯調(diào)節(jié),使計(jì)算機(jī)能合成出自然度較強(qiáng)、有抑揚(yáng)頓挫感、有感情、同一語(yǔ)句可發(fā)出不同含義語(yǔ)音的語(yǔ)流,例如對(duì)元音的采制采用八級(jí)音高的方法錄制,就一個(gè)韻母(元音)在音素庫(kù)中的狀況(ing舉例)
本系統(tǒng)對(duì)一個(gè)元音分八級(jí)音高的錄制,是根據(jù)被錄音人的音域范圍,分成八級(jí),用樂(lè)音的音階來(lái)定義,也就是被錄音人的八級(jí)音高定義在比中音C低一度半的#A、中音C、中音D、中音E、中音#F、中音#G、中音#A和高音C這八個(gè)音高上。不同的被錄音人,八級(jí)音高定義不同。
另一個(gè)改進(jìn)就是對(duì)計(jì)算機(jī)采錄的元音聲波數(shù)據(jù)中的每個(gè)周期做出周期起點(diǎn)和周期終點(diǎn)標(biāo)記,對(duì)每個(gè)周期的起點(diǎn)和它的終點(diǎn),人為地加入一個(gè)值為0的16進(jìn)制數(shù),做為控制軟件的識(shí)別標(biāo)志。當(dāng)需要延長(zhǎng)一個(gè)元音時(shí),由軟件自動(dòng)將此元音的主音段(聲能最強(qiáng)的部分)中的每個(gè)周期重復(fù)需要的次數(shù)合成輸出,縮短此元音則是平均抽出主音段中的若干聲波周期不做合成輸出。由于以上兩項(xiàng)的改進(jìn),就可以實(shí)現(xiàn)在計(jì)算機(jī)鍵盤上對(duì)語(yǔ)流中單音節(jié)在音高、音長(zhǎng)、音節(jié)間靜音間隔的編輯。
附圖
為本發(fā)明方法的流程中(1)為漢語(yǔ)文本文件(2)為構(gòu)詞賦音(3)為語(yǔ)音代碼自動(dòng)編輯(4)為語(yǔ)音代碼人工編輯(5)為音素提取(6)為放音為實(shí)現(xiàn)漢語(yǔ)語(yǔ)音編輯處理,計(jì)算機(jī)的整個(gè)運(yùn)轉(zhuǎn)過(guò)程為,待處理的漢語(yǔ)文本文件(1)(在內(nèi)存中),由漢語(yǔ)語(yǔ)音編輯處理軟件包參照CVPS(漢語(yǔ)語(yǔ)音處理系統(tǒng)),漢語(yǔ)詞庫(kù),自動(dòng)將漢語(yǔ)文本文件中的漢字組詞并賦音(2),每個(gè)漢字經(jīng)賦音后,自動(dòng)產(chǎn)生一個(gè)漢語(yǔ)拼音代碼串,經(jīng)用算法表示的漢語(yǔ)語(yǔ)流一般性發(fā)音規(guī)律自動(dòng)編輯(3)處理,代表每個(gè)漢語(yǔ)單字音節(jié)的音節(jié)屬性代碼中的音高、音長(zhǎng)及音節(jié)間的靜音間隔各項(xiàng)即被賦上值,CVPS根據(jù)拼音代碼串從計(jì)算機(jī)硬盤中存貯的CVPS音素庫(kù)中提取相應(yīng)的音素(5),依據(jù)音節(jié)屬性代碼中的音長(zhǎng)值做相應(yīng)的周期波形的處理,拼接形成語(yǔ)音波形數(shù)據(jù)流,然后送語(yǔ)音卡放音(6)。若經(jīng)CVPS處理后的語(yǔ)音效果還達(dá)不到要求的話,這時(shí)可在漢語(yǔ)語(yǔ)音編輯處理軟件包的人機(jī)交互界面下,根據(jù)操作者的意愿,人工編輯(4)調(diào)整音節(jié)的音高、音長(zhǎng)及音節(jié)間的靜音間隔,形成不同語(yǔ)義、不同情感的拼音及音節(jié)屬性代碼串。同時(shí)還可進(jìn)行多音字的處理,再送語(yǔ)音卡放音(6)。
實(shí)施例
設(shè)備386微機(jī)、語(yǔ)音卡(本系統(tǒng)用聲霸卡)以漢字“行”為例,假設(shè)該字在一個(gè)漢語(yǔ)文本文件中(僅此一字也可)“行”字的漢字內(nèi)碼,由漢語(yǔ)語(yǔ)音編輯軟件包參照CVPS漢語(yǔ)詞庫(kù),與“行”字的前后字(多字)判斷組詞關(guān)系,組成單字詞或多字詞,確定其讀音,形成該字的拼音代碼(此處定為銀行的“行”字)HANG2,其中H為聲母,ANG為韻母,2表示陽(yáng)平,按漢語(yǔ)語(yǔ)流一般性發(fā)音規(guī)律,給“行”字賦予其音高及音長(zhǎng)值,此處假定為#G調(diào),拼音代碼則為HANG52,其中5表示#G調(diào),音長(zhǎng)及音節(jié)間靜音間隔值賦在該字的音節(jié)屬性代碼中。若認(rèn)為自動(dòng)賦予的各項(xiàng)值不合適,所通過(guò)漢語(yǔ)語(yǔ)音編輯處理軟件包的人機(jī)交互界面調(diào)整。假設(shè)提高一個(gè)音高,即改為HANG62。若想改變讀音,也可通過(guò)界面改為XING52。
CVPS根據(jù)拼音代碼串從計(jì)算機(jī)硬盤中存貯的CVPS音素庫(kù)中提取相應(yīng)的音素,依據(jù)音節(jié)屬性代碼中的音長(zhǎng)值做相應(yīng)的周期波形的處理,拼接成語(yǔ)言波形數(shù)據(jù)流,送語(yǔ)音卡放音。
權(quán)利要求
1.一種包括計(jì)算機(jī)和語(yǔ)音卡的漢語(yǔ)語(yǔ)音合成處理方法,其特征在于,其運(yùn)作過(guò)程為,在內(nèi)存中漢語(yǔ)文本文件(1)經(jīng)構(gòu)詞賦音(2)之后,形成語(yǔ)音代碼的自動(dòng)編輯(3),或經(jīng)語(yǔ)音代碼的人工編輯(4)后,在硬盤中提取音素(5),送放音卡(6)。
2.按權(quán)利要求1所述的漢語(yǔ)語(yǔ)音合成處理方法,其特征在于,對(duì)音素庫(kù)中每個(gè)元音做八級(jí)音高的方法錄制。
3.按權(quán)利要求1、2所述的漢語(yǔ)語(yǔ)音合成處理方法,其特征在于對(duì)元音數(shù)據(jù)中的聲波周期數(shù)據(jù)做周期起始和終止標(biāo)記。
4.按權(quán)利要求2、3所述的漢語(yǔ)語(yǔ)音合成處理方法,其特征在于,利用計(jì)算機(jī)鍵盤對(duì)語(yǔ)流中單音節(jié)在音高、音長(zhǎng)、音節(jié)間靜音間隔的編輯。
全文摘要
本發(fā)明屬于計(jì)算機(jī)領(lǐng)域,特別是利用計(jì)算機(jī)來(lái)處理漢語(yǔ)語(yǔ)音的方法。本發(fā)明包括計(jì)算機(jī)和語(yǔ)音卡,其運(yùn)作過(guò)程為,漢語(yǔ)文本文件(1)經(jīng)構(gòu)詞賦音(2)之后,形成語(yǔ)音代碼的自動(dòng)編輯(3),或經(jīng)語(yǔ)言代碼的人工編輯(4)后,提取音素(5),送放音(6)。音素庫(kù)中對(duì)每個(gè)元音做八級(jí)音高的方法錄制,并對(duì)元音數(shù)據(jù)中的聲波周期數(shù)據(jù)做周期起始和終止標(biāo)記,可利用計(jì)算機(jī)鍵盤對(duì)語(yǔ)流中單音節(jié)在音高、音長(zhǎng)、音節(jié)間靜音間隔的編輯。
文檔編號(hào)G06F3/16GK1115442SQ94107420
公開(kāi)日1996年1月24日 申請(qǐng)日期1994年7月20日 優(yōu)先權(quán)日1994年7月20日
發(fā)明者金明, 駱?lè)屏? 楊少康, 劉念 申請(qǐng)人:金明