欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

語(yǔ)音合成設(shè)備的制作方法

文檔序號(hào):2834764閱讀:241來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):語(yǔ)音合成設(shè)備的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及語(yǔ)音(speech)合成設(shè)備,尤其涉及能夠產(chǎn)生情感上表達(dá)的合成聲音(voice)的語(yǔ)音合成設(shè)備。
背景技術(shù)
在公知的語(yǔ)音合成設(shè)備中,給出文本或音標(biāo)字母字符以產(chǎn)生相應(yīng)的合成聲音。
最近,例如,像寵物型的寵物機(jī)器人,有語(yǔ)音合成設(shè)備能夠與用戶說(shuō)話的寵物機(jī)器人已經(jīng)被提議了。
像另外一類(lèi)寵物機(jī)器人,使用代表情感狀態(tài)的情感模型并且根據(jù)情感模型代表的情感狀態(tài)遵從/違反用戶給的命令的寵物機(jī)器人已經(jīng)被提議了。
如果可以依據(jù)情感模型改變合成聲音的音調(diào),那么可以輸出依據(jù)情感的有音調(diào)的合成聲音。這樣,寵物機(jī)器人變得更有趣。

發(fā)明內(nèi)容
考慮到前述情況,本發(fā)明的目的是根據(jù)情感狀態(tài)通過(guò)產(chǎn)生具有可變音調(diào)的合成聲音生成情感上表達(dá)的合成聲音。
本發(fā)明的語(yǔ)音合成設(shè)備包括音調(diào)影響信息產(chǎn)生部件,用于在預(yù)定信息中,根據(jù)指示情感狀態(tài)的外部提供的狀態(tài)信息,產(chǎn)生用于影響合成聲音的音調(diào)的音調(diào)影響信息;和語(yǔ)音合成部件,用于使用音調(diào)影響信息產(chǎn)生具有受控制的音調(diào)的合成聲音。
本發(fā)明的語(yǔ)音合成方法包括在預(yù)定信息中,根據(jù)指示情感狀態(tài)的外部提供的狀態(tài)信息,產(chǎn)生用于影響合成聲音的音調(diào)的音調(diào)影響信息的音調(diào)影響信息產(chǎn)生步驟;和使用音調(diào)影響信息產(chǎn)生具有受控制的音調(diào)的合成聲音的語(yǔ)音合成步驟。
本發(fā)明的程序包括在預(yù)定信息中,根據(jù)指示情感狀態(tài)的外部提供的狀態(tài)信息,產(chǎn)生用于影響合成聲音的音調(diào)的音調(diào)影響信息的音調(diào)影響信息產(chǎn)生步驟;和使用音調(diào)影響信息產(chǎn)生具有受控制的音調(diào)的合成聲音的語(yǔ)音合成步驟。
本發(fā)明的記錄介質(zhì)具有有記錄在其中的程序,該程序包括在預(yù)定信息中,根據(jù)指示情感狀態(tài)的外部提供的狀態(tài)信息,產(chǎn)生用于影響合成聲音的音調(diào)的音調(diào)影響信息的音調(diào)影響信息產(chǎn)生步驟;和使用音調(diào)影響信息產(chǎn)生具有受控制的音調(diào)的合成聲音的語(yǔ)音合成步驟。
根據(jù)本發(fā)明,在預(yù)定信息中,根據(jù)指示情感狀態(tài)的外部提供的狀態(tài)信息產(chǎn)生用于影響合成聲音的音調(diào)的音調(diào)影響信息。使用音調(diào)影響信息產(chǎn)生具有受控制的音調(diào)的合成聲音。


圖1是顯示應(yīng)用了本發(fā)明的機(jī)器人實(shí)施例的外部構(gòu)造的例子的透視圖。
圖2是顯示機(jī)器人內(nèi)部構(gòu)造的例子的方框圖。
圖3是顯示控制器10功能構(gòu)造的例子的方框圖。
圖4是顯示語(yǔ)音識(shí)別單元50A構(gòu)造的例子的方框圖。
圖5是顯示語(yǔ)音合成器55構(gòu)造的例子的方框圖。
圖6是顯示基于規(guī)則的合成器32構(gòu)造的例子的方框圖。
圖7是描述由基于規(guī)則的合成器32執(zhí)行的處理的流程圖。
圖8是顯示波形發(fā)生器42構(gòu)造的第一個(gè)例子的方框圖。
圖9是顯示數(shù)據(jù)轉(zhuǎn)換器44構(gòu)造的第一個(gè)例子的方框圖。
圖10A是較高頻率增強(qiáng)(emphasis)濾波器特性的圖解。
圖10B是較高頻率抑制濾波器特性的圖解。
圖11是顯示波形發(fā)生器42構(gòu)造的第二個(gè)例子的方框圖。
圖12是顯示數(shù)據(jù)轉(zhuǎn)換器44構(gòu)造的第二個(gè)例子的方框圖。
圖13是顯示應(yīng)用了本發(fā)明的計(jì)算機(jī)實(shí)施例的構(gòu)造的例子的方框圖。
具體實(shí)施例方式
圖1示出應(yīng)用了本發(fā)明的機(jī)器人實(shí)施例的外部構(gòu)造的例子,并且圖2示出同樣實(shí)施例的電路構(gòu)造的例子。
在這一實(shí)施例中,機(jī)器人有像狗一樣四腿動(dòng)物的形式。腿部單元3A,3B,3C和3D與身體單元2的前面,后面,左邊和右邊相連。同樣,頭部單元4和尾部單元5與身體單元2分別在前面和后面相連。
尾部單元5從在身體單元2頂部表面提供的基部單元5B延展,并且尾部單元5延展,以便以兩個(gè)自由度彎曲或搖擺。
身體單元2包括在其中的用于控制整個(gè)機(jī)器人的控制器10,作為機(jī)器人電力源的電池11,以及包含電池傳感器12和熱傳感器13的內(nèi)部傳感器單元14。
頭部單元4在各自預(yù)定的位置擁有相當(dāng)于“耳朵”的麥克風(fēng)15,相當(dāng)于“眼睛”的CCD(電荷偶合裝置)攝像機(jī)16,相當(dāng)于觸覺(jué)接收器的觸覺(jué)傳感器17,和相當(dāng)于“嘴”的揚(yáng)聲器18。同樣,頭部單元4擁有相當(dāng)于嘴的下顎并且可以以一個(gè)自由度移動(dòng)的下顎4A。下顎4A移動(dòng)來(lái)張開(kāi)/關(guān)閉機(jī)器人的嘴。
如圖2所示,腿部單元3A到3D的關(guān)節(jié),腿部單元3A到3D與身體單元2之間的關(guān)節(jié),頭部單元4與身體單元2之間的關(guān)節(jié),頭部單元4與下顎4A之間的關(guān)節(jié),以及尾部單元5和身體單元2之間的關(guān)節(jié)分別擁有調(diào)節(jié)器3AA1到3AAk,3BA1到3BAk,3CA1到3CAk,3DA1到3DAk,4A1到4AL,5A1和5A2。
頭部單元4的麥克風(fēng)15收集包括用戶語(yǔ)音的周?chē)Z(yǔ)音(聲音),并把獲取的語(yǔ)音信號(hào)發(fā)送到控制器10。CCD攝像機(jī)16捕捉周?chē)h(huán)境的圖像并把獲取的圖像信號(hào)發(fā)送到控制器10。
觸覺(jué)傳感器17被提供在,例如,頭部單元4的頂部。觸覺(jué)傳感器17檢測(cè)物理接觸,例如用戶的“輕拍”或“打擊”施加的壓力,并且把檢測(cè)結(jié)果作為壓力檢測(cè)信號(hào)發(fā)送到控制器10。
身體單元2的電池傳感器12檢測(cè)剩余在電池11中的電力并把檢測(cè)結(jié)果作為電池剩余電力檢測(cè)信號(hào)發(fā)送到控制器10。熱傳感器13檢測(cè)機(jī)器人中的熱并把檢測(cè)結(jié)果作為熱檢測(cè)信號(hào)發(fā)送到控制器10。
控制器10包括在其中的CPU(中央處理單元)10A,存儲(chǔ)器10B等。CPU10A執(zhí)行存儲(chǔ)器10B中的控制程序,以執(zhí)行不同的處理。
具體的,控制器10根據(jù)分別由揚(yáng)聲器15、CCD攝像機(jī)16、觸覺(jué)傳感器17、電池傳感器12、和熱傳感器13提供的語(yǔ)音信號(hào)、圖像信號(hào)、壓力檢測(cè)信號(hào)、電池剩余電力檢測(cè)信號(hào)、和熱檢測(cè)信號(hào),確定環(huán)境的特性,如用戶是否給了命令,或者用戶是否接近。
根據(jù)確定結(jié)果,控制器10確定要進(jìn)行的隨后動(dòng)作。根據(jù)動(dòng)作確定結(jié)果,控制器10在調(diào)節(jié)器3AA1到3AAk,3BA1到3BAk,3CA1到3CAk,3DA1到3DAk,4A1到4AL,5A1和5A2當(dāng)中激活必要的單元。這引起頭部單元4豎直地和水平地?fù)u擺和下顎4A張開(kāi)和關(guān)閉。而且,這引起尾部單元5移動(dòng)并激活腿部單元3A到3D,以使得機(jī)器人行走。
隨著環(huán)境需要,控制器10產(chǎn)生合成聲音并將產(chǎn)生的聲音提供到揚(yáng)聲器18輸出聲音。此外,控制器10引起提供在機(jī)器人“眼睛”位置的LED(發(fā)光二極管)(沒(méi)有示出)打開(kāi)、關(guān)閉、或者閃爍開(kāi)和關(guān)。
因此,機(jī)器人被構(gòu)造為根據(jù)周?chē)鸂顟B(tài)等自主地行動(dòng)。
圖3示出圖2所示的控制器10的功能構(gòu)造的例子。圖3所示的功能構(gòu)造通過(guò)CPU10A執(zhí)行儲(chǔ)存在存儲(chǔ)器10B中的控制程序來(lái)實(shí)現(xiàn)。
控制器10包括用于識(shí)別具體外部狀態(tài)的傳感器輸入處理器50;用于積累傳感器輸入處理器50獲取的識(shí)別結(jié)果和表達(dá)情感,本能和成長(zhǎng)狀態(tài)的模型儲(chǔ)存單元51;用于根據(jù)傳感器輸入處理器50獲取的識(shí)別結(jié)果確定隨后動(dòng)作的動(dòng)作確定裝置52;用于引起機(jī)器人根據(jù)動(dòng)作確定裝置52獲取的確定結(jié)果實(shí)際執(zhí)行動(dòng)作的姿態(tài)變化裝置53;用于驅(qū)動(dòng)和控制調(diào)節(jié)器3AA1到5A1和5A2的控制裝置54;以及用于產(chǎn)生合成聲音的語(yǔ)音合成器55。
傳感器輸入處理器50根據(jù)由揚(yáng)聲器15、CCD攝像機(jī)16、觸覺(jué)傳感器17等提供的語(yǔ)音信號(hào)、圖像信號(hào)、壓力檢測(cè)信號(hào)等,識(shí)別具體的外部狀態(tài),用戶做的具體接近,和用戶給的命令,并且通知模型存儲(chǔ)單元51和動(dòng)作確定裝置52指示識(shí)別結(jié)果的狀態(tài)識(shí)別信息。
更具體地,傳感器輸入處理器50包括語(yǔ)音識(shí)別單元50A。語(yǔ)音識(shí)別單元50A執(zhí)行由揚(yáng)聲器15提供的語(yǔ)音信號(hào)的語(yǔ)音識(shí)別。語(yǔ)音識(shí)別單元50A把如“行走”,“下來(lái)”,“抓球”等的命令的語(yǔ)音識(shí)別結(jié)果作為狀態(tài)識(shí)別信息報(bào)告給模型存儲(chǔ)單元51和動(dòng)作確定裝置52。
傳感器輸入處理器50包括圖像識(shí)別單元50B。圖像識(shí)別單元50B使用由CCD攝像機(jī)16提供的圖像信號(hào)執(zhí)行圖像識(shí)別處理。當(dāng)圖像識(shí)別單元50B作為結(jié)果檢測(cè)到,例如,“一個(gè)紅的圓的物體”或“一個(gè)與預(yù)定高度或更高的地面垂直的平面”時(shí),圖像識(shí)別單元50B把像“有一個(gè)球”或“有一堵墻”這樣的圖像識(shí)別結(jié)果作為狀態(tài)識(shí)別信息報(bào)告給模型存儲(chǔ)單元51和動(dòng)作確定裝置52。
此外,傳感器輸入處理器50包括壓力處理器50C。壓力處理器50C處理由觸覺(jué)傳感器17提供的壓力檢測(cè)信號(hào)。當(dāng)壓力處理器50C作為結(jié)果檢測(cè)到在短時(shí)間內(nèi)施加的超出預(yù)定閾值的壓力時(shí),壓力處理器50C識(shí)別到機(jī)器人被“打(懲罰)”了。當(dāng)壓力處理器50C檢測(cè)到在長(zhǎng)時(shí)間內(nèi)施加的降低到預(yù)定閾值以下的壓力時(shí),壓力處理器50C識(shí)別到機(jī)器人被“輕拍(獎(jiǎng)勵(lì))”了。壓力處理器50C把識(shí)別結(jié)果作為狀態(tài)識(shí)別信息報(bào)告給模型存儲(chǔ)單元51和動(dòng)作確定裝置52。
模型存儲(chǔ)單元51存儲(chǔ)并管理分別用于表達(dá)情感、本能、和成長(zhǎng)狀態(tài)的情感模型、本能模型、和成長(zhǎng)模型。
情感模型使用預(yù)定范圍內(nèi)的值(例如,-1.0到1.0)代表情感狀態(tài)(程度),例如,“快樂(lè)”,“悲傷”,“憤怒”,和“享樂(lè)”。該值根據(jù)來(lái)自傳感器輸入處理器50、過(guò)去的時(shí)間等的狀態(tài)識(shí)別信息而改變。本能模型用預(yù)定范圍內(nèi)的值代表愿望狀態(tài)(程度)如“餓”,“睡覺(jué)”,“移動(dòng)”等。該值根據(jù)來(lái)自傳感器輸入處理器50、過(guò)去的時(shí)間等的狀態(tài)識(shí)別信息而改變。成長(zhǎng)模型用預(yù)定范圍內(nèi)的值代表成長(zhǎng)狀態(tài)(程度)如“童年”,“青年”,“成年”,“老年”等。該值根據(jù)來(lái)自傳感器輸入處理器50、過(guò)去的時(shí)間等的狀態(tài)識(shí)別信息而改變。
以這種方式,模型存儲(chǔ)單元51把分別由情感模型,本能模型,和成長(zhǎng)模型的值代表的情感、本能、和成長(zhǎng)的狀態(tài)作為狀態(tài)信息輸出到動(dòng)作確定裝置52。
狀態(tài)識(shí)別信息由傳感器輸入處理器50提供到模型存儲(chǔ)單元51。另外,指示機(jī)器人做的當(dāng)前的或過(guò)去的動(dòng)作的內(nèi)容的動(dòng)作信息,例如,“走了很長(zhǎng)時(shí)間”由動(dòng)作確定裝置52提供到模型存儲(chǔ)單元51。即使提供了同樣的狀態(tài)識(shí)別信息,模型存儲(chǔ)單元51根據(jù)動(dòng)作信息指示的機(jī)器人的動(dòng)作產(chǎn)生不同的狀態(tài)信息。
更具體地,例如,如果機(jī)器人向用戶問(wèn)好并且用戶輕拍機(jī)器人的頭,指示機(jī)器人向用戶問(wèn)好的動(dòng)作信息和指示機(jī)器人被輕拍頭部的狀態(tài)識(shí)別信息被提供到模型存儲(chǔ)單元51。在這種情況下,代表“快樂(lè)”的情感模型的值在模型存儲(chǔ)單元51中增加。
相反的,如果機(jī)器人被輕拍頭部同時(shí)執(zhí)行特定的任務(wù),指示機(jī)器人現(xiàn)在正執(zhí)行任務(wù)的動(dòng)作信息和指示機(jī)器人被輕拍頭部的狀態(tài)識(shí)別信息被提供到模型存儲(chǔ)單元51。在這種情況下,代表“快樂(lè)”的情感模型的值在模型存儲(chǔ)單元51中不變。
模型存儲(chǔ)單元51通過(guò)參考狀態(tài)識(shí)別信息和指示機(jī)器人做的當(dāng)前或過(guò)去動(dòng)作的動(dòng)作信息,設(shè)定情感模型的值。這樣,當(dāng)用戶輕拍機(jī)器人頭部來(lái)挑逗機(jī)器人,而機(jī)器人正在執(zhí)行特定任務(wù)時(shí),防止情感中不自然的變化,如代表“快樂(lè)”的情感模型的值的增加。
如在情感模型中,模型存儲(chǔ)單元51根據(jù)狀態(tài)識(shí)別信息和動(dòng)作信息增加或減少本能模型和成長(zhǎng)模型的值。同樣,模型存儲(chǔ)單元51根據(jù)其他模型的值增加或減少情感模型、本能模型、或成長(zhǎng)模型的值。
動(dòng)作確定裝置52根據(jù)由傳感器輸入處理器50提供的狀態(tài)識(shí)別信息、由模型存儲(chǔ)單元51提供的狀態(tài)信息、過(guò)去的時(shí)間等確定隨后的動(dòng)作,并且把確定的動(dòng)作的內(nèi)容作為動(dòng)作命令信息發(fā)送到姿態(tài)變化裝置53。
具體的,動(dòng)作確定裝置52管理有限狀態(tài)自動(dòng)控制裝置,在這個(gè)有限狀態(tài)自動(dòng)控制裝置中,可能由機(jī)器人做的動(dòng)作作為限定機(jī)器人動(dòng)作的動(dòng)作模型與狀態(tài)聯(lián)系起來(lái)。有限狀態(tài)自動(dòng)控制裝置中如動(dòng)作模型的狀態(tài)根據(jù)來(lái)自傳感器輸入處理器50的狀態(tài)識(shí)別信息、模型存儲(chǔ)單元51中的情感模型、本能模型、或成長(zhǎng)模型的值,過(guò)去的時(shí)間等,經(jīng)歷轉(zhuǎn)變。動(dòng)作確定裝置52然后確定一個(gè)對(duì)應(yīng)于轉(zhuǎn)變后的狀態(tài)的動(dòng)作,作為隨后動(dòng)作。
如果動(dòng)作確定裝置52檢測(cè)到預(yù)定的觸發(fā)器,那么動(dòng)作確定裝置52就引起狀態(tài)經(jīng)歷轉(zhuǎn)變。換句話說(shuō),當(dāng)對(duì)應(yīng)于當(dāng)前狀態(tài)的動(dòng)作被執(zhí)行了預(yù)定長(zhǎng)度的時(shí)間,當(dāng)接收到預(yù)定的狀態(tài)識(shí)別信息,或者當(dāng)由模型存儲(chǔ)單元51提供的狀態(tài)信息指示的情感、本能、或成長(zhǎng)的狀態(tài)的值變得少于或等于預(yù)定閾值或者變得大于或等于預(yù)定閾值時(shí),動(dòng)作確定裝置52引起狀態(tài)經(jīng)歷轉(zhuǎn)變。
如上所述,動(dòng)作確定裝置52不僅根據(jù)來(lái)自傳感器輸入處理器50的狀態(tài)識(shí)別信息而且根據(jù)模型存儲(chǔ)單元51中的情感模型、本能模型、和成長(zhǎng)模型等的值引起動(dòng)作模型中的狀態(tài)經(jīng)歷轉(zhuǎn)變。即使輸入同樣的狀態(tài)識(shí)別信息,下一狀態(tài)根據(jù)情感模型、本能模型和成長(zhǎng)模型(狀態(tài)信息)的值而不同。
結(jié)果,例如,當(dāng)狀態(tài)信息指示機(jī)器人“不生氣”和“不餓”,并且當(dāng)狀態(tài)識(shí)別信息指示“一只手伸到機(jī)器人面前”時(shí),動(dòng)作確定裝置52產(chǎn)生動(dòng)作命令信息指導(dǎo)機(jī)器人“搖爪子”來(lái)響應(yīng)有一只手伸到機(jī)器人面前。動(dòng)作確定裝置52把產(chǎn)生的動(dòng)作命令發(fā)送到姿態(tài)變化裝置53。
當(dāng)狀態(tài)信息指示機(jī)器人“不生氣”和“餓”,并且當(dāng)狀態(tài)識(shí)別信息指示“一只手伸到機(jī)器人面前”時(shí),動(dòng)作確定裝置52產(chǎn)生動(dòng)作命令信息指導(dǎo)機(jī)器人“舔手”來(lái)響應(yīng)有一只手伸到機(jī)器人面前。動(dòng)作確定裝置52把產(chǎn)生的動(dòng)作命令發(fā)送到姿態(tài)變化裝置53。
例如,當(dāng)狀態(tài)信息指示機(jī)器人“生氣”,并且當(dāng)狀態(tài)識(shí)別信息指示“一只手伸到機(jī)器人面前”時(shí),動(dòng)作確定裝置52產(chǎn)生動(dòng)作命令信息指導(dǎo)機(jī)器人“轉(zhuǎn)過(guò)頭去”而不顧狀態(tài)信息指示機(jī)器人是“餓”或“不餓”。動(dòng)作確定裝置52把產(chǎn)生的動(dòng)作命令發(fā)送到姿態(tài)變化裝置53。
動(dòng)作確定裝置52可以確定行走速度,腿移動(dòng)的幅度和速度等,這些是根據(jù)由從模型存儲(chǔ)單元51提供的狀態(tài)信息指示的情感、本能、和成長(zhǎng)的狀態(tài),對(duì)應(yīng)于下一狀態(tài)的動(dòng)作參數(shù)。在這種情況下,包含這些參數(shù)的動(dòng)作命令信息被發(fā)送到姿態(tài)變化裝置53。
如上所述,動(dòng)作確定裝置52不僅產(chǎn)生指導(dǎo)機(jī)器人活動(dòng)它的頭和腿的動(dòng)作命令信息,而且產(chǎn)生指導(dǎo)機(jī)器人說(shuō)話的動(dòng)作命令信息。指導(dǎo)機(jī)器人說(shuō)話的動(dòng)作命令信息被提供到語(yǔ)音合成器55。被提供到語(yǔ)音合成器55的動(dòng)作命令信息包括對(duì)應(yīng)于要由語(yǔ)音合成器55產(chǎn)生的合成聲音的文本。響應(yīng)于來(lái)自動(dòng)作確定裝置52的動(dòng)作命令信息,語(yǔ)音合成器55根據(jù)包含在動(dòng)作命令信息中的文本產(chǎn)生合成聲音。該合成聲音被提供到揚(yáng)聲器18并從揚(yáng)聲器18輸出。這樣,揚(yáng)聲器18輸出機(jī)器人的聲音,對(duì)用戶不同的請(qǐng)求如“我餓了”,響應(yīng)于用戶口頭接觸的回答如“什么 ”,以及其他語(yǔ)音。狀態(tài)信息要從模型存儲(chǔ)單元51提供到語(yǔ)音合成器55。語(yǔ)音合成器55可以根據(jù)這一狀態(tài)信息代表的情感狀態(tài)產(chǎn)生音調(diào)受控制的合成聲音。另外,語(yǔ)音合成器55可以根據(jù)情感、本能、和成長(zhǎng)的狀態(tài)產(chǎn)生音調(diào)-控制的合成聲音。
姿態(tài)變化裝置53根據(jù)由動(dòng)作確定裝置52提供的動(dòng)作命令信息產(chǎn)生用于引起機(jī)器人從當(dāng)前姿態(tài)移動(dòng)到下一姿態(tài)的姿態(tài)變化信息,并把姿態(tài)變化信息發(fā)送到控制裝置54。
根據(jù)身體和腿的形狀、重量、機(jī)器人的物理形狀如各部分間的連接狀態(tài)、和調(diào)節(jié)器3AA1到5A1和5A2的機(jī)械裝置如彎曲方向和關(guān)節(jié)的角度,確定當(dāng)前狀態(tài)可以變化到的下一狀態(tài)。
下一狀態(tài)包括當(dāng)前狀態(tài)可以直接變化到的狀態(tài)和當(dāng)前狀態(tài)不能直接變化到的狀態(tài)。例如,雖然四腿機(jī)器人可以直接從機(jī)器人伸開(kāi)它的腿的躺著的狀態(tài)變化到坐著的狀態(tài),但是機(jī)器人不能直接變到站立的狀態(tài)。要求機(jī)器人執(zhí)行兩步的動(dòng)作。第一,機(jī)器人的四肢拉向身體地躺在地面上,然后機(jī)器人站立起來(lái)。另外,有一些機(jī)器人不能可靠地假定的姿態(tài)。例如,如果當(dāng)前正處于站立姿態(tài)的四腿機(jī)器人試圖收起它的前爪,那么機(jī)器人容易摔倒。
姿態(tài)變化裝置53提前存儲(chǔ)機(jī)器人可以直接變化到的姿態(tài)。如果由動(dòng)作確定裝置52提供的動(dòng)作命令信息指示機(jī)器人可以直接變化到的姿態(tài),那么姿態(tài)變化裝置53把動(dòng)作命令信息作為姿態(tài)變化信息發(fā)送到控制裝置54。相反地,如果動(dòng)作命令信息指示機(jī)器人不能直接變化到的姿態(tài),姿態(tài)變化裝置53產(chǎn)生引起機(jī)器人先假定一個(gè)機(jī)器人可以直接變化到的姿態(tài),然后再假定一個(gè)目標(biāo)姿態(tài)的姿態(tài)變化信息,并且把姿態(tài)變化信息發(fā)送到控制裝置54。因此,防止機(jī)器人強(qiáng)迫自己假定不可能的姿態(tài)或者防止其摔倒。
控制裝置54依據(jù)由姿態(tài)變化裝置53提供的姿態(tài)變化信息產(chǎn)生用于驅(qū)動(dòng)調(diào)節(jié)器3AA1到5A1和5A2的控制信號(hào),并把控制信號(hào)傳送到調(diào)節(jié)器3AA1到5A1和5A2。所以,依據(jù)控制信號(hào)驅(qū)動(dòng)調(diào)節(jié)器3AA1到5A1和5A2,并且因此,機(jī)器人自主地執(zhí)行動(dòng)作。
圖4示出圖3中所示的語(yǔ)音識(shí)別單元50A的構(gòu)造的例子。
來(lái)自麥克風(fēng)15的語(yǔ)音信號(hào)被提供到AD(模擬數(shù)字)變換器21。AD變換器21對(duì)由麥克風(fēng)15提供的模擬信號(hào)的語(yǔ)音信號(hào)取樣,并量化取樣的語(yǔ)音信號(hào),從而把該信號(hào)AD-變換為是數(shù)字信號(hào)的語(yǔ)音數(shù)據(jù)。該語(yǔ)音數(shù)據(jù)被提供到特征提取單元22和語(yǔ)音部分檢測(cè)器27。
特征提取單元22執(zhí)行,例如,語(yǔ)音數(shù)據(jù)的MFCC(Mel頻率倒頻譜系數(shù))分析,它是以適當(dāng)幀為單位輸入進(jìn)去,然后把作為分析結(jié)果獲取的MFCCs作為特征參數(shù)(特征向量)輸出到匹配單元23。另外,特征提取單元22可以提取,如特征參數(shù)、線性預(yù)測(cè)系數(shù)、倒頻譜系數(shù)、線頻譜對(duì)、和在每個(gè)預(yù)定頻率帶中的能量(濾波器存儲(chǔ)體的輸出)。
使用從特征提取單元22提供的特征參數(shù),匹配單元23根據(jù),例如,連續(xù)分布的HMM(隱藏的馬爾可夫模型)方法通過(guò)必要時(shí)參考聲學(xué)模型存儲(chǔ)單元24、字典存儲(chǔ)單元25、和語(yǔ)法存儲(chǔ)單元26,執(zhí)行輸入到麥克風(fēng)15的語(yǔ)音(輸入的語(yǔ)音)的語(yǔ)音識(shí)別。
具體的,聲學(xué)模型存儲(chǔ)單元24以經(jīng)受語(yǔ)音識(shí)別的語(yǔ)音語(yǔ)言存儲(chǔ)指示每個(gè)音素或每個(gè)音節(jié)的聲學(xué)特征的聲學(xué)模型。例如,根據(jù)連續(xù)分布的HMM方法執(zhí)行語(yǔ)音識(shí)別。HMM(隱藏的馬爾可夫模型)被用作聲學(xué)模型。字典存儲(chǔ)單元25存儲(chǔ)包含關(guān)于要被識(shí)別的每個(gè)字的發(fā)音的信息(音素信息)的詞語(yǔ)字典。語(yǔ)法存儲(chǔ)單元26存儲(chǔ)描述注冊(cè)在字典存儲(chǔ)單元25的詞語(yǔ)字典中的字是如何被連接起來(lái)的(鏈接的)語(yǔ)法規(guī)則。例如,無(wú)上下文語(yǔ)法(CFG)或根據(jù)統(tǒng)計(jì)的字連接概率(N-gram)的規(guī)則可以被用作語(yǔ)法規(guī)則。
匹配單元23參考字典存儲(chǔ)單元25的詞語(yǔ)字典,以連接存儲(chǔ)在聲學(xué)模型存儲(chǔ)單元24中的聲學(xué)模型,這樣形成一個(gè)字的聲學(xué)模型(字模型)。匹配單元23也參考存儲(chǔ)在語(yǔ)法存儲(chǔ)單元26中的語(yǔ)法規(guī)則來(lái)連接幾個(gè)字模型,并且通過(guò)使用連續(xù)分布的HMM方法根據(jù)特征參數(shù)使用連接的字模型來(lái)識(shí)別經(jīng)麥克風(fēng)15輸入的語(yǔ)音。換句話說(shuō),匹配單元23檢測(cè)具有正被觀察的時(shí)間序列特征參數(shù)的最高得分(可能性)的一序列字模型,這一序列字模型由特征提取單元22輸出。匹配單元23把音素信息(發(fā)音)輸出在對(duì)應(yīng)于字模型的序列的字符串上,作為語(yǔ)音識(shí)別結(jié)果。
更具體的,匹配單元23積累關(guān)于對(duì)應(yīng)于連接的字模型的字符串發(fā)生的每個(gè)特征參數(shù)的概率,并且假定積累的值為一個(gè)得分。匹配單元23把音素信息輸出在有最高得分的字串上,作為語(yǔ)音識(shí)別結(jié)果。
輸入到麥克風(fēng)15的語(yǔ)音的識(shí)別結(jié)果,如上面描述地被輸出,作為狀態(tài)識(shí)別信息輸出到模型存儲(chǔ)單元51和動(dòng)作確定裝置52。
關(guān)于來(lái)自AD變換器21的語(yǔ)音數(shù)據(jù),語(yǔ)音部分檢測(cè)器27計(jì)算出如在特征提取單元22執(zhí)行的MFCC分析中每個(gè)幀的能量。此外,語(yǔ)音部分檢測(cè)器27用一個(gè)預(yù)定的閾值比較每個(gè)幀中的能量,并且檢測(cè)由擁有大于或等于閾值的能量的幀形成的部分,作為輸入用戶語(yǔ)音的語(yǔ)音部分。語(yǔ)音部分檢測(cè)器27把被檢測(cè)的語(yǔ)音部分提供到特征提取單元22和匹配單元23。特征提取單元22和匹配單元23僅執(zhí)行語(yǔ)音部分的處理。語(yǔ)音部分檢測(cè)器27執(zhí)行的用于檢測(cè)語(yǔ)音部分的檢測(cè)方法不限于上面描述的能量與閾值比較的方法。
圖5示出圖3中所示的語(yǔ)音合成器55的構(gòu)造的例子。
包括經(jīng)受語(yǔ)音合成和從動(dòng)作確定裝置52輸出的文本的動(dòng)作命令信息被提供到文本分析器31。文本分析器31參考字典存儲(chǔ)單元34和產(chǎn)生的語(yǔ)法存儲(chǔ)單元35并且分析包含在動(dòng)作命令信息中的文本。
具體的,字典存儲(chǔ)單元34存儲(chǔ)包含在每個(gè)字上的語(yǔ)音部分信息、發(fā)音信息、和重音信息的詞語(yǔ)字典。產(chǎn)生的語(yǔ)法存儲(chǔ)單元35存儲(chǔ)關(guān)于包含在字典存儲(chǔ)單元34的詞語(yǔ)字典中的每個(gè)字的產(chǎn)生的例如字連接上的限制的語(yǔ)法規(guī)則。根據(jù)詞語(yǔ)字典和產(chǎn)生的語(yǔ)法規(guī)則,文本分析器31執(zhí)行例如形態(tài)學(xué)分析和解析造句法分析的輸入文本的文本分析(語(yǔ)言分析)。文本分析器31提取對(duì)于基于規(guī)則的合成器32在隨后的階段執(zhí)行的基于規(guī)則的語(yǔ)音合成必要的信息?;谝?guī)則的語(yǔ)音合成需要的信息包括,例如,用于控制停頓、重音、和語(yǔ)調(diào)的位置的韻律信息和指示每個(gè)字發(fā)音的音素信息。
文本分析器31獲得的信息被提供到基于規(guī)則的合成器32。基于規(guī)則的合成器32參考語(yǔ)音信息存儲(chǔ)單元36并在對(duì)應(yīng)于輸入到文本分析器31的文本的合成聲音上產(chǎn)生語(yǔ)音數(shù)據(jù)(數(shù)字?jǐn)?shù)據(jù))。
具體的,語(yǔ)音信息存儲(chǔ)單元36以CV(輔音和元音)、VCV、CVC、和如音高的波形數(shù)據(jù)的形式存儲(chǔ)音素單元數(shù)據(jù),作為語(yǔ)音信息。根據(jù)來(lái)自文本分析器31的信息,基于規(guī)則的合成器32把必要的音素單元數(shù)據(jù)連接起來(lái)并處理音素單元數(shù)據(jù)的波形,這樣適當(dāng)?shù)靥砑恿送nD、重音、和語(yǔ)調(diào)。因此,基于規(guī)則的合成器32為對(duì)應(yīng)于輸入到文本分析器31的文本的合成聲音(合成的聲音數(shù)據(jù))產(chǎn)生語(yǔ)音數(shù)據(jù)。可選的,語(yǔ)音信息存儲(chǔ)單元36把語(yǔ)音特征參數(shù)存儲(chǔ)為語(yǔ)音信息,例如通過(guò)分析波形數(shù)據(jù)的聲學(xué)獲得的線性預(yù)測(cè)系數(shù)(LPC)和倒頻譜系數(shù)。根據(jù)來(lái)自文本分析器31的信息,基于規(guī)則的合成器32使用必要的特征參數(shù)作為用于語(yǔ)音合成的合成濾波器的抽頭(tap)系數(shù),并且控制用于輸出要提供到合成濾波器的驅(qū)動(dòng)信號(hào)的聲音源,這樣適當(dāng)?shù)靥砑恿送nD、重音、和語(yǔ)調(diào)。因此,基于規(guī)則的合成器32為對(duì)應(yīng)于輸入到文本分析器31的文本的合成聲音(合成的聲音數(shù)據(jù))產(chǎn)生語(yǔ)音數(shù)據(jù)。此外,狀態(tài)信息從模型存儲(chǔ)單元51被提供到基于規(guī)則的合成器32。根據(jù),例如,狀態(tài)信息中情感模型的值,基于規(guī)則的合成器32產(chǎn)生用于控制來(lái)自儲(chǔ)存在語(yǔ)音信息存儲(chǔ)單元36中的語(yǔ)音信息的基于規(guī)則的語(yǔ)音合成的音調(diào)控制信息或不同的合成控制參數(shù)。因此,基于規(guī)則的合成器32產(chǎn)生音調(diào)控制的合成聲音數(shù)據(jù)。
以上述方式產(chǎn)生的合成聲音數(shù)據(jù)被提供到揚(yáng)聲器18,并且揚(yáng)聲器18輸出對(duì)應(yīng)于輸入到文本分析器31的文本的合成聲音,同時(shí)依據(jù)情感控制音調(diào)。
如上所述,圖3所示的動(dòng)作確定裝置52根據(jù)動(dòng)作模型確定隨后的動(dòng)作。要被作為合成聲音輸出的文本的內(nèi)容可以與機(jī)器人做的動(dòng)作聯(lián)系起來(lái)。
具體的,例如,當(dāng)機(jī)器人執(zhí)行一個(gè)從坐的狀態(tài)變化到站立的狀態(tài)的動(dòng)作時(shí),文本“杭育(alley-oop)!”可以與該動(dòng)作聯(lián)系起來(lái)。在這種情況下,當(dāng)機(jī)器人從坐的狀態(tài)變化到站立的狀態(tài)時(shí),合成聲音“杭育!”與姿態(tài)的變化同步地輸出。
圖6示出圖5所示的基于規(guī)則的合成器32的構(gòu)造的例子。
文本分析器31(圖5)獲得的文本分析結(jié)果被提供到韻律產(chǎn)生器41。韻律產(chǎn)生器41產(chǎn)生用于根據(jù)指示例如,停頓、重音、語(yǔ)調(diào)的位置、和能量以及音素信息的韻律信息,具體控制合成聲音的韻律的韻律數(shù)據(jù)。韻律產(chǎn)生器41產(chǎn)生的韻律數(shù)據(jù)被提供到波形發(fā)生器42。作為韻律數(shù)據(jù),韻律產(chǎn)生器41產(chǎn)生形成合成聲音的每個(gè)音素的持續(xù)時(shí)間、指示合成聲音音高(pitch)周期的時(shí)間變化模型的周期模型信號(hào)、和指示合成聲音時(shí)間變化能量模型的能量模型信號(hào)。
如上所述,除韻律數(shù)據(jù)外,文本分析器31(圖5)獲得的文本分析結(jié)果被提供到波形發(fā)生器42。同樣,合成控制參數(shù)從參數(shù)產(chǎn)生器43被提供到波形發(fā)生器42。依據(jù)包含在文本分析結(jié)果中的音素信息,波形發(fā)生器42從被轉(zhuǎn)換的語(yǔ)音信息存儲(chǔ)單元45讀取必要的被轉(zhuǎn)換的語(yǔ)音信息,并且使用被轉(zhuǎn)換的語(yǔ)音信息執(zhí)行基于規(guī)則的語(yǔ)音合成,這樣就產(chǎn)生合成聲音。當(dāng)執(zhí)行基于規(guī)則的語(yǔ)音合成時(shí),波形發(fā)生器42根據(jù)來(lái)自韻律產(chǎn)生器41的韻律數(shù)據(jù)和來(lái)自參數(shù)產(chǎn)生器43的合成控制參數(shù),通過(guò)調(diào)整合成聲音數(shù)據(jù)的波形控制合成聲音的韻律和音調(diào)。波形發(fā)生器42輸出最終獲得的合成聲音數(shù)據(jù)。
狀態(tài)信息從模型存儲(chǔ)單元51(圖3)被提供到參數(shù)產(chǎn)生器43。根據(jù)狀態(tài)信息中的情感模型,參數(shù)產(chǎn)生器43產(chǎn)生用于由波形發(fā)生器42控制基于規(guī)則的語(yǔ)音合成的合成控制參數(shù)和用于轉(zhuǎn)換存儲(chǔ)在語(yǔ)音信息存儲(chǔ)單元36(圖5)中的語(yǔ)音信息的轉(zhuǎn)換參數(shù)。
具體的,參數(shù)產(chǎn)生器43存儲(chǔ)一個(gè)轉(zhuǎn)換表,在其中指示例如“快樂(lè)”,“悲傷”,“憤怒”,“享樂(lè)”,“興奮”,“想睡”,“舒適”,和“不適”的情感狀態(tài)作為情感模型的值(以下在必要時(shí)稱(chēng)為情感模型值)與合成控制參數(shù)和轉(zhuǎn)換參數(shù)聯(lián)系起來(lái)。使用轉(zhuǎn)換表,參數(shù)產(chǎn)生器43輸出與來(lái)自模型存儲(chǔ)單元51的狀態(tài)信息中的情感模型值相關(guān)的合成控制參數(shù)和轉(zhuǎn)換參數(shù)。
形成存儲(chǔ)在參數(shù)產(chǎn)生器43中的轉(zhuǎn)換表以便情感模型值與合成控制參數(shù)和轉(zhuǎn)換參數(shù)聯(lián)系起來(lái),以便于產(chǎn)生具有指示寵物機(jī)器人情感狀態(tài)的音調(diào)的合成聲音。情感模型值與合成控制參數(shù)和轉(zhuǎn)換參數(shù)聯(lián)系起來(lái)的方式可以由,例如,仿真確定。
使用轉(zhuǎn)換模型,合成控制參數(shù)和轉(zhuǎn)換參數(shù)從情感模型值中產(chǎn)生??蛇x的,合成控制參數(shù)和轉(zhuǎn)換參數(shù)可以由以下方法產(chǎn)生。
具體的,例如,Pn代表情感#n的情感模型值,Qi代表合成控制參數(shù)或轉(zhuǎn)換參數(shù),并且fi,n()代表預(yù)定函數(shù)。合成控制參數(shù)或轉(zhuǎn)換參數(shù)Qi可以通過(guò)計(jì)算等式Qi=∑fi,n(Pn)來(lái)計(jì)算,其中∑代表變量n的總和。
在上面的情況中,使用了轉(zhuǎn)換表,在其中考慮到例如“快樂(lè)”,“悲傷”,“憤怒”,和“享樂(lè)”的狀態(tài)的所有情感模型值??蛇x的,例如,可以使用下面的簡(jiǎn)化的轉(zhuǎn)換表。
具體的,情感狀態(tài)被分為幾類(lèi),例如,“正?!保氨瘋?,“憤怒”,和“享樂(lè)”,并且是唯一數(shù)字的情感號(hào)碼被分配到每個(gè)情感。換句話說(shuō),例如,情感號(hào)碼0,1,2,3等被分配到“正?!?,“悲傷”,“憤怒”,和“享樂(lè)”。創(chuàng)造一個(gè)轉(zhuǎn)換表,在其中情感號(hào)碼與合成控制參數(shù)和轉(zhuǎn)換參數(shù)聯(lián)系起來(lái)。當(dāng)使用該轉(zhuǎn)換表時(shí),有必要依據(jù)情感模型值把情感狀態(tài)分為“正?!保氨瘋?,“憤怒”,和“享樂(lè)”。這可以按以下方式執(zhí)行。具體的,例如,給定多個(gè)情感模型值,當(dāng)最大情感模型值與第二大情感模型值的差大于或等于預(yù)定的閾值時(shí),那一情感被分類(lèi)為對(duì)應(yīng)于最大情感模型值的情感狀態(tài)。否則,那一情感被分類(lèi)為“正?!睜顟B(tài)。
參數(shù)產(chǎn)生器43產(chǎn)生的合成控制參數(shù)包括,例如,用于調(diào)整每個(gè)聲音音量平衡的參數(shù),如有聲的聲音,無(wú)聲的摩擦音,和破擦音;用于控制驅(qū)動(dòng)信號(hào)產(chǎn)生器60(圖8)的輸出信號(hào)的振幅波動(dòng)量的參數(shù),驅(qū)動(dòng)信號(hào)產(chǎn)生器60如下述用作波形發(fā)生器42的聲音源;以及影響合成聲音音調(diào)的參數(shù),如用于控制聲音源頻率的參數(shù)。
參數(shù)產(chǎn)生器43產(chǎn)生的轉(zhuǎn)換參數(shù)被用來(lái)轉(zhuǎn)換語(yǔ)音信息存儲(chǔ)單元36(圖5)中的語(yǔ)音信息,例如變化形成合成聲音的波形數(shù)據(jù)的特性。
參數(shù)產(chǎn)生器43產(chǎn)生的合成控制參數(shù)被提供到波形發(fā)生器42,并且轉(zhuǎn)換參數(shù)被提供到數(shù)據(jù)轉(zhuǎn)換器44。數(shù)據(jù)轉(zhuǎn)換器44從語(yǔ)音信息存儲(chǔ)單元36讀取語(yǔ)音信息并依據(jù)轉(zhuǎn)換參數(shù)轉(zhuǎn)換語(yǔ)音信息。因此,數(shù)據(jù)轉(zhuǎn)換器44產(chǎn)生被用作用于改變形成合成聲音的波形數(shù)據(jù)的特性的語(yǔ)音信息的被轉(zhuǎn)換的語(yǔ)音信息,并且把被轉(zhuǎn)換的語(yǔ)音信息提供到被轉(zhuǎn)換語(yǔ)音信息存儲(chǔ)單元45。被轉(zhuǎn)換的語(yǔ)音信息存儲(chǔ)單元45存儲(chǔ)從數(shù)據(jù)轉(zhuǎn)換器44提供的被轉(zhuǎn)換的語(yǔ)音信息。如果必要,被轉(zhuǎn)換語(yǔ)音信息由波形發(fā)生器44讀取。
參考圖7的流程圖,現(xiàn)在將描述圖6所示的基于規(guī)則的合成器32執(zhí)行的處理。
圖5所示的文本分析器31輸出的文本分析結(jié)果被提供到韻律產(chǎn)生器41和波形發(fā)生器42。圖5所示的模型存儲(chǔ)單元51輸出的狀態(tài)信息被提供到參數(shù)產(chǎn)生器43。
當(dāng)韻律產(chǎn)生器41接收到文本分析結(jié)果時(shí),在步驟S1中,韻律產(chǎn)生器41產(chǎn)生韻律數(shù)據(jù),例如由包含在文本分析結(jié)果中的音素信息指示的每個(gè)音素的持續(xù)時(shí)間、周期性的模式信號(hào)、和能量模式信號(hào),把該韻律數(shù)據(jù)提供到波形發(fā)生器,并前進(jìn)到步驟S2。
隨后地,在步驟S2中,參數(shù)產(chǎn)生器確定機(jī)器人是否在情感反映模式中。具體的,在這個(gè)實(shí)施例中,在其中輸出有情感反映音調(diào)的合成聲音的情感反映模式和在其中輸出具有情感未被反映的音調(diào)的合成聲音的無(wú)情感反映模式中的任何一個(gè)可以被預(yù)置。在步驟S2中,確定機(jī)器人的模式是否是情感反映模式。
可選的,倘若不提供情感反映模式和無(wú)情感反映模式,機(jī)器人可以被設(shè)置一直輸出情感反映的合成聲音。
如果在步驟S2中確定機(jī)器人不在情感反映模式中,那么跳過(guò)步驟S3和S4。在步驟S5中,波形發(fā)生器42產(chǎn)生合成聲音,并且處理終止。
具體的,如果機(jī)器人不在情感反映模式中,參數(shù)產(chǎn)生器43不執(zhí)行特別的處理。這樣,參數(shù)產(chǎn)生器43不產(chǎn)生合成控制參數(shù)和轉(zhuǎn)換參數(shù)。
結(jié)果,波形發(fā)生器42經(jīng)過(guò)數(shù)據(jù)轉(zhuǎn)換器44和被轉(zhuǎn)換語(yǔ)音信息存儲(chǔ)單元45讀取存儲(chǔ)在語(yǔ)音信息存儲(chǔ)單元36(圖5)中的語(yǔ)音信息。使用語(yǔ)音信息和默認(rèn)的合成控制參數(shù),波形發(fā)生器42執(zhí)行語(yǔ)音合成處理,同時(shí)依據(jù)來(lái)自韻律產(chǎn)生器41的韻律數(shù)據(jù)控制韻律。這樣,波形發(fā)生器42產(chǎn)生具有默認(rèn)音調(diào)的合成聲音數(shù)據(jù)。
相反的,如果在步驟S2中確定機(jī)器人在情感反映模式中,在步驟S3中,參數(shù)產(chǎn)生器43根據(jù)來(lái)自模型存儲(chǔ)單元51的狀態(tài)信息中的情感模型,產(chǎn)生合成控制參數(shù)和轉(zhuǎn)換參數(shù)。合成控制參數(shù)被提供到波形發(fā)生器42,并且轉(zhuǎn)換參數(shù)被提供到數(shù)據(jù)轉(zhuǎn)換器44。
隨后地,在步驟S4中,數(shù)據(jù)轉(zhuǎn)換器44依據(jù)來(lái)自參數(shù)生成器43的轉(zhuǎn)換參數(shù)轉(zhuǎn)換存儲(chǔ)在語(yǔ)音信息存儲(chǔ)單元36(圖5)中的語(yǔ)音信息。數(shù)據(jù)轉(zhuǎn)換器44提供并在被轉(zhuǎn)換語(yǔ)音信息存儲(chǔ)單元45中存儲(chǔ)作為結(jié)果的被轉(zhuǎn)換語(yǔ)音信息。
在步驟S5中,波形發(fā)生器42產(chǎn)生合成聲音,并且處理終止。
具體的,在這種情況下,波形發(fā)生器42從存儲(chǔ)在被轉(zhuǎn)換語(yǔ)音信息存儲(chǔ)單元45中的語(yǔ)音信息中讀取必要的信息。使用被轉(zhuǎn)換語(yǔ)音信息和由參數(shù)產(chǎn)生器43提供的合成控制參數(shù),波形發(fā)生器執(zhí)行語(yǔ)音合成處理,同時(shí)依據(jù)來(lái)自韻律產(chǎn)生器41的韻律數(shù)據(jù)控制韻律。因此,波形發(fā)生器42產(chǎn)生具有對(duì)應(yīng)于機(jī)器人的情感狀態(tài)的音調(diào)的合成聲音數(shù)據(jù)。
如上所述,根據(jù)情感模型值產(chǎn)生合成控制參數(shù)和轉(zhuǎn)換參數(shù)。使用通過(guò)根據(jù)合成控制參數(shù)和轉(zhuǎn)換參數(shù)轉(zhuǎn)換語(yǔ)音信息產(chǎn)生的被轉(zhuǎn)換語(yǔ)音信息,執(zhí)行語(yǔ)音合成。因此,可以產(chǎn)生有受控音調(diào)的情感上表達(dá)的合成聲音,在其中,例如,頻率特性和音量平衡是受控的。
圖8示出當(dāng)存儲(chǔ)在語(yǔ)音信息存儲(chǔ)單元36(圖5)中的語(yǔ)音信息是例如用作語(yǔ)音特征參數(shù)的線性預(yù)測(cè)系數(shù)時(shí),圖6中所示的波形發(fā)生器42的構(gòu)造的例子。
通過(guò)執(zhí)行所謂的線性預(yù)測(cè)分析產(chǎn)生線性預(yù)測(cè)系數(shù),例如使用從語(yǔ)音波形數(shù)據(jù)計(jì)算出的自相關(guān)系數(shù)解Yule-Walker(耶魯-步行者)等式。關(guān)于線性預(yù)測(cè)分析,sn代表在當(dāng)前時(shí)刻n的音頻信號(hào)(的樣本值),并且sn-1,sn-2,...,sn-p代表鄰近sn的P個(gè)過(guò)去樣本值。假定下面等式表達(dá)的線性組合為真sn+α1sn-1+α2sn-2+…+αPsn-P=en...(1)依據(jù)下面等式使用P個(gè)過(guò)去樣本值sn-1,sn-2,...,sn-p線性預(yù)測(cè)在當(dāng)前時(shí)刻n的樣本值sn的預(yù)測(cè)值(線性預(yù)測(cè)值)sn’sn’=-(α1sn-1+α2sn-2+…+αPsn-P)...(2)計(jì)算用于最小化實(shí)際樣本值sn和線性預(yù)測(cè)值sn’之間的均方誤差的線性預(yù)測(cè)系數(shù)αP。
在等式(1)中,{en}(...,en-1,en,en+1,...)是不相關(guān)隨機(jī)變量,它的平均值是0,并且它的方差是σ2。
由等式(1),樣本值sn可以表達(dá)為sn=en- (α1sn-1+α2sn-2+...+αPsn-P)
...(3)通過(guò)等式(3)的Z轉(zhuǎn)換,下面等式為真S=E/(1+α1z-1+α2z-2+…+αPz-P)...(4)其中S和E代表等式(3)中的sn和en的Z變換。
由等式(1)和(2),en可以表達(dá)為en=sn-sn’...(5)其中en被稱(chēng)為實(shí)際樣本值sn和線性預(yù)測(cè)值sn’之間的殘留信號(hào)。
由等式(4),線性預(yù)測(cè)系數(shù)αP用作IIR(無(wú)限沖擊響應(yīng))濾波器的抽頭系數(shù),并且殘留信號(hào)en被用作IIR濾波器的驅(qū)動(dòng)信號(hào)(輸入信號(hào))。因此,可以計(jì)算出語(yǔ)音信號(hào)sn。
圖8所示的波形發(fā)生器42執(zhí)行用于依據(jù)等式(4)產(chǎn)生語(yǔ)音信號(hào)的語(yǔ)音合成。
具體的,驅(qū)動(dòng)信號(hào)產(chǎn)生器60產(chǎn)生并輸出成為驅(qū)動(dòng)信號(hào)的殘留信號(hào)。
韻律數(shù)據(jù)、文本分析結(jié)果、和合成控制參數(shù)被提供到驅(qū)動(dòng)信號(hào)產(chǎn)生器60。依據(jù)韻律數(shù)據(jù)、文本分析結(jié)果、和合成控制參數(shù),驅(qū)動(dòng)信號(hào)產(chǎn)生器60在信號(hào)如白色噪音上疊加周期(頻率)和振幅是受控的周期脈沖,這樣產(chǎn)生用于把相應(yīng)的韻律、音素、和音調(diào)(聲音質(zhì)量)給到合成聲音的驅(qū)動(dòng)信號(hào)。周期性的脈沖主要有助于有聲聲音的產(chǎn)生,反之如白色噪音的信號(hào)主要有助于無(wú)聲聲音的產(chǎn)生。
在圖8中,加法器61、P個(gè)延遲電路(D)621至62P、和P個(gè)乘法器631至63P形成功能為語(yǔ)音合成的合成濾波器的IIR濾波器。IIR濾波器把來(lái)自驅(qū)動(dòng)信號(hào)產(chǎn)生器60的驅(qū)動(dòng)信號(hào)用作聲音源并且產(chǎn)生合成聲音數(shù)據(jù)。
具體的,從驅(qū)動(dòng)信號(hào)產(chǎn)生器60輸出的殘留信號(hào)(驅(qū)動(dòng)信號(hào))經(jīng)過(guò)加法器61提供到延遲電路621。延遲電路62P按照殘留信號(hào)的一個(gè)樣本延遲輸入進(jìn)去的輸入信號(hào)并且把被延遲信號(hào)輸出到之后的延遲電路62P+1和計(jì)算單元63P。乘法器63P把延遲電路62P的輸出乘以為此設(shè)定的線性預(yù)測(cè)系數(shù)αP,并把乘積輸出到加法器61。
加法器61把乘法器631至63P的所有輸出與殘留信號(hào)e相加,并把和提供到延遲電路621。另外,加法器61把和作為語(yǔ)音合成結(jié)果(合成語(yǔ)音數(shù)據(jù))輸出。
系數(shù)提供單元64根據(jù)包含在文本分析結(jié)果中的音素從被轉(zhuǎn)換語(yǔ)音信息存儲(chǔ)單元45讀取線性預(yù)測(cè)系數(shù)α1,α2,…,αP,這些系數(shù)被用作必要的被轉(zhuǎn)換語(yǔ)音信息,并且把線性預(yù)測(cè)系數(shù)α1,α2,…,αP分別設(shè)置到乘法器631至63P。
圖9示出當(dāng)儲(chǔ)存在語(yǔ)音信息存儲(chǔ)單元36(圖5)中的語(yǔ)音信息包括,例如,被用作語(yǔ)音特征參數(shù)的線性預(yù)測(cè)系數(shù)(LPC)時(shí),圖6所示的數(shù)據(jù)轉(zhuǎn)換器44的構(gòu)造的例子。
是存儲(chǔ)在語(yǔ)音信息存儲(chǔ)單元36中的語(yǔ)音信息的線性預(yù)測(cè)系數(shù)被提供到合成濾波器71。合成濾波器71是與圖8所示的由加法器61、P個(gè)延遲電路(D)621至62P、和P個(gè)乘法器631至63P形成的合成濾波器相似的IIR濾波器。合成濾波器71把線性預(yù)測(cè)系數(shù)用作抽頭系數(shù)并把脈沖用作驅(qū)動(dòng)信號(hào)并且執(zhí)行濾波,這樣把線性預(yù)測(cè)系數(shù)轉(zhuǎn)換為語(yǔ)音數(shù)據(jù)(時(shí)域中的波形數(shù)據(jù))。語(yǔ)音數(shù)據(jù)被提供到傅立葉變換單元72。
傅立葉變換單元72執(zhí)行來(lái)自合成濾波器71的語(yǔ)音數(shù)據(jù)的傅立葉變換并計(jì)算頻域中的信號(hào),即頻譜,并且把該信號(hào)或頻譜提供到頻率特性轉(zhuǎn)換器73。
因此,合成濾波器71和傅立葉變換單元72把線性預(yù)測(cè)系數(shù)α1,α2,...,αP轉(zhuǎn)換為頻譜F(θ)。可選的,線性預(yù)測(cè)系數(shù)α1,α2,...,αP轉(zhuǎn)換為頻譜F(θ)可以通過(guò)依據(jù)下面等式把θ由0變化到π來(lái)執(zhí)行F(θ)=1/|1+α1z-1+α2z-2+…+αPz-P|2z=e-jθ...(6)其中θ代表每個(gè)頻率。
從參數(shù)產(chǎn)生器43(圖6)輸出的轉(zhuǎn)換參數(shù)被提供到頻率特性轉(zhuǎn)換器73。通過(guò)依據(jù)轉(zhuǎn)換參數(shù)轉(zhuǎn)換來(lái)自傅立葉變換單元72的頻譜,頻率特性轉(zhuǎn)換器73改變由線性預(yù)測(cè)系數(shù)獲得的語(yǔ)音數(shù)據(jù)(波形數(shù)據(jù))的頻率特性。
在圖9所示的實(shí)施例中,頻率特性轉(zhuǎn)換器73由擴(kuò)充/收縮處理器73A和均衡器73B形成。擴(kuò)充/收縮處理器73A在頻率軸方向擴(kuò)充/收縮由傅立葉變換單元72提供的頻譜F(θ)。換句話說(shuō),擴(kuò)充/收縮處理器73A通過(guò)用Δθ代替θ來(lái)計(jì)算等式(6),其中Δ代表擴(kuò)充/收縮參數(shù),并且計(jì)算出在頻率軸方向被擴(kuò)充/被收縮的頻譜F(Δθ)。
在這種情況下,擴(kuò)充/收縮參數(shù)Δ是轉(zhuǎn)換參數(shù)。擴(kuò)充/收縮參數(shù)Δ是,例如,從0.5到2.0范圍內(nèi)的值。
均衡器73B均衡由傅立葉變換單元72提供的頻譜F(θ)并且加強(qiáng)或抑制高頻率。換句話說(shuō),均衡器73B使頻譜F(θ)經(jīng)受于圖10A所示的高頻率增強(qiáng)濾波或圖10B所示的高頻率抑制濾波,并且計(jì)算出其頻率特性改變的頻譜。
在圖10中,g代表增益,fc代表截止頻率,fw代表衰減寬度,并且fs代表語(yǔ)音數(shù)據(jù)(合成濾波器71輸出的語(yǔ)音數(shù)據(jù))的取樣頻率。在這些值中,增益g、截止頻率fc、和衰減寬度f(wàn)w是轉(zhuǎn)換參數(shù)。
通常,當(dāng)執(zhí)行圖10A所示的高頻率增強(qiáng)濾波時(shí),合成聲音的音調(diào)變得刺耳。當(dāng)執(zhí)行圖10B所示的高頻率抑制濾波時(shí),合成聲音的音調(diào)變得柔和。
可選的,頻率特性轉(zhuǎn)換器73可以通過(guò),例如,執(zhí)行n度平均濾波或通過(guò)計(jì)算倒頻譜系數(shù)并執(zhí)行濾波來(lái)使頻譜平滑。
其頻率特性被頻率特性轉(zhuǎn)換器73改變的頻譜被提供到逆傅立葉變換單元74。逆傅立葉變換單元74對(duì)來(lái)自頻率特性轉(zhuǎn)換器73的頻譜執(zhí)行逆傅立葉變換,以計(jì)算出時(shí)域中的信號(hào),即語(yǔ)音數(shù)據(jù)(波形數(shù)據(jù)),并且把信號(hào)提供到LPC分析器75。
LPC分析器75通過(guò)對(duì)來(lái)自逆傅立葉變換單元74的語(yǔ)音數(shù)據(jù)執(zhí)行線性預(yù)測(cè)分析計(jì)算出線性預(yù)測(cè)系數(shù),并把線性預(yù)測(cè)系數(shù)作為被轉(zhuǎn)換語(yǔ)音信息提供并存儲(chǔ)在被轉(zhuǎn)換語(yǔ)音信息存儲(chǔ)單元45(圖6)中。
雖然線性預(yù)測(cè)系數(shù)在這種情況下被用作語(yǔ)音特征參數(shù),但是可選的,可以使用倒頻譜系數(shù)和線頻譜對(duì)。
圖11示出當(dāng)存儲(chǔ)在語(yǔ)音信息存儲(chǔ)單元36(圖5)中的語(yǔ)音信息包括,例如,被用作語(yǔ)音數(shù)據(jù)(波形數(shù)據(jù))的音素單元數(shù)據(jù)時(shí),圖6所示的波形發(fā)生器42的構(gòu)造的例子。
韻律數(shù)據(jù)、合成控制參數(shù)、和文本分析結(jié)果被提供到連接控制器81。依據(jù)韻律數(shù)據(jù)、合成控制參數(shù)、和文本分析結(jié)果,連接控制器81確定要被連接的音素單元數(shù)據(jù),以產(chǎn)生合成聲音和波形處理方法或調(diào)整方法(例如,波形的振幅),并且控制波形連接器82。
在連接控制器81的控制下,波形連接器82從被轉(zhuǎn)換語(yǔ)音信息存儲(chǔ)單元45讀取是被轉(zhuǎn)換語(yǔ)音信息的必要的音素單元數(shù)據(jù)。相似的,在連接控制器81的控制下,波形連接器82調(diào)整并連接被讀取的音素單元數(shù)據(jù)的波形。因此,波形連接器82產(chǎn)生并輸出擁有對(duì)應(yīng)于韻律數(shù)據(jù)、合成控制參數(shù)、和文本分析結(jié)果的韻律、音調(diào)、和音素的合成聲音數(shù)據(jù)。
圖12示出當(dāng)存儲(chǔ)在語(yǔ)音信息存儲(chǔ)單元36(圖5)中的語(yǔ)音信息是語(yǔ)音數(shù)據(jù)(波形數(shù)據(jù))時(shí),圖6所示的數(shù)據(jù)轉(zhuǎn)換器44的構(gòu)造的例子。在圖中,對(duì)相應(yīng)于圖9中元件的元件給出同樣的參考標(biāo)號(hào),并且省略了共同部分的重復(fù)的描述。換句話說(shuō),除了沒(méi)有提供合成濾波器71和LPC分析器75之外,圖12所示的數(shù)據(jù)轉(zhuǎn)換器44與圖9中的數(shù)據(jù)轉(zhuǎn)換器相似。
在圖12所示的數(shù)據(jù)轉(zhuǎn)換器44中,傅立葉變換單元72對(duì)是存儲(chǔ)在語(yǔ)音信息存儲(chǔ)單元36(圖5)中的語(yǔ)音信息的語(yǔ)音數(shù)據(jù)執(zhí)行傅立葉變換,并且把作為結(jié)果的頻譜提供到頻率特性轉(zhuǎn)換器73。頻率特性轉(zhuǎn)換器73依據(jù)轉(zhuǎn)換參數(shù)轉(zhuǎn)換來(lái)自傅立葉變換單元72的頻譜的頻率特性,并且把被轉(zhuǎn)換頻譜輸出到逆傅立葉變換單元74。逆傅立葉變換單元74對(duì)來(lái)自頻率特性轉(zhuǎn)換器73的頻譜執(zhí)行逆傅立葉變換,使其轉(zhuǎn)換為語(yǔ)音數(shù)據(jù),并且把語(yǔ)音數(shù)據(jù)作為被轉(zhuǎn)換語(yǔ)音信息提供并存儲(chǔ)在被轉(zhuǎn)換語(yǔ)音信息存儲(chǔ)單元45(圖6)中。
雖然在這里有本發(fā)明應(yīng)用于娛樂(lè)機(jī)器人(如假寵物的機(jī)器人)的描述過(guò)的情況,但是本發(fā)明不限于這些情況。例如,本發(fā)明廣泛適用于有語(yǔ)音合成設(shè)備的不同系統(tǒng)。同樣,本發(fā)明不僅適用于真實(shí)世界機(jī)器人,而且適用于在例如液晶顯示器的顯示器上顯示的虛擬機(jī)器人。
雖然在本實(shí)施例中已經(jīng)描述了一系列上述處理通過(guò)執(zhí)行程序由CPU 10A來(lái)執(zhí)行,但是一系列處理可以由專(zhuān)用硬件來(lái)執(zhí)行。
該程序可以提前存儲(chǔ)在存儲(chǔ)器10B(圖2)中??蛇x的,程序可以暫時(shí)或永久地存儲(chǔ)(記錄)在可移動(dòng)記錄介質(zhì),例如軟盤(pán)、CD-ROM(致密盤(pán)只讀存儲(chǔ)器)、MO(磁光)盤(pán)、DVD(數(shù)字多功能盤(pán))、磁盤(pán)、或半導(dǎo)體存儲(chǔ)器。可移動(dòng)記錄介質(zhì)可以作為所謂的封裝軟件提供,并且軟件可以安裝在機(jī)器人中(存儲(chǔ)器10B)。
可選的,該程序可以經(jīng)過(guò)數(shù)字廣播衛(wèi)星由下載地址無(wú)線發(fā)送,或者該程序可以通過(guò)網(wǎng)絡(luò),例如LAN(局域網(wǎng))或國(guó)際互聯(lián)網(wǎng),使用有線進(jìn)行發(fā)送。被發(fā)送的程序可以安裝在存儲(chǔ)器10B中。
在這種情況下,當(dāng)程序的版本升級(jí)了,升級(jí)的程序可以容易地安裝在存儲(chǔ)器10B中。
在本說(shuō)明中,用于寫(xiě)引起CPU10A執(zhí)行不同處理的程序的處理步驟不需要依據(jù)流程圖中描述的順序按時(shí)間序列處理。同樣包括與其它步驟平行執(zhí)行的步驟或單獨(dú)執(zhí)行的步驟(例如,平行處理或按照對(duì)象處理)。
該程序可以由單一的CPU處理??蛇x的,該程序可以由多個(gè)CPU在分散的環(huán)境中處理。
圖5中所示的語(yǔ)音合成器55可以由專(zhuān)用硬件或軟件來(lái)實(shí)現(xiàn)。當(dāng)語(yǔ)音合成器55由軟件實(shí)現(xiàn)時(shí),構(gòu)造那個(gè)軟件的程序被安裝進(jìn)通用計(jì)算機(jī)中。
圖13示出安裝用于實(shí)現(xiàn)語(yǔ)音合成器55的程序的計(jì)算機(jī)的實(shí)施例的構(gòu)造的例子。
程序可以預(yù)先記錄在硬盤(pán)105或ROM103中,ROM103是包含在計(jì)算機(jī)中的內(nèi)置記錄介質(zhì)。
可選的,該程序可以暫時(shí)或永久地存儲(chǔ)(記錄)在可移動(dòng)記錄介質(zhì)111,例如軟盤(pán),CD-ROM,MO盤(pán),DVD,磁盤(pán),或半導(dǎo)體存儲(chǔ)器。可移動(dòng)記錄介質(zhì)111可以作為所謂的封裝軟件提供。
該程序可以從上述的可移動(dòng)記錄介質(zhì)111安裝在計(jì)算機(jī)中??蛇x的,該程序可以經(jīng)過(guò)數(shù)字廣播衛(wèi)星無(wú)線從下載地址傳送到計(jì)算機(jī),或者可以經(jīng)過(guò)網(wǎng)絡(luò),例如LAN(局域網(wǎng))和世界互聯(lián)網(wǎng),進(jìn)行有線傳送。在計(jì)算機(jī)中,被發(fā)送的程序由通信單元108接收并安裝在內(nèi)置硬盤(pán)105。
計(jì)算機(jī)包括CPU(中央處理單元)102。輸入/輸出接口110經(jīng)過(guò)總線101連接到CPU102。當(dāng)用戶操作由鍵盤(pán)、鼠標(biāo)、和麥克風(fēng)形成的輸入單元107并且通過(guò)輸入/輸出接口110輸入命令到CPU102時(shí),CPU102依據(jù)命令執(zhí)行存儲(chǔ)在ROM(只讀存儲(chǔ)器)103的程序??蛇x的,CPU102把存儲(chǔ)在硬盤(pán)105的程序、從衛(wèi)星或網(wǎng)絡(luò)轉(zhuǎn)移的由通信單元108接收并安裝在硬盤(pán)105中的程序、從裝配在驅(qū)動(dòng)器109的可移動(dòng)記錄介質(zhì)讀取并安裝在硬盤(pán)105中的程序裝載進(jìn)RAM(隨機(jī)存取存儲(chǔ)器)104并執(zhí)行程序。因此,CPU102依據(jù)上述的流程圖執(zhí)行處理或者執(zhí)行上述方框圖中所示的構(gòu)造執(zhí)行的處理。如果必要,CPU102從由LCD(液顯示器)和揚(yáng)聲器形成的輸出單元106經(jīng)過(guò)輸入/輸出接口110輸出處理結(jié)果,或者從通信單元108發(fā)送處理結(jié)果,并且CPU2把處理結(jié)果記錄在硬盤(pán)105上。
雖然在這個(gè)實(shí)施例中合成聲音的音調(diào)根據(jù)情感狀態(tài)改變,可選的,例如,合成聲音的韻律也可以根據(jù)情感狀態(tài)改變。合成聲音的韻律可以根據(jù)情感模型通過(guò)控制,例如,合成聲音音高周期的時(shí)間變化模式(周期性的模式)和合成聲音的能量的時(shí)間變化模式(能量模式)而改變。
雖然在這個(gè)實(shí)施例中從文本(包括有中文字符和日文音節(jié)字符的文本)產(chǎn)生合成聲音,但是合成聲音也可以從音標(biāo)字母產(chǎn)生。
工業(yè)實(shí)用性如上所述,根據(jù)本發(fā)明,在預(yù)定的信息中,影響合成聲音音調(diào)的音調(diào)影響信息根據(jù)指示情感狀態(tài)的外部提供的狀態(tài)信息產(chǎn)生。使用音調(diào)影響信息,產(chǎn)生了音調(diào)控制的合成聲音。通過(guò)依據(jù)情感狀態(tài)產(chǎn)生具有改變的音調(diào)的合成聲音,可以產(chǎn)生情感上表達(dá)的合成聲音。
權(quán)利要求
1.用于使用預(yù)定信息執(zhí)行語(yǔ)音合成的語(yǔ)音合成設(shè)備,包括音調(diào)影響信息產(chǎn)生部件,用于在預(yù)定信息中,根據(jù)指示情感狀態(tài)的外部提供的狀態(tài)信息,產(chǎn)生用于影響合成聲音的音調(diào)的音調(diào)影響信息;以及語(yǔ)音合成部件,用于使用音調(diào)影響信息產(chǎn)生具有受控音調(diào)的合成聲音。
2.根據(jù)權(quán)利要求1的語(yǔ)音合成設(shè)備,其中音調(diào)影響信息產(chǎn)生部件包括轉(zhuǎn)換參數(shù)產(chǎn)生部件,用于根據(jù)情感狀態(tài)產(chǎn)生用于轉(zhuǎn)換音調(diào)影響信息以改變形成合成聲音的波形數(shù)據(jù)的特性的轉(zhuǎn)換參數(shù);以及音調(diào)影響信息轉(zhuǎn)換部件,用于根據(jù)轉(zhuǎn)換參數(shù)轉(zhuǎn)換音調(diào)影響信息。
3.根據(jù)權(quán)利要求2的語(yǔ)音合成設(shè)備,其中音調(diào)影響信息是在要被連接以產(chǎn)生合成聲音的預(yù)定單元中的波形數(shù)據(jù)。
4.根據(jù)權(quán)利要求2的語(yǔ)音合成設(shè)備,其中音調(diào)影響信息是從波形數(shù)據(jù)提取的特征參數(shù)。
5.根據(jù)權(quán)利要求1的語(yǔ)音合成設(shè)備,其中語(yǔ)音合成部件執(zhí)行基于規(guī)則的語(yǔ)音合成,以及音調(diào)影響信息是用于控制基于規(guī)則的語(yǔ)音合成的合成控制參數(shù)。
6.根據(jù)權(quán)利要求5的語(yǔ)音合成設(shè)備,其中合成控制參數(shù)控制音量平衡、聲音源的振幅波動(dòng)量、或聲音源的頻率。
7.根據(jù)權(quán)利要求1的語(yǔ)音合成設(shè)備,其中語(yǔ)音合成部件產(chǎn)生其頻率特性或音量平衡是受到控制的合成聲音。
8.一種用于使用預(yù)定信息執(zhí)行語(yǔ)音合成的語(yǔ)音合成方法,包括音調(diào)影響信息產(chǎn)生步驟,用于在預(yù)定信息中,根據(jù)指示情感狀態(tài)的外部提供的狀態(tài)信息,產(chǎn)生用于影響合成聲音的音調(diào)的音調(diào)影響信息;以及語(yǔ)音合成步驟,用于使用音調(diào)影響信息產(chǎn)生具有受控音調(diào)的合成聲音。
9.一種用于引起計(jì)算機(jī)執(zhí)行用于使用預(yù)定信息執(zhí)行語(yǔ)音合成的語(yǔ)音合成處理的程序,包括音調(diào)影響信息產(chǎn)生步驟,用于在預(yù)定信息中,根據(jù)指示情感狀態(tài)的外部提供的狀態(tài)信息,產(chǎn)生用于影響合成聲音的音調(diào)的音調(diào)影響信息;以及語(yǔ)音合成步驟,用于使用音調(diào)影響信息產(chǎn)生具有受控音調(diào)的合成聲音。
10.一種已經(jīng)在其中記錄用于引起計(jì)算機(jī)執(zhí)行用于使用預(yù)定信息執(zhí)行語(yǔ)音合成的語(yǔ)音合成處理的程序的記錄介質(zhì),該程序包括音調(diào)影響信息產(chǎn)生步驟,用于在預(yù)定信息中,根據(jù)指示情感狀態(tài)的外部提供的狀態(tài)信息,產(chǎn)生用于影響合成聲音的音調(diào)的音調(diào)影響信息;以及語(yǔ)音合成步驟,用于使用音調(diào)影響信息產(chǎn)生具有受控音調(diào)的合成聲音。
全文摘要
一種能夠通過(guò)生成根據(jù)情感狀態(tài)改變音調(diào)質(zhì)量的合成音調(diào),生成富于情感的合成音調(diào)的聲音合成裝置,其中參數(shù)生成單元(43)根據(jù)指示寵物機(jī)器人的情感狀態(tài)的狀態(tài)信息生成變換參數(shù)和合成控制參數(shù)。數(shù)據(jù)變換單元(44)把音素片數(shù)據(jù)的頻率特性變換為聲音信息。波形生成單元(42)根據(jù)包含在文本分析結(jié)果中的音素信息獲取必要的音素片數(shù)據(jù),并且把音素片數(shù)據(jù)連接起來(lái),同時(shí)根據(jù)韻律數(shù)據(jù)和合成控制參數(shù)處理數(shù)據(jù),以生成具有相應(yīng)韻律和音調(diào)質(zhì)量的合成音調(diào)數(shù)據(jù)。本裝置適用于生成合成音調(diào)的機(jī)器人。
文檔編號(hào)G10L13/08GK1461463SQ02801122
公開(kāi)日2003年12月10日 申請(qǐng)日期2002年3月8日 優(yōu)先權(quán)日2001年3月9日
發(fā)明者山崎信英, 小林賢一郎, 淺野康治, 狩谷真一, 藤田八重子 申請(qǐng)人:索尼公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
溧水县| 科尔| 柳河县| 大厂| 连城县| 西安市| 辽中县| 太仆寺旗| 鄂托克前旗| 台江县| 喀喇| 陆良县| 通城县| 鹤山市| 漳平市| 从化市| 南靖县| 惠安县| 康平县| 朝阳市| 当涂县| 日土县| 满洲里市| 左权县| 浦江县| 云阳县| 无极县| 庆城县| 金塔县| 大方县| 夏河县| 五家渠市| 台中县| 山丹县| 闽侯县| 留坝县| 儋州市| 澳门| 平原县| 司法| 依兰县|