欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

聲音合成方法和裝置、詞典構筑方法和計算機可讀媒體的制作方法

文檔序號:2822265閱讀:245來源:國知局
專利名稱:聲音合成方法和裝置、詞典構筑方法和計算機可讀媒體的制作方法
技術領域
本發(fā)明涉及適用于視頻游戲等的聲音合成方法、用于聲音合成的詞典構筑方法、聲音合成裝置及記錄聲音合成程序的計算機可讀媒體。
近年來,隨著電話報時、銀行ATM聲音引導之類需反復輸出聲音信息(人所講的言詞)的服務的普及和各種電氣制品等人機界面要求的提高,希望由機械輸出聲音信息的需求增大。
作為以往輸出聲音信息的方法,有一種真人朗讀預定的引導詞或文章并把它預先存儲在存儲裝置中,然后在所需場面原樣重現加以輸出的方法(下文稱為記錄重現法)。還有一種在存儲裝置中存儲與構成聲音信息的各種詞對應的聲音數據,然后根據任意輸入的字符串(文本),組合該聲音數據加以輸出的方法(所謂聲音合成方法)。
在上述記錄重現方法中,可輸出高品質的聲音信息。但另一方面,也有不能輸出確定的引導詞和文章以外的聲音信息,而且需要容量與引導詞和文章數量成比例的存儲裝置這些缺陷。
另一方面,在聲音合成方法中,可輸出對應于任意輸入的字符串,即對應于任意詞的聲音信息,且與上述記錄重現方法相比,其需要的存儲容量也小。但是,存在有些字符串變成留有不自然感的聲音信息這樣的缺陷。
可是,在近來視頻游戲中,隨著游戲機主體性能的提高和存儲媒體存儲容量的增加,游戲中登場角色的聲音信息與BGM和效果音一起輸出的可能性增大。
這時,在視頻游戲這種娛樂性高的場合,強烈希望每個游戲角色輸出音質不同的聲音信息,而且輸出反映講話時感性、狀況的聲音信息。進而,也迫切希望由游戲角色念游戲者任意輸入、設定的游戲者角色姓名(稱呼)。
如果要用上述的記錄重現方法實現適合上述希望的聲音信息輸出,則必須對游戲者任意輸入、設定的游戲者角色姓名(稱呼)這種遍及幾千至幾萬詞全部進行聲音收錄、重現。為此,收錄所需時間和費用、必需的存儲裝置容量變得十分龐大,事實上,不可能實施。
另一方面,用聲音合成方法,任意輸入、設定的游戲者角色姓名發(fā)聲比較容易。但,以往的聲音合成方法僅以產生明了的自然聲音信息為目標,因而根本不能合成與講話人的個性、講話時的感性和狀況相應的聲音信息,即不能根據每個游戲角色輸出音質不同的聲音信息,不能輸出反映游戲角色的感情、狀況的聲音信息。
本發(fā)明的目的在于提供一種適合視頻游戲這種娛樂性高的用途且能產生與講話者的個性、講話時的感情和狀況或各種講話內容相應的聲音信息的聲音合成方法,用于聲音合成的詞典構筑方法,聲音合成裝置及記錄聲音合成程序的計算機可讀媒體。
為了達到上述目的,本發(fā)明的一種采用單詞詞典、韻律詞典和波形詞典生成聲音信息的聲音合成方法,該方法包括下述步驟設定講話者或講話時感情、狀況或講話內容中至少一個不同的多個聲音合成處理作業(yè)單位(下文稱為任務);至少構筑與各任務對應的韻律詞典和波形詞典;在與任務指定的同時輸入要合成的字符串時,用與該任務對應的單詞詞典、韻律詞典和波形詞典進行聲音合成處理。
根據本發(fā)明,聲音合成處理分成多個講話者,講話時的多個感情、狀況,多個講話內容等任務,每個任務構筑詞典進行聲音合成,因此易于產生與講話者個性、講話時的感情與狀況、講話內容對應的聲音信息。
上述多個任務中的每個任務的詞典,由下述步驟構筑生成與任務對應的單詞詞典;從單詞詞典的全部單詞中選出可成為模型的字符串生成聲音收錄腳本;按照聲音收錄腳本收錄講話者的聲音;由所述收錄的聲音構筑韻律詞典和波形詞典;對各任務進行上述步驟。
上述每個任務的詞典由下述步驟構筑生成與任務對應的單詞詞典和單詞變形現則;按照與所述任務對應的單詞變形規(guī)則,對與任務對應的單詞詞典中包含的全部單詞進行變形處理;從經變形處理的單詞詞典中的全部單詞選出可成為模型的字符串生成聲音收錄腳本;根據聲音收錄腳本收錄講話者的聲音;從所述收錄的聲音構筑韻律詞典和波形詞典;對各任務進行上述步驟。
每個上述任務的詞典由下述步驟構筑生成與任務對應的單詞變形規(guī)則;按照與任務對應的單詞變形規(guī)則,對單詞詞典所包含的全部單詞進行變形處理;從經變形處理的單詞詞典中的全部單詞選出可成為模型的字符串生成聲音收錄腳本;根據聲音收錄腳本收錄講話者的聲音;從所述收錄的聲音構筑韻律詞典和波形詞典;對各任務進行上述步驟。
根據本發(fā)明,可簡單生成與任務相應的聲音收錄腳本,根據該腳本收錄聲音構筑各詞典,進行字符串變形處理,由此,可不增加詞典容量,易于生成含多樣表現內容的聲音信息。
采用這些詞典的聲音合成方法包括下述步驟根據與要合成的字符串一起輸入的任務指定,切換單詞詞典、韻律詞典和波形詞典;采用切換后的單詞詞典、韻律詞典和波形詞典,對與要合成的字符串對應的聲音信息進行合成處理。
這時,在各詞典是收錄許多至少含一個字符的單詞及其語調類型的單詞詞典、收錄表示對收錄于所述單詞詞典中的單詞的韻律的韻律模型數據中的代表性韻律數據的韻律詞典、把收錄聲音作為合成單位的聲音數據加以收錄的波形詞典時,該聲音合成處理包括下述步驟從單詞詞典判定要合成的字符串的語調類型;根據要合成的字符串與語調類型,從韻律詞典選擇韻律模型數據;根據選擇的韻律模型數據,從波形詞典選擇與要合成的字符串各字符對應的波形數據;相互連接所述選擇的波形數據。
采用這些詞典的另一聲音合成方法,包括下述步驟根據與要合成的字符串一起輸入的任務指定,切換單詞詞典、韻律詞典、波形詞典和單詞變形規(guī)則;按照單詞變形規(guī)則對要合成的字符串進行變形處理;采用切換后的單詞詞典、韻律詞典和波形詞典對與變形處理后的字符串對應的聲音信息進行合成處理。
采用這些詞典的另一聲音合成方法,包括下述步驟根據與要合成的字符串一起輸入的任務指定,切換韻律詞典、波形詞典和單詞變形規(guī)則;按照單詞變形規(guī)則對要合成的字符進行變形處理;采用單詞詞典、切換后的韻律詞典和波形詞典,對與變形處理后的字符串對應的聲音信息進行合成處理。
這時,在各詞典是收錄許多至少含一個字符的單詞及其語詞類型的單詞詞典、收錄表示對收錄于所述單詞詞典中的單詞的韻律的韻律模型數據中的代表性韻律數據的韻律詞典、把收錄聲音作為合成單位的聲音數據加以收錄的波形詞典且單詞變形規(guī)則是收錄字符串變形規(guī)則的單詞變形規(guī)則時,該聲音合成處理包括下述步驟從單詞詞典或單詞變形規(guī)則判定要合成的字符串的語調類型;根據要合成的字符串與語調類型,從韻律詞典選擇韻律模型數據;根據選擇的韻律模型數據,從波形詞典選擇與要合成的字符串的各字符對應的波形數據;相互連接所述選擇的波形數據。
采用上述詞典的聲音合成裝置包括根據與要合成的字符串一起輸入的任務指定,切換單詞詞典、韻律詞典和波形詞典的手段;采用切換后的單詞詞典、韻律詞典和波形詞典,對與要合成的字符串對應的聲音信息進行合成處理的手段。
采用上述詞典的另一聲音合成裝置包括根據與要合成的字符串一起輸入的任務指定,切替單詞詞典、韻律詞典、波形詞典和單詞變形規(guī)則的手段;按照單詞變形規(guī)則對要合成的字符串進行變形處理的手段;采用切換后的單詞詞典、韻律詞典和波形詞典,對與變形處理后的字符串對應的聲音信息進行合成處理的手段。
采用上述詞典的另一聲音合成裝置包括根據與要合成的字符串一起輸入的任務指定,切換韻律詞典、波形詞典和單詞變形規(guī)則的手段;按照單詞變形規(guī)則對要合成的字符串進行變形處理的手段;采用單詞詞典、切換后的韻律詞典和波形詞典對與變形處理后的字符串對應的聲音信息進行合成處理的手段。
上述聲音合成裝置通過一種記錄聲音合成程序的計算機可讀媒體加以實現,該媒體在所述程序被計算機讀取時,使該計算機在功能上包括下述手段與講話者或講話時的感情、狀況或講話內容中至少一個不同的多個聲音合成處理任務分別對應的單詞詞典、韻律詞典和波形詞典;根據與要合成的字符串一起輸入的任務指定切換單詞詞典、韻律詞典和波形詞典的手段;采用切換后的單詞詞典、韻律詞典和波形詞典對與要合成的字符串對應的聲音信息進行合成處理的手段。
上述聲音合成裝置通過一種記錄聲音合成程序的計算機可讀媒體加以實現,該媒體在所述程序被計算機讀取時,使該計算機在功能上包括下述手段與講話者或講話時的感情、狀況或進話內容中至少一個不同的多個聲音合成處理任務分別對應的單詞詞典、韻律詞典、波形詞典和單詞變形規(guī)則;根據與要合成的字符串一起輸入的任務指定,切換單詞詞典、韻律詞典、波形詞典和單詞變形規(guī)則的手段;按照單詞變形規(guī)則對要合成的字符串進行變形處理的手段;采用切換后的單詞詞典、韻律詞典和波形詞典對與變形處理后的字符串對應的聲音信息進行合成處理的手段。
上述聲音合成裝置通過一種記錄聲音合成程序的計算機可讀媒體加以實現,該媒體在所述程序被計算機讀取時,使該計算機在功能上包括下述手段單詞詞典、及與講話者或講話時的感情、狀態(tài)之一不同的多個聲音合成處理任務分別對應的韻律詞典、波形詞典和單詞變形規(guī)則;根據與要合成的字符串一起輸入的任務指定切換韻律詞典、波形詞典和單詞變形規(guī)則的手段;按照單詞變形規(guī)則對要合成的字符串進行變形處理的手段;采用單詞詞典、切換后的韻律詞典和波形詞典,對與變形處理后的字符串對應的聲音信息進行合成處理的手段。
通過以下說明及附圖,本發(fā)明的上述和其它目的、特征、優(yōu)點會變得更為明了。


圖1是整體表示本發(fā)明聲音合成方法的流程圖。
圖2是任務說明圖。
圖3是具體任務一個例子的示圖。
圖4是表示本發(fā)明用于聲音合成的詞典構筑方法的流程圖。
圖5是單詞變形規(guī)則一個例子示圖。
圖6是選出的字符串一個例子示圖。
圖7是根據單詞詞典、單詞變形規(guī)則、字符串選出規(guī)則產生聲音收錄腳本的情況的一個例子示圖。
圖8是表示本發(fā)明聲音合成方法的流程圖。
圖9是本發(fā)明聲音合成裝置的功能框圖。
下面敘述本發(fā)明的最佳實施例。
圖1是表示本發(fā)明的聲音合成方法(含用于聲音合成的詞典構筑的廣義聲音合成方法)的整體流程圖。
首先,設定多個聲音合成處理任務,這些任務中講話者或講話時的感情、狀況或講話內容中至少有一個不同(S1)。根據聲音合成目的由手工操作進行該作業(yè)。
圖2用于說明任務,圖1,A1、A2、A3表示多個不同講話者,B1、B2、B3表示多個不同感情、狀況,C1、C2、C3表示多個不同講話內容。這里,所謂講話內容不僅表示單一的詞,還表示向對方招呼的詞、高興時發(fā)出的言詞等根據一定定義的詞集合。
圖2中,講話者A1,在感情、狀況為B1時發(fā)表內容為C1的講話這種情況(A1-B1-C1)為一個任務。講話者A1在感情、狀況為B2時發(fā)表內容C1的講話這種情況(A1-B2-C1)為另一個任務。同樣,講話者A2在感情、狀況為B1時發(fā)表內容為C2的講話這種情況(A2-B1-C2),講話者A2在感情、狀況為B2時發(fā)表內容為C3的講話這種情況(A2-B2-C3),講話者A3在感情、狀況為B3時發(fā)表內容為C2的講話這種情況(A3-B3-C2)各自為另一任務。
這里,常常不必設定包羅全部多個講話者、多種講話時感情,狀況、多種講話內容的任務。即,即使如果對講話者A1設定感情、狀況B1,B2,B3且對感情、狀況B1,B2,B3各自設定講話內容C1、C2、C3,設定全部9種任務,有時對講話者A2也僅設定感情、狀況B1、B2,且對該感情、狀況B1僅設定講話內容C1、C2,對感情、狀況B2僅設定講話內容C3,即僅全部設定3種任務。設定怎樣的任務根據聲音合成目的任意決定。
雖然這里講話者、講話時的感情、狀況及講話內容均以多個進行說明,但也可按照聲音合成的目的,把其中任1或2項限定為一種設定任務。
圖3表示具體任務的一個例子,這里以視頻游戲中合成游戲角色的聲音信息為例,尤其表示講話內容僅限于對游戲者角色的招呼這一例子。
在圖3中,對名為“黑卡利(ひカリ)”的講話者(游戲角色)設定“幼年時的普通招呼”、“成為高中生時的普通招呼”、“成為高中生時電話中的普通招呼”、“自白、重逢時富感情的招呼”這4種感情、狀況,這些分別設定作為任務1、2、3、4。對名為“阿卡奈(ぁカね)”的講話者設定“普通招呼”、“電話中普通招呼”,“自白、放學時親切的招呼”這3種感情、狀況,這些分別設定作為任務5、6、7。
各任務中的信息例子示出附加后述的每個任務的單詞變形處理后的例子。圖中“奇亞恩(ちゃん)”、“庫恩(くん)(君)”是日語中的敬稱。
然后,對每個如上所述設定的任務構筑聲音合成所必需的詞典,即單詞詞典、韻律詞典和波形詞典(S2)。
這里,所謂單詞詞典是指收錄許多包含至少一個字符的單詞及其語調類型的部分,若以例如圖3中說明的任務而言,單詞詞典是收錄預想輸入的許多表示游戲者角色姓名的單詞及其語調類型的部分。所謂韻律詞典是指收錄韻律模型數據中代表性的韻律模型數據的部分,該韻律模型數據對收錄于單詞詞典的單詞表示韻律。所謂波形詞典是指把收錄聲音作為合成單位的聲音數據(音素片)加以收錄的部分。
如果加以后文所述的單詞變形處理,則講話者或感情、狀況不同的任務可共用單詞詞典,特別如果講話內容限定一種,則可僅為一個單詞詞典。
通過未圖示的輸入手段和游戲系統(tǒng)等,輸入要合成的字符串和指定任務時,采用與該任務對應的單詞詞典、韻律詞典及波形詞典進行聲音合成處理(S3)。
圖4是表示用于本發(fā)明聲音全成的詞典構筑方法的流程圖。
首先,用手工操作生成與上述設定的多個任務的講話者,講話時的感情、狀況,講話內容相應的單詞詞典(S21)。這時,根據需要,產生單詞變形規(guī)則(S22)。
這里,所謂單詞變形規(guī)則是確定把收錄于單詞詞典的單詞變換處理成與講話者或感情、狀況不同的任務所對應的單詞的規(guī)則。通過該變換處理,如上所述,可把一個單詞詞典作為與講話者或感情狀況不同的任務虛擬對應的多個單詞詞典使用。
圖5表示單詞變形規(guī)則的一個例子,在這里表示與圖3中說明過的“任務5”對應的變形規(guī)則,即從姓名(游戲者角色名)生成2拍(モ-ラ)(日文字母計數單位)外號名作為對游戲角色招呼時的規(guī)則為例子。
接著,從上述產生的單詞詞典或單詞詞典和單詞變形規(guī)則,選擇與某任務對應的單詞詞典或單詞詞典和單詞變形規(guī)則(S23)。這對,若有單詞變形規(guī)則就進行單詞變形處理(S24)。
單詞變形處理,根據與任務對應的單詞變形規(guī)則,對與該任務對應的單詞詞典中所包含的全部單詞進行變形處理。
對圖3、圖5的例子而言,這種處理是逐個取出收錄于單詞詞典的游戲角色名,若是2拍以上的通常名,則在最前面2拍所對應的字符后附加“庫恩”;如果是1拍的名字,則在該1拍所對應的字符上附加“-(長音)”及“庫恩”;如果是其它特殊的名字,則附加長音、促音、撥音等變形,生成外號名;或在生成外號名時,還進行使語調為第一拍升高等的對語調的變形處理。
接著,從收錄于上述單詞詞典的全部單詞中或對之加以單詞變形處理的全部單詞中,根據字符串選出規(guī)則,選出字符串,生成聲音收錄腳本(S25)。
所謂字符串選出規(guī)則是從收錄于單詞詞典的全部單詞或對之附加單詞變形處理的全部單詞中選出可成為模型的字符串的規(guī)則。例如,在從上述收錄許多游戲者角色名的單詞詞典中,選出可成為模式的字符串,即選出名字時,可采用(1)從1拍至6拍的名字,(2)至少采用一個每拍分別不同的語調類型的單詞。根據該規(guī)則選出的字符串的一個例子示于圖6。
單詞詞典所含的單詞,如果詞典產生時使講話內容的定義越窄,則限定模式、類似度大的單詞越多。在單詞詞典中包含很多類似度大的單詞時,向各單詞賦予表示其重要度、出現概率(頻度)的信息,把利用該信息的選擇基準與上述拍數和指定的語調類型等一起包含在字符串選出規(guī)則中,由此,在聲音收錄腳本中,包含實際聲音合成中作為要合成的字符串輸入的字符串或與其類似的字符串的概率高,從而,可提高實際聲音合成的品位。
接著,按照如上所述生成的任務所對應的聲音收錄腳本,收錄講話者的聲音(S26)。這時一種通常的工序在演播室邀請與任務相應的講話者(配聲演員等)按照腳本講,用話筒收錄其聲音,記錄在錄音機中。
最后,由收錄的聲音構筑韻律詞典和波形詞典(S27)。根據該收錄聲音構筑詞典的詳細處理,不是本申請的對象,可照用公知的算法和處理方法,因而這里省略其說明。
對全部任務重復進行上述處理(S28)。在如上所述,通過單詞變形處理,把一個單詞詞典作為與講話者或感情、狀況不同的任務虛擬對應的多個單詞詞典處理時,單詞詞典按原樣,僅對應于單詞變形規(guī)則不同的任務進行選擇。S24~S27的處理不必對每個任務全部順序進行,也可同時并行進行。
圖7示出一個例子根據與任務對應的單詞變形規(guī)則,對收錄在預定任務所對應的單詞詞典中的單詞進行變形處理,進而,產生按字符串選出規(guī)則選出并與預定任務對應的聲音收錄腳本。
這里,單詞變形規(guī)則是圖3說明過的“任務2”所對應的變形規(guī)則,即在名字(游戲角色名)上附加“庫恩”作為對游戲角色的招呼加以生成時的規(guī)則。字符串選擇規(guī)則是(1)變形后在3拍至8拍以內,(2)至少采用一個全部拍中每個均不同的語調類型的單詞,(3)出現概率高的詞優(yōu)先,(4)預定收錄在腳本中的字符串個數(超過該指定的時刻選擇結束)。
在本例中,雖然“阿基約希庫恩(ぁきょしくん)”、“姆茨約希庫恩(むフょしくん)”均是6拍,且同樣具有中間拍升高型語調類型(圖中實線所示),但“阿基約?!背霈F的概率高,因而選擇“阿基約希庫恩”,輸出至腳本。又,“沙愛摩恩扎部勞烏庫恩(さぇもんさぶろぅくん)”是10拍,因而不輸出至腳本。
在上述用于聲音合成的詞典構筑方法中,包含人工操作的生成詞典及聲音收錄等現場作業(yè),因而不能通過裝置或程序來實現全部工序,但對于單詞變形工序、字符串選出工序,可通過按照各自規(guī)則進行處理的裝置或程序來實現。
圖8是表示聲音合成方法(這里,是采用如上所述生成的每個任務的單詞詞典、韻律詞典和波形詞典,進行實際聲音合成的狹義的聲音合成方法)的流程圖。
首先,當通過沒有圖示的輸入手段和游戲系統(tǒng)等輸入要合成的字符串和指定任務時,根據該指定的任務,切換單詞詞典、韻律詞典和波形詞典,在詞典構筑階段進行單詞變形處理時還切換單詞變形規(guī)則(S31)。
接著,在詞典構筑階段進行單詞變形處理時,按照上述切換的單詞變形規(guī)則,對要合成的字符串進行單詞變形處理(S32)。這里所用的單詞變形規(guī)則,基本上按原樣使用詞典構筑階段所用的規(guī)則。
接著,由單詞詞典或單詞變形規(guī)則判定要合成字符串的語調類型(S33)。具體而言,比較要合成的字符串與收錄在單調詞典的單詞,若是同一單詞,則采用其語調類型;若不是,則采用同一拍數的單詞中具有類似字符串的單詞的語調類型。在沒有同一單詞時,操作者(游戲者)可從與要合成的字符串相同拍數的單詞中可出現的全部語調類型中,通過未圖示的輸入手段任意進行選擇。
這時,在上述單詞變形處理階段,對上述詞典構筑中已說明的語調進行變形處理時,采用按照上述單詞變形規(guī)則的語調類型。
接著,根據要合成的字符串與語調類型,從韻律詞典選擇韻律模型數據(S34),根據選擇的韻律模型數據,從波形詞典選擇與要合成的字符串的各字符對應的波形數據(S35),該選擇的波形數據彼此連接(S36),生成合成聲音數據。
關于S34~S36的處理細節(jié),不是本申請的對象,可原樣采用公知的算法和處理方法,因而省略其說明。
圖9是本發(fā)明聲音合成裝置的功能框圖,圖中,11-1、11-2、……11-11是任務1、任務2……任務n所用的詞典,12-1、12-2、……12-n是任務1、任務2、……任務n所用變形規(guī)則,13是詞典、變形規(guī)則切換手段,14是單詞變形手段,15是語調類型判定手段,16是韻律模型選擇手段,17是波形選擇手段,18是波形連接手段。
任務1~任務n所用詞典11-1~11-n,分別是任務1~任務n用的單詞詞典、韻律詞典和波形詞典(的存儲部)。任務1~任務n用變形規(guī)則12-1~12-n分別是任務1~任務n用的單詞變形規(guī)則(的存儲部)。
詞典、變形規(guī)則切換手段13,根據與要合成的字符串一起輸入的指定任務,切換使用的任務1~任務n用詞典11-1~11-n及任務1~任務n用變形規(guī)則12-1~12-n并分別選擇該詞典和規(guī)則中之一,向各部分提供。
單向變形手段14,按照上述選擇的單詞變形規(guī)則,對要合成的字符串進行變形處理。語調類型判定手段15,根據選擇的單詞詞典或單詞變形規(guī)則,判定要合成的字符串的語調類型。
韻律模型選擇手段,根據要合成的字符串與語調類型,從選擇的韻律詞典選擇韻律模型數據。波形選擇手段17,根據選擇的韻律模擬數據,從選擇的波形詞典選擇與要合成字符串的各字符對應的波形數據。波形連接手段18相互連接選擇的波形數據,生成合成聲音數據。
本說明書記載的最佳形態(tài)僅是例示,而不是用以限定。發(fā)明范圍由所附權利要求所示,落入該權利要求精神中的全部變形均包含在本發(fā)明中。
權利要求
1.一種采用單詞詞典、韻律詞典和波形詞典生成聲音信息的聲音合成方法,其特征在于,該方法包括下述步驟設定講話者或講話時感情、狀況或講話內容中至少一個不同的多個聲音合成處理任務;至少構筑與各任務對應的韻律詞典和波形詞典;在與任務指定的同時輸入要合成的字符串時,用與該任務對應的單詞詞典、韻律詞典和波形詞典進行聲音合成處理。
2.一種用于聲音合成的詞典構筑方法,是一種構筑進話者或講話時感情、狀況或講話內容中至少一個不同的多個聲音合成處理任務各自對應的單詞詞典、韻律詞典和波形詞典的詞典構筑方法,其特征在于,該方法包括下述步驟生成與任務對應的單詞詞典;從單詞詞典的全部單詞中選出可成為模型的字符串生成聲音收錄腳本;按照聲音收錄腳本收錄講話者的聲音;由所述收錄的聲音構筑韻律詞典和波形詞典;對各任務進行上述步驟。
3.一種用于聲音合成的詞典構筑方法,是一種構筑進話者或講話時感情、狀況或講話內容中至少一個不同的多個聲音合成處理任務各自對應的單詞詞典、韻律詞典和波形詞典的詞典構筑方法,其特征在于,該方法包括下述步驟生成與任務對應的單詞詞典和單詞變形現則;按照與所述任務對應的單詞變形規(guī)則,對與任務對應的單詞詞典中包含的全部單詞進行變形處理;從經變形處理的單詞詞典中的全部單詞選出可成為模型的字符串生成聲音收錄腳本;根據聲音收錄腳本收錄講話者的聲音;從所述收錄的聲音構筑韻律詞典和波形詞典;對各任務進行上述步驟。
4.一種用于聲音合成的詞典構筑方法,是一種構筑單詞詞典、與講話者或講話時的感情、狀況之一不同的多個聲音合成處理任務分別對應的韻律詞典和波形詞典的詞典構筑方法,其特征在于,該方法包括下步驟生成與任務對應的單詞變形規(guī)則;按照與任務對應的單詞變形規(guī)則,對單詞詞典所包含的全部單詞進行變形處理;從經變形處理的單詞詞典中的全部單詞選出可成為模型的字符串生成聲音收錄腳本;根據聲音收錄腳本收錄講話者的聲音;從所述收錄的聲音構筑韻律詞典和波形詞典;對各任務進行上述步驟。
5.一種采用與講話者或講話時的感情、狀況或講話內容中至少一個不同的多個聲音合成處理任務分別對應的單詞詞典、韻律詞典和波形詞典進行聲音合成的方法,其特征在于,該方法包括下述步驟根據與要合成的字符串一起輸入的任務指定,切換單詞詞典、韻律詞典和波形詞典;采用切換后的單詞詞典、韻律詞典和波形詞典,對與要合成的字符串對應的聲音信息進行合成處理。
6.如權利要求5所述的聲音合成方法,其特征在于,在各詞典是收錄許多至少含一個字符的單詞及其語調類型的單詞詞典、收錄表示對收錄于所述單詞詞典中的單詞的韻律的韻律模型數據中的代表性韻律數據的韻律詞典、把收錄聲音作為合成單位的聲音數據加以收錄的波形詞典時,該聲音合成處理包括下述步驟從單詞詞典判定要合成的字符串的語調類型;根據要合成的字符串與語調類型,從韻律詞典選擇韻律模型數據;根據選擇的韻律模型數據,從波形詞典選擇與要合成的字符串各字符對應的波形數據;相互連接所述選擇的波形數據。
7.一種采用與講話者或講話時的感情、狀況或講話內容中至少一個不同的多個聲音合成處理任務分別對應的單詞詞典、韻律詞典和波形詞典及單詞變形規(guī)則進行聲音合成的方法,其特征在于,該方法包括下述步驟根據與要合成的字符串一起輸入的任務指定,切換單詞詞典、韻律詞典、波形詞典和單詞變形規(guī)則;按照單詞變形規(guī)則對要合成的字符串進行變形處理;采用切換后的單詞詞典、韻律詞典和波形詞典對與變形處理后的字符串對應的聲音信息進行合成處理。
8.如權利要求7所述的聲音合成方法,其特征在于,在各詞典是收錄許多至少含一個字符的單詞及其語調類型的單詞詞典、收錄表示對收錄于所述單詞詞典中的單詞的韻律的韻律模型數據中的代表性韻律數據的韻律詞典、把收錄聲音作為合成單位的聲音數據加以收錄的波形詞典時,該聲音合成處理包括下述步驟從單詞詞典或單詞變形規(guī)則判定要合成的字符串的語調類型;根據要合成的字符串和語調類型,從韻律詞典選擇韻律模型數據;根據選擇的韻律模型數據,從波形詞典選擇與要合成的字符串的各字符對應的波形數據;相互連接所述選擇的波形數據。
9.一種采用單詞詞典、與講話者或講話時的感情、狀況之一不同的多個聲音合成處理任務分別對應的韻律詞典、波形詞典和單詞變形規(guī)則的聲音合成方法,其特征在于,該方法包括下述步驟根據與要合成的字符串一起輸入的任務指定,切換韻律詞典、波形詞典和單詞變形規(guī)則;按照單詞變形規(guī)則對要合成的字符進行變形處理;采用單詞詞典、切換后的韻律詞典和波形詞典,對與變形處理后的字符串對應的聲音信息進行合成處理。
10.如權利要求9所述的聲音合成方法,其特征在于,在各詞典是收錄許多至少含一個字符的單詞及其語調類型的單詞詞典、收錄表示對收錄于所述單詞詞典中的單詞的韻律的韻律模型數據中的代表性韻律數據的韻律詞典、把收錄聲音作為合成單位的聲音數據加以收錄的波形詞典且單詞變形規(guī)則是收錄字符串變形規(guī)則的單詞變形規(guī)則時,該聲音合成處理包括下述步驟從單詞詞典或單詞變形規(guī)則判定要合成的字符串的語調類型;根據要合成的字符串與語調類型,從韻律詞典選擇韻律模型數據;根據選擇的韻律模型數據,從波形詞典選擇與要合成的字符串的各字符對應的波形數據;相互連接所述選擇的波形數據。
11.一種采用與講話者或講話時的感情、狀況或講話內容中至少一個不同的多個聲音合成處理任務分別對應的單詞詞典、韻律詞典和波形詞典的聲音合成裝置,其特征在于,它包括根據與要合成的字符串一起輸入的任務指定,切換單詞詞典、韻律詞典和波形詞典的手段;采用切換后的單詞詞典、韻律詞典和波形詞典,對與要合成的字符串對應的聲音信息進行合成處理的手段。
12.如權利要求11所述的聲音合成裝置,其特征在于,在各詞典是收錄許多至少含一個字符的單詞及其語調類型的單詞詞典、收錄表示對收錄于所述單詞詞典中的單詞的韻律的韻律模型數據中的代表性韻律數據的韻律詞典、把收錄聲音作為合成單位的聲音數據加以收錄的波形詞典時,聲音合成處理手段包括由單詞詞典判定要合成字符串的語調類型的手段;根據要合成的字符串和語調類型,從韻律詞典選擇韻律模型數據的手段;根據選擇的韻律模型數據,從波形詞典選擇與要合成的字符串的各字符對應的波形數據;相互連接所述選擇的波形數據的手段。
13.一種采用與講話者或講話時的感情、狀況或講話內容中至少一個不同的多個聲音合成處理任務分別對應的單詞詞典、韻律詞典和波形詞典及單詞變形規(guī)則的聲音合成裝置,其特征在于,它包括根據與要合成的字符串一起輸入的任務指定,切替單詞詞典、韻律詞典、波形詞典和單詞變形規(guī)則的手段;按照單詞變形規(guī)則對要合成的字符串進行變形處理的手段;采用切換后的單詞詞典、韻律詞典和波形詞典,對與變形處理后的字符串對應的聲音信息進行合成處理的手段。
14.如權利要求13所述的聲音合成裝置,其特征在于,在各詞典是收錄許多至少含一個字符的單詞及其語調類型的單詞詞典、收錄表示對收錄于所述單詞詞典中的單詞的韻律的韻律模型數據中的代表性韻律數據的韻律詞典、把收錄聲音作為合成單位的聲音數據加以收錄的波形詞典且單詞變形規(guī)則是收錄字符串變形規(guī)則的單詞變形規(guī)則時,聲音合成處理手段包括由單詞詞典或單詞變形規(guī)則判定要合成字符串的語調類型的手段;根據要合成字符串與語調類型,從韻律詞典選擇韻律模型數據的手段;根據選擇的韻律模型數據,從波形詞典選擇與要合成字符串各字符對應的波形數據的手段;相互連接所述選擇的波形數據的手段。
15.一種采用單詞詞典、與講話者或講話時的感情、狀況之一不同的多個聲音合成處理任務分別對應的韻律詞典、波形詞典和單詞變形規(guī)則的聲音合成裝置,其特征在于,它包括根據與要合成的字符串一起輸入的任務指定,切換韻律詞典、波形詞典和單詞變形規(guī)則的手段;按照單詞變形規(guī)則對要合成的字符串進行變形處理的手段;采用單詞詞典、切換后的韻律詞典和波形詞典對與變形處理后的字符串對應的聲音信息進行合成處理的手段。
16.如權利要求15所述的聲音合成裝置,其特征在于,在各詞典是收錄許多至少含一個字符的單詞及其語調類型的單詞詞典、收錄表示對收錄于所述單詞詞典中的單詞的韻律的韻律模型數據中的代表性韻律數據的韻律詞典、把收錄聲音作為合成單位的聲音數據加以收錄的波形詞典且單詞變形規(guī)則是收錄字符串變形規(guī)則的單詞變形規(guī)則時,聲音合成處理手段包括從單詞詞典或單詞變形規(guī)則判定要合成字符串的語調類型的手段;根據要合成字符串與語調類型從韻律詞典選擇韻律模型數據的手段;根據選擇的韻律模型數據,從波形詞典選擇與要合成的字符串各字符對應的波形數據的手段;相互連接所述選擇的波形數據的手段。
17.一種記錄聲音合成程序的計算機可讀媒體,其特征在于,所述程序在被計算機讀取時,使該計算機在功能上包括下述手段與講話者或講話時的感情、狀況或講話內容中至少一個不同的多個聲音合成處理任務分別對應的單詞詞典、韻律詞典和波形詞典;根據與要合成的字符串一起輸入的任務指定切換單詞詞典、韻律詞典和波形詞典的手段;采用切換后的單詞詞典、韻律詞典和波形詞典對與要合成的字符串對應的聲音信息進行合成處理的手段。
18.如權利要求17所述的記錄聲音合成程序的計算機可讀媒體,其特征在于,在各詞典是收錄許多至少含一個字符的單詞及其語調類型的單詞詞典、收錄表示對收錄于所述單詞詞典中的單詞的韻律的韻律模型數據中的代表性韻律數據的韻律詞典、把收錄聲音作為合成單位的聲音數據加以收錄的波形詞典時,聲音合成處理手段包括由單詞詞典判定要合成字符串的語調類型的手段;根據要合成的字符串和語調類型,從韻律詞典選擇韻律模型數據的手段;根據選擇的韻律模型數據,從波形詞典選擇與要合成的字符串的各字符對應的波形數據;相互連接所述選擇的波形數據的手段。
19.一種記錄聲音合成程序的計算機可讀媒體,其特征在于,所述程序在被計算機讀取時,使該計算機在功能上包括下述手段與講話者或講話時的感情、狀況或講話內容中至少一個不同的多個聲音合成處理任務分別對應的單詞詞典、韻律詞典、波形詞典和單詞變形規(guī)則;根據與要合成的字符串一起輸入的任務指定,切換單詞詞典、韻律詞典、波形詞典和單詞變形規(guī)則的手段;按照單詞變形規(guī)則對要合成的字符串進行變形處理的手段;采用切換后的單詞詞典、韻律詞典和波形詞典對與變形處理后的字符串對應的聲音信息進行合成處理的手段。
20.如權利要求19所述的計算機可讀媒體,其特征在于,在各詞典是收錄許多至少含一個字符的單詞及其語調類型的單詞詞典、收錄表示對收錄于所述單詞詞典中的單詞的韻律的韻律模型數據中的代表性韻律數據的韻律詞典、把收錄聲音作為合成單位的聲音數據加以收錄的波形詞典且單詞變形規(guī)則是收錄字符串變形規(guī)則的單詞變形規(guī)則時,聲音合成處理手段包括由單詞詞典或單詞變形規(guī)則判定要合成的字符串的語調類型的手段;根據要合成的字符串和語調類型,從韻律詞典選擇韻律模型數據的手段;根據選擇的韻律模型數據,從波形詞典選擇與要合成的字符串的各字符對應的波形數據;相互連接所述選擇的波形數據的手段。
21.一種記錄聲音合成程序的計算機可讀媒體,其特征在于,所述程序在被計算機讀取時,使該計算機在功能上包括下述手段單詞詞典、與講話者或講話時的感情、狀態(tài)之一不同的多個聲音合成處理任務分別對應的韻律詞典、波形詞典和單詞變形規(guī)則;根據與要合成的字符串一起輸入的任務指定切換韻律詞典、波形詞典和單詞變形規(guī)則的手段;按照單詞變形規(guī)則對要合成的字符串進行變形處理的手段;采用單詞詞典、切換后的韻律詞典和波形詞典,對與變形處理后的字符串對應的聲音信息進行合成處理的手段。
22.如權利要求21所述的計算機可讀媒體,其特征在于,在各詞典是收錄許多至少含一個字符的單詞及其語調類型的單詞詞典、收錄表示對收錄于所述單詞詞典中的單詞的韻律的韻律模型數據中的代表性韻律數據的韻律詞典、把收錄聲音作為合成單位的聲音數據加以收錄的波形詞典且單詞變形規(guī)則是收錄字符串變形規(guī)則的單詞變形規(guī)則時,聲音合成處理手段包括由單詞詞典或單詞變形規(guī)則判定要合成的字符串的語調類型的手段;根據要合成的字符串和語調類型,從韻律詞典選擇韻律模型數據的手段;根據選擇的韻律模型數據,從波形詞典選擇與要合成的字符串的各字符對應的波形數據;相互連接所述選擇的波形數據的手段。
全文摘要
設定講話者或進話時的感情、狀況或講話內容中至少一個不同的多個聲音合成處理任務(S1),構筑與各任務對應的單詞詞典、韻律詞典和波形詞典(S2),在由游戲系統(tǒng)等輸入要合成的字符串及指定任務時采用該指定任務的單詞詞典、韻律詞典和波形詞典進行聲音合成處理(S3),由此可生成反映講話者個性和講話時的感情、狀況、講話內容的聲音信息。
文檔編號G10L13/04GK1282017SQ00120198
公開日2001年1月31日 申請日期2000年7月21日 優(yōu)先權日1999年7月21日
發(fā)明者笠井 治, 溝口稔幸 申請人:科樂美股份有限公司, 科樂美東京電腦娛樂股份有限公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
黔西县| 玉林市| 班玛县| 克什克腾旗| 阳江市| 巩义市| 盐津县| 天峻县| 镇赉县| 宣城市| 濮阳县| 澄江县| 栾川县| 华容县| 包头市| 渭南市| 乌兰察布市| 延安市| 镇安县| 红原县| 巴马| 彭泽县| 冷水江市| 平遥县| 穆棱市| 临清市| 樟树市| 枣阳市| 永寿县| 日土县| 封开县| 呼伦贝尔市| 剑川县| 丰县| 南宁市| 柞水县| 清远市| 北辰区| 柯坪县| 惠水县| 巢湖市|