專(zhuān)利名稱(chēng):對(duì)話系統(tǒng)和對(duì)話控制裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及對(duì)話系統(tǒng)和對(duì)話控制裝置,特別適合用于用戶(hù)與機(jī)器同時(shí)采用語(yǔ)音和畫(huà)面進(jìn)行對(duì)話的語(yǔ)音識(shí)別系統(tǒng)。
下面參照
互聯(lián)網(wǎng)環(huán)境中采用的上述對(duì)話系統(tǒng)。圖11表示已有技術(shù)的對(duì)話系統(tǒng)的構(gòu)成。
如圖11所示,已有技術(shù)的對(duì)話系統(tǒng)是把用戶(hù)操作的用戶(hù)終端102、語(yǔ)音識(shí)別字典服務(wù)器103和Web服務(wù)器104連接在互聯(lián)網(wǎng)101上而構(gòu)成。用戶(hù)終端102具有語(yǔ)音控制部102a、語(yǔ)音識(shí)別部102b和信息提示處理部102c。雖然圖示省略了,但是在用戶(hù)終端中還設(shè)置有鼠標(biāo)等指向器和鍵盤(pán)等接觸輸入部。
操作用戶(hù)終端102的用戶(hù)能夠同時(shí)采用由語(yǔ)音識(shí)別部102b進(jìn)行的語(yǔ)音識(shí)別、由接觸輸入部進(jìn)行的接觸輸入、由語(yǔ)音控制部102a進(jìn)行的語(yǔ)音輸出、由信息提示處理部102c進(jìn)行的畫(huà)面顯示,來(lái)輸入并取得信息。
按照這樣構(gòu)成的已有技術(shù)的對(duì)話系統(tǒng),其優(yōu)點(diǎn)是可通過(guò)使用HTML(Hyper Text Markup Language)文件和控制模式文件,對(duì)每個(gè)HTML文件切換語(yǔ)音識(shí)別字典。
即,指定在HTML文件中所使用的語(yǔ)音識(shí)別字典,對(duì)控制模式文件中的每個(gè)識(shí)別詞匯指定下面應(yīng)提示的HTML文件,由此,切換語(yǔ)音識(shí)別字典。
但是,上述已有技術(shù)的對(duì)話系統(tǒng)存在下述問(wèn)題。
即,為了把數(shù)十萬(wàn)條以上的大規(guī)模的識(shí)別詞匯作為對(duì)象進(jìn)行語(yǔ)音識(shí)別,就必須要求高性能的中央運(yùn)算處理裝置(處理器,中央處理單元(CPU))和大容量的存儲(chǔ)器。因此,像上述的對(duì)話系統(tǒng),在終端進(jìn)行語(yǔ)音識(shí)別的方法中,在制造具有高性能的CPU與大容量存儲(chǔ)器的終端時(shí),其成本增加。
如果例舉具體的一個(gè)實(shí)例,使用便攜式電話終端進(jìn)行與大量的詞匯有關(guān)的語(yǔ)音識(shí)別就會(huì)導(dǎo)致便攜式電話終端機(jī)身制造成本的大幅度的增加,伴隨而來(lái)的就是使銷(xiāo)售價(jià)格大為上升。因此,很難實(shí)現(xiàn)采用便攜式電話終端的語(yǔ)音識(shí)別,妨礙移動(dòng)環(huán)境下的利用。
在使用語(yǔ)音的對(duì)話中,必須根據(jù)對(duì)話的狀況控制語(yǔ)音識(shí)別和語(yǔ)音輸出。
具體來(lái)說(shuō),在不能識(shí)別用戶(hù)發(fā)出的語(yǔ)音的情況下的控制或終端裝置的語(yǔ)音引導(dǎo)的輸出時(shí),必須控制是否受理用戶(hù)的發(fā)話。可是,在上述對(duì)話系統(tǒng)中,由于采用HTML文件作為控制語(yǔ)言,所以難以進(jìn)行采用語(yǔ)音的對(duì)話的必要控制。
即,在上述的以往的對(duì)話系統(tǒng)中,首先,檢測(cè)識(shí)別詞匯,然后,從服務(wù)器獲得與該識(shí)別詞匯相對(duì)應(yīng)的HTML文件。但是,在不能檢測(cè)識(shí)別詞匯的情況下,由于不可能獲得HTML文件,故在不能夠識(shí)別時(shí),對(duì)話停止。另外,在HTML文件中極難表示是否受理用戶(hù)發(fā)話的控制信息。
為了解決上述課題,按照發(fā)明的第一項(xiàng)發(fā)明的特征在于具有可輸出語(yǔ)音信息的語(yǔ)音信息提供裝置、可輸出畫(huà)面信息的畫(huà)面信息提供裝置以及可對(duì)上述語(yǔ)音信息提供裝置和畫(huà)面信息提供裝置發(fā)送接收電子信息的對(duì)話控制裝置;至少可與畫(huà)面信息提供裝置之間進(jìn)行通信的第一通信終端和至少可與語(yǔ)音信息提供裝置之間進(jìn)行通信的第二通信終端可連接起來(lái);畫(huà)面信息提供裝置具有記錄發(fā)送到可顯示視覺(jué)信息的第一通信終端的第一電子信息和對(duì)話控制裝置中所使用的第二電子信息的記錄部,同時(shí)在從第一通信終端或?qū)υ捒刂蒲b置接收到信息的情況下,可根據(jù)接收到的信息進(jìn)行向第一通信終端發(fā)送第一電子信息的處理和向?qū)υ捒刂蒲b置發(fā)送第二電子信息的處理中的至少一種處理;語(yǔ)音信息提供裝置在接收到由對(duì)話控制裝置生成的語(yǔ)音對(duì)話用信息的情況下可從對(duì)話控制裝置把基于語(yǔ)音對(duì)話用信息的語(yǔ)音信息發(fā)送到第二通信終端,同時(shí)在從第二通信終端接收到語(yǔ)音信息的情況下,可根據(jù)語(yǔ)音對(duì)話用信息識(shí)別所接收到的語(yǔ)音信息,并生成語(yǔ)音識(shí)別結(jié)果,發(fā)送到對(duì)話控制裝置;對(duì)話控制裝置在從畫(huà)面信息提供裝置接收到第二電子信息的情況下,可根據(jù)第二電子信息生成語(yǔ)音對(duì)話用信息,發(fā)送到語(yǔ)音信息提供裝置,同時(shí)在從語(yǔ)音信息提供裝置接收到語(yǔ)音識(shí)別結(jié)果的情況下,可根據(jù)第二電子信息,將與語(yǔ)音識(shí)別結(jié)果有關(guān)的信息發(fā)送到畫(huà)面信息提供裝置。
作為典型方式,該第一項(xiàng)發(fā)明中,畫(huà)面信息提供裝置、語(yǔ)音信息提供裝置和對(duì)話控制裝置可經(jīng)電話線路交換網(wǎng)、互聯(lián)網(wǎng)或局域網(wǎng)(LAN)等網(wǎng)絡(luò)相互連接,同時(shí)第一通信終端和第二通信終端可經(jīng)網(wǎng)絡(luò)連接起來(lái)。
本發(fā)明的第二項(xiàng)發(fā)明的特征在于連接有畫(huà)面信息提供裝置和語(yǔ)音信息提供裝置;畫(huà)面信息提供裝置具有可記錄發(fā)送到能顯示視覺(jué)信息的第一通信終端的第一電子信息和語(yǔ)音信息提供裝置所使用的第二電子信息的記錄部,同時(shí)在從第一通信終端或語(yǔ)音信息提供裝置接收到信息的情況下,可進(jìn)行把基于接收到的信息的第一電子信息發(fā)送到第一通信終端的處理和向語(yǔ)音信息提供裝置發(fā)送第二電子信息的處理中的至少一種處理;語(yǔ)音信息提供裝置在從畫(huà)面信息提供裝置接收到第二電子信息的情況下,可將基于第二電子信息的語(yǔ)音信息發(fā)送到能輸出語(yǔ)音的第二通信終端,同時(shí)在從第二通信終端接收到語(yǔ)音信息的情況下,可根據(jù)第二電子信息識(shí)別接收到的語(yǔ)音信息,并生成語(yǔ)音識(shí)別結(jié)果,將語(yǔ)音識(shí)別結(jié)果發(fā)送到畫(huà)面信息提供裝置。
在該第一項(xiàng)和第二項(xiàng)發(fā)明中,如果考慮可與互聯(lián)網(wǎng)等網(wǎng)絡(luò)連接的便攜式電話或PHS等所采用的情況,第一通信終端和第二通信終端最好由同一終端構(gòu)成。
作為典型方式,在該第二項(xiàng)發(fā)明中,畫(huà)面信息提供裝置和聲音信息提供裝置可經(jīng)網(wǎng)絡(luò)相互連接,同時(shí)可經(jīng)網(wǎng)絡(luò)把第一通信裝置和第二通信裝置連接起來(lái)。
本發(fā)明的第三項(xiàng)發(fā)明的特征在于畫(huà)面信息提供裝置、對(duì)話控制裝置和語(yǔ)音識(shí)別裝置相互連接起來(lái)而構(gòu)成,同時(shí)可連接通信終端;畫(huà)面信息提供裝置具有可記錄發(fā)送到通信終端的第一電子信息和對(duì)話控制裝置中所使用的第二電子信息的記錄部,同時(shí)在從通信終端或?qū)υ捒刂蒲b置接收到信息的情況下,可根據(jù)接收到的信息進(jìn)行把第一電子信息發(fā)送到通信終端的處理和把第二電子信息發(fā)送到對(duì)話控制裝置的處理中的至少一種處理;對(duì)話控制裝置在從畫(huà)面信息提供裝置接收到第二電子信息的情況下,生成基于第二電子信息的語(yǔ)音對(duì)話用信息,并發(fā)送到通信終端,在從通信終端接收到語(yǔ)音識(shí)別結(jié)果的情況下,根據(jù)第二電子信息把與上述語(yǔ)音識(shí)別結(jié)果有關(guān)的信息發(fā)送到畫(huà)面信息提供裝置;語(yǔ)音識(shí)別裝置可從通信終端接收語(yǔ)音信息,識(shí)別所接收到的語(yǔ)音信息,生成語(yǔ)音識(shí)別結(jié)果,并發(fā)送到通信終端。
作為典型方式,在該第三項(xiàng)發(fā)明中,在從畫(huà)面信息提供裝置接收到第一電子信息的情況下,通信終端可輸出第一電子信息或?qū)Φ谝浑娮有畔⑦M(jìn)行了加工的信息;在進(jìn)行了接觸輸入的情況下,通信終端可根據(jù)第一電子信息把已進(jìn)行了接觸輸入的信息發(fā)送到畫(huà)面信息提供裝置;在從對(duì)話控制裝置接收到語(yǔ)音對(duì)話用信息的情況下,通信終端可根據(jù)語(yǔ)音對(duì)話用信息控制語(yǔ)音的輸入或語(yǔ)音的輸出;在進(jìn)行了語(yǔ)音的輸入的情況下,通信終端可根據(jù)語(yǔ)音對(duì)話用信息把語(yǔ)音發(fā)送到語(yǔ)音識(shí)別裝置;在從語(yǔ)音識(shí)別裝置接收到語(yǔ)音識(shí)別結(jié)果的情況下,通信終端可根據(jù)語(yǔ)音對(duì)話用信息把與語(yǔ)音識(shí)別結(jié)果有關(guān)的信息發(fā)送到對(duì)話控制裝置。
在上述第一項(xiàng)發(fā)明或第三項(xiàng)發(fā)明中,在接收到語(yǔ)音識(shí)別結(jié)果的情況下,對(duì)話控制裝置最好可根據(jù)第二電子信息和語(yǔ)音識(shí)別結(jié)果生成語(yǔ)音對(duì)話用信息。
本發(fā)明的第四項(xiàng)發(fā)明的特征在于把畫(huà)面信息提供裝置和語(yǔ)音識(shí)別裝置連接起來(lái)而構(gòu)成,同時(shí)能夠連接可與畫(huà)面信息提供裝置和語(yǔ)音識(shí)別裝置進(jìn)行通信的通信終端;畫(huà)面信息提供裝置具有可記錄發(fā)送到通信終端的第一電子信息和語(yǔ)音識(shí)別裝置所使用的第二電子信息的記錄部,并且可根據(jù)從通信終端接收到的信息把第一電子信息和第二電子信息發(fā)送到通信終端;語(yǔ)音識(shí)別裝置識(shí)別從通信終端接收到的語(yǔ)音信息,并可生成語(yǔ)音信息的語(yǔ)音識(shí)別結(jié)果,同時(shí)可把語(yǔ)音識(shí)別結(jié)果發(fā)送到通信終端。
作為典型方式,在該第四項(xiàng)發(fā)明中,通信終端在從畫(huà)面信息提供裝置接收到第一電子信息的情況下可顯示第一電子信息或?qū)Φ谝浑娮有畔⑦M(jìn)行了加工的信息;在進(jìn)行了接觸輸入的情況下可根據(jù)第一電子信息把已進(jìn)行了接觸輸入的信息發(fā)送到畫(huà)面信息提供裝置;在從畫(huà)面信息提供裝置接收到第二電子信息的情況下可根據(jù)第二電子信息控制語(yǔ)音的輸入和語(yǔ)音的輸出;在進(jìn)行了語(yǔ)音輸入的情況下可根據(jù)第二電子信息把語(yǔ)音的語(yǔ)音信息發(fā)送到語(yǔ)音識(shí)別裝置;在從語(yǔ)音識(shí)別裝置接收到語(yǔ)音識(shí)別結(jié)果的情況下可根據(jù)第二電子信息把與語(yǔ)音識(shí)別結(jié)果有關(guān)的信息發(fā)送到畫(huà)面信息提供裝置。
作為典型方式,在該第四項(xiàng)發(fā)明中,畫(huà)面信息提供裝置和語(yǔ)音識(shí)別裝置經(jīng)網(wǎng)絡(luò)相互連接,并且通信終端經(jīng)該網(wǎng)絡(luò)可在與畫(huà)面信息提供裝置和語(yǔ)音識(shí)別裝置之間進(jìn)行通信。
本發(fā)明的第五項(xiàng)發(fā)明是一種對(duì)話控制裝置,其特征在于具有接收從連接在網(wǎng)絡(luò)上的第一電子計(jì)算機(jī)發(fā)送的電子信息的第一接收裝置;加工電子信息而生成語(yǔ)音對(duì)話用信息的生成裝置;向連接在網(wǎng)絡(luò)上同時(shí)能夠進(jìn)行語(yǔ)音對(duì)話處理的第二電子計(jì)算機(jī)發(fā)送語(yǔ)音對(duì)話用信息的第一發(fā)送裝置;接收在第二電子計(jì)算機(jī)中進(jìn)行的語(yǔ)音對(duì)話處理而生成的語(yǔ)音識(shí)別結(jié)果的第二接收裝置;根據(jù)語(yǔ)音識(shí)別結(jié)果或電子信息把與語(yǔ)音識(shí)別結(jié)果有關(guān)的信息發(fā)送到第一電子計(jì)算機(jī)的第二發(fā)送裝置。
在該第五項(xiàng)發(fā)明中,為了節(jié)省裝置中的空間和簡(jiǎn)化裝置,作為典型方式,第一發(fā)送裝置和第二接收裝置由同一個(gè)第一發(fā)送接收裝置構(gòu)成,同時(shí)第二發(fā)送裝置和第一接收裝置由同一個(gè)第二發(fā)送接收裝置構(gòu)成。
在該第五項(xiàng)發(fā)明中,語(yǔ)音對(duì)話用信息的生成最好可根據(jù)語(yǔ)音識(shí)別結(jié)果來(lái)進(jìn)行。
本發(fā)明的第六項(xiàng)發(fā)明是一種對(duì)話系統(tǒng),可連接具有接觸輸入、語(yǔ)音輸入、畫(huà)面顯示和語(yǔ)音輸出的用戶(hù)接口的通信終端;其特征在于具有接收基于通信終端發(fā)送的接觸輸入的電子信息的接收裝置;接收基于通信終端發(fā)送的語(yǔ)音輸入的語(yǔ)音信息的接收裝置;把畫(huà)面顯示用的電子信息發(fā)送到通信終端的發(fā)送裝置;把語(yǔ)音輸出用的語(yǔ)音信息發(fā)送到通信終端的發(fā)送裝置;根據(jù)基于接觸輸入的電子信息或基于語(yǔ)音輸入的語(yǔ)音信息使畫(huà)面顯示用的電子信息或語(yǔ)音輸出用的語(yǔ)音信息變化的裝置。
本發(fā)明的第七項(xiàng)發(fā)明是一種對(duì)話系統(tǒng),可連接具有接觸輸入和畫(huà)面顯示的用戶(hù)接口的第一通信終端,同時(shí)可連接具有語(yǔ)音輸入和語(yǔ)音輸出的用戶(hù)接口的第二通信終端;其特征在于具有接收第一通信終端發(fā)送的基于接觸輸入的電子信息的接收裝置;接收第二通信終端發(fā)送的基于語(yǔ)音輸入的語(yǔ)音信息的接收裝置;把畫(huà)面顯示用的電子信息發(fā)送到第一通信終端的發(fā)送裝置;把語(yǔ)音輸出用的語(yǔ)音信息發(fā)送到第二通信終端的發(fā)送裝置;根據(jù)基于接觸輸入的電子信息或基于語(yǔ)音輸入的語(yǔ)音信息使畫(huà)面顯示用的電子信息或語(yǔ)音輸出用的語(yǔ)音信息變化的裝置。
在本發(fā)明的第一、第二和第六項(xiàng)發(fā)明中,在同一用戶(hù)使用第一通信終端和第二通信終端的情況下,為了使該第一通信終端和第二通信終端相對(duì)應(yīng),作為典型方式,從第一通信終端接觸輸入第一用戶(hù)識(shí)別符的同時(shí),從第二通信終端發(fā)送第二用戶(hù)識(shí)別符,比較第一用戶(hù)識(shí)別符和第二識(shí)別符的異同,就能夠使第一通信終端和第二通信終端相對(duì)應(yīng)。
在本發(fā)明的第一、第二和第六項(xiàng)發(fā)明中,在同一用戶(hù)使用第一通信終端和第二通信終端的情況下,為了使該第一通信終端和第二通信終端相對(duì)應(yīng),作為典型方式,在把第二通信終端與對(duì)話系統(tǒng)連接時(shí),在對(duì)話系統(tǒng)中自動(dòng)生成第一密碼數(shù)據(jù),并發(fā)送到第二通信終端;在第二通信終端,把第一密碼數(shù)據(jù)進(jìn)行語(yǔ)音輸出后,把第一通信終端連接到對(duì)話系統(tǒng)上時(shí),從第一通信終端接觸輸入第二密碼數(shù)據(jù),并發(fā)送到對(duì)話系統(tǒng);在對(duì)話系統(tǒng)中,比較第一密碼數(shù)據(jù)和第二密碼數(shù)據(jù)的異同,就能夠使第一通信終端和第二通信終端相對(duì)應(yīng)。
在本發(fā)明的第一、第二和第六項(xiàng)發(fā)明中,在同一用戶(hù)使用第一通信終端和第二通信終端的情況下,為了使該第一通信終端和第二通信終端相對(duì)應(yīng),同時(shí)進(jìn)一步提高保密性,最好是在第一通信終端連接到對(duì)話系統(tǒng)上時(shí),在上述對(duì)話系統(tǒng)中自動(dòng)生成第一密碼數(shù)據(jù),并發(fā)送到第一通信終端;在第一通信終端,把第一密碼數(shù)據(jù)進(jìn)行畫(huà)面輸出后,在第二通信終端與對(duì)話系統(tǒng)連接時(shí),從第二通信終端把第二密碼數(shù)據(jù)發(fā)送到對(duì)話系統(tǒng);在該對(duì)話系統(tǒng)中,比較第一密碼數(shù)據(jù)和第二密碼數(shù)據(jù)的異同,就能夠使第一通信終端和第二通信終端相對(duì)應(yīng)。
在本發(fā)明的第一、第二和第六項(xiàng)發(fā)明中,在同一用戶(hù)使用第一通信終端和第二通信終端的情況下,為了更簡(jiǎn)便地使該第一通信終端和第二通信終端相對(duì)應(yīng),作為典型方式,可把第一通信終端連接在至少連接了畫(huà)面信息提供裝置的第一網(wǎng)絡(luò)上,同時(shí)第二通信終端可連接在能夠與第二通信終端進(jìn)行通信且具有多個(gè)分別記錄了位置信息的基站的第二網(wǎng)絡(luò)上;第二通信終端與第一基站通信的同時(shí),在第一基站,除了第二通信終端以外而不存在通信中的通信終端時(shí),在第一通信終端連接到第一網(wǎng)絡(luò)上時(shí)可使第一通信終端和第二通信終端相對(duì)應(yīng)。
按照上述那樣構(gòu)成的本發(fā)明的對(duì)話系統(tǒng)和對(duì)話控制裝置,使用第一通信終端和第二通信終端,或使用它們組合形成的通信終端來(lái)進(jìn)行語(yǔ)音的終端操作時(shí),在終端以外的外部進(jìn)行語(yǔ)音識(shí)別處理就能夠不對(duì)第一通信終端和第二通信終端施加較大的負(fù)荷,而可進(jìn)行語(yǔ)音識(shí)別處理。
圖2是本發(fā)明的第一實(shí)施例的對(duì)話控制系統(tǒng)的方框圖。
圖3是本發(fā)明的第一實(shí)施例的對(duì)話系統(tǒng)、連接在該對(duì)話系統(tǒng)上的語(yǔ)音終端和畫(huà)面終端的對(duì)應(yīng)情況的方框圖。
圖4是本發(fā)明的第一實(shí)施例的對(duì)話控制用文件數(shù)據(jù)的一個(gè)實(shí)例的程序。
圖5是圖4所示的對(duì)話控制用文件數(shù)據(jù)的一個(gè)實(shí)例的后續(xù)部分的程序。
圖6是本發(fā)明的第一實(shí)施例的對(duì)話控制裝置的對(duì)話控制處理的流程圖。
圖7是本發(fā)明的第一實(shí)施例的畫(huà)面信息提供裝置的方框圖。
圖8是本發(fā)明的第二實(shí)施例的對(duì)話系統(tǒng)、連接在該對(duì)話系統(tǒng)上的語(yǔ)音終端和畫(huà)面終端的方框圖。
圖9是本發(fā)明的第二實(shí)施例的畫(huà)面信息提供裝置的方框圖。
圖10是本發(fā)明的第三實(shí)施例的對(duì)話系統(tǒng)、連接在該對(duì)話系統(tǒng)上的用戶(hù)終端的方框圖。
圖11是已有技術(shù)的對(duì)話系統(tǒng)、連接在該對(duì)話系統(tǒng)上的用戶(hù)終端的方框圖。
(第一實(shí)施例)首先,對(duì)本發(fā)明的第一實(shí)施例的對(duì)話系統(tǒng)進(jìn)行描述。圖1表示該第一實(shí)施例的對(duì)話系統(tǒng)、連接在該對(duì)話系統(tǒng)上的語(yǔ)音終端和畫(huà)面終端。
如圖1所示,在該第一實(shí)施例的語(yǔ)音識(shí)別對(duì)話系統(tǒng)中,語(yǔ)音終端2和語(yǔ)音信息提供裝置3連接在例如由電話線路等線路網(wǎng)構(gòu)成的公共線路交換網(wǎng)1上。畫(huà)面終端5、語(yǔ)音信息提供裝置3、語(yǔ)音對(duì)話用數(shù)據(jù)提供裝置6、對(duì)話控制裝置7以及畫(huà)面信息提供裝置8連接在互聯(lián)網(wǎng)等的寬帶網(wǎng)絡(luò)4上。
其中的語(yǔ)音終端2和畫(huà)面終端5是用戶(hù)側(cè)所持有并使用的終端,語(yǔ)音信息提供裝置3、語(yǔ)音對(duì)話用數(shù)據(jù)提供裝置6、對(duì)話控制裝置7以及畫(huà)面信息提供裝置8是設(shè)置在對(duì)話系統(tǒng)側(cè)的裝置。
語(yǔ)音終端2是例如便攜電話、PHS(Personal Handy phone System個(gè)人手機(jī)系統(tǒng))、PDA(Personal Digital Assistant個(gè)人數(shù)字助理)或個(gè)人計(jì)算機(jī)(PC)等具有語(yǔ)音輸入輸出裝置的通信終端。
該語(yǔ)音終端2中,可輸入作為用戶(hù)本身發(fā)出的語(yǔ)音的語(yǔ)音信號(hào)、多頻撥號(hào)音(Dial Tone Multi Frequency,DTMF),同時(shí)能夠經(jīng)公共線路交換網(wǎng)1輸入來(lái)自語(yǔ)音信息提供裝置3的語(yǔ)音信號(hào)。
語(yǔ)音終端2中,可輸出語(yǔ)音信號(hào),該語(yǔ)音信號(hào)經(jīng)公共線路交換網(wǎng)1供給語(yǔ)音信息提供裝置3??蓮脑撜Z(yǔ)音終端2向用戶(hù)輸出可聽(tīng)到的語(yǔ)音。
在這樣構(gòu)成的語(yǔ)音終端2中,在從用戶(hù)輸入語(yǔ)音或DTMF的情況下,語(yǔ)音終端2首先把這些語(yǔ)音或DTMF轉(zhuǎn)換為語(yǔ)音信號(hào),然后,經(jīng)公共線路交換網(wǎng)1把該語(yǔ)音信號(hào)發(fā)送到語(yǔ)音信息提供裝置3。另一方面,在語(yǔ)音終端2接收來(lái)自語(yǔ)音信息提供裝置3的語(yǔ)音信號(hào)的情況下,該語(yǔ)音終端2將所接收到的語(yǔ)音信號(hào)恢復(fù)為語(yǔ)音,從設(shè)置于語(yǔ)音終端2中的揚(yáng)聲器(圖中未示出)輸出。該語(yǔ)音終端2的用戶(hù)可聽(tīng)從該揚(yáng)聲器輸出的語(yǔ)音來(lái)識(shí)別語(yǔ)音信息。
用戶(hù)所持有并使用的畫(huà)面終端5由例如便攜電話、PHS、PDA或PC等通信終端構(gòu)成,該通信終端至少具有顯示GUI畫(huà)面的畫(huà)面顯示裝置和接受來(lái)自用戶(hù)的接觸輸入的接觸輸入裝置(在圖中均未示出)。在這里,所謂“接觸輸入”是指用戶(hù)用數(shù)字鍵、鍵盤(pán)、觸摸面板、指向器等輸入裝置直接接觸進(jìn)行的輸入,用硬件或軟件來(lái)實(shí)現(xiàn)。
在該畫(huà)面終端5中,用戶(hù)可通過(guò)接觸輸入來(lái)輸入文字等文本信息或指向信息,同時(shí)該畫(huà)面終端5可經(jīng)網(wǎng)絡(luò)4輸入從畫(huà)面信息提供裝置8發(fā)送的例如HTML文件等用于在畫(huà)面上進(jìn)行顯示的電子信息。
此外,在該畫(huà)面終端5中,可輸出通用資源標(biāo)識(shí)符(Universal ResourceIndicator,URI)、用戶(hù)通過(guò)接觸輸入來(lái)輸入的輸入信息以及識(shí)別畫(huà)面終端5的標(biāo)識(shí)符(用戶(hù)ID)。該URI、輸入信息和用戶(hù)ID通過(guò)網(wǎng)絡(luò)4供給畫(huà)面信息提供裝置8。該畫(huà)面終端5中,可輸出用戶(hù)能認(rèn)識(shí)的畫(huà)面信息。
在這樣構(gòu)成的畫(huà)面終端5中,在與畫(huà)面信息提供裝置8之間,進(jìn)行網(wǎng)上信息塊(Cookie)的對(duì)話期間管理。把用戶(hù)ID包含在網(wǎng)上信息塊中,畫(huà)面信息提供裝置8就能夠識(shí)別畫(huà)面終端5。
在用戶(hù)通過(guò)接觸輸入輸入了輸入信息和URI的情況下,畫(huà)面終端5將該輸入信息和URI變換為信號(hào),然后,通過(guò)網(wǎng)絡(luò)4將該信號(hào)發(fā)送到畫(huà)面信息提供裝置8。另一方面,在畫(huà)面終端5從該畫(huà)面信息提供裝置8接收到電子信息的情況下,該畫(huà)面終端5對(duì)所接收到的電子信息進(jìn)行分析處理,然后,作為圖象顯示在畫(huà)面上。語(yǔ)音終端2的用戶(hù)觀看顯示在畫(huà)面上的圖象,就能識(shí)別畫(huà)面中的圖象信息。
語(yǔ)音信息提供裝置3至少具有分析語(yǔ)音識(shí)別時(shí)所用的語(yǔ)言即“語(yǔ)音XML(語(yǔ)音XML)”的語(yǔ)音XML分析執(zhí)行裝置、語(yǔ)音識(shí)別裝置以及語(yǔ)音合成裝置。該語(yǔ)音XML分析執(zhí)行裝置、語(yǔ)音識(shí)別裝置以及語(yǔ)音合成裝置既可設(shè)置于同一計(jì)算機(jī)中,也可設(shè)置于不同的計(jì)算機(jī)中。
語(yǔ)音XML分析執(zhí)行裝置中,對(duì)每個(gè)連接的語(yǔ)音終端2生成并在與對(duì)話控制裝置7之間進(jìn)行網(wǎng)上信息塊的對(duì)話期間管理。把密碼(主叫人ID)包含在網(wǎng)上信息塊內(nèi),語(yǔ)音信息提供裝置3和對(duì)話控制裝置7就可相互對(duì)應(yīng)語(yǔ)音終端2的用戶(hù)。
具體來(lái)說(shuō),在語(yǔ)音XML分析執(zhí)行裝置中,首先對(duì)語(yǔ)音XML文件進(jìn)行分析處理。此時(shí),在所接收到的語(yǔ)音XML文件內(nèi)有進(jìn)行語(yǔ)音識(shí)別的記述的情況下,對(duì)語(yǔ)音識(shí)別裝置請(qǐng)求識(shí)別,并取得識(shí)別結(jié)果。把所取得的識(shí)別結(jié)果發(fā)送到對(duì)話控制裝置7。接著,從語(yǔ)音XML文件內(nèi)記述的識(shí)別語(yǔ)法的所在地取得識(shí)別語(yǔ)法。此時(shí),在所接收到的語(yǔ)音XML文件內(nèi)有進(jìn)行語(yǔ)音合成的記述的情況下,對(duì)語(yǔ)音合成裝置請(qǐng)求合成,并取得合成結(jié)果。然后,語(yǔ)音XML分析執(zhí)行裝置將所取得的合成結(jié)果變換為語(yǔ)音信號(hào),發(fā)送到語(yǔ)音終端2。在所接收到的語(yǔ)音XML文件內(nèi)有輸出語(yǔ)音引導(dǎo)用文件的記述的情況下,從所記述的所在地取得語(yǔ)音引導(dǎo)用文件。接著將所取得的語(yǔ)音引導(dǎo)用文件的內(nèi)容變換為語(yǔ)音信號(hào),發(fā)送到語(yǔ)音終端2。
在語(yǔ)音XML文件內(nèi)有取得語(yǔ)音XML文件的記述的情況下,在由URI指定的地方要求語(yǔ)音XML文件。
從對(duì)話控制裝置7接收中斷命令信號(hào)時(shí),按下述的順序進(jìn)行處理。中斷語(yǔ)音XML分析處理、語(yǔ)音識(shí)別以及語(yǔ)音信號(hào)的輸出。
向?qū)υ捒刂蒲b置7要求新的語(yǔ)音XML文件的URI。在此之前,在發(fā)送到語(yǔ)音信息提供裝置3的語(yǔ)音XML文件中指定該URI。
在語(yǔ)音識(shí)別裝置的處理中,首先,根據(jù)來(lái)自語(yǔ)音XML分析執(zhí)行裝置的請(qǐng)求,進(jìn)行語(yǔ)音識(shí)別處理,將識(shí)別結(jié)果返回到給語(yǔ)音XML分析執(zhí)行裝置。
另一方面,在語(yǔ)音合成裝置中,根據(jù)來(lái)自語(yǔ)音XML分析執(zhí)行裝置的請(qǐng)求,將文本信息變換為語(yǔ)音數(shù)據(jù),將變換結(jié)果返回到該語(yǔ)音XML分析執(zhí)行裝置。此時(shí),從語(yǔ)音對(duì)話用數(shù)據(jù)提供裝置6取得向語(yǔ)音數(shù)據(jù)變換所必要的語(yǔ)音合成用數(shù)據(jù)文件。
語(yǔ)音信息提供裝置3可輸入從上述語(yǔ)音終端2輸出的語(yǔ)音信號(hào)。即,語(yǔ)音信息提供裝置3可輸入用于識(shí)別從對(duì)話控制裝置7輸出的語(yǔ)音終端2的識(shí)別符(主叫人ID、密碼)和語(yǔ)音XML文件數(shù)據(jù),同時(shí)可輸入從語(yǔ)音對(duì)話用數(shù)據(jù)提供裝置6輸出的語(yǔ)音識(shí)別語(yǔ)法文件、語(yǔ)音引導(dǎo)用文件和語(yǔ)音合成用數(shù)據(jù)文件等電子信息。
語(yǔ)音信息提供裝置3可輸出語(yǔ)音信號(hào),如上所述,可通過(guò)公共線路交換網(wǎng)1把語(yǔ)音信號(hào)供給語(yǔ)音終端2。
語(yǔ)音信息提供裝置3可輸出語(yǔ)音XML文件的URI、密碼(主叫人ID)、語(yǔ)音識(shí)別結(jié)果(Rec Result)、語(yǔ)音識(shí)別語(yǔ)法文件的URI、語(yǔ)音引導(dǎo)用文件的URI以及語(yǔ)音合成用數(shù)據(jù)文件的請(qǐng)求。語(yǔ)音識(shí)別結(jié)果具有識(shí)別詞匯、識(shí)別詞匯的屬性、對(duì)應(yīng)于識(shí)別的可信度的多個(gè)識(shí)別結(jié)果候補(bǔ)(N-best)、可信度低于設(shè)定值的情況下的識(shí)別錯(cuò)誤(nomatch)以及輸入音量小于設(shè)定值的情況下的識(shí)別錯(cuò)誤(noinput)。
從語(yǔ)音信息提供裝置3輸出的信號(hào)中的語(yǔ)音XML文件的URI、密碼(主叫人ID)和語(yǔ)音識(shí)別結(jié)果(Rec Result)經(jīng)網(wǎng)絡(luò)4被發(fā)送到對(duì)話控制裝置7。
另一方面,從語(yǔ)音信息提供裝置3輸出的信號(hào)中的語(yǔ)音識(shí)別語(yǔ)法文件的URI、語(yǔ)音引導(dǎo)用文件的URI以及語(yǔ)音合成用數(shù)據(jù)文件的請(qǐng)求經(jīng)網(wǎng)絡(luò)4被送到語(yǔ)音對(duì)話用數(shù)據(jù)提供裝置6。
語(yǔ)音對(duì)話用數(shù)據(jù)提供裝置6具有可存儲(chǔ)數(shù)據(jù)的輔助記錄媒體(圖中未示出),在語(yǔ)音對(duì)話用數(shù)據(jù)提供裝置6的輔助記錄媒體上存儲(chǔ)有語(yǔ)音識(shí)別語(yǔ)法文件、語(yǔ)音引導(dǎo)用文件以及語(yǔ)音合成用數(shù)據(jù)文件。
語(yǔ)音對(duì)話用數(shù)據(jù)提供裝置6可應(yīng)答來(lái)自語(yǔ)音信息提供裝置3的請(qǐng)求,經(jīng)網(wǎng)絡(luò)4將這些文件提供給語(yǔ)音信息提供裝置3。該語(yǔ)音對(duì)話用數(shù)據(jù)提供裝置6既可由同一臺(tái)計(jì)算機(jī)構(gòu)成,也可由互不相同的計(jì)算機(jī)構(gòu)成。可以把該語(yǔ)音對(duì)話用數(shù)據(jù)提供裝置6包含在語(yǔ)音信息提供裝置3內(nèi),由同一臺(tái)計(jì)算機(jī)構(gòu)成。
對(duì)話控制裝置7用來(lái)在語(yǔ)音信息提供裝置3和畫(huà)面信息提供裝置8之間進(jìn)行同步控制,畫(huà)面信息提供裝置8至少具有Web服務(wù)器、應(yīng)用程序和數(shù)據(jù)庫(kù)。畫(huà)面信息提供裝置8中的Web服務(wù)器、應(yīng)用程序和數(shù)據(jù)庫(kù)等各個(gè)裝置可設(shè)置在同一個(gè)計(jì)算機(jī)中,也可設(shè)置在互不相同的計(jì)算機(jī)中。后面將詳細(xì)描述對(duì)話控制裝置7和畫(huà)面信息提供裝置8。
在語(yǔ)音信息提供裝置3、對(duì)話控制裝置7以及畫(huà)面信息提供裝置8相互之間用對(duì)話控制用文件數(shù)據(jù)實(shí)現(xiàn)同步。該對(duì)話控制用文件數(shù)據(jù)例如可像如下這樣使用。
具體來(lái)說(shuō),首先,用戶(hù)使用畫(huà)面終端5經(jīng)公共線路交換網(wǎng)1和網(wǎng)絡(luò)4連接到該第一實(shí)施例的對(duì)話系統(tǒng)上的情況下,接著就在對(duì)話系統(tǒng)和語(yǔ)音終端2之間確立連接。
即,在用戶(hù)對(duì)第一實(shí)施例的對(duì)話系統(tǒng)連接語(yǔ)音終端2之前,從畫(huà)面終端5開(kāi)始連接的情況下,首先從畫(huà)面信息提供裝置8向?qū)υ捒刂蒲b置7發(fā)送初始化語(yǔ)音信息提供裝置3的對(duì)話控制用文件數(shù)據(jù)。
接收到對(duì)話控制用文件數(shù)據(jù)的對(duì)話控制裝置7控制生成語(yǔ)音對(duì)話用的文件數(shù)據(jù)的語(yǔ)音對(duì)話用文件生成部24(圖中未示出)從對(duì)話控制用文件數(shù)據(jù)生成語(yǔ)音XML文件數(shù)據(jù)。在這里生成的語(yǔ)音XML文件數(shù)據(jù)被登記在特定的URI中。該登記地址的URI被記述在對(duì)話控制用文件數(shù)據(jù)內(nèi)。
在語(yǔ)音信息提供裝置3中,一旦有來(lái)自語(yǔ)音終端2的連接,就進(jìn)行設(shè)定,以請(qǐng)求該URI的語(yǔ)音XML文件數(shù)據(jù),一旦實(shí)現(xiàn)連接,就請(qǐng)求相應(yīng)的語(yǔ)音XML文件數(shù)據(jù)。
另一方面,在用戶(hù)從語(yǔ)音終端2與第一實(shí)施例的對(duì)話系統(tǒng)連接的情況下,就如下面那樣實(shí)現(xiàn)該對(duì)話系統(tǒng)與語(yǔ)音終端5之間的連接。
即,在用戶(hù)從語(yǔ)音終端2連接之前,準(zhǔn)備初始連接用的語(yǔ)音XML文件數(shù)據(jù)(初始連接用語(yǔ)音XML文件數(shù)據(jù))。該初始連接用語(yǔ)音XML文件數(shù)據(jù)被存儲(chǔ)在語(yǔ)音信息提供裝置3、對(duì)話控制裝置7或不同于它們的裝置中。初始連接用語(yǔ)音XML文件數(shù)據(jù)也可以根據(jù)發(fā)話方號(hào)碼或撥入號(hào)碼來(lái)準(zhǔn)備。
一旦有來(lái)自語(yǔ)音終端2的連接,語(yǔ)音信息提供裝置3就分析執(zhí)行初始連接用語(yǔ)音XML文件數(shù)據(jù)。然后從語(yǔ)音信息提供裝置3把分析執(zhí)行初始連接用語(yǔ)音XML文件數(shù)據(jù)而輸出的語(yǔ)音識(shí)別結(jié)果發(fā)送到對(duì)話控制裝置7。
向?qū)υ捒刂蒲b置7要求下次應(yīng)處理的語(yǔ)音XML文件的URI。一旦接收到語(yǔ)音識(shí)別結(jié)果,該對(duì)話控制裝置7就根據(jù)對(duì)話控制用文件的內(nèi)容進(jìn)行處理,并把處理結(jié)果發(fā)送到畫(huà)面信息提供裝置8。對(duì)話控制裝置7對(duì)語(yǔ)音信息提供裝置3,將相應(yīng)的語(yǔ)音XML文件數(shù)據(jù)發(fā)送到所要求的URI。
在用戶(hù)從畫(huà)面終端5對(duì)該對(duì)話系統(tǒng)進(jìn)行輸入的情況下,按如下方式進(jìn)行對(duì)話的同步。
即,使對(duì)話系統(tǒng)處于還可接收來(lái)自畫(huà)面終端5和語(yǔ)音終端2中的任何一方輸入的狀態(tài)。在該狀態(tài)下,在從畫(huà)面終端5輸入的情況下,從畫(huà)面信息提供裝置8向?qū)υ捒刂蒲b置7發(fā)送對(duì)話控制用文件數(shù)據(jù)。在該對(duì)話控制裝置7中,由語(yǔ)音對(duì)話用文件生成部24從對(duì)話控制用文件數(shù)據(jù)生成語(yǔ)音XML文件,并把中斷命令信號(hào)發(fā)送到語(yǔ)音信息提供裝置3。
一旦接收到中斷命令信號(hào),語(yǔ)音信息提供裝置3就中斷語(yǔ)音XML分析執(zhí)行、語(yǔ)音識(shí)別和語(yǔ)音輸出。同時(shí),語(yǔ)音信息提供裝置3向?qū)υ捒刂蒲b置7要求新的語(yǔ)音XML文件的URI。接收到要求的對(duì)話控制裝置7針對(duì)該要求發(fā)送所生成的語(yǔ)音XML文件數(shù)據(jù)。
在用戶(hù)從語(yǔ)音終端2對(duì)該對(duì)話系統(tǒng)進(jìn)行輸入的情況下,按如下方式來(lái)變更畫(huà)面顯示。
即,使對(duì)話系統(tǒng)的狀態(tài)處于還可接收來(lái)自畫(huà)面終端5和語(yǔ)音終端2中的任何一方的輸入的狀態(tài)下,在該狀態(tài)下,如果有從語(yǔ)音終端2向語(yǔ)音信息提供裝置3進(jìn)行語(yǔ)音信息的輸入,就從語(yǔ)音信息提供裝置3向?qū)υ捒刂蒲b置7發(fā)送語(yǔ)音識(shí)別結(jié)果。
在對(duì)話控制裝置7中,根據(jù)對(duì)話控制用文件數(shù)據(jù)處理語(yǔ)音識(shí)別結(jié)果,并將該處理結(jié)果發(fā)送到畫(huà)面信息提供裝置8。
在畫(huà)面信息提供裝置8中,根據(jù)所接收到的處理結(jié)果切換畫(huà)面的顯示內(nèi)容。
這里,來(lái)說(shuō)明對(duì)話控制裝置7。圖2表示該第一實(shí)施例的對(duì)話控制裝置7的各部分。
如圖2所示,在該第一實(shí)施例的對(duì)話控制裝置7中,具有語(yǔ)音現(xiàn)場(chǎng)通信部21、應(yīng)用現(xiàn)場(chǎng)通信部22、用戶(hù)狀態(tài)管理部23、語(yǔ)音對(duì)話用文件生成部24和對(duì)話控制用文件分析部25。
語(yǔ)音現(xiàn)場(chǎng)通信部21可從語(yǔ)音信息提供裝置3輸入語(yǔ)音XML文件的URI、密碼(主叫人ID)以及語(yǔ)音識(shí)別結(jié)果,同時(shí)輸出密碼(主叫人ID)、語(yǔ)音XML文件數(shù)據(jù)以及語(yǔ)音處理的中斷命令信號(hào),供給語(yǔ)音信息提供裝置3。
語(yǔ)音現(xiàn)場(chǎng)通信部21可輸入從語(yǔ)音對(duì)話用文件生成部24輸出的密碼(主叫人ID)和語(yǔ)音XML文件數(shù)據(jù)。另外,語(yǔ)音現(xiàn)場(chǎng)通信部21可輸入從對(duì)話控制用文件分析部25輸出的密碼(主叫人ID)和語(yǔ)音處理的中斷命令信號(hào)的信號(hào),同時(shí)語(yǔ)音現(xiàn)場(chǎng)通信部21可輸入密碼(主叫人ID)和語(yǔ)音識(shí)別結(jié)果,供給對(duì)話控制用文件分析部25。
這樣構(gòu)成的語(yǔ)音現(xiàn)場(chǎng)通信部21在與語(yǔ)音信息提供裝置3之間進(jìn)行按網(wǎng)上信息塊的對(duì)話期間管理。這里,網(wǎng)上信息塊中包含有密碼(主叫人ID),用網(wǎng)上信息塊,語(yǔ)音信息提供裝置3和對(duì)話控制裝置7就可相互對(duì)應(yīng)語(yǔ)音終端2的用戶(hù)。
在語(yǔ)音現(xiàn)場(chǎng)通信部21從語(yǔ)音信息提供裝置3接收到密碼(主叫人ID),以及語(yǔ)音XML文件的URI的情況下,如果該接收內(nèi)容中不包括網(wǎng)上信息塊,就生成新的網(wǎng)上信息塊。并且,語(yǔ)音現(xiàn)場(chǎng)通信部21將位于被要求的URI的語(yǔ)音XML文件數(shù)據(jù)與密碼(主叫人ID)一起發(fā)送到語(yǔ)音信息提供裝置3。
另一方面,在語(yǔ)音現(xiàn)場(chǎng)通信部21從語(yǔ)音信息提供裝置3接收到密碼(主叫人ID)以及語(yǔ)音識(shí)別結(jié)果的情況下,語(yǔ)音現(xiàn)場(chǎng)通信部21就把密碼(主叫人ID)和語(yǔ)音識(shí)別結(jié)果發(fā)送到對(duì)話控制用文件分析部25。在對(duì)話控制用文件分析部25把密碼(主叫人ID)和中斷命令信號(hào)供給語(yǔ)音現(xiàn)場(chǎng)通信部21,的情況下,將所供給的密碼(主叫人ID)和中斷命令信號(hào)發(fā)送到語(yǔ)音信息提供裝置3。
應(yīng)用現(xiàn)場(chǎng)通信部22可從畫(huà)面信息提供裝置8輸入對(duì)話控制用文件數(shù)據(jù)、指定畫(huà)面終端5的用戶(hù)的識(shí)別符(用戶(hù)ID)、畫(huà)面信息提供裝置8的處理結(jié)果(應(yīng)用結(jié)果),同時(shí)應(yīng)用現(xiàn)場(chǎng)通信部22可從對(duì)話控制用文件分析部25輸入用戶(hù)ID、URI以及通過(guò)語(yǔ)音對(duì)話取得的參數(shù)值(對(duì)話結(jié)果)。這里,處理結(jié)果(應(yīng)用結(jié)果)中可包含用戶(hù)從畫(huà)面終端5輸入的結(jié)果、畫(huà)面信息提供裝置8的處理結(jié)果和數(shù)據(jù)庫(kù)的檢索結(jié)果。
應(yīng)用現(xiàn)場(chǎng)通信部22可通過(guò)網(wǎng)絡(luò)4向畫(huà)面信息提供裝置8供給用戶(hù)ID、URI和參數(shù)值(對(duì)話結(jié)果),同時(shí)可向?qū)υ捒刂朴梦募治霾?5供給對(duì)話控制用文件數(shù)據(jù)、用戶(hù)ID以及處理結(jié)果(應(yīng)用結(jié)果)。
應(yīng)用現(xiàn)場(chǎng)通信部22在從畫(huà)面信息提供裝置8接收到用戶(hù)ID、對(duì)話控制用文件數(shù)據(jù)和處理結(jié)果(應(yīng)用結(jié)果)中的兩種信息的情況下,把這兩種信息發(fā)送到對(duì)話控制用文件分析部25。
設(shè)備側(cè)通信部22在從對(duì)話控制用文件分析部25接收到用戶(hù)ID、URI和參數(shù)值(對(duì)話結(jié)果)的情況下,就把這些信息數(shù)據(jù)發(fā)送到畫(huà)面信息提供裝置8。
用戶(hù)狀態(tài)管理部23可從對(duì)話控制用文件分析部25輸入密碼(主叫人ID)和用戶(hù)ID,同時(shí)可把密碼(主叫人ID)和用戶(hù)ID供給對(duì)話控制用文件分析部25。即,用戶(hù)狀態(tài)管理部23和對(duì)話控制用文件分析部25可相互輸入輸出密碼(主叫人ID)和用戶(hù)ID。在對(duì)話控制裝置7中,該密碼(主叫人ID)和用戶(hù)ID用作使語(yǔ)音終端2的用戶(hù)與畫(huà)面終端5的用戶(hù)相對(duì)應(yīng)用的用戶(hù)識(shí)別符。
用戶(hù)狀態(tài)管理部23用一組作為記錄的表來(lái)管理這些密碼(主叫人ID)和用戶(hù)ID。
對(duì)話控制用文件分析部25以密碼(主叫人ID)或用戶(hù)ID為關(guān)鍵詞進(jìn)行檢索。用戶(hù)狀態(tài)管理部23把對(duì)應(yīng)的識(shí)別符作為檢索結(jié)果供給對(duì)話控制用文件分析部25。
語(yǔ)音對(duì)話用文件生成部24可從對(duì)話控制用文件分析部25輸入密碼(主叫人ID)、對(duì)話控制用文件的用一組標(biāo)記(<dialog>和</dialog>)圍起來(lái)的部分(<dialog>部),同時(shí)可把密碼(主叫人ID)、語(yǔ)音XML文件數(shù)據(jù)供給語(yǔ)音現(xiàn)場(chǎng)通信部21。
語(yǔ)音對(duì)話用文件生成部24在輸入<dialog>部時(shí),首先,將該<dialog>部的內(nèi)容代入到語(yǔ)音XML模板中,生成語(yǔ)音XML文件數(shù)據(jù)。依照對(duì)話的形式準(zhǔn)備任意數(shù)的語(yǔ)音XML模板26。并且,將在語(yǔ)音對(duì)話用文件生成部24中所生成的語(yǔ)音XML文件與密碼(主叫人ID)一起發(fā)送到語(yǔ)音現(xiàn)場(chǎng)通信部21。
這里,下面來(lái)說(shuō)明在語(yǔ)音對(duì)話用文件生成部24中所準(zhǔn)備的語(yǔ)音XML模板的一個(gè)實(shí)例。
即,用于輸出語(yǔ)音引導(dǎo)的語(yǔ)音XML模板的行文結(jié)構(gòu)可以表示為<pre listing-type="program-listing"> ?。糳ialog template=″T001″) <prompt>*語(yǔ)音引導(dǎo)文字串*</prompt> ?。?dialog><!-- SIPO <DP n="15"> --><dp n="d15"/> 或 ?。糳ialog template=″T001″> ?。紁rompt expr=″*評(píng)價(jià)式*″/> ?。糳ialog></pre>輸出語(yǔ)音引導(dǎo),按照任意指定的語(yǔ)法進(jìn)行語(yǔ)音識(shí)別用的語(yǔ)音XML模板的行文結(jié)構(gòu)可以表示為<pre listing-type="program-listing"><dialog template=″T003″> ?。糹nit> ?。紁rompt>*初始語(yǔ)音引導(dǎo)文字串*</prompt> </init> ?。紀(jì)nNomatch retry=″*true或false*″count=″*錯(cuò)誤反復(fù)次數(shù)<br/>*″> <prompt>*nomatch時(shí)輸出的語(yǔ)音引導(dǎo)文字串*</prompt> ?。?onNomatch> ?。紀(jì)nNoinput retry=″*true或false*″count=″*錯(cuò)誤反復(fù)次數(shù)*″> <prompt>*noinput時(shí)輸出的語(yǔ)音引導(dǎo)文字串*</prompt> ?。?onNoinput> <grammar URI=″*語(yǔ)法文件URI*″slot=″*存儲(chǔ)槽識(shí)別符*″> ?。紃esult namelist=″*識(shí)別狀態(tài)存儲(chǔ)變量* *識(shí)別詞匯存儲(chǔ)變量*″/> ?。?dialog></pre>在上述的行文結(jié)構(gòu)實(shí)例中,把用“*”號(hào)圍住的部分代入到語(yǔ)音XML模板中,來(lái)生成語(yǔ)音XML文件。
下面舉例說(shuō)明從對(duì)話控制用文件數(shù)據(jù)的<dialog>部,生成語(yǔ)音XML文件的情況。作為一個(gè)實(shí)例,考慮如下的<dialog>部。
<pre listing-type="program-listing"> ?。糳ialog template=″T003″> <init> ?。紁rompt>請(qǐng)說(shuō)乘車(chē)站</prompt> ?。?init> <o(jì)nNomatch retry=″true″count=″1″><!-- SIPO <DP n="16"> --><dp n="d16"/> ?。紁rompt>請(qǐng)?jiān)僬f(shuō)一次乘車(chē)站</prompt> ?。?onNomatch> <o(jì)nNoinput retry=″true″count=″2″> ?。紁rompt>沒(méi)聽(tīng)見(jiàn)。請(qǐng)像東京那樣說(shuō)乘車(chē)站</prompt> ?。?onNoinput> ?。糶rammar URI=″http//grammarServer/station.grammar″slot=″station″> ?。紃esult namelist=″recStatus departure″/> ?。?dialog></pre>下面依次說(shuō)明上述的行文結(jié)構(gòu)實(shí)例中<dialog>部的各標(biāo)記的含義。即,首先,<dialog>部的屬性template的值(T003)表示模板的識(shí)別符,語(yǔ)音對(duì)話用文件生成部24從template的值檢索相應(yīng)的語(yǔ)音XML模板,再將<dialog>部的內(nèi)容代入到該模板中。
在由<init>與</init>圍起來(lái)的部分中記述用來(lái)輸出該<dialog>部分的初始引導(dǎo)的一組<prompt>和</prompt>,在該組<prompt>和</prompt>圍起來(lái)的部分內(nèi)記述語(yǔ)音引導(dǎo)句。這里,輸出稱(chēng)為“請(qǐng)說(shuō)乘車(chē)站”的語(yǔ)音引導(dǎo)。
也可在<prompt>和</prompt>圍起來(lái)的部分中使用放置在網(wǎng)絡(luò)4上的服務(wù)器中的比如Wav文件MP3文件等的語(yǔ)音文件。在此情況下,在<prompt>和</prompt>之間,就記述比如<audio src=http//audioServer/audioFileName.wav/>。
在</onNomatch>中,記述取得nomatch的情況下的處理,作為語(yǔ)音識(shí)別結(jié)果。在屬性retry的值為true的情況下,輸出<prompt>和</prompt>圍起來(lái)的句子作為語(yǔ)音引導(dǎo)。
count是對(duì)取得了nomatch的次數(shù)的屬性,輸出指定的語(yǔ)音引導(dǎo),直到nomatch的次數(shù)達(dá)到count的值為止,對(duì)每個(gè)密碼(主叫人ID)管理nomatch的次數(shù)。
在</onNoinput>中,記述取得noinput的情況的處理,作為語(yǔ)音識(shí)別結(jié)果。另外,屬性retry、count、<prompt>的處理與</onNomatch>的情況相同。
在<grammer>中,指定語(yǔ)音識(shí)別語(yǔ)法的URI,在<result>中,代入語(yǔ)音識(shí)別結(jié)果。
在recStatus中,代入識(shí)別成功與否。在識(shí)別成功的情況下,輸入“ok”;在識(shí)別失敗而構(gòu)成識(shí)別錯(cuò)誤的情況下,輸入nomatch或noinput。在departure中,輸入在recStatus為“ok”的情況下已識(shí)別的詞匯。這里,輸入乘車(chē)站的名稱(chēng)。
根據(jù)上述<dialog>部來(lái)生成如下的語(yǔ)音XML文件。
<pre listing-type="program-listing"> ?。迹縓ML version=″1.0″e(cuò)ncoding=″Shift_JIS″?> ?。?!DOCTYPE vXML PUBLIC’-//DTD VoiceXML 1.0b//EN’’http//dtd/????/vXML.dtd’> ?。紇XML version=″1.0″> <var name=″nomatch_count″e(cuò)xpr=″1″/> ?。紇ar name=″noinput_count″e(cuò)xpr=″1″/> <form> ?。糵ield name=″station″> ?。紁rompt>請(qǐng)說(shuō)乘車(chē)站</prompt> ?。糶rammer src=″http//grammarServer/station.grammar#station″> ?。糲atch event=″nomatch″> <if cond=″nomatch_count==1″> ?。紁rompt>請(qǐng)?jiān)僬f(shuō)一次乘車(chē)站</prompt>?。糴lse if cond=″nomatch_count==2″> <goto next=″http//vXMLServer/departuretureErr.vXML″/> ?。?if> ?。糰ssign name=″nomatch_count″e(cuò)xpr=″nomatch_count+1″/> ?。?catch> ?。糲atch event=″noinput″> <if cond=″noinput_count==1″> ?。紁rompt>沒(méi)聽(tīng)見(jiàn)。</prompt> ?。紁rompt>請(qǐng)像東京那樣說(shuō)乘車(chē)站</prompt> <else if cond=″noinput_count==2″><!-- SIPO <DP n="18"> --><dp n="d18"/> ?。紁rompt>沒(méi)聽(tīng)見(jiàn)。</prompt> ?。紁rompt>請(qǐng)像東京那樣說(shuō)乘車(chē)站</prompt> <else if cond=″noinput__count==3″> ?。糶oto next=″http//vXMLServer/departuretureErr.vXML″/> ?。?if> ?。糰ssign name=″noinput_count″e(cuò)xpr=″noinput_count+1″/> </catch> ?。糵illed> ?。約ubmit next=http//vXMLServer/departuretureConf.vXMLnamelist=″station″/> ?。?filled> </form></pre>對(duì)話控制用文件分析部25可從語(yǔ)音現(xiàn)場(chǎng)通信部21輸入密碼(主叫人ID)和語(yǔ)音識(shí)別結(jié)果,同時(shí)可從應(yīng)用現(xiàn)場(chǎng)通信部22輸入對(duì)話控制用文件數(shù)據(jù)、用戶(hù)ID和處理結(jié)果(應(yīng)用結(jié)果),還可從用戶(hù)狀態(tài)管理部23輸入密碼(主叫人ID)和用戶(hù)ID。
對(duì)話控制用文件分析部25可將密碼(主叫人ID)和語(yǔ)音處理的中斷命令信號(hào)供給語(yǔ)音現(xiàn)場(chǎng)通信部21,將用戶(hù)ID、URI和參數(shù)值(對(duì)話結(jié)果)供給應(yīng)用現(xiàn)場(chǎng)通信部22,將密碼(主叫人ID)和用戶(hù)ID供給用戶(hù)狀態(tài)管理部23,將密碼(主叫人ID)以及對(duì)話控制用文件中的<dialog>與</dialog>圍起來(lái)的部分(<dialog>部)供給語(yǔ)音對(duì)話用文件生成部24。
以下來(lái)說(shuō)明從應(yīng)用現(xiàn)場(chǎng)通信部22向上述對(duì)話控制用文件分析部25供給對(duì)話控制用文件數(shù)據(jù)和用戶(hù)ID的情況下的處理。
即,對(duì)話控制用文件分析部25首先根據(jù)用戶(hù)ID對(duì)用戶(hù)狀態(tài)管理部23進(jìn)行檢索,由此來(lái)取得對(duì)應(yīng)的密碼(主叫人ID)。此時(shí),不存在用戶(hù)狀態(tài)管理部23中檢索的用戶(hù)ID的情況下,判定為是來(lái)自畫(huà)面終端5的新連接。
下面以新連接的情況下的用戶(hù)ID和密碼(主叫人ID)的對(duì)應(yīng)例作為3個(gè)實(shí)例,進(jìn)行說(shuō)明。
首先,說(shuō)明新連接在第一實(shí)施例的對(duì)話系統(tǒng)的情況下的第一方法。該第一方法是用戶(hù)先于語(yǔ)音終端2把畫(huà)面終端5連接到對(duì)話系統(tǒng)上的情況下的方法。
即,首先,用戶(hù)從畫(huà)面終端5輸入用戶(hù)識(shí)別符。作為該用戶(hù)識(shí)別符,可使用比如電話號(hào)碼、用戶(hù)任意制作的數(shù)字串、文字串或符號(hào)串或它們的混合形式、對(duì)話系統(tǒng)的運(yùn)營(yíng)側(cè)指定的數(shù)字串、文字串或符號(hào)串或它們的混合形式等,最好不要與其它的用戶(hù)重復(fù)。
用戶(hù)使用語(yǔ)音終端2來(lái)輸入同一個(gè)用戶(hù)識(shí)別符。在此情況下,也可把使用戶(hù)識(shí)別符作成發(fā)話者的電話號(hào)碼,也可以由此節(jié)省用戶(hù)輸入的時(shí)間。
通過(guò)該用戶(hù)的用戶(hù)識(shí)別符的輸入,從語(yǔ)音信息提供裝置3輸入用戶(hù)識(shí)別符,作為語(yǔ)音識(shí)別結(jié)果,另一方面,從畫(huà)面信息提供裝置8輸入用戶(hù)識(shí)別符,作為對(duì)話控制用文件數(shù)據(jù)或處理結(jié)果(應(yīng)用結(jié)果)。由此,就能夠使具有同一用戶(hù)識(shí)別符的密碼(主叫人ID)和用戶(hù)ID相對(duì)應(yīng)。
下面來(lái)說(shuō)明新連接到該第一實(shí)施例的對(duì)話系統(tǒng)的情況下的第二方法。
即,在該第二方法中,首先,用戶(hù)從語(yǔ)音終端2與對(duì)話系統(tǒng)連接時(shí),該對(duì)話系統(tǒng)自動(dòng)生成任意的密碼(主叫人ID),并經(jīng)語(yǔ)音終端2使用戶(hù)得知。
接著,如果用戶(hù)從畫(huà)面終端5與對(duì)話系統(tǒng)連接,用戶(hù)就先從畫(huà)面終端5輸入經(jīng)語(yǔ)音終端2取得的密碼,作為用戶(hù)ID。由于該方法的此后的步驟與第一方法相同,故省略其說(shuō)明。在該第二方法中,先連接語(yǔ)音終端5后連接語(yǔ)音終端2的情況下也可同樣進(jìn)行處理。
在該第二方法中提供的密碼是對(duì)話系統(tǒng)給予用戶(hù)的密碼,與第一方法那樣作成為電話號(hào)碼等的情況相比較,由于該密碼僅僅正在使用的用戶(hù)知道,所以能夠防止不具有權(quán)限的用戶(hù)完全變?yōu)榫哂袡?quán)限的他人而使用。因此,可提高保密性。
下面來(lái)說(shuō)明新連接到按照第一實(shí)施例的對(duì)話系統(tǒng)的情況下的第三方法,圖3表示有關(guān)按照第三方法新連接時(shí)的語(yǔ)音終端2和畫(huà)面終端5的對(duì)應(yīng)情況的簡(jiǎn)況。
如圖3所示,在便攜電話等的情況下,該第三方法是根據(jù)實(shí)施通信的基站是哪個(gè)基站的信息,利用可指定用戶(hù)的位置的原理,來(lái)使語(yǔ)音終端2和畫(huà)面終端5相對(duì)應(yīng)。
即,在該第三方法中,首先,如果用戶(hù)使用語(yǔ)音終端2與對(duì)話系統(tǒng)連接,對(duì)話系統(tǒng)就進(jìn)行語(yǔ)音終端2正在進(jìn)行通信的基站1a的檢索。
然后,如果用戶(hù)從畫(huà)面終端5與對(duì)話系統(tǒng)連接,則在某時(shí)刻,連接在同一基站1a上的語(yǔ)音終端2是一個(gè),另外,像這樣,限于語(yǔ)音終端2和畫(huà)面終端5同時(shí)連接在對(duì)話系統(tǒng)上的情況,能夠直接地專(zhuān)門(mén)把語(yǔ)音終端2和畫(huà)面終端5對(duì)應(yīng)起來(lái)。
因?yàn)榇藸顟B(tài)僅僅在對(duì)話系統(tǒng)側(cè)存在信息,所以像第一或第二方法那樣可以節(jié)省輸入信息的時(shí)間,可更加簡(jiǎn)單地,使語(yǔ)音終端2和畫(huà)面終端5相對(duì)應(yīng)。在此情況下,也可利用全球定位系統(tǒng)(GPS)實(shí)現(xiàn)同樣的對(duì)應(yīng)。
下面來(lái)說(shuō)明對(duì)話控制文件數(shù)據(jù)。該第一實(shí)施例的對(duì)話控制文件數(shù)據(jù)是XML文件,對(duì)話控制用文件分析部25用XML服務(wù)器分析執(zhí)行該XML文件的內(nèi)容。
這里,圖4和圖5表示由該對(duì)話控制用文件分析部25進(jìn)行處理時(shí)所采用的對(duì)話控制用文件數(shù)據(jù)的一個(gè)實(shí)例。在圖4和圖5中,左側(cè)的數(shù)字表示行號(hào)。
下面用圖4和圖5的對(duì)話控制用文件數(shù)據(jù)來(lái)說(shuō)明在對(duì)話控制用文件分析部25中進(jìn)行的處理。圖4和圖5所示的對(duì)話控制用文件數(shù)據(jù)是用于從用戶(hù)取得列車(chē)的乘車(chē)站的對(duì)話控制用文件。該對(duì)話控制用文件可以用于比如列車(chē)的車(chē)票預(yù)約或購(gòu)買(mǎi)、時(shí)刻表檢索或經(jīng)過(guò)線路檢索等。文字串“<!— —”與文字串“— —)”圍起來(lái)的部分是“注釋″。
首先,該對(duì)話控制用文件數(shù)據(jù)的第1行是該對(duì)話控制用文件符合XML版本1.0的文件,用移位JIS碼記述。第2行的<對(duì)話控制用文件>是表示該文件是對(duì)話控制用文件的標(biāo)記。
對(duì)話控制用文件由1個(gè)主程序和任意個(gè)數(shù)的子程序構(gòu)成。
即,第4行~第10行進(jìn)行在主程序和子程序中共同使用的變量說(shuō)明,<declare>是表示變量說(shuō)明的標(biāo)記,“name”是變量名稱(chēng),“type”是變量類(lèi)型,“init”是表示變量的初始值的屬性。
第12行~第84行是主程序,第86行~第108行是子程序。主程序使用<main>標(biāo)記表示其范圍,而子程序使用<sub>標(biāo)記表示其范圍。
主程序中的第22行~第36行是用來(lái)取得乘車(chē)站的處理。即,第24行的<dialog>標(biāo)記表示Template ID采用T003的語(yǔ)音XML模板。在<dialog>部中,記述有應(yīng)代入語(yǔ)音XML模板的變量。
對(duì)話控制用文件分析部25在確認(rèn)對(duì)話控制用文件存在<dialog>部時(shí),將該部分的信息數(shù)據(jù)供給語(yǔ)音對(duì)話用文件生成部24。在輸入了該信息數(shù)據(jù)的語(yǔ)音對(duì)話用文件生成部24中,分析<dialog>部的內(nèi)容,將分析結(jié)果代入所指定的語(yǔ)音XML模板內(nèi)。
接著,如圖2所示,對(duì)話控制用文件分析部25將密碼(主叫人ID)和<dialog>部供給語(yǔ)音對(duì)話用文件生成部24,然后,將密碼(主叫人ID)和用戶(hù)ID供給用戶(hù)狀態(tài)管理部23。
對(duì)話控制用文件分析部25處于等待來(lái)自語(yǔ)音現(xiàn)場(chǎng)通信部21或應(yīng)用現(xiàn)場(chǎng)通信部22的信息的待機(jī)狀態(tài)。在該待機(jī)狀態(tài)下,從應(yīng)用現(xiàn)場(chǎng)通信部22取得新的對(duì)話控制用文件數(shù)據(jù)的情況下,開(kāi)始分析該對(duì)話控制用文件數(shù)據(jù),同時(shí)向語(yǔ)音現(xiàn)場(chǎng)通信部21發(fā)送中斷命令信號(hào)。下面,在后面將要描述的語(yǔ)音對(duì)話用文件生成部24中說(shuō)明該處理的<dialog>部的內(nèi)容。
圖4和圖5所示的對(duì)話控制用文件數(shù)據(jù)的第39行~第68行是進(jìn)行語(yǔ)音識(shí)別成功的情況下的處理的部分。
即,在<if>標(biāo)記中,把評(píng)價(jià)式記述為cond的值。在該評(píng)價(jià)式的值為真實(shí)的情況下,執(zhí)行<if>與</if>圍起來(lái)的部分。這里,在recStatus是ok的情況下,進(jìn)行語(yǔ)音識(shí)別了的內(nèi)容(比如,乘車(chē)站)的重復(fù)確認(rèn)。
在第44行的<prompt>中,把評(píng)價(jià)式記述為expr的值。在評(píng)價(jià)式中,存在(’+’)等的四則運(yùn)算符或邏輯運(yùn)算符的情況下,進(jìn)行按照該運(yùn)算符的運(yùn)算。這里,具體來(lái)說(shuō),在把“京都”作為語(yǔ)音識(shí)別結(jié)果代入departure的情況下,就成為“乘車(chē)站是京都合適嗎?”。
此外,在第49行的<result>中,代入重復(fù)確認(rèn)的語(yǔ)音識(shí)別結(jié)果,在recStatus中,如果識(shí)別成功,則輸入“ok″,如果有識(shí)別錯(cuò)誤,則輸入“nomatch”,或“noinput”。在confirmResult中,如果用戶(hù)肯定確認(rèn),則輸入“yes”,如果否定,則輸入“no”。
在確認(rèn)成功的情況下,即,如果recStatus為“ok”,則象圖4中的第55行所示的那樣,調(diào)出子程序的departureConfirmResult。另一方面,在確認(rèn)失敗的情況下,即,如果recStatus為“nomatch”或“noinput”,則用第62行的<callService>,在畫(huà)面終端5中進(jìn)行確認(rèn)。
<callService>是用于在網(wǎng)絡(luò)上的服務(wù)器中進(jìn)行處理用的標(biāo)記。服務(wù)器的應(yīng)用程序用URI指定。另外,namelist的值是傳遞到服務(wù)器中的參數(shù)值(對(duì)話結(jié)果),var的值是將服務(wù)器的處理結(jié)果(應(yīng)用結(jié)果)作為返回值存儲(chǔ)的變量。
在服務(wù)器中,根據(jù)URI和參數(shù)值(對(duì)話結(jié)果)執(zhí)行對(duì)應(yīng)的應(yīng)用程序,將返回值返回到對(duì)話控制裝置7。
如果執(zhí)行<callService>,對(duì)話控制用文件分析部25就成為待機(jī)狀態(tài),直至接收到返回值。這樣使用<callService>,就能夠切換利用語(yǔ)音對(duì)話和畫(huà)面顯示。
在第71行~第80行記述有在乘車(chē)站的識(shí)別發(fā)生錯(cuò)誤的情況下用來(lái)從畫(huà)面終端5取得乘車(chē)站的處理。
第74行的<callService>的使用形式不同于第62行的<callService>。即,是為同時(shí)并行對(duì)語(yǔ)音對(duì)話和畫(huà)面顯示而使用的<callService>。
服務(wù)器中作為namelist接收到departureErr時(shí),馬上向?qū)υ捒刂蒲b置7返回應(yīng)答的方式進(jìn)行設(shè)定,同時(shí)在畫(huà)面終端5中顯示乘車(chē)站的選擇畫(huà)面。
在對(duì)話控制用文件分析部25中,由于通過(guò)應(yīng)用現(xiàn)場(chǎng)通信部22立即有從服務(wù)器的應(yīng)答,故可執(zhí)行第76行的語(yǔ)音引導(dǎo)“請(qǐng)從畫(huà)面輸入乘車(chē)站”的處理。這樣,在對(duì)話控制用文件分析部25中,使用<callService>就能夠同時(shí)利用語(yǔ)音對(duì)話和畫(huà)面顯示。
從第86行~第108行記述有依據(jù)對(duì)話控制用文件分析部25的乘車(chē)站的確認(rèn)結(jié)果分支的子程序。
即,如第90行所示,在肯定確認(rèn)的情況下,即,在confirmResult為“yes”的情況下,取得用來(lái)語(yǔ)音識(shí)別下車(chē)站的對(duì)話控制用文件數(shù)據(jù)。
為了取得新的對(duì)話控制用文件數(shù)據(jù),如第93行所示,使用<goto>。即,對(duì)話控制用文件分析部25向服務(wù)器要求由該<goto>表示的URI,并從該服務(wù)器返回相應(yīng)的對(duì)話控制用文件數(shù)據(jù)。這樣使用<goto>就能夠轉(zhuǎn)移對(duì)話。
下面說(shuō)明從應(yīng)用現(xiàn)場(chǎng)通信部22向?qū)υ捒刂朴梦募治霾?5輸入處理結(jié)果(應(yīng)用結(jié)果)的情況的處理。
即,處理結(jié)果(應(yīng)用結(jié)果)作為<callService>的返回值,與用戶(hù)ID一起被送到對(duì)話控制用文件分析部25。在該對(duì)話控制用文件分析部25中,從相應(yīng)的對(duì)話控制用文件數(shù)據(jù)<callService>之后的處理開(kāi)始,進(jìn)行分析。
這里,如圖2所示,來(lái)說(shuō)明從語(yǔ)音現(xiàn)場(chǎng)通信部21輸入密碼(主叫人ID)和語(yǔ)音識(shí)別結(jié)果(Rec Result)的情況的處理。
即,該對(duì)話控制用文件分析部25在輸入密碼(主叫人ID)時(shí),根據(jù)密碼(主叫人ID)對(duì)用戶(hù)狀態(tài)管理部23進(jìn)行檢索。在檢索到檢索對(duì)象的密碼(主叫人ID)的情況下,判定為來(lái)自連接中的語(yǔ)音終端2的輸入。
在圖5所示的對(duì)話控制用文件數(shù)據(jù)中,在<dialog>部的<result>內(nèi)代入語(yǔ)音識(shí)別結(jié)果的結(jié)果,對(duì)話控制用文件分析部25從<dialog>部之后,開(kāi)始進(jìn)行處理。在不存在用戶(hù)狀態(tài)管理部23中檢索的密碼(主叫人ID)的情況下,判定為來(lái)自語(yǔ)音終端2的新連接。新連接的情況下的用戶(hù)ID和密碼(主叫人ID)的對(duì)應(yīng)與上述相同。
下面說(shuō)明第一實(shí)施例的對(duì)話控制裝置7的處理步驟,圖6是對(duì)話控制裝置7的處理步驟的流程圖。
即,如圖6所示,在步驟ST1,在對(duì)話控制裝置7與語(yǔ)音信息提供裝置3或畫(huà)面信息提供裝置8之間開(kāi)始連接。在將其中的對(duì)話控制裝置7和語(yǔ)音信息提供裝置3連接起來(lái)的情況下,該連接開(kāi)始于從語(yǔ)音信息提供裝置3向語(yǔ)音現(xiàn)場(chǎng)通信部21要求語(yǔ)音XML文件的URI。對(duì)話控制裝置7和畫(huà)面信息提供裝置8的連接開(kāi)始于從畫(huà)面信息提供裝置8向應(yīng)用現(xiàn)場(chǎng)通信部22發(fā)送對(duì)話控制用文件。然后,進(jìn)到步驟ST2。
在步驟ST2,對(duì)話控制裝置7成為等待來(lái)自對(duì)話控制裝置3或畫(huà)面信息提供裝置8的輸入的待機(jī)狀態(tài)。此時(shí),在正執(zhí)行對(duì)話控制用文件的<dialog>部之中的情況下,成為等待來(lái)自?xún)蓚€(gè)服務(wù)器的輸入的狀態(tài)。從語(yǔ)音信息提供裝置3等待語(yǔ)音識(shí)別結(jié)果的輸入,從畫(huà)面信息提供裝置8等待對(duì)話控制用文件數(shù)據(jù)或處理結(jié)果(應(yīng)用結(jié)果)的輸入。然后,進(jìn)到步驟ST3。
在該步驟ST3,根據(jù)構(gòu)成輸入源的裝置,后面的處理出現(xiàn)分支。即,對(duì)話控制用文件分析部25的輸入是來(lái)自語(yǔ)音信息提供裝置3的輸出的情況下,進(jìn)到步驟ST4,在該輸入是從畫(huà)面信息提供裝置8輸出的情況下,進(jìn)到步驟ST6。
在步驟ST4,從語(yǔ)音信息提供裝置3供給的輸入根據(jù)語(yǔ)音終端2的是否切斷而分支。在該輸入不切斷的情況下,進(jìn)到步驟ST5,另一方面,在切斷輸入的情況下,進(jìn)到步驟ST10。
在其中的步驟ST5,由于不切斷從語(yǔ)音信息提供裝置3供給的輸入,將語(yǔ)音識(shí)別結(jié)果代入<dialog>部的<result>中,故在該<dialog>部后,開(kāi)始執(zhí)行對(duì)話控制用文件數(shù)據(jù)的處理。然后,進(jìn)到步驟ST2,處于待機(jī)狀態(tài)。
另一方面,在于步驟ST4,從語(yǔ)音信息提供裝置3供給的輸入是切斷的情況下,進(jìn)到步驟ST10,進(jìn)行結(jié)束處理,刪除用戶(hù)狀態(tài)管理部23中的相應(yīng)記錄。
在于步驟ST3,在輸入是從畫(huà)面信息提供裝置8輸出的情況下,進(jìn)到步驟ST6。在步驟ST6,來(lái)自畫(huà)面信息提供裝置8的輸入根據(jù)是對(duì)話控制用文件數(shù)據(jù),還是處理結(jié)果(應(yīng)用結(jié)果)來(lái)分支。即,在來(lái)自畫(huà)面信息提供裝置8的輸入是對(duì)話控制用文件數(shù)據(jù)的情況下,進(jìn)到步驟ST7,在是處理結(jié)果(應(yīng)用結(jié)果)的情況下,進(jìn)到步驟ST8。
在來(lái)自畫(huà)面信息提供裝置8的輸入是對(duì)話控制用文件數(shù)據(jù)的情況下,進(jìn)到步驟ST7,對(duì)話控制用文件分析部25首先在新的對(duì)話控制用文件數(shù)據(jù)的取得不是由<goto>得到的情況下,向語(yǔ)音現(xiàn)場(chǎng)通信部21發(fā)送中斷命令信號(hào)。然后,對(duì)話控制用文件分析部25分析執(zhí)行新的對(duì)話控制用文件數(shù)據(jù)。然后,進(jìn)到步驟ST9。
另一方面,在來(lái)自畫(huà)面信息提供裝置8的輸入是處理結(jié)果(應(yīng)用結(jié)果)的情況下,進(jìn)到步驟ST8。在步驟ST8,將處理結(jié)果(應(yīng)用結(jié)果)作為<callService>的返回值提供給對(duì)話控制用文件分析部25,對(duì)話控制用文件分析部25在該<callService>之后,開(kāi)始進(jìn)行對(duì)話控制用文件的處理。然后,進(jìn)到步驟ST9。
在步驟ST9,根據(jù)對(duì)話控制用文件數(shù)據(jù)中是否有表示結(jié)束的<exit/>標(biāo)記而分支。
即,在對(duì)話控制用文件數(shù)據(jù)中沒(méi)有<exit/>標(biāo)記的情況下,由于有<dialog>、<goto>或<callService>,故進(jìn)到步驟ST2,以便等待來(lái)自語(yǔ)音信息提供裝置3的輸入。
另一方面,在對(duì)話控制用文件數(shù)據(jù)中有<exit/>標(biāo)記的情況下,進(jìn)到步驟ST10,進(jìn)行結(jié)束處理,刪除用戶(hù)狀態(tài)管理部23的相應(yīng)記錄。
如上所述,進(jìn)行對(duì)話控制裝置7做的處理。
接著,說(shuō)明由上述的對(duì)話控制裝置7控制輸出的第一實(shí)施例的畫(huà)面信息提供裝置8。圖7表示該第一實(shí)施例的畫(huà)面信息提供裝置8的構(gòu)成。
如圖7所示,第一實(shí)施例的畫(huà)面信息提供裝置8由對(duì)話控制側(cè)通信部31、可檢索數(shù)據(jù)庫(kù)32a的后端應(yīng)用部32、可檢索對(duì)話控制用文件數(shù)據(jù)庫(kù)33a、URI對(duì)應(yīng)表數(shù)據(jù)庫(kù)33b和HTM文件組數(shù)據(jù)庫(kù)33c的電子文件檢索部33和Web服務(wù)器34構(gòu)成。
對(duì)話控制側(cè)通信部31可從對(duì)話控制裝置7輸入用戶(hù)ID、URI和參數(shù)值(對(duì)話結(jié)果),同時(shí)可從后端應(yīng)用部32輸入用戶(hù)ID、對(duì)話控制用文件數(shù)據(jù)和處理結(jié)果(應(yīng)用結(jié)果)。
對(duì)話控制側(cè)通信部31可向?qū)υ捒刂蒲b置7輸出用戶(hù)ID、對(duì)話控制用文件數(shù)據(jù)和處理結(jié)果(應(yīng)用結(jié)果),同時(shí)可向后端應(yīng)用部32輸出用戶(hù)ID、URI以及參數(shù)值(對(duì)話結(jié)果)。
在這樣構(gòu)成的對(duì)話控制側(cè)通信部31中,從后端應(yīng)用部32供給用戶(hù)ID和對(duì)話控制用文件數(shù)據(jù)的情況下,將該用戶(hù)ID和對(duì)話控制用文件數(shù)據(jù)發(fā)送到對(duì)話控制裝置7。另一方面,在對(duì)話控制側(cè)通信部31從后端應(yīng)用部32取得用戶(hù)ID和處理結(jié)果(應(yīng)用結(jié)果)的情況下,將這些用戶(hù)ID和處理結(jié)果發(fā)送到對(duì)話控制裝置7。
在對(duì)話控制側(cè)通信部31從對(duì)話控制裝置7接收到用戶(hù)ID、URI和參數(shù)值(對(duì)話結(jié)果)的情況下,將用戶(hù)ID、URI和參數(shù)值(對(duì)話結(jié)果)供給后端應(yīng)用部32。
后端應(yīng)用部32可從對(duì)話控制側(cè)通信部31輸入用戶(hù)ID、URI和參數(shù)值(對(duì)話結(jié)果),同時(shí)可從Web服務(wù)器34輸入用戶(hù)ID、HTML文件的URI和畫(huà)面終端5的操作結(jié)果(Web結(jié)果);后端應(yīng)用部32可對(duì)數(shù)據(jù)庫(kù)32a進(jìn)行檢索,從該數(shù)據(jù)庫(kù)32a輸入數(shù)據(jù)庫(kù)檢索結(jié)果(DB結(jié)果);后端應(yīng)用部32可從電子文件檢索部33輸入對(duì)話控制用文件數(shù)據(jù)和HTML文件。
后端應(yīng)用部32可向?qū)υ捒刂苽?cè)通信部31供給用戶(hù)ID、對(duì)話控制用文件數(shù)據(jù)和處理結(jié)果(應(yīng)用結(jié)果),同時(shí)可向Web服務(wù)器34供給比如HTML文件;后端應(yīng)用部32可向數(shù)據(jù)庫(kù)32a供給數(shù)據(jù)庫(kù)檢索式(DB詢(xún)問(wèn)),利用該數(shù)據(jù)庫(kù)檢索式(DB詢(xún)問(wèn))就能夠檢索數(shù)據(jù)庫(kù)32a;此外,后端應(yīng)用部32可向電子文件檢索部33供給URI。
后端應(yīng)用部32在從對(duì)話控制側(cè)通信部31接收到用戶(hù)ID、URI以及參數(shù)值(對(duì)話結(jié)果)的情況下,根據(jù)這些內(nèi)容或程序進(jìn)行處理。
即,在后端應(yīng)用部32向電子文件檢索部33發(fā)送URI后,從電子文件檢索部33取得與該發(fā)送的URI相對(duì)應(yīng)的對(duì)話控制用文件數(shù)據(jù)或HTML文件數(shù)據(jù)。后端應(yīng)用部32向數(shù)據(jù)庫(kù)32a發(fā)送數(shù)據(jù)庫(kù)檢索式(DB詢(xún)問(wèn)),同時(shí)從該數(shù)據(jù)庫(kù)32a取得作為檢索結(jié)果的數(shù)據(jù)庫(kù)檢索結(jié)果(DB結(jié)果)。
另一方面,在從電子文件檢索部33取得對(duì)話控制用文件數(shù)據(jù)或HTML文件的情況下,首先,向數(shù)據(jù)庫(kù)發(fā)送數(shù)據(jù)庫(kù)檢索式(DB詢(xún)問(wèn))。此外,作為結(jié)果,從數(shù)據(jù)庫(kù)供給數(shù)據(jù)庫(kù)檢索結(jié)果(DB結(jié)果)。
然后,后端應(yīng)用部32將所取得的對(duì)話控制用文件數(shù)據(jù)或根據(jù)所獲得的對(duì)話控制用文件數(shù)據(jù)而生成的對(duì)話控制用文件數(shù)據(jù)與用戶(hù)ID一起發(fā)送到對(duì)話控制通信部。在該對(duì)話控制用文件數(shù)據(jù)中,可包括數(shù)據(jù)庫(kù)檢索結(jié)果(DB結(jié)果)或其加工結(jié)果、畫(huà)面終端5的操作結(jié)果(Web結(jié)果)或其加工結(jié)果、參數(shù)值(對(duì)話結(jié)果)或其加工結(jié)果的信息。
后端應(yīng)用部32將所取得的HTML文件或根據(jù)已獲得的HTML文件而生成的HTML文件與用戶(hù)ID一起發(fā)送到Web服務(wù)器34。在該HTML文件中,可包含數(shù)據(jù)庫(kù)檢索結(jié)果(DB結(jié)果)或其加工結(jié)果、Web結(jié)果或其加工結(jié)果、參數(shù)值(對(duì)話結(jié)果)或其加工結(jié)果的信息。
后端應(yīng)用部32在從數(shù)據(jù)庫(kù)取得數(shù)據(jù)庫(kù)檢索結(jié)果(DB結(jié)果)的情況下,根據(jù)其內(nèi)容或程序向數(shù)據(jù)庫(kù)32a發(fā)送數(shù)據(jù)庫(kù)檢索式(DB詢(xún)問(wèn))。另外,從數(shù)據(jù)庫(kù)32a取得數(shù)據(jù)庫(kù)檢索結(jié)果(DB結(jié)果)。
后端應(yīng)用部32向電子文件檢索部33供給URI,從電子文件檢索部33取得與該URI相對(duì)應(yīng)的對(duì)話控制用文件數(shù)據(jù)或HTML文件數(shù)據(jù)。
后端應(yīng)用部32將處理結(jié)果(應(yīng)用結(jié)果)與用戶(hù)ID一起供給對(duì)話控制側(cè)通信部31。這里,處理結(jié)果(應(yīng)用結(jié)果)可包括數(shù)據(jù)庫(kù)檢索結(jié)果(DB結(jié)果)或其加工結(jié)果、Web結(jié)果或其加工結(jié)果、參數(shù)值(對(duì)話結(jié)果)或其加工結(jié)果的信息。
然后,后端應(yīng)用部32在從Web服務(wù)器34獲得用戶(hù)ID、URI和畫(huà)面終端5的操作結(jié)果(Web結(jié)果)的情況下,根據(jù)這些內(nèi)容或程序進(jìn)行處理。
即,首先,后端應(yīng)用部32向電子文件檢索部33發(fā)送URI,從電子文件檢索部33取得與該URI相對(duì)應(yīng)的對(duì)話控制用文件數(shù)據(jù)或HTML文件數(shù)據(jù)。然后,后端應(yīng)用部32向數(shù)據(jù)庫(kù)32a發(fā)送數(shù)據(jù)庫(kù)檢索式(DB詢(xún)問(wèn)),作為結(jié)果,從數(shù)據(jù)庫(kù)32a取得數(shù)據(jù)庫(kù)檢索結(jié)果(DB結(jié)果)。
將處理結(jié)果(應(yīng)用結(jié)果)與用戶(hù)ID一起發(fā)送到對(duì)話控制側(cè)通信部31。這里,處理結(jié)果(應(yīng)用結(jié)果)可包括數(shù)據(jù)庫(kù)檢索結(jié)果(DB結(jié)果)或其加工結(jié)果、畫(huà)面終端5的操作結(jié)果(Web結(jié)果)或其加工結(jié)果、參數(shù)值(對(duì)話結(jié)果)或其加工結(jié)果的信息。
電子文件檢索部33可從后端應(yīng)用部32輸入U(xiǎn)RI,同時(shí)電子文件檢索部33可向后端應(yīng)用部32輸出對(duì)話控制用文件數(shù)據(jù)和HTML文件數(shù)據(jù)。
在這樣構(gòu)成的電子文件檢索部33從后端應(yīng)用部32取得URI時(shí),首先,檢索URI對(duì)應(yīng)表數(shù)據(jù)庫(kù)33b。在URI對(duì)應(yīng)表數(shù)據(jù)庫(kù)33b中記錄有對(duì)所取得的URI的對(duì)話控制用文件數(shù)據(jù)和HTML文件數(shù)據(jù)的識(shí)別符。接著,以該URI作為檢索關(guān)鍵詞檢索該識(shí)別符。
然后,電子文件檢索部33根據(jù)已檢索到的識(shí)別符取得對(duì)話控制用文件數(shù)據(jù)和HTML文件數(shù)據(jù)中至少一方的文件數(shù)據(jù)。接著,電子文件檢索部33將已取得的對(duì)話控制用文件數(shù)據(jù)或HTML文件數(shù)據(jù)發(fā)送到后端應(yīng)用部32。
由于Web服務(wù)器34與已有公知的Web服務(wù)器相同,故省略其說(shuō)明。
如上所述,構(gòu)成該第一實(shí)施例的語(yǔ)音系統(tǒng)后,用戶(hù)就能夠用語(yǔ)音終端2和畫(huà)面終端5來(lái)利用語(yǔ)音識(shí)別系統(tǒng)。
如上面已說(shuō)明的那樣,按照該第一實(shí)施例,經(jīng)公共線路交換網(wǎng)1,由語(yǔ)音信息提供裝置3進(jìn)行來(lái)自語(yǔ)音終端2的語(yǔ)音的識(shí)別,再由畫(huà)面信息提供裝置8經(jīng)網(wǎng)絡(luò)4向畫(huà)面終端5提供信息,并且由對(duì)話控制裝置7進(jìn)行語(yǔ)音信息提供裝置3和畫(huà)面信息提供裝置8的相互控制,由此,在語(yǔ)音終端2或畫(huà)面終端5中,分別連接到公共線路交換網(wǎng)1或網(wǎng)絡(luò)4上,而僅僅具有可進(jìn)行通信的功能,就能夠進(jìn)行語(yǔ)音識(shí)別的系統(tǒng)和顯示畫(huà)面的控制,因此,即使是只具有便攜電話水平的性能的終端,也能夠同時(shí)使用語(yǔ)音識(shí)別、接觸輸入、語(yǔ)音輸出和畫(huà)面顯示,并且可控制使用這些功能的對(duì)話。
(第二實(shí)施例)下面說(shuō)明本發(fā)明的第二實(shí)施例的對(duì)話系統(tǒng),圖8表示語(yǔ)音終端和畫(huà)面終端與該第二實(shí)施例的對(duì)話系統(tǒng)連接的狀態(tài)。
在第二實(shí)施例的對(duì)話系統(tǒng)中,與第一實(shí)施例不同,作為語(yǔ)音終端2連接的網(wǎng)絡(luò)是采用包含公共線路交換網(wǎng)1等的寬帶網(wǎng)41。
在第二實(shí)施例的對(duì)話系統(tǒng)中,與第一實(shí)施例不同,不設(shè)置對(duì)話控制裝置7,可從畫(huà)面信息提供裝置42直接向語(yǔ)音信息提供裝置3提供語(yǔ)音XML文件數(shù)據(jù)。
有關(guān)除此以外的構(gòu)成與第一實(shí)施例相同,所以在第二實(shí)施例中,僅僅說(shuō)明畫(huà)面信息提供裝置42。圖9表示第二實(shí)施例的畫(huà)面信息提供裝置42的構(gòu)成。
如圖9所示,該第二實(shí)施例的畫(huà)面信息提供裝置42由語(yǔ)音現(xiàn)場(chǎng)通信部51、用戶(hù)管理部52、可檢索數(shù)據(jù)庫(kù)53的后端應(yīng)用部53、可檢索對(duì)話控制文件組組數(shù)據(jù)庫(kù)54a、URI對(duì)應(yīng)表數(shù)據(jù)庫(kù)54b和HTML文件組數(shù)據(jù)庫(kù)54c的電子文件檢索部54以及Web服務(wù)器55構(gòu)成。
語(yǔ)音現(xiàn)場(chǎng)通信部51可從音信息提供裝置3輸入語(yǔ)音XML文件的URI、密碼(主叫人ID)和語(yǔ)音識(shí)別結(jié)果(Rec Result),同時(shí)可從用戶(hù)管理部52輸入密碼(主叫人ID)、語(yǔ)音XML文件數(shù)據(jù)和語(yǔ)音處理的中斷命令信號(hào)。
語(yǔ)音現(xiàn)場(chǎng)通信部51可向音信息提供裝置3發(fā)送密碼(主叫人ID)、語(yǔ)音XML文件和語(yǔ)音處理的中斷命令信號(hào),同時(shí)可向用戶(hù)管理部52供給密碼(主叫人ID)和語(yǔ)音識(shí)別結(jié)果。
該語(yǔ)音現(xiàn)場(chǎng)通信部51在與音信息提供裝置3之間進(jìn)行網(wǎng)上信息塊的度對(duì)話期間管理,使該網(wǎng)上信息塊包含密碼(主叫人ID),就能夠使語(yǔ)音終端2的用戶(hù)對(duì)應(yīng)音信息提供裝置3和畫(huà)面信息提供裝置42。
這樣構(gòu)成的語(yǔ)言部位通信部51從音信息提供裝置3接收密碼(主叫人ID)和語(yǔ)音XML文件的URI。并且,在來(lái)自音信息提供裝置3的接收內(nèi)容中不包含網(wǎng)上信息塊的情況下,就新生成網(wǎng)上信息塊。語(yǔ)音現(xiàn)場(chǎng)通信部51將存在于所要求的URI內(nèi)的語(yǔ)音XML文件與密碼(主叫人ID)一起發(fā)送到音信息提供裝置3。
另一方面,語(yǔ)音現(xiàn)場(chǎng)通信部51在從語(yǔ)音信息提供裝置3接收到密碼(主叫人ID)和語(yǔ)音識(shí)別結(jié)果的情況下,將該密碼(主叫人ID)和語(yǔ)音識(shí)別結(jié)果發(fā)送到用戶(hù)管理部52。在從用戶(hù)管理部52向語(yǔ)音通信部51輸入了密碼(主叫人ID)和中斷命令信號(hào)的情況下,語(yǔ)音現(xiàn)場(chǎng)通信部51將該密碼(主叫人ID)和中斷命令信號(hào)發(fā)送到語(yǔ)音信息提供裝置3。
用戶(hù)管理部52可從語(yǔ)音現(xiàn)場(chǎng)通信部51輸入密碼(主叫人ID)和語(yǔ)音識(shí)別結(jié)果,同時(shí)可輸入用戶(hù)ID和語(yǔ)音XML文件數(shù)據(jù)。
用戶(hù)管理部52可向語(yǔ)音現(xiàn)場(chǎng)通信部51供給密碼(主叫人ID)、語(yǔ)音XML文件數(shù)據(jù)和中斷命令信號(hào),同時(shí)可向后端應(yīng)用部53供給用戶(hù)ID和參數(shù)值(對(duì)話結(jié)果)。
這樣構(gòu)成的用戶(hù)管理部52中按照與第一實(shí)施例的用戶(hù)狀態(tài)管理部23(參照?qǐng)D2)中相同的方法來(lái)進(jìn)行管理,使密碼(主叫人ID)和用戶(hù)ID相對(duì)應(yīng)。
用戶(hù)管理部52在從語(yǔ)音現(xiàn)場(chǎng)通信部51供給密碼(主叫人ID)和語(yǔ)音識(shí)別結(jié)果時(shí),將密碼(主叫人ID)變換為用戶(hù)ID,并與參數(shù)值(對(duì)話結(jié)果)一起發(fā)送到后端應(yīng)用部52。在第二實(shí)施例中,語(yǔ)音識(shí)別結(jié)果和參數(shù)值(對(duì)話結(jié)果)同值。
用戶(hù)管理部52在從后端應(yīng)用部53取得了用戶(hù)ID和語(yǔ)音XML文件數(shù)據(jù)的情況下,按照其輸入的定時(shí),進(jìn)行互不相同的處理。
即,在用戶(hù)管理部52向語(yǔ)音現(xiàn)場(chǎng)通信部51發(fā)送用戶(hù)ID和語(yǔ)音XML文件數(shù)據(jù)后,從語(yǔ)音現(xiàn)場(chǎng)通信部51取得語(yǔ)音識(shí)別結(jié)果之前,從后端應(yīng)用部53供給用戶(hù)ID和語(yǔ)音XML文件的情況下,用戶(hù)管理部52將用戶(hù)ID變換為密碼(主叫人ID),并將密碼(主叫人ID)、中斷命令信號(hào)和語(yǔ)音XML文件發(fā)送到語(yǔ)音現(xiàn)場(chǎng)通信部51。
另一方面,用戶(hù)管理部52在向語(yǔ)音現(xiàn)場(chǎng)通信部51發(fā)送語(yǔ)音XML文件數(shù)據(jù)后,從語(yǔ)音現(xiàn)場(chǎng)通信部51取得語(yǔ)音識(shí)別結(jié)果,然后,從后端應(yīng)用部53,供給用戶(hù)ID和語(yǔ)音XML文件的情況下,用戶(hù)管理部52將用戶(hù)ID變換為密碼(主叫人ID),并將該密碼(主叫人ID)和從后端應(yīng)用部53供給的語(yǔ)音XML文件發(fā)送到語(yǔ)音現(xiàn)場(chǎng)通信部51。
后端應(yīng)用部53和電子文件檢索部54中,與第一實(shí)施例的不同之處在于用語(yǔ)音XML文件數(shù)據(jù)代替第一實(shí)施例中的對(duì)話控制用文件數(shù)據(jù)。由于其它構(gòu)成與第一實(shí)施例的相同,故省略其說(shuō)明。Web服務(wù)器55中的輸入、輸出和處理與現(xiàn)有技術(shù)的Web服務(wù)器中的相同。
按照第二實(shí)施例,可獲得與第一實(shí)施例相同的效果,同時(shí)由于畫(huà)面信息提供裝置42具有第一實(shí)施例的對(duì)話控制裝置和畫(huà)面信息提供裝置這兩者的功能,所以與第一實(shí)施例相比較,可簡(jiǎn)化對(duì)話系統(tǒng)的構(gòu)成。
(第三實(shí)施例)下面來(lái)說(shuō)明本發(fā)明的第三實(shí)施例的對(duì)話系統(tǒng),圖10表示第三實(shí)施例的對(duì)話系統(tǒng)。
如圖10所示,在該第三實(shí)施例的對(duì)話系統(tǒng)中,與第一實(shí)施例不同,分析執(zhí)行語(yǔ)音XML文件數(shù)據(jù)的裝置(語(yǔ)音XML分析執(zhí)行裝置)設(shè)置在融合了語(yǔ)音終端2和畫(huà)面終端5的用戶(hù)終端。
即,第三實(shí)施例的對(duì)話系統(tǒng)是把用戶(hù)終端61、語(yǔ)音識(shí)別服務(wù)器62、語(yǔ)音合成服務(wù)器63和畫(huà)面信息提供裝置64連接在網(wǎng)絡(luò)60上而構(gòu)成的。
用戶(hù)終端61至少包括語(yǔ)音輸入輸出部61a、畫(huà)面輸入輸出部61b和語(yǔ)音XML分析執(zhí)行部61c。
語(yǔ)音輸入輸出部61a具有與第一實(shí)施例的語(yǔ)音終端2相同的功能;畫(huà)面輸入輸出部61b具有與第一實(shí)施例的畫(huà)面終端相同的功能;語(yǔ)音XML分析執(zhí)行部61c具有與第一實(shí)施例的語(yǔ)音XML分析執(zhí)行裝置相同的功能。
具有上述構(gòu)成的用戶(hù)終端61中,可由用戶(hù)直接輸入語(yǔ)音、DTMT、文件信息和指向信息。該用戶(hù)終端61中,可經(jīng)網(wǎng)絡(luò)60從語(yǔ)音識(shí)別服務(wù)器62接收語(yǔ)音識(shí)別結(jié)果(記錄結(jié)果);可從語(yǔ)音合成服務(wù)器63接收語(yǔ)音信號(hào);可從畫(huà)面信息提供裝置64接收比如HTML文件數(shù)據(jù)、語(yǔ)音XML文件數(shù)據(jù)等電子信息。
在該用戶(hù)終端61中,在可識(shí)別的狀態(tài)下,可直接向用戶(hù)輸出語(yǔ)音和畫(huà)面信息。該用戶(hù)終端61可經(jīng)網(wǎng)絡(luò)60向語(yǔ)音識(shí)別服務(wù)器62發(fā)送語(yǔ)音信號(hào)、語(yǔ)音識(shí)別語(yǔ)法文件的URI以及語(yǔ)音識(shí)別對(duì)象的詞匯;可向語(yǔ)音合成服務(wù)器63發(fā)送語(yǔ)音引導(dǎo)用文件的URI和語(yǔ)音合成用文本;還可向畫(huà)面信息提供裝置64發(fā)送電子信息的URI、用來(lái)識(shí)別用戶(hù)終端的識(shí)別符(下稱(chēng)用戶(hù)ID)和語(yǔ)音識(shí)別結(jié)果(記錄結(jié)果)。
上述那樣構(gòu)成的用戶(hù)終端中,在與畫(huà)面信息提供裝置64之間進(jìn)行網(wǎng)上信息塊的對(duì)話期間管理。這樣,使該網(wǎng)上信息塊內(nèi)包含有用戶(hù)ID,畫(huà)面信息提供裝置64就可識(shí)別用戶(hù)終端61。
一旦用戶(hù)向用戶(hù)終端61輸入文件信息或指向信息、URI以及語(yǔ)音識(shí)別結(jié)果,這些信息數(shù)據(jù)就被發(fā)送到畫(huà)面信息提供裝置64。另外,如果用戶(hù)終端61從畫(huà)面信息提供裝置64接收與畫(huà)面顯示有關(guān)的電子信息,就在規(guī)定的畫(huà)面上顯示出基于電子信息的信息。
如果用戶(hù)終端61從畫(huà)面信息提供裝置64接收語(yǔ)音XML文件數(shù)據(jù),則在用戶(hù)終端61的語(yǔ)音XML分析執(zhí)行部中分析執(zhí)行該語(yǔ)音XML文件數(shù)據(jù)。
在用戶(hù)終端61接收到的語(yǔ)音XML文件數(shù)據(jù)內(nèi)存在執(zhí)行語(yǔ)音識(shí)別的記述的情況下,用戶(hù)終端61向語(yǔ)音識(shí)別服務(wù)器62發(fā)送要求識(shí)別的信號(hào),并取得其識(shí)別結(jié)果,在請(qǐng)求識(shí)別的信號(hào)中,包括語(yǔ)音識(shí)別語(yǔ)法文件的URI或成為識(shí)別對(duì)象的詞匯的信息數(shù)據(jù)。
在于用戶(hù)終端61接收到的語(yǔ)音XML文件數(shù)據(jù)內(nèi)存在進(jìn)行語(yǔ)音合成的記述的情況下,用戶(hù)終端61向語(yǔ)音合成服務(wù)器63發(fā)送要求語(yǔ)音合成的信號(hào),并取得其合成結(jié)果,在要求合成的信號(hào)中,包括語(yǔ)音合成用文本。
在于用戶(hù)終端61接收到的語(yǔ)音XML文件數(shù)據(jù)內(nèi)存在語(yǔ)音引導(dǎo)用文件的輸出的記述的情況下,用戶(hù)終端61向語(yǔ)音合成服務(wù)器63發(fā)送要求語(yǔ)音引導(dǎo)的信號(hào),在要求語(yǔ)音引導(dǎo)的信號(hào)中,包括語(yǔ)音引導(dǎo)用文件的URI的信息數(shù)據(jù)。
另外,在用戶(hù)終端61接收到的語(yǔ)音XML文件數(shù)據(jù)內(nèi)存在取得語(yǔ)音XML文件數(shù)據(jù)的記述的情況下,向由URI指定的存儲(chǔ)地址發(fā)送要求語(yǔ)音XML文件數(shù)據(jù)的信號(hào)。
語(yǔ)音識(shí)別服務(wù)器62中,可從用戶(hù)終端61經(jīng)網(wǎng)絡(luò)60接收語(yǔ)音識(shí)別語(yǔ)法文件的URI和語(yǔ)音識(shí)別對(duì)象詞匯。
語(yǔ)音識(shí)別服務(wù)器62可經(jīng)網(wǎng)絡(luò)60向用戶(hù)終端61發(fā)送語(yǔ)音識(shí)別結(jié)果(記錄結(jié)果)。
該語(yǔ)音識(shí)別服務(wù)器62通過(guò)分析從用戶(hù)終端61取得的語(yǔ)音信號(hào)來(lái)進(jìn)行語(yǔ)音識(shí)別。在該語(yǔ)音識(shí)別時(shí),使用與語(yǔ)音信號(hào)一起取得的語(yǔ)音識(shí)別語(yǔ)法文件的URI或語(yǔ)音識(shí)別對(duì)象詞匯。在使用它們中的語(yǔ)音識(shí)別語(yǔ)法文件的URI的情況下,從相應(yīng)的URI取得語(yǔ)音識(shí)別語(yǔ)法文件,將其用于語(yǔ)音識(shí)別。該語(yǔ)音識(shí)別的結(jié)果作為語(yǔ)音識(shí)別結(jié)果(記錄結(jié)果),由語(yǔ)音識(shí)別服務(wù)器62經(jīng)網(wǎng)絡(luò)60返回發(fā)送到用戶(hù)終端61。
語(yǔ)音合成服務(wù)器63可從用戶(hù)終端61接收語(yǔ)音引導(dǎo)用文件的URI和語(yǔ)音合成用文本,同時(shí)可經(jīng)網(wǎng)絡(luò)60向用戶(hù)終端61發(fā)送語(yǔ)音信號(hào)。
該語(yǔ)音合成服務(wù)器63在接收到從用戶(hù)終端61取得的語(yǔ)音合成用文本的情況下,執(zhí)行下面兩種處理中的至少一種處理,并把語(yǔ)音信號(hào)返回發(fā)送到用戶(hù)終端61。即,語(yǔ)音合成服務(wù)器63在把從用戶(hù)終端61取得的語(yǔ)音合成用文本變換為語(yǔ)音信號(hào)后,經(jīng)網(wǎng)絡(luò)60將該語(yǔ)音返回發(fā)送到用戶(hù)終端61,或者根據(jù)語(yǔ)音合成用文本檢索語(yǔ)音文件,將檢出的語(yǔ)音文件的內(nèi)容變換為語(yǔ)音信號(hào),然后經(jīng)網(wǎng)絡(luò)60,將其返回發(fā)送到用戶(hù)終端61。
在語(yǔ)音合成服務(wù)器63從用戶(hù)終端61接收到URI的情況下,根據(jù)該接收到的URI,檢索語(yǔ)音引導(dǎo)用文件,將檢出的語(yǔ)音引導(dǎo)用文件的內(nèi)容變換為語(yǔ)音信號(hào),然后經(jīng)網(wǎng)絡(luò)60,將其返回發(fā)送到用戶(hù)終端61。
畫(huà)面信息提供裝置64是與所謂的第二實(shí)施例的畫(huà)面信息提供裝置42相同的裝置,具有第一實(shí)施例的畫(huà)面信息提供裝置8和對(duì)話控制裝置7。
即,畫(huà)面信息提供裝置64可從用戶(hù)終端61接收電子信息的URI、用戶(hù)ID和語(yǔ)音識(shí)別結(jié)果(記錄結(jié)果),同時(shí)可向用戶(hù)終端61發(fā)送電子信息。
在像上述那樣構(gòu)成的第三實(shí)施例的對(duì)話系統(tǒng)中,可具有與第一實(shí)施例相同的效果,同時(shí)在用戶(hù)終端61中,由于分析執(zhí)行語(yǔ)音XML文件數(shù)據(jù),所以能夠分散語(yǔ)音識(shí)別的處理的負(fù)荷,并能夠?qū)崿F(xiàn)對(duì)話系統(tǒng)處理高速化。
上面具體說(shuō)明了本發(fā)明的實(shí)施例,但是,本發(fā)明不限于上述實(shí)施例,可實(shí)現(xiàn)基于本發(fā)明的技術(shù)構(gòu)思的各種變形。
比如,在上述實(shí)施例中所例舉的對(duì)話控制用文件數(shù)據(jù)只不過(guò)是個(gè)例子,可根據(jù)需要,使用與其不同的對(duì)話控制用文件數(shù)據(jù)。
另外,比如,在上述第一實(shí)施例中,語(yǔ)音信息提供裝置3、語(yǔ)音對(duì)話用數(shù)據(jù)提供裝置6、對(duì)話控制裝置7和畫(huà)面信息提供裝置8分別由各自不同的計(jì)算機(jī)構(gòu)成,但是,該語(yǔ)音信息提供裝置3、語(yǔ)音對(duì)話用數(shù)據(jù)提供裝置6、對(duì)話控制裝置7和畫(huà)面信息提供裝置8中的至少2個(gè)裝置也可由同一計(jì)算機(jī)構(gòu)成。
另外,比如,在上述實(shí)施例中,語(yǔ)音終端2和畫(huà)面終端5分別由不同的計(jì)算機(jī)構(gòu)成,但是該語(yǔ)音終端2和畫(huà)面終端5也可由同一終端構(gòu)成。即,語(yǔ)音終端2和畫(huà)面終端5既可由不同的終端構(gòu)成,也可由同一終端構(gòu)成。
還有,比如,在上述實(shí)施例中,語(yǔ)音終端2和語(yǔ)音信息提供裝置3經(jīng)公共線路交換網(wǎng)1,相互可通信地連接起來(lái),但是,也可通過(guò)局域網(wǎng)(LAN)或互聯(lián)網(wǎng)等的寬帶網(wǎng)絡(luò)連接起來(lái)。另外,作為網(wǎng)絡(luò)也可由語(yǔ)音超級(jí)IP(voiceover IP)等構(gòu)成。
比如,在上述第一實(shí)施例中,后端應(yīng)用部32使用HTML文件作為一面從電子文件檢索部33供給一面供給Web服務(wù)器34的文件數(shù)據(jù),但是該HTML文件終歸是一個(gè)實(shí)例,可采用HTML文件以外的數(shù)據(jù)。比如,也可采用利用其它置標(biāo)語(yǔ)言的文件數(shù)據(jù),還可采用包含用公共網(wǎng)關(guān)接口(CommonGateway Interface)、活動(dòng)服務(wù)器頁(yè)面(Active Server Pages)、Java(注冊(cè)商標(biāo))轉(zhuǎn)租頁(yè)面、Java服務(wù)器頁(yè)面(Java Server Pages)等生成的文件的文件數(shù)據(jù)。
如上所述,按照本發(fā)明,由于可同時(shí)使用語(yǔ)音與畫(huà)面檢索存儲(chǔ)在網(wǎng)絡(luò)上的計(jì)算機(jī)中的信息,并在語(yǔ)音信息提供裝置或語(yǔ)音識(shí)別裝置中進(jìn)行語(yǔ)音識(shí)別,所以用戶(hù)不購(gòu)買(mǎi)新的軟件或硬件,就能夠利用便攜式電話等已有裝置,在便攜式的電話等移動(dòng)環(huán)境中使用通信終端。
按照本發(fā)明,由于語(yǔ)音信息提供裝置和對(duì)話控制裝置可與畫(huà)面信息提供裝置進(jìn)行通信,所以該畫(huà)面信息提供裝置的運(yùn)營(yíng)商不投入進(jìn)行語(yǔ)音識(shí)別的裝置,就能夠向持有第一通信終端和第二通信終端或它們組合成的通信終端的用戶(hù)進(jìn)行可有語(yǔ)音對(duì)話處理實(shí)現(xiàn)操作的信息提供。
按照本發(fā)明,由于對(duì)話控制裝置可根據(jù)從畫(huà)面信息提供裝置取得的電子信息生成語(yǔ)音對(duì)話用信息,所以服務(wù)器運(yùn)營(yíng)商不必要求專(zhuān)門(mén)知識(shí),就能夠進(jìn)行可語(yǔ)音對(duì)話處理操作的信息提供。
按照本發(fā)明的第五項(xiàng)發(fā)明,由于可在對(duì)話控制裝置中,根據(jù)情況切換輸入輸出裝置,所以在具有該對(duì)話控制裝置的對(duì)話系統(tǒng)中,一面輸入固有名詞一面從多個(gè)選擇分支進(jìn)行選擇的情況下,利用語(yǔ)音識(shí)別,在二擇一等選擇分支少的情況下,利用接觸輸入等,可進(jìn)行這樣情況的切換等的,有效的對(duì)話通信。
權(quán)利要求
1.一種對(duì)話系統(tǒng),其特征在于該對(duì)話系統(tǒng)包括可輸出語(yǔ)音信息的語(yǔ)音信息提供裝置、可輸出畫(huà)面信息的畫(huà)面信息提供裝置以及可對(duì)所述語(yǔ)音信息提供裝置和所述畫(huà)面信息提供裝置發(fā)送接收電子信息的對(duì)話控制裝置;連接有至少可與所述畫(huà)面信息提供裝置之間進(jìn)行通信的第一通信終端和至少可與所述語(yǔ)音信息提供裝置之間進(jìn)行通信的第二通信終端;所述畫(huà)面信息提供裝置具有記錄發(fā)送到可顯示視覺(jué)信息的第一通信終端的第一電子信息和所述對(duì)話控制裝置中所使用的第二電子信息的記錄部,同時(shí)在從所述第一通信終端或所述對(duì)話控制裝置接收到信息的情況下,可根據(jù)所述接收到的信息進(jìn)行向所述第一通信終端發(fā)送所述第一電子信息的處理和向所述對(duì)話控制裝置發(fā)送所述第二電子信息的處理中的至少一種處理;所述語(yǔ)音信息提供裝置在接收到由所述對(duì)話控制裝置生成的語(yǔ)音對(duì)話用信息的情況下可從所述對(duì)話控制裝置把基于所述語(yǔ)音對(duì)話用信息的語(yǔ)音信息發(fā)送到所述第二通信終端,同時(shí)在從所述第二通信終端接收到所述語(yǔ)音信息的情況下,可根據(jù)所述語(yǔ)音對(duì)話用信息識(shí)別所述接收到的語(yǔ)音信息,并生成語(yǔ)音識(shí)別結(jié)果,發(fā)送到所述對(duì)話控制裝置;所述對(duì)話控制裝置在從所述畫(huà)面信息提供裝置接收到所述第二電子信息的情況下,可根據(jù)所述第二電子信息生成語(yǔ)音對(duì)話用信息,發(fā)送到所述語(yǔ)音信息提供裝置,同時(shí)在從所述語(yǔ)音信息提供裝置接收到語(yǔ)音識(shí)別結(jié)果的情況下,可根據(jù)所述第二電子信息,將與所述語(yǔ)音識(shí)別結(jié)果有關(guān)的信息發(fā)送到畫(huà)面信息提供裝置。
2.根據(jù)權(quán)利要求1所述的對(duì)話系統(tǒng),其特征在于所述畫(huà)面信息提供裝置、所述聲音信息提供裝置和所述對(duì)話控制裝置可經(jīng)網(wǎng)絡(luò)相互連接起來(lái),同時(shí)可經(jīng)所述網(wǎng)絡(luò)連接所述第一通信裝置和所述第二通信裝置。
3.一種對(duì)話系統(tǒng),其特征在于連接有畫(huà)面信息提供裝置和語(yǔ)音信息提供裝置;所述畫(huà)面信息提供裝置具有可記錄發(fā)送到能顯示視覺(jué)信息的第一通信終端的第一電子信息和所述語(yǔ)音信息提供裝置所使用的第二電子信息的記錄部,同時(shí)在從所述第一通信終端或所述語(yǔ)音信息提供裝置接收到信息的情況下,可進(jìn)行把基于所述接收到的信息的所述第一電子信息發(fā)送到所述第一通信終端的處理和向語(yǔ)音信息提供裝置發(fā)送所述第二電子信息的處理中的至少一種處理;所述語(yǔ)音信息提供裝置在從所述畫(huà)面信息提供裝置接收到所述第二電子信息的情況下,可將基于所述第二電子信息的語(yǔ)音信息發(fā)送到能輸出語(yǔ)音的第二通信終端,同時(shí)在從所述第二通信終端接收到所述語(yǔ)音信息的情況下,可根據(jù)所述第二電子信息識(shí)別所述接收到的語(yǔ)音信息,并生成語(yǔ)音識(shí)別結(jié)果,將所述語(yǔ)音識(shí)別結(jié)果發(fā)送到所述畫(huà)面信息提供裝置。
4.根據(jù)權(quán)利要求1或3所述的對(duì)話系統(tǒng),其特征在于所述第一通信終端和所述第二通信終端由同一終端構(gòu)成。
5.根據(jù)權(quán)利要求3所述的對(duì)話系統(tǒng),其特征在于所述畫(huà)面信息提供裝置和語(yǔ)音信息提供裝置可經(jīng)網(wǎng)絡(luò)相互連接,同時(shí)可經(jīng)所述網(wǎng)絡(luò)連接第一通信終端或所述第二通信終端。
6.一種對(duì)話系統(tǒng),其特征在于畫(huà)面信息提供裝置、對(duì)話控制裝置和語(yǔ)音識(shí)別裝置相互連接起來(lái)而構(gòu)成,同時(shí)可連接通信終端;所述畫(huà)面信息提供裝置具有可記錄發(fā)送到所述通信終端的第一電子信息和所述對(duì)話控制裝置中使用的第二電子信息的記錄部,同時(shí)在從所述通信終端或所述對(duì)話控制裝置接收到信息的情況下,可根據(jù)所述接收到的信息進(jìn)行把所述第一電子信息發(fā)送到所述通信終端的處理和把所述第二電子信息發(fā)送到所述對(duì)話控制裝置的處理中的至少一種處理;所述對(duì)話控制裝置在從所述畫(huà)面信息提供裝置接收到所述第二電子信息的情況下,生成基于所述第二電子信息的語(yǔ)音對(duì)話用信息,并發(fā)送到所述通信終端,在從所述通信終端接收到語(yǔ)音識(shí)別結(jié)果的情況下,根據(jù)所述第二電子信息把與所述語(yǔ)音識(shí)別結(jié)果有關(guān)的信息發(fā)送到所述畫(huà)面信息提供裝置;所述語(yǔ)音識(shí)別裝置可從所述通信終端接收語(yǔ)音信息,識(shí)別所述接收到的語(yǔ)音信息,生成語(yǔ)音識(shí)別結(jié)果,并發(fā)送到所述通信終端。
7.根據(jù)權(quán)利要求6所述的對(duì)話系統(tǒng),其特征在于所述通信終端在從所述畫(huà)面信息提供裝置接收到所述第一電子信息的情況下,可輸出所述第一電子信息或?qū)λ龅谝浑娮有畔⑦M(jìn)行了加工的信息;所述通信終端在進(jìn)行了接觸輸入的情況下,可根據(jù)所述第一電子信息將進(jìn)行了所述接觸輸入的信息發(fā)送到所述畫(huà)面信息提供裝置;所述通信終端在從所述對(duì)話控制裝置接收到所述語(yǔ)音對(duì)話用信息的情況下,可根據(jù)所述語(yǔ)音對(duì)話用信息控制語(yǔ)音的輸入或語(yǔ)音的輸出;所述通信終端在進(jìn)行了語(yǔ)音的輸入的情況下,可根據(jù)所述語(yǔ)音對(duì)話用信息將所述語(yǔ)音發(fā)送到所述語(yǔ)音識(shí)別裝置;所述通信終端在從所述語(yǔ)音識(shí)別裝置接收到所述語(yǔ)音識(shí)別結(jié)果的情況下,可根據(jù)所述語(yǔ)音對(duì)話用信息將與所述語(yǔ)音識(shí)別有關(guān)的信息發(fā)送到所述對(duì)話控制裝置。
8.根據(jù)權(quán)利要求1,2或6所述的對(duì)話系統(tǒng),其特征在于所述對(duì)話控制裝置在接收到所述語(yǔ)音識(shí)別結(jié)果的情況下,可根據(jù)所述第二電子信息和所述語(yǔ)音識(shí)別結(jié)果生成語(yǔ)音對(duì)話用信息。
9.一種對(duì)話系統(tǒng),其特征在于連接畫(huà)面信息提供裝置和語(yǔ)音識(shí)別裝置而構(gòu)成,同時(shí)可連接能與所述畫(huà)面信息提供裝置和所述語(yǔ)音識(shí)別裝置進(jìn)行通信的通信終端;所述畫(huà)面信息提供裝置具有可記錄發(fā)送到所述通信終端的第一電子信息和所述語(yǔ)音識(shí)別裝置使用的第二電子信息的記錄部,并且可根據(jù)從所述通信終端接收到的信息把所述第一電子信息和所述第二電子信息發(fā)送到所述通信終端;所述語(yǔ)音識(shí)別裝置識(shí)別從所述通信終端接收到的語(yǔ)音信息,并生成所述語(yǔ)音信息的語(yǔ)音識(shí)別結(jié)果,同時(shí)把所述語(yǔ)音識(shí)別結(jié)果發(fā)送到所述通信終端。
10.根據(jù)權(quán)利要求9所述的對(duì)話系統(tǒng),其特征在于所述通信終端在從所述畫(huà)面信息提供裝置接收到所述第一電子信息的情況下可顯示所述第一電子信息或?qū)λ龅谝浑娮有畔⑦M(jìn)行了加工的信息;在進(jìn)行了接觸輸入的情況下可根據(jù)所述第一電子信息把已進(jìn)行了接觸輸入的信息發(fā)送到所述畫(huà)面信息提供裝置;在從所述畫(huà)面信息提供裝置接收到所述第二電子信息的情況下可根據(jù)所述第二電子信息控制語(yǔ)音的輸入和語(yǔ)音的輸出;在進(jìn)行了語(yǔ)音輸入的情況下可根據(jù)所述第二電子信息把語(yǔ)音的語(yǔ)音信息發(fā)送到所述語(yǔ)音識(shí)別裝置;在從所述語(yǔ)音識(shí)別裝置接收到語(yǔ)音識(shí)別結(jié)果的情況下可根據(jù)所述第二電子信息把與所述語(yǔ)音識(shí)別結(jié)果有關(guān)的信息發(fā)送到所述畫(huà)面信息提供裝置。
11.根據(jù)權(quán)利要求9所述的對(duì)話系統(tǒng),其特征在于所述畫(huà)面信息提供裝置和所述語(yǔ)音識(shí)別裝置經(jīng)網(wǎng)絡(luò)相互連接,并且所述通信終端經(jīng)該網(wǎng)絡(luò)可在與所述畫(huà)面信息提供裝置和所述語(yǔ)音識(shí)別裝置之間進(jìn)行通信。
12.一種對(duì)話控制裝置,其特征在于具有接收從連接在網(wǎng)絡(luò)上的第一電子計(jì)算機(jī)發(fā)送的電子信息的第一接收裝置;加工所述電子信息而生成語(yǔ)音對(duì)話用信息的生成裝置;向連接在所述網(wǎng)絡(luò)上同時(shí)能夠進(jìn)行語(yǔ)音對(duì)話處理的第二電子計(jì)算機(jī)發(fā)送所述語(yǔ)音對(duì)話用信息的第一發(fā)送裝置;接收在所述第二電子計(jì)算機(jī)中進(jìn)行的語(yǔ)音對(duì)話處理而生成的語(yǔ)音識(shí)別結(jié)果的第二接收裝置;根據(jù)所述語(yǔ)音識(shí)別結(jié)果或所述電子信息把與所述語(yǔ)音識(shí)別結(jié)果有關(guān)的信息發(fā)送到所述第一電子計(jì)算機(jī)的第二發(fā)送裝置。
13.根據(jù)權(quán)利要求12所述的對(duì)話控制裝置,其特征在于所述第一發(fā)送裝置和所述第二接收裝置由同一個(gè)第一發(fā)送接收裝置構(gòu)成,同時(shí)所述第二發(fā)送裝置和所述第一接收裝置由同一個(gè)第二發(fā)送接收裝置構(gòu)成。
14.根據(jù)權(quán)利要求12所述的對(duì)話系統(tǒng),其特征在于根據(jù)所述語(yǔ)音識(shí)別結(jié)果進(jìn)行所述語(yǔ)音對(duì)話用信息的生成。
15.一種對(duì)話系統(tǒng),可連接具有接觸輸入、語(yǔ)音輸入、畫(huà)面顯示和語(yǔ)音輸出的用戶(hù)接口的通信終端;其特征在于具有接收基于所述通信終端發(fā)送的所述接觸輸入的電子信息的接收裝置;接收基于所述通信終端發(fā)送的所述語(yǔ)音輸入的語(yǔ)音信息的接收裝置;把所述畫(huà)面顯示用的電子信息發(fā)送到所述通信終端的發(fā)送裝置;把所述語(yǔ)音輸出用的語(yǔ)音信息發(fā)送到所述通信終端的發(fā)送裝置;根據(jù)基于所述接觸輸入的電子信息或基于所述語(yǔ)音輸入的語(yǔ)音信息使所述畫(huà)面顯示用的電子信息或所述語(yǔ)音輸出用的語(yǔ)音信息變化的裝置。
16.一種對(duì)話系統(tǒng),可連接具有接觸輸入和畫(huà)面顯示的用戶(hù)接口的第一通信終端,同時(shí)可連接具有語(yǔ)音輸入和語(yǔ)音輸出的用戶(hù)接口的第二通信終端;其特征在于具有接收所述第一通信終端發(fā)送的基于所述接觸輸入的電子信息的接收裝置;接收所述第二通信終端發(fā)送的基于所述語(yǔ)音輸入的語(yǔ)音信息的接收裝置;把所述畫(huà)面顯示用的電子信息發(fā)送到所述第一通信終端的發(fā)送裝置;把所述語(yǔ)音輸出用的語(yǔ)音信息發(fā)送到所述第二通信終端的發(fā)送裝置;根據(jù)基于所述接觸輸入的電子信息或基于所述語(yǔ)音輸入的語(yǔ)音信息使畫(huà)面顯示用的電子信息或語(yǔ)音輸出用的語(yǔ)音信息變化的裝置。
17.根據(jù)權(quán)利要求1,2,3,4或16所述的對(duì)話系統(tǒng),其特征在于從所述第一通信終端接觸輸入并發(fā)送第一用戶(hù)識(shí)別符,從所述第二通信終端發(fā)送第二用戶(hù)識(shí)別符,比較所述第一用戶(hù)識(shí)別符和所述第二識(shí)別符的異同,就能夠使所述第一通信終端和所述第二通信終端相對(duì)應(yīng)。
18.根據(jù)權(quán)利要求1,2,3,4或16所述的對(duì)話系統(tǒng),其特征在于在把所述第二通信終端與所述對(duì)話系統(tǒng)連接時(shí),在所述對(duì)話系統(tǒng)中自動(dòng)生成第一密碼數(shù)據(jù),并發(fā)送到所述第二通信終端;在所述第二通信終端,把所述第一密碼數(shù)據(jù)進(jìn)行語(yǔ)音輸出后,把所述第一通信終端連接到所述對(duì)話系統(tǒng)上時(shí),從所述第一通信終端接觸輸入第二密碼數(shù)據(jù),并發(fā)送到所述對(duì)話系統(tǒng);在所述對(duì)話系統(tǒng)中,比較所述第一密碼數(shù)據(jù)和所述第二密碼數(shù)據(jù)的異同,就能夠使所述第一通信終端和所述第二通信終端相對(duì)應(yīng)。
19.根據(jù)權(quán)利要求1,2,3,4或16所述的對(duì)話系統(tǒng),其特征在于在所述第一通信終端連接到所述對(duì)話系統(tǒng)上時(shí),在所述對(duì)話系統(tǒng)中自動(dòng)生成第一密碼數(shù)據(jù),并發(fā)送到所述第一通信終端;在所述第一通信終端,把所述第一密碼數(shù)據(jù)進(jìn)行畫(huà)面輸出后,在所述第二通信終端與所述對(duì)話系統(tǒng)連接時(shí),從所述第二通信終端把所述第二密碼數(shù)據(jù)發(fā)送到所述對(duì)話系統(tǒng);在所述對(duì)話系統(tǒng)中,比較所述第一密碼數(shù)據(jù)和所述第二密碼數(shù)據(jù)的異同,就能夠使所述第一通信終端和所述第二通信終端相對(duì)應(yīng)。
20.根據(jù)權(quán)利要求1,2,3,4或16所述的對(duì)話系統(tǒng),其特征在于可把所述第一通信終端連接在至少連接了畫(huà)面信息提供裝置的第一網(wǎng)絡(luò)上,同時(shí)所述第二通信終端可連接在能夠與所述第二通信終端進(jìn)行通信且具有多個(gè)分別記錄了位置信息的基站的第二網(wǎng)絡(luò)上;所述第二通信終端與第一基站通信的同時(shí),在所述第一基站,除了所述第二通信終端以外而不存在通信中的通信終端時(shí),在所述第一通信終端連接到所述第一網(wǎng)絡(luò)上時(shí),可使所述第一通信終端和所述第二通信終端相對(duì)應(yīng)。
全文摘要
提供一種對(duì)話系統(tǒng),即使是非高性能、高功能的低性能終端,也能夠同時(shí)采用語(yǔ)音識(shí)別、接觸輸入、語(yǔ)音輸出和畫(huà)面顯示進(jìn)行用語(yǔ)音的操作。該系統(tǒng)包括發(fā)送語(yǔ)音信息的語(yǔ)音裝置、發(fā)送畫(huà)面信息的畫(huà)面裝置和對(duì)語(yǔ)音裝置和畫(huà)面裝置發(fā)送接收信息的對(duì)話控制裝置,上述裝置分別連接在公共線路交換網(wǎng)和網(wǎng)絡(luò)上。語(yǔ)音終端連接在線路上,畫(huà)面終端連接在網(wǎng)絡(luò)上,語(yǔ)音終端與語(yǔ)音裝置之間以及畫(huà)面終端與畫(huà)面裝置之間能夠進(jìn)行通信,對(duì)話控制裝置控制語(yǔ)音裝置與畫(huà)面裝置之間的相互通信。分別在語(yǔ)音終端和畫(huà)面終端之間發(fā)送接收語(yǔ)音信息和畫(huà)面信息,可同時(shí)進(jìn)行語(yǔ)音輸入和接觸輸入。語(yǔ)音終端和畫(huà)面終端由不同的終端或同一用戶(hù)終端構(gòu)成。
文檔編號(hào)G10L15/22GK1445652SQ0312160
公開(kāi)日2003年10月1日 申請(qǐng)日期2003年3月14日 優(yōu)先權(quán)日2002年3月14日
發(fā)明者牛田博英, 中嵨宏, 大本浩司 申請(qǐng)人:歐姆龍株式會(huì)社