專利名稱:用于對話系統(tǒng)的對話控制的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種產(chǎn)生用于對話系統(tǒng)的對話控制的方法和系統(tǒng),以及具有該類型的對話控制的對話系統(tǒng)。
用于對話系統(tǒng)語音控制用戶向?qū)У膶υ捒刂茖τ诟鞣N類型的語音入口具有很寬的商業(yè)應(yīng)用領(lǐng)域,例如,在諸如電話銀行和家庭對話系統(tǒng)之類的語音控制信息和服務(wù)提供系統(tǒng)的情況下。這種類型的語音對話系統(tǒng)具有語音輸入界面,通過該界面用戶的語音發(fā)聲被記錄和評估,并且還通常具有語音產(chǎn)生和語音輸出的設(shè)備。作為中心控制組件,該對話系統(tǒng)具有對話控制。該對話控制以系統(tǒng)和用戶之間預(yù)定的、互為條件的、互相起作用的子對話形式實(shí)現(xiàn)所有的有效語音對話,以及可以從其得到的系統(tǒng)側(cè)響應(yīng)。有效對話網(wǎng)絡(luò)和它們的條件相關(guān)性會在具有相應(yīng)的復(fù)雜規(guī)范的對話系統(tǒng)情況下變得相對的寬泛。
原理上,這種對話控制可以以硬件的形式實(shí)現(xiàn),例如ROM芯片。在執(zhí)行速度方面,這樣硬件解決方案優(yōu)于軟件解決方案,但是不提供對改變的條件適應(yīng)的可能。因此,將該對話控制用軟件實(shí)現(xiàn)是切合實(shí)際的,并且也使得執(zhí)行該對話系統(tǒng)是可能的。
在語音控制對話系統(tǒng)的開發(fā)和生產(chǎn)中,通常的問題出現(xiàn)在當(dāng)要被控制的對話系統(tǒng)是相應(yīng)復(fù)雜性的情況下,一方面對話開發(fā)者很難獲得對話控制的總評述。另一方面,對于對話系統(tǒng)的規(guī)范的每個(gè)改變,所謂的對話描述,必須發(fā)生相應(yīng)的對話控制或?qū)υ捗枋龅倪m應(yīng),其快速準(zhǔn)確的可行性反過來又被對話描述的復(fù)雜性限制。根據(jù)對話系統(tǒng)的類型或應(yīng)用,這類的改變將需要被非常頻繁地執(zhí)行,例如,作為來自自動銷售系統(tǒng)提供的貨物和服務(wù)或者它們的價(jià)格范圍中變化的結(jié)果。
通常,具有特定開發(fā)系統(tǒng)的對話控制是通過對話開發(fā)者產(chǎn)生并且隨后被加載到對話系統(tǒng),在對話系統(tǒng)中其由它的運(yùn)行系統(tǒng)執(zhí)行。如果需要對對話描述進(jìn)行改變,那么對話控制必須被讀入開發(fā)系統(tǒng),在那里相應(yīng)地更新,并且隨后被再一次加載到對話系統(tǒng)的運(yùn)行時(shí)環(huán)境。如今,使用最專有的描述和說明語言,這些主要是具有對任務(wù)特制的指令范圍的編程語言。這些語言具有這樣的缺點(diǎn)該對話開發(fā)者必須為了指定對話控制的目的特別地學(xué)習(xí)這些語言。同樣地,對話系統(tǒng)的生產(chǎn)者的客戶或者外部業(yè)務(wù)提供商僅能夠在廣泛訓(xùn)練之后對于對話描述進(jìn)行適應(yīng)或改變。這使得這種系統(tǒng)非常不易改變,并且對于一些應(yīng)用程序領(lǐng)域不能使用。此外,要產(chǎn)生或改變的對話描述通常是如此復(fù)雜,以至于在專有語言的給定框架中開發(fā)過程或維護(hù)過程占用相當(dāng)多的時(shí)間。
用于對話控制的對話規(guī)定語言大部分是由解釋器在對話系統(tǒng)中執(zhí)行的腳本語言。其主要的缺點(diǎn)在于由于需要解釋使得這種對話控制的執(zhí)行速度在對話系統(tǒng)的運(yùn)行時(shí)環(huán)境中是有限的。同樣地,由于它們更難構(gòu)造使得達(dá)到一定復(fù)雜性水平的腳本語言的程序開發(fā)時(shí)間也更長。由于當(dāng)前技術(shù)發(fā)展,甚至有必要擴(kuò)大說明語言的指令或功能的范圍。這導(dǎo)致了進(jìn)一步的缺點(diǎn),即開發(fā)系統(tǒng)的解釋器和對話系統(tǒng)的解釋器必須適應(yīng)新范圍的指令。
原理上,通過圖形或直觀編程的方式能實(shí)現(xiàn)對話控制的設(shè)計(jì)。然而,在控制廣泛的對話描述復(fù)雜性方面可能出現(xiàn)相當(dāng)多的困難,因?yàn)橥ǔD形工具僅提供具有特別編制的以及由此受限制范圍的命令結(jié)構(gòu)和監(jiān)控結(jié)構(gòu)的專有方法。以這種方式開發(fā)的圖形化開發(fā)對話于是可以以腳本語言程序的形式作為對話控制用于對話系統(tǒng)。然而,以這種方式實(shí)現(xiàn)的圖形開發(fā)系統(tǒng)不具有開發(fā)任何預(yù)期復(fù)雜度對話的必要能力。
因此,本發(fā)明的一個(gè)目的是啟用用于對話系統(tǒng)的簡單、靈活、快速和經(jīng)濟(jì)的新產(chǎn)品以及對話控制的適應(yīng)。
首先通過一種產(chǎn)生用于對話系統(tǒng)的對話控制的方法實(shí)現(xiàn)這個(gè)目的,其中應(yīng)用程序開發(fā)者首先通過選擇并組合合適的圖形化表示對話組件產(chǎn)生一圖形對話描述。這里,圖形對話描述是通過顯示裝置可見的。例如,圖形對話組件通常可以代表頻繁出現(xiàn)以及可重復(fù)使用的標(biāo)準(zhǔn)子對話,例如問候和結(jié)束對話,認(rèn)證對話或者信息詢問。同樣地,對話的結(jié)構(gòu)組件,例如對話控制能夠采用的狀態(tài),或者狀態(tài)轉(zhuǎn)換,可以圖形化表示。對話開發(fā)者可以從一檔案中(例如,從一對話數(shù)據(jù)庫或者對話庫中)將這些取出,并且在圖形對話描述可視化的基礎(chǔ)上,經(jīng)由精確確定的接口,可以將它們與已經(jīng)選擇的組件適當(dāng)?shù)劓溄悠饋?。根?jù)該發(fā)明,該圖形對話描述隨后自動地轉(zhuǎn)換成技術(shù)上的對話描述,其表示以面向?qū)ο蟮姆g器語言的程序代碼形式的生成對話。由于這種通用程序語言(例如,Java,C++或者C#)在計(jì)算方面比圖形描述語言更強(qiáng)大,因此圖形對話描述的功能可以在任何情況下通過轉(zhuǎn)換被變換成等價(jià)的技術(shù)對話描述。在開發(fā)者已經(jīng)完全按照他愿望產(chǎn)生了在技術(shù)水平上的對話之后,技術(shù)對話描述利用合適的編譯器被翻譯成機(jī)器碼,形成對話控制,并且能夠安裝到對話系統(tǒng)中立即使用。與通常使用以解釋器語言或腳本語言產(chǎn)生的對話控制比較,其優(yōu)點(diǎn)在于對話控制可使用機(jī)器碼形式,在這方面對話控制在對話系統(tǒng)上運(yùn)行快速并且可靠,而腳本程序必須通過較慢的解釋器解釋。
采用通用的而非專有程序語言的一個(gè)重要優(yōu)點(diǎn)在于能夠?qū)崿F(xiàn)任何可以想象的對話的可能性。這產(chǎn)生了進(jìn)一步的優(yōu)點(diǎn)在于這種對話控制可以在任何時(shí)候不必花費(fèi)進(jìn)行擴(kuò)展,并且能夠適用于任何技術(shù)或市場經(jīng)濟(jì)的發(fā)展。
該技術(shù)對話描述包括采用的面向?qū)ο缶幊陶Z言的類,其一方面能夠從基本類中衍生并且從而繼承了這些基本類的某些特性,并且在另一發(fā)明能夠包括用于子對話、對話狀態(tài)或者對話轉(zhuǎn)換的子類。這樣會出現(xiàn)類體系,其作為一個(gè)整體表示技術(shù)對話描述,并且最終完全規(guī)定對話控制。
以任何預(yù)期的面向?qū)ο缶幊陶Z言編寫的對話組件或者對話模塊具有優(yōu)點(diǎn),由于語言結(jié)構(gòu)導(dǎo)致的數(shù)據(jù)封裝和接口的準(zhǔn)確定義,它們在原理上是可重復(fù)使用的,并且因此還能夠有效地再次用于對話控制的后續(xù)新開發(fā)。
在圖形水平開發(fā)對話的開發(fā)者,通過圖形選擇和組合,能夠優(yōu)選地執(zhí)行并在技術(shù)水平上通過編程更準(zhǔn)確地改進(jìn)對話。因此,例如在技術(shù)描述水平上的對話系統(tǒng)的標(biāo)準(zhǔn)發(fā)聲能夠適應(yīng)于具體的對話情況,或者在一(圖形)子對話中指定的對用戶開放的詢問選項(xiàng)可以通過額外的增加而擴(kuò)展。
在技術(shù)描述水平上對話類的新編寫對于特別有經(jīng)驗(yàn)的對話開發(fā)者是非常合適的,如果他們能夠編程對話比他們用圖形化開發(fā)對話更快的話。同樣地,例如如果需要特定水平抽象的對話類,其繼承了一個(gè)或多個(gè)類的特點(diǎn)和方法,并且相似的類不能在對話類數(shù)據(jù)庫中找到,則對于開發(fā)的技術(shù)編程方法是優(yōu)選的。還有一種情況是通過并不具有完全計(jì)算能力的圖形描述語言,不能實(shí)現(xiàn)特定對話的情況,或者能夠?qū)崿F(xiàn)但有困難。在這些情況下,對話開發(fā)者選擇利用具有完全計(jì)算能力的編程語言進(jìn)一步開發(fā)技術(shù)對話描述,并且編寫實(shí)現(xiàn)具體子對話的新的面向?qū)ο箢?,從而將這些類結(jié)合到技術(shù)對話描述中。
在任何情況下,本發(fā)明的一個(gè)特殊優(yōu)點(diǎn)在于對話控制的開發(fā)可以以一種特別靈活并且面向問題的方式進(jìn)行,不僅是在圖形而且在等效的編程語言水平上。
這個(gè)分布式對話開發(fā)的另一個(gè)優(yōu)點(diǎn)在于語音控制對話系統(tǒng)的對話-這些對話在后續(xù)的操作中僅以聲音的形式出現(xiàn),并且這些對話系統(tǒng)現(xiàn)今能夠達(dá)到相當(dāng)大程度的復(fù)雜性-在圖形描述水平上可以看到。因此,對話開發(fā)者能夠?qū)λ鼈儷@得更好的觀察,并更好地設(shè)計(jì)它們。轉(zhuǎn)換成技術(shù)對話描述的中間步驟使得對話開發(fā)者能夠?qū)υ捒刂频膱D形設(shè)計(jì)準(zhǔn)確地適應(yīng)由對話系統(tǒng)設(shè)定的需求,或者適應(yīng)客戶的希望。
這里,采用諸如Java或者面向?qū)ο驝派生(C-devivative)之類的傳統(tǒng)編程語言,而沒有采用專有對話描述語言,是特別有利的,因?yàn)椴粌H對話系統(tǒng)的生產(chǎn)者而且對于例如用戶維護(hù)人員或者專門服務(wù)提供商都可以開發(fā)對話控制,并且如果必要的話進(jìn)行修改。這里所需要的是系統(tǒng)的編程接口(API)中的指令。原理上,任何面向?qū)ο缶幊陶Z言可以在這里選用。
為了確保圖形和技術(shù)對話描述之間的一致性,在本發(fā)明的一個(gè)實(shí)施例中,還可以將技術(shù)對話描述的文本改變結(jié)合到圖形對話描述中。圖形和技術(shù)描述語言能力(powerfulness)上的可能差別在更新圖形對話描述上不會造成問題,因?yàn)橥ㄟ^面向?qū)ο缶幊陶Z言的嚴(yán)謹(jǐn)語法以及歸因于繼承和抽象機(jī)制的體系結(jié)構(gòu),每個(gè)對話類可以符號化表示為它的相關(guān)性和接口。
在本發(fā)明特別優(yōu)選的例子中,圖形對話描述到技術(shù)描述的轉(zhuǎn)換,以及通過改變技術(shù)對話描述更新圖形對話描述,在通過開發(fā)環(huán)境的背景下以自動方式發(fā)生,并且是以對于開發(fā)者透明的方式發(fā)生。通過這種方式,對話開發(fā)者同時(shí)在兩個(gè)描述水平上的準(zhǔn)并行開發(fā)甚至是可能的。
在該實(shí)施例的情況下,另外可以確信在圖形對話描述到技術(shù)對話描述的用戶控制轉(zhuǎn)換的情況下,兩種描述的一致性不會受到技術(shù)對話描述的可能改變類或者組件的簡單改寫的危害,而是相比較圖形對話描述,技術(shù)對話描述的過剩在轉(zhuǎn)換過程中被保留,并且反過來在圖形對話描述中被更新。
用于產(chǎn)生技術(shù)對話描述的類/組件可以完整地或部分地,即還可以單獨(dú)地存儲在對話數(shù)據(jù)庫或者庫中。在一個(gè)實(shí)施例的情況下,這種存儲在對話數(shù)據(jù)庫中的對話或子對話的這樣技術(shù)描述可以有利地從對話開發(fā)環(huán)境中讀出,并且作為對于對話控制的技術(shù)以及-更新后-圖形新開發(fā)的起點(diǎn)。這使得程序片段可以重復(fù)使用,并且因此允許高速有效開發(fā)。
完全或部分存儲在數(shù)據(jù)庫中的技術(shù)對話描述可以包含類體系以及類庫,其表示在幾個(gè)水平抽象中的特別重要的對話特征。這些類體系還可以在被以技術(shù)對話描述形式讀入到開發(fā)環(huán)境中之后,表示成圖形對話描述,因?yàn)轭惡屠^承方法之間的關(guān)系以及特性通過合適的圖形符號被可視化。從已經(jīng)以這種方式可視化的類體系,對話開發(fā)者可以通過選擇相應(yīng)的符號選擇為其需要被足夠規(guī)定的類,并且將它們與其它對話組件適當(dāng)?shù)亟M合。例如,這些單獨(dú)的子對話以及它們之間接口的準(zhǔn)確規(guī)范,可以通過編程出單獨(dú)的類在選定并組合的組件轉(zhuǎn)換為技術(shù)對話描述之后發(fā)生。這樣,實(shí)現(xiàn)了一種有利的分布式對話開發(fā),其中對話控制的結(jié)構(gòu)實(shí)現(xiàn)在清晰的圖形描述水平上,并且詳細(xì)的工作通過編程發(fā)生在技術(shù)描述水平上。
在根據(jù)本發(fā)明方法的一個(gè)有利實(shí)施例的情況下,技術(shù)對話描述的所有技術(shù)組件/類由符號表示,或者被表示成在圖形對話描述中的塊狀線條(block lines)或者環(huán)形線條(circle lines)。于是圖形對話描述可以表示成對話的完整狀態(tài)/轉(zhuǎn)換圖,該對話通過對話控制實(shí)現(xiàn)。這具有這種優(yōu)點(diǎn),即如果所有類或者組件已經(jīng)存在,則頻繁使用的用來設(shè)計(jì)對話的狀態(tài)/轉(zhuǎn)換圖能夠直接轉(zhuǎn)換成圖形,并且從而最終也轉(zhuǎn)換成技術(shù)對話描述。
在本發(fā)明的該實(shí)施例的情況中,類的特點(diǎn)和方法能夠有利地通過符號在圖形對話描述中識別為類的元素。每個(gè)符號可以具有一標(biāo)記,該標(biāo)記具有額外的信息,例如輸入和輸出參數(shù)或者接口,或者其可能陳述了方法或者類的完整程序代碼。類似地,單獨(dú)對話狀態(tài)之間的轉(zhuǎn)換被圖形化表示,其中每個(gè)轉(zhuǎn)換能夠被指定一標(biāo)記,該標(biāo)記具有系統(tǒng)或用戶的相應(yīng)陳述和對話步驟,其引起了相應(yīng)的轉(zhuǎn)換或者其導(dǎo)致了轉(zhuǎn)換。利用以這種方式表示的圖形對話描述,對話開發(fā)者能夠通過諸如托拽,移動,拷貝,插入或者剪切等簡單的鼠標(biāo)操作,開發(fā)用圖表表示的語言學(xué),即實(shí)質(zhì)上聲學(xué)的對話,并且能夠更準(zhǔn)確地規(guī)定它。在一個(gè)特別有利的實(shí)施例中,通過雙擊一符號,對話開發(fā)者能夠打開一文本窗,其中他可以對相應(yīng)的組件做文本上的改變,或者能夠?qū)λ鼈冞M(jìn)行編程。通過這種圖形和文本開發(fā)的結(jié)合,方便的對話開發(fā)成為可能。
為了這種用于一對話系統(tǒng)的對話控制開發(fā),需要一種根據(jù)本發(fā)明的開發(fā)系統(tǒng),其包含至少一圖形對話編輯器,利用該編輯器圖形對話描述能夠被可視化并編輯。用于對話系統(tǒng)的這個(gè)開發(fā)環(huán)境還包含將圖形對話描述轉(zhuǎn)換成技術(shù)對話描述的轉(zhuǎn)換器,其中技術(shù)對話描述包含面向?qū)ο缶幊陶Z言的類。該源代碼然后通過根據(jù)本發(fā)明的開發(fā)系統(tǒng)的翻譯器(編譯器)翻譯成二進(jìn)制描述格式,其最終表示可以執(zhí)行在對話系統(tǒng)上的對話控制。
為了技術(shù)描述到等效的圖形對話描述的反向轉(zhuǎn)換,該開發(fā)系統(tǒng)優(yōu)選地包含一更新器。
為了修改表示對話控制的源代碼的技術(shù)對話描述,該開發(fā)系統(tǒng)優(yōu)選地包含用于文本上編輯源代碼的文本編輯器。
在一本發(fā)明特別有利的實(shí)施例中,除了文本編輯器,還存在一完整的編程環(huán)境,該編程環(huán)境具有結(jié)合調(diào)試器,編譯器以及用于選擇面向?qū)ο髮υ掝惖念悶g覽器。
該開發(fā)環(huán)境的一個(gè)優(yōu)點(diǎn)在于,復(fù)雜多層次語音對話可以借助于通過可視編程用于編輯和可視化的適當(dāng)工具通過圖形水平上的對話開發(fā)者來設(shè)計(jì),雖然他能夠借助于完整的編程環(huán)境通過面向?qū)ο缶幊虒?shí)現(xiàn)在技術(shù)對話描述中的細(xì)節(jié)。
作為本發(fā)明的一個(gè)有利的實(shí)施例,上述的開發(fā)系統(tǒng)結(jié)合到對話系統(tǒng)的運(yùn)行時(shí)環(huán)境中,以便該對話描述能夠有利地產(chǎn)生在硬件平臺上,在該平臺上其作為對話控制實(shí)現(xiàn)操作。
在由在此描述的開發(fā)系統(tǒng)開發(fā)的對話控制進(jìn)行控制的對話系統(tǒng)的情況下,特別有利的是在操作過程翻譯的對話控制能夠被結(jié)合到系統(tǒng)中。由此,對話控制能夠被更新,而無需為了安裝更新的對話控制而將系統(tǒng)退出操作。這對于一種系統(tǒng)特別有利處,例如該系統(tǒng)由于持續(xù)的特殊提供,因此需要特別頻繁地更新。
本發(fā)明將通過參考附圖和下文中描述的典型實(shí)施例進(jìn)行說明。圖中
圖1示出了對話系統(tǒng)的示意圖,圖2示出了根據(jù)本發(fā)明的對話控制開發(fā)的流程圖,圖3a示出了對話系統(tǒng)的對話的圖形表示,圖3b示出了對話系統(tǒng)的子對話的圖形表示,圖4示出了技術(shù)對話控制的例子,圖5示出了圖4中所示的技術(shù)對話控制的兩個(gè)子對話。
圖1中示出了根據(jù)本發(fā)明具有對話控制DS的對話系統(tǒng)的設(shè)計(jì)實(shí)例,該對話系統(tǒng)與應(yīng)用程序AP、語音產(chǎn)生單元SG以及語音輸入接口SP一同工作。該對話控制DS根據(jù)其執(zhí)行的狀態(tài)、轉(zhuǎn)換以及對話控制對話系統(tǒng)。
輸入的語音話語S首先通過語音輸入接口SP的信號記錄單元SA轉(zhuǎn)換成數(shù)字音頻語音信號AS,并傳送到語音識別單元SE。語音理解過程,也就是對于語音識別單元SE已知的話語識別由對話控制DS通過啟動信號ST啟動。
通常,結(jié)合到語音輸入接口SP的語音識別單元SE包含語法分析單元和語義合成單元(在此都未示出),其根據(jù)對話控制規(guī)定的用戶語法GR檢驗(yàn)數(shù)字化語音話語AS的有效性,并將它轉(zhuǎn)化成識別結(jié)果ER,其作為對于用戶話語的響應(yīng),包含編程語言或者機(jī)器碼指令。該識別結(jié)果ER一方面被發(fā)送到對話控制DS以便允許其恢復(fù)對話程序的控制,并且在另一方面它被發(fā)送到應(yīng)用程序AP,以便由其直接執(zhí)行。可替換地,該識別結(jié)果ER能夠通過語音識別單元SE僅發(fā)送到對話控制DS,以便由此傳遞到應(yīng)用程序AP。
因此,對話控制DS是對話系統(tǒng)的中心轉(zhuǎn)換點(diǎn),因?yàn)樗?guī)定了會由語音識別單元SE認(rèn)為有效所接收的對話,并且因此間接地控制應(yīng)用程序AP。此外,對話控制DS還控制語音產(chǎn)生單元SG,其根據(jù)在對話控制DS中執(zhí)行的對話啟動由系統(tǒng)到用戶的語音話語產(chǎn)生。
通常,語音輸入接口SP的語音識別元件SE,應(yīng)用程序AP以及對話控制DS均是用相同的面向?qū)ο蠓g器語言編寫的,或者至少以一種能夠在相同平臺上執(zhí)行的語言編寫。
圖2是對話控制開發(fā)的示意順序。其還示出了根據(jù)本發(fā)明對話開發(fā)環(huán)境的所有重要部件。它包括了表示顯示器和編輯器裝置的圖形對話編輯器GE,利用該編輯器GE對話開發(fā)者能夠可視化并設(shè)計(jì)對話。為此,各種基本組件對他是可用的,例如對話,狀態(tài)和轉(zhuǎn)換,其在技術(shù)上可作為類體系的基本類實(shí)現(xiàn),并且他可以選擇其作為在圖形對話編輯器GE中的圖形符號,并且通過明確定義的接口能夠與其它組件適當(dāng)?shù)亟M合。
第一個(gè)開發(fā)循環(huán)的結(jié)果是圖形對話描述GB,其最初僅實(shí)際上以編輯器的內(nèi)部表示形式存在。圖形對話描述GB通過轉(zhuǎn)換器UM被轉(zhuǎn)換為技術(shù)對話描述TB,因?yàn)閳D形對話描述GB的單獨(dú)(圖形)組件被轉(zhuǎn)換成面向?qū)ο缶幊陶Z言的類實(shí)例。這些類實(shí)例表示以編程語言形式的圖形組件(比較圖4和5),例如作為用于對話、狀態(tài)和轉(zhuǎn)換的基本類實(shí)例,或者換句話說用于特殊子對話的具有繼承特性的衍生類。
由轉(zhuǎn)換器UM產(chǎn)生的技術(shù)對話描述TB能夠借助于文本編輯器TE由對話開發(fā)者進(jìn)行編輯,其可以是用于由轉(zhuǎn)換器UM產(chǎn)生的編程語言的理想編程環(huán)境的一部分。通過編輯技術(shù)對話描述TB的可能性,對話開發(fā)者能夠編程出要被開發(fā)的對話控制DS,也就是,通過細(xì)節(jié)對它進(jìn)行補(bǔ)充,該細(xì)節(jié)或者是他在設(shè)計(jì)圖形對話描述GB時(shí)不能實(shí)現(xiàn)的,或者是對于他在技術(shù)編程水平上實(shí)現(xiàn)更容易。
對話開發(fā)者借助于技術(shù)對話編輯器TE對技術(shù)對話描述TB作出的改變能夠通過更新器AK重新結(jié)合到圖形對話描述中,以至于對話開發(fā)的兩級抽象彼此保持一致。在此期間,新編程的技術(shù)對話描述TB的類/組件或者方法借助于相應(yīng)的符號以圖形對話描述GB可視化,并且根據(jù)新編程的組件的關(guān)系,它們被連接到圖形對話描述GB的其它符號。
在本發(fā)明的特別有利的實(shí)施例中,執(zhí)行更新的AK,以至于通過更新的圖形對話描述GB的更新轉(zhuǎn)換UM產(chǎn)生技術(shù)對話描述TB,其(在由合適的編譯器翻譯之后)顯示出與由對話開發(fā)者改變的最初技術(shù)對話描述TB相同的運(yùn)行時(shí)行為。
在對話數(shù)據(jù)庫DB中,子對話以及標(biāo)準(zhǔn)化對話元件以程序碼的形式存儲,其能夠被讀入到文本對話編輯器TE中作為技術(shù)對話描述TB,并且由對話開發(fā)者改變,作為用于需被新開發(fā)的對話的基礎(chǔ),或者作為現(xiàn)存對話的擴(kuò)展/改變。類似地,現(xiàn)存對話和對話組件可以存儲在數(shù)據(jù)庫DB中以備后續(xù)使用。由于面向?qū)ο缶幊陶Z言被用于技術(shù)對話描述TB,所以對話數(shù)據(jù)庫DB可以包含類體系,從中對話開發(fā)者可以選擇適合于他的目的、用于編程的抽象級的類。從這些類體系和庫開始,新對話的開發(fā)通過衍生或者繼承和抽象出現(xiàn)在技術(shù)和圖形描述水平TB,GB。
完成的技術(shù)對話描述TB由編譯器UB翻譯成機(jī)器碼對話控制DS,其最后被結(jié)合到圖1中示出的對話系統(tǒng)中。
該對話控制DS的(確定性)行為可以借助于完全描述系統(tǒng)所有狀態(tài)的狀態(tài)/轉(zhuǎn)換圖以及導(dǎo)致狀態(tài)變化(轉(zhuǎn)換)的事件正式地描述。圖3通過一個(gè)例子示出了一簡單對話HD的狀態(tài)/轉(zhuǎn)換圖,其由對話控制DS實(shí)現(xiàn)。該對話HD可以假定一狀態(tài)S1,具有一子對話SD,該子對話沒有以任何進(jìn)一步細(xì)節(jié)規(guī)定,其中又至少規(guī)定了另一個(gè)的狀態(tài),并且還具有四個(gè)轉(zhuǎn)換T1,T2以及T3/T4,其分別由對話步驟啟動。該轉(zhuǎn)換T1本身映射了狀態(tài)S1,而其它轉(zhuǎn)換T2和T3/T4描述了狀態(tài)S1和在子對話SD中規(guī)定的其中一個(gè)狀態(tài)之間的改變。
狀態(tài)S1是對話系統(tǒng)的最初狀態(tài)或者起始狀態(tài),其在與用戶的每次對話結(jié)束時(shí)重新假設(shè)。在該狀態(tài),系統(tǒng)產(chǎn)生一促使用戶產(chǎn)生一話語的起始短語“我可以為你做什么”。用于啟動轉(zhuǎn)換T1的“時(shí)間是幾點(diǎn)?”以及啟動轉(zhuǎn)換T2的“天氣預(yù)報(bào)怎么說”兩個(gè)語音話語現(xiàn)在對于用戶而言是開放的。在第一種情況下,系統(tǒng)響應(yīng)準(zhǔn)確的時(shí)間,并且完成相應(yīng)的轉(zhuǎn)換T1,因?yàn)闉榱嗽俅谓o出起始話語,它返回到起始狀態(tài)S1。在后一種情況下,系統(tǒng)經(jīng)由轉(zhuǎn)換T2和輸入接口IN改變到子對話SD。從子對話SD,轉(zhuǎn)換T3/T4經(jīng)由輸出接口OUT返回到起始狀態(tài)S1,其中在轉(zhuǎn)換T2中提出的問題得到了回答。
圖3b示出了子對話SD的相應(yīng)狀態(tài)/轉(zhuǎn)換圖。它示出了一狀態(tài)S2,其經(jīng)由一輸入接口IN和一輸出接口OUT與在圖3a中示出的較高級主對話HD連接。子對話SD具有一狀態(tài)S2,經(jīng)由轉(zhuǎn)換T2從主對話HD的狀態(tài)達(dá)到該狀態(tài),以及兩個(gè)轉(zhuǎn)換T3和T4,它們都承擔(dān)了在主對話HD中規(guī)定的狀態(tài)到狀態(tài)的改變。
在轉(zhuǎn)換T2的對話步驟“天氣預(yù)報(bào)怎么說”之后,對于用戶需求的更準(zhǔn)確規(guī)定,子對話SD通過反問題“明天還是下個(gè)星期”進(jìn)行響應(yīng),并且改變到新的狀態(tài)S2。在狀態(tài)S2,用戶僅可以利用對話步驟“明天”或“下周”回答對話控制DS的反問題。在狀態(tài)S2,他不再具有詢問時(shí)間的選項(xiàng);為了實(shí)現(xiàn)這個(gè)目的,首先必須離開子對話SD并且狀態(tài)S1會重新開始。在來自于用戶澄清的基礎(chǔ)上,對話控制DS根據(jù)“明天”還是“下周”的天氣預(yù)報(bào)而有區(qū)分地回答,并且借助于相應(yīng)的轉(zhuǎn)換T3或T4,它經(jīng)由輸出接口OUT分支返回到主對話HD,接著返回到起始狀態(tài)S1。
在圖3a和3b中的圖表示了圖形對話描述GB的一個(gè)例子。對話開發(fā)者通過狀態(tài)S1,S2,轉(zhuǎn)換T1,T2,T3,T4以及子對話SD的規(guī)定圖形化地設(shè)計(jì)對話HD。這里,對話步驟可以通過雙擊以及文本輸入與相應(yīng)的轉(zhuǎn)換T1,T2,T3,T4相關(guān)聯(lián)。在圖形對話描述GB UM轉(zhuǎn)換成技術(shù)對話描述中,對話HD的組件(狀態(tài),轉(zhuǎn)換和子對話)被轉(zhuǎn)換成以面向?qū)ο缶幊陶Z言形式的編程語言版本。圖4和5中示出了這種來自于圖3a和3b的圖形對話描述的UM轉(zhuǎn)換。
為了說明,下述的示例技術(shù)對話描述TB是由面向?qū)ο缶幊陶Z言C#編寫的。然而從根本上任何其它面向?qū)ο缶幊陶Z言對于技術(shù)對話描述TB的定義是適合的。圖4示出了作為類“ExampleDialogue”的主對話HD,其從由系統(tǒng)規(guī)定的基本對話類“Dialogue”衍生而來,并且其繼承了類“Dialogue”的特性?!癊xampleDialogue”限定了兩個(gè)狀態(tài)“state1”和“state2”,兩個(gè)轉(zhuǎn)換“WeatherTrans”和“timeTrans”以及一子對話“Weather”。盡管狀態(tài)“state1”和“state2”以及轉(zhuǎn)換“WeatherTrans”是基本類“State”和“TPansition”對于狀態(tài)和轉(zhuǎn)換的實(shí)例,但是“timeTrans”和“Weather”形成了由對話開發(fā)者同樣實(shí)現(xiàn)的兩個(gè)類的實(shí)例,其又從其它基本類中衍生,并且在圖5中指定。
當(dāng)通過調(diào)用四個(gè)構(gòu)造器實(shí)例化時(shí),類“ExampleDialogue”的Initialize()方法產(chǎn)生對象“state1”,“WeatherTrans”,“timeTrans”和“Weather”。對象“state1”表示起始狀態(tài)S1,其與對話系統(tǒng)最初與用戶通信的對話步驟相關(guān)聯(lián)。對象“WeatherTrans”表示轉(zhuǎn)換T2,其從狀態(tài)“state1”S1改變到子對話SD“Weather”的狀態(tài),并且從而作出給定階段的輸出。對象“timeTrans”映射狀態(tài)“state1”到其本身,并且對象“Weather”表示子對話SD,可能從狀態(tài)“State1”S1分支到其中。
為了完全規(guī)定對話HD,現(xiàn)在所缺少的是類“TimeTransition”和“WeatherDialogue”的規(guī)定,其在這個(gè)水平是未知的,其例子表示對象“timeTrans”和“Weather”。這些在圖5中示出。
類“TimeTransition”從類“Transition”中衍生出,其中主對話HD的對象“WeatherTrans”已經(jīng)表示一實(shí)例。該類僅實(shí)現(xiàn)了對于問題的回答,其已經(jīng)在主對話HD的類“ExampleDialogue”實(shí)例化時(shí)作為參數(shù)被賦予對象“timeTrans”。
類“WeatherDialogue”從類“sub-dialogue”中衍生,其又包含一狀態(tài)“state”S2和兩個(gè)轉(zhuǎn)換“TomorrowTrans”T3和“WeekTrans”T4。該類表示圖3b中示出的子對話SD的技術(shù)程序轉(zhuǎn)換UM。它在具有反問題的狀態(tài)“state”S2根據(jù)狀態(tài)/轉(zhuǎn)換圖響應(yīng)關(guān)于天氣預(yù)報(bào)的問題(比較在“ExamdleDialogue”中的它的實(shí)例參數(shù)),并且以具有轉(zhuǎn)換“tommorowTrans”T3或“WeekTrans”不同的方式響應(yīng)。到以“Exit”結(jié)束子對話時(shí),它將控制傳遞回到類“ExampleDialogue”的更高級對象,其實(shí)例化類“ExampleDialogue”的對象“Weather”。
技術(shù)對話描述TB-包含上述的三個(gè)類,用來實(shí)現(xiàn)主和子對話HD,SD-最終通過編譯器UB(對照圖2)翻譯成機(jī)器碼,從而形成對話控制DS。為了在對話系統(tǒng)中對話控制DS的運(yùn)行,類“ExampleDialogue”的較高級對象通過調(diào)用相應(yīng)的構(gòu)造器被實(shí)例化,其依次通過另一對象的實(shí)例化實(shí)現(xiàn)完整的對話。
最后,應(yīng)再一次指出,由圖和說明書表示的具體對話系統(tǒng)和開發(fā)系統(tǒng)僅是設(shè)計(jì)實(shí)例,本領(lǐng)域技術(shù)人員能夠在不背離本發(fā)明范圍的情況下進(jìn)行很大程度的改變。特別是在此示出的設(shè)計(jì)實(shí)例中的程序片段是由面向?qū)ο缶幊陶Z言C#編寫的,其可以以任何其他面向?qū)ο缶幊陶Z言編寫。更應(yīng)清楚的是,這里示出的對話設(shè)計(jì)實(shí)例是非常簡單、短的實(shí)例,選擇這樣的實(shí)例是為了盡可能簡單地說明本發(fā)明?,F(xiàn)實(shí)中的對話本質(zhì)上是相當(dāng)復(fù)雜的。為了完整性,還應(yīng)指出的是,不定冠詞“a”或“an”的使用不排除在問題中特征出現(xiàn)多個(gè)的可能性,并且術(shù)語“包含”的使用不排除其它元件或步驟的存在。
權(quán)利要求
1.一種對于具有語音用戶接口(SP)和應(yīng)用程序(AP)的對話系統(tǒng)產(chǎn)生對話控制(DS)的方法,其中對話控制(DS)與語音輸入接口(SP)和應(yīng)用程序(AP)一起工作,具有以下步驟產(chǎn)生包含圖形對話組件的圖形對話描述(GB),其在圖形對話描述(GB)產(chǎn)生期間借助于顯示裝置被顯示,將圖形對話描述(GB)的圖形對話組件轉(zhuǎn)換成以面向?qū)ο蠓g器語言的類形式的技術(shù)對話描述(TB)的技術(shù)對話組件,以及形成對話控制(DS)的同時(shí),將技術(shù)對話描述(TB)翻譯成可以由對話系統(tǒng)直接使用的二進(jìn)制數(shù)據(jù)。
2.如權(quán)利要求1所述的方法,其特征在于,技術(shù)對話描述(TB)可以進(jìn)行文本上的改變,其中,如果必要,圖形對話描述(GB)至少部分地通過技術(shù)對話描述(TB)的文本改變進(jìn)行補(bǔ)充,并且顯示補(bǔ)充的圖形對話描述(GB),并且在圖形對話描述(GB)到技術(shù)對話描述(TB)的轉(zhuǎn)換中,考慮技術(shù)對話描述(TB)的文本改變。
3.如權(quán)利要求1或2所述的方法,其特征在于,現(xiàn)存技術(shù)對話描述(TB)至少部分地轉(zhuǎn)換成圖形對話描述(GB)作為產(chǎn)生新圖形對話描述(GB)的基礎(chǔ)。
4.如權(quán)利要求1到3中任一個(gè)所述的方法,其特征在于,給定的對話描述類體系和/或?qū)υ捗枋鲱悗斓拿嫦驅(qū)ο箢愔辽俨糠值乇槐硎緸閳D形對話組件,圖形對話描述(GB)通過圖形選擇、組合和/或圖形對話組件的改變產(chǎn)生,圖形對話描述(GB)通過由圖形對話組件表示的規(guī)定類的衍生轉(zhuǎn)換成以衍生類形式的技術(shù)對話描述(TB)的技術(shù)對話組件。
5.如權(quán)利要求1到4中任一個(gè)所述的方法,其特征在于,規(guī)定的子對話描述至少部分地被圖形化表示為圖形對話組件,被選擇以及結(jié)合到圖形對話描述(GB)中。
6.如權(quán)利要求1到5中任一個(gè)所述的方法,其特征在于,在圖形對話描述(GB)的情況下,所有的圖形對話組件由符號表示,并且通過選擇、拷貝和鏈接符號以及改變由符號表示的技術(shù)對話組件,產(chǎn)生圖形對話描述(GB)。
7.一種對于具有語音輸入接口(SP)和應(yīng)用程序(AP)的對話系統(tǒng)產(chǎn)生對話控制(DS)的系統(tǒng),其中對話控制(DS)與語音輸入接口(SP)和應(yīng)用程序(AP)一起工作,包含圖像對話編輯器(GE),用于可視化并改變圖形對話描述(GB)的圖形對話組件,轉(zhuǎn)換器(UM),用于將圖形對話組件轉(zhuǎn)換成以面向?qū)ο蠓g器語言的類形式的技術(shù)對話描述(TB)的技術(shù)對話組件,以及翻譯器(UB),用來在形成對話控制(DS)的同時(shí),將技術(shù)對話描述翻譯成由對話系統(tǒng)可以直接使用的二進(jìn)制數(shù)據(jù)。
8.如權(quán)利要求7所述的系統(tǒng),其特征在于,文本對話編輯器(TE),用來改變技術(shù)對話描述(TB),以及更新器(AK),用來通過技術(shù)對話描述(TB)的文本改變至少部分補(bǔ)充圖形對話描述(GB)。
9.如權(quán)利要求7或8所述的系統(tǒng),其特征在于,它在與對話控制(DS)相同的運(yùn)行時(shí)環(huán)境中是可操作的。
10.一種具有對話控制(DS)、語音用戶接口(SP)和應(yīng)用程序(AP)的對話系統(tǒng),其中對話控制(DS)與語音輸入接口(SP)和應(yīng)用程序(AP)一起工作,并且對話控制(DS)利用由權(quán)利要求1到6中任一個(gè)所述的方法產(chǎn)生。
11.如權(quán)利要求10所述的對話系統(tǒng),其特征在于,在操作期間,可以結(jié)合和采用一種新的對話控制(DS)。
全文摘要
本發(fā)明描述了一種開發(fā)用于對話系統(tǒng)的對話控制(DS)的方法和系統(tǒng),其一方面控制與用戶的對話,另一方面監(jiān)測對話系統(tǒng)的語音用戶接口(SP)和應(yīng)用程序(AP)。首先,產(chǎn)生圖形對話描述(GB),其在開發(fā)過程中由開發(fā)系統(tǒng)的顯示裝置顯示。隨后,圖形對話描述(GB)轉(zhuǎn)換成技術(shù)對話描述(TB),該技術(shù)對話描述(TB)包含面向?qū)ο蠓g器語言的類并且將這些類翻譯成二進(jìn)制格式,其最終表示由對話系統(tǒng)執(zhí)行的對話控制(DS)。
文檔編號H04M3/493GK1864203SQ200480029574
公開日2006年11月15日 申請日期2004年10月6日 優(yōu)先權(quán)日2003年10月10日
發(fā)明者M·奧爾德 申請人:皇家飛利浦電子股份有限公司