欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

采用語(yǔ)音識(shí)別和自然語(yǔ)言處理的網(wǎng)絡(luò)交互式用戶界面的制作方法

文檔序號(hào):2822003閱讀:220來(lái)源:國(guó)知局
專利名稱:采用語(yǔ)音識(shí)別和自然語(yǔ)言處理的網(wǎng)絡(luò)交互式用戶界面的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及用于網(wǎng)絡(luò)計(jì)算機(jī)用戶界面的語(yǔ)音識(shí)別。更具體來(lái)說(shuō),本發(fā)明涉及一種用語(yǔ)音識(shí)別和自然語(yǔ)言處理與計(jì)算機(jī)進(jìn)行用戶交互的新穎方法和系統(tǒng)。本申請(qǐng)是美國(guó)專利申請(qǐng)“Interactive User InterfaceUsing Speech Recognition and Natural Language Processing”(采用語(yǔ)音識(shí)別和自然語(yǔ)言處理的交互式用戶界面)(申請(qǐng)?zhí)?9/150,459,申請(qǐng)日1998年9月10日)的部分繼續(xù)申請(qǐng)。
隨著計(jì)算機(jī)變得更加盛行,明顯有許多人在掌握計(jì)算機(jī)知識(shí)和與計(jì)算機(jī)交流等方面困難很大。用戶要操作計(jì)算機(jī),就必須經(jīng)常學(xué)習(xí)各種已不通用的命令和非直觀的過(guò)程。例如,大多數(shù)計(jì)算機(jī)都使用基本上是菜單驅(qū)動(dòng)的基于視窗的操作系統(tǒng)。這要求用戶學(xué)習(xí)什么菜單命令或命令序列會(huì)產(chǎn)生預(yù)定結(jié)果。
此外,傳統(tǒng)的與計(jì)算機(jī)的交互的速度經(jīng)常因諸如鍵盤或鼠標(biāo)的手工輸入設(shè)備而減慢。許多計(jì)算機(jī)用戶都不是打字快手。結(jié)果,許多時(shí)間都花費(fèi)在通過(guò)這些手工輸入設(shè)備向計(jì)算機(jī)發(fā)送命令和單詞上。已經(jīng)明顯需要有一種更容易、更快速和更直觀的與計(jì)算機(jī)和網(wǎng)絡(luò)對(duì)象(如網(wǎng)站)通信的方法。
有人提出的計(jì)算機(jī)交互的方法是語(yǔ)音識(shí)別。語(yǔ)音識(shí)別涉及用軟件和硬件協(xié)作監(jiān)測(cè)聽(tīng)得見(jiàn)的人類語(yǔ)音并把所監(jiān)測(cè)的語(yǔ)音轉(zhuǎn)換成單詞串。如現(xiàn)有技術(shù)中已知的那樣,語(yǔ)音識(shí)別的工作方式是把硬件監(jiān)測(cè)到的語(yǔ)音分解成不可分的更小單位的聲音-稱作音素(phonemes)。音素是不同的聲音單元。例如,單詞“those”由三個(gè)音素組成;第一個(gè)音素是“th”音,第二個(gè)是“o”音,第三個(gè)是“s”音。語(yǔ)音識(shí)別軟件試圖將所監(jiān)測(cè)的音素與一個(gè)存儲(chǔ)的字典中的已知單詞比較。美國(guó)專利4,783,803號(hào)中給出了一個(gè)語(yǔ)音識(shí)別系統(tǒng)的例子,該專利名稱為“SpeechRecognition Apparatus and Method”(語(yǔ)音識(shí)別裝置和方法)(1998年11月8日授權(quán),受讓給Dragon Systems公司),這里引用作為參考。目前,市場(chǎng)上有許多語(yǔ)音識(shí)別軟件包,出自Dragon Systems公司和IBM公司這樣的公司。
這些語(yǔ)音識(shí)別軟件包的一個(gè)缺陷是,它們通常只執(zhí)行命令和控制功能或者口授指令功能。所以,用戶仍然需要學(xué)習(xí)命令語(yǔ)匯才能操作計(jì)算機(jī)。
有人提出的這些語(yǔ)音識(shí)別系統(tǒng)的增強(qiáng)系統(tǒng),是用自然語(yǔ)言處理系統(tǒng)處理所監(jiān)測(cè)的單詞。自然語(yǔ)言處理一般涉及通過(guò)分析所監(jiān)測(cè)的單詞的語(yǔ)法關(guān)系和相對(duì)語(yǔ)境,確定它們的概念上的“意思”(例如說(shuō)話人想要傳達(dá)什么意思)。例如美國(guó)4,887,212號(hào)專利敘述了一種用單詞隔離、語(yǔ)形學(xué)分析、字典查找和語(yǔ)法分析來(lái)分析一個(gè)輸入單詞流的方法。該專利名稱為“Parser for Natural Language Text”(自然語(yǔ)言文本分析器)(1989年12月12日授權(quán),受讓給IBM公司),這里引用作為參考。
與語(yǔ)音識(shí)別一起采用的自然語(yǔ)言處理提供一種用口語(yǔ)而不是諸如鍵盤或鼠標(biāo)的手工輸入操作計(jì)算機(jī)的強(qiáng)大工具。然而,常規(guī)的自然語(yǔ)言處理系統(tǒng)的一個(gè)缺點(diǎn)是,它可能無(wú)法確定由語(yǔ)音識(shí)別系統(tǒng)所監(jiān)測(cè)的單詞的準(zhǔn)確“意思”。在這樣的情況下,用戶通常需要重新組合或重新陳述短語(yǔ)(phrase),希望自然語(yǔ)言處理系統(tǒng)將能在后面的嘗試中確定準(zhǔn)確“意思”。顯然,這會(huì)導(dǎo)致嚴(yán)重的延遲,因?yàn)橛脩粜枰匦玛愂稣麄€(gè)句子或命令。常規(guī)系統(tǒng)的另一個(gè)缺點(diǎn)是,語(yǔ)音識(shí)別所需的時(shí)間可能會(huì)過(guò)分長(zhǎng)。這主要由于與大量要處理的信息相比,處理資源的速度有限。例如,在許多常規(guī)語(yǔ)音識(shí)別程序中,識(shí)別話語(yǔ)(utterance)所需的時(shí)間很長(zhǎng),因?yàn)樗阉鞯淖值湮募艽蟆?br> 常規(guī)語(yǔ)音識(shí)別和自然語(yǔ)言處理系統(tǒng)的再一個(gè)缺點(diǎn)是,它們不是交互式的,因此不能應(yīng)付新情況。當(dāng)計(jì)算機(jī)系統(tǒng)遇到未知的或新的網(wǎng)絡(luò)對(duì)象,計(jì)算機(jī)與對(duì)象之間形成新的關(guān)系。常規(guī)的語(yǔ)音識(shí)別和自然語(yǔ)言處理系統(tǒng)不能應(yīng)付由以前未知的網(wǎng)絡(luò)對(duì)象形成的新關(guān)系所導(dǎo)致的情況。結(jié)果,就不可能與計(jì)算機(jī)進(jìn)行對(duì)話方式的交互。用戶需要向計(jì)算機(jī)傳達(dá)完整的概念。用戶不能說(shuō)句子片斷,因?yàn)檫@些(與前面的話語(yǔ)有關(guān)的)句子片斷的意思將丟失。
采用語(yǔ)音識(shí)別和自然語(yǔ)言處理的計(jì)算機(jī)所需要的是一種避免上述缺點(diǎn)的交互式用戶界面。
本發(fā)明是一種用于與采用話語(yǔ)、語(yǔ)音處理和自然語(yǔ)言處理的計(jì)算機(jī)進(jìn)行交互的新穎和改進(jìn)的系統(tǒng)和方法。一般來(lái)說(shuō),該系統(tǒng)包含一個(gè)語(yǔ)音處理器(speech processor),用于在一個(gè)第一語(yǔ)法文件中搜索話語(yǔ)的一個(gè)匹配短語(yǔ),并用于在如果在第一語(yǔ)法文件中找不到匹配短語(yǔ)時(shí),在一個(gè)第二語(yǔ)法文件中搜索匹配短語(yǔ)。該系統(tǒng)也包括一個(gè)用于在一個(gè)數(shù)據(jù)庫(kù)中搜索匹配短語(yǔ)的對(duì)應(yīng)匹配條目(matching entry)的自然語(yǔ)言處理器,以及一個(gè)如果在數(shù)據(jù)庫(kù)中找到匹配條目就執(zhí)行一個(gè)與匹配條目相關(guān)聯(lián)的行動(dòng)(action)的應(yīng)用界面(applicationinterface)。
在最佳實(shí)施例中,如果在數(shù)據(jù)庫(kù)中找不到匹配條目,自然語(yǔ)言處理器就用匹配短語(yǔ)更新數(shù)據(jù)庫(kù)、第一語(yǔ)法文件和第二語(yǔ)法文件的至少其中之一。
第一語(yǔ)法文件是一個(gè)特定語(yǔ)境語(yǔ)法文件。特定語(yǔ)境語(yǔ)法文件是一種含有與特定主題高度相關(guān)的單詞和短語(yǔ)的語(yǔ)法文件。第二語(yǔ)法文件是一個(gè)一般性語(yǔ)法文件。一般性語(yǔ)法文件是一種含有不必按語(yǔ)境解釋的單詞和短語(yǔ)的語(yǔ)法文件。就是說(shuō),一般性語(yǔ)法文件中的單詞和短語(yǔ)不屬于任何母體語(yǔ)境(parent context)。本發(fā)明在搜索一般性語(yǔ)法文件之前搜索特定語(yǔ)境語(yǔ)法文件,從而允許用戶用更口語(yǔ)化的方式與計(jì)算機(jī)交流,其中,所說(shuō)出的單詞如果在特定語(yǔ)境語(yǔ)法文件中被找到,就被參照最近討論過(guò)的主題進(jìn)行解釋。
在本發(fā)明的另外一個(gè)方面中,如果在一般性語(yǔ)法文件中找不到匹配短語(yǔ),語(yǔ)音識(shí)別處理器就在一個(gè)口授語(yǔ)法(dictation grammar)中搜索匹配短語(yǔ)。口授語(yǔ)法是個(gè)一般性單詞和短語(yǔ)的大單詞表。通過(guò)首先搜索特定語(yǔ)境語(yǔ)法和一般性語(yǔ)法,預(yù)計(jì)將大大縮短語(yǔ)音識(shí)別時(shí)間-因?yàn)樘囟ㄕZ(yǔ)境語(yǔ)法和一般性語(yǔ)法是物理上比口授語(yǔ)法更小的文件。
在本發(fā)明的另外一個(gè)方面中,自然語(yǔ)言處理器在搜索數(shù)據(jù)庫(kù)之前替換匹配短語(yǔ)中的至少一個(gè)單詞。這可由自然語(yǔ)言處理器中的用于以通配符替換匹配短語(yǔ)中的至少一個(gè)單詞的變量置換器(variablereplacer)完成。通過(guò)以通配符替換短語(yǔ)中的某些單詞(稱作“單詞變量”),可以大大地減少數(shù)據(jù)庫(kù)中條目的數(shù)量。此外,自然語(yǔ)言處理器中的代詞替換器(pronoun substituter)可以以適當(dāng)名稱替換匹配短語(yǔ)中的代詞,便于特定于用戶的事實(shí)在數(shù)據(jù)庫(kù)中的存儲(chǔ)。
在本發(fā)明的另外一個(gè)方面中,一個(gè)串格式化器(string formatter)在搜索數(shù)據(jù)庫(kù)之前對(duì)匹配短語(yǔ)進(jìn)行文本格式化。一個(gè)單詞加權(quán)器(wordweighter)也在搜索數(shù)據(jù)庫(kù)之前按各個(gè)單詞的相對(duì)重要性加權(quán)匹配短語(yǔ)中的各個(gè)單詞。這些步驟便于更快、更準(zhǔn)確地搜索數(shù)據(jù)庫(kù)。
自然語(yǔ)言處理器中的一個(gè)搜索引擎為匹配條目生成一個(gè)可信度值(confidence value)。自然語(yǔ)言處理器將該可信度值與一個(gè)閥值比較。一個(gè)布爾檢測(cè)器(boolean tester)確定匹配條目中是否存在所需數(shù)量的匹配短語(yǔ)中的單詞。該布爾檢測(cè)的作用是驗(yàn)證由搜索引擎返回的結(jié)果。
為了消除歧義,自然語(yǔ)言處理器在匹配條目中不存在所需數(shù)量的匹配短語(yǔ)中的單詞時(shí),提示用戶匹配條目是否是話語(yǔ)的正確解釋。如果匹配條目不是話語(yǔ)的正確解釋,自然語(yǔ)言處理器也提示用戶提供另外的信息。用該另外的信息更新數(shù)據(jù)庫(kù)、第一語(yǔ)法文件和第二語(yǔ)法文件的至少其中之一。這樣,本發(fā)明適應(yīng)性地“學(xué)習(xí)”更多的話語(yǔ)的意思,由此增強(qiáng)用戶界面的效率。
語(yǔ)音處理器將啟用并檢索一個(gè)與匹配條目相關(guān)聯(lián)的特定語(yǔ)境語(yǔ)法,用于其后一個(gè)話語(yǔ)的其后一個(gè)匹配短語(yǔ)。這保證首先將檢索到最相關(guān)的單詞和短語(yǔ),由此減少語(yǔ)音識(shí)別的次數(shù)。
一般來(lái)說(shuō),本發(fā)明包括一種用于為與網(wǎng)絡(luò)對(duì)象(如網(wǎng)頁(yè))進(jìn)行語(yǔ)音交互而更新計(jì)算機(jī)的方法。一開(kāi)始,通過(guò)網(wǎng)絡(luò)向計(jì)算機(jī)傳輸一個(gè)隨語(yǔ)音交互系統(tǒng)與網(wǎng)絡(luò)對(duì)象相關(guān)聯(lián)的網(wǎng)絡(luò)對(duì)象表。網(wǎng)絡(luò)對(duì)象表的位置可以嵌置在網(wǎng)絡(luò)對(duì)象內(nèi)、位于某特定因特網(wǎng)網(wǎng)站或位于存儲(chǔ)多個(gè)網(wǎng)絡(luò)對(duì)象的網(wǎng)絡(luò)對(duì)象表的統(tǒng)一位置。在網(wǎng)絡(luò)對(duì)象表中檢索匹配網(wǎng)絡(luò)對(duì)象的條目。與網(wǎng)絡(luò)對(duì)象匹配的條目可能導(dǎo)致執(zhí)行一個(gè)行動(dòng),諸如通過(guò)揚(yáng)聲器播出正文言語(yǔ)、采用一個(gè)特定語(yǔ)境語(yǔ)法文件或采用一個(gè)自然語(yǔ)言處理數(shù)據(jù)庫(kù)。網(wǎng)絡(luò)對(duì)象表可以是一個(gè)對(duì)話定義文件的一部分。對(duì)話定義文件也可以包含一個(gè)特定語(yǔ)境語(yǔ)法、一個(gè)自然語(yǔ)言處理數(shù)據(jù)庫(kù)條目,或者包含這二者。
在本發(fā)明的另一個(gè)方面中,一個(gè)網(wǎng)絡(luò)接口通過(guò)網(wǎng)絡(luò)傳輸一個(gè)對(duì)話定義文件。對(duì)話定義文件含有一個(gè)網(wǎng)絡(luò)對(duì)象表。一個(gè)數(shù)據(jù)處理器在網(wǎng)絡(luò)對(duì)象表中檢索與網(wǎng)絡(luò)對(duì)象匹配的表?xiàng)l目。找到匹配表?xiàng)l目后,一個(gè)應(yīng)用界面執(zhí)行該匹配條目規(guī)定的一個(gè)行動(dòng)。
在本發(fā)明的另一個(gè)方面中,定位并讀取一個(gè)與網(wǎng)絡(luò)對(duì)象相關(guān)的對(duì)話定義文件。對(duì)話定義文件可以從各種位置讀取,例如從網(wǎng)站、從存儲(chǔ)介質(zhì)或者從一個(gè)存儲(chǔ)多個(gè)網(wǎng)絡(luò)對(duì)象的對(duì)話定義文件的位置讀取。搜索對(duì)話定義文件中包含的一個(gè)網(wǎng)絡(luò)對(duì)象表,以查找與網(wǎng)絡(luò)對(duì)象匹配的表?xiàng)l目。匹配條目定義一個(gè)與網(wǎng)絡(luò)對(duì)象相關(guān)的行動(dòng),然后由系統(tǒng)執(zhí)行該行動(dòng)。除了網(wǎng)絡(luò)對(duì)象表外,對(duì)話定義文件也可以包含一個(gè)特定語(yǔ)境語(yǔ)法、一個(gè)自然語(yǔ)言處理數(shù)據(jù)庫(kù)的條目,或者包含這二者。
根據(jù)以下結(jié)合附圖所作的詳細(xì)說(shuō)明,本發(fā)明的特點(diǎn)、目的和優(yōu)點(diǎn)將變得更加明顯。附圖中相同的標(biāo)注符自始至終標(biāo)識(shí)相對(duì)應(yīng)的對(duì)象,其中

圖1是一個(gè)用于本發(fā)明的典型計(jì)算機(jī)系統(tǒng)的功能框圖;圖2是本發(fā)明的圖1的計(jì)算機(jī)系統(tǒng)的CPU102和存儲(chǔ)介質(zhì)108的擴(kuò)展的功能框圖;圖3A-3D是向計(jì)算機(jī)提供交互式語(yǔ)音識(shí)別和自然語(yǔ)言處理的方法的流程圖;圖4是本發(fā)明的典型的自然語(yǔ)言處理(NLP)數(shù)據(jù)庫(kù)的選擇列的示意圖。
圖5是按照本發(fā)明的典型的對(duì)話定義文件(DDF)的示意圖。
圖6本發(fā)明的典型的網(wǎng)絡(luò)對(duì)象表的選擇列的示意圖。
圖7A-7C是本發(fā)明的方法的流程圖,解釋的是交互式語(yǔ)音識(shí)別和自然語(yǔ)言處理與網(wǎng)絡(luò)對(duì)象(如網(wǎng)頁(yè))的鏈接。
圖8是通過(guò)因特網(wǎng)連接到其它計(jì)算機(jī)、存貯介質(zhì)和網(wǎng)站的計(jì)算機(jī)系統(tǒng)的示意圖。
現(xiàn)在將參照?qǐng)D1的典型計(jì)算機(jī)系統(tǒng)100的功能框圖敘述本發(fā)明。圖1中,計(jì)算機(jī)系統(tǒng)100包含一個(gè)中央處理單元(CPU)102。CPU 102可以是本領(lǐng)域中已知的、經(jīng)過(guò)適當(dāng)編程而能執(zhí)行本文結(jié)合圖3A-3D所述方法的任何通用微處理器或微控制器。用于編程CPU的軟件可以在存儲(chǔ)介質(zhì)108上找到,或者經(jīng)過(guò)計(jì)算機(jī)網(wǎng)絡(luò)從另一個(gè)位置得到。例如,CPU 102可以是一個(gè)諸如由因特爾公司制造的奔騰Ⅱ處理器之類的普通微處理器。
CPU 102與包括顯示器104、手工輸入裝置106、存儲(chǔ)介質(zhì)108、麥克風(fēng)110、揚(yáng)聲器112、數(shù)據(jù)輸入端口114和網(wǎng)絡(luò)接口116在內(nèi)的多個(gè)外圍設(shè)備通信。顯示器104可以是個(gè)直觀顯示設(shè)備-如CRT、LCD屏幕、觸感屏幕,或者是本領(lǐng)域中已知的用于直觀地向用戶顯示圖象和文字的其它監(jiān)視器。手工輸入裝置106可以是一個(gè)普通鍵盤、按鍵盤、鼠標(biāo)、跟蹤球或者本領(lǐng)域中已知的用于手工輸入數(shù)據(jù)的其它輸入設(shè)備。存儲(chǔ)介質(zhì)108可以是個(gè)普通的讀/寫存儲(chǔ)器-如磁盤驅(qū)動(dòng)器、軟盤驅(qū)動(dòng)器、CDROM驅(qū)動(dòng)器、硅存儲(chǔ)器或本領(lǐng)域中已知的用于存儲(chǔ)和檢索數(shù)據(jù)的其它存儲(chǔ)設(shè)備。重要的是,存儲(chǔ)介質(zhì)108可以遠(yuǎn)離CPU 102,通過(guò)諸如局域網(wǎng)(LAN)或?qū)捰蚓W(wǎng)(WAN)的網(wǎng)絡(luò)或者因特網(wǎng)與CPU 102相連。麥克風(fēng)110可以是本領(lǐng)域中已知的任何適合用于向CPU 102提供音頻信號(hào)的麥克風(fēng)。揚(yáng)聲器112可以是本領(lǐng)域中已知的任何適合用于重現(xiàn)來(lái)自CPU 102的音頻信號(hào)的揚(yáng)聲器。不言自明,麥克風(fēng)110和揚(yáng)聲器112可以包含相應(yīng)的數(shù)-模和模-數(shù)轉(zhuǎn)換電路。數(shù)據(jù)輸入端口114可以是本領(lǐng)域中已知的任何用于用諸如RS-232、通用串行總線之類的數(shù)據(jù)協(xié)議與外部附件連接的數(shù)據(jù)端口。網(wǎng)絡(luò)接口116可以是本領(lǐng)域中已知的用于經(jīng)過(guò)計(jì)算機(jī)網(wǎng)絡(luò)傳送文件的任何接口-這種網(wǎng)絡(luò)的例子包括TCP/IP網(wǎng)絡(luò)、以太網(wǎng)或令牌環(huán)網(wǎng)絡(luò)。此外,在有些系統(tǒng)上,網(wǎng)絡(luò)接口116可以包括一個(gè)與數(shù)據(jù)輸入端口114相連的調(diào)制解調(diào)器。
所以,圖1展示了計(jì)算機(jī)系統(tǒng)100的各功能單元。計(jì)算機(jī)系統(tǒng)100的每個(gè)單元可以是如上所述的合適的成品部件。本發(fā)明提供一種用于用語(yǔ)音與計(jì)算機(jī)系統(tǒng)100接合的方法和系統(tǒng)。
如圖8中所示,計(jì)算機(jī)系統(tǒng)100可以與因特網(wǎng)700相連(因特網(wǎng)是計(jì)算機(jī)網(wǎng)絡(luò)的一個(gè)集合)。要連接到因特網(wǎng)700,計(jì)算機(jī)系統(tǒng)100可以采用網(wǎng)絡(luò)接口116、與數(shù)據(jù)輸入端口114相連的調(diào)制解調(diào)器或者本領(lǐng)域中已知的任何其它方法。網(wǎng)站710、其它計(jì)算機(jī)720和存儲(chǔ)介質(zhì)108也可以通過(guò)這類本領(lǐng)域中的已知方法連接到因特網(wǎng)。
現(xiàn)在轉(zhuǎn)至圖2,圖2表示CPU 102和存儲(chǔ)介質(zhì)108的一個(gè)擴(kuò)展的功能框圖。應(yīng)當(dāng)明白,圖2的功能單元可以整個(gè)地以軟件或硬件或者軟硬件的結(jié)合實(shí)現(xiàn)。就軟件實(shí)現(xiàn)而言,軟件可以位于存儲(chǔ)介質(zhì)108中或位于計(jì)算機(jī)網(wǎng)絡(luò)上的另一個(gè)位置。CPU 102中包括語(yǔ)音識(shí)別處理器200、數(shù)據(jù)處理器201、自然語(yǔ)言處理器202和應(yīng)用界面220。數(shù)據(jù)處理器201與顯示器104、存儲(chǔ)介質(zhì)108、麥克風(fēng)110、揚(yáng)聲器112、數(shù)據(jù)輸入端口114和網(wǎng)絡(luò)接口116連接。數(shù)據(jù)處理器201允許CPU定位這些資源和以這些資源讀取數(shù)據(jù)。自然語(yǔ)言處理器202進(jìn)一步包含變量置換器204、串格式化器206、單詞加權(quán)器208、布爾檢測(cè)器210、代詞置換器211和搜索引擎213。存儲(chǔ)介質(zhì)108中含有多個(gè)特定語(yǔ)境語(yǔ)法文件212、一般性語(yǔ)法文件214、口授語(yǔ)法216和自然語(yǔ)言處理器(NLP)數(shù)據(jù)庫(kù)218。在最佳實(shí)施例中,語(yǔ)法文件212、214和216是巴科斯-諾爾(Bakus-Naur)形式(BNF)的文件,描述由用戶說(shuō)出的語(yǔ)言的結(jié)構(gòu)。BNF文件是本領(lǐng)域中眾所周知的用于描述語(yǔ)言結(jié)構(gòu)的文件,因此這里將不討論BNF文件的詳細(xì)內(nèi)容。BNF文件的一個(gè)優(yōu)點(diǎn)是,可以用分層的樹(shù)型結(jié)構(gòu)來(lái)描述短語(yǔ)或單詞序列,而無(wú)需顯式地列舉這些單詞序列的全部組合。所以,BNF文件在最佳實(shí)施例中的使用,使存儲(chǔ)介質(zhì)108中的語(yǔ)法文件212、214和216的物理大小最小化,提高了以下文所述方式啟用和搜索這些文件的速度。不過(guò),在另外的實(shí)施例中可以使用其它文件結(jié)構(gòu)。
現(xiàn)在將結(jié)合圖3A-3D的流程圖,說(shuō)明圖2的這些功能單元的操作和互動(dòng)。在圖3A中,流程始于功能框300,向語(yǔ)音處理器200提供一個(gè)話語(yǔ)。話語(yǔ)是有開(kāi)頭和結(jié)尾的一系列的聲音,可包含一個(gè)或多個(gè)口語(yǔ)單詞。捕獲口語(yǔ)單詞的麥克風(fēng)100可以執(zhí)行功能框300的步驟?;蛘撸梢越?jīng)過(guò)輸入端口144或者從存儲(chǔ)介質(zhì)108向語(yǔ)音處理器200提供話語(yǔ)。話語(yǔ)的格式最好是數(shù)字格式,如有名的“.wav”音頻文件格式。
流程前進(jìn)到判斷框302,語(yǔ)音處理器200在此判斷是否特定語(yǔ)境語(yǔ)法212的其中之一已經(jīng)被啟用。如果特定語(yǔ)境語(yǔ)法212被啟用,就在功能框304搜索特定語(yǔ)境語(yǔ)法212。在最佳實(shí)施例中,特定語(yǔ)境語(yǔ)法212是BNF文件,含有與某個(gè)母體語(yǔ)境有關(guān)的單詞和短語(yǔ)。一般來(lái)說(shuō),語(yǔ)境就是一個(gè)主題領(lǐng)域。例如,在本發(fā)明的一個(gè)可應(yīng)用于個(gè)人電腦的實(shí)施例中,語(yǔ)境的例子可以是“新聞”、“天氣”或“股票”。在這種情況下,特定語(yǔ)境語(yǔ)法212就各自含有對(duì)應(yīng)于這些語(yǔ)境中的不同語(yǔ)境的命令、控制單詞、描述符(descriptor)、限定符(qualifier)或參數(shù)。語(yǔ)境的使用提供一種表示各種信息類型的分層結(jié)構(gòu)。下文將結(jié)合NLP數(shù)據(jù)庫(kù)218進(jìn)一步對(duì)各語(yǔ)境及其應(yīng)用作出說(shuō)明。
如果已經(jīng)有特定語(yǔ)境語(yǔ)法212被啟用,就搜索該特定語(yǔ)境語(yǔ)法212,查找在功能框300所提供話語(yǔ)的匹配項(xiàng)(match)。然而,如果沒(méi)有特定語(yǔ)境語(yǔ)法212被啟用,流程就前進(jìn)到功能框308,在此啟用一般性語(yǔ)法214。
在最佳實(shí)施例中,一般性語(yǔ)法214是一個(gè)BNF文件,文件中含有的單詞和短語(yǔ)本身并不屬于某個(gè)母體語(yǔ)境,但是可能有某特定語(yǔ)境語(yǔ)法文件212為此存在的一個(gè)相關(guān)語(yǔ)境。換言之,一般性語(yǔ)法214中的單詞和短語(yǔ)可能位于分層語(yǔ)境結(jié)構(gòu)的根部。例如,在一個(gè)可應(yīng)用于個(gè)人電腦的實(shí)施例中,一般性語(yǔ)法214就含有命令和控制短語(yǔ)。
在功能框310中,搜索一般性語(yǔ)法214,查找在功能框300所提供話語(yǔ)的匹配單詞或短語(yǔ)。在功能框312,對(duì)是否找到該匹配進(jìn)行判別。如果找不到匹配項(xiàng),就在功能框314啟用口授語(yǔ)法216。在最佳實(shí)施例中,口授語(yǔ)法216是一個(gè)BFN文件,文件中含有的單詞列表本身既無(wú)某個(gè)母體語(yǔ)境也無(wú)相關(guān)語(yǔ)境。例如,在一個(gè)可應(yīng)用于個(gè)人電腦的實(shí)施例中,口授語(yǔ)法216就含有一個(gè)類似于通用詞典的較大的通用單詞列表。
在功能框316中,搜索口授語(yǔ)法,查找在功能框300所提供話語(yǔ)的每個(gè)單詞的匹配單詞。在判別框318如果找不到匹配單詞,則在功能框320可以選擇在顯示器104顯示一個(gè)可視的出錯(cuò)訊息或者選擇通過(guò)揚(yáng)聲器112重播一個(gè)有聲的出錯(cuò)訊息。過(guò)程結(jié)束,直到在功能框300有另一個(gè)話語(yǔ)被提供給語(yǔ)音處理器200。
所以,如上述說(shuō)明可見(jiàn),當(dāng)某個(gè)話語(yǔ)被提供給語(yǔ)音處理器200時(shí),首先搜索啟用的特定語(yǔ)境語(yǔ)法212(如果有的話)。如果所啟用的特定語(yǔ)境語(yǔ)法212中沒(méi)有匹配項(xiàng),則啟用并搜索一般性語(yǔ)法214。如果一般性語(yǔ)法214中沒(méi)有匹配項(xiàng),則啟用并搜索口授語(yǔ)法216。
在最佳實(shí)施例中,當(dāng)語(yǔ)音識(shí)別處理器200在搜索特定語(yǔ)境語(yǔ)法212或一般性語(yǔ)法214時(shí),稱其處于“命令和控制”方式。在該方式中,語(yǔ)音識(shí)別處理器200把整個(gè)話語(yǔ)作為整體與語(yǔ)法中的條目作比較。相比之下,當(dāng)語(yǔ)音識(shí)別處理器200在搜索口授語(yǔ)法時(shí),稱其處于“口授”方式。在該方式中,語(yǔ)音識(shí)別處理器200每次一個(gè)單詞地把話語(yǔ)與口授語(yǔ)法216中的條目作比較??梢灶A(yù)計(jì),在命令和控制方式中檢索整個(gè)一個(gè)話語(yǔ)的匹配項(xiàng)的速度,一般會(huì)比在口授方式中每次搜索一個(gè)單詞的速度快。
進(jìn)一步可以預(yù)計(jì),任何單個(gè)的特定語(yǔ)境語(yǔ)法212在規(guī)模上都小于一般性語(yǔ)法214(即總的單詞和短語(yǔ)更少),后者在規(guī)模上又小于口授語(yǔ)法216。所以,通過(guò)首先搜索任何啟用的特定語(yǔ)境語(yǔ)法212的方法,有可能更快地找到匹配項(xiàng)(如果有的話),這至少是部分地因?yàn)槲募 M瑯?,通過(guò)在搜索口授語(yǔ)法216之前搜索一般性語(yǔ)法214的方法,有可能更快地找到匹配項(xiàng)。
此外,正如下文對(duì)本發(fā)明能自適應(yīng)地對(duì)特定語(yǔ)境語(yǔ)法212和一般性語(yǔ)法214添加的能力進(jìn)一步解釋的那樣,它們將含有最常用的話語(yǔ)。因此可以預(yù)計(jì),在特定語(yǔ)境語(yǔ)法212或一般性語(yǔ)法214中找到匹配項(xiàng)的速度更有可能比在口授語(yǔ)法216中的快。
最后,正如下文將進(jìn)一步解釋的那樣,在啟用的特定語(yǔ)境語(yǔ)法212中的單詞和短語(yǔ),是用戶更有可能說(shuō)出的,因?yàn)樗鼈兪桥c用戶最近說(shuō)到的主題高度相關(guān)的單詞。這也使用戶能用語(yǔ)句片斷以更口語(yǔ)話的風(fēng)格說(shuō)話,其單詞的意思被按照所啟用的特定語(yǔ)境語(yǔ)法212解釋。
通過(guò)按上述順序進(jìn)行搜索,本發(fā)明的搜索的效率,高于在含有所有預(yù)期單詞和短語(yǔ)的一個(gè)大型列表中每次一個(gè)條目地進(jìn)行搜索的效率。
返回到判斷框306,如果在特定語(yǔ)境語(yǔ)法212中找到匹配項(xiàng),則有圖3A中所顯示的三種可能的下一步步驟。對(duì)于所啟用的特定語(yǔ)境語(yǔ)法212中的每個(gè)匹配條目,可能都有一個(gè)相關(guān)的要由語(yǔ)音識(shí)別處理器200采取的行動(dòng)。功能框322表示,一個(gè)行動(dòng)可能是指示應(yīng)用界面220對(duì)某個(gè)獨(dú)立軟件應(yīng)用或?qū)嶓w采取某種行動(dòng)。例如,應(yīng)用界面220可以用微軟公司的語(yǔ)音應(yīng)用編程接口(SAPI)標(biāo)準(zhǔn)與某外部應(yīng)用通信??梢灾甘驹撏獠繎?yīng)用例如訪問(wèn)特定的因特網(wǎng)網(wǎng)站URL或者通過(guò)正文向語(yǔ)音轉(zhuǎn)換的方式說(shuō)出特定的短語(yǔ)。可以采取如下文將結(jié)合圖4的NLP數(shù)據(jù)庫(kù)218所進(jìn)一步討論的那樣的其它行動(dòng)。
功能框324表示,另一個(gè)行動(dòng)可以是直接訪問(wèn)自然語(yǔ)言處理(NLP)數(shù)據(jù)庫(kù)218中的某一行,由此繞過(guò)下文進(jìn)一步作說(shuō)明的自然語(yǔ)言處理步驟。功能框326表示,另一個(gè)行動(dòng)可以是把用于所啟用語(yǔ)境的單詞或短語(yǔ)前置(prepend)到在功能框306在特定語(yǔ)境語(yǔ)法中找到的匹配單詞或短語(yǔ)。例如,如果所啟用的語(yǔ)境是“movies”(電影),匹配的話語(yǔ)是“8o’clock”(8點(diǎn)鐘),則把單詞“movies”前置到短語(yǔ)“8o’clock”,組成短語(yǔ)“movies at 8o’clock”(8點(diǎn)鐘的電影)。
同樣,如果在一般性語(yǔ)法214中找到匹配項(xiàng),流程就前進(jìn)到功能框322-在此指示應(yīng)用界面220采取一個(gè)如上所述的行動(dòng),或者前進(jìn)到功能框324,直接訪問(wèn)NLP數(shù)據(jù)庫(kù)中的某一行。然而,如果在一般性語(yǔ)法214中找到匹配項(xiàng),則不進(jìn)行對(duì)語(yǔ)境的前置,因?yàn)槿缟纤?,一般性語(yǔ)法214中的條目本身并沒(méi)有母體語(yǔ)境。
或者,可以在功能框301捕獲手工輸入的單詞,輸入到自然語(yǔ)言處理器中。
最后參看圖3A,可以通過(guò)手工輸入裝置106輸入單詞。在這種情況下,不需要進(jìn)行語(yǔ)音識(shí)別,不過(guò)仍然需要對(duì)所輸入單詞進(jìn)行自然語(yǔ)言處理。然后,流程前進(jìn)到圖3B。
圖3B中,在功能框328,自然語(yǔ)言處理器202為進(jìn)行自然語(yǔ)言處理分析而對(duì)短語(yǔ)進(jìn)行格式化。這種格式化是用串格式化器206完成的,可包括去除單詞之間的多余空格、把所有字母變成小寫(或大寫)、把縮略部分完全寫出(例如把“it’s”變成“it is”)之類的文字處理。這個(gè)格式化步驟的目的是對(duì)短語(yǔ)作分析的準(zhǔn)備。
流程繼續(xù)到功能框330,在此由變量置換器204用相關(guān)的通配符函數(shù)(wildcard function)置換某些“單詞變量”,為訪問(wèn)NLP數(shù)據(jù)庫(kù)218作準(zhǔn)備。這里所用的術(shù)語(yǔ)“單詞變量”指的是表示數(shù)量、日期、時(shí)間、貨幣之類的單詞或短語(yǔ)。例如,在一個(gè)實(shí)施例中,短語(yǔ)“what moviesare playing at 8o’clock”(8點(diǎn)鐘在放什么電影)要在功能框330被轉(zhuǎn)換成“what movies are playing at$time”(在$time時(shí)在放什么電影),其中“$time”是一個(gè)用來(lái)代表任一時(shí)間值的通配符函數(shù)。作為另一個(gè)例子,在一個(gè)實(shí)施例中,短語(yǔ)“sell IBM stock at 100dollars”(按100美元的價(jià)格賣出IBM股票)要在功能框330被轉(zhuǎn)換成“sell IBM stock at $dollars”(按$dollar的價(jià)格賣出IBM股票),其中“$dollars”是一個(gè)用來(lái)代表任一美元值的通配符函數(shù)。這個(gè)步驟可以由一個(gè)簡(jiǎn)單循環(huán)來(lái)完成,該循環(huán)搜索短語(yǔ)中諸如單詞“dollar”或“o’clock”的關(guān)鍵記號(hào)并用規(guī)定的通配符函數(shù)置換這些單詞變量。為了跟蹤在短語(yǔ)中作過(guò)替換的位置,可以使用一個(gè)數(shù)組。這樣能在搜索過(guò)NLP數(shù)據(jù)庫(kù)218后將原始的單詞變量重新替換回該短語(yǔ)中的某個(gè)位置。
在功能框330用相關(guān)通配符函數(shù)置換單詞變量的目的是減少必須在NLP數(shù)據(jù)庫(kù)218中出現(xiàn)的條目的數(shù)量。例如,NLP數(shù)據(jù)庫(kù)218會(huì)只含有“what movies are playing at$time”(在$time時(shí)在放什么電影),而不是有一個(gè)個(gè)單獨(dú)的對(duì)應(yīng)于8點(diǎn)鐘、9點(diǎn)鐘、10點(diǎn)鐘等等的條目。下文將對(duì)NLP數(shù)據(jù)庫(kù)218作進(jìn)一步說(shuō)明。
在功能框332,由代詞置換器211用專有名稱置換短語(yǔ)中的代詞。例如,在一個(gè)實(shí)施例中,要把代詞“I”(我)、“my”或“mine”(我的)替換成說(shuō)話人的姓名。這個(gè)步驟的目的是能在NLP數(shù)據(jù)庫(kù)218中存儲(chǔ)和訪問(wèn)特定于用戶的事實(shí)。例如,要把語(yǔ)句“who aremy children”(誰(shuí)是我的孩子)轉(zhuǎn)換成“who are Dean’s children”(誰(shuí)是Dean的孩子),其中Dean是說(shuō)話人的姓名。這個(gè)步驟還是可以用一個(gè)簡(jiǎn)單循環(huán)來(lái)完成-該循環(huán)搜索短語(yǔ)中的代詞并把找到的代詞替換成專有名稱。為了跟蹤在短語(yǔ)中作過(guò)替換的位置,可以使用一個(gè)數(shù)組。
在功能框334中,由單詞加權(quán)器208對(duì)短語(yǔ)中的各個(gè)單詞按它們對(duì)于短語(yǔ)的總體意思的相對(duì)“重要性”進(jìn)行加權(quán)。例如,在一個(gè)實(shí)施例中,分配三個(gè)加權(quán)因數(shù)。將最低的加權(quán)因數(shù)分配給諸如“a”、“an”、“the”和其它冠詞的單詞。將最高的加權(quán)因數(shù)賦予可能與短語(yǔ)的意思有重要關(guān)系的單詞。例如,這些單詞可包括NLP數(shù)據(jù)庫(kù)218中的所有動(dòng)詞、名詞、形容詞、和專有名稱(proper name)。將中間的加權(quán)因數(shù)賦予短語(yǔ)中的所有其它單詞。這種加權(quán)的目的是便于增強(qiáng)NLP數(shù)據(jù)庫(kù)218的搜索功能。
圖4中表示一個(gè)實(shí)施例的NLP數(shù)據(jù)庫(kù)218的幾個(gè)選定列的例子。NLP數(shù)據(jù)庫(kù)218包含多個(gè)列400-410和多個(gè)行412A-412N。列400中的各條目代表對(duì)NLP數(shù)據(jù)庫(kù)來(lái)說(shuō)是“已知的”短語(yǔ)。列402中顯示的是列400中每個(gè)條目的必需單詞的數(shù)目。列404中顯示的是列400中每個(gè)條目的相關(guān)語(yǔ)境或子語(yǔ)境(sub context)。列408和410中顯示的是列400中每個(gè)條目的一個(gè)或多個(gè)相關(guān)行動(dòng)。應(yīng)當(dāng)注意,圖4中所示的NLP數(shù)據(jù)庫(kù)218只是一個(gè)用于敘述本發(fā)明的簡(jiǎn)化的例子。其它實(shí)施例可以有更多或更少的具有不同條目的列。
返回到圖3B,在功能框336,搜索NLP數(shù)據(jù)庫(kù)218,根據(jù)NLP數(shù)據(jù)庫(kù)218的列400中的條目是否含有短語(yǔ)中的任何單詞(或單詞的同義詞)和這些單詞的相對(duì)權(quán)重,查找短語(yǔ)的可能匹配項(xiàng)。在功能框338,根據(jù)短語(yǔ)中每一個(gè)單詞的出現(xiàn)次數(shù)和它們的相對(duì)權(quán)重,為每一個(gè)可能的匹配條目生成一個(gè)可信度值。數(shù)據(jù)庫(kù)的加權(quán)單詞檢索在本領(lǐng)域中是眾所周知的,可以用市場(chǎng)銷售的搜索引擎(如位于美國(guó)弗吉尼亞州阿靈頓的DT軟件公司生產(chǎn)的“dtsearch”)執(zhí)行。同樣,同義詞檢索在本領(lǐng)域中是眾所周知的,可以用諸如由位于美國(guó)新澤西普林斯頓的普林斯頓大學(xué)認(rèn)識(shí)科學(xué)實(shí)驗(yàn)室開(kāi)發(fā)的“WordNet”這樣的可公開(kāi)獲得的工具執(zhí)行。搜索引擎可以是自然語(yǔ)言處理器202的一個(gè)組成部分。
在判斷框340,自然語(yǔ)言處理器202判斷是否可能匹配條目中的任一條目有大于或等于某個(gè)預(yù)定最小閥值T的可信度值。閥值T代表?yè)?jù)其可判定短語(yǔ)是否與NLP數(shù)據(jù)庫(kù)中任何條目匹配的可接受的最低可信度值。如果沒(méi)有可信度值大于或等于T的可能匹配條目,則流程就前進(jìn)到功能框342,在此將一個(gè)可選的出錯(cuò)訊息或者通過(guò)顯示器104向用戶顯示,或者通過(guò)揚(yáng)聲器112重播。在一個(gè)實(shí)施例中,向用戶顯示的任何出錯(cuò)訊息的類型(如果有的話),可以取決于在最高可信度的NLP數(shù)據(jù)庫(kù)條目中找到的“命中”有多少(即短語(yǔ)中有多少匹配單詞)。有零個(gè)或一個(gè)命中與有兩個(gè)或更多的命中相比,會(huì)生成不同類型的出錯(cuò)訊息。
然而,如果NLP數(shù)據(jù)庫(kù)218中至少有一個(gè)條目的可信度值大于或等于T,則流程前進(jìn)到功能框344,在此從短語(yǔ)中剔除“噪聲”單詞。“噪聲”單詞包括相對(duì)于短語(yǔ)中的其它單詞來(lái)說(shuō)對(duì)短語(yǔ)的總體意思沒(méi)有重要貢獻(xiàn)的單詞。這些單詞可包括冠詞、代詞、連詞和類似性質(zhì)的單詞?!胺窃肼暋眴卧~則包括對(duì)短語(yǔ)的總體意思有重要貢獻(xiàn)的單詞?!胺窃肼暋眴卧~包括動(dòng)詞、名詞、形容詞、專有名稱和類似的單詞。
流程前進(jìn)到圖3C,在功能框346從NLP數(shù)據(jù)庫(kù)218的列402中提取最高可信度匹配條目的非噪聲單詞要求。例如,如果最高可信度匹配短語(yǔ)是行412A中的條目(例如,“what movies are playing at$time”(在$time時(shí)在放什么電影)),則所要求的非噪聲單詞的數(shù)目是3。
在判斷框348,進(jìn)行一次檢測(cè),確定該短語(yǔ)所要求的非噪聲單詞的數(shù)目實(shí)際上出現(xiàn)在從NLP數(shù)據(jù)庫(kù)218提取的最高可信度匹配條目中。這個(gè)檢測(cè)是對(duì)在功能框336中進(jìn)行的相關(guān)風(fēng)格搜索(relevance-stylesearch)的精確性的驗(yàn)證,不言自明,一個(gè)可以生成大于最小閥值T的可信度值的條目,未必是短語(yǔ)的一個(gè)可接受的匹配項(xiàng)。
在判斷框348進(jìn)行的檢測(cè)的性質(zhì)是一個(gè)由布爾檢測(cè)器210進(jìn)行的布爾“AND”檢測(cè)。該檢測(cè)確定短語(yǔ)中每一個(gè)非噪聲單詞(或其同義詞)是否實(shí)際上出現(xiàn)在最高可信度條目中。如果有足夠數(shù)量的實(shí)際上出現(xiàn)在最高可信度條目中的必要單詞,流程就前進(jìn)到功能框350,自然語(yǔ)言處理器202在此指示應(yīng)用界面220采取列408或410中的一個(gè)相關(guān)行動(dòng)。不言自明,也可以有另外的行動(dòng)列。
例如,如果最高可信度條目是行412A中的條目,并且判斷框348的布爾檢測(cè)確定列400中的條目中的短語(yǔ)中實(shí)際上有3個(gè)非噪聲單詞,則要采取列408中的相關(guān)行動(dòng)(例如訪問(wèn)電影網(wǎng)站)。NLP數(shù)據(jù)庫(kù)中的其它條目有其它的相關(guān)行動(dòng)。例如,如果最高可信度條目是行412E中的條目(例如,“what time is it”(現(xiàn)在幾點(diǎn)鐘)),則相關(guān)行動(dòng)可能是,自然語(yǔ)言處理器202指示一個(gè)文字轉(zhuǎn)換至語(yǔ)音應(yīng)用程序(未予示出)通過(guò)揚(yáng)聲器112向用戶報(bào)出當(dāng)前時(shí)間。另一個(gè)例子是,如果最高可信度條目是行412N中的條目(例如,“show me the news”(給我顯示新聞)),則第一個(gè)相關(guān)行動(dòng)可能是訪問(wèn)因特網(wǎng)上預(yù)定的新聞網(wǎng)站,第二個(gè)相關(guān)行動(dòng)可能是指示一個(gè)圖象顯示應(yīng)用程序(未予示出)顯示新聞的相關(guān)圖象。也可以采取不同的或另外的行動(dòng)。
同樣,對(duì)于短語(yǔ),如果最高可信度條目含有如在判斷框348確定的預(yù)定數(shù)量的非噪聲單詞,自然語(yǔ)言處理器202就指示語(yǔ)音識(shí)別處理器200啟用用于列404的相關(guān)語(yǔ)境的特定語(yǔ)境語(yǔ)法212。所以,對(duì)于行412A,要啟用用于語(yǔ)境“movies”(電影)的特定語(yǔ)境語(yǔ)法212。所以,當(dāng)在圖3A的功能框300向語(yǔ)音識(shí)別處理器200提供下一個(gè)話語(yǔ)時(shí),語(yǔ)音識(shí)別處理器在搜索一般性語(yǔ)法214之前要在所啟用的特定語(yǔ)境語(yǔ)法212中檢索“movies”(電影)。如上所述,啟用恰當(dāng)?shù)奶囟ㄕZ(yǔ)境語(yǔ)法212大大增加快速、成功的語(yǔ)音識(shí)別的可能性,并且增強(qiáng)了用戶以口語(yǔ)化風(fēng)格與計(jì)算機(jī)溝通的能力。
然而-回到判斷框348,如果從NLP數(shù)據(jù)庫(kù)218提取的最高可信度條目中實(shí)際上沒(méi)有短語(yǔ)中預(yù)定數(shù)量的非噪聲單詞,流程就前進(jìn)到功能框354,通過(guò)顯示器104或揚(yáng)聲器112提示用戶回答是否指的是最高可信度條目。例如,如果用戶說(shuō)“how much is IBM stock selling fortoday”(IBM股票今日賣多少),則NLP數(shù)據(jù)庫(kù)218中的最高可信度條目可能是行412B中的條目。在這種情況下,盡管相關(guān)因數(shù)可能很高,必要單詞(或其同義詞)的數(shù)量卻可能不夠。所以,要在功能框354提示用戶回答他是否指的是“what is the price of IBM stock on August28。1998”(1998年8月28日IBM股票的價(jià)格是多少)。
用戶可以作肯定回答或否定回答。如果在判斷框356確定用戶作了肯定回答,則在功能框350采取與該最高可信度條目相關(guān)的行動(dòng),然后在功能框352啟用相關(guān)的特定語(yǔ)境語(yǔ)法212。
然而,如果在判斷框356確定用戶作了否定回答,流程就前進(jìn)到圖3D,從NLP數(shù)據(jù)庫(kù)218的列404提取用于該最高可信度條目的相關(guān)語(yǔ)境,并在功能框360提示用戶用基于語(yǔ)境的交互對(duì)話提供信息。例如,如果用戶說(shuō)“what is the price of XICOR stock today”(XICOR股票今日價(jià)格是多少),并且NLP數(shù)據(jù)庫(kù)218中的最高可信度條目是行412B(例如“what is the price of IBM stock on$date”(日期$的IBM股票的價(jià)格是多少)),則在功能框354提示用戶回答他是否指的就是這個(gè)意思。
如果用戶回答是否定的,則在功能框358從列404提取語(yǔ)境“stock”(股票),并通過(guò)顯示器104或揚(yáng)聲器112把用于該股票語(yǔ)境的基于語(yǔ)境的交互對(duì)話向用戶表示。這種基于語(yǔ)境的交互對(duì)話的作用是提示用戶提供XICOR股票的名稱和股票報(bào)價(jià)符。用戶可以口頭回答所需信息。對(duì)于每一個(gè)可能的語(yǔ)境,可以采用不同的基于語(yǔ)境的交互對(duì)話。例如,基于語(yǔ)境“weather”(天氣)的交互對(duì)話的作用是提示用戶提供姓名和希望了解其天氣情況的地點(diǎn)和名稱(例如城市)。同樣,基于語(yǔ)境“news”(新聞)的交互對(duì)話的作用是提示用戶提供文章的類型、新聞來(lái)源、新聞網(wǎng)站的因特網(wǎng)URL或其它有關(guān)信息。
基于語(yǔ)境的交互對(duì)話結(jié)束后,在功能框362,更新NLP數(shù)據(jù)庫(kù)218、一般性語(yǔ)法214和特定語(yǔ)境語(yǔ)法212,以包括新的信息。這樣,下一次用戶詢問(wèn)該信息時(shí),就會(huì)找到合適的匹配項(xiàng),無(wú)需提示用戶提供更多信息就能采取適當(dāng)?shù)男袆?dòng)。所以,本發(fā)明自適應(yīng)地“學(xué)習(xí)”識(shí)別用戶說(shuō)出的短語(yǔ)。
在本發(fā)明一個(gè)實(shí)施例中,NLP數(shù)據(jù)庫(kù)218、特定語(yǔ)境語(yǔ)法212、一般性語(yǔ)法214和口授語(yǔ)法216的一個(gè)或多個(gè)也含有與每個(gè)條目相關(guān)聯(lián)的時(shí)間戳值(未予示出)。每次使用一個(gè)匹配條目時(shí),就更新與該條目相關(guān)聯(lián)的時(shí)間戳值。每隔一定時(shí)間,或者由用戶決定,把時(shí)間戳值在一定日期或時(shí)間之前的條目從它們各自的數(shù)據(jù)庫(kù)/語(yǔ)法中刪除。這樣,通過(guò)“清除”舊的或過(guò)時(shí)的條目,可以使數(shù)據(jù)庫(kù)/語(yǔ)法的大小保持在高效的程度。這也有助于避免錯(cuò)誤的匹配。
在本發(fā)明一個(gè)實(shí)施例中,語(yǔ)音識(shí)別和自然語(yǔ)言處理可以被用來(lái)與網(wǎng)絡(luò)對(duì)象(networked objects)互動(dòng),連網(wǎng)對(duì)象例如是有語(yǔ)境敏感的基于語(yǔ)音的界面的萬(wàn)維網(wǎng)(“WWW”或“Web”)網(wǎng)頁(yè)。
圖5表示一個(gè)典型的對(duì)話定義文件(DDF)500,它表示為把語(yǔ)音識(shí)別和自然語(yǔ)言處理與某個(gè)因特網(wǎng)對(duì)象(諸如文本文件或圖象文件,或者是最佳實(shí)施例中的網(wǎng)頁(yè))相聯(lián)系所必需的信息。盡管在其最簡(jiǎn)單實(shí)施例中,對(duì)話定義文件500由一個(gè)網(wǎng)絡(luò)對(duì)象表510組成,DDF也可以含有另外的特定語(yǔ)境語(yǔ)法文件214和另外的用于自然語(yǔ)言處理(NLP)數(shù)據(jù)庫(kù)218的條目,如圖5所示的那樣。DDF 500的最佳實(shí)施例包括一個(gè)網(wǎng)絡(luò)對(duì)象表510,一個(gè)特定語(yǔ)境語(yǔ)法文件214和一個(gè)含有指向自然語(yǔ)言處理數(shù)據(jù)庫(kù)218的條目的文件。可以用本領(lǐng)域的任何已知方法,如Lempel-Ziv壓縮法,把這些成分壓縮并組合進(jìn)DDF文件500。特定語(yǔ)境語(yǔ)法文件214和自然語(yǔ)言處理(NLP)數(shù)據(jù)庫(kù)218如前面段落中所述的那樣。網(wǎng)絡(luò)對(duì)象表510是一個(gè)存儲(chǔ)器結(jié)構(gòu)(如存儲(chǔ)器樹(shù))、鏈或表,它把資源的地址與各種行動(dòng)、語(yǔ)法或NLP數(shù)據(jù)庫(kù)218中的條目相聯(lián)系。
圖6中表示網(wǎng)絡(luò)對(duì)象表510的一個(gè)典型實(shí)施例。圖6表示一個(gè)存儲(chǔ)器表,表中可含有對(duì)應(yīng)下列內(nèi)容的各條目列網(wǎng)絡(luò)對(duì)象520、文本到語(yǔ)音轉(zhuǎn)換(TTS)標(biāo)志522、文本言語(yǔ)524、使用語(yǔ)法標(biāo)志526、附接語(yǔ)法標(biāo)志528、“is yes/no”(是/否)標(biāo)志、““是(do yes)”的相應(yīng)操作”(do yes)532和““否”的相應(yīng)操作”(do no)534行動(dòng)。表中的每行540A-540E代表與一個(gè)網(wǎng)絡(luò)對(duì)象相關(guān)的語(yǔ)法和言語(yǔ)。本發(fā)明的典型實(shí)施例通過(guò)統(tǒng)一資源定位器(URL)來(lái)引用網(wǎng)絡(luò)對(duì)象520。URL是一種指定作為萬(wàn)維網(wǎng)一部分的因特網(wǎng)上的資源的地址的標(biāo)準(zhǔn)方法。由于這個(gè)標(biāo)準(zhǔn)用于說(shuō)明因特網(wǎng)資源的位置是本領(lǐng)域中眾所周知的,所以這里將不討論URL的詳細(xì)內(nèi)容。URL的一個(gè)優(yōu)點(diǎn)是,除了許多網(wǎng)絡(luò)對(duì)象設(shè)備和通信協(xié)議外,URL能指定各種網(wǎng)絡(luò)對(duì)象格式的信息,包括超文本的、圖象的、數(shù)據(jù)庫(kù)的或其它的文件。
正文到語(yǔ)音(TTS)標(biāo)志522與正文言語(yǔ)524組合起來(lái)時(shí),指出在對(duì)應(yīng)的網(wǎng)絡(luò)對(duì)象被傳輸時(shí)是否應(yīng)當(dāng)通過(guò)揚(yáng)聲器播出一個(gè)初始語(yǔ)句。例如,當(dāng)傳輸行540A的網(wǎng)絡(luò)對(duì)象列520中所列的網(wǎng)頁(yè)(http://www.conversational sys.com)時(shí),TTS標(biāo)志522是作過(guò)標(biāo)記的,這表明正文言語(yǔ)524“Hello,welcome to ConversationalSystems”(你好,歡迎來(lái)到談話系統(tǒng))要通過(guò)揚(yáng)聲器112播出。
下面三個(gè)標(biāo)志涉及使用與這個(gè)網(wǎng)絡(luò)對(duì)象相關(guān)的語(yǔ)法。“使用語(yǔ)法”標(biāo)志526或“附接語(yǔ)法”標(biāo)志528的肯定標(biāo)記指出出現(xiàn)一個(gè)與所指示的網(wǎng)絡(luò)對(duì)象相關(guān)的特定語(yǔ)境語(yǔ)法文件214?!笆褂谜Z(yǔ)法”標(biāo)志526的標(biāo)記指出該新的特定語(yǔ)境語(yǔ)法文件214代替現(xiàn)有的特定語(yǔ)境語(yǔ)法文件,禁用現(xiàn)有的文件?!案浇诱Z(yǔ)法”標(biāo)志528指出該新的特定語(yǔ)境語(yǔ)法文件214應(yīng)當(dāng)與現(xiàn)有的特定語(yǔ)境語(yǔ)法文件同時(shí)啟用。
最后,其余列的條目涉及一個(gè)“是/否”語(yǔ)法結(jié)構(gòu)。如果“為是/否”標(biāo)志530是作過(guò)標(biāo)記的,則啟用一個(gè)標(biāo)準(zhǔn)“是/否”語(yǔ)法。當(dāng)啟用了一個(gè)標(biāo)準(zhǔn)“是/否”語(yǔ)法時(shí),向計(jì)算機(jī)說(shuō)出的肯定性命令導(dǎo)致計(jì)算機(jī)執(zhí)行““是”的相應(yīng)操作”條目532中所指出的命令。類似地,向計(jì)算機(jī)說(shuō)出的否定性命令導(dǎo)致計(jì)算機(jī)執(zhí)行““否”的相應(yīng)操作”條目534中所指出的命令?!啊笆恰钡南鄳?yīng)操作”532列和““否”的相應(yīng)操作”534列中的條目可以是命令,也可以是指向NLP數(shù)據(jù)庫(kù)218中嵌入的命令的指針。例如,如行540B所示,“是/否”標(biāo)志是作過(guò)標(biāo)記的。如果給計(jì)算機(jī)一個(gè)肯定性回答,例如“是”,則導(dǎo)致執(zhí)行““是”的相應(yīng)操作”條目532中的相應(yīng)命令;在這個(gè)具體情況中,該條目是數(shù)字“210”,是對(duì)NLP數(shù)據(jù)庫(kù)中第210條命令的引用。如果回答是“否”,則導(dǎo)致計(jì)算機(jī)執(zhí)行NLP數(shù)據(jù)庫(kù)中第211條命令。
現(xiàn)在轉(zhuǎn)至圖7A,圖中表示向互連計(jì)算機(jī)(如正在瀏覽萬(wàn)維網(wǎng)的計(jì)算機(jī))提供言語(yǔ)和語(yǔ)音命令的方法和系統(tǒng)的流程圖。圖7A-7C的方法可以與圖3A-3D的方法結(jié)合起來(lái)使用。在功能框602中,向萬(wàn)維網(wǎng)瀏覽器提供一個(gè)網(wǎng)站URL(網(wǎng)絡(luò)對(duì)象)。網(wǎng)絡(luò)瀏覽器是一種用于在因特網(wǎng)中導(dǎo)航的程序,這是本領(lǐng)域中眾所周知的。功能框602的向?yàn)g覽器提供URL的步驟可以很簡(jiǎn)單,只要用戶鍵入該URL,或者讓用戶選擇一個(gè)對(duì)所選網(wǎng)站URL的“鏈接”。該步驟也可以用前面結(jié)合與NLP數(shù)據(jù)庫(kù)218中每個(gè)條目相關(guān)的行動(dòng)所述的語(yǔ)音命令來(lái)完成。在功能框604,計(jì)算機(jī)得到URL后,必須決定是否能解析該URL內(nèi)指定的網(wǎng)站的因特網(wǎng)地址。這個(gè)解析過(guò)程是本領(lǐng)域中一個(gè)眾所周知的過(guò)程。如果計(jì)算機(jī)不能解析因特網(wǎng)地址,在功能框605,在瀏覽器窗口中顯示一個(gè)出錯(cuò)訊息,然后,系統(tǒng)返回其初始狀態(tài)600。如果解析了因特網(wǎng)地址,在功能框606,計(jì)算機(jī)向該網(wǎng)站發(fā)送一個(gè)對(duì)該網(wǎng)頁(yè)的請(qǐng)求。
在功能框608,作出判斷,看網(wǎng)站是否發(fā)送網(wǎng)頁(yè)。如果網(wǎng)站沒(méi)有響應(yīng),或者未能發(fā)送網(wǎng)頁(yè),則在功能框605,在瀏覽器窗口中顯示一個(gè)出錯(cuò)訊息,然后,系統(tǒng)返回其初始狀態(tài)600。如果網(wǎng)站返回網(wǎng)頁(yè),則在功能框610,在瀏覽器窗口顯示網(wǎng)頁(yè)。
在判斷框612,計(jì)算機(jī)100判斷是否該網(wǎng)站的對(duì)應(yīng)DDF文件500已經(jīng)出現(xiàn)在計(jì)算機(jī)100上。如果DDF文件已經(jīng)出現(xiàn),流程就前進(jìn)到圖7C;否則,流程就前進(jìn)到圖7B。
轉(zhuǎn)至圖7B。如果DDF文件500不存在,計(jì)算機(jī)檢查是否DDF文件500的位置被以URL的形式編碼在網(wǎng)頁(yè)的超文本標(biāo)記語(yǔ)言(HTML)內(nèi)。(注意,HTML是本領(lǐng)域中眾所周知的,因此這里將不討論該語(yǔ)言的詳細(xì)內(nèi)容)。在HTML代碼內(nèi)對(duì)DDF文件位置編碼的方法是,將DDF文件位置列在一個(gè)初始HTML元標(biāo)記(meta-tag)中,例如<meta DDF=“http://www.conversationalsys.com/ConverseIt.ddf”>
或者把一個(gè)腳本標(biāo)記(scripting tag)直接寫入瀏覽器所支持的HTML的變體(variation),<!--<DDF=“http://www.conversationalsys.com/ConverseIt.ddf”>-->
如果DDF文件位置信息被編碼在網(wǎng)頁(yè)內(nèi),則在功能框616,解析該位置的因特網(wǎng)地址,然后在功能框626,計(jì)算機(jī)請(qǐng)求傳輸DDF文件500。
另一方面,如果DDF文件500的位置沒(méi)有被編碼在網(wǎng)頁(yè)內(nèi),它就有幾個(gè)可能的存儲(chǔ)位置。它可能存儲(chǔ)在網(wǎng)站的一個(gè)預(yù)定位置-如根目錄中某個(gè)文件位置,或者在一個(gè)不同的中央位置-例如在另一個(gè)因特網(wǎng)服務(wù)器上或圖1的存儲(chǔ)介質(zhì)108中。功能框618和620檢查這些可能。功能框618判斷DDF文件是否位于該網(wǎng)站。在該步驟中,計(jì)算機(jī)向網(wǎng)站發(fā)送查詢,詢問(wèn)是否存在DDF文件500。如果DDF文件500在網(wǎng)站存在,在功能框626,計(jì)算機(jī)請(qǐng)求傳輸DDF文件500。如果DDF文件不在網(wǎng)站,在功能框620,計(jì)算機(jī)查詢中央位置是否有該網(wǎng)站的一個(gè)DDF文件。如果DDF文件在網(wǎng)站存在,在功能框626,計(jì)算機(jī)請(qǐng)求傳輸DDF文件。如果找不到DDF文件500,在功能框622,就關(guān)閉任何當(dāng)前DDF文件的現(xiàn)有部分,諸如網(wǎng)絡(luò)對(duì)象表510、與網(wǎng)站相關(guān)的NLP數(shù)據(jù)庫(kù)218和任何以前訪問(wèn)過(guò)的網(wǎng)站的特定語(yǔ)境語(yǔ)法214。此外,在功能框624,按非語(yǔ)音啟動(dòng)的網(wǎng)站對(duì)待該網(wǎng)站,并且只使用標(biāo)準(zhǔn)語(yǔ)法文件。標(biāo)準(zhǔn)語(yǔ)法文件系統(tǒng)是現(xiàn)有的不包含任何與網(wǎng)絡(luò)對(duì)象相關(guān)聯(lián)的特定語(yǔ)境語(yǔ)法文件的相關(guān)語(yǔ)法的系統(tǒng)上的語(yǔ)法文件。
如果DDF文件500在功能框626被請(qǐng)求,并且其傳輸不成功,則在功能框622關(guān)閉任何當(dāng)前DDF文件500的任何現(xiàn)有部分,并在功能框624,按非語(yǔ)音啟動(dòng)的網(wǎng)站對(duì)待該網(wǎng)站,并且只使用標(biāo)準(zhǔn)語(yǔ)法文件。
如果DDF文件500在功能框626被請(qǐng)求,并且在功能框628判斷其傳輸是成功的,則在功能框630,它替代任何以前的DDF文件。在功能框632,析取DDF文件500的任何成分,諸如網(wǎng)絡(luò)對(duì)象表510、特定語(yǔ)境語(yǔ)法文件214和NLP數(shù)據(jù)庫(kù)218??梢杂妙愃频募夹g(shù)來(lái)獲得實(shí)現(xiàn)圖3A-3D中所示方法的必要軟件,包含圖2的功能單元。
流程轉(zhuǎn)移到圖7C。在功能框634,由計(jì)算機(jī)將網(wǎng)絡(luò)對(duì)象表510讀入存儲(chǔ)器。如果功能框636判斷出網(wǎng)頁(yè)URL存在于網(wǎng)站網(wǎng)絡(luò)對(duì)象表510中,則它由如圖6中所示的表的某行540A-540E表示。網(wǎng)絡(luò)對(duì)象表的每行表示用戶可用于該特定網(wǎng)頁(yè)的語(yǔ)音交互。如果不存在對(duì)應(yīng)于該網(wǎng)頁(yè)的行,則不存在用于該網(wǎng)頁(yè)的語(yǔ)音交互,于是處理結(jié)束。
如果功能框636判斷出網(wǎng)頁(yè)URL存在于網(wǎng)站網(wǎng)絡(luò)對(duì)象表510中,則在功能框638,計(jì)算機(jī)檢查TTS標(biāo)志522是否作了標(biāo)記,以決定是否把一個(gè)正文言語(yǔ)524與網(wǎng)頁(yè)相聯(lián)系。如果有一個(gè)正文言語(yǔ)524,就在功能框640播出它,然后流程繼續(xù)。如果由判斷框642判斷出有一個(gè)與網(wǎng)頁(yè)相關(guān)聯(lián)的特定語(yǔ)境語(yǔ)法文件,就在功能框644啟用它,然后在功能框646啟用NLP數(shù)據(jù)庫(kù)218。如果沒(méi)有與網(wǎng)頁(yè)相關(guān)聯(lián)的特定語(yǔ)境語(yǔ)法文件,在功能框646只啟用NLP數(shù)據(jù)庫(kù)218。一旦NLP數(shù)據(jù)庫(kù)被啟用,功能框646,系統(tǒng)就按如以上所述的圖3A-3C的方式運(yùn)行。
總之,本發(fā)明提供一種用于計(jì)算機(jī)的連網(wǎng)的交互式用戶界面的方法和系統(tǒng)。通過(guò)使用通過(guò)對(duì)話定義文件與因特網(wǎng)對(duì)象聯(lián)系的特定語(yǔ)境語(yǔ)法,本發(fā)明減少語(yǔ)音識(shí)別時(shí)間,提高用戶以口語(yǔ)話風(fēng)格與因特網(wǎng)對(duì)象(如網(wǎng)頁(yè))溝通的能力。此外,通過(guò)采用對(duì)各種語(yǔ)法和NLP數(shù)據(jù)庫(kù)的適應(yīng)性更新,本發(fā)明進(jìn)一步提高交互的效率。
前面的最佳實(shí)施例說(shuō)明,使本領(lǐng)域任何熟練人員都能制造或使用本發(fā)明。這些實(shí)施例的各種修改,對(duì)本領(lǐng)域的熟練人員來(lái)說(shuō)顯而易見(jiàn),無(wú)需發(fā)明性技能,就能將本文中所界定的一般原理應(yīng)用于其它實(shí)施例。所以,本發(fā)明不限于本文所示的實(shí)施例,而應(yīng)涵蓋與本文所披露的原理和新穎特點(diǎn)相符的最寬的范圍。
權(quán)利要求
1.一種用于為與網(wǎng)絡(luò)對(duì)象進(jìn)行語(yǔ)音交互而更新計(jì)算機(jī)的方法,該方法包含下列步驟通過(guò)網(wǎng)絡(luò)傳輸一個(gè)與網(wǎng)絡(luò)對(duì)象相關(guān)聯(lián)的網(wǎng)絡(luò)對(duì)象表;在網(wǎng)絡(luò)對(duì)象表中檢索網(wǎng)絡(luò)對(duì)象的匹配條目;和如果在網(wǎng)絡(luò)對(duì)象表中找到所述匹配條目,就執(zhí)行一個(gè)與所述匹配條目相關(guān)的行動(dòng)。
2.權(quán)利要求1的方法,其中,網(wǎng)絡(luò)對(duì)象表是從一個(gè)網(wǎng)站讀取的。
3.權(quán)利要求1的方法,其中,網(wǎng)絡(luò)對(duì)象表是從一個(gè)存儲(chǔ)多個(gè)網(wǎng)絡(luò)對(duì)象的網(wǎng)絡(luò)對(duì)象表的位置讀取的。
4.權(quán)利要求1的方法,其中,將網(wǎng)絡(luò)對(duì)象表包含在一個(gè)也包含一個(gè)特定語(yǔ)境語(yǔ)法的對(duì)話定義文件中。
5.權(quán)利要求1的方法,其中,將網(wǎng)絡(luò)對(duì)象表包含在一個(gè)也包含一個(gè)自然語(yǔ)言處理數(shù)據(jù)庫(kù)的條目的對(duì)話定義文件中。
6.權(quán)利要求1的方法,其中,將網(wǎng)絡(luò)對(duì)象表包含在一個(gè)也包含一個(gè)特定語(yǔ)境語(yǔ)法和一個(gè)自然語(yǔ)言處理數(shù)據(jù)庫(kù)的條目的對(duì)話定義文件中。
7.一種用于為與網(wǎng)絡(luò)對(duì)象進(jìn)行語(yǔ)音交互而更新計(jì)算機(jī)的系統(tǒng),該系統(tǒng)包含一個(gè)網(wǎng)絡(luò)接口,用于傳輸一個(gè)與一個(gè)網(wǎng)絡(luò)對(duì)象相關(guān)聯(lián)的對(duì)話定義文件,其中,對(duì)話定義文件含有一個(gè)網(wǎng)絡(luò)對(duì)象表;一個(gè)數(shù)據(jù)處理器,用于在網(wǎng)絡(luò)對(duì)象表中檢索網(wǎng)絡(luò)對(duì)象的匹配條目;和一個(gè)應(yīng)用界面,用于在如果在網(wǎng)絡(luò)對(duì)象表中找到所述匹配條目時(shí),就執(zhí)行一個(gè)與所述匹配條目相關(guān)的行動(dòng)。
8.一種用于為與網(wǎng)絡(luò)對(duì)象進(jìn)行語(yǔ)音交互而更新計(jì)算機(jī)的方法,該方法包含下列步驟查找一個(gè)與一個(gè)網(wǎng)絡(luò)對(duì)象相關(guān)聯(lián)的對(duì)話定義文件,其中,對(duì)話定義文件包含一個(gè)網(wǎng)絡(luò)對(duì)象表;讀取對(duì)話定義文件;在網(wǎng)絡(luò)對(duì)象表中檢索網(wǎng)絡(luò)對(duì)象的匹配條目;和如果在網(wǎng)絡(luò)對(duì)象表中找到所述匹配條目,就執(zhí)行一個(gè)與所述匹配條目相關(guān)的行動(dòng)。
9.權(quán)利要求8的方法,其中,對(duì)話定義文件是從一個(gè)網(wǎng)站讀取的。
10.權(quán)利要求8的方法,其中,對(duì)話定義文件是從一個(gè)存儲(chǔ)多個(gè)網(wǎng)絡(luò)對(duì)象的對(duì)話定義文件的位置讀取的。
11.權(quán)利要求8的方法,其中,對(duì)話定義文件是從存儲(chǔ)介質(zhì)讀取的。
12.權(quán)利要求8的方法,其中,對(duì)話定義文件包含一個(gè)特定語(yǔ)境語(yǔ)法。
13.權(quán)利要求8的方法,其中,對(duì)話定義文件包含一個(gè)自然語(yǔ)言處理數(shù)據(jù)庫(kù)的條目。
14.權(quán)利要求8的方法,其中,對(duì)話定義文件包含一個(gè)特定語(yǔ)境語(yǔ)法和一個(gè)自然語(yǔ)言處理數(shù)據(jù)庫(kù)的條目。
全文摘要
一種用于通過(guò)計(jì)算機(jī)用話語(yǔ)、語(yǔ)音處理和自然語(yǔ)言處理與網(wǎng)絡(luò)對(duì)象交互的系統(tǒng)和方法。一個(gè)數(shù)據(jù)定義文件聯(lián)系網(wǎng)絡(luò)對(duì)象和一個(gè)語(yǔ)音處理器。數(shù)據(jù)定義文件包含一個(gè)與網(wǎng)絡(luò)對(duì)象(包括語(yǔ)法文件和自然語(yǔ)言處理器)有關(guān)的存儲(chǔ)器結(jié)構(gòu)。語(yǔ)音處理器在第一語(yǔ)法文件檢索話語(yǔ)的匹配短語(yǔ),如果在第一語(yǔ)法文件找不到匹配短語(yǔ)時(shí),就在第二語(yǔ)法文件檢索匹配短語(yǔ)。系統(tǒng)也包含一個(gè)自然語(yǔ)言處理器,用于在一個(gè)數(shù)據(jù)庫(kù)檢索匹配短語(yǔ)的匹配條目;一個(gè)應(yīng)用界面,用于如果在數(shù)據(jù)庫(kù)找到匹配條目時(shí),就執(zhí)行一個(gè)與匹配條目相關(guān)的行動(dòng)。系統(tǒng)采用特定語(yǔ)境語(yǔ)法,由此增強(qiáng)語(yǔ)音識(shí)別和自然語(yǔ)言處理的效率。系統(tǒng)另外還能自適應(yīng)地以交互方式“學(xué)習(xí)”單詞和短語(yǔ)以及它們的相關(guān)意思。
文檔編號(hào)G10L15/00GK1325528SQ99813098
公開(kāi)日2001年12月5日 申請(qǐng)日期1999年9月8日 優(yōu)先權(quán)日1998年9月9日
發(fā)明者D·C·韋博 申請(qǐng)人:單一聲音技術(shù)公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
内黄县| 丘北县| 五河县| 贵南县| 龙门县| 洛南县| 乌兰县| 青田县| 禹城市| 民和| 郴州市| 项城市| 兰溪市| 凤阳县| 武安市| 吴川市| 定边县| 丹阳市| 敦煌市| 光泽县| 华阴市| 平乡县| 闻喜县| 海宁市| 海伦市| 宜丰县| 昆山市| 上饶县| 同心县| 开化县| 贡嘎县| 贵溪市| 万宁市| 体育| 会宁县| 永川市| 灵璧县| 天柱县| 古丈县| 哈尔滨市| 车致|