欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種開放式自然語言模板的創(chuàng)建方法

文檔序號:6605242閱讀:690來源:國知局
專利名稱:一種開放式自然語言模板的創(chuàng)建方法
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)對自然語言的處理技術(shù),特別涉及一種開放式自然語言模板的創(chuàng)建方法。
背景技術(shù)
目前,隨著計(jì)算機(jī)的普及,人們對智能化人機(jī)交互系統(tǒng)、機(jī)器翻譯系統(tǒng)及其他特定信息處理系統(tǒng)的需求不斷增多,對系統(tǒng)相關(guān)信息進(jìn)行處理并加以智能化和人性化的呈現(xiàn)成為一個(gè)被廣泛關(guān)注的領(lǐng)域,而作為人類最基本的信息交流手段之一自然語言的智能化呈現(xiàn),則是該領(lǐng)域中的一個(gè)熱點(diǎn)。
現(xiàn)有的智能化人機(jī)交互系統(tǒng)中,往往是一對一的方式。一般的情況是用計(jì)算機(jī)的程序語言實(shí)現(xiàn)各種約定好的語言邏輯,這需要完全按照約定好的語言邏輯來編寫程序語言,同時(shí)要求在人機(jī)交互過程中,必須按照約定好的語言邏輯來輸入自然語言,這種方法實(shí)現(xiàn)過程繁瑣且無法適應(yīng)靈活多變的交互引導(dǎo)需求。
現(xiàn)有的機(jī)器翻譯系統(tǒng)中,大多只能按照程序中所描述的語法、語義對翻譯后的詞匯進(jìn)行重新組合,并形成最終的目標(biāo)語言。
雖然有極少數(shù)系統(tǒng)在形成目標(biāo)語言過程中還引入了一定的語言模板概念,給出了固定的語言模板,以填空為基本方式形成目標(biāo)語言。這樣的固定語言模板,對于簡單的特定業(yè)務(wù)或?qū)I(yè)翻譯有一定的成效。但是,固定語言模板只能針對某些特定的業(yè)務(wù)或特定的翻譯專業(yè),這就需要對每種要求自然語言呈現(xiàn)的業(yè)務(wù)或翻譯的專業(yè)分別進(jìn)行程序開發(fā),并要求開發(fā)人員具有多種業(yè)務(wù)知識和所翻譯專業(yè)的專業(yè)知識,從而造成大量的人力、物力的資源浪費(fèi)。而且,由于面向的是最終用戶,產(chǎn)品一旦發(fā)布便難以對即定的語法關(guān)系及語言模板進(jìn)行調(diào)整,而其要求自然語言呈現(xiàn)的對象卻是一個(gè)無限的不確定領(lǐng)域,因此采用固定的語言模板難以生成符合人的表述習(xí)慣的自然語言。

發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的在于提供一種開放式自然語言模板的創(chuàng)建方法,該方法能夠簡單、靈活創(chuàng)建自然語言模板,而不再局限于提供一些固定的語言模板。
為達(dá)到上述目的,本發(fā)明的技術(shù)方案具體是這樣實(shí)現(xiàn)的一種開放式自然語言模板的創(chuàng)建方法,該方法包括以下步驟1)根據(jù)業(yè)務(wù)類型及其功能描述確定業(yè)務(wù)信息,并提取該業(yè)務(wù)對應(yīng)的必要自然語言原形;2)將步驟1)所述的自然語言原形中的隨業(yè)務(wù)動(dòng)態(tài)變化的所有文字分別設(shè)置為不同名稱且隨業(yè)務(wù)動(dòng)態(tài)變化實(shí)時(shí)修改的語義槽;3)按業(yè)務(wù)信息的自然語言原形語法規(guī)則,將自然語言原形文字與一個(gè)或一個(gè)以上語義槽組合,作為自然語言模板保存;該方法可以進(jìn)一步將生成的自然語言模板以字符串形式保存在文件或數(shù)據(jù)庫中。并可以由用戶直接在文件或數(shù)據(jù)庫中修改自然語言模板的自然語言原形文字和語義槽。
該方法步驟3)可以進(jìn)一步包括按業(yè)務(wù)需求將自然語言原形語句直接作為自然語言模板保存。
步驟3)還可以包括按業(yè)務(wù)需求將自然語言原形文字與表達(dá)同一語義且重復(fù)出現(xiàn)的一個(gè)以上語義槽組合成語義塊,作為自然語言模板保存。
步驟3)還可以按業(yè)務(wù)需求將自然語言原形文字與一個(gè)以上語義塊進(jìn)行嵌套組合,作為自然語言模板保存。
該方法還可以進(jìn)一步包括對生成的自然語言模板進(jìn)行檢驗(yàn),對于不完整或不符合自然語言模板編寫格式的自然語言模板給出錯(cuò)誤信息。
該方法可以進(jìn)一步包括統(tǒng)計(jì)各個(gè)語義塊重復(fù)出現(xiàn)的次數(shù),并將統(tǒng)計(jì)結(jié)果作為語義塊的一部分保存。
由上述的技術(shù)方案可見,本發(fā)明的這種開放式自然語言模板的創(chuàng)建方法,該方法能夠簡單、靈活創(chuàng)建自然語言模板,而不再局限于提供一些固定的語言模板。利用本發(fā)明方法不需要進(jìn)行任何編碼,便可以迅速創(chuàng)建滿足任何業(yè)務(wù)及功能需求呈現(xiàn)的開放式自然語言模板。


圖1為本發(fā)明開放式自然語言模板創(chuàng)建方法的過程示意圖。
具體實(shí)施例方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,下面結(jié)合實(shí)施例和附圖,對本發(fā)明進(jìn)一步詳細(xì)說明。
參見圖1,圖1為本發(fā)明開放式自然語言模板創(chuàng)建方法的過程示意圖。如圖1所示,本發(fā)明開放式自然語言模板創(chuàng)建方法的具體實(shí)現(xiàn)過程為步驟101,首先確定業(yè)務(wù)信息,并提取自然語言原形;也就是明確當(dāng)前需要為什么系統(tǒng)創(chuàng)建語言模板,其涉及什么業(yè)務(wù),又需要為哪些功能描述設(shè)計(jì)語言模板,并將該業(yè)務(wù)中必須用到和可能用到的語言提取為自然語言原形。
步驟102,將步驟101所述的自然語言原形中信息變量為設(shè)置語義槽;即將自然語言原形中跟隨業(yè)務(wù)信息變化而動(dòng)態(tài)變化的文字設(shè)置為語義槽。
步驟103,按業(yè)務(wù)信息的自然語言原形語法規(guī)則,將自然語言原形文字與語義槽組合,作為自然語言模板保存。也就是將自然語言原形中的跟隨業(yè)務(wù)信息變化而動(dòng)態(tài)變化的文字用語義槽替換,組合為自然語言模板;還可以按業(yè)務(wù)需求將自然語言原形中沒有信息變量的語句作為自然語言模板保存;也可以按業(yè)務(wù)需求將自然語言原形文字與表達(dá)同一語義且重復(fù)出現(xiàn)的一個(gè)以上語義槽組合成語義塊,作為自然語言模板保存;更可以按業(yè)務(wù)需求將自然語言原形文字與一個(gè)以上語義塊進(jìn)行嵌套組合,作為自然語言模板保存??梢?,本發(fā)明生成的自然語言模板的靈活性和多樣性,根據(jù)該模板生成的自然語言更符合人們的表述習(xí)慣。
另外,在創(chuàng)建自然語言模板的同時(shí),統(tǒng)計(jì)各個(gè)語義塊重復(fù)出現(xiàn)的次數(shù),并將統(tǒng)計(jì)結(jié)果作為語義塊的一部分保存,以便于用自然語言模板生成自然語言。
同時(shí),為了防止誤寫等原因造成自然語言模板的錯(cuò)誤,在模板生成后對其進(jìn)行檢驗(yàn),對于不完整或不符合自然語言模板編寫格式的自然語言模板給出錯(cuò)誤信息,提示修改模板,保證生成的自然語言模板的準(zhǔn)確性。
生成的自然語言模板可以以字符串形式保存在文件或數(shù)據(jù)庫中,讀取更加的方便。
當(dāng)業(yè)務(wù)變化時(shí),該已創(chuàng)建的自然語言模板可由用戶直接修改自然語言模板的自然語言原形文字和語義槽。例如,由用戶根據(jù)業(yè)務(wù)需要直接在文件或數(shù)據(jù)庫中修改自然語言模板的自然語言原形文字和語義槽,體現(xiàn)了本發(fā)明的開放性。
以下結(jié)合開放式自然語言模板在語音郵件系統(tǒng)中的應(yīng)用實(shí)例,有針對性的對開放式自然語言模板創(chuàng)建的具體過程進(jìn)行說明。這里的語音郵件系統(tǒng)是指通過電話與系統(tǒng)的語音交互來進(jìn)行郵件讀和寫的系統(tǒng)。
要實(shí)現(xiàn)通過電話與系統(tǒng)的語音交互,需要在語音郵件系統(tǒng)投入使用之前,在系統(tǒng)中通過建立自然語言模板,在語音郵件系統(tǒng)使用時(shí),將自然語言模板解析生成自然語言播放給用戶。建立自然語言模板是建立語音郵件系統(tǒng)的一個(gè)重要環(huán)節(jié)。其具體應(yīng)用過程為第一步,在創(chuàng)建自然語言模板之前,首先需要明確當(dāng)前所要?jiǎng)?chuàng)建語言模板所涉及的業(yè)務(wù)范圍及其業(yè)務(wù)動(dòng)態(tài)信息。在本實(shí)施例中,業(yè)務(wù)范圍是指郵件處理,業(yè)務(wù)動(dòng)態(tài)信息是指郵件主題、郵件正文、發(fā)信人等與郵件相關(guān)的各種系統(tǒng)原始信息。
第二步,根據(jù)動(dòng)態(tài)信息存儲模塊中存儲的動(dòng)態(tài)信息涉及業(yè)務(wù)的語言呈現(xiàn)需要,整理提取各種描述系統(tǒng)服務(wù)和業(yè)務(wù)狀態(tài)的自然語言原形并將其中的信息變量設(shè)置為語義槽,如“您現(xiàn)在有五封郵件,一封來自張三、兩封來自李四、兩封來自王五”。本實(shí)施例中語義槽用[]來標(biāo)識,則其中總郵件數(shù)“五”設(shè)置為語義槽[AllMailNum]、一個(gè)用戶發(fā)送的郵件總數(shù)“一”或“兩”設(shè)置為語義槽[UserMailNum]、發(fā)送郵件的用戶“張三”、“李四”或“王五”設(shè)置為語義槽[UserMailName],即能夠從系統(tǒng)中獲得信息值的信息變量可以設(shè)置為語義槽。這些信息變量有些是直接從系統(tǒng)能夠獲得的信息,如郵件來源“張三”等,有些是需要系統(tǒng)經(jīng)過統(tǒng)計(jì)獲得的信息,如郵件的封數(shù)“五”等。這兩類信息共同滿足自然語言原形對系統(tǒng)各種描述的需要,另外有些語言原形如“您現(xiàn)在沒有任何郵件”與系統(tǒng)中保存的系統(tǒng)信息相同,不需要語義槽支持,保留語言原形。
第三步,將自然語言原形與語義槽按照自然語言原形的語法規(guī)則,用語義槽替換在自然語言原形中與之對應(yīng)的詞匯,組合成與自然語言原形對應(yīng)的自然語言模板保存,如表一中的“您現(xiàn)在有[AllMailNum]封郵件”。
也可以按業(yè)務(wù)需求將自然語言原形文字與表達(dá)同一語義且重復(fù)出現(xiàn)的多個(gè)語義槽組合成語義塊,作為自然語言模板保存,本實(shí)施例中語義塊用{}來標(biāo)識,如表一中的{[UserMailNum]封來自[UserMailName]、[@UserNum]}其中,[@UserNum]是循環(huán)次數(shù)控制槽,是系統(tǒng)統(tǒng)計(jì)的該語義塊重復(fù)出現(xiàn)的次數(shù),在語言模板解析時(shí)不作為語義輸出。例如語言原形為“一封來自張三、兩封來自李四、兩封來自王五”系統(tǒng)給[@UserNum]賦值3,表示該語義塊循環(huán)出現(xiàn)3次。
在這里,循環(huán)次數(shù)控制槽是顯式用法,在語義塊中還可以用隱式用法,即將當(dāng)前語義塊中第一個(gè)語義槽與該語義塊重復(fù)出現(xiàn)的次數(shù)相關(guān)聯(lián),而不寫入語義塊。兩種方法實(shí)現(xiàn)都比較簡單,顯式方法比較直觀。

表一還可以按業(yè)務(wù)需求將自然語言原形文字與一個(gè)以上語義塊進(jìn)行嵌套組合,作為自然語言模板保存。
另外有些語言原形與系統(tǒng)中保存的系統(tǒng)信息相同,不含語義槽,直接用做自然語言模板,如表一中的“您現(xiàn)在沒有任何郵件”。
最終生成的自然語言模板主要由模版要素及文字串組成,最基本的模版要素包括“語義槽”、“語義塊”及“塊循環(huán)記數(shù)”等三類,如表二所示。

表二上表中三種用于表示基本模版要素的符號,僅為系統(tǒng)應(yīng)用實(shí)施例中的一種,在實(shí)際系統(tǒng)中可用其他任意的符號實(shí)現(xiàn)表示上述模版要素。
利用上述三種基本的模板要素,基本能夠?qū)崿F(xiàn)各種常規(guī)自然語言模板的編寫,但在編寫某些特殊語言邏輯時(shí)可能需要對上述三種模版要素特別是語義塊進(jìn)行多層的嵌套組合,或使用在上述三種模板基礎(chǔ)上演化而來的新的模板要素。
除了模板要素具有開放性的特點(diǎn),構(gòu)成模板要素的內(nèi)容,特別是語義槽中的槽名,也具有開放式的特點(diǎn),用戶根據(jù)不同業(yè)務(wù)的要求或喜好,可隨意的增添新的語義槽或改變槽名。
每個(gè)語義塊“{}”系統(tǒng)都會為之分配一個(gè)默認(rèn)的塊循環(huán)計(jì)數(shù)槽[@LoopCount],并且在調(diào)用{}時(shí)系統(tǒng)自動(dòng)將其初始化為1。塊循環(huán)計(jì)數(shù)槽[@LoopCount]在解析過程中會自動(dòng)記錄語義塊內(nèi)容被循環(huán)使用的次數(shù),并可供生成提示語使用,如表二中{[@LoopCount]},在第一步解析,也就是生成第一句提示語時(shí)其為1;第二步解析,也就是生成第二句提示語時(shí)其為2。
此外在編寫自然語言模板時(shí)一般還需要為每個(gè)語義塊“{}”指定一個(gè)與塊循環(huán)記數(shù)[@LoopCount]相對應(yīng)的用來動(dòng)態(tài)指定語義塊循環(huán)總數(shù)循環(huán)次數(shù)控制槽,如表一例一中的[@UserNum],該類控制槽的槽名以“@”作為前綴,并且通常是關(guān)于語義塊需要重復(fù)語義的統(tǒng)計(jì)信息。
為了防止誤寫等原因造成自然語言模板的錯(cuò)誤,本實(shí)施例在模板生成后對其進(jìn)行檢驗(yàn),對于不完整或不符合自然語言模板編寫格式的自然語言模板給出錯(cuò)誤信息,提示修改模板,保證生成的自然語言模板的準(zhǔn)確性。
本實(shí)施例生成的自然語言模板最終是以字符串形式保存在語音郵件系統(tǒng)服務(wù)器的數(shù)據(jù)庫中,讀取更加方便。這樣,當(dāng)業(yè)務(wù)變化時(shí),可以直接在數(shù)據(jù)庫中修改自然語言模板的自然語言原形文字和語義槽。
由上述的實(shí)施例可見,本發(fā)明為用戶提供了一種簡單、靈活的創(chuàng)建開放式自然語言模板的方法,而不局限于提供一些固定的語言模板。利用本發(fā)明方法不需要進(jìn)行任何編碼,便可以迅速創(chuàng)建滿足任何業(yè)務(wù)及功能需求呈現(xiàn)的開放式自然語言模板。
權(quán)利要求
1.一種開放式自然語言模板的創(chuàng)建方法,其特征在于,該方法包括以下步驟1)根據(jù)業(yè)務(wù)類型及其功能描述確定業(yè)務(wù)信息,并提取該業(yè)務(wù)對應(yīng)的必要自然語言原形;2)將步驟1)所述的自然語言原形中的隨業(yè)務(wù)動(dòng)態(tài)變化的所有文字分別設(shè)置為不同名稱且隨業(yè)務(wù)動(dòng)態(tài)變化實(shí)時(shí)修改的語義槽;3)按業(yè)務(wù)信息的自然語言原形語法規(guī)則,將自然語言原形文字與一個(gè)或一個(gè)以上語義槽組合,作為自然語言模板保存;
2.如權(quán)利要求1所述的開放式自然語言模板的創(chuàng)建方法,其特征在于該方法進(jìn)一步將生成的自然語言模板以字符串形式保存在文件或數(shù)據(jù)庫中。
3.如權(quán)利要求2所述的開放式自然語言模板的創(chuàng)建方法,其特征在于,該方法進(jìn)一步包括由用戶直接在文件或數(shù)據(jù)庫中修改自然語言模板的自然語言原形文字和語義槽。
4.如權(quán)利要求1所述的開放式自然語言模板的創(chuàng)建方法,其特征在于該方法步驟3)進(jìn)一步包括按業(yè)務(wù)需求將自然語言原形中語句直接作為自然語言模板保存。
5.如權(quán)利要求1所述的開放式自然語言模板的創(chuàng)建方法,其特征在于該方法步驟3)進(jìn)一步包括按業(yè)務(wù)需求將自然語言原形文字與表達(dá)同一語義且重復(fù)出現(xiàn)的一個(gè)以上語義槽組合成語義塊,作為自然語言模板保存。
6.如權(quán)利要求5所述的開放式自然語言模板的創(chuàng)建方法,其特征在于該方法步驟3)進(jìn)一步包括按業(yè)務(wù)需求將自然語言原形文字與一個(gè)以上語義塊進(jìn)行嵌套組合,作為自然語言模板保存。
7.如權(quán)利要求1所述的開放式自然語言模板的創(chuàng)建方法,其特征在于該方法進(jìn)一步包括對生成的自然語言模板進(jìn)行檢驗(yàn),對于不完整或不符合自然語言模板編寫格式的自然語言模板給出錯(cuò)誤信息。
8.如權(quán)利要求5所述的開放式自然語言模板的創(chuàng)建方法,其特征在于該方法進(jìn)一步包括統(tǒng)計(jì)各個(gè)語義塊重復(fù)出現(xiàn)的次數(shù),并將統(tǒng)計(jì)結(jié)果作為語義塊的一部分保存。
全文摘要
本發(fā)明公開了一種開放式自然語言模板的創(chuàng)建方法,該方法包括以下步驟1)根據(jù)業(yè)務(wù)類型及其功能描述確定業(yè)務(wù)信息,并提取該業(yè)務(wù)對應(yīng)的必要自然語言原形;2)將步驟1)所述的自然語言原形中的隨業(yè)務(wù)動(dòng)態(tài)變化的所有文字分別設(shè)置為不同名稱且隨業(yè)務(wù)動(dòng)態(tài)變化實(shí)時(shí)修改的語義槽;3)按業(yè)務(wù)信息的自然語言原形語法規(guī)則,將自然語言原形文字與一個(gè)或一個(gè)以上語義槽組合,作為自然語言模板保存。本發(fā)明的這種開放式自然語言模板的創(chuàng)建方法,該方法能夠簡單、靈活創(chuàng)建自然語言模板,而不再局限于提供一些固定的語言模板。利用本發(fā)明方法不需要進(jìn)行任何編碼,便可以迅速創(chuàng)建滿足任何業(yè)務(wù)及功能需求呈現(xiàn)的開放式自然語言模板。
文檔編號G06F17/27GK1512395SQ02159240
公開日2004年7月14日 申請日期2002年12月27日 優(yōu)先權(quán)日2002年12月27日
發(fā)明者孫久文, 孫文彥, 諸光, 劉武, 任文捷, 王楠, 申江濤, 王江, 高建忠, 王建新 申請人:聯(lián)想(北京)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
泽州县| 平果县| 金寨县| 探索| 资兴市| 九江县| 仁布县| 临邑县| 林西县| 陆良县| 腾冲县| 乐业县| 天津市| 黔南| 宁城县| 泾源县| 民县| 科技| 长武县| 太谷县| 万年县| 延安市| 靖西县| 樟树市| 南充市| 阳春市| 南溪县| 龙井市| 宁阳县| 旌德县| 渝中区| 集贤县| 贵德县| 吴江市| 弥渡县| 饶阳县| 博野县| 甘德县| 东乡族自治县| 济源市| 嫩江县|