欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

智能問答系統(tǒng)中抽象語義庫的更新方法及更新裝置的制造方法

文檔序號:9911004閱讀:551來源:國知局
智能問答系統(tǒng)中抽象語義庫的更新方法及更新裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及人機(jī)交互技術(shù)領(lǐng)域,尤其涉及智能問答系統(tǒng)中抽象語義庫的更新方法及更新裝置。
【背景技術(shù)】
[0002]人機(jī)交互是研究系統(tǒng)與用戶之間的交互關(guān)系的科學(xué)。系統(tǒng)可以是各種各樣的機(jī)器,也可以是計(jì)算機(jī)化的系統(tǒng)和軟件。例如,通過人機(jī)交互可以實(shí)現(xiàn)各種人工智能系統(tǒng),例如,智能客服系統(tǒng)、語音控制系統(tǒng)等等。人工智能語義識(shí)別是人機(jī)交互的基礎(chǔ),其能夠?qū)θ祟愓Z言進(jìn)行識(shí)別,以轉(zhuǎn)換成機(jī)器能夠理解的語言。
[0003]智能問答系統(tǒng)是人機(jī)交互的一種典型應(yīng)用,其中當(dāng)用戶提出問題后,智能問答系統(tǒng)給出該問題的答案。為此,智能問答系統(tǒng)中有一套知識(shí)庫,里面有大量的問題和與每個(gè)問題相對應(yīng)的答案。智能問答系統(tǒng)首先需要識(shí)別用戶所提出的問題,即從知識(shí)庫中找到與該用戶問題所對應(yīng)的問題,然后找出與該問題相匹配的答案。
[0004]智能問答系統(tǒng)的維護(hù)更新是一項(xiàng)重要挑戰(zhàn)。

【發(fā)明內(nèi)容】

[0005]以下給出一個(gè)或多個(gè)方面的簡要概述以提供對這些方面的基本理解。此概述不是所有構(gòu)想到的方面的詳盡綜覽,并且既非旨在指認(rèn)出所有方面的關(guān)鍵性或決定性要素亦非試圖界定任何或所有方面的范圍。其唯一的目的是要以簡化形式給出一個(gè)或多個(gè)方面的一些概念以為稍后給出的更加詳細(xì)的描述之序。
[0006]根據(jù)本發(fā)明的一方面,提供了一種智能問答系統(tǒng)中抽象語義庫的更新方法,包括:
[0007]收集語料;
[0008]生成每個(gè)語料所對應(yīng)的抽象語義表達(dá)式;以及
[0009]將至少部分未存在于抽象語義庫中的新生成抽象語義表達(dá)式添加至該抽象語義庫。
[0010]在一實(shí)例中,該生成每個(gè)語料所對應(yīng)的抽象語義表達(dá)式包括:
[0011 ]對該語料進(jìn)行分詞以獲得若干單獨(dú)詞;
[0012]將每一單獨(dú)詞識(shí)別為語義規(guī)則詞或非語義規(guī)則詞,該語義規(guī)則詞屬于抽象語義表達(dá)式用到的詞語;
[0013]分別對每個(gè)非語義規(guī)則詞進(jìn)行詞性標(biāo)注,得到每個(gè)非語義規(guī)則詞的詞性信息;以及
[0014]至少基于每個(gè)非語義規(guī)則詞的詞性信息將該非語義規(guī)則詞替換為相應(yīng)語義成分符以作為新生成抽象語義表達(dá)式的缺失語義成分。
[0015]在一實(shí)例中,該將每一單獨(dú)詞識(shí)別為語義規(guī)則詞或非語義規(guī)則詞包括:
[0016]在語義規(guī)則詞庫中查找每個(gè)單獨(dú)詞,該語義規(guī)則詞庫包括屬于抽象語義表達(dá)式用到的所有詞語的集合,若該單獨(dú)詞存在于該語義規(guī)則詞庫中則將該單獨(dú)詞識(shí)別為語義規(guī)則詞,否則識(shí)別為非語義規(guī)則詞。
[0017]在一實(shí)例中,該至少基于每個(gè)非語義規(guī)則詞的詞性信息將該非語義規(guī)則詞替換為相應(yīng)語義成分符還包括:
[0018]基于該語料的上下文將該非語義規(guī)則詞替換為相應(yīng)語義成分符以作為新生成抽象語義表達(dá)式的缺失語義成分。
[0019]在一實(shí)例中,該將至少部分未存在于抽象語義庫中的新生成抽象語義表達(dá)式添加至該抽象語義庫包括:
[0020]將經(jīng)確認(rèn)正確的未存在于抽象語義庫的所有新生成抽象語義表達(dá)式直接添加至該抽象語義庫中。
[0021 ]在一實(shí)例中,該方法還包括:
[0022]對未存在于該抽象語義庫中的新生成抽象語義表達(dá)式進(jìn)行語義聚類處理,以形成多個(gè)新生成抽象語義表達(dá)式群集;
[0023]對每個(gè)新生成抽象語義表達(dá)式群集中的抽象語義表達(dá)式進(jìn)行合并處理,以基于每個(gè)新生成抽象語義表達(dá)式群集獲得精簡數(shù)目的簡并抽象語義表達(dá)式;
[0024]其中,該將至少部分未存在于抽象語義庫中的新生成抽象語義表達(dá)式添加至該抽象語義庫包括:
[0025]將經(jīng)確認(rèn)正確的所有簡并抽象語義表達(dá)式添加至該抽象語義庫中。
[0026]在一實(shí)例中,該方法還包括:
[0027]基于每個(gè)新生成抽象語義表達(dá)式群集中抽象語義表達(dá)式的語義相似度進(jìn)行分組,
[0028]其中,該對每個(gè)新生成抽象語義表達(dá)式群集中的抽象語義表達(dá)式進(jìn)行合并處理包括:
[0029]分別以每個(gè)新生成抽象語義表達(dá)式群集中的每一組抽象語義表達(dá)式進(jìn)行該合并處理,以基于每一組抽象語義表達(dá)式獲得一個(gè)簡并抽象語義表達(dá)式。
[0030]根據(jù)本發(fā)明的另一方面,提供了一種智能問答系統(tǒng)中抽象語義庫的更新裝置,包括:
[0031 ]收集模塊,用于收集語料;
[0032]抽象語義表達(dá)式生成模塊,用于生成每個(gè)語料所對應(yīng)的抽象語義表達(dá)式;以及
[0033]抽象語義庫編輯模塊,用于將至少部分未存在于抽象語義庫中的新生成抽象語義表達(dá)式添加至該抽象語義庫。
[0034]在一實(shí)例中,該抽象語義表達(dá)式生成模塊包括:
[0035]分詞模塊,用于對該語料進(jìn)行分詞以獲得若干單獨(dú)詞;
[0036]語義規(guī)則詞識(shí)別模塊,用于將每一單獨(dú)詞識(shí)別為語義規(guī)則詞或非語義規(guī)則詞,該語義規(guī)則詞屬于抽象語義表達(dá)式用到的詞語;
[0037]詞性標(biāo)注模塊,用于分別對每個(gè)非語義規(guī)則詞進(jìn)行詞性標(biāo)注,得到每個(gè)非語義規(guī)則詞的詞性信息;以及
[0038]填充模塊,用于至少基于每個(gè)非語義規(guī)則詞的詞性信息將該非語義規(guī)則詞替換為相應(yīng)語義成分符以作為新生成抽象語義表達(dá)式的缺失語義成分。
[0039]在一實(shí)例中,該語義規(guī)則詞識(shí)別模塊包括:
[0040]查找模塊,用于在語義規(guī)則詞庫中查找每個(gè)單獨(dú)詞,該語義規(guī)則詞庫包括屬于抽象語義表達(dá)式用到的所有詞語的集合,若該單獨(dú)詞存在于該語義規(guī)則詞庫中則將該單獨(dú)詞識(shí)別為語義規(guī)則詞,否則識(shí)別為非語義規(guī)則詞。
[0041 ]在一實(shí)例中,該填充模塊進(jìn)一步基于該語料的上下文將該非語義規(guī)則詞替換為相應(yīng)語義成分符以作為新生成抽象語義表達(dá)式的缺失語義成分。
[0042]在一實(shí)例中,該抽象語義庫編輯模塊進(jìn)一步用于:
[0043]將經(jīng)確認(rèn)正確的未存在于抽象語義庫的所有新生成抽象語義表達(dá)式直接添加至該抽象語義庫中。
[0044]在一實(shí)例中,該裝置還包括:
[0045]聚類模塊,用于對未存在于該抽象語義庫中的新生成抽象語義表達(dá)式進(jìn)行語義聚類處理,以形成多個(gè)新生成抽象語義表達(dá)式群集;以及
[0046]抽象語義表達(dá)式合并模塊,用于對每個(gè)新生成抽象語義表達(dá)式群集中的抽象語義表達(dá)式進(jìn)行合并處理,以基于每個(gè)新生成抽象語義表達(dá)式群集獲得精簡數(shù)目的簡并抽象語義表達(dá)式,
[0047]其中該抽象語義庫編輯模塊進(jìn)一步用于:
[0048]將經(jīng)確認(rèn)正確的所有簡并抽象語義表達(dá)式添加至該抽象語義庫中。
[0049]在一實(shí)例中,該裝置還包括:
[0050]分組模塊,用于基于每個(gè)新生成抽象語義表達(dá)式群集中抽象語義表達(dá)式的語義相似度進(jìn)行分組,
[0051 ]其中,該抽象語義表達(dá)式合并模塊進(jìn)一步用于:
[0052]分別以每個(gè)新生成抽象語義表達(dá)式群集中的每一組抽象語義表達(dá)式進(jìn)行該合并處理,以基于每一組抽象語義表達(dá)式獲得一個(gè)簡并抽象語義表達(dá)式。
[0053]根據(jù)本發(fā)明的方案,可以自動(dòng)地根據(jù)收集到的語料生成抽象語義表達(dá)式,并且自動(dòng)添加至抽象語義庫中,大大節(jié)省了人力維護(hù)成本。
【附圖說明】
[0054]在結(jié)合以下附圖閱讀本公開的實(shí)施例的詳細(xì)描述之后,能夠更好地理解本發(fā)明的上述特征和優(yōu)點(diǎn)。在附圖中,各組件不一定是按比例繪制,并且具有類似的相關(guān)特性或特征的組件可能具有相同或相近的附圖標(biāo)記。
[0055]圖1是示出了根據(jù)本發(fā)明的一方面的用于智能問答系統(tǒng)中抽象語義庫的更新方法的流程圖;
[0056]圖2示出了根據(jù)本發(fā)明的一方面的用于生成抽象語義表達(dá)式的方法的流程圖;以及
[0057]圖3是示出了根據(jù)本發(fā)明的一方面的用于智能問答系統(tǒng)中抽象語義庫的更新裝置的框圖。
【具體實(shí)施方式】
[0058]以下結(jié)合附圖和具體實(shí)施例對本發(fā)明作詳細(xì)描述。注意,以下結(jié)合附圖和具體實(shí)施例描述的諸方面僅是示例性的,而不應(yīng)被理解為對本發(fā)明的保護(hù)范圍進(jìn)行任何限制。
[0059]知識(shí)庫中的基本知識(shí)點(diǎn)最原始和最簡單的形式就是平時(shí)常用的FAQ,一般的形式是“問-答”對。在本發(fā)明中,“標(biāo)準(zhǔn)問”是用來表示某個(gè)知識(shí)點(diǎn)的文字,主要目標(biāo)是表達(dá)清晰,便于維護(hù)。例如,“彩鈴的資費(fèi)”就是表達(dá)清晰的標(biāo)準(zhǔn)問描述。這里的“問”不應(yīng)被狹義地理解為“詢問”,而應(yīng)廣義地來理解一“輸入”,該“輸入”具有對應(yīng)的“輸出”。例如,對于用于控制系統(tǒng)的語義識(shí)別而言,用戶的一個(gè)指令,例如“打開收音機(jī)”也應(yīng)可以被理解為是一個(gè)“問”,此時(shí)對應(yīng)的“答”可以是用于執(zhí)行相應(yīng)控制的控制程序的調(diào)用。
[0060]用戶在向機(jī)器輸入時(shí),最理想的情況是使用標(biāo)準(zhǔn)問,則機(jī)器的智能語義識(shí)別系統(tǒng)馬上能夠理解用戶的意思。然而,用戶往往并非使用的是標(biāo)準(zhǔn)問,而是標(biāo)準(zhǔn)問的一些變形的形式。例如,若對于收音機(jī)的電臺(tái)切換的標(biāo)準(zhǔn)問形式是“換一個(gè)電臺(tái)”,那么用戶可能使用的命令是“切換一個(gè)電臺(tái)”,機(jī)器也需要能夠識(shí)別用戶表達(dá)的是同一個(gè)意思。
[0061]因此,對于智能語義識(shí)別而言,知識(shí)庫里需要有標(biāo)準(zhǔn)問的擴(kuò)展問,該擴(kuò)展問與標(biāo)準(zhǔn)問表達(dá)形式有略微差異,但是表達(dá)相同的含義。
[0062]進(jìn)一步,為了更準(zhǔn)確、高效地識(shí)別用戶問題,智能問答系統(tǒng)還發(fā)展出了抽象語義的概念。抽象語義是對本體類屬性的進(jìn)一步抽象。一個(gè)類別的抽象語義通過一組抽象語義表達(dá)式的集合來描述一類抽象語義的不同表達(dá),為表達(dá)更為抽象的語義,這些抽象語義表達(dá)式在組成元素上進(jìn)行了擴(kuò)充。當(dāng)這些擴(kuò)充的元素一旦被賦予了相應(yīng)的值就可以表達(dá)各種各樣的具體語義。
[0063]每一個(gè)抽象語義表達(dá)式主要可包括缺失語義成分和語義規(guī)則詞。缺失語義成分由語義成分符表示,當(dāng)這些缺失的語義成分被填充了相應(yīng)的值(即內(nèi)容)后可以表達(dá)各式各樣的具體語義。
[0064]抽象語義的語義成分符可包括:
[0065][concept]:表示主體或客體成份的詞或短語。
[0066]比如:“彩鈴如何開通”中的“彩鈴”
當(dāng)前第1頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1
吉木萨尔县| 浮梁县| 丽水市| 房山区| 乌兰察布市| 黎城县| 大渡口区| 左贡县| 张家港市| 万源市| 河曲县| 德惠市| 新宁县| 昌乐县| 灵宝市| 宁陵县| 太保市| 冷水江市| 淳安县| 德化县| 林周县| 无极县| 郧西县| 台北县| 鱼台县| 洞口县| 峨眉山市| 饶平县| 六安市| 临西县| 阳西县| 莎车县| 梧州市| 阳原县| 全南县| 双峰县| 宁都县| 宜黄县| 肥乡县| 桐城市| 平利县|