一種基于知識圖譜的智慧城市信息問答方法

文檔序號：40589996發(fā)布日期：2025-01-07 20:30閱讀：7來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及人工智能知識圖譜問答領(lǐng)域，特別涉及一種基于知識圖譜的智慧城市信息問答方法。

背景技術(shù)：

0、技術(shù)背景

1、伴隨著人工智能領(lǐng)域技術(shù)的迅速發(fā)展，知識圖譜在近幾年成為一個重要的研究方向。知識圖譜本質(zhì)上是一個龐大的知識網(wǎng)絡(luò)，以圖的形式將知識連接起來。谷歌在2012年正式提出knowledge?graph，其通過信息抽取、知識加工等自然語言處理工具將非結(jié)構(gòu)化的數(shù)據(jù)構(gòu)建為知識圖譜，使海量的數(shù)據(jù)以結(jié)構(gòu)化、關(guān)聯(lián)化的形式展示出來，以更接近人類的認知形式進行建構(gòu)和管理，從而更好地發(fā)掘以往隱藏在數(shù)據(jù)中的關(guān)系，充分利用知識之間的價值。

2、問答系統(tǒng)屬于一種高級的信息檢索方式，不同于搜索引擎輸入問題后反饋給用戶網(wǎng)頁鏈接，它能用簡潔、直觀的自然語言形式回答用戶的問題?；谥R圖譜的問答系統(tǒng)能夠準(zhǔn)確理解用戶輸入問題的意圖，通過查詢知識圖譜中的實體、關(guān)系和屬性后將答案回復(fù)給用戶，從而大大提高的信息檢索的效率和準(zhǔn)確性。目前，知識圖譜的問答系統(tǒng)已經(jīng)在醫(yī)療、金融、常識知識問答領(lǐng)域得到了廣泛應(yīng)用。

3、為了彌補用戶通過查詢百科了解中國城市信息的局限性，滿足用戶想要更直觀獲取中國城市知識的需求，利用自然語言處理工具將城市信息構(gòu)建知識圖譜并實現(xiàn)知識圖譜問答能充分發(fā)揮知識圖譜的優(yōu)勢，免去了用戶手動檢索的過程，直接將對應(yīng)的問答結(jié)果回傳，從而更好地滿足用戶獲取信息的需求。

技術(shù)實現(xiàn)思路

1、本發(fā)明的目的是針對現(xiàn)有技術(shù)的不足，從而提供一種基于知識圖譜的智慧城市信息問答方法。這種方法充分發(fā)揮了知識圖譜問答系統(tǒng)準(zhǔn)確率高的優(yōu)勢，提升用戶的問答體驗。

2、實現(xiàn)本發(fā)明目的的技術(shù)方案是：

3、一種基于知識圖譜的智慧城市信息問答方法，其包括如下步驟：

4、1)中國城市信息數(shù)據(jù)的采集：由于目前沒有現(xiàn)有的結(jié)構(gòu)化的中國城市信息數(shù)據(jù)集，因此需要利用爬蟲技術(shù)從權(quán)威網(wǎng)站獲取中國城市信息，本發(fā)明采用selenium技術(shù)獲取中國城市信息百科知識，經(jīng)過數(shù)據(jù)清洗將數(shù)據(jù)中的缺失項進行處理，將處理好的數(shù)據(jù)進行格式轉(zhuǎn)化，生成csv文件用于建構(gòu)知識圖譜。

5、2)構(gòu)建中國城市信息知識圖譜：根據(jù)獲取的數(shù)據(jù)構(gòu)建中國城市信息知識圖譜的schema，其中包括三種實體類別和三種實體間的關(guān)系，其中城市實體有十三種屬性值。根據(jù)schema利用py2neo包編寫python腳本構(gòu)建知識圖譜并導(dǎo)入neo4j圖數(shù)據(jù)庫中，實現(xiàn)中國城市信息圖譜的可視化；

6、3)意圖識別模型構(gòu)建：本發(fā)明采用深度學(xué)習(xí)模型作為識別用戶意圖的功能模塊，包括lr+gbdt多模型融合和bert+textcnn兩種方法。其中l(wèi)r+gbdt混合模型用于識別用戶的閑聊意圖，將問題文本進行向量化處理提取用戶問句特征，將從用戶問句提取的特征送入邏輯回歸模型lr和梯度提升決策樹模型gbdt，采用加權(quán)平均的方式將兩個模型進行融合，實現(xiàn)對用戶閑聊意圖的識別。bert+textcnn用于判斷用戶提問問題的類別，bert模型對用戶問句進行特征提取，將問句轉(zhuǎn)化為高緯度的語意向量表示，textcnn模型將bert提取的語義向量作為輸入，利用一維卷積操作在語意向量的基礎(chǔ)上提取特征，捕獲文本中的關(guān)鍵信息，最后將特征送入訓(xùn)練好的分類器后獲得分類預(yù)測的結(jié)果。

7、4)城市實體識別模型構(gòu)建：本發(fā)明采用深度學(xué)習(xí)模型實現(xiàn)城市實體識別模型，具體采用bilstm+crf的方法實現(xiàn)城市實體識別功能，對輸入文本進行特征提取，采用詞嵌入將文本轉(zhuǎn)化為向量表示，用雙向長短期記憶網(wǎng)絡(luò)bilstm充分獲取問題文本向量的上下文信息，再送入條件隨機場crf添加標(biāo)簽之間的約束條件，最后輸出預(yù)測結(jié)果。

8、5)用戶問題處理：將意圖識別模型與實體識別模型采用flask發(fā)布api端口方便調(diào)用。對于用戶輸入的問題，首先問題經(jīng)過lr+gbdt進行閑聊意圖判斷，若問題為閑聊則直接返回用戶閑聊語料庫語句。若不是閑聊則調(diào)用bert+textcnn意識識別模塊識別用戶提問具體意圖，并給出問題的置信度，唯有置信度超過閾值才會執(zhí)行后續(xù)操作，否則進行反問操作以確定用戶意圖。同時將用戶問句送入bilstm+crf模塊識別用戶問句的城市實體，送入城市實體槽位列表，用于后續(xù)操作。

9、6)答案生成：本發(fā)明根據(jù)實體識別和意圖識別的結(jié)果，采用槽位填充的方式實現(xiàn)知識圖譜的查詢和問答答案的生成。根據(jù)意圖識別的結(jié)果確定要填充的槽位，將實體結(jié)果送入實體填充槽位，將實體槽位值送入查詢語句模版生成cypher查詢語句送入neo4j進行查詢操作，查詢結(jié)果送入答案生成模版生成自然語言形式的答案返回給用戶。

10、相比較于傳統(tǒng)的搜索引擎，該發(fā)明免去了用戶手動檢索的過程，直接將對應(yīng)的問答結(jié)果反饋給用戶，從而更好地滿足用戶獲取信息的需求。

技術(shù)特征：

1.一種基于知識圖譜的智慧城市信息問答方法，其特征在于，包括如下步驟：

技術(shù)總結(jié)
本發(fā)明公開了一種基于知識圖譜的智慧城市信息問答方法，包括1)中國城市信息數(shù)據(jù)的采集；2)構(gòu)建中國城市信息知識圖譜；3)意圖識別模型構(gòu)建；4)城市實體識別模型構(gòu)建；5)用戶問題處理；6)答案生成。相比較于搜索引擎，該發(fā)明充分發(fā)揮知識圖譜的優(yōu)勢，免去了用戶手動檢索的過程，直接將對應(yīng)的問答結(jié)果反饋給用戶，從而更好地滿足用戶獲取信息的需求。

技術(shù)研發(fā)人員：覃遠年,寧波,雷送強,盧玉勝,杜翔宇,陶文飛
受保護的技術(shù)使用者：桂林電子科技大學(xué)
技術(shù)研發(fā)日：
技術(shù)公布日：2025/1/6

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：覃遠年,寧波,雷送強,盧玉勝,杜翔宇,陶文飛
技術(shù)所有人：桂林電子科技大學(xué)
我是此專利的發(fā)明人

上一篇：一種柔性連續(xù)沖壓線組件的制作方法
上一篇：一種義齒加工用義齒燒結(jié)裝置的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于知識圖譜的智慧城市信息問答方法