本發(fā)明涉及人工智能和安全生產(chǎn)與環(huán)境保護(hù),尤其涉及安環(huán)領(lǐng)域知識問答方法、裝置、電子設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、安全環(huán)保領(lǐng)域涉及的數(shù)據(jù)種類繁多,包括環(huán)境監(jiān)測數(shù)據(jù)、污染源信息、安全生產(chǎn)記錄、政策法規(guī)等,針對安環(huán)領(lǐng)域知識繁雜、種類多樣、用戶需求多變導(dǎo)致知識復(fù)用效率低、精度不高等問題,提出一種融合大語言模型與知識圖譜的安全環(huán)保知識構(gòu)建與知識問答方法。
2、近年來,隨著知識工程的不斷進(jìn)步,越來越多的企業(yè)和組織都在尋求將這一技術(shù)應(yīng)用到安全環(huán)保領(lǐng)域。面對海量的安全環(huán)保數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)處理方式難以快速準(zhǔn)確地提取有價值的信息。知識圖譜通過結(jié)構(gòu)化的知識表示和推理能力,能夠幫助決策者快速找到關(guān)鍵信息,提高決策效率和準(zhǔn)確性,通過知識圖譜的構(gòu)建,可以實現(xiàn)知識的自動化、智能化復(fù)用,提高知識復(fù)用效率和精度,降低人力成本。因此,知識圖譜在安全環(huán)保領(lǐng)域的應(yīng)用前景廣泛而深遠(yuǎn),它不僅能夠提升該領(lǐng)域的創(chuàng)新能力和競爭力,還能夠為企業(yè)和社會帶來實際的效益和價值。
3、然而,隨著技術(shù)的不斷發(fā)展和完善,安全環(huán)保領(lǐng)域的知識圖譜構(gòu)建也面臨著一些挑戰(zhàn)。由于該領(lǐng)域的專業(yè)性和復(fù)雜性,需要根據(jù)企業(yè)自身的特點及其積累的數(shù)據(jù)與知識,探索安全環(huán)保領(lǐng)域知識圖譜的自動構(gòu)建方法,實現(xiàn)安環(huán)領(lǐng)域知識圖譜自動構(gòu)建和智能化應(yīng)用,為安全環(huán)保領(lǐng)域的持續(xù)發(fā)展和創(chuàng)新提供有力的支持。近年來,大語言模型(largelanguage?models,llm)在多種自然語言處理任務(wù)上展現(xiàn)出了顯著的成效。這類模型擁有龐大的參數(shù)規(guī)模和復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu),能夠有效地處理和理解自然語言任務(wù)。然而,當(dāng)面對專業(yè)領(lǐng)域的問題時,大語言模型的生成結(jié)果可能會缺乏真實性和準(zhǔn)確性。
技術(shù)實現(xiàn)思路
1、有鑒于此,有必要提供一種安環(huán)領(lǐng)域知識問答方法、裝置、電子設(shè)備及存儲介質(zhì),用以解決現(xiàn)有技術(shù)在將大語言模型與知識圖譜進(jìn)行結(jié)合后面對專業(yè)領(lǐng)域的問題可能會缺乏真實性和準(zhǔn)確性的技術(shù)問題。
2、為了解決上述問題,本發(fā)明提供一種安環(huán)領(lǐng)域知識問答方法,包括:
3、基于owl本體語言構(gòu)建結(jié)構(gòu)化標(biāo)準(zhǔn)知識描述模型構(gòu)建知識圖譜本體模型;
4、基于深度學(xué)習(xí)模型獲取安環(huán)領(lǐng)域的知識數(shù)據(jù);
5、結(jié)合所述知識圖譜本體模型以及知識數(shù)據(jù)構(gòu)建安環(huán)領(lǐng)域的知識圖譜;
6、基于大語言模型對用戶輸入的自然語言問題進(jìn)行解析,得到查詢語;
7、基于所述大語言模型、知識圖譜以及查詢語生成對應(yīng)的答案。
8、在一種可能的實現(xiàn)方式中,所述基于owl本體語言構(gòu)建結(jié)構(gòu)化標(biāo)準(zhǔn)知識描述模型構(gòu)建知識圖譜本體模型,包括:
9、確定知識圖譜的專業(yè)領(lǐng)域和范疇;
10、基于所述專業(yè)領(lǐng)域以及范疇確定安全環(huán)保領(lǐng)域內(nèi)的術(shù)語和概念;
11、在owl本體語言構(gòu)建結(jié)構(gòu)化標(biāo)準(zhǔn)知識描述模型的基礎(chǔ)上,根據(jù)術(shù)語列表,定義本體模型中的類及其層次結(jié)構(gòu);
12、其中,定義本體模型中的類及其層次結(jié)構(gòu),包括:
13、定義類的屬性,其中,所述屬性包括數(shù)據(jù)屬性和對象屬性;
14、定義類與類之間的關(guān)系。
15、在一種可能的實現(xiàn)方式中,所述基于深度學(xué)習(xí)模型獲取安環(huán)領(lǐng)域的知識數(shù)據(jù),包括:
16、對包括安全環(huán)保領(lǐng)域的標(biāo)準(zhǔn)規(guī)范、實驗報告以及文獻(xiàn)報告的安環(huán)文本數(shù)據(jù)進(jìn)行預(yù)處理;
17、從預(yù)處理后的安環(huán)文本數(shù)據(jù)中提取得到實體以及實體之間的關(guān)系;
18、基于實體以及實體之間的關(guān)系構(gòu)建實體識別模型和關(guān)系識別模型;
19、基于實體識別模型和關(guān)系識別模型進(jìn)行三元組抽取,并將抽取得到的知識數(shù)據(jù)存儲到neo4j圖數(shù)據(jù)庫中。
20、在一種可能的實現(xiàn)方式中,所述對安環(huán)文本數(shù)據(jù)進(jìn)行預(yù)處理,包括:
21、對所述非結(jié)構(gòu)化文本數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,并以txt文件的方式保存預(yù)處理后的安環(huán)文本數(shù)據(jù)。
22、在一種可能的實現(xiàn)方式中,所述從預(yù)處理后的安環(huán)文本數(shù)據(jù)中提取得到實體以及實體之間的關(guān)系,包括:
23、定義安環(huán)文本數(shù)據(jù)中的實體類型;
24、根據(jù)所述實體類型,基于brat工具對所述安環(huán)文本數(shù)據(jù)中的實體進(jìn)行標(biāo)注;
25、基于albert-bilstm-crf模型對標(biāo)注的結(jié)果進(jìn)行實體識別;
26、基于albert-bilstm模型對實體識別的結(jié)果進(jìn)行關(guān)系抽取。
27、其中,關(guān)系包括包含關(guān)系、關(guān)聯(lián)關(guān)系、依賴關(guān)系以及影響關(guān)系。
28、在一種可能的實現(xiàn)方式中,所述基于大語言模型對用戶輸入的自然語言問題進(jìn)行解析,得到查詢語,包括:
29、基于大語言模型對自然語言問題進(jìn)行語句主干提取解析,輸出原問題的解析結(jié)果;
30、將解析結(jié)果轉(zhuǎn)化為cypher語句,得到查詢語。
31、在一種可能的實現(xiàn)方式中,所述基于所述大語言模型、知識圖譜以及查詢語生成對應(yīng)的答案,包括:
32、在所述知識圖譜中檢索與查詢語對應(yīng)的安環(huán)知識;
33、將所述安環(huán)知識以提示的方式和查詢語一起輸入所述大語言模型;
34、基于大語言模型進(jìn)行推理生成答案。
35、本發(fā)明還提供一種安環(huán)領(lǐng)域知識問答裝置,包括:
36、本體模型構(gòu)建模塊,用于基于owl本體語言構(gòu)建結(jié)構(gòu)化標(biāo)準(zhǔn)知識描述模型構(gòu)建知識圖譜本體模型;
37、知識數(shù)據(jù)獲取模塊,用于基于深度學(xué)習(xí)模型獲取安環(huán)領(lǐng)域的知識數(shù)據(jù);
38、知識圖譜構(gòu)建模塊,用于結(jié)合所述本體模型以及知識數(shù)據(jù)構(gòu)建安環(huán)領(lǐng)域的知識圖譜;
39、查詢語轉(zhuǎn)換模塊,用于基于大語言模型對用戶以文字形式輸入的自然語言問題進(jìn)行分析,得到查詢語;
40、答案查詢模塊,用于基于所述大語言模型、知識圖譜以及查詢語生成對應(yīng)的答案。
41、本發(fā)明還提供一種電子設(shè)備,包括:
42、存儲器,用于存儲程序;
43、處理器,與所述存儲器耦合,用于執(zhí)行所述存儲器中存儲的所述程序,以實現(xiàn)上述各方法項中任意一項所述的安環(huán)領(lǐng)域知識問答方法中的步驟。
44、本發(fā)明還提供一種存儲介質(zhì),用于存儲計算機(jī)可讀取的程序或指令,所述程序或指令被處理器執(zhí)行時能夠?qū)崿F(xiàn)上述各方法項中任意一項所述的安環(huán)領(lǐng)域知識問答方法中的步驟。
45、本發(fā)明的有益效果是:本發(fā)明提供了一種安環(huán)領(lǐng)域知識問答方法,首先,本發(fā)明利用知識圖譜相關(guān)技術(shù),能夠結(jié)構(gòu)化地表示安環(huán)領(lǐng)域知識,同時,大語言模型具備理解和生成自然語言的能力,兩者的融合使得安全環(huán)保領(lǐng)域的知識能夠有效整合,形成全面的領(lǐng)域知識體系,從而實現(xiàn)知識的廣泛共享與應(yīng)用。其次,本發(fā)明獲取的安環(huán)領(lǐng)域非結(jié)構(gòu)化文本數(shù)據(jù)的來源真實可靠,而深度學(xué)習(xí)模型具備從大規(guī)模數(shù)據(jù)中自動學(xué)習(xí)特征表示的能力,通過訓(xùn)練,深度學(xué)習(xí)模型能夠?qū)W習(xí)到安環(huán)領(lǐng)域非結(jié)構(gòu)化數(shù)據(jù)中的復(fù)雜模式和關(guān)聯(lián),進(jìn)而提高抽取的知識的真實性以及準(zhǔn)確性,從而有效地解決了現(xiàn)有技術(shù)在將大語言模型與知識圖譜進(jìn)行結(jié)合后面對專業(yè)領(lǐng)域的問題可能會缺乏真實性和準(zhǔn)確性的技術(shù)問題。
1.一種安環(huán)領(lǐng)域知識問答方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的安環(huán)領(lǐng)域知識問答方法,其特征在于,所述基于owl本體語言構(gòu)建結(jié)構(gòu)化標(biāo)準(zhǔn)知識描述模型構(gòu)建知識圖譜本體模型,包括:
3.根據(jù)權(quán)利要求1所述的安環(huán)領(lǐng)域知識問答方法,其特征在于,所述基于深度學(xué)習(xí)模型獲取安環(huán)領(lǐng)域的知識數(shù)據(jù),包括:
4.根據(jù)權(quán)利要求3所述的安環(huán)領(lǐng)域知識問答方法,其特征在于,所述對安環(huán)文本數(shù)據(jù)進(jìn)行預(yù)處理,包括:
5.根據(jù)權(quán)利要求3所述的安環(huán)領(lǐng)域知識問答方法,其特征在于,所述從預(yù)處理后的安環(huán)文本數(shù)據(jù)中提取得到實體以及實體之間的關(guān)系,包括:
6.根據(jù)權(quán)利要求1所述的安環(huán)領(lǐng)域知識問答方法,其特征在于,所述基于大語言模型對用戶輸入的自然語言問題進(jìn)行解析,得到查詢語,包括:
7.根據(jù)權(quán)利要求6所述的安環(huán)領(lǐng)域知識問答方法,其特征在于,所述基于所述大語言模型、知識圖譜以及查詢語生成對應(yīng)的答案,包括:
8.一種安環(huán)領(lǐng)域知識問答裝置,其特征在于,包括:
9.一種電子設(shè)備,其特征在于,包括:
10.一種存儲介質(zhì),其特征在于,用于存儲計算機(jī)可讀取的程序或指令,所述程序或指令被處理器執(zhí)行時能夠?qū)崿F(xiàn)上述權(quán)利要求1至7中任意一項所述的安環(huán)領(lǐng)域知識問答方法中的步驟。