欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種知識(shí)圖譜構(gòu)建方法和裝置、介質(zhì)、電子設(shè)備與流程

文檔序號(hào):40428254發(fā)布日期:2024-12-24 15:01閱讀:15來源:國知局
一種知識(shí)圖譜構(gòu)建方法和裝置、介質(zhì)、電子設(shè)備與流程

本申請涉及人工智能與醫(yī)療領(lǐng)域,具體地,涉及一種知識(shí)圖譜構(gòu)建方法和裝置、介質(zhì)、電子設(shè)備。


背景技術(shù):

1、在當(dāng)前的信息化時(shí)代,醫(yī)療健康信息廣泛分布于互聯(lián)網(wǎng)的多個(gè)數(shù)據(jù)源之中,涵蓋了疾病診斷、癥狀描述、食物營養(yǎng)、運(yùn)動(dòng)建議等多個(gè)方面。這種信息的分散性為用戶檢索帶來了極大的挑戰(zhàn)。用戶往往需要在多個(gè)數(shù)據(jù)源之間頻繁切換,以嘗試獲取全面且準(zhǔn)確的醫(yī)療信息,不僅耗時(shí)費(fèi)力,而且效率低下。

2、傳統(tǒng)的信息檢索技術(shù)大多基于字符匹配的方式,即根據(jù)用戶輸入的關(guān)鍵詞,在數(shù)據(jù)庫中查找包含這些關(guān)鍵詞的記錄。然而,這種方式在處理自然語言數(shù)據(jù)時(shí)存在明顯的局限性。它無法深入理解數(shù)據(jù)的語義信息,也就無法對數(shù)據(jù)的類型以及數(shù)據(jù)之間的關(guān)系進(jìn)行更深入的分析和挖掘。因此,傳統(tǒng)的檢索技術(shù)往往只能提供表面上的、碎片化的信息,難以滿足用戶對全面、深入醫(yī)療信息的需求。

3、特別是在醫(yī)療領(lǐng)域,信息的準(zhǔn)確性和完整性至關(guān)重要。錯(cuò)誤的醫(yī)療信息可能導(dǎo)致誤診、誤治,甚至危及患者的生命安全。因此,如何有效地整合互聯(lián)網(wǎng)上的醫(yī)療健康信息,提高信息檢索的準(zhǔn)確性和效率,成為了一個(gè)亟待解決的問題。


技術(shù)實(shí)現(xiàn)思路

1、本申請的目的是提供一種知識(shí)圖譜構(gòu)建方法和裝置、介質(zhì)、電子設(shè)備,以解決目前醫(yī)療信息檢索的效率低、準(zhǔn)確性差的問題。

2、為了實(shí)現(xiàn)上述目的,本申請采用以下技術(shù)方案。

3、一種知識(shí)圖譜構(gòu)建方法,包括:構(gòu)建用于抽取待識(shí)別數(shù)據(jù)中實(shí)體與實(shí)體關(guān)系的模型,所述模型的構(gòu)建過程包括:使用醫(yī)療相關(guān)文本數(shù)據(jù)對bert模型進(jìn)行預(yù)訓(xùn)練,得到第一模型;基于所述第一模型,在所述bert模型的架構(gòu)上添加crf層得到第二模型,利用訓(xùn)練數(shù)據(jù)集對所述第二模型進(jìn)行訓(xùn)練;使用訓(xùn)練完成的所述模型對待識(shí)別數(shù)據(jù)進(jìn)行實(shí)體與實(shí)體關(guān)系的抽取;將抽取的所述待識(shí)別數(shù)據(jù)的實(shí)體關(guān)系與現(xiàn)有詞庫進(jìn)行關(guān)系匹配,若匹配結(jié)果一致,則按照相同關(guān)系寫入知識(shí)圖譜;當(dāng)匹配結(jié)果不一致時(shí),根據(jù)訓(xùn)練完成的所述第二模型對所述待識(shí)別數(shù)據(jù)抽取的中間結(jié)果,輸出抽取的各個(gè)實(shí)體的多維向量;計(jì)算所述各個(gè)實(shí)體的多維向量與現(xiàn)有詞庫中實(shí)體的多維向量的余弦相似度,根據(jù)所述余弦相似度獲取候選實(shí)體;將訓(xùn)練完成的所述第二模型的crf層去掉,在bert模型的架構(gòu)上的最后一層上添加全連接層,訓(xùn)練得到第三模型;采用所述第三模型區(qū)分識(shí)別出的實(shí)體與所述候選實(shí)體是否為同一實(shí)體;若區(qū)分結(jié)果為同一實(shí)體,將識(shí)別出的實(shí)體及實(shí)體關(guān)系寫入知識(shí)圖譜。

4、在一些實(shí)施方式中,所述使用醫(yī)療相關(guān)文本數(shù)據(jù)對bert模型進(jìn)行預(yù)訓(xùn)練,包括:獲取所述醫(yī)療相關(guān)文本數(shù)據(jù);通過建立的mlm和nsp訓(xùn)練任務(wù)對bert模型進(jìn)行預(yù)訓(xùn)練得到第一模型,預(yù)訓(xùn)練使用的數(shù)據(jù)為所述醫(yī)療相關(guān)文本數(shù)據(jù)。

5、在一些實(shí)施方式中,獲取所述訓(xùn)練數(shù)據(jù)集的過程,包括:定義知識(shí)圖譜的綱要,所述綱要包括實(shí)體類型、實(shí)體關(guān)系類型;使用通用信息抽取模型uie,對所述知識(shí)圖譜的綱要和原始文本進(jìn)行預(yù)標(biāo)注,所述原始文本為包含實(shí)體和實(shí)體關(guān)系的文本。

6、在一些實(shí)施方式中,所述使用訓(xùn)練完成的所述第二模型對待識(shí)別數(shù)據(jù)進(jìn)行實(shí)體與實(shí)體關(guān)系的抽取,包括:對待識(shí)別數(shù)據(jù)進(jìn)行糾錯(cuò)并改正,所述待識(shí)別數(shù)據(jù)包括結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù);使用訓(xùn)練完成的所述第二模型抽取改正后的所述待識(shí)別數(shù)據(jù)中的實(shí)體與實(shí)體關(guān)系。

7、在一些實(shí)施方式中,所述計(jì)算所述各個(gè)實(shí)體的多維向量與現(xiàn)有詞庫中實(shí)體的多維向量的余弦相似度,根據(jù)所述余弦相似度獲取候選實(shí)體,包括:當(dāng)所述余弦相似度大于設(shè)定閾值時(shí),返回高于所述設(shè)定閾值的前若干個(gè)實(shí)體作為候選實(shí)體。

8、本申請第二方面提供了一種知識(shí)圖譜的構(gòu)建裝置,包括:模型構(gòu)建模塊,其用于構(gòu)建用于抽取待識(shí)別數(shù)據(jù)中實(shí)體與實(shí)體關(guān)系的模型,所述模型的構(gòu)建過程包括:使用醫(yī)療相關(guān)文本數(shù)據(jù)對bert模型進(jìn)行預(yù)訓(xùn)練,得到第一模型;基于所述第一模型,在所述bert模型的架構(gòu)上添加crf層得到第二模型,利用訓(xùn)練數(shù)據(jù)集對所述第二模型進(jìn)行訓(xùn)練;抽取模塊,其用于使用訓(xùn)練完成的所述第二模型對待識(shí)別數(shù)據(jù)進(jìn)行實(shí)體與實(shí)體關(guān)系的抽?。黄ヅ淠K,其用于將抽取的所述待識(shí)別數(shù)據(jù)的實(shí)體關(guān)系與現(xiàn)有詞庫進(jìn)行關(guān)系匹配,若匹配結(jié)果一致,則按照相同關(guān)系寫入知識(shí)圖譜。

9、在一些實(shí)施方式中,所述匹配模塊還包括:當(dāng)匹配結(jié)果不一致時(shí),根據(jù)訓(xùn)練完成的所述第二模型對所述待識(shí)別數(shù)據(jù)抽取的中間結(jié)果,輸出抽取的各個(gè)實(shí)體的多維向量;計(jì)算所述各個(gè)實(shí)體的多維向量與現(xiàn)有詞庫中實(shí)體的多維向量的余弦相似度,根據(jù)所述余弦相似度獲取候選實(shí)體;將訓(xùn)練完成的所述第二模型的crf層去掉,在bert模型的架構(gòu)上的最后一層上添加全連接層,訓(xùn)練得到第三模型;采用所述第三模型區(qū)分識(shí)別出的實(shí)體與所述候選實(shí)體是否為同一實(shí)體;若區(qū)分結(jié)果為同一實(shí)體,將識(shí)別出的實(shí)體及實(shí)體關(guān)系寫入知識(shí)圖譜。

10、本申請第三方面提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,當(dāng)所述計(jì)算機(jī)程序在處理器上運(yùn)行時(shí),使得所述處理器執(zhí)行如第一方面所述的方法。

11、本申請第四方面提供了一種電子設(shè)備,包括:至少一個(gè)存儲(chǔ)器,用于存儲(chǔ)程序;至少一個(gè)處理器,用于執(zhí)行所述存儲(chǔ)器存儲(chǔ)的程序,當(dāng)所述存儲(chǔ)器存儲(chǔ)的程序被執(zhí)行時(shí),所述處理器用于執(zhí)行如第一方面所述的方法。

12、與現(xiàn)有技術(shù)相比,本申請的有益效果。

13、本申請?zhí)峁┝艘环N知識(shí)圖譜構(gòu)建方法和裝置、介質(zhì)、電子設(shè)備,其通過構(gòu)建用于抽取待識(shí)別數(shù)據(jù)中實(shí)體與實(shí)體關(guān)系的模型,對待識(shí)別數(shù)據(jù)進(jìn)行實(shí)體與實(shí)體關(guān)系的抽取,將抽取的帶識(shí)別數(shù)據(jù)的實(shí)體關(guān)系與現(xiàn)有詞庫進(jìn)行關(guān)系匹配。本申請的技術(shù)方案能夠清晰地展示實(shí)體、屬性以及實(shí)體之間的關(guān)系。通過構(gòu)建醫(yī)療領(lǐng)域的知識(shí)圖譜,可以將分散在互聯(lián)網(wǎng)上的醫(yī)療健康信息進(jìn)行有效的整合和關(guān)聯(lián),形成一個(gè)全面、系統(tǒng)的知識(shí)體系。用戶就可以通過知識(shí)圖譜提供的直觀界面,快速、準(zhǔn)確地獲取所需的醫(yī)療信息,從而提高信息檢索的效率和準(zhǔn)確性。本申請的技術(shù)方案可以高效地從海量數(shù)據(jù)中提取有用的醫(yī)療信息,準(zhǔn)確地表示和存儲(chǔ)該有效醫(yī)療信息,為用戶提供便捷、智能的信息檢索服務(wù)。



技術(shù)特征:

1.一種知識(shí)圖譜構(gòu)建方法,其特征在于,包括:

2.如權(quán)利要求1所述的知識(shí)圖譜構(gòu)建方法,其特征在于,所述使用醫(yī)療相關(guān)文本數(shù)據(jù)對bert模型進(jìn)行預(yù)訓(xùn)練,包括:

3.如權(quán)利要求1所述的知識(shí)圖譜構(gòu)建方法,其特征在于,獲取所述訓(xùn)練數(shù)據(jù)集的過程,包括:

4.如權(quán)利要求1所述的知識(shí)圖譜構(gòu)建方法,其特征在于,所述使用訓(xùn)練完成的所述第二模型對待識(shí)別數(shù)據(jù)進(jìn)行實(shí)體與實(shí)體關(guān)系的抽取,包括:

5.如權(quán)利要求1所述的知識(shí)圖譜構(gòu)建方法,其特征在于,所述計(jì)算所述各個(gè)實(shí)體的多維向量與現(xiàn)有詞庫中實(shí)體的多維向量的余弦相似度,根據(jù)所述余弦相似度獲取候選實(shí)體,包括:

6.一種知識(shí)圖譜的構(gòu)建裝置,其特征在于,包括:

7.如權(quán)利要求6所述的知識(shí)圖譜的構(gòu)建裝置,其特征在于,所述匹配模塊還包括:

8.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,當(dāng)所述計(jì)算機(jī)程序在處理器上運(yùn)行時(shí),使得所述處理器執(zhí)行如權(quán)利要求1至5任一項(xiàng)所述的方法。

9.一種電子設(shè)備,其特征在于,包括:至少一個(gè)存儲(chǔ)器,用于存儲(chǔ)程序;


技術(shù)總結(jié)
本申請?zhí)峁┝艘环N知識(shí)圖譜構(gòu)建方法,屬于人工智能與醫(yī)療領(lǐng)域,其通過構(gòu)建用于抽取待識(shí)別數(shù)據(jù)中實(shí)體與實(shí)體關(guān)系的模型,對待識(shí)別數(shù)據(jù)進(jìn)行實(shí)體與實(shí)體關(guān)系的抽取,將抽取的帶識(shí)別數(shù)據(jù)的實(shí)體與現(xiàn)有詞庫進(jìn)行匹配。本申請的技術(shù)方案能夠清晰地展示實(shí)體、屬性以及實(shí)體之間的關(guān)系。通過構(gòu)建醫(yī)療領(lǐng)域的知識(shí)圖譜,可將分散在互聯(lián)網(wǎng)上的醫(yī)療健康信息進(jìn)行有效的整合和關(guān)聯(lián),形成一個(gè)全面、系統(tǒng)的知識(shí)體系。用戶就可以通過知識(shí)圖譜提供的直觀界面,快速、準(zhǔn)確地獲取所需的醫(yī)療信息,從而提高信息檢索的效率和準(zhǔn)確性。本申請的知識(shí)圖譜構(gòu)建裝置可以高效地從海量數(shù)據(jù)中提取有用的醫(yī)療信息,準(zhǔn)確地表示和存儲(chǔ)該有效醫(yī)療信息,為用戶提供便捷、智能的信息檢索服務(wù)。

技術(shù)研發(fā)人員:胡紅亮,胡月,姜春艷
受保護(hù)的技術(shù)使用者:科學(xué)技術(shù)文獻(xiàn)出版社有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2024/12/23
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1
辽宁省| 青龙| 连山| 崇仁县| 和静县| 盖州市| 五家渠市| 天峻县| 延吉市| 湘西| 普定县| 大丰市| 丰县| 凌源市| 宁海县| 林周县| 文山县| 华宁县| 长葛市| 林州市| 昌江| 楚雄市| 安新县| 玉山县| 大余县| 潮州市| 精河县| 罗平县| 五峰| 澎湖县| 江安县| 东方市| 黔西| 崇明县| 靖安县| 开远市| 奉新县| 景宁| 赫章县| 施秉县| 浦江县|