欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于關(guān)系視域構(gòu)圖的中英文事件檢測方法

文檔序號:40440200發(fā)布日期:2024-12-24 15:14閱讀:13來源:國知局
一種基于關(guān)系視域構(gòu)圖的中英文事件檢測方法

本發(fā)明涉及一種基于關(guān)系視域構(gòu)圖的中英文事件檢測方法,屬于事件檢測。


背景技術(shù):

1、事件檢測技術(shù)是自然語言處理領(lǐng)域的一個(gè)重要分支,它致力于從文本中識別出特定類型的事件,并對這些事件進(jìn)行分類和理解。它有助于構(gòu)建智能系統(tǒng)理解和生成自然語言的能力,比如在新聞聚合、社交媒體監(jiān)控、輿情分析、知識圖譜構(gòu)建等場景中,能有效提取關(guān)鍵信息,進(jìn)行精準(zhǔn)的內(nèi)容分類和主題跟蹤。同時(shí),事件檢測也是許多高級nlp任務(wù)的基礎(chǔ),如情感分析、關(guān)系抽取和事件推理等。通過深度學(xué)習(xí)和機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,事件檢測的精度和效率得到了顯著提升,為人工智能賦予了更強(qiáng)的語言理解和處理能力。

2、在現(xiàn)有的事件檢測技術(shù)框架中,主要分為兩大類:基于特征工程的方法和基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)策略。前者,主要通過對文本進(jìn)行細(xì)致的詞法、句法和語義分析,運(yùn)用自然語言處理工具精心設(shè)計(jì)特征,這些方法在準(zhǔn)確性上表現(xiàn)出色。然而,它們的高度依賴于人工特征設(shè)計(jì),使得它們在跨領(lǐng)域應(yīng)用時(shí)的通用性和可擴(kuò)展性有所欠缺。相比之下,基于神經(jīng)網(wǎng)絡(luò)的方法通過將文本轉(zhuǎn)化為高維詞嵌入(word?embeddings),讓神經(jīng)網(wǎng)絡(luò)自行從海量數(shù)據(jù)中學(xué)習(xí)并提取特征。這種方法顯著減少了人工干預(yù),降低了因外部工具引入的誤差,因此在當(dāng)前的研究趨勢中占據(jù)了主導(dǎo)地位。

3、然而,值得注意的是,大多數(shù)基于神經(jīng)網(wǎng)絡(luò)的方法專注于英文處理,將事件檢測簡化為單詞間的映射,忽視了中文語言的特性。中文的多義詞和詞序的重要性在這些方法中并未得到充分利用,導(dǎo)致在處理觸發(fā)詞與文本中詞語匹配不一致的問題時(shí),其效果可能會大打折扣。因此,針對中文事件檢測的特異性,如何有效地結(jié)合神經(jīng)網(wǎng)絡(luò)和中英文自然語言處理的優(yōu)勢,是當(dāng)前研究亟待解決的一個(gè)重要課題。


技術(shù)實(shí)現(xiàn)思路

1、為解決現(xiàn)有技術(shù)存在的預(yù)測精度不高問題,本發(fā)明提供了一種基于關(guān)系視域構(gòu)圖的中英文事件檢測方法,該方法利用圖神經(jīng)網(wǎng)絡(luò)構(gòu)建事件類型關(guān)聯(lián)的結(jié)構(gòu)圖,并將這種關(guān)聯(lián)信息有效地嵌入到圖注意力網(wǎng)絡(luò)中,該策略旨在通過探索事件類型之間的內(nèi)在聯(lián)系來提高模型的性能。

2、為實(shí)現(xiàn)上述目的,本發(fā)明所采用的技術(shù)方案為一種基于關(guān)系視域構(gòu)圖的中英文事件檢測方法,包括以下步驟:

3、s1、將所有候選觸發(fā)詞視為候選實(shí)體,基于文本序列編碼器生成實(shí)體上下文表示e;

4、s2、設(shè)計(jì)事件類型編碼器為所有事件類型定義嵌入式的表征t,從而建模事件類型之間的關(guān)聯(lián)關(guān)系;

5、s3、對已獲取的候選實(shí)體的上下文表示e和事件類型的表示t進(jìn)行深度融合,得到上下文實(shí)體事件類型信息的融合表示,再采用掩碼注意力機(jī)制得到候選實(shí)體與預(yù)測事件類型的掩碼自注意力得分矩陣m,將掩碼自注意力得分矩陣m與上下文實(shí)體表示相加得到每個(gè)目標(biāo)實(shí)體表示z;

6、s4、根據(jù)訓(xùn)練得到的模型,利用實(shí)體間事件類型的相關(guān)性來進(jìn)行精確預(yù)測。

7、優(yōu)選的,在進(jìn)行步驟s1時(shí),按照以下步驟進(jìn)行操作,

8、a1、將待檢測的事件句子字符序列輸入預(yù)訓(xùn)練模型bert編碼器,生成以詞上下文為條件的文本表示的隱藏狀態(tài),如公式(1)所示:

9、??????(1)

10、a2、在候選觸發(fā)詞上對令牌表示進(jìn)行最大池化操作max()來生成每個(gè)候選實(shí)體表示,如公式(2)所示:

11、???????????(2)。

12、優(yōu)選的,在進(jìn)行步驟s2時(shí),按照以下步驟進(jìn)行操作,b1、首先將事件類型集中每個(gè)事件類型轉(zhuǎn)化為詞向量序列,然后計(jì)算事件類型之間的語義相似度,每個(gè)事件類型向量與其他事件類別的相似度計(jì)算得到一個(gè)相應(yīng)的相似度向量,采用加權(quán)余弦相似函數(shù)進(jìn)行計(jì)算,如公式(3)所示:

13、????(3)

14、其中,表示hadamard乘積,是可學(xué)習(xí)的權(quán)重向量,是兩個(gè)事件類型向量和在第p個(gè)語義上的相似性;類似于多頭學(xué)習(xí)器,使用m個(gè)權(quán)重向量,讓每個(gè)權(quán)重向量代表一種語義,使用上述相似度函數(shù)計(jì)算m個(gè)獨(dú)立的相似度矩陣,并將其平均值作為最終相似度;

15、b2、基于事件類型之間的相似性得分構(gòu)建一個(gè)無向全連接圖,接著用ε鄰域來對生成的圖進(jìn)行剪枝操作使圖變得稀疏,稀疏化的目的將事件類型關(guān)系弱的關(guān)系屏蔽掉,這樣使得事件類型關(guān)系降低對最終預(yù)測結(jié)果的性能影響。通過圖剪枝操作,將余弦相似度矩陣轉(zhuǎn)換為稀疏矩陣,低于閾值ε的位置將被屏蔽,被替換為負(fù)無窮大,使softmax之后輸出為0,高于或等于閾值的位置保留原值,如下式(4)所示:

16、??????????(4)

17、b3、用圖神經(jīng)網(wǎng)絡(luò)gnn來增強(qiáng)類型的關(guān)系嵌入,使得這些類型嵌入具有相互之間的關(guān)聯(lián)關(guān)系,具體來說,對于前一步生成的稀疏矩陣a進(jìn)行g(shù)cn卷積操作,將經(jīng)過圖卷積的類型嵌入向量與原始類型嵌入向量相加,以獲得包含類型相關(guān)性的類型嵌入向量,最終得到事件類別信息的向量表示t,記為,具體如公式(5):

18、???(5)

19、其中,是第i個(gè)節(jié)點(diǎn)對應(yīng)的事件類型的向量表示即類型嵌入,為類型嵌入經(jīng)過線性變換后得到的向量表示,為gnn的層圖卷積核函數(shù),為該層的超參數(shù)。為結(jié)點(diǎn)對應(yīng)事件類別融合其他事件類型信息的向量表示,特別地,表示空事件類型。n為圖中所有與第i個(gè)節(jié)點(diǎn)有連邊的節(jié)點(diǎn)集合,j∈n表示節(jié)點(diǎn)集合中的第j個(gè)節(jié)點(diǎn),?relu函數(shù)為非線性激活函數(shù)。

20、優(yōu)選的,在進(jìn)行步驟s3時(shí),按照以下步驟進(jìn)行操作,

21、c1、為了捕捉實(shí)例相關(guān)性,進(jìn)一步將上下文實(shí)例類型信息融入到實(shí)例表示中。具體地,通過計(jì)算每個(gè)實(shí)例屬于某個(gè)事件類型的可能性得分,得到實(shí)例類型可能性表示,然后聚合所有的類型表示,得到了融合上下文實(shí)體類型的實(shí)例表示,具體如公式(6):

22、????(6)

23、c2、運(yùn)用掩碼自注意力機(jī)制以捕捉上下文實(shí)體類型信息與預(yù)測實(shí)體類型之間的聯(lián)系,需要計(jì)算兩類掩碼自注意力得分,一種是實(shí)體本身的自注意力得分,另一種是與上下文實(shí)體的注意力得分,從而兩種注意力得分組合成掩碼自注意力得分矩陣。具體地,用公式(6)分別計(jì)算全掩碼符號的實(shí)體和非全掩碼的實(shí)體之間的注意力交互得分s1,s2,

24、??(7)

25、這里,自注意力機(jī)制采用進(jìn)行計(jì)算,其中,wq和wk是可學(xué)習(xí)的參數(shù),自注意力計(jì)算公式中的上標(biāo)t表示矩陣轉(zhuǎn)置操作。是一種線性融合參數(shù)矩陣,[:]進(jìn)行矩陣向量元素拼接操作。

26、c3、將實(shí)體本身注意力分?jǐn)?shù)s1放在對角線上,將上下文實(shí)體的注意力分?jǐn)?shù)s2放在非對角線上來生成掩碼自注意力得分矩陣m,如公式7所示。為了便于預(yù)測計(jì)算,矩陣元素通過softmax函數(shù)將注意力得分映射到概率分布(如公式8所示),再將掩碼自注意力得分矩陣m與上下文實(shí)例信息相加得到融合上下文實(shí)體類型信息并與預(yù)測實(shí)體類型相關(guān)的融合表示z,如公式9所示:

27、?????(7)

28、?????????(8)

29、????????????????(9)。

30、優(yōu)選的,在進(jìn)行步驟s4時(shí),按照以下步驟進(jìn)行操作,

31、利用這些融合后的特征表示進(jìn)行目標(biāo)實(shí)體事件類型的預(yù)測如式(10)所示,

32、?(10)

33、其中,每個(gè)候選詞對空類型的概率表示為,對其他事件類型的概率表示為,具體如式(11)所示,

34、?(11)

35、在預(yù)測過程中,如果得分大于閾值,則返回該類型作為最終預(yù)測,否則返回空類型,如式(12)所示,

36、????(12)

37、在訓(xùn)練過程中,盡量減少以下?lián)p失,損失函數(shù)如式(13)所示,

38、?(13)。

39、與現(xiàn)有技術(shù)相比,本發(fā)明具有以下技術(shù)效果:本發(fā)明利用圖神經(jīng)網(wǎng)絡(luò)構(gòu)建事件類型關(guān)聯(lián)的結(jié)構(gòu)圖,并將這種關(guān)聯(lián)信息有效地嵌入到圖注意力網(wǎng)絡(luò)中,該策略旨在通過探索事件類型之間的內(nèi)在聯(lián)系來提高模型的檢測性能。通過構(gòu)建事件類型關(guān)系圖,充分利用觸發(fā)詞關(guān)聯(lián)的事件類型相關(guān)性,從而大幅提升了低資源事件類型的預(yù)測精度,能夠完成中英文事件檢測的任務(wù);通過融合了實(shí)例上下文數(shù)據(jù)和事件類型的特征,特別是加強(qiáng)了高度相關(guān)事件之間的聯(lián)系,降低了事件關(guān)聯(lián)的噪聲干擾。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
章丘市| 迭部县| 岑巩县| 新和县| 桦南县| 鄂伦春自治旗| 保靖县| 龙岩市| 平遥县| 江门市| 两当县| 古交市| 商城县| 湘乡市| 玉溪市| 普安县| 会同县| 新泰市| 额尔古纳市| 信丰县| 双桥区| 裕民县| 平潭县| 和田县| 阳江市| 奉化市| 油尖旺区| 嵊州市| 行唐县| 福建省| 龙岩市| 清河县| 广元市| 内乡县| 永城市| 贵阳市| 马龙县| 开原市| 乌拉特前旗| 兴和县| 石嘴山市|