欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種自然語(yǔ)言文本的復(fù)雜命名實(shí)體的識(shí)別方法及系統(tǒng)

文檔序號(hào):40573502發(fā)布日期:2025-01-03 11:36閱讀:來(lái)源:國(guó)知局

技術(shù)特征:

1.一種自然語(yǔ)言文本的復(fù)雜命名實(shí)體的識(shí)別方法,其特征在于,包括以下步驟:

2.如權(quán)利要求1所述的方法,其特征在于,訓(xùn)練候選實(shí)體生成模塊時(shí),訓(xùn)練數(shù)據(jù)按照輸入模板的格式填寫目標(biāo)類型實(shí)體及其所在文本,標(biāo)注目標(biāo)實(shí)體相鄰位置的分詞,選取非實(shí)體負(fù)樣本。

3.如權(quán)利要求1或2所述的方法,其特征在于,訓(xùn)練候選實(shí)體生成模塊時(shí),bart編碼器中的自注意力機(jī)制將各個(gè)分詞以所有分詞加權(quán)進(jìn)行表示,使分詞特征中含有分詞之間、分詞與類別之間的相關(guān)性特征。

4.如權(quán)利要求1或2所述的方法,其特征在于,訓(xùn)練候選實(shí)體生成模塊時(shí),輸出模板作為bart解碼器的輸入,通過(guò)交叉注意力機(jī)制獲得當(dāng)前輸出下各個(gè)分詞的概率權(quán)重,再通過(guò)最大化當(dāng)前輸出概率,選擇出最高權(quán)重的分詞作為當(dāng)前輸出。

5.如權(quán)利要求4所述的方法,其特征在于,訓(xùn)練候選實(shí)體生成模塊時(shí),通過(guò)迭代更新bart模型中自注意力機(jī)制、交叉注意力機(jī)制的各個(gè)權(quán)重參數(shù),優(yōu)化bart解碼器輸出概率,并計(jì)算與輸出模板內(nèi)容的誤差,直到bart解碼器的輸出與輸出模板的內(nèi)容一致。

6.如權(quán)利要求1所述的方法,其特征在于,訓(xùn)練候選實(shí)體篩選模塊時(shí),使用正負(fù)樣例及其文本和類別輸入到候選實(shí)體生成模塊中訓(xùn)練好的bart編碼器中,獲得對(duì)應(yīng)的表示形式,將該表示形式作為訓(xùn)練候選實(shí)體篩選模塊的數(shù)據(jù)。

7.如權(quán)利要求1或6所述的方法,其特征在于,訓(xùn)練候選實(shí)體篩選模塊時(shí),候選實(shí)體的文本語(yǔ)境特征及類別特征經(jīng)過(guò)堆疊的特征增強(qiáng)網(wǎng)絡(luò),獲得多粒度的增強(qiáng)的文本語(yǔ)境與類別特征表示,再將這兩個(gè)特征拼接,作為多層感知機(jī)的輸入。

8.如權(quán)利要求7所述的方法,其特征在于,訓(xùn)練候選實(shí)體篩選模塊時(shí),通過(guò)不斷優(yōu)化特征增強(qiáng)網(wǎng)絡(luò)中注意力機(jī)制模塊與多層感知機(jī)中的權(quán)重,直到多層感知機(jī)的判別輸出與標(biāo)簽一致。

9.如權(quán)利要求1所述的方法,其特征在于,輸入模板包含待抽取實(shí)體的類別信息,該類別信息與待處理文本通過(guò)bart模型的分詞操作轉(zhuǎn)換為bart模型可處理的表示形式。

10.一種自然語(yǔ)言文本的復(fù)雜命名實(shí)體的識(shí)別系統(tǒng),其特征在于,包括:


技術(shù)總結(jié)
本發(fā)明提出了一種自然語(yǔ)言文本的復(fù)雜命名實(shí)體的識(shí)別方法及系統(tǒng),涉及自然語(yǔ)言處理技術(shù)領(lǐng)域,通過(guò)引入含位置信息和類別信息的輸入輸出模板來(lái)指導(dǎo)候選實(shí)體生成模塊,并采用基于特征增強(qiáng)網(wǎng)絡(luò)和多層感知機(jī)的候選實(shí)體篩選模塊,從而提升實(shí)體識(shí)別的準(zhǔn)確性和召回率。本發(fā)明綜合利用模板引導(dǎo)、特征增強(qiáng)和類別信息,有效降低無(wú)效輸出概率,生成精準(zhǔn)全面的候選實(shí)體,實(shí)現(xiàn)準(zhǔn)確高效的實(shí)體識(shí)別。

技術(shù)研發(fā)人員:古曉艷,朱星宇,代飛飛,樊?;?李波,王偉平
受保護(hù)的技術(shù)使用者:中國(guó)科學(xué)院信息工程研究所
技術(shù)研發(fā)日:
技術(shù)公布日:2025/1/2
當(dāng)前第2頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
馆陶县| 斗六市| 漳州市| 陵水| 青川县| 兴文县| 云阳县| 高州市| 东港市| 六盘水市| 宜宾市| 大丰市| 乐业县| 贵阳市| 澄城县| 绍兴市| 东乌| 灌云县| 嵊州市| 韩城市| 永清县| 肥乡县| 钟山县| 乐昌市| 上饶市| 通化市| 桂阳县| 温州市| 桑植县| 白沙| 临桂县| 海淀区| 西丰县| 滦南县| 辽阳县| 化州市| 桃江县| 嘉黎县| 郸城县| 习水县| 晋州市|