欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

文本段落識別方法、裝置、計算機(jī)設(shè)備、可讀存儲介質(zhì)和程序產(chǎn)品與流程

文檔序號:40648861發(fā)布日期:2025-01-10 18:55閱讀:來源:國知局

技術(shù)特征:

1.一種文本段落識別方法,其特征在于,所述方法包括:

2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過語義分析模型,對所述第一文本信息和所述第二文本信息之間進(jìn)行語義關(guān)聯(lián)分析,得到所述第一文本信息和所述第二文本信息之間的語義關(guān)聯(lián)性,包括:

3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:

4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述響應(yīng)于針對目標(biāo)文本的段落識別指令,獲取所述目標(biāo)文本中的目標(biāo)文本行的第一文本信息、以及所述目標(biāo)文本行的上一文本行的第二文本信息,包括:

5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:

6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述第一文本信息的關(guān)鍵詞組的獲取過程包括:

7.一種文本段落識別裝置,其特征在于,所述裝置包括:

8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述語義分析模塊還用于:通過語義分析模型,分別對所述第一文本信息和所述第二文本信息進(jìn)行語義特征提取,得到所述第一文本信息的第一語義特征、以及所述第二文本信息的第二語義特征;對所述第一語義特征和所述第二語義特征進(jìn)行相似度分析,得到所述第一語義特征和所述第二語義特征之間的特征相似度;基于所述特征相似度,確定所述第一文本信息和所述第二文本信息之間的語義關(guān)聯(lián)性。

9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還用于:獲取包含多個段落標(biāo)識的初始樣本文本,對所述初始樣本文本,進(jìn)行段落標(biāo)識剔除,得到第一樣本文本;對所述初始樣本文本,進(jìn)行段落標(biāo)識替換,得到第二樣本文本;對所述初始樣本文本,進(jìn)行段落順序調(diào)整,得到第三樣本文本;將所述第一樣本文本、所述第二樣本文本和所述第三樣本文本共同作為訓(xùn)練樣本,基于所述訓(xùn)練樣本,對預(yù)訓(xùn)練語義分析模型進(jìn)行模型訓(xùn)練,直至所述預(yù)訓(xùn)練語義分析模型的訓(xùn)練次數(shù)達(dá)到次數(shù)閾值,得到語義分析模型;基于所述訓(xùn)練樣本,對預(yù)訓(xùn)練詞組分析模型進(jìn)行模型訓(xùn)練,直至所述預(yù)訓(xùn)練詞組分析模型的訓(xùn)練次數(shù)達(dá)到所述次數(shù)閾值,得到詞組分析模型。

10.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述文本信息獲取模塊還用于:響應(yīng)于針對目標(biāo)文本的段落識別指令,對所述目標(biāo)文本進(jìn)行安全性檢測,得到所述目標(biāo)文本的安全性檢測結(jié)果;在所述安全性檢測結(jié)果表示所述目標(biāo)文本屬于安全文本的情況下,獲取所述目標(biāo)文本的文本內(nèi)容;對所述文本內(nèi)容進(jìn)行完整性檢測,得到所述文本內(nèi)容的完整性檢測結(jié)果;在所述完整性檢測結(jié)果表示所述文本內(nèi)容完整的情況下,獲取所述目標(biāo)文本中的目標(biāo)文本行的第一文本信息、以及所述目標(biāo)文本行的上一文本行的第二文本信息。

11.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還用于:分別對所述第一文本信息和所述第二文本信息進(jìn)行分詞處理,得到所述第一文本信息的各第一文本分詞、以及所述第二文本信息的各第二文本分詞;分別對各所述第一文本分詞和各所述第二文本分詞進(jìn)行詞嵌入,得到每一所述第一文本分詞的第一詞向量、以及每一所述第二文本分詞的第二詞向量;所述第一詞向量和所述第二詞向量均作為所述語義分析模型和所述詞組分析模型的輸入。

12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述裝置還用于:分別對各所述第一文本分詞進(jìn)行詞頻統(tǒng)計,得到每一所述第一文本分詞各自的出現(xiàn)頻率;在各所述第一文本分詞中,篩選出所述出現(xiàn)頻率超過頻率閾值的目標(biāo)文本分詞;將所述目標(biāo)文本分詞和所述第一文本信息中指定文本位置處的文本詞組共同作為關(guān)鍵詞組。

13.一種計算機(jī)設(shè)備,包括存儲器和處理器,所述存儲器存儲有計算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計算機(jī)程序時實現(xiàn)權(quán)利要求1至6中任一項所述的方法的步驟。

14.一種計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序,其特征在于,所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至6中任一項所述的方法的步驟。

15.一種計算機(jī)程序產(chǎn)品,包括計算機(jī)程序,其特征在于,所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至6中任一項所述的方法的步驟。


技術(shù)總結(jié)
本申請涉及一種文本段落識別方法、裝置、計算機(jī)設(shè)備、可讀存儲介質(zhì)和程序產(chǎn)品,涉及大數(shù)據(jù)技術(shù)領(lǐng)域。方法包括:接收針對目標(biāo)文本的段落識別指令,獲取目標(biāo)文本中的目標(biāo)文本行的第一文本信息、以及目標(biāo)文本行的上一文本行的第二文本信息;分別通過語義分析模型和詞組分析模型,對第一文本信息和第二文本信息之間進(jìn)行語義關(guān)聯(lián)分析和詞組關(guān)聯(lián)分析,得到第一文本信息和第二文本信息之間的語義關(guān)聯(lián)性和詞組關(guān)聯(lián)分析結(jié)果。在語義關(guān)聯(lián)性達(dá)到關(guān)聯(lián)性閾值、以及詞組關(guān)聯(lián)分析結(jié)果表示第一文本信息包含第二文本信息的關(guān)鍵詞組的情況下,將目標(biāo)文本行與上一文本行歸為同一段落。采用本方法能夠提高文本段落識別準(zhǔn)確性。

技術(shù)研發(fā)人員:卜麗
受保護(hù)的技術(shù)使用者:中國建設(shè)銀行股份有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/1/9
當(dāng)前第2頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
滦南县| 邵阳市| 安西县| 七台河市| 巢湖市| 黄陵县| 九台市| 九龙坡区| 盘锦市| 英山县| 霍山县| 班戈县| 潞西市| 定州市| 佛山市| 武强县| 胶州市| 聂荣县| 阿拉善盟| 读书| 杭锦后旗| 乐昌市| 宣威市| 兰州市| 嘉义县| 巴彦淖尔市| 布拖县| 吉首市| 临海市| 方山县| 大化| 伊吾县| 沙洋县| 奉贤区| 哈巴河县| 汝城县| 河曲县| 彭水| 永川市| 怀安县| 保亭|