1.一種文本段落識別方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過語義分析模型,對所述第一文本信息和所述第二文本信息之間進(jìn)行語義關(guān)聯(lián)分析,得到所述第一文本信息和所述第二文本信息之間的語義關(guān)聯(lián)性,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述響應(yīng)于針對目標(biāo)文本的段落識別指令,獲取所述目標(biāo)文本中的目標(biāo)文本行的第一文本信息、以及所述目標(biāo)文本行的上一文本行的第二文本信息,包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述第一文本信息的關(guān)鍵詞組的獲取過程包括:
7.一種文本段落識別裝置,其特征在于,所述裝置包括:
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述語義分析模塊還用于:通過語義分析模型,分別對所述第一文本信息和所述第二文本信息進(jìn)行語義特征提取,得到所述第一文本信息的第一語義特征、以及所述第二文本信息的第二語義特征;對所述第一語義特征和所述第二語義特征進(jìn)行相似度分析,得到所述第一語義特征和所述第二語義特征之間的特征相似度;基于所述特征相似度,確定所述第一文本信息和所述第二文本信息之間的語義關(guān)聯(lián)性。
9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還用于:獲取包含多個段落標(biāo)識的初始樣本文本,對所述初始樣本文本,進(jìn)行段落標(biāo)識剔除,得到第一樣本文本;對所述初始樣本文本,進(jìn)行段落標(biāo)識替換,得到第二樣本文本;對所述初始樣本文本,進(jìn)行段落順序調(diào)整,得到第三樣本文本;將所述第一樣本文本、所述第二樣本文本和所述第三樣本文本共同作為訓(xùn)練樣本,基于所述訓(xùn)練樣本,對預(yù)訓(xùn)練語義分析模型進(jìn)行模型訓(xùn)練,直至所述預(yù)訓(xùn)練語義分析模型的訓(xùn)練次數(shù)達(dá)到次數(shù)閾值,得到語義分析模型;基于所述訓(xùn)練樣本,對預(yù)訓(xùn)練詞組分析模型進(jìn)行模型訓(xùn)練,直至所述預(yù)訓(xùn)練詞組分析模型的訓(xùn)練次數(shù)達(dá)到所述次數(shù)閾值,得到詞組分析模型。
10.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述文本信息獲取模塊還用于:響應(yīng)于針對目標(biāo)文本的段落識別指令,對所述目標(biāo)文本進(jìn)行安全性檢測,得到所述目標(biāo)文本的安全性檢測結(jié)果;在所述安全性檢測結(jié)果表示所述目標(biāo)文本屬于安全文本的情況下,獲取所述目標(biāo)文本的文本內(nèi)容;對所述文本內(nèi)容進(jìn)行完整性檢測,得到所述文本內(nèi)容的完整性檢測結(jié)果;在所述完整性檢測結(jié)果表示所述文本內(nèi)容完整的情況下,獲取所述目標(biāo)文本中的目標(biāo)文本行的第一文本信息、以及所述目標(biāo)文本行的上一文本行的第二文本信息。
11.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還用于:分別對所述第一文本信息和所述第二文本信息進(jìn)行分詞處理,得到所述第一文本信息的各第一文本分詞、以及所述第二文本信息的各第二文本分詞;分別對各所述第一文本分詞和各所述第二文本分詞進(jìn)行詞嵌入,得到每一所述第一文本分詞的第一詞向量、以及每一所述第二文本分詞的第二詞向量;所述第一詞向量和所述第二詞向量均作為所述語義分析模型和所述詞組分析模型的輸入。
12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述裝置還用于:分別對各所述第一文本分詞進(jìn)行詞頻統(tǒng)計,得到每一所述第一文本分詞各自的出現(xiàn)頻率;在各所述第一文本分詞中,篩選出所述出現(xiàn)頻率超過頻率閾值的目標(biāo)文本分詞;將所述目標(biāo)文本分詞和所述第一文本信息中指定文本位置處的文本詞組共同作為關(guān)鍵詞組。
13.一種計算機(jī)設(shè)備,包括存儲器和處理器,所述存儲器存儲有計算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計算機(jī)程序時實現(xiàn)權(quán)利要求1至6中任一項所述的方法的步驟。
14.一種計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序,其特征在于,所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至6中任一項所述的方法的步驟。
15.一種計算機(jī)程序產(chǎn)品,包括計算機(jī)程序,其特征在于,所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至6中任一項所述的方法的步驟。