本發(fā)明涉及人工智能領(lǐng)域和金融科技領(lǐng)域,尤其涉及新聞識別方法、裝置、設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、金融平臺上的新聞來源包括官方發(fā)布機(jī)構(gòu)、財經(jīng)媒體、金融研究機(jī)構(gòu)以及自媒體機(jī)構(gòu)。這些新聞涵蓋了各類金融市場的動態(tài)以及宏觀經(jīng)濟(jì)政策、國際經(jīng)濟(jì)關(guān)系等方面的信息。
2、然而,金融平臺的當(dāng)前新聞的識別過程繁瑣,不利于提高當(dāng)前新聞的識別效率。其原因在于,現(xiàn)有技術(shù)主要采用人工識別的方式,識別金融平臺的當(dāng)前新聞,而人工識別的方式會耗費(fèi)大量的人力資源和時間資源,增加了金融平臺的當(dāng)前新聞的識別時間,且容易受到人工干預(yù)的影響,因此,不利于提高當(dāng)前新聞的識別效率。
技術(shù)實現(xiàn)思路
1、本發(fā)明提供一種新聞識別方法、裝置、計算機(jī)設(shè)備及存儲介質(zhì),以解決現(xiàn)有金融平臺的當(dāng)前新聞的識別過程繁瑣,不利于提高當(dāng)前新聞的識別效率的技術(shù)問題。
2、第一方面,提供了一種新聞識別方法,包括:
3、獲取金融平臺上經(jīng)過確認(rèn)的虛假新聞和真實新聞,選取所述虛假新聞或所述真實新聞作為預(yù)設(shè)新聞,獲取所述預(yù)設(shè)新聞對應(yīng)的預(yù)設(shè)識別結(jié)果,獲取所述金融平臺對應(yīng)的金融專業(yè)知識;
4、對所述預(yù)設(shè)新聞進(jìn)行特征提取,得到第一特征向量,對所述金融專業(yè)知識進(jìn)行特征提取,得到第二特征向量;
5、將所述第一特征向量和所述第二特征向量進(jìn)行融合,生成第三特征向量;
6、獲取預(yù)訓(xùn)練語言模型基于所述第三特征向量輸出的預(yù)測識別結(jié)果,基于預(yù)定義的生成方式,生成所述預(yù)測識別結(jié)果與所述預(yù)設(shè)識別結(jié)果之間的損失值;
7、當(dāng)所述損失值小于預(yù)設(shè)值時,采用預(yù)定義的獲取方式,獲取測試通過的所述預(yù)訓(xùn)練語言模型;
8、獲取所述金融平臺的當(dāng)前新聞,將所述當(dāng)前新聞輸入測試通過的所述預(yù)訓(xùn)練語言模型中,獲取測試通過的所述預(yù)訓(xùn)練語言模型基于所述當(dāng)前新聞輸出的當(dāng)前識別結(jié)果。
9、進(jìn)一步地,所述對所述預(yù)設(shè)新聞進(jìn)行特征提取,得到第一特征向量,對所述金融專業(yè)知識進(jìn)行特征提取,得到第二特征向量,包括:
10、獲取所述預(yù)設(shè)新聞的新聞文字、新聞圖像、新聞音頻,對所述預(yù)設(shè)新聞的新聞文字、新聞圖像、新聞音頻進(jìn)行特征提取,得到第一特征向量;
11、獲取所述金融專業(yè)知識中的金融術(shù)語、金融法規(guī),對所述金融術(shù)語、所述金融法規(guī)進(jìn)行特征提取,得到第二特征向量。
12、進(jìn)一步地,所述將所述第一特征向量和所述第二特征向量進(jìn)行融合,生成第三特征向量,包括:
13、利用所述預(yù)訓(xùn)練語言模型的線性變換層,將所述第一特征向量轉(zhuǎn)換為第一輸出向量,將所述第二特征向量轉(zhuǎn)換為第二輸出向量;
14、通過多頭自注意力機(jī)制將所述第一輸出向量和所述第二輸出向量進(jìn)行融合,生成第三特征向量。
15、進(jìn)一步地,所述獲取預(yù)訓(xùn)練語言模型基于所述第三特征向量輸出的預(yù)測識別結(jié)果,基于預(yù)定義的生成方式,生成所述預(yù)測識別結(jié)果與所述預(yù)設(shè)識別結(jié)果之間的損失值,包括:
16、獲取預(yù)訓(xùn)練語言模型的分類器基于所述第三特征向量輸出的預(yù)測識別結(jié)果;
17、通過預(yù)設(shè)的交叉熵?fù)p失函數(shù),生成所述預(yù)測識別結(jié)果與所述預(yù)設(shè)識別結(jié)果之間的損失值。
18、進(jìn)一步地,所述當(dāng)所述損失值小于預(yù)設(shè)值時,采用預(yù)定義的獲取方式,獲取測試通過的所述預(yù)訓(xùn)練語言模型,包括:
19、當(dāng)所述損失值小于預(yù)設(shè)值時,獲取所述金融平臺對應(yīng)的測試集,采用所述測試集測試所述預(yù)訓(xùn)練語言模型,生成測試結(jié)果;
20、根據(jù)所述測試結(jié)果,獲取所述預(yù)訓(xùn)練語言模型在所述測試集上的當(dāng)前準(zhǔn)確率,當(dāng)所述當(dāng)前準(zhǔn)確率大于預(yù)設(shè)準(zhǔn)確率時,獲取測試通過的所述預(yù)訓(xùn)練語言模型。
21、進(jìn)一步地,所述獲取所述金融平臺的當(dāng)前新聞,將所述當(dāng)前新聞輸入測試通過的所述預(yù)訓(xùn)練語言模型中,獲取測試通過的所述預(yù)訓(xùn)練語言模型基于所述當(dāng)前新聞輸出的當(dāng)前識別結(jié)果,包括:
22、獲取所述金融平臺的聊天界面,獲取所述聊天界面的對話窗口,獲取所述對話窗口中出現(xiàn)的所述當(dāng)前新聞;
23、獲取所述當(dāng)前新聞的新聞文字、新聞圖像、新聞音頻,對所述當(dāng)前新聞的新聞文字、新聞圖像、新聞音頻進(jìn)行特征提取,得到第四特征向量,將所述第四特征向量輸入測試通過的所述預(yù)訓(xùn)練語言模型中,獲取測試通過的所述預(yù)訓(xùn)練語言模型基于所述第四特征向量輸出的當(dāng)前識別結(jié)果。
24、進(jìn)一步地,在所述獲取所述金融平臺的當(dāng)前新聞,將所述當(dāng)前新聞輸入測試通過的所述預(yù)訓(xùn)練語言模型中,獲取測試通過的所述預(yù)訓(xùn)練語言模型基于所述當(dāng)前新聞輸出的當(dāng)前識別結(jié)果之后,所述新聞識別方法,包括:
25、獲取所述金融平臺的提示框,通過所述提示框顯示所述當(dāng)前識別結(jié)果。
26、第二方面,提供了一種新聞識別裝置,包括:
27、第一獲取模塊,用于獲取金融平臺上經(jīng)過確認(rèn)的虛假新聞和真實新聞,選取所述虛假新聞或所述真實新聞作為預(yù)設(shè)新聞,獲取所述預(yù)設(shè)新聞對應(yīng)的預(yù)設(shè)識別結(jié)果,獲取所述金融平臺對應(yīng)的金融專業(yè)知識;
28、提取模塊,用于對所述預(yù)設(shè)新聞進(jìn)行特征提取,得到第一特征向量,對所述金融專業(yè)知識進(jìn)行特征提取,得到第二特征向量;
29、生成模塊,用于將所述第一特征向量和所述第二特征向量進(jìn)行融合,生成第三特征向量;
30、第二獲取模塊,用于獲取預(yù)訓(xùn)練語言模型基于所述第三特征向量輸出的預(yù)測識別結(jié)果,基于預(yù)定義的生成方式,生成所述預(yù)測識別結(jié)果與所述預(yù)設(shè)識別結(jié)果之間的損失值;
31、第三獲取模塊,用于當(dāng)所述損失值小于預(yù)設(shè)值時,采用預(yù)定義的獲取方式,獲取測試通過的所述預(yù)訓(xùn)練語言模型;
32、識別模塊,用于獲取所述金融平臺的當(dāng)前新聞,將所述當(dāng)前新聞輸入測試通過的所述預(yù)訓(xùn)練語言模型中,獲取測試通過的所述預(yù)訓(xùn)練語言模型基于所述當(dāng)前新聞輸出的當(dāng)前識別結(jié)果。
33、第三方面,提供了一種計算機(jī)設(shè)備,包括存儲器、處理器以及存儲在存儲器中并可在處理器上運(yùn)行的計算機(jī)程序,處理器執(zhí)行計算機(jī)程序時實現(xiàn)上述新聞識別方法的步驟。
34、第四方面,提供了一種計算機(jī)可讀存儲介質(zhì),計算機(jī)可讀存儲介質(zhì)存儲有計算機(jī)程序,計算機(jī)程序被處理器執(zhí)行時實現(xiàn)上述新聞識別方法的步驟。
35、本技術(shù)提供一種新聞識別方法、裝置、計算機(jī)設(shè)備及存儲介質(zhì),獲取金融平臺上經(jīng)過確認(rèn)的虛假新聞和真實新聞,選取所述虛假新聞或所述真實新聞作為預(yù)設(shè)新聞,獲取所述預(yù)設(shè)新聞對應(yīng)的預(yù)設(shè)識別結(jié)果,獲取所述金融平臺對應(yīng)的金融專業(yè)知識;對所述預(yù)設(shè)新聞進(jìn)行特征提取,得到第一特征向量,對所述金融專業(yè)知識進(jìn)行特征提取,得到第二特征向量;將所述第一特征向量和所述第二特征向量進(jìn)行融合,生成第三特征向量;獲取預(yù)訓(xùn)練語言模型基于所述第三特征向量輸出的預(yù)測識別結(jié)果,基于預(yù)定義的生成方式,生成所述預(yù)測識別結(jié)果與所述預(yù)設(shè)識別結(jié)果之間的損失值;當(dāng)所述損失值小于預(yù)設(shè)值時,采用預(yù)定義的獲取方式,獲取測試通過的所述預(yù)訓(xùn)練語言模型;獲取所述金融平臺的當(dāng)前新聞,將所述當(dāng)前新聞輸入測試通過的所述預(yù)訓(xùn)練語言模型中,獲取測試通過的所述預(yù)訓(xùn)練語言模型基于所述當(dāng)前新聞輸出的當(dāng)前識別結(jié)果,有益效果在于兩方面,一方面,一方面,識別所述金融平臺的當(dāng)前新聞,將所述當(dāng)前新聞輸入測試通過的所述預(yù)訓(xùn)練語言模型中,識別測試通過的所述預(yù)訓(xùn)練語言模型基于所述當(dāng)前新聞輸出的當(dāng)前識別結(jié)果,由于無需人工識別,因此減少了金融平臺的當(dāng)前新聞的識別時間,有利于提高金融平臺的當(dāng)前新聞的識別效率;另一方面,由于預(yù)訓(xùn)練語言模型,不會受到人工干預(yù)的影響,因此有利于提高當(dāng)前識別結(jié)果的可靠性。