本技術(shù)涉及金融風(fēng)險(xiǎn)預(yù)測(cè),尤其涉及一種債券風(fēng)險(xiǎn)預(yù)測(cè)模型的訓(xùn)練方法及裝置、債券風(fēng)險(xiǎn)預(yù)測(cè)方法及裝置、電子設(shè)備及計(jì)算機(jī)程序產(chǎn)品。
背景技術(shù):
1、債券是政府、企業(yè)、銀行等債務(wù)人為籌集資金,按照法定程序發(fā)行并向債券人承諾于指定日期還本付息的有價(jià)證券。債券投資,是指?jìng)?gòu)買人(投資人,債券人)以購(gòu)買債券的形式投放資本,到期向債券發(fā)行人(借款人、債務(wù)人)收取固定的利息以及收回本金的一種投資方式。債務(wù)人為了籌得資金,會(huì)發(fā)布債券募集說明書,里面通常包含了債券的發(fā)行基本信息,首次發(fā)行量,債券期限,發(fā)行價(jià)格,利率,還款方式,擔(dān)保方式等重要信息。此外,說明書還包括債券風(fēng)險(xiǎn)和評(píng)級(jí)、債券使用的目的和計(jì)劃、發(fā)行方和發(fā)行團(tuán)隊(duì)介紹,以及相關(guān)法律條款等信息。債券的募集說明書旨在為投資者提供全面、準(zhǔn)確、公正的信息,幫助投資者做出明智的投資決策并保護(hù)其權(quán)益。
2、但是,債券募集說明書長(zhǎng)達(dá)幾百頁,人工閱讀說明書費(fèi)時(shí)費(fèi)力,因此,有研究人員提出了使用線性回歸模型來對(duì)說明書進(jìn)行分析,并得出結(jié)論,線性回歸模型雖然訓(xùn)練速度和預(yù)測(cè)速度很快,但是預(yù)測(cè)精度較低,可能會(huì)出現(xiàn)過度擬合,不適用于非線性數(shù)據(jù),預(yù)測(cè)精確度較低。并且,現(xiàn)有的方法沒有考慮到數(shù)據(jù)集中的特征交互,分離信號(hào)和噪聲的效果不理想。此外,債券募集說明書的內(nèi)容包含了一定的情感因素,現(xiàn)在的方法并沒有對(duì)此進(jìn)行研究。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)實(shí)施例提供了一種債券風(fēng)險(xiǎn)預(yù)測(cè)模型的訓(xùn)練方法及裝置、債券風(fēng)險(xiǎn)預(yù)測(cè)方法及裝置、電子設(shè)備及計(jì)算機(jī)程序產(chǎn)品,以提高債券風(fēng)險(xiǎn)預(yù)測(cè)的準(zhǔn)確性。
2、本技術(shù)實(shí)施例采用下述技術(shù)方案:
3、第一方面,本技術(shù)實(shí)施例提供一種債券風(fēng)險(xiǎn)預(yù)測(cè)模型的訓(xùn)練方法,所述債券風(fēng)險(xiǎn)預(yù)測(cè)模型的訓(xùn)練方法包括:
4、獲取債券募集說明書數(shù)據(jù)集,所述債券募集說明書數(shù)據(jù)集中包含債券募集說明書文本;
5、利用有向圖將所述債券募集說明書文本構(gòu)建為有向文本圖;
6、利用債券風(fēng)險(xiǎn)預(yù)測(cè)模型中的圖注意力網(wǎng)絡(luò)對(duì)所述有向文本圖進(jìn)行處理,得到所述圖注意力網(wǎng)絡(luò)輸出的有向文本圖的注意力特征;
7、利用債券風(fēng)險(xiǎn)預(yù)測(cè)模型中的分類器對(duì)所述有向文本圖的注意力特征進(jìn)行分類,得到債券募集說明書文本的分類結(jié)果;
8、根據(jù)所述債券募集說明書文本的分類結(jié)果計(jì)算債券風(fēng)險(xiǎn)預(yù)測(cè)模型的損失值,并利用所述損失值更新所述債券風(fēng)險(xiǎn)預(yù)測(cè)模型的參數(shù)。
9、可選地,所述獲取債券募集說明書數(shù)據(jù)集包括:
10、從目標(biāo)數(shù)據(jù)庫中獲取債券募集說明書的原始數(shù)據(jù);
11、將所述債券募集說明書的原始數(shù)據(jù)轉(zhuǎn)換為債券募集說明書文本;
12、對(duì)所述債券募集說明書文本進(jìn)行預(yù)處理,得到預(yù)處理后的債券募集說明書文本。
13、可選地,所述債券募集說明書文本包括多個(gè),所述利用有向圖將所述債券募集說明書文本構(gòu)建為有向文本圖包括:
14、利用有向圖分別將每個(gè)債券募集說明書文本構(gòu)建為一個(gè)有向文本圖,得到多個(gè)有向文本圖。
15、可選地,所述債券募集說明書文本中包含多個(gè)單詞,所述利用有向圖將所述債券募集說明書文本構(gòu)建為有向文本圖包括:
16、基于有向圖,將每個(gè)單詞表示為有向圖的頂點(diǎn),將單詞之間的共現(xiàn)關(guān)系表示為有向圖的邊;
17、根據(jù)所述有向圖的頂點(diǎn)和有向圖的邊構(gòu)建所述有向文本圖。
18、可選地,所述債券風(fēng)險(xiǎn)預(yù)測(cè)模型還包括編碼網(wǎng)絡(luò),所述利用債券風(fēng)險(xiǎn)預(yù)測(cè)模型中的圖注意力網(wǎng)絡(luò)對(duì)所述有向文本圖進(jìn)行處理,得到所述圖注意力網(wǎng)絡(luò)輸出的有向文本圖的注意力特征包括:
19、將所述有向文本圖中每個(gè)頂點(diǎn)的初始特征向量輸入編碼網(wǎng)絡(luò),得到編碼網(wǎng)絡(luò)輸出的隱藏層向量;
20、對(duì)每個(gè)隱藏層向量對(duì)應(yīng)的頂點(diǎn)和邊,利用圖注意力網(wǎng)絡(luò)和多頭注意力機(jī)制分別在每個(gè)注意力機(jī)制下學(xué)習(xí)每個(gè)頂點(diǎn)對(duì)應(yīng)的邊的權(quán)重,并根據(jù)每個(gè)注意力機(jī)制下學(xué)習(xí)到的每個(gè)頂點(diǎn)對(duì)應(yīng)的邊的權(quán)重生成每個(gè)注意力機(jī)制下的頂點(diǎn)的新特征向量;
21、對(duì)多個(gè)注意力機(jī)制下的頂點(diǎn)的新特征向量進(jìn)行融合,得到有向文本圖的注意力特征。
22、可選地,在利用債券風(fēng)險(xiǎn)預(yù)測(cè)模型中的圖注意力網(wǎng)絡(luò)對(duì)所述有向文本圖進(jìn)行處理,得到所述圖注意力網(wǎng)絡(luò)輸出的有向文本圖的注意力特征之后,所述債券風(fēng)險(xiǎn)預(yù)測(cè)模型的訓(xùn)練方法還包括:
23、對(duì)所述有向文本圖的注意力特征分別進(jìn)行最大池化和平均池化,得到最大池化后的注意力特征和平均池化后的注意力特征;
24、將所述最大池化后的注意力特征和所述平均池化后的注意力特征進(jìn)行融合,得到融合后的注意力特征;
25、所述利用債券風(fēng)險(xiǎn)預(yù)測(cè)模型中的分類器對(duì)所述有向文本圖的注意力特征進(jìn)行分類,得到債券募集說明書文本的分類結(jié)果包括:
26、利用債券風(fēng)險(xiǎn)預(yù)測(cè)模型中的分類器對(duì)所述融合后的注意力特征進(jìn)行分類,得到債券募集說明書文本的分類結(jié)果。
27、第二方面,本技術(shù)實(shí)施例還提供一種債券風(fēng)險(xiǎn)預(yù)測(cè)方法,所述債券風(fēng)險(xiǎn)預(yù)測(cè)方法包括:
28、獲取待預(yù)測(cè)的債券募集說明書的原始數(shù)據(jù),并轉(zhuǎn)換為待預(yù)測(cè)的債券募集說明書文本;
29、利用有向圖將所述待預(yù)測(cè)的債券募集說明書文本構(gòu)建為有向文本圖;
30、利用債券風(fēng)險(xiǎn)預(yù)測(cè)模型對(duì)所述有向文本圖進(jìn)行處理,得到債券風(fēng)險(xiǎn)預(yù)測(cè)結(jié)果;
31、其中,所述債券風(fēng)險(xiǎn)預(yù)測(cè)模型基于前述任一項(xiàng)所述債券風(fēng)險(xiǎn)預(yù)測(cè)模型的訓(xùn)練方法訓(xùn)練得到。
32、第三方面,本技術(shù)實(shí)施例還提供一種債券風(fēng)險(xiǎn)預(yù)測(cè)模型的訓(xùn)練裝置,所述債券風(fēng)險(xiǎn)預(yù)測(cè)模型的訓(xùn)練裝置包括:
33、第一獲取單元,用于獲取債券募集說明書數(shù)據(jù)集,所述債券募集說明書數(shù)據(jù)集中包含債券募集說明書文本;
34、第一構(gòu)建單元,用于利用有向圖將所述債券募集說明書文本構(gòu)建為有向文本圖;
35、圖注意力單元,用于利用債券風(fēng)險(xiǎn)預(yù)測(cè)模型中的圖注意力網(wǎng)絡(luò)對(duì)所述有向文本圖進(jìn)行處理,得到所述圖注意力網(wǎng)絡(luò)輸出的有向文本圖的注意力特征;
36、分類單元,用于利用債券風(fēng)險(xiǎn)預(yù)測(cè)模型中的分類器對(duì)所述有向文本圖的注意力特征進(jìn)行分類,得到債券募集說明書文本的分類結(jié)果;
37、更新單元,用于根據(jù)所述債券募集說明書文本的分類結(jié)果計(jì)算債券風(fēng)險(xiǎn)預(yù)測(cè)模型的損失值,并利用所述損失值更新所述債券風(fēng)險(xiǎn)預(yù)測(cè)模型的參數(shù)。
38、第四方面,本技術(shù)實(shí)施例還提供一種債券風(fēng)險(xiǎn)預(yù)測(cè)裝置,所述債券風(fēng)險(xiǎn)預(yù)測(cè)裝置包括:
39、第二獲取單元,用于獲取待預(yù)測(cè)的債券募集說明書的原始數(shù)據(jù),并轉(zhuǎn)換為待預(yù)測(cè)的債券募集說明書文本;
40、第二構(gòu)建單元,用于利用有向圖將所述待預(yù)測(cè)的債券募集說明書文本構(gòu)建為有向文本圖;
41、預(yù)測(cè)單元,用于利用債券風(fēng)險(xiǎn)預(yù)測(cè)模型對(duì)所述有向文本圖進(jìn)行處理,得到債券風(fēng)險(xiǎn)預(yù)測(cè)結(jié)果;
42、其中,所述債券風(fēng)險(xiǎn)預(yù)測(cè)模型基于前述債券風(fēng)險(xiǎn)預(yù)測(cè)模型的訓(xùn)練裝置訓(xùn)練得到。
43、第五方面,本技術(shù)實(shí)施例還提供一種電子設(shè)備,包括:
44、處理器;以及
45、被安排成存儲(chǔ)計(jì)算機(jī)可執(zhí)行指令的存儲(chǔ)器,所述可執(zhí)行指令在被執(zhí)行時(shí)使所述處理器執(zhí)行前述之任一所述債券風(fēng)險(xiǎn)預(yù)測(cè)模型的訓(xùn)練方法,或者執(zhí)行前述債券風(fēng)險(xiǎn)預(yù)測(cè)方法。
46、第六方面,本技術(shù)實(shí)施例還提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序或指令,所述計(jì)算機(jī)程序或指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)前述任一所述債券風(fēng)險(xiǎn)預(yù)測(cè)模型的訓(xùn)練方法,或者實(shí)現(xiàn)前述債券風(fēng)險(xiǎn)預(yù)測(cè)方法。
47、本技術(shù)實(shí)施例采用的上述至少一個(gè)技術(shù)方案能夠達(dá)到以下有益效果:本技術(shù)實(shí)施例的債券風(fēng)險(xiǎn)預(yù)測(cè)模型的訓(xùn)練方法,先獲取債券募集說明書數(shù)據(jù)集,債券募集說明書數(shù)據(jù)集中包含債券募集說明書文本;然后利用有向圖將債券募集說明書文本構(gòu)建為有向文本圖;之后利用債券風(fēng)險(xiǎn)預(yù)測(cè)模型中的圖注意力網(wǎng)絡(luò)對(duì)有向文本圖進(jìn)行處理,得到圖注意力網(wǎng)絡(luò)輸出的有向文本圖的注意力特征;再利用債券風(fēng)險(xiǎn)預(yù)測(cè)模型中的分類器對(duì)有向文本圖的注意力特征進(jìn)行分類,得到債券募集說明書文本的分類結(jié)果;最后根據(jù)債券募集說明書文本的分類結(jié)果計(jì)算債券風(fēng)險(xiǎn)預(yù)測(cè)模型的損失值,并利用損失值更新債券風(fēng)險(xiǎn)預(yù)測(cè)模型的參數(shù)。本技術(shù)實(shí)施例的債券風(fēng)險(xiǎn)預(yù)測(cè)模型的訓(xùn)練方法將債券募集說明書文本數(shù)據(jù)構(gòu)建成有向文本圖,并使用圖注意力網(wǎng)絡(luò)進(jìn)行訓(xùn)練,能夠?qū)W習(xí)到文本級(jí)別的單詞交互和單詞間的順序,且能夠關(guān)注到不同單詞節(jié)點(diǎn)的重要性,從而實(shí)現(xiàn)了更準(zhǔn)確的債券風(fēng)險(xiǎn)預(yù)測(cè)。