本發(fā)明涉及清洗設(shè)備的,特別涉及一種基于多元異質(zhì)性特征的股票表征的價(jià)格預(yù)測方法。
背景技術(shù):
1、隨著深度神經(jīng)網(wǎng)絡(luò)的普及和發(fā)展,在金融科學(xué)技術(shù)領(lǐng)域,越來越多的量化模型與深度神經(jīng)網(wǎng)絡(luò)相結(jié)合,針對單一的股票、眾多股票構(gòu)成的指數(shù)等進(jìn)行研究。其中通過構(gòu)筑不同股票與股票之間、股票與和指數(shù)之間關(guān)系成為提升模型預(yù)測性能的一個(gè)研究方向。然而目前的研究往往還局限于使用單一的關(guān)系數(shù)據(jù),或者使用來自單一種類數(shù)據(jù)的多種關(guān)系數(shù)據(jù)。
2、因此,現(xiàn)有的技術(shù)與方法缺乏一種能充分挖掘金融市場內(nèi)部聯(lián)系的預(yù)測方法。
技術(shù)實(shí)現(xiàn)思路
1、針對現(xiàn)有技術(shù)中存在的不足之處,本發(fā)明的目的是提供一種基于多元異質(zhì)性特征的股票表征的價(jià)格預(yù)測方法,深度挖掘了文本評價(jià)、市場價(jià)格與股票趨勢之間的關(guān)聯(lián),并充分考慮了板塊之間的相關(guān)性,具有更強(qiáng)的表征能力和更好的預(yù)測能力。為了實(shí)現(xiàn)根據(jù)本發(fā)明的上述目的和其他優(yōu)點(diǎn),提供了一種基于多元異質(zhì)性特征的股票表征的價(jià)格預(yù)測方法,包括:
2、評論數(shù)據(jù)挖掘模塊,所述市場數(shù)據(jù)挖掘模塊用于獲取股票文本評價(jià)數(shù)據(jù);
3、市場數(shù)據(jù)挖掘模塊,所述市場數(shù)據(jù)挖掘模塊用于獲取市場數(shù)據(jù);
4、通過股票文本評價(jià)數(shù)據(jù)中動(dòng)詞計(jì)算板塊之間的情緒相關(guān)性系數(shù);
5、通過市場數(shù)據(jù)計(jì)算市場相關(guān)性矩陣;
6、通過評論數(shù)據(jù)挖掘模塊、市場數(shù)據(jù)挖掘模塊與股票趨勢分類器模塊構(gòu)成股票價(jià)格預(yù)測模型;
7、將預(yù)處理的股票文本評價(jià)數(shù)據(jù)與市場數(shù)據(jù)輸入中股票價(jià)格預(yù)測模型中預(yù)訓(xùn)練獲取板塊共享模型;
8、獲取最新股票文本評價(jià)數(shù)據(jù)與市場數(shù)據(jù)輸入股票價(jià)格預(yù)測模型中,對下一個(gè)交易周期的股票價(jià)格趨勢進(jìn)行預(yù)測。
9、優(yōu)選的,還包括投資組合管理模塊,所述投資組合管理模塊具體操作為:
10、通過股票價(jià)格預(yù)測模型篩選出下一個(gè)交易日的預(yù)測結(jié)果為上漲的股票,保存對應(yīng)股票的股票表征,計(jì)算股票的交易權(quán)重;
11、其中,投資風(fēng)險(xiǎn)通過投資組合中股票表征的點(diǎn)積和表示,計(jì)算投資組合的總收益。
12、優(yōu)選的,將股票文本評價(jià)數(shù)據(jù)根據(jù)所屬股票和時(shí)間進(jìn)行劃分,并根據(jù)數(shù)據(jù)集起始和結(jié)束時(shí)間對股票進(jìn)行篩選,從所有股票中篩選出符合要求的股票組成股票池,對股票池中的股票進(jìn)行預(yù)處理,將文本信息通過雙向向量嵌入編碼提取為評論表征數(shù)據(jù)。
13、優(yōu)選的,所述評論數(shù)據(jù)挖掘模塊包括編碼器模塊、第一向量、第二向量及將第一向量和第二向量在寬度維度上進(jìn)行拼接獲得第三向量;
14、所述編碼器模塊對股票的基本面歷史信息、技術(shù)面歷史信息進(jìn)行處理轉(zhuǎn)換得到第一向量;
15、將預(yù)處理的股票文本評價(jià)數(shù)據(jù)的雙向向量嵌入結(jié)果輸入蒸餾器模塊,得到第二向量。
16、優(yōu)選的,所述通過市場數(shù)據(jù)計(jì)算市場相關(guān)性矩陣,具體為:
17、板塊數(shù)據(jù)通過板塊內(nèi)部個(gè)股數(shù)據(jù)的平均值進(jìn)行描述;
18、將個(gè)股信息與眾多板塊的信息進(jìn)行結(jié)合,生成市場價(jià)格矩陣;
19、對于市場價(jià)格矩陣,計(jì)算其協(xié)方差矩陣,作為該股票的市場相關(guān)性矩陣。
20、本發(fā)明與現(xiàn)有技術(shù)相比,其有益效果是:通過融合多類數(shù)據(jù)的股票表征,可以有效的使用多類型的融合數(shù)據(jù)對股票進(jìn)行表征并且將不同的股票之間的關(guān)系納入股票的表征之中,從而有效解決了以往金融市場內(nèi)部聯(lián)系被忽視的問題。在對股票價(jià)格漲跌趨勢進(jìn)行預(yù)測的同時(shí)也提供了一個(gè)股票組合選擇的方法,為后續(xù)的股價(jià)預(yù)測模型和選股模型的學(xué)習(xí)研究以及工程應(yīng)用提供了新的思路。
1.一種基于多元異質(zhì)性特征的股票表征的價(jià)格預(yù)測方法,其特征在于,包括:
2.如權(quán)利要求1所述的一種基于多元異質(zhì)性特征的股票表征的價(jià)格預(yù)測方法,其特征在于,還包括投資組合管理模塊,所述投資組合管理模塊具體操作為:
3.如權(quán)利要求1所述的一種基于多元異質(zhì)性特征的股票表征的價(jià)格預(yù)測方法,其特征在于,將股票文本評價(jià)數(shù)據(jù)根據(jù)所屬股票和時(shí)間進(jìn)行劃分,并根據(jù)數(shù)據(jù)集起始和結(jié)束時(shí)間對股票進(jìn)行篩選,從所有股票中篩選出符合要求的股票組成股票池,對股票池中的股票進(jìn)行預(yù)處理,將文本信息通過雙向向量嵌入編碼提取為評論表征數(shù)據(jù)。
4.如權(quán)利要求3所述的一種基于多元異質(zhì)性特征的股票表征的價(jià)格預(yù)測方法,其特征在于,所述評論數(shù)據(jù)挖掘模塊包括編碼器模塊、第一向量、第二向量及將第一向量和第二向量在寬度維度上進(jìn)行拼接獲得第三向量;
5.如權(quán)利要求1所述的一種基于多元異質(zhì)性特征的股票表征的價(jià)格預(yù)測方法,其特征在于,所述通過市場數(shù)據(jù)計(jì)算市場相關(guān)性矩陣,具體為:
6.如權(quán)利要求1所述的一種基于多元異質(zhì)性特征的股票表征的價(jià)格預(yù)測方法,其特征在于,市場數(shù)據(jù)挖掘模塊具體操作為:
7.如權(quán)利要求1所述的一種基于多元異質(zhì)性特征的股票表征的價(jià)格預(yù)測方法,其特征在于,所述股票價(jià)格趨勢分類器模塊包括一個(gè)transformer的解碼器模塊層,一個(gè)長短期記憶模型(lstm)層,一個(gè)transformer的編碼器模塊層和一個(gè)多層感知機(jī)。
8.一種終端設(shè)備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述的方法。
9.一種計(jì)算機(jī)可讀存儲介質(zhì),所述計(jì)算機(jī)可讀存儲介質(zhì)存儲有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述的方法。