本發(fā)明涉及儲(chǔ)能數(shù)據(jù)傳輸,具體涉及一種儲(chǔ)能電站數(shù)據(jù)采集與傳輸方法及系統(tǒng)。
背景技術(shù):
1、儲(chǔ)能電站作為現(xiàn)代電力系統(tǒng)的重要組成部分,旨在解決可再生能源發(fā)電的間歇性和不穩(wěn)定性問題。在儲(chǔ)能電站的運(yùn)營中,日志數(shù)據(jù)扮演著關(guān)鍵角色。這些日志數(shù)據(jù)記錄了電站的實(shí)時(shí)運(yùn)行狀態(tài)、能量存儲(chǔ)和釋放情況、設(shè)備性能等信息,為運(yùn)維決策提供了重要依據(jù)。通過分析日志數(shù)據(jù),可以優(yōu)化儲(chǔ)能系統(tǒng)的調(diào)度策略,提高充放電效率,降低運(yùn)營成本。此外,日志數(shù)據(jù)還為故障診斷、預(yù)測性維護(hù)和性能評估提供了數(shù)據(jù)支持,助力實(shí)現(xiàn)智能化管理。
2、隨著技術(shù)進(jìn)步和市場需求的增長,儲(chǔ)能電站的應(yīng)用場景不斷拓展,包括電力市場參與、需求響應(yīng)和電網(wǎng)調(diào)節(jié)等。然而,要充分發(fā)揮儲(chǔ)能電站的潛力,仍需在數(shù)據(jù)采集、處理和分析能力上加大投入,以提升其智能化水平和經(jīng)濟(jì)效益。
3、由于儲(chǔ)能電站是由多組電能存儲(chǔ)單元構(gòu)成的,即每個(gè)電能存儲(chǔ)單元存在多個(gè)電池,那么在對儲(chǔ)能電站的監(jiān)測過程中主要以監(jiān)測日志的形式對電能存儲(chǔ)單元的狀況進(jìn)行描述。然而在實(shí)際的監(jiān)測過程中監(jiān)測日志存在大量相同的文本,即日志文本的相似性極高,那么在進(jìn)行存儲(chǔ)時(shí)會(huì)產(chǎn)生大量的冗余數(shù)據(jù),進(jìn)而導(dǎo)致了對采集得到的監(jiān)測日志的存儲(chǔ)和傳輸?shù)呢?fù)載壓力。
技術(shù)實(shí)現(xiàn)思路
1、為了解決以上的技術(shù)問題,本發(fā)明的目的在于提供一種儲(chǔ)能電站數(shù)據(jù)采集與傳輸方法及系統(tǒng)。
2、根據(jù)本發(fā)明實(shí)施例的第一方面,提供的一種儲(chǔ)能電站數(shù)據(jù)采集與傳輸方法,所采用的技術(shù)方案具體如下:
3、對儲(chǔ)能電站的各電能存儲(chǔ)單元進(jìn)行數(shù)據(jù)監(jiān)測,得到原始日志,所述原始日志包括數(shù)字?jǐn)?shù)據(jù)和文本數(shù)據(jù);
4、對所述數(shù)字?jǐn)?shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理得到數(shù)字向量序列,和對所述文本數(shù)據(jù)進(jìn)行分段文本量化得到文本向量序列;
5、基于所述文本向量序列,對所述原始日志進(jìn)行第一次聚類分析,得到各電能存儲(chǔ)單元的特征類別;
6、分析所述特征類別內(nèi)所述原始日志的分布特征,得到各電能存儲(chǔ)單元的冗余權(quán)重;
7、分析所述數(shù)字向量序列之間的相關(guān)性和差異性,并結(jié)合所述冗余權(quán)重,得到所述原始日志的異常表現(xiàn)性;
8、根據(jù)所述異常表現(xiàn)性,對所述原始日志進(jìn)行第二次聚類分析,得到正常日志集和疑似異常日志集;
9、利用所述正常日志集訓(xùn)練得到基于關(guān)鍵詞的句子嵌入模型,基于所述句子嵌入模型進(jìn)行監(jiān)測數(shù)據(jù)傳輸。
10、在本發(fā)明的一些實(shí)施例中,對所述文本數(shù)據(jù)進(jìn)行分段文本量化得到文本向量序列,包括:
11、根據(jù)停用詞表,去除所述文本數(shù)據(jù)中的停用詞,得到有效文本;
12、使用結(jié)巴分詞算法,將所述有效文本進(jìn)行分詞操作,得到所述有效文本的關(guān)鍵詞;
13、對所有所述原始日志進(jìn)行等比例切分,得到切分段;
14、基于所述關(guān)鍵詞,依次對所有所述原始日志對應(yīng)的切分段內(nèi)的文本數(shù)據(jù)進(jìn)行字典構(gòu)建,得到詞向量字典;
15、基于所述詞向量字典,對所述文本數(shù)據(jù)進(jìn)行文本向量化得到文本向量序列。
16、在本發(fā)明的一些實(shí)施例中,基于所述文本向量序列,對所述原始日志進(jìn)行第一次聚類分析,得到各電能存儲(chǔ)單元的特征類別,包括:
17、對所述文本向量序列中的詞向量進(jìn)行模值化,得到所述原始日志的文本序列和所述詞向量的模值;
18、使用mann-kendall(mk)趨勢檢驗(yàn)算法,對所述文本序列進(jìn)行檢驗(yàn)分析,獲得所述文本向量序列對應(yīng)的檢驗(yàn)統(tǒng)計(jì)量;
19、計(jì)算所述文本向量序列內(nèi)所有詞向量的模值的平均值,得到所述文本向量序列的數(shù)據(jù)分布;
20、基于所述檢驗(yàn)統(tǒng)計(jì)量和所述數(shù)據(jù)分布,使用isodata算法對所述原始日志進(jìn)行第一次聚類分析,得到各電能存儲(chǔ)單元的特征類別。
21、在本發(fā)明的一些實(shí)施例中,基于所述檢驗(yàn)統(tǒng)計(jì)量和所述數(shù)據(jù)分布,使用isodata算法對所述原始日志進(jìn)行第一次聚類分析,得到各電能存儲(chǔ)單元的特征類別,包括:
22、所述數(shù)據(jù)分布為橫軸,所述檢驗(yàn)統(tǒng)計(jì)量為縱軸,構(gòu)建二維分析空間;
23、基于所述二維分析空間,使用isodata算法對所述原始日志進(jìn)行第一次聚類分析,得到若干類別;
24、獲取每個(gè)電能存儲(chǔ)單元在每個(gè)所述類別中的原始日志個(gè)數(shù),選取包含所述電能存儲(chǔ)單元的原始日志個(gè)數(shù)最多的類別作為所述電能存儲(chǔ)單元的特征類別。
25、在本發(fā)明的一些實(shí)施例中,分析所述特征類別內(nèi)所述原始日志的分布特征,得到各電能存儲(chǔ)單元的冗余權(quán)重,包括:
26、獲取各電能存儲(chǔ)單元在其對應(yīng)的特征類別中的原始日志的數(shù)量,以及獲取各電能存儲(chǔ)單元對應(yīng)的特征類別中包含的原始日志的總數(shù)量;
27、計(jì)算各電能存儲(chǔ)單元在其對應(yīng)的特征類別中的原始日志的數(shù)量與各電能存儲(chǔ)單元對應(yīng)的特征類別中包含原始日志的總數(shù)量的比值,得到各電能存儲(chǔ)單元的冗余權(quán)重。
28、在本發(fā)明的一些實(shí)施例中,分析所述數(shù)字向量序列之間的相關(guān)性和差異性,并結(jié)合所述冗余權(quán)重,得到所述原始日志的異常表現(xiàn)性,包括:
29、統(tǒng)計(jì)所有所述數(shù)字向量序列中詞向量的數(shù)量,得到標(biāo)準(zhǔn)數(shù)字向量序列;
30、將每個(gè)所述數(shù)字向量序列與所述標(biāo)準(zhǔn)數(shù)字向量序列進(jìn)行dtw匹配,得到每個(gè)所述數(shù)字向量序列對應(yīng)的規(guī)整數(shù)字向量序列;
31、計(jì)算每個(gè)所述規(guī)整數(shù)字向量序列和所述標(biāo)準(zhǔn)數(shù)字向量序列的皮爾遜相關(guān)系數(shù),得到每個(gè)所述規(guī)整數(shù)字向量序列對應(yīng)的相關(guān)性;
32、計(jì)算每個(gè)所述規(guī)整數(shù)字向量序列和所述標(biāo)準(zhǔn)數(shù)字向量序列中對應(yīng)的向量之間的模值差值,得到每個(gè)所述規(guī)整數(shù)字向量序列對應(yīng)的差異性;
33、根據(jù)所述相關(guān)性和所述差異性,并結(jié)合所述冗余權(quán)重,得到所述原始日志的異常表現(xiàn)性。
34、在本發(fā)明的一些實(shí)施例中,根據(jù)所述異常表現(xiàn)性,對所述原始日志進(jìn)行第二次聚類分析,得到正常日志集和疑似異常日志集,包括:
35、基于所有原始日志的異常表現(xiàn)性,使用密度聚類算法dbscan進(jìn)行第二次聚類分析,其中半徑為0.1,半徑內(nèi)鄰近點(diǎn)個(gè)數(shù)為電能存儲(chǔ)單元個(gè)數(shù),獲得若干類簇;
36、將其中能構(gòu)成類簇的原始日志作為普通日志,將不能構(gòu)成類簇的原始日志作為差異日志;
37、所有的普通日志構(gòu)成正常日志集,所有的差異日志構(gòu)成疑似異常日志集。
38、在本發(fā)明的一些實(shí)施例中,基于所述句子嵌入模型進(jìn)行監(jiān)測數(shù)據(jù)傳輸,包括:
39、對所述疑似異常日志集進(jìn)行傳輸,對所述正常日志集中所述原始日志的關(guān)鍵詞進(jìn)行傳輸;
40、在分析端,使用所述句子嵌入模型和所述原始日志的關(guān)鍵詞,對所述正常日志集中的所述原始日志進(jìn)行還原。
41、根據(jù)本發(fā)明實(shí)施例的第二方面,提供的一種儲(chǔ)能電站數(shù)據(jù)采集與傳輸系統(tǒng),包括:存儲(chǔ)器和處理器,其中:
42、所述存儲(chǔ)器,用于存儲(chǔ)程序代碼;
43、所述處理器,用于讀取所述存儲(chǔ)器中存儲(chǔ)的程序代碼,并執(zhí)行本發(fā)明實(shí)施例的第一方面所述的方法。
44、在本發(fā)明的一些實(shí)施例中,所述處理器包括:
45、日志數(shù)據(jù)監(jiān)測模塊,用于對儲(chǔ)能電站的各電能存儲(chǔ)單元進(jìn)行數(shù)據(jù)監(jiān)測,得到原始日志,所述原始日志包括數(shù)字?jǐn)?shù)據(jù)和文本數(shù)據(jù);
46、日志數(shù)據(jù)處理模塊,用于對所述數(shù)字?jǐn)?shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理得到數(shù)字向量序列,和對所述文本數(shù)據(jù)進(jìn)行分段文本量化得到文本向量序列;
47、冗余權(quán)重分析模塊,用于基于所述文本向量序列,對所述原始日志進(jìn)行第一次聚類分析,得到各電能存儲(chǔ)單元的特征類別;并分析所述特征類別內(nèi)所述原始日志的分布特征,得到各電能存儲(chǔ)單元的冗余權(quán)重;
48、日志判斷模塊,用于分析所述數(shù)字向量序列之間的相關(guān)性和差異性,并結(jié)合所述冗余權(quán)重,得到所述原始日志的異常表現(xiàn)性;并根據(jù)所述異常表現(xiàn)性,對所述原始日志進(jìn)行第二次聚類分析,得到正常日志集和疑似異常日志集;
49、句子嵌入模型訓(xùn)練模塊,用于利用所述正常日志集訓(xùn)練得到基于關(guān)鍵詞的句子嵌入模型,基于所述句子嵌入模型進(jìn)行監(jiān)測數(shù)據(jù)傳輸。
50、相較于現(xiàn)有技術(shù),本發(fā)明提供的一種儲(chǔ)能電站數(shù)據(jù)采集與傳輸方法及系統(tǒng),具有如下有益效果:
51、第一,通過對原始日志中文本數(shù)據(jù)進(jìn)行分段文本量化得到文本向量序列,避免了存在差異的詞向量會(huì)排在字典的靠后位置,與正常的詞匯向量的間隔較遠(yuǎn),即向量差異過大導(dǎo)致向量的意義失真。
52、第二,通過分析同一電能存儲(chǔ)單元受到內(nèi)阻影響導(dǎo)致的文本向量序列差異,用于在分析電能存儲(chǔ)單元的相似性時(shí),作為更高敏感性的數(shù)字向量序列的冗余權(quán)重。
53、第三,通過對同一電能存儲(chǔ)單元的所有文本向量序列和數(shù)字向量序列分別進(jìn)行分析,并將通過分析文本向量序列得到的冗余權(quán)重作為分析數(shù)字向量序列時(shí)的權(quán)重,提高了對原始日志異常表現(xiàn)性判斷的準(zhǔn)確性,進(jìn)而提高了正常日志集和疑似異常日志集的可靠性。
54、第四,利用正常日志集訓(xùn)練得到基于關(guān)鍵詞的句子嵌入模型,可以保證傳輸質(zhì)量的同時(shí)有效的減少存儲(chǔ)和傳輸?shù)呢?fù)載壓力,提高傳輸效率。