本發(fā)明涉及電力技術(shù)領(lǐng)域,更為具體地說,涉及一種多源電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式的規(guī)整方法和系統(tǒng)。
背景技術(shù):
電力網(wǎng)絡(luò)包括子站系統(tǒng)和主站系統(tǒng),一個主站系統(tǒng)可能連接多個子站系統(tǒng),從而對不同子站系統(tǒng)上傳的電力業(yè)務(wù)數(shù)據(jù)進行集成,例如:通過不同的電流互感器/電壓互感器從具體電力設(shè)備采集電力信息的二次裝置作為子站系統(tǒng),會向作為主站系統(tǒng)的信息業(yè)務(wù)系統(tǒng)傳遞電力業(yè)務(wù)數(shù)據(jù)。
由于一個主站系統(tǒng)可能連接多個子站系統(tǒng),子站系統(tǒng)之間相互獨立,并且即使是同一子站系統(tǒng)前、后上傳至主站系統(tǒng)的電力業(yè)務(wù)數(shù)據(jù)也可能相互重疊,導致主站系統(tǒng)接收到的電力業(yè)務(wù)數(shù)據(jù)可能存在冗余;同時,由于子站系統(tǒng)與主站系統(tǒng)之間的信息傳遞往往缺乏統(tǒng)一的建模和傳輸規(guī)范,導致主站系統(tǒng)接收到的電力業(yè)務(wù)數(shù)據(jù)可能為存在數(shù)據(jù)錯誤、缺失的“臟”數(shù)據(jù)。因此為了減少數(shù)據(jù)的冗余、錯誤和缺失問題,通常在主站系統(tǒng)集成數(shù)據(jù)之前,需要對數(shù)據(jù)進行清洗。
然而,主站系統(tǒng)接收到的電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)源類型繁多,往往包括:數(shù)據(jù)庫類數(shù)據(jù)源、web-services數(shù)據(jù)源以及文本格式txt、xls和XML等文本數(shù)據(jù)源等多種類型;不同數(shù)據(jù)源的電力業(yè)務(wù)數(shù)據(jù),其數(shù)據(jù)結(jié)構(gòu)格式往往不同。并且由于主站系統(tǒng)往往連接多個子站系統(tǒng),子站系統(tǒng)與主站系統(tǒng)之間的信息傳輸缺乏統(tǒng)一的建模與傳輸規(guī)范,導致主站系統(tǒng)獲取到的電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式的差異較大。由于上述原因,在對電力業(yè)務(wù)數(shù)據(jù)清洗時,會導致數(shù)據(jù)的清洗效率下降,甚至導致數(shù)據(jù)無法清洗的問題。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的是提供一種多源電力業(yè)務(wù)數(shù)據(jù)的規(guī)整的技術(shù)方案,以解決背景技術(shù)中所介紹的現(xiàn)有技術(shù)中電力業(yè)務(wù)數(shù)據(jù)清洗效率下降,甚至數(shù)據(jù)無法清洗的問題。
為了解決上述技術(shù)問題,本發(fā)明提供如下技術(shù)方案:
根據(jù)本發(fā)明的第一方面,提供了一種多源電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式的規(guī)整方法,該數(shù)據(jù)結(jié)構(gòu)格式的規(guī)整方法用于主站系統(tǒng),包括:
使用數(shù)據(jù)管理規(guī)范對多個數(shù)據(jù)源的電力業(yè)務(wù)數(shù)據(jù)進行接入管理,其中,所述數(shù)據(jù)管理規(guī)范與所述電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)源類型相對應(yīng);
使用格式數(shù)據(jù)轉(zhuǎn)換模型抽取所述電力業(yè)務(wù)數(shù)據(jù),將所述電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式轉(zhuǎn)換為匹配所述主站系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)格式,其中,所述格式數(shù)據(jù)轉(zhuǎn)換模型與所述匹配主站系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)格式相對應(yīng);
使用與所述電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式對應(yīng)的模型處理規(guī)范,將所述電力業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換為通用信息模型CIM形式的電力業(yè)務(wù)數(shù)據(jù)。
優(yōu)選地,所述數(shù)據(jù)結(jié)構(gòu)格式的規(guī)整方法還包括:
將所述CIM形式的電力業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換為對象-關(guān)系映射形式的電力業(yè)務(wù)數(shù)據(jù);
確定與所述電力業(yè)務(wù)數(shù)據(jù)的對象-關(guān)系映射形式對應(yīng)的數(shù)據(jù)接口,根據(jù)所述數(shù)據(jù)接口傳遞所述電力業(yè)務(wù)數(shù)據(jù)。
優(yōu)選地,所述使用數(shù)據(jù)管理規(guī)范對多個數(shù)據(jù)源的電力業(yè)務(wù)數(shù)據(jù)進行接入管理,包括:
使用與所述數(shù)據(jù)源類型對應(yīng)的數(shù)據(jù)管理規(guī)范分別對所述電力業(yè)務(wù)數(shù)據(jù)的接入頻率、存儲位置和接入時段進行管理。
優(yōu)選地,所述使用與所述電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式對應(yīng)的模型處理規(guī)范,將所述電力業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換為CIM形式的電力業(yè)務(wù)數(shù)據(jù),包括:
使用模型處理規(guī)范將對應(yīng)數(shù)據(jù)結(jié)構(gòu)格式的電力業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換為所述模型處理規(guī)范對應(yīng)的變量或?qū)ο笮问降碾娏I(yè)務(wù)數(shù)據(jù);
將所述變量或?qū)ο笮问降碾娏I(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換為CIM形式的電力業(yè)務(wù)數(shù)據(jù)。
優(yōu)選地,所述數(shù)據(jù)源類型包括:數(shù)據(jù)庫類型、文件類型和規(guī)約數(shù)據(jù)流類型;
所述數(shù)據(jù)管理規(guī)范包括:與所述數(shù)據(jù)庫類型對應(yīng)的數(shù)據(jù)庫處理規(guī)范、與所述文件類型對應(yīng)的文件傳輸協(xié)議FTP或文件系統(tǒng)處理規(guī)范、與所述文件類型對應(yīng)的網(wǎng)絡(luò)服務(wù)web-services處理規(guī)范以及與所述規(guī)約數(shù)據(jù)流對應(yīng)的協(xié)議處理規(guī)范。
根據(jù)本發(fā)明的第二方面,還提供了一種多源電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式的規(guī)整系統(tǒng),用于主站系統(tǒng),所述規(guī)整系統(tǒng)包括:
數(shù)據(jù)接入管理模塊,用于使用數(shù)據(jù)管理規(guī)范對多個數(shù)據(jù)源的電力業(yè)務(wù)數(shù)據(jù)進行接入管理,其中,所述數(shù)據(jù)管理規(guī)范與所述電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)源類型相對應(yīng);
數(shù)據(jù)統(tǒng)一抽取模塊,用于使用格式數(shù)據(jù)轉(zhuǎn)換模型抽取所述電力業(yè)務(wù)數(shù)據(jù),將所述電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式轉(zhuǎn)換為匹配所述主站系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)格式,其中,所述格式數(shù)據(jù)轉(zhuǎn)換模型與所述匹配主站系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)格式相對應(yīng);
數(shù)據(jù)統(tǒng)一解析模塊,用于使用與所述電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式對應(yīng)的模型處理規(guī)范,將所述電力業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換為通用信息模型CIM形式的電力業(yè)務(wù)數(shù)據(jù)。
優(yōu)選地,所述數(shù)據(jù)結(jié)構(gòu)格式的規(guī)整系統(tǒng)還包括:
數(shù)據(jù)映射模塊,用于將所述CIM形式的電力業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換為對象-關(guān)系映射形式的電力業(yè)務(wù)數(shù)據(jù);
數(shù)據(jù)統(tǒng)一接口模塊,用于確定與所述電力業(yè)務(wù)數(shù)據(jù)的對象-關(guān)系映射形式對應(yīng)的數(shù)據(jù)接口,根據(jù)所述數(shù)據(jù)接口傳遞所述電力業(yè)務(wù)數(shù)據(jù)。
優(yōu)選地,所述數(shù)據(jù)接入管理模塊,具體用于使用與所述數(shù)據(jù)源類型對應(yīng)的數(shù)據(jù)管理規(guī)范分別對所述電力業(yè)務(wù)數(shù)據(jù)的接入頻率、存儲位置和接入時段進行管理。
優(yōu)選地,所述數(shù)據(jù)統(tǒng)一解析模塊,包括:
第一數(shù)據(jù)轉(zhuǎn)換子模塊,用于使用模型處理規(guī)范將對應(yīng)數(shù)據(jù)結(jié)構(gòu)格式的電力業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換為所述模型處理規(guī)范對應(yīng)的變量或?qū)ο笮问降碾娏I(yè)務(wù)數(shù)據(jù);
第二數(shù)據(jù)轉(zhuǎn)換子模塊,用于將所述變量或?qū)ο笮问降碾娏I(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換為CIM形式的電力業(yè)務(wù)數(shù)據(jù)。
優(yōu)選地,所述數(shù)據(jù)源類型包括:數(shù)據(jù)庫類型、文件類型和規(guī)約數(shù)據(jù)流類型;
所述數(shù)據(jù)管理規(guī)范包括:與所述數(shù)據(jù)庫類型對應(yīng)的數(shù)據(jù)庫處理規(guī)范、與所述文件類型對應(yīng)的文件傳輸協(xié)議FTP或文件系統(tǒng)處理規(guī)范、與所述文件類型對應(yīng)的網(wǎng)絡(luò)服務(wù)web-services處理規(guī)范以及與所述規(guī)約數(shù)據(jù)流對應(yīng)的協(xié)議處理規(guī)范。
通過上述工作過程可以得出,本發(fā)明提供的多源電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式的規(guī)整方案,通過使用數(shù)據(jù)管理規(guī)范對多個數(shù)據(jù)源中的電力業(yè)務(wù)數(shù)據(jù)進行接入管理,然后通過格式數(shù)據(jù)轉(zhuǎn)換模型抽取電力業(yè)務(wù)數(shù)據(jù),使用與電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式對應(yīng)的模型處理規(guī)范,將電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式轉(zhuǎn)換為匹配主站系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)格式,然后將電力業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換為通用信息模型CIM形式的電力業(yè)務(wù)數(shù)據(jù),能夠建立電力業(yè)務(wù)數(shù)據(jù)的統(tǒng)一的數(shù)據(jù)結(jié)構(gòu)格式,從而方便電力業(yè)務(wù)數(shù)據(jù)在子站系統(tǒng)和主站系統(tǒng)之間的傳輸,并方便對電力業(yè)務(wù)數(shù)據(jù)進行清洗,提高數(shù)據(jù)清洗效率。
附圖說明
為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,對于本領(lǐng)域普通技術(shù)人員而言,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其它的附圖。
圖1是本發(fā)明一示例性實施例示出的第一種多源電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式的規(guī)整方法的流程圖;
圖2是圖1所示實施例示出的一種電力業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換方法的流程圖;
圖3是本發(fā)明一示例性實施例示出的第二種多源電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式的規(guī)整方法的流程圖;
圖4是本發(fā)明一示例性實施例示出的第一種多源電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式的規(guī)整系統(tǒng)的結(jié)構(gòu)圖;
圖5是圖4所示實施例示出的一種數(shù)據(jù)統(tǒng)一解析模塊的結(jié)構(gòu)圖;
圖6是本發(fā)明一示例性實施例示出的第二種多源電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式的規(guī)整系統(tǒng)的結(jié)構(gòu)圖;
圖7是本發(fā)明一示例性實施例示出的一種多源電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式的規(guī)整系統(tǒng)的架構(gòu)圖。
具體實施方式
本發(fā)明實施例提供的多源電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式的規(guī)整方案,解決了背景技術(shù)中所介紹的電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式的差異較大,導致數(shù)據(jù)的清洗效率下降,甚至導致數(shù)據(jù)無法清洗的問題。
為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明實施例中的技術(shù)方案,并使本發(fā)明實施例的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結(jié)合附圖對本發(fā)明實施例中的技術(shù)方案作進一步詳細的說明。
請參考附圖1,圖1是本發(fā)明一示例性實施例示出的一種多源電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式的規(guī)整方法的流程示意圖。如圖1所示,本發(fā)明實施例提供的多源電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式的規(guī)整方法包括:
S110:使用數(shù)據(jù)管理規(guī)范對多個數(shù)據(jù)源的電力業(yè)務(wù)數(shù)據(jù)進行接入管理,其中,所述數(shù)據(jù)管理規(guī)范與所述電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)源類型相對應(yīng);
電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)源包括數(shù)據(jù)庫類數(shù)據(jù)源;網(wǎng)絡(luò)服務(wù)web-services、aop類數(shù)據(jù)源;文件系統(tǒng)類數(shù)據(jù)源;iec 61850和iec61870等多種數(shù)據(jù)源類型??傮w來講,可將電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)源劃分為數(shù)據(jù)庫類型、文件類型和規(guī)約數(shù)據(jù)流類型三部分。并且與數(shù)據(jù)源類型對應(yīng)的數(shù)據(jù)管理規(guī)范包括與所述數(shù)據(jù)庫類型對應(yīng)的數(shù)據(jù)庫處理規(guī)范、與所述文件類型對應(yīng)的文件傳輸協(xié)議FTP或文件系統(tǒng)處理規(guī)范、與所述文件類型對應(yīng)的網(wǎng)絡(luò)服務(wù)web-services處理規(guī)范以及與所述規(guī)約數(shù)據(jù)流對應(yīng)的協(xié)議處理規(guī)范。
在本發(fā)明實施例中,具體使用與所述數(shù)據(jù)源類型對應(yīng)的數(shù)據(jù)管理規(guī)范分別對所述電力業(yè)務(wù)數(shù)據(jù)的接入頻率、存儲位置和接入時段進行管理。主站系統(tǒng)接收到的電力業(yè)務(wù)數(shù)據(jù)主要為子站系統(tǒng)發(fā)送的,也包括從數(shù)據(jù)庫等其他存儲器件中獲取到的。
S120:使用格式數(shù)據(jù)轉(zhuǎn)換模型抽取所述電力業(yè)務(wù)數(shù)據(jù),將所述電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式轉(zhuǎn)換為匹配所述主站系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)格式,其中,所述格式數(shù)據(jù)轉(zhuǎn)換模型與所述匹配主站系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)格式相對應(yīng);
在本實施例中數(shù)據(jù)轉(zhuǎn)換模型至少包括CIM/RDF模型、XML模型和特定格式模型三種類型,該三種模型可對應(yīng)于主站系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)格式,如CIM、RDF或XML格式等。
通過將電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式轉(zhuǎn)換為匹配主站系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)格式,能夠方便主站系統(tǒng)對電力業(yè)務(wù)數(shù)據(jù)進行數(shù)據(jù)規(guī)范,減小數(shù)據(jù)結(jié)構(gòu)格式不統(tǒng)一導致的清洗速度下降的情況。
S130:使用與所述電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式對應(yīng)的模型處理規(guī)范,將所述電力業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換為通用信息模型CIM形式的電力業(yè)務(wù)數(shù)據(jù)。
在本發(fā)明實施例中,模型處理規(guī)范可包括Jena處理方法、DOM處理方法和SAX處理方法,通過四種方法對不同的模型數(shù)據(jù)進行解析,并將解析后的數(shù)據(jù)封裝為統(tǒng)一的JavaBean接口模式。
在本發(fā)明實施例中,該步驟S130:使用與電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式對應(yīng)的模型處理規(guī)范,將電力業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換為CIM形式的電力業(yè)務(wù)數(shù)據(jù)包括:
S131:使用模型處理規(guī)范將對應(yīng)數(shù)據(jù)結(jié)構(gòu)格式的電力業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換為所述模型處理規(guī)范對應(yīng)的變量或?qū)ο笮问降碾娏I(yè)務(wù)數(shù)據(jù);
S132:將所述變量或?qū)ο笮问降碾娏I(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換為CIM形式的電力業(yè)務(wù)數(shù)據(jù)。
在本發(fā)明實施例中,解析包括對電力業(yè)務(wù)數(shù)據(jù)的語法進行解析,通過解析語法,將電力業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)化為內(nèi)存中的變量或?qū)ο髷?shù)據(jù),然后再轉(zhuǎn)換為標準CIM模型數(shù)據(jù)。相應(yīng)地,格式轉(zhuǎn)換即通過解析元數(shù)據(jù)在內(nèi)存中構(gòu)建的對象數(shù)據(jù)轉(zhuǎn)換為標準的CIM模型數(shù)據(jù)的過程。
雖然電力業(yè)務(wù)的數(shù)據(jù)結(jié)構(gòu)格式經(jīng)過了轉(zhuǎn)換,能夠方便對數(shù)據(jù)進行統(tǒng)一的清洗等處理,然而由于不同電力業(yè)務(wù)數(shù)據(jù)具有不同的傳輸規(guī)范,因此在電力業(yè)務(wù)數(shù)據(jù)傳輸時可能會出現(xiàn)傳輸效率低下,甚至無法傳輸?shù)那闆r。如將電力業(yè)務(wù)數(shù)據(jù)傳輸入數(shù)據(jù)庫中,由于沒有統(tǒng)一的傳輸接口會導致數(shù)據(jù)傳輸效率低下。
在將電力業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換為CIM形式的電力業(yè)務(wù)數(shù)據(jù)后,如圖3所示,圖1中的數(shù)據(jù)結(jié)構(gòu)格式的規(guī)整方法還包括:
S140:將CIM形式的電力業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換為對象-關(guān)系映射形式的電力業(yè)務(wù)數(shù)據(jù);
S150:確定與電力業(yè)務(wù)數(shù)據(jù)的對象-關(guān)系映射形式對應(yīng)的數(shù)據(jù)接口,根據(jù)所述數(shù)據(jù)接口傳遞所述電力業(yè)務(wù)數(shù)據(jù)。
具體地,需要將CIM形式的電力業(yè)務(wù)數(shù)據(jù)封裝為統(tǒng)一的JavaBean結(jié)構(gòu)格式,然后為該電力業(yè)務(wù)數(shù)據(jù)提供統(tǒng)一的接口,實現(xiàn)對象到關(guān)系數(shù)據(jù)庫數(shù)據(jù)的映射,以供數(shù)據(jù)清洗使用。
本發(fā)明實施例提供的多源電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式的規(guī)整方法,通過使用數(shù)據(jù)管理規(guī)范對多個數(shù)據(jù)源中的電力業(yè)務(wù)數(shù)據(jù)進行接入管理,然后通過格式數(shù)據(jù)轉(zhuǎn)換模型抽取電力業(yè)務(wù)數(shù)據(jù),使用與電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式對應(yīng)的模型處理規(guī)范,將電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式轉(zhuǎn)換為匹配主站系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)格式,然后將電力業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換為通用信息模型CIM形式的電力業(yè)務(wù)數(shù)據(jù),能夠建立電力業(yè)務(wù)數(shù)據(jù)的統(tǒng)一的數(shù)據(jù)結(jié)構(gòu)格式,從而方便電力業(yè)務(wù)數(shù)據(jù)在子站系統(tǒng)和主站系統(tǒng)之間的傳輸,并方便對電力業(yè)務(wù)數(shù)據(jù)進行清洗,提高數(shù)據(jù)清洗效率。
基于同一發(fā)明構(gòu)思,本申請實施例還提供了多源電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式的規(guī)整系統(tǒng),由于所述系統(tǒng)對應(yīng)的方法是本申請實施例中的多源電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)的規(guī)整方法,并且該系統(tǒng)解決問題的原理與方法相似,因此該系統(tǒng)的實施可以參見方法的實施,重復之處不再贅述。
請參見圖4,本發(fā)明實施例還提供了一種多源電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式的規(guī)整系統(tǒng),該數(shù)據(jù)結(jié)構(gòu)格式的規(guī)整系統(tǒng)用于主站系統(tǒng),所述規(guī)整系統(tǒng)包括:
數(shù)據(jù)接入管理模塊401,用于使用數(shù)據(jù)管理規(guī)范對多個數(shù)據(jù)源的電力業(yè)務(wù)數(shù)據(jù)進行接入管理,其中,所述數(shù)據(jù)管理規(guī)范與所述電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)源類型相對應(yīng);
其中,數(shù)據(jù)源類型包括:數(shù)據(jù)庫類型、文件類型和規(guī)約數(shù)據(jù)流類型;所述數(shù)據(jù)管理規(guī)范包括:與所述數(shù)據(jù)庫類型對應(yīng)的數(shù)據(jù)庫處理規(guī)范、與所述文件類型對應(yīng)的FTP或文件系統(tǒng)處理規(guī)范、與所述文件類型對應(yīng)的網(wǎng)絡(luò)服務(wù)web-services處理規(guī)范以及與所述規(guī)約數(shù)據(jù)流對應(yīng)的協(xié)議處理規(guī)范。
其中,所述數(shù)據(jù)接入管理模塊401,具體用于使用與所述數(shù)據(jù)源類型對應(yīng)的數(shù)據(jù)管理規(guī)范分別對所述電力業(yè)務(wù)數(shù)據(jù)的接入頻率、存儲位置和接入時段進行管理。
數(shù)據(jù)統(tǒng)一抽取模塊402,用于使用格式數(shù)據(jù)轉(zhuǎn)換模型抽取所述電力業(yè)務(wù)數(shù)據(jù),將所述電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式轉(zhuǎn)換為匹配所述主站系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)格式,其中,所述格式數(shù)據(jù)轉(zhuǎn)換模型與所述匹配主站系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)格式相對應(yīng);
數(shù)據(jù)統(tǒng)一解析模塊403,用于使用與所述電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式對應(yīng)的模型處理規(guī)范,將所述電力業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換為通用信息模型CIM形式的電力業(yè)務(wù)數(shù)據(jù)。
如圖5所示,圖4所示的數(shù)據(jù)統(tǒng)一解析模塊403,包括:
第一數(shù)據(jù)轉(zhuǎn)換子模塊4031,用于使用模型處理規(guī)范將對應(yīng)數(shù)據(jù)結(jié)構(gòu)格式的電力業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換為所述模型處理規(guī)范對應(yīng)的變量或?qū)ο笮问降碾娏I(yè)務(wù)數(shù)據(jù);
第二數(shù)據(jù)轉(zhuǎn)換子模塊4032,用于將所述變量或?qū)ο笮问降碾娏I(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換為CIM形式的電力業(yè)務(wù)數(shù)據(jù)。
本發(fā)明實施例提供的多源電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式的規(guī)整系統(tǒng),通過使用數(shù)據(jù)管理規(guī)范對多個數(shù)據(jù)源中的電力業(yè)務(wù)數(shù)據(jù)進行接入管理,然后通過格式數(shù)據(jù)轉(zhuǎn)換模型抽取電力業(yè)務(wù)數(shù)據(jù),使用與電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式對應(yīng)的模型處理規(guī)范,將電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式轉(zhuǎn)換為匹配主站系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)格式,然后將電力業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換為通用信息模型CIM形式的電力業(yè)務(wù)數(shù)據(jù),能夠建立電力業(yè)務(wù)數(shù)據(jù)的統(tǒng)一的數(shù)據(jù)結(jié)構(gòu)格式,從而方便電力業(yè)務(wù)數(shù)據(jù)在子站系統(tǒng)和主站系統(tǒng)之間的傳輸,并方便對電力業(yè)務(wù)數(shù)據(jù)進行清洗,提高數(shù)據(jù)清洗效率。
請參見圖6,圖4所示的數(shù)據(jù)結(jié)構(gòu)格式的規(guī)整系統(tǒng)還包括:
數(shù)據(jù)映射模塊404,用于將所述CIM形式的電力業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)換為對象-關(guān)系映射形式的電力業(yè)務(wù)數(shù)據(jù);
數(shù)據(jù)統(tǒng)一接口模塊405,用于確定與所述電力業(yè)務(wù)數(shù)據(jù)的對象-關(guān)系映射形式對應(yīng)的數(shù)據(jù)接口,根據(jù)所述數(shù)據(jù)接口傳遞所述電力業(yè)務(wù)數(shù)據(jù)。
請參見圖7,圖7為本發(fā)明一示例性實施例提供的一種多源電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式的規(guī)整系統(tǒng)的架構(gòu)圖。如圖7所示,該多源電力業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)格式的規(guī)整系統(tǒng),包括:數(shù)據(jù)源管理模塊71、數(shù)據(jù)統(tǒng)一抽取模塊72、數(shù)據(jù)統(tǒng)一解析模塊73以及數(shù)據(jù)統(tǒng)一接口模塊74四部分組成。
其中,數(shù)據(jù)源管理模塊71由數(shù)據(jù)庫處理模塊711、網(wǎng)絡(luò)服務(wù)web-services處理模塊712、文件系統(tǒng)處理模塊713、協(xié)議處理模塊714組成;數(shù)據(jù)統(tǒng)一抽取模塊72由通用信息/資源描述CIM/RDF模型721、可擴展標記語言XML模型722、特定格式數(shù)據(jù)模型723組成;數(shù)據(jù)統(tǒng)一解析模塊73由工具包Jena處理模塊731、文檔對象DOM處理模塊732、推模型SAX處理模塊715、特定格式處理模塊734組成;數(shù)據(jù)統(tǒng)一接口模塊74由集成模塊741和數(shù)據(jù)接口742組成。
首先,使用數(shù)據(jù)源管理模塊71對需要接入的數(shù)據(jù)進行數(shù)據(jù)源配置管理,可以通過數(shù)據(jù)庫處理模塊711、網(wǎng)絡(luò)服務(wù)web-services處理模塊712、文件系統(tǒng)處理模塊713和協(xié)議處理模塊714分別完成對數(shù)據(jù)庫類數(shù)據(jù)源、網(wǎng)絡(luò)服務(wù)協(xié)議web-services和面向行為aop類數(shù)據(jù)源;文件系統(tǒng)類數(shù)據(jù)源、iec 61850和iec61870等類數(shù)據(jù)源的接入管理。
然后,由數(shù)據(jù)源管理模塊71管理的數(shù)據(jù)源直接交由數(shù)據(jù)統(tǒng)一抽取模塊72進行抽取,數(shù)據(jù)統(tǒng)一抽取模塊72通過通用信息/資源描述CIM/RDF模型721、可擴展標記語言XML模型722和特定格式數(shù)據(jù)模型723這三種模型抽取各數(shù)據(jù)源中的數(shù)據(jù)。
再次,數(shù)據(jù)統(tǒng)一抽取模塊72抽取到各模型數(shù)據(jù)后交由數(shù)據(jù)統(tǒng)一解析模塊73進行處理,分別通過Jena處理模塊731、文檔對象DOM處理模塊732、推模型SAX處理模塊733和特定格式處理模塊734這四個模塊對上述數(shù)據(jù)統(tǒng)一抽取模塊抽取的不同模型的電力業(yè)務(wù)數(shù)據(jù)進行解析,并將其封裝為統(tǒng)一的JavaBean結(jié)構(gòu)格式,通過JavaBean完成格式轉(zhuǎn)換后交由最終數(shù)據(jù)統(tǒng)一接口模塊74處理,由數(shù)據(jù)接口742其提供統(tǒng)一接口。
在本發(fā)明中,數(shù)據(jù)獲取主要是根據(jù)各自不同的數(shù)據(jù)來源制定相應(yīng)的數(shù)據(jù)獲取策略,總結(jié)現(xiàn)有電網(wǎng)中的數(shù)據(jù)獲取方式,數(shù)據(jù)源類型可劃分為數(shù)據(jù)庫、文件、規(guī)約數(shù)據(jù)流三種方式,各自不同的方式所需要的獲取方式是不同的,區(qū)別對待;數(shù)據(jù)解析是對獲取到的源數(shù)據(jù)進行語法解析,轉(zhuǎn)換為內(nèi)存中的變量或者對象數(shù)據(jù)。根據(jù)源數(shù)據(jù)格式的不同,將其分為三種:通用信息/資源描述CIM/RDF格式、普通的可擴展標記語言XML格式、特定格式的文本文件;格式轉(zhuǎn)換是通過解析源數(shù)據(jù)在內(nèi)存中構(gòu)建的對象數(shù)據(jù)轉(zhuǎn)換為標準的通用信息CIM模型的過程。格式的轉(zhuǎn)換和數(shù)據(jù)的解析構(gòu)建在一個程序模塊中,直接將內(nèi)存中的對象按照CIM模型進行定義;對象-關(guān)系映射以中間件(CIM模型)的形式存在,實現(xiàn)對象到關(guān)系數(shù)據(jù)庫數(shù)據(jù)的映射。
本說明書中的各個實施例均采用遞進的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其它實施例的不同之處。
以上所述的本發(fā)明實施方式,并不構(gòu)成對本發(fā)明保護范圍的限定。任何在本發(fā)明的精神和原則之內(nèi)所作的修改、等同替換和改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。