一種流程對象原始數據時序發(fā)現與調整方法
【專利摘要】本發(fā)明公開了一種流程對象原始數據時序發(fā)現與調整方法,包括:數據取樣步驟,對流程對象各環(huán)節(jié)測點在時間T內采集到的原始數據集進行抽樣,抽取單位時間段內變化量最大的數據片段作為樣本數據;時序發(fā)現步驟,以任意環(huán)節(jié)測點為基測點,計算其與其他環(huán)節(jié)測點間的時間距,從而獲得包含所有環(huán)節(jié)測點時間順序的時間序列L;時序調整步驟,根據時間序列L對各環(huán)節(jié)測點原始數據進行時序調整。本發(fā)明對原始數據進行抽樣、發(fā)現時序并調整時序,具有簡單、精確、人為干預少的優(yōu)點,以解決現有流程工業(yè)中原始數據錯漏較多,無法體現各個環(huán)節(jié)間的相互影響關系的問題。
【專利說明】一種流程對象原始數據時序發(fā)現與調整方法
【技術領域】
[0001] 本發(fā)明涉及流程工業(yè)生產領域,尤其涉及流程工業(yè)中的一種流程對象原始數據時 序發(fā)現與調整方法。
【背景技術】
[0002] 在流程工業(yè)生產中,生產過程根據工業(yè)要求由一個個環(huán)節(jié)構成的,各個環(huán)節(jié)具有 傳遞性,每個環(huán)節(jié)通常需要加裝許多檢測裝置,通過數據接口,將檢測數據傳入數據存儲 計算機中,數據量巨大,利用這些數據進行優(yōu)化工業(yè)控制流程、輔助控制決策的需求不斷增 力口;而且流程工業(yè)的數據采集是基于一定頻率的,各個環(huán)節(jié)采集到的數據是相互聯系的,并 且是相互制約的,流程工業(yè)中的各個環(huán)節(jié)具有時序特征,但是由于狀態(tài)傳播的延遲,使采集 到的數據不具有時序性,相同時刻的各環(huán)節(jié)數據不是該時刻對其他環(huán)節(jié)產生響應的數據, 表現出了不同步的特性,直接用該數據進行后續(xù)運算不會反映出流程數據的時序性;時序 運算,即找出流程對象各測點之間的時序,并求出時序流程不同測點之間的延遲時間,一直 是研究熱題;然而由于在流程工業(yè)生產過程中,常常因其煅燒過程和物料的復雜性,還存在 著一些復雜而且目前還不可檢測的環(huán)境因素,工作環(huán)境的限制與信息采集技術的不完善, 導致獲得的原始數據間時序特征不明顯且存在大量的噪聲與錯漏數據,導致從原始數據中 獲取知識非常困難,因此迫切需要對原始數據進行規(guī)范化處理。
[0003] 流程對象通常具有以下特性:1、多環(huán)節(jié)性,一個流程對象,通常由諸多環(huán)節(jié)構成, 每個環(huán)節(jié)根據工藝要求前后相連,前一環(huán)節(jié)的輸出是它下一環(huán)節(jié)的輸入;2、單向向前相關 性,我們可以將一個流程看作一個開環(huán)系統(通常在工業(yè)過程中,局部的閉環(huán)控制可以視 為一個環(huán)節(jié)),對于一個開環(huán)系統,每個環(huán)節(jié)的輸出是他后一個環(huán)節(jié)的輸入,其單項相關性 是顯而易見的;3、時序性,由于流程對象中,各環(huán)節(jié)在得到前一環(huán)節(jié)的輸出時,本環(huán)節(jié)的變 化需要一定的時間,前一環(huán)節(jié)的狀態(tài)變化將經過一段時間后才能導致下一狀態(tài)的變化。那 么,流程對象各環(huán)節(jié)的狀態(tài)參數實際上是一個時間序列。
[0004] 現有的數據處理技術大多采用隨機抽樣和人工干預的方式對原始數據進行預處 理,受人為因素影響較多,且無法對數據間的時間序列進行調整,所以難以真正體現流程對 象間的影響關系。因此需要一種面向流程對象的原始數據的時序發(fā)現與調整方法,提升知 識發(fā)現能力。
【發(fā)明內容】
[0005] 為了克服現有技術中存在的不足,本發(fā)明提供一種流程對象原始數據時序發(fā)現與 調整方法,對原始數據進行抽樣、發(fā)現時序并調整時序,具有簡單、精確、人為干預少的優(yōu) 點,以解決現有流程工業(yè)中原始數據錯漏較多,無法體現各個環(huán)節(jié)間的相互影響關系的問 題。
[0006] 為實現上述目的,本發(fā)明對流程對象進行了定義:流程對象是多個環(huán)節(jié)、具有向前 相關性的時間序列集合,這個時間序列集合中的數據來自各個環(huán)節(jié)的可采樣測點,在流程 對象X中,某一測點Xi的變化導致另一測點\產生響應的時間差值為測點Xi對測點Xj的 延遲時間為時間距,記為Atij, Atij = Uxp-UXi)。本發(fā)明根據流程對像的特點提出了利 用測點中數據的分布規(guī)律進行統計分類的方法實現數據抽樣與時序發(fā)現的方案,并根據時 序計算結果調整數據,使之符合周期規(guī)律,便于智能處理。
[0007] 具體的,本發(fā)明采取如下技術方案:
[0008] -種流程對象原始數據時序發(fā)現與調整方法,包括如下步驟:
[0009] 數據取樣步驟,對流程對象各環(huán)節(jié)測點在時間T內采集到的原始數據集進行抽 樣,抽取單位時間段內變化量最大的數據片段作為樣本數據;
[0010] 時序發(fā)現步驟,以任意環(huán)節(jié)測點為基測點,計算其與其他環(huán)節(jié)測點間的時間距,從 而獲得包含所有環(huán)節(jié)測點時間順序的時間序列L ;
[0011] 時序調整步驟,根據時間序列L對各環(huán)節(jié)測點原始數據進行時序調整。
[0012] 更進一步的,由于原始數據記錄數巨大,逐條記錄遍歷來統計連續(xù)記錄數效率低 下,耗費系統時間長,不符合大數據處理的要求,本發(fā)明采用了逐步縮小時間范圍的算法來 快速求得記錄的最長連續(xù)時間段。另外,本發(fā)明選擇流程對象中變化量最大的數據片段作 為數據樣本。數據的差分代表了數據的狀態(tài)變化,而差分大小代表了數據變化的幅度,變化 即是信息,變化幅度越大包含的信息越多,數據變化量即是環(huán)節(jié)數據差分絕對值的和,因此 選擇數據變化量最大的數據片段也即選擇了包含信息量最大的數據片段。
[0013] 因此,本發(fā)明數據取樣步驟采用基于差分的數據取樣方法進行抽樣,將時間T劃 分為若干時間段,計算每個時間段內各個環(huán)節(jié)測點數據變化量,抽取各個環(huán)節(jié)測點數據變 化量之和最大的時間段內采集的數據片段作為樣本數據。
[0014] 優(yōu)選的,所述基于差分的數據取樣方法包括如下步驟:
[0015] 設流程對象X共含有η個環(huán)節(jié),X = (XpX2. .. X1J,其任意環(huán)節(jié)Xi在tj時刻的測量 數據為Xi (tj);若將時間T= Itpt2, 均分成w片段,每段長度為h,貝UwXh = m,設 其中任意時間段7V = {%·f4 -1·…·f1彡y彡W,所有環(huán)節(jié)測點在Ty上的數據變化 量為AxyJ
【權利要求】
1. 一種流程對象原始數據時序發(fā)現與調整方法,其特征在于包括如下步驟: 數據取樣步驟,對流程對象各環(huán)節(jié)測點在時間T內采集到的原始數據集進行抽樣,抽 取單位時間段內變化量最大的數據片段作為樣本數據; 時序發(fā)現步驟,以任意環(huán)節(jié)測點為基測點,計算其與其他環(huán)節(jié)測點間的時間距,從而獲 得包含所有環(huán)節(jié)測點時間順序的時間序列L ; 時序調整步驟,根據時間序列L對各環(huán)節(jié)測點原始數據進行時序調整。
2. 根據權利要求1所述的一種流程對象原始數據時序發(fā)現與調整方法,其特征在于: 所述數據取樣步驟采用基于差分的數據取樣方法進行抽樣,將時間T劃分為若干時間段, 計算每個時間段內各個環(huán)節(jié)測點數據變化量,抽取各個環(huán)節(jié)測點數據變化量之和最大的時 間段內采集的數據片段作為樣本數據。
3. 根據權利要求2所述的一種流程對象原始數據時序發(fā)現與調整方法,其特征在于: 所述基于差分的數據取樣方法包括: 設流程對象x共含有n個環(huán)節(jié),x = {Xp X2. . . Xn},其任意環(huán)節(jié)Xi在tj時刻的測量數據 為xjtj);若將時間T = It" t2,…,tm}均分成w片段,每段長度為h,貝iJwXh = m,
因此在時間 T = {tp t2,…,tm}內,3[T,心-使得 A xM = max { A xy,1彡y彡w}成立,則A xM為流程對象x在時間T內數據變化量最大的時 間段,選擇原始數據集中TM時間段內的數據片段作為樣本數據。
4. 根據權利要求1所述的一種流程對象原始數據時序發(fā)現與調整方法,其特征在于: 所述時序發(fā)現步驟根據數據的差分選取所有環(huán)節(jié)測點的極值點數據,通過極值點數據計算 各環(huán)節(jié)測點之間的延遲時間,并將所述延遲時間作為各環(huán)節(jié)測點之間的時間距,進而求出 時間序列L。
5. 根據權利要求1或4所述的一種流程對象原始數據時序發(fā)現與調整方法,其特征 在于:設任意環(huán)節(jié)測點Xi e x,+[ ^,且^ 使得?(〇?(&)或Xi(t。) < Xi (tj),tj G [tp t。)U (t。,tm],則 Xi (t。)為 Xi 在時間段[tp tp]內的極值點數據; 其中x表示流程對象,流程對象x共含有n個環(huán)節(jié),x =氏,X2. . . Xn},i G [1,2…n] 其任意環(huán)節(jié)\在\時刻的測量數據為Xi (tp ;TM表示包含變化量最大數據片段的單位時間 段。
6. 根據權利要求5所述的一種流程對象原始數據時序發(fā)現與調整方法,其特征在于: 所述時間序列L的確定包含如下步驟: (1) 以任意環(huán)節(jié)測點\為基測點,其在位置s與測點&在不同位置的時間差值的最小 值為測點Xi在位置s與測點X」在位置r的時間差值A (sr),其中s = 1,2, . . .,q,q表 示各環(huán)節(jié)測點的極值點數目,j G [1,2…n],則: Atj^sr) = {t' s(Xj)-t' r(Xj) |min{ 11' s(X』)_t' r (Xj |,r = 1,2, ? ? ?,q}}; (2) 測點\與測點&之間的時間距A ^為A ^.(sr)相同的數目最多的值,其中 A tjj = { A tjj (sr) | max {count ( A tjj (sr))}}, 由此得到測點Xi與流程對象所有測點之間的時間距; ⑶以測點M立置為基準,保持Xi不動,若AtijX),將測點Xj置于Xi的前I Atu|個 采樣時間間隔位置;若Atu < 0,將測點\置于\的后| Atu|個采樣時間間隔位置;若 A ^ = 0, X」的位置和\處于同等位置,從而得到包含所有環(huán)節(jié)測點時間順序的時間序列 L〇
7. 根據權利要求1所述的一種流程對象原始數據時序發(fā)現與調整方法,其特征在于: 所述時序調整步驟中,根據時序發(fā)現步驟得到的所有環(huán)節(jié)測點間的時間序列L,以任意環(huán)節(jié) 測點的原始數據為基準,保持基準測點的原始數據不動,然后根據其他環(huán)節(jié)測點與基準測 點的時間距進行時序調整。
8. 根據權利要求7所述的一種流程對象原始數據時序發(fā)現與調整方法,其特征在于: 所述時序調整步驟中,根據時序發(fā)現步驟得到的所有環(huán)節(jié)測點間的時間序列L,以任意環(huán)節(jié) 測點\的原始數據為基準,保持\的原始數據不動,然后令測點&在t時刻的原始數據為 Xj (t) = Xj (t- A t ' ij), 其中At' u為時間序列L中X',對)('」的時間距,X' i、X'」分別表示時間序列 L中按時間順序排列后的測點Xi、Xj位置,At' i」= t(X'J若At' ">0,將 測點M勺原始數據向后移動| At' d個采樣時間間隔;若At' u<0,將測點&的原始 數據向前移動I At' J個采樣時間間隔;若At' u = 0,測點&的原始數據不變。
【文檔編號】G06F9/44GK104346169SQ201410542448
【公開日】2015年2月11日 申請日期:2014年10月14日 優(yōu)先權日:2014年10月14日
【發(fā)明者】郭慶北, 朱連江, 曲守寧, 杜韜, 張坤, 程新功, 王欽, 張勇, 王凱 申請人:濟南大學