基于云計算和大數(shù)據(jù)的軌道狀態(tài)靜態(tài)檢控系統(tǒng)及方法
【技術(shù)領域】
[0001]本發(fā)明涉及云計算和大數(shù)據(jù)信息系統(tǒng),具體是一種基于云計算和大數(shù)據(jù)的軌道狀態(tài)靜態(tài)檢控系統(tǒng)及方法。
【背景技術(shù)】
[0002]為了保證鐵路線路正常運營,軌道狀態(tài)靜態(tài)檢測、調(diào)控是一項必不可少的工作。傳統(tǒng)的單機式軌道靜態(tài)檢測設備檢測到的數(shù)據(jù)只能暫時存儲在檢測設備中,待到完成整個靜態(tài)檢測過程,這些數(shù)據(jù)才能上傳至服務器進行數(shù)據(jù)的處理,無法在檢測現(xiàn)場傳遞實時檢測數(shù)據(jù);無法保證數(shù)據(jù)的實時傳輸,檢測人員是否篡改、偽造、盜用檢測數(shù)據(jù),檢測活動是否真正進行都無從知曉。隨著鐵路靜態(tài)檢測、修補、調(diào)控日益頻繁,靜態(tài)檢測、調(diào)控數(shù)據(jù)日益龐大,傳統(tǒng)的軌道狀態(tài)靜態(tài)檢控系統(tǒng)根本無法集中統(tǒng)一科學地存儲、管理、分析長時間大范圍海量靜態(tài)檢測數(shù)據(jù),無法進行各種具體的數(shù)據(jù)挖掘處理,也不具備良好的冗錯能力,且需要專人進行維護管理存儲設備,不支持多用戶并行訪問,整個靜態(tài)檢控系統(tǒng)容易崩潰、癱瘓。這些不利因素使得鐵路軌道檢測、修補、調(diào)控工作停滯不前,失去了原有的意義。
【發(fā)明內(nèi)容】
[0003]本發(fā)明所解決的技術(shù)問題是,針對現(xiàn)有技術(shù)中存在的上述不足,提供了一種基于云計算和大數(shù)據(jù)的軌道狀態(tài)靜態(tài)檢控系統(tǒng)及方法,能實時傳輸現(xiàn)場檢測數(shù)據(jù),數(shù)據(jù)處理速度快,存儲容量大;經(jīng)過數(shù)據(jù)信息對比分析,制定相應的維修計劃,保證軌道正常狀態(tài)和線路相對平順性。
[0004]本發(fā)明是通過以下技術(shù)方案實現(xiàn)的:
[0005]—種基于云計算和大數(shù)據(jù)的軌道狀態(tài)靜態(tài)檢控系統(tǒng),包括軌道狀態(tài)靜態(tài)檢測設備、數(shù)據(jù)信息管理中心以及顯示系統(tǒng);軌道狀態(tài)靜態(tài)檢測設備與數(shù)據(jù)信息管理中心通過網(wǎng)絡相連;數(shù)據(jù)信息管理中心與顯示系統(tǒng)通過網(wǎng)絡相連;
[0006]軌道狀態(tài)靜態(tài)檢測設備,用于現(xiàn)場檢測靜態(tài)狀態(tài)下的軌道幾何參數(shù),并將得到的檢測數(shù)據(jù)通過網(wǎng)絡傳輸給數(shù)據(jù)信息管理中心;所述軌道幾何參數(shù)包括軌距、水平(超高)、高低、軌向和二角坑;還包括軌向偏差、正矢、正矢偏差、軌距變化率、檢測里程、基本弦軌向、基本弦高低、高低偏差、特征點、特征值、數(shù)據(jù)檢測時間、溫度、經(jīng)瑋度、工務段、推行速度、線路里程等;
[0007]數(shù)據(jù)信息管理中心,用于接收軌道狀態(tài)靜態(tài)檢測設備發(fā)送的檢測數(shù)據(jù),并基于大數(shù)據(jù)存儲和處理技術(shù)實現(xiàn)檢測數(shù)據(jù)和臺賬數(shù)據(jù)的存儲、處理和分析,得到不同級別的維修計劃以及軌道幾何參數(shù)的變化趨勢;
[0008]顯示系統(tǒng),用于從數(shù)據(jù)信息管理中心接收現(xiàn)場軌道狀態(tài)靜態(tài)檢測設備發(fā)來的檢測數(shù)據(jù)、維修計劃以及軌道幾何參數(shù)的變化趨勢,并在顯示終端上予以顯示;
[0009]所述數(shù)據(jù)信息管理中心包括原始數(shù)據(jù)單元、數(shù)據(jù)處理單元、數(shù)據(jù)存儲單元和系統(tǒng)管理單元;
[0010]所述原始數(shù)據(jù)單元接收軌道狀態(tài)靜態(tài)檢測設備發(fā)送的檢測數(shù)據(jù),存儲臺帳數(shù)據(jù)、實時檢測數(shù)據(jù)和歷史檢測數(shù)據(jù);臺帳數(shù)據(jù)是鐵路線路建設之初,為了保證線路平順性所設計的標準數(shù)據(jù);歷史檢測數(shù)據(jù)是同一線路以前的靜態(tài)檢測數(shù)據(jù);
[0011 ]所述數(shù)據(jù)處理單元按以下步驟進行數(shù)據(jù)處理:
[0012]I)在分布式文件系統(tǒng)HDFS和分布式編程模型MapReduce的基礎之上采用數(shù)據(jù)清洗、數(shù)據(jù)集成的數(shù)據(jù)預處理技術(shù)初步抽取出完整的檢測數(shù)據(jù),舍棄殘缺的檢測數(shù)據(jù);其中完整的數(shù)據(jù)是指軌道狀態(tài)靜態(tài)檢測設備預先設定的所有檢測項目都有檢測結(jié)果的數(shù)據(jù),殘缺的數(shù)據(jù)是指軌道狀態(tài)靜態(tài)檢測設備預先設定的某些檢測項目沒有檢測結(jié)果的數(shù)據(jù);
[0013]2)利用Avro技術(shù)將數(shù)據(jù)進行序列化處理,得到固定格式的序列化數(shù)據(jù)和ETL并行技術(shù)加載各項序列化數(shù)據(jù);
[0014]3)采用Kmeans技術(shù)進行聚類分析,具體步驟如下:首先選定完整的靜態(tài)檢測數(shù)據(jù),然后利用Kmeans技術(shù)將檢測得到的軌道幾何參數(shù)的具體數(shù)值劃定出特定的集合;最后得到依據(jù)各軌道狀態(tài)參數(shù)相似程度不同而進行聚合的數(shù)據(jù);聚類是指根據(jù)“物以類聚”原理,將本身沒有類別的樣本聚集成不同的組,這樣的一組數(shù)據(jù)對象的集合叫做簇,并且對每一個這樣的簇進行描述的過程。它的目的是使得屬于同一個簇的樣本之間應該彼此相似,而不同簇的樣本應該足夠不相似。與分類規(guī)則不同,進行聚類前并不知道將要劃分成幾個組和什么樣的組,也不知道根據(jù)哪些空間區(qū)分規(guī)則來定義組。其目的旨在發(fā)現(xiàn)空間實體的屬性間的函數(shù)關系,挖掘的知識用以屬性名為變量的數(shù)學方程來表示。
[0015]4)采用Mahout技術(shù)進行分類分析,具體步驟如下:首先根據(jù)軌道靜態(tài)幾何尺寸容許偏差管理值,構(gòu)造出分類器,得到各個類的靜態(tài)數(shù)據(jù)范圍值;然后將聚類分析得到的數(shù)據(jù)作為分類器的輸入,最后從分類器得到分類結(jié)果;分類是事先定義好類別,類別數(shù)不變。分類器需要由人工標注的分類訓練語料訓練得到,屬于有指導學習范疇。在此基礎之上,結(jié)合臺帳數(shù)據(jù)以及軌道靜幾何尺寸容許偏差管理值,得到超限參數(shù)和超限等級,以制定各種不同級別的維修計劃,包括作業(yè)驗收、經(jīng)常保養(yǎng)和臨時補修;
[0016]所述數(shù)據(jù)存儲單元采用Hadoop框架常用的Hive數(shù)據(jù)倉庫和Hbase非關系型數(shù)據(jù)庫來存儲所述數(shù)據(jù)處理單元的處理結(jié)果,同時采用數(shù)據(jù)庫轉(zhuǎn)移工具Sqoop、集群監(jiān)控工具Ambar1、集群協(xié)同服務Zookeper來保證數(shù)據(jù)處理單元的處理結(jié)果能夠快速準確存入所述數(shù)據(jù)存儲單元;
[0017]所述系統(tǒng)管理單元采用Flume系統(tǒng),用于記錄所述數(shù)據(jù)信息管理中心所發(fā)生的事件,包括系統(tǒng)訪問、功能修改、系統(tǒng)設置。
[0018]進一步地,所述數(shù)據(jù)處理單元還包括以下數(shù)據(jù)處理步驟:
[0019]5)采用Spss技術(shù)進行回歸分析,具體步驟如下:將各軌道幾何參數(shù)(包括軌距、水平、高低、軌向和三角坑)作為Spss的輸入,選擇各軌道幾何參數(shù)之間線性和非線性關系,然后輸出得到任意兩個軌道幾何參數(shù)之間的依賴關系,據(jù)此判斷各個軌道幾何參數(shù)之間的相互影響大小;在此基礎之上,結(jié)合步驟4)制定的各種不同類型的維修計劃,充分利用Spss回歸分析的結(jié)果,在進行維修時,考慮其中某個軌道幾何參數(shù)對其他幾何參數(shù)的影響,必須要避免修改某個軌道幾何參數(shù)而使得其他參數(shù)的情況變得更壞。
[0020]進一步地,所述數(shù)據(jù)信息管理中心還包括結(jié)果分析單元;
[0021]所述結(jié)果分析單元對數(shù)據(jù)處理單元的處理結(jié)果利用模式識別技術(shù)進行進一步的分析,具體地,設已經(jīng)進行了 m次檢測活動,每次檢測活動均進行η次測量,第i次測量結(jié)果記為g(i) (I < i < η),第k次檢測活動經(jīng)過前述數(shù)據(jù)處理單元得到的結(jié)果記為h(k) (I <k<m),該結(jié)果包括聚類分析、分類分析和回歸分析的所有結(jié)果;將h(k)(l<k Sm)進行預處理,得到h(j)(l Sk Sm)提取和選擇同一線路的各軌道幾何參數(shù)【包括軌距、水平、高低、軌向、三角坑和正矢】的特征向量,根據(jù)上述特征向量設計分類器為f(h(j))(l Sm),最后輸入第m+1次檢測活動經(jīng)過數(shù)據(jù)處理單元得到的結(jié)果h(m+l),由f(h(m+l))得到該線路軌道幾何參數(shù)的變化趨勢。
[0022]進一步地,所述軌道狀態(tài)靜態(tài)檢測設備包括軌檢儀和軌檢小車。
[0023]進一步地,所述軌道狀態(tài)靜態(tài)檢測設備依次通過移動基站、移動網(wǎng)絡管理中心和互聯(lián)網(wǎng)或直接通過互聯(lián)網(wǎng)與數(shù)據(jù)信息管理中心相連。
[0024]進一步地,所述顯示終端包括電腦、平板和手機。
[0025]一種基于云計算和大數(shù)據(jù)的軌道狀態(tài)靜態(tài)檢控信息方法,采用上述的基于云計算和大數(shù)據(jù)的軌道狀態(tài)靜態(tài)檢控系統(tǒng);
[0026]軌道狀態(tài)靜態(tài)檢測設備實時檢測靜態(tài)狀態(tài)下的軌道狀態(tài)參數(shù),并將得到的檢測數(shù)據(jù)通過網(wǎng)絡傳輸給數(shù)據(jù)信息管理中心;
[0027]數(shù)據(jù)信息管理中心接收軌道狀態(tài)靜態(tài)檢測設備發(fā)送的檢測數(shù)據(jù),并基于大數(shù)據(jù)存儲和處理技術(shù)實現(xiàn)檢測數(shù)據(jù)和臺賬數(shù)據(jù)的存儲、處理和分析,得到不同級別的維修計劃以及軌道幾何參數(shù)的變化趨勢;
[0028]顯示系統(tǒng)從數(shù)據(jù)信息管理中心接收檢測數(shù)據(jù)和維修計劃,并在顯示終端上予以顯示;
[0029]所述數(shù)據(jù)信息管理中心包括原始數(shù)據(jù)單元、數(shù)據(jù)處理單元、數(shù)據(jù)存儲單元和系統(tǒng)管理單元;
[0030]所述原始數(shù)據(jù)單元接收軌道狀態(tài)靜態(tài)檢測設備發(fā)送的檢測數(shù)據(jù),存儲臺帳數(shù)據(jù)、實時檢測數(shù)據(jù)和歷史檢測數(shù)據(jù);歷史檢測數(shù)據(jù)是同一線路以前的靜態(tài)檢測數(shù)據(jù),用于所述數(shù)據(jù)處理單元對同一檢測線路數(shù)據(jù)處理,實時檢測數(shù)據(jù)是某一次的檢測數(shù)據(jù);
[0031 ]所述數(shù)據(jù)處理單元按以下步驟進行數(shù)據(jù)處理:
[0032]I)在分布式文件系統(tǒng)HDFS和分布式編程模型MapReduce的基礎之上采用數(shù)據(jù)清洗、數(shù)據(jù)集成的數(shù)據(jù)預處理技術(shù)初步抽取出完整的檢測數(shù)據(jù),舍棄殘缺的檢測數(shù)據(jù);其中完整的數(shù)據(jù)是指軌道狀態(tài)靜態(tài)檢測設備預先設定的所有檢測項目都有檢測結(jié)果的數(shù)據(jù),殘缺的數(shù)據(jù)是指軌道狀態(tài)靜態(tài)檢測設備預先設定的某些檢測項目沒有檢測結(jié)果的數(shù)據(jù);
[0033]2)利用Avro技術(shù)將數(shù)據(jù)進行序列化處理,得到固定格式的序列化數(shù)據(jù)和ETL并行技術(shù)加載各項序列化數(shù)據(jù);
[0034]3)采用Kmeans技術(shù)進行聚