欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種支持可視化和流程化的大數(shù)據(jù)ETL調(diào)度系統(tǒng)的制作方法

文檔序號:11230639閱讀:1745來源:國知局
一種支持可視化和流程化的大數(shù)據(jù)ETL調(diào)度系統(tǒng)的制造方法與工藝

本發(fā)明涉及大數(shù)據(jù)處理技術(shù)領(lǐng)域,特別涉及一種支持可視化和流程化的大數(shù)據(jù)etl調(diào)度系統(tǒng)。



背景技術(shù):

etl(extract-transform-load,提取、轉(zhuǎn)換和加載)是bi(大數(shù)據(jù))項(xiàng)目最重要的一個(gè)環(huán)節(jié),通常情況下etl會(huì)花掉整個(gè)項(xiàng)目的1/3的時(shí)間,etl設(shè)計(jì)的好壞直接關(guān)接到bi項(xiàng)目的成敗。

大數(shù)據(jù)etl也是一個(gè)長期的過程,只有不斷的發(fā)現(xiàn)問題并解決問題,才能使etl運(yùn)行效率更高,為項(xiàng)目后期開發(fā)提供準(zhǔn)確的數(shù)據(jù)。大數(shù)據(jù)etl負(fù)責(zé)將分散的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)如關(guān)系數(shù)據(jù)、平面數(shù)據(jù)文件等抽取到大數(shù)據(jù)平臺系統(tǒng)后,進(jìn)行清洗、轉(zhuǎn)換、集成,最后加載到大數(shù)據(jù)平臺、數(shù)據(jù)倉庫或數(shù)據(jù)集市中,成為聯(lián)機(jī)分析處理、數(shù)據(jù)挖掘提供決策支持的數(shù)據(jù)。這個(gè)過程通常都需要在后臺進(jìn)行相關(guān)操作,且后臺操作復(fù)雜,降低了etl的開發(fā)速度和效率,同時(shí)對于集群來說可能存在著誤操作的風(fēng)險(xiǎn),大大增加企業(yè)項(xiàng)目實(shí)施成本。



技術(shù)實(shí)現(xiàn)要素:

為解決上述問題,本發(fā)明提供了一種支持可視化和流程化的大數(shù)據(jù)etl調(diào)度系統(tǒng),其能夠有效摒棄復(fù)雜的后臺操作,極大提升了etl的開發(fā)速度和效率,同時(shí)降低了企業(yè)項(xiàng)目實(shí)施的成本。

本發(fā)明采用以下技術(shù)方案:

一種支持可視化和流程化的大數(shù)據(jù)etl調(diào)度系統(tǒng),基于b/s架構(gòu)實(shí)現(xiàn),其包括大數(shù)據(jù)組件操作單元、etl作業(yè)管理模塊、etl調(diào)度管理模塊、系統(tǒng)管理模塊及作業(yè)配置數(shù)據(jù)庫,所述etl作業(yè)管理模塊、etl調(diào)度管理模塊與大數(shù)據(jù)組件操作單元彼此獨(dú)立、互不影響,其中:

所述大數(shù)據(jù)組件操作單元包括支持可視化操作的數(shù)據(jù)查詢模塊、組件腳本編輯模塊、腳本執(zhí)行監(jiān)控模塊、平臺組件驅(qū)動(dòng)模塊、大數(shù)據(jù)平臺、本地業(yè)務(wù)系統(tǒng)及遠(yuǎn)程業(yè)務(wù)系統(tǒng);

所述etl作業(yè)管理模塊用于對大數(shù)據(jù)抽取、清洗、加載的配置提供可視化操作,并生成json或xml格式作業(yè)配置文件進(jìn)行提交或保存到作業(yè)配置數(shù)據(jù)庫;

所述etl調(diào)度管理模塊用于進(jìn)行etl作業(yè)的定時(shí)調(diào)度工作以及完成對etl作業(yè)執(zhí)行過程的監(jiān)控,并生成作業(yè)監(jiān)控結(jié)果;

所述系統(tǒng)管理模塊用于針對系統(tǒng)各模塊提供用戶、角色、資源的管理以及訪問權(quán)限控制,其包括資源管理子模塊、權(quán)限管理子模塊及系統(tǒng)驅(qū)動(dòng)子模塊,所述驅(qū)動(dòng)子模塊連接所述作業(yè)配置數(shù)據(jù)庫。

優(yōu)選地,所述etl作業(yè)管理模塊包括抽取配置子模塊、清洗配置子模塊、加載配置子模塊,所述抽取配置子模塊用于實(shí)現(xiàn)大數(shù)據(jù)抽取的可視化操作,所述清洗配置子模塊用于實(shí)現(xiàn)大數(shù)據(jù)清洗的可視化操作,所述加載配置子模塊用于實(shí)現(xiàn)大數(shù)據(jù)加載的可視化操作。

優(yōu)選地,所述etl調(diào)度管理模塊包括流程配置子模塊、作業(yè)調(diào)度子模塊及調(diào)度監(jiān)控子模塊,所述流程配置子模塊用于提供etl作業(yè)流程配置的可視化操作,生成etl作業(yè)列表存儲(chǔ)到作業(yè)配置數(shù)據(jù)庫,以及從作業(yè)配置數(shù)據(jù)庫中讀取etl作業(yè)列表,所述作業(yè)調(diào)度子模塊連接流程配置子模塊,用于實(shí)現(xiàn)etl作業(yè)的定時(shí)調(diào)度工作,所述調(diào)度監(jiān)控子模塊用于對etl作業(yè)執(zhí)行過程進(jìn)行監(jiān)控,并生成作業(yè)監(jiān)控結(jié)果。

優(yōu)選地,所述作業(yè)監(jiān)控結(jié)果包括etl作業(yè)的日志、狀態(tài)、結(jié)果以及告警信息。

優(yōu)選地,所述大數(shù)據(jù)平臺的組件包括hdfs、hive、hbase、solr、yarn、oozie、spark、storm、sqoop、pig、impala、zookeeper。

采用上述技術(shù)方案后,本發(fā)明與背景技術(shù)相比,具有如下優(yōu)點(diǎn):

本發(fā)明有效摒棄復(fù)雜的后臺操作,極大提升了etl的開發(fā)速度和效率,同時(shí)降低了企業(yè)項(xiàng)目實(shí)施的成本。

附圖說明

圖1為本發(fā)明結(jié)構(gòu)示意圖;

圖2為本發(fā)明大數(shù)據(jù)組件操作單元的工作流程示意圖;

圖3為本發(fā)明etl作業(yè)管理模塊和etl調(diào)度管理模塊的工作流程示意圖;

圖4為本發(fā)明etl作業(yè)管理模塊和etl調(diào)度管理模塊的工作流程示意圖。

具體實(shí)施方式

為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。

實(shí)施例一

請參閱圖1,本發(fā)明公開了一種支持可視化和流程化的大數(shù)據(jù)etl調(diào)度系統(tǒng),基于b/s架構(gòu)實(shí)現(xiàn),其包括大數(shù)據(jù)組件操作單元、etl作業(yè)管理模塊、etl調(diào)度管理模塊、系統(tǒng)管理模塊及作業(yè)配置數(shù)據(jù)庫,所述etl作業(yè)管理模塊、etl調(diào)度管理模塊與大數(shù)據(jù)組件操作單元彼此獨(dú)立、互不影響,其中:

參考圖1所示,所述大數(shù)據(jù)組件操作單元包括支持可視化操作的數(shù)據(jù)查詢模塊、組件腳本編輯模塊、腳本執(zhí)行監(jiān)控模塊、平臺組件驅(qū)動(dòng)模塊、大數(shù)據(jù)平臺、本地業(yè)務(wù)系統(tǒng)及遠(yuǎn)程業(yè)務(wù)系統(tǒng)。大數(shù)據(jù)平臺的組件包括hdfs、hive、hbase、solr、yarn、oozie、spark、storm、sqoop、pig、impala、zookeeper。

所述etl作業(yè)管理模塊用于對大數(shù)據(jù)抽取、清洗、加載的配置提供可視化操作,并生成json或xml格式作業(yè)配置文件進(jìn)行提交或保存到作業(yè)配置數(shù)據(jù)庫。所述etl作業(yè)管理模塊包括抽取配置子模塊、清洗配置子模塊、加載配置子模塊,所述抽取配置子模塊用于實(shí)現(xiàn)大數(shù)據(jù)抽取的可視化操作,所述清洗配置子模塊用于實(shí)現(xiàn)大數(shù)據(jù)清洗的可視化操作,所述加載配置子模塊用于實(shí)現(xiàn)大數(shù)據(jù)加載的可視化操作。

所述etl調(diào)度管理模塊用于進(jìn)行etl作業(yè)的定時(shí)調(diào)度工作以及完成對etl作業(yè)執(zhí)行過程的監(jiān)控,并生成作業(yè)監(jiān)控結(jié)果。所述etl調(diào)度管理模塊包括流程配置子模塊、作業(yè)調(diào)度子模塊及調(diào)度監(jiān)控子模塊,所述流程配置子模塊用于提供etl作業(yè)流程配置的可視化操作,生成etl作業(yè)列表存儲(chǔ)到作業(yè)配置數(shù)據(jù)庫,以及從作業(yè)配置數(shù)據(jù)庫中讀取etl作業(yè)列表,所述作業(yè)調(diào)度子模塊連接流程配置子模塊,用于實(shí)現(xiàn)etl作業(yè)的定時(shí)調(diào)度工作,所述調(diào)度監(jiān)控子模塊用于對etl作業(yè)執(zhí)行過程進(jìn)行監(jiān)控,并生成作業(yè)監(jiān)控結(jié)果。所述作業(yè)監(jiān)控結(jié)果包括etl作業(yè)的日志、狀態(tài)、結(jié)果以及告警信息。

所述系統(tǒng)管理模塊用于針對系統(tǒng)各模塊提供用戶、角色、資源的管理以及訪問權(quán)限控制,其包括資源管理子模塊、權(quán)限管理子模塊及系統(tǒng)驅(qū)動(dòng)子模塊,所述驅(qū)動(dòng)子模塊連接所述作業(yè)配置數(shù)據(jù)庫。

為便于更好的理解本發(fā)明,下面結(jié)合附圖對本發(fā)明各模塊的工作流程做進(jìn)一步說明。

參考圖2所示,大數(shù)據(jù)組件操作單元的工作流程為:

用戶根據(jù)實(shí)際需要選擇數(shù)據(jù)查詢模塊、組件腳本編輯模塊、腳本執(zhí)行監(jiān)控模塊進(jìn)行可視化操作,并加載平臺組件驅(qū)動(dòng)模塊,平臺組件驅(qū)動(dòng)模塊讀取大數(shù)據(jù)平臺、本地業(yè)務(wù)系統(tǒng)及遠(yuǎn)程業(yè)務(wù)系統(tǒng)的數(shù)據(jù)信息。

參考圖3所示,etl作業(yè)管理模塊和etl調(diào)度管理模塊的工作流程為:

用戶通過etl作業(yè)管理模塊對大數(shù)據(jù)抽取、清洗、加載的配置進(jìn)行可視化操作,并生成json或xml格式的作業(yè)配置文件,作業(yè)配置文件提交到平臺組件驅(qū)動(dòng)模塊和系統(tǒng)驅(qū)動(dòng)子模塊,大數(shù)據(jù)平臺、本地業(yè)務(wù)系統(tǒng)及遠(yuǎn)程業(yè)務(wù)系統(tǒng)基于作業(yè)配置文件進(jìn)行etl作業(yè),系統(tǒng)驅(qū)動(dòng)子模塊將作業(yè)配置文件保存到作業(yè)配置數(shù)據(jù)庫;etl調(diào)度管理模塊讀取作業(yè)配置數(shù)據(jù)庫的etl作業(yè)列表,根據(jù)etl作業(yè)列表進(jìn)行作業(yè)調(diào)度,并對etl作業(yè)執(zhí)行過程進(jìn)行監(jiān)控。

參考圖4所示,系統(tǒng)管理模塊的工作流程為:

用戶通過系統(tǒng)管理模塊進(jìn)行用戶、角色、資源的管理以及訪問權(quán)限控制,并通過系統(tǒng)驅(qū)動(dòng)子模塊將用戶、角色、資源的管理信息以及訪問權(quán)限保存到作業(yè)配置數(shù)據(jù)庫。

以上所述,僅為本發(fā)明較佳的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)該以權(quán)利要求的保護(hù)范圍為準(zhǔn)。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1
泾川县| 塔城市| 航空| 苗栗市| 巨野县| 湘潭市| 丘北县| 曲麻莱县| 凤阳县| 江城| 弥渡县| 乌兰浩特市| 白河县| 天镇县| 黄石市| 广宗县| 苏尼特左旗| 北票市| 南皮县| 于田县| 景泰县| 乐山市| 锡林郭勒盟| 同江市| 平安县| 柳河县| 永胜县| 大英县| 康马县| 右玉县| 沾化县| 崇明县| 民权县| 湘潭县| 永济市| 巴中市| 深水埗区| 常熟市| 逊克县| 百色市| 容城县|