本發(fā)明涉及一種基于數(shù)據(jù)挖掘的生產(chǎn)經(jīng)營(yíng)數(shù)據(jù)可視化實(shí)現(xiàn)方法,屬于數(shù)據(jù)挖掘和數(shù)據(jù)可視化技術(shù)領(lǐng)域。
背景技術(shù):
數(shù)據(jù)挖掘(Data Mining,DM)是指從數(shù)據(jù)庫(kù)的大量數(shù)據(jù)中揭示出隱含的、先前未知的并有潛在價(jià)值的信息的非平凡過(guò)程。在產(chǎn)品制造過(guò)程中,會(huì)產(chǎn)生大量的生產(chǎn)經(jīng)營(yíng)數(shù)據(jù)。隨著大數(shù)據(jù)時(shí)代的到來(lái),不采用數(shù)據(jù)挖掘和數(shù)據(jù)可視化技術(shù)來(lái)管理和分析生產(chǎn)經(jīng)營(yíng)數(shù)據(jù),將耗費(fèi)大量的人力財(cái)力去分析統(tǒng)計(jì)數(shù)據(jù),而且很難在宏觀上綜合處理和分析數(shù)據(jù),無(wú)法充分利用數(shù)據(jù)的價(jià)值。
技術(shù)實(shí)現(xiàn)要素:
為解決現(xiàn)有技術(shù)在產(chǎn)品制造過(guò)程中,不采用數(shù)據(jù)挖掘和數(shù)據(jù)可視化技術(shù)來(lái)管理和分析生產(chǎn)經(jīng)營(yíng)數(shù)據(jù),將耗費(fèi)大量的人力財(cái)力去分析統(tǒng)計(jì)數(shù)據(jù),而且很難在宏觀上綜合處理和分析數(shù)據(jù),無(wú)法充分利用數(shù)據(jù)的價(jià)值的問(wèn)題,提供了一種基于數(shù)據(jù)挖掘的生產(chǎn)經(jīng)營(yíng)數(shù)據(jù)可視化實(shí)現(xiàn)方法。
本發(fā)明的目的是改善落后的產(chǎn)品生產(chǎn)經(jīng)營(yíng)數(shù)據(jù)管理模式,建立企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù),實(shí)現(xiàn)對(duì)源數(shù)據(jù)的數(shù)據(jù)挖掘;實(shí)現(xiàn)數(shù)據(jù)多維度展示;選擇合適的數(shù)據(jù)模型實(shí)現(xiàn)數(shù)據(jù)可視化。
本發(fā)明的一種基于數(shù)據(jù)挖掘的生產(chǎn)經(jīng)營(yíng)數(shù)據(jù)可視化實(shí)現(xiàn)方法,其特征在于,包括如下步驟:
步驟一:設(shè)置企業(yè)內(nèi)存儲(chǔ)生產(chǎn)經(jīng)營(yíng)數(shù)據(jù)的事務(wù)型數(shù)據(jù)庫(kù)為源數(shù)據(jù)庫(kù),按照企業(yè)級(jí)數(shù)據(jù)指標(biāo)體系,采用定點(diǎn)采集方式向數(shù)據(jù)源挖掘數(shù)據(jù),對(duì)挖掘到的數(shù)據(jù)進(jìn)行統(tǒng)一編碼,去除重復(fù)信息,篩選數(shù)據(jù),對(duì)篩選后的數(shù)據(jù)進(jìn)行聚類(lèi)分析,存 儲(chǔ)數(shù)據(jù),建立多維企業(yè)數(shù)據(jù)倉(cāng)庫(kù);
步驟二:在所述的多維企業(yè)數(shù)據(jù)倉(cāng)庫(kù)的基礎(chǔ)上,建立多維數(shù)據(jù)分析;
步驟三:采用儀表盤(pán)、表格、甘特圖或圖形可視化展示生產(chǎn)經(jīng)營(yíng)數(shù)據(jù)。
進(jìn)一步,步驟二包括如下分步驟:
1)建立物理層數(shù)據(jù),將多維企業(yè)數(shù)據(jù)倉(cāng)庫(kù)導(dǎo)入物理層,包括定義物理表的結(jié)構(gòu),表之間的主外鍵關(guān)系;
2)建立邏輯層數(shù)據(jù),包括定義維度表與事實(shí)表的主外鍵關(guān)系,以便于對(duì)進(jìn)行數(shù)據(jù)鉆取,數(shù)據(jù)切片;
3)建立表示層數(shù)據(jù),根據(jù)用戶(hù)習(xí)慣建立表示層數(shù)據(jù)視圖,將各個(gè)分主題的維度表和事實(shí)表重命名為用戶(hù)可識(shí)別的形式,方便用戶(hù)進(jìn)行數(shù)據(jù)定制;
4)創(chuàng)建分析,根據(jù)需求,用戶(hù)在表示層中選擇合適的維度和事實(shí),進(jìn)行數(shù)據(jù)鉆取,數(shù)據(jù)切片。
本發(fā)明相比于現(xiàn)有技術(shù)具有如下積極效果,本發(fā)明的一種基于數(shù)據(jù)挖掘的生產(chǎn)經(jīng)營(yíng)數(shù)據(jù)可視化實(shí)現(xiàn)方法,實(shí)現(xiàn)了在宏觀上綜合處理和分析數(shù)據(jù),充分利用數(shù)據(jù)的價(jià)值,向企業(yè)管理者提供企業(yè)全局?jǐn)?shù)據(jù)信息,并根據(jù)用戶(hù)需求定制產(chǎn)品生產(chǎn)經(jīng)營(yíng)數(shù)據(jù)的展示指標(biāo)組合和展示形式。
具體實(shí)施方式
下面就具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳細(xì)說(shuō)明。
本發(fā)明的一種基于數(shù)據(jù)挖掘的生產(chǎn)經(jīng)營(yíng)數(shù)據(jù)可視化實(shí)現(xiàn)方法,其特征在于,包括如下步驟:
步驟一:設(shè)置企業(yè)內(nèi)存儲(chǔ)生產(chǎn)經(jīng)營(yíng)數(shù)據(jù)的事務(wù)型數(shù)據(jù)庫(kù)為源數(shù)據(jù)庫(kù),根據(jù)企業(yè)生產(chǎn)經(jīng)營(yíng)數(shù)據(jù)存儲(chǔ)方式,源數(shù)據(jù)庫(kù)一般包括ERP數(shù)據(jù)庫(kù),PDM數(shù)據(jù)庫(kù),財(cái)務(wù)數(shù)據(jù)庫(kù),人力數(shù)據(jù)庫(kù)等,從公司的盈利模式出發(fā),分析并整理出企業(yè)級(jí)數(shù)據(jù)指標(biāo)體系樹(shù),找出各個(gè)業(yè)務(wù)部門(mén)主要指標(biāo)的內(nèi)在關(guān)聯(lián),按照企業(yè)級(jí)數(shù)據(jù)指標(biāo)體系,采用定點(diǎn)采集方式向數(shù)據(jù)源挖掘數(shù)據(jù),對(duì)挖掘到的數(shù)據(jù)進(jìn)行統(tǒng)一編碼,去除重復(fù)信息,篩選數(shù)據(jù),對(duì)篩選后的數(shù)據(jù)進(jìn)行聚類(lèi)分析;存儲(chǔ)數(shù)據(jù),建立多維企業(yè)數(shù)據(jù)倉(cāng)庫(kù);
步驟二:在所述的多維企業(yè)數(shù)據(jù)倉(cāng)庫(kù)的基礎(chǔ)上,建立多維數(shù)據(jù)分析;
步驟三:采用儀表盤(pán)、表格、甘特圖或圖形可視化展示生產(chǎn)經(jīng)營(yíng)數(shù)據(jù)。
進(jìn)一步,步驟二包括如下分步驟:
1)建立物理層數(shù)據(jù),將多維企業(yè)數(shù)據(jù)倉(cāng)庫(kù)導(dǎo)入物理層,包括定義物理表的結(jié)構(gòu),表之間的主外鍵關(guān)系;
2)建立邏輯層數(shù)據(jù),包括定義維度表與事實(shí)表的主外鍵關(guān)系,以便于對(duì)進(jìn)行數(shù)據(jù)鉆取,數(shù)據(jù)切片;
3)建立表示層數(shù)據(jù),根據(jù)用戶(hù)習(xí)慣建立表示層數(shù)據(jù)視圖,將各個(gè)分主題的維度表和事實(shí)表重命名為用戶(hù)可識(shí)別的形式,方便用戶(hù)進(jìn)行數(shù)據(jù)定制;
4)創(chuàng)建分析,根據(jù)需求,用戶(hù)在表示層中選擇合適的維度和事實(shí),進(jìn)行數(shù)據(jù)鉆取,數(shù)據(jù)切片。
步驟一中,按照主題進(jìn)行多維企業(yè)數(shù)據(jù)倉(cāng)庫(kù)的建立,需要建立兩種類(lèi)型的數(shù)據(jù)庫(kù)表,即維度表和事實(shí)表,維度表一般包含的信息比較固定,一般包含維度id,維度名稱(chēng)等數(shù)據(jù)。有的維度需要建立多維數(shù)據(jù)表,例如時(shí)間維度表,有一個(gè)主維度,有年、季度、月、日子維度,維度id是維度的唯一標(biāo)示,事實(shí)表的字段一般分為兩個(gè)部分,一個(gè)是與事實(shí)表相關(guān)聯(lián)的維度表的維度id,另一部分是事實(shí)數(shù)據(jù)。
步驟二中,采用Oracle BIEE工具建立多維數(shù)據(jù)分析;
物理層是定義與數(shù)據(jù)倉(cāng)庫(kù)的連接,具體需要定義物理表的結(jié)構(gòu),主外鍵關(guān)系等;
邏輯層即業(yè)務(wù)模型:在物理層的基礎(chǔ)上,定義具體的維度表與事實(shí)表的主外鍵關(guān)系,這一層是整個(gè)模型的核心,需要在業(yè)務(wù)和技術(shù)的基礎(chǔ)上完成。
表示層:是按照主題區(qū)域劃分的符合用戶(hù)習(xí)慣的視圖。
分析的建立是指在表示層的基礎(chǔ)上,用戶(hù)按照邏輯層中定義的維度表與事實(shí)表的主外鍵關(guān)系,定制維度與事實(shí),形成分析。
步驟三中,設(shè)計(jì)生產(chǎn)經(jīng)營(yíng)數(shù)據(jù)的多維可視化時(shí),根據(jù)分析類(lèi)型,選擇合適的展示模型,展示數(shù)據(jù);例如項(xiàng)目管理的項(xiàng)目進(jìn)度采用甘特圖展示、計(jì)劃值與 實(shí)際值的對(duì)比采用柱狀圖展示、變化趨勢(shì)使用折線(xiàn)圖展示、各種類(lèi)型的占比采用餅狀圖展示。
本發(fā)明選用B/S(Browser/Server)瀏覽器/服務(wù)器網(wǎng)絡(luò)結(jié)構(gòu),Web服務(wù)器端采用計(jì)算功能較強(qiáng)的圖形工作站,在數(shù)據(jù)分析服務(wù)器安裝Oracle BI分析工具,數(shù)據(jù)庫(kù)軟件采用Oracle10g以上版本。將應(yīng)用分為表示層、功能層和數(shù)據(jù)層三部分,表示層由基于Web瀏覽器的客戶(hù)端組成。用戶(hù)通過(guò)系統(tǒng)的Web應(yīng)用界面與系統(tǒng)進(jìn)行人機(jī)交互,完成信息顯示。功能層由Web應(yīng)用服務(wù)器和數(shù)據(jù)分析服務(wù)器構(gòu)成。Web服務(wù)器采用HTTP協(xié)議回應(yīng)各客戶(hù)端用戶(hù)發(fā)送的請(qǐng)求,向Web應(yīng)用服務(wù)器提供信息顯示,向用戶(hù)生成客戶(hù)端實(shí)際顯示頁(yè)面;數(shù)據(jù)分析服務(wù)器通過(guò)數(shù)據(jù)庫(kù)接口組件訪問(wèn)數(shù)據(jù)層的數(shù)據(jù)倉(cāng)庫(kù),將數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)按需求建立成多維度分析、儀表盤(pán)及報(bào)表,提交給Web服務(wù)器,以實(shí)現(xiàn)用戶(hù)的應(yīng)用需求;數(shù)據(jù)層由源數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)構(gòu)成。源數(shù)據(jù)庫(kù)中包含的是面向事務(wù)的生產(chǎn)經(jīng)營(yíng)數(shù)據(jù),數(shù)據(jù)倉(cāng)庫(kù)中包含的是面向主題的生產(chǎn)經(jīng)營(yíng)數(shù)據(jù),數(shù)據(jù)倉(cāng)庫(kù)從源數(shù)據(jù)庫(kù)中進(jìn)行數(shù)據(jù)挖掘,形成多維數(shù)據(jù)庫(kù)。