專利名稱:基于元數(shù)據(jù)快速實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)過程的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種加速數(shù)據(jù)倉(cāng)庫(kù)過程、提高應(yīng)用適應(yīng)能力和擴(kuò)展能力的方法, 具體地說(shuō)是一種基于元數(shù)據(jù),通過提供人機(jī)交互界面,使得數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用的使用 者能夠方便的通過已有多維立方體(稱為基礎(chǔ)立方體),組成形成新的多維立方 體(稱為組合立方體)的基于元數(shù)據(jù)快速實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)過程的方法。
背景技術(shù):
聯(lián)機(jī)分析處理(OLAP)的概念最早是由關(guān)系數(shù)據(jù)庫(kù)之父E. R Codd于1993年提 出的。當(dāng)時(shí),Codd認(rèn)為聯(lián)機(jī)事務(wù)處理(OLTP)已不能滿足終端用戶對(duì)數(shù)據(jù)庫(kù)査詢分 析的需要,對(duì)大數(shù)據(jù)庫(kù)進(jìn)行的簡(jiǎn)單査詢也不能滿足用戶分析的需求。用戶的決策 分析需要對(duì)關(guān)系數(shù)據(jù)庫(kù)進(jìn)行大量計(jì)算才能得到結(jié)果,而査詢的結(jié)果并不能滿足決 策者提出的需求。因此Codd提出了多維數(shù)據(jù)庫(kù)和多維分析的概念,即0LAP。
企業(yè)數(shù)據(jù)倉(cāng)庫(kù)(0LAP SERVER)建設(shè)的主要目的,是為管理者全面、及時(shí)的 了解和分析企業(yè)運(yùn)營(yíng)信息提供豐富的手段,為領(lǐng)導(dǎo)決策指揮的科學(xué)性、高效性、 準(zhǔn)確性提供強(qiáng)大的技術(shù)支持。
與一般性的業(yè)務(wù)應(yīng)用系統(tǒng)不同,數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用的需求提出和明確往往是非常 困難的。主要有以下幾點(diǎn)原因
1) 數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用的使用者往往是企業(yè)的領(lǐng)導(dǎo)者和決策者。需求分析人員很 難與其就需求細(xì)節(jié)進(jìn)行仔細(xì)的討論與溝通;
2) 由于數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用在國(guó)內(nèi)的建設(shè)還處在剛剛起步的階段,企業(yè)業(yè)務(wù)人員 及管理人員對(duì)這一領(lǐng)域缺乏基本的了解,對(duì)系統(tǒng)能夠提供怎么的査詢分析手段也 沒有認(rèn)識(shí);
3) 大量常規(guī)的查詢、統(tǒng)計(jì)和報(bào)表在業(yè)務(wù)系統(tǒng)中已經(jīng)完成,企業(yè)管理人員即 便有更深層次的管理分析需求,卻也往往處于一種"說(shuō)不清道不明"的狀態(tài)。
正因?yàn)槿绱耍?一個(gè)數(shù)據(jù)倉(cāng)庫(kù)過程的完成,往往只起到原型開發(fā)的作用。管理 人員只有在看到前端應(yīng)用之后,才開始對(duì)自身的分析應(yīng)用需求做出更清晰的界 定。這一過程需要多次迭代。
傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用項(xiàng)目立足于根據(jù)數(shù)據(jù)分析應(yīng)用的需求,構(gòu)建大而全的多 維立方體來(lái)支撐分析應(yīng)用。由于此項(xiàng)工作的復(fù)雜度很高,導(dǎo)致了數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目建 設(shè)難度大、周期長(zhǎng)。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于元數(shù)據(jù)快速實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)過程的方法,通過該 方法使用者可以直接參與到數(shù)據(jù)分析模型的構(gòu)建中來(lái),使得深層次的管理分析需 求能夠由使用者自己來(lái)實(shí)現(xiàn)。開發(fā)者只需更多的關(guān)心最為核心的業(yè)務(wù)基礎(chǔ)數(shù)據(jù), 而不需去了解繁復(fù)的數(shù)據(jù)間應(yīng)用邏輯和分析需求。 本發(fā)明的目的是通過以下技術(shù)方案來(lái)實(shí)現(xiàn)的-一種基于元數(shù)據(jù)快速實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)過程的方法,其特征在于它包括以下步
驟
1) 通過元數(shù)據(jù),對(duì)數(shù)據(jù)倉(cāng)庫(kù)(OLAPSERVER)中已有的基礎(chǔ)立方體模型進(jìn)行解析 并列出其包含的度量和維度,供使用者選擇;
2) 使用者將一些具有共有維度的基礎(chǔ)立方體進(jìn)行組合,并利用已有度量創(chuàng)建新 的計(jì)算度量;
3) 將使用者所做的組合立方體的定義以XML的形式進(jìn)行描述并通過開發(fā)OLAP SERVER的元數(shù)據(jù)訪問接口,將定義導(dǎo)入OLAP SERVER中,形成組合立方體模 型;
4) 根據(jù)使用者所做的組合立方體定義信息,將基礎(chǔ)立方體所關(guān)聯(lián)的事實(shí)表數(shù)據(jù) 以共有維度所對(duì)應(yīng)的外鍵進(jìn)行關(guān)聯(lián)組合,形成新的事實(shí)表或視圖來(lái)作為組合 立方體的數(shù)據(jù)支撐。
本發(fā)明引入業(yè)務(wù)元數(shù)據(jù)對(duì)多維立方體模型進(jìn)行表述,屏蔽其中復(fù)雜的技術(shù)元 數(shù)據(jù)信息,使得使用者僅僅通過度量、維度等具有業(yè)務(wù)含義的關(guān)鍵要素就能夠描 述多維立方體模型。通過分析技術(shù)元數(shù)據(jù)與業(yè)務(wù)元數(shù)據(jù)間關(guān)聯(lián)關(guān)系,將多維立方 體模型轉(zhuǎn)換為各類OLAP SERVER能夠識(shí)別的表述形式,并通過開發(fā)接口程序,將 多維立方體模型導(dǎo)入OLAP SERVER。
本發(fā)明中,數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用的使用者通過人機(jī)交互界面,可以列出應(yīng)用中已有 的多維立方體(稱為基礎(chǔ)立方體)信息,包括多維立方體的名稱、其包含的度量 和維度信息。選擇多個(gè)具有共有維度信息的基礎(chǔ)立方體,可以將其組合形成一個(gè) 新的多維立方體(稱為組合立方體)。在形成組合立方體的過程中,使用者可以 使用基礎(chǔ)立方體中包含的度量和各類常數(shù),通過定義計(jì)算表達(dá)式,構(gòu)造出新的度 量。組合立方體定義信息將轉(zhuǎn)換為多維立方體模型的元數(shù)據(jù)并導(dǎo)入至OLAP SERVER中,形成新的多維分析模型。
通過本發(fā)明,數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用的使用者可以方便的將若干個(gè)存在關(guān)聯(lián)維度的簡(jiǎn) 單多維立方體,通過定義計(jì)算度量等方式,組合成為新的復(fù)雜多維立方體。數(shù)據(jù)
倉(cāng)庫(kù)應(yīng)用開發(fā)者不需要再將大量精力投入到各類業(yè)務(wù)關(guān)聯(lián)分析的設(shè)計(jì)實(shí)現(xiàn)中去, 既可縮短應(yīng)用開發(fā)周期,又可提高應(yīng)用對(duì)業(yè)務(wù)需求,特別是關(guān)聯(lián)分析需求的適應(yīng) 能力和擴(kuò)展能力。
本發(fā)明的有益效果如下
1、 按照本發(fā)明進(jìn)行數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用項(xiàng)目建設(shè),改變了傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用項(xiàng) 目建設(shè)方法。本發(fā)明使得數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目建設(shè)的復(fù)雜度被分解,可以有效的降低項(xiàng) 目建設(shè)難度,縮短項(xiàng)目建設(shè)周期。
2、 按照本發(fā)明進(jìn)行數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用項(xiàng)目建設(shè),使用者可在應(yīng)用過程中自行構(gòu) 建多維立方體模型,使得數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用具備很好的可擴(kuò)展性,能夠更好的適應(yīng)不 斷變化的分析需求。
3、 按照本發(fā)明進(jìn)行數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用項(xiàng)目建設(shè),開發(fā)者在建設(shè)階段將著力組織 核心的基礎(chǔ)業(yè)務(wù)數(shù)據(jù)來(lái)構(gòu)建大量簡(jiǎn)單的基礎(chǔ)多維立方體,這將使得數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用 的建設(shè)具備更好的可迭代性。
附圖是本發(fā)明的結(jié)構(gòu)示意圖。
具體實(shí)施方式
' 一種本發(fā)明所述的基于元數(shù)據(jù)快速實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)過程的方法,它包括以下步
驟
1) 通過元數(shù)據(jù),對(duì)0LAP SERVER中己有的基礎(chǔ)立方體模型進(jìn)行解析并列出其包 含的度量和維度,供使用者選擇;開發(fā)者在建設(shè)階段將著力組織大量的核心 業(yè)務(wù)數(shù)據(jù)來(lái)構(gòu)建大量簡(jiǎn)單的基礎(chǔ)多維立方體。
2) 使用者將基礎(chǔ)立方體業(yè)務(wù)元數(shù)據(jù)導(dǎo)出,根據(jù)需要選擇若干個(gè)基礎(chǔ)立方體,并 通過構(gòu)建人機(jī)《互界面將一些具有共有維度的基礎(chǔ)立方體進(jìn)行組合,包括選 擇共有維度、選擇已有度量;并利用已有度量定義新的計(jì)算度量,構(gòu)建新的 組合立方體。
3) 將使用者所確定的組合立方體的定義以XML的形式進(jìn)行描述并通過開發(fā)OLAP SERVER的元數(shù)據(jù)訪問接口,將組合立方體業(yè)務(wù)元數(shù)據(jù)導(dǎo)入OLAP SERVER中, 形成組合立方體模型;
4) 根據(jù)使用者所做的組合立方體定義信息,將基礎(chǔ)立方體所關(guān)聯(lián)的事實(shí)表數(shù)據(jù) 以共有維度所對(duì)應(yīng)的外鍵進(jìn)行關(guān)聯(lián)組合,形成新的事實(shí)表或視圖來(lái)作為組合 立方體的數(shù)據(jù)支撐。舉例如下
假設(shè)當(dāng)前已存在基礎(chǔ)立方體"銷售收入"、"職工"、"客戶",其中"銷售收入" 立方體中包括度量"銷售收入(元)",維度"分支機(jī)構(gòu)"、"銷售月度";"職工" 立方體中包括度量"職工人數(shù)",維度"分支機(jī)構(gòu)"、"統(tǒng)計(jì)月度";"客戶"立方 體中包括度量"客戶數(shù)量",維度"所屬分支機(jī)構(gòu)"、"統(tǒng)計(jì)月度"。
使用者可以將"銷售收入"、"職工"兩個(gè)基礎(chǔ)立方體進(jìn)行組合,構(gòu)建新的度 量"人均銷售收入(元/人)",針對(duì)各分支機(jī)構(gòu)各月度人均產(chǎn)出進(jìn)行考察,分析 其平均勞動(dòng)生產(chǎn)率。
使用者可以將"銷售收入"、"客戶"兩個(gè)基礎(chǔ)立方體進(jìn)行組合,構(gòu)建新的度 量"客戶平均銷售收入(元/客戶)",針對(duì)各分支機(jī)構(gòu)各月度客戶銷售收入均值
進(jìn)行考查,分析各分支機(jī)構(gòu)客戶價(jià)值分布特點(diǎn)。
使用者可以將"職工"、"客戶"兩個(gè)基礎(chǔ)立方體進(jìn)行組合,構(gòu)建新的度量"服 務(wù)強(qiáng)度(客戶/人)",針對(duì)各分支機(jī)構(gòu)各月度平均每職工服務(wù)客戶的數(shù)量進(jìn)行考 査,分析各分支機(jī)構(gòu)職工客戶服務(wù)工作的強(qiáng)度。
按照本發(fā)明進(jìn)行數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用項(xiàng)目建設(shè),改變了傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用項(xiàng)目建 設(shè)方法。傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用項(xiàng)目立足于根據(jù)數(shù)據(jù)分析應(yīng)用的需求,構(gòu)建大而全 的多維立方體來(lái)支撐分析應(yīng)用。由于此項(xiàng)工作的復(fù)雜度很高,導(dǎo)致了數(shù)據(jù)倉(cāng)庫(kù)項(xiàng) 目建設(shè)難度大、周期長(zhǎng)的問題。通過本發(fā)明,工作思路和工作角度發(fā)生逆轉(zhuǎn),數(shù) 據(jù)倉(cāng)庫(kù)項(xiàng)目建設(shè)的復(fù)雜度被分解,可以有效的降低項(xiàng)目建設(shè)難度,縮短項(xiàng)目建設(shè) 周期。
而且,按照本發(fā)明進(jìn)行數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用項(xiàng)目建設(shè),使用者可在應(yīng)用過程中自行 構(gòu)建多維立方體模型的做法,使得數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用具備很好的可擴(kuò)展性,能夠更好 的適應(yīng)不斷變化的分析需求;
并且,按照本發(fā)明進(jìn)行數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用項(xiàng)目建設(shè),開發(fā)者在建設(shè)階段將著力組 織核心的基礎(chǔ)業(yè)務(wù)數(shù)據(jù)來(lái)構(gòu)建大量簡(jiǎn)單的基礎(chǔ)多維立方體,這將使得數(shù)據(jù)倉(cāng)庫(kù)應(yīng) 用的建設(shè)具備更好的可迭代性。
權(quán)利要求
1、一種基于元數(shù)據(jù)快速實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)過程的方法,其特征在于它包括以下步驟1)通過元數(shù)據(jù),對(duì)數(shù)據(jù)倉(cāng)庫(kù)中已有的一組基礎(chǔ)立方體模型進(jìn)行解析并列出其包含的度量和維度,供使用者選擇;2)使用者將一些具有共有維度的基礎(chǔ)立方體進(jìn)行組合,并根據(jù)需要利用已有度量創(chuàng)建新的計(jì)算度量;3)將使用者所做的組合立方體的定義以XML的形式進(jìn)行描述并通過開發(fā)數(shù)據(jù)倉(cāng)庫(kù)的元數(shù)據(jù)訪問接口,將定義導(dǎo)入數(shù)據(jù)倉(cāng)庫(kù)中,形成組合立方體模型;4)根據(jù)使用者所確定的組合立方體定義信息,將基礎(chǔ)立方體所關(guān)聯(lián)的事實(shí)表數(shù)據(jù)以共有維度所對(duì)應(yīng)的外鍵進(jìn)行關(guān)聯(lián)組合,形成新的事實(shí)表或視圖來(lái)作為組合立方體的數(shù)據(jù)支撐。
2、根據(jù)權(quán)利要求1所述的基于元數(shù)據(jù)快速實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)過程的方法,其特征 在于在步驟3)中,使用者通過具有業(yè)務(wù)含義的關(guān)鍵要素度量和維度形成多維 立方體模型。
全文摘要
本發(fā)明公開了一種基于元數(shù)據(jù)快速實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)過程的方法,首先通過元數(shù)據(jù)對(duì)數(shù)據(jù)倉(cāng)庫(kù)中已有的一組基礎(chǔ)立方體模型進(jìn)行解析并列出其包含的度量和維度;使用者將一些具有共有維度的基礎(chǔ)立方體進(jìn)行組合,并根據(jù)需要利用已有度量創(chuàng)建新的計(jì)算度量;將定義導(dǎo)入數(shù)據(jù)倉(cāng)庫(kù)中,形成組合立方體模型;根據(jù)使用者所確定的組合立方體定義信息,將基礎(chǔ)立方體所關(guān)聯(lián)的事實(shí)表數(shù)據(jù)以共有維度所對(duì)應(yīng)的外鍵進(jìn)行關(guān)聯(lián)組合,形成新的事實(shí)表或視圖來(lái)作為組合立方體的數(shù)據(jù)支撐。通過本發(fā)明,使用者可以在使用過程中自主的創(chuàng)建多維分析模型,而不是由開發(fā)者預(yù)先設(shè)計(jì)完成,大大提高了數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用對(duì)于業(yè)務(wù)分析需求的適應(yīng)能力,并由此加速了數(shù)據(jù)倉(cāng)庫(kù)過程。
文檔編號(hào)G06F17/30GK101178732SQ20071019152
公開日2008年5月14日 申請(qǐng)日期2007年12月12日 優(yōu)先權(quán)日2007年12月12日
發(fā)明者莊哲寅, 張明明, 王成現(xiàn) 申請(qǐng)人:江蘇省電力公司