使用興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)進(jìn)行數(shù)據(jù)分析的興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)和方法
【專(zhuān)利摘要】根據(jù)本發(fā)明的實(shí)施例的興趣驅(qū)動(dòng)商業(yè)智能(BI)系統(tǒng)被說(shuō)明。在本發(fā)明的一個(gè)實(shí)施例中,數(shù)據(jù)處理系統(tǒng)包括:包含原始數(shù)據(jù)的原始數(shù)據(jù)存儲(chǔ)器;包含描述原始數(shù)據(jù)的元數(shù)據(jù)的元數(shù)據(jù)存儲(chǔ)器;和被自動(dòng)編譯以通過(guò)使用原始數(shù)據(jù)生成報(bào)告數(shù)據(jù)的興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn),其中,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)基于從通過(guò)使用元數(shù)據(jù)定義的至少一個(gè)報(bào)告規(guī)范自動(dòng)導(dǎo)出的報(bào)告數(shù)據(jù)需求被編譯。
【專(zhuān)利說(shuō)明】使用興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)進(jìn)行數(shù)據(jù)分析的興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)和方法
[0001]相關(guān)申請(qǐng)的交叉引用
[0002]本申請(qǐng)要求在2012年2月29日提交的美國(guó)專(zhuān)利申請(qǐng)N0.13/408872的優(yōu)先權(quán),該美國(guó)專(zhuān)利申請(qǐng)的公開(kāi)內(nèi)容通過(guò)引用被結(jié)合于此。
【技術(shù)領(lǐng)域】
[0003]本發(fā)明涉及商業(yè)智能系統(tǒng),具體而言涉及使用興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)(interest-driven data pipeline)進(jìn)行數(shù)據(jù)分析的興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)和方法。
【背景技術(shù)】
[0004]商業(yè)智能指的是用于識(shí)別、處理和分析商業(yè)數(shù)據(jù)的技術(shù)。商業(yè)智能系統(tǒng)可提供商業(yè)操作的歷史、當(dāng)前和預(yù)測(cè)視圖。在商業(yè)操作的過(guò)程中生成的商業(yè)數(shù)據(jù)(包括從商業(yè)處理生成的數(shù)據(jù)和由雇員和顧客創(chuàng)建的附加數(shù)據(jù)),取決于圍繞數(shù)據(jù)的語(yǔ)境和知識(shí),可以是結(jié)構(gòu)化的、半結(jié)構(gòu)化的、或者非結(jié)構(gòu)化的。在許多情況下,從商業(yè)處理生成的數(shù)據(jù)是結(jié)構(gòu)化的,而從與商業(yè)的顧客交互生成的數(shù)據(jù)是半結(jié)構(gòu)化的或者非結(jié)構(gòu)化的。由于一般在商業(yè)操作的過(guò)程中生成的數(shù)據(jù)量,商業(yè)智能系統(tǒng)一般構(gòu)建于數(shù)據(jù)倉(cāng)庫(kù)之上并且利用數(shù)據(jù)倉(cāng)庫(kù)。
[0005]數(shù)據(jù)倉(cāng)庫(kù)被用于存儲(chǔ)、分析和報(bào)告數(shù)據(jù),該數(shù)據(jù)例如為商業(yè)數(shù)據(jù)。數(shù)據(jù)倉(cāng)庫(kù)利用數(shù)據(jù)庫(kù)來(lái)以富有成效和成本有效的方式存儲(chǔ)、分析和利用數(shù)據(jù)。一般利用各種數(shù)據(jù)庫(kù),諸如關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)(RDBMS),諸如來(lái)自California的Santa Clara的OracleCorporat1n的Oracle Database,或者海量并行處理分析數(shù)據(jù)庫(kù),諸如來(lái)自O(shè)h1的Miamisburg 的 Teradata Corporat1n 的 Teradata0 諸如來(lái)自 North Carolina 的 Cary的SAS Institute, Inc.的SAS的商業(yè)智能(BI)和分析工具被用于訪(fǎng)問(wèn)存儲(chǔ)于數(shù)據(jù)庫(kù)中的數(shù)據(jù)并且提供供開(kāi)發(fā)人員生成報(bào)告、管理和挖掘存儲(chǔ)的數(shù)據(jù)、執(zhí)行統(tǒng)計(jì)分析、商業(yè)計(jì)劃、預(yù)報(bào)和其它商業(yè)功能的界面。通過(guò)使用BI工具創(chuàng)建的大多數(shù)的報(bào)告是由數(shù)據(jù)庫(kù)管理員創(chuàng)建的,并且,可針對(duì)期望的訪(fǎng)問(wèn)型式調(diào)諧底層的數(shù)據(jù)庫(kù)。數(shù)據(jù)庫(kù)管理員可以索引、預(yù)聚集(aggregate)或限制對(duì)于特定關(guān)系的訪(fǎng)問(wèn),允許自組織(ad_hoc)報(bào)告和探索。
[0006]在線(xiàn)交易處理(OLTP)系統(tǒng)被設(shè)計(jì)為有利于并且管理基于交易的應(yīng)用。OTLP可參照諸如數(shù)據(jù)庫(kù)管理系統(tǒng)交易、業(yè)務(wù)或商業(yè)交易的各種交易。OLTP系統(tǒng)一般具有對(duì)于用戶(hù)請(qǐng)求的低延時(shí)響應(yīng)。
[0007]作為OLTP的修正的在線(xiàn)分析處理(OLAP)是回答多維分析查詢(xún)的方法。OLAP工具使得用戶(hù)能夠通過(guò)利用三種基本的分析操作來(lái)分析多維數(shù)據(jù):整合(聚集數(shù)據(jù))、下鉆(導(dǎo)航數(shù)據(jù)的細(xì)節(jié))以及分割和劃片(取得特定的數(shù)據(jù)集并且從多個(gè)視點(diǎn)查看)。任何OLAP系統(tǒng)的基礎(chǔ)是OLAP立方體(cube)。OLAP立方體是允許通過(guò)從多個(gè)視角操縱和分析數(shù)據(jù)的能力來(lái)快速分析數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)。OLAP立方體一般由通過(guò)維度分類(lèi)的數(shù)值事實(shí)構(gòu)成,這些事實(shí)稱(chēng)為量度(measure)。一般根據(jù)RDBMS中的表的星形模式(schema)或者雪花模式創(chuàng)建這些事實(shí)和量度。
[0008]雪花模式是RDBMS中的表的布置,中心事實(shí)表與一個(gè)或更多個(gè)維度表連接。雪花模式中的維度表被歸一化為多個(gè)有關(guān)的表一對(duì)于復(fù)雜模式,在維度表之間將存在許多關(guān)系,從而得出看似雪花的模式。星形模式是具有參照一個(gè)或更多個(gè)維度表的事實(shí)表的雪花模式的特定形式。但是,在星形模式中,維度被歸一化為單個(gè)表一事實(shí)表是中心,維度表是星形的“點(diǎn)”。
[0009]轉(zhuǎn)到OLAP系統(tǒng),從一般由商業(yè)處理的測(cè)量結(jié)果或數(shù)據(jù)構(gòu)成的事實(shí)表導(dǎo)出量度。從維度表導(dǎo)出維度。換句話(huà)說(shuō),量度具有一組標(biāo)簽,這里,標(biāo)簽的描述在相應(yīng)的維度中被描述。一般使用兩種OLAP工具:關(guān)系OLAP (ROLAP)和多維OLAP (MOLAP)。ROLAP和MOLAP均被設(shè)計(jì)為允許通過(guò)使用多維數(shù)據(jù)模型分析數(shù)據(jù)。
[0010]ROLAP工具訪(fǎng)問(wèn)關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)并且在終端用戶(hù)請(qǐng)求時(shí)生成SQL查詢(xún)以在適當(dāng)?shù)膶用嬗?jì)算信息。通過(guò)R0LAP,能夠創(chuàng)建附加的數(shù)據(jù)庫(kù)表(概要表或聚集),這些數(shù)據(jù)庫(kù)表在維度的任何希望的組合上概要數(shù)據(jù)。而ROLAP使用關(guān)系數(shù)據(jù)庫(kù)源,數(shù)據(jù)庫(kù)一般必須針對(duì)ROLAP使用被仔細(xì)設(shè)計(jì)。對(duì)OLAP設(shè)計(jì)的數(shù)據(jù)庫(kù)不能很好地用作ROLAP數(shù)據(jù)庫(kù)。因此,ROLAP仍包括創(chuàng)建數(shù)據(jù)的附加副本。但是,由于它是數(shù)據(jù)庫(kù),因此可以使用各種技術(shù)以填充數(shù)據(jù)庫(kù)。ROLAP工具的一個(gè)例子是來(lái)自Florida的Orlando的Pentaho Corporat1n的Pentaho BI Suite。
[0011]MOLAP工具與ROLAP工具的不同在于,MOLAP工具常常涉及OLAP立方體中的信息的預(yù)計(jì)算和存儲(chǔ)。大多數(shù)的MOLAP方案將該數(shù)據(jù)存儲(chǔ)為內(nèi)存內(nèi)(in-memory)多維陣列而不是存儲(chǔ)在關(guān)系數(shù)據(jù)庫(kù)中。由于優(yōu)化的存儲(chǔ)、多維索引和高速緩存以及數(shù)據(jù)的更高水平聚集的自動(dòng)計(jì)算,數(shù)據(jù)的該預(yù)處理和存儲(chǔ)允許快速查詢(xún)性能。但是,數(shù)據(jù)的預(yù)處理和存儲(chǔ)具有一些缺點(diǎn),諸如長(zhǎng)處理步驟,特別是當(dāng)應(yīng)對(duì)大量的數(shù)據(jù)時(shí)。MOLAP工具在常規(guī)上難以查詢(xún)?nèi)缦履P?,該模型具有基?shù)非常高的維度或者大量的維度。MOLAP的一個(gè)例子是來(lái)自New York的 Armonk 的 Internat1nal Business Machine 的 Cognos Powerplay 系統(tǒng)。
[0012]預(yù)測(cè)分析包括從分析當(dāng)前和歷史事實(shí)的建模、數(shù)據(jù)挖掘和博弈論到關(guān)于將來(lái)的事件進(jìn)行預(yù)測(cè)的各種統(tǒng)計(jì)技術(shù)。一般地,當(dāng)提到商業(yè)智能系統(tǒng)時(shí),術(shù)語(yǔ)預(yù)測(cè)分析被用于表示預(yù)測(cè)性的建模、用預(yù)測(cè)性的模型對(duì)數(shù)據(jù)“評(píng)分”和預(yù)報(bào)。
【發(fā)明內(nèi)容】
[0013]商業(yè)越來(lái)越多地捕獲和存儲(chǔ)機(jī)器生成數(shù)據(jù),諸如用戶(hù)與系統(tǒng)的交互的服務(wù)器日志或記錄,從而使得生成極大量的數(shù)據(jù)。因此,機(jī)器生成數(shù)據(jù)正暴露沒(méi)有被設(shè)計(jì)為處理這種大量的數(shù)據(jù)的常規(guī)BI系統(tǒng)的許多限制。用于存儲(chǔ)這種大量數(shù)據(jù)的系統(tǒng)一般具有高延時(shí),并因此提供非常差的交互性。常規(guī)的商業(yè)智能系統(tǒng)常常利用內(nèi)存內(nèi)處理模型,其中通過(guò)使用數(shù)據(jù)管線(xiàn)從數(shù)據(jù)倉(cāng)庫(kù)將數(shù)據(jù)集加載到系統(tǒng)內(nèi)存內(nèi)以進(jìn)行分析?,F(xiàn)有的利用該方法的系統(tǒng)需要高度受訓(xùn)的工程師和商業(yè)智能分析師的大量勞動(dòng)以構(gòu)建數(shù)據(jù)管線(xiàn),從而基于原始數(shù)據(jù)填充內(nèi)存內(nèi)數(shù)據(jù)集。并且,一旦數(shù)據(jù)管線(xiàn)已被構(gòu)建,就不存在內(nèi)存內(nèi)數(shù)據(jù)集的活動(dòng)更新。數(shù)據(jù)管線(xiàn)的變化或更新一般涉及支持工程師的進(jìn)一步的勞動(dòng)和分析,并且終端用戶(hù)一般不能看到對(duì)于分析可能可用的不處于內(nèi)存內(nèi)數(shù)據(jù)集中的數(shù)據(jù)。
[0014]根據(jù)本發(fā)明的實(shí)施例的興趣驅(qū)動(dòng)商業(yè)智能(BI)系統(tǒng)能夠以使得用戶(hù)能夠完全看到可用數(shù)據(jù)并且能夠動(dòng)態(tài)重新配置BI系統(tǒng)的數(shù)據(jù)管線(xiàn)以提供對(duì)于想要的信息的訪(fǎng)問(wèn)的方式管理巨量的數(shù)據(jù)集。
[0015]示出根據(jù)本發(fā)明的實(shí)施例的用于興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)的系統(tǒng)和方法。在本發(fā)明的一個(gè)實(shí)施例中,一種數(shù)據(jù)處理系統(tǒng)包括:包含原始數(shù)據(jù)的原始數(shù)據(jù)存儲(chǔ)器;包含描述原始數(shù)據(jù)的元數(shù)據(jù)的元數(shù)據(jù)存儲(chǔ)器;和被自動(dòng)編譯(compile)以通過(guò)使用原始數(shù)據(jù)生成報(bào)告數(shù)據(jù)的興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn),其中,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)基于從通過(guò)使用元數(shù)據(jù)定義的至少一個(gè)報(bào)告規(guī)范自動(dòng)導(dǎo)出的報(bào)告數(shù)據(jù)需求被編譯。
[0016]在本發(fā)明的另一實(shí)施例中,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)基于選自由報(bào)告數(shù)據(jù)需求的變化、元數(shù)據(jù)的變化和原始數(shù)據(jù)的變化組成的組的至少一個(gè)變化被自動(dòng)編譯。
[0017]在本發(fā)明的再一實(shí)施例中,數(shù)據(jù)處理系統(tǒng)還包括:被配置為存儲(chǔ)源數(shù)據(jù)的源數(shù)據(jù)存儲(chǔ)器,其中,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)被配置為通過(guò)用源模型對(duì)原始數(shù)據(jù)執(zhí)行提取、變換和加載(ETL)處理來(lái)創(chuàng)建源數(shù)據(jù)。
[0018]在本發(fā)明的又一實(shí)施例中,數(shù)據(jù)處理系統(tǒng)還包括:被配置為存儲(chǔ)聚集數(shù)據(jù)的聚集數(shù)據(jù)存儲(chǔ)器,其中,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)被配置為通過(guò)使用源數(shù)據(jù)執(zhí)行聚集來(lái)生成聚集數(shù)據(jù)。
[0019]在本發(fā)明的又一實(shí)施例中,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)被配置為通過(guò)利用報(bào)告數(shù)據(jù)需求來(lái)生成聚集。
[0020]在本發(fā)明的又一實(shí)施例中,數(shù)據(jù)處理系統(tǒng)還包括中間處理層,其中,中間處理層包括被配置為存儲(chǔ)數(shù)據(jù)模型的數(shù)據(jù)管理器和興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)編譯器。
[0021]在本發(fā)明的又一實(shí)施例中,中間處理層訪(fǎng)問(wèn)原始數(shù)據(jù)存儲(chǔ)器內(nèi)的數(shù)據(jù)。
[0022]在本發(fā)明的又一實(shí)施例中,通過(guò)利用興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)編譯器,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)被自動(dòng)編譯。
[0023]在本發(fā)明的又一實(shí)施例中,中間處理層被配置為執(zhí)行包含更新原始數(shù)據(jù)和更新報(bào)告數(shù)據(jù)的原始數(shù)據(jù)引入(intake)。
[0024]在本發(fā)明的又一實(shí)施例中,數(shù)據(jù)處理系統(tǒng)被配置為包含商業(yè)智能報(bào)告引擎的興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng),其中,商業(yè)智能報(bào)告引擎包括被配置為存儲(chǔ)報(bào)告數(shù)據(jù)的報(bào)告數(shù)據(jù)存儲(chǔ)器。
[0025]在本發(fā)明的又一實(shí)施例中,商業(yè)智能報(bào)告引擎包含被配置為顯示數(shù)據(jù)并接收對(duì)數(shù)據(jù)的請(qǐng)求的用戶(hù)界面。
[0026]在本發(fā)明的又一實(shí)施例中,興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)還包括:被配置為存儲(chǔ)報(bào)告規(guī)范的報(bào)告規(guī)范存儲(chǔ)器,其中,興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)被配置為接收至少一個(gè)報(bào)告規(guī)范。
[0027]在本發(fā)明的又一實(shí)施例中,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)被配置為通過(guò)使用至少一個(gè)報(bào)告規(guī)范自動(dòng)生成報(bào)告數(shù)據(jù)需求。
[0028]在本發(fā)明的又一實(shí)施例中,商業(yè)智能報(bào)告引擎被配置為通過(guò)利用報(bào)告規(guī)范和報(bào)告數(shù)據(jù)生成報(bào)告。
[0029]在本發(fā)明的又一實(shí)施例中,興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)包括興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)編譯器,其中,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)被配置為:通過(guò)利用提取、變換和加載(ETL)處理將原始數(shù)據(jù)轉(zhuǎn)換成源數(shù)據(jù);利用報(bào)告數(shù)據(jù)需求來(lái)生成應(yīng)用于源數(shù)據(jù)以生成聚集數(shù)據(jù)的聚集處理;和基于報(bào)告數(shù)據(jù)需求來(lái)生成數(shù)據(jù)模型并且通過(guò)使用聚集數(shù)據(jù)填充數(shù)據(jù)模型來(lái)生成報(bào)告數(shù)據(jù),其中,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)編譯器被配置為響應(yīng)于興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)接收到修改報(bào)告數(shù)據(jù)需求的報(bào)告規(guī)范來(lái)自動(dòng)編譯興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)。
[0030]在本發(fā)明的又一實(shí)施例中,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)編譯器被配置為響應(yīng)于對(duì)報(bào)告數(shù)據(jù)需求的修改來(lái)更新ETL處理。
[0031]在本發(fā)明的又一實(shí)施例中,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)編譯器被配置為響應(yīng)于對(duì)報(bào)告數(shù)據(jù)需求的修改來(lái)生成新的聚集。
[0032]在本發(fā)明的又一實(shí)施例中,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)編譯器被配置為響應(yīng)于對(duì)報(bào)告數(shù)據(jù)需求的修改來(lái)生成新的數(shù)據(jù)模型。
[0033]在本發(fā)明的又一實(shí)施例中,報(bào)告包含至少一個(gè)可視化(visualizat1n),其中,至少一個(gè)可視化被配置為處理并顯示報(bào)告數(shù)據(jù)。
[0034]本發(fā)明的又一實(shí)施例包括興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng),該興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)包括:被配置為包含原始數(shù)據(jù)并且執(zhí)行ETL處理的原始數(shù)據(jù)存儲(chǔ)器系統(tǒng);被配置為包含描述原始數(shù)據(jù)的元數(shù)據(jù)的元數(shù)據(jù)存儲(chǔ)器;被配置為包含通過(guò)使用ETL處理從原始數(shù)據(jù)生成的聚集數(shù)據(jù)的聚集數(shù)據(jù)存儲(chǔ)器;被配置為接收定義至少一個(gè)報(bào)告規(guī)范的元數(shù)據(jù)的用戶(hù)探索的商業(yè)智能報(bào)告引擎;和中間處理層,其中,中間處理層被配置為自動(dòng)進(jìn)行以下操作:從所述至少一個(gè)報(bào)告規(guī)范導(dǎo)出報(bào)告數(shù)據(jù)需求;和基于報(bào)告數(shù)據(jù)需求編譯興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn),其中,自動(dòng)編譯興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)包括:生成ETL處理作業(yè)以從原始數(shù)據(jù)生成聚集數(shù)據(jù);和通過(guò)使用聚集數(shù)據(jù)生成報(bào)告數(shù)據(jù);其中,商業(yè)智能報(bào)告引擎被配置為通過(guò)使用報(bào)告數(shù)據(jù)來(lái)基于所述至少一個(gè)報(bào)告規(guī)范生成至少一個(gè)報(bào)告,其中,商業(yè)智能報(bào)告引擎被配置為提供所述至少一個(gè)報(bào)告的交互探索,其中,商業(yè)智能報(bào)告引擎被配置為基于所述至少一個(gè)報(bào)告的交互探索來(lái)實(shí)時(shí)更新報(bào)告數(shù)據(jù)需求,并且,其中,中間處理層被配置為自動(dòng)重新編譯興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)以響應(yīng)于報(bào)告數(shù)據(jù)需求的變化生成附加的報(bào)告數(shù)據(jù)。
[0035]在本發(fā)明的又一實(shí)施例中,原始數(shù)據(jù)存儲(chǔ)系統(tǒng)是數(shù)據(jù)倉(cāng)庫(kù)。
[0036]在本發(fā)明的又一實(shí)施例中,數(shù)據(jù)倉(cāng)庫(kù)利用選自由分布式計(jì)算系統(tǒng)、數(shù)據(jù)庫(kù)管理系統(tǒng)和NoSQL數(shù)據(jù)庫(kù)組成的組的系統(tǒng)被實(shí)現(xiàn)。
[0037]在本發(fā)明的又一實(shí)施例中,數(shù)據(jù)倉(cāng)庫(kù)是通過(guò)使用Hadoop實(shí)現(xiàn)的分布式計(jì)算系統(tǒng)。
[0038]在本發(fā)明的又一實(shí)施例中,數(shù)據(jù)倉(cāng)庫(kù)被配置為存儲(chǔ)通過(guò)使用中間處理層生成的數(shù)據(jù)。
[0039]在本發(fā)明的又一實(shí)施例中,中間處理層被配置為生成數(shù)據(jù)倉(cāng)庫(kù)請(qǐng)求。
[0040]在本發(fā)明的又一實(shí)施例中,數(shù)據(jù)倉(cāng)庫(kù)請(qǐng)求是選自由Hive查詢(xún)和MapReduce操作組成的組的請(qǐng)求。
[0041]在本發(fā)明的又一實(shí)施例中,中間處理層通過(guò)利用選自由分布式計(jì)算系統(tǒng)、數(shù)據(jù)庫(kù)管理系統(tǒng)和NoSQL數(shù)據(jù)庫(kù)系統(tǒng)組成的組的系統(tǒng)被實(shí)現(xiàn)。
[0042]在本發(fā)明的又一實(shí)施例中,商業(yè)智能報(bào)告引擎被配置為基于所述至少一個(gè)報(bào)告的交互探索來(lái)顯示指示。
[0043]在本發(fā)明的又一實(shí)施例中,指示是更新報(bào)告數(shù)據(jù)需求所需要的時(shí)間的估計(jì)。
[0044]本發(fā)明的又一實(shí)施例包括通過(guò)使用興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)來(lái)創(chuàng)建報(bào)告,包括:在原始數(shù)據(jù)存儲(chǔ)器中存儲(chǔ)原始數(shù)據(jù);通過(guò)使用興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)來(lái)接收通過(guò)利用描述原始數(shù)據(jù)的元數(shù)據(jù)而生成的報(bào)告定義;通過(guò)使用興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)來(lái)自動(dòng)生成從報(bào)告定義導(dǎo)出的報(bào)告數(shù)據(jù)需求;通過(guò)使用報(bào)告數(shù)據(jù)需求和原始數(shù)據(jù)來(lái)自動(dòng)編譯作為興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)的一部分的興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn);通過(guò)使用興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)來(lái)從報(bào)告數(shù)據(jù)需求生成報(bào)告數(shù)據(jù);通過(guò)使用興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)來(lái)用報(bào)告數(shù)據(jù)填充報(bào)告;通過(guò)使用興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)來(lái)提供報(bào)告的交互探索;和通過(guò)使用興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)來(lái)自動(dòng)編譯興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)以響應(yīng)于在報(bào)告的交互探索期間定義的報(bào)告數(shù)據(jù)需求的變化而生成附加的報(bào)告數(shù)據(jù)。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0045]圖1是根據(jù)本發(fā)明的實(shí)施例的商業(yè)智能系統(tǒng)的網(wǎng)絡(luò)示圖。
[0046]圖2是根據(jù)本發(fā)明的實(shí)施例的興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)的概念圖。
[0047]圖3是示出根據(jù)本發(fā)明的實(shí)施例的用于探索數(shù)據(jù)的處理的流程圖。
[0048]圖4是示出根據(jù)本發(fā)明的實(shí)施例的興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的示圖。
[0049]圖5A是示出根據(jù)本發(fā)明的實(shí)施例的與興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的交互的示圖。
[0050]圖5B是示出根據(jù)本發(fā)明的實(shí)施例的創(chuàng)建新導(dǎo)出數(shù)據(jù)的與興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的交互的示圖。
[0051]圖5C是示出根據(jù)本發(fā)明的實(shí)施例的修改報(bào)告數(shù)據(jù)的與興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的交互的示圖。
[0052]圖是示出根據(jù)本發(fā)明的修改興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的各方面的與興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的交互的示圖。
[0053]圖5E是示出根據(jù)本發(fā)明的實(shí)施例的添加附加的數(shù)據(jù)源的與興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的交互的示圖。
[0054]圖6是示出根據(jù)本發(fā)明的實(shí)施例的用于處理原始數(shù)據(jù)的處理的流程圖。
[0055]圖7是示出根據(jù)本發(fā)明的實(shí)施例的用于聚集數(shù)據(jù)的處理的流程圖。
[0056]圖8是示出根據(jù)本發(fā)明的實(shí)施例的用于數(shù)據(jù)轉(zhuǎn)換(wrangle)的處理的流程圖。
[0057]圖9是示出根據(jù)本發(fā)明的實(shí)施例的用于生成模式的處理的流程圖。
[0058]圖10是示出根據(jù)本發(fā)明的實(shí)施例的用于構(gòu)建OLAP立方體的處理的流程圖。
[0059]圖11是示出根據(jù)本發(fā)明的實(shí)施例的用于數(shù)據(jù)引入的處理的流程圖。
[0060]圖12是示出根據(jù)本發(fā)明的實(shí)施例的用于構(gòu)建報(bào)告的處理的流程圖。
[0061]圖13是示出根據(jù)本發(fā)明的實(shí)施例的用于創(chuàng)建可視化的處理的流程圖。
[0062]圖14是示出根據(jù)本發(fā)明的實(shí)施例的用于估計(jì)用戶(hù)生成的動(dòng)作的時(shí)間需求的處理的流程圖。
[0063]圖15是示出根據(jù)本發(fā)明的實(shí)施例的用于數(shù)據(jù)探索的處理的流程圖。
【具體實(shí)施方式】
[0064]現(xiàn)在轉(zhuǎn)到示圖,示出根據(jù)本發(fā)明的實(shí)施例的興趣驅(qū)動(dòng)商業(yè)智能(BI)系統(tǒng)。BI系統(tǒng)是適于商業(yè)使用的特定種類(lèi)的數(shù)據(jù)處理系統(tǒng),但是,以下描述的系統(tǒng)和方法適用于任何數(shù)據(jù)處理系統(tǒng)。術(shù)語(yǔ)“興趣驅(qū)動(dòng)”可被用于描述能夠動(dòng)態(tài)構(gòu)建數(shù)據(jù)管線(xiàn)以向終端用戶(hù)提供感興趣的信息的一類(lèi)BI系統(tǒng)。在許多實(shí)施例中,興趣驅(qū)動(dòng)BI系統(tǒng)能夠以使得用戶(hù)能夠完全看到可用數(shù)據(jù)并且能夠動(dòng)態(tài)重新配置BI系統(tǒng)的數(shù)據(jù)管線(xiàn)以提供對(duì)于想要的信息的訪(fǎng)問(wèn)的方式管理巨量的數(shù)據(jù)集。
[0065]在幾個(gè)實(shí)施例中,興趣驅(qū)動(dòng)BI系統(tǒng)在原始數(shù)據(jù)存儲(chǔ)系統(tǒng)中蓄積原始數(shù)據(jù)。興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)可然后通過(guò)使用提取、變換和加載(ETL)處理將源數(shù)據(jù)加載到數(shù)據(jù)倉(cāng)庫(kù)中。在許多實(shí)施例中,根據(jù)本領(lǐng)域技術(shù)人員已知的數(shù)據(jù)處理技術(shù),ETL處理包括從數(shù)據(jù)源提取數(shù)據(jù)、變換數(shù)據(jù)和將數(shù)據(jù)加載到數(shù)據(jù)存儲(chǔ)器中。興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)然后基于模式過(guò)濾和/或聚集源數(shù)據(jù)以創(chuàng)建報(bào)告數(shù)據(jù)。數(shù)據(jù)聚集一般被理解為指多條數(shù)據(jù)被成組在一起以形成單個(gè)值的功能;過(guò)濾包括創(chuàng)建數(shù)據(jù)的子集。在整個(gè)說(shuō)明書(shū)中,術(shù)語(yǔ)聚集被用于描述聚集和/或過(guò)濾處理。常見(jiàn)的數(shù)據(jù)聚集包括但不限于取得平均、計(jì)數(shù)、加算、找到最大值、最小值、中值和/或模式。在許多實(shí)施例中,報(bào)告數(shù)據(jù)存儲(chǔ)于數(shù)據(jù)集市中并且被用于在通過(guò)BI系統(tǒng)在向用戶(hù)顯示的報(bào)告中生成可視化。由于數(shù)據(jù)管線(xiàn)的興趣驅(qū)動(dòng)本質(zhì),可基于用戶(hù)感興趣的數(shù)據(jù)動(dòng)態(tài)重新配置用于生成報(bào)告數(shù)據(jù)的ETL處理和過(guò)濾和聚集處理。在興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)中的各級(jí)中,關(guān)于底層的數(shù)據(jù)的元數(shù)據(jù)被向前傳遞到用戶(hù)。因此,用戶(hù)獲知所有可用的數(shù)據(jù)。在感興趣的數(shù)據(jù)不包括在由興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)提供的報(bào)告數(shù)據(jù)中的情況下,興趣驅(qū)動(dòng)BI系統(tǒng)動(dòng)態(tài)重新構(gòu)建興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)以使得數(shù)據(jù)在供用戶(hù)探索的報(bào)告內(nèi)可用。
[0066]利用興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)可減少或者消除工程師或商業(yè)智能分析師手動(dòng)調(diào)諧數(shù)據(jù)管線(xiàn)的需要。作為依賴(lài)于工程師或商業(yè)智能分析師以構(gòu)建分析師查詢(xún)的數(shù)據(jù)集的替代,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)響應(yīng)于包括傳入數(shù)據(jù)、改變的模式、商業(yè)智能數(shù)據(jù)的演進(jìn)的各種人為或非人為因素或者響應(yīng)于由分析師采取的動(dòng)作被實(shí)時(shí)自動(dòng)修改。運(yùn)轉(zhuǎn)中的興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的例子是當(dāng)附加的數(shù)據(jù)源或現(xiàn)有數(shù)據(jù)源內(nèi)的字段變得可用時(shí)。該附加數(shù)據(jù)的描述可被指定或者自動(dòng)檢測(cè),然后,該元數(shù)據(jù)可通過(guò)興趣驅(qū)動(dòng)BI系統(tǒng)被一直自動(dòng)前推,使得終端用戶(hù)可在不必支付變換和具體化附加數(shù)據(jù)的前期成本的情況下利用附加的數(shù)據(jù),在常規(guī)的數(shù)據(jù)管線(xiàn)中,這會(huì)要求支持工程師和分析師投入時(shí)間和勞動(dòng)。
[0067]在大量的實(shí)施例中,通過(guò)使用諸如(但不限于)也常簡(jiǎn)稱(chēng)為Hadoop的ApacheHadoop的分布式計(jì)算平臺(tái),執(zhí)行原始數(shù)據(jù)的蓄積、原始數(shù)據(jù)的創(chuàng)建源數(shù)據(jù)的ETL處理和源數(shù)據(jù)在數(shù)據(jù)倉(cāng)庫(kù)中的存儲(chǔ)。分布式計(jì)算平臺(tái)提供能夠生長(zhǎng)以通過(guò)利用商用硬件存儲(chǔ)千萬(wàn)億字節(jié)數(shù)據(jù)的相對(duì)便宜、可靠和可縮放的存儲(chǔ)層。另外,分布式計(jì)算平臺(tái)能夠通過(guò)利用MapReduce、查詢(xún)或其它的處理方法并行處理數(shù)據(jù)。
[0068]雖然分布式計(jì)算平臺(tái)可存儲(chǔ)大量的數(shù)據(jù),但分布式計(jì)算平臺(tái)一般具有非常差的響應(yīng)時(shí)間,這里,作業(yè)或者查詢(xún)可花費(fèi)幾分鐘或者甚至幾小時(shí)。另外,雖然MapReduce對(duì)于并行處理【技術(shù)領(lǐng)域】的技術(shù)人員來(lái)說(shuō)是有力的工具,但使用MapReduce超出大多數(shù)工程師和分析師的范圍。為了實(shí)現(xiàn)高度交互的性能,興趣驅(qū)動(dòng)BI系統(tǒng)可動(dòng)態(tài)構(gòu)建多級(jí)數(shù)據(jù)管線(xiàn)的級(jí),以基于數(shù)據(jù)的希望的終端消費(fèi)將感興趣的數(shù)據(jù)加載到系統(tǒng)內(nèi)存中。在報(bào)告層面上指定的變化可通過(guò)興趣驅(qū)動(dòng)BI系統(tǒng)被自動(dòng)編譯和回溯,以創(chuàng)建滿(mǎn)足新的報(bào)告需求的適當(dāng)?shù)臄?shù)據(jù)管線(xiàn)。
[0069]在大量的實(shí)施例中,通過(guò)位于商業(yè)分析師使用的商業(yè)智能前端與分布式計(jì)算平臺(tái)之間的中間處理層構(gòu)建興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)。該中間處理層可從商業(yè)分析師或其它用戶(hù)接收請(qǐng)求,并且自動(dòng)創(chuàng)建興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)以從分布式計(jì)算平臺(tái)取回?cái)?shù)據(jù),執(zhí)行任何必要的處理,并且返回供用戶(hù)進(jìn)行內(nèi)存內(nèi)探索的報(bào)告數(shù)據(jù)。中間處理層常常在數(shù)據(jù)集市中存儲(chǔ)供用戶(hù)探索的報(bào)告數(shù)據(jù)。中間處理層可在單個(gè)機(jī)器上被實(shí)現(xiàn),或者跨著多系統(tǒng)被并行化,從而提供可與內(nèi)存內(nèi)商業(yè)智能系統(tǒng)一樣快地響應(yīng)的平臺(tái),而沒(méi)有常規(guī)的內(nèi)存內(nèi)商業(yè)智能系統(tǒng)的限制。因此,利用興趣驅(qū)動(dòng)BI系統(tǒng)的分析師可通過(guò)使用由中間處理層取回并且保持于內(nèi)存內(nèi)的數(shù)據(jù)迅速地生成頻繁使用的報(bào)告,并且同時(shí)具有通過(guò)利用興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)下鉆到底層原始數(shù)據(jù)中的能力。將在后面進(jìn)一步討論根據(jù)本發(fā)明的實(shí)施例的用于動(dòng)態(tài)構(gòu)建興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的興趣驅(qū)動(dòng)BI系統(tǒng)和方法。
[0070]系統(tǒng)概要
[0071]在圖1中不出根據(jù)本發(fā)明的實(shí)施例的興趣驅(qū)動(dòng)BI系統(tǒng)。興趣驅(qū)動(dòng)BI系統(tǒng)100包含被配置為存儲(chǔ)原始商業(yè)數(shù)據(jù)的分布式計(jì)算平臺(tái)110。分布式計(jì)算平臺(tái)110被配置為通過(guò)網(wǎng)絡(luò)114與中間處理系統(tǒng)112通信。在本發(fā)明的幾個(gè)實(shí)施例中,網(wǎng)絡(luò)114是局域網(wǎng)。在許多實(shí)施例中,分布式計(jì)算平臺(tái)110通過(guò)因特網(wǎng)114與中間處理系統(tǒng)112通信。中間處理系統(tǒng)112也被配置為通過(guò)利用網(wǎng)絡(luò)114與包括蜂窩電話(huà)116、個(gè)人計(jì)算機(jī)118和呈現(xiàn)裝置120的一個(gè)或更多個(gè)客戶(hù)端裝置通信。在本發(fā)明的許多實(shí)施例中,客戶(hù)端裝置包括能夠接收和/或顯示數(shù)據(jù)的任何計(jì)算裝置。在本發(fā)明的幾個(gè)實(shí)施例中,客戶(hù)端裝置被配置為與中間處理系統(tǒng)112通信。在大量的實(shí)施例中,客戶(hù)端裝置被配置為與數(shù)據(jù)倉(cāng)庫(kù)110通信。
[0072]在本發(fā)明的許多實(shí)施例中,分布式計(jì)算平臺(tái)110是被配置為利用Hadoop的分布式計(jì)算平臺(tái)的計(jì)算機(jī)集群。Hadoop是允許跨著節(jié)點(diǎn)集群分布式處理數(shù)據(jù)集的軟件庫(kù)。Hadoop被設(shè)計(jì)為從一個(gè)節(jié)點(diǎn)增加到數(shù)以千計(jì)的節(jié)點(diǎn),這里,各節(jié)點(diǎn)是負(fù)責(zé)其自身的處理和數(shù)據(jù)存儲(chǔ)的計(jì)算機(jī)。為了在計(jì)算機(jī)的數(shù)量增加時(shí)提供可靠性,Hadoop被設(shè)計(jì)為檢測(cè)并處理軟件和/或硬件中的故障,從而解決各單個(gè)節(jié)點(diǎn)中的不可靠。Hadoop能夠通過(guò)使用Hadoop分布式文件系統(tǒng)(HDFS)存儲(chǔ)數(shù)據(jù),通過(guò)使用Hadoop MapReduce運(yùn)行并行處理,并且支持SQL類(lèi)查詢(xún)連同由各種計(jì)劃提供的其它功能,這些功能中的許多通過(guò)Apache Foundat1n被支持。在大量的實(shí)施例中,分布式計(jì)算平臺(tái)110被配置為運(yùn)行通過(guò)利用Hadoop MapReduce由興趣驅(qū)動(dòng)BI系統(tǒng)生成的作業(yè)和利用Hive的查詢(xún)。以這種方式,分布式計(jì)算平臺(tái)110可被配置為用作興趣驅(qū)動(dòng)BI系統(tǒng)內(nèi)的原始數(shù)據(jù)存儲(chǔ)系統(tǒng)和數(shù)據(jù)倉(cāng)庫(kù)。在其它的實(shí)施例中,可以利用替代性的分布式處理系統(tǒng),該分布式處理系統(tǒng)可被大規(guī)模并行處理架構(gòu)取代,并且/或者,單獨(dú)的數(shù)據(jù)倉(cāng)庫(kù)可被分布式處理系統(tǒng)或被配置為管理大規(guī)模數(shù)據(jù)集的等同系統(tǒng)填充。
[0073]在幾個(gè)實(shí)施例中,還通過(guò)使用計(jì)算裝置中的一個(gè)或集群實(shí)現(xiàn)中間處理系統(tǒng)112。中間處理系統(tǒng)112使得用戶(hù)能夠指定包括數(shù)據(jù)可視化的報(bào)告,數(shù)據(jù)可視化使得用戶(hù)能夠探索(explore)存儲(chǔ)于分布式計(jì)算平臺(tái)110內(nèi)的原始數(shù)據(jù)?;谟捎脩?hù)指定的可視化,中間處理系統(tǒng)112自動(dòng)創(chuàng)建并且/或者更新一個(gè)或更多個(gè)興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)以創(chuàng)建或更新報(bào)告數(shù)據(jù)。一般通過(guò)將作業(yè)下推到分布式計(jì)算平臺(tái)110以創(chuàng)建源數(shù)據(jù)并然后通過(guò)使用中間處理系統(tǒng)112向源數(shù)據(jù)應(yīng)用各種過(guò)濾器和/或聚集處理以產(chǎn)生存儲(chǔ)于內(nèi)存內(nèi)的報(bào)告數(shù)據(jù),配置興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)。將在后面討論構(gòu)建興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的處理。
[0074]在本發(fā)明的許多實(shí)施例中,通過(guò)使用面向服務(wù)的架構(gòu)(SOA)實(shí)現(xiàn)分布式計(jì)算系統(tǒng)
110、中間處理系統(tǒng)112和客戶(hù)端裝置116?120,這里,例如,分布式計(jì)算系統(tǒng)110和中間處理系統(tǒng)112是通過(guò)云進(jìn)行通信的服務(wù)。在幾個(gè)實(shí)施例中,通過(guò)利用多層架構(gòu)實(shí)現(xiàn)分布式計(jì)算系統(tǒng)110、中間處理系統(tǒng)112和客戶(hù)端裝置116?120。
[0075]興趣驅(qū)動(dòng)BI系統(tǒng)的各層
[0076]根據(jù)可相互獨(dú)立地開(kāi)發(fā)和部署的概念層,可以理解諸如圖1所示的系統(tǒng)的興趣驅(qū)動(dòng)BI系統(tǒng)。在圖2中示出根據(jù)本發(fā)明的實(shí)施例的示出興趣驅(qū)動(dòng)BI系統(tǒng)的各層的層示圖。系統(tǒng)200包含BI報(bào)告引擎210。BI報(bào)告引擎210包括允許用戶(hù)和系統(tǒng)與興趣驅(qū)動(dòng)BI系統(tǒng)交互的用戶(hù)界面和其它編程界面。興趣驅(qū)動(dòng)BI系統(tǒng)200還包含中間處理層220。中間處理層包含數(shù)據(jù)管理器222和興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)編譯器224。中間處理層220被設(shè)計(jì)為處理來(lái)自BI報(bào)告引擎210的請(qǐng)求,管理存儲(chǔ)于數(shù)據(jù)管理器222中的數(shù)據(jù)模型和數(shù)據(jù),通過(guò)使用興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)編譯器224創(chuàng)建、配置和更新興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)。通過(guò)下推將希望的源數(shù)據(jù)從原始數(shù)據(jù)存儲(chǔ)層240加載到數(shù)據(jù)倉(cāng)庫(kù)層230中的ETL作業(yè)來(lái)創(chuàng)建興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)。如上面討論的那樣,原始數(shù)據(jù)存儲(chǔ)層240和數(shù)據(jù)倉(cāng)庫(kù)層230均可通過(guò)使用諸如Hadoop的分布式計(jì)算系統(tǒng)被實(shí)現(xiàn)。由中間處理層220構(gòu)建的興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)還向存儲(chǔ)于數(shù)據(jù)倉(cāng)庫(kù)層230中的源數(shù)據(jù)應(yīng)用過(guò)濾和/或聚集處理以通過(guò)BI報(bào)告引擎210生成通過(guò)中間處理層保持于內(nèi)存內(nèi)的供探索的報(bào)告數(shù)據(jù)。
[0077]中間處理層220不限于基于用戶(hù)交互來(lái)重新編譯興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)。當(dāng)新的數(shù)據(jù)變得可用時(shí),中間處理層可動(dòng)態(tài)更新存儲(chǔ)于數(shù)據(jù)管理器222中的模型。關(guān)于新數(shù)據(jù)的元數(shù)據(jù)通過(guò)BI報(bào)告引擎210被傳遞到用戶(hù),并且,為了探索新數(shù)據(jù),用戶(hù)可通過(guò)使用數(shù)據(jù)管線(xiàn)編譯器224發(fā)起興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的重新構(gòu)建。在本發(fā)明的大量的實(shí)施例中,中間處理層220提供能夠提供對(duì)存儲(chǔ)于中間處理層220中的各種數(shù)據(jù)的訪(fǎng)問(wèn)的應(yīng)用編程界面。應(yīng)用編程界面提供對(duì)BI報(bào)告引擎210和第三方程序二者的數(shù)據(jù)訪(fǎng)問(wèn)。
[0078]雖然在圖1和圖2中示出用于興趣驅(qū)動(dòng)BI系統(tǒng)的特定架構(gòu),但也可利用根據(jù)本發(fā)明的實(shí)施例的被配置為存儲(chǔ)大數(shù)據(jù)集并且基于由用戶(hù)構(gòu)建的報(bào)告來(lái)自動(dòng)構(gòu)建興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的各種架構(gòu)中的任一種。將在后面進(jìn)一步討論根據(jù)本發(fā)明的實(shí)施例的用于通過(guò)利用興趣驅(qū)動(dòng)BI系統(tǒng)來(lái)創(chuàng)建、利用和更新興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的系統(tǒng)和方法。
[0079]通過(guò)使用興趣驅(qū)動(dòng)BI系統(tǒng)來(lái)探索數(shù)據(jù)
[0080]興趣驅(qū)動(dòng)BI系統(tǒng)的主要目的是使得用戶(hù)能夠探索由BI系統(tǒng)收集的原始商業(yè)數(shù)據(jù)。在原始數(shù)據(jù)可被探索之前,數(shù)據(jù)被表征并且興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)被構(gòu)造。在圖3中示出根據(jù)本發(fā)明的實(shí)施例的使得能夠通過(guò)使用興趣驅(qū)動(dòng)BI系統(tǒng)來(lái)實(shí)現(xiàn)原始商業(yè)數(shù)據(jù)的探索的處理的高層面概要。處理300包括轉(zhuǎn)換(310)數(shù)據(jù),其包括對(duì)存儲(chǔ)于興趣驅(qū)動(dòng)BI系統(tǒng)中的原始數(shù)據(jù)創(chuàng)建描述結(jié)構(gòu)的元數(shù)據(jù)。數(shù)據(jù)然后被建模(312)。建模(312)數(shù)據(jù)包括確定應(yīng)使得數(shù)據(jù)的哪些方面可用以及任何希望的聚集或過(guò)濾器。在許多實(shí)施例中,數(shù)據(jù)的各方面是星形或雪花模式中的事實(shí)表的維度。通過(guò)使用模式來(lái)構(gòu)造(314)數(shù)據(jù)空間。在本發(fā)明的許多實(shí)施例中,模式可以是星形或雪花模式。一旦數(shù)據(jù)空間被構(gòu)造,就可構(gòu)建(316)報(bào)告。通過(guò)使用報(bào)告,用戶(hù)可探索(318)數(shù)據(jù)。探索(318)數(shù)據(jù)一般包括可視化數(shù)據(jù)和識(shí)別數(shù)據(jù)的各方面以供進(jìn)一步的探索?;跀?shù)據(jù)的探索(318),數(shù)據(jù)空間可被更新,或者新的數(shù)據(jù)空間可被構(gòu)造(314)。
[0081]雖然在圖3中示出用于通過(guò)使用興趣驅(qū)動(dòng)BI系統(tǒng)來(lái)探索數(shù)據(jù)的特定處理,但是,根據(jù)本發(fā)明的實(shí)施例,可以利用使能興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的動(dòng)態(tài)構(gòu)建的各種處理中的任一種。將在后面進(jìn)一步討論根據(jù)本發(fā)明的實(shí)施例的上述處理使能興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的自動(dòng)創(chuàng)建的方式。
_2] 動(dòng)態(tài)構(gòu)建興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)
[0083]根據(jù)本發(fā)明的實(shí)施例的興趣驅(qū)動(dòng)BI系統(tǒng)可動(dòng)態(tài)構(gòu)建數(shù)據(jù)管線(xiàn)以基于由用戶(hù)提供的原始數(shù)據(jù)的描述和報(bào)告規(guī)范來(lái)在內(nèi)存內(nèi)加載報(bào)告數(shù)據(jù)。換句話(huà)說(shuō),興趣驅(qū)動(dòng)BI系統(tǒng)取得由用戶(hù)提供的原始數(shù)據(jù)的描述和用戶(hù)希望探索原始數(shù)據(jù)并且動(dòng)態(tài)構(gòu)建數(shù)據(jù)管線(xiàn)以從原始數(shù)據(jù)存儲(chǔ)系統(tǒng)提取希望的數(shù)據(jù)以供用戶(hù)內(nèi)存內(nèi)交互探索的方式的描述。
[0084]在圖4中示出根據(jù)本發(fā)明的實(shí)施例的用于構(gòu)建興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的處理。興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)400使用通過(guò)利用在數(shù)據(jù)轉(zhuǎn)換處理412期間創(chuàng)建的元數(shù)據(jù)而生成的源模型410來(lái)自動(dòng)構(gòu)建取得原始數(shù)據(jù)416的ETL處理414并且生成源數(shù)據(jù)418。在原始數(shù)據(jù)存儲(chǔ)于分布式計(jì)算系統(tǒng)內(nèi)的實(shí)施例中,作為被傳遞到分布式計(jì)算平臺(tái)的作業(yè)來(lái)生成ETL處理。
[0085]由用戶(hù)指定并且/或者在BI系統(tǒng)內(nèi)定義的報(bào)告需求420被用于確定聚集和/或過(guò)濾器422。聚集和/或過(guò)濾器422通過(guò)使用創(chuàng)建聚集數(shù)據(jù)424的聚集處理423被應(yīng)用于源數(shù)據(jù)418。在分布式計(jì)算平臺(tái)生成源數(shù)據(jù)的情況下,興趣驅(qū)動(dòng)BI系統(tǒng)可自動(dòng)生成被提供給分布式計(jì)算平臺(tái)的作業(yè)以執(zhí)行與聚集處理423相關(guān)聯(lián)的聚集和/或過(guò)濾。
[0086]模式構(gòu)建器426也可利用報(bào)告需求420來(lái)創(chuàng)建模式428。在大量的實(shí)施例中,模式是星形模式或雪花模式。在其它的實(shí)施例中,可以利用適于特定的應(yīng)用的任何模式。處理429被應(yīng)用于聚集數(shù)據(jù)424以填充模式428,從而提供可在內(nèi)存內(nèi)加載并且在報(bào)告的交互生成中被用戶(hù)使用以有利于數(shù)據(jù)的可視化和探索的報(bào)告數(shù)據(jù)430。在許多實(shí)施例中,中間處理系統(tǒng)通過(guò)使用由保持原始數(shù)據(jù)的分布式計(jì)算平臺(tái)生成的聚集數(shù)來(lái)構(gòu)建模式。在該點(diǎn)上,報(bào)告數(shù)據(jù)保持于內(nèi)存內(nèi),并且可被交互地(即,以低延時(shí)方式)利用。在許多實(shí)施例中,可在興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)以外的數(shù)據(jù)處理系統(tǒng)內(nèi)利用報(bào)告數(shù)據(jù)。
[0087]雖然在圖4中示出用于動(dòng)態(tài)構(gòu)建興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的特定處理,但是,根據(jù)本發(fā)明的實(shí)施例,可以利用各種處理中的任一種來(lái)根據(jù)終端用戶(hù)的數(shù)據(jù)消費(fèi)自動(dòng)變換原始數(shù)據(jù)。在后面進(jìn)一步討論根據(jù)本發(fā)明的實(shí)施例的可響應(yīng)于用戶(hù)交互和新數(shù)據(jù)源向興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的添加來(lái)動(dòng)態(tài)重新配置興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的方式。
[0088]與興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的交互
[0089]在本發(fā)明的許多實(shí)施例中,基于與系統(tǒng)的用戶(hù)交互,并且當(dāng)新數(shù)據(jù)進(jìn)入系統(tǒng)時(shí),動(dòng)態(tài)創(chuàng)建或編譯興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)。例如,當(dāng)用戶(hù)通過(guò)使用興趣驅(qū)動(dòng)BI系統(tǒng)探索數(shù)據(jù)時(shí),用戶(hù)可配置報(bào)告?;谂渲?,通過(guò)對(duì)結(jié)構(gòu)化并概述數(shù)據(jù)并使其以低延時(shí)格式可供用戶(hù)進(jìn)行交互探索的一組變換進(jìn)行編譯,創(chuàng)建或更新興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)。以下的五個(gè)例子進(jìn)一步詳述與興趣驅(qū)動(dòng)BI系統(tǒng)的用戶(hù)交互如何引起興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的變化。
[0090]首先,如圖5A所示,用戶(hù)交互500包括用戶(hù)501通過(guò)使用用戶(hù)界面506探索報(bào)告數(shù)據(jù)502。用戶(hù)501可執(zhí)行由BI報(bào)告引擎504支持的動(dòng)作,包括用戶(hù)501查看報(bào)告數(shù)據(jù)502,諸如改變可視化、改變過(guò)濾器或改變聚集水平。在許多實(shí)施例中,報(bào)告數(shù)據(jù)502是被來(lái)自興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的數(shù)據(jù)填充的模式。由于用戶(hù)502動(dòng)作不改變底層的報(bào)告數(shù)據(jù)502,因此,BI報(bào)告引擎504不引起興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的任何變化。
[0091]現(xiàn)在轉(zhuǎn)到圖5B,示出第二用戶(hù)交互502。用戶(hù)521使用由BI報(bào)告引擎524提供的用戶(hù)界面526來(lái)基于諸如計(jì)算出的導(dǎo)出的量度、計(jì)算出的列、或集合和總體的報(bào)告數(shù)據(jù)522來(lái)創(chuàng)建新的導(dǎo)出數(shù)據(jù)528。新的導(dǎo)出數(shù)據(jù)528被反饋到興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)中,從而使得興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)基于新的導(dǎo)出數(shù)據(jù)528更新報(bào)告數(shù)據(jù)522。并且,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)可基于對(duì)報(bào)告數(shù)據(jù)522的更新來(lái)更新自身。
[0092]在圖5C中示出第三用戶(hù)交互。用戶(hù)交互540包含:用戶(hù)541使用由BI報(bào)告引擎552提供的用戶(hù)界面554以通過(guò)改變存在于報(bào)告數(shù)據(jù)550中的數(shù)據(jù)來(lái)修改聚集處理548。由用戶(hù)541提供的修改可采取各種形式,諸如通過(guò)ETL處理544從原始數(shù)據(jù)542拉入新源數(shù)據(jù)546、改變?cè)贓TL處理544和聚集處理548中使用的過(guò)濾器、改變由聚集處理548使用的聚集水平和/或改變通過(guò)利用聚集數(shù)據(jù)550填充551報(bào)告數(shù)據(jù)553的方式。通過(guò)改變報(bào)告數(shù)據(jù)553,用戶(hù)541使得興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)編譯新聚集處理548以創(chuàng)建在報(bào)告數(shù)據(jù)553的填充551中使用的聚集數(shù)據(jù)550。新聚集處理548可包含ETL處理544的變化,以支持由聚集處理548使用的源數(shù)據(jù)546的必要的變化。當(dāng)興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)被更新時(shí),報(bào)告數(shù)據(jù)553被更新,并且,用戶(hù)能夠與更新的報(bào)告數(shù)據(jù)553交互。
[0093]在圖中示出第四用戶(hù)界面。用戶(hù)交互560包括:用戶(hù)561使用由BI報(bào)告引擎574提供的用戶(hù)界面576以修改數(shù)據(jù)生成器562的各方面(例如,添加數(shù)據(jù)源或者修改從數(shù)據(jù)源獲得的數(shù)據(jù))、ETL處理566和聚集處理570。通過(guò)修改數(shù)據(jù)生成器562、ETL處理566和/或聚集處理570,用戶(hù)561使得興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)動(dòng)態(tài)更新,從而使得創(chuàng)建新的原始數(shù)據(jù)564、源數(shù)據(jù)568和聚集數(shù)據(jù)572,并且通過(guò)利用聚集數(shù)據(jù)572來(lái)填充573報(bào)告數(shù)據(jù)575,將報(bào)告數(shù)據(jù)575傳播到BI報(bào)告引擎574。這里,用戶(hù)561能夠動(dòng)態(tài)重新配置興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)并且在沒(méi)有工程師或商業(yè)分析師的任何手動(dòng)調(diào)諧的情況下接收更新的報(bào)告數(shù)據(jù)575。
[0094]最后,在圖5E中示出第五用戶(hù)交互。用戶(hù)交互580包括:添加新的數(shù)據(jù)生成器582,從而使得新的原始數(shù)據(jù)584變得可用于興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)。用戶(hù)交互580還可包括更新ETL處理586,諸如基于使得可用的新原始數(shù)據(jù)584的更新數(shù)據(jù)處理和歸一化?;谶@些變化,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)被動(dòng)態(tài)重新配置,從而使得新的源數(shù)據(jù)588可用于聚集處理590,從而創(chuàng)建可用于填充593新的報(bào)告數(shù)據(jù)595的新的聚集數(shù)據(jù)592。BI報(bào)告引擎通過(guò)用戶(hù)界面596使得新的報(bào)告數(shù)據(jù)595可由用戶(hù)581使用。以這種方式,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)動(dòng)態(tài)提供對(duì)于新的數(shù)據(jù)生成器的訪(fǎng)問(wèn)。
[0095]在以上的例子中,用戶(hù)界面可由BI報(bào)告引擎提供。雖然以上描述了用戶(hù)交互以及隨后對(duì)興趣驅(qū)動(dòng)BI系統(tǒng)內(nèi)的興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的影響的特定例子,但這些僅是說(shuō)明性的,并且,可根據(jù)本發(fā)明的實(shí)施例利用任何種類(lèi)的用戶(hù)交互。在后面進(jìn)一步討論根據(jù)本發(fā)明的實(shí)施例的用于通過(guò)利用興趣驅(qū)動(dòng)BI系統(tǒng)處理數(shù)據(jù)并與其交互的方法。
[0096]在興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)中處理原始數(shù)據(jù)
[0097]興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)通常包括向原始數(shù)據(jù)應(yīng)用ETL處理從而生成供興趣驅(qū)動(dòng)BI系統(tǒng)的用戶(hù)使用的源數(shù)據(jù)。在圖6中示出根據(jù)本發(fā)明的實(shí)施例的用于將原始數(shù)據(jù)處理成源數(shù)據(jù)的處理。處理600從取回(610)原始數(shù)據(jù)開(kāi)始。在許多實(shí)施例中,原始數(shù)據(jù)是機(jī)器生成的數(shù)據(jù)。向原始數(shù)據(jù)應(yīng)用(612)過(guò)濾器和變換。在大量的實(shí)施例中,通過(guò)表征數(shù)據(jù)來(lái)定義過(guò)濾器和變換。原始數(shù)據(jù)也可被聚集(614)。在幾個(gè)實(shí)施例中,聚集(614)數(shù)據(jù)包括減少原始數(shù)據(jù)的維度。優(yōu)化(616)也可被應(yīng)用于原始數(shù)據(jù)。在大量的實(shí)施例中,優(yōu)化(616)原始數(shù)據(jù)包括格式化數(shù)據(jù)以實(shí)現(xiàn)低延時(shí)訪(fǎng)問(wèn)。
[0098]在處理600完成之后,已經(jīng)從原始數(shù)據(jù)創(chuàng)建源數(shù)據(jù)。在許多實(shí)施例中,原始數(shù)據(jù)被保留以支持在以后創(chuàng)建新的源數(shù)據(jù)或者細(xì)化現(xiàn)有的源數(shù)據(jù)。雖然在圖6中示出用于從原始數(shù)據(jù)生成源數(shù)據(jù)的特定處理,但是,根據(jù)本發(fā)明的實(shí)施例,可利用各種處理中的任一種來(lái)在興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)中從原始數(shù)據(jù)生成源數(shù)據(jù)。將在后面進(jìn)一步討論根據(jù)本發(fā)明的實(shí)施例的用于通過(guò)利用興趣驅(qū)動(dòng)BI系統(tǒng)來(lái)處理源數(shù)據(jù)并與其交互的方法,包括用于創(chuàng)建過(guò)濾器和變換的方法。
[0099]在興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)中聚集數(shù)據(jù)
[0100]為了在興趣驅(qū)動(dòng)BI系統(tǒng)中支持各種可視化和用戶(hù)交互,通常通過(guò)利用源數(shù)據(jù)創(chuàng)建聚集數(shù)據(jù)以提供數(shù)據(jù)的各種視圖。在圖7中示出根據(jù)本發(fā)明的實(shí)施例的用于創(chuàng)建聚集數(shù)據(jù)的處理。處理700從獲得(710)源數(shù)據(jù)開(kāi)始。執(zhí)行是否在數(shù)據(jù)管線(xiàn)中利用聚集的檢查(712)。如果不利用聚集,那么源數(shù)據(jù)可作為聚集數(shù)據(jù)返回(716)。如果在數(shù)據(jù)管線(xiàn)中利用聚集,那么通過(guò)利用源數(shù)據(jù)來(lái)生成(714)聚集數(shù)據(jù)。聚集數(shù)據(jù)可返回(716)。執(zhí)行另一檢查(718)以確定是否需要進(jìn)一步的聚集。如果是,那么生成(714)附加的聚集數(shù)據(jù)。當(dāng)不需要進(jìn)一步的聚集時(shí),處理700完成。
[0101]在本發(fā)明的許多實(shí)施例中,基于與興趣驅(qū)動(dòng)BI系統(tǒng)的用戶(hù)交互確定用于生成(714)聚集數(shù)據(jù)的聚集。在本發(fā)明的幾個(gè)實(shí)施例中,通過(guò)利用興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)確定用于生成(714)聚集數(shù)據(jù)的聚集。
[0102]雖然以上描述了用于聚集源數(shù)據(jù)的特定處理,但是,根據(jù)本發(fā)明的實(shí)施例,可以利用聚集數(shù)據(jù)的任何處理。在后面進(jìn)一步討論根據(jù)本發(fā)明的實(shí)施例的用于通過(guò)利用興趣驅(qū)動(dòng)BI系統(tǒng)處理數(shù)據(jù)的方法。
[0103]識(shí)別和可視化數(shù)據(jù)
[0104]為了創(chuàng)建可在ETL處理中使用的源模型以從原始數(shù)據(jù)生成源數(shù)據(jù),用戶(hù)首先轉(zhuǎn)換原始數(shù)據(jù)。數(shù)據(jù)轉(zhuǎn)換包括創(chuàng)建提供用于解析原始數(shù)據(jù)并且分析與原始數(shù)據(jù)有關(guān)的信息的結(jié)構(gòu)的元數(shù)據(jù)。在圖8中示出根據(jù)本發(fā)明的實(shí)施例的用于轉(zhuǎn)換數(shù)據(jù)的處理。原始數(shù)據(jù)可以是結(jié)構(gòu)化的、半結(jié)構(gòu)化的或者非結(jié)構(gòu)化的。雖然結(jié)構(gòu)化的原始數(shù)據(jù)的結(jié)構(gòu)是已知的,但數(shù)據(jù)轉(zhuǎn)換處理800可包括識(shí)別(810)半結(jié)構(gòu)化的或非結(jié)構(gòu)化的原始數(shù)據(jù)的結(jié)構(gòu)。在幾個(gè)實(shí)施例中,可對(duì)結(jié)構(gòu)化的原始數(shù)據(jù)識(shí)別(810)附加的結(jié)構(gòu)。識(shí)別(810)原始數(shù)據(jù)的結(jié)構(gòu)包括定義原始數(shù)據(jù)的含義和結(jié)構(gòu),諸如用戶(hù)選擇和識(shí)別存在于原始數(shù)據(jù)中的數(shù)據(jù)字段。
[0105]向原始數(shù)據(jù)應(yīng)用(812)過(guò)濾器和變換。在許多實(shí)施例中,過(guò)濾器和變換被用于創(chuàng)建可包括樣本數(shù)據(jù)行的數(shù)據(jù)集。還生成(814)統(tǒng)計(jì)數(shù)據(jù)。生成的統(tǒng)計(jì)數(shù)據(jù)可包括諸如多少行處于原始數(shù)據(jù)中、原始數(shù)據(jù)多大、可用維度或?qū)傩缘臄?shù)量、各種統(tǒng)計(jì)分布或任何其它的相關(guān)的統(tǒng)計(jì)測(cè)量結(jié)果的方面。在本發(fā)明的許多實(shí)施例中,包含數(shù)據(jù)集和生成的統(tǒng)計(jì)數(shù)據(jù)的元數(shù)據(jù)被用戶(hù)和興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)利用以創(chuàng)建和細(xì)化源模型。雖然在圖8中示出用于執(zhí)行數(shù)據(jù)轉(zhuǎn)換的特定的處理,但是,根據(jù)本發(fā)明的實(shí)施例,可以利用通過(guò)興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)準(zhǔn)備用于處理的原始數(shù)據(jù)的各種處理中的任一種。
[0106]一旦發(fā)生數(shù)據(jù)轉(zhuǎn)換,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)就能夠利用元數(shù)據(jù)來(lái)構(gòu)造并填充各種內(nèi)存內(nèi)數(shù)據(jù)模型。在后面更詳細(xì)地討論根據(jù)本發(fā)明的實(shí)施例的用于通過(guò)利用興趣驅(qū)動(dòng)BI系統(tǒng)定義并填充模式的處理。
[0107]興趣驅(qū)動(dòng)BI系統(tǒng)中的模式構(gòu)造
[0108]為了支持與數(shù)據(jù)的用戶(hù)交互,構(gòu)造定義報(bào)告數(shù)據(jù)的結(jié)構(gòu)和內(nèi)容的模式通常是有用的。在圖9中示出根據(jù)本發(fā)明的實(shí)施例的用于對(duì)數(shù)據(jù)探索中的內(nèi)存內(nèi)數(shù)據(jù)模型的模式進(jìn)行創(chuàng)建和填充的處理。處理900包括接收(910)請(qǐng)求。該請(qǐng)求可以是與用戶(hù)希望創(chuàng)建的新的可視化、對(duì)現(xiàn)有報(bào)告或可視化的修改或在興趣驅(qū)動(dòng)BI系統(tǒng)中支持的任何其它動(dòng)作有關(guān)的用戶(hù)請(qǐng)求。在幾個(gè)實(shí)施例中,可通過(guò)興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)自動(dòng)生成請(qǐng)求。請(qǐng)求被翻譯(912)成用于內(nèi)存內(nèi)數(shù)據(jù)模型的模式。在幾個(gè)實(shí)施例中,模式是基于存在于興趣驅(qū)動(dòng)BI系統(tǒng)內(nèi)的數(shù)據(jù)的星形或雪花模式??梢詧?zhí)行包含(914)分析以確定是否已在興趣驅(qū)動(dòng)BI系統(tǒng)中存在能夠部分或者完全滿(mǎn)足請(qǐng)求的模式。興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)可重寫(xiě)(916)現(xiàn)有模式的定義。模式可出于各種原因被重寫(xiě),包括優(yōu)化性能和/或資源利用。模式的任何創(chuàng)建或修改還可包括要在數(shù)據(jù)上執(zhí)行的附加的聚集(918)。
[0109]在大量的實(shí)施例中,如果現(xiàn)有的模式滿(mǎn)足請(qǐng)求,那么興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)可重寫(xiě)模式以滿(mǎn)足請(qǐng)求。可出于各種原因創(chuàng)建或重寫(xiě)模式,諸如包括新的數(shù)據(jù)、應(yīng)用于數(shù)據(jù)的過(guò)濾器的改變、修改數(shù)據(jù)的聚集或支持用戶(hù)或興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的需要所需的模式的任何其它修改或變更。
[0110]一旦創(chuàng)建了模式,數(shù)據(jù)就可通過(guò)使用模式加載到內(nèi)存內(nèi)數(shù)據(jù)模型中??赏ㄟ^(guò)使用BI報(bào)告引擎以低延時(shí)方式探索內(nèi)存內(nèi)數(shù)據(jù)模型。雖然在圖9中示出用于構(gòu)建模式的特定的處理,但是,根據(jù)本發(fā)明的實(shí)施例,可以利用用于構(gòu)建適用于興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)中的模式的各種處理中的任一種。在后面更詳細(xì)地描述根據(jù)本發(fā)明的實(shí)施例的用于通過(guò)使用興趣驅(qū)動(dòng)BI系統(tǒng)來(lái)使用模式將數(shù)據(jù)加載到內(nèi)存內(nèi)數(shù)據(jù)模型中的處理。
[0川]在興趣驅(qū)動(dòng)BI系統(tǒng)中填充內(nèi)存內(nèi)數(shù)據(jù)結(jié)構(gòu)
[0112]為了提供低延時(shí)交互用戶(hù)體驗(yàn),興趣驅(qū)動(dòng)BI系統(tǒng)利用內(nèi)存內(nèi)數(shù)據(jù)結(jié)構(gòu)來(lái)包含用于支持用戶(hù)與之交互的報(bào)告和可視化的報(bào)告數(shù)據(jù)。在圖10中示出根據(jù)本發(fā)明的實(shí)施例的用于填充內(nèi)存內(nèi)數(shù)據(jù)結(jié)構(gòu)的處理。處理1000包括獲得(1010)模式。在大量的實(shí)施例中,模式是星形或雪花模式。然后通過(guò)利用模式來(lái)創(chuàng)建(1012)內(nèi)存內(nèi)數(shù)據(jù)結(jié)構(gòu)。在許多實(shí)施例中,創(chuàng)建(1012)的結(jié)構(gòu)是基于在模式中定義的事實(shí)和維度的OLAP立方體。
[0113]對(duì)內(nèi)存內(nèi)數(shù)據(jù)結(jié)構(gòu)導(dǎo)出(1014)量度和維度。導(dǎo)出(1014)量度和維度可基于對(duì)存儲(chǔ)于內(nèi)存內(nèi)數(shù)據(jù)結(jié)構(gòu)中的數(shù)據(jù)希望的聚集水平,從而以數(shù)據(jù)的聚集水平提供粒度水平。通過(guò)利用興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)來(lái)用聚集數(shù)據(jù)填充(1016)內(nèi)存內(nèi)數(shù)據(jù)結(jié)構(gòu)。
[0114]雖然在圖10中示出用于加載內(nèi)存內(nèi)數(shù)據(jù)結(jié)構(gòu)的特定的處理,但是,根據(jù)本發(fā)明的實(shí)施例,可以利用用于將數(shù)據(jù)加載到供BI系統(tǒng)使用的低延時(shí)存儲(chǔ)器中的任何處理。除了加載數(shù)據(jù)使得用戶(hù)可分析和使用它以外,興趣驅(qū)動(dòng)BI系統(tǒng)也負(fù)責(zé)原始數(shù)據(jù)的連續(xù)引入。在后面進(jìn)一步討論根據(jù)本發(fā)明的實(shí)施例的用于在興趣驅(qū)動(dòng)BI系統(tǒng)中處理傳入原始數(shù)據(jù)的處理。
[0115]興趣驅(qū)動(dòng)BI系統(tǒng)中的原始數(shù)據(jù)引入
[0116]在真實(shí)世界操作中,即使當(dāng)用戶(hù)和興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)與存在于興趣驅(qū)動(dòng)BI系統(tǒng)中的數(shù)據(jù)交互時(shí),興趣驅(qū)動(dòng)BI系統(tǒng)也不斷地添加新的原始數(shù)據(jù)和新的數(shù)據(jù)源。在圖11中示出根據(jù)本發(fā)明的實(shí)施例的用于原始數(shù)據(jù)引入的處理。處理1100包括接收(1110)原始數(shù)據(jù)。接收(1110)的原始數(shù)據(jù)可以是根據(jù)現(xiàn)有的商業(yè)處理生成的原始數(shù)據(jù)或者原始數(shù)據(jù)的新源。原始數(shù)據(jù)被添加(1120)到數(shù)據(jù)倉(cāng)庫(kù)。原始數(shù)據(jù)也與現(xiàn)有模式進(jìn)行匹配(1130)。在大量的實(shí)施例中,通過(guò)利用興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)來(lái)執(zhí)行原始數(shù)據(jù)與現(xiàn)有模式的匹配。如果原始數(shù)據(jù)匹配任何現(xiàn)有模式,那么執(zhí)行對(duì)模式的更新(1132)。更新(1132)可包括更新由模式利用的數(shù)據(jù)的聚集和與興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)有關(guān)的任何更新。
[0117]為了在不引起在數(shù)據(jù)倉(cāng)庫(kù)中存儲(chǔ)原始數(shù)據(jù)并且取回該數(shù)據(jù)以更新興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的開(kāi)銷(xiāo)和延時(shí)的情況下向用戶(hù)提供數(shù)據(jù)的最新視圖,本發(fā)明的大量的實(shí)施例支持通過(guò)使用數(shù)據(jù)管理器來(lái)相互獨(dú)立地向數(shù)據(jù)倉(cāng)庫(kù)添加(1120)原始數(shù)據(jù)和匹配(1130)數(shù)據(jù)與現(xiàn)有模式。數(shù)據(jù)管理器確保數(shù)據(jù)倉(cāng)庫(kù)包含原始數(shù)據(jù)的最新的版本以供以后的探索和挖掘,同時(shí),當(dāng)前存在于興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)中的數(shù)據(jù)模型可盡可能快速地被更新(1132),從而向用戶(hù)和興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)提供數(shù)據(jù)的最新版本。
[0118]雖然在圖11中示出用于通過(guò)使用興趣驅(qū)動(dòng)BI系統(tǒng)分析實(shí)時(shí)數(shù)據(jù)的特定處理,但是,根據(jù)本發(fā)明的實(shí)施例,可以利用各種處理中的任一種來(lái)將新的數(shù)據(jù)集成到興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)中。為了利用存儲(chǔ)于興趣驅(qū)動(dòng)BI系統(tǒng)中的數(shù)據(jù),提供用戶(hù)界面以允許用戶(hù)能夠可視化數(shù)據(jù)并且與數(shù)據(jù)交互。在后面進(jìn)一步詳細(xì)討論根據(jù)本發(fā)明的實(shí)施例的與數(shù)據(jù)的用戶(hù)交互的處理。
[0119]在興趣驅(qū)動(dòng)BI系統(tǒng)中構(gòu)建報(bào)告
[0120]根據(jù)本發(fā)明的許多實(shí)施例,報(bào)告是用戶(hù)可視化、探索和呈現(xiàn)存儲(chǔ)于興趣驅(qū)動(dòng)BI系統(tǒng)中的數(shù)據(jù)的主要方法。由用戶(hù)生成的報(bào)告也定義并致使興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的更新。在圖12中示出根據(jù)本發(fā)明的實(shí)施例的用于生成報(bào)告的處理。處理1200包括創(chuàng)建(1210)報(bào)告并且選擇(1212)包括于報(bào)告中的可視化。在許多實(shí)施例中,用戶(hù)通過(guò)利用由興趣驅(qū)動(dòng)BI系統(tǒng)提供的BI報(bào)告引擎來(lái)創(chuàng)建報(bào)告并與其交互??梢暬軌蝻@示存儲(chǔ)于興趣驅(qū)動(dòng)BI系統(tǒng)中的任何數(shù)據(jù)。用戶(hù)可定義在可視化中示出的數(shù)據(jù),包括定義各種水平的數(shù)據(jù)聚集和組合來(lái)自多個(gè)源的數(shù)據(jù)。
[0121]基于可視化的需求,興趣驅(qū)動(dòng)BI系統(tǒng)利用興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)來(lái)生成支持可視化所需要的數(shù)據(jù)。生成(1214)報(bào)告包括通過(guò)使用由興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)提供的數(shù)據(jù)填充存在于報(bào)告中的可視化。一旦生成報(bào)告,用戶(hù)就可使用和修改它們。雖然在圖12中示出用于生成報(bào)告的特定處理,但是,根據(jù)本發(fā)明的實(shí)施例,可以利用適于特定應(yīng)用的各種處理中的任一種以通過(guò)使用興趣驅(qū)動(dòng)BI系統(tǒng)探索數(shù)據(jù)。在后面進(jìn)一步討論根據(jù)本發(fā)明的實(shí)施例的用于創(chuàng)建可視化、選擇用于報(bào)告的數(shù)據(jù)并且探索數(shù)據(jù)的處理。
[0122]可視化一構(gòu)建報(bào)告的塊
[0123]如名稱(chēng)所示,可視化是存儲(chǔ)于興趣驅(qū)動(dòng)BI系統(tǒng)中的數(shù)據(jù)的實(shí)際可查看實(shí)施例。可視化可采取許多形式,諸如餅圖、條形圖、表或使得能夠查看數(shù)據(jù)的任何其它形式。在圖13中示出根據(jù)本發(fā)明的實(shí)施例的用于定義和填充可視化的處理。處理1300包括定義(1310)可視化。在幾個(gè)實(shí)施例中,定義(1310)可視化包括定義對(duì)存儲(chǔ)于興趣驅(qū)動(dòng)BI系統(tǒng)中的數(shù)據(jù)的過(guò)濾器和/或聚集。在許多實(shí)施例中,定義(1310)可視化包括對(duì)OLAP立方體執(zhí)行諸如分割、劃片和下鉆的操作。定義(1310)可視化還可包括創(chuàng)建各種數(shù)據(jù)概述(比如數(shù)據(jù)透視表或匯總(rollup))并且與之交互。
[0124]一旦定義可視化,就取回(1312)包含支持可視化的數(shù)據(jù)的數(shù)據(jù)空間。在大量的實(shí)施例中,數(shù)據(jù)空間可以是任意數(shù)量的內(nèi)存內(nèi)數(shù)據(jù)模型,諸如OLAP立方體、關(guān)系模型或存儲(chǔ)于內(nèi)存中的對(duì)象。通過(guò)使用數(shù)據(jù)空間,填充(1314)可視化,從而使得能夠查看存在于可視化中的數(shù)據(jù)。在大量的實(shí)施例中,通過(guò)使用BI報(bào)告引擎創(chuàng)建和顯示可視化。雖然在圖13中示出用于生成可視化的特定處理,但是,根據(jù)本發(fā)明的實(shí)施例,可以在通過(guò)使用BI引擎進(jìn)行數(shù)據(jù)探索時(shí)利用各種處理中的任一種。在后面進(jìn)一步討論根據(jù)本發(fā)明的實(shí)施例的用于與興趣驅(qū)動(dòng)BI系統(tǒng)交互的附加的處理。
[0125]在興趣驅(qū)動(dòng)BI系統(tǒng)中可視化估計(jì)的執(zhí)行時(shí)間
[0126]興趣驅(qū)動(dòng)BI系統(tǒng)動(dòng)態(tài)地向用戶(hù)提供通過(guò)利用興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)對(duì)各種原始數(shù)據(jù)的訪(fǎng)問(wèn)。但是,興趣驅(qū)動(dòng)BI系統(tǒng)可能不能在所有的情況下以低延時(shí)方式提供該動(dòng)態(tài)數(shù)據(jù)訪(fǎng)問(wèn)。在圖14中示出根據(jù)本發(fā)明的實(shí)施例的用于估計(jì)向用戶(hù)提供特定的數(shù)據(jù)或可視化所涉及的時(shí)間量的處理。處理1400包括呈現(xiàn)(1410)目錄概要;目錄概要包括存在于興趣驅(qū)動(dòng)BI系統(tǒng)中的數(shù)據(jù)的列表。在大量的實(shí)施例中,呈現(xiàn)(1410)的目錄概要是數(shù)據(jù)轉(zhuǎn)換處理的產(chǎn)物。
[0127]在許多實(shí)施例中,興趣驅(qū)動(dòng)BI系統(tǒng)建議(1412)用戶(hù)可能感興趣的可視化。在大量的實(shí)施例中,興趣驅(qū)動(dòng)BI系統(tǒng)建議(1414)用戶(hù)可能有興趣探索的數(shù)據(jù)。想要的數(shù)據(jù)從目錄被選出(1416)。數(shù)據(jù)的可用性被確定(1418),并且,顯示(1420)指示用于取回想要的數(shù)據(jù)的時(shí)間量的視覺(jué)指示符。例如,可以利用信號(hào)燈系統(tǒng)來(lái)指示取回想要的數(shù)據(jù)的時(shí)間量:綠色表示可迅速訪(fǎng)問(wèn)數(shù)據(jù),黃色表示可在幾分鐘內(nèi)訪(fǎng)問(wèn)數(shù)據(jù);紅色表示:由于需要完全重構(gòu)數(shù)據(jù)管線(xiàn)并且/或者在大比例的原始數(shù)據(jù)之上運(yùn)行MapReduce處理,因此訪(fǎng)問(wèn)數(shù)據(jù)可能花費(fèi)幾個(gè)小時(shí)。
[0128]在許多實(shí)施例中,數(shù)據(jù)的可用性的確定(1418)依賴(lài)于是否在興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)內(nèi)存在數(shù)據(jù),如果是,那么確定數(shù)據(jù)處于興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)的什么級(jí)。興趣驅(qū)動(dòng)BI系統(tǒng)能夠動(dòng)態(tài)創(chuàng)建和更新興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)以提供對(duì)于存在于系統(tǒng)中的任何數(shù)據(jù)的訪(fǎng)問(wèn)。關(guān)于不存在于現(xiàn)有興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)中的數(shù)據(jù)的可用性所顯示的視覺(jué)指示符可依賴(lài)于重新編譯興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)以提供想要的數(shù)據(jù)所涉及的時(shí)間。
[0129]雖然以上描述了用于估計(jì)數(shù)據(jù)訪(fǎng)問(wèn)時(shí)間的特定處理,但是,根據(jù)本發(fā)明的實(shí)施例,可以利用各種處理中的任一種。作為上述的基于時(shí)間的信號(hào)燈系統(tǒng)的替代,這些處理可基于各種度量,諸如處理功率估計(jì)。在后面進(jìn)一步討論根據(jù)本發(fā)明的實(shí)施例的用于探索數(shù)據(jù)的處理。
[0130]興趣驅(qū)動(dòng)BI系統(tǒng)中的用戶(hù)數(shù)據(jù)探索
[0131]許多興趣驅(qū)動(dòng)BI系統(tǒng)的重要特征是用戶(hù)探索存儲(chǔ)于興趣驅(qū)動(dòng)BI系統(tǒng)中的數(shù)據(jù)并且與該數(shù)據(jù)交互從而使得用戶(hù)能夠找到用于創(chuàng)建報(bào)告的附加數(shù)據(jù)的能力。在圖15中示出根據(jù)本發(fā)明的實(shí)施例的用于通過(guò)使用興趣驅(qū)動(dòng)BI系統(tǒng)進(jìn)行數(shù)據(jù)探索的處理。在大量的實(shí)施例中,由用戶(hù)通過(guò)利用BI報(bào)告引擎執(zhí)行處理1500。處理1500包括向用戶(hù)呈現(xiàn)(1500)目錄概要;目錄概要包括存在于興趣驅(qū)動(dòng)BI系統(tǒng)中的數(shù)據(jù)的列表。用戶(hù)能夠通過(guò)利用存在于目錄概要中的數(shù)據(jù)創(chuàng)建(1512)查詢(xún)。查詢(xún)被處理(1514)。在本發(fā)明的許多實(shí)施例中,通過(guò)利用興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)來(lái)執(zhí)行查詢(xún)的處理(1514)。查詢(xún)的結(jié)果被添加(1516)到目錄。
[0132]在大量的實(shí)施例中,查詢(xún)的結(jié)果能夠被興趣驅(qū)動(dòng)BI系統(tǒng)的所有用戶(hù)使用。查詢(xún)結(jié)果的這種共享可帶來(lái)興趣驅(qū)動(dòng)BI系統(tǒng)中的許多引人注意的特征。例如,通過(guò)將通信功能與共享查詢(xún)結(jié)果相結(jié)合,向許多興趣驅(qū)動(dòng)BI系統(tǒng)添加協(xié)作方面。另外,根據(jù)本發(fā)明的許多實(shí)施例的興趣驅(qū)動(dòng)BI系統(tǒng)包括其中可跨著利用興趣驅(qū)動(dòng)BI系統(tǒng)的不同商業(yè)來(lái)購(gòu)買(mǎi)和出售特定查詢(xún)和定制可視化的商店。
[0133]雖然在某些特定的方面中描述了本發(fā)明,但對(duì)于本領(lǐng)域技術(shù)人員來(lái)說(shuō),許多附加的修改和變更是十分明顯的。因此,要理解,可以以具體描述的方式以外的方式實(shí)踐本發(fā)明。因此,本發(fā)明的實(shí)施例應(yīng)在所有的方面被視為說(shuō)明性的而不是限制性的。
【權(quán)利要求】
1.一種數(shù)據(jù)處理系統(tǒng),包括: 包含原始數(shù)據(jù)的原始數(shù)據(jù)存儲(chǔ)器; 包含描述原始數(shù)據(jù)的元數(shù)據(jù)的元數(shù)據(jù)存儲(chǔ)器;和 被自動(dòng)編譯以通過(guò)使用原始數(shù)據(jù)生成報(bào)告數(shù)據(jù)的興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn), 其中,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)基于從通過(guò)使用元數(shù)據(jù)定義的至少一個(gè)報(bào)告規(guī)范自動(dòng)導(dǎo)出的報(bào)告數(shù)據(jù)需求被編譯。
2.根據(jù)權(quán)利要求1的數(shù)據(jù)處理系統(tǒng),其中,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)基于選自由報(bào)告數(shù)據(jù)需求的變化、元數(shù)據(jù)的變化和原始數(shù)據(jù)的變化組成的組的至少一個(gè)變化被自動(dòng)編譯。
3.根據(jù)權(quán)利要求1的數(shù)據(jù)處理系統(tǒng),還包括: 被配置為存儲(chǔ)源數(shù)據(jù)的源數(shù)據(jù)存儲(chǔ)器,且 其中,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)被配置為通過(guò)使用源模型對(duì)原始數(shù)據(jù)執(zhí)行提取、變換和加載(ETL)處理來(lái)創(chuàng)建源數(shù)據(jù)。
4.根據(jù)權(quán)利要求4的數(shù)據(jù)處理系統(tǒng),還包括: 被配置為存儲(chǔ)聚集數(shù)據(jù)的聚集數(shù)據(jù)存儲(chǔ)器,且 其中,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)被配置為通過(guò)使用源數(shù)據(jù)執(zhí)行聚集來(lái)生成聚集數(shù)據(jù)。
5.根據(jù)權(quán)利要求4的數(shù)據(jù)處理系統(tǒng),其中,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)被配置為通過(guò)利用報(bào)告數(shù)據(jù)需求來(lái)生成聚集。
6.根據(jù)權(quán)利要求1的數(shù)據(jù)處理系統(tǒng),還包括:中間處理層,其中,中間處理層包括: 被配置為存儲(chǔ)數(shù)據(jù)模型的數(shù)據(jù)管理器;和 興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)編譯器。
7.根據(jù)權(quán)利要求6的數(shù)據(jù)處理系統(tǒng),其中,中間處理層訪(fǎng)問(wèn)原始數(shù)據(jù)存儲(chǔ)器內(nèi)的數(shù)據(jù)。
8.根據(jù)權(quán)利要求6的數(shù)據(jù)處理系統(tǒng),其中,通過(guò)利用興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)編譯器,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)被自動(dòng)編譯。
9.根據(jù)權(quán)利要求6的數(shù)據(jù)處理系統(tǒng),其中,中間處理層被配置為執(zhí)行包括更新原始數(shù)據(jù)和更新報(bào)告數(shù)據(jù)的原始數(shù)據(jù)引入。
10.根據(jù)權(quán)利要求1的數(shù)據(jù)處理系統(tǒng),其中, 數(shù)據(jù)處理系統(tǒng)被配置為包括商業(yè)智能報(bào)告引擎的興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng), 其中,商業(yè)智能報(bào)告引擎包括被配置為存儲(chǔ)報(bào)告數(shù)據(jù)的報(bào)告數(shù)據(jù)存儲(chǔ)器。
11.根據(jù)權(quán)利要求10的興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng),其中,商業(yè)智能報(bào)告引擎包括被配置為顯示數(shù)據(jù)并接收對(duì)數(shù)據(jù)的請(qǐng)求的用戶(hù)界面。
12.根據(jù)權(quán)利要求10的興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng),還包括: 被配置為存儲(chǔ)報(bào)告規(guī)范的報(bào)告規(guī)范存儲(chǔ)器, 其中,興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)被配置為接收至少一個(gè)報(bào)告規(guī)范。
13.根據(jù)權(quán)利要求12的興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng),其中,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)被配置為通過(guò)使用至少一個(gè)報(bào)告規(guī)范自動(dòng)生成報(bào)告數(shù)據(jù)需求。
14.根據(jù)權(quán)利要求13的興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng),其中,商業(yè)智能報(bào)告引擎被配置為通過(guò)利用報(bào)告規(guī)范和報(bào)告數(shù)據(jù)來(lái)生成報(bào)告。
15.根據(jù)權(quán)利要求14的興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng),包括興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)編譯器,其中,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)被配置為: 通過(guò)利用提取、變換和加載(ETL)處理將原始數(shù)據(jù)轉(zhuǎn)換成源數(shù)據(jù); 利用報(bào)告數(shù)據(jù)需求來(lái)生成應(yīng)用于源數(shù)據(jù)以生成聚集數(shù)據(jù)的聚集處理;和基于報(bào)告數(shù)據(jù)需求來(lái)生成數(shù)據(jù)模型并且通過(guò)使用聚集數(shù)據(jù)填充數(shù)據(jù)模型來(lái)生成報(bào)告數(shù)據(jù), 其中,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)編譯器被配置為響應(yīng)于興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)接收到修改報(bào)告數(shù)據(jù)需求的報(bào)告規(guī)范來(lái)自動(dòng)編譯興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)。
16.根據(jù)權(quán)利要求15的興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng),其中,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)編譯器被配置為響應(yīng)于對(duì)報(bào)告數(shù)據(jù)需求的修改來(lái)更新ETL處理。
17.根據(jù)權(quán)利要求15的興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng),其中,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)編譯器被配置為響應(yīng)于對(duì)報(bào)告數(shù)據(jù)需求的修改來(lái)生成新的聚集。
18.根據(jù)權(quán)利要求15的興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng),其中,興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)編譯器被配置為響應(yīng)于對(duì)報(bào)告數(shù)據(jù)需求的修改來(lái)生成新的數(shù)據(jù)模型。
19.根據(jù)權(quán)利要求15的興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng),其中,報(bào)告包括至少一個(gè)可視化,其中,至少一個(gè)可視化被配置為處理并顯示報(bào)告數(shù)據(jù)。
20.一種興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng),包括: 被配置為包含原始數(shù)據(jù)并且執(zhí)行ETL處理的原始數(shù)據(jù)存儲(chǔ)器系統(tǒng); 被配置為包含描述原始數(shù)據(jù)的元數(shù)據(jù)的元數(shù)據(jù)存儲(chǔ)器; 被配置為包含通過(guò)使用ETL處理從原始數(shù)據(jù)生成的聚集數(shù)據(jù)的聚集數(shù)據(jù)存儲(chǔ)器; 被配置為接收定義至少一個(gè)報(bào)告規(guī)范的元數(shù)據(jù)的用戶(hù)探索的商業(yè)智能報(bào)告引擎;和 中間處理層,其中,中間處理層被配置為自動(dòng)進(jìn)行以下操作: 從所述至少一個(gè)報(bào)告規(guī)范導(dǎo)出報(bào)告數(shù)據(jù)需求;和 基于報(bào)告數(shù)據(jù)需求編譯興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn),其中,自動(dòng)編譯興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)包括: 生成ETL處理作業(yè)以從原始數(shù)據(jù)生成聚集數(shù)據(jù);和 通過(guò)使用聚集數(shù)據(jù)來(lái)生成報(bào)告數(shù)據(jù); 其中,商業(yè)智能報(bào)告引擎被配置為通過(guò)使用報(bào)告數(shù)據(jù)來(lái)基于所述至少一個(gè)報(bào)告規(guī)范生成至少一個(gè)報(bào)告; 其中,商業(yè)智能報(bào)告引擎被配置為提供所述至少一個(gè)報(bào)告的交互探索; 其中,商業(yè)智能報(bào)告引擎被配置為基于所述至少一個(gè)報(bào)告的交互探索來(lái)實(shí)時(shí)更新報(bào)告數(shù)據(jù)需求;并且 其中,中間處理層被配置為自動(dòng)重新編譯興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)以響應(yīng)于報(bào)告數(shù)據(jù)需求的變化來(lái)生成附加的報(bào)告數(shù)據(jù)。
21.根據(jù)權(quán)利要求20的興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng),其中,原始數(shù)據(jù)存儲(chǔ)系統(tǒng)是數(shù)據(jù)倉(cāng)庫(kù)。
22.根據(jù)權(quán)利要求21的興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng),其中,數(shù)據(jù)倉(cāng)庫(kù)通過(guò)利用選自由分布式計(jì)算系統(tǒng)、數(shù)據(jù)庫(kù)管理系統(tǒng)和NoSQL數(shù)據(jù)庫(kù)組成的組的系統(tǒng)被實(shí)現(xiàn)。
23.根據(jù)權(quán)利要求21的興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng),其中,數(shù)據(jù)倉(cāng)庫(kù)是通過(guò)利用Hadoop實(shí)現(xiàn)的分布式計(jì)算系統(tǒng)。
24.根據(jù)權(quán)利要求21的興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng),其中,數(shù)據(jù)倉(cāng)庫(kù)被配置為存儲(chǔ)通過(guò)利用中間處理層而生成的數(shù)據(jù)。
25.根據(jù)權(quán)利要求21的興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng),其中,中間處理層被配置為生成數(shù)據(jù)倉(cāng)庫(kù)請(qǐng)求。
26.根據(jù)權(quán)利要求25的興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng),其中,數(shù)據(jù)倉(cāng)庫(kù)請(qǐng)求是選自由Hive查詢(xún)和MapReduce操作組成的組的請(qǐng)求。
27.根據(jù)權(quán)利要求20的興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng),其中,中間處理層通過(guò)利用選自由分布式計(jì)算系統(tǒng)、數(shù)據(jù)庫(kù)管理系統(tǒng)和NoSQL數(shù)據(jù)庫(kù)系統(tǒng)組成的組的系統(tǒng)被實(shí)現(xiàn)。
28.根據(jù)權(quán)利要求20的興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng),其中,商業(yè)智能報(bào)告引擎被配置為基于所述至少一個(gè)報(bào)告的交互探索來(lái)顯示指示。
29.根據(jù)權(quán)利要求28的興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng),其中,指示是更新報(bào)告數(shù)據(jù)需求所需要的時(shí)間的估計(jì)。
30.一種用于通過(guò)使用興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)來(lái)創(chuàng)建報(bào)告的方法,包括: 在原始數(shù)據(jù)存儲(chǔ)器中存儲(chǔ)原始數(shù)據(jù); 通過(guò)使用興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)來(lái)接收通過(guò)利用描述原始數(shù)據(jù)的元數(shù)據(jù)而生成的報(bào)告定義; 通過(guò)使用興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)來(lái)自動(dòng)生成從報(bào)告定義導(dǎo)出的報(bào)告數(shù)據(jù)需求; 通過(guò)使用報(bào)告數(shù)據(jù)需求和原始數(shù)據(jù)來(lái)自動(dòng)編譯作為興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)的一部分的興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn); 通過(guò)使用興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)來(lái)從報(bào)告數(shù)據(jù)需求生成報(bào)告數(shù)據(jù); 通過(guò)使用興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)來(lái)用報(bào)告數(shù)據(jù)填充報(bào)告; 通過(guò)使用興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)來(lái)提供報(bào)告的交互探索;和 通過(guò)使用興趣驅(qū)動(dòng)商業(yè)智能系統(tǒng)來(lái)自動(dòng)編譯興趣驅(qū)動(dòng)數(shù)據(jù)管線(xiàn)以響應(yīng)于在報(bào)告的交互探索期間定義的報(bào)告數(shù)據(jù)需求的變化而生成附加的報(bào)告數(shù)據(jù)。
【文檔編號(hào)】G06F7/00GK104205039SQ201380019027
【公開(kāi)日】2014年12月10日 申請(qǐng)日期:2013年2月28日 優(yōu)先權(quán)日:2011年7月7日
【發(fā)明者】J·G·伊施勒曼, B·M·沃瑟, K·S·畢耶, B·F·巴布科克, 張業(yè)偉 申請(qǐng)人:百科納有限公司