專利名稱:一種數(shù)據(jù)分析方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本申請實施例涉及數(shù)據(jù)存儲技術(shù)領(lǐng)域,特別涉及一種數(shù)據(jù)分析方法和設(shè)備。
背景技術(shù):
緩慢變化維度(Slowly Changing Dimensions, SCD)是在數(shù)據(jù)倉庫中隨著時間的 推移存儲和管理當前數(shù)據(jù)和歷史數(shù)據(jù)的維。它被視為并實現(xiàn)為跟蹤維記錄歷史過程中最關(guān) 鍵的數(shù)據(jù)抽取、轉(zhuǎn)換和加載(Extraction TransformationLoading, ETL)任務之一。S⑶分為三種類型,可以使用Warehouse Builder定義、部署并加載這三種類型的 SCD,分別為Type 1 SCD-覆蓋在Type 1 S⑶中,新數(shù)據(jù)將覆蓋現(xiàn)有數(shù)據(jù)。因此,現(xiàn)有數(shù)據(jù)將丟失,而不會存儲 在其他任何地方。這是創(chuàng)建的維的默認類型,不需要指定任何附加信息,即可創(chuàng)建Type 1 SCD。Type 2 SCD-創(chuàng)建另一個維記錄Type 2 S⑶可保留值的完整歷史。如果選定屬性的值發(fā)生更改,當前記錄會關(guān)閉。 系統(tǒng)會使用更改后的數(shù)據(jù)值創(chuàng)建一個新記錄,這個新記錄將成為當前記錄。每個記錄都包 含有效時間和過期時間,以標識記錄處于活動狀態(tài)的時間段。Type 3 SCD-創(chuàng)建當前值域Type 3 S⑶可為某些選定的級別屬性存儲兩個版本的值。每個記錄都會存儲選定 屬性的上一個值和當前值。如果任一選定屬性的值發(fā)生更改,就會將當前值存儲為舊值,而 新值將成為當前值。其中,SCD Type 2和Type 3可用于OWB 10gR2的企業(yè)ETL組件。利用核心ETL特 性,只能使用 SCD Type 1,即 Do not keep history 選項。如果存儲類型為多維聯(lián)機分析處理(Muiltdimension On-Line AnalysisProcessing, M0LAP),則不能創(chuàng)建 Type 2 或 Type 3 緩慢變化維度。常規(guī)的緩慢變化維度方法定位在單條商業(yè)記錄的生命周期管理上,對單條商業(yè)數(shù) 據(jù)的開始時間,結(jié)束時間做了記錄,從而能夠通過指定的商業(yè)日期,取出該商業(yè)日期的商業(yè) 數(shù)據(jù)快照,而且要掃描的輸入輸出anput-Output,10)成本比該業(yè)務日期的真實大小要大 很多,從而影響了應用在取快照的效率,只能解決快照的完整性,而不能解決使用快照的便 捷和高性能?,F(xiàn)有的常規(guī)緩慢變化維技術(shù)的缺點是每次預處理和業(yè)務取快照都要掃描比指定 快照大很多的10,從而限制了預處理的效率和使用快照的效率。
發(fā)明內(nèi)容
本申請實施例提供一種數(shù)據(jù)分析方法和設(shè)備,減少快照處理數(shù)據(jù)的數(shù)據(jù)量,提高 應用處理的效率。
本申請實施例提供一種數(shù)據(jù)分析方法,包括以下步驟根據(jù)不同的時間范圍創(chuàng)建相應的數(shù)據(jù)分區(qū);根據(jù)數(shù)據(jù)的生命周期,將所述數(shù)據(jù)存儲至時間范圍與所述生命周期相對應的數(shù)據(jù) 分區(qū)中。優(yōu)選的,所述根據(jù)不同的時間范圍創(chuàng)建相應的數(shù)據(jù)分區(qū),具體為根據(jù)當前時間所能對應的一個或多個時間范圍,分別創(chuàng)建一個或多個相對應的數(shù) 據(jù)分區(qū);或,根據(jù)當前各已存在數(shù)據(jù)的生命周期所對應的時間范圍,分別創(chuàng)建一個或多個相對 應的數(shù)據(jù)分區(qū)。優(yōu)選的,根據(jù)數(shù)據(jù)的生命周期,將所述數(shù)據(jù)存儲至時間范圍與所述生命周期相對 應的數(shù)據(jù)分區(qū)中,具體為將所述數(shù)據(jù)所對應的數(shù)據(jù)分配在相應的所述數(shù)據(jù)分區(qū),所述數(shù)據(jù)的生命周期與所 述數(shù)據(jù)分區(qū)的時間范圍相匹配;其中,所述數(shù)據(jù)分區(qū)的時間范圍為所述數(shù)據(jù)分區(qū)業(yè)務開始時間至結(jié)束時間。優(yōu)選的,所述數(shù)據(jù)的生命周期具體包括當所述數(shù)據(jù)為新增數(shù)據(jù)時,所述數(shù)據(jù)的生命周期為進行新增操作的當前日期至無 窮大;當所述數(shù)據(jù)被修改時,修改后的數(shù)據(jù)的生命周期為進行修改操作的當前日期至無 窮大,修改前的數(shù)據(jù)的生命周期截止到進行修改操作的當前日期;當所述數(shù)據(jù)被刪除時,被刪除的數(shù)據(jù)的生命周期截止到進行刪除操作的當前日期。優(yōu)選的,所述方法,還包括根據(jù)業(yè)務日期在當前存在的數(shù)據(jù)分區(qū)中確定與所述業(yè)務日期相匹配的數(shù)據(jù)分區(qū), 并在所述數(shù)據(jù)分區(qū)中獲取與所述業(yè)務日期對應的數(shù)據(jù)快照。優(yōu)選的,根據(jù)業(yè)務日期在當前存在的數(shù)據(jù)分區(qū)中確定與所述業(yè)務日期相匹配的數(shù) 據(jù)分區(qū),具體包括,當所述數(shù)據(jù)分區(qū)滿足,所述數(shù)據(jù)分區(qū)所對應時間范圍的開始時間< 所述業(yè)務日期 <所述數(shù)據(jù)分區(qū)所對應時間范圍的結(jié)束時間時,所述數(shù)據(jù)分區(qū)與所述業(yè)務日期相匹配,確 定所述數(shù)據(jù)分區(qū)為與所述業(yè)務日期相匹配的數(shù)據(jù)分區(qū)。優(yōu)選的,所述在所述數(shù)據(jù)分區(qū)中獲取與所述業(yè)務日期對應的數(shù)據(jù)快照,具體為將確定的與所述業(yè)務日期相匹配的所述數(shù)據(jù)分區(qū)進行合并操作,獲取與所述業(yè)務 日期對應的數(shù)據(jù)快照。另一方面,本申請實施例還提出了一種數(shù)據(jù)分析設(shè)備,包括創(chuàng)建模塊,用于根據(jù)不同的時間范圍創(chuàng)建相應的數(shù)據(jù)分區(qū);存儲模塊,與所述創(chuàng)建模塊相連接,用于根據(jù)數(shù)據(jù)的生命周期,將所述數(shù)據(jù)存儲至 所述創(chuàng)建模塊所創(chuàng)建的時間范圍與所述生命周期相對應的數(shù)據(jù)分區(qū)中。優(yōu)選的,所述創(chuàng)建模塊根據(jù)不同的時間范圍創(chuàng)建相應的數(shù)據(jù)分區(qū),具體為所述創(chuàng)建模塊根據(jù)當前時間所能對應的一個或多個時間范圍,分別創(chuàng)建一個或多個相對應的數(shù)據(jù)分區(qū);或,所述創(chuàng)建模塊根據(jù)當前各已存在數(shù)據(jù)的生命周期所對應的時間范圍,分別創(chuàng)建一 個或多個相對應的數(shù)據(jù)分區(qū)。優(yōu)選的,所述存儲模塊根據(jù)數(shù)據(jù)的生命周期,將所述數(shù)據(jù)存儲至時間范圍與所述生命周期 相對應的數(shù)據(jù)分區(qū)中,具體為所述存儲模塊將所述數(shù)據(jù)所對應的數(shù)據(jù)分配在相應的所述數(shù)據(jù)分區(qū),所述數(shù)據(jù)的 生命周期與所述數(shù)據(jù)分區(qū)的時間范圍相匹配;其中,所述數(shù)據(jù)分區(qū)的時間范圍為所述數(shù)據(jù)分區(qū)業(yè)務開始時間至結(jié)束時間;所述數(shù)據(jù)的生命周期具體包括當所述數(shù)據(jù)為新增數(shù)據(jù)時,所述數(shù)據(jù)的生命周期為進行新增操作的當前日期至無 窮大;當所述數(shù)據(jù)被修改時,修改后的數(shù)據(jù)的生命周期為進行修改操作的當前日期至無 窮大,修改前的數(shù)據(jù)的生命周期截止到進行修改操作的當前日期;當所述數(shù)據(jù)被刪除時,被刪除的數(shù)據(jù)的生命周期截止到進行刪除操作的當前日期。優(yōu)選的,所述設(shè)備還包括確定模塊和獲取模塊,所述確定模塊,與所述創(chuàng)建模塊相連接,用于根據(jù)業(yè)務日期在所述創(chuàng)建模塊所創(chuàng) 建的當前存在的數(shù)據(jù)分區(qū)中確定與所述業(yè)務日期相匹配的數(shù)據(jù)分區(qū);所述獲取模塊,與所述確定模塊相連接,用于在所述確定模塊所確定的數(shù)據(jù)分區(qū) 中獲取與所述業(yè)務日期對應的數(shù)據(jù)快照;優(yōu)選的,所述確定模塊確定數(shù)據(jù)分區(qū)的具體方式包括當所述數(shù)據(jù)分區(qū)滿足,所述數(shù)據(jù)分區(qū)所對應時間范圍的開始時間< 所述業(yè)務日期 <所述數(shù)據(jù)分區(qū)所對應時間范圍的結(jié)束時間時,所述數(shù)據(jù)分區(qū)與所述業(yè)務日期相匹配,確 定所述數(shù)據(jù)分區(qū)為與所述業(yè)務日期相匹配的數(shù)據(jù)分區(qū)。所述獲取模塊在所述數(shù)據(jù)分區(qū)中獲取與所述業(yè)務日期對應的數(shù)據(jù)快照的具體方 式包括將確定的與所述業(yè)務日期相匹配的所述數(shù)據(jù)分區(qū)進行合并操作,獲取與所述業(yè)務 日期對應的數(shù)據(jù)快照。本申請實施例包括以下優(yōu)點通過應用本申請的技術(shù)方案,可以根據(jù)生命周期的變化對數(shù)據(jù)按照不同的數(shù)據(jù)分 區(qū)進行存儲,從而在獲取數(shù)據(jù)時可以直接依據(jù)業(yè)務日期在相應的數(shù)據(jù)分區(qū)中對數(shù)據(jù)進行獲 取,而按照數(shù)據(jù)分區(qū)對不同生命周期的數(shù)據(jù)進行存儲的思路,可以減小相同個數(shù)的快照的 存儲容量和預處理過程掃描的數(shù)據(jù)量,使預處理過程比常規(guī)的增量合并的過程時間短,由 于獲取數(shù)據(jù)快照的時候所掃描的數(shù)據(jù)容量就是確定的需要掃描的數(shù)據(jù)快照的真實大小,因 此,不再需要掃描任何所需快照以外的數(shù)據(jù),從而提升應用的便捷和效率。
為了更清楚地說明本申請實施例或現(xiàn)有技術(shù)的技術(shù)方案,下面將對本申請實施例 或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅 是本申請實施例的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前 提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1為本申請實施例一中的一種實現(xiàn)數(shù)據(jù)快照的方法流程圖;圖2為本申請實施例二中的一種實現(xiàn)數(shù)據(jù)快照的方法流程圖;圖3為本申請實施例三中的一種實現(xiàn)數(shù)據(jù)快照的設(shè)備的結(jié)構(gòu)示意圖。
具體實施例方式本申請實施例根據(jù)數(shù)據(jù)的生命周期將數(shù)據(jù)分配在對應的數(shù)據(jù)分區(qū),下面將結(jié)合本 申請實施例中的附圖,對本申請實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述 的實施例僅僅是本申請實施例的一部分實施例,而不是全部的實施例?;诒旧暾垖嵤├?中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施 例,都屬于本申請實施例保護的范圍。如圖1所示,為本申請實施例一中的一種數(shù)據(jù)分析方法,包括以下步驟步驟SlOl、根據(jù)不同的時間范圍創(chuàng)建相應的數(shù)據(jù)分區(qū)。在具體的應用場景中,本步驟的實現(xiàn)可以包括以下兩種方案方案一、根據(jù)當前時間所能對應的一個或多個時間范圍,分別創(chuàng)建一個或多個相 對應的數(shù)據(jù)分區(qū)。這種方案在預設(shè)的周期性時間點啟動,例如在每一天的0點啟動,當然,在實際 的應用中也可以另行確定其他的任意時間點完成本步驟,具體時間的變化并不會影響本申 請的保護范圍。該方案依據(jù)預設(shè)的創(chuàng)建規(guī)則直接建立與當前日期相對應的數(shù)據(jù)分區(qū),例如分別 建立當前日期至無窮大的數(shù)據(jù)分區(qū)、先前各個日期至當前日期的數(shù)據(jù)分區(qū)等。該方案的思想在于在數(shù)據(jù)分析之前,建立與當前日期相對應的各種數(shù)據(jù)分區(qū),在 進行數(shù)據(jù)分析之后,將相應的數(shù)據(jù)存儲至相應的數(shù)據(jù)分區(qū)。這樣處理的優(yōu)點在于數(shù)據(jù)分區(qū)都屬于先創(chuàng)建的,而且可以將當前日期下可能會用 到的數(shù)據(jù)分區(qū)全部一次性建立,從而,在完成數(shù)據(jù)分析后一定可以為數(shù)據(jù)找到相對應的數(shù)據(jù) 分區(qū),從而直接進行相應的存儲,不用再另行建立數(shù)據(jù)分區(qū),節(jié)省了數(shù)據(jù)分區(qū)的創(chuàng)建時間。方案二、根據(jù)當前各已存在數(shù)據(jù)的生命周期所對應的時間范圍,分別創(chuàng)建一個或 多個相對應的數(shù)據(jù)分區(qū)。該方案的實現(xiàn)依賴于數(shù)據(jù)分析的實現(xiàn),只有在數(shù)據(jù)分析進行過程中或數(shù)據(jù)分析完 成后,即產(chǎn)生了一個或多個數(shù)據(jù)分析結(jié)果后才能具體應用。當對一個數(shù)據(jù)完成了數(shù)據(jù)分析,確定了該數(shù)據(jù)的生命周期后,根據(jù)該生命周期,查 詢當前是否已經(jīng)存在相對應的數(shù)據(jù)分區(qū),如果存在,則將該數(shù)據(jù)放入該數(shù)據(jù)分區(qū),但是,如 果當前沒有存在,則根據(jù)該數(shù)據(jù)的生命周期和當前的日期,創(chuàng)建相對應的數(shù)據(jù)分區(qū),并將該 數(shù)據(jù)存儲至新創(chuàng)建的該數(shù)據(jù)分區(qū)。這樣處理的好處在于可以根據(jù)實際的數(shù)據(jù)分析情況進行數(shù)據(jù)分區(qū)的建立,不會創(chuàng)建用不到的數(shù)據(jù)分區(qū),從而節(jié)約了建立用不到的數(shù)據(jù)分區(qū)所耗費的系統(tǒng)資源。步驟S102、根據(jù)數(shù)據(jù)的生命周期,將數(shù)據(jù)存儲至時間范圍與生命周期相對應的數(shù) 據(jù)分區(qū)中。需要進一步指出的是,上述的各數(shù)據(jù)在具體的數(shù)據(jù)表中可以設(shè)置有“業(yè)務日期”、 “生命周期”字段,從而在劃分數(shù)據(jù)分區(qū)時,可以直接以此為依據(jù)進行存儲,也可以不設(shè)置上 述的字段,而是僅僅設(shè)置具體的存儲規(guī)則,已發(fā)生數(shù)據(jù)操作的日期為當前的業(yè)務日期,并設(shè) 置具體的生命周期生成規(guī)則,從而完成相應的數(shù)據(jù)存儲。具體的生命周期生成規(guī)則在后續(xù) 說明中會進行詳細敘述,在此不再重復描述。在具體的應用場景中,在達到相同技術(shù)效果的前提下,具體應用上述哪種方案,是 否設(shè)置上述的字段標識或規(guī)則并不會影響本申請的保護范圍。在本申請實施例中,按照數(shù)據(jù)的生命周期將數(shù)據(jù)分配在對應的數(shù)據(jù)分區(qū)中,具有 相同生命周期的數(shù)據(jù)分配在一個數(shù)據(jù)分區(qū)中,生命周期不同的數(shù)據(jù)分配在不同的數(shù)據(jù)分區(qū) 中。例如,設(shè)置以天為基本單位確定數(shù)據(jù)的生命周期和數(shù)據(jù)分區(qū)的區(qū)間,具有相同生 命周期的數(shù)據(jù)分配在同一個數(shù)據(jù)分區(qū)中,該數(shù)據(jù)分區(qū)的時間范圍與數(shù)據(jù)的生命周期相匹 配,數(shù)據(jù)分區(qū)的時間范圍為數(shù)據(jù)分區(qū)開始時間與結(jié)束時間之間的時間范圍;生命周期不同 的數(shù)據(jù)分配在不同的數(shù)據(jù)分區(qū)中,數(shù)據(jù)分區(qū)的時間范圍與數(shù)據(jù)的生命周期相匹配。在對數(shù)據(jù)進行相關(guān)操作時,數(shù)據(jù)的生命周期會發(fā)生相應的改變,其中,對數(shù)據(jù)的相 關(guān)操作包括對數(shù)據(jù)進行新增操作、修改操作、刪除操作以及其他操作。在本申請實施例中,設(shè)置數(shù)據(jù)的生命周期以天為基本單位,具體為1,新增數(shù)據(jù)的生命周期為進行新增操作的當前日期至無窮大;2,修改后數(shù)據(jù)的生命周期為進行修改操作的當前日期至無窮大;3,修改前數(shù)據(jù)的生命周期截止到進行修改操作的當前日期;4,刪除數(shù)據(jù)的生命周期截止到進行刪除操作的當前日期。根據(jù)數(shù)據(jù)的生命周期,將數(shù)據(jù)分配到與數(shù)據(jù)的生命周期相匹配的數(shù)據(jù)分區(qū)中,數(shù) 據(jù)分區(qū)的時間范圍與數(shù)據(jù)的生命周期相匹配,具體的,與新增數(shù)據(jù)對應的數(shù)據(jù)分區(qū)的時間 范圍為進行新增操作的當前日期至無窮大,與修改后數(shù)據(jù)對應的數(shù)據(jù)分區(qū)的時間范圍為進 行修改操作的當前日期至無窮大,與修改前數(shù)據(jù)對應的數(shù)據(jù)分區(qū)的時間范圍為該數(shù)據(jù)的初 始開始時間至進行修改操作的當前日期,與刪除數(shù)據(jù)對應的數(shù)據(jù)分區(qū)的時間范圍為該數(shù)據(jù) 的初始開始時間至進行刪除操作的當前日期。在本申請實施例中,為了方便描述,以表1所示的各個數(shù)據(jù)分區(qū)分布為例進行說 明,表1中的各個表格中的信息具體為該數(shù)據(jù)分區(qū)所對應的時間范圍。其中,表1中的列(Column)中列出了根據(jù)各業(yè)務日期所建立的的數(shù)據(jù)分區(qū),行 (Row)中列出了時間范圍為在當前業(yè)務日期之前的各個日期到當前業(yè)務日期的各個數(shù)據(jù)分區(qū)。表1數(shù)據(jù)分區(qū)格式示意列表
權(quán)利要求
1.一種數(shù)據(jù)分析方法,其特征在于,包括以下步驟 根據(jù)不同的時間范圍創(chuàng)建相應的數(shù)據(jù)分區(qū);根據(jù)數(shù)據(jù)的生命周期,將所述數(shù)據(jù)存儲至時間范圍與所述生命周期相對應的數(shù)據(jù)分區(qū)中。
2.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)不同的時間范圍創(chuàng)建相應的數(shù)據(jù) 分區(qū),具體為根據(jù)當前時間所能對應的一個或多個時間范圍,分別創(chuàng)建一個或多個相對應的數(shù)據(jù)分 區(qū);或,根據(jù)當前各已存在數(shù)據(jù)的生命周期所對應的時間范圍,分別創(chuàng)建一個或多個相對應的 數(shù)據(jù)分區(qū)。
3.如權(quán)利要求1所述的方法,其特征在于,根據(jù)數(shù)據(jù)的生命周期,將所述數(shù)據(jù)存儲至時 間范圍與所述生命周期相對應的數(shù)據(jù)分區(qū)中,具體為將所述數(shù)據(jù)所對應的數(shù)據(jù)分配在相應的所述數(shù)據(jù)分區(qū),所述數(shù)據(jù)的生命周期與所述數(shù) 據(jù)分區(qū)的時間范圍相匹配;其中,所述數(shù)據(jù)分區(qū)的時間范圍為所述數(shù)據(jù)分區(qū)業(yè)務開始時間至結(jié)束時間。
4.如權(quán)利要求3所述的方法,其特征在于,所述數(shù)據(jù)的生命周期具體包括當所述數(shù)據(jù)為新增數(shù)據(jù)時,所述數(shù)據(jù)的生命周期為進行新增操作的當前日期至無窮大;當所述數(shù)據(jù)被修改時,修改后的數(shù)據(jù)的生命周期為進行修改操作的當前日期至無窮 大,修改前的數(shù)據(jù)的生命周期截止到進行修改操作的當前日期;當所述數(shù)據(jù)被刪除時,被刪除的數(shù)據(jù)的生命周期截止到進行刪除操作的當前日期。
5.如權(quán)利要求1所述的方法,其特征在于,還包括根據(jù)業(yè)務日期在當前存在的數(shù)據(jù)分區(qū)中確定與所述業(yè)務日期相匹配的數(shù)據(jù)分區(qū),并在 所述數(shù)據(jù)分區(qū)中獲取與所述業(yè)務日期對應的數(shù)據(jù)快照。
6.如權(quán)利要求5所述的方法,其特征在于,根據(jù)業(yè)務日期在當前存在的數(shù)據(jù)分區(qū)中確 定與所述業(yè)務日期相匹配的數(shù)據(jù)分區(qū),具體包括,當所述數(shù)據(jù)分區(qū)滿足,所述數(shù)據(jù)分區(qū)所對應時間范圍的開始時間< 所述業(yè)務日期 <所 述數(shù)據(jù)分區(qū)所對應時間范圍的結(jié)束時間時,所述數(shù)據(jù)分區(qū)與所述業(yè)務日期相匹配,確定所 述數(shù)據(jù)分區(qū)為與所述業(yè)務日期相匹配的數(shù)據(jù)分區(qū)。
7.如權(quán)利要求5所述的方法,其特征在于,所述在所述數(shù)據(jù)分區(qū)中獲取與所述業(yè)務日 期對應的數(shù)據(jù)快照,具體為將確定的與所述業(yè)務日期相匹配的所述數(shù)據(jù)分區(qū)進行合并操作,獲取與所述業(yè)務日期 對應的數(shù)據(jù)快照。
8.一種數(shù)據(jù)分析設(shè)備,其特征在于,包括創(chuàng)建模塊,用于根據(jù)不同的時間范圍創(chuàng)建相應的數(shù)據(jù)分區(qū);存儲模塊,與所述創(chuàng)建模塊相連接,用于根據(jù)數(shù)據(jù)的生命周期,將所述數(shù)據(jù)存儲至所述 創(chuàng)建模塊所創(chuàng)建的時間范圍與所述生命周期相對應的數(shù)據(jù)分區(qū)中。
9.如權(quán)利要求8所述的設(shè)備,其特征在于,所述創(chuàng)建模塊根據(jù)不同的時間范圍創(chuàng)建相 應的數(shù)據(jù)分區(qū),具體為所述創(chuàng)建模塊根據(jù)當前時間所能對應的一個或多個時間范圍,分別創(chuàng)建一個或多個相 對應的數(shù)據(jù)分區(qū);或,所述創(chuàng)建模塊根據(jù)當前各已存在數(shù)據(jù)的生命周期所對應的時間范圍,分別創(chuàng)建一個或 多個相對應的數(shù)據(jù)分區(qū)。
10.如權(quán)利要求8所述的設(shè)備,其特征在于,所述存儲模塊根據(jù)數(shù)據(jù)的生命周期,將所 述數(shù)據(jù)存儲至時間范圍與所述生命周期相對應的數(shù)據(jù)分區(qū)中,具體為所述存儲模塊將所述數(shù)據(jù)所對應的數(shù)據(jù)分配在相應的所述數(shù)據(jù)分區(qū),所述數(shù)據(jù)的生命 周期與所述數(shù)據(jù)分區(qū)的時間范圍相匹配;其中,所述數(shù)據(jù)分區(qū)的時間范圍為所述數(shù)據(jù)分區(qū)業(yè)務開始時間至結(jié)束時間; 所述數(shù)據(jù)的生命周期具體包括當所述數(shù)據(jù)為新增數(shù)據(jù)時,所述數(shù)據(jù)的生命周期為進行新增操作的當前日期至無窮大;當所述數(shù)據(jù)被修改時,修改后的數(shù)據(jù)的生命周期為進行修改操作的當前日期至無窮 大,修改前的數(shù)據(jù)的生命周期截止到進行修改操作的當前日期;當所述數(shù)據(jù)被刪除時,被刪除的數(shù)據(jù)的生命周期截止到進行刪除操作的當前日期。
11.如權(quán)利要求8所述的設(shè)備,其特征在于,還包括確定模塊和獲取模塊,所述確定模塊,與所述創(chuàng)建模塊相連接,用于根據(jù)業(yè)務日期在所述創(chuàng)建模塊所創(chuàng)建的 當前存在的數(shù)據(jù)分區(qū)中確定與所述業(yè)務日期相匹配的數(shù)據(jù)分區(qū);所述獲取模塊,與所述確定模塊相連接,用于在所述確定模塊所確定的數(shù)據(jù)分區(qū)中獲 取與所述業(yè)務日期對應的數(shù)據(jù)快照;
12.如權(quán)利要求11所述的設(shè)備,其特征在于, 所述確定模塊確定數(shù)據(jù)分區(qū)的具體方式包括當所述數(shù)據(jù)分區(qū)滿足,所述數(shù)據(jù)分區(qū)所對應時間范圍的開始時間< 所述業(yè)務日期 <所 述數(shù)據(jù)分區(qū)所對應時間范圍的結(jié)束時間時,所述數(shù)據(jù)分區(qū)與所述業(yè)務日期相匹配,確定所 述數(shù)據(jù)分區(qū)為與所述業(yè)務日期相匹配的數(shù)據(jù)分區(qū)。所述獲取模塊在所述數(shù)據(jù)分區(qū)中獲取與所述業(yè)務日期對應的數(shù)據(jù)快照的具體方式包括將確定的與所述業(yè)務日期相匹配的所述數(shù)據(jù)分區(qū)進行合并操作,獲取與所述業(yè)務日期 對應的數(shù)據(jù)快照。
全文摘要
本申請實施例公開了一種數(shù)據(jù)分析方法和設(shè)備,通過數(shù)據(jù)的生命周期將數(shù)據(jù)存儲在數(shù)據(jù)分區(qū)中實現(xiàn)了數(shù)據(jù)存儲的不重復性,降低了容納相同數(shù)目的快照總?cè)萘?,?jié)省了數(shù)據(jù)預處理的時間,并將數(shù)據(jù)預處理的時間控制在常規(guī)的增量合并的時間范圍內(nèi),對獲取的與業(yè)務日期相對應的數(shù)據(jù)分區(qū)進行合并獲取對應的數(shù)據(jù)快照,提高了取快照的效率并降低了取快照的復雜程度。
文檔編號G06F12/02GK102141963SQ20101010229
公開日2011年8月3日 申請日期2010年1月28日 優(yōu)先權(quán)日2010年1月28日
發(fā)明者張清 申請人:阿里巴巴集團控股有限公司