欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)模型的方法與裝置的制造方法

文檔序號(hào):9274722閱讀:336來(lái)源:國(guó)知局
構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)模型的方法與裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別地涉及一種構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)模型的方法與裝置。
【背景技術(shù)】
[0002] 隨著電子商務(wù)的發(fā)展,例如京東、淘寶、亞馬遜等日常運(yùn)營(yíng)中生成、累積的大量用 戶(hù)、商品、生產(chǎn)相關(guān)的數(shù)據(jù)呈現(xiàn)爆發(fā)式增長(zhǎng),數(shù)據(jù)結(jié)構(gòu)也開(kāi)始多元化,數(shù)據(jù)中含有的信息越 來(lái)越多,公司對(duì)數(shù)據(jù)化運(yùn)營(yíng)也越來(lái)越關(guān)注。數(shù)據(jù)倉(cāng)庫(kù)用于對(duì)數(shù)據(jù)進(jìn)行分處理工作,發(fā)揮著巨 大的作用。然而,大數(shù)據(jù)時(shí)代的降臨數(shù)據(jù)倉(cāng)庫(kù)慢慢轉(zhuǎn)成分布式架構(gòu),以滿(mǎn)足爆發(fā)式增長(zhǎng)的計(jì) 算以及存儲(chǔ)的要求。
[0003] 基于傳統(tǒng)行業(yè),例如銀行、保險(xiǎn)、零售等的數(shù)據(jù)倉(cāng)庫(kù)模型標(biāo)準(zhǔn)化的構(gòu)建方法已經(jīng)非 常成熟。現(xiàn)有技術(shù)的做法為基于Teradata數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)之上,零售企業(yè)的數(shù)據(jù)倉(cāng)庫(kù)的構(gòu)建 和主題分析,主要構(gòu)建過(guò)程包括:業(yè)務(wù)建模、領(lǐng)域建模、邏輯建模以及物理建模。具體的,業(yè) 務(wù)建模生成業(yè)務(wù)模型,用于解決業(yè)務(wù)層面的分解和程序化;領(lǐng)域建模生成領(lǐng)域模型,用于對(duì) 業(yè)務(wù)模型進(jìn)行抽象處理生成領(lǐng)域概念模型;邏輯建模生成邏輯模型,用于將領(lǐng)域模型的概 念實(shí)體化以及將實(shí)體之間的關(guān)系進(jìn)行基于數(shù)據(jù)庫(kù)層次的邏輯化;物理建模生成物理模型, 用于解決邏輯模型針對(duì)不同關(guān)系型數(shù)據(jù)庫(kù)的物理化以及性能等問(wèn)題。
[0004] 進(jìn)一步地,基于Teradata的零售數(shù)據(jù)倉(cāng)庫(kù)模型,利用商業(yè)化的oracle集群和傳 統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)建模方法論構(gòu)建stage層,通過(guò)ETL過(guò)程抽取源生產(chǎn)系統(tǒng)數(shù)據(jù);構(gòu)建ods層, 對(duì)stage層進(jìn)行清洗和加工;構(gòu)建dwd層,基于邏輯模型搭建實(shí)體表及實(shí)體表的關(guān)系;構(gòu)建 dwa層,基于主題模型和邏輯關(guān)系將dwd層數(shù)據(jù)編譯處理到dwa層。
[0005] 但現(xiàn)有技術(shù)存在以下缺點(diǎn):數(shù)據(jù)倉(cāng)庫(kù)基于商業(yè)化的數(shù)據(jù)倉(cāng)庫(kù)平臺(tái),存在資源不足, 計(jì)算性能有限的問(wèn)題,無(wú)法充分良好的擴(kuò)充資源,且傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)建模層次繁多,依賴(lài)關(guān) 系復(fù)雜,模型變更繁瑣,進(jìn)一步地,由于電子商務(wù)的業(yè)務(wù)正在高速發(fā)展,現(xiàn)有模型無(wú)法快速 響應(yīng)業(yè)務(wù)的快速變化,具有技術(shù)的滯后性。

【發(fā)明內(nèi)容】

[0006] 有鑒于此,本發(fā)明提供一種構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)模型的方法,通過(guò)易用性。本發(fā)明還公開(kāi) 了一種構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)模型的裝置。
[0007] 為實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供了一種構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)模型的方法, 包括:
[0008] 對(duì)業(yè)務(wù)模型執(zhí)行抽象處理生成領(lǐng)域模型;將所述領(lǐng)域模型根據(jù)多個(gè)主題名稱(chēng)分拆 為多個(gè)主題模型;以及通過(guò)所述多個(gè)主題模型構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)模型。
[0009] 可選地,所述領(lǐng)域模型包括:網(wǎng)站前端模型、電子零售模型、供應(yīng)鏈模型、售后模型 以及倉(cāng)儲(chǔ)模型。
[0010] 可選地,所述多個(gè)主題名稱(chēng)包括:客戶(hù)、組織機(jī)構(gòu)、商品、訂單、賬戶(hù)、客戶(hù)端、營(yíng)銷(xiāo)、 倉(cāng)儲(chǔ)、配送、客服、地理區(qū)域、財(cái)務(wù)、社區(qū)、流量以及供應(yīng)鏈。
[0011] 可選地,所述多個(gè)主題模型的參數(shù)包括:主題前綴、主題名稱(chēng)、簡(jiǎn)稱(chēng)以及業(yè)務(wù)覆蓋 范圍。
[0012] 可選地,通過(guò)所述多個(gè)主題模型構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)模型具體包括:將所述多個(gè)主題模 型依次經(jīng)過(guò)緩沖數(shù)據(jù)層、基礎(chǔ)數(shù)據(jù)層、通用數(shù)據(jù)層以及聚合數(shù)據(jù)層執(zhí)行裝載,構(gòu)建所述數(shù)據(jù) 倉(cāng)庫(kù)模型。
[0013] 為實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的另一個(gè)方面,提供了一種構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)模型的裝 置,包括:
[0014] 領(lǐng)域模型生成模塊,用于對(duì)業(yè)務(wù)模型執(zhí)行抽象處理生成領(lǐng)域模型;主題模型分拆 模塊,用于將所述領(lǐng)域模型根據(jù)多個(gè)主題名稱(chēng)分拆為多個(gè)主題模型;以及數(shù)據(jù)倉(cāng)庫(kù)模型構(gòu) 建模塊,用于通過(guò)所述多個(gè)主題模型構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)模型。
[0015] 可選地,所述領(lǐng)域模型包括:網(wǎng)站前端模型、電子零售模型、供應(yīng)鏈模型、售后模型 以及倉(cāng)儲(chǔ)模型。
[0016] 可選地,所述多個(gè)主題名稱(chēng)包括:客戶(hù)、組織機(jī)構(gòu)、商品、訂單、賬戶(hù)、客戶(hù)端、營(yíng)銷(xiāo)、 倉(cāng)儲(chǔ)、配送、客服、地理區(qū)域、財(cái)務(wù)、社區(qū)、流量以及供應(yīng)鏈。
[0017] 可選地,所述多個(gè)主題模型的參數(shù)包括:主題前綴、主題名稱(chēng)、簡(jiǎn)稱(chēng)以及業(yè)務(wù)覆蓋 范圍。
[0018] 可選地,所述數(shù)據(jù)倉(cāng)庫(kù)模型構(gòu)建模塊具體包括:裝載單元,用于將所述多個(gè)主題模 型依次經(jīng)過(guò)緩沖數(shù)據(jù)層、基礎(chǔ)數(shù)據(jù)層、通用數(shù)據(jù)層以及聚合數(shù)據(jù)層執(zhí)行裝載,構(gòu)建所述數(shù)據(jù) 倉(cāng)庫(kù)模型。
[0019] 根據(jù)本發(fā)明的技術(shù)方案,本發(fā)明提出了一種構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)模型的方法,基于電子 商務(wù)業(yè)務(wù),提出了完整的多個(gè)主題模型,有利于充分、有效的實(shí)現(xiàn)數(shù)據(jù)分析和挖掘,同時(shí)通 過(guò)分布式數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)模型,即緩沖數(shù)據(jù)層、基礎(chǔ)數(shù)據(jù)層、通用數(shù)據(jù)層、聚合數(shù)據(jù)層、維度數(shù) 據(jù)庫(kù)、以及計(jì)算中間庫(kù)(臨時(shí)數(shù)據(jù)庫(kù)),且以hadoop為平臺(tái),hive作為數(shù)據(jù)模型構(gòu)建工具, 有效提升了數(shù)據(jù)的穩(wěn)定性、可擴(kuò)展性,為構(gòu)建基于分布式數(shù)據(jù)倉(cāng)庫(kù)提供了一套完整的模型 體系。本發(fā)明還公開(kāi)了一種構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)模型的裝置。
【附圖說(shuō)明】
[0020] 附圖用于更好地理解本發(fā)明,不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。其中:
[0021] 圖1是根據(jù)本發(fā)明實(shí)施例的一種構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)模型的方法的步驟流程圖;以及
[0022] 圖2是根據(jù)本發(fā)明實(shí)施例的一種構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)模型的裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0023] 以下結(jié)合附圖對(duì)本發(fā)明的示范性實(shí)施方式做出說(shuō)明,其中包括本發(fā)明實(shí)施方式的 各種細(xì)節(jié)以助于理解,應(yīng)當(dāng)將它們認(rèn)為僅僅是示范性的。因此,本領(lǐng)域普通技術(shù)人員應(yīng)當(dāng)認(rèn) 識(shí)到,可以對(duì)這里描述的實(shí)施方式做出各種改變和修改,而不會(huì)背離本發(fā)明的范圍和精神。 同樣,為了清楚和簡(jiǎn)明,以下的描述中省略了對(duì)公知功能和結(jié)構(gòu)的描述。
[0024] 本發(fā)明提出的一種構(gòu)架數(shù)據(jù)倉(cāng)庫(kù)模型的方法為基于B2C(Business-t〇-Customer, 商對(duì)客)的電子商務(wù)業(yè)務(wù)的數(shù)據(jù)倉(cāng)庫(kù)模型標(biāo)準(zhǔn)化的構(gòu)建方法,以B2C電子商務(wù)為業(yè)務(wù)基礎(chǔ), 區(qū)別于傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)模型的構(gòu)建方法。
[0025] 如圖1所示,本發(fā)明實(shí)施例的一種構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)模型的方法的步驟流程圖。構(gòu)建 數(shù)據(jù)倉(cāng)庫(kù)模型的方法,包括以下具體步驟:
[0026] 步驟S1 :對(duì)業(yè)務(wù)模型執(zhí)行抽象處理生成領(lǐng)域模型。其中,領(lǐng)域模型包括:網(wǎng)站前端 模型、電子零售模型、供應(yīng)鏈模型、售后模型以及倉(cāng)儲(chǔ)模型。由此,提高了針對(duì)業(yè)務(wù)抽象出來(lái) 的領(lǐng)域多樣性與適用性。
[0027] 步驟S2 :將領(lǐng)域模型根據(jù)多個(gè)主題名稱(chēng)分拆為多個(gè)主題模型。其中,多個(gè)主題名 稱(chēng)包括:客戶(hù)、組織機(jī)構(gòu)、商品、訂單、賬戶(hù)、客戶(hù)端、營(yíng)銷(xiāo)、倉(cāng)儲(chǔ)、配送、客服、地理區(qū)域、財(cái)務(wù)、 社區(qū)、流量以及供應(yīng)鏈,且多個(gè)主題模型參數(shù)包括:主題前綴、主題名稱(chēng)、簡(jiǎn)稱(chēng)以及業(yè)務(wù)覆蓋 范圍。由此,通過(guò)在領(lǐng)域模型中按照多個(gè)主題名稱(chēng)拆分提出多個(gè)主題的方式,有效的實(shí)現(xiàn)了 精確數(shù)據(jù)的分析和挖掘。具體對(duì)應(yīng)關(guān)系,如下表所示:
[0028]
[00291-步驟S3 :通過(guò)多個(gè)主題模型構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)模型。 '
[0030] 具體地,通過(guò)多個(gè)主題模型構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)模型具體包括:將多個(gè)主題模型依次經(jīng) 過(guò)緩沖數(shù)據(jù)層、基礎(chǔ)數(shù)據(jù)層、通用數(shù)據(jù)層以及聚合數(shù)據(jù)層執(zhí)行裝載,構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)模型。其 中,緩沖數(shù)據(jù)層從源系統(tǒng)將數(shù)據(jù)抽取到本層,數(shù)據(jù)以文件的形式入到hadoop本地;基礎(chǔ)數(shù) 據(jù)層將緩沖層的數(shù)據(jù),通過(guò)拉鏈的方式加工到本層中;通用數(shù)據(jù)層根據(jù)業(yè)務(wù)模型,將基礎(chǔ)層 數(shù)據(jù)通過(guò)業(yè)務(wù)邏輯加工成主題數(shù)據(jù);聚合數(shù)據(jù)層按維度,將基礎(chǔ)層或通用層數(shù)據(jù)通過(guò)匯總 邏輯加工成聚合數(shù)據(jù)。
[0031] 進(jìn)一步地,數(shù)據(jù)模型中的維度數(shù)據(jù)層從源系統(tǒng)中抽取維度相關(guān)數(shù)據(jù),入到本層中。 由此,實(shí)現(xiàn)了用戶(hù)從多種維度分析數(shù)據(jù)的可行性;臨時(shí)數(shù)據(jù)層用于臨時(shí)數(shù)據(jù)加工、存儲(chǔ)的 層。由此,通過(guò)對(duì)臨時(shí)數(shù)據(jù)的堆放和緩存操作,有效提高了多個(gè)主題模型在多層執(zhí)行裝載的 速率。
[0032] 為了更好的理解通過(guò)多個(gè)主題模型構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)模型,進(jìn)行以下示例:基于電 子商務(wù)的分布式數(shù)據(jù)倉(cāng)庫(kù),通過(guò)hadoop平臺(tái),利用hive作為數(shù)據(jù)倉(cāng)庫(kù)工具,商品主題的 數(shù)據(jù)倉(cāng)庫(kù)模型構(gòu)建過(guò)程:通過(guò)ETL過(guò)程,將商品相關(guān)的線(xiàn)上源系統(tǒng)的數(shù)據(jù),抽取并裝載到 BDM(Buffering Data Model,緩沖數(shù)據(jù)層),表名 bdm_item_01,bdm_item_02, bdm_item_03 等,通過(guò)加工腳本,將BDM層數(shù)據(jù)表,加工生成到FDM(Fundamental Data Model,基礎(chǔ)數(shù)據(jù) 層),相對(duì)應(yīng)的表名fdm_item_01,fdm_item_02,fdm_item_03等,繼而通過(guò)hive腳本,將 FDM層的數(shù)據(jù)加工到GDM(General Data Model,通用數(shù)據(jù)層),表名gdm_m03_item,同時(shí), FDM層或GDM層表,可以加工得到ADM(Aggregative Data Model,聚合數(shù)據(jù)層),表名adm_ m03_item,gdm和adm表,作為商品主題模型的物理表。
[0033] 根據(jù)本發(fā)明實(shí)施例的構(gòu)架數(shù)據(jù)倉(cāng)庫(kù)模型的方法,基于
當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
莫力| 麻城市| 阳城县| 荥阳市| 溧水县| 班玛县| 宝应县| 乌拉特中旗| 陆河县| 弥渡县| 香港| 广西| 临海市| 土默特右旗| 新密市| 泰宁县| 洪泽县| 沁源县| 郓城县| 科技| 宁津县| 东乡族自治县| 体育| 化州市| 宜章县| 巩留县| 佳木斯市| 吉隆县| 娱乐| 天水市| 达尔| 登封市| 旬阳县| 江西省| 昌江| 盐池县| 都兰县| 栖霞市| 顺平县| 昭苏县| 明水县|