專利名稱:用于存儲多維知識的數(shù)據(jù)倉庫模型的制作方法
技術(shù)領(lǐng)域:
本發(fā)明主要涉及數(shù)據(jù)倉庫和數(shù)據(jù)挖掘領(lǐng)域,尤其涉及一種用于存儲多維知識的數(shù) 據(jù)倉庫模型。
背景技術(shù):
數(shù)據(jù)倉庫主要功能是將政府、企業(yè)等組織通過在線交易處理系統(tǒng)(OLTP)長年累 月所累積的海量數(shù)據(jù),通過數(shù)據(jù)倉庫理論所特有的數(shù)據(jù)存儲架構(gòu),進(jìn)行有系統(tǒng)的分析整理, 以便進(jìn)行各種分析方法如在線分析處理(OLAP)、數(shù)據(jù)挖掘(Data Mining),并進(jìn)而支持如決 策支持系統(tǒng)(DSS)、主管信息系統(tǒng)(EIS)等的建立,幫助決策者能從海量數(shù)據(jù)中快速有效的 分析出有價值的信息,以便制定決策及快速應(yīng)對外界環(huán)境的變動,幫助建構(gòu)商業(yè)智能(Bi)。一般來說,數(shù)據(jù)倉庫可由關(guān)系數(shù)據(jù)庫,或?qū)閿?shù)據(jù)倉庫開發(fā)的多維度數(shù)據(jù)庫建立, 其架構(gòu)可分為星狀及雪花狀架構(gòu),包含數(shù)個維度數(shù)據(jù)表,及一個事實數(shù)據(jù)表?,F(xiàn)有數(shù)據(jù)倉庫 的主要問題在于數(shù)據(jù)倉庫缺乏一個有堅實理論基礎(chǔ)的知識模型,無法把其中存儲的海量 數(shù)據(jù)提升到知識的高度,因此也就難以實現(xiàn)數(shù)據(jù)倉庫的最終目標(biāo)——知識發(fā)現(xiàn)。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種用于存儲多維知識的數(shù)據(jù)倉庫模型,能夠?qū)崿F(xiàn)知識發(fā) 現(xiàn)、實現(xiàn)知識無限關(guān)聯(lián)并快速找到所需的知識,以克服現(xiàn)有技術(shù)存在的上述不足。本發(fā)明的目的是通過以下技術(shù)方案來實現(xiàn)一種用于存儲多維知識的數(shù)據(jù)倉庫模型,包括絕對維層,其包括絕對時間維模塊、絕對地點維模塊、主分類維模塊,其中時間維 模塊分為年、月、日、時、分、秒多個級別,地點維模塊分為國家、省、市、區(qū)縣、鄉(xiāng)鎮(zhèn)以及街道 多個級別,主分類維模塊分為若干副分類維模塊;集合層,其包括事件模塊、組織模塊、關(guān)系模塊,集合層通過其內(nèi)部的相對維層包 含實體層;相對維層,其包括相對時間維模塊、相對地點維模塊、角色維模塊,其中時間維模 塊為過去、現(xiàn)在和將來,相對地點維模塊為東、西、南、北以及中,角色維模塊為組織機構(gòu)里 面的職位劃分以及合同書里面的甲方乙方;實體層,其包括人員模塊、物品模塊、聯(lián)系方式模塊;所述絕對維層、集合層、相對維層和實體層都是由節(jié)點組成,節(jié)點是知識模型中的 最小單元,節(jié)點有兩個基本參數(shù)即亮度和狀態(tài),其中亮度為此節(jié)點點亮以后有多亮;狀態(tài)為 此節(jié)點亮了沒有,狀態(tài)分為三種即暗、照亮、點亮;所述數(shù)據(jù)倉庫還包括以下表地點維表、主分類維表、副分類維表、相對維表、基本 實體集合表、擴展實體集合表;所述數(shù)據(jù)倉庫的抽取、轉(zhuǎn)換、加載過程需要把原始數(shù)據(jù)導(dǎo)入到數(shù)據(jù)倉庫中,原始數(shù) 據(jù)表的字段可以分為五類實體標(biāo)識字段、相對維字段、集合標(biāo)識字段、絕對維字段和原始數(shù)據(jù)定位字段,其中實體標(biāo)識字段包括人員編號、物品編號、聯(lián)系方式編號;相對維字段包 括時間維、地點維、角色維;集合標(biāo)識字段包括事件編號、組織編號、關(guān)系編號;絕對維字段 包括時間維、經(jīng)度維、緯度維、地點維、分類維;原始數(shù)據(jù)定位字段可以是一個或多個字段。本發(fā)明的有益效果為容納時間模塊、地點模塊、分類模塊等多維度知識,以及事 件活動、組織機構(gòu)、親屬關(guān)系、通話記錄、航班、酒店等多種集合,還有人員、物品、房產(chǎn)、機動 車輛、聯(lián)系方式、銀行賬號等多種實體?,F(xiàn)有的社交網(wǎng)站、知識網(wǎng)站、信息追蹤和軌跡研判等 系統(tǒng),能夠?qū)崿F(xiàn)知識發(fā)現(xiàn)、實現(xiàn)知識無限關(guān)聯(lián)并快速找到所需的知識。
下面根據(jù)附圖對本發(fā)明作進(jìn)一步詳細(xì)說明。圖1是本發(fā)明實施例所述的用于存儲多維知識的數(shù)據(jù)倉庫模型框圖。
具體實施例方式如圖1所示,本發(fā)明實施例所述的一種用于存儲多維知識的數(shù)據(jù)倉庫模型,包括 絕對維層,包括絕對時間維模塊、絕對地點維模塊、主分類維模塊,其中時間維模塊分為年、 月、日、時、分、秒多個級別,地點維模塊分為國家、省、市、區(qū)縣、鄉(xiāng)鎮(zhèn)以及街道多個級別,主 分類維模塊分為若干副分類維模塊;集合層,包括事件模塊、組織模塊、關(guān)系模塊,集合層通 過其內(nèi)部的相對維層包含實體層;相對維層,包括相對時間維模塊、相對地點維模塊、角色 維模塊,其中時間維模塊為過去、現(xiàn)在和將來,相對地點維模塊為東、西、南、北以及中,角色 維模塊為組織機構(gòu)里面的職位劃分以及合同書里面的甲方乙方;實體層,包括人員模塊、物 品模塊、聯(lián)系方式模塊,例如,一個人、一件物品、一張照片、一個電子郵箱都是唯一的,都是 實體。集合層為聯(lián)系為一體的維度和實體,其中維度位于知識模型的底層,而實體位于 知識模型的頂層。集合占據(jù)一定的時間維、地點維和主分類維,并包含一個或多個實體。一 個集合可以包含一個或多個實體,一個實體也可以從屬于一個或多個集合,組織機構(gòu)、事件 活動、好友圈子、人際關(guān)系、物權(quán)關(guān)系這些都是集合,集合并不直接包含實體,而是通過集合 內(nèi)部的維度包含實體。集合外部的維度稱為絕對維,集合內(nèi)部的維度稱為相對維,相對維 也分為相對時間維、相對地點維、相對分類維(或者叫角色維)。每個維是由多個維節(jié)點組 成的,每個集合是由多個集合節(jié)點組成的,每個實體是由多個實體節(jié)點組成的。所述絕對維 層、集合層、相對維層和實體層都是由節(jié)點組成,節(jié)點是知識模型中的最小單元,節(jié)點有兩 個基本參數(shù)即亮度和狀態(tài),其中亮度為此節(jié)點點亮以后有多亮;狀態(tài)為此節(jié)點亮了沒有,狀 態(tài)分為三種即暗、照亮、點亮;節(jié)點是本發(fā)明的最小單元,節(jié)點有多種表現(xiàn)形式,在前臺頁面 的網(wǎng)狀圖里,節(jié)點表現(xiàn)為網(wǎng)絡(luò)節(jié)點;在后臺的數(shù)據(jù)倉庫里,節(jié)點表現(xiàn)為一條數(shù)據(jù);在一篇文 章里,節(jié)點表現(xiàn)為一句話;在用戶對知識模型的操作中,節(jié)點表現(xiàn)為用戶增加的一條知識。 在不進(jìn)行知識查找時,所有的節(jié)點都是暗的;在進(jìn)行知識查找時,其中一小部分節(jié)點會被點 亮,點亮的節(jié)點又會照亮跟它連接的另外一些節(jié)點,這些節(jié)點中的一部分又會被點亮,這樣 不斷向外發(fā)展,就會形成一條條連續(xù)不斷的查找路徑。由于知識庫中的節(jié)點是普遍聯(lián)系的, 所以不管從哪個節(jié)點出發(fā),都能到達(dá)其它任意一個節(jié)點。所有節(jié)點的亮度都是同一個初始值,也就是說所有節(jié)點的亮度都相同,節(jié)點的亮度會在3種因素的影響下發(fā)生變化,3種因素為時間、點亮次數(shù)、評價,時間越長,節(jié)點的亮 度越小,亮度越小亮度的減小速度越慢,最終會趨近于0 ;每點亮一次,節(jié)點的亮度就會變 大一些,亮度越大亮度的增加速度越慢,最終會趨近于一個最大亮度;評價越高,亮度也越 高。亮度隨時間變化曲線和亮度隨點亮次數(shù)變化曲線疊加起來,就形成了總的亮度變化曲 線??偟牧炼惹€為一開始為亮度初始值,然后較快地增加,達(dá)到亮度最大值,然后下降, 下降速度越來越慢,最后趨近于0;節(jié)點的亮度曲線,基本上能夠反映現(xiàn)實世界的真實情 況。一個節(jié)點被點亮以后,一方面,它能照亮與它直接連接的其它節(jié)點;另一方面,它能照亮 與它距離較近的其它節(jié)點,節(jié)點亮度越高,它的照亮距離越大,照亮范圍也越大。所述數(shù)據(jù)倉庫還包括以下表地點維表、主分類維表、副分類維表、相對維表、基本 實體集合表、擴展實體集合表;地點維表 主分類維表 副分類維表 相對維表 基本實體集合表 擴展實體集合表 所述數(shù)據(jù)倉庫的抽取、轉(zhuǎn)換、加載過程需要把原始數(shù)據(jù)導(dǎo)入到數(shù)據(jù)倉庫中,原始數(shù) 據(jù)表的字段可以分為五類實體標(biāo)識字段、相對維字段、集合標(biāo)識字段、絕對維字段和原始 數(shù)據(jù)定位字段,其中實體標(biāo)識字段包括人員編號、物品編號、聯(lián)系方式編號;相對維字段包 括時間維、地點維、角色維;集合標(biāo)識字段包括事件編號、組織編號、關(guān)系編號;絕對維字段 包括時間維、經(jīng)度維、緯度維、地點維、分類維;原始數(shù)據(jù)定位字段可以是一個或多個字段。每個表都至少有1個核心字段,這個核心字段可以是實體標(biāo)識字段、相對維字段、 集合標(biāo)識字段、絕對維字段,核心字段一般不為空。展現(xiàn)界面采用基于Web (互聯(lián)網(wǎng))的RIA(富因特網(wǎng)應(yīng)用)技術(shù),主要包括登錄頁 面、瀏覽頁面、導(dǎo)航窗口、坐標(biāo)軸窗口、集合實體展開窗口、集合實體過濾窗口。登錄頁面比 較簡單,包含用戶名、密碼等輸入框,與普通Web登錄頁面一樣。瀏覽頁面是瀏覽數(shù)據(jù)倉庫 中的數(shù)據(jù)的主頁面。它采用單體RIA,包含多個相同的標(biāo)簽頁,可以打開或者關(guān)閉標(biāo)簽頁,類 似于Web瀏覽器。每個標(biāo)簽頁的左側(cè)是工具條,工具條上有多個按鈕,點擊按鈕可以彈出某 個功能窗口,功能窗口在上側(cè)和右側(cè)浮動。工具條包括主頁、歷史、收藏夾、地址導(dǎo)航、搜索 導(dǎo)航、圖形控制、過濾、收藏、導(dǎo)出、打印、選項等。標(biāo)簽頁的主體部分是一個以圖形化方式顯 示數(shù)據(jù)倉庫中的多維知識的坐標(biāo)系,坐標(biāo)系有X軸、Y軸和Z軸,分別顯示時間維、地點維和 主分類維。坐標(biāo)系中分布著由節(jié)點和連線組成的網(wǎng)絡(luò),節(jié)點代表集合和實體,連線代表相對 維,通過點擊工具條和坐標(biāo)系,可以實現(xiàn)數(shù)據(jù)倉庫的切片、旋轉(zhuǎn)、上鉆、下鉆等操作。導(dǎo)航窗 口是瀏覽頁面中的一個功能窗口,功能窗口通過點擊工具條彈出的,功能窗口分為地址導(dǎo) 航窗口和搜索導(dǎo)航窗口,地址導(dǎo)航窗口為按照三個維(時間維、地點維和主分類維)進(jìn)行導(dǎo)航,搜索導(dǎo)航窗口是按照關(guān)鍵詞進(jìn)行導(dǎo)航。坐標(biāo)軸窗口是瀏覽頁面中的一個功能窗口,它是 通過雙擊坐標(biāo)軸彈出的,它的作用是進(jìn)行維度的切片和上鉆、下鉆,維度的旋轉(zhuǎn)是通過圖形 控制窗口完成的。集合實體展開窗口是瀏覽頁面中的一個功能窗口,它是通過雙擊坐標(biāo)系 中的某個集合或?qū)嶓w而彈出的。在坐標(biāo)系的某個坐標(biāo)點上,有時可能有多個集合或?qū)嶓w,這 些集合和實體會互相重疊,上面的會蓋住下面的。在這種情況下,該點的集合或?qū)嶓w的圖標(biāo) 上會出現(xiàn)一個加號,點擊它就會彈出集合實體展開窗口,在窗口中會清楚明白地展現(xiàn)出各 個集合和實體,集合實體過濾窗口是瀏覽頁面中的一個功能窗口,通過點擊工具條彈出的。
權(quán)利要求
一種用于存儲多維知識的數(shù)據(jù)倉庫模型,其特征在于,其包括絕對維層,其包括絕對時間維模塊、絕對地點維模塊、主分類維模塊,其中時間維模塊分為年、月、日、時、分、秒多個級別,地點維模塊分為國家、省、市、區(qū)縣、鄉(xiāng)鎮(zhèn)以及街道多個級別,主分類維模塊分為若干副分類維模塊;集合層,其包括事件模塊、組織模塊、關(guān)系模塊,集合層通過其內(nèi)部的相對維層包含實體層;相對維層,其包括相對時間維模塊、相對地點維模塊、角色維模塊,其中時間維模塊為過去、現(xiàn)在和將來,相對地點維模塊為東、西、南、北、中,角色維模塊為組織機構(gòu)里面的職位劃分以及合同書里面的甲方乙方;實體層包括人員模塊、物品模塊、聯(lián)系方式模塊。
2.根據(jù)權(quán)利要求1所述的用于存儲多維知識的數(shù)據(jù)倉庫模型,其特征在于所述絕對 維層、集合層、相對維層和實體層都是由節(jié)點組成,節(jié)點是知識模型中的最小單元,節(jié)點有 兩個基本參數(shù)即亮度和狀態(tài),其中亮度為此節(jié)點點亮以后有多亮;狀態(tài)為此節(jié)點亮了沒有, 狀態(tài)分為三種即暗、照亮、點亮。
3.根據(jù)權(quán)利要求1或2所述的用于存儲多維知識的數(shù)據(jù)倉庫模型,其特征在于,所述數(shù) 據(jù)倉庫還包括以下表地點維表、主分類維表、副分類維表、相對維表、基本實體集合表、擴 展實體集合表。
4.根據(jù)權(quán)利要求1或2所述的用于存儲多維知識的數(shù)據(jù)倉庫模型,其特征在于所述 數(shù)據(jù)倉庫的抽取、轉(zhuǎn)換、加載過程需要把原始數(shù)據(jù)導(dǎo)入到數(shù)據(jù)倉庫中,原始數(shù)據(jù)表的字段可 以分為五類實體標(biāo)識字段、相對維字段、集合標(biāo)識字段、絕對維字段和原始數(shù)據(jù)定位字段, 其中實體標(biāo)識字段包括人員編號、物品編號、聯(lián)系方式編號;相對維字段包括時間維、地點 維、角色維;集合標(biāo)識字段包括事件編號、組織編號、關(guān)系編號;絕對維字段包括時間維、經(jīng) 度維、緯度維、地點維、分類維;原始數(shù)據(jù)定位字段是一個或多個字段。
全文摘要
本發(fā)明涉及一種用于存儲多維知識的數(shù)據(jù)倉庫模型,包括絕對維層,包括絕對時間維模塊、絕對地點維模塊、主分類維模塊;集合層,包括事件模塊、組織模塊、關(guān)系模塊;相對維層,包括相對時間維模塊、相對地點維模塊、角色維模塊;實體層,包括人員模塊、物品模塊、聯(lián)系方式模塊。本發(fā)明的有益效果為容納時間模塊、地點模塊、分類模塊等多維度知識,以及事件活動、組織機構(gòu)、親屬關(guān)系、通話記錄、航班、酒店等多種集合,能夠?qū)崿F(xiàn)知識發(fā)現(xiàn)、實現(xiàn)知識無限關(guān)聯(lián)并快速找到所需的知識。
文檔編號G06F17/30GK101882164SQ20101022841
公開日2010年11月10日 申請日期2010年7月16日 優(yōu)先權(quán)日2010年7月16日
發(fā)明者張為斌 申請人:張為斌