一種提供數(shù)據(jù)的方法及裝置制造方法
【專利摘要】本申請公開了一種提供數(shù)據(jù)的方法及裝置,用以解決現(xiàn)有技術中浪費數(shù)據(jù)倉庫的計算資源,提供數(shù)據(jù)的效率較低的問題。該方法預先在數(shù)據(jù)倉庫的IDS中保存通用指標數(shù)據(jù),當數(shù)據(jù)倉庫接收到用戶發(fā)送的數(shù)據(jù)獲取請求時,直接從IDS預先保存的通用指標數(shù)據(jù)中查找該數(shù)據(jù)獲取請求中攜帶的指標標識信息對應的通用指標數(shù)據(jù),并提供給用戶。通過上述方法,數(shù)據(jù)倉庫在向用戶提供通用指標數(shù)據(jù)時,可直接將預先保存在IDS中的通用指標數(shù)據(jù)提供給用戶,而無需將源數(shù)據(jù)從最底層的ODS開始逐層向上處理得到指標數(shù)據(jù),再提供給用戶,因此可有效節(jié)省數(shù)據(jù)倉庫的計算資源,也提高了提供數(shù)據(jù)的效率。
【專利說明】一種提供數(shù)據(jù)的方法及裝置
【技術領域】
[0001] 本申請涉及計算機【技術領域】,特別涉及一種提供數(shù)據(jù)的方法及裝置。
【背景技術】
[0002] 目前,數(shù)據(jù)倉庫主要分為四層:源數(shù)據(jù)層(0DS)、視圖層(BDS)、主題寬表層(IDS)、 應用層(ADS)。這四層的邏輯層級關系從上到下依次是:ADS、IDS、BDS、0DS。
[0003] 在現(xiàn)有技術中,當用戶根據(jù)其需要獲取某些指標數(shù)據(jù)時,數(shù)據(jù)倉庫需要先從ODS 中提取出相應的源數(shù)據(jù),再通過BDS對提取的源數(shù)據(jù)進行數(shù)據(jù)清洗,然后通過IDS根據(jù)用戶 的需要對清洗后的數(shù)據(jù)進行計算和匯總,得到用戶所需的指標數(shù)據(jù),最后通過ADS將用戶 所需的指標數(shù)據(jù)提供給能給用戶。
[0004] 其中,指標數(shù)據(jù)是指對數(shù)據(jù)倉庫中的某些源數(shù)據(jù)按照某個維度進行計算統(tǒng)計得到 的數(shù)據(jù),如,根據(jù)數(shù)據(jù)倉庫中最近1個月內(nèi)的交易數(shù)據(jù)(源數(shù)據(jù)),統(tǒng)計最近一個月內(nèi)的訂單 金額,該訂單金額就是得到的指標數(shù)據(jù)。
[0005] 然而,在現(xiàn)有技術中,無論各用戶要獲取的指標數(shù)據(jù)是否相同,數(shù)據(jù)倉庫均需要從 最底層的0DS開始,依次經(jīng)過ODS、BDS、IDS、ADS才能將相應的指標數(shù)據(jù)提供給用戶,這顯 然會浪費數(shù)據(jù)倉庫大量的計算資源,也降低了提供數(shù)據(jù)的效率。
【發(fā)明內(nèi)容】
[0006] 本申請實施例提供一種提供數(shù)據(jù)的方法及裝置,用以解決現(xiàn)有技術中浪費數(shù)據(jù)倉 庫的計算資源,提供數(shù)據(jù)的效率較低的問題。
[0007] 本申請實施例提供的一種提供數(shù)據(jù)的方法,包括:
[0008] 預先對數(shù)據(jù)倉庫中保存的源數(shù)據(jù)進行統(tǒng)計,得到通用指標數(shù)據(jù),將得到的通用指 標數(shù)據(jù)保存在所述數(shù)據(jù)倉庫的主題寬表層IDS中;
[0009] 當所述數(shù)據(jù)倉庫接收數(shù)據(jù)獲取請求時,確定所述數(shù)據(jù)獲取請求中攜帶的指標標識 信息;并
[0010] 根據(jù)所述指標標識信息,在所述IDS保存的通用指標數(shù)據(jù)中,查找所述指標標識 信息對應的通用指標數(shù)據(jù);以及
[0011] 將查找到的通用指標數(shù)據(jù)提供給發(fā)送所述數(shù)據(jù)獲取請求的用戶。
[0012] 本申請實施例提供的一種提供數(shù)據(jù)的裝置,包括:
[0013] 主題寬表層IDS,用于預先對源數(shù)據(jù)進行統(tǒng)計,得到通用指標數(shù)據(jù)并保存;
[0014] 接收模塊,用于接收數(shù)據(jù)獲取請求,并確定所述數(shù)據(jù)獲取請求中攜帶的指標標識 信息;
[0015] 查找模塊,用于根據(jù)所述指標標識信息,在所述IDS保存的通用指標數(shù)據(jù)中,查找 所述指標標識信息對應的通用指標數(shù)據(jù);
[0016] 提供模塊,用于將查找到的通用指標數(shù)據(jù)提供給發(fā)送所述數(shù)據(jù)獲取請求的用戶。
[0017] 本申請實施例提供一種提供數(shù)據(jù)的方法及裝置,該方法預先在數(shù)據(jù)倉庫的IDS中 保存通用指標數(shù)據(jù),當數(shù)據(jù)倉庫接收到用戶發(fā)送的數(shù)據(jù)獲取請求時,直接從IDS預先保存 的通用指標數(shù)據(jù)中查找該數(shù)據(jù)獲取請求中攜帶的指標標識信息對應的通用指標數(shù)據(jù),并提 供給用戶。通過上述方法,數(shù)據(jù)倉庫在向用戶提供通用指標數(shù)據(jù)時,可直接將預先保存在 IDS中的通用指標數(shù)據(jù)提供給用戶,而無需將源數(shù)據(jù)從最底層的ODS開始逐層向上處理得 到指標數(shù)據(jù),再提供給用戶,因此可有效節(jié)省數(shù)據(jù)倉庫的計算資源,也提高了提供數(shù)據(jù)的效 率。
【專利附圖】
【附圖說明】
[0018] 圖1為本申請實施例提供的數(shù)據(jù)倉庫提供數(shù)據(jù)的過程;
[0019] 圖2為本申請實施例提供的提供數(shù)據(jù)的裝置結構示意圖。
【具體實施方式】
[0020] 為了節(jié)省數(shù)據(jù)倉庫的計算資源,也提高數(shù)據(jù)倉庫提供數(shù)據(jù)的效率,本申請實施例 中預先將通用指標數(shù)據(jù)保存在IDS中,當提供通用指標數(shù)據(jù)時,可直接將IDS保存的相應通 用指標數(shù)據(jù)提供給用戶。
[0021] 下面結合附圖對本申請優(yōu)選的實施方式進行詳細說明。
[0022] 圖1為本申請實施例提供的數(shù)據(jù)倉庫提供數(shù)據(jù)的過程,具體包括以下步驟:
[0023] S101 :預先對數(shù)據(jù)倉庫中保存的源數(shù)據(jù)進行統(tǒng)計,得到通用指標數(shù)據(jù),將得到的通 用指標數(shù)據(jù)保存在數(shù)據(jù)倉庫的IDS中。
[0024] 在本申請實施例中,數(shù)據(jù)倉庫可預先對保存在0DS中的源數(shù)據(jù)進行統(tǒng)計,得到通 用指標數(shù)據(jù),并保存在IDS中。
[0025] 具體的,可預先在IDS中設置業(yè)務主題表,以及各業(yè)務主題表與指標標識信息的 從屬關系,對源數(shù)據(jù)進行統(tǒng)計并得到通用指標數(shù)據(jù)后,則可確定得到的通用指標數(shù)據(jù)的指 標標識信息所屬的業(yè)務主題表,并將得到的通用指標數(shù)據(jù)保存在確定的業(yè)務主題表中。
[0026] 其中,由于數(shù)據(jù)倉庫的源數(shù)據(jù)中大多是用戶的操作數(shù)據(jù),如用戶的付款操作、退款 操作、注冊操作、登錄操作、點擊操作等,而操作數(shù)據(jù)中均會攜帶相應的操作類型信息,因 此,在IDS中預設業(yè)務主題表時,對于一個業(yè)務主題表,可將該業(yè)務主題表與至少一種操作 類型信息相關聯(lián),但一種操作類型信息只與唯一的一個業(yè)務主題表相關聯(lián),即,對不同的操 作類型信息按照其所屬的業(yè)務主題表進行嚴格的劃分。
[0027] 例如,預設的業(yè)務主題表為交易主題表,將付款操作和退款操作這兩個操作類型 信息設置為與該交易主題表相關聯(lián)。需要說明的是,一旦設置了付款操作和退款操作與該 交易主題表相關聯(lián),這兩個操作類型信息就不再與其他的業(yè)務主題表(如瀏覽主題表)相關 聯(lián)。
[0028] 采用上述方法設置了各業(yè)務主題表與操作類型信息的關聯(lián)關系后,則可針對預設 的每個業(yè)務主題表,確定與該業(yè)務主題表相關聯(lián)的操作類型信息,將根據(jù)攜帶確定的操作 類型信息的源數(shù)據(jù)統(tǒng)計得到的各通用指標數(shù)據(jù)對應的指標標識信息確定為該業(yè)務主題表 下的指標標識信息。
[0029] 繼續(xù)沿用上例,由于付款操作與交易主題表相關聯(lián),根據(jù)攜帶的操作類型信息為 付款操作的源數(shù)據(jù)統(tǒng)計得到的通用指標數(shù)據(jù)對應的指標標識信息包括付款訂單數(shù)和付款 金額,因此,付款訂單數(shù)和付款金額所屬的業(yè)務主題表就是交易主題表。類似的,由于退款 操作與交易主題表相關聯(lián),根據(jù)攜帶的操作類型信息為退款操作的源數(shù)據(jù)統(tǒng)計得到的通用 指標數(shù)據(jù)對應的指標標識信息包括退款訂單數(shù)和退款金額,因此,退款訂單數(shù)和退款金額 所屬的業(yè)務主題表也是交易主題表。
[0030] 這樣,每個通用指標數(shù)據(jù)也按照相應的操作類型信息而被嚴格劃分到業(yè)務主題表 下。
[0031] 進一步的,在IDS中預設了業(yè)務主題表、相關聯(lián)的操作類型信息以及各業(yè)務主題 表下的指標標識信息后,則可在IDS的各業(yè)務主題表中保存相應指標標識信息對應的通用 指標數(shù)據(jù)。
[0032] 考慮到實際應用場景中存在諸多相似的通用指標數(shù)據(jù),例如,最近7天的申請退 款訂單數(shù)、最近30天的申請退款訂單數(shù)、最近7天的投訴退款訂單數(shù)等,如果針對每個通 用指標數(shù)據(jù)都設置相應的統(tǒng)計算法來統(tǒng)計通用指標數(shù)據(jù),則后續(xù)一旦相應的源數(shù)據(jù)發(fā)生變 化,那么所有這些相似的通用指標數(shù)據(jù)對應的統(tǒng)計算法均要發(fā)生改變,這就會使后續(xù)對統(tǒng) 計算法的變更較為繁瑣復雜,而且,一旦漏掉對某個通用指標數(shù)據(jù)的統(tǒng)計算法的變更,將會 導致通用指標數(shù)據(jù)出錯。
[0033] 因此,為了提高后續(xù)變更統(tǒng)計算法的效率,提高統(tǒng)計通用指標數(shù)據(jù)的準確性,本申 請實施例中的通用指標標識信息包括一個原子指標標識信息、若干個指標修飾詞以及一個 時間信息,并預先為原子指標標識信息設定統(tǒng)計算法,為指標修飾詞以及時間信息設定統(tǒng) 計條件。相應的,對源數(shù)據(jù)進行統(tǒng)計,得到通用指標數(shù)據(jù)的方法可以是:數(shù)據(jù)倉庫針對一 個指標標識信息,根據(jù)預先針對該指標標識信息中包含的原子指標標識信息設定的統(tǒng)計算 法,并基于預先針對該指標標識信息中包含的時間信息和每個指標修飾詞設定的統(tǒng)計條 件,對源數(shù)據(jù)進行統(tǒng)計,得到該指標標識信息對應的通用指標數(shù)據(jù)。
[0034] 繼續(xù)沿用上例,由于與交易主題表相關聯(lián)的操作類型信息包括退款操作,因此,可 將原子指標標識信息設置為"退款訂單數(shù)"、"退款訂單金額"等,指標修飾詞可設置為"申 請"、"投訴"等,時間信息可設置為"最近7天內(nèi)"、"最近30天內(nèi)"等。
[0035] 為原子指標標識信息"退款訂單數(shù)"設定的統(tǒng)計算法可以是統(tǒng)計攜帶操作類型信 息為退款操作的源數(shù)據(jù)的數(shù)量;為原子指標標識信息"退款訂單金額"設定的統(tǒng)計算法可以 是統(tǒng)計各攜帶操作類型信息為退款操作的源數(shù)據(jù)中包含的金額之和。
[0036] 為指標修飾詞"申請"設定的統(tǒng)計條件可以是攜帶操作類型信息為退款,且退款類 型為申請退款的源數(shù)據(jù);為指標修飾詞"投訴"設定的統(tǒng)計條件可以是攜帶操作類型信息為 退款,且退款類型為投訴退款的源數(shù)據(jù)。
[0037] 為時間信息"最近7天內(nèi)"設定的統(tǒng)計條件可以是生成時間為最近7天以內(nèi)的源 數(shù)據(jù);為時間信息"最近30天內(nèi)"設定的統(tǒng)計條件可以是生成時間為最近30天以內(nèi)的源數(shù) 據(jù)。
[0038] 則對于指標標識信息"最近7天內(nèi)的申請退款訂單數(shù)",其原子指標標識信息即為 "退款訂單數(shù)",指標修飾詞即為"申請",時間信息即為"最近7天內(nèi)",因此,數(shù)據(jù)倉庫采用針 對原子指標標識信息"退款訂單數(shù)"設定的統(tǒng)計算法,基于針對指標修飾詞"申請"和時間 信息"最近7天內(nèi)"設定的統(tǒng)計條件,統(tǒng)計攜帶操作類型信息為退款操作、且退款類型為申 請退款、且最近7天內(nèi)生成的源數(shù)據(jù)的數(shù)量,作為指標標識信息"最近7天內(nèi)的申請退款訂 單數(shù)"對應的通用指標數(shù)據(jù)保存在IDS中。
[0039] 類似的,"最近30天內(nèi)的申請退款訂單數(shù)"對應的通用指標數(shù)據(jù)即為對攜帶操作類 型信息為退款操作、且退款類型為申請退款、且生成時間為最近30天內(nèi)的源數(shù)據(jù)的數(shù)量進 行統(tǒng)計的結果。
[0040] 這樣,一個指標標識信息對應的通用指標數(shù)據(jù)的統(tǒng)計算法就繼承了該指標標識信 息包含的原子指標標識信息對應的統(tǒng)計算法,如上例中"最近7天內(nèi)的申請退款訂單數(shù)"和 "最近30天內(nèi)的申請退款訂單數(shù)"的統(tǒng)計算法均繼承了包含的原子指標標識信息"退款訂 單數(shù)"的統(tǒng)計算法,如果后續(xù)源數(shù)據(jù)發(fā)生變化,只需對原子指標標識信息"退款訂單數(shù)"對應 的統(tǒng)計算法進行變更即可,而無需對"最近7天內(nèi)的申請退款訂單數(shù)"和"最近30天內(nèi)的申 請退款訂單數(shù)"的統(tǒng)計算法均進行變更,實現(xiàn)了對相似指標標識信息(包含相同原子指標標 識信息)對應的通用指標數(shù)據(jù)的統(tǒng)計算法的統(tǒng)一,可有效提高后續(xù)變更統(tǒng)計算法的效率,提 高提供指標數(shù)據(jù)的準確性。
[0041] 另外,對于時間信息,還可設定其對應的統(tǒng)計周期,則數(shù)據(jù)倉庫針對包含該時間信 息的指標標識信息,按照該時間信息對應的統(tǒng)計周期進行周期的統(tǒng)計該指標標識信息對應 的通用指標數(shù)據(jù)。如,對于時間信息"最近7天內(nèi)"和"最近30天內(nèi)",可設定這兩個時間信 息對應的統(tǒng)計周期均為1天,則數(shù)據(jù)倉庫對于"最近7天內(nèi)的申請退款訂單數(shù)"和"最近30 天內(nèi)的申請退款訂單數(shù)"這兩個指標標識信息,每天對這兩個指標標識信息對應的通用指 標數(shù)據(jù)進行統(tǒng)計,并保存在IDS中。
[0042] S102 :當數(shù)據(jù)倉庫接收數(shù)據(jù)獲取請求時,確定該數(shù)據(jù)獲取請求中攜帶的指標標識 信息。
[0043] 在本申請實施例中,用戶要獲取指標數(shù)據(jù)時,先向數(shù)據(jù)倉庫發(fā)送數(shù)據(jù)獲取請求,其 中,該數(shù)據(jù)獲取請求中攜帶用戶所要獲取的指標數(shù)據(jù)對應的指標標識信息,該指標標識信 息可以是指標名稱,也可以是指標英文字段。例如,當要獲取的指標數(shù)據(jù)為最近7天的申請 退款訂單數(shù)時,則可向數(shù)據(jù)倉庫發(fā)送攜帶指標標識信息為"最近7天的申請退款訂單數(shù)"的 數(shù)據(jù)獲取請求。
[0044] 相應的,數(shù)據(jù)倉庫接收到該數(shù)據(jù)獲取請求后,則確定其中攜帶的指標標識信息,以 便后續(xù)向用戶提供相應的指標數(shù)據(jù)。
[0045] S103 :根據(jù)該指標標識信息,在IDS保存的通用指標數(shù)據(jù)中,查找該指標標識信息 對應的通用指標數(shù)據(jù)。
[0046] 在本申請實施例中,由于已經(jīng)預先將各通用指標數(shù)據(jù)保存在了 IDS中的各業(yè)務主 題表中,因此,在IDS中查找該指標標識信息對應的通用指標數(shù)據(jù)時,可先根據(jù)在IDS中預 設的各業(yè)務主題表,以及各業(yè)務主題表與各指標標識信息的從屬關系,查找數(shù)據(jù)獲取請求 中攜帶的該指標標識信息所屬的業(yè)務主題表,再在查找到的業(yè)務主題表中的各通用指標數(shù) 據(jù)中,查找與該指標標識信息對應的通用指標數(shù)據(jù)。
[0047] S104 :將查找到的通用指標數(shù)據(jù)提供給發(fā)送該數(shù)據(jù)獲取請求的用戶。
[0048] 從IDS中查找到數(shù)據(jù)獲取請求中攜帶的指標標識信息對應的通用指標數(shù)據(jù)后,數(shù) 據(jù)倉庫則將查找到的通用指標數(shù)據(jù)提供給用戶。
[0049] 通過上述方法,數(shù)據(jù)倉庫可直接將預先保存在IDS中的通用指標數(shù)據(jù)提供給用 戶,而無需從最底層的0DS開始逐層向上對源數(shù)據(jù)進行處理得到指標數(shù)據(jù),再提供給用戶, 因此可有效節(jié)省數(shù)據(jù)倉庫的計算資源,也提高了提供數(shù)據(jù)的效率。
[0050] 并且,上述方法嚴格按照操作類型信息定義了業(yè)務主題表,以及業(yè)務主題下的各 指標標識信息,每個指標標識信息對應的通用指標數(shù)據(jù)的統(tǒng)計算法又繼承了該指標標識信 息中包含的原子指標標識信息對應的統(tǒng)計算法,實現(xiàn)了業(yè)務主題、指標標識信息以及統(tǒng)計 算法的統(tǒng)一,可有效提高統(tǒng)計的指標數(shù)據(jù)的準確性。
[0051] 此外,本申請實施例中數(shù)據(jù)倉庫還可支持通用指標數(shù)據(jù)的訂制,也即,對于IDS中 保存的某個通用指標數(shù)據(jù),數(shù)據(jù)倉庫除了在接收到用戶發(fā)送的針對該通用指標數(shù)據(jù)的數(shù)據(jù) 獲取請求時,將該通用指標數(shù)據(jù)提供給用戶以外,還可以將該通用指標數(shù)據(jù)提供給訂制了 該通用指標數(shù)據(jù)的用戶,而無需在接收到數(shù)據(jù)獲取請求時才提供。
[0052] 如,對于一個企業(yè)中的部門A和部門B,如果部門A訂制了指標標識信息a對應的 通用指標數(shù)據(jù),部門B訂制了指標標識信息b對應的通用指標數(shù)據(jù),則數(shù)據(jù)倉庫根據(jù)保存的 部門A與指標標識信息a的訂制關系以及部門B與指標標識信息b的訂制關系,可將IDS 中保存的指標標識信息a對應的通用指標數(shù)據(jù)自動提供給部門A,將指標標識信息b對應 的通用指標數(shù)據(jù)自動提供給部門B。如果后續(xù)該企業(yè)將部門A和部門B合并成了一個部門 C,則可將數(shù)據(jù)倉庫中保存的部門A與指標標識信息a的訂制關系以及部門B與指標標識信 息b的訂制關系變更為部門C與指標標識信息a和b的訂制關系,數(shù)據(jù)倉庫則可將指標標 識信息a和b對應的通用指標數(shù)據(jù)提供給部門C,而無需部門C重新開發(fā)獲取數(shù)據(jù)的模型。
[0053] 較佳的,在本申請實施例中,可在IDS中保存通用性較強的指標標識信息對應的 通用指標數(shù)據(jù),而對于一些個性化、且可直接基于IDS中保存的通用指標數(shù)據(jù)統(tǒng)計得到的 個性化指標數(shù)據(jù),則可保存在ADS中。具體的,可預先對IDS中保存的至少一個通用指標數(shù) 據(jù)進行統(tǒng)計,得到個性化指標數(shù)據(jù),并保存在ADS中。則在圖1所示的步驟S103中,數(shù)據(jù)倉 庫如果在IDS中未查找到數(shù)據(jù)獲取請求中攜帶的指標標識信息對應的通用指標數(shù)據(jù)時,則 可在ADS中查找該指標標識信息對應的個性化指標數(shù)據(jù)。
[0054] 例如,由于"最近7天內(nèi)的申請退款訂單數(shù)"以及"最近7天內(nèi)的支付訂單數(shù)"對應 的指標數(shù)據(jù)具有較強的通用性,因此可將這兩個通用指標數(shù)據(jù)保存在IDS中,而"最近7天 內(nèi)的申請退款率"對應的指標數(shù)據(jù)則個性化較強,而且,可直接基于"最近7天內(nèi)的申請退 款訂單數(shù)"與"最近7天內(nèi)的支付訂單數(shù)"的比值得到,因此,可將"最近7天內(nèi)的申請退款 率"對應的個性化指標數(shù)據(jù)保存在ADS中。
[0055] 具體的,同樣可在ADS中設置指標標識信息"最近7天內(nèi)的申請退款率",并針對該 指標標識信息設定其對應的統(tǒng)計算法為IDS中保存的"最近7天內(nèi)的申請退款訂單數(shù)"與 "最近7天內(nèi)的支付訂單數(shù)"對應的通用指標數(shù)據(jù)的比值,則數(shù)據(jù)倉庫可直接將已經(jīng)保存在 IDS中的"最近7天內(nèi)的申請退款訂單數(shù)"與"最近7天內(nèi)的支付訂單數(shù)"對應的通用指標 數(shù)據(jù)的比值作為"最近7天內(nèi)的申請退款率"對應的個性化指標數(shù)據(jù),并保存在ADS中。
[0056] 考慮到實際應用中最近7天內(nèi)的申請退款訂單并不一定是最近7天內(nèi)的支付訂單 (如用戶在8天前支付了一個訂單,但在5天前對該訂單申請了退款,則這個訂單是最近7 天內(nèi)的申請退款訂單,但不是最近7天內(nèi)的支付訂單),因此,為了提高ADS中保存的"最近 7天內(nèi)的申請退款率"對應的個性化指標數(shù)據(jù)的準確性,在上例中,可在IDS中保存"最近7 天內(nèi)的支付訂單中的申請退款訂單數(shù)"對應的通用指標數(shù)據(jù),則,在ADS中設置指標標識信 息"最近7天內(nèi)的申請退款率"之后,可針對該指標標識信息設定其對應的統(tǒng)計算法為IDS 中保存的"最近7天內(nèi)的支付訂單中的申請退款訂單數(shù)"與"最近7天內(nèi)的支付訂單數(shù)"對 應的通用指標數(shù)據(jù)的比值。
[0057] 相應的,當數(shù)據(jù)倉庫接收到的數(shù)據(jù)獲取請求中攜帶的指標標識信息為"最近7天 內(nèi)的申請退款率"時,則在IDS中未查找到相應的通用指標數(shù)據(jù),因此在ADS中查找,并將查 找到的個性化指標數(shù)據(jù)提供給用戶。類似的,ADS中保存的個性化指標數(shù)據(jù)也可以根據(jù)訂 制關系進行自動提供,這里就不再一一贅述。
[0058] 進一步的,對于一個指標數(shù)據(jù)而言,其通用性和個性化是相對而言的,如果獲取 (或者訂制)該指標數(shù)據(jù)的用戶較多,或者該指標數(shù)據(jù)經(jīng)常被獲取,那么可認為這個指標數(shù) 據(jù)的通用性較強,就是通用指標數(shù)據(jù),反之,如果獲取(或者訂制)該指標數(shù)據(jù)的用戶較少, 或者該指標數(shù)據(jù)很少被獲取,那么可認為這個指標數(shù)據(jù)的個性化較強,就是個性化指標數(shù) 據(jù)。因此,數(shù)據(jù)倉庫可對IDS和ADS中保存的各通用指標數(shù)據(jù)和個性化指標數(shù)據(jù)的獲取情 況進行監(jiān)控,并根據(jù)監(jiān)控結果對該指標數(shù)據(jù)的保存位置進行調(diào)整。
[0059] 如,針對一個指標數(shù)據(jù),監(jiān)控在指定時間段內(nèi)獲取該指標數(shù)據(jù)的用戶的數(shù)量,或 者,監(jiān)控該指標數(shù)據(jù)在指定時間段內(nèi)被獲取的次數(shù),如果獲取該指標數(shù)據(jù)的用戶的數(shù)量小 于設定數(shù)量閾值,或者,該指標數(shù)據(jù)被獲取的次數(shù)小于設定次數(shù)閾值,則可將其作為個性化 指標數(shù)據(jù)保存在ADS中(如果該指標數(shù)據(jù)已經(jīng)保存在ADS中,則可保持其保存位置不變),反 之,如果獲取該指標數(shù)據(jù)的用戶的數(shù)量不小于設定數(shù)量閾值,該指標數(shù)據(jù)被獲取的次數(shù)也 不小于設定次數(shù)閾值,則可將其作為通用指標數(shù)據(jù)保存在IDS中(若該指標數(shù)據(jù)已經(jīng)保存 在IDS中,則可保持其保存位置不變),甚至,如果獲取該指標數(shù)據(jù)的用戶數(shù)量長時間小于設 定數(shù)量閾值,該指標數(shù)據(jù)被獲取的次數(shù)長時間小于設定次數(shù)閾值,則可刪除該指標數(shù)據(jù)以 及該指標數(shù)據(jù)對應的指標標識信息。也即,IDS和ADS中保存的指標數(shù)據(jù)可以互相轉(zhuǎn)移,僅 從這一點上來說,本申請實施例中IDS和ADS的劃分界限是模糊的。
[0060] 更進一步的,對于用戶要獲取的一個指標標識信息對應的指標數(shù)據(jù),如果數(shù)據(jù)倉 庫在IDS和ADS中均未查找到該指標標識信息對應的指標數(shù)據(jù),則數(shù)據(jù)倉庫可提示用戶本 次獲取該指標數(shù)據(jù)失敗,并記錄該指標標識信息。對于記錄的同一個指標標識信息,如果 記錄該指標標識信息的次數(shù)已經(jīng)超過指定次數(shù),則數(shù)據(jù)倉庫可向數(shù)據(jù)庫管理員發(fā)出提示信 息,以提示數(shù)據(jù)庫管理員將記錄的該指標標識信息劃分到某一個業(yè)務主題下,并為其設定 統(tǒng)計算法(包括原子指標標識信息的統(tǒng)計算法、指標修飾詞和時間信息的統(tǒng)計條件),并將 該指標標識信息對應的指標數(shù)據(jù)保存在IDS或ADS中。
[0061] 需要說明的是,無論是否在IDS和ADS中查找到用戶要獲取的指標數(shù)據(jù),數(shù)據(jù)倉庫 均要禁止用戶直接從0DS或BDS中獲取數(shù)據(jù),以保證業(yè)務主題、指標標識信息、指標數(shù)據(jù)的 統(tǒng)計算法的統(tǒng)一性。
[0062] 另外,數(shù)據(jù)倉庫的源數(shù)據(jù)中除了包括用戶的操作數(shù)據(jù)以外,還包括用戶、商品、店 鋪、公司等屬性數(shù)據(jù),如用戶的屬性數(shù)據(jù)包括用戶的用戶級別、用戶聯(lián)系方式、地址、是否會 員等屬性數(shù)據(jù)。這些屬性數(shù)據(jù)大多無需進行統(tǒng)計匯總,可直接提供給用戶,因此,本發(fā)明實 施例中還可預先在IDS中保存屬性數(shù)據(jù)。當數(shù)據(jù)倉庫接收到的數(shù)據(jù)獲取請求中攜帶屬性標 識信息時,數(shù)據(jù)倉庫還可根據(jù)該屬性標識信息,在IDS保存的屬性數(shù)據(jù)中,查找該屬性標識 信息對應的屬性數(shù)據(jù),并將查找到的屬性數(shù)據(jù)提供給發(fā)送該數(shù)據(jù)獲取請求的用戶。
[0063] 其中,與通用指標數(shù)據(jù)類似的,本申請實施例中針對在IDS中預設的一個業(yè)務主 題表,可先定義該業(yè)務主題表下的業(yè)務實體,再確定該業(yè)務實體下的各屬性標識信息,并在 查找時,在相應業(yè)務主題表下的相應業(yè)務實體的屬性數(shù)據(jù)中,查找該數(shù)據(jù)獲取請求中攜帶 的屬性標識信息對應的屬性數(shù)據(jù)。當然,與個性化指標數(shù)據(jù)類似的,也可將屬性數(shù)據(jù)保存在 ADS中,這里就不再一一贅述。
[0064]以上為本申請實施例提供的提供數(shù)據(jù)的方法,基于同樣的思路,本申請實施例還 提供一種提供數(shù)據(jù)的裝置,如圖2所示。
[0065]圖2為本申請實施例提供的提供數(shù)據(jù)的裝置結構示意圖,具體包括:
[0066] 主題寬表層IDS201,用于預先對源數(shù)據(jù)進行統(tǒng)計,得到通用指標數(shù)據(jù)并保存;
[0067] 接收模塊202,用于接收數(shù)據(jù)獲取請求,并確定所述數(shù)據(jù)獲取請求中攜帶的指標標 識息;
[0068] 查找模塊203,用于根據(jù)所述指標標識信息,在所述IDS201保存的通用指標數(shù)據(jù) 中,查找所述指標標識信息對應的通用指標數(shù)據(jù);
[0069] 提供模塊204,用于將查找到的通用指標數(shù)據(jù)提供給發(fā)送所述數(shù)據(jù)獲取請求的用 戶。
[0070] 所述IDS201具體用于,保存預先設置的業(yè)務主題表,以及各業(yè)務主題表與指標標 識信息的從屬關系;確定得到的通用指標數(shù)據(jù)的指標標識信息所屬的業(yè)務主題表,并將所 述通用指標數(shù)據(jù)保存在確定的業(yè)務主題表中;
[0071] 所述查找模塊203具體用于,根據(jù)在所述IDS201中預設的各業(yè)務主題表,以及各 業(yè)務主題表與各指標標識信息的從屬關系,查找所述數(shù)據(jù)獲取請求中攜帶的指標標識信息 所屬的業(yè)務主題表;在查找到的業(yè)務主題表中的各通用指標數(shù)據(jù)中,查找與所述數(shù)據(jù)獲取 請求中攜帶的指標標識信息對應的通用指標數(shù)據(jù)。
[0072] 所述IDS201保存的一個指標標識信息包括一個原子指標標識信息、若干個指標 修飾詞以及一個時間信息;
[0073] 所述IDS201具體用于,針對一個指標標識信息,根據(jù)預先針對該指標標識信息中 包含的原子指標標識信息設定的統(tǒng)計算法,并基于預先針對該指標標識信息中包含的時間 信息和每個指標修飾詞設定的統(tǒng)計條件,對源數(shù)據(jù)進行統(tǒng)計,得到該指標標識信息對應的 通用指標數(shù)據(jù)。
[0074] 所述裝置還包括:
[0075] 應用層ADS205,用于預先對所述IDS201中保存的至少一個通用指標數(shù)據(jù)進行統(tǒng) 計,得到個性化指標數(shù)據(jù)并保存;
[0076] 所述查找模塊203還用于,當在IDS201中未查找到所述數(shù)據(jù)獲取請求中攜帶的指 標標識信息對應的通用指標數(shù)據(jù)時,在所述ADS205中查找所述指標標識信息對應的個性 化指標數(shù)據(jù)。
[0077] 所述IDS201還用于,保存屬性數(shù)據(jù);
[0078] 所述查找模塊203還用于,當所述接收模塊202接收到的所述數(shù)據(jù)獲取請求中攜 帶屬性標識信息時,根據(jù)所述屬性標識信息,在所述IDS201保存的屬性數(shù)據(jù)中,查找所述 屬性標識信息對應的屬性數(shù)據(jù);
[0079] 所述提供模塊204還用于,將查找到的屬性數(shù)據(jù)提供給發(fā)送所述數(shù)據(jù)獲取請求的 用戶。
[0080] 具體的上述提供數(shù)據(jù)的裝置可以位于數(shù)據(jù)倉庫中。
[0081] 本申請實施例提供一種提供數(shù)據(jù)的方法及裝置,該方法預先在數(shù)據(jù)倉庫的IDS中 保存通用指標數(shù)據(jù),當數(shù)據(jù)倉庫接收到用戶發(fā)送的數(shù)據(jù)獲取請求時,直接從IDS預先保存 的通用指標數(shù)據(jù)中查找該數(shù)據(jù)獲取請求中攜帶的指標標識信息對應的通用指標數(shù)據(jù),并提 供給用戶。通過上述方法,數(shù)據(jù)倉庫在向用戶提供通用指標數(shù)據(jù)時,可直接將預先保存在 IDS中的通用指標數(shù)據(jù)提供給用戶,而無需將源數(shù)據(jù)從最底層的0DS開始逐層向上處理得 到指標數(shù)據(jù),再提供給用戶,因此可有效節(jié)省數(shù)據(jù)倉庫的計算資源,也提高了提供數(shù)據(jù)的效 率。
[0082] 本領域內(nèi)的技術人員應明白,本申請的實施例可提供為方法、系統(tǒng)、或計算機程序 產(chǎn)品。因此,本申請可采用完全硬件實施例、完全軟件實施例、或結合軟件和硬件方面的實 施例的形式。而且,本申請可采用在一個或多個其中包含有計算機可用程序代碼的計算機 可用存儲介質(zhì)(包括但不限于磁盤存儲器、CD-ROM、光學存儲器等)上實施的計算機程序產(chǎn) 品的形式。
[0083] 本申請是參照根據(jù)本申請實施例的方法、設備(系統(tǒng))、和計算機程序產(chǎn)品的流程 圖和/或方框圖來描述的。應理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一 流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合??商峁┻@些計算 機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設備的處理 器以產(chǎn)生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理設備的處理器執(zhí)行的指令產(chǎn)生 用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能 的裝置。
[0084] 這些計算機程序指令也可存儲在能引導計算機或其他可編程數(shù)據(jù)處理設備以特 定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指 令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或 多個方框中指定的功能。
[0085] 這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設備上,使得在計 算機或其他可編程設備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理,從而在計算機或 其他可編程設備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖 一個方框或多個方框中指定的功能的步驟。
[0086] 盡管已描述了本申請的優(yōu)選實施例,但本領域內(nèi)的技術人員一旦得知了基本創(chuàng)造 性概念,則可對這些實施例作出另外的變更和修改。所以,所附權利要求意欲解釋為包括優(yōu) 選實施例以及落入本申請范圍的所有變更和修改。
[0087] 顯然,本領域的技術人員可以對本申請實施例進行各種改動和變型而不脫離本申 請實施例的精神和范圍。這樣,倘若本申請實施例的這些修改和變型屬于本申請權利要求 及其等同技術的范圍之內(nèi),則本申請也意圖包含這些改動和變型在內(nèi)。
【權利要求】
1. 一種提供數(shù)據(jù)的方法,其特征在于,包括: 預先對數(shù)據(jù)倉庫中保存的源數(shù)據(jù)進行統(tǒng)計,得到通用指標數(shù)據(jù),將得到的通用指標數(shù) 據(jù)保存在所述數(shù)據(jù)倉庫的主題寬表層IDS中; 當所述數(shù)據(jù)倉庫接收數(shù)據(jù)獲取請求時,確定所述數(shù)據(jù)獲取請求中攜帶的指標標識信 息;并 根據(jù)所述指標標識信息,在所述IDS保存的通用指標數(shù)據(jù)中,查找所述指標標識信息 對應的通用指標數(shù)據(jù);以及 將查找到的通用指標數(shù)據(jù)提供給發(fā)送所述數(shù)據(jù)獲取請求的用戶。
2. 如權利要求1所述的方法,其特征在于,將得到的通用指標數(shù)據(jù)保存在所述數(shù)據(jù)倉 庫的IDS中,具體包括: 預先在所述IDS中設置業(yè)務主題表,以及各業(yè)務主題表與指標標識信息的從屬關系; 確定得到的通用指標數(shù)據(jù)的指標標識信息所屬的業(yè)務主題表,并將所述通用指標數(shù)據(jù) 保存在確定的業(yè)務主題表中; 在所述IDS保存的通用指標數(shù)據(jù)中,查找所述指標標識信息對應的通用指標數(shù)據(jù),具 體包括: 根據(jù)在所述IDS中預設的各業(yè)務主題表,以及各業(yè)務主題表與各指標標識信息的從屬 關系,查找所述數(shù)據(jù)獲取請求中攜帶的指標標識信息所屬的業(yè)務主題表;并 在查找到的業(yè)務主題表中的各通用指標數(shù)據(jù)中,查找與所述數(shù)據(jù)獲取請求中攜帶的指 標標識信息對應的通用指標數(shù)據(jù)。
3. 如權利要求2所述的方法,其特征在于,一個指標標識信息包括一個原子指標標識 信息、若干個指標修飾詞以及一個時間信息; 預先對數(shù)據(jù)倉庫中保存的源數(shù)據(jù)進行統(tǒng)計,得到通用指標數(shù)據(jù),具體包括: 針對一個指標標識信息,根據(jù)預先針對該指標標識信息中包含的原子指標標識信息設 定的統(tǒng)計算法,并基于預先針對該指標標識信息中包含的時間信息和每個指標修飾詞設定 的統(tǒng)計條件,對源數(shù)據(jù)進行統(tǒng)計,得到該指標標識信息對應的通用指標數(shù)據(jù)。
4. 如權利要求1所述的方法,其特征在于,預先對所述IDS中保存的至少一個通用指標 數(shù)據(jù)進行統(tǒng)計,得到個性化指標數(shù)據(jù),并保存在應用層ADS中; 所述方法還包括: 當在IDS中未查找到所述數(shù)據(jù)獲取請求中攜帶的指標標識信息對應的通用指標數(shù)據(jù) 時,在所述ADS中查找所述指標標識信息對應的個性化指標數(shù)據(jù)。
5. 如權利要求1所述的方法,其特征在于,預先在所述IDS中保存屬性數(shù)據(jù); 所述方法還包括: 當所述數(shù)據(jù)倉庫接收到的數(shù)據(jù)獲取請求中攜帶屬性標識信息時,所述數(shù)據(jù)倉庫根據(jù)所 述屬性標識信息,在所述IDS保存的屬性數(shù)據(jù)中,查找所述屬性標識信息對應的屬性數(shù)據(jù); 并 將查找到的屬性數(shù)據(jù)提供給發(fā)送所述數(shù)據(jù)獲取請求的用戶。
6. -種提供數(shù)據(jù)的裝置,其特征在于,包括: 主題寬表層IDS,用于預先對源數(shù)據(jù)進行統(tǒng)計,得到通用指標數(shù)據(jù)并保存; 接收模塊,用于接收數(shù)據(jù)獲取請求,并確定所述數(shù)據(jù)獲取請求中攜帶的指標標識信 息; 查找模塊,用于根據(jù)所述指標標識信息,在所述IDS保存的通用指標數(shù)據(jù)中,查找所述 指標標識信息對應的通用指標數(shù)據(jù); 提供模塊,用于將查找到的通用指標數(shù)據(jù)提供給發(fā)送所述數(shù)據(jù)獲取請求的用戶。
7. 如權利要求6所述的裝置,其特征在于,所述IDS具體用于,保存預先設置的業(yè)務主 題表,以及各業(yè)務主題表與指標標識信息的從屬關系;確定得到的通用指標數(shù)據(jù)的指標標 識信息所屬的業(yè)務主題表,并將所述通用指標數(shù)據(jù)保存在確定的業(yè)務主題表中; 所述查找模塊具體用于,根據(jù)在所述IDS中預設的各業(yè)務主題表,以及各業(yè)務主題表 與各指標標識信息的從屬關系,查找所述數(shù)據(jù)獲取請求中攜帶的指標標識信息所屬的業(yè)務 主題表;在查找到的業(yè)務主題表中的各通用指標數(shù)據(jù)中,查找與所述數(shù)據(jù)獲取請求中攜帶 的指標標識信息對應的通用指標數(shù)據(jù)。
8. 如權利要求7所述的裝置,其特征在于,所述IDS保存的一個指標標識信息包括一個 原子指標標識信息、若干個指標修飾詞以及一個時間信息; 所述IDS具體用于,針對一個指標標識信息,根據(jù)預先針對該指標標識信息中包含的 原子指標標識信息設定的統(tǒng)計算法,并基于預先針對該指標標識信息中包含的時間信息和 每個指標修飾詞設定的統(tǒng)計條件,對源數(shù)據(jù)進行統(tǒng)計,得到該指標標識信息對應的通用指 標數(shù)據(jù)。
9. 如權利要求6所述的裝置,其特征在于,所述裝置還包括: 應用層ADS,用于預先對所述IDS中保存的至少一個通用指標數(shù)據(jù)進行統(tǒng)計,得到個性 化指標數(shù)據(jù)并保存; 所述查找模塊還用于,當在IDS中未查找到所述數(shù)據(jù)獲取請求中攜帶的指標標識信息 對應的通用指標數(shù)據(jù)時,在所述ADS中查找所述指標標識信息對應的個性化指標數(shù)據(jù)。
10. 如權利要求6所述的裝置,其特征在于,所述IDS還用于,保存屬性數(shù)據(jù); 所述查找模塊還用于,當所述接收模塊接收到的所述數(shù)據(jù)獲取請求中攜帶屬性標識信 息時,根據(jù)所述屬性標識信息,在所述IDS保存的屬性數(shù)據(jù)中,查找所述屬性標識信息對應 的屬性數(shù)據(jù); 所述提供模塊還用于,將查找到的屬性數(shù)據(jù)提供給發(fā)送所述數(shù)據(jù)獲取請求的用戶。
【文檔編號】G06F17/30GK104123303SQ201310153297
【公開日】2014年10月29日 申請日期:2013年4月27日 優(yōu)先權日:2013年4月27日
【發(fā)明者】鄧中華, 王賽, 朋新宇 申請人:阿里巴巴集團控股有限公司