法,諸如線性相關(guān)算法或預(yù)測間隔驗證算法。在一些情況中,框406處的排序 位于之前排序最高的時段組合與框402處選擇的時段組合之間。在一些實施方式中,對時 段組合進行排序能夠涉及計算每個時段組合上的數(shù)據(jù)的組合并之后以一個或多個時間周 期將每個時段組合的平均誤差與該時段組合的實際值進行比較???06的示例將參照圖6 和圖10進行描述。
[0066] 在判定塊408,時間分辨率排序系統(tǒng)126確定是否存在未被排序的時段組合。如果 有,則過程400返回框402并針對尚未被排序的另一時段組合來重復(fù)過程400。如果沒有未 被排序的時段組合,則在框410,時間分辨率排序系統(tǒng)126選擇排序最高的時段組合并將其 與所述度量相關(guān)聯(lián)。在一些實施方式中,時間分辨率排序系統(tǒng)126可以選擇多于一個時段 組合(諸如選擇前兩個或三個時段組合)將其與將與所述度量相關(guān)聯(lián),。
[0067] 過程400可以在指定間隔期間執(zhí)行。例如,過程400可以每晚或一星期一次地自 動執(zhí)行。在其他情況中,過程400可以響應(yīng)于用戶的命令而發(fā)生。在一些實施方式中,過程 400可以被用來識別度量的特性,諸如最佳地表征度量的值隨著時間的變化的時段組合。
[0068] 圖4B示出了學習過程450的一個實施方式的流程圖。過程450可以例如作為圖2 的學習過程252的一部分而被執(zhí)行。在各種實施方式中,過程450可以作為過程400的替 代而被執(zhí)行。過程450能夠至少部分地由能夠識別一個或多個時段組合或分段時段并針對 特定度量對它們進行排序的任意系統(tǒng)來實施。例如,過程450的全部或部分能夠由系統(tǒng)評 估器120、數(shù)據(jù)挖掘系統(tǒng)122、度量預(yù)測器124和時間分辨率排序系統(tǒng)126來實施。雖然任 意數(shù)量的系統(tǒng)能夠全部地或部分地實施過程450,但是為了簡化討論,將參照特定系統(tǒng)來對 過程450的不同部分進行描述。
[0069] 過程450從框452開始,在框452中,例如,系統(tǒng)評估器120對有可能可應(yīng)用于感 興趣的度量的一組預(yù)測算法中的一些或所有預(yù)測算法進行循環(huán)遍歷。這組預(yù)測算法能夠包 括例如最小二乘法線性回歸算法、Theil-Sen估計函數(shù)、基于平均值的預(yù)測、指數(shù)預(yù)測算法 等。預(yù)測算法的示例將在下面參照圖9進行描述。在框454,系統(tǒng)評估器120為當前預(yù)測 算法選擇最佳時段組合。例如,在框454,系統(tǒng)評估器120能夠執(zhí)行與過程400相類似的過 程,其中排序最高的時段組合被認為是針對所述預(yù)測算法的最佳時段組合。如上面參照過 程400所提到的,框454能夠產(chǎn)生具有一組預(yù)測值的最佳時段組合,該組預(yù)測值與感興趣的 度量的一組歷史值相對應(yīng)。
[0070] 在判定塊456,系統(tǒng)評估器120確定在所述組中是否存在尚未被測試的其他預(yù)測 算法。如果有,則過程450返回框452并針對尚未被測試的另一預(yù)測算法來重復(fù)過程450。 過程450通常將持續(xù)到該組中的所有預(yù)測算法都已經(jīng)被測試。如果沒有尚未被測試的預(yù)測 算法,則在框458,系統(tǒng)評估器120對例如在框454的迭代期間選擇的每個最佳時段組合進 行評估。例如,該評估能夠包括對于每個最佳時段組合而言評估該組預(yù)測值相對于這組歷 史值的精度。可以使用用于測量精度、可靠性等的各種方法。例如,在一些實施方式中,該 評估能夠包括對于每個最佳時段組合而言計算誤差測量,諸如平均絕對誤差平均值(mean absoluteaverageerror)、平均絕對比例誤差(meanabsolutescalederror)、均方誤差 等。在一些實施方式中,誤差測量能夠集中于預(yù)測值的某個范圍,諸如預(yù)測值的第二半部 分。
[0071] 在框460,基于在框458的評估,系統(tǒng)評估器120在這組預(yù)測算法中選擇最佳預(yù)測 算法。該最佳預(yù)測算法能夠例如是具有最低誤差測量的預(yù)測算法。在一個典型的實施方式 中,最佳預(yù)測算法的選擇還構(gòu)成了為那個預(yù)測算法選擇最佳時段組合。如將參照圖8-圖9 更詳細描述的,以此方式,最佳預(yù)測算法及其最佳時段組合能夠用作計算預(yù)測的基礎(chǔ)。
[0072] 圖5示出了遞增地將歷史數(shù)據(jù)值插入時段組合中的過程500的一個實施方式的流 程圖。過程500可以例如作為圖4A的框404的一部分而被執(zhí)行。過程500能夠至少部分 地由能夠識別一個或多個時段組合或分段時段并針對特定度量對它們進行排序的任意系 統(tǒng)來實施。例如,過程500的全部或部分能夠由系統(tǒng)評估器120、數(shù)據(jù)挖掘系統(tǒng)122、度量預(yù) 測器124和時間分辨率排序系統(tǒng)126來實施。雖然任意數(shù)量的系統(tǒng)能夠全部地或部分地實 施過程500,但是為了簡化討論,將參照特定系統(tǒng)來對過程500的不同部分進行描述。
[0073] 在框502,數(shù)據(jù)挖掘系統(tǒng)122從一組歷史值中選擇歷史值。在框504,數(shù)據(jù)挖掘系 統(tǒng)122選擇時段組合的時間段。在一個典型的實施方式中,當選擇時間段時,數(shù)據(jù)挖掘系統(tǒng) 122從最高頻率的時段向最低頻率的時段迭代。例如,如果時段組合包括為天、星期和月的 時段,則天時段將是最高頻率的時段,月時段將是最低頻率的時段。
[0074] 在框506,數(shù)據(jù)挖掘系統(tǒng)122計算所選時段的相應(yīng)時間分段的預(yù)測值,其中該相應(yīng) 時間分段是所述歷史值所屬的分段。例如,如果所選的時段是天時段,所選時段具有1小時 的時間分辨率,并且歷史值來自上午12:01的時間點,則數(shù)據(jù)挖掘系統(tǒng)122將計算針對天時 段的第一個1小時分段的預(yù)測值。該預(yù)測值可以基于例如來自相應(yīng)時間分段的所有可用歷 史值。計算預(yù)測值的算法和方法的示例將在下面參照圖9進行描述。
[0075] 在框508,數(shù)據(jù)挖掘系統(tǒng)122基于該時段組合的任意更高頻率的時段的相應(yīng)分段 來調(diào)整歷史值。下面的等式1描述了可以如何計算所選時段的調(diào)整后的歷史值(An)的示 例。在等式1中,H表示歷史值,n表示時段組合中所選時段的頻率位置。例如,在n越低 值意味著頻率越高的時段的實施方式中,對于最高頻率時段(例如,天-星期-月時段組合 中的"天")而言n能夠等于零,對于下一最高頻率時段(例如,天-星期-月時段組合中的 "星期")而言n能夠等于1,等等。
【主權(quán)項】
1. 一種方法,包括: 由包括計算機硬件的計算機系統(tǒng)識別針對感興趣度量的多個時段組合; 其中,每個時段組合包括一個或多個時間段并且所述一個或多個時間段中的每個時間 段包括一個或多個分段; 對于所述多個時段組合中的每個時段組合以及所述感興趣度量的多個歷史值中的每 個歷史值,所述計算機系統(tǒng)遞增地將所述歷史值插入所述一個或多個時間段中的相應(yīng)分段 中; 其中,對于所述一個或多個時間段中的每個時間段而言,所述遞增地插入包括: 識別針對所述歷史值的相應(yīng)分段; 計算所述相應(yīng)分段的預(yù)測值; 基于所述時段組合的任何更高頻率的時間段來調(diào)整所述歷史值;以及 將調(diào)整后的歷史值插入所述相應(yīng)分段中; 由所述計算機系統(tǒng)基于所述多個歷史值與相應(yīng)預(yù)測值的組之間的比較對所述多個時 段組合進行排序;以及 由所述計算機系統(tǒng)將排序最高的時段組合選為最佳表征所述感興趣度量的時段組合。
2. 根據(jù)權(quán)利要求1所述的方法,該方法還包括: 針對多個預(yù)測算法中的每個預(yù)測算法來執(zhí)行所述識別、所述遞增地插入、所述排序和 所述選擇; 評估每個排序最高的時段組合;以及 基于所述評估,為所述感興趣度量選擇最佳預(yù)測算法。
3. 根據(jù)權(quán)利要求2所述的方法,其中,對于所述多個預(yù)測算法中的每個預(yù)測算法,所述 預(yù)測值的計算包括利用所述預(yù)測算法。
4. 根據(jù)權(quán)利要求1所述的方法,其中,所述遞增地插入包括從最高頻率向最低頻率對 一個或多個時間段進行迭代。
5. 根據(jù)權(quán)利要求4所述的方法,其中,所述調(diào)整后的歷史值的計算包括: 對所述一個或多個時間段的緊接著的更高頻率的時間段進行識別;以及 對于該緊接著的更高頻率的時間段的相應(yīng)分段,運算所述調(diào)整后的歷史值與所述預(yù)測 值之間的差值。
6. 根據(jù)權(quán)利要求1所述的方法,其中,所述多個時間段的最高頻率時段的調(diào)整后的歷 史值包括所述歷史值。
7. 根據(jù)權(quán)利要求1所述的方法,其中,對于所述多個時段組合中的每個時段組合,所述 排序包括: 將所述多個歷史值與一組相應(yīng)預(yù)測值進行比較; 基于所述比較計算評分;以及 根據(jù)所述評分對所述時段組合進行排序。
8. 根據(jù)權(quán)利要求1所述的方法,該方法包括將所述感興趣度量的新歷史值聚集到所述 排序最高的時段組合的相應(yīng)分段中。
9. 根據(jù)權(quán)利要求1所述的方法,其中,對于所述多個時段組合中的每個時段組合,所述 排序包括: 運算一組預(yù)測值與所述一組歷史值的線性相關(guān)性; 計算預(yù)測間隔; 執(zhí)行預(yù)測間隔驗證; 計算外部區(qū)域; 基于所述線性相關(guān)性、所述預(yù)測間隔驗證和所述外部區(qū)域來確定所述時段組合的評 分;以及 根據(jù)所述評分對所述時段組合進行排序。
10. 根據(jù)權(quán)利要求1所述的方法,該方法包括對所述多個歷史值的值執(zhí)行噪聲過濾。
11. 根據(jù)權(quán)利要求1所述的方法,該方法包括:對于所述排序最高的時段組合的至少一 個時間段,執(zhí)行所述一個或多個分段的噪聲過濾。
12. 根據(jù)權(quán)利要求11所述的方法,其中,對于所述一個或多個分段的每個分段,所述執(zhí) 行所述一個或多個分段的噪聲過濾包括: 將所述分段劃分成子分段; 為其中一個所述子分段與另一所述子分段的每個可能配對計算分段噪聲值; 選擇最大的分段噪聲值;以及 響應(yīng)于所述最大分段噪聲值超過閾值而從所述至少一個時間段中過濾所述分段。
13. -種信息處理系統(tǒng),包括: 至少一個計算機處理器,其中,所述至少一個計算機處理器可操作以執(zhí)行包括以下步 驟的方法: 識別針對感興趣度量的多個時段組合; 其中,每個時段組合包括一個或多個時間段并且所述一個或多個時間段中的每個時間 段包括一個或多個分段; 對于所述多個時段組合中的每個時段組合以及所述感興趣度量的多個歷史值中的每 個歷史值,遞增地將所述歷史值插入所述一個或多個時間段中的相應(yīng)分段中; 其中,對于所述一個或多個時間段