為許多建模任務(wù)創(chuàng)建可理解模型的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及統(tǒng)計(jì)建模,并且更具體地涉及為大量統(tǒng)計(jì)建模任務(wù)創(chuàng)建可理解統(tǒng)計(jì)模 型。
【發(fā)明內(nèi)容】
[0002] 根據(jù)本發(fā)明的一個(gè)實(shí)施例,為多個(gè)建模任務(wù)創(chuàng)建模型的計(jì)算機(jī)程序產(chǎn)品包括計(jì)算 機(jī)可讀存儲(chǔ)介質(zhì),在該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有:第一程序指令,其能夠由處理器執(zhí)行 以使處理器接收各自具有目標(biāo)變量和至少一個(gè)協(xié)變量的多個(gè)建模任務(wù),目標(biāo)變量和至少一 個(gè)協(xié)變量對(duì)于所有建模任務(wù)是相同的,目標(biāo)變量和至少一個(gè)協(xié)變量之間的關(guān)系對(duì)于所有建 模任務(wù)是不同的;以及第二程序指令,其能夠由處理器執(zhí)行以使處理器按照以下方式為多 個(gè)建模任務(wù)中的每一個(gè)生成包括用于估計(jì)建模任務(wù)的目標(biāo)值和至少一個(gè)協(xié)變量之間的關(guān) 系的傳遞函數(shù)的模型:至少兩個(gè)模型共享相同的傳遞函數(shù)并且模型滿足準(zhǔn)確性條件。
[0003] 根據(jù)本發(fā)明的另一個(gè)實(shí)施例,用于為多個(gè)建模任務(wù)生成模型的系統(tǒng)包括處理器, 其配置成:接收各自具有目標(biāo)變量和至少一個(gè)協(xié)變量的多個(gè)建模任務(wù),目標(biāo)變量和至少一 個(gè)協(xié)變量對(duì)于所有建模任務(wù)是相同的,目標(biāo)變量和至少一個(gè)協(xié)變量之間的關(guān)系對(duì)于所有建 模任務(wù)是不同的;以及按照以下方式為多個(gè)建模任務(wù)中的每一個(gè)生成包括用于估計(jì)建模任 務(wù)的目標(biāo)值和至少一個(gè)協(xié)變量之間的關(guān)系的傳遞函數(shù)的模型:至少兩個(gè)模型共享相同的傳 遞函數(shù)并且模型滿足準(zhǔn)確性條件。
[0004] 根據(jù)本發(fā)明的又一個(gè)實(shí)施例,用于為多個(gè)建模任務(wù)生成模型的方法包括:用處理 設(shè)備接收各自具有目標(biāo)變量和至少一個(gè)協(xié)變量的多個(gè)建模任務(wù),目標(biāo)變量和至少一個(gè)協(xié)變 量對(duì)于所有建模任務(wù)是相同的,目標(biāo)變量和至少一個(gè)協(xié)變量之間的關(guān)系對(duì)于所有建模任務(wù) 是不同的;按照以下方式為多個(gè)建模任務(wù)中的每一個(gè)生成包括用于估計(jì)建模任務(wù)的目標(biāo)值 和至少一個(gè)協(xié)變量之間的關(guān)系的傳遞函數(shù)的模型:至少兩個(gè)模型共享相同的傳遞函數(shù)并且 模型滿足準(zhǔn)確性條件。
[0005] 附加特征和優(yōu)點(diǎn)通過本發(fā)明的技術(shù)實(shí)現(xiàn)。本發(fā)明的其他實(shí)施例和方面在本文中被 詳細(xì)描述、并被認(rèn)為是要求保護(hù)的發(fā)明的一部分。為了更好地理解具有所述優(yōu)點(diǎn)和特征的 本發(fā)明,參考描述和附圖。
【附圖說明】
[0006] 在說明書的末尾處的權(quán)利要求書中特別指出并清楚地要求保護(hù)被視為本發(fā)明的 主題。根據(jù)結(jié)合附圖給出的以下詳細(xì)描述,本發(fā)明的前述和其他特征及優(yōu)點(diǎn)將是明顯的,在 附圖中:
[0007] 圖1是根據(jù)本發(fā)明的實(shí)施例的用于構(gòu)建模型的建模系統(tǒng)的示意圖。
[0008] 圖2是根據(jù)本發(fā)明的實(shí)施例構(gòu)建的傳遞函數(shù)的示例分層結(jié)構(gòu)。
[0009] 圖3是根據(jù)本發(fā)明的實(shí)施例的方法的流程圖。
[0010]圖4是根據(jù)本發(fā)明的實(shí)施例構(gòu)建和修改的一組模型。
[0011] 圖5是根據(jù)本發(fā)明的實(shí)施例的方法的流程圖。
[0012] 圖6是根據(jù)本發(fā)明的實(shí)施例的用于構(gòu)建模型的建模系統(tǒng)的示意圖。
[0013] 圖7是根據(jù)本發(fā)明的實(shí)施例的方法的流程圖。
[0014] 圖8是根據(jù)本發(fā)明的實(shí)施例構(gòu)建的一組模型。
【具體實(shí)施方式】
[0015] 針對(duì)大量統(tǒng)計(jì)建模任務(wù)具有可理解的一組統(tǒng)計(jì)模型對(duì)于許多實(shí)際情景是合乎期 望的。例如,公共事業(yè)公司可能想要預(yù)測該公司在不同位置的800, 000個(gè)分站中的每一個(gè) 的能量負(fù)荷。該公共事業(yè)公司可以為分站中的每一個(gè)創(chuàng)建統(tǒng)計(jì)模型。這些模型可能在它們 使用相同類型的協(xié)變量(例如,本地天氣條件、當(dāng)日時(shí)間等)這一點(diǎn)上是相關(guān)的。然而,對(duì) 于800, 000個(gè)模型中的每一個(gè)而言,協(xié)變量和目標(biāo)變量(即,能量負(fù)荷)之間的關(guān)系可能 是不同的。為了理解這些800, 000個(gè)不同的模型,公共事業(yè)公司可能必須分別單獨(dú)地檢查 800, 000個(gè)模型。分別單獨(dú)地檢查該大量模型是一項(xiàng)具有挑戰(zhàn)性的任務(wù)。
[0016] 對(duì)于典型的模型,模型的每個(gè)協(xié)變量(也被稱為輸入變量)與傳遞函數(shù)相關(guān)聯(lián),該 傳遞函數(shù)將協(xié)變量值變換成目標(biāo)變量(也被稱為輸出變量)值。也就是說,傳遞函數(shù)估計(jì)協(xié) 變量和目標(biāo)變量之間的關(guān)系。在公共事業(yè)公司示例中,如果每個(gè)分站具有十個(gè)共同協(xié)變量, 則潛在地將存在8, 000, 000(800, 000乘以10)個(gè)不同的傳遞函數(shù)。這會(huì)倍增理解800, 000 個(gè)模型的復(fù)雜性,而理解800, 000個(gè)模型已經(jīng)是一項(xiàng)具有挑戰(zhàn)性的任務(wù)。
[0017] 本發(fā)明的實(shí)施例提供了為大量相關(guān)、但不完全相同的建模任務(wù)構(gòu)建模型的方法。 在本發(fā)明的實(shí)施例中,當(dāng)任務(wù)具有相同數(shù)目的協(xié)變量并且協(xié)變量的類型相同時(shí),認(rèn)為建模 任務(wù)是相關(guān)的。當(dāng)協(xié)變量和目標(biāo)變量之間的關(guān)系對(duì)于每一個(gè)建模任務(wù)不同時(shí),認(rèn)為相關(guān)的 建模任務(wù)不完全相同。本發(fā)明的一個(gè)實(shí)施例中的方法通過在維持某一準(zhǔn)確性水平的同時(shí)將 所有模型上的大量不同的傳遞函數(shù)減少為更易管理的數(shù)目的傳遞函數(shù)來構(gòu)建模型。例如, 對(duì)于上面所討論的公共事業(yè)公司示例,該方法在將800, 000個(gè)模型的準(zhǔn)確性維持在某一閾 值誤差值內(nèi)的同時(shí),將不同的傳遞函數(shù)的數(shù)目從8, 000, 000減少為400。
[0018] 圖1是根據(jù)本發(fā)明的實(shí)施例的用于構(gòu)建模型的建模系統(tǒng)100的示意圖。如圖所示, 系統(tǒng)100包括學(xué)習(xí)模塊105、聚類模塊110、選擇模塊115、模型生成模塊120以及預(yù)測模塊 125。系統(tǒng)100還包括建模任務(wù)130、原始模型135、聚類的傳遞函數(shù)140、所選的傳遞函數(shù) 145、新模型150和預(yù)測結(jié)果155。
[0019] 建模任務(wù)130包括多組時(shí)間序列數(shù)據(jù)。每組時(shí)間序列數(shù)據(jù)表示在一時(shí)間段內(nèi)觀測 到的目標(biāo)變量的值。建模任務(wù)還包括在相同的時(shí)間段內(nèi)觀測到的輸入變量的值。系統(tǒng)100 構(gòu)建模型,其可以用于基于這些先前觀測到的值來預(yù)測目標(biāo)變量的未來值。
[0020] 學(xué)習(xí)模塊105分析建模任務(wù)130以學(xué)習(xí)原始模型135。原始模型135中的每一個(gè) 可以用于預(yù)測建模任務(wù)130的目標(biāo)變量的值。學(xué)習(xí)模塊105可以采用一個(gè)或多個(gè)已知建模 技術(shù)(例如,回歸建模、ARIMX建模等)來學(xué)習(xí)原始模型135。在本發(fā)明的一個(gè)實(shí)施例中, 學(xué)習(xí)模塊105通過利用加性模型(AM)公式分析建模任務(wù)130,所述加性模型公式可以表示 為:
[0021]
【主權(quán)項(xiàng)】
1. 一種用于為多個(gè)建模任務(wù)生成模型的系統(tǒng),所述系統(tǒng)包括處理器,所述處理器配置 成: 接收各自具有目標(biāo)變量和至少一個(gè)協(xié)變量的所述多個(gè)建模任務(wù),所述目標(biāo)變量和所述 至少一個(gè)協(xié)變量對(duì)于所有建模任務(wù)是相同的,所述目標(biāo)變量和所述至少一個(gè)協(xié)變量之間的 關(guān)系對(duì)于所有建模任務(wù)是不同的;W及 按照W下方式為所述多個(gè)建模任務(wù)中的每一個(gè)生成包括用于估計(jì)建模任務(wù)的目標(biāo)值 和所述至少一個(gè)協(xié)變量之間的關(guān)系的傳遞函數(shù)的模型;至少兩個(gè)模型共享至少一個(gè)相同的 傳遞函數(shù)并且所述模型滿足準(zhǔn)確性條件。
2. 如權(quán)利要求1所述的系統(tǒng),其中所述處理器還配置成:從用戶接收輸入,所述輸入指 示哪些模型應(yīng)該共享所述至少一個(gè)相同的傳遞函數(shù);W及基于所述輸入生成所述模型。
3. 如權(quán)利要求1所述的系統(tǒng),其中所述多個(gè)建模任務(wù)中的每一個(gè)具有數(shù)據(jù)集,所述數(shù) 據(jù)集包括所述至少一個(gè)協(xié)變量的值和所述目標(biāo)變量的值,其中所述處理器配置成還通過同 時(shí)從與所述模型相對(duì)應(yīng)的所述數(shù)據(jù)集學(xué)習(xí)所述模型來生成所述模型。
4. 如權(quán)利要求3所述的系統(tǒng),其中所述學(xué)習(xí)包括: 通過將所述模型結(jié)合在一起來制定最優(yōu)化問題; 將與所述模型相對(duì)應(yīng)的數(shù)據(jù)集結(jié)合在一起;W及 通過基于結(jié)合后的數(shù)據(jù)集解決所述最優(yōu)化問題,使所述模型適合所述結(jié)合后的數(shù)據(jù) 集。
5. 如權(quán)利要求4所述的系統(tǒng),其中解決所述最優(yōu)化問題包括;使目標(biāo)變量值和由所述 傳遞函數(shù)估計(jì)的值之間的差異最小化。
6. 如權(quán)利要求1所述的系統(tǒng),其中所述處理器還配置成;使用針對(duì)特定建模任務(wù)的模 型來為所述特定建模任務(wù)預(yù)測目標(biāo)變量值。
7. 如權(quán)利要求1所述的系統(tǒng),其中所述處理器配置成通過W下方式生成所述模型: 從所述建模任務(wù)學(xué)習(xí)所述傳遞函數(shù),使得所述傳遞函數(shù)對(duì)于所有模型是不同的; 選擇所述傳遞函數(shù)的子集;W及 通過用所述傳遞函數(shù)的所述子集替換所述模型的所述傳遞函數(shù)來修改所述模型。
8. -種用于為多個(gè)建模任務(wù)生成模型的方法,所述方法包括: 由處理設(shè)備接收各自具有目標(biāo)變量和至少一個(gè)協(xié)變量的所述多個(gè)建模任務(wù),所述目標(biāo) 變量和所述至少一個(gè)協(xié)變量對(duì)于所有建模任務(wù)是相同的,所述目標(biāo)變量和所述至少一個(gè)協(xié) 變量之間的關(guān)系對(duì)于所有建模任務(wù)是不同的;W及 按照W下方式為所述多個(gè)建模任務(wù)中的每一個(gè)生成包括用于估計(jì)建模任務(wù)的目標(biāo)值 和所述至少一個(gè)協(xié)變量之間的關(guān)系的傳遞函數(shù)的模型;至少兩個(gè)模型共享至少一個(gè)相同的 傳遞函數(shù)并且所述模型滿足準(zhǔn)確性條件。
9. 如權(quán)利要求8所述的方法,其中生成所述模型包括: 從所述建模任務(wù)學(xué)習(xí)所述傳遞函數(shù),使得所述傳遞函數(shù)對(duì)于所有模型是不同的; 選擇所述傳遞函數(shù)的子集;W及 通過用所述傳遞函數(shù)的所述子集替換所述模型的所述傳遞函數(shù)來修改所述模型。
10. 如權(quán)利要求9所述的方法,其中選擇所述子集包括: 基于所述傳遞函數(shù)的相似性創(chuàng)建所述傳遞函數(shù)的分層結(jié)構(gòu);W及 通過遍歷所述傳遞函數(shù)的分層結(jié)構(gòu)直到找到滿足所述準(zhǔn)確性條件的一組傳遞函數(shù),來 選擇所述一組傳遞函數(shù)。
11. 如權(quán)利要求10所述的方法,其中當(dāng)通過所述分層結(jié)構(gòu)中的第一傳遞函數(shù)估計(jì)的值 與通過一模型的將被所述第一傳遞函數(shù)替換的第二傳遞函數(shù)估計(jì)的值之間的差異在闊值 差異內(nèi)時(shí),所述準(zhǔn)確性條件得到滿足。
12. 如權(quán)利要求9所述的方法,還包括從用戶接收要選擇的傳遞函數(shù)的數(shù)目。
13. 如權(quán)利要求8所述的方法,其中所述生成步驟包括: 從用戶接收輸入,所述輸入指示哪些模型應(yīng)該共享所述至少一個(gè)相同的傳遞函數(shù);W 及 基于所述輸入生成多個(gè)模型。
【專利摘要】本公開涉及為許多建模任務(wù)創(chuàng)建可理解模型。在一個(gè)實(shí)施例中,用于為多個(gè)建模任務(wù)生成模型的方法包括:由處理設(shè)備接收各自具有目標(biāo)變量和至少一個(gè)協(xié)變量的多個(gè)建模任務(wù),目標(biāo)變量和至少一個(gè)協(xié)變量對(duì)于所有建模任務(wù)是相同的,目標(biāo)變量和至少一個(gè)協(xié)變量之間的關(guān)系對(duì)于所有建模任務(wù)是不同的;以及按照以下方式為多個(gè)建模任務(wù)中的每一個(gè)生成包括用于估計(jì)建模任務(wù)的目標(biāo)值和至少一個(gè)協(xié)變量之間的關(guān)系的傳遞函數(shù)的模型:至少兩個(gè)模型共享至少一個(gè)相同的傳遞函數(shù)并且模型滿足準(zhǔn)確性條件。
【IPC分類】G06F17-50, G06F9-46
【公開號(hào)】CN104636531
【申請(qǐng)?zhí)枴緾N201410645043
【發(fā)明人】P·龐佩, M·辛恩, O·費(fèi)舒爾, M·沃斯特
【申請(qǐng)人】國際商業(yè)機(jī)器公司
【公開日】2015年5月20日
【申請(qǐng)日】2014年11月12日
【公告號(hào)】US20150134306, US20150134307