利用用于聚結(jié)內(nèi)存事務(wù)的指示的方法和系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本公開總體涉及事務(wù)內(nèi)存(TM)執(zhí)行領(lǐng)域,并且更具體而言涉及修改用于將多個(gè) 內(nèi)存事務(wù)處理為單個(gè)事務(wù)的代碼。
【背景技術(shù)】
[0002] 芯片上的中央處理單元(CPU)核的數(shù)量以及與共享內(nèi)存相連的CPU核的數(shù)量繼 續(xù)顯著增長(zhǎng)以便支持日益增長(zhǎng)的工作負(fù)載容量的需要。合作起來處理相同工作負(fù)載的CPU 的日益增長(zhǎng)的數(shù)量給軟件可縮放性(scalability)帶來的重大的負(fù)擔(dān),例如,由傳統(tǒng)旗語 (semaphore)保護(hù)的共享隊(duì)列或數(shù)據(jù)結(jié)構(gòu)成為熱點(diǎn)并且導(dǎo)致子線性n路比例(scaling)曲 線。
[0003] 傳統(tǒng)上,這通過在軟件中實(shí)現(xiàn)更好粒度鎖定以及在硬件中采用更低延遲/更高帶 寬互聯(lián)來對(duì)付。實(shí)現(xiàn)更好粒度鎖定來改善軟件可縮放性可能會(huì)非常復(fù)雜并且容易出錯(cuò),并 且在當(dāng)今的CPU頻率上,硬件互聯(lián)的延遲受到芯片和系統(tǒng)的物理尺寸以及光速的限制。
[0004] 現(xiàn)在已經(jīng)引入了硬件事務(wù)內(nèi)存(HTM,或本討論中簡(jiǎn)稱為TM)的實(shí)現(xiàn)方式,其中一 組指令一也稱之為事務(wù)一以內(nèi)存的數(shù)據(jù)結(jié)構(gòu)上的原子方式運(yùn)行(在其他文獻(xiàn)中,原子操作 也被稱為"塊并行(block concurrent)"或"串行化"),如其它中央處理單元(CPU)以及1/ 〇子系統(tǒng)所看到的。樂觀地,事務(wù)可以在不獲得鎖定的情況下執(zhí)行,但是,如果內(nèi)存位置上的 執(zhí)行事務(wù)的操作與在相同內(nèi)存位置上的另一個(gè)操作沖突,則可能需要中止或重試該事務(wù)執(zhí) 行。先前,已經(jīng)提出了一些軟件事務(wù)內(nèi)存事項(xiàng)方式來支持人軟件事務(wù)內(nèi)存(TM)。但是,硬件 TM也能夠提供改善性能方案并且易于在軟件TM上使用。
[0005] 在此通過引用整體包含在本申請(qǐng)中的、與2001年5月11日申請(qǐng)標(biāo)題為"Nested Transactions in a File System(文件系統(tǒng)中的嵌套事務(wù))"的美國專利US7, 185, 005教 導(dǎo)了一些技術(shù),其被提供用于在電子文件系統(tǒng)中執(zhí)行作為嵌套事務(wù)的操作。根據(jù)一個(gè)方面, 接收用于執(zhí)行一個(gè)或多個(gè)文件系統(tǒng)操作的命令。響應(yīng)于該命令,執(zhí)行包括所述一個(gè)或多個(gè) 文件系統(tǒng)操作的多個(gè)操作。執(zhí)行所述多個(gè)操作包括(1)執(zhí)行所述多個(gè)操作中的作為第一事 務(wù)的部分的第一子集;以及(2)執(zhí)行所述多個(gè)操作中的作為嵌套在第一事務(wù)中的第二事務(wù) 的部分的第二子集。
[0006] 在此通過引用整體包含在本申請(qǐng)中的、與2005年12月30日申請(qǐng)標(biāo)題為 "software Assisted Nested Hardware Transactions (軟件幫助的嵌套硬件事務(wù))"的美 國專利US7, 730, 286教導(dǎo)了一用于有效執(zhí)行嵌套事務(wù)的方法和裝置。提供了用于執(zhí)行事務(wù) 的硬件支持。此外,通過使用緊接于本地內(nèi)存中的當(dāng)前嵌套事務(wù)之前登錄先前值以及存儲(chǔ) 與事務(wù)的層級(jí)相關(guān)聯(lián)的處理器的堆棧,嵌套事務(wù)被潛在有效地執(zhí)行。一旦在嵌套事務(wù)內(nèi)有 失敗、中止、或無效事件/訪問,在該嵌套事務(wù)的執(zhí)行期間被寫入的變臉或內(nèi)存位置的狀態(tài) 則回滾到緊接于所述嵌套事務(wù)之前,而不是一直回到變量或內(nèi)存位置在封入(enclosing) 事務(wù)之前的原始狀態(tài)。因此,可以在封入事務(wù)內(nèi)重新執(zhí)行嵌套事務(wù),而無需弄平(flatten) 所述封入的和嵌套的事務(wù)來重新執(zhí)行所有事情。
【發(fā)明內(nèi)容】
[0007] 本公開的實(shí)施例提供了一種用于事務(wù)內(nèi)存系統(tǒng)的方法、計(jì)算機(jī)系統(tǒng)以及計(jì)算機(jī)程 序產(chǎn)品,其用用于聚結(jié)最外面事務(wù)的指示。所述聚結(jié)使得針對(duì)第一事務(wù)的內(nèi)存存儲(chǔ)數(shù)據(jù)到 內(nèi)存的提交在第二事務(wù)的事務(wù)執(zhí)行(TX)末端處進(jìn)行。所述事務(wù)內(nèi)存系統(tǒng)的處理器執(zhí)行一 個(gè)或多個(gè)聚結(jié)指令,用于控制多個(gè)最外面事務(wù)的聚結(jié)?;趫?zhí)行一個(gè)或多個(gè)聚結(jié)指令,由處 理器確定兩個(gè)最外面事務(wù)是否將被聚結(jié)?;诖_定兩個(gè)最外面事務(wù)將被聚結(jié),由處理器將 包括在多個(gè)最外面事務(wù)中的至少兩個(gè)最外面事務(wù)聚結(jié)。
【附圖說明】
[0008] 本公開的實(shí)施例的一個(gè)或多個(gè)方面被具體指出并且被要求保護(hù)為在本說明書的 結(jié)論處的權(quán)利要求書中的實(shí)例。本公開實(shí)施例的前述以及其它目的、特征以及優(yōu)點(diǎn)根據(jù)結(jié) 合附圖所進(jìn)行的下述描述而更清楚,其中:
[0009] 圖1和2描繪了根據(jù)本公開的實(shí)施例的示例性多核事務(wù)內(nèi)存環(huán)境的框圖;
[0010] 圖3描繪了包括根據(jù)本公開的實(shí)施例的實(shí)例CPU的實(shí)例組件的框圖;
[0011] 圖4圖釋了根據(jù)本公開的實(shí)施例的聚結(jié)控制器執(zhí)行的操作活動(dòng),該聚結(jié)控制器控 制一個(gè)最外面事務(wù)與另一個(gè)的聚結(jié)
[0012] 圖5圖釋了根據(jù)本公開的實(shí)施例被執(zhí)行用于聚結(jié)多個(gè)最外面事務(wù)的操作活動(dòng);
[0013] 圖6圖釋了根據(jù)本公開的實(shí)施例的通過一種使用事務(wù)歷史和標(biāo)志來指導(dǎo)未來聚 結(jié)活動(dòng)的動(dòng)態(tài)預(yù)測(cè)的操作活動(dòng);
[0014] 圖7圖釋了根據(jù)本公開的實(shí)施例由識(shí)別和處理控制事務(wù)聚結(jié)活動(dòng)的指示符的控 制指示符執(zhí)行的操作活動(dòng);
[0015] 圖8圖釋了根據(jù)本公開的實(shí)施例由優(yōu)化多個(gè)最外面事務(wù)的聚結(jié)以便使得性能增 益最大化的聚結(jié)優(yōu)化器執(zhí)行操作活動(dòng);
[0016] 圖9描繪了根據(jù)本公開的實(shí)施例支持聚結(jié)優(yōu)化器的執(zhí)行的JavaK'運(yùn)行時(shí)間環(huán)境 (JRE)的實(shí)例組件;
[0017] 圖10描繪了根據(jù)本公開的實(shí)施例正在執(zhí)行聚結(jié)控制、動(dòng)態(tài)預(yù)測(cè)、控制指示符以及 聚結(jié)優(yōu)化器的計(jì)算設(shè)備的組件以及被執(zhí)行用于最外面事務(wù)的聚結(jié)的操作活動(dòng)的任何軟件 方面的框圖;
[0018] 圖11描繪了根據(jù)本公開的各個(gè)實(shí)施例的圖10的一處理器的部分存在的各種硬件 構(gòu)件;
[0019] 圖12描繪了根據(jù)本公開的實(shí)施例用于幫助讀取器識(shí)別嵌套事務(wù)和聚結(jié)最外面事 務(wù)之間的差別的事務(wù)嵌套的實(shí)例;
[0020] 圖13圖釋了根據(jù)本公開的實(shí)施例由執(zhí)行事務(wù)聚結(jié)處理的方面的動(dòng)態(tài)編譯器執(zhí)行 的操作活動(dòng)的方法;
[0021] 圖14描繪了根據(jù)本公開的實(shí)施例的流程圖,其圖釋了利用用于聚結(jié)最外面事務(wù) 指示的實(shí)施例;
[0022] 圖15描繪了圖釋本公開的實(shí)施例的流程圖;
[0023] 圖16描繪了圖釋本公開的實(shí)施例的流程圖;
[0024] 圖17描繪了圖釋本公開的實(shí)施例的流程圖;
[0025] 圖18描繪了圖釋本公開的實(shí)施例的流程圖;
[0026] 圖19描繪了圖釋本公開的實(shí)施例的流程圖;
[0027] 圖20描繪了圖釋本公開的實(shí)施例的流程圖;
[0028] 圖21描繪了圖釋本公開的實(shí)施例的流程圖;
[0029] 圖22描繪了圖釋本公開的實(shí)施例的流程圖。
【具體實(shí)施方式】
[0030] 從歷史上看,計(jì)算機(jī)系統(tǒng)或處理其只具有單一處理器(也成為處理單元或中央處 理單元)。處理器包括指令處理單元(IPU)、分支單元、內(nèi)存控制單元等。這樣的處理器能 夠一次執(zhí)行程序的單個(gè)線程?,F(xiàn)在開發(fā)了一些操作系統(tǒng),其能夠通過分派一個(gè)成組在一段 時(shí)間內(nèi)在處理器上執(zhí)行而隨后分派另一程序在另一段時(shí)間內(nèi)在處理器上執(zhí)行來對(duì)處理器 進(jìn)行時(shí)間共享(time-share)。隨著技術(shù)的改進(jìn),經(jīng)常將內(nèi)存子系統(tǒng)超高速緩存器添加到處 理器以及包括轉(zhuǎn)換后備緩沖器(translation lookaside buffer (TLB))的復(fù)雜動(dòng)態(tài)地址轉(zhuǎn) 換。IPU本身通常被稱為處理器。隨著技術(shù)的繼續(xù)演進(jìn),整個(gè)處理器可以被包封在單