欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

以配置信息驅(qū)動數(shù)據(jù)訪存模式匹配的片上緩存預取機制的制作方法

文檔序號:10569854閱讀:203來源:國知局
以配置信息驅(qū)動數(shù)據(jù)訪存模式匹配的片上緩存預取機制的制作方法
【專利摘要】本發(fā)明公開了一種以配置信息驅(qū)動數(shù)據(jù)訪存模式匹配的片上緩存預取機制,包括:模式檢測模塊,用于基于可重構陣列的訪存地址,檢測當前執(zhí)行的配置信息的預取模式;模式存儲模塊,用于存儲預設時間段內(nèi)使用的配置信息的預取模式;地址生成模塊,用于根據(jù)存儲的預取模式為再次在可重構陣列上執(zhí)行的配置信息產(chǎn)生數(shù)據(jù)預取地址;模式評估模塊,用于計算存儲的預取模式的預取準確度,以檢測出失效的預取模式并更新。本發(fā)明實施例的片上緩存預取機制,在預取準確度超過一定的閾值時,按照預取模版獲取預取數(shù)據(jù),提高了預取的準確度和性能,進一步提高了系統(tǒng)性能,簡單易實現(xiàn)。
【專利說明】
以配置信息驅(qū)動數(shù)據(jù)訪存模式匹配的片上緩存預取機制
技術領域
[0001] 本發(fā)明涉及動態(tài)可重構技術領域,特別涉及一種以配置信息驅(qū)動數(shù)據(jù)訪存模式匹 配的片上緩存預取機制。
【背景技術】
[0002] 可重構計算陣列使用多個處理單元(Processing Elements,PEs)構成的陣列來滿 足不同應用程序的不同需求。未來的計算系統(tǒng)往往需要兼具多功能和高性能的特點,當前 的趨勢是在計算系統(tǒng)中加入多個可重構計算陣列,來自適應地支持不同的標準,同時滿足 日益增加的性能需求。與其他典型的計算系統(tǒng)類似,由多個可重構陣列組成的計算系統(tǒng)面 臨的挑戰(zhàn)之一是:不斷增加的內(nèi)存帶寬需求和有限的片外存儲器訪問速度之間日益增大的 差距。片上緩存已經(jīng)作為一種非常有效的方法來減少片外存儲器的帶寬要求。圖1顯示了多 個可重構陣列共享片上緩存的一種通用的體系結(jié)構,該結(jié)構類似于片上多處理器(chip multiprocessor)架構,其中的每個可重構陣列相當于一個處理器。
[0003]通過片上緩存獲得高性能的關鍵之一是有效地管理緩存,以減少對片外存儲器的 訪問次數(shù)。片上緩存通常采用LRU(Least Recently Used)替換方法,該方法并不會對運算 數(shù)據(jù)進行預取。因此,一旦當前需要的運算數(shù)據(jù)并不在片上緩存中,即發(fā)生緩存缺失時,需 要從片外存儲器中讀取缺失的運算數(shù)據(jù);此時,處理器不得不停止運算,等待運算數(shù)據(jù)從片 外存儲器中讀入,導致降低處理器的性能。
[0004] 為了解決這個問題,緩存的預取方法已經(jīng)被證明是一種可以有效地使用片上緩存 的技術,該技術為每個處理器預先準備運算數(shù)據(jù)。相關技術中,如圖2所示,圖2給出了使用 SBP方法實現(xiàn)片上緩存預取的例子,該方法預先定義好了一些不同步長的預取模板,在系統(tǒng) 運行時實時地評估不同的預取模板可能獲得的收益,再按照收益最大的預取模板進行預 取。
[0005] 然而,相關技術中的片上緩存預取方法,根據(jù)處理器的歷史訪存信息,推測處理器 近期將要使用的運算數(shù)據(jù)地址,并進行預取。其主要追蹤記錄通用處理器中獨立的訪存地 址,沒有考慮到可重構陣列上的配置信息被多次執(zhí)行的特點,因此直接使用現(xiàn)有的預取方 法會存在以下問題:
[0006] 1、相關技術中的緩存預取方法需要經(jīng)過同一地址的多次緩存缺失過程,才能確定 訪存數(shù)據(jù)流的步長和方向,這個過程消耗的時間很長。
[0007] 2、相關技術中的預取方法僅僅基于歷史訪存地址來推測當前可能的訪存地址,它 們之間不一定存在聯(lián)系,因此歷史訪存信息很可能已經(jīng)過時卻仍然在被使用,從而對當前 訪存地址產(chǎn)生錯誤的推測。
[0008] 3、相關技術中的硬件預取方法無法檢測到數(shù)組的邊界,會在數(shù)組邊界之外預取大 量的無效數(shù)據(jù),從而造成片上緩存的污染和預取準確度的降低。

【發(fā)明內(nèi)容】

[0009] 本發(fā)明旨在至少在一定程度上解決相關技術中的技術問題之一。
[0010] 為此,本發(fā)明的目的在于提出一種以配置信息驅(qū)動數(shù)據(jù)訪存模式匹配的片上緩存 預取機制,該機制可以提高預取的準確度和性能,簡單易實現(xiàn)。
[0011] 為達到上述目的,本發(fā)明實施例提出了一種以配置信息驅(qū)動數(shù)據(jù)訪存模式匹配的 片上緩存預取機制,包括:模式檢測模塊,用于基于可重構陣列的訪存地址,檢測當前執(zhí)行 的配置信息的預取模式;模式存儲模塊,用于存儲預設時間段內(nèi)使用的配置信息的預取模 式;地址生成模塊,用于根據(jù)存儲的預取模式為再次在可重構陣列上執(zhí)行的配置信息產(chǎn)生 數(shù)據(jù)預取地址;模式評估模塊,用于計算所述存儲的預取模式的預取準確度,以檢測出失效 的預取模式并更新。
[0012] 本發(fā)明實施例的以配置信息驅(qū)動數(shù)據(jù)訪存模式匹配的片上緩存預取機制,在進行 收益評估時并不需要實際去獲得預取的數(shù)據(jù),而是通過判斷預取模板是否可以精準地預取 數(shù)據(jù),只有當預取模板的預取準確度超過一定的閾值時,才會按照該預取模板去實際獲取 預取數(shù)據(jù),提高了預取的準確度和性能,進一步提高了系統(tǒng)性能,簡單易實現(xiàn)。
[0013] 另外,根據(jù)本發(fā)明上述實施例的以配置信息驅(qū)動數(shù)據(jù)訪存模式匹配的片上緩存預 取機制還可以具有以下附加的技術特征:
[0014] 進一步地,在本發(fā)明的一個實施例中,所述模式檢測模塊具體用于檢測所述訪存 地址中的數(shù)據(jù)流,以記錄下描述數(shù)據(jù)流的信息,并且當檢測到的數(shù)據(jù)流與之前的任意一個 數(shù)據(jù)流首尾相接時,將這兩個數(shù)據(jù)流拼接在一起,以及當檢測到的數(shù)據(jù)流與之前的任意一 個數(shù)據(jù)流有重疊的地址時,將這兩個數(shù)據(jù)流合并為一個。
[0015]進一步地,在本發(fā)明的一個實施例中,緩存采用全相連(full-associativeW^^ii 織模式,緩存的標簽是配置信息索引,緩存的數(shù)據(jù)空間為每套配置信息存儲固定數(shù)目的數(shù) 據(jù)流。
[0016] 進一步地,在本發(fā)明的一個實施例中,所述地址生成模塊根據(jù)配置信息的預取模 式產(chǎn)生基于步長的預取,其中,所述地址生成模塊使用所述配置信息作為索引在所述模式 存儲模塊中查找并讀出相應的預取模式,按照基于步長的預取生成順序的所述數(shù)據(jù)預取地 址。
[0017] 進一步地,在本發(fā)明的一個實施例中,所述模式評估模塊通過布隆濾波器、預取計 數(shù)器與命中計數(shù)器計算預取準確度,其中,所述布隆濾波器由多路選擇器、按位異或模塊和 位向量組成,所述預取計數(shù)器與命中計數(shù)器分別統(tǒng)計預取的數(shù)據(jù)量和命中的數(shù)據(jù)量。
[0018] 進一步地,在本發(fā)明的一個實施例中,所述預取模式的預取準確度通過計算命中 計數(shù)器與預取計數(shù)器的比值得到,如果所述比值超過預設閾值,則所述預取模式仍然有效, 不需要進行更新,否則所述預取模式需要被更新。
[0019] 進一步地,在本發(fā)明的一個實施例中,所述位向量、所述預取計數(shù)器與所述命中計 數(shù)器在評估過程完成之后進行一次復位。
[0020] 本發(fā)明附加的方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本發(fā)明的實踐了解到。
【附圖說明】
[0021] 本發(fā)明上述的和/或附加的方面和優(yōu)點從下面結(jié)合附圖對實施例的描述中將變得 明顯和容易理解,其中:
[0022]圖1為相關技術中的多個可重構陣列共享緩存的體系結(jié)構示意圖;
[0023]圖2為根據(jù)本發(fā)明一個實施例的實現(xiàn)片上緩存預取的SBP方法的流程圖;
[0024] 圖3為根據(jù)本發(fā)明實施例的以配置信息驅(qū)動數(shù)據(jù)訪存模式匹配的片上緩存預取機 制的結(jié)構不意圖;
[0025] 圖4為根據(jù)本發(fā)明一個實施例的模式存儲模塊的存儲空間內(nèi)容示意圖;
[0026] 圖5為根據(jù)本發(fā)明一個實施例的模式評估模塊的硬件結(jié)構示意圖;以及
[0027] 圖6為根據(jù)本發(fā)明一個實施例的性能對比示意圖。
【具體實施方式】
[0028] 下面詳細描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終 相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附 圖描述的實施例是示例性的,旨在用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。
[0029] 下面參照附圖描述根據(jù)本發(fā)明實施例提出的以配置信息驅(qū)動數(shù)據(jù)訪存模式匹配 的片上緩存預取機制。
[0030] 圖3是本發(fā)明實施例的以配置信息驅(qū)動數(shù)據(jù)訪存模式匹配的片上緩存預取機制的 結(jié)構示意圖。
[0031] 如圖3所示,該以配置信息驅(qū)動數(shù)據(jù)訪存模式匹配的片上緩存預取機制10包括:模 式檢測模塊1 〇〇、模式存儲模塊200、地址生成模塊300和模式評估模塊400。
[0032] 其中,模式檢測模塊100用于基于可重構陣列的訪存地址,檢測當前執(zhí)行的配置信 息的預取模式。模式存儲模塊200用于存儲預設時間段內(nèi)使用的配置信息的預取模式。地址 生成模塊300用于根據(jù)存儲的預取模式為再次在可重構陣列上執(zhí)行的配置信息產(chǎn)生數(shù)據(jù)預 取地址。模式評估模塊400用于計算存儲的預取模式的預取準確度,以檢測出失效的預取模 式并更新。本發(fā)明實施例的片上緩存預取機制10在預取準確度超過一定的閾值時,按照預 取模版獲取預取數(shù)據(jù),提高了預取的準確度和性能,進一步提高了系統(tǒng)性能。
[0033]具體地,如圖3所示,模式檢測模炔基于可重構陣列20的訪存地址,檢測當前執(zhí)行 的配置信息的預取模式;模式存儲模塊200用來存儲最近使用的配置信息的預取模式;地址 生成模塊300根據(jù)已經(jīng)存儲的預取模式,為再次在可重構陣列20上執(zhí)行的配置信息產(chǎn)生數(shù) 據(jù)預取地址;模式評估模塊400計算預取模式的預取準確度,檢測出失效的預取模式并更 新。其中使用的輸入信號說明如下:
[0034] 1 context index信號:在可重構陣列上執(zhí)行的配置信息的索引;
[0035] 2、invalid信號:指示當前配置信息的訪存模式是否需要更新;
[0036] 3、prefetch addresses信號:預取地址;
[0037] 4、cache miss信號:指示當前配置信息的預取模式不在模式存儲模塊中;
[0038] 5、read cache信號:將當前配置信息的預取模式從模式存儲模塊中讀出;
[0039] 6、write cache信號:將當前配置信息的預取模式寫入到模式存儲模塊中。
[0040] 需要說明的是,圖3中可重構陣列20、片上緩存30與片外存儲器40的結(jié)構與作用為 本領域技術人員公知的,為減少冗余,在此不作詳細贅述。另外,預設時間段可以根據(jù)實際 情況進行設置,例如為了得到最近使用的配置信息的預取模式,可以將預設時間段設置為 一個月內(nèi),
[0041] 進一步地,在本發(fā)明的一個實施例中,模式檢測模塊100具體用于檢測訪存地址中 的數(shù)據(jù)流,以記錄下描述數(shù)據(jù)流的信息,并且當檢測到的數(shù)據(jù)流與之前的任意一個數(shù)據(jù)流 首尾相接時,將這兩個數(shù)據(jù)流拼接在一起,以及當檢測到的數(shù)據(jù)流與之前的任意一個數(shù)據(jù) 流有重疊的地址時,將這兩個數(shù)據(jù)流合并為一個。
[0042] 在本發(fā)明的實施例中,模式檢測模塊100主要檢測訪存地址中的數(shù)據(jù)流,記錄下描 述數(shù)據(jù)流的相關信息,如表1所示。另外,模式檢測模塊100可以實現(xiàn)多個數(shù)據(jù)流的拼接與合 并:當檢測到的數(shù)據(jù)流與之前的某個數(shù)據(jù)流首尾相接時,可以將這兩個數(shù)據(jù)流拼接在一起; 當檢測到的數(shù)據(jù)流與之前的某個數(shù)據(jù)流有重疊的地址時,可以將這兩個數(shù)據(jù)流合并為一 個。
[0043] 表 1
[0045]進一步地,在本發(fā)明的一個實施例中,緩存采用全相連(作11-3880(^31:;[¥6)的組 織模式,緩存的標簽是配置信息索引,緩存的數(shù)據(jù)空間為每套配置信息存儲固定數(shù)目的數(shù) 據(jù)流。
[0046]具體地,模式存儲模塊200采用緩存結(jié)構存儲近期使用的配置信息的預取模式,其 中的存儲內(nèi)容如圖4所示。緩存采用全相連(如11_3880(^31:;^6)的組織模式,緩存的標簽是 配置信息索引,緩存的數(shù)據(jù)空間為每套配置信息存儲固定數(shù)目的數(shù)據(jù)流。
[0047]進一步地,在本發(fā)明的一個實施例中,地址生成模塊300根據(jù)配置信息的預取模式 產(chǎn)生基于步長的預取,其中,地址生成模塊300使用配置信息作為索引在模式存儲模塊200 中查找并讀出相應的預取模式,按照基于步長的預取生成順序的數(shù)據(jù)預取地址。
[0048]也就是說,在本發(fā)明的實施例中,地址生成模塊300根據(jù)配置信息的預取模式產(chǎn)生 基于步長的預取。地址生成模塊300使用配置信息作為索引在模式存儲模塊中查找并讀出 相應的預取模式,按照基于步長的預取生成順序的預取地址a+s,a+2 X s,. . .a+d X s,其中 的各個變量定義如下:
[0049] 1、變量a是預取的起始地址,它等于可重構陣列當前的訪存地址;
[0050] 2、變量s是相鄰的預取地址間偏移量,它等于預取模式的步長;
[0051] 3、變量d是預取地址的數(shù)目,它等于預取模式的拍數(shù)。
[0052]進一步地,在本發(fā)明的一個實施例中,模式評估模塊400通過布隆濾波器、預取計 數(shù)器與命中計數(shù)器計算預取準確度,其中,布隆濾波器由多路選擇器、按位異或模塊和位向 量組成,預取計數(shù)器與命中計數(shù)器分別統(tǒng)計預取的數(shù)據(jù)量和命中的數(shù)據(jù)量。
[0053]在本發(fā)明的一個實施例中,如圖5所示,模式評估模塊400使用布隆濾波器和兩個 計數(shù)器計算預取準確度:布隆濾波器由多路選擇器、按位異或模塊和一個4096比特位向量 組成;兩個硬件計數(shù)器分別統(tǒng)計預取的數(shù)據(jù)量和命中的數(shù)據(jù)量。其中使用的輸入信號說明 如下:
[0054] l、prefetch address信號:預取地址;
[0055] 2、prefetch request信號:預取請求;
[0056] 3、demand address信號:可重構陣列的訪存地址;
[0057] 4、filter address信號:布隆濾波器中用來生成比特位索引的地址。
[0058]當 prefetch request 信號有效時,多路選擇器選通 prefetch address 到filter address,按位異或之后將位向量的相應比特位置為1,指示該預取地址已經(jīng)被存入片上緩 存中。同時,預取計數(shù)器的值增加1。
[0059] 當可重構陣列發(fā)起訪存請求時,多路選擇器選通demand address到f i Iter addre s s,按位異或之后讀出位向量的相應比特位的數(shù)值。若該值為1,表示可重構陣列的訪 存地址已經(jīng)被預取到片上緩存中,在這種情況下,命中計數(shù)器的值增加1。
[0060] 進一步地,在本發(fā)明的一個實施例中,預取模式的預取準確度通過計算命中計數(shù) 器與預取計數(shù)器的比值得到,如果比值超過預設閾值,則預取模式仍然有效,不需要進行更 新,否則預取模式需要被更新。
[0061] 也就是說,預取模式的準確度可以通過計算命中計數(shù)器與預取計數(shù)器的比值得 至|J:如果該比值超過給定的閾值0( = 3/4),那么認為預取模式仍然有效,不需要進行更新: 否則,預取模式需要被更新。
[0062] 進一步地,在本發(fā)明的一個實施例中,位向量、預取計數(shù)器與命中計數(shù)器在評估過 程完成之后進行一次復位。即言,位向量和兩個硬件計數(shù)器的值在每套配置信息的預取模 式評估過程完成之后進行一次復位。
[0063] 在本發(fā)明的實施例中,當進行收益評估時并不需要實際去獲得預取的數(shù)據(jù),而是 通過將預取模板的訪存地址與一個布隆濾波器中的歷史記錄進行比較,來判斷預取模板是 否可以精準地預取數(shù)據(jù),只有當預取模板的預取準確度超過一定的閾值時,才會按照該預 取模板去實際獲取預取數(shù)據(jù)。具體地,本發(fā)明實施例的片上緩存預取機制的特點與優(yōu)點如 下:
[0064] 主要特點:
[0065] 1、使用可重構陣列的配置信息作為引導,當配置信息首次在可重構陣列上執(zhí)行 時,記錄該配置信息的數(shù)據(jù)訪存模式;
[0066] 2、當配置信息再次在可重構陣列上執(zhí)行時,根據(jù)已經(jīng)記錄的數(shù)據(jù)訪存模式產(chǎn)生預 取地址;
[0067] 3、使用布隆濾波器評估數(shù)據(jù)訪存模式的預取準確度,對于失效的數(shù)據(jù)訪存模式進 行更新。
[0068]主要優(yōu)點:
[0069] 1、該機制減少了重復訓練的次數(shù)和時間,通常只需要在配置信息首次執(zhí)行時進行 一次訓練過程;
[0070] 2、該機制記錄了配置信息準確的數(shù)據(jù)訪存模式,消除了無效的歷史數(shù)據(jù)對預取性 能的負面影響;
[0071] 3、該機制的數(shù)據(jù)訪存模式可以記錄到循環(huán)的邊界,防止預取循環(huán)邊界之外的無效 數(shù)據(jù)。
[0072] 舉例而言,在圖3所示的結(jié)構上,對比本發(fā)明實施例提出的以配置信息驅(qū)動數(shù)據(jù)訪 存模式匹配的片上緩存預取機制與相關技術中方法的性能。該結(jié)構中的各部分模塊的配置 參數(shù)如表2所不,表2為:
[0073] 表 2
[0075]用于性能對比的測試集如表3所示,可以分為兩組:一組測試集包括Parallell~ Parallel7,其中兩個可重構陣列執(zhí)行同樣的算法,但是輸入數(shù)據(jù)不同;以測試集Parallel5 為例,可重構陣列1和可重構陣列2分別完成同一幀圖像的奇數(shù)場和偶數(shù)場的中值濾波運 算。另一組測試集包括Pipelinel~Pipelinee,其中兩個可重構陣列組成流水線,執(zhí)行不同 的算法;以測試集Pipeline為例,可重構陣列1完成反離散余弦變換,可重構陣列2完成運 動補償,這兩個算法是主流的視頻解碼算法中兩個順序執(zhí)行的子算法。
[0076]表 3
[0078]
[0079] 本發(fā)明實施例的預取方法與相關技術中3種預取方法的性能對比如圖6所示,具體 的性能對比結(jié)果如表4所示,其中采用LRU方法的性能加速比歸一化為1,其他預取方法的性 能以相對于LRU算法的性能加速比表示。
[0080] 表 4
[0082]由此得知,與相關技術中3種預取方法相比,采用本發(fā)明實施例的預取方法,系統(tǒng) 的性能加速比平均分別提高了32%,12%,和8%。
[0083]下面以測試集Parallel4為例,對比了本發(fā)明實施例與SBP方法得到的預取效果的 不同。
[0084] 本測試集中,兩個可重構陣列完成相同的運算,都是按照牛頓引力定律和牛頓運 動定律來模擬N個粒子的運動狀態(tài)。其中可重構陣列用到的輸入數(shù)據(jù)包括N個粒子的位置、 質(zhì)量、速度,它們按照不同的數(shù)組存放在外部存儲器中。計算的第一步是使用位置和質(zhì)量計 算粒子之間的引力大小;第二步是使用位置、質(zhì)量和速度計算每個粒子的運動狀態(tài)。計算過 程中可重構陣列的輸入數(shù)據(jù)由多個不同步長的短數(shù)據(jù)流交織組成,這些數(shù)據(jù)流在粒子的位 置、質(zhì)量、速度信息之間頻繁切換。
[0085] 在這種情況下,本發(fā)明實施例的預取方法可以檢測到不同時刻訪存同一類信息的 具有相同步長的多個短數(shù)據(jù)流,并且將它們合并為一個統(tǒng)一的長數(shù)據(jù)流;當配置信息再次 被執(zhí)行時,就可以預取整個長數(shù)據(jù)流,從而提高預取的性能。另外,本發(fā)明實施例的預取方 法將數(shù)據(jù)流與配置信息相關聯(lián),消除了其他配置信息的數(shù)據(jù)流對預取準確度的影響,可以 提尚預取的性能。
[0086] 相比之下,SBP預取方法只能按照預先定義好的固定步長進行預取,不適合本例子 中多個不同步長的數(shù)據(jù)流交織在一起的情況。因此,相比于SBP方法,本發(fā)明實施例的預取 方法可以提尚9 %的系統(tǒng)性能。
[0087] 根據(jù)本發(fā)明實施例的以配置信息驅(qū)動數(shù)據(jù)訪存模式匹配的片上緩存預取機制,在 進行收益評估時并不需要實際去獲得預取的數(shù)據(jù),而是通過判斷預取模板是否可以精準地 預取數(shù)據(jù),只有當預取模板的預取準確度超過一定的閾值時,才會按照該預取模板去實際 獲取預取數(shù)據(jù),提高了預取的準確度和性能,進一步提高了系統(tǒng)性能,簡單易實現(xiàn)。
[0088]在本發(fā)明的描述中,需要理解的是,術語"中心"、"縱向"、"橫向"、"長度"、"寬度"、 "厚度"、"上"、"下"、"前"、"后"、"左"、"右"、"豎直"、"水平"、"頂"、"底" "內(nèi)"、"外"、"順時 針"、"逆時針"、"軸向"、"徑向"、"周向"等指示的方位或位置關系為基于附圖所示的方位或 位置關系,僅是為了便于描述本發(fā)明和簡化描述,而不是指示或暗示所指的裝置或元件必 須具有特定的方位、以特定的方位構造和操作,因此不能理解為對本發(fā)明的限制。
[0089]此外,術語"第一"、"第二"僅用于描述目的,而不能理解為指示或暗示相對重要性 或者隱含指明所指示的技術特征的數(shù)量。由此,限定有"第一"、"第二"的特征可以明示或者 隱含地包括至少一個該特征。在本發(fā)明的描述中,"多個"的含義是至少兩個,例如兩個,三 個等,除非另有明確具體的限定。
[0090] 在本發(fā)明中,除非另有明確的規(guī)定和限定,術語"安裝"、"相連"、"連接"、"固定"等 術語應做廣義理解,例如,可以是固定連接,也可以是可拆卸連接,或成一體;可以是機械連 接,也可以是電連接;可以是直接相連,也可以通過中間媒介間接相連,可以是兩個元件內(nèi) 部的連通或兩個元件的相互作用關系,除非另有明確的限定。對于本領域的普通技術人員 而言,可以根據(jù)具體情況理解上述術語在本發(fā)明中的具體含義。
[0091] 在本發(fā)明中,除非另有明確的規(guī)定和限定,第一特征在第二特征"上"或"下"可以 是第一和第二特征直接接觸,或第一和第二特征通過中間媒介間接接觸。而且,第一特征在 第二特征"之上"、"上方"和"上面"可是第一特征在第二特征正上方或斜上方,或僅僅表示 第一特征水平高度高于第二特征。第一特征在第二特征"之下"、"下方"和"下面"可以是第 一特征在第二特征正下方或斜下方,或僅僅表示第一特征水平高度小于第二特征。
[0092] 在本說明書的描述中,參考術語"一個實施例"、"一些實施例"、"示例"、"具體示 例"、或"一些示例"等的描述意指結(jié)合該實施例或示例描述的具體特征、結(jié)構、材料或者特 點包含于本發(fā)明的至少一個實施例或示例中。在本說明書中,對上述術語的示意性表述不 必須針對的是相同的實施例或示例。而且,描述的具體特征、結(jié)構、材料或者特點可以在任 一個或多個實施例或示例中以合適的方式結(jié)合。此外,在不相互矛盾的情況下,本領域的技 術人員可以將本說明書中描述的不同實施例或示例以及不同實施例或示例的特征進行結(jié) 合和組合。
[0093] 盡管上面已經(jīng)示出和描述了本發(fā)明的實施例,可以理解的是,上述實施例是示例 性的,不能理解為對本發(fā)明的限制,本領域的普通技術人員在本發(fā)明的范圍內(nèi)可以對上述 實施例進行變化、修改、替換和變型。
【主權項】
1. 一種以配置信息驅(qū)動數(shù)據(jù)訪存模式匹配的片上緩存預取機制,其特征在于,包括: 模式檢測模塊,用于基于可重構陣列的訪存地址,檢測當前執(zhí)行的配置信息的預取模 式; 模式存儲模塊,用于存儲預設時間段內(nèi)使用的配置信息的預取模式; 地址生成模塊,用于根據(jù)存儲的預取模式為再次在可重構陣列上執(zhí)行的配置信息產(chǎn)生 數(shù)據(jù)預取地址;以及 模式評估模塊,用于計算所述存儲的預取模式的預取準確度,以檢測出失效的預取模 式并更新。2. 根據(jù)權利要求1所述的以配置信息驅(qū)動數(shù)據(jù)訪存模式匹配的片上緩存預取機制,其 特征在于,所述模式檢測模塊具體用于檢測所述訪存地址中的數(shù)據(jù)流,以記錄下描述數(shù)據(jù) 流的信息,并且當檢測到的數(shù)據(jù)流與之前的任意一個數(shù)據(jù)流首尾相接時,將這兩個數(shù)據(jù)流 拼接在一起,以及當檢測到的數(shù)據(jù)流與之前的任意一個數(shù)據(jù)流有重疊的地址時,將這兩個 數(shù)據(jù)流合并為一個。3. 根據(jù)權利要求1所述的以配置信息驅(qū)動數(shù)據(jù)訪存模式匹配的片上緩存預取機制,其 特征在于,緩存采用全相連(full-associative)的組織模式,緩存的標簽是配置信息索引, 緩存的數(shù)據(jù)空間為每套配置信息存儲固定數(shù)目的數(shù)據(jù)流。4. 根據(jù)權利要求1所述的以配置信息驅(qū)動數(shù)據(jù)訪存模式匹配的片上緩存預取機制,其 特征在于,所述地址生成模塊根據(jù)配置信息的預取模式產(chǎn)生基于步長的預取,其中,所述地 址生成模塊使用所述配置信息作為索引在所述模式存儲模塊中查找并讀出相應的預取模 式,按照基于步長的預取生成順序的所述數(shù)據(jù)預取地址。5. 根據(jù)權利要求1所述的以配置信息驅(qū)動數(shù)據(jù)訪存模式匹配的片上緩存預取機制,其 特征在于,所述模式評估模塊通過布隆濾波器、預取計數(shù)器與命中計數(shù)器計算預取準確度, 其中,所述布隆濾波器由多路選擇器、按位異或模塊和位向量組成,所述預取計數(shù)器與命中 計數(shù)器分別統(tǒng)計預取的數(shù)據(jù)量和命中的數(shù)據(jù)量。6. 根據(jù)權利要求5所述的以配置信息驅(qū)動數(shù)據(jù)訪存模式匹配的片上緩存預取機制,其 特征在于,所述預取模式的預取準確度通過計算命中計數(shù)器與預取計數(shù)器的比值得到,如 果所述比值超過預設閾值,則所述預取模式仍然有效,不需要進行更新,否則所述預取模式 需要被更新。7. 根據(jù)權利要求5所述的以配置信息驅(qū)動數(shù)據(jù)訪存模式匹配的片上緩存預取機制,其 特征在于,所述位向量、所述預取計數(shù)器與所述命中計數(shù)器在評估過程完成之后進行一次 復位。
【文檔編號】G06F12/08GK105930281SQ201610317626
【公開日】2016年9月7日
【申請日】2016年5月12日
【發(fā)明人】劉雷波, 楊晨, 羅凱, 李兆石, 尹首, 尹首一, 魏少軍
【申請人】清華大學
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
广宁县| 西乌珠穆沁旗| 正阳县| 郸城县| 剑河县| 聂荣县| 文登市| 晋中市| 自贡市| 石台县| 盐津县| 庄河市| 青冈县| 乌审旗| 衡东县| 巴南区| 柳林县| 无锡市| 蓬溪县| 玉林市| 镇赉县| 凌源市| 苗栗市| 米泉市| 德钦县| 炎陵县| 拉萨市| 信宜市| 剑河县| 资中县| 石棉县| 紫云| 湘乡市| 喜德县| 兴业县| 泉州市| 安泽县| 彭州市| 临清市| 新巴尔虎左旗| 余庆县|