欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種同時(shí)線程處理器的分支預(yù)測(cè)器設(shè)計(jì)的制作方法

文檔序號(hào):6487943閱讀:315來(lái)源:國(guó)知局
一種同時(shí)線程處理器的分支預(yù)測(cè)器設(shè)計(jì)的制作方法
【專(zhuān)利摘要】一種同時(shí)線程處理器的分支預(yù)測(cè)器設(shè)計(jì)。本發(fā)明采用了共享和獨(dú)立可配置的方式,能夠適應(yīng)不用的應(yīng)用程序,能夠更好的發(fā)揮分支預(yù)測(cè)的效率。獨(dú)立模式下的PHT分配采用動(dòng)態(tài)調(diào)整的結(jié)構(gòu),則能夠充分的利用硬件資源,保證處理器在只運(yùn)行少量線程時(shí)能夠獲得更好的性能。同時(shí),本發(fā)明使用多個(gè)小的PHT組合的方式,總的大小不會(huì)超過(guò)其它的預(yù)測(cè)方法。因此,在保證高效率的前提下所增加的硬件開(kāi)銷(xiāo)也很小,從而保證了它的實(shí)用性。
【專(zhuān)利說(shuō)明】一種同時(shí)線程處理器的分支預(yù)測(cè)器設(shè)計(jì)
【技術(shù)領(lǐng)域】
[0001 ] 本發(fā)明涉及計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)的設(shè)計(jì)。
【背景技術(shù)】
[0002]在傳統(tǒng)的超標(biāo)量處理器中,處理器性能的提高主要依靠提取程序的指令級(jí)并行性 (Instruction, Level Parallelism, ILP)來(lái)獲得。而分支指令是影響ILP開(kāi)發(fā)的重火障礙, 這是由于分支的誤預(yù)測(cè)所帶來(lái)的代價(jià)太大,在Pentiumll/III和Alpha21264中,分支預(yù)測(cè) 錯(cuò),重新刷新流水線需要11個(gè)周期以上,將浪費(fèi)I?4個(gè)取指周期取來(lái)的指令。在通用程 序代碼的指令流中,平均每5?7條指令就會(huì)有一條分支指令,同時(shí)現(xiàn)代高性能處理器流水 線深度越來(lái)越高,謎I大大增加了預(yù)測(cè)錯(cuò)誤的代價(jià)。針對(duì)分支預(yù)測(cè)的問(wèn)題,學(xué)術(shù)界已經(jīng)作了 很多卓有成效的研究,當(dāng)前動(dòng)態(tài)預(yù)測(cè)技術(shù)的精度對(duì)SPEC CPU ql的非數(shù)值程序已能達(dá)到平 均95%的預(yù)測(cè)精度,進(jìn)一步提高精度需要付出更多的硬件開(kāi)銷(xiāo),因此,超標(biāo)量處理器巾的分 支預(yù)測(cè)技術(shù)研究已經(jīng)非常充分了。
[0003]相比于超標(biāo)量處理器,SMT處理器中的分支處理問(wèn)題就變得不那么明朗了。SMT處 理器同時(shí)利用了線程級(jí)并行性(Thread-Level Parallelism,TLP)和指令級(jí)并行性ILP,不 同線程的指令相互獨(dú)立,可以被同時(shí)發(fā)射執(zhí)行,比單線揮的超標(biāo)量處理器達(dá)到了更好的吞 吐量和加速比。單個(gè)線程執(zhí)行過(guò)程中出現(xiàn)的延遲可以通過(guò)線程的調(diào)度被其它線程所隱藏, 從而具有更好的延遲容忍能力。同樣,分支的誤預(yù)測(cè)對(duì)于SMT處理器性能的影響也遠(yuǎn)小于 超標(biāo)量處理器,但這并不意味著SMT處理器中分支問(wèn)題VIII以被忽略。然而目前人們對(duì) SMT處理器中的分支處理問(wèn)題的研究并不多,建設(shè)性的成果就更少了。本發(fā)明主要設(shè)計(jì)了一 種SMT處理其中的分支預(yù)測(cè)器,使得預(yù)測(cè)準(zhǔn)確度較先前有大幅提升。

【發(fā)明內(nèi)容】

[0004]本發(fā)明主要涉及可重構(gòu)Gshare預(yù)測(cè)器的設(shè)計(jì)
[0005]可重構(gòu)Gshare預(yù)測(cè)器采用了共享和獨(dú)立可配置的方式,能夠適應(yīng)不用的應(yīng)用程 序,能夠更好的發(fā)揮分支預(yù)測(cè)的效率。獨(dú)立模式下的PHT分配采用動(dòng)態(tài)調(diào)整的結(jié)構(gòu),則能夠 充分的利用硬件資源,保證處理器在只運(yùn)行少量線程時(shí)能夠獲得更好的性能。
[0006]同時(shí),可重構(gòu)Gshare預(yù)測(cè)器使用多個(gè)小的PHT組合的方式,總的大小不會(huì)超過(guò)其 它的預(yù)測(cè)方法。因此,可重構(gòu)Gshare預(yù)測(cè)器在保證高效率的前提下所增加的硬件開(kāi)銷(xiāo)也很 小,從而保證了它的實(shí)用性。
【專(zhuān)利附圖】

【附圖說(shuō)明】
[0007]圖1為可重構(gòu)Gshare預(yù)測(cè)器的基本結(jié)構(gòu)
[0008]圖2為共享模式下的可重構(gòu)Gshare預(yù)測(cè)器
[0009]圖3為獨(dú)立模式下的可重構(gòu)Gshare預(yù)測(cè)器【具體實(shí)施方式】
[0010]由于可重構(gòu)硬件擁有更大的靈活性,同時(shí)當(dāng)前的各種不同分支預(yù)測(cè)方案往往適用 于不同的環(huán)境,特別是在SMT處理器中,多道程序的負(fù)載和并行程序的負(fù)載對(duì)于分支預(yù)測(cè) 方案的要求是不一樣的,而應(yīng)用程序的類(lèi)型也會(huì)影響分支預(yù)測(cè)方案的選擇,因此,我們希望 通過(guò)可重構(gòu)硬件來(lái)實(shí)現(xiàn)分支預(yù)測(cè)方案的靈活性。
[0011 ] 本設(shè)計(jì)的可重構(gòu)Gshare預(yù)測(cè)器包括n個(gè)小的PHT結(jié)構(gòu)和n個(gè)全局歷史寄存器GHR, 這n個(gè)PHT通過(guò)可重構(gòu)邏輯來(lái)進(jìn)行控制。這里,GHR是每個(gè)活動(dòng)線程都有一個(gè),每增加一個(gè) 線程,就為該線程分配一個(gè)GHR。通過(guò)可重構(gòu)邏輯,可以將PHTl?PHTn配置成獨(dú)立的,或者 是共享的,用各線程的GHR和分支地址異或的結(jié)果來(lái)索引。這樣,該預(yù)測(cè)器可以工作在共享 和獨(dú)立兩種模式下,通過(guò)可重構(gòu)邏輯來(lái)進(jìn)行配置。
[0012]在共享模式下,PHTl?PHTn合成一個(gè)整體的PHT,為每個(gè)線程所共享。這種模 式下,GHR依然是各線程擁有各自獨(dú)立的一個(gè)。實(shí)際上,這就是一個(gè)GHR獨(dú)立,PHT共享的 Gshare預(yù)測(cè)器配置。
[0013]在獨(dú)立模式下,活動(dòng)線程數(shù)為m,PHTa?PHTk是動(dòng)態(tài)調(diào)整后的PHT結(jié)構(gòu),它可能包 含I個(gè)或多個(gè)小的PHT,剩余部分為空閑的小PHT。這種模式下,各線程分別訪問(wèn)各自獨(dú)立 的PHT,GHR為各線程獨(dú)立擁有。并且,這種模式下,各線程擁有的PHT的大小事可以隨著活 動(dòng)線程數(shù)目動(dòng)態(tài)變化的,以n = 8為例,當(dāng)活動(dòng)線程數(shù)目m只有I個(gè)時(shí),PHTl?PHT8合成 一個(gè),也就是說(shuō),該線程可以利用整個(gè)的PHT ;當(dāng)活動(dòng)線程數(shù)目m為5?7個(gè)時(shí),各線程也只 占用一個(gè)小的PHTi,這時(shí),m個(gè)小的PHT處于工作狀態(tài),剩余的n-m個(gè)處于空閑狀態(tài);活動(dòng)線 程數(shù)目m為3?4個(gè)時(shí),為每個(gè)線程分配兩個(gè)PHT ;活動(dòng)線程數(shù)目m為2時(shí),則每個(gè)線程分 配4個(gè)PHT。
【權(quán)利要求】
1.一種同時(shí)線程處理器的分支預(yù)測(cè)器設(shè)計(jì),其特征在于:采用了共享和獨(dú)立可配置的 方式,能夠適應(yīng)不用的應(yīng)用程序,能夠更好的發(fā)揮分支預(yù)測(cè)的效率。獨(dú)立模式下的PHT分配 采用動(dòng)態(tài)調(diào)整的結(jié)構(gòu),則能夠充分的利用硬件資源,保證處理器在只運(yùn)行少量線程時(shí)能夠 獲得更好的性能。
2.根據(jù)權(quán)利要求1所述的同時(shí)線程處理器的分支預(yù)測(cè)器,其特征在于:可重構(gòu)Gshare預(yù)測(cè)器使用多個(gè)小的PHT組合的方式,總的大小不會(huì)超過(guò)其它的預(yù)測(cè)方法。
3.根據(jù)權(quán)利要求1所述的同時(shí)線程處理器的分支預(yù)測(cè)器,其特征在于:可重構(gòu)Gshare預(yù)測(cè)器包括n個(gè)小的PHT結(jié)構(gòu)和n個(gè)全局歷史寄存器GHR,這n個(gè)PHT 通過(guò)可重構(gòu)邏輯來(lái)進(jìn)行控制。
4.根據(jù)權(quán)利要求1所述的同時(shí)線程處理器的分支預(yù)測(cè)器,其特征在于:在共享模式下,PHTl?PHTn合成一個(gè)整體的PHT,為每個(gè)線程所共享。這種模式下, GHR依然是各線程擁有各自獨(dú)立的一個(gè)。實(shí)際上,這就是一個(gè)GHR獨(dú)立,PHT共享的Gshare 預(yù)測(cè)器配置。
5.根據(jù)權(quán)利要求1所述的同時(shí)線程處理器的分支預(yù)測(cè)器,其特征在于:在獨(dú)立模式下,活動(dòng)線程數(shù)為m,PHTa?PHTk是動(dòng)態(tài)調(diào)整后的PHT結(jié)構(gòu),它可能包含I 個(gè)或多個(gè)小的PHT,剩余部分為空閑的小PHT。
6.根據(jù)權(quán)利要求1所述的同時(shí)線程處理器的分支預(yù)測(cè)器,其特征在于:通過(guò)可重構(gòu)硬件來(lái)實(shí)現(xiàn)分支預(yù)測(cè)方案的靈活性。
【文檔編號(hào)】G06F9/38GK103593166SQ201210294702
【公開(kāi)日】2014年2月19日 申請(qǐng)日期:2012年8月17日 優(yōu)先權(quán)日:2012年8月17日
【發(fā)明者】劉書(shū), 鄭耀, 任治全, 陳曦 申請(qǐng)人:劉書(shū)
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
新巴尔虎左旗| 怀仁县| 保山市| 乌恰县| 边坝县| 东兴市| 邳州市| 凌云县| 通化市| 通许县| 图片| 合作市| 南通市| 陆丰市| 广东省| 阳江市| 高雄县| 称多县| 微博| 洞口县| 万载县| 西乌珠穆沁旗| 勐海县| 昂仁县| 芒康县| 晋宁县| 方山县| 邢台市| 金山区| 兰坪| 邳州市| 灵石县| 沿河| 遂川县| 滨州市| 博客| 正安县| 乡城县| 宁晋县| 开鲁县| 台东市|