核的工作負載是否足夠高以使進入更高性能狀態(tài)成為必要。這里,圖3b中示例性的“逐核” PO確定邏輯340可如圖2中可見被具現(xiàn)N次,從240_1至240_N。如圖2和3b中可見,單一核的諸個單獨線程_C0計數(shù)器值被求和以產(chǎn)生該核總的CO計數(shù)(“記分”)JS_co(core_co)。同樣,單一核的諸個單獨線程_C0P0計數(shù)器值被求和以產(chǎn)生該核總的COPO計數(shù)(“記分”)核_0^0((:0^_C0P0)。
[0029]根據(jù)圖3b中特定的實施例,貫穿多個觀察時間周期的連續(xù)Core_C0和Core_C0P0記分被累加至特殊的方程中,其衡量最近的觀察時間周期結(jié)束時的計數(shù)值相對于先前觀察時間周期各計數(shù)值之和的比例。具體來說,如圖2和3b中可見,運行的計數(shù)被列表如下:
[0030]Running_Core_C0[i] = (( 00 c)*core_C0[i]) + (((1-( 00 c))*Running_Core_
co[1-1])
[0031]Running_Core_C0P0[i] = (( 00 cp)*core_C0P0[i])+(((1-( 00 cp))*Running_Core_C0P0[1-l])
[0032]其中每次i的遞增對應(yīng)著下一個觀察時間周期。這里,-c和°c cp各自被分配了一個介于1.000和0.000之間的數(shù)值(需要注意的是,任何精度都可被用來指定OC C和-cp)。一個更接近1.000的數(shù)值將各自運行核的記分衡量為更側(cè)重于僅反映最近的觀察時間周期的計數(shù)值,而一個更接近0.000的數(shù)值將各自運行核的記分衡量為更側(cè)重于反映先前觀察時間周期記分的累積計數(shù)。
[0033]前者為突發(fā)事件提供了更直接的響應(yīng),而后者提供了更為審慎的(measured)方法,其僅在多個時間周期被觀察后對表現(xiàn)出的行為趨勢進行響應(yīng)。如下文將更詳盡地描述的,根據(jù)一種方法,C和cp值被保持在更接近1.000而非0.000以確保處理器的功率管理邏輯220能通過快速將核置于PO狀態(tài)對核負載的突然增加做出反應(yīng)。在一個實施例中,~ c被設(shè)置等于oc cp,然而,它們可根據(jù)設(shè)計者的偏好被設(shè)置成不等同。
[0034]在一個實施例中,如圖3b中可見,工作負載閾值是否被越過以致進入最高性能狀態(tài)的決策是基于Running_Core_COPO (運行_核_C0P0)是否為Running_Core_CO (運行_核_(:0)的足夠高的百分比。換一種說法,如果核表明在相應(yīng)OS/虛擬機請求PO狀態(tài)后,CO狀態(tài)中執(zhí)行的線程周期的足夠高比例被執(zhí)行,那么核進入PO狀態(tài)是被認(rèn)為合理的。在圖3b的實施例中,該決定基本被計算如下:
[0035]If
[0036](Running_Core_COPO[i]>β c*Running_Core_CO[i])
[0037]THEN核性能狀態(tài)=PO
[0038]其中β c代表處在CO狀態(tài)中的周期比例,其中PO狀態(tài)已經(jīng)被OS所請求。更正式來說,為了防止抖動(當(dāng) Running_Core_C0P0[i]近似等于 β c*Running_Core_CO[i]時,不穩(wěn)定地、快速往復(fù)地進入和離開PO狀態(tài)),根據(jù)下式,某些回滯(hysteresis) 330被建入PO確定的算法中:
[0039]If
[0040](Running_Core_C0P0[i]>β c_h*Running_Core_CO[i])
[0041 ] THEN核性能狀態(tài)=PO
[0042]ELSE If ((核性能狀態(tài)==PO) and
[0043](Running_Core_C0P0[i]>β c_l*Running_Core_CO[i])
[0044]THEN核性能狀態(tài)=! PO//退出核加速模式
[0045]其中β c_l< β c_h。
[0046]如圖2中可見,功率管理電路220包括邏輯電路,如240_1,被用于將合適的記分列表,并最終決定特定的核是否要進入PO狀態(tài)。功率管理電路220被耦接至?xí)r鐘產(chǎn)生電路222,如鎖相環(huán)電路,以在一個有限時間周期內(nèi)將給PO狀態(tài)的單獨核的頻率提高至超過處理器最大額定保證工作頻率的時鐘頻率,并且,同樣的,如果核將被帶出PO狀態(tài),則將核的時鐘頻率降低。
[0047]另一個特征是,以上描述的逐核的PO狀態(tài)技術(shù)也可被設(shè)計為同更傳統(tǒng)的方法(在背景部分中所討論的)一起和諧的工作,其僅將PO狀態(tài)視為平等影響所有處理器核的整體處理器狀態(tài)。
[0048]因此,如圖2和3c中可見,為Package_C0 (封裝_C0)和Package_C0P0 (封裝_C0P0)保存另一組計數(shù)器,其中,Package_C0是所有處理器核每個相應(yīng)Core_C0數(shù)值之和,而Package_C0P0是所有處理器核每個相應(yīng)package_C0P0數(shù)值之和。因此,Package_C0提供了在CO功率狀態(tài)中執(zhí)行的線程資源的處理器廣度的標(biāo)示,而Package_C0P0提供了在CO功率狀態(tài)中執(zhí)行的、其中PO性能狀態(tài)被請求的線程資源的處理器廣度的標(biāo)示。
[0049]與單獨核的分析相似,封裝級的分析250,根據(jù)圖3c中的一個實施例,可根據(jù)下式被確定:
[0050]Running_Package_CO[i] = (( 00 pc)*package_C0[i]) + (((1-( 00 pc))*Running_Package_C0[1-1])
[0051 ] Running_Package_C0P0 [i] = (( 00 pcp)*package_COPO[i]) + (((1-( 00 pep)) *Running_Package_C0P0[1-1])
[0052]其中pc對應(yīng)于相對先前的package_C0數(shù)值之和有多少比重被給予當(dāng)前的package_C0數(shù)值,而0pep對應(yīng)于相對先前的package_C0P0數(shù)值之和有多少比重被給予當(dāng)前的 package_C0P0 數(shù)值。
[0053]根據(jù)一種方法,pc和°^ pep兩個數(shù)值被給定一個相比0° c和°^ cp兩個數(shù)值更接近0.000的數(shù)值,以使封裝級PO狀態(tài)(其中所有核在一個有限時間周期內(nèi)被提供了超過處理器最大額定頻率的頻率)被進入時相比逐核級進入PO狀態(tài)具有更低的靈敏度。也就是說,00 C和~ cp數(shù)值被設(shè)定得相比0^ PC和~ pep數(shù)值更接近1.000,以使單一核響應(yīng)于核工作負載的突然增加可以相對更快速地進入其自身的PO狀態(tài),而相對的,處理器廣度的封裝級PO狀態(tài)僅在作出更審慎的觀察(其相比逐核的方法更側(cè)重于衡量遍及諸核的過去的工作負載要求)之后才被進入。在一個實施例中,~ Pc和《C pep被設(shè)置成彼此相等,盡管設(shè)計者可選擇將其設(shè)為不等同。
[0054]同樣與每個核的方法相仿,根據(jù)下式,回滯351可被建入封裝級PO狀態(tài)的確定:
[0055]If
[0056](Running_Package_C0P0[i]> βp_h*Running_Package_CO[i])
[0057]THEN package performance state = PO
[0058]ELSE If ((package performance state = = PO)and
[0059](Running_Package_C0P0[i]< βp_l*Running_Package_CO[i]))
[0060]THEN core performance state = ! PO// 退出封裝性能模式
[0061]其中β ρ_1< β p_h以防止進入和退出封裝級PO狀態(tài)間的抖動(thrashing)。根據(jù)進一步的實施例,β ρ_1〈0.5* β p_h。
[0062]這里,應(yīng)該被指出的是,如以上描述的每個核和封裝級控制的組合可被利用以“壓制”(override)先前用戶的設(shè)定,因為在當(dāng)前的應(yīng)用條件下,這樣的壓制是有其理由的(warranted)。例如,用戶可將處理器設(shè)為“綠色”模式或某些其他節(jié)電模式作為處理器的常規(guī)配置。然而,某種情況會發(fā)生,即呈現(xiàn)于核的工作負載如此極端以致暫時壓制用戶設(shè)置以滿足峰值需求是合理的。這里,用于封裝級和逐核級的列表的計數(shù)可被用作決定去壓制用戶設(shè)置的基礎(chǔ)。這里,足以觸發(fā)壓制操作的具體計數(shù)水平可被編程在硬件中。替代地、或與之組合,處理器可被設(shè)計為將計數(shù)公開至軟件(通過寄存器空間和/或存儲器)以使軟件(如功率管理軟件)能做出決定。
[0063]應(yīng)該指出的是,盡管以上討論很大程度上針對于影響通用處理核的性能狀態(tài),其他類型的核,如圖形處理核也可適于根據(jù)本文所描述的技術(shù)來處理。例如,具有一個或多個圖形核的處理器可根據(jù)以上描述的逐核的方法單獨進入PO狀態(tài)。確定PO狀態(tài)是否適合于圖形處理核的分析可包括~ C和~ CP數(shù)值,其與為通用核建立的數(shù)值相同或不同。關(guān)于圖形處理器的相同的方法也可對任何內(nèi)嵌于處理器的加速器采用。加速器,如普通技術(shù)人員所知,是設(shè)計成響應(yīng)相比需要執(zhí)行相同功能的通用核的指令數(shù)更少的命令/指令而執(zhí)行特定復(fù)雜功能(如加密/解密,dsp (數(shù)字信號處理),特定的算術(shù)功能,如金融運算,科學(xué)計算運算等)的專用硬件模塊。
[0064]對于實現(xiàn),任何/ 所有所列的 Thread_C0、Core_C0、Thread_P0C0、Core_P0C0、Running_Core_C0、Running_Core_P0C0、Package_C0 和 Package_C0P0、Running_Pa