本發(fā)明涉及異構(gòu)處理器測(cè)試,具體為一種異構(gòu)處理器平臺(tái)測(cè)試與性能分級(jí)方法。
背景技術(shù):
1、當(dāng)前,隨著各類專門面向人工智能應(yīng)用的處理器設(shè)計(jì)理念和創(chuàng)新架構(gòu)逐漸成型,華為、寒武紀(jì)、燧原科技等十余種適用于不同應(yīng)用場(chǎng)景下的新興ai加速器持續(xù)涌現(xiàn),而如何高效、可靠的將這些多元化處理器集合利用起來,多元異構(gòu)成為了集成優(yōu)化的核心技術(shù),異構(gòu)處理器通過將各類算力協(xié)同處理,實(shí)現(xiàn)計(jì)算效力的最大化,從而提升處理器性能水平。然而,各類處理器都有不同的測(cè)試方法,不同的測(cè)試方法又可以滿足同樣的測(cè)試要求,因此,處理器測(cè)試存在方法不統(tǒng)一、架構(gòu)不完整、功能不具體等方面的問題。異構(gòu)處理器作為一種新形態(tài),對(duì)于測(cè)試方法的具體明確,測(cè)試體系的統(tǒng)一有效,能力水平的清晰明了,提出更高要求。
2、現(xiàn)有技術(shù)中,spec?cpu是spec組織推出的cpu計(jì)算性能測(cè)試基準(zhǔn)套件,關(guān)注cpu整點(diǎn)運(yùn)算能力、浮點(diǎn)運(yùn)算能力、整型并發(fā)速率和浮點(diǎn)并發(fā)速率,能夠客觀反映cpu自身計(jì)算性能情況。但是spec?cpu測(cè)試本身存在訪存壓力不夠、覆蓋場(chǎng)景有限等方面的問題,當(dāng)面對(duì)訪存要求更高、應(yīng)用場(chǎng)景更廣的異構(gòu)處理器時(shí),該局限性會(huì)被進(jìn)一步放大。與此同時(shí),speccpu主要關(guān)注計(jì)算性能,而忽略了對(duì)于內(nèi)存、系統(tǒng)等方面的能力。
3、cinebench則是由maxon?computer開發(fā),用cpu渲染高清圖片,支持單線程和多線程測(cè)試,是一種被業(yè)界廣泛采用的cpu基準(zhǔn)性能測(cè)試標(biāo)準(zhǔn)。但是cinebench只有一個(gè)測(cè)試,測(cè)試維度比較單一,主要還是側(cè)重于core的性能,與異構(gòu)處理器體系化、多場(chǎng)景、多維度的測(cè)試要求不相符。
4、綜上,現(xiàn)有的spec?cpu、cinebench等測(cè)試方法主要關(guān)注cpu能力,對(duì)于gpu以及異構(gòu)處理器的關(guān)注度較低。同時(shí),現(xiàn)有測(cè)試方法的維度較為單一、局限,無法滿足多元化測(cè)試要求,尚未形成體系化、定量化測(cè)試架構(gòu)。
5、因此,急需對(duì)此缺點(diǎn)進(jìn)行改進(jìn),本發(fā)明則是針對(duì)現(xiàn)有的技術(shù)及不足予以研究改良,提供有一種異構(gòu)處理器平臺(tái)測(cè)試與性能分級(jí)方法。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供一種異構(gòu)處理器平臺(tái)測(cè)試與性能分級(jí)方法,以解決上述背景技術(shù)中提出的問題。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種異構(gòu)處理器平臺(tái)測(cè)試與性能分級(jí)方法,包括以下步驟:
3、s1、測(cè)試環(huán)境準(zhǔn)備階段:
4、s11、硬件環(huán)境:
5、在cpu方面:選用intel?xeon?e5-2620服務(wù)器,基準(zhǔn)頻率為2.0ghz,搭載主頻為2.00ghz的雙處理器,內(nèi)存為48gb;
6、在gpu方面:部署兩塊nvidia?tesla?k20c,顯存為5g;
7、s12、軟件環(huán)境:采用linux?centos7.0;
8、s13、測(cè)試樣品與設(shè)備:
9、測(cè)試樣品:三塊同型號(hào)異構(gòu)多核的處理器平臺(tái);
10、測(cè)試設(shè)備:選用與測(cè)試樣品接口兼容的計(jì)算機(jī)模塊以及一塊載板;
11、s2、測(cè)試計(jì)劃階段:
12、明確測(cè)試目的為:測(cè)試cpu-gpu異構(gòu)處理器平臺(tái)在cpu、gpu、內(nèi)存、系統(tǒng)等方面的性能情況并確定異構(gòu)能力等級(jí),據(jù)此確定測(cè)試項(xiàng)目,并針對(duì)不同的測(cè)試項(xiàng)目,選擇對(duì)應(yīng)的測(cè)試工具;
13、s3、測(cè)試執(zhí)行階段:
14、s31、測(cè)試樣品若支持dvfs,需在測(cè)試前關(guān)閉該功能;若不支持dvfs,則該步驟可以忽略;
15、s32、cpu性能測(cè)試和壓力測(cè)試
16、使用nbench測(cè)試cpu性能,獲得mem、int和fp,其中mem指數(shù)是內(nèi)存性能,int反映定點(diǎn)性能,fp是雙精度浮點(diǎn)性能;然后分別在三個(gè)樣品運(yùn)行stress工具測(cè)試cpu壓力情況,獲得反映系統(tǒng)平均負(fù)載的uptime;
17、s33、gpu壓力測(cè)試
18、安裝glmark2工具,對(duì)gpu進(jìn)行壓力測(cè)試,獲得照明、緩沖、紋理等圖形單元性能的最終分?jǐn)?shù);
19、s34、cpu與gpu聯(lián)合測(cè)試
20、采用luxmark?2.0工具,測(cè)試cpu+gpu模式下,opencl運(yùn)算性能;
21、s35、內(nèi)存訪問延遲測(cè)評(píng)和帶寬測(cè)試
22、采用lmbench工具測(cè)試內(nèi)存訪問延遲情況,得到連續(xù)訪問延遲和隨機(jī)訪問延遲數(shù)值;并采用stream工具測(cè)試內(nèi)存帶寬性能,得到copy、scale、add、triad帶寬衡量值;
23、s36、系統(tǒng)綜合性能測(cè)試
24、采用unixbench工具測(cè)試搭載異構(gòu)處理器整機(jī)的綜合性能,分別在單核和四核環(huán)境下測(cè)試,獲得單進(jìn)程和多進(jìn)程unixbench值;
25、s4、綜合分?jǐn)?shù)及等級(jí)評(píng)定階段:
26、對(duì)樣品進(jìn)行測(cè)試后,按照異構(gòu)處理器平臺(tái)分?jǐn)?shù)計(jì)算要求表中所述的分?jǐn)?shù)計(jì)算要求進(jìn)行打分,并按照分?jǐn)?shù)高低劃分不同異構(gòu)處理器平臺(tái)等級(jí)。
27、進(jìn)一步的,所述步驟s2中,測(cè)試項(xiàng)目具體包括:cpu性能測(cè)試和壓力測(cè)試、gpu壓力測(cè)試、cpu與gpu聯(lián)合測(cè)試、內(nèi)存訪問延遲測(cè)評(píng)和帶寬測(cè)試、系統(tǒng)綜合性能測(cè)試。
28、進(jìn)一步的,所述測(cè)試項(xiàng)目選用的測(cè)試工具情況如下:
29、1)cpu性能測(cè)試和壓力測(cè)試,選用nbench和stress作為測(cè)試工具;
30、2)gpu壓力測(cè)試,選用glmark2作為測(cè)試工具;
31、3)cpu與gpu聯(lián)合測(cè)試,選用luxmark?2.0作為測(cè)試工具;
32、4)內(nèi)存訪問延遲測(cè)評(píng)和帶寬測(cè)試,選用lmbench和stream作為測(cè)試工具;
33、5)平臺(tái)綜合性能測(cè)試,選用unixbench作為平臺(tái)的系統(tǒng)性能測(cè)試工具。
34、進(jìn)一步的,所述步驟s4中,異構(gòu)處理器平臺(tái)分?jǐn)?shù)計(jì)算要求表包括cpu、gpu、cpu+gpu、內(nèi)存、系統(tǒng)五個(gè)測(cè)試項(xiàng)。
35、進(jìn)一步的,所述cpu測(cè)試項(xiàng)的總分為20分,具體包括mem、inf、fp、uptime四個(gè)指標(biāo),各指標(biāo)的子分項(xiàng)均為5分,且各指標(biāo)的評(píng)分規(guī)則如下:
36、mem:mem≥6.0時(shí),獲得滿分5分;
37、mem<6.0時(shí),得分為5*mem/6;
38、inf:int≥6.5時(shí),獲得滿分10分;
39、int<6.5時(shí),得分為10*int/13;
40、fp:fp≥6.5時(shí),獲得滿分10分;
41、fp<6.5時(shí),得分為10*fp/13;
42、uptime:uptime>0.7cpu時(shí),得分為0;
43、uptime在(0.6cpu,0.7cpu]之間時(shí),得分為1;
44、uptime在(0.3cpu,0.6cpu]之間時(shí),得分為3;
45、uptime在(0,0.3cpu]之間時(shí),得分為5。
46、進(jìn)一步的,所述gpu測(cè)試項(xiàng)的總分為15分,具體包括glmark2指標(biāo),且該指標(biāo)的子分項(xiàng)為15分,其評(píng)分規(guī)則為:
47、sg≥3000時(shí),獲得滿分15分;
48、sg<3000時(shí),得分為sg/200;
49、其中,sg為glmark2測(cè)試跑分結(jié)果。
50、進(jìn)一步的,所述cpu+gpu測(cè)試項(xiàng)的總分為15分,具體包括luxmark指標(biāo),且該指標(biāo)的子分項(xiàng)為15分,其評(píng)分規(guī)則為:
51、sl≥400時(shí),獲得滿分15分;
52、sl<400時(shí),得分為3*sl/80;
53、其中,sl為luxmark基準(zhǔn)測(cè)試跑分結(jié)果。
54、進(jìn)一步的,所述內(nèi)存測(cè)試項(xiàng)的總分為36分,具體包括連續(xù)訪問延遲、隨機(jī)訪問延遲、copy、scale、add、triad六個(gè)指標(biāo),且各指標(biāo)的子分項(xiàng)以及評(píng)分規(guī)則如下:
55、連續(xù)訪問延遲(6分):0ns≤tcont≤10ns時(shí),獲得滿分6分;
56、tcont>10ns時(shí),得分為60/tcont;
57、其中,tcont為連續(xù)訪問延遲時(shí)長(zhǎng);
58、隨機(jī)訪問延遲(6分):0ns≤trand≤120ns時(shí),獲得滿分6分;
59、trand>120ns時(shí),得分為720/trand;
60、其中,trand為隨機(jī)訪問延遲時(shí)長(zhǎng);
61、copy(4分):copy≥10000mb/s時(shí),獲得滿分4分;
62、copy<10000mb/s時(shí),得分為copy/2500;
63、scale(4分):scale≥8000mb/s時(shí),獲得滿分4分;
64、scale<8000mb/s時(shí),得分為scale/2000;
65、add(4分):add≥9000mb/s時(shí),獲得滿分4分;
66、add<9000mb/s時(shí),得分為add/2250;
67、triad(4分):triad≥9000mb/s時(shí),獲得滿分4分;
68、triad<9000mb/s時(shí),得分為triad/2250。
69、進(jìn)一步的,所述系統(tǒng)測(cè)試項(xiàng)的總分為14分,具體包括單進(jìn)程、多進(jìn)程兩個(gè)指標(biāo),各指標(biāo)的子分項(xiàng)均為7分,且各指標(biāo)的評(píng)分規(guī)則如下:
70、單進(jìn)程:u單≥1400時(shí),獲得滿分7分;
71、u單<1400時(shí),得分為u單/200;
72、其中,u單代表單進(jìn)程unixbench值;
73、多進(jìn)程:u多≥3000mb/s時(shí),獲得滿分7分;
74、u多<3000mb/s時(shí),得分為7*u多/3000;
75、其中,u多代表多進(jìn)程unixbench值。
76、進(jìn)一步的,所述步驟s4中,異構(gòu)處理器平臺(tái)等級(jí)總共有3檔:從一級(jí)到三級(jí),且一級(jí)異構(gòu)處理器平臺(tái)性能最低,三級(jí)異構(gòu)處理器平臺(tái)性能最高。
77、本發(fā)明提供了一種異構(gòu)處理器平臺(tái)測(cè)試與性能分級(jí)方法,具備以下有益效果:
78、本發(fā)明給出了一種異構(gòu)處理器平臺(tái)的測(cè)試方法體系和性能水平分級(jí)策略,通過測(cè)試結(jié)果可計(jì)算指標(biāo)值,最終得到異構(gòu)處理器平臺(tái)的性能情況,并根據(jù)分級(jí)要求將其定為“一級(jí)”、“二級(jí)”、“三級(jí)”中的某一性能級(jí)別。本發(fā)明以測(cè)試為手段,構(gòu)建起異構(gòu)處理器平臺(tái)測(cè)試體系,并通過分級(jí)評(píng)估方式,幫助企業(yè)明確異構(gòu)處理器能力水平,從而針對(duì)性優(yōu)化現(xiàn)有異構(gòu)處理器性能,加快異構(gòu)處理器應(yīng)用深度和廣度。
79、通過本發(fā)明的技術(shù)方案,有助于明確異構(gòu)處理器性能水平,幫助建設(shè)者和使用者明確異構(gòu)處理器的性能水平,加快提升算力基礎(chǔ)設(shè)施整體性能,為異構(gòu)處理器應(yīng)用推廣和高性能算力基礎(chǔ)設(shè)施建設(shè)提供堅(jiān)實(shí)的設(shè)備保障。
80、通過本發(fā)明的技術(shù)方案,能夠提供異構(gòu)處理器優(yōu)化思路,從多個(gè)角度提高異構(gòu)處理器性能,可采用多樣化技術(shù)手段,聚焦cpu、gpu、內(nèi)存、系統(tǒng)等維度,提高處理器負(fù)載能力和訪問內(nèi)存帶寬,降低處理時(shí)延,實(shí)現(xiàn)處理器性能優(yōu)化和高效處理。