欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種異構(gòu)處理器平臺(tái)測(cè)試與性能分級(jí)方法與流程

文檔序號(hào):40610233發(fā)布日期:2025-01-07 20:52閱讀:11來源:國(guó)知局
一種異構(gòu)處理器平臺(tái)測(cè)試與性能分級(jí)方法與流程

本發(fā)明涉及異構(gòu)處理器測(cè)試,具體為一種異構(gòu)處理器平臺(tái)測(cè)試與性能分級(jí)方法。


背景技術(shù):

1、當(dāng)前,隨著各類專門面向人工智能應(yīng)用的處理器設(shè)計(jì)理念和創(chuàng)新架構(gòu)逐漸成型,華為、寒武紀(jì)、燧原科技等十余種適用于不同應(yīng)用場(chǎng)景下的新興ai加速器持續(xù)涌現(xiàn),而如何高效、可靠的將這些多元化處理器集合利用起來,多元異構(gòu)成為了集成優(yōu)化的核心技術(shù),異構(gòu)處理器通過將各類算力協(xié)同處理,實(shí)現(xiàn)計(jì)算效力的最大化,從而提升處理器性能水平。然而,各類處理器都有不同的測(cè)試方法,不同的測(cè)試方法又可以滿足同樣的測(cè)試要求,因此,處理器測(cè)試存在方法不統(tǒng)一、架構(gòu)不完整、功能不具體等方面的問題。異構(gòu)處理器作為一種新形態(tài),對(duì)于測(cè)試方法的具體明確,測(cè)試體系的統(tǒng)一有效,能力水平的清晰明了,提出更高要求。

2、現(xiàn)有技術(shù)中,spec?cpu是spec組織推出的cpu計(jì)算性能測(cè)試基準(zhǔn)套件,關(guān)注cpu整點(diǎn)運(yùn)算能力、浮點(diǎn)運(yùn)算能力、整型并發(fā)速率和浮點(diǎn)并發(fā)速率,能夠客觀反映cpu自身計(jì)算性能情況。但是spec?cpu測(cè)試本身存在訪存壓力不夠、覆蓋場(chǎng)景有限等方面的問題,當(dāng)面對(duì)訪存要求更高、應(yīng)用場(chǎng)景更廣的異構(gòu)處理器時(shí),該局限性會(huì)被進(jìn)一步放大。與此同時(shí),speccpu主要關(guān)注計(jì)算性能,而忽略了對(duì)于內(nèi)存、系統(tǒng)等方面的能力。

3、cinebench則是由maxon?computer開發(fā),用cpu渲染高清圖片,支持單線程和多線程測(cè)試,是一種被業(yè)界廣泛采用的cpu基準(zhǔn)性能測(cè)試標(biāo)準(zhǔn)。但是cinebench只有一個(gè)測(cè)試,測(cè)試維度比較單一,主要還是側(cè)重于core的性能,與異構(gòu)處理器體系化、多場(chǎng)景、多維度的測(cè)試要求不相符。

4、綜上,現(xiàn)有的spec?cpu、cinebench等測(cè)試方法主要關(guān)注cpu能力,對(duì)于gpu以及異構(gòu)處理器的關(guān)注度較低。同時(shí),現(xiàn)有測(cè)試方法的維度較為單一、局限,無法滿足多元化測(cè)試要求,尚未形成體系化、定量化測(cè)試架構(gòu)。

5、因此,急需對(duì)此缺點(diǎn)進(jìn)行改進(jìn),本發(fā)明則是針對(duì)現(xiàn)有的技術(shù)及不足予以研究改良,提供有一種異構(gòu)處理器平臺(tái)測(cè)試與性能分級(jí)方法。


技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明的目的在于提供一種異構(gòu)處理器平臺(tái)測(cè)試與性能分級(jí)方法,以解決上述背景技術(shù)中提出的問題。

2、為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種異構(gòu)處理器平臺(tái)測(cè)試與性能分級(jí)方法,包括以下步驟:

3、s1、測(cè)試環(huán)境準(zhǔn)備階段:

4、s11、硬件環(huán)境:

5、在cpu方面:選用intel?xeon?e5-2620服務(wù)器,基準(zhǔn)頻率為2.0ghz,搭載主頻為2.00ghz的雙處理器,內(nèi)存為48gb;

6、在gpu方面:部署兩塊nvidia?tesla?k20c,顯存為5g;

7、s12、軟件環(huán)境:采用linux?centos7.0;

8、s13、測(cè)試樣品與設(shè)備:

9、測(cè)試樣品:三塊同型號(hào)異構(gòu)多核的處理器平臺(tái);

10、測(cè)試設(shè)備:選用與測(cè)試樣品接口兼容的計(jì)算機(jī)模塊以及一塊載板;

11、s2、測(cè)試計(jì)劃階段:

12、明確測(cè)試目的為:測(cè)試cpu-gpu異構(gòu)處理器平臺(tái)在cpu、gpu、內(nèi)存、系統(tǒng)等方面的性能情況并確定異構(gòu)能力等級(jí),據(jù)此確定測(cè)試項(xiàng)目,并針對(duì)不同的測(cè)試項(xiàng)目,選擇對(duì)應(yīng)的測(cè)試工具;

13、s3、測(cè)試執(zhí)行階段:

14、s31、測(cè)試樣品若支持dvfs,需在測(cè)試前關(guān)閉該功能;若不支持dvfs,則該步驟可以忽略;

15、s32、cpu性能測(cè)試和壓力測(cè)試

16、使用nbench測(cè)試cpu性能,獲得mem、int和fp,其中mem指數(shù)是內(nèi)存性能,int反映定點(diǎn)性能,fp是雙精度浮點(diǎn)性能;然后分別在三個(gè)樣品運(yùn)行stress工具測(cè)試cpu壓力情況,獲得反映系統(tǒng)平均負(fù)載的uptime;

17、s33、gpu壓力測(cè)試

18、安裝glmark2工具,對(duì)gpu進(jìn)行壓力測(cè)試,獲得照明、緩沖、紋理等圖形單元性能的最終分?jǐn)?shù);

19、s34、cpu與gpu聯(lián)合測(cè)試

20、采用luxmark?2.0工具,測(cè)試cpu+gpu模式下,opencl運(yùn)算性能;

21、s35、內(nèi)存訪問延遲測(cè)評(píng)和帶寬測(cè)試

22、采用lmbench工具測(cè)試內(nèi)存訪問延遲情況,得到連續(xù)訪問延遲和隨機(jī)訪問延遲數(shù)值;并采用stream工具測(cè)試內(nèi)存帶寬性能,得到copy、scale、add、triad帶寬衡量值;

23、s36、系統(tǒng)綜合性能測(cè)試

24、采用unixbench工具測(cè)試搭載異構(gòu)處理器整機(jī)的綜合性能,分別在單核和四核環(huán)境下測(cè)試,獲得單進(jìn)程和多進(jìn)程unixbench值;

25、s4、綜合分?jǐn)?shù)及等級(jí)評(píng)定階段:

26、對(duì)樣品進(jìn)行測(cè)試后,按照異構(gòu)處理器平臺(tái)分?jǐn)?shù)計(jì)算要求表中所述的分?jǐn)?shù)計(jì)算要求進(jìn)行打分,并按照分?jǐn)?shù)高低劃分不同異構(gòu)處理器平臺(tái)等級(jí)。

27、進(jìn)一步的,所述步驟s2中,測(cè)試項(xiàng)目具體包括:cpu性能測(cè)試和壓力測(cè)試、gpu壓力測(cè)試、cpu與gpu聯(lián)合測(cè)試、內(nèi)存訪問延遲測(cè)評(píng)和帶寬測(cè)試、系統(tǒng)綜合性能測(cè)試。

28、進(jìn)一步的,所述測(cè)試項(xiàng)目選用的測(cè)試工具情況如下:

29、1)cpu性能測(cè)試和壓力測(cè)試,選用nbench和stress作為測(cè)試工具;

30、2)gpu壓力測(cè)試,選用glmark2作為測(cè)試工具;

31、3)cpu與gpu聯(lián)合測(cè)試,選用luxmark?2.0作為測(cè)試工具;

32、4)內(nèi)存訪問延遲測(cè)評(píng)和帶寬測(cè)試,選用lmbench和stream作為測(cè)試工具;

33、5)平臺(tái)綜合性能測(cè)試,選用unixbench作為平臺(tái)的系統(tǒng)性能測(cè)試工具。

34、進(jìn)一步的,所述步驟s4中,異構(gòu)處理器平臺(tái)分?jǐn)?shù)計(jì)算要求表包括cpu、gpu、cpu+gpu、內(nèi)存、系統(tǒng)五個(gè)測(cè)試項(xiàng)。

35、進(jìn)一步的,所述cpu測(cè)試項(xiàng)的總分為20分,具體包括mem、inf、fp、uptime四個(gè)指標(biāo),各指標(biāo)的子分項(xiàng)均為5分,且各指標(biāo)的評(píng)分規(guī)則如下:

36、mem:mem≥6.0時(shí),獲得滿分5分;

37、mem<6.0時(shí),得分為5*mem/6;

38、inf:int≥6.5時(shí),獲得滿分10分;

39、int<6.5時(shí),得分為10*int/13;

40、fp:fp≥6.5時(shí),獲得滿分10分;

41、fp<6.5時(shí),得分為10*fp/13;

42、uptime:uptime>0.7cpu時(shí),得分為0;

43、uptime在(0.6cpu,0.7cpu]之間時(shí),得分為1;

44、uptime在(0.3cpu,0.6cpu]之間時(shí),得分為3;

45、uptime在(0,0.3cpu]之間時(shí),得分為5。

46、進(jìn)一步的,所述gpu測(cè)試項(xiàng)的總分為15分,具體包括glmark2指標(biāo),且該指標(biāo)的子分項(xiàng)為15分,其評(píng)分規(guī)則為:

47、sg≥3000時(shí),獲得滿分15分;

48、sg<3000時(shí),得分為sg/200;

49、其中,sg為glmark2測(cè)試跑分結(jié)果。

50、進(jìn)一步的,所述cpu+gpu測(cè)試項(xiàng)的總分為15分,具體包括luxmark指標(biāo),且該指標(biāo)的子分項(xiàng)為15分,其評(píng)分規(guī)則為:

51、sl≥400時(shí),獲得滿分15分;

52、sl<400時(shí),得分為3*sl/80;

53、其中,sl為luxmark基準(zhǔn)測(cè)試跑分結(jié)果。

54、進(jìn)一步的,所述內(nèi)存測(cè)試項(xiàng)的總分為36分,具體包括連續(xù)訪問延遲、隨機(jī)訪問延遲、copy、scale、add、triad六個(gè)指標(biāo),且各指標(biāo)的子分項(xiàng)以及評(píng)分規(guī)則如下:

55、連續(xù)訪問延遲(6分):0ns≤tcont≤10ns時(shí),獲得滿分6分;

56、tcont>10ns時(shí),得分為60/tcont;

57、其中,tcont為連續(xù)訪問延遲時(shí)長(zhǎng);

58、隨機(jī)訪問延遲(6分):0ns≤trand≤120ns時(shí),獲得滿分6分;

59、trand>120ns時(shí),得分為720/trand;

60、其中,trand為隨機(jī)訪問延遲時(shí)長(zhǎng);

61、copy(4分):copy≥10000mb/s時(shí),獲得滿分4分;

62、copy<10000mb/s時(shí),得分為copy/2500;

63、scale(4分):scale≥8000mb/s時(shí),獲得滿分4分;

64、scale<8000mb/s時(shí),得分為scale/2000;

65、add(4分):add≥9000mb/s時(shí),獲得滿分4分;

66、add<9000mb/s時(shí),得分為add/2250;

67、triad(4分):triad≥9000mb/s時(shí),獲得滿分4分;

68、triad<9000mb/s時(shí),得分為triad/2250。

69、進(jìn)一步的,所述系統(tǒng)測(cè)試項(xiàng)的總分為14分,具體包括單進(jìn)程、多進(jìn)程兩個(gè)指標(biāo),各指標(biāo)的子分項(xiàng)均為7分,且各指標(biāo)的評(píng)分規(guī)則如下:

70、單進(jìn)程:u單≥1400時(shí),獲得滿分7分;

71、u單<1400時(shí),得分為u單/200;

72、其中,u單代表單進(jìn)程unixbench值;

73、多進(jìn)程:u多≥3000mb/s時(shí),獲得滿分7分;

74、u多<3000mb/s時(shí),得分為7*u多/3000;

75、其中,u多代表多進(jìn)程unixbench值。

76、進(jìn)一步的,所述步驟s4中,異構(gòu)處理器平臺(tái)等級(jí)總共有3檔:從一級(jí)到三級(jí),且一級(jí)異構(gòu)處理器平臺(tái)性能最低,三級(jí)異構(gòu)處理器平臺(tái)性能最高。

77、本發(fā)明提供了一種異構(gòu)處理器平臺(tái)測(cè)試與性能分級(jí)方法,具備以下有益效果:

78、本發(fā)明給出了一種異構(gòu)處理器平臺(tái)的測(cè)試方法體系和性能水平分級(jí)策略,通過測(cè)試結(jié)果可計(jì)算指標(biāo)值,最終得到異構(gòu)處理器平臺(tái)的性能情況,并根據(jù)分級(jí)要求將其定為“一級(jí)”、“二級(jí)”、“三級(jí)”中的某一性能級(jí)別。本發(fā)明以測(cè)試為手段,構(gòu)建起異構(gòu)處理器平臺(tái)測(cè)試體系,并通過分級(jí)評(píng)估方式,幫助企業(yè)明確異構(gòu)處理器能力水平,從而針對(duì)性優(yōu)化現(xiàn)有異構(gòu)處理器性能,加快異構(gòu)處理器應(yīng)用深度和廣度。

79、通過本發(fā)明的技術(shù)方案,有助于明確異構(gòu)處理器性能水平,幫助建設(shè)者和使用者明確異構(gòu)處理器的性能水平,加快提升算力基礎(chǔ)設(shè)施整體性能,為異構(gòu)處理器應(yīng)用推廣和高性能算力基礎(chǔ)設(shè)施建設(shè)提供堅(jiān)實(shí)的設(shè)備保障。

80、通過本發(fā)明的技術(shù)方案,能夠提供異構(gòu)處理器優(yōu)化思路,從多個(gè)角度提高異構(gòu)處理器性能,可采用多樣化技術(shù)手段,聚焦cpu、gpu、內(nèi)存、系統(tǒng)等維度,提高處理器負(fù)載能力和訪問內(nèi)存帶寬,降低處理時(shí)延,實(shí)現(xiàn)處理器性能優(yōu)化和高效處理。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
虎林市| 丹江口市| 遂昌县| 高雄市| 宜宾市| 固始县| 晴隆县| 乐安县| 南华县| 合肥市| 龙井市| 隆尧县| 高密市| 赣州市| 宜黄县| 巴彦淖尔市| 敖汉旗| 恭城| 青川县| 永济市| 大邑县| 遂溪县| 赤城县| 三穗县| 河津市| 团风县| 阳原县| 苍南县| 喜德县| 平阳县| 安顺市| 句容市| 遂昌县| 黑山县| 屏边| 临泉县| 道孚县| 莱州市| 雅江县| 云霄县| 阿城市|