一種異構(gòu)處理器平臺(tái)測(cè)試與性能分級(jí)方法與流程

文檔序號(hào)：40610233發(fā)布日期：2025-01-07 20:52閱讀：11來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及異構(gòu)處理器測(cè)試，具體為一種異構(gòu)處理器平臺(tái)測(cè)試與性能分級(jí)方法。

背景技術(shù)：

1、當(dāng)前，隨著各類專門面向人工智能應(yīng)用的處理器設(shè)計(jì)理念和創(chuàng)新架構(gòu)逐漸成型，華為、寒武紀(jì)、燧原科技等十余種適用于不同應(yīng)用場(chǎng)景下的新興ai加速器持續(xù)涌現(xiàn)，而如何高效、可靠的將這些多元化處理器集合利用起來，多元異構(gòu)成為了集成優(yōu)化的核心技術(shù)，異構(gòu)處理器通過將各類算力協(xié)同處理，實(shí)現(xiàn)計(jì)算效力的最大化，從而提升處理器性能水平。然而，各類處理器都有不同的測(cè)試方法，不同的測(cè)試方法又可以滿足同樣的測(cè)試要求，因此，處理器測(cè)試存在方法不統(tǒng)一、架構(gòu)不完整、功能不具體等方面的問題。異構(gòu)處理器作為一種新形態(tài)，對(duì)于測(cè)試方法的具體明確，測(cè)試體系的統(tǒng)一有效，能力水平的清晰明了，提出更高要求。

2、現(xiàn)有技術(shù)中，spec?cpu是spec組織推出的cpu計(jì)算性能測(cè)試基準(zhǔn)套件，關(guān)注cpu整點(diǎn)運(yùn)算能力、浮點(diǎn)運(yùn)算能力、整型并發(fā)速率和浮點(diǎn)并發(fā)速率，能夠客觀反映cpu自身計(jì)算性能情況。但是spec?cpu測(cè)試本身存在訪存壓力不夠、覆蓋場(chǎng)景有限等方面的問題，當(dāng)面對(duì)訪存要求更高、應(yīng)用場(chǎng)景更廣的異構(gòu)處理器時(shí)，該局限性會(huì)被進(jìn)一步放大。與此同時(shí)，speccpu主要關(guān)注計(jì)算性能，而忽略了對(duì)于內(nèi)存、系統(tǒng)等方面的能力。

3、cinebench則是由maxon?computer開發(fā)，用cpu渲染高清圖片，支持單線程和多線程測(cè)試，是一種被業(yè)界廣泛采用的cpu基準(zhǔn)性能測(cè)試標(biāo)準(zhǔn)。但是cinebench只有一個(gè)測(cè)試，測(cè)試維度比較單一，主要還是側(cè)重于core的性能，與異構(gòu)處理器體系化、多場(chǎng)景、多維度的測(cè)試要求不相符。

4、綜上，現(xiàn)有的spec?cpu、cinebench等測(cè)試方法主要關(guān)注cpu能力，對(duì)于gpu以及異構(gòu)處理器的關(guān)注度較低。同時(shí)，現(xiàn)有測(cè)試方法的維度較為單一、局限，無法滿足多元化測(cè)試要求，尚未形成體系化、定量化測(cè)試架構(gòu)。

5、因此，急需對(duì)此缺點(diǎn)進(jìn)行改進(jìn)，本發(fā)明則是針對(duì)現(xiàn)有的技術(shù)及不足予以研究改良，提供有一種異構(gòu)處理器平臺(tái)測(cè)試與性能分級(jí)方法。

技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明的目的在于提供一種異構(gòu)處理器平臺(tái)測(cè)試與性能分級(jí)方法，以解決上述背景技術(shù)中提出的問題。

2、為實(shí)現(xiàn)上述目的，本發(fā)明提供如下技術(shù)方案：一種異構(gòu)處理器平臺(tái)測(cè)試與性能分級(jí)方法，包括以下步驟：

3、s1、測(cè)試環(huán)境準(zhǔn)備階段：

4、s11、硬件環(huán)境：

5、在cpu方面：選用intel?xeon?e5-2620服務(wù)器，基準(zhǔn)頻率為2.0ghz，搭載主頻為2.00ghz的雙處理器，內(nèi)存為48gb；

6、在gpu方面：部署兩塊nvidia?tesla?k20c，顯存為5g；

7、s12、軟件環(huán)境：采用linux?centos7.0；

8、s13、測(cè)試樣品與設(shè)備：

9、測(cè)試樣品：三塊同型號(hào)異構(gòu)多核的處理器平臺(tái)；

10、測(cè)試設(shè)備：選用與測(cè)試樣品接口兼容的計(jì)算機(jī)模塊以及一塊載板；

11、s2、測(cè)試計(jì)劃階段：

12、明確測(cè)試目的為：測(cè)試cpu-gpu異構(gòu)處理器平臺(tái)在cpu、gpu、內(nèi)存、系統(tǒng)等方面的性能情況并確定異構(gòu)能力等級(jí)，據(jù)此確定測(cè)試項(xiàng)目，并針對(duì)不同的測(cè)試項(xiàng)目，選擇對(duì)應(yīng)的測(cè)試工具；

13、s3、測(cè)試執(zhí)行階段：

14、s31、測(cè)試樣品若支持dvfs，需在測(cè)試前關(guān)閉該功能；若不支持dvfs，則該步驟可以忽略；

15、s32、cpu性能測(cè)試和壓力測(cè)試

16、使用nbench測(cè)試cpu性能，獲得mem、int和fp，其中mem指數(shù)是內(nèi)存性能，int反映定點(diǎn)性能，fp是雙精度浮點(diǎn)性能；然后分別在三個(gè)樣品運(yùn)行stress工具測(cè)試cpu壓力情況，獲得反映系統(tǒng)平均負(fù)載的uptime；

17、s33、gpu壓力測(cè)試

18、安裝glmark2工具，對(duì)gpu進(jìn)行壓力測(cè)試，獲得照明、緩沖、紋理等圖形單元性能的最終分?jǐn)?shù)；

19、s34、cpu與gpu聯(lián)合測(cè)試

20、采用luxmark?2.0工具，測(cè)試cpu+gpu模式下，opencl運(yùn)算性能；

21、s35、內(nèi)存訪問延遲測(cè)評(píng)和帶寬測(cè)試

22、采用lmbench工具測(cè)試內(nèi)存訪問延遲情況，得到連續(xù)訪問延遲和隨機(jī)訪問延遲數(shù)值；并采用stream工具測(cè)試內(nèi)存帶寬性能，得到copy、scale、add、triad帶寬衡量值；

23、s36、系統(tǒng)綜合性能測(cè)試

24、采用unixbench工具測(cè)試搭載異構(gòu)處理器整機(jī)的綜合性能，分別在單核和四核環(huán)境下測(cè)試，獲得單進(jìn)程和多進(jìn)程unixbench值；

25、s4、綜合分?jǐn)?shù)及等級(jí)評(píng)定階段：

26、對(duì)樣品進(jìn)行測(cè)試后，按照異構(gòu)處理器平臺(tái)分?jǐn)?shù)計(jì)算要求表中所述的分?jǐn)?shù)計(jì)算要求進(jìn)行打分，并按照分?jǐn)?shù)高低劃分不同異構(gòu)處理器平臺(tái)等級(jí)。

27、進(jìn)一步的，所述步驟s2中，測(cè)試項(xiàng)目具體包括：cpu性能測(cè)試和壓力測(cè)試、gpu壓力測(cè)試、cpu與gpu聯(lián)合測(cè)試、內(nèi)存訪問延遲測(cè)評(píng)和帶寬測(cè)試、系統(tǒng)綜合性能測(cè)試。

28、進(jìn)一步的，所述測(cè)試項(xiàng)目選用的測(cè)試工具情況如下：

29、1)cpu性能測(cè)試和壓力測(cè)試，選用nbench和stress作為測(cè)試工具；

30、2)gpu壓力測(cè)試，選用glmark2作為測(cè)試工具；

31、3)cpu與gpu聯(lián)合測(cè)試，選用luxmark?2.0作為測(cè)試工具；

32、4)內(nèi)存訪問延遲測(cè)評(píng)和帶寬測(cè)試，選用lmbench和stream作為測(cè)試工具；

33、5)平臺(tái)綜合性能測(cè)試，選用unixbench作為平臺(tái)的系統(tǒng)性能測(cè)試工具。

34、進(jìn)一步的，所述步驟s4中，異構(gòu)處理器平臺(tái)分?jǐn)?shù)計(jì)算要求表包括cpu、gpu、cpu+gpu、內(nèi)存、系統(tǒng)五個(gè)測(cè)試項(xiàng)。

35、進(jìn)一步的，所述cpu測(cè)試項(xiàng)的總分為20分，具體包括mem、inf、fp、uptime四個(gè)指標(biāo)，各指標(biāo)的子分項(xiàng)均為5分，且各指標(biāo)的評(píng)分規(guī)則如下：

36、mem：mem≥6.0時(shí)，獲得滿分5分；

37、mem＜6.0時(shí)，得分為5*mem/6；

38、inf：int≥6.5時(shí)，獲得滿分10分；

39、int＜6.5時(shí)，得分為10*int/13；

40、fp：fp≥6.5時(shí)，獲得滿分10分；

41、fp＜6.5時(shí)，得分為10*fp/13；

42、uptime：uptime＞0.7cpu時(shí)，得分為0；

43、uptime在(0.6cpu,0.7cpu]之間時(shí)，得分為1；

44、uptime在(0.3cpu,0.6cpu]之間時(shí)，得分為3；

45、uptime在(0,0.3cpu]之間時(shí)，得分為5。

46、進(jìn)一步的，所述gpu測(cè)試項(xiàng)的總分為15分，具體包括glmark2指標(biāo)，且該指標(biāo)的子分項(xiàng)為15分，其評(píng)分規(guī)則為：

47、sg≥3000時(shí)，獲得滿分15分；

48、sg＜3000時(shí)，得分為sg/200；

49、其中，sg為glmark2測(cè)試跑分結(jié)果。

50、進(jìn)一步的，所述cpu+gpu測(cè)試項(xiàng)的總分為15分，具體包括luxmark指標(biāo)，且該指標(biāo)的子分項(xiàng)為15分，其評(píng)分規(guī)則為：

51、sl≥400時(shí)，獲得滿分15分；

52、sl＜400時(shí)，得分為3*sl/80；

53、其中，sl為luxmark基準(zhǔn)測(cè)試跑分結(jié)果。

54、進(jìn)一步的，所述內(nèi)存測(cè)試項(xiàng)的總分為36分，具體包括連續(xù)訪問延遲、隨機(jī)訪問延遲、copy、scale、add、triad六個(gè)指標(biāo)，且各指標(biāo)的子分項(xiàng)以及評(píng)分規(guī)則如下：

55、連續(xù)訪問延遲(6分)：0ns≤tcont≤10ns時(shí)，獲得滿分6分；

56、tcont＞10ns時(shí)，得分為60/tcont；

57、其中，tcont為連續(xù)訪問延遲時(shí)長(zhǎng)；

58、隨機(jī)訪問延遲(6分)：0ns≤trand≤120ns時(shí)，獲得滿分6分；

59、trand＞120ns時(shí)，得分為720/trand；

60、其中，trand為隨機(jī)訪問延遲時(shí)長(zhǎng)；

61、copy(4分)：copy≥10000mb/s時(shí)，獲得滿分4分；

62、copy＜10000mb/s時(shí)，得分為copy/2500；

63、scale(4分)：scale≥8000mb/s時(shí)，獲得滿分4分；

64、scale＜8000mb/s時(shí)，得分為scale/2000；

65、add(4分)：add≥9000mb/s時(shí)，獲得滿分4分；

66、add＜9000mb/s時(shí)，得分為add/2250；

67、triad(4分)：triad≥9000mb/s時(shí)，獲得滿分4分；

68、triad＜9000mb/s時(shí)，得分為triad/2250。

69、進(jìn)一步的，所述系統(tǒng)測(cè)試項(xiàng)的總分為14分，具體包括單進(jìn)程、多進(jìn)程兩個(gè)指標(biāo)，各指標(biāo)的子分項(xiàng)均為7分，且各指標(biāo)的評(píng)分規(guī)則如下：

70、單進(jìn)程：u單≥1400時(shí)，獲得滿分7分；

71、u單＜1400時(shí)，得分為u單/200；

72、其中，u單代表單進(jìn)程unixbench值；

73、多進(jìn)程：u多≥3000mb/s時(shí)，獲得滿分7分；

74、u多＜3000mb/s時(shí)，得分為7*u多/3000；

75、其中，u多代表多進(jìn)程unixbench值。

76、進(jìn)一步的，所述步驟s4中，異構(gòu)處理器平臺(tái)等級(jí)總共有3檔：從一級(jí)到三級(jí)，且一級(jí)異構(gòu)處理器平臺(tái)性能最低，三級(jí)異構(gòu)處理器平臺(tái)性能最高。

77、本發(fā)明提供了一種異構(gòu)處理器平臺(tái)測(cè)試與性能分級(jí)方法，具備以下有益效果：

78、本發(fā)明給出了一種異構(gòu)處理器平臺(tái)的測(cè)試方法體系和性能水平分級(jí)策略，通過測(cè)試結(jié)果可計(jì)算指標(biāo)值，最終得到異構(gòu)處理器平臺(tái)的性能情況，并根據(jù)分級(jí)要求將其定為“一級(jí)”、“二級(jí)”、“三級(jí)”中的某一性能級(jí)別。本發(fā)明以測(cè)試為手段，構(gòu)建起異構(gòu)處理器平臺(tái)測(cè)試體系，并通過分級(jí)評(píng)估方式，幫助企業(yè)明確異構(gòu)處理器能力水平，從而針對(duì)性優(yōu)化現(xiàn)有異構(gòu)處理器性能，加快異構(gòu)處理器應(yīng)用深度和廣度。

79、通過本發(fā)明的技術(shù)方案，有助于明確異構(gòu)處理器性能水平，幫助建設(shè)者和使用者明確異構(gòu)處理器的性能水平，加快提升算力基礎(chǔ)設(shè)施整體性能，為異構(gòu)處理器應(yīng)用推廣和高性能算力基礎(chǔ)設(shè)施建設(shè)提供堅(jiān)實(shí)的設(shè)備保障。

80、通過本發(fā)明的技術(shù)方案，能夠提供異構(gòu)處理器優(yōu)化思路，從多個(gè)角度提高異構(gòu)處理器性能，可采用多樣化技術(shù)手段，聚焦cpu、gpu、內(nèi)存、系統(tǒng)等維度，提高處理器負(fù)載能力和訪問內(nèi)存帶寬，降低處理時(shí)延，實(shí)現(xiàn)處理器性能優(yōu)化和高效處理。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：劉昭煒,趙精華,楊玲玲,牛曉玲
技術(shù)所有人：中國(guó)信息通信研究院
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種異構(gòu)處理器平臺(tái)測(cè)試與性能分級(jí)方法與流程