本發(fā)明涉及系統(tǒng)性能提升領(lǐng)域,尤其涉及一種系統(tǒng)加速方法及裝置。
背景技術(shù):
服務(wù)器的處理器的運算速度性能遵循于摩爾定律,但是隨著互聯(lián)網(wǎng)時代對數(shù)據(jù)的處理需求的不斷增加,以及復雜應(yīng)用場景的不斷出現(xiàn),服務(wù)器性能雖然比以前提高了很多,但是還不能滿足對性能的新需求。針對這種情況,目前通用的方法,一個是通過增加CPU的數(shù)量來提升性能,一個是通過網(wǎng)絡(luò)集群的方式來提升處理能力。CPU的數(shù)量在緊耦合的機器中由于各種技術(shù)限制,無法進行大量擴容。網(wǎng)絡(luò)集群受限于網(wǎng)絡(luò)IO的讀寫能力,在有些實時性要求高的領(lǐng)域也會出現(xiàn)性能無法滿足的場景。雖然計算場景的呈現(xiàn)多元化,但對服務(wù)器性能的需求一直都有很迫切的需要,所以提高服務(wù)器的性能一直都是服務(wù)器領(lǐng)域關(guān)注的重點。
隨著日常生活中的計算場景越來越多,越來越復雜,對服務(wù)器的性能要求也越來越高,為提高服務(wù)器的性能,提高單個CPU節(jié)點的性能已經(jīng)無法滿足人們對服務(wù)器性能的要求,需要靠提高服務(wù)器中CPU的數(shù)量來提高性能,但是基于目前技術(shù)的限制,CPU數(shù)量在緊耦合的系統(tǒng)里擴充很有限。因此,如何有效地提高系統(tǒng)加速方法是目前亟待解決的技術(shù)問題。
技術(shù)實現(xiàn)要素:
本發(fā)明針對目前需求以及現(xiàn)有技術(shù)發(fā)展的不足之處,提供一種系統(tǒng)加速方法及裝置,通過加速單元分擔一部分CPU的計算任務(wù),相當于在數(shù)量上對CPU進行了擴充,在物理接口上用QPI協(xié)議來實現(xiàn),實現(xiàn)加速單元和CPU之間的高速數(shù)據(jù)傳輸,加速單元根據(jù)需求分擔CPU的一部分計算任務(wù),然后把結(jié)果返回;利用這樣的方式能有效地提升系統(tǒng)的整體性能,且操作簡便可行。
為了便于理解,對本發(fā)明中出現(xiàn)的部分名詞作以下解釋說明:
QPI:快速通道互聯(lián),英文全稱為:Quick Path Interconnect,又名CSI,Common System Interface,公共系統(tǒng)接口,是一種可以實現(xiàn)芯片間直接互聯(lián)的架構(gòu)。
為了實現(xiàn)上述目的,本發(fā)明采用以下的技術(shù)方案:
一種系統(tǒng)加速方法,包括以下步驟:
通過QPI協(xié)議傳輸數(shù)據(jù)至加速單元;
加速單元接收、解析QPI報文,并執(zhí)行QPI報文中的任務(wù);
將包含執(zhí)行結(jié)果的數(shù)據(jù)通過QPI協(xié)議返回至CPU。
優(yōu)選地,在通過QPI協(xié)議傳輸數(shù)據(jù)之前,還包括:CPU將任務(wù)指令寫入數(shù)據(jù)中。
優(yōu)選地,所述的CPU將任務(wù)指令寫入數(shù)據(jù)中,包括:CPU將操作任務(wù)或計算任務(wù)指令寫入數(shù)據(jù)中。
優(yōu)選地,所述的通過QPI協(xié)議傳輸數(shù)據(jù)至加速單元,包括:通過QPI協(xié)議以QPI報文的形式傳輸數(shù)據(jù)至加速單元。
優(yōu)選地,所述的通過QPI協(xié)議傳輸數(shù)據(jù)至加速單元,還包括:通過QPI協(xié)議以10-24GB/S的傳輸速率傳輸數(shù)據(jù)至加速單元。
優(yōu)選地,所述的加速單元接收、解析QPI報文,并執(zhí)行QPI報文中的任務(wù),包括:通過加速單元上具有兼容QPI協(xié)議功能的物理接口接收、解析QPI報文中的CPU指令,并進行操作任務(wù)或計算任務(wù)。
一種系統(tǒng)加速方法的一種系統(tǒng)加速裝置,包括:
傳輸模塊,用于通過QPI協(xié)議傳輸數(shù)據(jù)至加速單元;
接收模塊,用于加速單元接收、解析QPI報文,并執(zhí)行QPI報文中的任務(wù);
返回模塊,用于將包含執(zhí)行結(jié)果的數(shù)據(jù)通過QPI協(xié)議返回至CPU。
優(yōu)選地,還包括:
寫入模塊,用于CPU將操作任務(wù)或計算任務(wù)指令寫入數(shù)據(jù)中。
本發(fā)明的有益效果:
1.本發(fā)明通過引入加速單元,分擔一部分CPU的計算任務(wù),相當于在數(shù)量上對CPU進行了擴充,在物理接口上用QPI協(xié)議來實現(xiàn),滿足了加速單元和CPU之間的高速數(shù)據(jù)傳輸,提升了系統(tǒng)的運行速度;
2. 加速單元提供了計算能力,可以根據(jù)需求分擔CPU的一部分計算任務(wù),然后把結(jié)果返回,這樣能夠緩解CPU的壓力,從而提升系統(tǒng)的整體性能。
附圖說明
圖1 為本發(fā)明一種系統(tǒng)加速方法的流程示意圖之一。
圖2為本發(fā)明 一種系統(tǒng)加速裝置的結(jié)構(gòu)示意圖之一。
圖3為本發(fā)明一種系統(tǒng)加速方法的流程示意圖之二。
圖4為本發(fā)明一種系統(tǒng)加速裝置的結(jié)構(gòu)示意圖之二。
具體實施方式
下面結(jié)合附圖和實施例,對本發(fā)明的具體實施方式作進一步詳細描述:
實施例一:如圖1所示,本發(fā)明的一種系統(tǒng)加速方法,包括以下步驟:
步驟S101:通過QPI協(xié)議傳輸數(shù)據(jù)至加速單元;
步驟S102:加速單元接收、解析QPI報文,并執(zhí)行QPI報文中的任務(wù);
步驟S103:將包含執(zhí)行結(jié)果的數(shù)據(jù)通過QPI協(xié)議返回至CPU。
實施例二:如圖2所示,本發(fā)明的一種系統(tǒng)加速裝置,包括:傳輸模塊201、接收模塊202和返回模塊203;傳輸模塊201依次連接接收模塊202和返回模塊203;
傳輸模塊201,用于通過QPI協(xié)議傳輸數(shù)據(jù)至加速單元;接收模塊202,用于加速單元接收、解析QPI報文,并執(zhí)行QPI報文中的任務(wù);返回模塊203,用于將包含執(zhí)行結(jié)果的數(shù)據(jù)通過QPI協(xié)議返回至CPU。
實施例三:如圖3所示,本發(fā)明的另一種系統(tǒng)加速方法,包括以下步驟:
步驟S301:CPU將操作任務(wù)或計算任務(wù)指令寫入數(shù)據(jù)中;
步驟S302:通過QPI協(xié)議以QPI報文的形式傳輸數(shù)據(jù)至加速單元;
步驟S303:通過加速單元上具有兼容QPI協(xié)議功能的物理接口接收、解析QPI報文中的CPU指令,并進行操作任務(wù)或計算任務(wù);
步驟S304:將包含執(zhí)行結(jié)果的數(shù)據(jù)通過QPI協(xié)議返回至CPU;
作為一種可實施的方式,本實施例中步驟S302,數(shù)據(jù)通過QPI協(xié)議以QPI報文的形式傳輸至加速單元,其傳輸速率達24GB/S。
實施例四:如圖4所示,本發(fā)明的另一種系統(tǒng)加速裝置,包括:寫入模塊401、傳輸模塊402、接收模塊403和返回模塊404;寫入模塊401依次連接傳輸模塊402、接收模塊403和返回模塊404;
寫入模塊401,用于CPU將操作任務(wù)或計算任務(wù)指令寫入數(shù)據(jù)中;傳輸模塊402,用于通過QPI協(xié)議以QPI報文的形式傳輸數(shù)據(jù)至加速單元;接收模塊403,通過加速單元上具有兼容QPI協(xié)議功能的物理接口接收、解析QPI報文中的CPU指令,并進行操作任務(wù)或計算任務(wù);返回模塊404,用于將包含執(zhí)行結(jié)果的數(shù)據(jù)通過QPI協(xié)議返回至CPU。
以上所示僅是本發(fā)明的優(yōu)選實施方式,應(yīng)當指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應(yīng)視為本發(fā)明的保護范圍。