欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種用于gpdsp的采用從機計數(shù)的多核dma分段數(shù)據(jù)傳輸方法

文檔序號:8361384閱讀:458來源:國知局
一種用于gpdsp的采用從機計數(shù)的多核dma分段數(shù)據(jù)傳輸方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明主要涉及到通用數(shù)字信號處理器(General Purpose Digital SignalProcessor,GPDSP)領(lǐng)域,特指一種采用從機計數(shù)的DMA分段數(shù)據(jù)傳輸方法。
【背景技術(shù)】
[0002]數(shù)字信號處理器(Digital Signal Processor,DSP)作為一種典型的嵌入式微處理器被廣泛應(yīng)用于嵌入式系統(tǒng)中,它以其數(shù)據(jù)處理能力強大、可編程性好、使用靈活和低功耗等特點,給信號處理的發(fā)展帶來了巨大機遇,其應(yīng)用領(lǐng)域拓展到軍事、經(jīng)濟發(fā)展的各個方面。在現(xiàn)代通信、圖像處理和雷達信號處理等應(yīng)用領(lǐng)域,隨著數(shù)據(jù)處理量加大,對計算精度和實時性要求的增加,通常需要使用更高性能的微處理器進行處理。
[0003]區(qū)別于中央處理器CPU,DSP具有以下特點:1)計算能力強,關(guān)注實時計算勝于關(guān)注控制和事務(wù)處理;2)對于典型信號處理設(shè)有專門硬件支持,如乘加運算、線性尋址;3)嵌入式微處理器的共性特征:地址和指令通路不多于32位,多數(shù)數(shù)據(jù)通路不多于32位;非精確中斷;短期離線調(diào)試、長期在線駐留運行的程序工作方式(而非通用CPU調(diào)試即運行的方法);4)集成外設(shè)接口以快速外設(shè)為主,特別利于在線收發(fā)高速AD/DA數(shù)據(jù),也支持DSP間高速直連。
[0004]通用科學(xué)計算需要高性能的DSP,然而傳統(tǒng)DSP用于科學(xué)計算時有以下不足:1)位寬小,使得計算精度和尋址空間不足。通用科學(xué)計算應(yīng)用至少需要64位精度;2)缺乏任務(wù)管理、文件控制、進程調(diào)度、中斷管理等軟硬件支持;或者,說缺乏操作系統(tǒng)硬件環(huán)境,給通用、多道計算任務(wù)管理帶來不便;3)缺乏統(tǒng)一高級語言編程模式的支持,對多核、向量、數(shù)據(jù)并行等的支持基本依靠匯編程序編程,不便于通用編程;4)不支持本地宿主的程序調(diào)試模式,僅依靠它機交叉調(diào)試仿真。這些問題嚴重限制了 DSP在通用科學(xué)計算領(lǐng)域的應(yīng)用。
[0005]有從業(yè)者提出了一種“通用計算數(shù)字信號處理器(GPDSP) ”,其中公開了一種既保持嵌入式DSP基本特征和高性能低功耗的優(yōu)勢,又高效支持通用科學(xué)計算的新型體系結(jié)構(gòu)一一多核微處理器GPDSP。該結(jié)構(gòu)能夠克服一般DSP用于科學(xué)計算的上述問題,可同時提供對64位高性能計算機和嵌入式高精度信號處理的高效支持。該結(jié)構(gòu)具有如下特征:1)具有雙精度浮點和64位定點數(shù)據(jù)的直接表示,通用寄存器、數(shù)據(jù)總線、指令位寬64位以上,地址總線40位以上;2)CPU與DSP異構(gòu)多核緊密耦合,CPU核支持完整操作系統(tǒng),DSP核的標(biāo)量單元支持操作系統(tǒng)微核;3)考慮CPU核、DSP核及DSP核內(nèi)向量陣列結(jié)構(gòu)的統(tǒng)一編程模式;4)保持它機交叉仿真調(diào)試,同時提供本地CPU宿主調(diào)試模式;5)保留除位數(shù)之外的普通DSP的基本特征。
[0006]GPDSP通常由多個同構(gòu)64位處理單元組成處理陣列來獲得較高浮點運算能力。然而,由于GPDSP需處理的數(shù)據(jù)量巨大,導(dǎo)致GPDSP核內(nèi)存儲部件和核外存儲部件之間需要交換大量的數(shù)據(jù)。核外存儲空間存放的數(shù)據(jù)首先需要搬移到核內(nèi)存儲空間以方便內(nèi)核進行計算,內(nèi)核計算得到的結(jié)果需要搬移至核外存儲空間進行保存,此時核內(nèi)存儲部件和核外存儲部件之間的數(shù)據(jù)傳輸速率成為限制GPDSP處理速度的關(guān)鍵因素。與通用處理器相同,GPDSP也面臨著“存儲墻”問題。
[0007]直接存儲訪問(Director Memory Access,DMA)是一種能較好緩解“存儲墻”問題的技術(shù),DMA可以在處理核進行數(shù)據(jù)計算的同時,后臺高速進行數(shù)據(jù)搬移,搬移過程不需要處理核的參與。由于DMA技術(shù)將內(nèi)核的計算操作和存儲部件的數(shù)據(jù)搬移操作重疊執(zhí)行,在一定程度上降低了核內(nèi)存儲部件和核外存儲部件之間的數(shù)據(jù)傳輸速度對GPDSP處理性能的影響。然而隨著GPDSP中集成的處理核數(shù)目不斷增加,現(xiàn)有DMA數(shù)據(jù)傳輸方法已不能滿足多核并行處理對數(shù)據(jù)量的需求,高效多核DMA設(shè)計必須考慮應(yīng)用程序的訪存需求和多核GPDSP的硬件結(jié)構(gòu)特性。
[0008]通常而言,矩陣乘、快速傅里葉變換、HPL(High Performance Linpack)等常用算法和應(yīng)用程序在多核GPDSP上并行實現(xiàn)時,多個內(nèi)核或所有內(nèi)核在一段時間內(nèi)會訪問同一塊存儲空間,或者地址連續(xù)的存儲空間,DMA部件的設(shè)計應(yīng)該充分利用這一訪存特性。多核芯片的數(shù)據(jù)交換需要經(jīng)過片上網(wǎng)絡(luò)進行傳輸,過高的片上網(wǎng)絡(luò)負載會限制數(shù)據(jù)傳輸效率,高效多核DMA設(shè)計必須要降低片上網(wǎng)絡(luò)的負載。此外,當(dāng)前GPDSP的核外存儲部件一般采用DDR3SDRAM存儲器,DDR3 SDRAM的換行次數(shù)直接決定了訪存效率,DMA的設(shè)計應(yīng)該盡量提升同一行存儲單元能滿足的請求數(shù),以盡量減少DDR3 SDRAM的換行次數(shù)。

【發(fā)明內(nèi)容】

[0009]本發(fā)明要解決的技術(shù)問題就在于:針對現(xiàn)有技術(shù)存在的技術(shù)問題,本發(fā)明提供一種原理簡單、操作方便、可靈活配置、提高訪存效率的用于GPDSP的采用從機計數(shù)的多核DMA分段數(shù)據(jù)傳輸方法。
[0010]為解決上述技術(shù)問題,本發(fā)明采用以下技術(shù)方案:
[0011]一種用于GPDSP的采用從機計數(shù)的多核DMA分段數(shù)據(jù)傳輸方法,其傳輸過程為:
[0012](I)主機DMA啟動,依據(jù)配置參數(shù)生成分段數(shù)據(jù)傳輸請求;DMA每次發(fā)出分段數(shù)據(jù)傳輸?shù)淖x請求中攜帶了讀數(shù)據(jù)返回數(shù)據(jù)選擇向量,所述讀數(shù)據(jù)返回數(shù)據(jù)選擇向量指示返回數(shù)據(jù)的目標(biāo)DSP內(nèi)核;
[0013](2)核外存儲部件返回的數(shù)據(jù)攜帶了對應(yīng)讀請求的讀數(shù)據(jù)返回數(shù)據(jù)選擇向量,片上網(wǎng)絡(luò)對該信號域進行解釋,根據(jù)其有效位向相應(yīng)的DSP內(nèi)核發(fā)送數(shù)據(jù);
[0014](3)DSP內(nèi)核的DMA接收到返回數(shù)據(jù)后,將數(shù)據(jù)轉(zhuǎn)發(fā)至核內(nèi)存儲部件AM或SM,同時進行計數(shù);
[0015](4)當(dāng)計數(shù)完成后,置位事務(wù)完成標(biāo)識寄存器。
[0016]作為本發(fā)明的進一步改進:在上述過程中,每個參與分段數(shù)據(jù)傳輸?shù)膹臋CDMA都設(shè)置了一個從機計數(shù)寄存器BSCR,所述從機計數(shù)寄存器BSCR描述了每個DMA會接收到的數(shù)據(jù)個數(shù);在所述主機DMA啟動后,依據(jù)配置參數(shù)生成分段數(shù)據(jù)傳輸請求,各參與的DMA自行計數(shù)確認數(shù)據(jù)傳輸完成。
[0017]作為本發(fā)明的進一步改進:在配置傳輸參數(shù)前,發(fā)起分段數(shù)據(jù)傳輸事務(wù)的主機DMA和其他參與本次分段數(shù)據(jù)傳輸?shù)膹臋CDMA進行檢測是否仍在參與前一次分段數(shù)據(jù)傳輸事務(wù),過程為:如果DMA正在參與前一次分段數(shù)據(jù)傳輸事務(wù),則等待該事務(wù)結(jié)束之后才能配置新的參數(shù);如果當(dāng)前沒有正在參與分段數(shù)據(jù)傳輸事務(wù),則主機DMA配置傳輸參數(shù)和從機計數(shù)寄存器BSCR,其他從機DMA只需配置從機計數(shù)寄存器BSCR。
[0018]作為本發(fā)明的進一步改進:所述從機計數(shù)寄存器BSCR中包含本DMA預(yù)期接收的數(shù)據(jù)個數(shù)和傳輸完成后是否發(fā)出中斷的使能位。
[0019]作為本發(fā)明的進一步改進:所述主機DMA在啟動傳輸事務(wù)前進行一次柵欄同步。
[0020]作為本發(fā)明的進一步改進:所述配置參數(shù)是標(biāo)量處理部件SPU通過外設(shè)配置總線PBUS將傳輸給主機DMA部件。
[0021]作為本發(fā)明的進一步改進:所述主機DMA部件啟動后,取出相應(yīng)的傳輸參數(shù)并判斷本次傳輸是否為分段數(shù)據(jù)傳輸模式;如果不是分段數(shù)據(jù)傳輸模式,則按照其它傳輸模式進行處理;如果是分段數(shù)據(jù)傳輸模式,生成并發(fā)出讀請求。
[0022]作為本發(fā)明的進一步改進:所述讀請求發(fā)送給片上網(wǎng)絡(luò)并到達核外存儲部件;核外存儲部件返回數(shù)據(jù),添加分段傳輸標(biāo)識;讀返回數(shù)據(jù)發(fā)送至片上網(wǎng)絡(luò),判斷分段傳輸標(biāo)識,當(dāng)為否時則按其它傳輸模式處理;當(dāng)為是時,依據(jù)讀數(shù)據(jù)返回選擇向量派發(fā)數(shù)據(jù)。
[0023]作為本發(fā)明的進一步改進:在數(shù)據(jù)到達目標(biāo)主機DMA/從機DMA后,發(fā)往核內(nèi)存儲部件,同時DMA進行計數(shù);在計數(shù)完成后,傳輸結(jié)束,置位事務(wù)結(jié)束標(biāo)識,根據(jù)是否中斷使能發(fā)出中斷信號;若計數(shù)未完成,則繼續(xù)等待接收后續(xù)數(shù)據(jù)。
[0024]作為本發(fā)明的進一步改進:所述讀數(shù)據(jù)返回數(shù)據(jù)選擇向量由參數(shù)BCNT、參數(shù)BMODE、參數(shù)BSTEP和參數(shù)BSHIFT生成;其中:
[0025]TMODE表示DMA傳輸模式;
[0026]循環(huán)分段模式參數(shù)BMODE共有η位,每一位對應(yīng)某個內(nèi)核的DMA,其中一位的值表示數(shù)據(jù)需返回給該DMA;
[0027]分段粒度參數(shù)BCNT表示每段數(shù)
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
大理市| 巴彦淖尔市| 鸡泽县| 库尔勒市| 滦平县| 岳普湖县| 罗源县| 涿州市| 封丘县| 海淀区| 淮阳县| 石泉县| 五原县| 石城县| 唐河县| 砀山县| 山东省| 宜丰县| 平潭县| 屏山县| 汉川市| 澎湖县| 延边| 西盟| 大洼县| 漳浦县| 云和县| 通化市| 山丹县| 武隆县| 同仁县| 乐陵市| 成武县| 渝北区| 手游| 鄯善县| 淮阳县| 乌兰浩特市| 那曲县| 义马市| 天镇县|