欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

硬件加速裝置、方法、系統(tǒng)及存儲(chǔ)介質(zhì)

文檔序號(hào):40533133發(fā)布日期:2024-12-31 13:49閱讀:13來(lái)源:國(guó)知局
硬件加速裝置、方法、系統(tǒng)及存儲(chǔ)介質(zhì)

本發(fā)明涉及數(shù)據(jù)處理,尤其涉及一種硬件加速裝置、方法、系統(tǒng)及存儲(chǔ)介質(zhì),具體是一種面向超低延時(shí)的任意次遞歸調(diào)用的fft和ifft硬件加速裝置、方法、系統(tǒng)及存儲(chǔ)介質(zhì)。


背景技術(shù):

1、快速傅里葉變換(fastfouriertransform),即利用計(jì)算機(jī)計(jì)算離散傳里葉變換q(dft)的高效、快速計(jì)算方法的統(tǒng)稱,簡(jiǎn)稱fft。快速傅里葉變換是1965年由j.w.庫(kù)利和t.w,圖基提出的。采用這種算法能使計(jì)算機(jī)計(jì)算離散傅里葉變換所需要的乘法次數(shù)大為減少,特別是被變換的抽樣點(diǎn)數(shù)n越多,fft算法計(jì)算量的節(jié)省就越顯著。

2、fft在多個(gè)領(lǐng)域有著廣泛的應(yīng)用,包括但不限于信號(hào)處理、通信、計(jì)算機(jī)科學(xué)、音頻處理、圖像處理、機(jī)器學(xué)習(xí)、數(shù)據(jù)加密和安全等。盡管fft硬件加速在許多應(yīng)用中具有顯著的優(yōu)勢(shì),但仍存在一些弊端,包括:

3、1.成本高昂:fft硬件加速通常需要專門設(shè)計(jì)和制造的硬件電路,導(dǎo)致成本較高。這對(duì)于個(gè)人用戶或小規(guī)模應(yīng)用來(lái)說可能不太實(shí)際。

4、2.限制了靈活性:一旦fft硬件加速器被設(shè)計(jì)和制造,其功能和性能通常是固定的,難以進(jìn)行靈活的修改或升級(jí)。這對(duì)于需要頻繁變動(dòng)需求的應(yīng)用來(lái)說可能不太適用。

5、3.物理空間占用:fft硬件加速器通常需要占用較大的物理空間。對(duì)于空間受限的設(shè)備或系統(tǒng),如嵌入式系統(tǒng)或移動(dòng)設(shè)備,可能很難集成這樣的硬件加速器。

6、4.依賴特定硬件平臺(tái):fft硬件加速器通常是針對(duì)特定的硬件平臺(tái)設(shè)計(jì)的,不同平臺(tái)之間的兼容性可能存在問題。這使得在不同平臺(tái)上進(jìn)行移植或跨平臺(tái)開發(fā)變得更加困難。

7、因此,fft硬件加速器在某些特定場(chǎng)景下具有明顯的優(yōu)勢(shì),但也存在一些限制和弊端。在決定是否采用fft硬件加速時(shí),需要考慮應(yīng)用的需求、成本、靈活性和平臺(tái)兼容性等因素。


技術(shù)實(shí)現(xiàn)思路

1、針對(duì)現(xiàn)有技術(shù)存在的不足,本發(fā)明的目的在于提供一種硬件加速裝置、方法、系統(tǒng)及存儲(chǔ)介質(zhì),能夠根據(jù)計(jì)算資源的功耗限制和性能需求,改變參數(shù)配置,靈活地調(diào)整計(jì)算復(fù)雜度和資源利用率、實(shí)現(xiàn)精度、功耗和算力之間的平衡,并將運(yùn)算延時(shí)推向極致。

2、本公開的第一方面提供了一種硬件加速裝置,所述硬件加速裝置包括以下模塊中一個(gè)或多個(gè):

3、初始模塊,被配置為緩存原始的時(shí)域信號(hào);

4、讀指針循環(huán)模塊,被配置為基于所述原始的時(shí)域信號(hào)產(chǎn)生周期連續(xù)更替的初始信號(hào);

5、第一鏡像地址轉(zhuǎn)換模塊,被配置為將所述周期連續(xù)更替的初始信號(hào)轉(zhuǎn)換為適配fft模塊的指針時(shí)序,以為所述fft模塊持續(xù)地提供待處理的時(shí)域信號(hào)的數(shù)據(jù);

6、fft模塊,包括fft遞歸體模塊,所述fft模塊被配置為按最優(yōu)時(shí)序接收所述待處理的時(shí)域信號(hào)的數(shù)據(jù),并通過所述fft遞歸體模塊將所述待處理的時(shí)域信號(hào)的數(shù)據(jù)轉(zhuǎn)換為周期連續(xù)更替的頻域信號(hào),所述fft遞歸體模塊被配置為執(zhí)行可任意次循環(huán)的蝶形套娃運(yùn)算;

7、第二鏡像地址轉(zhuǎn)換模塊,被配置為接收所述周期連續(xù)更替的頻域信號(hào),以及將所述周期連續(xù)更替的頻域信號(hào)轉(zhuǎn)換為適配ifft模塊的指針時(shí)序,以為所述ifft模塊持續(xù)地提供待處理的頻域信號(hào)的數(shù)據(jù);以及

8、ifft模塊,包括ifft遞歸體模塊,所述ifft模塊被配置為按最優(yōu)時(shí)序接收所述待處理的頻域信號(hào)的數(shù)據(jù),并通過所述ifft遞歸體模塊將所述待處理的頻域信號(hào)的數(shù)據(jù)還原為原始的時(shí)域信號(hào),所述ifft遞歸體模塊被配置為執(zhí)行可任意次循環(huán)的蝶形套娃運(yùn)算。

9、可選的,所述fft模塊通過對(duì)所述fft遞歸體模塊進(jìn)行任意次遞歸調(diào)用,實(shí)現(xiàn)4到正無(wú)窮點(diǎn)數(shù)的fft運(yùn)算,以將所述待處理的時(shí)域信號(hào)的數(shù)據(jù)轉(zhuǎn)換為周期連續(xù)更替的頻域信號(hào);

10、所述ifft模塊通過對(duì)所述ifft遞歸體模塊進(jìn)行任意次遞歸調(diào)用,實(shí)現(xiàn)4到正無(wú)窮點(diǎn)數(shù)的fft運(yùn)算,以將所述待處理的頻域信號(hào)的數(shù)據(jù)還原為原始的時(shí)域信號(hào)。

11、可選的,所述fft遞歸體模塊和所述ifft遞歸體模塊各自包括基本遞歸單元模塊和n層遞歸體模塊,n為所述fft遞歸體模塊或者所述ifft遞歸體模塊執(zhí)行遞歸調(diào)用的最大嵌套層數(shù),

12、所述fft遞歸體模塊和所述ifft遞歸體模塊各自包括一個(gè)最頂層遞歸體模塊和一個(gè)最底層遞歸體模塊,所述最頂層遞歸體模塊為執(zhí)行第n層遞歸調(diào)用的遞歸體模塊,所述最底層遞歸體模塊為所述基本遞歸單元模塊。

13、可選的,所述最大遞歸調(diào)用嵌套層數(shù)n的值按照以下公式確定:

14、

15、其中,m為fft或者ifft的運(yùn)算點(diǎn)數(shù)。

16、可選的,每層遞歸體模塊都包括一順序相同但執(zhí)行時(shí)間為其前一層遞歸體模塊的執(zhí)行時(shí)間2倍的蝶形管道選通時(shí)序模塊。

17、可選的,所述蝶形管道選通時(shí)序模塊包括至少一個(gè)隱形狀態(tài)機(jī)模塊,所述隱形狀態(tài)機(jī)模塊的觸發(fā)條件和輸出指針均被計(jì)數(shù)器模塊中??的倍數(shù)特質(zhì)隱藏。

18、可選的,每層遞歸體模塊中的所述隱形狀態(tài)機(jī)模塊均包括當(dāng)前層蝶形運(yùn)算0、1、2、3的四種狀態(tài),且四種狀態(tài)下的蝶形管道指針的導(dǎo)向一致,其中,0表示對(duì)蝶形的左前翼進(jìn)行乘累加,1表示對(duì)蝶形的左后翼進(jìn)行乘累加,2表示對(duì)蝶形的右前翼進(jìn)行乘累加,3表示對(duì)蝶形的右后翼進(jìn)行乘累加。

19、可選的,每層遞歸體模塊均有四個(gè)方向的蝶形指針,其中任意一個(gè)方向的蝶形指針中都包含了前一層遞歸體模塊中同樣方向的兩枚小指針;所述遞歸體模塊每執(zhí)行一次指針操作,其所包含的前一層遞歸體模塊中的同樣方向的兩枚小指針以2倍的速率陸續(xù)執(zhí)行兩次指針操作。

20、可選的,當(dāng)前層的遞歸體模塊的狀態(tài)周期是其前一層遞歸體模塊的狀態(tài)周期的2倍,當(dāng)前層的遞歸體模塊的數(shù)據(jù)位寬為前一層遞歸體模塊的數(shù)據(jù)位寬的2倍。

21、可選的,每層遞歸體模塊的所述數(shù)據(jù)位寬為w的數(shù)據(jù)管道中,包含兩條數(shù)據(jù)位寬均為w/2的數(shù)據(jù)位寬的數(shù)據(jù)管道。

22、本公開的第二方面提供了一種硬件加速方法,所述方法包括一個(gè)或多個(gè)以下步驟:

23、緩存原始的時(shí)域信號(hào);

24、基于所述原始的時(shí)域信號(hào)產(chǎn)生周期連續(xù)更替的初始信號(hào);

25、將所述周期連續(xù)更替的初始信號(hào)轉(zhuǎn)換為適配fft變換的指針時(shí)序,以獲得待處理的時(shí)域信號(hào)的數(shù)據(jù);

26、按最優(yōu)時(shí)序接收所述待處理的時(shí)域信號(hào)的數(shù)據(jù),并通過fft遞歸體模塊將所述待處理的時(shí)域信號(hào)的數(shù)據(jù)轉(zhuǎn)換為周期連續(xù)更替的頻域信號(hào),所述fft遞歸體模塊被配置為執(zhí)行可任意次循環(huán)的蝶形套娃運(yùn)算;

27、將所述周期連續(xù)更替的頻域信號(hào)轉(zhuǎn)換為適配ifft變換的指針時(shí)序,以獲得待處理的頻域信號(hào)的數(shù)據(jù);

28、按最優(yōu)時(shí)序接收所述待處理的頻域信號(hào)的數(shù)據(jù),并通過ifft遞歸體模塊將所述待處理的頻域信號(hào)的數(shù)據(jù)還原為原始的時(shí)域信號(hào),所述ifft遞歸體模塊被配置為執(zhí)行可任意次循環(huán)的蝶形套娃運(yùn)算。

29、可選的,通過對(duì)所述fft遞歸體模塊進(jìn)行任意次遞歸調(diào)用,實(shí)現(xiàn)4到正無(wú)窮點(diǎn)數(shù)的fft運(yùn)算,以將所述待處理的時(shí)域信號(hào)的數(shù)據(jù)轉(zhuǎn)換為周期連續(xù)更替的頻域信號(hào);

30、通過對(duì)所述ifft遞歸體模塊進(jìn)行任意次遞歸調(diào)用,實(shí)現(xiàn)4到正無(wú)窮點(diǎn)數(shù)的fft運(yùn)算,以將所述待處理的頻域信號(hào)的數(shù)據(jù)還原為原始的時(shí)域信號(hào)。

31、可選的,所述fft遞歸體模塊和所述ifft遞歸體模塊各自包括基本遞歸單元模塊和n層遞歸體模塊,n為所述fft遞歸體模塊或者所述ifft遞歸體模塊執(zhí)行遞歸調(diào)用的最大嵌套層數(shù),

32、所述fft遞歸體模塊和所述ifft遞歸體模塊各自包括一個(gè)最頂層遞歸體模塊和一個(gè)最底層遞歸體模塊,所述最頂層遞歸體模塊為執(zhí)行第n層遞歸調(diào)用的遞歸體模塊,所述最底層遞歸體模塊為所述基本遞歸單元模塊。

33、可選的,所述最大遞歸調(diào)用嵌套層數(shù)n的值按照以下公式確定:

34、

35、其中,m為fft或ifft的運(yùn)算點(diǎn)數(shù)。

36、可選的,每層遞歸體模塊都包括一順序相同但執(zhí)行時(shí)間為其前一層遞歸體模塊的執(zhí)行時(shí)間2倍的蝶形管道選通時(shí)序。

37、可選的,所述蝶形管道選通時(shí)序包括至少一個(gè)隱形狀態(tài)機(jī),所述隱形狀態(tài)機(jī)的觸發(fā)條件和輸出指針均被計(jì)數(shù)器中??的倍數(shù)特質(zhì)隱藏。

38、可選的,每層遞歸體模塊中的所述隱形狀態(tài)機(jī)模塊均包括當(dāng)前層蝶形運(yùn)算0、1、2、3的四種狀態(tài),且四種狀態(tài)下的蝶形管道指針的導(dǎo)向一致,其中,0表示對(duì)蝶形的左前翼進(jìn)行乘累加,1表示對(duì)蝶形的左后翼進(jìn)行乘累加,3表示對(duì)蝶形的右前翼進(jìn)行乘累加,4表示對(duì)蝶形的右后翼進(jìn)行乘累加。

39、可選的,每層遞歸體模塊均有四個(gè)方向的蝶形指針,其中任意一個(gè)方向的蝶形指針中都包含了前一層遞歸體模塊中同樣方向的兩枚小指針;所述遞歸體模塊每執(zhí)行一次指針操作,其所包含的前一層遞歸體模塊中的同樣方向的兩枚小指針以2倍的速率陸續(xù)執(zhí)行兩次指針操作。

40、可選的,當(dāng)前層的遞歸體模塊的狀態(tài)周期是其前一層遞歸體模塊的狀態(tài)周期的2倍,當(dāng)前層的遞歸體模塊的數(shù)據(jù)位寬為前一層遞歸體模塊的數(shù)據(jù)位寬的2倍。

41、可選的,每層遞歸體模塊的所述數(shù)據(jù)位寬為w的數(shù)據(jù)管道中,包含兩條數(shù)據(jù)位寬均為w/2的數(shù)據(jù)位寬的數(shù)據(jù)管道。

42、本公開的第三方面提供了一種硬件加速系統(tǒng),所述硬件加速系統(tǒng)包括上述第一方面的硬件加速裝置。

43、本公開的第四方面提供了一種非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)指令,所述計(jì)算機(jī)指令適于處理器加載,以實(shí)現(xiàn)上述第一方面的硬件加速方法。

44、實(shí)施上述方案,具有如下有益效果:

45、本公開中,fft模塊的架構(gòu)和ifft模塊的架構(gòu)極為相似,這兩套架構(gòu)可由同一套代碼來(lái)描述。通過修改define宏定義值來(lái)確定被例化時(shí)是扮演fft的角色,還是扮演ifft的角色,從而降低了代碼維護(hù)和管理的難度。

46、fft遞歸體模塊被配置為執(zhí)行可任意次循環(huán)的蝶形套娃運(yùn)算,通過調(diào)用fft遞歸體模塊可實(shí)現(xiàn)任意點(diǎn)數(shù)的fft運(yùn)算。ifft遞歸體模塊被配置為執(zhí)行可任意次循環(huán)的蝶形套娃運(yùn)算,通過調(diào)用ifft遞歸體模塊可實(shí)現(xiàn)任意點(diǎn)數(shù)的fft運(yùn)算??赏ㄟ^修改參數(shù),改變例化嵌套的層級(jí)數(shù)來(lái)任意定制任意2的倍數(shù)的點(diǎn)數(shù)。提高了算子的重用性、靈活性,降低了版本維護(hù)和管理的經(jīng)濟(jì)和時(shí)間成本。

47、利用隱形狀態(tài)機(jī)模塊為每個(gè)遞歸層實(shí)現(xiàn)時(shí)序完全相同,但執(zhí)行周期呈?2n?遞增的數(shù)據(jù)流狀態(tài)引導(dǎo),使得不同層級(jí)間的遞歸調(diào)用不會(huì)產(chǎn)生任何運(yùn)算縫隙,更不會(huì)產(chǎn)生數(shù)據(jù)丟包,在有限的資源內(nèi),將運(yùn)算延時(shí)推向極致。并且,?隱形狀態(tài)機(jī)模塊的“跳轉(zhuǎn)條件”和當(dāng)前狀態(tài)的“任務(wù)執(zhí)行標(biāo)識(shí)信號(hào)”被徹底“隱去”,從而減少了電路的面積和功耗。

48、本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實(shí)踐了解到。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
阿拉尔市| 武宁县| 高安市| 微山县| 天全县| 鄂托克前旗| 甘肃省| 铜陵市| 开封县| 江都市| 启东市| 绥中县| 越西县| 库车县| 敖汉旗| 德昌县| 榕江县| 宝山区| 融水| 衡南县| 安岳县| 通化市| 越西县| 龙井市| 阿拉尔市| 黄浦区| 镶黄旗| 双柏县| 林州市| 哈巴河县| 白银市| 应城市| 西吉县| 定远县| 深水埗区| 察隅县| 青铜峡市| 崇礼县| 普宁市| 隆昌县| 永修县|