專利名稱:高效訪問存儲(chǔ)器中的矩陣元素的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及訪問存儲(chǔ)器中的矩陣元素的方法和裝置,具體地涉 及訪問通用存儲(chǔ)器中的矩陣元素的方法和裝置。根據(jù)本發(fā)明,訪問還表示存儲(chǔ),即,讀和寫。
背景技術(shù):
在存儲(chǔ)器中實(shí)現(xiàn)矩陣通常是通過向每個(gè)矩陣元素指定一個(gè)寬度為W的存儲(chǔ)元件來完成的。矩陣具有M》N個(gè)元素,其中,M表示列數(shù), N表示行數(shù)。顯然,存儲(chǔ)該矩陣的存儲(chǔ)器需要M々N個(gè)元素的尺寸,每 個(gè)元素的寬度為W。對(duì)于這種實(shí)現(xiàn),所有的行或者列都被鏈接至矩陣 元素的單鏈,該單鏈被映射至存儲(chǔ)器的地址范圍。例如,通過與存儲(chǔ) 器中的鏈的起點(diǎn)相關(guān)的相對(duì)地址,可以實(shí)現(xiàn)對(duì)矩陣的訪問。取決于矩 陣的行或者列是否被鏈接起來,增加地址將分別提供按行或按列的訪 問。為了按列訪問鏈接的行,必須在每一步對(duì)相對(duì)地址增加列數(shù),反 之亦然。例如,如果將行鏈接起來,可以利用相對(duì)地址n輔+m對(duì)列m 行n中的元素進(jìn)行訪問,其中,m=0. .M-l, n=0. .N-1。在每次只對(duì)一個(gè)矩陣元素進(jìn)行訪問的情況下,這種按行或按列 訪問的控制邏輯是相對(duì)簡(jiǎn)單的。如果同時(shí)要對(duì)幾個(gè)相鄰的元素進(jìn)行讀 或者寫,會(huì)出現(xiàn)至少一種訪問類型的帶寬損失。例如,假定行被鏈接 了起來,可以將一個(gè)行中的相鄰矩陣元素放置在寬度為1*M的單個(gè)存 儲(chǔ)器單元中。在這種情況下,對(duì)于按行訪問,可以并行地對(duì)元素進(jìn)行 讀或?qū)?。?duì)于按列訪問而言,元素分布在幾個(gè)存儲(chǔ)器單元中,不能被 同時(shí)訪問。這假定了最大面積效率和成本效率的單端口存儲(chǔ)器。發(fā)明內(nèi)容從而,本發(fā)明的一個(gè)目的是說明一種用于訪問矩陣元素的方法和裝置,通過這種方法和裝置,在不出現(xiàn)按行訪問以及按列訪問的帶 寬損失的情況下,可以同時(shí)訪問多個(gè)相鄰元素。
通過一種包括在權(quán)利要求1中給出的特性的方法,以及通過包 括在權(quán)利要求9中給出的特性的裝置,可以解決這個(gè)問題。
在各個(gè)獨(dú)立的權(quán)利要求中,給出了本發(fā)明的有利的實(shí)施例。 根據(jù)本發(fā)明,對(duì)矩陣的行中或列中相鄰并由各個(gè)相對(duì)地址指定 的兩個(gè)元素的訪問,利用第一局部地址執(zhí)行對(duì)在第一存儲(chǔ)器塊中的第 一個(gè)所述元素的訪問,以及利用第二局部地址執(zhí)行對(duì)在不同的第二存 儲(chǔ)器塊中的第二個(gè)所述元素的訪問。與現(xiàn)有技術(shù)相比,分別在矩陣元 素被寫入不同的存儲(chǔ)器塊之前或在被從這些存儲(chǔ)器塊中讀出之后,本
發(fā)明實(shí)質(zhì)上執(zhí)行了對(duì)這些矩陣元素的重新排序,其中,不管他們是在 行中或者在列中相鄰,沒有兩個(gè)相鄰的矩陣元素被存儲(chǔ)在同一存儲(chǔ)器 塊中。換句話說,將在矩陣中水平相鄰或垂直相鄰的元素分配在不同 的存儲(chǔ)器塊中。本發(fā)明可以很容易被擴(kuò)展至比二大的確定數(shù)目的相鄰 矩陣元素(如果沒有這個(gè)數(shù)目的相鄰元素被存儲(chǔ)在同一存儲(chǔ)器塊中, 即,如果可以獲得相等數(shù)量的存儲(chǔ)器塊)。這種訪問被認(rèn)為是按行或 按列的。這使得在沒有帶寬損失的情況下可以同時(shí)對(duì)矩陣的多個(gè)相鄰 元素進(jìn)行訪問。另外,通過這種方法,可以使總線事務(wù)的數(shù)量最少。 這兩種結(jié)果導(dǎo)致采用根據(jù)本發(fā)明原則的系統(tǒng)的功耗降低。例如,在用 于手持設(shè)備的數(shù)字視頻廣播系統(tǒng)中,通過使基于脈沖串的無線傳輸系 統(tǒng)的開啟時(shí)間最小化,以及在開啟時(shí)間期間降低功耗,來降低功耗。 在有利的實(shí)施例中,矩陣的行的數(shù)目和列的數(shù)目均是采用的存 儲(chǔ)器塊的數(shù)量的倍數(shù)。否則,由于在同一時(shí)間對(duì)矩陣邊界的訪問沒有 采用所有存儲(chǔ)器的帶寬,平均帶寬被減小。例如,大小為10X10的 矩陣和四個(gè)存儲(chǔ)器,當(dāng)訪問一行或一列時(shí),有三個(gè)訪問,采用了10/
(4*3)的存儲(chǔ)器帶寬。
在第一個(gè)可行實(shí)施例中,對(duì)于每一個(gè)所述矩陣元素,利用所述 各個(gè)索引的相對(duì)地址,從查找表中確定所述各個(gè)存儲(chǔ)器塊和/或所述 各個(gè)局部地址。這是獲得存儲(chǔ)器塊和/或局部地址的快速方式,但需 要一個(gè)用于存儲(chǔ)查找表的額外存儲(chǔ)器。在第二個(gè)可行實(shí)施例中,對(duì)于每一個(gè)所述矩陣元素,從各個(gè)相 對(duì)地址的位的第一子群中確定所述各個(gè)存儲(chǔ)器塊,和/或從各個(gè)相對(duì) 地址的位的第二子群中確定所述各個(gè)局部地址。這也是獲得存儲(chǔ)器塊 和/或局部地址的快速方式。不需要查找表,從而需要更少的存儲(chǔ)器。在第三個(gè)可行實(shí)施例中,對(duì)于每一個(gè)所述矩陣元素,從所述各 個(gè)全局線性地址中計(jì)算地確定所述各個(gè)存儲(chǔ)器塊和/或所述各個(gè)局部 地址。這是獲得存儲(chǔ)器塊和/或局部地址的簡(jiǎn)易方式。不需要用于存 儲(chǔ)査找表的存儲(chǔ)器。通過對(duì)所述各個(gè)相對(duì)地址的位進(jìn)行移位或換位,可以有利地執(zhí) 行這種確定,以獲得所述各個(gè)存儲(chǔ)器塊和/或所述各個(gè)局部地址,該 局部地址具有比相對(duì)地址較窄的地址空間??梢栽跊]有耗時(shí)的加、減、 乘和除的情況下執(zhí)行這種移位或換位操作。優(yōu)選地,執(zhí)行作為所述移位或換位操作的位旋轉(zhuǎn)。以這種方式, 只需要一個(gè)操作就可以獲得各個(gè)存儲(chǔ)器塊和/或各個(gè)局部地址。當(dāng)然,可以結(jié)合上述的這三個(gè)實(shí)施例和它們的增強(qiáng)型。例如, 如果按照一種重復(fù)模式,將存儲(chǔ)器塊指定為相對(duì)地址,則在計(jì)算地將 相對(duì)地址減小到模式尺寸之后,可以利用與模式相同的尺寸的小的查 找表來確定存儲(chǔ)器塊。作為一種可行的方案,然后在對(duì)位進(jìn)行旋轉(zhuǎn)之 后,從相對(duì)地址的位的子群來確定局部地址。優(yōu)選地,采用2的冪個(gè)數(shù)目的存儲(chǔ)器塊。然后,可以在確定存 儲(chǔ)器塊和局部地址中采用幾種簡(jiǎn)化方式。必須采用可以同時(shí)且相互獨(dú) 立地訪問的存儲(chǔ)器塊。根據(jù)本發(fā)明的裝置包括多個(gè)存儲(chǔ)器塊和連接至所述存儲(chǔ)器塊的 存儲(chǔ)器控制器,其中,在訪問在矩陣的行或者列中相鄰并由各個(gè)相對(duì) 地址一一指定的兩個(gè)矩陣元素的情況下,存儲(chǔ)器控制器利用第一個(gè)局 部地址對(duì)第一存儲(chǔ)器塊中的第一個(gè)所述元素執(zhí)行第一個(gè)子訪問,并利 用第二個(gè)局部地址對(duì)不同的第二存儲(chǔ)器塊中的第二個(gè)所述元素執(zhí)行 第二個(gè)子訪問。取決于選擇的參數(shù),來自一個(gè)地址計(jì)算的結(jié)果可以被 用于確定其他的地址。例如,對(duì)于某些訪問,每個(gè)存儲(chǔ)器的局部地址 可能是同一個(gè)。優(yōu)選地,對(duì)于每一個(gè)所述的矩陣元素,每個(gè)存儲(chǔ)器控制器用所 述各個(gè)相對(duì)地址來確定所述各個(gè)存儲(chǔ)器塊和/或所述各個(gè)局部地址。
在有利的實(shí)施例中,存儲(chǔ)器塊的數(shù)目、矩陣的寬度和矩陣的高 度是2的冪。然后,對(duì)于快速存儲(chǔ)器訪問,可以采用確定存儲(chǔ)器塊和 局部地址中的幾種簡(jiǎn)化方式。必然,所述第一存儲(chǔ)器塊和所述第二存 儲(chǔ)器塊是可以同時(shí)且相互獨(dú)立地訪問的。
在下文中,參照附圖,對(duì)本發(fā)明進(jìn)行了更詳細(xì)的描述。 圖1示出了根據(jù)本發(fā)明的裝置的框圖2示出了矩陣元素、相關(guān)存儲(chǔ)器塊和局部地址的相應(yīng)方案;
以及
圖3示出了矩陣元素、相關(guān)存儲(chǔ)器塊和局部地址的第二方案。
具體實(shí)施例方式
圖1的裝置A包括四個(gè)存儲(chǔ)器塊Bp,其中P二4 (編號(hào)為p=0到 p=3),這四個(gè)存儲(chǔ)器塊被連接至存儲(chǔ)器控制器C。該裝置A提供了 對(duì)矩陣的32位讀寫能力,該矩陣具有(M=16) * (N=16) =256個(gè)8 位的元素。裝置A,特別是存儲(chǔ)器控制器C通過系統(tǒng)總線S連接至中 央處理單元U。
存儲(chǔ)器控制器C以四個(gè)相鄰矩陣元素的任意組,而不管它們是 在行r或者是在列c中相鄰的方式將矩陣存儲(chǔ)在存儲(chǔ)器塊Bp中,這 種組的每個(gè)成員被存儲(chǔ)在四個(gè)存儲(chǔ)器塊Bp的不同的一個(gè)中。這使得 可以用對(duì)存儲(chǔ)器控制器C的一個(gè)單個(gè)總線請(qǐng)求R來實(shí)現(xiàn)對(duì)四個(gè)相鄰矩 陣元素的訪問。
如果中央處理單元U要對(duì)矩陣元素(m,n)(其中m=0..M-1, n=0. .N-l)進(jìn)行訪問,則該中央處理器單元U根據(jù)它被編程的指令, 計(jì)算出用于按行訪問的相對(duì)地址ar或用于按列訪問的相對(duì)地址a。。 然后,該中央處理單元U通過系統(tǒng)總線S向存儲(chǔ)器控制器C發(fā)送請(qǐng)求 R,該請(qǐng)求包括對(duì)矩陣的訪問的類型,即在讀或?qū)懩J较碌陌葱性L問或按列訪問,用于按行訪問的相對(duì)地址ar或用于按列訪問的相對(duì)地 址a。以及在寫請(qǐng)求下要被寫入矩陣元素的值。如果該存儲(chǔ)器控制器C 接收到了這樣的請(qǐng)求R,它利用在請(qǐng)求R中指定的相對(duì)地址&或a。 來確定被請(qǐng)求的矩陣元素要被寫入或讀出的相應(yīng)的存儲(chǔ)器塊BP的標(biāo) 號(hào),以及確定在確定的存儲(chǔ)器塊Bp內(nèi)的對(duì)應(yīng)存儲(chǔ)器單元的局部地址, 這都是根據(jù)請(qǐng)求R中指定的訪問類型完成的。在有利的實(shí)施例中,訪問類型、按行訪問或按列訪問是由高位 地址線確定的。在以不同的基地址開始進(jìn)行按行訪問和按列訪問時(shí), 該矩陣兩次對(duì)該中央處理單元的編程人員可見。通常,可以利用下列步驟實(shí)現(xiàn)本發(fā)明a) 將存儲(chǔ)器(尤其是通用存儲(chǔ)器)組織成P個(gè)可獨(dú)立且可同時(shí) 訪問的深度為N*M/P的存儲(chǔ)器塊,元素的寬度為W。為了簡(jiǎn)化地址產(chǎn) 生邏輯,將參數(shù)N、 M和P選擇為2的冪(更多細(xì)節(jié)見圖3和圖4)。b) 安排矩陣和存儲(chǔ)器元件之間的關(guān)系,例如如下所示 每個(gè)矩陣元素的相關(guān)存儲(chǔ)器塊Bp從0到P-1循環(huán),對(duì)于n=0的行r和ra二0的列c而言,從p=0開始,對(duì)于n=l的行r和m二l的列c 而言,從p=l開始,依次類推。列m=0的行n=0至n=P-l被分別分配 至p=0至p=P-l的存儲(chǔ)器塊BP,同樣的方法適用于n=i*P至n=(i + l)*P-l的行,直至該列被全部分配。列n^l的行被分配至存儲(chǔ)器塊Bp (p^至p二P-l,以及p^), 因此,以相同的模式重復(fù)第二行n=l的相關(guān)分配,但是,從p^開始 取代了 P=0開始。在整個(gè)矩陣中重復(fù)這些模式。這種循環(huán)適用于按行 查看和按列查看。當(dāng)然,存在很多其他的將存儲(chǔ)器緩存器Bp分配給 矩陣元素的可行方法,例如,簡(jiǎn)單的其他循環(huán)方式或者甚至是隨機(jī)方 式。必要條件是在同一存儲(chǔ)器塊Bp中沒有存儲(chǔ)P個(gè)相鄰的矩陣元素。c) 在存儲(chǔ)器控制器C中實(shí)現(xiàn)隨機(jī)邏輯(shuffle logic)以訪 問矩陣元素。例如,可以通過査找表,在按行或按列訪問過程中旋轉(zhuǎn) 元素,或者通過計(jì)算各個(gè)存儲(chǔ)器塊Bp的標(biāo)號(hào)p和用別的方式計(jì)算各 個(gè)局部地址a',來實(shí)現(xiàn)這個(gè)目的。由于沒有P個(gè)相鄰的矩陣元素存儲(chǔ)在同一存儲(chǔ)器塊Bp中,又因?yàn)榇鎯?chǔ)控制器C可以同時(shí)訪問所有的存儲(chǔ)器塊Bp,在沒有任何帶寬損 失的情況下,存儲(chǔ)器控制器C提供對(duì)矩陣的行和列的訪問。裝置A 上的總線事務(wù)的數(shù)量被最小化了。
在圖1的例子中,到裝置A的一個(gè)單32位總線請(qǐng)求R可以同時(shí)
訪問任何4個(gè)水平或垂直相鄰的矩陣元素。例如,如果具有相對(duì)地址
arl=81, at.2=ari+l=82, ar3=ari+2=83, ar4=ari+3=84 的四個(gè)水平相鄰的矩陣元素是由中央處理單元U所請(qǐng)求的按行 訪問,存儲(chǔ)器控制器C確定相關(guān)的第一、第二、第三和第四存儲(chǔ)器塊 Bpl、 Bp2、 Bp3、 Bp4以及從各個(gè)相關(guān)地址 中確定相關(guān)的 第一、第二、第三和第四局部地址a、、 a,2、 a,3、 a,4,結(jié)果分別為 p=2,3,0,l和a,=20,20,20,21。
如果裝置A用于基于脈沖串的無線傳輸系統(tǒng)中,減少其開啟時(shí)
間以及減小開啟時(shí)間內(nèi)的功耗,會(huì)導(dǎo)致功耗的降低。
如2示出了如上所述的M=16,N=16,P=4的示例的方案。可以很 容易地將其修改為類似M=256和N=1024的數(shù)目,這是用于數(shù)字視 頻廣播手持設(shè)備中的。行r^0,4,8…的元素與存儲(chǔ)器塊Bp相關(guān)聯(lián)(其 中,p=0,l,2,3,0,l,2,3...)。行r^l,5,9…的元素與存儲(chǔ)器塊Bp相關(guān)聯(lián) (其中,p=l,2,3,0,l,2,3,0...)。行11=2,6,10...的元素與存儲(chǔ)器塊Bp 相關(guān)聯(lián)(其中,p=2,3,0,l,2,3,0,l...)。行和列元素的相關(guān)性隨著每個(gè) 行與列發(fā)生變化,其變化周期是每個(gè)P列和行。
部分SI示出了矩陣的哪一個(gè)元素存儲(chǔ)在哪一個(gè)存儲(chǔ)器塊Bp中。 部分S2表示了按行訪問矩陣的處理器所指定的相對(duì)地址^。 部分S3示出了按列訪問矩陣的處理器所指定的相對(duì)地址ac。 部分S4示出了局部地址a',該地址用于選擇在相應(yīng)的存儲(chǔ)器塊 Bp中的矩陣元素。很明顯,在同一時(shí)間,沒有兩個(gè)矩陣元素具有都 相同的存儲(chǔ)器塊Bp和相同的相關(guān)地址a'。通過局部地址&'=0訪問第 O行的第一個(gè)P個(gè)元素,通過局部地址a' = l訪問接下來的P個(gè)元素。 利用a^P^4訪問第一行的第一個(gè)P個(gè)元素。當(dāng)然,同樣的規(guī)則適用 于按行訪問和按列訪問。
部分S5等于部分S4,但是,局部地址a'是從相對(duì)地址ar中,根據(jù)部分S2,用P去除該相對(duì)地址ar來確定的 a,=arDIVP。
從而,該除法是要在指定的給到存儲(chǔ)器控制器C的相關(guān)地址ar 上執(zhí)行的操作,以在相關(guān)的存儲(chǔ)器緩存器Bp中產(chǎn)生局部地址a'。在 該示例中,由于P是2的冪,可以用對(duì)應(yīng)的位的移位操作來代替該 除法a,=arSHR2。因此,在按行訪問模式中,從^的高六位的組來 確定局部地址a'。
當(dāng)然,部分S6等于部分S4和S5,但是,部分S6是從按列訪 問的部分S3的相對(duì)地址ac計(jì)算得出的。例如,在按列訪問模式下, 由相對(duì)地址ae=7*16+6=118指定的具有m=7、 r^6的元素。然后,從
a,= (acSHL2) OR (a。SHR6)
確定局部地址a,。當(dāng)然,其被限制在存儲(chǔ)器塊Bp的地址空間內(nèi),
即
a,= (a。SHL2) OR (acSHR6) AND 63。
移位操作的這種聯(lián)合可以被分別表示為單個(gè)旋轉(zhuǎn)操作a'=ac ROTL2以及&,= (aeROTL2) AND 63。利用相對(duì)地址空間的位寬度 來執(zhí)行該旋轉(zhuǎn),即,在該示例中為8位。
對(duì)于按行訪問和按列訪問,可以高速執(zhí)行地址轉(zhuǎn)換。值得注意 的是,不需要加法或乘法來確定局部地址a',從而避免了進(jìn)位鏈, 并從而保持了短的關(guān)鍵路徑。只要M、 N、 P是2的冪,這就是有效 的。
在該示例中,行n=0,4,8的第一元素位于存儲(chǔ)器塊Bo中,而行 n=l,5,9的第一元素位于存儲(chǔ)器塊Bi中。從而,分別根據(jù)相對(duì)地址ar 和ae,必須對(duì)存儲(chǔ)器塊Bp的P個(gè)輸入和輸出進(jìn)行旋轉(zhuǎn),以生成存儲(chǔ) 器控制器C的輸入和輸出數(shù)據(jù)。例如,通過進(jìn)行?=( (ar/eMODP) + (ar/emVP)),如果適用的話,然后進(jìn)行p二pMODP,計(jì)算地確 定各個(gè)存儲(chǔ)器塊Bp的標(biāo)號(hào)p。這種規(guī)則適用于按行訪問和按列訪問 的請(qǐng)求R。由于在示例中P是2的冪,可以利用快速位操作執(zhí)行該計(jì) 算p= ( (ar/cAND3) + (ar/cSHR2) ) [AND 3(如果適用)]。這種 規(guī)則意味著相對(duì)地址減小至在部分S1內(nèi)的存儲(chǔ)器塊Bp的最小重復(fù)模式。當(dāng)然,取代這種規(guī)則,可以采用査找表來確定各個(gè)存儲(chǔ)器塊Bp 的標(biāo)號(hào)P。如果該相對(duì)地址首先被減小至最小重復(fù)模式,那么,這種 查找表可以和最小重復(fù)模式一樣小。
圖3和圖4分別示出了與圖1中的裝置以及與其相關(guān)的方案相 比簡(jiǎn)化了的裝置A。該裝置A包括兩個(gè)存儲(chǔ)器塊Bp (P=2,編號(hào)為 p二0到p二l),其被連接至存儲(chǔ)器控制器C。兩個(gè)存儲(chǔ)器塊Bp都可以 被獨(dú)立同時(shí)訪問。裝置A提供了對(duì)具有8位大小的(M=4) * (N=4) =16元素的矩陣的32位讀寫能力。裝置A,特別是存儲(chǔ)器控制器C 通過系統(tǒng)總線S以與圖1中的相同方式連接至中央處理單元U。它用 于由本發(fā)明提出的按行和/或按列訪問請(qǐng)求R。
分配到矩陣元素的p=0、 p=l的存儲(chǔ)器塊Bp是交替在所有的行 和所有的列中的。從而,沒有兩個(gè)在行中或者列中相鄰的矩陣元素被 存儲(chǔ)在同 一存儲(chǔ)器塊Bp中。存儲(chǔ)器控制器C可以同時(shí)對(duì)兩個(gè)存儲(chǔ)器 塊Bp進(jìn)行訪問。在沒有任何帶寬損失的情況下,存儲(chǔ)器控制器C提 供對(duì)矩陣行和列的訪問。裝置A上的總線事務(wù)的數(shù)量被最小化了。
對(duì)于按行訪問,根據(jù)部分S2,通過a^arSHRl,可從各個(gè)相對(duì) 地址^的位的子群中確定局部地址a'。
對(duì)于按列訪問模式,根據(jù)部分S2,通過a'= (ae SHL 1) OR (ac SHR3),可從各個(gè)相對(duì)地址ar的位的子群中確定局部地址a'。
移位操作的這種組合可以被表示為4位地址空間中的單個(gè)旋轉(zhuǎn) 操作a,=acROTL 1。
通過p二 ( (ar/cANDl) + (ar/cSHRl))來確定用于按行和按 列訪問請(qǐng)求R的各個(gè)存儲(chǔ)器塊Bp的標(biāo)號(hào)p。
所有的計(jì)算和位操作都被限制在存儲(chǔ)器塊Bp的3位地址空間內(nèi)。
參考標(biāo)號(hào)列表 A 裝置
^ 按行訪問的相對(duì)地址 a。 按列訪問的相對(duì)地址a.局部地址
BP存儲(chǔ)器塊
C存儲(chǔ)器控制器
M列數(shù)
m列
N行數(shù)
n行
P存儲(chǔ)器塊數(shù)
P存儲(chǔ)器標(biāo)號(hào)
R請(qǐng)求
S系統(tǒng)總線
U中央處理單元
權(quán)利要求
1.一種訪問矩陣元素的方法,其中,對(duì)矩陣的行中或列中相鄰并由各個(gè)相對(duì)地址(ar,ac)指定的兩個(gè)元素的訪問,利用第一局部地址(a’1)執(zhí)行對(duì)在第一存儲(chǔ)器塊(BP1)中的第一個(gè)所述元素的訪問,以及利用第二局部地址(a’2)執(zhí)行對(duì)在第二存儲(chǔ)器塊(BP2)中的第二個(gè)所述元素的訪問。
2. 根據(jù)權(quán)利要求1所述的方法,其中,對(duì)于每個(gè)所述的矩陣元 素,利用所述的索引的各個(gè)相對(duì)地址(ar, ae),從査找表中確定所 述各個(gè)存儲(chǔ)器塊(BP)和/或所述各個(gè)局部地址(a')。
3. 根據(jù)權(quán)利要求1所述的方法,其中,對(duì)于每一個(gè)所述矩陣元 素,從所述各個(gè)相對(duì)地址(ar, ae)的位的第一子群確定所述各個(gè)存 儲(chǔ)器塊(BP),和/或從所 述各個(gè)相對(duì)地址(ar, ae)的位的第二子群 確定所述各個(gè)局部地址(a')。
4. 根據(jù)權(quán)利要求1所述的方法,其中,對(duì)于每一個(gè)所述矩陣元 素,從所述各個(gè)相對(duì)地址(^, ae)中計(jì)算地確定所述各個(gè)存儲(chǔ)器塊(Bp)禾口/或所述各個(gè)局部地址(a,)。
5. 根據(jù)權(quán)利要求3或4所述的方法,其中,對(duì)所述各個(gè)相對(duì)地 址(af, ae)的位進(jìn)行移位或換位,以獲得所述的各個(gè)存儲(chǔ)器塊(Bp), 和/或獲得所述各個(gè)局部地址(a'),所述局部地址(a')具有比相 對(duì)地址(ar, ae)更窄的地址空間。
6. 根據(jù)權(quán)利要求5所述的方法,其中,執(zhí)行作為所述換位操作 的位旋轉(zhuǎn)。
7. 根據(jù)之前一項(xiàng)權(quán)利要求所述的方法,其中,所采用的存儲(chǔ)器塊(Bp)的數(shù)目(P)是2的冪。
8. 根據(jù)之前一項(xiàng)權(quán)利要求所述的方法,其中,采用了存儲(chǔ)器塊 (Bp),所述存儲(chǔ)器塊是可以同時(shí)且相互獨(dú)立訪問的。
9. 一種用以訪問矩陣元素的裝置(A),其包括多個(gè)存儲(chǔ)器塊 (Bp)和連接至所述存儲(chǔ)器塊(Bp)的存儲(chǔ)器控制器(C),其中,在在訪問在矩陣的一行或一列中相鄰并均由各個(gè)相對(duì)地址(ar, ae)所 指定的兩個(gè)矩陣元素的情況下,所述存儲(chǔ)器控制器(C)利用第一局 部地址(a',)對(duì)第一存儲(chǔ)器塊(Bpl)中的第一所述元素執(zhí)行第一子 訪問,并利用第二局部地址(a'2)對(duì)不同的第二存儲(chǔ)器塊(Bp2)中 的第二所述元素執(zhí)行第二子訪問。
10. 根據(jù)權(quán)利要求9所述的裝置(A),其中,對(duì)于每個(gè)所述的 矩陣元素,所述存儲(chǔ)器控制器用所述各個(gè)相對(duì)地址(ar, ae)來確定 所述各個(gè)存儲(chǔ)器塊(BP)和/或所述各個(gè)局部地址(a')。
11. 根據(jù)權(quán)利要求9或10所述的裝置(A),其中,存儲(chǔ)器塊 (Bp)的數(shù)目(P)、矩陣的寬度(W)和矩陣的高度(N)都是2的。
12. 根據(jù)權(quán)利要求9至11中的一個(gè)所述的裝置(A),其中, 所述第一存儲(chǔ)器塊(Bpl)和所述第二存儲(chǔ)器塊(BP2)是可以同時(shí)且 相互獨(dú)立訪問的。
全文摘要
本發(fā)明涉及訪問矩陣元素的方法,其中,對(duì)矩陣的行中或列中相鄰并由各個(gè)相對(duì)地址(a<sub>r</sub>,a<sub>c</sub>)分別指定的兩個(gè)元素的訪問,利用第一局部地址(a’<sub>1</sub>)執(zhí)行對(duì)在第一存儲(chǔ)器塊(B<sub>p1</sub>)中的第一個(gè)所述元素的訪問,以及利用第二局部地址(a’<sub>2</sub>)執(zhí)行對(duì)在不同的第二存儲(chǔ)器塊(B<sub>p2</sub>)中的第二個(gè)所述元素的訪問。
文檔編號(hào)G06F12/02GK101322107SQ200680045108
公開日2008年12月10日 申請(qǐng)日期2006年11月29日 優(yōu)先權(quán)日2005年12月1日
發(fā)明者迪特馬爾·加斯曼 申請(qǐng)人:Nxp股份有限公司