專利名稱:一種圖像處理專用可配置的mmu電路的制作方法
一種圖像處理專用可配置的MMU電路
技術(shù)領(lǐng)域:
本發(fā)明涉及一種MMU電路,特別是涉及一種針對圖像處理的MMU電路。背景技術(shù):
在傳統(tǒng)的應(yīng)用中,MMU(內(nèi)存管理單元)通常用于運行操作系統(tǒng)時CPU對存儲單元進(jìn)行訪問的所需的虛擬地址映射和管理。隨著技術(shù)的發(fā)展,圖形圖像在消費類移動終端電子設(shè)備中成為越來越重要的應(yīng)用,而產(chǎn)生高質(zhì)量圖形圖像效果所需的圖形圖像處理電路也跟隨應(yīng)用的發(fā)展變得原來越復(fù)雜。在圖形圖像處理電路中沒有加入MMU單元之前,所有的數(shù)據(jù)和命令都是直接以物理地址進(jìn)行訪問,這樣帶來的問題很多當(dāng)圖形圖像處理電路在處理過程中需要在內(nèi)存中開辟一塊空間作為幀緩存,如果沒有虛擬地址映射則這一塊存儲空間必須為一片連續(xù)的地址空間,這樣則需要系統(tǒng)找到一塊連續(xù)的物理空間供圖形圖像處理電路使用,如果圖像的解析度很大,則對應(yīng)所需的存儲量也會很大,在內(nèi)存緊張的情況下,系統(tǒng)可能很難找到一片很到的連續(xù)物理空間;圖形圖像處理電路如果沒有MMU,由于所需數(shù)據(jù)和命令的地址都是物理地址,而操作系統(tǒng)軟件本身看到的都是虛擬地址,所以在使用圖形圖像處理電路時,需要軟件將虛擬地址映射為物理地址后才能配置圖形圖像處理電路進(jìn)行工作,加大了圖形圖像處理電路的使用復(fù)雜度。所以在圖形圖像處理電路中加入MMU已成為發(fā)展的趨勢。隨著圖形圖像處理性能的提升,SOC(系統(tǒng)級芯片,或稱片上系統(tǒng))系統(tǒng)對總線的帶寬和效率要求也隨之增高,AXI總線作為一種高性能、高帶寬、低延遲的片內(nèi)總線,已經(jīng)逐步成為SOC芯片中圖形圖像處理電路常常使用的一種總線接口,而基于這種先進(jìn)總線接口設(shè)計的MMU是很有必要的。AXI (Advanced extensible Interface)是一種總線協(xié)議,該協(xié)議是 ARM 公司提出的 AMBA (Advanced Microcontroller Bus Architecture) 3. 0 協(xié)議中最重要的部分,是一種面向高性能、高帶寬、低延遲的片內(nèi)總線。它的地址/控制和數(shù)據(jù)相位是分離的,支持不對齊的數(shù)據(jù)傳輸,同時在突發(fā)傳輸中,只需要首地址,同時分離的讀寫數(shù)據(jù)通道、并支持亂序訪問,不同的命令和數(shù)據(jù)之間可以使用不同的ID號碼以示區(qū)別,以便實現(xiàn)亂序傳輸訪問。由于過去的MMU電路設(shè)計通?;诓僮飨到y(tǒng)的特性進(jìn)行設(shè)計,而圖形圖像處理電路的數(shù)據(jù)流有其自身的特點,所以如果直接套用通用MMU的設(shè)計結(jié)構(gòu)用于圖形圖像處理電路不能有效地提高映射效率,因此設(shè)計一種針對圖形圖像處理數(shù)據(jù)流特點的MMU是一項很有意義的工作。而且現(xiàn)有MMU的解析速度和傳輸效率不足;MMU電路的靈活性可配置性不足。
發(fā)明內(nèi)容本發(fā)明要解決的技術(shù)問題,在于提供一種圖像處理專用可配置的MMU電路,它針對圖形圖像處理數(shù)據(jù)流的特點,能夠提高TLBCTranslation lookaside buffer,即旁路轉(zhuǎn)換緩沖或稱為頁表緩沖)的命中率,并且提高傳輸?shù)男屎退俣取?br>
本發(fā)明是這樣實現(xiàn)的一種圖像處理專用可配置的MMU電路,它包括原始命令解析單元、與圖形圖像處理單元操作區(qū)域數(shù)量相同的TLB,每一 TLB對應(yīng)一操作區(qū)域、TLB命中統(tǒng)計單元,TLB更新控制單元、命令裁決單元、AXI master接口,讀數(shù)據(jù)通道處理單元、配置信息寄存器;所述原始命令解析單元接收來自圖形圖像處理單元的信號,并且還連接到各個TLB,以及命令裁決單元,所述TLB均連接到命令裁決單元,所述命令裁決單元連接到AXI master接口,所述AXI master接口通過AXI總線連接到存儲單元,并且AXI master接口連接到讀數(shù)據(jù)通道處理單元,所述讀數(shù)據(jù)通道處理單元分別連接到命令裁決單元、TLB更新控制單元,并且連接到圖形圖像處理單元,所述配置信息存儲單元接收保存來自CPU的配置信息,并將配置信息傳輸給各個單元。進(jìn)一步的,所述TLB均連接到所述TLB命中統(tǒng)計單元。進(jìn)一步的,所述TLB采用參數(shù)化設(shè)計,通過調(diào)節(jié)TLB的深度參數(shù)即可調(diào)節(jié)TLB的深度。進(jìn)一步的,所述圖形圖像處理單元的不同的操作區(qū)域使用不同的ID,每一 TLB訪問使用對應(yīng)操作區(qū)域的總線ID操作。本發(fā)明具有如下優(yōu)點1.本發(fā)明MMU針對圖形圖像處理數(shù)據(jù)流特點設(shè)計,根據(jù)不同的連續(xù)操作區(qū)域來劃分使用不同的TLB,以提高TLB的命中率;2.本發(fā)明基于AXI總線設(shè)計,在AXI總線中基于不同ID的命令不需要有前后依賴的順序關(guān)系,也就是可以亂序和并行操作,不同的TLB訪問使用不同的總線ID操作,由于不同ID之間的操作可并行性,大幅提高傳輸?shù)男屎退俣龋?.本發(fā)明TLB命中統(tǒng)計單元可以統(tǒng)計各個TLB的命中率,可以實時查詢各個TLB 的命中情況,而且所述TLB設(shè)計采用參數(shù)化設(shè)計,設(shè)計者只需要通過設(shè)置TLB的深度參數(shù)即可調(diào)整TLB的深度,所以在仿真期間,設(shè)計者可以根據(jù)TLB命中統(tǒng)計單元的各個TLB的統(tǒng)計信息,得到各個圖像區(qū)域的地址訪問特點,從而可以不斷調(diào)整TLB的深度,以達(dá)到面積和效
率最佳平衡。
下面參照附圖結(jié)合實施例對本發(fā)明作進(jìn)一步的說明。圖1為本發(fā)明MMU的使用狀態(tài)電路結(jié)構(gòu)示意圖。圖2是本發(fā)明MMU電路結(jié)構(gòu)示意圖。圖3是圖形圖像處理單元有4個操作區(qū)域情況的示意圖。圖4是本發(fā)明根據(jù)頁表信息進(jìn)行地址映射的示意圖。
具體實施方式
請參閱圖1至圖4所示,對本發(fā)明的實施例進(jìn)行詳細(xì)的說明。
如圖1所示,當(dāng)本發(fā)明MMUl工作的時候,MMUl上的AXI master接口通過AXI總線連接到存儲單元2,所述MMUl還連接到圖形圖像處理單元3。CPU4連接到MMUl上,負(fù)責(zé)對 MMUl進(jìn)行配置,配置信息包括頁表,頁表在存儲單元中的物理存儲地址、圖形圖像處理單元中每個操作區(qū)域使用的ID。所述存儲單元2負(fù)責(zé)存儲所有的數(shù)據(jù),包括頁表信息,待處
4理的圖形圖像數(shù)據(jù)。所述圖形圖像處理單元3負(fù)責(zé)處理圖形圖像數(shù)據(jù),并在處理完后寫回存儲單元,所述圖形圖像處理單元3通過一個AXImaster接口與外部進(jìn)行交互。所述MMUl 在圖形圖像處理單元3和AXI總線之間,負(fù)責(zé)圖形圖像處理單元3數(shù)據(jù)訪問時候虛擬地址到物理地址的映射和管理。TLB里面存放的是一些頁表文件(虛擬地址到物理地址的轉(zhuǎn)換表),又稱為快表技術(shù)。由于“頁表”存儲在主存儲器中,查詢頁表所付出的代價很大,由此產(chǎn)生了 TLB。MMU在將虛擬地址映射為物理地址時需要用到頁表信息,MMU會首先在TLB中查詢是否有所需的頁表信息,如果命中則不需要通過訪問內(nèi)存中的頁表而直接使用TLB中的頁表信息進(jìn)行映射(這種情況下大幅減少了 MMU訪問內(nèi)存的時間),如果沒有命中則需要通過訪問內(nèi)存中的頁表來進(jìn)行地址映射(這種情況下會增加了 MMU訪問內(nèi)存的時間)。如圖2,本發(fā)明MMUl包括原始命令解析單元11、與圖形圖像處理單元操作區(qū)域相對應(yīng)的復(fù)數(shù)個TLB12 (本實施例中共有ΤΙΛ、TLB2、TLB3)、TLB命中統(tǒng)計單元13,TLB更新控制單元14、命令裁決單元15、AXI master接口 16,讀數(shù)據(jù)通道處理單元17、配置信息寄存器18 ;所述原始命令解析單元11接收來自圖形圖像處理單元3的信號,并且還連接到各個 TLB12,以及命令裁決單元15,所述每一 TLB12均連接到命令裁決單元15,所述每一 TLB12 還均連接到一 TLB命中統(tǒng)計單元13。所述命令裁決單元15連接到AXI master接口 16,所述AXI master接口 16通過AXI總線連接到存儲單元2,并且AXI master接口 16連接到讀數(shù)據(jù)通道處理單元17,所述讀數(shù)據(jù)通道處理單元17分別連接到命令裁決單元15、TLB更新控制單元14,并且連接到圖形圖像處理單元3,所述配置信息存儲單元18接收保存來自 CPU4的配置信息,并將配置信息傳輸給各個單元。所述TLB12采用參數(shù)化設(shè)計,通過調(diào)節(jié) TLB12的深度參數(shù)即可調(diào)節(jié)TLB12的深度。所述TLB12的數(shù)量與圖形圖像處理單元操作區(qū)域數(shù)量相同,每一 TLB12對應(yīng)一操作區(qū)域,不同的操作區(qū)域使用不同的ID,每一 TLB12訪問使用對應(yīng)操作區(qū)域的總線ID操作。本發(fā)明MMU的工作原理1.首先,CPU4對MMUl進(jìn)行配置,CPU4的配置信息保存在配置信息寄存器18中, 然后配置信息寄存器18將配置信息送往所有內(nèi)部單元供其使用,CPU4對MMUl配置完畢后, 圖形圖像處理單元3開始工作;2.圖形圖像處理單元3開始工作后,會向MMUl發(fā)出讀寫命令,這時候原始命令解析單元11根據(jù)每個操作區(qū)域所使用的不同ID號來分出命令是對哪個操作區(qū)域進(jìn)行讀寫操作,然后按照解析出來的命令操作目標(biāo)區(qū)域,到其對應(yīng)的TLB12中進(jìn)行頁表信息查詢,同時,所有的命令信號都會直接送往命令裁決單元15中緩存在緩存器中,等待命令裁決單元 15進(jìn)行地址映射完成后再一起發(fā)送;3. TLB 12完成查詢后,會將是否成功命中的結(jié)果送往命令裁決單元15和TLB命中統(tǒng)計單元13,如果成功命中,則同時將命中得到的頁表信息送往命令裁決單元15以供完成虛擬地址到物理地址的映射;如果沒有命中,則會請求命令裁決單元15去存儲單元2中查詢所需的頁表信息以完成虛擬地址到物理地址的映射,并在查詢所需的頁表信息后進(jìn)行 TLB 12的頁表更新;4. TLB12將是否成功命中的結(jié)果傳送到達(dá)命令裁決單元15后,命令裁決單元15會根據(jù)命中與否決定下面的行為如果查詢成功命中,則使用同時從TLB12傳輸過來的頁表信息進(jìn)行地址映射,在完成以后,將物理地址配合其他存在緩存器中的總線命令一起送往 AXI master接口 16 ;如果沒有命中,則需要到存儲單元2中去查詢頁表信息,這時候命令裁決單元15會向AXI master接口 16發(fā)出一個讀頁表的命令,并在讀頁表的命令對應(yīng)的頁表信息返回后完成地址映射,然后在地址映射后將物理地址配合其他存在緩存器中的總線命令一起送往AXI master接口 16 ;5.在TLB12沒有命中的情況下,命令裁決單元15會發(fā)出頁表查詢讀命令來查詢存儲單元2中的頁表信息,當(dāng)頁表查詢讀命令對應(yīng)的讀數(shù)據(jù)返回的時候,讀數(shù)據(jù)會到達(dá)讀數(shù)據(jù)通道處理單元17,讀數(shù)據(jù)通道處理單元17會根據(jù)ID號判斷讀數(shù)據(jù)是查詢頁表讀數(shù)據(jù)還是圖形圖像處理單元3發(fā)出的讀命令得到的讀數(shù)據(jù);如果讀數(shù)據(jù)是查詢頁表讀數(shù)據(jù)即頁表信息,則將頁表信息送往命令裁決單元15和TLB更新控制單元14 ;6.在存儲單元2查詢得到的頁表信息傳輸?shù)矫畈脹Q單元15后,命令裁決單元 15會將頁表信息進(jìn)行地址映射,在完成地址映射以后,將物理地址配合其他存在緩存器中的總線命令一起送往AXI master接口 16,從而完成一次命令的映射;6.在存儲單元2查詢得到的頁表信息傳輸?shù)絋LB更新控制單元14后,TLB更新控制單元14會到此次查詢沒有命中的TLB12中進(jìn)行更新,更新的策略為輪流替換;7.在MMUl的一個操作區(qū)域命令收到一個命令后,到完成該次命令的地址映射之間,MMUl不再接收針對該操作區(qū)域的下一個命令,在MMUl完成此操作區(qū)域這次命令的地址映射后,才可以開始接收圖形圖像處理單元對此操作區(qū)域的下一次總線命令。例如MMUl接收到一個對應(yīng)TLB1的操作區(qū)域的命令后,到地址映射完畢之前不再接收對應(yīng)TLB1的操作區(qū)域的命令;在不同的操作區(qū)域之間,MMU是一直并行接收命令的,例如MMU接收到一個對應(yīng)TLB1的目標(biāo)區(qū)域的命令后,仍可以立刻繼續(xù)接收對應(yīng)TLB2或者TLB3的目標(biāo)區(qū)域的命令。 每個操作區(qū)域?qū)?yīng)一個ID號,這樣可以使各個操作區(qū)域的命令操作都有一個不同的ID,而在AXI總線中基于不同ID的命令不需要有前后依賴的順序關(guān)系,也就是可以亂序和并行操作,而返回的讀數(shù)據(jù)也只需要根據(jù)數(shù)據(jù)對應(yīng)的ID識別出是屬于哪個操作區(qū)域的頁表信息。 所以利用每個操作區(qū)域?qū)?yīng)一個ID號的操作,可以大大提高傳輸并行性和效率。所述TLB命中統(tǒng)計單元13可以統(tǒng)計各個TLB12的命中率,而且所述TLB12設(shè)計采用參數(shù)化設(shè)計,設(shè)計者只需要通過設(shè)置TLB12的深度參數(shù)即可調(diào)整TLB的深度。所以在仿真期間,設(shè)計者可以根據(jù)TLB命中統(tǒng)計單元13的各個TLB的統(tǒng)計信息,得到各個圖像區(qū)域的地址訪問特點,從而可以不斷調(diào)整TLB的深度,以達(dá)到面積和效率最佳平衡。極大的方便了在仿真時不斷的調(diào)整TLB深度以適合各個圖像區(qū)域的地址訪問特點;TLB在MMU電路中的個數(shù)也可以很方便的調(diào)整,TLB的個數(shù)主要根據(jù)圖形圖像處理單元3的操作區(qū)域有幾塊來決定如圖3,一個較復(fù)雜的圖形圖像處理電路,可以實現(xiàn)三個源圖像疊加到目的區(qū)域的圖像,則在存儲單元中三個源圖像和一個目的圖像通常存儲于不同的起始地址,但是每個圖像內(nèi)的數(shù)據(jù)都是連續(xù)的,所以這種情況需要使用4個TLB。如圖4所示,虛擬地址包括虛擬頁號和頁內(nèi)偏移量。TLB包括有效位、標(biāo)簽、物理頁基址。TLB中等號是判斷標(biāo)簽內(nèi)容和虛擬地址中的虛擬頁號是否相等的邏輯。根據(jù)頁表信息進(jìn)行地址映射的過程是得到虛擬地址后,將虛擬頁號和TLB中的所有的標(biāo)簽進(jìn)行比較,將是否相等的結(jié)果送往邏輯與單元(相等則結(jié)果等于1,不相等為 0),然后將是否相等的結(jié)果與TLB中標(biāo)簽的有效位進(jìn)行邏輯與計算,如果結(jié)果為1則判定TLB命中,否則TLB不命中。如果TLB命中則直接將命中標(biāo)簽對應(yīng)的物理頁基址和虛擬地址的頁內(nèi)偏移量組合成為物理地址完成映射;如果TLB沒有命中,則需要到外部存儲單元讀取頁表信息以得到虛擬頁號到物理頁基址的映射關(guān)系以完成虛擬地址到物理地址的映射。以上所述,僅為本發(fā)明較佳實施例而已,故不能依此限定本發(fā)明實施的范圍,即依本發(fā)明專利范圍及說明書內(nèi)容所作的等效變化與修飾,皆應(yīng)仍屬本發(fā)明涵蓋的范圍內(nèi)。
權(quán)利要求
1.一種圖像處理專用可配置的MMU電路,其特征在于,它包括原始命令解析單元、與圖形圖像處理單元操作區(qū)域數(shù)量相同的TLB,每一 TLB對應(yīng)一操作區(qū)域、TLB命中統(tǒng)計單元, TLB更新控制單元、命令裁決單元、AXI master接口,讀數(shù)據(jù)通道處理單元、配置信息寄存器;所述原始命令解析單元接收來自圖形圖像處理單元的信號,并且還連接到各個TLB,以及命令裁決單元,所述TLB均連接到命令裁決單元,所述命令裁決單元連接到AXI master 接口,所述AXI master接口通過AXI總線連接到存儲單元,并且AXI master接口連接到讀數(shù)據(jù)通道處理單元,所述讀數(shù)據(jù)通道處理單元分別連接到命令裁決單元、TLB更新控制單元,并且連接到圖形圖像處理單元,所述配置信息存儲單元接收保存來自CPU的配置信息, 并將配置信息傳輸給各個單元。
2.根據(jù)權(quán)利要求1所述的一種圖像處理專用可配置的MMU電路,其特征在于所述TLB 均連接到所述TLB命中統(tǒng)計單元。
3.根據(jù)權(quán)利要求1所述的一種圖像處理專用可配置的MMU電路,其特征在于所述TLB 采用參數(shù)化設(shè)計,通過調(diào)節(jié)TLB的深度參數(shù)即可調(diào)節(jié)TLB的深度。
4.根據(jù)權(quán)利要求1所述的一種圖像處理專用可配置的MMU電路,其特征在于所述圖形圖像處理單元的不同的操作區(qū)域使用不同的ID,每一 TLB訪問使用對應(yīng)操作區(qū)域的總線 ID操作。
全文摘要
本發(fā)明提供一種圖像處理專用可配置的MMU電路,它的原始命令解析單元接收來自圖形圖像處理單元的信號,并連接到各個TLB,以及命令裁決單元,各TLB均連接到命令裁決單元,所述命令裁決單元連接到AXImaster接口,AXI master接口通過AXI總線連接到存儲單元,并且連接到讀數(shù)據(jù)通道處理單元,所述讀數(shù)據(jù)通道處理單元分別連接到命令裁決單元、TLB更新控制單元,并且連接到圖形圖像處理單元,所述配置信息存儲單元接收保存來自CPU的配置信息,并將配置信息傳輸給各個單元。本發(fā)明針對圖形圖像處理數(shù)據(jù)流的特點設(shè)計,提高了TLB的命中率、提高了傳輸?shù)男屎退俣龋梢詫LB個數(shù)和深度進(jìn)行配置。
文檔編號G06T1/60GK102163320SQ20111011068
公開日2011年8月24日 申請日期2011年4月27日 優(yōu)先權(quán)日2011年4月27日
發(fā)明者廖裕民 申請人:福州瑞芯微電子有限公司