專利名稱:用于執(zhí)行指令的處理系統(tǒng)和方法
技術領域:
本發(fā)明涉及用于執(zhí)行指令的處理系統(tǒng)和方法,尤其涉及針對在 兩個或多個部分中提取的指令具有功率降低優(yōu)勢的處理系統(tǒng)和方法。
本發(fā)明還涉及包括這種處理系統(tǒng)的裝置,諸如移動電話、PDA
等。
背景技術:
基于處理器的設備的功率效率正變得越來越重要,尤其在電池 供電的設備中。已經采用了很多技術來降低功率使用。這些技術包括 對處理器的電路進行設計,以使用較少的功率,或者以允許管理功率 使用的方式設計處理器。而且,對于給定的處理器結構,通過優(yōu)化其 程序設計能節(jié)省功耗。
當設計處理器結構和用于處理器結構的相關指令集時,可能會 在描述指令級并行性所需的位的數(shù)量和可以從程序存儲器并行地提 取的位的數(shù)量之間進行權衡。
在某些處理器結構中,如果指令超出給定長度,則會出現(xiàn)周期 懲罰。因此,某些處理器結構采用了指令壓縮。然而,如果指令的壓
縮太昂貴,則一種供選擇的方法是采用兩種類型的程序存儲器 一種 用于具有有限并行性的小指令,而第二種用于具有較大并行性的寬指
令。為了指示應該提取寬指令,則采用特殊小指令(即第一部分)來 觸發(fā)對寬指令(即第二部分)的提取。
在US專利第5, 724, 535號中公開了這種系統(tǒng)的示例,其中描述 了一種機制,在該機制中,通過在第二存儲器中進行査找,可將程序 存儲器中的指令擴展為VLIW (超長指令字)指令。
圖1示出了這種VLIW處理器1的示例,其特征是具有一種能力, 即可采用處理器內的不同功能單元3。至3n來并行處理多指令。存儲在第二存儲器5中的VLIW指令包括許多元素,每個元素都對處理器 1內的各個功能單元3。至3n進行控制。在操作期間,由主程序存儲 器7中的指令產生第二存儲器5的地址。提供解碼器9,用于檢測來 自主程序存儲器7的特殊指令,特殊指令需要在第二存儲器5中進行 查找。
圖2示出了主存儲器7中的指令(即第一部分11)如何提供用 于存儲在第二存儲器5中的VLIW指令(即第二部分13)的地址信息。 VLIW指令13包含多個元素13。至13N。在P Kievits等人1998年在 ICSPAT conference上發(fā)表的文章"R. E.A丄DSP Technology for Telecom Baseband Processing" 中可以發(fā)現(xiàn)這禾中處理指令的方法的 更詳細的方面。
以此方式,VLIW指令可被并行輸出至圖l中的各個功能單元3。 至3n。在每個處理周期中都使用了所有功能單元的完全并行的操作是 很少見的情況。更常見的情況是,很多VLIW指令在若干子元素中包 含N0P (不操作)指令,這表示在該處理周期期間不對相應的功能單 元進行操作。
因此,由于第二部分的元素13。至13k將包含NOP (即不操作), 所以如果不使用壓縮,則第二部分所允許的并行操作通常不會被完全 利用。在現(xiàn)有技術中,第二部分都完全是從存儲器中提取的,即使是 那些包含N0P的指令的元素。這存在一個缺點,即消耗功率比所需功 率多。
本發(fā)明的目的是提供一種處理系統(tǒng)和方法,其中避免了與提取 N0P相關的不必要功耗。
發(fā)明內容
根據(jù)本發(fā)明的第一方面,提供了一種在處理器中執(zhí)行指令的方 法,其中指令的第一部分導致指令的第二部分的執(zhí)行,并且其中第二
部分包括多個元素。該方法包括以下步驟提取指令的第一部分,并 且根據(jù)在指令的第一部分中所編碼的第一信息來識別哪些元素組成 了指令的第二部分。該方法還包括以下步驟根據(jù)在指令的第一部分中所編碼的第二信息來對識別出的元素中哪些元素與不操作(NOP) 指令相對應進行識別。然后提取形成指令的第二部分的元素,排除對 應于不操作(NOP)指令的元素。
通過在第一部分中指示應該提取第二部分的哪個元素,本發(fā)明 解決了上面提到的功率問題。因此,本發(fā)明具有以下優(yōu)勢可通過僅 僅提取不包含NOP的第二部分的元素來節(jié)省功率。
根據(jù)本發(fā)明的另一方面,提供了一種用于執(zhí)行指令的處理系統(tǒng), 其中指令的第一部分導致指令的第二部分的執(zhí)行。該系統(tǒng)包括用于提 取指令的第一部分的裝置,以及用于根據(jù)在指令的第一部分中所包含 的第一信息來識別哪些元素組成了指令的第二部分的裝置。該系統(tǒng)還 包括用于根據(jù)在指令的第一部分中所編碼的第二信息對識別出的元
素中哪些元素對應于不操作(NOP)指令進行識別的裝置,以及用于
提取形成指令的第二部分的元素的裝置。用于提取的裝置用于排除對
應于不操作(NOP)指令的元素。
根據(jù)本發(fā)明的另一方面,提供了一種用于數(shù)據(jù)處理系統(tǒng)的指令, 該指令包括第一部分,其導致了具有多個元素的第二部分的執(zhí)行,其
中該指令的第一部分包括多個數(shù)據(jù)位,該多個數(shù)據(jù)位對不操作(NOP) 指令進行識別,不操作(NOP)指令將從第二部分中的執(zhí)行中被排除。
為了更好的理解本發(fā)明,并且更清楚地示出如何實施本發(fā)明,
現(xiàn)在僅僅通過示例的方式,對以下附圖進行參考,其中 圖1示出了已知處理結構的圖示說明。
圖2示出了如何在兩個部分中提取VLIW指令的圖示說明。
圖3示出了根據(jù)本發(fā)明的第一實施例,如何執(zhí)行指令的圖示說明。
圖4示出了根據(jù)本發(fā)明的第二實施例,如何執(zhí)行指令的圖示說明。
具體實施方式
圖3示出了根據(jù)本發(fā)明的處理系統(tǒng)。指令編碼方案中的每個指 令均包括第一部分ll。然而,除了包含用于第二部分13的地址信息
(第一信息)之外,第一部分11還包括多個數(shù)據(jù)位(E。至EN)形式 的其它信息(第二信息)。應該以解的是,這些數(shù)據(jù)位E。至Ew是形 成指令集的第一部分中的指令的主數(shù)據(jù)位之外的數(shù)據(jù)位,它們被存儲 在主程序存儲器7中。
根據(jù)本發(fā)明的第一實施例,每個數(shù)據(jù)位E。至E,直接選擇指令集 的第二部分13中的對應元素13。至13N。例如,指令集的第二部分13 中的元素13。至13w形成了 VLIW。以此方式,第一部分11的數(shù)據(jù)位 E。至Ew被用來僅僅選擇不包括NOP指令的元素,因此避免了不必要 的功耗。換句話說,通過僅僅對排除了 NOP指令的元素進行選擇,可 以有效地利用在數(shù)據(jù)位E。至Ew中編碼的信息來識別哪個元素對應于 NOP指令。
因此,根據(jù)本發(fā)明,主程序存儲器7中的指令ll包括多個數(shù)據(jù) 位E。至Ew,其指示了應該從第二存儲器5提取VILW的哪個元素。由 于存儲器5被分為多個元素,每個元素都涉及與處理器中的功能單元 對應的VLIW的一部分,本發(fā)明使得每個元素都具有單獨的啟動信號, 其中啟動信號是由多個數(shù)據(jù)位E。至Ew中的一個對應的數(shù)據(jù)位控制的。
例如,如果存儲在第二存儲器中的VLIW包括8個元素13。至137, 則主程序存儲器中的指令字將包括8個數(shù)據(jù)位E。至E7。根據(jù)本發(fā)明 的第一實施例,如果在VLIW的任何元素中均不存在NOP指令,則可 將每個數(shù)據(jù)位E。至E7設置為相同的邏輯狀態(tài)(例如"高電平")以 啟動每個元素。在這種情況下,將使得每個元素都被傳遞至處理器中 的對應功能單元3。至3 ,以便執(zhí)行。
然而,如果VLIW中的元素(例如第四元素133)包含N0P指令, 則多個數(shù)據(jù)位中的對應數(shù)據(jù)位(E3)將被保持為"低電位",由此使 第四元素不能被傳遞至其對應的功能單元來執(zhí)行。以此方式,因為有 效地使與第四元素133對應的功能單元不處理任何指令,所以節(jié)省了 功率。
應該理解,雖然在上述實施例中,所提到的邏輯"高電平"起作用以啟動對應的元素,而邏輯"低電平"起作用以禁止對應的元素, 但是同樣可以使用相反的邏輯。
因此,如從圖3可以看出,每個第一部分11需要"N"個數(shù)據(jù) 位, 一個數(shù)據(jù)位用于第二部分13中的每個元素。
圖4示出了本發(fā)明的可選實施例。根據(jù)該實施例,第一部分ll 中所編碼的數(shù)可采用數(shù)據(jù)位E。至Ew對第二部分13中的不同元素組進 行選擇。使用解碼級15選擇元素組。優(yōu)選地,這些不同組反映了在 程序執(zhí)行期間最頻繁使用的組。例如,可以定義16或32組,每組都 具有經常出現(xiàn)的NOP組合。然后對解碼級15進行配置以確定特定的 指令屬于哪個組。
例如, 一個組可以包括"元素1、元素2、元素5、元素7", 另一個組可以包括"元素1、元素6、元素9、元素10"等等,其中 特定組中的元素的每種組合代表了程序中通常使用的組合。
在第二實施例中,可以使用包括四個數(shù)據(jù)位E。至E:,的第一部分 11對16個不同的第二部分進行編碼,也可以使用包括八個數(shù)據(jù)位E。 至E7的第一部分對256個不同的第二部分進行編碼,等等。
注意,在第一和第二實施例中,并不是所有的指令11都必須有 對應的第二部分13。換句話說,具有有限并行性的某些指令可以只 包括第一部分ll,而沒有相關的第二部分13。以此方式,如果在指 令中存在非常有限的并行性,則通過在第一部分中完全地編碼該指令 可以提高效率。
而且,雖然依據(jù)在第一和第二部分提取的指令已經描述了優(yōu)選 實施例,但是應該理解本發(fā)明同樣適用于在兩個以上的部分中提取指 令。
注意,本發(fā)明尤其適用于要求高計算性能的電池驅動裝置內的 應用。
如所屬領域的技術人員所了解,在上述提到的實施例中所描述 的"元素"可以是針對各個功能單元的單獨指令,或針對功能單元的 指令的一部分。多個功能單元與多個元素的單個指令對應,這也是可 行的。例如,數(shù)據(jù)由存儲器移動到功能單元的寄存器中可能需要寄存器目的地選擇和指針單元來產生數(shù)據(jù)地址。這將在多個元素中被編 碼。
應該注意,上面提到的實施例僅僅說明了而不是限制了本發(fā)明, 并且所屬領域的技術人員應該能夠在不脫離附屬權利要求范圍的情 況下設計出許多可替換實施例。詞語"包括"不排除在權利要求中所 列舉的元素或步驟之外的其它元素和步驟的存在,詞語"一個"或"一 種"不排除多個元素或步驟的存在,并且單個處理器或其它單元可能 實現(xiàn)權利要求中所述的幾個單元的功能。權利要求中的任何標號都不 應該被理解為用于限制權利要求的范圍。
權利要求
1. 一種在處理器中執(zhí)行指令的方法,在該處理器中,指令的第一部分導致指令的第二部分的執(zhí)行,并且其中所述第二部分包括多個元素,所述方法包括以下步驟提取所述指令的第一部分;根據(jù)在所述指令的第一部分中編碼的第一信息來識別哪些元素組成了所述指令的第二部分;根據(jù)在所述指令的第一部分中編碼的第二信息來對所述識別出的元素中的哪些元素與不操作NOP指令對應進行識別;以及提取形成所述指令的第二部分的所述元素,排除與不操作NOP指令對應的所述元素。
2. 如權利要求l所述的方法,其中在所述第一部分中編碼的所 述第二信息包括多個數(shù)據(jù)位,其中每個數(shù)據(jù)位都提供信息用于選擇所 述指令的第二部分的相關元素。
3. 如權利要求l所述的方法,其中在所述第一部分中編碼的所述第二信息包括多個數(shù)據(jù)位,所述數(shù)據(jù)位的組合代表了形成所述指令 的第二部分的相關元素組。
4. 如權利要求3所述的方法,其中所述第二部分中的元素的每 個組都與在程序執(zhí)行期間頻繁使用的一組元素相關。
5. 如權利要求1至4中的任一權利要求所述的方法,其中所述 第二部分是超長指令字VLIW, VLIW中的每個元素都形成了用于處理 器的功能元素的指令。
6. 如權利要求1至5中的任一權利要求所述的方法,其中所述 第一部分被存儲在第一存儲器中,并且其中所述第二部分被存儲在第二存儲器中。
7. —種用于執(zhí)行指令的處理系統(tǒng),其中指令的第一部分導致指 令的第二部分的執(zhí)行,所述系統(tǒng)包括用于提取所述指令的第一部分的裝置;用于根據(jù)包含在所述指令的第一部分中的第一信息來識別哪些 元素組成了所述指令的第二部分的裝置;用于根據(jù)在所述指令的第一部分中編碼的第二信息來對所述識 別出的元素中的哪些元素與不操作NOP指令對應進行識別的裝置;以 及用于提取形成所述指令的第二部分的所述元素的裝置,用于提 取的所述裝置用于排除與不操作NOP指令對應的所述元素。
8. 如權利要求7所述的系統(tǒng),其中在所述第一部分中編碼的所 述第二信息包括多個數(shù)據(jù)位,并且用于提取的所述裝置用于基于對應 的數(shù)據(jù)位來選擇所述指令的第二部分的相關元素。
9. 如權利要求7所述的系統(tǒng),其中在所述第一部分中編碼的所述第二信息包括多個數(shù)據(jù)位,并且用于提取的所述裝置用于基于所述 第一部分中的所述多個數(shù)據(jù)位來選擇形成所述指令的第二部分的一 組元素。
10. 如權利要求7所述的系統(tǒng),其進一步包括解碼邏輯,用于對形成所述指令的第二部分的一組元素進行選擇。
11. 如權利要求7至10中的任一權利要求所述的系統(tǒng),其中所 述第二部分是超長指令字VLIW, VLIW中的每個元素都形成了用于處 理器的功能元素的指令。
12. 如權利要求7至11中的任一權利要求所述的系統(tǒng),其進一步包括用于存儲所述指令的第一部分的第一存儲器,以及用于存儲所 述指令的第二部分的第二存儲器。
13. —種用于數(shù)據(jù)處理系統(tǒng)的指令,該指令包括第一部分,所 述第一部分導致具有多個元素的第二部分的執(zhí)行,其中所述指令的第 一部分包括多個數(shù)據(jù)位,所述多個數(shù)據(jù)位識別不操作N0P指令,所述不操作NOP指令將從所述第二部分中的執(zhí)行中被排除。
14. 一種裝置,其包括根據(jù)權利要求7至12中的任一權利要求 所述的處理系統(tǒng)。
全文摘要
用于執(zhí)行指令的處理系統(tǒng)包括具有地址信息和多個數(shù)據(jù)位E<sub>0</sub>至E<sub>N</sub>的第一部分(11)。根據(jù)一個實施例,每個數(shù)據(jù)位E<sub>0</sub>至E<sub>N</sub>都直接對形成指令集的第二部分(例如VLIW)的對應元素13<sub>0</sub>至13<sub>N</sub>進行選擇。以此方式,第一部分(11)被用于僅僅對不包括NOP指令的元素進行選擇,從而避免了不必要地功耗。根據(jù)可選實施例,利用數(shù)據(jù)位E<sub>0</sub>至E<sub>N</sub>,在第一部分(11)中所編碼的數(shù)可以選擇第二部分(13)中的元素的不同組。優(yōu)選地,這些不同組反映了程序中最可能使用的組合。
文檔編號G06F9/318GK101305345SQ200680042305
公開日2008年11月12日 申請日期2006年11月13日 優(yōu)先權日2005年11月15日
發(fā)明者彼得·A·E·J·基耶維茨, 讓-保羅·C·F·H·斯梅茨 申請人:Nxp股份有限公司