技術(shù)特征:1.一種在處理器體系結(jié)構(gòu)中實(shí)現(xiàn)的方法,包括:使用圖形處理單元GPU編譯器來編譯具有內(nèi)循環(huán)體的源代碼;以及當(dāng)編譯的源代碼的一個(gè)以上的機(jī)器代碼指令未充分使用GPU指令帶寬限制時(shí):從循環(huán)中剝離所述內(nèi)循環(huán)體的第一迭代;降低所述源代碼中的操作數(shù)的類型;以及使用矢量條狀提取將任意矢量長度的指令簡化為源代碼的所剝離的內(nèi)循環(huán)體中的圖形處理單元GPU支持的矢量長度,以獲取優(yōu)化的源代碼。2.如權(quán)利要求1所述的方法,其特征在于,包括:確定何時(shí)編譯的源代碼的一個(gè)以上的機(jī)器代碼指令未充分使用GPU指令帶寬限制是由源代碼具有至少一個(gè)帶兩個(gè)定義的操作數(shù)產(chǎn)生的,一個(gè)定義包括所述內(nèi)循環(huán)體外面的初始化定義,而另一個(gè)定義包括循環(huán)攜帶的定義;確定何時(shí)所述初始化定義具有dword的操作類型,而同時(shí)所述循環(huán)攜帶的定義具有word的操作類型;以及確定何時(shí)所述初始化定義和所述循環(huán)攜帶的定義的目的地相同而且是類型dword。3.如權(quán)利要求2所述的方法,其特征在于,包括:將所述優(yōu)化的源代碼的16寬的變量拆分為兩個(gè)9寬的變量;以及使用矢量條狀提取將任意矢量長度的指令簡化為所述優(yōu)化的源代碼中的GPU支持的矢量長度,以獲取進(jìn)一步優(yōu)化的源代碼。4.如權(quán)利要求1所述的方法,其特征在于,所述源代碼被配置成處理Rivest、Shamir,以及Adleman(RSA)解密算法。5.一種計(jì)算設(shè)備,包括:圖形處理單元GPU;以及GPU編譯器,所述GPU編譯器操作用以:編譯源代碼的內(nèi)循環(huán)體;確定何時(shí)編譯的源代碼的一個(gè)以上的機(jī)器代碼指令未充分使用GPU指令帶寬限制:從循環(huán)中剝離所述內(nèi)循環(huán)體的第一迭代;以及降低所述源代碼中的操作數(shù)的類型。6.如權(quán)利要求5所述的設(shè)備,其特征在于,所述GPU編譯器操作用以使用矢量條狀提取將任意矢量長度的指令簡化為源代碼的所剝離的內(nèi)循環(huán)體中的GPU支持的矢量長度,來獲取優(yōu)化的源代碼。7.如權(quán)利要求6所述的設(shè)備,其特征在于,所述GPU編譯器操作用以:確定何時(shí)編譯的源代碼的一個(gè)以上的機(jī)器代碼指令未充分使用GPU指令帶寬限制是由源代碼具有至少一個(gè)帶兩個(gè)定義的操作數(shù)產(chǎn)生的,一個(gè)定義包括所述內(nèi)循環(huán)體外面的初始化定義,而另一個(gè)定義包括循環(huán)攜帶的定義;確定何時(shí)所述初始化定義具有dword的操作類型,而同時(shí)所述循環(huán)攜帶的定義具有word的操作類型;以及確定何時(shí)所述初始化定義和所述循環(huán)攜帶的定義的目的地相同而且是類型dword。8.如權(quán)利要求7所述的設(shè)備,其特征在于,所述GPU編譯器操作用以:將16寬的變量拆分為兩個(gè)9寬的變量;以及使用矢量條狀提取將任意矢量長度的指令簡化為所述優(yōu)化的源代碼中的GPU支持的矢量長度,來獲取進(jìn)一步優(yōu)化的源代碼。9.如權(quán)利要求7所述的設(shè)備,其特征在于,所述GPU是在同一處理器管芯上包括CPU和所述GPU的異構(gòu)型處理器體系結(jié)構(gòu)的一部分。10.如權(quán)利要求7所述的設(shè)備,其特征在于,所述源代碼用于處理Rivest、Shamir,以及Adleman(RSA)解密算法。11.一種計(jì)算系統(tǒng),包括:操作用以執(zhí)行設(shè)置為M值的主RSA解密函數(shù)的中央處理單元CPU;耦合到所述CPU的圖形處理單元GPU,所述GPU操作用以:執(zhí)行包括被配置成執(zhí)行RSA計(jì)算以計(jì)算M的值的源代碼的GPU函數(shù);以及將M的值返回到在所述CPU上執(zhí)行的所述主RSA解密函數(shù),以及在所述GPU上操作以執(zhí)行下列操作的GPU編譯器:使用矢量條狀提取將任意矢量長度的指令簡化為所述源代碼的內(nèi)循環(huán)體中的GPU支持的矢量長度;以及確定何時(shí)編譯的源代碼的一個(gè)以上的機(jī)器代碼指令未充分使用GPU指令帶寬限制。12.如權(quán)利要求11所述的系統(tǒng),其特征在于,所述GPU編譯器操作用以:丟棄初始矢量條狀提取結(jié)果;從循環(huán)中剝離所述內(nèi)循環(huán)體的第一迭代;降低所述源代碼中的操作數(shù)的類型;以及使用矢量條狀提取將任意矢量長度的指令簡化為所述源代碼的所剝離的內(nèi)循環(huán)體中的GPU支持的矢量長度,來獲取優(yōu)化的源代碼。13.如權(quán)利要求12所述的系統(tǒng),其特征在于,所述GPU編譯器操作用以:確定何時(shí)編譯的源代碼的一個(gè)以上的機(jī)器代碼指令未充分使用GPU指令帶寬限制是由源代碼具有至少一個(gè)帶兩個(gè)定義的操作數(shù)產(chǎn)生的,一個(gè)定義包括所述內(nèi)循環(huán)體外面的初始化定義,而另一個(gè)定義包括循環(huán)攜帶的定義;確定何時(shí)所述初始化定義具有dword的操作類型,而同時(shí)所述循環(huán)攜帶的定義具有word的操作類型;以及確定何時(shí)所述初始化定義和所述循環(huán)攜帶的定義的目的地相同而且是類型dword。14.如權(quán)利要求12所述的系統(tǒng),其特征在于,所述GPU編譯器操作用以:將16寬的變量拆分為兩個(gè)9寬的變量;以及使用矢量條狀提取將任意矢量長度的指令簡化為所述優(yōu)化的源代碼中的GPU支持的矢量長度,來獲取進(jìn)一步優(yōu)化的源代碼。15.如權(quán)利要求11所述的系統(tǒng),其特征在于,所述CPU和所述GPU位于同一處理器管芯上。16.如權(quán)利要求15所述的系統(tǒng),其特征在于,所述處理器管芯被集成到移動(dòng)計(jì)算設(shè)備中。17.一種在處理器體系結(jié)構(gòu)中實(shí)現(xiàn)的方法,包括:把設(shè)置為值M的Rivest、Shamir,以及Adleman(RSA)解密算法的參數(shù)從操作用以在CPU上執(zhí)行的中央處理單元CPU主函數(shù)傳遞到操作用以在GPU上執(zhí)行的圖形處理單元GPU函數(shù),所述GPU函數(shù)包括源代碼,所述源代碼包括用于計(jì)算M的內(nèi)循環(huán)體;使用矢量條狀提取將任意矢量長度的指令簡化為所述源代碼的內(nèi)循環(huán)體中的GPU支持的矢量長度;當(dāng)編譯的GPU函數(shù)源代碼的一個(gè)以上的機(jī)器代碼指令未充分使用GPU指令帶寬限制時(shí),重新編寫所述GPU函數(shù)源代碼;在所述GPU上計(jì)算M的值;以及將M的值返回到所述CPU主函數(shù)。18.如權(quán)利要求17所述的方法,其特征在于,包括:確定何時(shí)未充分使用的機(jī)器代碼指令是由源代碼具有至少一個(gè)帶兩個(gè)定義的操作數(shù)產(chǎn)生的,一個(gè)定義包括所述內(nèi)循環(huán)體外面的初始化定義,而另一個(gè)定義包括循環(huán)攜帶的定義;確定何時(shí)所述初始化定義具有dword的操作類型,而同時(shí)所述循環(huán)攜帶的定義具有word的操作類型;以及確定何時(shí)所述初始化定義和所述循環(huán)攜帶的定義的目的地相同而且是類型dword。19.如權(quán)利要求18所述的方法,其特征在于,包括:丟棄初始矢量條狀提取結(jié)果;從循環(huán)中剝離所述內(nèi)循環(huán)體的第一迭代;以及降低所述源代碼中的操作數(shù)的類型。20.如權(quán)利要求19所述的方法,其特征在于,包括:使用矢量條狀提取將任意矢量長度的指令簡化為所述源代碼的所剝離的內(nèi)循環(huán)體中的GPU支持的矢量長度,來獲取優(yōu)化的源代碼。21.如權(quán)利要求20所述的方法,其特征在于,包括:將所述源代碼的16寬的變量拆分為兩個(gè)9寬的變量;以及使用矢量條狀提取將任意矢量長度的指令簡化為所述優(yōu)化的源代碼中的GPU支持的矢量長度,來獲取進(jìn)一步優(yōu)化的源代碼。22.一種在處理器體系結(jié)構(gòu)中實(shí)現(xiàn)的設(shè)備,包括:用于使用圖形處理單元GPU編譯器來編譯具有內(nèi)循環(huán)體的源代碼的裝置;以及當(dāng)編譯的源代碼的一個(gè)以上的機(jī)器代碼指令未充分使用GPU指令帶寬限制時(shí):用于從循環(huán)中剝離所述內(nèi)循環(huán)體的第一迭代的裝置;用于降低所述源代碼中的操作數(shù)的類型的裝置;以及用于使用矢量條狀提取將任意矢量長度的指令簡化為源代碼的所剝離的內(nèi)循環(huán)體中的圖形處理單元GPU支持的矢量長度來獲取優(yōu)化的源代碼的裝置。23.如權(quán)利要求22所述的設(shè)備,其特征在于,還包括:用于確定何時(shí)編譯的源代碼的一個(gè)以上的機(jī)器代碼指令未充分使用GPU指令帶寬限制是由源代碼具有至少一個(gè)帶兩個(gè)定義的操作數(shù)產(chǎn)生的裝置,一個(gè)定義包括所述內(nèi)循環(huán)體外面的初始化定義,而另一個(gè)定義包括循環(huán)攜帶的定義;用于確定何時(shí)所述初始化定義具有dword的操作類型而同時(shí)所述循環(huán)攜帶的定義具有word的操作類型的裝置;以及用于確定何時(shí)所述初始化定義和所述循環(huán)攜帶的定義的目的地相同而且是類型dword的裝置。24.如權(quán)利要求23所述的設(shè)備,其特征在于,還包括:用于將所述優(yōu)化的源代碼的16寬的變量拆分為兩個(gè)9寬的變量的裝置;以及用于使用矢量條狀提取將任意矢量長度的指令簡化為所述優(yōu)化的源代碼中的GPU支持的矢量長度來獲取進(jìn)一步優(yōu)化的源代碼的裝置。25.如權(quán)利要求23所述的設(shè)備,其特征在于,還包括用于處理Rivest、Shamir以及Adleman(RSA)解密算法的裝置。