一種降低動態(tài)冗余多線程性能和功耗開銷的方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種降低動態(tài)冗余多線程性能和功耗開銷的方法,包括指令譯碼階段,讀取程序運行過程中指令操作碼,識別NOP指令,NOP指令統(tǒng)計量加一;指令發(fā)射階段,讀取寄存器時,使用寄存器號索引記錄表,將相應(yīng)標志位置0;指令提交階段,使用寄存器號索引記錄表,查看相應(yīng)標志位,如果內(nèi)容為1,則表明之前寫寄存器的指令為動態(tài)死指令,死指令統(tǒng)計量加一;無論標志位內(nèi)容為0或1,在指令提交階段,都將標志位置1。程序每運行一定數(shù)量的指令,將動態(tài)死指令和NOP指令統(tǒng)計信息以及其他關(guān)鍵統(tǒng)計量輸入已構(gòu)建線性回歸預(yù)測模型,預(yù)測處理器部件的AVF;當處理器部件的AVF高時,則開啟冗余線程以提高可靠性;當處理器部件的AVF低時,則關(guān)閉冗余線程以提高性能,降低功耗。
【專利說明】一種降低動態(tài)冗余多線程性能和功耗開銷的方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及處理器可靠性【技術(shù)領(lǐng)域】,尤其涉及一種降低動態(tài)冗余多線程性能和功耗開銷的方法和系統(tǒng)。
【背景技術(shù)】
[0002]在集成電路中,不斷降低的供電電壓、越來越高的工作頻率、持續(xù)減小的節(jié)點電容和高速增長的芯片復(fù)雜度使得電路對環(huán)境的影響越來越敏感。高能粒子(主要來源于宇宙輻射、核輻射、大氣和封裝材料)轟擊半導(dǎo)體器件,以及外界環(huán)境中的噪聲和干擾,導(dǎo)致邏輯位發(fā)生翻轉(zhuǎn),引起集成電路發(fā)生邏輯故障。由于這種故障具有瞬態(tài)、可恢復(fù)、發(fā)生位置和時間隨機等特點,不會引起器件永久性的故障,因此,稱為軟錯誤。隨著摩爾定律的繼續(xù)有效,單芯片的軟錯誤率也呈現(xiàn)指數(shù)增長趨勢,在16nm工藝下,單芯片的用戶可見錯誤率高達一天一次。因此,不論是在宇宙環(huán)境中,還是在地面環(huán)境中,甚至對商用處理器,軟錯誤問題都帶來了極大的危害,成為限制微處理器發(fā)展的一個重要問題。
[0003]利用SMT (Simultaneously and Redundantly Threading)硬件資源或多核處理器,通過冗余技術(shù)檢測或恢復(fù)軟錯誤,統(tǒng)稱為冗余多線程技術(shù)RMT (RedundantMultithreading)。在RMT技術(shù)中,同時運行兩個相同的線程,只有當兩個線程的輸出相等時,程序才能繼續(xù)執(zhí)行。盡管RMT技術(shù)能有效檢測軟錯誤,但是帶來了非常大的性能、功耗和面積開銷。Mukherjee發(fā)現(xiàn),利用多核處理器資源,使用RMT技術(shù)檢測軟錯誤,會導(dǎo)致單線程程序性能平均降低30%,多線程程序平均降低32%,功耗、面積開銷增大一倍。因此,過度保護的商用處理器會導(dǎo)致其在價格和性能上毫無競爭力。然而,如果沒有采取足夠的保護措施,又會導(dǎo)致處理器因為不可靠而變得無法使用。實際上,并不是所有由于外部帶電粒子引起的翻轉(zhuǎn)都會導(dǎo)致程序的執(zhí)行發(fā)生錯誤。因此,僅僅考慮芯片原始錯誤率會導(dǎo)致過度保護。芯片的失效率是其原始軟錯誤率與部件的弱點因子的乘積,而弱點因子又是時序弱點因子 TVF (Timing Vulnerability Factor)和體系結(jié)構(gòu)弱點因子 AVF (ArchitecturalVulnerability Factor)的乘積。芯片的原始錯誤率和TVF是由工藝和芯片制造技術(shù)決定的。處理器部件的AVF指的是處理器部件中的一位翻轉(zhuǎn)會導(dǎo)致用戶可見的錯誤的概率,與體系結(jié)構(gòu)特性和應(yīng)用程序特性有關(guān)。
[0004]在程序執(zhí)行過程中,AVF呈現(xiàn)明顯的動態(tài)變化特性和階段特性。因此,當處理器部件的AVF高時,則開啟冗余線程以提高可靠性;當處理器部件的AVF低時,則關(guān)閉冗余線程以提高性能,降低功耗。因此,在動態(tài)冗余多線程技術(shù)中,準確預(yù)測處理器的AVF是非常重要的。
[0005]現(xiàn)有技術(shù)需要在一個大小為4萬條指令的分析窗口,檢測動態(tài)死指令,這在硬件實現(xiàn)上是不可行的,而且分析復(fù)雜度高和分析時間長。所以,現(xiàn)有技術(shù)沒有將動態(tài)死指令的統(tǒng)計特征作為處理器部件AVF預(yù)測模型的輸入。但是,如果不考慮動態(tài)死指令的影響,而僅僅根據(jù)處理器部件的大小以及占用率預(yù)測AVF,會導(dǎo)致高估AVF,開啟不必要的冗余線程,帶來不必要的性能和功耗開銷。因為計算處理器部件的占用率時,并沒有去除處理器部件中可能駐留的動態(tài)死指令(在程序執(zhí)行過程中,動態(tài)死指令發(fā)生軟錯誤不會影響程序執(zhí)行結(jié)果),從而高估了處理器部件的有效占用率,但是占用率是預(yù)測處理器部件AVF的關(guān)鍵特征,當處理器部件占用率高時,其預(yù)測AVF很可能高。
【發(fā)明內(nèi)容】
[0006]為了解決上述技術(shù)問題,本發(fā)明的目的在于公開一種通過增加動態(tài)死指令統(tǒng)計信息和NOP指令統(tǒng)計信息這兩種體系結(jié)構(gòu)無關(guān)特征作為輸入,構(gòu)建機器學(xué)習預(yù)測模型,提高處理器部件的AVF預(yù)測準確性,從而降低動態(tài)冗余多線程開銷的方法及系統(tǒng)。
[0007]本發(fā)明分別對整型和浮點寄存器的每一個寄存器,增加一位標志位,構(gòu)成寄存器讀寫記錄表,高效實時檢測動態(tài)死指令。在程序運行過程中,指令譯碼階段,讀取指令操作碼,識別NOP指令,NOP指令統(tǒng)計量加一;指令發(fā)射階段,讀取寄存器時,使用寄存器號索引記錄表(即寄存器的標志位進行列表),將相應(yīng)標志位置O ;指令提交階段,使用寄存器號索引記錄表,查看相應(yīng)標志位,如果內(nèi)容為1,則表明之前寫寄存器的指令為動態(tài)死指令,死指令統(tǒng)計量加一。無論標志位內(nèi)容為O或1,在指令提交階段,都將標志位置I。程序每運行一定數(shù)量的指令,將動態(tài)死指令和NOP指令統(tǒng)計信息以及處理器部件占用率輸入預(yù)測模型,預(yù)測處理器部件的AVF。當處理器部件的AVF高時,則開啟冗余線程以提高可靠性;當處理器部件的AVF低時,則關(guān)閉冗余線程以提高性能,降低功耗。
[0008]本發(fā)明通過提高處理器部件AVF預(yù)測準確性,在滿足軟錯誤率設(shè)計要求的同時,減少冗余多線程的運行時間,降低動態(tài)冗余多線程的性能和功耗開銷。
【專利附圖】
【附圖說明】
[0009]圖1為寄存器讀與記錄表;
[0010]圖2為冗余多線程示意圖;
[0011]圖3為處理器部件AVF動態(tài)變化圖;
[0012]圖4為動態(tài)冗余多線程示意圖。
【具體實施方式】
[0013]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖,對本發(fā)明的實現(xiàn)進行進一步詳細說明。應(yīng)當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0014]為了緩解軟錯誤問題,工業(yè)界經(jīng)常使用冗余技術(shù),尤其是冗余多線程技術(shù)。利用SMT硬件資源或多核處理器,同時運行兩個相同的線程,只有當兩個線程的輸出相等時,程序才能繼續(xù)執(zhí)行,如圖2所示。
[0015]在程序運行的整個過程中,冗余線程始終在檢測軟錯誤,保證了所有軟錯誤都會被檢測到??墒菍嶋H上并不需要在程序運行的整個生命期內(nèi)都使用如此高代價的檢測措施。在程序運行過程中,處理器部件AVF呈現(xiàn)明顯的動態(tài)變化特性和階段特性,如圖3所示。當處理器部件的AVF低時,取消冗余線程以提高性能,降低功耗,仍然能夠滿足處理器軟錯誤率要求。當處理器部件的AVF高時,則開啟冗余線程以提高可靠性,如圖4所示。根據(jù)AVF的高低,實時開啟或關(guān)閉冗余線程,使得在滿足處理器軟錯誤率要求的同時,減少冗余多線程的運行時間,降低動態(tài)冗余多線程的性能和功耗開銷。所以,能夠準確預(yù)測AVF的高低則顯得尤為重要。(動態(tài)死指令統(tǒng)計信息和NOP指令統(tǒng)計信息,這兩種體系結(jié)構(gòu)無關(guān)特征是能夠準確預(yù)測處理器部件AVF的關(guān)鍵特征。動態(tài)死指令是它的結(jié)果在后續(xù)程序執(zhí)行過程中從來沒有被其他指令讀取使用的指令。例如,當兩條連續(xù)的指令A(yù)和B寫同一個寄存器R1,而期間沒有其他指令讀取過寄存器R1,則指令A(yù)為動態(tài)死指令。
[0016]本發(fā)明增加動態(tài)死指令統(tǒng)計信息和NOP指令統(tǒng)計信息作為處理器部件AVF預(yù)測模型的輸入特征。在SPEC2000Alpha指令級的基準程序中,動態(tài)死指令的比例高達9%,NOP指令的比例為10%。本實施例對26個SPEC2000基準測試程序做了大量的統(tǒng)計分析,從200個可能與處理器部件AVF相關(guān)的統(tǒng)計量中,選擇出最相關(guān)的統(tǒng)計量,構(gòu)建能夠準確預(yù)測處理器部件AVF的線性回歸模型,也可以采用其他的機器學(xué)習模型。本實例發(fā)現(xiàn),處理器部件占用率和動態(tài)死指令和NOP指令統(tǒng)計信息都是能夠準確預(yù)測處理器部件AVF的關(guān)鍵特征。
[0017]線性回歸方程,如公式I所示。
[0018]y = h0+hl.X^b2.Xjbi.X1...+bn.Xn
[0019]其中X1, x2,...xn表示自變量,y表示應(yīng)變量。在本發(fā)明中,Xi表示第i個統(tǒng)計量,I表示處理器相應(yīng)部件的AVF。
[0020]處理器相應(yīng)部件的AVF的殘差平方和,如公式2所示。
[0021]Q=E [y「(b0+bi.X^b2.X^bi.X1...+bn.xn) ]2
[0022]通過min (Q), 得到回歸系數(shù)B向量的最優(yōu)值。常用的方法有最小二乘法和梯度下降法。
[0023]為了構(gòu)建預(yù)測模型,每個程序運行前10個simpoint程序片段。在每一個simpoint程序片段運行過程中,每400萬條指令,計算一次處理器主要部件的AVF,并將相應(yīng)的200個統(tǒng)計量記錄下來,比如cache缺失率,分支預(yù)測準確率,動態(tài)死指令比例,NOP指令比例等。
[0024]本發(fā)明選取SPEC2000中的22個程序的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),其他4個程序,兩個浮點程序(apsi和galgel)以及兩個整型程序(mcf和twolf ),作為測試程序。
[0025]本發(fā)明首先計算每個統(tǒng)計量Xi與處理器部件AVFy的協(xié)方差平方,選擇出最相關(guān)的統(tǒng)計量。協(xié)方差平方值越大,表示該統(tǒng)計量與處理器相應(yīng)部件的AVF越相關(guān)。比如與ROBAVF最相關(guān)的統(tǒng)計量是ROB的占用率,協(xié)方差平方為0.9。然后依次將其余的199個統(tǒng)計量的其中一個與最相關(guān)統(tǒng)計量做二元線性回歸。預(yù)測差值最小的二元線性方程所包含的另一個自變量,即第二個自變量。以此類推,一次添加一個自變量,直到窮盡所有統(tǒng)計量。經(jīng)過全面的回歸分析,使用前幾個自變量構(gòu)成的線性回歸預(yù)測模型已經(jīng)可以比較準確的預(yù)測處理器主要部件的AVF,其中動態(tài)死指令和NOP指令統(tǒng)計信息都是很重要的統(tǒng)計量。
[0026]本發(fā)明分別對整型和浮點寄存器的每一個寄存器,增加一位標志位,構(gòu)成寄存器讀與記錄表,聞效實時檢測動態(tài)死指令。
[0027]在程序運行過程中,指令譯碼階段,讀取指令操作碼,識別NOP指令,NOP指令統(tǒng)計量加一;指令發(fā)射階段,讀取寄存器時,使用寄存器號索引記錄表,將相應(yīng)標志位置O ;指令提交階段,使用寄存器號索引記錄表,查看相應(yīng)標志位,如果內(nèi)容為1,則表明之前寫寄存器的指令為動態(tài)死指令,死指令統(tǒng)計量加一。無論標志位內(nèi)容為O或I,在指令提交階段,都將標志位置I。
[0028]程序每運行一定數(shù)量的指令,將動態(tài)死指令和NOP指令統(tǒng)計信息以及其他關(guān)鍵統(tǒng)計量(比如,處理器部件占用率等)輸入已經(jīng)構(gòu)建的線性回歸預(yù)測模型,預(yù)測處理器部件的AVF。當處理器部件的AVF高時,則開啟冗余線程以提高可靠性;當處理器部件的AVF低時,則關(guān)閉冗余線程以提高性能,降低功耗。本發(fā)明通過提高處理器部件AVF預(yù)測準確性,在滿足軟錯誤率設(shè)計要求的同時,減少冗余多線程的運行時間,降低動態(tài)冗余多線程的性能和功耗開銷。
[0029]綜上,本發(fā)明公開了一種降低動態(tài)冗余多線程性能和功耗開銷的方法,包括如下步驟:
[0030]步驟1、指令譯碼階段,讀取程序運行過程中指令操作碼,識別NOP指令,NOP指令統(tǒng)計量加一;
[0031]步驟2、指令發(fā)射階段,讀取寄存器時,使用寄存器號索引記錄表,將相應(yīng)標志位置O ;
[0032]步驟3、指令提交階段,使用寄存器號索引記錄表,查看相應(yīng)標志位,如果內(nèi)容為1,則表明之前寫寄存器的指令為動態(tài)死指令,死指令統(tǒng)計量加一;無論標志位內(nèi)容為O或I,在指令提交階段,都將標志位置I。
[0033]步驟4、程序每運行一定數(shù)量的指令,將動態(tài)死指令和NOP指令統(tǒng)計信息以及其他關(guān)鍵統(tǒng)計量輸入已構(gòu)建線性回歸預(yù)測模型,預(yù)測處理器部件的AVF ;
[0034]步驟5、當處理器部件的AVF高時,則開啟冗余線程以提高可靠性;當處理器部件的AVF低時,則關(guān)閉冗余線程以提高性能,降低功耗。
[0035]步驟3前包括:`[0036]步驟30、分別對整型和浮點寄存器的每一個寄存器,增加一位標志位,構(gòu)成寄存器讀與記錄表,聞效實時檢測動態(tài)死指令。
[0037]步驟4前包括:
[0038]步驟41、構(gòu)建預(yù)測處理器部件AVF的線性回歸模型步驟。
[0039]步驟41具體包括:
[0040]步驟411、統(tǒng)計處理器相應(yīng)部件的AVF ;
[0041]步驟412、計算殘差平方和;
[0042]步驟413、選擇殘差平方和的最小值,得到回歸系數(shù)B向量的最優(yōu)值;
[0043]步驟414、計算每個統(tǒng)計量與處理器部件AVF的協(xié)方差平方,選擇出最相關(guān)的統(tǒng)計量;協(xié)方差平方值越大,表示該統(tǒng)計量與處理器相應(yīng)部件的AVF越相關(guān)。
[0044]步驟41中計算處理器相應(yīng)部件的AVF的線性回歸方程為:
[0045]y = h0+hl.X^b2.Xjbi.X1...+bn.xn
[0046]其中=X1, x2,...xn表示自變量,y表示應(yīng)變量,Xi表示第i個統(tǒng)計量,y表示處理器相應(yīng)部件的AVF。
[0047]步驟41中處理器相應(yīng)部件的AVF的殘差平方和計算公式為:
[0048]Q=E Iiy1-(V^b1.X^b2.X^bi.X1...+bn.xn) ]2
[0049]本發(fā)明還公開了一種降低動態(tài)冗余多線程性能和功耗開銷的系統(tǒng),包括:
[0050]指令譯碼模塊,用于讀取程序運行過程中指令操作碼,識別NOP指令,NOP指令統(tǒng)計量加一;
[0051]指令發(fā)射模塊,用于讀取寄存器時,使用寄存器號索引記錄表,將相應(yīng)標志位置O ;
[0052]指令提交模塊,用于使用寄存器號索引記錄表,查看相應(yīng)標志位,如果內(nèi)容為I,則表明之前寫寄存器的指令為動態(tài)死指令,死指令統(tǒng)計量加一;無論標志位內(nèi)容為O或1,在指令提交階段,都將標志位置I。
[0053]預(yù)測模塊,用于程序每運行一定數(shù)量的指令,將動態(tài)死指令和NOP指令統(tǒng)計信息以及其他關(guān)鍵統(tǒng)計量輸入已構(gòu)建線性回歸預(yù)測模型,預(yù)測處理器部件的AVF ;
[0054]控制模塊,用于當處理器部件的AVF高時,則開啟冗余線程以提高可靠性;當處理器部件的AVF低時,則關(guān)閉冗余線程以提高性能,降低功耗。
[0055]所述降低動態(tài)冗余多線程性能和功耗開銷的系統(tǒng),還包括線性回歸模型構(gòu)建模塊,用于構(gòu)建預(yù)測處理器部件體系結(jié)構(gòu)弱點因子的線性回歸模型。
[0056]所述降低動態(tài)冗余多線程性能和功耗開銷的方法,線性回歸模型構(gòu)建模塊還計算殘差平方和;計算殘差平方和的最小值,得到回歸系數(shù)B向量的最優(yōu)值;計算每個統(tǒng)計量與處理器部件體系A(chǔ)VF的協(xié)方差平方,選擇出最相關(guān)的統(tǒng)計量;協(xié)方差平方值越大,表示該統(tǒng)計量與處理器相應(yīng)部件的AVF越相關(guān)。
[0057]本發(fā)明通過提高處理器部件AVF預(yù)測準確性,在滿足軟錯誤率設(shè)計要求的同時,減少冗余多線程的運行時間,降低動態(tài)冗余多線程的性能和功耗開銷。
【權(quán)利要求】
1.一種降低動態(tài)冗余多線程性能和功耗開銷的方法,其特征在于,包括如下步驟: 步驟1、指令譯碼階段,讀取程序運行過程中指令操作碼,識別NOP指令,NOP指令統(tǒng)計量加一; 步驟2、指令發(fā)射階段,讀取寄存器時,使用寄存器號索引記錄表,將相應(yīng)標志位置O ; 步驟3、指令提交階段,使用寄存器號索引記錄表,查看相應(yīng)標志位,如果內(nèi)容為1,則表明之前寫寄存器的指令為動態(tài)死指令,死指令統(tǒng)計量加一;無論標志位內(nèi)容為O或1,在指令提交階段,都將標志位置I ; 步驟4、程序每運行一定數(shù)量的指令,將動態(tài)死指令和NOP指令統(tǒng)計信息以及其他關(guān)鍵統(tǒng)計量輸入已構(gòu)建線性回歸預(yù)測模型,預(yù)測處理器部件的AVF ; 步驟5、當處理器部件的AVF高時,則開啟冗余線程以提高可靠性;當處理器部件的AVF低時,則關(guān)閉冗余線程以提高性能,降低功耗。
2.如權(quán)利要求1所述降低動態(tài)冗余多線程性能和功耗開銷的方法,其特征在于,步驟3前包括: 步驟30、分別對整型和浮點寄存器的每一個寄存器,增加一位標志位,構(gòu)成寄存器讀寫記錄表,聞效實時檢測動態(tài)死指令。
3.如權(quán)利要求1所述降低動態(tài)冗余多線程性能和功耗開銷的方法,其特征在于,步驟4前包括: 步驟41、構(gòu)建預(yù)測處 理器部件AVF的線性回歸模型步驟。
4.如權(quán)利要求3所述降低動態(tài)冗余多線程性能和功耗開銷的方法,其特征在于,步驟41具體包括: 步驟412、計算殘差平方和; 步驟413、選擇殘差平方和的最小值,得到回歸系數(shù)B向量的最優(yōu)值; 步驟414、計算每個統(tǒng)計量與處理器部件AVF的協(xié)方差平方,選擇出最相關(guān)的統(tǒng)計量;協(xié)方差平方值越大,表示該統(tǒng)計量與處理器相應(yīng)部件的AVF越相關(guān)。
5.如權(quán)利要求3所述降低動態(tài)冗余多線程性能和功耗開銷的方法,其特征在于,步驟41中計算處理器相應(yīng)部件的AVF的線性回歸方程為:
y = bo+bi.Xi+b2.x2+bi.X1...+bn.xn 其中:χ” χ2,...xn表示自變量,y表示應(yīng)變量,Xi表示第i個統(tǒng)計量,y表示處理器相應(yīng)部件的AVF。
6.如權(quán)利要求5所述降低動態(tài)冗余多線程性能和功耗開銷的方法,其特征在于,步驟41中處理器相應(yīng)部件的AVF的殘差平方和計算公式為:
Q=E Ey1-Ov^b1.X^b2.x2+bi.X1...+bn.xn) ]2
7.一種降低動態(tài)冗余多線程性能和功耗開銷的系統(tǒng),其特征在于,包括: 指令譯碼模塊,用于讀取程序運行過程中指令操作碼,識別NOP指令,NOP指令統(tǒng)計量加一; 指令發(fā)射模塊,用于讀取寄存器時,使用寄存器號索引記錄表,將相應(yīng)標志位置O ; 指令提交模塊,用于使用寄存器號索引記錄表,查看相應(yīng)標志位,如果內(nèi)容為1,則表明之前寫寄存器的指令為動態(tài)死指令,死指令統(tǒng)計量加一;無論標志位內(nèi)容為O或1,在指令提交階段,都將標志位置I ;預(yù)測模塊,用于程序每運行一定數(shù)量的指令,將動態(tài)死指令和NOP指令統(tǒng)計信息以及其他關(guān)鍵統(tǒng)計量輸入已構(gòu)建線性回歸預(yù)測模型,預(yù)測處理器部件的AVF ; 控制模塊,用于當處理器部件的AVF高時,則開啟冗余線程以提高可靠性;當處理器部件的AVF低時,則關(guān)閉冗余線程以提高性能,降低功耗。
8.如權(quán)利要求7所述降低動態(tài)冗余多線程性能和功耗開銷的系統(tǒng),其特征在于,還包括線性回歸模型構(gòu)建模塊,用于構(gòu)建預(yù)測處理器部件體系結(jié)構(gòu)弱點因子的線性回歸模型。
9.如權(quán)利要求8所述降低動態(tài)冗余多線程性能和功耗開銷的方法,其特征在于,線性回歸模型構(gòu)建模塊還包括計算殘差平方和;計算殘差平方和的最小值,得到回歸系數(shù)B向量的最優(yōu)值;計算每個統(tǒng)計量與處理器部件體系A(chǔ)VF的協(xié)方差平方,選擇出最相關(guān)的統(tǒng)計量;協(xié)方差平方值越大,表示該統(tǒng)計量與處理器相應(yīng)部件的AVF越相關(guān)。
【文檔編號】G06F11/14GK103699458SQ201310682554
【公開日】2014年4月2日 申請日期:2013年12月12日 優(yōu)先權(quán)日:2013年6月28日
【發(fā)明者】尹一笑, 陳云霽, 胡偉武 申請人:中國科學(xué)院計算技術(shù)研究所