一種以內(nèi)升溫方式檢測時延故障的定溫指令級自測試方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及半導(dǎo)體工藝技術(shù)領(lǐng)域,尤其是涉及一種以內(nèi)升溫方式檢測時延故障的定溫指令級自測試方法,是一種VLSI故障容忍高溫條件下時延故障的檢測方法。
【背景技術(shù)】
[0002]高溫因素一直是影響計算機系統(tǒng)可靠性的關(guān)鍵因素之一。計算機系統(tǒng)在正常工作溫度下可正確地工作。但是,一旦溫度升高,計算機系統(tǒng)中將出現(xiàn)大量無法理解的故障。即使整個系統(tǒng)的芯片都經(jīng)過了嚴格的制造測試,這種問題依然普遍存在。這種與溫度相關(guān)的問題主要來源于最壞時延故障,即高溫條件下的時延故障。隨著芯片溫度的提高,電路中信號傳輸?shù)臅r延也會顯著地提高,因此高溫條件會加劇芯片原本的時延。然而糟糕的是,由于當(dāng)前芯片有著日益遞增的性能要求,設(shè)計中預(yù)留給高溫和其它因素的時間邊界被嚴重地消減了。在這種情況下,高溫導(dǎo)致電路時延超過芯片的固有時延的故障成為了一項計算機系統(tǒng)的普遍問題。這個問題需要被妥當(dāng)?shù)靥幚?,尤其是高可靠性要求的計算機系統(tǒng)。但是,當(dāng)前的方法檢測這種問題存在缺陷,因此需要設(shè)計合適測試方法檢測高溫條件下的時延故障。
[0003]當(dāng)前的制造測試并不適用于測試高溫條件下的時延故障。首先,針對正常的時延故障,制造測試自身就有缺陷。這種方法需要在被測電路上插入輔助測試電路(Design forTest, DFT),這樣使得被測電路中的故障能夠更容易被激活或被觀測。但是,這種測試要求改變了原來的電路,會引入一些在正常工作中完全不會出現(xiàn)的向量(被稱為非功能向量)。對于時延故障,制造測試將會引入的這種非功能向量比例極其高。這樣,很多工作模式下能正常工作的芯片在制造測試過程中卻被誤認為是錯誤芯片。這種問題被稱為過度測試問題,它會對芯片工業(yè)帶來難以容忍的經(jīng)濟損失。其次,采用制造測試的方法檢測高溫條件下的時延故障是非常危險的。一方面,當(dāng)溫度提高后制造測試會加劇已經(jīng)存在的過量測試問題。這是因為非功能向量能夠輕易地激活那些不可測的長通路,而當(dāng)溫度升高后,這部分故障首先被觀測到。另一方面,當(dāng)前的制造測試亟需降低測試溫度,而不是測試高溫條件下的時延故障。在制造測試中,它的信號跳變數(shù)目是正常工作模式下的數(shù)倍,這些不正常的信號跳變會迅速加熱芯片,甚至直接燒毀芯片。因此,制造測試并不適用于測試高溫條件下的時延故障。
[0004]老化測試常常用于測試芯片在高溫條件下是否正常工作,但是它同樣具有一些致命的問題。在老化測試中,被測芯片被烤爐從外部加熱直到它到達給定的溫度。然后,這種溫度下,老化測試運行正常程序數(shù)個小時或者數(shù)天,藉此可以測試高溫條件下芯片的缺陷。但是,老化測試會損壞被測芯片。由于長時間的烘烤,這種方法會損壞絕緣,進而降低芯片的壽命。更糟糕的是,老化測試不能有效地測試高溫條件下的時延缺陷。首先,由于絕緣層的因素,老化測試可能加熱芯片的表層,而并沒有有效地加熱芯片的內(nèi)部電路。更進一步,正常的功能程序并不是專門針對時延故障,它們的故障覆蓋率不高,難以完備地測試芯片。
[0005]指令級自測試方法是一種新型的測試技術(shù),它通過運行普通的功能程序測試處理器或嵌入式系統(tǒng),它最顯著的特征是極高的故障覆蓋率,堪比采用全掃描結(jié)構(gòu)的制造測試。這種方法曾經(jīng)被用于測試基于跳變故障模型的時延測試,并且達到了 94%以上的故障覆蓋率。同時,它也能夠用于基于路徑故障模型的時延測試,同樣達到了較高的故障覆蓋率。以往的指令級自測試方法僅考慮過低功耗或低溫度,以減少測試開銷。但是,沒有工作考慮采用指令級自測試方法,檢測高溫條件下的時延故障。為了有效地檢測最糟糕情況下的時延故障,指令級自測試方法需要運行在系統(tǒng)允許的最高溫度范圍內(nèi),即能夠在高溫范圍內(nèi)開展定溫測試。
【發(fā)明內(nèi)容】
[0006]本發(fā)明的目的就是為了克服上述現(xiàn)有技術(shù)存在的缺陷而提供一種能有效地測試高溫條件下的時延故障、保證高的故障覆蓋率、減小處理器損失的以內(nèi)升溫方式檢測時延故障的定溫指令級自測試方法。
[0007]本發(fā)明的目的可以通過以下技術(shù)方案來實現(xiàn):
[0008]一種以內(nèi)升溫方式檢測時延故障的定溫指令級自測試方法,對處理器進行高溫時延測試,包括以下步驟:
[0009]I)獲取原始指令級自測試程序模塊,形成未變形原始程序模塊集合TH);
[0010]2)對原始指令級自測試程序模塊進行循環(huán)展開的變形;
[0011]3)對原始指令級自測試程序模塊進行基于觸發(fā)cache miss的變形;
[0012]4)根據(jù)步驟2)和3),形成基于循環(huán)展開變形的程序模塊集合TF1、基于觸發(fā)cachemiss變形的程序模塊集合TF2和同時采用循環(huán)展開和觸發(fā)cache miss變形的程序模塊集合 TF3 ;
[0013]5)在設(shè)定的測試溫度區(qū)間內(nèi),采用定溫測試程序調(diào)度算法,從所述TF0、TF1、TF2、TF3中獲取可行調(diào)度;
[0014]6)將處理器加熱到測試溫度區(qū)間的下界,根據(jù)可行調(diào)度,執(zhí)行相應(yīng)程序,針對時延故障實施內(nèi)升溫的定溫測試。
[0015]所述步驟2)中,循環(huán)展開的變形具體為:
[0016]2.1)刪除程序模塊中循環(huán)語句的檢測器;
[0017]2.2)提取循環(huán)次數(shù),并將其作為變量N的值;
[0018]2.3)檢查變量N是否大于0,若是,則進入步驟2.4),若否,則進入步驟2.6);
[0019]2.4)根據(jù)N的值,設(shè)置程序模塊中l(wèi)oad指令和store指令的偏移地址,并輸出本次循環(huán)對應(yīng)的指令序列;
[0020]2.5)變量N自減1,返回步驟2.3);
[0021]2.6)結(jié)束。
[0022]所述步驟3)中,進行基于觸發(fā)cache miss的變形時,判斷處理器的cache結(jié)構(gòu),根據(jù)所述cache結(jié)構(gòu)觸發(fā)原始指令級自測試程序模塊中的cache miss。
[0023]所述cache結(jié)構(gòu)包括直接映射cache、全相聯(lián)cache或組相聯(lián)cache。
[0024]所述步驟5)中,定溫測試程序調(diào)度算法是基于貪心策略,從TF0、TF1、TF2、TF3中搜索滿足設(shè)定的測試溫度區(qū)間的測試程序調(diào)度方案。
[0025]所述貪心策略包括低開銷程序變形優(yōu)先策略和高溫度模塊優(yōu)先策略。
[0026]所述定溫測試程序調(diào)度算法具體為:
[0027]5.1)以測試溫度區(qū)間的下界為初始溫度;
[0028]5.2)根據(jù)低開銷程序變形優(yōu)先策略,從TH)開始搜索,根據(jù)初始溫度計算TH)中未執(zhí)行程序模塊的終態(tài)溫度;
[0029]5.3)根據(jù)所述終態(tài)溫度判斷TH)是否存在滿足設(shè)定的測試溫度區(qū)間的程序模塊,若是,則將滿足設(shè)定的測試溫度區(qū)間的程序模塊作為可行模塊,并根據(jù)高溫度模塊優(yōu)先策略,從所述可行模塊中選取終態(tài)溫度最高的一個加入可行調(diào)度中,并以該終態(tài)溫度作為初始溫度,返回步驟5.2),若否,則執(zhí)行步驟5.4);
[0030]5.4)根據(jù)低開銷程序變形優(yōu)先策略,從TF2開始搜索,根據(jù)初始溫度計算TF2中未執(zhí)行程序模塊的終態(tài)溫度;
[0031]5.5)根據(jù)所述終態(tài)溫度判斷TF2是否存在滿足設(shè)定的測試溫度區(qū)間的程序模塊,若是,則將滿足設(shè)定的測試溫度區(qū)間的程序模塊作為可行模塊,并根據(jù)高溫度模塊優(yōu)先策略,從所述可行模塊中選取終態(tài)溫度最高的一個加入可行調(diào)度中,并以該終態(tài)溫度作為初始溫度,返回步驟5.2),若否,則執(zhí)行步驟5.6);
[0032]5.6)根據(jù)低開銷程序變形優(yōu)先策略,從TFl開始搜索,根據(jù)初始溫度計算TFl中未執(zhí)行程序模塊的終態(tài)溫度;
[0033]5.7)根據(jù)所述終態(tài)溫度判斷TFl是否存在滿足設(shè)定的測試溫度區(qū)間的程序模塊,若是,則將滿足設(shè)定的測試溫度區(qū)間的程序模塊作為可行模塊,并根據(jù)高溫度模塊優(yōu)先策略,從所述可行模塊中選取終態(tài)溫度最高的一個加入可行調(diào)度中,并以該終態(tài)溫度作為初始溫度,返回步驟5.2),若否,則執(zhí)行步驟5.8);
[0034]5.8)根據(jù)低開銷程序變形優(yōu)先策略,從TF3開始搜索,根據(jù)初始溫度計算TF3中未執(zhí)行程序模塊的終態(tài)溫度;
[0035]5.9)根據(jù)所述終態(tài)溫度判斷TF3是否存在滿足設(shè)定的測試溫度區(qū)間的程序模塊,若是,則將滿足設(shè)定的測試溫度區(qū)間的程序模塊作為可行模塊,并根據(jù)高溫度模塊優(yōu)先策略,從所述可行模塊中選取終態(tài)溫度最高的一個加入可行調(diào)度中,并以該終態(tài)溫度作為初始溫度,返回步驟5.2),若否,則終止。
[0036]所述未執(zhí)行程序模塊的終態(tài)溫度采用四階runge-kutta算法計算獲得。
[0037]所述未執(zhí)行程序模塊的終態(tài)溫度的具體計算過程為:
[0038]al)獲得未執(zhí)行程序模塊i的測試時間time和功耗power ;
[0039]a2)根據(jù)初始溫度計算未執(zhí)行程序模塊i在一個采樣間隔interval后的終態(tài)溫度Te ;
[0040]a3)將終態(tài)溫度Te設(shè)置成下一個采樣周期的初始溫度Ts ;
[0041]a4)重復(fù)步驟al)?a3)M次,得到最終的終態(tài)溫度Te ;
[0042]其中,M為循環(huán)變量,M= time/interval。
[0043]所述根據(jù)高溫度模塊優(yōu)先策略,從所述可行模塊中選取終態(tài)溫度最高的一個加入可行調(diào)度中具體為:
[0044]bl)初始化最高溫度Temax等于首個可行模塊的終態(tài)溫度,最高溫模塊序號max等于該程序模塊的序號i ;
[0045]b2)判斷是否存在其它可行模塊,若是,則選擇另一可行模塊j,執(zhí)行步驟b3),若否,則執(zhí)行步驟b4);
[0046]b3)判斷可行模塊j的終態(tài)溫度是否大于最高溫度Temax,若是,則將可行模塊j的終態(tài)溫度作為最高溫度Temax,同時將序號max更新為j,返回步驟b2