本發(fā)明屬于集成電路模組測試領域,尤其涉及基于高能粒子的大容量固態(tài)硬盤單粒子效應測試方法和裝置。
背景技術(shù):
1、隨著固態(tài)存儲器(solid?state?drive,ssd)的廣泛應用,用戶對其可靠性要求越來越高。單粒子效應(single?event?effects,see)可造成存儲系統(tǒng)邏輯功能異常,其中以單粒子功能中斷(single?event?functional?interruption,sefi)影響最大。高能粒子通過彈性碰撞造成的材料內(nèi)部原子位移,稱為位移損傷效應(displacement?damage?effect,dde)。dde會導致器件中某些電參數(shù)的退化,乃至器件最終失去正常功能。
2、目前,對于ssd功能中斷現(xiàn)象尚缺乏分析技術(shù)與評估方法,尤其是針對敏感器件的定位與錯誤率評估指標確定。如現(xiàn)有技術(shù)1公開了一種nand型閃存固態(tài)硬盤空間環(huán)境效應測試系統(tǒng)及試驗方法,其中對單粒子輻照的主要實驗方法為使用激光脈沖發(fā)生器模擬高能粒子入射ssd中的關鍵器件,然而該試驗方法需要對這些器件進行開封裝操作暴露芯片表面進行試驗,其面臨兩大挑戰(zhàn),一是隨著芯片封裝密度的增加,現(xiàn)階段的ssd芯片主要采用球柵陣列封裝(ball?gridarray,bga),因此為確保芯片在開封裝后仍能工作,只能從芯片的正面開封裝。目前nand型閃存芯片與主控制器芯片仍采用引線鍵合(wire?bonding)封裝結(jié)構(gòu),芯片正面存在多層金屬布線結(jié)構(gòu)。該結(jié)構(gòu)會對入射脈沖激光產(chǎn)生反射,從而影響試驗的有效性。同時芯片開封裝存在必要的強酸腐蝕與加熱步驟,容易對部分芯片產(chǎn)生永久性損傷。其二是脈沖激光僅能同時針對ssd中的單個芯片進行輻照評估,較難反映在同一輻照條件下每種類器件的敏感度。現(xiàn)有技術(shù)2公開了一種固態(tài)硬盤單粒子翻轉(zhuǎn)截面的測試方法。提出了利用閃存單元與ssd控制器的單粒子翻轉(zhuǎn)計數(shù)之和作為固態(tài)硬盤整體的單粒子翻轉(zhuǎn)計數(shù)的評估方法。由于該測試方法未考慮到控制器外部動態(tài)隨機存儲器發(fā)生單粒子效應的對ssd系統(tǒng)整體產(chǎn)生影響。因此更適用于評估采用無緩存設計的ssd。同時最新的ssd均在nand型閃存與控制器內(nèi)部靜態(tài)隨機存儲器、控制器外部動態(tài)隨機存儲器中應用了錯誤檢查糾正模塊,因此在ssd中由單粒子效應產(chǎn)生的錯誤可被區(qū)分為可糾正的錯誤與不可糾正的錯誤。實際工程應用更加關注不可糾正的錯誤,該發(fā)明專利只針對ssd中發(fā)生的原始錯誤率進行測試?,F(xiàn)有技術(shù)中缺乏對ssd在實際工作條件下的單粒子效應評估方法與試驗結(jié)果的定量分析方法。
技術(shù)實現(xiàn)思路
1、為解決上述技術(shù)問題,更加全面體現(xiàn)ssd抗輻照性能,本發(fā)明提出了基于高能粒子的大容量固態(tài)硬盤單粒子效應測試方法和裝置,能夠?qū)崿F(xiàn)ssd抗輻射性能的參數(shù)化評估。
2、為實現(xiàn)上述目的,本發(fā)明提供了基于高能粒子的大容量固態(tài)硬盤單粒子效應測試方法,包括:
3、進行ssd用戶數(shù)據(jù)預置實驗,向待測ssd數(shù)據(jù)按照指定大小的數(shù)據(jù)包并在每個數(shù)據(jù)包中添加校驗信息;
4、基于所述數(shù)據(jù)預置實驗,開啟輻照測試,判斷ssd中的電子元器件是否在輻照條件下發(fā)生功能中斷與單粒子鎖定,確定判斷結(jié)果;
5、根據(jù)所述判斷結(jié)果,進行功能測試,獲取功能測試結(jié)果,基于所述功能測試結(jié)果,在輻照后測試階段進行靜默數(shù)據(jù)破壞測試與固定位錯誤測試;
6、根據(jù)所述靜默數(shù)據(jù)破壞測試和固定位錯誤測試,記錄靜默錯誤數(shù)量與固定位錯誤數(shù)據(jù);
7、基于所述靜默數(shù)據(jù)破壞數(shù)量與固定位錯誤數(shù)據(jù),進行錯誤特性量化計算,輸出計算結(jié)果。
8、可選的,基于所述數(shù)據(jù)預置實驗,開啟所述輻照測試,包括:
9、在高能粒子輻照環(huán)境下由測試服務器批量對待測ssd執(zhí)行4kverify混合隨機讀寫運行測試,獲取ssd的性能信息和錯誤信息。
10、可選的,判斷ssd中的電子元器件是否在輻照條件下發(fā)生功能中斷與單粒子鎖定,確定判斷結(jié)果包括:
11、若發(fā)生單粒子鎖定,則進行斷電并收集測試服務器bmc過流警告日志;
12、若未發(fā)生單粒子鎖定,則進行所述功能測試。
13、可選的,基于所述功能測試結(jié)果,在輻照后測試階段進行靜默數(shù)據(jù)破壞測試與固定位錯誤測試包括:
14、若所述功能測試失敗,則收集日志數(shù)據(jù),進行功能恢復和固件重寫,成功后再進行靜默數(shù)據(jù)破壞測試;
15、若所述功能測試成功,則根據(jù)收集的錯誤日志信息進行所述靜默數(shù)據(jù)破壞測試與固定位錯誤測試。
16、可選的,根據(jù)所述靜默數(shù)據(jù)破壞測試和固定位錯誤測試,記錄固定位錯誤數(shù)據(jù)包括:
17、利用fio的verify功能進行讀測試,若出現(xiàn)讀出數(shù)據(jù)出錯且控制器未上報該錯誤,則認為發(fā)生靜默數(shù)據(jù)破壞錯誤,并記錄所述靜默錯誤數(shù)量,若在測試期間發(fā)現(xiàn)動態(tài)隨機存儲器出現(xiàn)固定物理地址上的重復糾錯記錄,則記錄固定位錯誤數(shù)據(jù)。
18、可選的,基于所述固定位錯誤數(shù)據(jù),進行錯誤特性量化計算,輸出計算結(jié)果包括:
19、利用控制器和動態(tài)隨機存儲器產(chǎn)生的錯誤數(shù)據(jù),利用所述固定位錯誤數(shù)據(jù),進行錯誤特性量化計算,統(tǒng)計計算結(jié)果并輸出。
20、本發(fā)明還提供了基于高能粒子的大容量固態(tài)硬盤單粒子效應測試裝置,包括:通過以太網(wǎng)連接的控制中心和輻照室;
21、所述控制中心,用于對所述輻照室進行控制;
22、所述輻照室包括:高能粒子束流窗、被測模組、高能粒子吸收器、測試服務器、pciex16線纜、slimsas重定時拓展卡、sff-8654u.2接口線纜、sff-8088sata接口線纜;
23、所述高能粒子束流窗,用于實現(xiàn)加速器束流管道內(nèi)部高真空環(huán)境與外部常壓環(huán)境之間的隔離,同時允許加速后的粒子束安全、有效地從加速器內(nèi)引出;
24、所述被測模組,用于固定待測ssd并確保高能粒子束流中心點位于預期位置;
25、所述高能粒子吸收器,用于吸收剩余高能粒子,防止對測試環(huán)境其他敏感器件產(chǎn)生干擾;
26、所述測試服務器,用于運行ssd的測試腳本與測試案例,監(jiān)控ssd工作狀態(tài)并收集發(fā)生的錯誤數(shù)據(jù);
27、所述pcie?x16線纜,用于連接測試服務器pcie接口與slimsas重定時拓展卡,使得測試服務器盡可能遠離束流窗;
28、所述slimsas重定時拓展卡,用于將pcie信號轉(zhuǎn)換為slimsas標準信號,同時進行重定時以補償鏈路損耗,以滿足pcie鏈路的信號完整性要求;
29、所述sff-8645u.2接口線纜,用于連接采用u.2接口的待測ssd的數(shù)據(jù)與slimsas重定時拓展卡,以滿足多個ssd同時開展輻照測試的需求;
30、所述sff-8088sata接口線纜,用于直接連接采用sata接口的待測ssd與測試服務器。
31、可選的,所述控制中心包括:高能粒子準直器控制器、高能粒子開關和監(jiān)控計算機;
32、所述高能粒子準直器控制器,用于控制高能粒子輻照的面積與通量;
33、所述高能粒子開關,用于控制高能粒子輻照時間;
34、所述監(jiān)控計算機,用于通過ssh協(xié)議遠程登陸測試服務器,確保測試人員對輻照室內(nèi)的測試服務器進行安全且實時的控制與觀察。
35、與現(xiàn)有技術(shù)相比,本發(fā)明具有如下優(yōu)點和技術(shù)效果:
36、1.減少開封裝操作的復雜性與損傷風險:現(xiàn)有發(fā)明技術(shù)中的試驗方法依賴對ssd芯片進行開封裝操作,隨著封裝密度的不斷增大,開封裝難度也越來越大,本發(fā)明改進了實驗方法,避免了開封裝操作,降低了測試裝對芯片性能的影響,從而提高了試驗的可靠性與有效性。
37、2.在正常工作條件下完成ssd單粒子效應測試:現(xiàn)有發(fā)明中提及的技術(shù)僅能針對ssd中的單個芯片進行輻照評估并依賴于特定的寫入數(shù)據(jù)或工程開發(fā)調(diào)試模式。同時,本發(fā)明的測試方法不需要ssd進入調(diào)試模式,而是在其正常工作模式下即可完成單粒子效應的測試和評估。這一特性不僅簡化了測試流程,能夠更真實地反映ssd在實際工況下的性能和穩(wěn)定性。
38、3.綜合考慮系統(tǒng)級單粒子效應的影響:本發(fā)明克服了現(xiàn)有技術(shù)只針對特定于nand閃存或控制器的局限性,通過改進實驗設計,使得在相同的輻照條件下,可以同時評估ssd內(nèi)部多個關鍵器件的敏感度,顯著增強了對各類器件的分析能力。同時現(xiàn)有發(fā)明中的測試技術(shù)不適用于帶有緩存的ssd。本發(fā)明能夠在帶緩存設計的ssd中進行單粒子效應的測試和評估,拓寬了技術(shù)應用的范圍,適用于當前ssd的主流設計。
39、4.不可糾正錯誤測試與表征方式:由于現(xiàn)代ssd廣泛應用了錯誤檢查與糾正模塊,本發(fā)明能夠有效區(qū)分由單粒子效應引起的可糾正與不可糾正錯誤并給出測試表征方法,尤其是關注工程應用中更加重要的不可糾正錯誤,從而提高了對ssd工作可靠性的評估精度。
40、5.總結(jié)來說,本發(fā)明不僅克服了現(xiàn)有技術(shù)在試驗操作、器件敏感度分析、系統(tǒng)級效應評估等方面的不足,還提供了更全面、精準的ssd單粒子效應評估方法,并更好地反映了現(xiàn)代ssd在實際工作條件下的性能。