本發(fā)明屬于硬盤性能檢測(cè)領(lǐng)域,尤其涉及一種硬盤異常自動(dòng)復(fù)位方法及其裝置。
背景技術(shù):
硬盤作為電腦主要的存儲(chǔ)核心部件之一,其可靠性至關(guān)重要;但是目前的系統(tǒng)設(shè)計(jì)中,關(guān)于硬盤的關(guān)注度主要集中在軟件方面,比如硬盤修改、raid、數(shù)據(jù)克隆等等,而對(duì)于硬盤本身的可靠性問題關(guān)注度不高。
據(jù)統(tǒng)計(jì)數(shù)字顯示,在被存儲(chǔ)廠家換下來的硬盤中,有60%的硬盤屬于無異常、可使用的硬盤,只不過在系統(tǒng)因?yàn)橐淮蔚哪撤N原因硬盤無響應(yīng)夯住,使硬盤處于“假死”狀態(tài),導(dǎo)致系統(tǒng)誤以為硬盤損壞而剔除硬盤,使硬盤被迫下線退回至存儲(chǔ)廠家,但這時(shí)候硬盤其實(shí)是沒有損壞的、可使用的,只要重新對(duì)硬盤進(jìn)行一次插拔作業(yè),硬盤又會(huì)重新上線;硬盤“假死”故障屬于不定時(shí)現(xiàn)象,沒有規(guī)則性,有時(shí)候一天出現(xiàn)一次,有時(shí)候長(zhǎng)時(shí)間不出現(xiàn)一次,影響系統(tǒng)的正常運(yùn)行,增加維修成本,因此,對(duì)于本技術(shù)領(lǐng)域成員而言,如何在系統(tǒng)運(yùn)行過程中解決硬盤的假死故障為亟需解決的技術(shù)問題。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供一種硬盤異常自動(dòng)復(fù)位方法及其裝置,當(dāng)硬盤無響應(yīng)時(shí),能夠自動(dòng)對(duì)硬盤進(jìn)行復(fù)位,使得硬盤重新上線,及時(shí)在系統(tǒng)中恢復(fù)硬盤的使用,從而避免硬盤被誤剔除。
為了實(shí)現(xiàn)上述目的,本發(fā)明采用以下的技術(shù)方案:
一種硬盤異常自動(dòng)復(fù)位方法,包括以下步驟:
磁盤陣列系統(tǒng)檢測(cè)到異常硬盤;
通過磁盤陣列柜的機(jī)箱管理體系定位出異常硬盤;
對(duì)異常硬盤進(jìn)行復(fù)位;
驗(yàn)證復(fù)位后的硬盤。
優(yōu)選地,磁盤陣列系統(tǒng)檢測(cè)到異常硬盤,包括:磁盤陣列系統(tǒng)向硬盤讀寫數(shù)據(jù)時(shí)進(jìn)行校驗(yàn),當(dāng)校驗(yàn)發(fā)生無響應(yīng)或錯(cuò)誤時(shí),則判定該硬盤為異常硬盤。
優(yōu)選地,對(duì)異常硬盤進(jìn)行復(fù)位,包括:磁盤陣列柜的機(jī)箱管理體系發(fā)送信號(hào)至控制器,控制器控制邏輯線路斷電,間隔預(yù)設(shè)時(shí)間后,再次恢復(fù)供電,并通過總線返回操作信號(hào)給計(jì)算機(jī)管理系統(tǒng)。
優(yōu)選地,所述驗(yàn)證為對(duì)復(fù)位后的硬盤進(jìn)行讀寫測(cè)試。
優(yōu)選地,驗(yàn)證復(fù)位后的硬盤之后,還包括:復(fù)位后的硬盤通過驗(yàn)證測(cè)試,則上線;否則,下線。
一種硬盤異常自動(dòng)復(fù)位裝置,包括:
檢測(cè)模塊,用于檢測(cè)異常硬盤;
觸發(fā)模塊,用于對(duì)異常硬盤進(jìn)行定位;
復(fù)位模塊,用于對(duì)異常硬盤進(jìn)行復(fù)位;
驗(yàn)證模塊,用于驗(yàn)證復(fù)位后的硬盤。
優(yōu)選地,還包括:處理模塊,用于處理驗(yàn)證后硬盤的上線或下線。
本發(fā)明的有益效果:
本發(fā)明在讀寫時(shí)的校驗(yàn)判定硬盤是否處于異常,若硬盤異常,繼而通過觸發(fā)、復(fù)位操作,復(fù)位之后再對(duì)復(fù)位后的硬盤進(jìn)行驗(yàn)證,若驗(yàn)證成功,則判定硬盤為假死狀態(tài),在系統(tǒng)中對(duì)硬盤進(jìn)行重新上線,實(shí)現(xiàn)對(duì)硬盤的自動(dòng)復(fù)位,使硬盤以毫秒級(jí)時(shí)間重新上線,及時(shí)在系統(tǒng)中恢復(fù)硬盤的使用,而且不需要對(duì)硬盤進(jìn)行插拔即可恢復(fù)硬盤,避免硬盤被誤剔除,有效保證系統(tǒng)工作的穩(wěn)定性,降低硬盤應(yīng)用的風(fēng)險(xiǎn),提高硬盤的使用壽命。
現(xiàn)有的技術(shù)是,硬盤因出現(xiàn)異常情況被夯住短時(shí)間無響應(yīng),導(dǎo)致系統(tǒng)誤以為硬盤損壞而剔除硬盤,其實(shí)被剔除的硬盤可能是出于“假死”狀態(tài),導(dǎo)致硬盤被誤判,繼而進(jìn)行下線處理,增加了硬盤的維護(hù)費(fèi)用,本發(fā)明通過觸發(fā)、復(fù)位和驗(yàn)證對(duì)于硬盤短時(shí)間無響應(yīng)的問題進(jìn)行甄別,來確定硬盤是否可以繼續(xù)使用,防止硬盤被系統(tǒng)誤判,可以有效的節(jié)省60%的硬盤維護(hù)費(fèi)用。
附圖說明
圖1為本發(fā)明硬盤異常自動(dòng)復(fù)位方法的流程示意圖之一;
圖2為本發(fā)明硬盤異常自動(dòng)復(fù)位方法的流程示意圖之二;
圖3為本發(fā)明硬盤異常自動(dòng)復(fù)位裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
為了便于理解,對(duì)本發(fā)明中出現(xiàn)的部分名詞作以下解釋說明:
磁盤陣列:英文全稱為Redundant Arrays of Independent Disks,以下簡(jiǎn)稱RAID,是由多個(gè)磁盤組合成一個(gè)磁盤組,利用個(gè)別磁盤提供數(shù)據(jù)所產(chǎn)生加成效果提升整個(gè)磁盤系統(tǒng)效能。
SES管理體系:SES為SCSI Enclosure Service的簡(jiǎn)稱,是T10技術(shù)委員會(huì)制定的用于機(jī)箱管理的標(biāo)準(zhǔn),主要負(fù)責(zé)SSA/SCSI/SAS等技術(shù)、標(biāo)準(zhǔn)的開發(fā)和制定,硬盤陣列柜都設(shè)計(jì)了總線環(huán)路來獲許各種狀態(tài)數(shù)據(jù)和傳輸SES規(guī)范中的命令,在發(fā)送的時(shí)候把SES規(guī)范中的SCSI命令包裹到I2C總線中進(jìn)行傳遞,之后傳輸?shù)接脖P陣列柜的控制器中。
復(fù)雜可編程邏輯器件: 英文全稱為Complex Programmable Logic Device,以下簡(jiǎn)稱CPLD,是以乘積項(xiàng)結(jié)構(gòu)方式構(gòu)成邏輯行為的器件,由可編程邏輯宏單元(Macro Cell)圍繞中心的可編程互連矩陣單元組成。
I2C總線:是一個(gè)雙向的兩線連續(xù)總線,提供集成電路(integrated circuit)之間的通信線路。
操作系統(tǒng): 英文全稱為Operating System,以下簡(jiǎn)稱OS,是管理和控制計(jì)算機(jī)硬件與軟件資源的計(jì)算機(jī)程序。
腳本:英文全稱為script,是批處理文件的延伸,是一種純文本保存的程序;腳本可以由應(yīng)用程序臨時(shí)調(diào)用并執(zhí)行。
下面結(jié)合附圖和實(shí)施例,對(duì)本發(fā)明的具體實(shí)施方式作進(jìn)一步詳細(xì)描述:
實(shí)施例一
如圖1所示,一種硬盤異常自動(dòng)復(fù)位方法,包括以下步驟:
步驟S101:使用RAID作為本發(fā)明磁盤陣列系統(tǒng),系統(tǒng)RAID讀寫數(shù)據(jù)時(shí)進(jìn)行校驗(yàn),當(dāng)校驗(yàn)發(fā)生無響應(yīng)或錯(cuò)誤時(shí),則判定該硬盤發(fā)生異常。
步驟S102:使用SES管理體系作為本發(fā)明的磁盤陣列柜的機(jī)箱管理體系,發(fā)現(xiàn)硬盤異常后,通過SES管理體系定位出異常硬盤。
步驟S103:使用CPLD作為本發(fā)明的控制器,SES管理體系通過管理總線將信號(hào)發(fā)送至CPLD,CPLD控制邏輯線路斷電,間隔預(yù)設(shè)時(shí)間后,再次恢復(fù)供電,并通過管理總線返回操作信號(hào)給SES管理體系。
上述管理總線為I2C總線。
作為一種可實(shí)施方式,間隔預(yù)設(shè)時(shí)間為毫秒級(jí)時(shí)間,毫秒級(jí)時(shí)間可以設(shè)置為10ms。
步驟S104:SES管理體系觸發(fā)OS下腳本程序,完成讀寫測(cè)試。
步驟S105:通過讀寫測(cè)試的硬盤,則上線,轉(zhuǎn)步驟S101。
步驟S106:不通過讀寫測(cè)試的硬盤,則下線。
實(shí)施例二
如圖2所示,一種硬盤異常自動(dòng)復(fù)位方法,包括以下步驟:
步驟S201:磁盤陣列系統(tǒng)檢測(cè)到異常硬盤。
步驟S202:通過磁盤陣列柜的機(jī)箱管理體系定位出異常硬盤。
步驟S203:對(duì)異常硬盤進(jìn)行復(fù)位。
步驟S204:驗(yàn)證復(fù)位后的硬盤。
實(shí)施例三
如圖3所示,一種硬盤異常自動(dòng)復(fù)位裝置,包括檢測(cè)模塊301、觸發(fā)模塊302、復(fù)位模塊303、驗(yàn)證模塊304和處理模塊305,所述檢測(cè)模塊301依次順序連接觸發(fā)模塊302、復(fù)位模塊303、驗(yàn)證模塊304和處理模塊305。
檢測(cè)模塊301,用于檢測(cè)異常硬盤;觸發(fā)模塊302,用于對(duì)異常硬盤進(jìn)行定位;復(fù)位模塊303,用于對(duì)異常硬盤進(jìn)行復(fù)位;驗(yàn)證模塊304,用于驗(yàn)證復(fù)位后的硬盤;處理模塊305,用于處理驗(yàn)證后硬盤的上線或下線。
以上所示僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤飾,這些改進(jìn)和潤飾也應(yīng)視為本發(fā)明的保護(hù)范圍。