一種linux服務(wù)器sas卡硬盤狀態(tài)的監(jiān)控方法
【專利說明】一種I inux服務(wù)器sas卡硬盤狀態(tài)的監(jiān)控方法
[0001]
技術(shù)領(lǐng)域
[0002]本發(fā)明涉及硬盤監(jiān)控技術(shù),具體的說是一種Iinux服務(wù)器sas卡硬盤狀態(tài)的監(jiān)控方法。
【背景技術(shù)】
[0003]隨著云計算技術(shù)的興起,大數(shù)據(jù)服務(wù)器開始應(yīng)用到互聯(lián)網(wǎng)等行業(yè)客戶中,這些大數(shù)據(jù)服務(wù)器配置大容量多數(shù)量SATA硬盤,通常情況下配置SAS卡。而SAS卡本身不具備告警功能,即SATA硬盤出現(xiàn)掉線或故障時,由于SATA硬盤協(xié)議原因,硬盤背板指示燈不亮燈不報警。通過機房巡檢難以發(fā)現(xiàn)硬盤故障,只有業(yè)務(wù)讀寫文件異常時才能發(fā)現(xiàn),給運維管理增加了難度。目前SAS卡管理軟件具備陣列管理功能,但硬盤狀態(tài)監(jiān)控及告警手段存在不足。
【發(fā)明內(nèi)容】
[0004]本發(fā)明針對目前需求以及現(xiàn)有技術(shù)發(fā)展的不足之處,提供一種Iinux服務(wù)器sas卡硬盤狀態(tài)的監(jiān)控方法。
[0005]本發(fā)明所述一種Iinux服務(wù)器sas卡硬盤狀態(tài)的監(jiān)控方法,解決上述技術(shù)問題采用的技術(shù)方案如下:所述Iinux服務(wù)器sas卡硬盤狀態(tài)的監(jiān)控方法,基于Shell腳本作為監(jiān)控腳本,在內(nèi)存中駐留磁盤狀態(tài)監(jiān)控器,按照設(shè)定的周期遍歷所有磁盤,通過定期檢索硬盤設(shè)備名,來判斷硬盤是否掉線,通過掃描硬盤SMART參數(shù)關(guān)鍵項字符串,判斷在線硬盤的健康狀況。
[0006]優(yōu)選的,先獲取所有硬盤在線情況下完整的磁盤設(shè)備列表,按序遍歷磁盤設(shè)備列表中的硬盤,同時在當(dāng)前系統(tǒng)的磁盤設(shè)備中檢索該磁盤,如果檢索不到表明磁盤離線,否貝IJ,磁盤在線并檢查磁盤健康狀況。
[0007]優(yōu)選的,當(dāng)出現(xiàn)硬盤掉線或者SMART參數(shù)異常時,將會觸發(fā)告警機制,并郵件通知管理員。
[0008]本發(fā)明所述一種Iinux服務(wù)器sas卡硬盤狀態(tài)的監(jiān)控方法與現(xiàn)有技術(shù)相比具有的有益效果是:本發(fā)明通過shell腳本程序,能夠自動分析在線硬盤的健康狀態(tài),實時發(fā)現(xiàn)硬盤的離線及健康狀態(tài),實現(xiàn)了 Iinux服務(wù)器下sas卡硬盤在線及健康狀態(tài)的實時監(jiān)控,當(dāng)硬盤出現(xiàn)異常時,運維人員能夠第一時間發(fā)現(xiàn)處理;實施時步驟簡潔、不占用系統(tǒng)資源,只需運行腳本,無需安裝第三方插件,無需修改系統(tǒng)參數(shù),不影響生產(chǎn)環(huán)境,系統(tǒng)資源耗費低,非常方便實用。
【附圖說明】
[0009]附圖1為所述Iinux服務(wù)器sas卡硬盤狀態(tài)的監(jiān)控方法的實施流程圖。
【具體實施方式】
[0010]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚明白,以下結(jié)合具體實施例,并參照附圖,對本發(fā)明所述一種Iinux服務(wù)器sas卡硬盤狀態(tài)的監(jiān)控方法進一步詳細(xì)說明。
[0011]本發(fā)明所述I inux服務(wù)器sas卡硬盤狀態(tài)的監(jiān)控方法,是基于Shell腳本的Iinux服務(wù)器sas卡硬盤狀態(tài)的監(jiān)控方法,提出的監(jiān)控腳本,將會在內(nèi)存中駐留磁盤狀態(tài)監(jiān)控器,能夠按照設(shè)定的周期遍歷所有磁盤,及時發(fā)現(xiàn)掉線的硬盤。
[0012]實施例:
本實施例所述一種Iinux服務(wù)器sas卡硬盤狀態(tài)的監(jiān)控方法,基于Shell腳本作為監(jiān)控腳本,在內(nèi)存中駐留磁盤狀態(tài)監(jiān)控器,通過定期檢索硬盤設(shè)備名,來判斷硬盤是否掉線,通過掃描硬盤SMART參數(shù)關(guān)鍵項字符串,判斷在線硬盤的健康狀況;當(dāng)出現(xiàn)硬盤掉線或者SMART參數(shù)異常時,將會觸發(fā)告警機制,并郵件通知管理員ο
[0013]本實施例所述監(jiān)控方法,先獲取所有硬盤在線情況下完整的磁盤設(shè)備列表,按序遍歷磁盤設(shè)備列表中的硬盤,同時在當(dāng)前系統(tǒng)的磁盤設(shè)備中檢索該磁盤,如果檢索不到表明磁盤離線,否則,磁盤在線并檢查磁盤健康狀況。
[0014]本實施例所述監(jiān)控方法中,所基于的SHELL腳本文件DiskMonitor.sh,具體內(nèi)容如下:# ! /bin/bash
Is |grep initial, disklist > /dev/null
if [ $? -ne 0 ]
then
lsscsi |grep disk |awk ^ {print $6}’ > initial, disklistfi
while truedo
for disk in cat initial, disklist' do
Is /dev/sd木 Igrep disk> /dev/null
if [ $? -eq 0 ]
then
smartctl -H $disk |grep PASSED > /dev/null
if [ $? -ne 0 ]
then
echo 〃$disk on $H0STNAME is online, however, the status of $diskneeds pay attent1n, |mail -s "Disk warning detected on $H0STNAME〃 adminOxxx.com
fi
else
echo 〃$disk on $H0STNAME is offline, please pay attent1n
immediately 〃 fidonesleep 43200done o
[0015]本實施例所述linux服務(wù)器sas卡硬盤狀態(tài)的監(jiān)控方法,實施步驟簡潔,無需修改系統(tǒng)參數(shù),不影響生產(chǎn)環(huán)境。該監(jiān)控方法的具體實施流程如附圖1所示:
1)對部署sas卡硬盤狀態(tài)監(jiān)控的Iinux服務(wù)器拷貝DiskMonitor.sh腳本,并拷貝到指定目錄,如/opt等目錄;
2)賦予DiskMonitor.sh 腳本可執(zhí)行權(quán)限:# chmod +x DiskMonitor.sh ;
3)執(zhí)行DiskMonitor.sh 腳本程序:#./DiskMonitor.sh & ;
1.腳本程序首次運行,會生成所有硬盤在線情況下完整的磁盤設(shè)備列表文件initial, disklist,里面記錄了需要檢索的磁盤設(shè)備名;
?.本程序定義了硬盤掃描周期為12h,可自定義掃描時間;掃描時間到達時時,程序開始在/dev目錄中檢索磁盤設(shè)備名;腳本程序按initial, disklist里磁盤名的順序開始遍歷,當(dāng)某磁盤名在/dev目錄能夠檢索到時,腳本程序判斷此硬盤在線,并執(zhí)行smartctl命令查看硬盤健康狀況,掃描特征字符串PASSED,如果掃描到,則判斷硬盤狀態(tài)良好,反之需要管理員關(guān)注。
[0016]上述【具體實施方式】僅是本發(fā)明的具體個案,本發(fā)明的專利保護范圍包括但不限于上述【具體實施方式】,任何符合本發(fā)明的權(quán)利要求書的且任何所屬技術(shù)領(lǐng)域的普通技術(shù)人員對其所做的適當(dāng)變化或替換,皆應(yīng)落入本發(fā)明的專利保護范圍。
【主權(quán)項】
1.一種Iinux服務(wù)器sas卡硬盤狀態(tài)的監(jiān)控方法,其特征在于,基于Shell腳本作為監(jiān)控腳本,在內(nèi)存中駐留磁盤狀態(tài)監(jiān)控器,按照設(shè)定的周期遍歷所有磁盤,通過定期檢索硬盤設(shè)備名,來判斷硬盤是否掉線,通過掃描硬盤SMART參數(shù)關(guān)鍵項字符串,判斷在線硬盤的健康狀況。2.根據(jù)權(quán)利要求1所述一種Iinux服務(wù)器sas卡硬盤狀態(tài)的監(jiān)控方法,其特征在于,先獲取所有硬盤在線情況下完整的磁盤設(shè)備列表,按序遍歷磁盤設(shè)備列表中的硬盤,同時在當(dāng)前系統(tǒng)的磁盤設(shè)備中檢索該磁盤,如果檢索不到表明磁盤離線,否則,磁盤在線并檢查磁盤健康狀況。3.根據(jù)權(quán)利要求2所述一種Iinux服務(wù)器sas卡硬盤狀態(tài)的監(jiān)控方法,其特征在于,當(dāng)出現(xiàn)硬盤掉線或者SMART參數(shù)異常時,將會觸發(fā)告警機制,并郵件通知管理員。
【專利摘要】本發(fā)明公開一種linux服務(wù)器sas卡硬盤狀態(tài)的監(jiān)控方法,涉及硬盤監(jiān)控技術(shù),基于Shell腳本作為監(jiān)控腳本,在內(nèi)存中駐留磁盤狀態(tài)監(jiān)控器,按照設(shè)定的周期遍歷所有磁盤,通過定期檢索硬盤設(shè)備名,來判斷硬盤是否掉線,通過掃描硬盤SMART參數(shù)關(guān)鍵項字符串,判斷在線硬盤的健康狀況。本發(fā)明實現(xiàn)了linux服務(wù)器下sas卡硬盤在線及健康狀態(tài)的實時監(jiān)控,實施時步驟簡潔、不占用系統(tǒng)資源,只需運行腳本,無需安裝第三方插件,無需修改系統(tǒng)參數(shù),不影響生產(chǎn)環(huán)境,系統(tǒng)資源耗費低,非常方便實用。
【IPC分類】G06F11/30, H04L12/26
【公開號】CN105141478
【申請?zhí)枴緾N201510554496
【發(fā)明人】孫曉亮, 任華進
【申請人】浪潮電子信息產(chǎn)業(yè)股份有限公司
【公開日】2015年12月9日
【申請日】2015年9月2日