欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

磁盤的故障預(yù)測(cè)方法和裝置與流程

文檔序號(hào):11590149閱讀:214來(lái)源:國(guó)知局

本發(fā)明涉及磁盤領(lǐng)域,具體而言,涉及一種磁盤的故障預(yù)測(cè)方法和裝置。



背景技術(shù):

目前,硬盤是存儲(chǔ)數(shù)據(jù)的主要介質(zhì),硬盤一旦出故障,便會(huì)造成巨大的數(shù)據(jù)損失。因此如何保證硬盤的穩(wěn)定性能非常重要。在通常狀態(tài)下,硬盤在24小時(shí)中出錯(cuò)的概率在是萬(wàn)分之一左右,當(dāng)一臺(tái)服務(wù)器具有十塊硬盤時(shí),服務(wù)器硬盤出錯(cuò)的概率就會(huì)上升到千分之一,而隨著當(dāng)前網(wǎng)站等業(yè)務(wù)的發(fā)展,服務(wù)器需要使用的硬盤會(huì)越來(lái)越多,多塊硬盤同時(shí)出錯(cuò)的概率也會(huì)提升。

通常情況下,數(shù)據(jù)存儲(chǔ)通常會(huì)有多個(gè)備份,如mysql主備庫(kù),gfs文件默認(rèn)3個(gè)備份。在大量數(shù)據(jù)存儲(chǔ)平臺(tái)上,如果多個(gè)硬盤同時(shí)出故障,那么這些硬盤上存儲(chǔ)著同一個(gè)文件的備份的概率就會(huì)很高,即如果多塊硬盤同時(shí)出現(xiàn)故障,就會(huì)導(dǎo)致一些文件的丟失,對(duì)于一些線上的服務(wù),大都依賴于服務(wù)器中存儲(chǔ)的海量數(shù)據(jù),如果硬盤出故障,就會(huì)導(dǎo)致上述在線服務(wù)異常,甚至?xí)和J褂谩?/p>

由于上述原因,需要具有預(yù)測(cè)硬盤是否會(huì)出錯(cuò)的系統(tǒng)需要有一套系統(tǒng)能提前告訴我們哪些硬盤會(huì)出錯(cuò),數(shù)據(jù)可能丟失導(dǎo)致硬盤故障的原因有很多,最常見(jiàn)的有以下幾種:外部振動(dòng)、溫度和濕度、電器元件損壞、聲音和灰塵,在上述因素中,有些因素能夠被采集到,比如溫度和濕度、一些元器件數(shù)據(jù),但是更多的數(shù)據(jù)無(wú)法被采集和量化,因此便會(huì)導(dǎo)致預(yù)測(cè)結(jié)果不準(zhǔn)確。

針對(duì)現(xiàn)有技術(shù)的硬盤故障預(yù)測(cè)系統(tǒng)中一些容易致使硬盤故障的因素不能被采集胡或量化導(dǎo)致的預(yù)測(cè)結(jié)果不準(zhǔn)確的問(wèn)題,目前尚未提出有效的解決方案。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明實(shí)施例提供了一種磁盤的故障預(yù)測(cè)方法和裝置,以至少解決現(xiàn)有技術(shù)的硬盤故障預(yù)測(cè)系統(tǒng)中一些容易致使硬盤故障的因素不能被采集胡或量化導(dǎo)致的預(yù)測(cè)結(jié)果不準(zhǔn)確的技術(shù)問(wèn)題。

根據(jù)本發(fā)明實(shí)施例的一個(gè)方面,提供了一種磁盤的故障預(yù)測(cè)方法,包括:通過(guò)磁 盤監(jiān)控技術(shù)獲取磁盤的樣本磁盤數(shù)據(jù),其中,樣本磁盤數(shù)據(jù)包括多個(gè)維度上的樣本數(shù)據(jù);采用gbdt算法對(duì)樣本磁盤數(shù)據(jù)進(jìn)行樣本訓(xùn)練,得到由多個(gè)決策樹(shù)組成的磁盤預(yù)測(cè)模型;在接收到待測(cè)磁盤的磁盤數(shù)據(jù)之后,使用由多個(gè)決策樹(shù)組成的磁盤預(yù)測(cè)模型對(duì)待測(cè)磁盤的磁盤數(shù)據(jù)進(jìn)行處理,確定待測(cè)磁盤是否為故障磁盤。

根據(jù)本發(fā)明實(shí)施例的另一方面,還提供了一種磁盤的故障預(yù)測(cè)裝置,包括:通過(guò)磁盤監(jiān)控技術(shù)獲取磁盤的樣本磁盤數(shù)據(jù),其中,樣本磁盤數(shù)據(jù)包括多個(gè)維度上的樣本數(shù)據(jù);采用gbdt算法對(duì)樣本磁盤數(shù)據(jù)進(jìn)行樣本訓(xùn)練,得到由多個(gè)決策樹(shù)組成的磁盤預(yù)測(cè)模型;在接收到待測(cè)磁盤的磁盤數(shù)據(jù)之后,使用由多個(gè)決策樹(shù)組成的磁盤預(yù)測(cè)模型對(duì)待測(cè)磁盤的磁盤數(shù)據(jù)進(jìn)行處理,確定待測(cè)磁盤是否為故障磁盤。

在本發(fā)明實(shí)施例中,采用通過(guò)磁盤監(jiān)控技術(shù)獲取磁盤的樣本磁盤數(shù)據(jù),其中,樣本磁盤數(shù)據(jù)包括多個(gè)維度上的樣本數(shù)據(jù);采用gbdt算法對(duì)樣本磁盤數(shù)據(jù)進(jìn)行樣本訓(xùn)練,得到由多個(gè)決策樹(shù)組成的磁盤預(yù)測(cè)模型方式,通過(guò)在接收到待測(cè)磁盤的磁盤數(shù)據(jù)之后,使用由多個(gè)決策樹(shù)組成的磁盤預(yù)測(cè)模型對(duì)待測(cè)磁盤的磁盤數(shù)據(jù)進(jìn)行處理,達(dá)到了確定待測(cè)磁盤是否為故障磁盤的目的,從而實(shí)現(xiàn)了預(yù)測(cè)磁盤故障狀態(tài)的技術(shù)效果,進(jìn)而解決了現(xiàn)有技術(shù)的硬盤故障預(yù)測(cè)系統(tǒng)中一些容易致使硬盤故障的因素不能被采集胡或量化導(dǎo)致的預(yù)測(cè)結(jié)果不準(zhǔn)確的技術(shù)問(wèn)題。

附圖說(shuō)明

此處所說(shuō)明的附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本發(fā)明的示意性實(shí)施例及其說(shuō)明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中:

圖1是根據(jù)本發(fā)明實(shí)施例的一種磁盤的故障預(yù)測(cè)方法的計(jì)算機(jī)終端的硬件結(jié)構(gòu)框圖;

圖2是根據(jù)本發(fā)明實(shí)施例的一種磁盤的故障預(yù)測(cè)方法的流程圖;

圖3是根據(jù)本發(fā)明實(shí)施例的一種使用gbdt算法對(duì)樣本磁盤數(shù)據(jù)進(jìn)行訓(xùn)練的示意圖;

圖4為根據(jù)本發(fā)明實(shí)施例的一種使用gbdt算法計(jì)算磁盤預(yù)測(cè)值的示意圖;

圖5是根據(jù)本發(fā)明實(shí)施例的一種可選的磁盤的故障預(yù)測(cè)方法的流程圖;

圖6是根據(jù)本發(fā)明實(shí)施例的一種磁盤的故障預(yù)測(cè)裝置的結(jié)構(gòu)示意圖;

圖7是根據(jù)本發(fā)明實(shí)施例的一種可選的磁盤的故障預(yù)測(cè)裝置的結(jié)構(gòu)示意圖;

圖8是根據(jù)本發(fā)明實(shí)施例的一種可選的磁盤的故障預(yù)測(cè)裝置的結(jié)構(gòu)示意圖;

圖9是根據(jù)本發(fā)明實(shí)施例的一種可選的磁盤的故障預(yù)測(cè)裝置的結(jié)構(gòu)示意圖;

圖10是根據(jù)本發(fā)明實(shí)施例的一種可選的磁盤的故障預(yù)測(cè)裝置的結(jié)構(gòu)示意圖;以及

圖11是根據(jù)本發(fā)明實(shí)施例的一種計(jì)算機(jī)終端的結(jié)構(gòu)框圖。

具體實(shí)施方式

為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分的實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本發(fā)明保護(hù)的范圍。

需要說(shuō)明的是,本發(fā)明的說(shuō)明書和權(quán)利要求書及上述附圖中的術(shù)語(yǔ)“第一”、“第二”等是用于區(qū)別類似的對(duì)象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本發(fā)明的實(shí)施例能夠以除了在這里圖示或描述的那些以外的順序?qū)嵤?。此外,術(shù)語(yǔ)“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過(guò)程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒(méi)有清楚地列出的或?qū)τ谶@些過(guò)程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。

實(shí)施例1

根據(jù)本發(fā)明實(shí)施例,還提供了一種磁盤的故障預(yù)測(cè)方法實(shí)施例,需要說(shuō)明的是,在附圖的流程圖示出的步驟可以在諸如一組計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。

本申請(qǐng)實(shí)施例一所提供的方法實(shí)施例可以在移動(dòng)終端、計(jì)算機(jī)終端或者類似的運(yùn)算裝置中執(zhí)行。以運(yùn)行在計(jì)算機(jī)終端上為例,圖1是根據(jù)本發(fā)明實(shí)施例的一種磁盤的故障預(yù)測(cè)方法的計(jì)算機(jī)終端的硬件結(jié)構(gòu)框圖。如圖1所示,計(jì)算機(jī)終端10可以包括一個(gè)或多個(gè)(圖中僅示出一個(gè))處理器102(處理器102可以包括但不限于微處理器mcu或可編程邏輯器件fpga等的處理裝置)、用于存儲(chǔ)數(shù)據(jù)的存儲(chǔ)器104、以及用于通信功能的傳輸模塊106。本領(lǐng)域普通技術(shù)人員可以理解,圖1所示的結(jié)構(gòu)僅為示意,其并不對(duì)上述電子裝置的結(jié)構(gòu)造成限定。例如,計(jì)算機(jī)終端10還可包括比圖1中所示更多或者更少的組件,或者具有與圖1所示不同的配置。

存儲(chǔ)器104可用于存儲(chǔ)應(yīng)用軟件的軟件程序以及模塊,如本發(fā)明實(shí)施例中的磁盤 的故障預(yù)測(cè)方法對(duì)應(yīng)的程序指令/模塊,處理器102通過(guò)運(yùn)行存儲(chǔ)在存儲(chǔ)器104內(nèi)的軟件程序以及模塊,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理,即實(shí)現(xiàn)上述的應(yīng)用程序的漏洞檢測(cè)方法。存儲(chǔ)器104可包括高速隨機(jī)存儲(chǔ)器,還可包括非易失性存儲(chǔ)器,如一個(gè)或者多個(gè)磁性存儲(chǔ)裝置、閃存、或者其他非易失性固態(tài)存儲(chǔ)器。在一些實(shí)例中,存儲(chǔ)器104可進(jìn)一步包括相對(duì)于處理器102遠(yuǎn)程設(shè)置的存儲(chǔ)器,這些遠(yuǎn)程存儲(chǔ)器可以通過(guò)網(wǎng)絡(luò)連接至計(jì)算機(jī)終端10。上述網(wǎng)絡(luò)的實(shí)例包括但不限于互聯(lián)網(wǎng)、企業(yè)內(nèi)部網(wǎng)、局域網(wǎng)、移動(dòng)通信網(wǎng)及其組合。

傳輸裝置106用于經(jīng)由一個(gè)網(wǎng)絡(luò)接收或者發(fā)送數(shù)據(jù)。上述的網(wǎng)絡(luò)具體實(shí)例可包括計(jì)算機(jī)終端10的通信供應(yīng)商提供的無(wú)線網(wǎng)絡(luò)。在一個(gè)實(shí)例中,傳輸裝置106包括一個(gè)網(wǎng)絡(luò)適配器(networkinterfacecontroller,nic),其可通過(guò)基站與其他網(wǎng)絡(luò)設(shè)備相連從而可與互聯(lián)網(wǎng)進(jìn)行通訊。在一個(gè)實(shí)例中,傳輸裝置106可以為射頻(radiofrequency,rf)模塊,其用于通過(guò)無(wú)線方式與互聯(lián)網(wǎng)進(jìn)行通訊。

在上述運(yùn)行環(huán)境下,本申請(qǐng)?zhí)峁┝巳鐖D2所示的一種磁盤的故障預(yù)測(cè)方法。圖2是根據(jù)本發(fā)明實(shí)施例的一種磁盤的故障預(yù)測(cè)方法的流程圖。

需要說(shuō)明的是,對(duì)于前述的各方法實(shí)施例,為了簡(jiǎn)單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本發(fā)明,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說(shuō)明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本發(fā)明所必須的。

通過(guò)以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到根據(jù)上述實(shí)施例的方法可借助軟件加必需的通用硬件平臺(tái)的方式來(lái)實(shí)現(xiàn),當(dāng)然也可以通過(guò)硬件,但很多情況下前者是更佳的實(shí)施方式。基于這樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說(shuō)對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)(如rom/ram、磁碟、光盤)中,包括若干指令用以使得一臺(tái)終端設(shè)備(可以是手機(jī),計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述的方法。

在上述運(yùn)行環(huán)境下,本申請(qǐng)?zhí)峁┝巳鐖D2所示的反編譯數(shù)據(jù)的處理方法。圖2是根據(jù)本發(fā)明實(shí)施例一的反編譯數(shù)據(jù)的處理方法的流程圖,如圖2所示,該方法包括:

步驟21,通過(guò)磁盤監(jiān)控技術(shù)獲取磁盤的樣本磁盤數(shù)據(jù),其中,所述樣本磁盤數(shù)據(jù)包括多個(gè)維度上的樣本數(shù)據(jù)。

在上述步驟中,磁盤監(jiān)控技術(shù)用于監(jiān)測(cè)磁盤出廠后的使用過(guò)程中產(chǎn)生的各項(xiàng)磁盤 數(shù)據(jù),以預(yù)測(cè)磁盤的故障狀態(tài),使得磁盤使用者能夠在磁盤發(fā)生故障之前便能知曉磁盤即將發(fā)生故障,從而對(duì)磁盤中的數(shù)據(jù)進(jìn)行拷貝存儲(chǔ),避免數(shù)據(jù)的丟失。

在一種可選的實(shí)施例中,上述樣本磁盤數(shù)據(jù)可以包括:底層數(shù)據(jù)讀取錯(cuò)誤率、啟動(dòng)/停止計(jì)數(shù)、重映射扇區(qū)數(shù)、通電時(shí)間累計(jì)、主軸起旋重試次數(shù)、磁盤校準(zhǔn)重試次數(shù)、磁盤通電次數(shù)、溫度以及寫錯(cuò)誤率,可以根據(jù)磁盤歷史故障情況獲取樣本磁盤數(shù)據(jù)。例如,可以按照正負(fù)樣本比例為1:5的比例進(jìn)行樣本獲取,其中,正樣本為存在故障的磁盤,負(fù)樣本為不存在故障的磁盤。

此處需要說(shuō)明的是,在通過(guò)磁盤監(jiān)控技術(shù)獲取磁盤的樣本磁盤數(shù)據(jù)時(shí),由于預(yù)測(cè)磁盤故障的各個(gè)機(jī)構(gòu)使用的磁盤并不一定相同,且由于各個(gè)機(jī)構(gòu)不同溫濕度等環(huán)境因素對(duì)磁盤的影響,使得不同機(jī)構(gòu)的磁盤的好壞比例并不相同,為了使樣本磁盤數(shù)據(jù)的訓(xùn)練提供更可靠的樣本磁盤數(shù)據(jù),還可以根據(jù)機(jī)構(gòu)的實(shí)際上磁盤損壞情況進(jìn)行獲取樣本磁盤數(shù)據(jù)。

步驟s23,采用gbdt算法對(duì)所述樣本磁盤數(shù)據(jù)進(jìn)行樣本訓(xùn)練,得到由多個(gè)決策樹(shù)組成的磁盤預(yù)測(cè)模型。

在上述步驟中,gbdt(gradientboostingdecisiontree)為一種迭代的決策樹(shù)算法,該算法由多棵決策樹(shù)組成,并通過(guò)對(duì)所有決策樹(shù)的結(jié)論進(jìn)行累加,得到最終結(jié)果。上述決策樹(shù)作為一種預(yù)測(cè)模型,是在上一層決策得到的結(jié)果的基礎(chǔ)上,進(jìn)行下一層決策,包括決策點(diǎn)、狀態(tài)結(jié)點(diǎn)、結(jié)果結(jié)點(diǎn)等參數(shù),樹(shù)中的每個(gè)節(jié)點(diǎn)表示被預(yù)測(cè)的對(duì)象,二每個(gè)分叉路徑則代表該對(duì)象可能的屬性。

在一種可選的實(shí)施例中,在上述樣本磁盤為磁盤的s.m.a.r.t的原始值的情況下,對(duì)樣本磁盤進(jìn)行樣本訓(xùn)練,例如,原始值大于等于預(yù)設(shè)原始值,可以認(rèn)為該樣本磁盤發(fā)生故障的概率較大,原始值小于預(yù)設(shè)值原始時(shí),可以認(rèn)為該樣本磁盤發(fā)生故障的概率較小,因此在確定磁盤預(yù)測(cè)模型時(shí),在樣本磁盤的原始值大于等于預(yù)設(shè)原始值的情況下,確認(rèn)該樣本磁盤的屬性為故障,在樣本磁盤的原始值小于預(yù)設(shè)原始值的情況下,確認(rèn)該樣本磁盤的屬性為非故障。建立具備上述決策能力的磁盤預(yù)測(cè)模型,即向決策樹(shù)輸入待檢測(cè)磁盤時(shí),若待檢測(cè)磁盤的原始值大于等于預(yù)設(shè)原始值,決策樹(shù)自動(dòng)確認(rèn)該待檢測(cè)磁盤為故障的情況下,確認(rèn)該樣本磁盤的屬性為故障,當(dāng)樣本磁盤的原始值小于預(yù)設(shè)原始值的情況下,確認(rèn)該樣本磁盤的屬性為非故障。

步驟s25,在接收到待測(cè)磁盤的磁盤數(shù)據(jù)之后,使用所述由多個(gè)決策樹(shù)組成的磁盤預(yù)測(cè)模型對(duì)所述待測(cè)磁盤的磁盤數(shù)據(jù)進(jìn)行處理,確定所述待測(cè)磁盤是否為故障磁盤。

在一種可選的實(shí)施例中,將樣本磁盤的多個(gè)維度的值作為決策樹(shù)的評(píng)價(jià)指標(biāo),得 到多個(gè)決策樹(shù),再由多個(gè)決策樹(shù)構(gòu)成一個(gè)磁盤預(yù)測(cè)模型,對(duì)待檢測(cè)磁盤進(jìn)行檢測(cè)。

此處值得注意的是,根據(jù)磁盤每一個(gè)維度得到的決策樹(shù)可能相同,可能不相同,因此在使用多個(gè)決策樹(shù)構(gòu)成磁盤預(yù)測(cè)模型時(shí),需要根據(jù)每個(gè)決策樹(shù)在評(píng)價(jià)體系中的重要性,來(lái)確認(rèn)每個(gè)決策樹(shù)的權(quán)重值,從而得到磁盤預(yù)測(cè)模型。

此處需要說(shuō)明的是,在通過(guò)磁盤監(jiān)控技術(shù)獲取磁盤的樣本磁盤數(shù)據(jù)時(shí),采用了磁盤檢測(cè)技術(shù),使得獲取樣本磁盤數(shù)據(jù)的過(guò)程更為簡(jiǎn)單,且獲取的數(shù)據(jù)更為全面,為樣本磁盤數(shù)據(jù)的訓(xùn)練提供了豐富的磁盤樣本數(shù)據(jù)。在上述步驟中,采用gbdt算法對(duì)所述樣本磁盤數(shù)據(jù)進(jìn)行樣本訓(xùn)練可以是分兩次或多次進(jìn)行訓(xùn)練,以提高與訓(xùn)練結(jié)果對(duì)應(yīng)的決策樹(shù)構(gòu)成的磁盤預(yù)測(cè)模型的準(zhǔn)確率和召回率。

由此,本申請(qǐng)?zhí)峁┑纳鲜鰧?shí)施例一的方案解決了現(xiàn)有技術(shù)的硬盤故障預(yù)測(cè)系統(tǒng)中一些容易致使硬盤故障的因素不能被采集或量化導(dǎo)致的預(yù)測(cè)結(jié)果不準(zhǔn)確的技術(shù)問(wèn)題。

根據(jù)本申請(qǐng)上述實(shí)施例,在一種優(yōu)選的方案中,所述樣本磁盤數(shù)據(jù)至少包括如下四個(gè)維度上的樣本數(shù)據(jù):原始值、標(biāo)準(zhǔn)值、最差值和累積值。

上述原始值為磁盤運(yùn)行時(shí)的當(dāng)前參數(shù);上述標(biāo)準(zhǔn)值為正常磁盤運(yùn)行時(shí)各項(xiàng)參數(shù)的數(shù)值;上述最差值為磁盤運(yùn)行時(shí),磁盤的各項(xiàng)檢測(cè)參數(shù)曾出現(xiàn)過(guò)與正常值偏差最大的非正常值;上述累計(jì)值為磁盤的各項(xiàng)檢測(cè)參數(shù)從磁盤使用至當(dāng)前時(shí)刻的累計(jì)結(jié)果。

在一種可選的實(shí)施例中,磁盤的各項(xiàng)參數(shù)可以是對(duì)磁盤的各項(xiàng)屬性進(jìn)行描述的信息,可以包括錯(cuò)誤讀取率、加電次數(shù)、重新分配扇區(qū)數(shù)、旋轉(zhuǎn)重試次數(shù)、磁盤校準(zhǔn)重試次數(shù)以及奇偶校驗(yàn)錯(cuò)誤率中的一項(xiàng)或多項(xiàng),也可以包括磁盤的其他屬性信息。

本申請(qǐng)上述步驟可以分別以上述四個(gè)維度上的樣本數(shù)據(jù)得到多個(gè)不同的決策樹(shù)。

在一種可選的實(shí)施例中,可以采用hdtune、crystaldiskinfo等軟件獲取樣本磁盤數(shù)據(jù)。

根據(jù)本申請(qǐng)上述實(shí)施例,在一種優(yōu)選的方案中,在通過(guò)磁盤監(jiān)控技術(shù)獲取磁盤的樣本磁盤數(shù)據(jù)之后,所述方法還包括:

步驟s211,對(duì)所述每個(gè)維度上的樣本數(shù)據(jù)進(jìn)行如下任意一種或多種運(yùn)算:差分運(yùn)算、平方運(yùn)算和分布求和運(yùn)算,使得任意一個(gè)維度上的樣本數(shù)據(jù)被擴(kuò)展出新的維度上的樣本數(shù)據(jù)。

在上述步驟中,對(duì)決策結(jié)果進(jìn)行進(jìn)一步運(yùn)算,可將決策樹(shù)根據(jù)運(yùn)算結(jié)果拓展出新的維度,得到這一維度上的樣本數(shù)據(jù)。

此處值得注意的時(shí),每個(gè)維度的樣本數(shù)據(jù)都可以進(jìn)行多種運(yùn)算以在這一維度的基礎(chǔ)上得到更多維度的樣本數(shù)據(jù),在有四個(gè)維度的基礎(chǔ)上,每個(gè)維度再分別進(jìn)行差分運(yùn)算、平方運(yùn)算和分布求和運(yùn)算,便能夠得到十六個(gè)維度的樣本數(shù)據(jù),且通過(guò)每個(gè)維度的樣本數(shù)據(jù)進(jìn)行決策的側(cè)重點(diǎn)均不同。

在一種可選的實(shí)施例中,仍以原始值這一維度的樣本數(shù)據(jù)為例,對(duì)原始值的樣本數(shù)據(jù)進(jìn)行差分運(yùn)算、平方運(yùn)算和分布求和運(yùn)算,由此得到新的四個(gè)維度的樣本數(shù)據(jù),采用新的四個(gè)維度的樣本數(shù)據(jù)最為決策指標(biāo)進(jìn)行訓(xùn)練,并得到新的四個(gè)決策樹(shù)。

根據(jù)本申請(qǐng)上述實(shí)施例,在一種優(yōu)選的方案中,采用gbdt算法對(duì)所述樣本磁盤數(shù)據(jù)進(jìn)行樣本訓(xùn)練,得到由多個(gè)決策樹(shù)組成的磁盤預(yù)測(cè)模型,包括:

步驟s231,以所有磁盤的樣本磁盤數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),并采用默認(rèn)值初始化所述訓(xùn)練數(shù)據(jù)的分類模型參數(shù)。

在上述步驟中,初始化訓(xùn)練數(shù)據(jù)的分類模型參數(shù)可以是預(yù)先設(shè)置上述決策樹(shù)的個(gè)數(shù)、每個(gè)決策樹(shù)的層數(shù),即對(duì)決策樹(shù)的屬性進(jìn)行初步設(shè)置。

步驟s233,提取所述訓(xùn)練數(shù)據(jù)中的多個(gè)特征數(shù)據(jù),將每個(gè)特征數(shù)據(jù)作為根節(jié)點(diǎn)在創(chuàng)建所述多個(gè)決策樹(shù),并將每個(gè)特征數(shù)據(jù)對(duì)應(yīng)的特征值作為對(duì)應(yīng)的決策樹(shù)的葉子節(jié)點(diǎn)。

步驟s235,計(jì)算當(dāng)前所有葉子節(jié)點(diǎn)的最優(yōu)劃分以及其增益,并以增益最大的葉子節(jié)點(diǎn)以及對(duì)應(yīng)的劃分點(diǎn)進(jìn)行分裂,使得將所述樣本磁盤數(shù)據(jù)劃分到子節(jié)點(diǎn)中。

在上述步驟中,增益可以是標(biāo)簽值的最小化均方差,即每個(gè)樣本的標(biāo)簽值與預(yù)測(cè)標(biāo)簽值做差后,求的差的平方,并計(jì)算所有差的平方的和,可以認(rèn)為被預(yù)測(cè)出錯(cuò)的樣本越多,均方差就越大,因此通過(guò)最小化均方差能夠找到最優(yōu)的分枝依據(jù)

上述決策樹(shù)可以是以每個(gè)特征數(shù)據(jù)作為根節(jié)點(diǎn)的二叉樹(shù),且每個(gè)特?cái)?shù)據(jù)對(duì)應(yīng)于一個(gè)特征值,該特征值為以該特征數(shù)據(jù)為根節(jié)點(diǎn)的決策樹(shù)的葉子節(jié)點(diǎn)。在確定決策樹(shù)的葉子節(jié)點(diǎn)后,對(duì)葉子節(jié)點(diǎn)在進(jìn)行下一步劃分,此處值得注意的是,當(dāng)對(duì)葉子節(jié)點(diǎn)進(jìn)行進(jìn)一步劃分時(shí),在多個(gè)葉子節(jié)點(diǎn)的增益不相同的情況下,劃分增益最大的葉子節(jié)點(diǎn),使所有樣本數(shù)據(jù)都能劃分至相應(yīng)的葉子節(jié)點(diǎn)中。

在一種可選的實(shí)施例中,以樣本磁盤為a、b、c和d四塊磁盤為例,其中,a磁盤和b磁盤為正常磁盤,c磁盤和d磁盤為損壞的磁盤,在這一示例中,將正常磁盤對(duì)應(yīng)于0,故障磁盤對(duì)應(yīng)于1,因此,a、b、c和d四塊磁盤分別對(duì)應(yīng)為0、0、1、1。獲取上述磁盤在第一維度上的特征值為a,使用gbdt算法對(duì)樣本磁盤數(shù)據(jù)進(jìn)行訓(xùn)練,圖3是根據(jù)本發(fā)明實(shí)施例的一種使用gbdt算法對(duì)樣本磁盤數(shù)據(jù)進(jìn)行訓(xùn)練的示意圖,結(jié) 合圖3所示,設(shè)置默認(rèn)初始值為0.5,即每個(gè)磁盤為故障磁盤的概率為0.5,第一維度的閥值為a0,將特征值大于a0的磁盤劃分為一個(gè)子節(jié)點(diǎn),將第一維度上的特征值小于等于a0的磁盤劃分為另一個(gè)子節(jié)點(diǎn),并設(shè)置兩個(gè)子節(jié)點(diǎn)的磁盤為故障磁盤的概率為0.5。

此處需要說(shuō)明的當(dāng)是,上述實(shí)施例為方便說(shuō)明,僅選用了四個(gè)樣本數(shù)據(jù)進(jìn)行說(shuō)明,因此只劃分得到兩個(gè)葉子節(jié)點(diǎn),在實(shí)際應(yīng)用中,根節(jié)點(diǎn)劃分為兩個(gè)葉子節(jié)點(diǎn)之后,仍可以繼續(xù)劃分,樣本數(shù)據(jù)量越大,劃分的層次就越多。

根據(jù)本申請(qǐng)上述實(shí)施例,在一種優(yōu)選的方案中,提取所述訓(xùn)練數(shù)據(jù)中的多個(gè)特征數(shù)據(jù),將每個(gè)特征數(shù)據(jù)作為根節(jié)點(diǎn)在創(chuàng)建所述多個(gè)決策樹(shù),并將每個(gè)特征數(shù)據(jù)對(duì)應(yīng)的特征值作為對(duì)應(yīng)的決策樹(shù)的葉子節(jié)點(diǎn),包括:

步驟s2331,讀取任意一個(gè)特征數(shù)據(jù)對(duì)應(yīng)的閾值。

步驟s2333,將所述任意一個(gè)特征數(shù)據(jù)的特征值與所述閾值進(jìn)行比較,并根據(jù)比較結(jié)果得到兩個(gè)分支的熵。

步驟s2335,根據(jù)所述兩個(gè)分支的熵確定兩個(gè)新節(jié)點(diǎn)作為所述任意一個(gè)特征數(shù)據(jù)的兩個(gè)葉子節(jié)點(diǎn)。

步驟s2337,采用上述步驟對(duì)每一個(gè)特征數(shù)據(jù)進(jìn)行處理,直到每個(gè)特征數(shù)據(jù)得到預(yù)定的兩個(gè)唯一的葉子節(jié)點(diǎn)。

在上述步驟中,窮舉每一個(gè)特征的每一個(gè)閾值,找到使得按照特征小于等于閾值,和特征大于閾值分成的兩個(gè)分枝的熵最小的特征和閾值,按照該標(biāo)準(zhǔn)分枝得到兩個(gè)新節(jié)點(diǎn),使用同樣方法繼續(xù)分枝直到所有樣本都被分入只有正常磁盤或只有故障磁盤的葉子節(jié)點(diǎn),或達(dá)到預(yù)設(shè)的終止條件,若最終葉子節(jié)點(diǎn)中不是只有正常磁盤或故障磁盤,則以該節(jié)點(diǎn)上所有樣本的平均標(biāo)簽值作為該葉子節(jié)點(diǎn)的預(yù)測(cè)標(biāo)簽值。

此處需要說(shuō)明的是,標(biāo)簽值即為該磁盤為故障磁盤的概率。

此處仍需要說(shuō)明的是,熵最小是指盡可能的使每個(gè)分枝中,正樣本和負(fù)樣本的比例遠(yuǎn)離1:1,熵最小的情況為該分枝上只有正樣本或負(fù)樣本,即該分支上只有正常的磁盤,或故障磁盤。

在一種可選的實(shí)施例中,在決策樹(shù)為回歸樹(shù)的示例中,每個(gè)節(jié)點(diǎn)都會(huì)得一個(gè)預(yù)測(cè)值,該預(yù)測(cè)值等于屬于該節(jié)點(diǎn)的所有標(biāo)簽值的平均值,對(duì)該節(jié)點(diǎn)進(jìn)行劃分時(shí),窮舉每一個(gè)特征的每個(gè)閾值,找最好的分割點(diǎn)進(jìn)行劃分,直到每個(gè)葉子節(jié)點(diǎn)上每個(gè)樣本的標(biāo)簽值都唯一或者達(dá)到預(yù)設(shè)的終止條件,若最終葉子節(jié)點(diǎn)上樣本的標(biāo)簽值不唯一,則以 該節(jié)點(diǎn)上所有樣本的平均標(biāo)簽值作為該葉子節(jié)點(diǎn)的預(yù)測(cè)標(biāo)簽值。

此處需要說(shuō)明的是,在上述實(shí)施例中,最優(yōu)的劃分標(biāo)準(zhǔn)不再是最小化熵,而是最小化均方差,即每個(gè)樣本的標(biāo)簽值與預(yù)測(cè)標(biāo)簽值做差后,求的差的平方,并計(jì)算所有差的平方的和,可以認(rèn)為被預(yù)測(cè)出錯(cuò)的樣本越多,均方差就越大,因此通過(guò)最小化均方差能夠找到最優(yōu)的分枝依據(jù)。

此處還需要說(shuō)明的是,在進(jìn)行劃分時(shí),使每個(gè)葉子節(jié)點(diǎn)上每個(gè)樣本的標(biāo)簽值都唯一是很難達(dá)到的,因此為了得到最接近真實(shí)情況的預(yù)測(cè)結(jié)果可以預(yù)設(shè)一個(gè)終止條件,該終止條件可以是葉子的上限。

根據(jù)本申請(qǐng)上述實(shí)施例,在一種優(yōu)選的方案中,在得到由多個(gè)決策樹(shù)組成的磁盤預(yù)測(cè)模型之后,所述方法還包括:對(duì)所述分類模型參數(shù)進(jìn)行調(diào)整,其中,在所述分類模型參數(shù)包括故障磁盤樣本和非故障磁盤樣本的情況下,如果要確定所述待測(cè)磁盤是否為故障磁盤,則將所述分類模型參數(shù)中的故障磁盤樣本的比例調(diào)高。

根據(jù)本申請(qǐng)上述實(shí)施例,在一種優(yōu)選的方案中,使用所述由多個(gè)決策樹(shù)組成的磁盤預(yù)測(cè)模型對(duì)所述待測(cè)磁盤的磁盤數(shù)據(jù)進(jìn)行處理,確定所述待測(cè)磁盤是否為故障磁盤,包括:

步驟s251,接收到所述待測(cè)磁盤的磁盤數(shù)據(jù)之后,對(duì)所述待測(cè)磁盤的磁盤數(shù)據(jù)賦予一個(gè)初始值。

步驟s253,根據(jù)所述待測(cè)磁盤的初始值遍歷每一個(gè)決策樹(shù),計(jì)算得到第一個(gè)決策樹(shù)所確定的預(yù)測(cè)結(jié)果和第一殘差,并將所述第一殘差賦值給所述初始值,得到更新后的初始值。

步驟s255,以所述更新后的初始值計(jì)算得到第二個(gè)決策樹(shù)所確定的預(yù)測(cè)結(jié)果和第二殘差,并所述第二殘差賦值所述更新后的初始值,以此遍歷所有的決策樹(shù),得到預(yù)測(cè)所述待測(cè)磁盤是否為故障磁盤的結(jié)果。

步驟s257,每一棵樹(shù)學(xué)的是之前所有樹(shù)結(jié)論和的殘差,這個(gè)殘差就是一個(gè)加預(yù)測(cè)值后能得真實(shí)值的累加量。

在一種可選的實(shí)施例中,仍以上述a,b,c,d四個(gè)磁盤為例,采用特征a可將a,b,c,d四個(gè)磁盤分為兩個(gè)部分,分別為a,b和c,d,每個(gè)部分用平均標(biāo)簽值作為預(yù)測(cè)值。此時(shí)計(jì)算殘差,其中殘差至為磁盤的預(yù)測(cè)值與磁盤的實(shí)際值的差,所以a的殘差就是1-0.5=0.5進(jìn)而得到a,b,c,d的殘差分別為0.5,-0.5,0.5,-0.5。然后結(jié)合圖4所示,圖4為根據(jù)本發(fā)明實(shí)施例的一種使用gbdt算法計(jì)算磁盤預(yù)測(cè)值的示意圖,使用 殘差替代a,b,c,d的原值,輸入至第二棵決策樹(shù)進(jìn)行訓(xùn)練,并根據(jù)與特征b的比對(duì)結(jié)果分為兩個(gè)葉子節(jié)點(diǎn),如果預(yù)測(cè)值和它們的殘差相等,則只需把第二棵樹(shù)的結(jié)論累加到第一棵樹(shù)上就能得到磁盤的實(shí)際值。第二棵樹(shù)僅有兩個(gè)值0.5和-0.5,因此直接分成兩個(gè)節(jié)點(diǎn)。此時(shí)所有人的殘差都是0,即每個(gè)人都得到了真實(shí)的預(yù)測(cè)值。

此處需要說(shuō)明的是,上述實(shí)施例以說(shuō)明為目的,因此只有兩顆決策樹(shù),在實(shí)際應(yīng)用中,根據(jù)樣本數(shù)據(jù)量可以獲得到個(gè)決策樹(shù),且預(yù)測(cè)值是指之前所有樹(shù)累加的和,由于此實(shí)施例中,這棵決策樹(shù)之前僅有一顆決策樹(shù),因此直接是0.5,如果還有奇特決策樹(shù),則需要都累加起來(lái)作為a的預(yù)測(cè)值。

圖5是根據(jù)本發(fā)明實(shí)施例的一種可選的磁盤的故障預(yù)測(cè)方法的流程圖,下面結(jié)合圖5詳細(xì)介紹本申請(qǐng)的一種優(yōu)選的實(shí)施例。

如圖5所示,提供了一種磁盤的故障預(yù)測(cè)方法,該方法可以包括如下步驟s51至步驟s57:

s51,獲取樣本磁盤的樣本數(shù)據(jù)。

具體的,在上述步驟中,可以通過(guò)hdtune、crystaldiskinfo等軟件獲取樣本磁盤數(shù)據(jù)。

s52,對(duì)樣本數(shù)據(jù)進(jìn)行差分運(yùn)算。

具體的,在上述步驟中,差分運(yùn)算指磁盤在某一時(shí)刻的特征數(shù)據(jù)與過(guò)該磁盤在24小時(shí)之前的特征數(shù)據(jù)做差運(yùn)算得到的值。

s53,對(duì)差分運(yùn)算得到的結(jié)果進(jìn)行分布求和和/或平方運(yùn)算。

s54,得到訓(xùn)練和預(yù)測(cè)數(shù)據(jù)。

s55,第一步訓(xùn)練和預(yù)測(cè),使召回率較大。

s56,第二步訓(xùn)練和預(yù)測(cè),平衡召回率和準(zhǔn)確率。

具體的,在上述步驟中,由于訓(xùn)練數(shù)據(jù)中負(fù)樣本占比很大,正樣本占比小,例如,當(dāng)二者比例為1000:1時(shí),如果用全部的訓(xùn)練數(shù)據(jù)做訓(xùn)練,能準(zhǔn)確預(yù)測(cè)的正樣本是很少的,由于訓(xùn)練數(shù)據(jù)中正樣本較少,很多真實(shí)值為負(fù)樣本的數(shù)據(jù)可能被誤判為正樣本,因此第一步在訓(xùn)練時(shí)使正樣本的召回率較大,第二步在訓(xùn)練時(shí),把第一步預(yù)測(cè)為正樣本的訓(xùn)練數(shù)據(jù)作為第二步的訓(xùn)練數(shù)據(jù),即選擇為與正樣本接近的那些樣本作為訓(xùn)練樣本,如此在做訓(xùn)練時(shí),訓(xùn)練出的模型會(huì)更有利于預(yù)測(cè)出正樣本,這樣第二步預(yù)測(cè)得到的結(jié)果,正樣本的準(zhǔn)確率會(huì)比第一步有大幅度提高,從而使準(zhǔn)確率和召回率達(dá)到一定 的平衡程度。

實(shí)施例2

根據(jù)本發(fā)明實(shí)施例,還提供了一種用于實(shí)施上述反編譯數(shù)據(jù)的處理方法的反編譯數(shù)據(jù)的處理裝置,圖6是根據(jù)本發(fā)明實(shí)施例的一種磁盤的故障預(yù)測(cè)裝置的結(jié)構(gòu)示意圖,如圖6所示,該裝置包括:獲取模塊60,訓(xùn)練模塊62和處理模塊64。

獲取模塊60,用于通過(guò)磁盤監(jiān)控技術(shù)獲取磁盤的樣本磁盤數(shù)據(jù),其中,所述樣本磁盤數(shù)據(jù)包括多個(gè)維度上的樣本數(shù)據(jù);

訓(xùn)練模塊62,用于采用gbdt算法對(duì)所述樣本磁盤數(shù)據(jù)進(jìn)行樣本訓(xùn)練,得到由多個(gè)決策樹(shù)組成的磁盤預(yù)測(cè)模型;

處理模塊64,在接收到待測(cè)磁盤的磁盤數(shù)據(jù)之后,使用所述由多個(gè)決策樹(shù)組成的磁盤預(yù)測(cè)模型對(duì)所述待測(cè)磁盤的磁盤數(shù)據(jù)進(jìn)行處理,確定所述待測(cè)磁盤是否為故障磁盤。

此處需要說(shuō)明的是,上述獲取模塊60,訓(xùn)練模塊62和處理模塊64對(duì)應(yīng)于實(shí)施例一種的步驟s21至步驟s25所實(shí)現(xiàn)的實(shí)例和應(yīng)用場(chǎng)景相同,但不限于上述實(shí)施例一所公開(kāi)的內(nèi)容。需要說(shuō)明的是,上述模塊作為裝置的一部分可以運(yùn)行在實(shí)施例一提供的計(jì)算機(jī)終端10中。

根據(jù)本申請(qǐng)上述實(shí)施例,在一種優(yōu)選的方案中,所述樣本磁盤數(shù)據(jù)為smart磁盤數(shù)據(jù),其中,所述樣本磁盤數(shù)據(jù)至少包括如下四個(gè)維度上的樣本數(shù)據(jù):原始值、標(biāo)準(zhǔn)值、最差值和累積值。

根據(jù)本申請(qǐng)上述實(shí)施例,在一種優(yōu)選的方案中,結(jié)合圖7所示,上述裝置還包括:

運(yùn)算模塊70,用于對(duì)所述每個(gè)維度上的樣本數(shù)據(jù)進(jìn)行如下任意一種或多種運(yùn)算:差分運(yùn)算、平方運(yùn)算和分布求和運(yùn)算,使得任意一個(gè)維度上的樣本數(shù)據(jù)被擴(kuò)展出新的維度上的樣本數(shù)據(jù)。

此處需要說(shuō)明的是,上述運(yùn)算模塊770對(duì)應(yīng)與實(shí)施例一中的步驟s21至步驟s25所實(shí)現(xiàn)的實(shí)例和應(yīng)用場(chǎng)景相同,但不限于上述實(shí)施例一所公開(kāi)的內(nèi)容。需要說(shuō)明的是,上述模塊作為裝置的一部分可以運(yùn)行在實(shí)施例一提供的計(jì)算機(jī)終端10中。

根據(jù)本申請(qǐng)上述實(shí)施例,在一種優(yōu)選的方案中,結(jié)合圖8所示,上述訓(xùn)練模塊62還包括:

初始模塊80,用于以所有磁盤的樣本磁盤數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),并采用默認(rèn)值初始 化所述訓(xùn)練數(shù)據(jù)的分類模型參數(shù);

提取模塊82,用于提取所述訓(xùn)練數(shù)據(jù)中的多個(gè)特征數(shù)據(jù),將每個(gè)特征數(shù)據(jù)作為根節(jié)點(diǎn)在創(chuàng)建所述多個(gè)決策樹(shù),并將每個(gè)特征數(shù)據(jù)對(duì)應(yīng)的特征值作為對(duì)應(yīng)的決策樹(shù)的葉子節(jié)點(diǎn);

第一計(jì)算模塊84,用于計(jì)算當(dāng)前所有葉子節(jié)點(diǎn)的最優(yōu)劃分以及其增益,并以增益最大的葉子節(jié)點(diǎn)以及對(duì)應(yīng)的劃分點(diǎn)進(jìn)行分裂,使得將所述樣本磁盤數(shù)據(jù)劃分到子節(jié)點(diǎn)中。

此處需要說(shuō)明的是,上述初始模塊80,提取模塊82和第一計(jì)算模塊84對(duì)應(yīng)于實(shí)施例一種的步驟s231至步驟s235所實(shí)現(xiàn)的實(shí)例和應(yīng)用場(chǎng)景相同,但不限于上述實(shí)施例一所公開(kāi)的內(nèi)容。需要說(shuō)明的是,上述模塊作為裝置的一部分可以運(yùn)行在實(shí)施例一提供的計(jì)算機(jī)終端10中。

根據(jù)本申請(qǐng)上述實(shí)施例,在一種優(yōu)選的方案中,結(jié)合圖9所示,所述提取模塊82包括:

讀取模塊90,用于讀取任意一個(gè)特征數(shù)據(jù)對(duì)應(yīng)的閾值;

比較模塊92,用于將所述任意一個(gè)特征數(shù)據(jù)的特征值與所述閾值進(jìn)行比較,并根據(jù)比較結(jié)果得到兩個(gè)分支的熵;

確定模塊94,用于根據(jù)所述兩個(gè)分支的熵確定兩個(gè)新節(jié)點(diǎn)作為所述任意一個(gè)特征數(shù)據(jù)的兩個(gè)葉子節(jié)點(diǎn);

處理子模塊96,用于采用上述步驟對(duì)每一個(gè)特征數(shù)據(jù)進(jìn)行處理,直到每個(gè)特征數(shù)據(jù)得到預(yù)定的兩個(gè)唯一的葉子節(jié)點(diǎn)。

此處需要說(shuō)明的是,上述讀取模塊90,比較模塊92、確定模塊94和處理子模塊96對(duì)應(yīng)于實(shí)施例一種的步驟s2331至步驟s2337所實(shí)現(xiàn)的實(shí)例和應(yīng)用場(chǎng)景相同,但不限于上述實(shí)施例一所公開(kāi)的內(nèi)容。需要說(shuō)明的是,上述模塊作為裝置的一部分可以運(yùn)行在實(shí)施例一提供的計(jì)算機(jī)終端10中。

根據(jù)本申請(qǐng)上述實(shí)施例,在一種優(yōu)選的方案中,在得到由多個(gè)決策樹(shù)組成的磁盤預(yù)測(cè)模型之后,所述方法還包括:對(duì)所述分類模型參數(shù)進(jìn)行調(diào)整,其中,在所述分類模型參數(shù)包括故障磁盤樣本和非故障磁盤樣本的情況下,如果要確定所述待測(cè)磁盤是否為故障磁盤,則將所述分類模型參數(shù)中的故障磁盤樣本的比例調(diào)高。

根據(jù)本申請(qǐng)上述實(shí)施例,在一種優(yōu)選的方案中,結(jié)合圖10所示,上述處理模塊 64包括:

接收模塊100,用于接收到所述待測(cè)磁盤的磁盤數(shù)據(jù)之后,對(duì)所述待測(cè)磁盤的磁盤數(shù)據(jù)賦予一個(gè)初始值;

第二計(jì)算模塊102,用于根據(jù)所述待測(cè)磁盤的初始值遍歷每一個(gè)決策樹(shù),計(jì)算得到第一個(gè)決策樹(shù)所確定的預(yù)測(cè)結(jié)果和第一殘差,并將所述第一殘差賦值給所述初始值,得到更新后的初始值;

遍歷模塊104,用于以所述更新后的初始值計(jì)算得到第二個(gè)決策樹(shù)所確定的預(yù)測(cè)結(jié)果和第二殘差,并所述第二殘差賦值所述更新后的初始值,以此遍歷所有的決策樹(shù),得到預(yù)測(cè)所述待測(cè)磁盤是否為故障磁盤的結(jié)果。

此處需要說(shuō)明的是,上述接收模塊100,第二計(jì)算模塊102和遍歷模塊104對(duì)應(yīng)于實(shí)施例一種的步驟s251至步驟s255所實(shí)現(xiàn)的實(shí)例和應(yīng)用場(chǎng)景相同,但不限于上述實(shí)施例一所公開(kāi)的內(nèi)容。需要說(shuō)明的是,上述模塊作為裝置的一部分可以運(yùn)行在實(shí)施例一提供的計(jì)算機(jī)終端10中。

實(shí)施例3

本發(fā)明的實(shí)施例可以提供一種計(jì)算機(jī)終端,該計(jì)算機(jī)終端可以是計(jì)算機(jī)終端群中的任意一個(gè)計(jì)算機(jī)終端設(shè)備??蛇x地,在本實(shí)施例中,上述計(jì)算機(jī)終端也可以替換為移動(dòng)終端等終端設(shè)備。

可選地,在本實(shí)施例中,上述計(jì)算機(jī)終端可以位于計(jì)算機(jī)網(wǎng)絡(luò)的多個(gè)網(wǎng)絡(luò)設(shè)備中的至少一個(gè)網(wǎng)絡(luò)設(shè)備。

在本實(shí)施例中,上述計(jì)算機(jī)終端可以執(zhí)行磁盤的故障預(yù)測(cè)方法中以下步驟的程序代碼:通過(guò)磁盤監(jiān)控技術(shù)獲取磁盤的樣本磁盤數(shù)據(jù),其中,樣本磁盤數(shù)據(jù)包括多個(gè)維度上的樣本數(shù)據(jù);采用gbdt算法對(duì)樣本磁盤數(shù)據(jù)進(jìn)行樣本訓(xùn)練,得到由多個(gè)決策樹(shù)組成的磁盤預(yù)測(cè)模型;在接收到待測(cè)磁盤的磁盤數(shù)據(jù)之后,使用由多個(gè)決策樹(shù)組成的磁盤預(yù)測(cè)模型對(duì)待測(cè)磁盤的磁盤數(shù)據(jù)進(jìn)行處理,確定待測(cè)磁盤是否為故障磁盤。

可選地,圖11是根據(jù)本發(fā)明實(shí)施例的一種計(jì)算機(jī)終端的結(jié)構(gòu)框圖。如圖11所示,該計(jì)算機(jī)終端a可以包括:一個(gè)或多個(gè)(圖中僅示出一個(gè))處理器111、存儲(chǔ)器113、以及傳輸裝置115。

其中,存儲(chǔ)器可用于存儲(chǔ)軟件程序以及模塊,如本發(fā)明實(shí)施例中的磁盤的故障預(yù)測(cè)方法和裝置對(duì)應(yīng)的程序指令/模塊,處理器通過(guò)運(yùn)行存儲(chǔ)在存儲(chǔ)器內(nèi)的軟件程序以及模塊,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理,即實(shí)現(xiàn)上述的磁盤的故障預(yù)測(cè)方法。存 儲(chǔ)器可包括高速隨機(jī)存儲(chǔ)器,還可以包括非易失性存儲(chǔ)器,如一個(gè)或者多個(gè)磁性存儲(chǔ)裝置、閃存、或者其他非易失性固態(tài)存儲(chǔ)器。在一些實(shí)例中,存儲(chǔ)器可進(jìn)一步包括相對(duì)于處理器遠(yuǎn)程設(shè)置的存儲(chǔ)器,這些遠(yuǎn)程存儲(chǔ)器可以通過(guò)網(wǎng)絡(luò)連接至終端a。上述網(wǎng)絡(luò)的實(shí)例包括但不限于互聯(lián)網(wǎng)、企業(yè)內(nèi)部網(wǎng)、局域網(wǎng)、移動(dòng)通信網(wǎng)及其組合。

處理器可以通過(guò)傳輸裝置調(diào)用存儲(chǔ)器存儲(chǔ)的信息及應(yīng)用程序,以執(zhí)行下述步驟:樣本磁盤數(shù)據(jù)為smart磁盤數(shù)據(jù),其中,樣本磁盤數(shù)據(jù)至少包括如下四個(gè)維度上的樣本數(shù)據(jù):原始值、標(biāo)準(zhǔn)值、最差值和累積值。

可選的,上述處理器還可以執(zhí)行如下步驟的程序代碼:對(duì)每個(gè)維度上的樣本數(shù)據(jù)進(jìn)行如下任意一種或多種運(yùn)算:差分運(yùn)算、平方運(yùn)算和分布求和運(yùn)算,使得任意一個(gè)維度上的樣本數(shù)據(jù)被擴(kuò)展出新的維度上的樣本數(shù)據(jù)。

可選的,上述處理器還可以執(zhí)行如下步驟的程序代碼:以所有磁盤的樣本磁盤數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),并采用默認(rèn)值初始化訓(xùn)練數(shù)據(jù)的分類模型參數(shù);提取訓(xùn)練數(shù)據(jù)中的多個(gè)特征數(shù)據(jù),將每個(gè)特征數(shù)據(jù)作為根節(jié)點(diǎn)在創(chuàng)建多個(gè)決策樹(shù),并將每個(gè)特征數(shù)據(jù)對(duì)應(yīng)的特征值作為對(duì)應(yīng)的決策樹(shù)的葉子節(jié)點(diǎn);計(jì)算當(dāng)前所有葉子節(jié)點(diǎn)的最優(yōu)劃分以及其增益,并以增益最大的葉子節(jié)點(diǎn)以及對(duì)應(yīng)的劃分點(diǎn)進(jìn)行分裂,使得將樣本磁盤數(shù)據(jù)劃分到子節(jié)點(diǎn)中。

可選的,上述處理器還可以執(zhí)行如下步驟的程序代碼:讀取任意一個(gè)特征數(shù)據(jù)對(duì)應(yīng)的閾值;將任意一個(gè)特征數(shù)據(jù)的特征值與閾值進(jìn)行比較,并根據(jù)比較結(jié)果得到兩個(gè)分支的熵;根據(jù)兩個(gè)分支的熵確定兩個(gè)新節(jié)點(diǎn)作為任意一個(gè)特征數(shù)據(jù)的兩個(gè)葉子節(jié)點(diǎn);采用上述步驟對(duì)每一個(gè)特征數(shù)據(jù)進(jìn)行處理,直到每個(gè)特征數(shù)據(jù)得到預(yù)定的兩個(gè)唯一的葉子節(jié)點(diǎn)。

可選的,上述處理器還可以執(zhí)行如下步驟的程序代碼:在得到由多個(gè)決策樹(shù)組成的磁盤預(yù)測(cè)模型之后,方法還包括:對(duì)分類模型參數(shù)進(jìn)行調(diào)整,其中,在分類模型參數(shù)包括故障磁盤樣本和非故障磁盤樣本的情況下,如果要確定待測(cè)磁盤是否為故障磁盤,則將分類模型參數(shù)中的故障磁盤樣本的比例調(diào)高。

可選的,上述處理器還可以執(zhí)行如下步驟的程序代碼:接收到待測(cè)磁盤的磁盤數(shù)據(jù)之后,對(duì)待測(cè)磁盤的磁盤數(shù)據(jù)賦予一個(gè)初始值;根據(jù)待測(cè)磁盤的初始值遍歷每一個(gè)決策樹(shù),計(jì)算得到第一個(gè)決策樹(shù)所確定的預(yù)測(cè)結(jié)果和第一殘差,并將第一殘差賦值給初始值,得到更新后的初始值;以更新后的初始值計(jì)算得到第二個(gè)決策樹(shù)所確定的預(yù)測(cè)結(jié)果和第二殘差,并第二殘差賦值更新后的初始值,以此遍歷所有的決策樹(shù),得到預(yù)測(cè)待測(cè)磁盤是否為故障磁盤的結(jié)果。

在本發(fā)明實(shí)施例中,采用通過(guò)磁盤監(jiān)控技術(shù)獲取磁盤的樣本磁盤數(shù)據(jù),其中,樣本磁盤數(shù)據(jù)包括多個(gè)維度上的樣本數(shù)據(jù);采用gbdt算法對(duì)樣本磁盤數(shù)據(jù)進(jìn)行樣本訓(xùn)練,得到由多個(gè)決策樹(shù)組成的磁盤預(yù)測(cè)模型方式,通過(guò)在接收到待測(cè)磁盤的磁盤數(shù)據(jù)之后,使用由多個(gè)決策樹(shù)組成的磁盤預(yù)測(cè)模型對(duì)待測(cè)磁盤的磁盤數(shù)據(jù)進(jìn)行處理,達(dá)到了確定待測(cè)磁盤是否為故障磁盤的目的,從而實(shí)現(xiàn)了預(yù)測(cè)磁盤故障狀態(tài)的技術(shù)效果,進(jìn)而解決了現(xiàn)有技術(shù)的硬盤故障預(yù)測(cè)系統(tǒng)中一些容易致使硬盤故障的因素不能被采集胡或量化導(dǎo)致的預(yù)測(cè)結(jié)果不準(zhǔn)確的技術(shù)問(wèn)題。

本領(lǐng)域普通技術(shù)人員可以理解,圖11所示的結(jié)構(gòu)僅為示意,計(jì)算機(jī)終端也可以是智能手機(jī)(如android手機(jī)、ios手機(jī)等)、平板電腦、掌聲電腦以及移動(dòng)互聯(lián)網(wǎng)設(shè)備(mobileinternetdevices,mid)、pad等終端設(shè)備。圖11其并不對(duì)上述電子裝置的結(jié)構(gòu)造成限定。例如,計(jì)算機(jī)終端a還可包括比圖11中所示更多或者更少的組件(如網(wǎng)絡(luò)接口、顯示裝置等),或者具有與圖11所示不同的配置。

本領(lǐng)域普通技術(shù)人員可以理解上述實(shí)施例的各種方法中的全部或部分步驟是可以通過(guò)程序來(lái)指令終端設(shè)備相關(guān)的硬件來(lái)完成,該程序可以存儲(chǔ)于一計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,存儲(chǔ)介質(zhì)可以包括:閃存盤、只讀存儲(chǔ)器(read-onlymemory,rom)、隨機(jī)存取器(randomaccessmemory,ram)、磁盤或光盤等。

實(shí)施例4

本發(fā)明的實(shí)施例還提供了一種存儲(chǔ)介質(zhì)??蛇x地,在本實(shí)施例中,上述存儲(chǔ)介質(zhì)可以用于保存上述實(shí)施例一所提供的磁盤的故障預(yù)測(cè)方法所執(zhí)行的程序代碼。

可選地,在本實(shí)施例中,上述存儲(chǔ)介質(zhì)可以位于計(jì)算機(jī)網(wǎng)絡(luò)中計(jì)算機(jī)終端群中的任意一個(gè)計(jì)算機(jī)終端中,或者位于移動(dòng)終端群中的任意一個(gè)移動(dòng)終端中。

可選地,在本實(shí)施例中,存儲(chǔ)介質(zhì)被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼:通過(guò)磁盤監(jiān)控技術(shù)獲取磁盤的樣本磁盤數(shù)據(jù),其中,樣本磁盤數(shù)據(jù)包括多個(gè)維度上的樣本數(shù)據(jù);采用gbdt算法對(duì)樣本磁盤數(shù)據(jù)進(jìn)行樣本訓(xùn)練,得到由多個(gè)決策樹(shù)組成的磁盤預(yù)測(cè)模型;在接收到待測(cè)磁盤的磁盤數(shù)據(jù)之后,使用由多個(gè)決策樹(shù)組成的磁盤預(yù)測(cè)模型對(duì)待測(cè)磁盤的磁盤數(shù)據(jù)進(jìn)行處理,確定待測(cè)磁盤是否為故障磁盤。

可選地,上述存儲(chǔ)介質(zhì)還被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼:對(duì)每個(gè)維度上的樣本數(shù)據(jù)進(jìn)行如下任意一種或多種運(yùn)算:差分運(yùn)算、平方運(yùn)算和分布求和運(yùn)算,使得任意一個(gè)維度上的樣本數(shù)據(jù)被擴(kuò)展出新的維度上的樣本數(shù)據(jù)。

可選地,上述存儲(chǔ)介質(zhì)還被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼:以所有磁盤的樣本磁盤數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),并采用默認(rèn)值初始化訓(xùn)練數(shù)據(jù)的分類模型參數(shù);提 取訓(xùn)練數(shù)據(jù)中的多個(gè)特征數(shù)據(jù),將每個(gè)特征數(shù)據(jù)作為根節(jié)點(diǎn)在創(chuàng)建多個(gè)決策樹(shù),并將每個(gè)特征數(shù)據(jù)對(duì)應(yīng)的特征值作為對(duì)應(yīng)的決策樹(shù)的葉子節(jié)點(diǎn);計(jì)算當(dāng)前所有葉子節(jié)點(diǎn)的最優(yōu)劃分以及其增益,并以增益最大的葉子節(jié)點(diǎn)以及對(duì)應(yīng)的劃分點(diǎn)進(jìn)行分裂,使得將樣本磁盤數(shù)據(jù)劃分到子節(jié)點(diǎn)中。

可選地,上述存儲(chǔ)介質(zhì)還被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼:讀取任意一個(gè)特征數(shù)據(jù)對(duì)應(yīng)的閾值;將任意一個(gè)特征數(shù)據(jù)的特征值與閾值進(jìn)行比較,并根據(jù)比較結(jié)果得到兩個(gè)分支的熵;根據(jù)兩個(gè)分支的熵確定兩個(gè)新節(jié)點(diǎn)作為任意一個(gè)特征數(shù)據(jù)的兩個(gè)葉子節(jié)點(diǎn);采用上述步驟對(duì)每一個(gè)特征數(shù)據(jù)進(jìn)行處理,直到每個(gè)特征數(shù)據(jù)得到預(yù)定的兩個(gè)唯一的葉子節(jié)點(diǎn)。

可選地,上述存儲(chǔ)介質(zhì)還被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼:在得到由多個(gè)決策樹(shù)組成的磁盤預(yù)測(cè)模型之后,方法還包括:對(duì)分類模型參數(shù)進(jìn)行調(diào)整,其中,在分類模型參數(shù)包括故障磁盤樣本和非故障磁盤樣本的情況下,如果要確定待測(cè)磁盤是否為故障磁盤,則將分類模型參數(shù)中的故障磁盤樣本的比例調(diào)高。

可選地,上述存儲(chǔ)介質(zhì)還被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼:接收到待測(cè)磁盤的磁盤數(shù)據(jù)之后,對(duì)待測(cè)磁盤的磁盤數(shù)據(jù)賦予一個(gè)初始值;根據(jù)待測(cè)磁盤的初始值遍歷每一個(gè)決策樹(shù),計(jì)算得到第一個(gè)決策樹(shù)所確定的預(yù)測(cè)結(jié)果和第一殘差,并將第一殘差賦值給初始值,得到更新后的初始值;以更新后的初始值計(jì)算得到第二個(gè)決策樹(shù)所確定的預(yù)測(cè)結(jié)果和第二殘差,并第二殘差賦值更新后的初始值,以此遍歷所有的決策樹(shù),得到預(yù)測(cè)待測(cè)磁盤是否為故障磁盤的結(jié)果。

上述本發(fā)明實(shí)施例序號(hào)僅僅為了描述,不代表實(shí)施例的優(yōu)劣。

在本發(fā)明的上述實(shí)施例中,對(duì)各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒(méi)有詳述的部分,可以參見(jiàn)其他實(shí)施例的相關(guān)描述。

在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的技術(shù)內(nèi)容,可通過(guò)其它的方式實(shí)現(xiàn)。其中,以上所描述的裝置實(shí)施例僅僅是示意性的,例如所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過(guò)一些接口,單元或模塊的間接耦合或通信連接,可以是電性或其它的形式。

所述作為分離部件說(shuō)明的單元可以是或者也可以不是物理上分開(kāi)的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來(lái)實(shí)現(xiàn)本實(shí)施例 方案的目的。

另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。

所述集成的單元如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說(shuō)對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可為個(gè)人計(jì)算機(jī)、服務(wù)器或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:u盤、只讀存儲(chǔ)器(rom,read-onlymemory)、隨機(jī)存取存儲(chǔ)器(ram,randomaccessmemory)、移動(dòng)硬盤、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。

以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為本發(fā)明的保護(hù)范圍。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
绥江县| 安义县| 太白县| 崇阳县| 巴东县| 台前县| 兰坪| 聂拉木县| 连江县| 博白县| 青州市| 凤山市| 宜川县| 台南市| 格尔木市| 浪卡子县| 武邑县| 黄骅市| 越西县| 承德市| 黄平县| 康乐县| 枣庄市| 衡阳县| 东乡族自治县| 开封县| 广昌县| 长子县| 武邑县| 汝阳县| 磐石市| 白朗县| 阳春市| 高碑店市| 丰都县| 石泉县| 西贡区| 新绛县| 交口县| 德庆县| 海林市|