專利名稱:一種集群存儲系統(tǒng)及其數(shù)據(jù)存儲方法
技術領域:
本發(fā)明涉及集群存儲系統(tǒng),特別涉及一種集群存儲系統(tǒng)及其數(shù)據(jù)存儲方法。
背景技術:
目前,不少企事業(yè)單位所采用的傳統(tǒng)HA架構存在一定缺陷,比如兩臺小型機搭配一個磁盤陣列,組成一套集群系統(tǒng),所有的信息數(shù)據(jù)都存儲在這臺磁盤陣列上,存儲只有一份,一旦此磁盤陣列發(fā)生問題,就面臨整個業(yè)務系統(tǒng)停頓的危險,而采用分布式存儲,雖然可以保證備份,但是磁盤利用率低下,且受成本限制容量受到限制??梢?,要實現(xiàn)業(yè)務的高可用,必須先保證存儲高可用;或者說,缺少高可用性存儲的業(yè)務系統(tǒng),不能實現(xiàn)真正的高可用性。針對這種情況,我們提出了存儲高可用解決方案。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術問題是,如何提高集群系統(tǒng)的容災性。因此,提供一種集群存儲系統(tǒng)及其數(shù)據(jù)存儲方法。為了解決上述問題,本發(fā)明公開了一種集群存儲系統(tǒng),包括共享存儲設備,位于元節(jié)點的數(shù)據(jù)分級服務器和DRBD,其中所述數(shù)據(jù)分級服務器,確定所述共享存儲設備中各文件的優(yōu)先值,并將優(yōu)先值大于設定值的文件的數(shù)據(jù)上傳到所述DRBD ;所述DRBD,接收所述數(shù)據(jù)分級服務器上傳的文件的數(shù)據(jù)并存儲。較佳地,上述系統(tǒng)中,所述數(shù)據(jù)分級服務器確定所述共享存儲設備中各文件的優(yōu)先值指所述數(shù)據(jù)分級服務器將所述共享存儲設備中文件的參數(shù)值的總和作為該文件的優(yōu)先值,其中,文件的參數(shù)值包括如下一種或幾種文件數(shù)據(jù)的大小值、文件數(shù)據(jù)的讀取頻率值、文件數(shù)據(jù)的修改頻率值、文件對應的用戶的等級值?;蛘?,上述系統(tǒng)中,所述數(shù)據(jù)分級服務器確定所述共享存儲設備中各文件的優(yōu)先值指所述數(shù)據(jù)分級服務器為所述共享存儲設備中文件的參數(shù)值分別確定一權值,將各參數(shù)值與其對應的權值的乘積作為優(yōu)先值計算參數(shù),并將所有優(yōu)先值計算參數(shù)的總和作為該文件的優(yōu)先值,其中,文件的參數(shù)值包括如下一種或幾種文件數(shù)據(jù)的大小值、文件數(shù)據(jù)的讀取頻率值、文件數(shù)據(jù)的修改頻率值、文件對應的用戶的等級值。較佳地,上述集群存儲系統(tǒng)中至少兩個元節(jié)點上具有數(shù)據(jù)分級服務器和DRBD。本發(fā)明還公開了一種如上所述的集群存儲系統(tǒng)的數(shù)據(jù)存儲方法,包括所述集群存儲系統(tǒng),確定共享存儲設備中各文件的優(yōu)先值,僅將優(yōu)先值大于設定值的文件的數(shù)據(jù)存儲到分布式復制塊設備(DRBD)中。
較佳地,上述方法中,所述集群存儲系統(tǒng)確定所述共享存儲設備中各文件的優(yōu)先值指所述集群存儲系統(tǒng)將所述共享存儲設備中文件的參數(shù)值的總和作為該文件的優(yōu)先值,其中,文件的參數(shù)值包括如下一種或幾種文件數(shù)據(jù)的大小值、文件數(shù)據(jù)的讀取頻率值、文件數(shù)據(jù)的修改頻率值、文件對應的用戶的等級值?;蛘?,上述方法中,所述集群存儲系統(tǒng)確定所述共享存儲設備中各文件的優(yōu)先值指所述集群存儲系統(tǒng)為所述共享存儲設備中文件的參數(shù)值分別確定一權值,將各參數(shù)值與其對應的權值的乘積作為優(yōu)先值計算參數(shù),并將所有優(yōu)先值計算參數(shù)的總和作為該文件的優(yōu)先值,其中,文件的參數(shù)值包括如下一種或幾種文件數(shù)據(jù)的大小值、文件數(shù)據(jù)的讀取頻率值、文件數(shù)據(jù)的修改頻率值、文件對應的用戶的等級值。較佳地,上述集群存儲系統(tǒng)中至少兩個元節(jié)點上具有DRBD。本發(fā)明實施例采用混合存儲架構兼顧集中式存儲低沉本大容量的優(yōu)勢和分布式存儲高可靠性的優(yōu)點,同時構建數(shù)據(jù)提取模型分類安放數(shù)據(jù),便于數(shù)據(jù)管理,提高整個集群的容災性,為電子信息系統(tǒng)的安全運行提供了有效保障。
圖1為本實施例1中集群存儲系統(tǒng)結(jié)構示意圖。
具體實施例方式下面結(jié)合附圖及具體實施例對本發(fā)明技術方案做進一步詳細說明。需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互任意組合。目前,集群存儲系統(tǒng)中有兩種廣泛采用的存儲方式。其一是集中式存儲方式,采用該方式,存儲器成為單一失效節(jié)點。其二是分布式存儲方式,采用該方式,存儲器磁盤利用率太低,并且數(shù)據(jù)安放策略單一,不能進行有效管理?;诖耍景l(fā)明申請人考慮到可采用混合存儲架構兼顧集中式存儲低沉本大容量的優(yōu)勢和分布式存儲高可靠性的優(yōu)點,同時構建數(shù)據(jù)提取模型,以便于數(shù)據(jù)管理,提高整個集群的容災性。具體地,通過修改/etc/multipath. conf配置文件,實現(xiàn)集群中的各節(jié)點對共享存儲設備的多路徑訪問和故障切換。即至少在兩個以上的元節(jié)點上安裝DRBD設備,實現(xiàn)通過網(wǎng)絡通信來同步鏡像整個設備,有點類似于一個網(wǎng)絡RAID的功能。也就是說當用戶將數(shù)據(jù)寫入本地的DRBD設備上的文件系統(tǒng)時,數(shù)據(jù)會同時被發(fā)送到網(wǎng)絡中的另外一臺主機之上,并以完全相同的形式記錄在一個文件系統(tǒng)中,從而達到分布式存儲的效果。這樣既可以滿足海量數(shù)據(jù)的存儲要求,也可以部分滿足數(shù)據(jù)安全的要求,提高磁盤利用率并且平衡成本。實施例1本實施例基于上述思想,提供一種集群存儲系統(tǒng),該系統(tǒng)架構如圖1所示,包括位數(shù)據(jù)分級服務器、分布式復制塊設備(DRBD,Distributed ReplicatedBlock Device)以及
4共享存儲設備,本實施例中共享存儲設備選用共享陣列,共享陣列用來滿足業(yè)務級HA的需求保證節(jié)點出現(xiàn)故障時服務不中斷,DRBD則用于滿足存儲級HA的要求,保證重要數(shù)據(jù)不丟失。從圖1可以看到,所有節(jié)點都與共享陣列整列相連,兩個元節(jié)點除與共享陣列相連外還安裝有DRBD。其中,數(shù)據(jù)分級服務器,位于兩個元節(jié)點上,其主要負責為共享陣列中的文件構建數(shù)據(jù)提取模型以確定各文件的優(yōu)先值,并將共享陣列中優(yōu)先值大于設定值的文件的數(shù)據(jù)上傳到DRBD ;具體地,在客戶調(diào)研的基礎上,數(shù)據(jù)分級服務器將文件的參數(shù)值的和作為文件的優(yōu)先值,其中,文件的參數(shù)值包括如下一種或幾種文件數(shù)據(jù)的大小值、文件數(shù)據(jù)的讀取頻率值、文件數(shù)據(jù)的修改頻率值、文件對應的用戶的等級值。在優(yōu)選方案中,數(shù)據(jù)分級服務器除了將文件的各參數(shù)值的和作為優(yōu)先值時,還要考慮到各參數(shù)的權重,即為共享存儲設備中文件的參數(shù)值分別確定一權值,將各參數(shù)值與其對應的權值的乘積作為優(yōu)先值計算參數(shù),并將所有優(yōu)先值計算參數(shù)的總和作為該文件的優(yōu)先值。例如,將文件數(shù)據(jù)的大小值記為χ、文件數(shù)據(jù)的讀取頻率值記為y、文件數(shù)據(jù)的修改頻率值記為z,文件對應的用戶的等級值記為v,之后建立數(shù)據(jù)提取模型,即確定文件的優(yōu)先值如下ax+by+cz+dv = f其中,a、b、c和d為各參數(shù)的權值,可通過樣本訓練確定各參數(shù)的權值;f即為文件的優(yōu)先值。另外,事關整個集群運行的關鍵信息也認為是大于設定值的文件的數(shù)據(jù),也要上傳到DRBD。這樣一旦集群崩潰或者陣列損壞,可以將數(shù)據(jù)損失的代價減少到最少,同時使集群在最短時間內(nèi)恢復運轉(zhuǎn),達到提高容災性的目標。而對于優(yōu)先值小于設定值的文件的數(shù)據(jù)仍保留在共享陣列中。DRBD,存儲數(shù)據(jù)分級服務器上傳的文件的數(shù)據(jù)。其中,為了提高集群存儲系統(tǒng)的容災性,一般DRBD位于元節(jié)點上。這樣,光纖交換機可將共享存儲設備(即本實施例中的共享陣列)和每個節(jié)點相連,設置 /etc/corosync/corosync. conf ;由 Pacemaker 建立起 active/active 模式的高可用集群,這樣每個節(jié)點都成為潛在的備源節(jié)點,選擇兩臺大內(nèi)存服務器作為元節(jié)點,通過設置DRBD和配置文件,建立起active/passive模式的高可用集群,這樣在一個集群里既有 active/active模式又有active/passive模式,從而實現(xiàn)t昆合架構。共享陣列,存儲優(yōu)先值小于設定值的文件的數(shù)據(jù)。
本實施例,在大量實驗和抽樣統(tǒng)計的基礎之上,將文件數(shù)據(jù)的讀取頻率值、文件數(shù)據(jù)的修改頻率值、文件對應的用戶的等級值作為參數(shù)值,設計數(shù)據(jù)提取模型,編寫程序,實現(xiàn)數(shù)據(jù)自動安置,從而達到提高容災能力的要求,同時維護一份索引,便于查找數(shù)據(jù),記錄數(shù)據(jù)遷移狀況。此外,將集群中重要的配置文件,設備信息備份在DRBD中,一旦集群崩潰可以迅速恢復。通過對用戶授權,限制用戶訪問DRBD的權限,可提高這個集群的安全性。實施例2本實施例基于上述集群存儲系統(tǒng),提出一種集群存儲系統(tǒng)的數(shù)據(jù)存儲方法,其核心是對數(shù)據(jù)進行篩選,將重要數(shù)據(jù)(即優(yōu)先值大于設定值的文件的數(shù)據(jù))放在分布式復制塊設備(DRBD,Distributed Replicated Block Device)中,將一般數(shù)據(jù)(即優(yōu)先值小于設定值的文件的數(shù)據(jù))置在共享存儲設備(本實施例中即為共享陣列)中,這樣即使共享陣列損壞,也可以將數(shù)據(jù)丟失的損失降到最低,并且DRBD中還會備份重要的系統(tǒng)信息(如服務器的配置文件,管理員信息,日志信息等等由管理員確定)當集群崩潰時即可快速恢復。具體地,該方法包括集群存儲系統(tǒng)確定共享存儲設備中各文件的優(yōu)先值,僅將優(yōu)先值大于設定值的文件的數(shù)據(jù)存儲到DRBD中。其中,DRBD —般位于各元節(jié)點上。具體地,集群存儲系統(tǒng)確定共享存儲設備中各文件的優(yōu)先值指將共享存儲設備中文件的參數(shù)值的總和作為該文件的優(yōu)先值,其中,文件的參數(shù)值包括如下一種或幾種文件數(shù)據(jù)的大小值、文件數(shù)據(jù)的讀取頻率值、文件數(shù)據(jù)的修改頻率值、文件對應的用戶的等級值。還有一些優(yōu)選方案中,集群存儲系統(tǒng)為共享存儲設備中文件的參數(shù)值分別確定一權值,將各參數(shù)值與其對應的權值的乘積作為優(yōu)先值計算參數(shù),并將所有優(yōu)先值計算參數(shù)的總和作為該文件的優(yōu)先值。例如,將文件數(shù)據(jù)的大小值記為X、文件數(shù)據(jù)的讀取頻率值記為y、文件數(shù)據(jù)的修改頻率值記為Z,文件對應的用戶的等級值記為V,之后建立數(shù)據(jù)提取模型,即確定文件的優(yōu)先值如下ax+by+cz+dv = f其中,a、b、c和d為各參數(shù)的權值,可通過樣本訓練確定各參數(shù)的權值;f即為文件的優(yōu)先值。從上述實施例可以看出,本發(fā)明的實施例通過搭配使用DRBD和共享存儲設備,對數(shù)據(jù)分類,分開存放,提高了整個系統(tǒng)的容災能力。同時達到兼顧存儲安全性和降低成本的目的。以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,對于本領域的技術人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。
權利要求
1.一種集群存儲系統(tǒng),包括共享存儲設備,其特征在于,該系統(tǒng)還包括位于元節(jié)點的數(shù)據(jù)分級服務器和分布式復制塊設備(DRBD),其中所述數(shù)據(jù)分級服務器,確定所述共享存儲設備中各文件的優(yōu)先值,并將優(yōu)先值大于設定值的文件的數(shù)據(jù)上傳到所述DRBD ;所述DRBD,接收所述數(shù)據(jù)分級服務器上傳的文件的數(shù)據(jù)并存儲。
2.如權利要求1所述的系統(tǒng),其特征在于,所述數(shù)據(jù)分級服務器確定所述共享存儲設備中各文件的優(yōu)先值指 所述數(shù)據(jù)分級服務器將所述共享存儲設備中文件的參數(shù)值的總和作為該文件的優(yōu)先值,其中,文件的參數(shù)值包括如下一種或幾種文件數(shù)據(jù)的大小值、文件數(shù)據(jù)的讀取頻率值、文件數(shù)據(jù)的修改頻率值、文件對應的用戶的等級值。
3.如權利要求1所述的系統(tǒng),其特征在于,所述數(shù)據(jù)分級服務器確定所述共享存儲設備中各文件的優(yōu)先值指 所述數(shù)據(jù)分級服務器為所述共享存儲設備中文件的參數(shù)值分別確定一權值,將各參數(shù)值與其對應的權值的乘積作為優(yōu)先值計算參數(shù),并將所有優(yōu)先值計算參數(shù)的總和作為該文件的優(yōu)先值,其中,文件的參數(shù)值包括如下一種或幾種文件數(shù)據(jù)的大小值、文件數(shù)據(jù)的讀取頻率值、文件數(shù)據(jù)的修改頻率值、文件對應的用戶的等級值。
4.如權利要求1、2或3所述的系統(tǒng),其特征在于,所述集群存儲系統(tǒng)中至少兩個元節(jié)點上具有數(shù)據(jù)分級服務器和DRBD。
5.一種如權利要求1所述的集群存儲系統(tǒng)的數(shù)據(jù)存儲方法,其特征在于,該方法包括 所述集群存儲系統(tǒng),確定共享存儲設備中各文件的優(yōu)先值,僅將優(yōu)先值大于設定值的文件的數(shù)據(jù)存儲到分布式復制塊設備(DRBD)中。
6.如權利要求5所述的方法,其特征在于,所述集群存儲系統(tǒng)確定所述共享存儲設備中各文件的優(yōu)先值指 所述集群存儲系統(tǒng)將所述共享存儲設備中文件的參數(shù)值的總和作為該文件的優(yōu)先值, 其中,文件的參數(shù)值包括如下一種或幾種文件數(shù)據(jù)的大小值、文件數(shù)據(jù)的讀取頻率值、文件數(shù)據(jù)的修改頻率值、文件對應的用戶的等級值。
7.如權利要求5所述的方法,其特征在于,所述集群存儲系統(tǒng)確定所述共享存儲設備中各文件的優(yōu)先值指 所述集群存儲系統(tǒng)為所述共享存儲設備中文件的參數(shù)值分別確定一權值,將各參數(shù)值與其對應的權值的乘積作為優(yōu)先值計算參數(shù),并將所有優(yōu)先值計算參數(shù)的總和作為該文件的優(yōu)先值,其中,文件的參數(shù)值包括如下一種或幾種文件數(shù)據(jù)的大小值、文件數(shù)據(jù)的讀取頻率值、文件數(shù)據(jù)的修改頻率值、文件對應的用戶的等級值。
8.如權利要求5、6或7所述的方法,其特征在于, 所述集群存儲系統(tǒng)中至少兩個元節(jié)點上具有DRBD。
全文摘要
本發(fā)明公開了一種集群存儲系統(tǒng)及其數(shù)據(jù)存儲方法,涉及集群存儲系統(tǒng)。本發(fā)明公開的系統(tǒng),包括共享存儲設備,位于元節(jié)點的數(shù)據(jù)分級服務器和DRBD,其中所述數(shù)據(jù)分級服務器,確定所述共享存儲設備中各文件的優(yōu)先值,并將優(yōu)先值大于設定值的文件的數(shù)據(jù)上傳到所述DRBD;所述DRBD,接收所述數(shù)據(jù)分級服務器上傳的文件的數(shù)據(jù)并存儲。本發(fā)明實施例采用混合存儲架構兼顧集中式存儲低沉本大容量的優(yōu)勢和分布式存儲高可靠性的優(yōu)點,同時構建數(shù)據(jù)提取模型分類安放數(shù)據(jù),便于數(shù)據(jù)管理,提高整個集群的容災性,為電子信息系統(tǒng)的安全運行提供了有效保障。
文檔編號H04L29/08GK102170460SQ20111005757
公開日2011年8月31日 申請日期2011年3月10日 優(yōu)先權日2011年3月10日
發(fā)明者劉家駒, 張立強 申請人:浪潮(北京)電子信息產(chǎn)業(yè)有限公司