專利名稱:為數(shù)據(jù)對(duì)象提供預(yù)期存儲(chǔ)管理的分級(jí)存儲(chǔ)管理系統(tǒng)與方法
技術(shù)領(lǐng)域:
本發(fā)明總體上涉及存儲(chǔ)管理,更具體而言,涉及用于提供基于內(nèi)容的預(yù)期存儲(chǔ)管理的系統(tǒng)與方法。
背景技術(shù):
分級(jí)存儲(chǔ)管理(HSM)現(xiàn)在被認(rèn)為是幾乎所有歸檔系統(tǒng)必須遵循的最小能力。當(dāng)前的HSM系統(tǒng)是通過基于顯式聲明規(guī)則的策略驅(qū)動(dòng)的,該策略是從象年代、大小、使用頻率或某種用戶指定的文件優(yōu)先級(jí)的底層屬性得到的。
一般來說,管理數(shù)據(jù)從例如磁盤的昂貴介質(zhì)到例如磁帶的廉價(jià)低速介質(zhì)的移動(dòng)的簡化規(guī)則不支持基于數(shù)據(jù)屬性、內(nèi)容和相互關(guān)系的綜合考慮的智能、搶先式數(shù)據(jù)遷移。因此,分級(jí)存儲(chǔ)空間是被次優(yōu)管理的,而且系統(tǒng)性能降低。
通過提供基于底層文件屬性設(shè)置顯式策略的能力,當(dāng)前的HSM系統(tǒng)解決了歸檔和空間管理問題。TSM HSMTM和LEGATODiskExtenderTM是提供這些能力的一些系統(tǒng)。這些系統(tǒng)使用非常簡化的方式來確定歸檔的候選數(shù)據(jù)。同樣,數(shù)據(jù)召回操作也一般是由特定的用戶請(qǐng)求觸發(fā)的。
由當(dāng)前的現(xiàn)有技術(shù)的分級(jí)存儲(chǔ)管理工具所采用的簡化屬性不解決當(dāng)前跨分級(jí)布置存儲(chǔ)系統(tǒng)集合的數(shù)據(jù)遷移(歸檔和召回)的復(fù)雜需求。很諷刺的是,歸檔操作通常忽略描述提交到檔案的數(shù)據(jù)對(duì)象之間關(guān)系的很容易獲得但很重要的信息。同樣,召回操作不預(yù)期用戶可能需要的數(shù)據(jù)對(duì)象的召回。因此,數(shù)據(jù)遷移(召回和次級(jí)歸檔)不執(zhí)行并且可能有更復(fù)雜的規(guī)則、策略和信息。
當(dāng)前的HSM系統(tǒng)基于象文件大小、年代、使用頻率等的底層屬性。因此,HSM策略被限定為工作在有限的屬性集合上。這在用戶對(duì)基于內(nèi)容而不僅僅是文件大小等遷移文件感興趣的復(fù)雜存儲(chǔ)情況中具有有限的使用。用戶沒有設(shè)置用于跨存儲(chǔ)層次遷移的更高層策略的靈活性,象“將關(guān)于在1998年之前進(jìn)行的藥品試驗(yàn)及提到化合物X、Y和Z的所有文件遷移到磁帶存儲(chǔ)器”或“將提到項(xiàng)目號(hào)IS23的所有文件遷移到廉價(jià)的SATA磁盤”或“遷移用于已經(jīng)出院的病人的所有病例和相關(guān)文檔”。類似地,當(dāng)前HSM系統(tǒng)不處理更復(fù)雜的策略,如“將滿足X的所有文件遷移到存儲(chǔ)介質(zhì)Y中”,其中X可以是標(biāo)準(zhǔn)的SQL謂詞或條件,而Y是具有確定成本和性能的存儲(chǔ)介質(zhì)類型,可能作為存儲(chǔ)池的一部分。
這些類型的策略不能被現(xiàn)有的HSM系統(tǒng)支持,因?yàn)檫@些系統(tǒng)被策略屬性的個(gè)數(shù)和性質(zhì)嚴(yán)重限制。此外,存儲(chǔ)屬性是相當(dāng)有限的-尤其是關(guān)于存儲(chǔ)介質(zhì)的性能和成本特征,及因此由所討論介質(zhì)提供的可能服務(wù)水平。
當(dāng)前的HSM系統(tǒng)是由顯式定義的規(guī)則“如果X,則Y”驅(qū)動(dòng)的,該規(guī)則依賴于策略屬性(數(shù)據(jù)對(duì)象和存儲(chǔ)介質(zhì))。但是,當(dāng)前系統(tǒng)的存儲(chǔ)情況更加復(fù)雜。用戶不能總是定義所有可能的規(guī)則。理想地,HSM系統(tǒng)還應(yīng)當(dāng)被一組隱含規(guī)則管理。例如,用戶可能總是在相同的時(shí)間移動(dòng)一組特定的醫(yī)院賬單集和病歷。很有可能在涉及醫(yī)院賬單和病歷的對(duì)象類集合之間存在隱含的關(guān)系,例如,它們可能屬于一個(gè)已經(jīng)出院的特定病人。因此,如果有傳輸已經(jīng)出院的病人的所有醫(yī)院賬單的顯式HSM策略,則這對(duì)于遷移該病人的病歷也是有意義的。
類似地,如果病人的病歷從磁帶存儲(chǔ)器停止,則停止醫(yī)院賬單可能是個(gè)好主意。查找病歷的保險(xiǎn)代理可能也想檢查醫(yī)院賬單。不是發(fā)出兩個(gè)獨(dú)立的顯式數(shù)據(jù)移動(dòng)命令,如果記錄在單個(gè)命令中自動(dòng)停止將是優(yōu)選的,從而降低磁帶的等待時(shí)間。這些類型的規(guī)則不能利用當(dāng)前的HSM系統(tǒng)實(shí)現(xiàn)。
發(fā)明內(nèi)容
通過提供識(shí)別并跟蹤關(guān)于數(shù)據(jù)歸檔和召回的信息并在提高數(shù)據(jù)歸檔系統(tǒng)性能的機(jī)制中采用整理成規(guī)則、策略和數(shù)據(jù)關(guān)系的這種信息的系統(tǒng)與方法,本發(fā)明解決了以上提到的問題及其它問題。本發(fā)明包括用于通過系統(tǒng)監(jiān)視和用戶輸入捕捉顯式或隱含數(shù)據(jù)關(guān)系的機(jī)制。本發(fā)明還包括用于利用產(chǎn)生用于存儲(chǔ)空間改善的分配與使用的建議的算法處理數(shù)據(jù)關(guān)系的機(jī)制。
在第一方面,本發(fā)明提供了分級(jí)存儲(chǔ)管理(HSM)系統(tǒng),其包括用于從由內(nèi)容管理系統(tǒng)管理的分級(jí)存儲(chǔ)復(fù)合體中的數(shù)據(jù)對(duì)象中提取數(shù)據(jù)對(duì)象信息的數(shù)據(jù)使用監(jiān)視器;用于存儲(chǔ)數(shù)據(jù)對(duì)象信息的數(shù)據(jù)關(guān)系倉庫,其中數(shù)據(jù)對(duì)象信息包括用于分級(jí)存儲(chǔ)復(fù)合體中數(shù)據(jù)對(duì)象的關(guān)系數(shù)據(jù);及分析關(guān)系數(shù)據(jù)并對(duì)分級(jí)存儲(chǔ)復(fù)合體作出數(shù)據(jù)管理動(dòng)作建議的系統(tǒng)。
在第二方面,本發(fā)明提供了存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上的用于管理存儲(chǔ)管理系統(tǒng)中數(shù)據(jù)對(duì)象關(guān)系的程序產(chǎn)品,包括配置成從由內(nèi)容管理系統(tǒng)管理的存儲(chǔ)復(fù)合體中的數(shù)據(jù)對(duì)象中提取數(shù)據(jù)對(duì)象信息的程序代碼;用于存儲(chǔ)數(shù)據(jù)對(duì)象信息的數(shù)據(jù)關(guān)系倉庫,其中數(shù)據(jù)對(duì)象信息包括用于分級(jí)存儲(chǔ)復(fù)合體中數(shù)據(jù)對(duì)象的關(guān)系數(shù)據(jù);及配置成分析關(guān)系數(shù)據(jù)并為存儲(chǔ)復(fù)合體創(chuàng)建數(shù)據(jù)管理動(dòng)作建議的程序代碼。
在第三方面,本發(fā)明提供了用于對(duì)存儲(chǔ)復(fù)合體中數(shù)據(jù)對(duì)象提供預(yù)期存儲(chǔ)管理的方法,包括分析數(shù)據(jù)對(duì)象,以便生成內(nèi)容信息;將內(nèi)容信息存儲(chǔ)到識(shí)別具有相似內(nèi)容信息的對(duì)象的關(guān)系倉庫中;及基于在關(guān)系倉庫中識(shí)別的關(guān)系創(chuàng)建建議的存儲(chǔ)管理動(dòng)作。
在第四方面,本發(fā)明提供了部署用于管理存儲(chǔ)復(fù)合體中數(shù)據(jù)對(duì)象的預(yù)期存儲(chǔ)管理應(yīng)用的方法,包括提供可用于進(jìn)行以下動(dòng)作的計(jì)算機(jī)基礎(chǔ)結(jié)構(gòu)從存儲(chǔ)復(fù)合體中的數(shù)據(jù)對(duì)象中提取數(shù)據(jù)對(duì)象信息;存儲(chǔ)數(shù)據(jù)對(duì)象信息,其中數(shù)據(jù)對(duì)象信息包括用于存儲(chǔ)復(fù)合體中數(shù)據(jù)對(duì)象的關(guān)系數(shù)據(jù);及分析關(guān)系數(shù)據(jù)并為存儲(chǔ)復(fù)合體創(chuàng)建數(shù)據(jù)管理動(dòng)作建議。
在第五方面,本發(fā)明提供了在傳播信號(hào)中體現(xiàn)的用于實(shí)現(xiàn)管理存儲(chǔ)復(fù)合體中數(shù)據(jù)對(duì)象的預(yù)期存儲(chǔ)管理應(yīng)用的計(jì)算機(jī)軟件,該計(jì)算機(jī)軟件包括使計(jì)算機(jī)執(zhí)行以下功能的指令從存儲(chǔ)復(fù)合體中的數(shù)據(jù)對(duì)象中提取數(shù)據(jù)對(duì)象信息;存儲(chǔ)數(shù)據(jù)對(duì)象信息,其中數(shù)據(jù)對(duì)象信息包括用于存儲(chǔ)復(fù)合體中數(shù)據(jù)對(duì)象的關(guān)系數(shù)據(jù);及分析關(guān)系數(shù)據(jù)并為存儲(chǔ)復(fù)合體創(chuàng)建數(shù)據(jù)管理動(dòng)作建議。
根據(jù)以上所述,本發(fā)明提供了各種存儲(chǔ)管理特征,包括允許可預(yù)測(cè)歸檔和召回操作;允許對(duì)可預(yù)測(cè)遷移分級(jí)空間的基于規(guī)則/策略的管理;及對(duì)于歸檔和召回操作允許對(duì)用戶有改進(jìn)的響應(yīng)時(shí)間。
本發(fā)明的這些和其它特征將從以下對(duì)本發(fā)明各個(gè)方面的具體描述并聯(lián)系附圖變得更容易理解,其中圖1描述了根據(jù)本發(fā)明實(shí)施方式的分級(jí)存儲(chǔ)管理系統(tǒng)。
圖2描述了顯示根據(jù)本發(fā)明實(shí)施方式的說明性操作的流程圖。
具體實(shí)施例方式
現(xiàn)在參考附圖,圖1描述了通常包括分級(jí)存儲(chǔ)復(fù)合體12、內(nèi)容管理系統(tǒng)14和數(shù)據(jù)關(guān)系管理系統(tǒng)16的分級(jí)存儲(chǔ)管理(HSM)系統(tǒng)10。分級(jí)存儲(chǔ)復(fù)合體12可以包括用于存儲(chǔ)數(shù)據(jù)對(duì)象的各種類型的存儲(chǔ)機(jī)制,例如硬盤驅(qū)動(dòng)器、磁帶、磁盤、光盤等。為此,本發(fā)明的HSM系統(tǒng)10可以包括其中數(shù)據(jù)對(duì)象可以從一種存儲(chǔ)機(jī)制移動(dòng)到另一種的任何類型的存儲(chǔ)管理系統(tǒng)。
數(shù)據(jù)對(duì)象可以包括被HSM系統(tǒng)10作為單個(gè)元素管理的任何數(shù)據(jù)片斷。一般來說,每個(gè)文件都被看作是獨(dú)立的對(duì)象;但是,文件集合也可以看作一個(gè)數(shù)據(jù)對(duì)象。HSM系統(tǒng)10的規(guī)范將確定獨(dú)立文件、文件集合或兩者是否跨其存儲(chǔ)層次被管理(即,歸檔、召回、移動(dòng))。因此,本發(fā)明對(duì)可以是獨(dú)立文件、文件集合或兩者的數(shù)據(jù)對(duì)象起作用。
內(nèi)容管理系統(tǒng)14包括用于管理企業(yè)中內(nèi)容的一般系統(tǒng),該系統(tǒng)可以是從其中所有文件都簡單地存儲(chǔ)在文件系統(tǒng)中的非常底層的系統(tǒng)到其中數(shù)據(jù)存儲(chǔ)在具有描述每個(gè)特定數(shù)據(jù)對(duì)象的元數(shù)據(jù)的數(shù)據(jù)庫中的更加復(fù)雜的系統(tǒng)。內(nèi)容管理系統(tǒng)14對(duì)關(guān)于分級(jí)存儲(chǔ)復(fù)合體12中的數(shù)據(jù)對(duì)象的任何動(dòng)作22進(jìn)行響應(yīng)。這些動(dòng)作可以包括例如打開/編輯文件、請(qǐng)求召回歸檔的數(shù)據(jù)對(duì)象等。
如所指出的,內(nèi)容可以與元數(shù)據(jù)一起存儲(chǔ)。依賴于內(nèi)容管理系統(tǒng)14的類型,元數(shù)據(jù)可以包括如文件大小、年代、使用頻率等的底層屬性,或者包括如文件內(nèi)容描述的高層屬性,例如用于電子病歷的病人編號(hào)、疾病名稱、處方細(xì)節(jié)等。內(nèi)容管理系統(tǒng)14具有訪問數(shù)據(jù)對(duì)象及所關(guān)聯(lián)元數(shù)據(jù)的能力。
包括在內(nèi)容管理系統(tǒng)14中的是存儲(chǔ)歸檔/召回(SAR)系統(tǒng)20。SAR系統(tǒng)20可以是與內(nèi)容管理系統(tǒng)14一起運(yùn)行的獨(dú)立系統(tǒng)或者可以與內(nèi)容管理系統(tǒng)14完全集成在一起。SAR系統(tǒng)20對(duì)所有存儲(chǔ)的元素保持跟蹤。它具有關(guān)于存儲(chǔ)類型(例如,磁帶、磁盤、光盤等)、關(guān)于每種存儲(chǔ)類型的成本(例如,存儲(chǔ)介質(zhì)的價(jià)格和與從存儲(chǔ)器拉出數(shù)據(jù)關(guān)聯(lián)的檢索時(shí)間)、每種存儲(chǔ)子類型的容量、每種子類型中所使用的存儲(chǔ)量、指定在數(shù)據(jù)需要遷移到“更廉價(jià)”介質(zhì)之前被允許的最大存儲(chǔ)使用量的用戶閾值、存儲(chǔ)器中每個(gè)數(shù)據(jù)文件的訪問模式(例如,保持跟蹤同時(shí)移動(dòng)的對(duì)象)的信息。
數(shù)據(jù)關(guān)系管理系統(tǒng)16分析并識(shí)別關(guān)系和關(guān)于其中數(shù)據(jù)對(duì)象被利用的方式的其它信息,以便優(yōu)化內(nèi)容管理系統(tǒng)14所采取的存儲(chǔ)歸檔和檢索動(dòng)作。集中到數(shù)據(jù)關(guān)系管理系統(tǒng)16的是根據(jù)數(shù)據(jù)關(guān)系模型30組織數(shù)據(jù)的數(shù)據(jù)關(guān)系倉庫28。數(shù)據(jù)關(guān)系倉庫28包含關(guān)于每個(gè)唯一識(shí)別的數(shù)據(jù)對(duì)象的信息。它還包含管理數(shù)據(jù)對(duì)象之間關(guān)系的所有信息。數(shù)據(jù)關(guān)系模型30提供用于組織數(shù)據(jù)對(duì)象信息的結(jié)構(gòu)。數(shù)據(jù)使用規(guī)則集合44可以應(yīng)用到結(jié)構(gòu)化信息,來管理分級(jí)存儲(chǔ)復(fù)合體12中數(shù)據(jù)對(duì)象的存儲(chǔ)和檢索。模型30包括三種類型的數(shù)據(jù)數(shù)據(jù)對(duì)象描述符、數(shù)據(jù)訪問描述符和數(shù)據(jù)關(guān)系描述符。
數(shù)據(jù)對(duì)象描述符包括用于每個(gè)數(shù)據(jù)對(duì)象的唯一標(biāo)識(shí)符、用于每個(gè)數(shù)據(jù)對(duì)象的包括大小(例如,以字節(jié)或某種其它度量)和數(shù)據(jù)類型的描述信息。數(shù)據(jù)對(duì)象描述符還可以包括關(guān)于特定數(shù)據(jù)對(duì)象的內(nèi)容信息(例如,元數(shù)據(jù)或?qū)嶋H的數(shù)據(jù)內(nèi)容)。數(shù)據(jù)訪問描述符描述數(shù)據(jù)訪問事件并對(duì)每個(gè)事件包括用戶標(biāo)識(shí)符、時(shí)間和日期、被訪問數(shù)據(jù)的唯一標(biāo)識(shí)符及訪問類型(讀、讀/寫等)。數(shù)據(jù)關(guān)系描述符描述數(shù)據(jù)對(duì)象之間的關(guān)系。數(shù)據(jù)關(guān)系通常包括兩個(gè)或多個(gè)相關(guān)數(shù)據(jù)對(duì)象的列表、關(guān)系類型、每個(gè)對(duì)象作為集合一部分出現(xiàn)的頻率及關(guān)系的“使用”。關(guān)系類型指數(shù)據(jù)對(duì)象如何關(guān)聯(lián),例如都包含相似的內(nèi)容信息、一般都是由用戶同時(shí)打開的,等等?!笆褂谩弊R(shí)別關(guān)系所應(yīng)用的內(nèi)容管理動(dòng)作的類型(例如,移動(dòng)、歸檔或召回)。
信息通過數(shù)據(jù)使用監(jiān)視器24、內(nèi)容分析處理器26或用戶接口34流到數(shù)據(jù)關(guān)系倉庫28。數(shù)據(jù)使用監(jiān)視器24接收關(guān)于在存儲(chǔ)管理系統(tǒng)10中發(fā)生的對(duì)數(shù)據(jù)訪問的信息。一般來說,這種信息將從內(nèi)容管理系統(tǒng)14中的組件發(fā)送并且將包括唯一用戶標(biāo)識(shí)符、訪問的時(shí)間和日期、被訪問數(shù)據(jù)的唯一標(biāo)識(shí)符、數(shù)據(jù)的大小(例如,以字節(jié)或某種其它度量)和類型及訪問類型(例如,讀、讀/寫)??蛇x地,內(nèi)容管理組件可以提供唯一訪問事件標(biāo)識(shí)符和相關(guān)的先前訪問事件標(biāo)識(shí)符集合。數(shù)據(jù)使用監(jiān)視器24處理這種信息,來創(chuàng)建包括屬于存儲(chǔ)分級(jí)的歸檔和召回處理及屬于移動(dòng)的任何數(shù)據(jù)關(guān)系的數(shù)據(jù)對(duì)象描述符信息。
內(nèi)容分析處理器(CAP)26從內(nèi)容管理系統(tǒng)14取數(shù)據(jù)對(duì)象和關(guān)聯(lián)的元數(shù)據(jù)信息,以便為每個(gè)數(shù)據(jù)對(duì)象創(chuàng)建內(nèi)容信息。這種內(nèi)容信息是與從對(duì)象提取的對(duì)象和內(nèi)容屬性關(guān)聯(lián)的元數(shù)據(jù)的聯(lián)合。因此,CAP26利用內(nèi)容信息豐富了數(shù)據(jù)對(duì)象描述符。應(yīng)當(dāng)指出,CAP 26的實(shí)現(xiàn)依賴于要處理的數(shù)據(jù)對(duì)象的類型和特定的領(lǐng)域。例如,用于圖像數(shù)據(jù)的CAP 26可以實(shí)現(xiàn)成處理包括JPEG、GIF、TIFF、PNG等的很寬范圍的圖像格式。CAP 26可以例如提取具有基于顏色和質(zhì)地的特征的圖像處理子例程。類似地,用于藥品試驗(yàn)數(shù)據(jù)的CAP 26應(yīng)當(dāng)能夠支持由各種試驗(yàn)管理應(yīng)用創(chuàng)建的各種藥品試驗(yàn)格式,還應(yīng)當(dāng)能夠提取頭和內(nèi)容信息,例如病人名字、疾病類型等。
內(nèi)容屬性是可以從數(shù)據(jù)對(duì)象內(nèi)容提取并提供在確定適當(dāng)數(shù)據(jù)管理動(dòng)作中有用的分類信息的特征。應(yīng)當(dāng)指出,內(nèi)容管理系統(tǒng)14中的元數(shù)據(jù)信息可以包含內(nèi)容屬性。例子包括電子數(shù)據(jù)表中指示日期和財(cái)務(wù)數(shù)據(jù)類型;圖像的顏色、質(zhì)地、布局信息;DICOM圖像中存在的DICOM頭信息內(nèi)容等的列頭。
用戶接口34提供使用戶能夠提供描述他們所使用的數(shù)據(jù)之間關(guān)系的用戶輸入32的機(jī)制。用戶接口34將用戶所描述的關(guān)系轉(zhuǎn)換成數(shù)據(jù)關(guān)系模型30預(yù)制的格式并將該關(guān)系信息作為數(shù)據(jù)關(guān)系描述符的一部分存儲(chǔ)在數(shù)據(jù)關(guān)系倉庫28中。
一旦數(shù)據(jù)關(guān)系倉庫28根據(jù)數(shù)據(jù)關(guān)系模型30加載了數(shù)據(jù)對(duì)象信息,數(shù)據(jù)使用規(guī)則處理器38就可以對(duì)信息應(yīng)用數(shù)據(jù)使用規(guī)則44,以便創(chuàng)建建議的數(shù)據(jù)管理動(dòng)作。所建議的數(shù)據(jù)管理動(dòng)作可以例如包括數(shù)據(jù)對(duì)象列表、動(dòng)作(例如,遷移、召回、歸檔)、建議有效的時(shí)間、概率和/或優(yōu)先化。數(shù)據(jù)使用規(guī)則44可以響應(yīng)內(nèi)容管理系統(tǒng)14中發(fā)生的特定動(dòng)作應(yīng)用,例如從磁帶備份檢索文件的用戶請(qǐng)求可以觸發(fā)查找數(shù)據(jù)關(guān)系倉庫28中所有數(shù)據(jù)關(guān)系的規(guī)則。應(yīng)當(dāng)指出,所建議的數(shù)據(jù)管理動(dòng)作可以包括附關(guān)于它的概率。例如,動(dòng)作可以聲明當(dāng)文件X被檢索時(shí),文件Y也被檢索的概率是N%。
存儲(chǔ)分配系統(tǒng)36優(yōu)先化來自數(shù)據(jù)使用規(guī)則處理器38的所建議的數(shù)據(jù)管理動(dòng)作并為內(nèi)容管理系統(tǒng)14創(chuàng)建存儲(chǔ)管理動(dòng)作集合。存儲(chǔ)管理動(dòng)作集合是基于可配置的存儲(chǔ)使用規(guī)則42和先前的存儲(chǔ)使用模式40的集合。存儲(chǔ)使用規(guī)則42描述存儲(chǔ)管理動(dòng)作不允許、允許和建議的條件。存儲(chǔ)使用規(guī)則包括類型(不允許、允許、建議)、存儲(chǔ)管理動(dòng)作(移動(dòng)、召回、歸檔)集合及條件(存儲(chǔ)駐留閾值/最高限度、可執(zhí)行時(shí)間周期)。存儲(chǔ)使用模式40描述數(shù)據(jù)跨分級(jí)存儲(chǔ)復(fù)合體12的各個(gè)層次隨時(shí)間的移動(dòng)。
如所指出的,分級(jí)存儲(chǔ)復(fù)合體12包括物理存儲(chǔ)介質(zhì)。它可以包括與不同存儲(chǔ)類型關(guān)聯(lián)的不同的存儲(chǔ)層次。每個(gè)存儲(chǔ)層次是一組具有相似價(jià)格成本和訪問成本的存儲(chǔ)介質(zhì)。例如,所有磁帶介質(zhì)屬于一個(gè)存儲(chǔ)層次,而所有高速磁盤屬于另一存儲(chǔ)層次。價(jià)格成本(PC)是存儲(chǔ)介質(zhì)的成本價(jià)格,即磁帶存儲(chǔ)器的價(jià)格成本比磁帶存儲(chǔ)器低得多。訪問成本(AC)是訪問存儲(chǔ)介質(zhì)上存儲(chǔ)單元所需的時(shí)間。例如,磁帶存儲(chǔ)器的訪問成本比磁盤存儲(chǔ)器的高得多。
在一種說明性實(shí)施方式中,分級(jí)存儲(chǔ)復(fù)合體可以設(shè)置成存儲(chǔ)層次從1到MaxLevel編號(hào),其中MaxLevel是存在的存儲(chǔ)層次的總數(shù)。存儲(chǔ)層次(1)包括具有最高PC和最低AC的存儲(chǔ)介質(zhì)。存儲(chǔ)層次(MaxLevel)包括具有最低PC和最高AC的存儲(chǔ)介質(zhì)。
分級(jí)空間18是分級(jí)存儲(chǔ)復(fù)合體12的可以實(shí)現(xiàn)成處理來自存儲(chǔ)分配系統(tǒng)36的基于概率的存儲(chǔ)管理建議的一部分。對(duì)于每個(gè)存儲(chǔ)層次n(1<=n<MaxLevel),都有標(biāo)記為Staging(n)的所關(guān)聯(lián)的存儲(chǔ)組件。存儲(chǔ)層次(n)的特定部分標(biāo)記為Staging(n)。當(dāng)數(shù)據(jù)基于概率規(guī)則移動(dòng)時(shí)(0<概率<1),它首先移動(dòng)到分級(jí)區(qū)域18。因此,如果數(shù)據(jù)關(guān)于預(yù)期的召回規(guī)則從存儲(chǔ)層次(n)移動(dòng)到存儲(chǔ)層次(n-1),則它首先移動(dòng)到Staging(n-1)中。這確保當(dāng)給出實(shí)際的召回命令時(shí)數(shù)據(jù)處于較高的存儲(chǔ)層次。相應(yīng)地,如果數(shù)據(jù)基于概率規(guī)則從存儲(chǔ)層次(n)移動(dòng)到存儲(chǔ)層次(n+1),則它首先移動(dòng)到Staging(n+1)中。
現(xiàn)在參考圖2,在流程圖中描述了存儲(chǔ)系統(tǒng)10運(yùn)行的說明性實(shí)現(xiàn)。首先,在步驟S1,內(nèi)容管理系統(tǒng)14在內(nèi)容管理系統(tǒng)14的控制下向數(shù)據(jù)使用監(jiān)視器發(fā)送何時(shí)用戶訪問數(shù)據(jù)的數(shù)據(jù)訪問描述。這種描述包括唯一的用戶標(biāo)識(shí)符、時(shí)間和日期、被訪問數(shù)據(jù)的唯一標(biāo)識(shí)符、數(shù)據(jù)的大小(例如,以字節(jié)或某種其它度量)和類型及訪問類型(讀、讀/寫等)??蛇x地,內(nèi)容管理系統(tǒng)14可以提供唯一訪問事件標(biāo)識(shí)符和相關(guān)的先前訪問事件標(biāo)識(shí)符集合。數(shù)據(jù)使用監(jiān)視器24處理這種信息,以便創(chuàng)建關(guān)于存儲(chǔ)層次中歸檔、召回和遷移的數(shù)據(jù)關(guān)系集合。該數(shù)據(jù)關(guān)系指示同一用戶同時(shí)訪問的數(shù)據(jù)對(duì)象,帶有同時(shí)訪問頻率的指示符。
接下來,在步驟S2,數(shù)據(jù)使用監(jiān)視器24將數(shù)據(jù)關(guān)系存儲(chǔ)在數(shù)據(jù)關(guān)系倉庫28中。在步驟S3,用戶可以瀏覽并更新現(xiàn)有的數(shù)據(jù)管理動(dòng)作規(guī)則而且他們可以通過用戶接口添加新規(guī)則。規(guī)則可以直接輸入,或者用戶可以通過在用戶接口中提供的一組提示提供創(chuàng)建規(guī)則的信息。數(shù)據(jù)使用規(guī)則是通過用戶接口34創(chuàng)建的。
在步驟S3,內(nèi)容管理系統(tǒng)14向內(nèi)容分析處理器(CAP)26發(fā)送內(nèi)容和關(guān)于內(nèi)容的元數(shù)據(jù)。元數(shù)據(jù)可以包括例如由MIME定義的顯式數(shù)據(jù)類型或者內(nèi)容格式可以自定義(例如通過文件頭)。在有些情況下,數(shù)據(jù)格式可以是不定義的。如果內(nèi)容是可以被CAP處理的格式,則內(nèi)容分析處理器26基于元數(shù)據(jù)和內(nèi)容生成內(nèi)容信息。否則,只有元數(shù)據(jù)被用于產(chǎn)生內(nèi)容信息。在步驟S4,內(nèi)容信息作為用于被處理數(shù)據(jù)對(duì)象數(shù)據(jù)描述符的一部分在數(shù)據(jù)關(guān)系倉庫28中歸檔。
在步驟S5,數(shù)據(jù)使用規(guī)則處理器38和存儲(chǔ)分配系統(tǒng)36創(chuàng)建建議的存儲(chǔ)管理動(dòng)作列表。這種處理可以以調(diào)度為基礎(chǔ)或者基于如來自數(shù)據(jù)使用監(jiān)視器24的提示的外部信號(hào)調(diào)用,這種處理對(duì)新空間的可用性或者達(dá)到預(yù)設(shè)閾值的可用空間使用作出反應(yīng)。數(shù)據(jù)使用規(guī)則處理器38訪問并掃描數(shù)據(jù)關(guān)系倉庫28,識(shí)別有期望數(shù)據(jù)對(duì)象管理動(dòng)作的高可能性的數(shù)據(jù)對(duì)象。例如,如果數(shù)據(jù)使用監(jiān)視器24指示第二個(gè)數(shù)據(jù)對(duì)象剛剛被給定用戶從檔案召回而且用于該數(shù)據(jù)對(duì)象的數(shù)據(jù)關(guān)系指示另一數(shù)據(jù)對(duì)象常常被同時(shí)訪問,則數(shù)據(jù)使用規(guī)則處理器38將生成內(nèi)容管理系統(tǒng)14還召回第二個(gè)相關(guān)數(shù)據(jù)對(duì)象的建議。所建議的數(shù)據(jù)管理動(dòng)作將傳遞到存儲(chǔ)分配系統(tǒng)36,以便優(yōu)先化并轉(zhuǎn)發(fā)到內(nèi)容管理系統(tǒng)14。
在步驟S6,存儲(chǔ)分配系統(tǒng)向存儲(chǔ)歸檔/召回系統(tǒng)20發(fā)送優(yōu)先化的動(dòng)作集合,存儲(chǔ)歸檔/召回系統(tǒng)20執(zhí)行例如根據(jù)需要在不同存儲(chǔ)層次和存儲(chǔ)空間之間移動(dòng)指定數(shù)據(jù)的動(dòng)作。
在步驟S7,存儲(chǔ)歸檔/召回系統(tǒng)20向存儲(chǔ)分配系統(tǒng)36發(fā)送分級(jí)存儲(chǔ)復(fù)合體12的所有屬性的列表。這種屬性列表包括存儲(chǔ)類型(磁帶、磁盤、光盤等)、存在的各種存儲(chǔ)層次、與每個(gè)存儲(chǔ)層次關(guān)聯(lián)的成本(既有PC又有AC)、每個(gè)存儲(chǔ)層次的總?cè)萘?、用于每個(gè)層次中的存儲(chǔ)量、在數(shù)據(jù)需要遷移之前指定允許使用的存儲(chǔ)使用的最大量的用戶定義閾值、存儲(chǔ)器中數(shù)據(jù)文件的訪問模式(例如,它們使用多頻繁、跟蹤同時(shí)移動(dòng)的對(duì)象等)等。
總的來說,以上描述的各種組件可以在例如桌面計(jì)算機(jī)、膝上計(jì)算機(jī)、工作站等的計(jì)算機(jī)系統(tǒng)上實(shí)現(xiàn),這些計(jì)算機(jī)系統(tǒng)可以作為客戶端和/或服務(wù)器的一部分實(shí)現(xiàn)。對(duì)計(jì)算機(jī)系統(tǒng)的訪問可以在例如因特網(wǎng)、局域網(wǎng)(LAN)、廣域網(wǎng)(WAN)、虛擬專用網(wǎng)(VPN)的網(wǎng)絡(luò)上提供。通信可用通過直接硬連線連接(例如,串行口)或者通過可以利用有線和/或無線發(fā)送方法的可尋址連接發(fā)生。此外,傳統(tǒng)的網(wǎng)絡(luò)連接,如令牌環(huán)、以太網(wǎng)、WiFi或其它傳統(tǒng)的通信標(biāo)準(zhǔn),都可以使用。還有,連接可以由基于傳統(tǒng)TCP/IP套接字的協(xié)議提供。在這種情況下,因特網(wǎng)服務(wù)提供商可以用于建立互連。連接可以由例如JMS的基于消息的協(xié)議或自發(fā)現(xiàn)或例如web服務(wù)的基于其它服務(wù)的協(xié)議提供。此外,如上面所指出的,通信可以在客戶端-服務(wù)器或服務(wù)器-服務(wù)器環(huán)境中發(fā)生。
應(yīng)當(dāng)理解,本發(fā)明的教義可以作為以預(yù)定或付費(fèi)為基礎(chǔ)的商業(yè)方法提供。例如,包括關(guān)系管理系統(tǒng)16的計(jì)算機(jī)系統(tǒng)可以由為客戶提供在此所述功能的服務(wù)提供商創(chuàng)建、維護(hù)和/或部署。即,服務(wù)提供商可以向內(nèi)容管理系統(tǒng)提供如上所述提供建議數(shù)據(jù)管理動(dòng)作的接口。
應(yīng)當(dāng)理解,在此所述的系統(tǒng)、功能、機(jī)制、方法、引擎和模塊可以以硬件、軟件或硬件與軟件的組合實(shí)現(xiàn)。它們可以由任何類型的計(jì)算機(jī)系統(tǒng)或適于執(zhí)行在此所述方法的其它裝置實(shí)現(xiàn)。硬件與軟件的典型組合可以是具有計(jì)算機(jī)程序的通用計(jì)算機(jī)系統(tǒng),當(dāng)被加載并執(zhí)行時(shí),該計(jì)算機(jī)程序可以控制計(jì)算機(jī)系統(tǒng)使其執(zhí)行在此所述的方法。可選地,可以使用包括用于執(zhí)行本發(fā)明一種或多種功能任務(wù)的指定硬件的特定于用戶的計(jì)算機(jī)。在另一實(shí)施方式中,本發(fā)明的部分或全部可以分布方式實(shí)現(xiàn),例如在如因特網(wǎng)的網(wǎng)絡(luò)上。
本發(fā)明還可以嵌入到計(jì)算機(jī)程序產(chǎn)品中,該計(jì)算機(jī)程序產(chǎn)品包括使在此所述方法與功能實(shí)現(xiàn)的所有特征,而且當(dāng)加載到計(jì)算機(jī)系統(tǒng)中時(shí),該計(jì)算機(jī)程序產(chǎn)品能夠執(zhí)行這些方法與功能。本上下文中如計(jì)算機(jī)程序、軟件程序、程序、程序產(chǎn)品、軟件等的術(shù)語意味著指令集的任何語言、代碼或符號(hào)的任何表達(dá),該指令集打算使具有信息處理能力的系統(tǒng)直接或者在以下一個(gè)或兩個(gè)步驟之后執(zhí)行特定功能(a)轉(zhuǎn)換成其它語言、代碼或符號(hào);和/或(b)以不同的材料形式再現(xiàn)。
本發(fā)明以上描述是為了說明和描述而給出的。它不打算是窮盡的或者要將本發(fā)明限定到所公開的精確形式,而且很顯然,許多修改和變化都是可能的。對(duì)本領(lǐng)域技術(shù)人員顯而易見的此類修改和變化打算包括在由所附權(quán)利要求定義的本發(fā)明范圍之內(nèi)。
權(quán)利要求
1.一種分級(jí)存儲(chǔ)管理(HSM)系統(tǒng),包括數(shù)據(jù)使用監(jiān)視器,用于從由內(nèi)容管理系統(tǒng)管理的分級(jí)存儲(chǔ)復(fù)合體中的數(shù)據(jù)對(duì)象中提取數(shù)據(jù)對(duì)象信息;數(shù)據(jù)關(guān)系倉庫,用于存儲(chǔ)數(shù)據(jù)對(duì)象信息,其中數(shù)據(jù)對(duì)象信息包括用于分級(jí)存儲(chǔ)復(fù)合體中數(shù)據(jù)對(duì)象的關(guān)系數(shù)據(jù);及分析關(guān)系數(shù)據(jù)并為分級(jí)存儲(chǔ)復(fù)合體作出數(shù)據(jù)管理動(dòng)作建議的系統(tǒng)。
2.如權(quán)利要求1所述的HSM系統(tǒng),其中數(shù)據(jù)對(duì)象信息包括數(shù)據(jù)對(duì)象描述符、數(shù)據(jù)訪問描述符和數(shù)據(jù)關(guān)系描述符。
3.如權(quán)利要求1所述的HSM系統(tǒng),還包括內(nèi)容分析處理器,該內(nèi)容分析處理器分析數(shù)據(jù)對(duì)象的內(nèi)容屬性和元數(shù)據(jù)并生成與數(shù)據(jù)對(duì)象信息一起存儲(chǔ)到數(shù)據(jù)關(guān)系倉庫中的內(nèi)容信息。
4.如權(quán)利要求1所述的HSM系統(tǒng),還包括用戶接口,該用戶接口允許用戶將關(guān)系數(shù)據(jù)輸入到數(shù)據(jù)關(guān)系倉庫中。
5.如權(quán)利要求1所述的HSM系統(tǒng),還包括存儲(chǔ)分配系統(tǒng),該存儲(chǔ)分配系統(tǒng)為內(nèi)容管理系統(tǒng)優(yōu)先化數(shù)據(jù)管理動(dòng)作建議。
6.如權(quán)利要求5所述的HSM系統(tǒng),其中存儲(chǔ)分配系統(tǒng)基于存儲(chǔ)使用規(guī)則和存儲(chǔ)使用模式優(yōu)先化數(shù)據(jù)管理動(dòng)作建議。
7.如權(quán)利要求1所述的HSM系統(tǒng),其中分級(jí)存儲(chǔ)復(fù)合體包括用于在分級(jí)層次之間移動(dòng)的數(shù)據(jù)對(duì)象的分級(jí)空間。
8.如權(quán)利要求1所述的HSM系統(tǒng),其中關(guān)系數(shù)據(jù)包括相關(guān)對(duì)象集合、用于每個(gè)相關(guān)對(duì)象集合的關(guān)系類型、與每個(gè)對(duì)象集合相關(guān)的頻率和用于每個(gè)相關(guān)對(duì)象集合的內(nèi)容管理動(dòng)作。
9.如權(quán)利要求8所述的HSM系統(tǒng),其中內(nèi)容管理動(dòng)作選自遷移、歸檔和召回。
10.一種用于對(duì)存儲(chǔ)復(fù)合體中的數(shù)據(jù)對(duì)象提供預(yù)期存儲(chǔ)管理的方法,包括分析數(shù)據(jù)對(duì)象,以便生成內(nèi)容信息;將內(nèi)容信息存儲(chǔ)到識(shí)別具有相似內(nèi)容信息的對(duì)象的關(guān)系倉庫中;及基于在關(guān)系倉庫中識(shí)別的關(guān)系創(chuàng)建建議的存儲(chǔ)管理動(dòng)作。
11.如權(quán)利要求10所述的方法,還包括優(yōu)先化所建議存儲(chǔ)管理動(dòng)作的步驟。
12.如權(quán)利要求10所述的方法,其中內(nèi)容信息包括內(nèi)容特征和元數(shù)據(jù)。
13.如權(quán)利要求10所述的方法,其中所建議的存儲(chǔ)管理動(dòng)作包括選自遷移、歸檔和召回的動(dòng)作。
14.一種部署用于管理存儲(chǔ)復(fù)合體中數(shù)據(jù)對(duì)象的預(yù)期存儲(chǔ)管理應(yīng)用的方法,包括提供計(jì)算機(jī)基礎(chǔ)結(jié)構(gòu),其可用于從存儲(chǔ)復(fù)合體中的數(shù)據(jù)對(duì)象提取數(shù)據(jù)對(duì)象信息;存儲(chǔ)數(shù)據(jù)對(duì)象信息,其中數(shù)據(jù)對(duì)象信息包括用于存儲(chǔ)復(fù)合體中的數(shù)據(jù)對(duì)象的關(guān)系數(shù)據(jù);及分析關(guān)系數(shù)據(jù)并為存儲(chǔ)復(fù)合體創(chuàng)建數(shù)據(jù)管理動(dòng)作建議。
15.一種體現(xiàn)在傳播信號(hào)中的計(jì)算機(jī)軟件,用于實(shí)現(xiàn)管理存儲(chǔ)復(fù)合體中數(shù)據(jù)對(duì)象的預(yù)期存儲(chǔ)管理應(yīng)用,該計(jì)算機(jī)軟件包括使計(jì)算機(jī)執(zhí)行以下功能的指令從存儲(chǔ)復(fù)合體中的數(shù)據(jù)對(duì)象中提取數(shù)據(jù)對(duì)象信息;存儲(chǔ)數(shù)據(jù)對(duì)象信息,其中數(shù)據(jù)對(duì)象信息包括用于存儲(chǔ)復(fù)合體中的數(shù)據(jù)對(duì)象的關(guān)系數(shù)據(jù);及分析關(guān)系數(shù)據(jù)并為存儲(chǔ)復(fù)合體創(chuàng)建數(shù)據(jù)管理動(dòng)作建議。
全文摘要
一種分級(jí)存儲(chǔ)管理(HSM)系統(tǒng)和方法。所提供的系統(tǒng)包括數(shù)據(jù)使用監(jiān)視器,用于從由內(nèi)容管理系統(tǒng)管理的分級(jí)存儲(chǔ)復(fù)合體中的數(shù)據(jù)對(duì)象中提取數(shù)據(jù)對(duì)象信息;數(shù)據(jù)關(guān)系倉庫,用于存儲(chǔ)數(shù)據(jù)對(duì)象信息,其中數(shù)據(jù)對(duì)象信息包括用于分級(jí)存儲(chǔ)復(fù)合體中數(shù)據(jù)對(duì)象的關(guān)系數(shù)據(jù);及分析關(guān)系數(shù)據(jù)并為分級(jí)存儲(chǔ)復(fù)合體作出數(shù)據(jù)管理動(dòng)作建議的系統(tǒng)。
文檔編號(hào)G06F17/30GK1912873SQ20061011073
公開日2007年2月14日 申請(qǐng)日期2006年8月7日 優(yōu)先權(quán)日2005年8月8日
發(fā)明者威廉·A.·托爾斯基, 瓦姆西·K.·烏圖庫魯 申請(qǐng)人:國際商業(yè)機(jī)器公司