專利名稱:備份計(jì)算機(jī)系統(tǒng)的消除重復(fù)計(jì)算機(jī)文件系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)系統(tǒng),并且具體涉及備份計(jì)算機(jī)系統(tǒng)的消除重復(fù)計(jì)算機(jī)文件系 統(tǒng)的方法和系統(tǒng)。
背景技術(shù):
計(jì)算機(jī)系統(tǒng)典型地包括計(jì)算機(jī)文件系統(tǒng)。文件系統(tǒng)可以是消除重復(fù)文件系統(tǒng) (de-duplicated file-system)。計(jì)算機(jī)系統(tǒng)(例如,服務(wù)器計(jì)算機(jī)系統(tǒng))需要對數(shù)據(jù)執(zhí)行有效的數(shù)據(jù)消除重復(fù)的 能力。用于計(jì)算機(jī)文件系統(tǒng)的備份解決方案已經(jīng)包括一些形式的數(shù)據(jù)“消除重復(fù)”或數(shù)據(jù) “冗余消除”算法。這些算法可在整個(gè)文件或子文件級使用。一種最普遍的子文件消除重復(fù)的方法是首先使用數(shù)據(jù)指紋(fingerprinting)算 法(如Rabin指紋)將數(shù)據(jù)流(文件)分為各塊(chunk)。數(shù)據(jù)指紋算法可設(shè)置為基于算 法的參數(shù)產(chǎn)生“期望大小”的各塊。一旦文件為塊的形式,散列算法用于唯一地標(biāo)識這些塊 的每個(gè)的內(nèi)容。這些唯一的標(biāo)識符然后置于可查詢的索引中。當(dāng)找到在文件系統(tǒng)中已經(jīng)存 在的塊時(shí)(通過查詢索引或嘗試插入并得到?jīng)_突而找到),該塊可被對該塊的引用而替代, 并且出現(xiàn)“消除重復(fù)”。對于被分塊的每個(gè)文件,產(chǎn)生“藍(lán)圖”或塊列表,標(biāo)識如何從其組成 部分重建文件。這種類型的消除重復(fù)文件系統(tǒng)的一個(gè)問題在于,數(shù)據(jù)存儲格式使得當(dāng)備份到分離 的存儲介質(zhì)(例如,磁帶系統(tǒng))時(shí),非常難以維持該消除重復(fù)狀態(tài)。由于數(shù)據(jù)的互連質(zhì)(對 象“藍(lán)圖”引用多個(gè)塊,并且消除重復(fù)的塊指回到多個(gè)對象),備份消除重復(fù)的系統(tǒng)到分離的 存儲介質(zhì)是困難的。讀取單個(gè)對象可能需要安裝多個(gè)存儲介質(zhì)以便讀取該對象的數(shù)據(jù)。為此原因,現(xiàn)有技術(shù)的用于備份消除重復(fù)的文件系統(tǒng)到分離的存儲介質(zhì)的系統(tǒng)重 新復(fù)制數(shù)據(jù),使得維持?jǐn)?shù)據(jù)的引用位置。然而,如現(xiàn)有技術(shù)的圖1所示,這樣的系統(tǒng)不能備 份消除重復(fù)的文件系統(tǒng)到分離的介質(zhì)、同時(shí)維持文件系統(tǒng)的消除重復(fù)狀態(tài)并維持引用位 置。當(dāng)前,現(xiàn)有技術(shù)的系統(tǒng)需要安裝/重新安裝分離的存儲介質(zhì)以便訪問所有的消除重復(fù) 的文件數(shù)據(jù)。因此,期望備份消除重復(fù)計(jì)算機(jī)文件系統(tǒng)的改進(jìn)方法和系統(tǒng)。
發(fā)明內(nèi)容
因此,在第一方面,本發(fā)明提供了一種備份計(jì)算機(jī)系統(tǒng)的消除重復(fù)計(jì)算機(jī)文件系 統(tǒng)的方法,包括將文件系統(tǒng)劃分為分區(qū);以及將每個(gè)分區(qū)存儲在分離的存儲介質(zhì)上。劃分 包括使用圖形分割算法。使用包括將文件系統(tǒng)分割為沒有互連的子圖。分割包括,如果各 子圖中的子圖不能完全存儲在分離的存儲介質(zhì)上,則標(biāo)識使得子圖連接的數(shù)據(jù);以及重 新復(fù)制使得子圖連接的數(shù)據(jù)。該方法包括隨所有引用的圖形分區(qū)保存重新復(fù)制的數(shù)據(jù)。優(yōu)選地,標(biāo)識包括找到使得子圖連接的數(shù)據(jù)塊的最小集合。優(yōu)選地,標(biāo)識包括選擇具有高引用計(jì)數(shù)的數(shù)據(jù)塊。
優(yōu)選地,存儲包括在分離存儲介質(zhì)上組合分區(qū),直到每個(gè)介質(zhì)滿。優(yōu)選地,存儲包括將各分區(qū)保存在分離存儲介質(zhì)上,其中各分區(qū)中的圖形互連量最小。優(yōu)選地,保存包括計(jì)數(shù)可同時(shí)安裝在計(jì)算機(jī)系統(tǒng)上的分離存儲介質(zhì)的數(shù)量;以 及考慮分離存儲介質(zhì)的拆卸和重新安裝的性能懲罰。在第二方面,提供了一種備份計(jì)算機(jī)系統(tǒng)的消除重復(fù)計(jì)算機(jī)文件系統(tǒng)的系統(tǒng),該 系統(tǒng)包括劃分模塊,配置為將文件系統(tǒng)劃分為分區(qū);以及存儲模塊,配置為將每個(gè)分區(qū)存 儲在分離的存儲介質(zhì)上。劃分模塊包括配置為使用圖形分割算法的使用模塊。使用模塊包 括配置為將文件系統(tǒng)分割為沒有互連的子圖的分割模塊。如果各子圖中的子圖不能完全存 儲在分離的存儲介質(zhì)上,則分割模塊包括標(biāo)識模塊,配置為標(biāo)識使得子圖連接的數(shù)據(jù);以 及重新復(fù)制模塊,配置為重新復(fù)制使得子圖連接的數(shù)據(jù);系統(tǒng)還包括保存模塊,配置為隨所 有引用的圖形分區(qū)保存重新復(fù)制的數(shù)據(jù)。優(yōu)選地,標(biāo)識模塊包括查找模塊,配置為找到使得子圖連接的數(shù)據(jù)塊的最小集
I=I O優(yōu)選地,標(biāo)識模塊包括選擇模塊,配置為選擇具有高引用計(jì)數(shù)的數(shù)據(jù)塊。優(yōu)選地,存儲模塊包括組合模塊,配置為在分離存儲介質(zhì)上組合分區(qū),直到每個(gè) 介質(zhì)滿。優(yōu)選地,存儲模塊包括保存模塊,配置為將各分區(qū)保存在分離存儲介質(zhì)上,其中各 分區(qū)中的圖形互連量最小。優(yōu)選地,保存模塊包括計(jì)算模塊,配置為計(jì)數(shù)可同時(shí)安裝在計(jì)算機(jī)系統(tǒng)上的分離 存儲介質(zhì)的數(shù)量;以及考慮模塊,配置為考慮分離存儲介質(zhì)的拆卸和重新安裝的性能懲罰。在第三方面,提供了一種計(jì)算機(jī)程序,包括當(dāng)加載到計(jì)算機(jī)系統(tǒng)并在其上執(zhí)行時(shí)、 使得所述計(jì)算機(jī)系統(tǒng)執(zhí)行根據(jù)第一方面的方法的所有步驟的計(jì)算機(jī)程序代碼。該計(jì)算機(jī)程序可體現(xiàn)為可隨可編程計(jì)算機(jī)使用的計(jì)算機(jī)程序產(chǎn)品,所述可編程計(jì) 算機(jī)中嵌入備份計(jì)算機(jī)系統(tǒng)的消除重復(fù)計(jì)算機(jī)文件系統(tǒng)的可讀程序代碼,該計(jì)算機(jī)程序產(chǎn) 品包括用于將文件系統(tǒng)劃分為分區(qū)的計(jì)算機(jī)可讀代碼;用于將每個(gè)分區(qū)存儲在分離的存 儲介質(zhì)上的計(jì)算機(jī)可讀代碼。本發(fā)明可以以傳輸計(jì)算機(jī)系統(tǒng)的消除重復(fù)計(jì)算機(jī)文件系統(tǒng)的系統(tǒng)體現(xiàn),該系統(tǒng)包 括將文件系統(tǒng)劃分為分區(qū);以及組裝每個(gè)分區(qū)用于分離的傳輸信道。本發(fā)明可以以傳輸計(jì)算機(jī)系統(tǒng)的消除重復(fù)計(jì)算機(jī)文件系統(tǒng)的系統(tǒng)體現(xiàn),該系統(tǒng)包 括劃分模塊,配置為將文件系統(tǒng)劃分為分區(qū);以及組裝模塊,配置為組裝每個(gè)分區(qū)用于分 離的傳輸信道。本發(fā)明實(shí)施例提供了一種備份計(jì)算機(jī)系統(tǒng)的消除重復(fù)計(jì)算機(jī)文件系統(tǒng)的方法和 系統(tǒng)。在示例性實(shí)施例中,該方法和系統(tǒng)包括(1)將文件系統(tǒng)劃分為分區(qū);以及(2)將每 個(gè)分區(qū)存儲在分離的存儲介質(zhì)上。在示例性實(shí)施例中,劃分包括使用圖形分割算法。在示例性實(shí)施例中,使用包括將 文件系統(tǒng)分割為沒有互連的子圖。在示例性實(shí)施例中,分割包括,如果各子圖中的子圖不能完全存儲在分離的存儲 介質(zhì)上,則(a)標(biāo)識使得子圖連接的數(shù)據(jù);以及(b)重新復(fù)制使得子圖連接的數(shù)據(jù)。在示例性實(shí)施例中,分割還包括隨所有引用的圖形分區(qū)保存重新復(fù)制的數(shù)據(jù)。在示例性實(shí)施例中,標(biāo)識包括找到使得子圖連接的數(shù)據(jù)塊的最小集合。在示例性 實(shí)施例中,標(biāo)識包括選擇具有高引用計(jì)數(shù)的數(shù)據(jù)塊。在示例性實(shí)施例中,存儲包括在分離存儲介質(zhì)上組合分區(qū),直到每個(gè)介質(zhì)滿。在 示例性實(shí)施例中,存儲包括將各分區(qū)保存在分離存儲介質(zhì)上,其中各分區(qū)中的圖形互連量 最小。在示例性實(shí)施例中,保存包括(a)計(jì)數(shù)可同時(shí)安裝在計(jì)算機(jī)系統(tǒng)上的分離存儲介質(zhì) 的數(shù)量;以及(b)考慮分離存儲介質(zhì)的拆卸和重新安裝的性能懲罰。本發(fā)明還提供了一種可隨可編程計(jì)算機(jī)使用的計(jì)算機(jī)程序產(chǎn)品,所述可編程計(jì)算 機(jī)中嵌入備份計(jì)算機(jī)系統(tǒng)的消除重復(fù)計(jì)算機(jī)文件系統(tǒng)的可讀程序代碼。在示例性實(shí)施例 中,該計(jì)算機(jī)程序產(chǎn)品包括(1)用于將文件系統(tǒng)劃分為分區(qū)的計(jì)算機(jī)可讀代碼;以及(2) 用于將每個(gè)分區(qū)存儲在分離的存儲介質(zhì)上的計(jì)算機(jī)可讀代碼。
現(xiàn)在,將參照附圖,僅通過示例描述本發(fā)明的優(yōu)選實(shí)施例,附圖中圖1是現(xiàn)有技術(shù)的流程圖;圖2是根據(jù)本發(fā)明示例性實(shí)施例的流程圖;圖3A是根據(jù)本發(fā)明示例性實(shí)施例的劃分步驟的流程圖;圖3B是根據(jù)本發(fā)明示例性實(shí)施例的使用步驟的流程圖;圖3C是消除重復(fù)系統(tǒng)的圖;圖3D是根據(jù)本發(fā)明示例性實(shí)施例的備份消除重復(fù)系統(tǒng)的圖;圖4A是根據(jù)本發(fā)明示例性實(shí)施例的分割步驟的流程圖;圖4B是根據(jù)本發(fā)明另一實(shí)施例的分割步驟的流程圖;圖4C是消除重復(fù)系統(tǒng)的圖;圖4D是根據(jù)本發(fā)明示例性實(shí)施例的備份消除重復(fù)系統(tǒng)的圖;圖5A是根據(jù)本發(fā)明示例性實(shí)施例的標(biāo)識步驟的流程圖;圖5B是根據(jù)本發(fā)明示例性實(shí)施例的標(biāo)識步驟的流程圖;圖6是根據(jù)本發(fā)明示例性實(shí)施例的存儲步驟的流程圖;圖7A是根據(jù)本發(fā)明示例性實(shí)施例的存儲步驟的流程圖;圖7B是根據(jù)本發(fā)明示例性實(shí)施例的保存步驟的流程圖;以及圖8是根據(jù)本發(fā)明示例性實(shí)施例的流程圖。
具體實(shí)施例方式本發(fā)明的優(yōu)選實(shí)施例提供了備份計(jì)算機(jī)系統(tǒng)的消除重復(fù)計(jì)算機(jī)文件系統(tǒng)的方法 和系統(tǒng)。在示例性實(shí)施例中,該方法和系統(tǒng)包括(1)將文件系統(tǒng)劃分為分區(qū);以及(2)將每 個(gè)分區(qū)存儲在分離的存儲介質(zhì)上。參照圖2,在示例性實(shí)施例中,本發(fā)明包括將文件系統(tǒng)劃分為分區(qū)的步驟212、以 及將每個(gè)分區(qū)存儲在分離的存儲介質(zhì)上的步驟214。本發(fā)明盡可能地維持文件系統(tǒng)的消除 重復(fù)狀態(tài)。文件系統(tǒng)存儲對象(例如,計(jì)算機(jī)文件)。每個(gè)對象包括至少一個(gè)數(shù)據(jù)塊。存儲 介質(zhì)可以是磁存儲介質(zhì)(例如,磁帶)或光學(xué)存儲介質(zhì)(例如,DVD)。在示例性實(shí)施例中,存儲步驟214不需要引用其他存儲介質(zhì)上的各條數(shù)據(jù)。劃分文件系統(tǒng)參照圖3A,在示例性實(shí)施例中,劃分步驟212包括使用圖形分割算法的步驟 312。例如,本發(fā)明可以使用Dijkstra算法。本發(fā)明將消除重復(fù)的文件系統(tǒng)視為兩部分 (bipartite)(兩級)圖形,其中各對象連接到它們的組成塊,并且各塊連接回到它們的成
員對象。沒有互連的子圖參照圖3B,在示例性實(shí)施例中,使用步驟312包括將文件系統(tǒng)分割為沒有互連的 子圖的步驟322。在示例性實(shí)施例中,子圖是分區(qū)。參照圖3C,例如,消除重復(fù)的文件系統(tǒng)包括對象1 (項(xiàng)目330),其包括塊1和2 (分 別為項(xiàng)目331和332);對象3(項(xiàng)目350),其包括塊3、4和1(分別為項(xiàng)目351、352和353); 對象2(項(xiàng)目340),其包括塊5、6和7(分別為項(xiàng)目341、342和343);以及對象4 (項(xiàng)目360), 其包括塊6、7和8(分別為項(xiàng)目361、362和363)。如圖3C所示,消除重復(fù)的文件系統(tǒng)包括 塊1(項(xiàng)目371),其被項(xiàng)目331和353引用;塊2(項(xiàng)目372),其被項(xiàng)目332引用;塊3(項(xiàng) 目373),其被項(xiàng)目351引用;塊4(項(xiàng)目374),其被項(xiàng)目352引用;塊5 (項(xiàng)目381),其被項(xiàng) 目341引用;塊6(項(xiàng)目382),其被項(xiàng)目342和361引用;塊7(項(xiàng)目383),其被項(xiàng)目343和 362引用;以及塊8(項(xiàng)目384),其被項(xiàng)目363引用。參照圖3D,在示例性實(shí)施例中,分割步 驟322將如圖3C所示的消除重復(fù)的文件系統(tǒng)分割為分區(qū)1 (項(xiàng)目370)(子圖)和分區(qū)2 (項(xiàng) 目380)(另一子圖),使得分區(qū)1 (項(xiàng)目370)和分區(qū)2 (項(xiàng)目380)沒有互連。有互連的子圖參照圖4A,在示例性實(shí)施例中,分割步驟322包括如果各子圖當(dāng)中的一子圖不能 完全存儲在分離的存儲介質(zhì)上,則步驟412 標(biāo)識使得該子圖連接的數(shù)據(jù);以及步驟414 重 新復(fù)制使得該子圖連接的數(shù)據(jù)。在示例性實(shí)施例中,如果子圖可以適合分離的存儲介質(zhì),則 它足夠小。對于不能完全分離或沒有小到足夠適合分離的存儲介質(zhì)的圖形,可以標(biāo)識和重 新復(fù)制使得該圖形的各子圖連接的各條數(shù)據(jù),以用于隨每個(gè)引用的圖形分區(qū)存儲。參照圖4B,在示例性實(shí)施例中,分割步驟322還包括步驟422 隨所有引用的圖形 分區(qū)保存重新復(fù)制的數(shù)據(jù)。在示例性實(shí)施例中,本發(fā)明將重新復(fù)制的數(shù)據(jù)保存到備份目標(biāo)。 每個(gè)圖形分區(qū)可存儲在分離的介質(zhì)(例如,單獨(dú)的磁存儲介質(zhì)(例如,磁帶)或單獨(dú)的光學(xué) 存儲介質(zhì)(例如,DVD))上,并且每個(gè)圖形分區(qū)將僅引用該圖形分區(qū)駐留的分開的一塊介質(zhì) 上包含的數(shù)據(jù)。參照圖4C,例如,消除重復(fù)的文件系統(tǒng)包括對象1 (項(xiàng)目430),其包括塊1和2 (分 別為項(xiàng)目431和432);對象3(項(xiàng)目450),其包括塊3、4和1(分別為項(xiàng)目451、452和453); 對象2 (項(xiàng)目440),其包括塊5、6和7 (分別為項(xiàng)目441、442和443);以及對象4 (項(xiàng)目460), 其包括塊3、6、7和8 (分別為項(xiàng)目461、462、463和464)。如圖4C所示,消除重復(fù)的文件系 統(tǒng)包括塊1 (項(xiàng)目471),其被項(xiàng)目341和453引用;塊2(項(xiàng)目472),其被項(xiàng)目432引用;塊 3 (項(xiàng)目473),其被項(xiàng)目451和461引用(實(shí)例互連);塊4 (項(xiàng)目474),其被項(xiàng)目452引用; 塊5 (項(xiàng)目481),其被項(xiàng)目441引用;塊6 (項(xiàng)目482),其被項(xiàng)目442和462引用;塊7 (項(xiàng) 目483),其被項(xiàng)目443和463引用;以及塊8 (項(xiàng)目484),其被項(xiàng)目464引用。參照圖4D, 在示例性實(shí)施例中,即使圖4C中的消除重復(fù)的文件系統(tǒng)包括從塊3(項(xiàng)目473)被項(xiàng)目451和461引用而導(dǎo)致的互連的實(shí)例,分割步驟322也將圖4C所示的消除重復(fù)的文件系統(tǒng)分割 為分區(qū)1 (項(xiàng)目470)(子圖)和分區(qū)2 (項(xiàng)目480)(另一子圖),使得通過重新復(fù)制項(xiàng)目473 到塊3(項(xiàng)目485)中、并允許塊3(項(xiàng)目485)被項(xiàng)目461引用,分區(qū)1 (項(xiàng)目470)和分區(qū) 2(項(xiàng)目480)沒有互連。標(biāo)識數(shù)據(jù)參照圖5A,在示例性實(shí)施例中,標(biāo)識步驟412包括步驟512 找到使得子圖連接的 數(shù)據(jù)塊的最小集合。本發(fā)明可通過使用標(biāo)準(zhǔn)圖形算法來執(zhí)行查找,以找到最小切割。本發(fā)明 可通過使用最小切割圖形分割算法來執(zhí)行查找,以找到需要被重新復(fù)制的數(shù)據(jù)的最小量。 參照圖5B,在示例性實(shí)施例中,標(biāo)識步驟412包括步驟522 選擇具有高引用計(jì)數(shù)的數(shù)據(jù)塊。 特定數(shù)據(jù)塊的引用計(jì)數(shù)是該塊被文件系統(tǒng)中的對象引用的次數(shù)的計(jì)數(shù)。特定數(shù)據(jù)塊的引用 計(jì)數(shù)還是文件系統(tǒng)中引用該塊的文件的數(shù)量的計(jì)數(shù)。存儲每個(gè)分區(qū)參照圖6,在示例性實(shí)施例中,存儲步驟214包括步驟610 將分區(qū)在分離存儲介質(zhì) 上組合,直到每個(gè)介質(zhì)滿。圖形分區(qū)可在分離介質(zhì)的單個(gè)實(shí)例上組合,直到該介質(zhì)滿,但是 沒有部分分區(qū)將存儲在分離的一塊介質(zhì)上。參照圖7A,在示例性實(shí)施例中,存儲步驟214包括步驟712 將分區(qū)保存在分離 的存儲介質(zhì)上,其中各分區(qū)中圖形互連量最小。參照圖7B,在示例性實(shí)施例中,保存步驟 712包括步驟722 計(jì)算(account for)可以同時(shí)安裝在計(jì)算機(jī)系統(tǒng)上的分離的存儲介質(zhì) 的數(shù)量;以及步驟724 考慮分離的存儲介質(zhì)的拆卸和重新安裝的性能懲罰(performance penalty)。本發(fā)明可容忍圖互連的最小量依賴于(i)可同時(shí)安裝的分離介質(zhì)的數(shù)量;以及 ( )拆卸和/或重新安裝分離介質(zhì)的性能懲罰。傳輸本發(fā)明還提供了用于傳輸計(jì)算機(jī)系統(tǒng)的消除重復(fù)計(jì)算機(jī)文件系統(tǒng)的方法和系統(tǒng)。 在示例性實(shí)施例中,該方法和系統(tǒng)包括(1)將文件系統(tǒng)劃分為分區(qū);以及(2)對于分離的傳 輸信道組裝每個(gè)分區(qū)。參照圖8,在示例性實(shí)施例中,本發(fā)明包括步驟812 將文件系統(tǒng)劃分 為分區(qū);以及步驟814,將每個(gè)分區(qū)組裝用于分離的傳輸信道??偨Y(jié)本發(fā)明可采取完全硬件實(shí)施例、完全軟件實(shí)施例、或包含硬件和軟件元素的實(shí)施 例的形式。在示例性實(shí)施例中,本發(fā)明以軟件形式實(shí)現(xiàn),其包括但不限于固件、駐留軟件和 微代碼。此外,本發(fā)明可采用可從計(jì)算機(jī)可用或計(jì)算機(jī)可讀介質(zhì)訪問的計(jì)算機(jī)程序產(chǎn)品的 形式,該計(jì)算機(jī)可用或計(jì)算機(jī)可讀介質(zhì)提供程序代碼,用于由計(jì)算機(jī)系統(tǒng)或任何指令執(zhí)行 系統(tǒng)使用或結(jié)合計(jì)算機(jī)系統(tǒng)或任何指令執(zhí)行系統(tǒng)使用。計(jì)算機(jī)程序產(chǎn)品包括實(shí)現(xiàn)本發(fā)明的 方法的指令。計(jì)算機(jī)可用或計(jì)算機(jī)可讀介質(zhì)可以是可包含、存儲、傳遞、傳播或傳送程序以 用于由指令執(zhí)行系統(tǒng)、裝置或設(shè)備使用或結(jié)合指令執(zhí)行系統(tǒng)、裝置或設(shè)備使用的任何裝置。 介質(zhì)可以是電、磁、光、電磁、紅外或半導(dǎo)體系統(tǒng)(或裝置或設(shè)備)或傳播介質(zhì)。計(jì)算機(jī)可讀 介質(zhì)的示例包括半導(dǎo)體或固態(tài)存儲器、磁帶、可移除計(jì)算機(jī)盤、隨機(jī)存取存儲器(RAM)、只讀 存儲器(ROM)、剛性磁盤和光盤。光盤的當(dāng)前示例包括致密盤-只讀存儲器(CD-ROM)、致密 盤-讀 / 寫(CD-R/W)和 DVD。
7
適于存儲和/或執(zhí)行程序代碼的計(jì)算機(jī)系統(tǒng)包括直接或通過系統(tǒng)總線間接耦合 到存儲器元件的至少一個(gè)處理器。存儲器元件包括系統(tǒng)代碼的實(shí)際執(zhí)行期間采用的本地存 儲器、大容量存儲和高速緩存,所述高速緩存提供至少一些程序代碼的暫時(shí)存儲,以減少執(zhí) 行期間從大容量存儲取回代碼的次數(shù)。輸入/輸出(I/O)設(shè)備(包括但不限于鍵盤、顯示 器、指向設(shè)備等)可直接或通過中間I/O控制器耦合到計(jì)算機(jī)系統(tǒng)。網(wǎng)絡(luò)適配器也可耦合 到計(jì)算機(jī)系統(tǒng),以便使得計(jì)算機(jī)系統(tǒng)變?yōu)槟軌蛲ㄟ^中間私有或公開網(wǎng)絡(luò),耦合到其他計(jì)算 機(jī)系統(tǒng)或遠(yuǎn)程打印機(jī)或存儲設(shè)備。調(diào)制解調(diào)器、線纜調(diào)制解調(diào)器和以太網(wǎng)卡僅僅是一些當(dāng) 前可用的網(wǎng)絡(luò)適配器的類型。計(jì)算機(jī)系統(tǒng)還可包括操作系統(tǒng)和計(jì)算機(jī)文件系統(tǒng)。
權(quán)利要求
一種備份計(jì)算機(jī)系統(tǒng)的消除重復(fù)計(jì)算機(jī)文件系統(tǒng)的方法,包括使用圖形分割算法,將文件系統(tǒng)劃分為分區(qū);將文件系統(tǒng)分割為沒有互連的子圖;以及將每個(gè)分區(qū)存儲在分離的存儲介質(zhì)上;其中,分割包括,如果各子圖中的子圖不能完全存儲在分離的存儲介質(zhì)上,則標(biāo)識使得子圖連接的數(shù)據(jù);重新復(fù)制使得子圖連接的數(shù)據(jù);以及隨所有引用的圖形分區(qū)保存重新復(fù)制的數(shù)據(jù)。
2.如權(quán)利要求1所述的方法,其中標(biāo)識包括找到使得子圖連接的數(shù)據(jù)塊的最小集合。
3.如權(quán)利要求1或2所述的方法,其中標(biāo)識包括選擇具有高引用計(jì)數(shù)的數(shù)據(jù)塊。
4.如前面任一權(quán)利要求所述的方法,其中存儲包括在分離存儲介質(zhì)上組合分區(qū),直 到每個(gè)介質(zhì)滿。
5.如前面任一權(quán)利要求所述的方法,其中存儲包括將各分區(qū)保存在分離存儲介質(zhì) 上,其中各分區(qū)中的圖形互連量最小。
6.如權(quán)利要求5所述的方法,其中保存包括計(jì)數(shù)可同時(shí)安裝在計(jì)算機(jī)系統(tǒng)上的分離存儲介質(zhì)的數(shù)量;以及 考慮分離存儲介質(zhì)的拆卸和重新安裝的性能懲罰。
7. 一種備份計(jì)算機(jī)系統(tǒng)的消除重復(fù)計(jì)算機(jī)文件系統(tǒng)的系統(tǒng),包括劃分模塊,包括配置為使用圖形分割算法的使用模塊,所述圖形分割算法配置為將文 件系統(tǒng)劃分為分區(qū);分割模塊,配置為將文件系統(tǒng)分割為沒有互連的子圖;以及存儲模塊,配置為將每個(gè)分區(qū)存儲在分離的存儲介質(zhì)上;其中,如果各子圖中的子圖不能完全存儲在分離的存儲介質(zhì)上,則分割模塊包括標(biāo)識模塊,配置為標(biāo)識使得子圖連接的數(shù)據(jù);重新復(fù)制模塊,配置為重新復(fù)制使得子圖連接的數(shù)據(jù);以及保存模塊,配置為隨所有引用的圖形分區(qū)保存重新復(fù)制的數(shù)據(jù)。
8.如權(quán)利要求7所述的系統(tǒng),其中標(biāo)識模塊包括查找模塊,配置為找到使得子圖連接 的數(shù)據(jù)塊的最小集合。
9.如權(quán)利要求7或8所述的系統(tǒng),其中標(biāo)識模塊包括選擇模塊,配置為選擇具有高引用 計(jì)數(shù)的數(shù)據(jù)塊。
10.如權(quán)利要求7-9的任一所述的系統(tǒng),其中存儲模塊包括組合模塊,配置為在分離 存儲介質(zhì)上組合分區(qū),直到每個(gè)介質(zhì)滿。
11.如權(quán)利要求10所述的系統(tǒng),其中存儲模塊包括保存模塊,將各分區(qū)保存在分離存 儲介質(zhì)上,其中各分區(qū)中的圖形互連量最小。
12.如權(quán)利要求11所述的系統(tǒng),其中保存模塊包括計(jì)算模塊,配置為計(jì)數(shù)可同時(shí)安裝在計(jì)算機(jī)系統(tǒng)上的分離存儲介質(zhì)的數(shù)量;以及 考慮模塊,配置為考慮分離存儲介質(zhì)的拆卸和重新安裝的性能懲罰。
13. 一種計(jì)算機(jī)程序,包括當(dāng)加載到計(jì)算機(jī)系統(tǒng)并在其上執(zhí)行時(shí)、使得所述計(jì)算機(jī)系統(tǒng) 執(zhí)行根據(jù)權(quán)利要求1到6的任一的方法的所有步驟的計(jì)算機(jī)程序代碼。
全文摘要
本發(fā)明提供了備份計(jì)算機(jī)系統(tǒng)的消除重復(fù)計(jì)算機(jī)文件系統(tǒng)的方法和系統(tǒng)。在示例性實(shí)施例中,該方法和系統(tǒng)包括(1)將文件系統(tǒng)劃分為分區(qū);以及(2)將每個(gè)分區(qū)存儲在分離存儲介質(zhì)上。
文檔編號G06F11/14GK101911020SQ200880123989
公開日2010年12月8日 申請日期2008年12月17日 優(yōu)先權(quán)日2008年1月4日
發(fā)明者克萊門斯·德魯斯, 馬克·A·史密斯 申請人:國際商業(yè)機(jī)器公司