欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

存儲子系統(tǒng)及其控制方法

文檔序號:6480686閱讀:216來源:國知局
專利名稱:存儲子系統(tǒng)及其控制方法
技術領域
本發(fā)明涉及存儲子系統(tǒng)及其控制方法,尤其涉及采用冗余化路徑結構、具 有通過多個交換設備形成的連接路徑的存儲子系統(tǒng)以及該連接路徑的控制方 法。
背景技術
存儲子系統(tǒng)是對主計算機提供數據存儲服務的裝置。存儲子系統(tǒng)典型地由 用于存儲數據的硬盤驅動器群和對其進行控制的磁盤控制器構成。磁盤控制器
具備用于控制存儲子系統(tǒng)全體的處理器、用于與主計算機連接的前端接口、 用于連接硬盤驅動器群的后端接口 。典型地在兩接口之間配置用于對用戶數據 進行高速緩沖存儲的高速緩沖存儲器。另外,硬盤驅動器群經由多段配置的交 換電路被設置成陣列狀。
存儲子系統(tǒng)一般用于關鍵(mission critical)業(yè)務,所以要求高可靠性、 高可用性。因此,從耐故障性的觀點出發(fā),典型的是冗余地構成存儲子系統(tǒng)內 的組件。例如,在后端接口中將用于訪問硬盤驅動器的路徑二重化,即使某條 路徑發(fā)生了故障,也可以用另一條路徑繼續(xù)運用系統(tǒng)。另外,在存儲子系統(tǒng)內 發(fā)生了故障的情況下,馬上確定發(fā)生該故障的組件,使故障恢復。
下述專利文獻1公開了這樣的存儲控制裝置監(jiān)視連接有磁盤驅動器的交 換電路的多個端口,當在某個端口中檢測出錯誤時,通過設置在控制器中的故 障恢復控制部確定故障部位,并進行故障恢復處理。
存儲子系統(tǒng)一般被用于關鍵業(yè)務,所以要求高可靠性、高可用性。構成存 儲子系統(tǒng)的組件的故障從概率上看是會發(fā)生的,這無法避免,因此從系統(tǒng)設計 的觀點出發(fā),需要充分考慮耐故障性。
例如,如上所述,存儲子系統(tǒng)即使在二重化的路徑的一方中發(fā)生了故障的 情況下,也可以經由剩下的另一方路徑來訪問硬盤驅動器,由此能夠繼續(xù)運用 系統(tǒng),能夠經得住故障。然而,在這種現(xiàn)有的存儲子系統(tǒng)中存在如下問題二重化的路徑分別是整 個地獨立地構成,因此, 一旦發(fā)生故障時,無法使用發(fā)生該故障的路徑本身, 故障的影響會波及較大范圍。
另外,存在如下問題在該故障恢復之前的期間內,僅通過另一方路徑進 行運用,因此無法應對進一步的故障。因此,萬一在剩下的路徑中發(fā)生了故障 時,會引起系統(tǒng)停機。
而且,在僅通過另 一方路徑進行的運用中,訪問負荷集中于該另 一方路徑, 因此存在吞吐性能降低的問題。
專利文獻1特開2007-141185號公報

發(fā)明內容
因此,鑒于上述問題,本發(fā)明的目的在于,提供一種可以在提高可靠性以 及可用性的同時,將系統(tǒng)性能的惡化抑制到最小限度的存儲子系統(tǒng)及其控制方 法。
更具體而言,本發(fā)明的一個目的在于,提供一種即使在存儲子系統(tǒng)內發(fā)生 了故障時,也能夠將故障的影響抑制到最小限度的存儲子系統(tǒng)及其控制方法。
另夕卜,本發(fā)明的另一目的在于,提供一種即使在存儲子系統(tǒng)內發(fā)生了故障 時,在故障恢復之前的期間內,通過利用未發(fā)生故障的組件盡可能地維持冗余 結構來分散負荷,能夠防止吞吐性能降低的存儲子系統(tǒng)及其控制方法。
本發(fā)明的其它目的通過后述的實施方式的記載可以明了 。
本發(fā)明是鑒于上述問題而完成的,其主旨是本發(fā)明的存儲子系統(tǒng)在針對 驅動器單元的連接路徑中檢測出故障部位時,以繞過或者避開該故障部位的方 式重新構建該連接路徑。
即,遵從某觀點的本發(fā)明的一種存儲子系統(tǒng),其包含控制經由多個第1 交換設備連接的多個驅動器單元的第1控制器、以及控制經由與該多個第1 交換設備對應的多個第2交換設備連接的相應的多個驅動器單元的第2控制 器,該存儲子系統(tǒng)具有將該多個第1交換設備和該對應的多個第2交換設備相 互連接起來的連接路徑。該存儲系統(tǒng)當檢測出故障的發(fā)生時,確定連接路徑中 的故障部位,為了繞過該故障部位而變更交換設備的連接結構。
由此,存儲子系統(tǒng)即使在內部發(fā)生了故障時,也能夠將故障的影響抑制到最小限度。另外,即使發(fā)生了這種故障,存儲系統(tǒng)在故障恢復之前的期間內, 能夠通過未發(fā)生故障的組件來盡可能地維持冗余結構,因此可以分散負荷,能 夠防止吞吐性能的降低。
另外,遵從另一觀點的本發(fā)明的一種存儲子系統(tǒng),其具備具有用于存儲 數據的存儲介質的多個驅動器單元;具有多個端口、并在該多個端口中至少一
個端口上連接所述多個驅動器單元中至少一個驅動器單元的多個第一交換設
備;連接所述多個第一交換設備的至少一個交換設備、并控制所述多個驅動器 單元的第一磁盤控制器;具有多個端口、并在該多個端口中至少一個端口上連 接所述多個驅動器單元中至少一個驅動器單元的多個第二交換i殳備,該多個第 二交換設備的每一個與所述多第個一交換設備的每一個相對應;以及連接所述 多個第二交換設備中至少一個交換設備、并控制所述多個驅動器單元的第二磁 盤控制器。并且,該存儲子系統(tǒng)具有這樣的結構所述多個第一交換設備的各 個交換設備中的所述多個端口中至少一個端口 、與所述對應的多個第二交換設 備的各個交換設備中的所述多個端口中至少一個端口相互連接。
而且,遵從另一觀點的本發(fā)明的一種存儲子系統(tǒng),其具備具有用于存儲 數據的存儲介質的多個第一驅動器單元;具有用于存儲數據的存儲介質的多個 第二驅動器單元;具有多個端口、并在該多個端口中至少一個上連接所述多個 第 一驅動器單元中至少 一個第 一驅動器單元的多個第 一交換設備;具有多個端 口 、并在該多個端口中至少一個端口上連接所述多個第 一驅動器單元中至少一 個第一驅動器單元的多個第二交換設備,該多個第二交換設備的每一個與所述 多個第一交換設備的每一個相對應;具有多個端口、并在該多個端口中至少一 個端口上連接所述多個第二驅動器單元中至少一個第二驅動器單元的多個第 三交換設備;具有多個端口、并在該多個端口中至少一個端口上連4妄所述多個 第二驅動器單元中至少一個第二驅動器單元的多個第四交換設備;第 一磁盤控 制器,其連接所述多個第一交換設備中至少一個第一交換設備、控制所述多個 第 一驅動器單元,并且連接所述多個第三交換設備中至少一個第三交換設備、 控制所述多個第二驅動器單元;以及第二磁盤控制器,其連接所述多個第二交 換設備中至少一個第二交換設備、控制所述多個第一驅動器單元,并且連接所 述多個第四交換設備中至少一個第四交換設備、控制所述多個第二驅動器單元。并且,該存儲子系統(tǒng)具有這樣的結構所述多個第一交換設備的各個第一
交換設備中的所述多個端口中至少一個端口 、與所述對應的多個第二交換設備 的各個第二交換設備中的所述多個端口中至少一個端口相連,所述多個第三交
換設備的各個第三交換設備中的所述多個端口中至少一個端口 、與所述對應的 多個第四交換設備的各個第四交換設備中的所述多個端口中至少一個端口相 連。
而且,遵從另一觀點的本發(fā)明還作為方法發(fā)明來把握。即,本發(fā)明是一種 包含第 一控制器和第二控制器的存儲子系統(tǒng)中的交換設備間連接路徑的控制 方法,所述第一控制器控制經由串聯(lián)連接的多個第一交換設備而連接的多個驅 動器單元,所述第二控制器控制經由串聯(lián)連接的、與所述多個第一交換設備對 應的多個第二交換設備而連接的所述多個驅動器單元。該控制方法包含以下步 驟所述第一控制器以及所述第二磁盤控制器中至少一方,經由與自身連接的 所述多個交換設備,向所述多個驅動器單元中至少一個驅動器單元發(fā)送基于用 于訪問的命令的數據幀;所述至少一方的磁盤控制器,接收應答所述命令而經 由所述多個交換設備發(fā)送來的數據幀,并檢查該接收到的數據幀中的錯誤;所 述至少一方的磁盤控制器,當所述檢查的結果是在所述數據幀中檢查出錯誤 時,對所述多個交換設備發(fā)送錯誤信息發(fā)送請求;所述至少一方的磁盤控制器, 接收應答所述錯誤信息發(fā)送請求而發(fā)送來的錯誤信息;所述至少一方的磁盤控 制器,根據所述接收到的錯誤信息,將檢測出錯誤的交換設備以及該交換設備 的端口確定為故障部位;以及所述至少一方的磁盤控制器,根據所述確定的故 障部位,按照預定的連接路徑重構模式來變更所述交換設備間連接路徑。 . 根據本發(fā)明,存儲子系統(tǒng)可以在提供可靠性以及可用性的同時,將系統(tǒng)性 能的惡化限制到最小限度。
本發(fā)明的其它技術特征及優(yōu)點,通過參照附圖而說明的以下實施方式可以 進一步明了。


圖1是用于說明本發(fā)明的一個實施方式的存儲子系統(tǒng)的整體結構的圖。 圖2是表示本發(fā)明的一個實施方式的磁盤控制器的存儲器單元的內容的 一例的圖。圖3是用于說明本發(fā)明的一個實施方式的存儲子系統(tǒng)的交換設備的結構 的圖。
圖4是表示本發(fā)明的一個實施方式的交換設備的錯誤模式表的一例的圖。 圖5是用于說明本發(fā)明的一個實施方式的交換設備的錯誤寄存器的內容 的圖。
圖6是表示本發(fā)明的一個實施方式的磁盤控制器中保存的連接路徑圖的 一例的圖。
圖7是表示本發(fā)明的一個實施方式的磁盤控制器中保存的連接路徑圖的 一例的圖。
圖8是表示本發(fā)明的一個實施方式的磁盤控制器中保存的連接路徑重構 表的一例的圖。
圖9是用于說明本發(fā)明的一個實施方式的交換設備中的錯誤檢查處理的 流程圖。
圖IO是用于說明本發(fā)明的一個實施方式的磁盤控制器的1/0處理的流程圖。
圖11是用于說明本發(fā)明的一個實施方式的磁盤控制器的故障恢復處理的 流程圖。
圖12是用于說明本發(fā)明的一個實施方式的存儲子系統(tǒng)的伴隨后端的I/O
處理的錯誤檢查時的處理的順序圖。
圖13是表示本發(fā)明的一個實施方式的存儲子系統(tǒng)中的后端的示意圖。 圖14是表示本發(fā)明的一個實施方式的存儲子系統(tǒng)中的后端的示意圖。 圖15是表示本發(fā)明的一個實施方式的磁盤控制器中保存的連接路徑圖的
一例的圖。
圖16是表示本發(fā)明的一個實施方式的磁盤控制器中保存的連接路徑圖的 一例的圖。
圖17是表示本發(fā)明的一個實施方式的存儲子系統(tǒng)中的后端的示意圖。 圖18是表示本發(fā)明的一個實施方式的存儲子系統(tǒng)中的后端的示意圖。 圖19是表示本發(fā)明的 一個實施方式的存儲子系統(tǒng)中的后端的示意圖。 圖20是表示本發(fā)明的一個實施方式的存儲子系統(tǒng)中的后端的示意圖。圖21是表示本發(fā)明的一個實施方式的存儲子系統(tǒng)中的后端的示意圖。圖22是表示本發(fā)明的一個實施方式的存儲子系統(tǒng)的結構的圖。圖23是表示本發(fā)明的一個實施方式的存儲子系統(tǒng)1中的后端的示意圖。圖24是用于說明本發(fā)明的一個實施方式的磁盤控制器的I/O處理的流程圖。
圖25是用于說明本發(fā)明的一個實施方式的磁盤控制器的故障恢復處理的流程圖。
圖26是用于說明本發(fā)明的一個實施方式的磁盤控制器的忙碌狀態(tài)監(jiān)視處理的流程圖。符號說明
1:存儲子系統(tǒng);12、 120: 〃磁盤控制器;121:通道適配器;122:數據控制器;123:磁盤適配器;124:處理器;125:存儲器單元;126: LAN接口;127:總線;2A、 2B:網絡;3:主計算機;4:管理裝置;11:存儲設備;110:驅動器單元;in:硬盤驅動器;112:控制電路。
具體實施例方式
接下來,參照附圖來說明本發(fā)明的實施方式。第1實施方式
圖l是用于說明本發(fā)明的一個實施方式的存儲子系統(tǒng)的全體結構的圖。該圖中所示的存儲子系統(tǒng)1經由網絡2A與主計算機3相連,形成了計算機系統(tǒng)。存儲子系統(tǒng)1還經由管理用網絡2B與管理裝置4相連。
網絡2A例如可以使用LAN、因特網或SAN (Storage Area Network)的任意一種,典型地包含網絡交換機或集線器等而構成。在本實施方式中,網絡2A由使用了光纖通道協(xié)議的SAN (FC-SAN)構成,管理用網絡2B由LAN構成。
主計算機3具備處理器、主存儲器、通信接口、本地輸入輸出裝置等硬件資源,并且具備設備驅動程序或操作系統(tǒng)(OS)、應用程序等軟件資源(未圖示)。由此,主計算機3在處理器的控制下執(zhí)行各種應用程序,通過與硬件資源的協(xié)同作用,在訪問存儲子系統(tǒng)1的同時實現(xiàn)希望的處理。
存儲子系統(tǒng)1是向主計算機3提供數據存儲服務的輔助存儲裝置。存儲子系統(tǒng)1具備包含存儲數據的存儲介質的存儲設備11、和對其進行控制的磁盤控制器12。存儲設備11和磁盤控制器12經由磁盤通道相連。磁盤控制器12的內部結構被二重化,磁盤控制器12可以使用兩個通道(連接路徑)對存儲設備ll進行訪問。
存儲設備11包含一個以上的驅動器單元110而構成。驅動器單元110例如由硬盤驅動器111以及控制該硬盤驅動器111的驅動的控制電路112構成。硬盤驅動器111例如被嵌入安裝在驅動器單元110的機箱內。也可以代替硬盤驅動器111而使用閃速存儲器等固態(tài)裝置。與磁盤控制器12中的二重化路徑結構相對應地,控制電路112也被二重化。
驅動器單元110典型地經由交換設備(擴展器)13與磁盤控制器12相連。通過使用多個交換設備(switching device) 13,能夠以各種形態(tài)連接多個驅動器單元110。在本實施方式中,在串聯(lián)連接的多個交換設備13的每一個上連接有驅動器單元IIO。即,磁盤控制器120經由在其下屬的串聯(lián)連接的多個交換設備13來訪問驅動器單元110。因此,通過串聯(lián)地追加連接交換設備,能夠容易地增設驅動器單元110,能夠容易地擴展存儲子系統(tǒng)1的存儲容量。存儲子系統(tǒng)1內的驅動器單元110的連接形態(tài)通過后述的連接路徑圖被定義。
驅動器單元110的硬盤驅動器111典型地一艮據預定的RAID結構(例如RAID5)構成RAID組,在RAID控制下被訪問。例如通過安裝在磁盤控制器12中的RAID控制器(未圖示)進行RAID控制。RAID組可以跨越多個驅動器單元110。屬于同一RAID組的硬盤驅動器111被主計算機3識別為1個虛擬邏輯設備。
磁盤控制器12是控制存儲子系統(tǒng)1全體的系統(tǒng)組件,其主要作用是根據來自主計算機3的訪問請求,執(zhí)行針對存儲設備11的1/0處理。磁盤控制器12還根據來自管理裝置4的各種請求,執(zhí)行與存儲子系統(tǒng)1的管理有關的處理。
如上所述,在本實施方式中,從耐故障性的觀點出發(fā),將磁盤控制器12內的組件二重化。以下,當指的是二重化的各個磁盤控制器12時,使用"磁盤控制器120"。另外,當指的是磁盤控制器120中的個體時,使用"第l磁盤控制器120"以及"第2磁盤控制器120"。各磁盤控制器120包含通道適配器121、數據控制器122、》茲盤適配器 123、處理器124、存儲器單元125、和LAN接口 126。 ^磁盤控制器120彼此 以能夠相互通信的方式通過總線127相連。
通道適配器(CHA) 121是用于經由網絡2A連接主計算機3的接口,控 制與主計算機3之間的遵從預定的協(xié)議的數據通信。通道適配器121,當收到 來自主計算機的例如寫入命令時,經由數據控制器122在存儲器單元125中寫 入該寫入命令以及遵從該寫入命令的數據。通道適配器121有時也被稱為主機 4妄口或前端4妄口。
數據控制器122是磁盤控制器120內的組件間的接口,控制組件間的數據 收發(fā)。
磁盤適配器(DKA) 123是用于連接驅動器單元110的接口 ,磁盤適配器 123按照來自主計算機3的I/O命令,控制與驅動器單元110之間的遵從預定 的協(xié)議的數據通信。即,磁盤適配器123周期性地檢查存儲器單元125,當在 存儲器單元125上發(fā)現(xiàn)I/0命令時,按照該命令訪問驅動器單元110。
更具體而言,磁盤適配器123例如在存儲器單元125上發(fā)現(xiàn)寫入命令時, 為了將該寫入命令指定的存儲器單元125上的數據降級到存儲設備11 (即硬 盤驅動器111的預定存儲區(qū)域),而對存儲設備11進行訪問。另外,磁盤適配 器123,當在存儲器單元125上發(fā)現(xiàn)讀出命令時,為了將該讀出命令指定的存 儲設備11上的數據升級到存儲器單元125上,而對存儲設備11進行訪問。
本實施方式的磁盤適配器123除了上述I/0功能外,還安裝了故障恢復功 能。例如作為固件來實現(xiàn)這些功能。
磁盤適配器123有時也被稱為,茲盤接口或后端接口 。
處理器124執(zhí)行加載在存儲器單元125上的各種控制程序,來管理磁盤控 制器120 (即存儲子系統(tǒng)1)全體的動作。處理器124也可以是多核型的處理 器。
存儲器單元125作為處理器124的主存儲器來工作,并且作為通道適配器 121以及磁盤適配器123的高速緩沖存儲器來工作。存儲器單元125例如由 DRAM等易失性存儲器構成,或者由閃速存儲器等非易失性存儲器構成。存 儲器單元125例如圖2所示,存儲存儲子系統(tǒng)l自身的系統(tǒng)結構信息。系統(tǒng)結構信息包含邏輯巻結構信息或RAID結構信息、連接路徑圖、連接路徑重構 表等。關于系統(tǒng)結構信息,例如在對存儲子系統(tǒng)l接通電源時,在處理器U4 的控制下,按照初始處理,從硬盤驅動器111的特定存儲區(qū)域讀出該系統(tǒng)結構 信息,并將其載入存儲器單元125。連接路徑圖以及連接路徑重構表在后面進 行描述。
LAN接口 126是用于經由LAN連接管理裝置4的接口電路。LAN接口例 如可以采用遵從TCP/IP及以太網(注冊商標)的網絡接口。
管理裝置4是系統(tǒng)管理者用于管理存儲子系統(tǒng)1全體的裝置,其典型地是 通過安裝有管理程序的通用計算機來構成。管理裝置4有時被稱為服務處理 器。在上述圖中,管理裝置4經由管理用網絡2B被設置在存儲裝置1的外側, 但不限于此,其也可以設置在存儲子系統(tǒng)1的內部?;蛘咭部梢詫⒋疟P控制器 120構成為包含與管理裝置4同等的功能。
系統(tǒng)管理者經由管理裝置4所提供的用戶界面向磁盤控制器發(fā)出指示,由 此能夠取得存儲子系統(tǒng)1的系統(tǒng)結構信息來進行參照,或者設定、變更系統(tǒng)結 構信息。例如,系統(tǒng)管理者能夠操作管理裝置4,配合硬盤驅動器的增設來設 定邏輯巻或虛擬巻,還能夠設定RAID結構。
圖3是用于說明本發(fā)明的一個實施方式的存儲子系統(tǒng)1內的交換i殳備13 的結構的圖。
如該圖所示,交換設備13具備多個端口部131、交換電路132、地址表 133和錯誤寄存器134。
端口部131包含用于進行外部連接的多個端口 1311、和錯誤才企查電路 1312。另外,雖未圖示,但端口部131包含緩沖器,可以臨時存儲接收數據幀 以及發(fā)送數據幀。在端口 1311上連接例如磁盤控制器120、其它交換設備13、 以及驅動器單元IIO。對各端口 1311分配了在交換設備13內固有的號碼(端 口號碼),以4吏其可以識別。端口號碼可以分配給每個端口部131。在上述圖 中表示了配置多個端口部131,并在它們上分別連接其它設備的情況,但不特 別局限于此,也可以在設置在單一端口部131中的多個端口 1311上連接各個 設備。
在交換設備13的內部,各端口 1311經由數據線D與交換電路132相連。另夕卜,錯誤檢查電路1312按照圖4所示的錯誤模式表,監(jiān)視各端口 1311中的 通信錯誤。具體而言,錯誤檢查電路1312檢查通過各端口 1311的數據幀中包 含的校驗位,當該校驗位與預定的錯誤模式一致時,將與該錯誤模式對應的錯 誤計數器的值增加。錯誤檢查電路1312在錯誤計數器的值超過預定的閾值時, 向錯誤信號線E輸出錯誤信息。錯誤信息經由交換電路132被寫入錯誤寄存 器134。
交換電路132包含由地址鎖存器以及選擇器構成的交換元件。交換電路 132對輸入的數據幀的頭信息進行解析,按照地址表133切換數據幀的送出目 的地。
錯誤寄存器134是用于保存從各端口部131的錯誤檢查電路1312送出的 錯誤信息的寄存器。
圖4是表示本發(fā)明的一個實施方式的交換設備13內的錯誤模式表的一例 的圖。錯誤模式表保存在錯誤檢查電路1312中。
如該圖所示,錯誤模式表400中,按通過預定的比特排列而定義的每個錯 誤模式401,將錯誤計數器值402以及預定的閾值403對應起來。若是正常的 數據通信,則錯誤模式401是數據幀內的校驗位中未出現(xiàn)的比特模式。錯誤計 數器值402是針對每個錯誤模式401而發(fā)生的錯誤的次數,閾值403是該錯誤 發(fā)生次數的允許上限值。
錯誤檢查電路1312,在數據幀內的校驗位與錯誤模式401的某一個相一 致時,認為發(fā)生了錯誤,將與該檢測出的錯誤模式401對應的錯誤計數器值 402增加。而且,錯誤檢查電路1312比較該錯誤計數器值402和閾值403,當 判斷為該錯誤計數器值402超過了閾值403時,向錯誤信號線E輸出錯誤信 自,
心o
圖5是用于說明本發(fā)明的一個實施方式的交換設備13內的錯誤寄存器134 的內容的圖。
如該圖所示,錯誤寄存器134存儲從錯誤檢查電路1312發(fā)送的錯誤信息。 錯誤信息例如由端口號碼1341、錯誤代碼1342、錯誤計數器值1343構成。端 口號碼1341是檢測出錯誤的端口 1311的端口號碼。錯誤代碼1342例如是分 配給每個錯誤模式401的代碼,通過參照錯誤代碼1342能夠識別錯誤的內容等。應答從外部的設備(例如通道適配器123)發(fā)送的錯誤信息發(fā)送請求,來 讀出錯誤寄存器134的錯誤信息。
圖6和圖7是表示本發(fā)明的一個實施方式的》茲盤控制器120的存儲器單元 125中保存的連接路徑圖600的一例的圖。連接路徑圖600被存儲在二重化的 磁盤控制器120的各自的存儲器單元125中。圖6表示第1磁盤控制器120 中的連接路徑圖600,圖7表示第2磁盤控制器120中的連接路徑圖600。磁 盤控制器120經由總線127能夠參照其它磁盤控制器120的連接路徑圖600。 連接路徑圖600是表示各交換設備13的各端口 1311上連接的設備以及該 端口 1311的狀態(tài)的表。即,連接路徑圖600包含設備名601、端口號碼602、 連接目的地設備名603和狀態(tài)604。設備名601是唯一分配給交換設備13的 識別名。端口號碼602是設置在交換設備13中的端口 1311的端口號碼。連接 目的地設備名603是為了唯一地識別與該端口 1311連接的設備而分配的識別 名。另外,狀態(tài)604表示該端口 1311是成為了有效狀態(tài)還是成為了無效狀態(tài)。 例如,如圖6所示,設備名"Switch-ll"所表示的交換設備13,將連接 目的地設備名"Controller-1"所表示的第l磁盤控制器120連接在了端口號碼 "#1"所表示的端口上。此時的該端口的狀態(tài)變成"有效"。同樣地,在 "Switch-ll"的端口 "#2"以及"#3"上分別連接有"HDD#1,,以及"HDD #2",另外,在端口 "#4"上連接有"Switch-12"。另外,在端口 "#5"上 什么也沒有連接,該端口的狀態(tài)為"無效"。
圖8是表示本發(fā)明的一個實施方式的磁盤控制器120的存儲器單元125中 保存的連接路徑重構表800的一例。連接路徑重構表800存儲在二重化的/f茲盤 控制器120的各自的存儲器單元125中。
即,如該圖所示,連接路徑重構表800由故障模式801和連接路徑重構模 式802構成。故障模式801是檢測出錯誤的故障部位的組合。故障部位是檢測 出錯誤的交換設備13的端口 1311。在本例中,故障模式801定義了與端口 1311 的組合對應的6個模式。圖中,"F"意思是該端口號碼的端口 1311是故障部 位,另外,"E"意思是該端口號碼的端口 1311為有效狀態(tài)(使用中)。另夕卜, 空欄意思是不管有效/無效狀態(tài),"-"意思是沒有變更。例如,在第一行中表 示的故障模式801表示正在使用端口號碼# 1以及# 4,在端口號碼# 1中檢測出了錯誤。
連接路徑重構模式802定義為了重新構建用于繞過故障部位的連接路徑 而需要的各交換設備13的端口 1311的狀態(tài)。圖中,陰影所示的部分表示為了 重新構建連接路徑,端口 1311的狀態(tài)發(fā)生了變更。
關于使用了連接路徑重構表800的連接路徑重構處理,參照圖13至圖21 進行詳細說明。
圖9是用于說明本發(fā)明的一個實施方式的交換設備13中的錯誤檢查處理 的流程圖。
即,如該圖所示,交換設備13的各端口部131的錯誤檢查電路1312監(jiān)視 數據幀是否被寫入端口部131的緩沖器(STEP901)。作為數據幀被寫入緩沖 器的情況,有交換設備13經由端口部131的端口 1311從外部接收數據幀的情 況、和該交換設備13內的其它端口部131接收到的數據幀經由交換電路132 被轉發(fā)來的情況。前者是數據幀的接收,后者是數據幀的發(fā)送。當在緩沖器中 寫入數據幀時,錯誤檢查電路1312參照錯誤模式表400 (STEP卯2),判斷該 數據幀內的校驗位(parity)是否與某個錯誤模式401相一致(STEP903 )。如 上所述,錯誤模式401是在數據通信方面異常的比特排列。
錯誤檢查電路1312,當判斷出該校驗位與任意錯誤模式401都不一致時 (STEP903中為否),認為數據幀正常,將該數據幀向下轉發(fā)(STEP906)。即, 若從外部接收數據幀,則錯誤檢查電路1312將該數據幀送出到交換電路132, 若向外部發(fā)送數據幀,則將數據送出到與端口 1311相連的其它{殳備。
與之相對,錯誤檢查電路1312,當判斷出該校驗位與某個錯誤模式401 一致時(STEP903中為是),將錯誤模式表400中的與一致的錯誤模式401對 應的錯誤計數器值402增加1 (STEP904)。然后,錯誤檢查電路1312將包含 檢測出該錯誤的端口 1311的端口號碼以及錯誤計數器值402的4晉誤信息輸出 到錯誤信號線E。接收該錯誤信息后,將該錯誤信息寫入^"誤寄存器134中。 然后,錯誤檢查電路1312將該數據幀向下轉發(fā)(STEP906 )。
圖IO是用于說明本發(fā)明的一個實施方式的磁盤控制器120的磁盤適配器 123的I/O處理的流程圖。本實施方式的磁盤適配器123的I/O處理包含檢測 出錯誤時的故障恢復處理。1/0處理例如通過I/0處理程序來實現(xiàn)?;蛘?,作為磁盤適配器123的固件的一部分來實現(xiàn)。
即,如該圖所示,磁盤適配器123取出存儲在存儲器單元125中的命令, 通過預定的協(xié)議變換來生成數據幀,并存儲在內部緩沖器中(STEP1001)。在 此,若命令是讀出命令,則生成基于該讀出命令的數據幀。另外,若命令是寫 入命令,則生成基于該寫入命令以及寫入對象數據的數據幀。
然后,磁盤適配器123針對該生成的數據幀進行錯誤檢查(STEP1002)。 磁盤適配器123中的錯誤檢查也與上述的交換設備13中的錯誤檢查處理一樣, 根據數據幀中包含的校驗位是否與預定的錯誤模式一致來進行。磁盤適配器 123,在錯誤檢查的結果是判斷出該數據幀沒有錯誤時(STEP1002中為否), 經由端口送出該數據幀(STEP1003 )。由此,該數據幀經由交換設備13,按照 該數據幀的頭信息被轉發(fā),最終被發(fā)送到發(fā)送目的地的驅動器單元110。
與之相對,磁盤適配器123,當判斷出該數據幀有錯誤時(STEP1002中 為是),向管理裝置4發(fā)送錯誤報告(STEP1008),并結束I/0處理。
磁盤適配器123接收應答所發(fā)送的數據幀而經由交換設備13從驅動器單 元110發(fā)送的數據幀,并存儲在內部緩沖器中(STEP1004)。接著,萬茲盤適配 器123針對接收到的數據幀進行錯誤檢查(STEP1005 )。
磁盤適配器123,當錯誤檢查的結果是判斷出該接收到的數據幀中沒有錯 誤時(STEP1005中為否),在對該接收到的數據幀進行協(xié)議變換后,寫入存儲 器單元125 (STEP1006)。例如,若命令是讀出命令,則將從硬盤驅動器111 的預定區(qū)域讀出的數據寫入存儲器單元125的高速緩沖存儲區(qū)域。
與之相對,磁盤適配器123,當判斷出該接收到的數據幀中有錯誤時 (STEP1005中為是),進行以下詳細描述的故障恢復處理(STEP1007)。即, 接收到的數據幀中包含錯誤模式,就是在數據幀的傳送路徑的某處有可能發(fā)生 了故障。故障恢復處理后,》茲盤適配器123嘗試再次發(fā)送數據幀(STEP1003 )。
故障恢復處理包含確定發(fā)生了故障的設備及其部位(故障部位)的處理、 以及構建繞過所確定的故障部位的新的連接路徑的處理。圖ll是用于說明本 發(fā)明的一個實施方式的磁盤控制器120的磁盤適配器123的故障恢復處理的流 程圖。
即,如該圖所示,磁盤適配器123,當判斷出接收到的數據幀中有錯誤時,經由端口廣播發(fā)送錯誤信息發(fā)送請求(STEP1101)。廣播發(fā)送是以連接路徑上 的所有設備作為發(fā)送目的地的發(fā)送。由此,錯誤信息發(fā)送請求被發(fā)送到與磁盤 適配器123串聯(lián)連接的所有交換設備13。接收到了錯誤信息發(fā)送請求的交換 設備13將存儲在自身的錯誤寄存器134中的錯誤信息發(fā)送到上位的交換設備 13,并且將錯誤信息發(fā)送請求轉發(fā)到下位的交換設備13。
磁盤適配器123接收應答錯誤信息發(fā)送請求而從各交換設備13發(fā)送來的 錯誤信息(STEP1102)。在本實施方式中,收集在各交換設備13的錯誤寄存 器134中保存的錯誤信息。從未檢測出錯誤的交換設備13發(fā)送的錯誤信息, 包含表示"沒有錯誤"的狀態(tài)。
然后,磁盤適配器123根據該收集到的錯誤信息來確定故障部位
(STEP1103)。通過錯誤信息中包含的交換設備13的設備名以及端口號碼來 確定故障部位。接著,磁盤適配器123生成包含所確定的故障部位的故障信息, 并將其發(fā)送到管理裝置4 ( STEP1104 )。接收到該故障信息后,管理裝置4在 用戶界面上顯示故障信息。
然后,/f茲盤適配器123為了重新構建繞過所確定的故障部位的連接路徑, 而參照存儲器單元中存儲的連接路徑重構表800,從所確定的故障部位的組合
(故障模式801)中確定連接路徑重構模式802 (STEP1105)。然后,磁盤適 配器123按照所確定的連接路徑重構模式802來更新連接路徑圖600
(STEP1105)。
如上所述,根據存儲設備ll內的連接路徑內的故障部位,構建繞過它的 新的連接路徑,存儲子系統(tǒng)1能夠在最大限度地確保二重化結構的同時繼續(xù)存 儲服務的運用。
圖12是用于說明本發(fā)明的一個實施方式的存儲子系統(tǒng)l的伴隨后端的I/0 處理的錯誤檢查時的處理的順序圖。
磁盤控制器120的磁盤適配器123,當從存儲器單元125取出命令時,在 進行預定的協(xié)議變換后,發(fā)送到串聯(lián)連接的最上位的交換設備13( STEP1201 )。
最上位的交換設備13,當接收到該命令時(STEP1202)進行接收錯誤檢 查,根據頭信息來選擇發(fā)送目的地,再進行發(fā)送錯誤檢查(STEP1203 ),并發(fā) 送到下位的交換設備13 (STEP1204)。在下位的交換設備13中同樣在接收到該命令時進行接收錯誤檢查,根據頭信息來選擇發(fā)送目的地,再進行發(fā)送錯誤
檢查,并發(fā)送到更下位的交換設備13。另外,各交換設備13,在該命令的發(fā) 送目的地是與自身連接的驅動器單元110時,將該命令發(fā)送到驅動器單元110。
驅動器單元110,當接收到該命令時(STEP1205 )進行基于該命令的訪問 處理(STEP1206),將對該命令的處理結果(命令應答)發(fā)送到交換設備13 (STEP1207)。例如若命令是寫入命令,則命令應答是寫入成功狀態(tài)。另外, 例如若命令是讀出命令,則命令應答成為從硬盤驅動器lll讀取的數據。交換 設備13當接收到命令應答時(STEP1208),同樣地進行接收錯誤檢查,根據 頭信息選擇發(fā)送目的地,再進行發(fā)送錯誤檢查(STEP1209),發(fā)送到上位的交 換設備13 (STEP1210)。于是,磁盤適配器123經由一個以上的交換設備13 從驅動器單元110接收命令應答(STEP1211 )。
接收到了命令應答的磁盤適配器123進行接收錯誤檢查(STEP1212)。在 本例中,假定在命令應答中檢測出錯誤。磁盤適配器123在檢測出錯誤時,廣 播發(fā)送錯誤信息發(fā)送請求(STEP1213)。廣播發(fā)送是以所有交換設備13作為 發(fā)送目的地的發(fā)送。
交換設備13,當接收到錯誤信息發(fā)送請求時(STEP1214),將自身的錯誤 寄存器134中存儲的錯誤信息發(fā)送到上位的交換設備13 ( STEP1215 ),并且將 錯誤信息發(fā)送請求轉發(fā)到下位的交換設備13 ( STEP1216 )。接收到了錯誤信息 發(fā)送請求的下位的交換設備13同樣地將自身的錯誤寄存器134中存儲的錯誤 信息發(fā)送到上位的交換設備13,并且將錯誤信息發(fā)送請求轉發(fā)到更下位的交 換設備。最下位的交換設備13,當接收到錯誤信息發(fā)送請求時(STEP1217), 將自身的錯誤寄存器134中存儲的錯誤信息發(fā)送到上位的交換設備13 (STEP1218)。另外,各交換設備13,當從下位的交換設備13接收到錯誤信 息時(STEP1219),將其轉發(fā)到上位的交換設備13 (STEP1220)。于是,磁盤 適配器123從連接路徑上的所有交換設備13收集錯誤信息(STEP1221 )。
接下來,說明本實施方式的基于故障恢復處理的連接路徑的重構的具體 例。圖13是表示本發(fā)明的一個實施方式的存儲子系統(tǒng)1中的后端的示意圖。
如該圖所示,關于本實施方式的存儲子系統(tǒng)1中的后端,二重化的》茲盤控 制器120的磁盤適配器123串聯(lián)地連接4個交換設備13,各交換設備13構成了連接了驅動器單元110的連接路徑。將這種后端接口的結構表示為例如圖6 和圖7所示的連4妄路徑圖600。
在以下的i兌明中,將第1》茲盤控制器120的》茲盤適配器123稱為"DKA-1", 將與其連接的4個交換設備13分別稱為"Switch-ll"、 "Switch-12"、 "Switch畫13"以及"Switch-14"。另外,將第2磁盤控制器120的磁盤適配器 123稱為"DKA-2",將與其連接的4個交換設備13分別稱為"Switch-21"、 "Switch-22"、 "Switch-23"以及"Switch-24"。而且,設在"Switch-ll"及 "Switch-21"上連接的驅動器單元110為"HDD弁l"及"HDD弁2,,,在"Switch-12" 及"Switch-22"上連接的驅動器單元為"HDD#3"及"HDD#4",在"Swtich-13" 及"Switch-23"上連接的驅動器單元為"HDD#5"及"HDD#6",在"Swtich-14" 及"Switch-24"上連接的驅動器單元為"HD面,,及"HDD#8"。另外,圖中 各交換設備13內的#后面的數字表示端口 1311的端口號碼。而且,實線箭頭 表示該端口 1311的狀態(tài)變?yōu)橛行?,虛線箭頭表示該端口 1311的狀態(tài)變?yōu)闊o效。 (具體例1 )
現(xiàn)在,如圖14所示,假定在Switch-12的端口號碼#1中發(fā)生了故障。 DKA-1如上所述發(fā)送^"誤信息發(fā)送請求,識別故障部位,此時,參照圖8所 示的連接路徑重構表800,確定為了繞過故障部位而需要的連接路徑重構模式 802。在本例中由于是Switch-12的端口號碼弁l的故障,因此確定為在第l行 中表示的連接路徑重構模式。因此,DKA-1分別將Switch-ll的端口號碼#5、 Switch-12的端口號碼# 5、 Switch-21的端口號碼# 5、以及Switch-22的端口 號碼#5有效化,并且將Switch-ll的端口號碼#4以及Switch-12的端口號碼 # 4無效化。由此,在DKA-1和Switch-12之間構建了通過Switch-11 、 Switch-21 、 以及Switch-22的迂回路徑(圖中的雙點劃線所示)。圖15以及圖16表示此 時的連接路徑圖600。 (具體例2 )
如圖17所示,假定Switch-12的端口號碼# 1以及# 5中發(fā)生了故障。在 這種情況下,DKA-1按照圖8所示的連接路徑重構表800,分別將Switch-ll 的端口號碼#5、 Switch-13的端口號碼#5、 Switch-21的端口號碼#5以及 Switch-23的端口號碼# 5有效化,并且將Switch-l 1的端口號碼# 4以及Switch-12的端口號碼#4無效化。由此,在DKA-l和Switchl3之間構建了通 過Switch-11 、 Switch-21 、 Switch-22以及Switch-23的迂回i 各徑。 (具體例3 )
如圖18所示,假定在Switch-12的端口號碼#4中發(fā)生了故障。在這種情 況下,DKA-1分別將Switch-12的端口號碼#5、 Switch-13的端口號碼#5、 Switch-22的端口號碼#5以及Switch-23的端口號碼#5有效化,并且將 Switch-12的端口號碼#4以及Switch-13的端口號碼#4無效化。由此,在 DKA-1和Switch腸13之間構建了通過Switch畫l 1 、 Switch腸12、 Switch隱22、 Switch-23 的迂回路徑。
(具體例4 )
如圖19所示,假定在Switch-12的端口號碼# 4以及# 5中發(fā)生了故障。 在這種情況下,DKA-1分別將Switch-ll的端口號碼# 5、 Switch-13的端口號 碼# 5、 Switch-21的端口號碼# 5以及Switch-23的端口號碼# 5有效化,并且 將Switch-ll的端口號碼# 4以及Switch-13的端口號碼# 1無效化。由此,在 維持DKA-1和Switchl2之間的路徑的同時,在DKA-1和Switch-13之間構建 了通過Switch-ll、 Switch-21 、 Switch-22以及Switch-23的迂回路徑。 (具體例5 )
如圖20所示,假定在Switch-12的端口號碼# 1和#4中發(fā)生了故障。在 這種情況下,DKA-1分別將Switch-ll的端口號碼# 5、 Switch-12的端口號碼 #5、 Switch-13的端口號碼#5、 Switch-21的端口號碼#5、 Switch-22的端口 號碼# 5以及Switch-23的端口號碼# 5有效化,并且將Switch-11的端口號碼 # 4、 Switch-12的端口號碼# 1及# 4、以及Switch-13的端口號碼# 4無效化。 由此,在DKA-1和Switch-12之間構建了通過Switch-11、 Switch-21以及 Switch-22的迂回路徑,并且在DKA-1和Switch-13之間構建了通過Switch-ll、 Switch-21 、 Switch-22以及Switch-23的迂回路徑。 (具體例6 )
如圖21所示,假定在Switch-12的端口號碼# 1、 #4以及#5中發(fā)生了故 障。在這種情況下,DKA-1分別將Switch-ll的端口號碼# 5、 Switch-13的端 口號碼# 5 、 Switch-21的端口號碼# 5以及Switch-23的端口號碼# 5有效化,并且將Switch-ll的端口號碼# 4以及Switch-21的端口號碼# 1及# 4無效化。 由此,在DKA畫1和Switchl3之間構建了通過Switch-ll、 Switch-21 、 Switch國22 以及Switch-23的迂回路徑。第2實施方式
圖22是表示本發(fā)明的一個實施方式的存儲子系統(tǒng)的結構的圖。
如該圖所示,本實施方式的存儲子系統(tǒng)1構成為由各磁盤控制器120的磁 盤適配器123控制針對存儲設備11的多個通道(在圖中為2通道)。各通道中 的各交換設備13與上述實施方式同樣地串聯(lián)連接,并分別連接了驅動器單元 110,但各交換設備13與同一磁盤適配器123的其它通道中的對應的交換設備 13相連。按照這種結構定義連接路徑圖400以及連接路徑重構表800的內容。 關于其它各部的結構以及處理內容,與上述實施方式相同。
圖23是表示本發(fā)明的一個實施方式的存儲子系統(tǒng)1中的后端的示意圖, 具體而言,該圖表示在Switch-12所示的交換設備13的端口號碼# 1所示的端 口 1311中發(fā)生了故障時重構而得的連接路徑。磁盤適配器123的故障恢復處 理與上述實施方式相同。
即,DKA-1在確定Switch-12的端口號碼# 1為故障部位時,按照預定的 連接路徑重構表重新構建連接路徑。在本例中,DKA-1分別將Switch-ll的端 口號碼# 5、Switch-12的端口號碼# 5、Switch-31的端口號碼# 5以及Switch-32 的端口號碼#5有效化,并且分別將Switch-ll的端口號碼#4以及Switch-12 的端口號碼#4無效化。
在此需要特別說明的是,形成迂回路徑的對應的各個交換設備13屬于同 一磁盤適配器123。即,即使是在屬于一個》茲盤適配器123的某個通道內的交 換設備13中檢測出錯誤時,另一個磁盤適配器123也不會介入重新構建的連 接路徑。因此,在二重化的磁盤控制器120中的磁盤適配器123間不會發(fā)生沖 突,因此能夠更高效率地轉發(fā)數據幀。
第3實施方式
本實施方式是在路徑交換設備13的端口 1311成為忙碌狀態(tài)時進行連接路 徑的重構處理的實施方式。本實施方式也能夠應用于上述第1實施方式以及第 2實施方式中示出的存儲子系統(tǒng)1的結構中的任意一方。圖24是用于說明本發(fā)明的一個實施方式的磁盤控制器120的磁盤適配器 123的I/O處理的流程圖。本實施方式的^f茲盤適配器123的I/O處理包含檢測 數據幀的轉發(fā)延遲的處理,這一點與上述實施方式不同。
即,如該圖所示,磁盤適配器123取出在存儲器單元125中存儲的命令, 通過預定的協(xié)議變換來生成數據幀,并存儲在內部緩沖器中(STEP2401 )。
然后,》茲盤適配器123經由端口送出該數據幀(STEP2402)。》茲盤適配器 123與上述實施方式一樣,也可以針對發(fā)送數據幀進行錯誤檢查。由此,該數 據幀經由交換設備13按照該數據幀的頭信息被轉發(fā),最終被發(fā)送到發(fā)送目的 地的驅動器單元110。
磁盤適配器123,在數據幀的發(fā)送后,在預定時間內監(jiān)視是否有命令應答 (STEP2403 )。當在預定時間以內沒有命令應答時,判斷為超時。磁盤適配器 123當在預定時間內接收到了命令應答時(STEP2403中為否),將該接收到的 數據幀存儲在內部緩沖器中(STEP2404),在進行預定的協(xié)議變換后寫入存儲 器單元125中(STEP2405 )。
與之相對,磁盤適配器123在預定時間內未接收到命令應答時(STEP2403 中為是),認為發(fā)生了故障,進行以下詳細描述的故障恢復處理(STEP2406)。 在故障恢復處理后,磁盤適配器123嘗試再次發(fā)送數據幀(STEP2402)。
圖25是用于說明本發(fā)明的一個實施方式的磁盤控制器120的磁盤適配器 123的故障恢復處理的流程圖。
即,如該圖所示,磁盤適配器123,在判斷出所接收到的數據幀中有錯誤 時,經由端口廣播發(fā)送錯誤信息發(fā)送請求(STEP2501 )。由此,磁盤適配器123 可以從所有交換設備13收集錯誤信息(STEP2502)。在這種情況下,在錯誤 信息收集的路徑內有可能包含忙碌狀態(tài)的端口 1311,因此,與通常的命令發(fā) 送時的超時時間相比,理想的是使接收到應答(錯誤信息)之前的超時時間較 長。在本實施方式中,從交換設備13發(fā)送的錯誤信息包含各端口 1311的發(fā)送 接收錯誤信息以及各端口 1311的忙碌信息。發(fā)送接收^t昔誤信息等價于圖5中 所示的錯誤信息。
然后,磁盤適配器123判斷在該收集到的錯誤信息中是否包含發(fā)送接收錯 誤信息(STEP2503 )。磁盤適配器123,在該收集到的錯誤信息中包含發(fā)送接收錯誤信息時(STEP2503中為是),根據該收集到的錯誤信息確定故障部位 (STEP2504)。以后的處理與圖11所示的STEP1104 STEP1106相同,因此 省略說明。
磁盤適配器123,當判斷出在該收集到的錯誤信息中不包含發(fā)送接收錯誤 信息時(STEP2503中為否),根據該收集到的錯誤信息中包含的忙碌信息,將 處于忙碌狀態(tài)的部位確定為故障部位(STEP2508)。然后,磁盤適配器123為 了重新構建繞過所確定的故障部位的連接路徑,而參照存儲在存儲器單元中的 連接路徑重構表800,確定連接路徑重構才莫式802 (STEP2509)。
接著,磁盤適配器123生成當前的連接路徑圖600的備份,并且按照所確 定的連接路徑重構;漠式802更新連接路徑圖600 (STEP2510)。然后,》茲盤適 配器123另外啟動忙碌狀態(tài)監(jiān)視處理(STEP2511),結束該故障恢復處理。忙 碌狀態(tài)監(jiān)視處理監(jiān)視處于忙碌狀態(tài)的端口 1311的忙碌狀態(tài)是否已解除,當判 斷為忙碌狀態(tài)已解除時,恢復為原來的連接路徑圖。
圖26是用于說明本發(fā)明的一個實施方式的磁盤適配器123的忙碌狀態(tài)監(jiān) 視處理的流程圖。與上述的1/0處理獨立地(通過別的線程)執(zhí)行忙碌狀態(tài)監(jiān) 視處理。
即,如該圖所示,磁盤適配器123每經過一定時間(STEP2601中為是) 就檢測成為了忙碌狀態(tài)的端口 1311的忙碌狀態(tài)是否已解除(STEP2602)。磁 盤適配器123,當判斷出端口 1311的忙碌狀態(tài)已解除時(STEP2602中為是), 將重新構建的ii接路徑圖替換為已備份的連接路徑圖600 ( STEP2603 )。由此, 存儲設備11內的連接路徑恢復為忙碌狀態(tài)發(fā)生前的連接路徑。
如上所述,根據存儲設備11中的連接路徑內的部位的忙碌狀態(tài),構建繞 過它的新的連接路徑,存儲子系統(tǒng)1能夠在最大限度地確保二重化結構的同時 繼續(xù)存儲服務的運用。
另外,當忙碌狀態(tài)解除時,存儲子系統(tǒng)1恢復為原來的連接路徑,因此可 以進行更靈活且高效的存儲服務的運用。
此外,在本實施方式中,磁盤適配器123當在預定時間內接收到了命令應 答時,不進行錯誤檢查就在存儲器單元125中寫入該命令應答,但也可以與上 述實施方式同樣地進行錯誤檢查,根據該錯誤檢查的結果進行故障恢復處理。其它實施方式
上述各實施方式是用于說明本發(fā)明的例子,不表示將本發(fā)明僅限定于這些 實施方式。本發(fā)明只要不脫離其主旨,可以通過各種形態(tài)來實施。例如,在上 述實施方式中,按順序說明了各種程序的處理,但不特別拘泥于此。因此,只 要在處理結果中不產生矛盾,也可以用更替處理的順序或進行并行動作的方式 構成。
另夕卜,在上述實施方式中,以由^茲盤適配器123進行故障恢復處理的方式 構成,但不特別拘泥于此。例如也可以構成為代替^茲盤適配器123而由處理器 124進行故障恢復處理等。
而且,在上述實施方式中分開地構成驅動器單元110和交換設備13,但 也可以用包含交換設備13的功能的方式構成驅動器單元110。
產業(yè)上的可利用性
本發(fā)明能夠廣泛應用于采用冗余化路徑結構、使用多個交換設備來形成連 接路徑的存儲子系統(tǒng)。
權利要求
1. 一種存儲子系統(tǒng),其特征在于,具備具有用于存儲數據的存儲介質的多個驅動器單元;具有多個端口、并在該多個端口中至少一個端口上連接所述多個驅動器單元中至少一個驅動器單元的多個第一交換設備;連接所述多個第一交換設備的至少一個交換設備、并控制所述多個驅動器單元的第一磁盤控制器;具有多個端口、并在該多個端口中至少一個端口上連接所述多個驅動器單元中至少一個驅動器單元的多個第二交換設備,該多個第二交換設備的每一個與所述多個第一交換設備的每一個相對應;以及連接所述多個第二交換設備中至少一個交換設備、并控制所述多個驅動器單元的第二磁盤控制器,所述多個第一交換設備的各個交換設備中的所述多個端口中至少一個端口、與所述對應的多個第二交換設備的各個交換設備中的所述多個端口中至少一個端口相互連接。
2. 根據權利要求1所述的存儲子系統(tǒng),其特征在于,所述多個第一交換設備以及所述多個第二交換設備分別經由自身的所述 多個端口串聯(lián)地連接。
3. 根據權利要求2所述的存儲子系統(tǒng),其特征在于, 所述第一》茲盤控制器具有第一連接路徑圖,該第一連4妾路徑圖管理在所述多個第一交換設備的各個交換設備中的所述多個端口的各個端口上連接的設 備以及該多個端口的各自的連接狀態(tài),所述第二磁盤控制器具有第二連接路徑圖,該第二連接路徑圖管理在所述 多個第二交換設備的各個交換設備中的所述多個端口的各個端口上連接的設 備以及該多個端口的各自的連接狀態(tài)。
4. 根據權利要求3所述的存儲子系統(tǒng),其特征在于,所述多個第一交換設備的每一個以及所述多個第二交換設備的每一個,具有檢查發(fā)送到所述多個端口的各個端口的數據幀中的錯誤的錯誤檢查電路, 所述錯誤檢查電路,當在所述數據幀中檢查出錯誤時,輸出預定的錯誤信息。
5. 根據權利要求4所述的存儲子系統(tǒng),其特征在于, 所述第一磁盤控制器以及所述第二磁盤控制器中至少一方,經由與自身相連的所述多個交換設備中至少一個交換設備,發(fā)送基于命令的數據幀,該命令 用于訪問所述多個驅動器單元中至少一個驅動器單元,當在應答所述命令而發(fā) 送來的數據幀中檢查出錯誤時,對所述多個交換設備發(fā)送錯誤信息發(fā)送請求。
6. 根據權利要求5所述的存儲子系統(tǒng),其特征在于, 與所述至少一方的磁盤控制器相連的所述多個交換設備的每一個,應答所述錯誤信息發(fā)送請求,將所述錯誤信息發(fā)送到所述至少一方的磁盤控制器。
7. 根據權利要求6所述的存儲子系統(tǒng),其特征在于,所述至少一方的》茲盤控制器,根據應答所述錯誤信息發(fā)送請求而從所述多 個交換設備的每一個發(fā)送來的錯誤信息,將檢查出錯誤的交換設備以及端口確 定為故障部位。
8. 根據權利要求7所述的存儲子系統(tǒng),其特征在于, 所述至少一方的磁盤控制器,根據所述確定的故障部位,按照預定的連接路徑重構模式來更新自身的所述連接路徑圖的內容。
9. 根據權利要求1所述的存儲子系統(tǒng),其特征在于, 所述第一磁盤控制器以及所述第二磁盤控制器的至少一方,將與自身相連的所述多個交換設備中至少 一個交換設備以及該對應的所述交換設備的各個 交換設備中的所述多個端口中至少一個端口的連接狀態(tài)設定為有效狀態(tài)。
10. 根據權利要求3所述的存儲子系統(tǒng),其特征在于,所述多個第一交換設備的每一個以及所述多個第二交換設備的每一個,輸 出自身的所述多個端口的各個端口中的忙碌信息。
11. 根據權利要求IO所述的存儲子系統(tǒng),其特征在于,所述第 一磁盤控制器以及所述第二磁盤控制器的至少一方,根據所述多個 第一交換設備以及所述多個第二交換設備中某一個交換設備輸出的忙碌信息, 按照預定的連接路徑重構模式來更新自身的所述連接路徑圖的內容。
12. —種存儲子系統(tǒng),其特征在于, 具備具有用于存儲數據的存儲介質的多個第一驅動器單元;具有用于存儲數據的存儲介質的多個第二驅動器單元;具有多個端口 、并在該多個端口中至少一個上連接所述多個第一驅動器單 元中至少 一個第 一驅動器單元的多個第 一 交換設備;具有多個端口 、并在該多個端口中至少一個端口上連接所述多個第一驅動 器單元中至少一個第一驅動器單元的多個第二交換設備,該多個第二交換設備 的每一個與所述多個第 一交換設備的每一個相對應;具有多個端口 、并在該多個端口中至少一個端口上連接所述多個第二驅動 器單元中至少 一個第二驅動器單元的多個第三交換設備;具有多個端口 、并在該多個端口中至少一個端口上連接所述多個第二驅動 器單元中至少 一個第二驅動器單元的多個第四交換設備;連接所述多個第一交換設備中至少一個第一交換設備、控制所述多個第一 驅動器單元,并且連接所述多個第三交換設備中至少一個第三交換設備、控制所述多個第二驅動器單元的第一^t盤控制器;以及連接所述多個第二交換設備中至少 一個第二交換設備、控制所述多個第一 驅動器單元,并且連接所述多個第四交換設備中至少一個第四交換設備、控制 所述多個第二驅動器單元的第二磁盤控制器,所述多個第一交換設備的各個第一交換設備中的所述多個端口中至少一 個端口 、與所述對應的多個第二交換設備的各個第二交換設備中的所述多個端 口中至少一個端口相連,所述多個第三交換設備的各個第三交換設備中的所述多個端口中至少一 個端口 、與所述對應的多個第四交換設備的各個第四交換i殳備中的所述多個端 口中至少一個端口相連。
13. —種包含第 一控制器和第二控制器的存儲子系統(tǒng)中的交換設備間連 接路徑的控制方法,所述第一控制器控制經由串聯(lián)連接的多個第一交換設備而 連接的多個驅動器單元,所述第二控制器控制經由串聯(lián)連接的、與所述多個第 一交換設備對應的多個第二交換設備而連接的所述多個驅動器單元,該控制方法的特征在于,包含以下步驟所述第一控制器以及所述第二磁盤控制器中至少一方,經由與自身連接的 所述多個交換設備,向所述多個驅動器單元中至少 一個驅動器單元發(fā)送基于用 于訪問的命令的數據幀;所述至少一方的磁盤控制器,接收應答所述命令而經由所述多個交換設備 發(fā)送來的數據幀,檢查該接收到的數據幀中的錯誤;所述至少一方的》茲盤控制器,當所述檢查的結果是在所述數據幀中;f企查出 錯誤時,對所述多個交換設備發(fā)送錯誤信息發(fā)送請求;所述至少一方的磁盤控制器,接收應答所述^"誤信息發(fā)送請求而發(fā)送來的 錯誤信息;所述至少一方的磁盤控制器,根據所述接收到的錯誤信息,將檢測出錯誤 的交換設備以及該交換設備的端口確定為故障部位;以及所述至少一方的磁盤控制器,根據所述確定的故障部位,按照預定的連接路徑重構模式來變更所述交換設備間連接路徑。
14.根據權利要求13所述的控制方法,其特征在于,所述變更的步驟,為了繞過所述確定的故障部位,將所述多個第一交換設 備中至少一個第一交換設備、和與其對應的所述多個第二交換設備中至少一個 第二交換設備的連接狀態(tài)設定為有效狀態(tài)。
全文摘要
本發(fā)明涉及存儲子系統(tǒng)及其控制方法。本發(fā)明的課題是,提供一種在提高可靠性以及可用性的同時,將系統(tǒng)性能的惡化抑制到最小限度的存儲子系統(tǒng)。本發(fā)明為一種存儲子系統(tǒng),其包含控制經由多個第1交換設備連接的多個驅動器單元的第1控制器、以及控制經由與該多個第1交換設備對應的多個第2交換設備連接的相應的多個驅動器單元的第2控制器,該存儲子系統(tǒng)具有將所述多個第1交換設備和所述對應的多個第2交換設備相互連接起來的連接路徑。該存儲系統(tǒng)當檢測出故障的發(fā)生時,確定連接路徑中的故障部位,并為了繞過該故障部位而變更交換設備的連接結構。
文檔編號G06F3/06GK101504592SQ20091000596
公開日2009年8月12日 申請日期2009年1月22日 優(yōu)先權日2008年2月8日
發(fā)明者井上哲也, 小賀努, 鈴木弘志 申請人:株式會社日立制作所
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
武陟县| 靖江市| 江川县| 烟台市| 师宗县| 揭东县| 海原县| 嘉定区| 东莞市| 和硕县| 马公市| 美姑县| 沈丘县| 胶南市| 乌拉特后旗| 将乐县| 重庆市| 九龙坡区| 昌邑市| 东明县| 轮台县| 承德市| 云浮市| 濉溪县| 湖南省| 邻水| 西安市| 兴仁县| 广水市| 东阿县| 长宁区| 大丰市| 牙克石市| 大姚县| 九江市| 宁武县| 临江市| 齐河县| 通化市| 镇坪县| 湖北省|