在計(jì)算機(jī)網(wǎng)絡(luò)中檢索電子文檔的復(fù)制件的制作方法

文檔序號(hào)：6484968閱讀：255來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：在計(jì)算機(jī)網(wǎng)絡(luò)中檢索電子文檔的復(fù)制件的制作方法
技術(shù)領(lǐng)域：
本發(fā)明總體涉及在計(jì)算機(jī)網(wǎng)絡(luò)中的復(fù)制件存取。更具體地說(shuō)，本發(fā)明涉及在計(jì)算機(jī)網(wǎng)絡(luò)中檢索和/或存放電子文檔的復(fù)制件。
背景技術(shù)：
對(duì)電子文檔和數(shù)據(jù)的即時(shí)存取對(duì)于日常的商務(wù)操作變得越來(lái)越重要。結(jié)果是，對(duì)包括局部物理?yè)p壞之類的故障，還需要存儲(chǔ)是可靠的和有彈性的。在計(jì)算機(jī)網(wǎng)絡(luò)上的分布的、復(fù)制的存儲(chǔ)好象是唯一的出路。
但是，今天的分布的/復(fù)制的系統(tǒng)或者需要在所涉及的計(jì)算實(shí)體(通常是在不同位置的至少兩個(gè)數(shù)據(jù)中心)之間完全、相同的復(fù)制，或者需要在分布存儲(chǔ)的情況中，集中化的控制器持續(xù)地跟蹤復(fù)制件分布。存取多于一個(gè)復(fù)制件的任何人需要或者知道復(fù)制件的完整列表或者需要具有對(duì)返回這種信息的目錄服務(wù)的存取權(quán)，或者全局性地-對(duì)于所有文檔-或者基于每個(gè)文檔。
由于現(xiàn)存的廉價(jià)機(jī)器能夠用于服務(wù)內(nèi)容，分布存儲(chǔ)變得越來(lái)越重要。隨著分布散列表(DHT)技術(shù)的出現(xiàn)，自組織(self-organizing)存儲(chǔ)網(wǎng)絡(luò)變得可行并且已經(jīng)在業(yè)界引起了濃厚興趣。這些可伸縮的、處在因特網(wǎng)的“頂上”的上層(overlay)網(wǎng)絡(luò)使用下層(underlying)網(wǎng)絡(luò)的傳輸能力，但是增加了價(jià)值。DHT技術(shù)提供從資源ID到主機(jī)(D--＞H)的映射，而在其之前通常有從資源名稱到資源ID(N--＞D)的映射。這是通過使用在每個(gè)節(jié)點(diǎn)中的最小路由信息來(lái)實(shí)現(xiàn)的。通常還將DHT進(jìn)行準(zhǔn)備以處理在主機(jī)可用性和網(wǎng)絡(luò)連接性中的變化。
DHT具有各種路由偏好但卻共享這樣的特性，即在上層網(wǎng)絡(luò)的構(gòu)成節(jié)點(diǎn)之間基于逐個(gè)跳躍來(lái)傳輸消息。每個(gè)跳躍都知道如何更接近目的地，直到其最終到達(dá)宣稱所請(qǐng)求的ID是其自己的那個(gè)節(jié)點(diǎn)并且根據(jù)請(qǐng)求進(jìn)行動(dòng)作為止。
一些DHT基于間隔環(huán)拓?fù)溥M(jìn)行操作，如在Ion Stoica等人所著的“ChordAScalable Peer-to-peer lookup Service for Internet Application”，Proceedings ofACM SIGCOMM 2001，2001年8月，149-160頁(yè)中所述的，有一些將多維空間分割為可管理的組塊(chunk)，如Sylvia Ratnasamy等人所著的“A ScalableContent-Addressable Network”，Proceedings of ACM SIGCOMM，2001年9月所述的，或如Marcel Waldvogel和Roberto Rinaldi所著的“EfficientTopology-Aware Overlay Network”，ACM Computer Communication Review，2003年1月，卷33，第1號(hào)，101-106頁(yè)所述，但是其他的實(shí)施無(wú)根樹(rootlesstree)，如Anthony Rowstron和Peter Druschel所著的“PastryScalable，distributedobject location and routing for large-scale peer-to-peer systems”，IFIP/ACMInternational Conference on Distributed Systems Platforms(Middleware)，2001年11月，329-350頁(yè)所述，或者如Ben Y.Zhao等人所著的“TapestryAnInfrastructure for Fault-tolerant Wide-area Location and Routing”，University ofCalifornia，Berkeley，UCB/CSD-01-1141，2001年4月所述。
這些DHT系統(tǒng)中的許多個(gè)都能夠利用下層網(wǎng)絡(luò)的本地性(locality)。通常將本地性方面分離為地理布局類別和鄰近轉(zhuǎn)發(fā)(proximity forwarding)類別，這些類別根據(jù)Miguel Castro等人所著“Exploiting Network Proximity inDistributed Hash Tables”，International Workshop on Future Directions inDistributed Computing(FuDiCo)，由Ozalp Babaoglu和Ken Birman和KeithMarzullo編輯，2002年6月，52-55頁(yè)所述而改編而來(lái)。
C.Greg Plaxton等人所著“Accessing Nearby Copies of Replicated Objectsin a Distributed Environment”，ACM Symposium on Parallel Algorithms andArchitectures”，1997年，311-320頁(yè)示出了對(duì)于本地性模式的另一種方法。
在由John Byers，Jeffrey Considine，Michael Mitzenmacher所著的、在2003年2月的International Peer-to-Peer Symposium(IPTPS)中的“Simple LoadBalancing for Distributed Hash Tables”中說(shuō)明了負(fù)載均衡方面。
在由John Kubiatowicz等人所著的“OceanStoreAn Architecture forGlobal-Scale Persistent Storage”，Proceedings of ACM ASPLOS，2000年11月中示出了鏈接DHT和高速緩存的一種方法。這里，當(dāng)存在沿著該路徑可發(fā)現(xiàn)文檔高速緩存的概率較高時(shí)，由衰減的花朵過濾器(Attenuated Bloom Filter，ABF)來(lái)重定向沿著DHT而通過的查詢。盡管連續(xù)的ABF更新通訊量，但是當(dāng)產(chǎn)生需要時(shí)，除了錯(cuò)誤正確(false positives)的概率之外，對(duì)于文檔創(chuàng)始者沒有方法來(lái)尋址所選擇的復(fù)制件。
由Magdalena Balazinska等人所著“INS/TwineA Scalable Peer-to-PeerArchitecture for Intentional Resource Discovery”，Pervasive 2002-InternationalConference on Pervasive Computing，2002年8月，示出了在DHT頂上的資源發(fā)現(xiàn)/目錄服務(wù)的例子。
US20020114341A1提出了對(duì)等企業(yè)存儲(chǔ)，其使用集中化的控制器/協(xié)調(diào)器。
申請(qǐng)人的US6,223,206公開一種方法和系統(tǒng)，用于通過將由第一流正在讀取的文件的部分復(fù)制到第二設(shè)備上并且用能夠存取的第二流來(lái)讀取該部分來(lái)進(jìn)行負(fù)載均衡。這種現(xiàn)有技術(shù)針對(duì)完全集中化的系統(tǒng)。
US20030014523A1、US20030014433A1、和US20030014432A1，每個(gè)都介紹了一種存儲(chǔ)網(wǎng)絡(luò)數(shù)據(jù)復(fù)制器。存在公開的、關(guān)于如何從一個(gè)實(shí)例到另一個(gè)實(shí)例進(jìn)行復(fù)制的算法。其描述了要選擇哪一個(gè)現(xiàn)存的復(fù)制件作為用于進(jìn)一步復(fù)制的資源。
US6,467,046和EP 807 885 B1兩者都示出了一種系統(tǒng)和方法，用于在計(jì)算機(jī)系統(tǒng)中自動(dòng)地分發(fā)復(fù)制的數(shù)據(jù)庫(kù)的拷貝。列舉用于確定復(fù)制件替換的主機(jī)和盤以提高可靠性。
US5,815,649示出了容錯(cuò)計(jì)算機(jī)系統(tǒng)的分布的容錯(cuò)數(shù)字?jǐn)?shù)據(jù)存儲(chǔ)。使用多個(gè)冗余計(jì)算機(jī)作為多個(gè)冗余盤的前端，基本上作為網(wǎng)絡(luò)RAID(廉價(jià)盤冗余陣列)。
根據(jù)US6,470,420，提出了一種方法，用于指定多個(gè)可尋址的存儲(chǔ)設(shè)備中的一個(gè)以處理數(shù)據(jù)傳輸請(qǐng)求。客戶將單個(gè)請(qǐng)求多播到所有復(fù)制件并且它們配合地選擇一個(gè)進(jìn)行應(yīng)答。
WO 03/012699 A1示出了用于為跟蹤存儲(chǔ)設(shè)備的分布文件系統(tǒng)上的信息而提供元數(shù)據(jù)的系統(tǒng)和方法。使用元數(shù)據(jù)來(lái)定位文件。
在US6,163,856中，示出了用于文件系統(tǒng)災(zāi)難恢復(fù)的方法和設(shè)備。
根據(jù)另一個(gè)申請(qǐng)人的專利US5,897,661，示出了邏輯卷管理器和對(duì)應(yīng)方法，通過存儲(chǔ)的動(dòng)態(tài)分配和元數(shù)據(jù)信息的最小存儲(chǔ)而具有增強(qiáng)的更新性能。提供元數(shù)據(jù)復(fù)制，其被限制于那些具有知情需要的存儲(chǔ)提供商。
在WO 02/093298 A3中，通過動(dòng)態(tài)數(shù)據(jù)管理描述了模塊化的存儲(chǔ)服務(wù)器構(gòu)架。該文獻(xiàn)示出根據(jù)本地性存取模式和分層存儲(chǔ)管理的復(fù)制。
根據(jù)US20030028695A1，示出了用于文件數(shù)據(jù)的有效復(fù)制的制造者/消費(fèi)者鎖定系統(tǒng)，其提供并發(fā)操作之間的鎖定。
根據(jù)US5,588,147，描述了復(fù)制裝置，其使用日志文件機(jī)制來(lái)復(fù)制文檔。
盡管對(duì)復(fù)制和分布存儲(chǔ)已經(jīng)做了一些工作，但是現(xiàn)在還是缺少在不受出現(xiàn)單點(diǎn)故障的影響的、完全分布技術(shù)之上的復(fù)制機(jī)制。因?yàn)閺?fù)制件不僅僅提高可獲得性，而且還均衡負(fù)載，所以已經(jīng)存在有用于高速緩存目的的分布機(jī)制。除了可靠性之外，高速緩存系統(tǒng)還造成更新問題由于其不清楚在哪里對(duì)信息進(jìn)行高速緩存，所以如果其不連續(xù)地跟蹤原始位置的狀態(tài)，則高速緩存可能變得過時(shí)。這造成在可伸縮性方面的嚴(yán)重問題，從而不能進(jìn)行高速緩存所提供的負(fù)載分擔(dān)(off-loading)。
因此，期望提供一種在計(jì)算機(jī)網(wǎng)絡(luò)中管理復(fù)制件的機(jī)制，以適當(dāng)?shù)姆椒▉?lái)反映該機(jī)制，并且提供計(jì)算實(shí)體和計(jì)算機(jī)程序元件，用于在計(jì)算機(jī)網(wǎng)絡(luò)中檢索和/或存放復(fù)制件。

發(fā)明內(nèi)容
本發(fā)明提供了一種用于在計(jì)算機(jī)網(wǎng)絡(luò)中檢索電子文檔的復(fù)制件的方法。選擇至少一個(gè)復(fù)制件號(hào)碼并且應(yīng)用給定函數(shù)。該函數(shù)要求將復(fù)制件號(hào)碼和與電子文檔關(guān)聯(lián)的文檔識(shí)別符作為輸入。通過用作為輸入的k個(gè)不同的復(fù)制件號(hào)碼將該函數(shù)應(yīng)用k次，確定k個(gè)實(shí)體識(shí)別符，其中在可能提供復(fù)制件的網(wǎng)絡(luò)中每個(gè)實(shí)體識(shí)別符表示計(jì)算實(shí)體。K是等于或大于1的整數(shù)。然后，將文檔相關(guān)的請(qǐng)求尋址到至少一個(gè)所識(shí)別的實(shí)體。
最好在具有對(duì)網(wǎng)絡(luò)的存取權(quán)的檢索計(jì)算實(shí)體上自動(dòng)地執(zhí)行該方法。
根據(jù)本發(fā)明的另一個(gè)方面，還提供一種用于在計(jì)算機(jī)網(wǎng)絡(luò)中存放電子文檔的復(fù)制件的方法。再次，選擇了復(fù)制件號(hào)碼并且應(yīng)用給定函數(shù)，該函數(shù)需要復(fù)制件號(hào)碼和文檔識(shí)別符作為輸入。該函數(shù)的輸出是實(shí)體識(shí)別符，該實(shí)體識(shí)別符代表網(wǎng)絡(luò)中的計(jì)算實(shí)體，在其上可存放帶有所選擇的復(fù)制件號(hào)碼的復(fù)制件。然后為了復(fù)制件存放或修改的目的對(duì)所識(shí)別的實(shí)體進(jìn)行尋址。還可以將本方法用于存放與文檔有關(guān)的修改。
最好在具有對(duì)網(wǎng)絡(luò)的存取權(quán)的存放或修改計(jì)算實(shí)體上執(zhí)行該方法。
該方法的想法是將電子文檔的復(fù)制件僅僅存儲(chǔ)在計(jì)算機(jī)網(wǎng)絡(luò)中的預(yù)定地址處。在此處的上下文中還可以將這種地址稱為實(shí)體識(shí)別符。由一種函數(shù)預(yù)先定義該地址，該函數(shù)為每個(gè)文檔的每個(gè)復(fù)制號(hào)碼提供與計(jì)算實(shí)體關(guān)聯(lián)的、可以在此處發(fā)現(xiàn)或存儲(chǔ)特定復(fù)制件的地址。
在優(yōu)選實(shí)施例中，該函數(shù)是偽隨機(jī)散列函數(shù)，其中將每個(gè)地址/識(shí)別符使用分布的散列表映射到網(wǎng)絡(luò)中機(jī)器/實(shí)體之一。
借助該函數(shù)，在網(wǎng)絡(luò)中的任何地方都不能隨機(jī)地增加或刪除復(fù)制件。僅僅在網(wǎng)絡(luò)中的非常確定的位置/實(shí)體處才可以存取或存放復(fù)制件，其中通過應(yīng)用帶有復(fù)制件號(hào)碼作為輸入的函數(shù)來(lái)確定實(shí)體。但是，在應(yīng)用偽隨機(jī)散列函數(shù)的情況中，散列函數(shù)的偽隨機(jī)特性確保將均勻地分布復(fù)制件。然而，可能依照其他規(guī)則或函數(shù)來(lái)在網(wǎng)絡(luò)中的實(shí)體上存放其他的復(fù)制件。然后通過該函數(shù)而存放的復(fù)制件可以作為低效運(yùn)行解決方案來(lái)工作，用于例如在該系統(tǒng)存在事故(break down)的情況中的集中化管理系統(tǒng)。
該函數(shù)提供用于每個(gè)電子文檔的信息，在網(wǎng)絡(luò)中的哪個(gè)實(shí)體處可以發(fā)現(xiàn)復(fù)制件或者在網(wǎng)絡(luò)中的哪個(gè)實(shí)體處可以存放復(fù)制件。為了支持該函數(shù)，最好編號(hào)系統(tǒng)引入用于要被檢索或要被存儲(chǔ)的每個(gè)文檔的復(fù)制件號(hào)碼，最好該復(fù)制件號(hào)碼在1到N的范圍之間，在這種情況中將N表征為最大復(fù)制件號(hào)碼以及所允許的復(fù)制件的最大數(shù)量。在對(duì)于所選擇的這個(gè)文檔識(shí)別符具有文檔識(shí)別符y和復(fù)制件號(hào)碼x之后，該函數(shù)就確定實(shí)體識(shí)別符，其指示為文檔y的復(fù)制件號(hào)碼x選擇的實(shí)體。在寫過程中，則將文檔y的復(fù)制件x發(fā)送到該實(shí)體并且存儲(chǔ)在該實(shí)體處。在存取操作中，則在該特定實(shí)體處發(fā)現(xiàn)文檔y的復(fù)制件號(hào)碼x，但是并不必須是這里發(fā)現(xiàn)至此可能已經(jīng)不需要具有在所關(guān)聯(lián)的實(shí)體處存放的文檔y的復(fù)制件x，因?yàn)橹链?例如)比x低的復(fù)制件的號(hào)碼對(duì)于服務(wù)從檢索實(shí)體來(lái)的請(qǐng)求已經(jīng)足夠了。
假設(shè)該函數(shù)與用于存放相同文檔的復(fù)制件的函數(shù)相同，則只能在由該函數(shù)確定的網(wǎng)絡(luò)中的特定地址處檢索文檔的復(fù)制件。
因?yàn)闄z索實(shí)體具有復(fù)制件號(hào)碼限定到底數(shù)計(jì)算上的范圍并且在需要情況下進(jìn)行查詢，所以通過將復(fù)制件的數(shù)量的限制優(yōu)選地設(shè)置到在網(wǎng)絡(luò)中所允許的范圍內(nèi)，優(yōu)化了檢索處理過程。通過不設(shè)置復(fù)制件的數(shù)量或者設(shè)置復(fù)制件的過大最大數(shù)量，嘗試存取其中實(shí)際上沒有存儲(chǔ)復(fù)制件的實(shí)體可能引起檢索時(shí)間的損失，因?yàn)橐郧皼]有人使用該實(shí)體來(lái)存儲(chǔ)帶有非常大的號(hào)碼的復(fù)制件。
與所提出的方法相關(guān)，應(yīng)該理解在原始文檔自身和任何復(fù)制件之間從術(shù)語(yǔ)上來(lái)說(shuō)沒有區(qū)別。最好可以在任何復(fù)制件號(hào)碼下存儲(chǔ)原始文檔自身，因此可以在該復(fù)制件號(hào)碼下尋址該原始文檔。
下層網(wǎng)絡(luò)可以是對(duì)等網(wǎng)絡(luò)或分層網(wǎng)絡(luò)。
電子文檔可以是任何種類的電子文件或數(shù)據(jù)，或者甚至是數(shù)據(jù)庫(kù)、可以在計(jì)算機(jī)網(wǎng)絡(luò)中的不同位置作為復(fù)制件存儲(chǔ)的拷貝。如在這里說(shuō)明的電子文檔還可以是活性資源，如當(dāng)被存取時(shí)將執(zhí)行所存儲(chǔ)的行動(dòng)的計(jì)算機(jī)程序，還可以是電子文檔的片段，如存儲(chǔ)單元、扇區(qū)或扇區(qū)的簇?？梢?例如)為了備份的目的在非常特殊的位置永久地存儲(chǔ)復(fù)制件。或者可以將它們臨時(shí)進(jìn)行存儲(chǔ)，(例如)用于高速緩存的目的，減少網(wǎng)絡(luò)上的負(fù)載或其他復(fù)制件，包括原始文檔存儲(chǔ)，特別是當(dāng)許多用戶需要存取下層文檔時(shí)。本發(fā)明支持分布的存儲(chǔ)應(yīng)用或文檔儲(chǔ)存庫(kù)存儲(chǔ)應(yīng)用，以及分布的計(jì)算應(yīng)用。因此，最好通過在網(wǎng)絡(luò)上建立復(fù)制件以具有比僅原始資源本身更多的存取點(diǎn)，從而在存儲(chǔ)實(shí)體處提供更多的計(jì)算容量以及方便用戶的更多的網(wǎng)絡(luò)能力。從單個(gè)用戶的觀點(diǎn)來(lái)說(shuō)復(fù)制件也是有益的，因?yàn)樵撚脩粝Ｍ碾娮游臋n在例如膝上計(jì)算機(jī)、手持設(shè)備、移動(dòng)電話、或臺(tái)式計(jì)算機(jī)的許多不同的計(jì)算實(shí)體上都可以存取。本發(fā)明可擴(kuò)展到復(fù)制電子文檔的所有這些應(yīng)用，但是又不限于此。
結(jié)合本發(fā)明所描述的實(shí)體的能力依賴于所試圖進(jìn)行的應(yīng)用。通常，計(jì)算實(shí)體可以是能夠存取網(wǎng)絡(luò)并且通過網(wǎng)絡(luò)進(jìn)行通訊的任何單元。一些實(shí)體可以主要服務(wù)作為用于文檔/復(fù)制件的存放位置，并且因此被準(zhǔn)備用于存儲(chǔ)大量的數(shù)據(jù)。具體地說(shuō)，這種實(shí)體可能是服務(wù)器計(jì)算機(jī)。但是，具有到網(wǎng)絡(luò)的接口的所有其他計(jì)算實(shí)體以及任何種類的存儲(chǔ)裝置都可以作為實(shí)體進(jìn)行服務(wù)以提供復(fù)制件?？梢詫z索實(shí)體作為客戶計(jì)算機(jī)或任何類型的計(jì)算實(shí)體而實(shí)現(xiàn)，例如上述的計(jì)算實(shí)體，或者檢索實(shí)體還可以是文檔管理員的計(jì)算機(jī)。最好，計(jì)算機(jī)可以執(zhí)行檢索或存放復(fù)制件這兩項(xiàng)工作。
根據(jù)檢索-即定位-電子文檔的復(fù)制件的方法，可以不同的方式來(lái)執(zhí)行尋址可能提供復(fù)制件的、被識(shí)別的實(shí)體。被尋址到實(shí)體的請(qǐng)求可僅僅使得被尋址的實(shí)體查詢?cè)搹?fù)制件是否實(shí)際可以獲得并且將結(jié)果通知檢索實(shí)體。在另一個(gè)實(shí)施例中，該請(qǐng)求可還包括將復(fù)制件立即發(fā)送到檢索設(shè)備、或增加或修改或更新或修改數(shù)據(jù)的要求，所述修改數(shù)據(jù)被同該請(qǐng)求一起發(fā)送到在被識(shí)別的實(shí)體處的復(fù)制件。
在所識(shí)別的實(shí)體處存放復(fù)制件的情況中，請(qǐng)求可能只觸發(fā)關(guān)于所尋址的實(shí)體是否已經(jīng)準(zhǔn)備好存儲(chǔ)復(fù)制件并且因此在所尋址的實(shí)體處開始內(nèi)部檢查的響應(yīng)。但是，該請(qǐng)求可還包括已經(jīng)準(zhǔn)備好被立即存儲(chǔ)在所尋址的實(shí)體處的復(fù)制件自身。
從全局的角度考慮，用于檢索復(fù)制件的方法使得客戶-也被稱為檢索實(shí)體-只發(fā)送少量的消息以定位復(fù)制件。如可以從下面的實(shí)施例中看出的，客戶可以定位接近或甚至是最接近的復(fù)制件。為了實(shí)現(xiàn)這個(gè)目的，最好限制復(fù)制件的選擇。因?yàn)閺?fù)制件由此可以被列舉并且被直接尋址，所以對(duì)于客戶來(lái)說(shuō)能迅速地發(fā)現(xiàn)文檔。但是，在文檔已經(jīng)或需要被更新或者文檔內(nèi)容需要被驗(yàn)證或另外處理的情況中，對(duì)于文檔所有者來(lái)說(shuō)迅速地發(fā)現(xiàn)所有復(fù)制件也是有益的。
而且，每個(gè)復(fù)制件需要只存儲(chǔ)文檔ID和文檔內(nèi)容的元組。文檔內(nèi)容可以是文檔自身的內(nèi)容，例如文字或圖形，但也可以是針對(duì)實(shí)際存儲(chǔ)文檔的(多個(gè))節(jié)點(diǎn)的(一組)指針，和(一組)復(fù)制件索引或復(fù)制件實(shí)體ID。在相同的實(shí)體可以對(duì)相同文檔的多個(gè)復(fù)制件負(fù)責(zé)的情況中，其可以是諸如散列函數(shù)的函數(shù)隨機(jī)地分布實(shí)體識(shí)別符從而它們中的兩個(gè)或多個(gè)可能落入由單個(gè)節(jié)點(diǎn)覆蓋的范圍內(nèi)的情況，實(shí)體以及由此的復(fù)制件可以在相同實(shí)體上區(qū)分不同復(fù)制件的復(fù)制件索引或復(fù)制件實(shí)體ID的形式，來(lái)提供附加的信息。
考慮了復(fù)制件號(hào)碼的限制的優(yōu)選實(shí)施例，可以以不同的方式來(lái)處理復(fù)制件號(hào)碼的選擇，基于復(fù)制件號(hào)碼的選擇，函數(shù)可以確定與所選擇的文檔的該特定復(fù)制件號(hào)碼相關(guān)聯(lián)的實(shí)體的識(shí)別符。該選擇可以是k個(gè)復(fù)制件號(hào)碼的隨機(jī)選擇。但是，該選擇還可以覆蓋所有N個(gè)復(fù)制件號(hào)碼，其中N是復(fù)制件的最大號(hào)碼，并且號(hào)碼的優(yōu)選范圍是例如[1.....N]或
。在優(yōu)選實(shí)施例中，將給定函數(shù)應(yīng)用k＝N次，以確定可以提供對(duì)相關(guān)文檔的復(fù)制件的存取的k個(gè)實(shí)體識(shí)別符。
該實(shí)施例提供完全的自由給檢索實(shí)體，以訪問最大數(shù)量的每個(gè)都可能提供復(fù)制件的實(shí)體，或者選擇一些被識(shí)別的實(shí)體或者要尋址到的僅僅一個(gè)被識(shí)別的實(shí)體。選擇方案可以遵不同被識(shí)別實(shí)體的評(píng)估。
但是，當(dāng)資源有限時(shí)或當(dāng)N是較大的數(shù)字時(shí)，可能傾向于另一個(gè)方法從最多N個(gè)復(fù)制件中選擇僅僅k個(gè)復(fù)制件號(hào)碼，其中k＜N。結(jié)果是，由用于確定這種實(shí)體識(shí)別符的函數(shù)僅僅發(fā)送了k個(gè)實(shí)體識(shí)別符。
對(duì)于限制作為實(shí)體識(shí)別符的數(shù)量的數(shù)據(jù)數(shù)量，和限制最終可能被認(rèn)為是值得進(jìn)行尋址的實(shí)體的數(shù)量來(lái)說(shuō)，這種方法是有益的。
最好，可將k選擇為＜＝5。這表示特別在直接地尋址所有被識(shí)別的實(shí)體而不為了該目的選擇實(shí)體的子集時(shí)，為了檢索復(fù)制件而被尋址的實(shí)體的合理范圍。將在下面更詳細(xì)地解釋這種策略的道理。
在k＝1的另一個(gè)優(yōu)選實(shí)施例中，并且因此，在這種方法中，從一開始就只有一個(gè)識(shí)別的被訪地址并且將該請(qǐng)求僅僅尋址到這一個(gè)實(shí)體。在一個(gè)實(shí)施例中，可隨機(jī)地選擇復(fù)制件號(hào)碼。在另一個(gè)實(shí)施例中，假設(shè)以升序的復(fù)制件號(hào)碼在網(wǎng)絡(luò)上分布復(fù)制件，在所允許的復(fù)制件號(hào)碼的范圍的低號(hào)碼范圍內(nèi)選擇復(fù)制件號(hào)碼。因此，當(dāng)在提供帶有低復(fù)制件號(hào)碼的復(fù)制件的實(shí)體處尋找復(fù)制件時(shí)，增加了第一次就找到該復(fù)制件的概率。但是，該復(fù)制件也可能從離檢索實(shí)體很遠(yuǎn)處被定位。
在更類似的方法中，將與文檔相關(guān)的請(qǐng)求相對(duì)于所有被識(shí)別的實(shí)體進(jìn)行尋址。該實(shí)施例反映了一種事實(shí)，即實(shí)際上并不是所有被識(shí)別的實(shí)體都必須具有可獲得的所請(qǐng)求的復(fù)制件。注意，如果將復(fù)制件號(hào)碼用于存放該復(fù)制件，則通過函數(shù)的方式指定到特定復(fù)制件號(hào)碼的實(shí)體只確定帶有該實(shí)體號(hào)碼的復(fù)制件必須被存放到的位置。但是，不需要下面情況，即在網(wǎng)絡(luò)中的任何實(shí)體目前都具有實(shí)際將帶有該號(hào)碼的復(fù)制件存放在這個(gè)特定位置/實(shí)體處的需要，因?yàn)槔缒壳霸谑褂弥械膹?fù)制件的數(shù)量對(duì)于滿足過去的要求是足夠的。
但是，當(dāng)相對(duì)于多于一個(gè)識(shí)別的實(shí)體尋址請(qǐng)求時(shí)，更可能從在詢問中的復(fù)制件是可獲得的并且已經(jīng)準(zhǔn)備好下載的、所尋址的實(shí)體的至少一個(gè)實(shí)體中接收信息。
在另一個(gè)優(yōu)選實(shí)施例中，通過與文檔相關(guān)的請(qǐng)求僅僅對(duì)被識(shí)別的實(shí)體中的所選擇的那些實(shí)體進(jìn)行尋址。針對(duì)尋址目的，該實(shí)施例允許從被識(shí)別實(shí)體中選擇有資格的實(shí)體。因?yàn)橛糜谧R(shí)別提供文檔的復(fù)制件的實(shí)體的過程可能不需要太多資源，并且因此對(duì)于最多N個(gè)復(fù)制件號(hào)碼或至少對(duì)于其大部分執(zhí)行該過程，所以處理與許多實(shí)體的通訊可能很麻煩并且浪費(fèi)時(shí)間和資源。為了最小化要被發(fā)送到所識(shí)別的實(shí)體的請(qǐng)求的數(shù)量，可以應(yīng)用評(píng)估方案來(lái)從所識(shí)別的實(shí)體中只確定最有希望的實(shí)體?？梢愿鶕?jù)不同的標(biāo)準(zhǔn)來(lái)進(jìn)行評(píng)估以判斷實(shí)體是否是有希望的。
特別是當(dāng)因?yàn)槟撤N原因不希望有到實(shí)體的密集通訊時(shí)，評(píng)估/選擇過程可以只選擇一個(gè)優(yōu)選的實(shí)體以尋址該文檔相關(guān)的請(qǐng)求到其上作為結(jié)束。
一個(gè)非常優(yōu)選的評(píng)估方案可以包括用于計(jì)算與實(shí)體相關(guān)的成本值的成本函數(shù)。這種成本值可以指示用于尋址該實(shí)體和/或與該實(shí)體進(jìn)行通訊和/或從該實(shí)體執(zhí)行下載的成本，其中例如可以用所需要的時(shí)間和/或資源和/或與尋址相關(guān)實(shí)體相關(guān)地指示優(yōu)點(diǎn)或者缺點(diǎn)的其他參數(shù)來(lái)定義成本。最好，對(duì)于k個(gè)被識(shí)別的實(shí)體的每一個(gè)實(shí)體都計(jì)算成本值。在隨后的步驟中，根據(jù)所計(jì)算的成本值從所識(shí)別的實(shí)體中選擇要被尋址的實(shí)體。最好，只選擇示出低成本值的、要被尋址的實(shí)體。可以引入閾值以確定示出低成本值的實(shí)體。或者從許多評(píng)估過的實(shí)體中選擇示出最低成本值的實(shí)體。
在優(yōu)選實(shí)施例中，成本函數(shù)可以從成本數(shù)據(jù)庫(kù)中查詢或獲得實(shí)體的成本值。這種數(shù)據(jù)庫(kù)可以是本地(例如，高速緩存)、集中化的、或分布的數(shù)據(jù)庫(kù)。
最好當(dāng)不能獲得用于得到實(shí)體的成本值的其他手段時(shí)，可以從帶有這些實(shí)體的通訊中直接得到這種成本值。在優(yōu)選實(shí)施例中，尋址被識(shí)別的實(shí)體并且調(diào)用其以發(fā)送響應(yīng)，其中例如測(cè)量在請(qǐng)求的發(fā)布和在檢索實(shí)體處的響應(yīng)到達(dá)之間的時(shí)間并且將該時(shí)間轉(zhuǎn)換為所尋址的實(shí)體的成本值。該成本值可能與檢索實(shí)體的位置和所尋址的實(shí)體的位置相關(guān)，所尋址的實(shí)體所處的位置越遠(yuǎn)則往返的時(shí)間越長(zhǎng)。但是，事先以這種方式來(lái)確定成本值是合理的，特別在要下載表示大型文件的復(fù)制件之前。于是其與從隨機(jī)選擇的被識(shí)別的實(shí)體中用下載來(lái)立即開始(這可能意外地提供非常慢的下載速率)相比，為了成本估計(jì)的目的而使用短消息尋址多個(gè)被識(shí)別的實(shí)體可能是一種更省時(shí)的方法。
總體上，可以由在詢問中的實(shí)體的絕對(duì)值或由將成本當(dāng)作與檢索實(shí)體相關(guān)的成本的相對(duì)值來(lái)表示成本值。
在從每個(gè)被尋址的實(shí)體中接收“復(fù)制件不可獲得”響應(yīng)的情況中，從尋址與文檔相關(guān)的請(qǐng)求而涉及的被識(shí)別的實(shí)體中選擇另一個(gè)實(shí)體?！皬?fù)制件不可獲得”響應(yīng)指示實(shí)際上在相關(guān)的實(shí)體中沒有存儲(chǔ)這樣的復(fù)制件。
假設(shè)網(wǎng)絡(luò)中以復(fù)制件號(hào)碼的升序來(lái)存儲(chǔ)復(fù)制件，“復(fù)制件不可獲得”響應(yīng)指示沒有復(fù)制件在該實(shí)體處用該特定復(fù)制件號(hào)碼進(jìn)行存儲(chǔ)。此外，可以從這樣的系統(tǒng)規(guī)則中適當(dāng)?shù)氐贸鲞@樣的結(jié)論，即在實(shí)體被指定有比該特定的復(fù)制件號(hào)碼更高的復(fù)制件號(hào)碼的情況下，沒有復(fù)制件被存儲(chǔ)于在網(wǎng)絡(luò)中的任何位置的這些實(shí)體處。這意味著對(duì)被期待用較高復(fù)制件號(hào)碼來(lái)存儲(chǔ)相同文檔的復(fù)制件的實(shí)體的尋址是沒希望的。這樣最好從表示比失敗的復(fù)制件號(hào)碼低的復(fù)制件號(hào)碼的一組實(shí)體中選擇至少一個(gè)實(shí)體以尋址新的請(qǐng)求到其上。這極大地有助于對(duì)總體上值得被尋址的實(shí)體數(shù)量進(jìn)行限制。
作為重復(fù)地將上述規(guī)則輪流應(yīng)用到所有回答的直接結(jié)果，如果存取多于一個(gè)實(shí)體并且所有響應(yīng)指示“復(fù)制件不可獲得”，則這些所尋址的復(fù)制件號(hào)碼中的最低復(fù)制件號(hào)碼為從其中選擇另一個(gè)實(shí)體以用該請(qǐng)求對(duì)其進(jìn)行尋址的新的一組復(fù)制件號(hào)碼設(shè)置上限。
在這組剩余的實(shí)體內(nèi)，可以根據(jù)它們的成本值來(lái)再次選擇隨后要被尋址的(多個(gè))實(shí)體。這意味著在該組剩余的實(shí)體內(nèi)，在進(jìn)一步的步驟中再次尋址在將低成本作為選擇條件的情況中示出最低成本的(多個(gè))實(shí)體。當(dāng)隨后對(duì)于這種請(qǐng)求沒有響應(yīng)則顯示出提供所請(qǐng)求的復(fù)制件的實(shí)體，在這些請(qǐng)求中所涉及的最低復(fù)制件號(hào)碼再次為在進(jìn)一步的步驟中可能尋址所關(guān)聯(lián)的實(shí)體的復(fù)制件號(hào)碼設(shè)置上限。
逐步地和反復(fù)地將不提供復(fù)制件的被識(shí)別的并被尋址的實(shí)體進(jìn)行排除以及其他實(shí)體具有比已經(jīng)被尋址的實(shí)體更高的被指定的復(fù)制件號(hào)碼的結(jié)論，極大地減少了在網(wǎng)絡(luò)上用于檢索復(fù)制件的通訊。
但是，其中當(dāng)從所尋址的(多個(gè))實(shí)體接收關(guān)于在那里即不是不可獲得復(fù)制件也不是可以獲得復(fù)制件的任何指示時(shí)，不能得出下面的結(jié)論，即由比失敗的一個(gè)復(fù)制件號(hào)碼更高的復(fù)制件號(hào)碼來(lái)確定的任何其他實(shí)體總體上不提供在詢問中的復(fù)制件。結(jié)果是，不能從將進(jìn)一步請(qǐng)求尋址到的實(shí)體之中將這些實(shí)體排除?，F(xiàn)在只能排除已經(jīng)尋址的(多個(gè))實(shí)體，因?yàn)槠渲甘局辽僭谠摬樵兊臅r(shí)間中保持不可達(dá)到。但是，最好將請(qǐng)求尋址到剩余實(shí)體中的另一個(gè)，該實(shí)體是從被識(shí)別的實(shí)體中選擇的并且最好示出下一個(gè)最佳成本值。
根據(jù)本發(fā)明的另一個(gè)實(shí)施例，從被識(shí)別的實(shí)體中選擇一個(gè)或多個(gè)最優(yōu)選的實(shí)體，并且將與文檔相關(guān)的請(qǐng)求尋址到每個(gè)最優(yōu)選的實(shí)體。在該實(shí)施例中，根據(jù)它們到檢索實(shí)體的距離來(lái)選擇所尋址的實(shí)體，其中每個(gè)最優(yōu)選的實(shí)體示出到檢索實(shí)體的短距離，而且其中可以通過絕對(duì)地應(yīng)用閾值或者通過相對(duì)地比較所檢測(cè)的距離來(lái)定義短距離，例如，當(dāng)要選擇g個(gè)實(shí)體時(shí)，最好該g個(gè)實(shí)體是在所識(shí)別的實(shí)體中相對(duì)于檢索實(shí)體示出最短距離的那些。在某些網(wǎng)絡(luò)中特別是在某些實(shí)體識(shí)別符記法中，可以從所關(guān)聯(lián)的實(shí)體識(shí)別符中得出位置和由此得到的距離度量?？梢詫⑦@樣的距離當(dāng)作成本值，并且可將該成本值作為選擇過程的條件來(lái)使用。
而且，在該實(shí)施例中最好在接收從所尋址的實(shí)體來(lái)的“復(fù)制件不可獲得”消息時(shí)，從一組所識(shí)別的實(shí)體中選擇至少一個(gè)其他實(shí)體作為將文檔相關(guān)的請(qǐng)求尋址到其上的第二最佳優(yōu)選實(shí)體，將該組所識(shí)別的實(shí)體限于帶有比與最優(yōu)選的(多個(gè))實(shí)體識(shí)別符關(guān)聯(lián)的最低復(fù)制件號(hào)碼還低的對(duì)應(yīng)復(fù)制件號(hào)碼的實(shí)體。最好根據(jù)其到檢索實(shí)體的距離而從該組所識(shí)別的實(shí)體中選擇第二優(yōu)選實(shí)體，其中從關(guān)聯(lián)的實(shí)體識(shí)別符來(lái)的一組實(shí)體之間得出最接近的距離。
根據(jù)本發(fā)明的另一個(gè)方面，所提供的計(jì)算機(jī)程序元件包括計(jì)算機(jī)程序代碼組件，當(dāng)將其載入到計(jì)算實(shí)體的處理器單元中時(shí)，其配置處理器單元以執(zhí)行如權(quán)利要求1到22和25中的任何一個(gè)權(quán)利要求所述的方法。
此外，提供在計(jì)算機(jī)網(wǎng)絡(luò)中檢索電子文檔的復(fù)制件的計(jì)算實(shí)體，該計(jì)算實(shí)體包括被設(shè)計(jì)來(lái)執(zhí)行一種方法的控制單元，該方法用于如權(quán)利要求1到22的任何一項(xiàng)權(quán)利要求所述或如上面所述的、在計(jì)算機(jī)網(wǎng)絡(luò)中檢索電子文檔的復(fù)制件的方法。
還提供了一種用于在計(jì)算機(jī)網(wǎng)絡(luò)中存放電子文檔的復(fù)制件的計(jì)算實(shí)體，其包括一個(gè)被設(shè)計(jì)來(lái)執(zhí)行一種方法的控制單元，該方法用于如權(quán)利要求25或上述說(shuō)明所述的，在計(jì)算機(jī)網(wǎng)絡(luò)中存放電子文檔的復(fù)制件。
對(duì)于參照用于在計(jì)算機(jī)網(wǎng)絡(luò)上檢索或存放復(fù)制件的方法所描述的優(yōu)點(diǎn)和實(shí)施例，也可以考慮為在所描述的計(jì)算實(shí)體和計(jì)算機(jī)程序元件之前對(duì)于這里的分別有益的實(shí)施例。

現(xiàn)在將以示例的方式，參照附圖來(lái)描述本發(fā)明的優(yōu)選實(shí)施例，其中圖1示出了作為分布存儲(chǔ)的部分的網(wǎng)絡(luò)部分；圖2示出了成本函數(shù)的示意圖；圖3a和3b示出了根據(jù)本發(fā)明實(shí)施例的、在計(jì)算機(jī)網(wǎng)絡(luò)中檢索復(fù)制件的方法的流程圖；和圖4示出了成本函數(shù)的另一個(gè)示意圖。
在不同的圖中可能示出相同的附圖標(biāo)記，表示帶有類似或相同內(nèi)容的元件。
具體實(shí)施例方式
圖1示出了計(jì)算實(shí)體100、120、140、160、180、200、220、240、260、280、300、320、340、360、380、400、420、440、460、480、500、520、540、560、580、600、620、640、660、680-所有都被稱為節(jié)點(diǎn)-并且作為計(jì)算機(jī)網(wǎng)絡(luò)1的部分。計(jì)算實(shí)體所帶有的號(hào)碼是實(shí)體識(shí)別符，其最終是或者表示實(shí)體的地址。
假設(shè)帶有文檔識(shí)別符D1的文檔是非常流行的文檔。因此，在整個(gè)網(wǎng)絡(luò)1上存儲(chǔ)了該文檔的許多復(fù)制件。在該網(wǎng)絡(luò)上分布的復(fù)制件的最大數(shù)量是N＝6，其中為了說(shuō)明的目的，作為相對(duì)較小的數(shù)字而選擇該號(hào)碼。因此，在系統(tǒng)范圍內(nèi)的提供每個(gè)文檔的最多N個(gè)復(fù)制件。引入下面記法D1:1表示文檔D1的第1號(hào)復(fù)制件，D1:2表示文檔D1的第2號(hào)復(fù)制件，等等。
如能從圖1中推出的，在網(wǎng)絡(luò)1上、在帶有實(shí)體識(shí)別符100、200、300、400、500、600的位置/實(shí)體處散布著文檔D1的k＝N個(gè)復(fù)制件。在另一方面，從圖1中還可以推出，在實(shí)體120、220、320、420、520、620處還能夠以N＝6個(gè)復(fù)制件(為了說(shuō)明的目的，以此為例)的形式獲得另一個(gè)文檔D2。
在網(wǎng)絡(luò)1上文檔D1和D2根據(jù)下面函數(shù)存放h(i，Dx)＝100+(((x-1)*20)+((i-1)*100)modulo 600)其中i是復(fù)制件號(hào)碼，并且i＝[1.....N]，并且Dx是帶有x的文檔識(shí)別符，x為數(shù)字1、2。
在圖1中所示的實(shí)體之一，或者在圖1所示的網(wǎng)絡(luò)范圍之外的另一個(gè)實(shí)體已經(jīng)應(yīng)用了該函數(shù)h(i，Dx)以存放文檔D1和D2的復(fù)制件，并且實(shí)際上已經(jīng)將每個(gè)文檔的6個(gè)復(fù)制件存放在網(wǎng)絡(luò)上。
僅僅為了說(shuō)明的目的，可以依照例如象h(i，Dx)＝100+((x*20)+i*(120-20*x)-120)modulo 600)的函數(shù)而在網(wǎng)絡(luò)上存放另一個(gè)文檔，結(jié)果是在例如實(shí)體300處有不同文檔的復(fù)制件的重疊存放。
用更一般的話來(lái)說(shuō)，對(duì)于每個(gè)文檔Dx，存在有Dx的數(shù)量為k的復(fù)制件。在地址h(i，d)處存儲(chǔ)這些復(fù)制件，其中1＜＝i＜k。并且最好以偽隨機(jī)散列函數(shù)實(shí)現(xiàn)h()。這意味著將每個(gè)地址用DHT映射到網(wǎng)絡(luò)中的一個(gè)機(jī)器。
因?yàn)榭梢詫⒖刂瞥杀?即，實(shí)際請(qǐng)求)的操作的平均數(shù)量限制到log(N+1)，所以通?？梢詫⒃试S的復(fù)制件的最大數(shù)量N選擇得非常大。例如，選擇N＝1023導(dǎo)致平均10個(gè)消息或更少的消息用于定位最接近的復(fù)制件并且開始下載。
檢索實(shí)體(例如可以是帶有識(shí)別符140的實(shí)體)現(xiàn)在可能想要存取被作為D1識(shí)別的文檔的復(fù)制件。計(jì)算實(shí)體140具有可獲得的、相同的函數(shù)h(i，Dx)＝100+(((x-1)*20)+((i-1)*100)modulo 600)用于確定可從其中獲得文檔D1的復(fù)制件的實(shí)體。當(dāng)對(duì)所有i個(gè)復(fù)制件號(hào)碼應(yīng)用該函數(shù)時(shí)，檢索實(shí)體140將獲得實(shí)體識(shí)別符100、200、300、400、500、600，作為結(jié)果。
已經(jīng)確定了文檔D1的復(fù)制件可從其中獲得以用于下載的這些位置，檢索實(shí)體140現(xiàn)在應(yīng)用成本函數(shù)。已知，至少當(dāng)只考慮數(shù)字“幾百”的識(shí)別符并且知道在網(wǎng)絡(luò)的最右手部分中的擁有位置時(shí)，實(shí)體識(shí)別符從網(wǎng)絡(luò)1的右手部分向網(wǎng)絡(luò)1的左手部分而增大，由實(shí)體140所應(yīng)用的成本函數(shù)可以是由函數(shù)h(i，Dx)得出的所有實(shí)體識(shí)別符的比較。結(jié)果可能是這樣的一種關(guān)系，即100＜200＜300＜400＜500＜600。根據(jù)這種結(jié)果，可以得出下面結(jié)論，即帶有識(shí)別符100的實(shí)體作為等級(jí)中的第一個(gè)示出最低成本值，而實(shí)體600作為等級(jí)中的最后一個(gè)示出最高成本值。轉(zhuǎn)換為書面語(yǔ)言就是，成本值指示被識(shí)別為實(shí)體100的實(shí)體可能是最接近檢索實(shí)體140的一個(gè)。因?yàn)闄z索實(shí)體關(guān)注點(diǎn)在于進(jìn)行快速下載，所以實(shí)體100好像對(duì)于通訊來(lái)說(shuō)最經(jīng)濟(jì)有效因此對(duì)于下載來(lái)說(shuō)也就最經(jīng)濟(jì)有效。
作為結(jié)果，檢索實(shí)體將請(qǐng)求尋址到具有文檔D1的實(shí)體100，實(shí)體100用肯定回答(“D1的復(fù)制件在這里可獲得”)進(jìn)行響應(yīng)，或者在另外的實(shí)施例中，用直接發(fā)送復(fù)制件D1進(jìn)行響應(yīng)。
圖2示出了在對(duì)實(shí)體140應(yīng)用成本函數(shù)后，與D1的每個(gè)被識(shí)別的復(fù)制件關(guān)聯(lián)的成本的示意圖。與網(wǎng)絡(luò)中的檢索實(shí)體140的位置相關(guān)來(lái)確定該成本，該成本表示根據(jù)如上所述的對(duì)于網(wǎng)絡(luò)結(jié)構(gòu)的認(rèn)識(shí)、到檢索實(shí)體140的距離的評(píng)估。
在另一個(gè)實(shí)施例中，假設(shè)實(shí)體420現(xiàn)在是檢索實(shí)體，其正在尋找文檔D1的復(fù)制件并且將實(shí)體100、200、300、400、500、600識(shí)別為這樣的復(fù)制件的可能提供者。當(dāng)將實(shí)體固有的成本函數(shù)用于420時(shí)，產(chǎn)生這樣的結(jié)果，即實(shí)體400可能是檢索實(shí)體420要從其獲得復(fù)制件的最接近的實(shí)體。圖4示出在對(duì)實(shí)體420應(yīng)用成本函數(shù)后，與D1的每個(gè)被識(shí)別的復(fù)制件關(guān)聯(lián)的成本的示意圖。與網(wǎng)絡(luò)中的檢索實(shí)體420的位置相關(guān)來(lái)確定成本，該成本表示基于如上所述的對(duì)網(wǎng)絡(luò)結(jié)構(gòu)的認(rèn)知、對(duì)到檢索實(shí)體420的距離的評(píng)估。
但是，現(xiàn)在僅實(shí)體100、200、300才可以實(shí)際地提供文檔D1的復(fù)制件，這是因?yàn)槲臋nD1的管理者由于還沒有對(duì)這些復(fù)制件號(hào)碼應(yīng)用散列函數(shù)所以還沒有將復(fù)制件分發(fā)到實(shí)體400、500和600。
因此，當(dāng)檢索實(shí)體420現(xiàn)在將請(qǐng)求發(fā)送到最接近的實(shí)體400時(shí)，實(shí)體400現(xiàn)在可能做出在實(shí)體400處不能獲得文檔D1的復(fù)制件的響應(yīng)。請(qǐng)求實(shí)體420現(xiàn)在可能嘗試將另一個(gè)請(qǐng)求尋址到作為下一個(gè)優(yōu)選的、并且能夠從其獲得復(fù)制件的下一個(gè)接近的實(shí)體的實(shí)體500。但是，假定網(wǎng)絡(luò)中的實(shí)體是以復(fù)制件號(hào)碼升序順序的復(fù)制件來(lái)填充的情況下，很明顯，當(dāng)實(shí)體400不能提供復(fù)制件號(hào)碼i＝4時(shí)，在所指定的實(shí)體處不可獲得帶有較高復(fù)制件號(hào)碼的任何復(fù)制件。因此，現(xiàn)在被引導(dǎo)到在被識(shí)別的實(shí)體100到600內(nèi)的除實(shí)體400之外的另一個(gè)實(shí)體的任何請(qǐng)求都必須被引導(dǎo)到可能提供帶有比i＝4更小的復(fù)制件號(hào)碼的復(fù)制件的實(shí)體處。因此，實(shí)體100、200、300可形成與小于i＝4的復(fù)制件號(hào)碼關(guān)聯(lián)的、實(shí)際可能具有文檔D1的復(fù)制件存儲(chǔ)其中的一組實(shí)體。因?yàn)閷?shí)體300示出在剩余實(shí)體中最低的成本，所以檢索實(shí)體420下一個(gè)可能接近實(shí)體300并且可能成功。但是，如果甚至實(shí)體300也不具有可獲得的文檔D1的復(fù)制件，將進(jìn)一步限制隨后要被接近的一組實(shí)體。通過以反復(fù)的方式應(yīng)用這種方案，可以省去到其他實(shí)體的許多通訊。
如已經(jīng)說(shuō)明的，某些分布散列表(DHT)保持本地性，即通過知道兩個(gè)地址是類似的，可以得出這樣的結(jié)論——服務(wù)那些地址的實(shí)體也會(huì)接近。使用這種性質(zhì)來(lái)估計(jì)到另一個(gè)實(shí)體的距離——如根據(jù)由DHT使用的量度進(jìn)行測(cè)量。支持這種系統(tǒng)的DHT例如是在Marcel Waldvogel和Roberto Rinaldi所著的“Efficient Topology-Aware Overlay Network”，ACM ComputerCommunications Review，2003年1月，卷33，第1號(hào)，101-106頁(yè)中的Mithos，因此通過引用將其合并。但是，還可以應(yīng)用其他成本函數(shù)。這樣的成本函數(shù)可以是網(wǎng)絡(luò)自身的一部分或在其上，或者獨(dú)立作為每個(gè)實(shí)體的一部分。
根據(jù)本發(fā)明的另一個(gè)實(shí)施例，當(dāng)客戶想要定位帶有ID d的文檔時(shí)，其先驗(yàn)地只需要知道復(fù)制件的最大數(shù)量N和所使用的散列函數(shù)。則該過程如下1.r＝N2.客戶通過對(duì)復(fù)制件號(hào)碼，i(1＜＝i＜r)的所有可能值檢查服務(wù)文檔的距離來(lái)確定復(fù)制該文檔的哪個(gè)節(jié)點(diǎn)是最接近。其選擇最接近的一個(gè)-假設(shè)其是節(jié)點(diǎn)g-并且向其要求該文檔。在非常合適的DHT中，或由適合的本地?cái)?shù)據(jù)庫(kù)進(jìn)行擴(kuò)充，這不需要發(fā)送任何消息。
3.如果被要求的節(jié)點(diǎn)以該文檔進(jìn)行回答，則一切正常；否則，r＝g-1，繼續(xù)在步驟2的該算法(推薦將距離的計(jì)算進(jìn)行高速緩存)。
因?yàn)樵撍阉饕宰罱咏墓?jié)點(diǎn)開始，所以能夠返回最接近的可能的復(fù)制件。如果其實(shí)際上是復(fù)制件，則發(fā)現(xiàn)最接近的復(fù)制件。如果其不具有最接近的復(fù)制件，則可以從搜索中將所有以g或更高的號(hào)碼進(jìn)行編號(hào)的復(fù)制件進(jìn)行排除，因?yàn)閺?fù)制件位置策略保證復(fù)制件號(hào)碼是連續(xù)的并且從1開始。
在log N步驟之后希望其停止。因?yàn)樯⒘泻瘮?shù)是偽隨機(jī)的，所以在每個(gè)間隔中的最接近的節(jié)點(diǎn)將平均處于中間。因此，可以排除平均50％的候選節(jié)點(diǎn)。因?yàn)榭偸侵辽倥懦粋€(gè)節(jié)點(diǎn)，所以取得進(jìn)展是有保證的。如果至少存在一個(gè)復(fù)制件(編號(hào)為1的)，則發(fā)現(xiàn)文檔也是有保證的。不需要進(jìn)一步的信息。
因此，可以將本實(shí)施例的檢索方法表征為主元素(pivot)選擇角度的隨機(jī)化的二元搜索。通過并發(fā)地探查k個(gè)最接近的節(jié)點(diǎn)，可以將其擴(kuò)展到(k+1)元((k+1)-ary)搜索。然后，檢索節(jié)點(diǎn)可能不想直接地向被識(shí)別的、并且可以應(yīng)用成本選擇的節(jié)點(diǎn)要求文檔，而是僅僅詢問該節(jié)點(diǎn)是否具有該文檔，從而防止多重傳輸。
返回到圖1，已知的參數(shù)以及不變的系統(tǒng)范圍是復(fù)制件N的最大數(shù)量，并且使用散列函數(shù)h()。
如所提出的，在計(jì)算機(jī)網(wǎng)絡(luò)中用于檢索和/或存放復(fù)制件的方法還可以被用作備份系統(tǒng)，用于基于復(fù)制件管理的集中化的目錄結(jié)構(gòu)的、站點(diǎn)或組織范圍內(nèi)的、復(fù)制網(wǎng)絡(luò)化的存儲(chǔ)系統(tǒng)。在這種情況中，目錄服務(wù)器要提供故障的單個(gè)點(diǎn)。在這樣的情況中，這樣復(fù)制件的一個(gè)子集需要根據(jù)上面系統(tǒng)而進(jìn)行放置。而可以根據(jù)本地性模式(即，保證的離站(off-site)存儲(chǔ))或存取模式(即，接近客戶)按照所期望的來(lái)放置其他復(fù)制件。然后，即使集中化的目錄發(fā)生故障或者變得不可存取，還可以存取根據(jù)本發(fā)明所存儲(chǔ)的數(shù)據(jù)。即使依照根據(jù)本發(fā)明而指定的復(fù)制件的子集的大小和放置，性能可能下降，但是還是可以保證對(duì)數(shù)據(jù)的存取。
在本地化程度大的系統(tǒng)/網(wǎng)絡(luò)中-即在其中基本上可以同等存取所有系統(tǒng)的單個(gè)建筑物或站點(diǎn)內(nèi)，可用隨機(jī)函數(shù)來(lái)代替距離函數(shù)，以達(dá)到有效的負(fù)載均衡。
根據(jù)本發(fā)明的另一個(gè)實(shí)施例，也許不能獲得由如上所述的距離估計(jì)函數(shù)表示的、基于從實(shí)體識(shí)別符自身得來(lái)的信息的成本函數(shù)。代替從由于存放復(fù)制件而被識(shí)別的實(shí)體中選擇最接近的實(shí)體，可以從被識(shí)別的實(shí)體中選擇隨機(jī)實(shí)體并且進(jìn)行尋址。對(duì)于這種請(qǐng)求的響應(yīng)可以承載諸如復(fù)制件負(fù)載或往返時(shí)間的信息，其可以在多個(gè)匹配的情況中幫助選擇最佳匹配。與成本估計(jì)結(jié)合的這種隨機(jī)選擇不保證檢測(cè)到最近的節(jié)點(diǎn)，但是其可以將檢索實(shí)體引導(dǎo)到復(fù)制件的最終位置。被尋址的實(shí)體的相對(duì)較大的數(shù)量k產(chǎn)生較多的探詢從而導(dǎo)致接近實(shí)體的較高概率。
如果，類似如上所述的距離估計(jì)函數(shù)的成本函數(shù)是昂貴的，但是還是比向?qū)嶓w發(fā)送消息要節(jié)省，則僅僅從被識(shí)別的實(shí)體中選擇一個(gè)子集的實(shí)體以計(jì)算它們各自的成本值。然后，從成本值的角度來(lái)選擇最佳實(shí)體以向其發(fā)送請(qǐng)求。
在上面的兩個(gè)實(shí)施例中，都不需要識(shí)別可能具有復(fù)制件的所有N個(gè)實(shí)體。相反地，可以只選擇較少數(shù)量k＜N的復(fù)制件號(hào)碼用于確定所關(guān)聯(lián)的實(shí)體。
如果所接近的實(shí)體不可達(dá)到或者返回可以被理解為“當(dāng)前不能服務(wù)文檔，請(qǐng)選擇另一個(gè)復(fù)制件”的“過載”消息或者在接近后到達(dá)超時(shí)，則不可能做出關(guān)于節(jié)點(diǎn)是否不具有可獲得的復(fù)制件、或者它們是否具有可獲得的復(fù)制件但是當(dāng)前因?yàn)槿魏卧蚨荒馨l(fā)送該復(fù)制件的估計(jì)。與存放復(fù)制件的方法相關(guān)，一個(gè)可能的返回消息還可以指示所尋址的實(shí)體的確帶有復(fù)制件，但是不能獲得足夠的存儲(chǔ)。雖然對(duì)其性能影響最小，該算法還是可以正確地工作。因此，如果沒有任何被尋址的實(shí)體返回該實(shí)體要發(fā)送文檔的承諾或者它們不具有該文檔的指示，則不能限制用于尋址進(jìn)一步的請(qǐng)求的搜索范圍。相反地，從當(dāng)前實(shí)體范圍來(lái)選擇下一個(gè)最佳實(shí)體，例如，使用任何類型的成本估計(jì)，并且隨后接近這些實(shí)體。
圖3示出了實(shí)施根據(jù)本發(fā)明的檢索復(fù)制件的方面的兩個(gè)流程圖。圖3a)示出了用于拓?fù)湟阎W(wǎng)絡(luò)的方法，而圖3b)示出了拓?fù)湮粗W(wǎng)絡(luò)的流程圖。拓?fù)湟阎诖颂幰馕吨梢灾辽購(gòu)钠涞刂?識(shí)別符得出，或者從附加的、相對(duì)廉價(jià)的探詢或測(cè)量中粗略地得出實(shí)體的位置。
對(duì)于兩個(gè)流程圖，應(yīng)用下面記法-N，是復(fù)制件的最大數(shù)量-h(m，d)，是關(guān)于復(fù)制件號(hào)碼m和文檔ID d的散列函數(shù)-c(a)，是給出到地址a的成本的成本函數(shù)-k，是每個(gè)步驟探詢的次數(shù)參照?qǐng)D3a)，在步驟S1，將作為文檔的可能的復(fù)制件的最大有效號(hào)碼的r初始化到N。在步驟S2，a_m＝h(m，d)，對(duì)在[1，N]中的所有m進(jìn)行計(jì)算。在步驟S3，c_m＝c(a_m)，對(duì)在[1，N]中的所有m進(jìn)行計(jì)算。在步驟S4，從集合[1，r]中選擇k個(gè)索引m_1....m_k，從而對(duì)應(yīng)的c_m_i是最小的。在步驟S5，探詢a_i個(gè)地址?？蛇x地，在僅僅k-s個(gè)回答之后終止探詢。如果，在步驟S6，任何探詢返回文檔可獲得性[1]，則在步驟S7根據(jù)任何量度確定最佳探詢/地址，并且在步驟S8從該最佳地址返回復(fù)制件。
如果在步驟S6沒有任何被尋址的實(shí)體返回文檔[2]，則在步驟S9，將r設(shè)置為min(m_i)-1，并且在步驟S4繼續(xù)該方法。
參照?qǐng)D3b)，在步驟R1，將作為文檔的可能的復(fù)制件的最大有效號(hào)碼的r初始化到N。在步驟R2，從集合[1，r]中隨機(jī)地選擇k個(gè)索引m_1....m_k。在步驟R3，確定通過計(jì)算a_i＝h(m_i，d)而被探詢的、a_i個(gè)所尋址的復(fù)制件。在步驟R4，探詢a_i個(gè)地址。在僅僅k-s個(gè)回答之后就選擇性地終止探詢，從而不浪費(fèi)時(shí)間來(lái)等待可能永遠(yuǎn)不會(huì)到來(lái)的最后幾個(gè)回答，因?yàn)樗鶎ぶ返墓?jié)點(diǎn)可能沒有運(yùn)轉(zhuǎn)或不能到達(dá)。這可通過不監(jiān)聽所有節(jié)點(diǎn)的成本而提高性能。已經(jīng)不被等待的節(jié)點(diǎn)將是好的候選復(fù)制件的情況是不可能的，因?yàn)樗鼈兎从陈脑蚩赡苁怯捎诰W(wǎng)絡(luò)的過載或該復(fù)制件自身。
如果在步驟R5，任何探詢返回文檔可獲得性[1]，則在步驟R6根據(jù)任何量度來(lái)確定最佳探詢/地址，并且在步驟R7，從該最佳地址返回的復(fù)制件返回最佳。如果沒有任何被尋址的實(shí)體返回文檔[2]，則在步驟R8，將r設(shè)置為min(m_i)-1，并且在步驟R2繼續(xù)該方法。
在下面的部分中，將描述根據(jù)本發(fā)明的所有方面的一些更多的實(shí)施例。
如果根據(jù)成本估計(jì)僅僅將文檔相關(guān)的請(qǐng)求發(fā)送到被識(shí)別的實(shí)體之一，則在該機(jī)器處的負(fù)載非常高的情況下，該實(shí)體可能需要長(zhǎng)時(shí)間來(lái)響應(yīng)。可以通過以隨機(jī)的方式在被識(shí)別的實(shí)體中選擇至少一個(gè)另外的額外實(shí)體、并且向這樣的至少一個(gè)更多的實(shí)體發(fā)送另一個(gè)請(qǐng)求來(lái)進(jìn)一步改善這種尋址機(jī)制。如此，接近的因而根據(jù)所介紹的方案被選擇尋址、但是過載因而將不響應(yīng)或者只非常慢地響應(yīng)的實(shí)體可以被檢測(cè)，并且通過將來(lái)的查詢，即不為將來(lái)的請(qǐng)求考慮它，對(duì)該實(shí)體進(jìn)行自動(dòng)卸載。在另一方面，在這種情況中，隨機(jī)選擇的實(shí)體可能及時(shí)提供所請(qǐng)求的響應(yīng)而不必選擇由將新請(qǐng)求尋址到其上的實(shí)體的新的接近。
根據(jù)另一個(gè)實(shí)施例，可以將所分發(fā)的請(qǐng)求的數(shù)量以及相應(yīng)的搜索時(shí)間限制到某個(gè)概率處，以從選擇過程中排除小集合的節(jié)點(diǎn)。因此，可以選擇次最優(yōu)的鄰居，或者在將嚴(yán)重網(wǎng)絡(luò)中斷與非常壞的成本函數(shù)結(jié)合的情況中，可以不搜索所有的潛在復(fù)制件。所期望的性能是要被發(fā)送出的log(N)個(gè)步驟/請(qǐng)求，其中N是復(fù)制件的最大數(shù)量。然而，最壞的情況是N個(gè)步驟，即，如果成本函數(shù)是復(fù)制件號(hào)碼的單調(diào)遞減函數(shù)。這種成本函數(shù)的作用是每個(gè)步驟將只去除單個(gè)潛在的復(fù)制件，而不是所希望的它們的一半。對(duì)這個(gè)問題的解決方案是在每個(gè)步驟都有保證的最小進(jìn)展?？梢员挥脕?lái)保證最小進(jìn)展的可能的函數(shù)類包括最多N/base^(steps-delta)的界限r(nóng)(可能探詢的窗口)，其中base是諸如2的指數(shù)的底；steps是至此已經(jīng)被執(zhí)行的步驟的數(shù)量；而delta是最差情況速率。通過選擇base＝2，delta＝2，你要求最多delta個(gè)附加的步驟，并且假設(shè)二元搜索(每步驟的探詢數(shù)量，k＝1)，你的范圍將永遠(yuǎn)不寬出多于所期望的情況的base^delta的因數(shù)。而且，由base的因數(shù)來(lái)界定(bound)所發(fā)現(xiàn)的節(jié)點(diǎn)的質(zhì)量。將質(zhì)量因數(shù)定義如下給出r_d個(gè)實(shí)際的復(fù)制件，以增加的成本將它們排列。未修改的(未界定)搜索總發(fā)現(xiàn)那些中的第一個(gè)(＝最好的)。修改的情況將發(fā)現(xiàn)在首先的r_d*(1-1/base)個(gè)項(xiàng)目中被排序的一個(gè)，所以其永遠(yuǎn)不會(huì)比r_d*(1-1/base)項(xiàng)目更糟。
由J.Byer等人所著“Simple Load Balancing for Distributed Hash Tables”，International Peer-to-Peer Symposium(IPTPS)2003年2月，示出了在DHT內(nèi)使用兩個(gè)探詢是受歡迎的，因?yàn)槠涓玫胤峙湄?fù)載通常將一個(gè)項(xiàng)目存儲(chǔ)在兩個(gè)(或多個(gè))可能的位置中負(fù)載較輕的一個(gè)上。
權(quán)利要求
1.一種在計(jì)算機(jī)網(wǎng)絡(luò)中用于檢索電子文檔的復(fù)制件的方法，包括選擇至少一個(gè)復(fù)制件號(hào)碼，通過應(yīng)用給定函數(shù)，該函數(shù)要求復(fù)制件號(hào)碼和文檔識(shí)別符作為輸入確定至少一個(gè)實(shí)體識(shí)別符，每個(gè)實(shí)體識(shí)別符表示在網(wǎng)絡(luò)中可能提供復(fù)制件的實(shí)體，將與文檔相關(guān)的請(qǐng)求尋址到至少一個(gè)被識(shí)別的實(shí)體。
2.根據(jù)權(quán)利要求1所述的方法，包括選擇k＝N個(gè)復(fù)制件號(hào)碼，其中N是復(fù)制件的最大數(shù)量，通過應(yīng)用給定函數(shù)k次確定k個(gè)實(shí)體識(shí)別符。
3.根據(jù)權(quán)利要求1所述的方法，包括從最大數(shù)量N個(gè)復(fù)制件中選擇k個(gè)復(fù)制件號(hào)碼，其中k＜N，通過應(yīng)用給定函數(shù)k次確定k個(gè)實(shí)體識(shí)別符。
4.根據(jù)權(quán)利要求3所述的方法，其中k＜＝5。
5.根據(jù)權(quán)利要求3所述的方法，其中k＝1。
6.根據(jù)前面權(quán)利要求的任何一項(xiàng)所述的方法，包括將與文檔相關(guān)的請(qǐng)求尋址到所有被識(shí)別的實(shí)體。
7.根據(jù)前面權(quán)利要求1到4的任何一項(xiàng)所述的方法，包括只將與文檔相關(guān)的請(qǐng)求尋址到被識(shí)別的實(shí)體中的所選擇的那些。
8.根據(jù)前面權(quán)利要求1到4的任何一項(xiàng)所述的方法，包括只將與文檔相關(guān)的請(qǐng)求尋址到從被識(shí)別的實(shí)體中選擇的一個(gè)實(shí)體。
9.根據(jù)前面權(quán)利要求1到5的任何一項(xiàng)所述的方法，包括為k個(gè)實(shí)體的每一個(gè)實(shí)體計(jì)算成本函數(shù)，該成本函數(shù)提供成本值作為指示用于尋址相關(guān)實(shí)體的成本的結(jié)果。
10.結(jié)合權(quán)利要求7或權(quán)利要求8而根據(jù)權(quán)利要求9的方法，其中根據(jù)所關(guān)聯(lián)的成本值從被識(shí)別的實(shí)體中選擇要被尋址的每個(gè)實(shí)體。
11.根據(jù)權(quán)利要求10所述的方法，其中所尋址的實(shí)體/多個(gè)實(shí)體是示出最低成本值的一個(gè)/多個(gè)。
12.根據(jù)權(quán)利要求6或權(quán)利要求7所述的方法，其中從與這些實(shí)體的通訊中得出所尋址的實(shí)體的成本值。
13.根據(jù)權(quán)利要求6或權(quán)利要求7所述的方法，其中從成本數(shù)據(jù)庫(kù)中得出所尋址的實(shí)體的成本值。
14.根據(jù)前面權(quán)利要求的任何一項(xiàng)所述的方法，其中一旦從所尋址實(shí)體的每一個(gè)實(shí)體接收“復(fù)制件不可獲得”響應(yīng)，則從所識(shí)別的實(shí)體中選擇另一個(gè)實(shí)體以將與文檔相關(guān)的請(qǐng)求尋址到其上。
15.根據(jù)權(quán)利要求14所述的方法，其中通過選擇帶有比與之前將請(qǐng)求尋址到其上的實(shí)體/多個(gè)實(shí)體相關(guān)聯(lián)的復(fù)制件號(hào)碼低的關(guān)聯(lián)的復(fù)制件號(hào)碼的實(shí)體，從所識(shí)別的實(shí)體中選擇另一個(gè)實(shí)體。
16.根據(jù)前面權(quán)利要求的任何一項(xiàng)所述的方法，其中一旦從所尋址的實(shí)體/多個(gè)實(shí)體接收關(guān)于在這里即不是不可獲得復(fù)制件也不是可以獲得復(fù)制件的指示，從所識(shí)別的實(shí)體中選擇另一個(gè)實(shí)體以將與文檔相關(guān)的請(qǐng)求尋址到其上。
17.根據(jù)權(quán)利要求16所述的方法，其中根據(jù)所關(guān)聯(lián)的成本值來(lái)選擇另一個(gè)實(shí)體。
18.根據(jù)權(quán)利要求1到4的任何一項(xiàng)所述的方法，包括從所識(shí)別的實(shí)體中選擇至少一個(gè)最優(yōu)選的實(shí)體，和將與文檔相關(guān)的請(qǐng)求尋址到每個(gè)最優(yōu)選的實(shí)體。
19.根據(jù)權(quán)利要求18所述的方法，其中根據(jù)其到檢索實(shí)體的距離來(lái)選擇每個(gè)最優(yōu)選的實(shí)體。
20.根據(jù)權(quán)利要求19所述的方法，其中從所關(guān)聯(lián)的實(shí)體識(shí)別符而獲得實(shí)體的距離。
21.根據(jù)前面權(quán)利要求18到20之中的任何一項(xiàng)所述的方法，其中一旦從所尋址的實(shí)體接收“復(fù)制件不可獲得”消息，從一組所識(shí)別的實(shí)體中選擇至少一個(gè)其他實(shí)體作為第二優(yōu)選實(shí)體，以將與文檔相關(guān)的請(qǐng)求尋址到其上，將該組所識(shí)別的實(shí)體限于帶有比與最優(yōu)選的實(shí)體識(shí)別符關(guān)聯(lián)的復(fù)制件號(hào)碼低的對(duì)應(yīng)復(fù)制件號(hào)碼的實(shí)體。
22.根據(jù)權(quán)利要求19所述的方法，其中根據(jù)其到檢索實(shí)體的距離，從所述的一組識(shí)別實(shí)體中選擇第二優(yōu)選實(shí)體，其中從關(guān)聯(lián)的實(shí)體識(shí)別符得出最接近的距離。
23.一種包括計(jì)算機(jī)程序代碼組件的計(jì)算機(jī)程序元件，當(dāng)將所述計(jì)算機(jī)程序代碼組件載入到計(jì)算實(shí)體的處理器單元中時(shí)，其配置該處理器單元以執(zhí)行如前面權(quán)利要求的任何一項(xiàng)所述的方法。
24.一種用于在計(jì)算機(jī)網(wǎng)絡(luò)中檢索電子文檔的復(fù)制件的計(jì)算實(shí)體，包括控制單元，其被設(shè)計(jì)來(lái)執(zhí)行如權(quán)利要求1到22的任何一項(xiàng)所述的方法。
25.一種用于在計(jì)算機(jī)網(wǎng)絡(luò)中存放電子文檔的復(fù)制件的方法，選擇復(fù)制件號(hào)碼，通過應(yīng)用給定函數(shù)，該函數(shù)要求復(fù)制件號(hào)碼和文檔識(shí)別符作為輸入確定實(shí)體識(shí)別符，實(shí)體識(shí)別符表示在網(wǎng)絡(luò)中的實(shí)體，為了存放復(fù)制件的目的來(lái)尋址所識(shí)別的實(shí)體。
26.一種包括計(jì)算機(jī)程序代碼組件的計(jì)算機(jī)程序元件，當(dāng)將該計(jì)算機(jī)程序代碼組件載入到計(jì)算實(shí)體的處理器單元中時(shí)，該計(jì)算機(jī)程序代碼組件操作所述處理器單元以執(zhí)行如權(quán)利要求25所述的方法。
27.一種用于在計(jì)算機(jī)網(wǎng)絡(luò)中存放電子文檔的復(fù)制件的計(jì)算實(shí)體，包括控制單元，將其設(shè)計(jì)來(lái)執(zhí)行根據(jù)權(quán)利要求25所述的方法。
全文摘要
介紹了一種用于在計(jì)算機(jī)網(wǎng)絡(luò)中檢索或存放電子文檔的復(fù)制件的方法。在已經(jīng)選擇了至少一個(gè)復(fù)制件號(hào)碼之后，應(yīng)用散列函數(shù)。該函數(shù)要求復(fù)制件號(hào)碼和文檔識(shí)別符作為輸入。該函數(shù)返回至少一個(gè)實(shí)體識(shí)別符作為結(jié)果，每個(gè)實(shí)體識(shí)別符表示在網(wǎng)絡(luò)中可能提供復(fù)制件的實(shí)體。在隨后的步驟中，將與文檔相關(guān)的請(qǐng)求尋址到所識(shí)別的實(shí)體中的至少一個(gè)實(shí)體。
文檔編號(hào)G06F17/30GK1795448SQ200480014153
公開日2006年6月28日申請(qǐng)日期2004年5月7日優(yōu)先權(quán)日2003年6月30日
發(fā)明者丹尼爾·M·鮑爾, 保羅·T·赫爾利, 馬塞爾·沃爾德沃格爾申請(qǐng)人:國(guó)際商業(yè)機(jī)器公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：丹尼爾.M.鮑爾;保羅.T.赫爾利;馬塞爾.沃爾德沃格爾
技術(shù)所有人：國(guó)際商業(yè)機(jī)器公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

文檔檢索相關(guān)技術(shù)

文檔檢索系統(tǒng)相關(guān)技術(shù)

文檔檢索軟件相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

在計(jì)算機(jī)網(wǎng)絡(luò)中檢索電子文檔的復(fù)制件的制作方法