專利名稱:指紋數(shù)據(jù)庫維護(hù)方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明是關(guān)于維護(hù)數(shù)據(jù)庫的方法,該數(shù)據(jù)庫包括多個(gè)多媒體對象的每一個(gè)的指紋和相關(guān)元數(shù)據(jù)集。本發(fā)明還關(guān)于文件共享客戶、計(jì)算機(jī)程序產(chǎn)品和文件共享網(wǎng)絡(luò)。
人類的指紋被用作識別人已經(jīng)有一百多年。概念上,指紋能被看作是每個(gè)單個(gè)人類的唯一簡短概括。近來,不斷增長的興趣呈現(xiàn)在處理計(jì)算多媒體對象指紋的多媒體領(lǐng)域。為了限定兩個(gè)多媒體對象相同,不用比較多媒體對象本身,而只用比較它們的指紋。多媒體對象指紋是被討論對象相對永恒的特征。該指紋有時(shí)也被認(rèn)為是“(強(qiáng)壯的)散列”。
在使用指紋技術(shù)的大多數(shù)系統(tǒng)中,大量多媒體數(shù)據(jù)以及它們有關(guān)的各個(gè)元數(shù)據(jù)的指紋被存儲在數(shù)據(jù)庫中。術(shù)語“元數(shù)據(jù)”涉及比如標(biāo)題、藝人、流派等多媒體對象的信息。多媒體數(shù)據(jù)的元數(shù)據(jù)通過計(jì)算它的指紋和通過所計(jì)算的指紋作為查找鍵或查詢參數(shù)執(zhí)行查找/查詢數(shù)據(jù)庫來進(jìn)行檢索。
存儲多媒體對象的指紋來代替存儲多媒體內(nèi)容本身有多個(gè)優(yōu)點(diǎn)。提出一些1.內(nèi)存/存儲器對數(shù)據(jù)庫的要求減少。
2.比較指紋比比較多媒體對象本身更有效,因?yàn)橹讣y基本上要比對象短。
3.為匹配指紋搜索數(shù)據(jù)庫比為完整的多媒體對象搜索更有效,因?yàn)樗痰钠ヅ漤?xiàng)。
4.為匹配指紋的搜索更可能成功,因?yàn)槎嗝襟w對象的微小變化(比如不同的形式編碼或改變比特率)不影響指紋。
為多媒體對象生成指紋的一個(gè)例子在國際專利申請WO 02/064782(代理人文檔號PHNL010110),以及在Jaap Haitsma,Ton Kalker和Job Oostveen,“用于內(nèi)容識別的強(qiáng)壯音頻散列法”,基于內(nèi)容的多媒體索引國際工廠,Brescia,2001年9月。
在大規(guī)模系統(tǒng)中,指紋數(shù)據(jù)庫需要被分布到一定數(shù)量的指紋服務(wù)器,使得能夠處理所有的搜索請求并存儲所有的指紋。此外,數(shù)據(jù)庫需要與時(shí)間同步。例如,在音頻指紋的情況下,新發(fā)行的歌曲的指紋被加入。所需的服務(wù)器和數(shù)據(jù)庫時(shí)間同步使系統(tǒng)十分昂貴。
本發(fā)明的一個(gè)目標(biāo)是根據(jù)前言所提供的一種比所知方法便宜的方法。
根據(jù)本發(fā)明的方法達(dá)到的這個(gè)目標(biāo),該方法包括把數(shù)據(jù)庫各個(gè)部分分布到與用于共享所述多個(gè)多媒體對象的文件共享網(wǎng)絡(luò)相連接的各個(gè)文件共享客戶。
使用這個(gè)方法,就不再需要積極地出門去購買比如CD上的內(nèi)容,或自己去尋找內(nèi)容中的元數(shù)據(jù)了。通過利用網(wǎng)絡(luò)中文件共享客戶可得的對象和元數(shù)據(jù),指紋和元數(shù)據(jù)能以很便宜和有效的方式收集。這些客戶已經(jīng)使對象可被任何人下載,所以不需要再購買這些對象。另外,這些對象可以典型地和元數(shù)據(jù)合在一起,所以元數(shù)據(jù)也可以被使用。
把數(shù)據(jù)庫分布到文件共享網(wǎng)絡(luò)有不需要專用數(shù)據(jù)庫服務(wù)器和管理系統(tǒng)的附加優(yōu)點(diǎn)。該文件共享網(wǎng)絡(luò)已經(jīng)包含有潛在的大量相互連接的計(jì)算機(jī),這些計(jì)算機(jī)為維護(hù)這樣的數(shù)據(jù)庫提供了很合適的基礎(chǔ)。
并且,根據(jù)本發(fā)明的方法要比業(yè)界以前的方法更能擴(kuò)展。當(dāng)更多的用戶加入到文件共享網(wǎng)絡(luò)中,對元數(shù)據(jù)的請求數(shù)量會(huì)增加,那么如果期望有滿意的響應(yīng)時(shí)間,對數(shù)據(jù)庫服務(wù)器的請求也應(yīng)當(dāng)增加。但是,當(dāng)數(shù)據(jù)庫被分布到文件共享網(wǎng)絡(luò)中的客戶時(shí),那么當(dāng)新用戶加入網(wǎng)絡(luò)時(shí)網(wǎng)絡(luò)中更多的計(jì)算機(jī)會(huì)變?yōu)榭捎?。這些新計(jì)算機(jī)提供的多余計(jì)算能力、存儲和連接就可以被用作維護(hù)一部分?jǐn)?shù)據(jù)庫。這種方式下,一道擴(kuò)展了分布式數(shù)據(jù)庫的能力和要求。
本發(fā)明更進(jìn)一步的目標(biāo)是提供一個(gè)文件共享客戶,包括存儲一個(gè)或多個(gè)多媒體對象的存儲器,在存儲器中與文件共享網(wǎng)絡(luò)上的其它文件共享客戶共享多媒體對象的共享裝置,用于計(jì)算指紋和為被共享設(shè)備共享的多媒體對象獲取一組元數(shù)據(jù),以及用于添加計(jì)算出的指紋和所得到的元數(shù)據(jù)集到被分布到和文件共享網(wǎng)絡(luò)相連的文件共享客戶的數(shù)據(jù)庫的指紋裝置。
這樣的文件共享客戶能夠加入到如上概括的方法中。因?yàn)橹讣y和數(shù)據(jù)收集裝置被集成在文件共享客戶中,安裝文件共享客戶的用戶也能自動(dòng)的安裝所需裝置,用以幫助維護(hù)分布式數(shù)據(jù)庫。這樣,當(dāng)他們隨后加入到文件共享網(wǎng)絡(luò)時(shí),他們的計(jì)算能力、連接和存儲變得為網(wǎng)絡(luò)所用,并且擴(kuò)展了分布式數(shù)據(jù)庫的功能。
在一個(gè)實(shí)施例中,文件共享客戶還包括用于維護(hù)部分分布式數(shù)據(jù)庫的DBMS裝置。通過在文件共享客戶中安裝該數(shù)據(jù)庫管理系統(tǒng)裝置,每個(gè)安裝該客戶(通常在一個(gè)計(jì)算機(jī)系統(tǒng)上)也安裝了DBMS裝置,并且能有助于維護(hù)分布式數(shù)據(jù)庫。
在另一個(gè)實(shí)施例中,被DBMS裝置所維護(hù)的分布式數(shù)據(jù)庫部分大小依靠運(yùn)行客戶的計(jì)算機(jī)系統(tǒng)的性能。例如,可被考慮的帶寬限制、CPU速度和/或可用工作內(nèi)存(RAM)。在這種方式下,數(shù)度慢的計(jì)算機(jī)不會(huì)負(fù)載一個(gè)大型指紋數(shù)據(jù)庫服務(wù)器。
在另一個(gè)實(shí)施例中,該DBMS裝置用于添加所計(jì)算的指紋和所得到的元數(shù)據(jù)集到各個(gè)部分。在這種方式下,該分布式數(shù)據(jù)庫用新指紋和來自在文件共享客戶上顯示的多媒體對象的元數(shù)據(jù)集來更新。每個(gè)客戶現(xiàn)在維護(hù)包含有至少一個(gè)出現(xiàn)在它自己存儲器中的對象的分布式數(shù)據(jù)庫部分。
在另一個(gè)實(shí)施例中,該指紋裝置用于傳輸所計(jì)算的指紋和所得到的元數(shù)據(jù)集到文件共享網(wǎng)絡(luò)上的另一個(gè)文件共享客戶。在這種方式下,要存儲到數(shù)據(jù)庫上的數(shù)據(jù)能借助文件共享網(wǎng)絡(luò)被分布,這樣它就能被存儲到由任意客戶所管理的部分,該客戶被安排為管理該部分。
在上述實(shí)例的一個(gè)變化中,其它文件共享客戶是文件共享網(wǎng)絡(luò)上的超級節(jié)點(diǎn)。超級節(jié)點(diǎn)是擁有足夠帶寬、處理能力和內(nèi)存的客戶。普通客戶通過連接到一個(gè)超級節(jié)點(diǎn)與網(wǎng)絡(luò)連接并將被共享文件列表發(fā)送到該超級節(jié)點(diǎn)。超級節(jié)點(diǎn)和許多客戶連接并且還和許多其它超級節(jié)點(diǎn)連接。因?yàn)樗鼈冊趦?nèi)存、處理能力和帶寬方面的強(qiáng)大性能,它們更適合管理一部分分布式數(shù)據(jù)庫。
在另一個(gè)實(shí)施例中,該指紋裝置被安排用于計(jì)算指紋和當(dāng)多媒體對象存儲在存儲器中時(shí),獲取多媒體對象的元數(shù)據(jù)集。通過在此時(shí)計(jì)算該指紋,任何所獲得的新多媒體對象的元數(shù)據(jù)被自動(dòng)添加到分布式數(shù)據(jù)庫被完成。
本發(fā)明的另一個(gè)目標(biāo)是提供一個(gè)計(jì)算機(jī)程序產(chǎn)品,該產(chǎn)品用于使通用計(jì)算機(jī)能如根據(jù)本發(fā)明的文件共享客戶一樣運(yùn)行。
本發(fā)明的這些以及其它方面通過參考附圖中所示實(shí)施例會(huì)清楚明白,其中
圖1示意地顯示包括多個(gè)客戶的文件共享網(wǎng)絡(luò);并且圖2示意地顯示更詳細(xì)的文件共享客戶。
在整個(gè)圖中,相同的引用數(shù)字表示類似或相應(yīng)的特征。在附圖中表明的一些特征典型地在軟件和這樣的代表軟件實(shí)體,比如軟件模塊和對象中實(shí)現(xiàn)。
圖1示意地的顯示包括多個(gè)客戶101、102、103、104和105的文件共享網(wǎng)絡(luò)100。雖然這里所示的如同一個(gè)物理網(wǎng)絡(luò),客戶101-105之間有直接連接,但文件共享網(wǎng)絡(luò)100最好被當(dāng)成概念的或虛擬的網(wǎng)絡(luò)。這就是說,不需要所有的客戶101-105在所有時(shí)間都物理地或網(wǎng)絡(luò)狀地相互直接連接。所需要的是“網(wǎng)絡(luò)中”的一個(gè)客戶能從另一個(gè)客戶獲得文件或?qū)ο?。并且,即使使用客戶到客戶直接連接時(shí),也不需要所有的客戶和所有其它的客戶連接。
網(wǎng)絡(luò)100可包括服務(wù)器110,其為客戶101-105執(zhí)行目錄服務(wù)。為了和文件共享網(wǎng)絡(luò)100連接,客戶101提交它要和服務(wù)器110共享的文件(或?qū)ο?列表。服務(wù)器110結(jié)合它從與網(wǎng)絡(luò)100連接的所有客戶接收的列表。其它客戶102-105就能連接到服務(wù)器110并瀏覽結(jié)合的列表或搜索在該列表上的特定對象。隨后它們能和含有它們所尋找對象的客戶聯(lián)系,并直接從那個(gè)客戶獲得(下載)。在這種方式下,服務(wù)器110不直接加入客戶101-105間的文件或?qū)ο蠊蚕?。這種方法在世界范圍的Napster文件共享網(wǎng)絡(luò)中很有名。
也可以不用服務(wù)器110而實(shí)現(xiàn)網(wǎng)絡(luò)100。在這種情況下,客戶101通過已經(jīng)在網(wǎng)絡(luò)100中的客戶102-105的一個(gè)或多個(gè)和網(wǎng)絡(luò)100連接??蛻敉ㄟ^向與它相連的客戶發(fā)送一個(gè)搜索請求來搜索網(wǎng)絡(luò)。這些客戶檢查它們所共享的對象列表,如果所請求對象在列表中則返回結(jié)果。并且,該請求被轉(zhuǎn)發(fā)給和這些客戶連接的其它客戶。在這種方式下,該請求被分布到整個(gè)網(wǎng)絡(luò)100中,直到它被一個(gè)能實(shí)現(xiàn)該請求的客戶接收,或直到所有客戶都已經(jīng)接收它并且沒有一個(gè)能實(shí)現(xiàn)它。
該實(shí)施例可從例如Gnutella文件共享網(wǎng)絡(luò)知道。該實(shí)施例的一個(gè)缺點(diǎn)是網(wǎng)絡(luò)100不可擴(kuò)展。例如當(dāng)前的類Gnutella網(wǎng)絡(luò)不支持一百萬客戶。此外,如果有許多“慢”計(jì)算機(jī),即是對網(wǎng)絡(luò)100的帶寬、處理能力和/或內(nèi)存有限的計(jì)算機(jī),網(wǎng)絡(luò)速度變慢。
或者,客戶101在連接了一個(gè)或多個(gè)其它客戶102-105后能提交它想與其它客戶102-105共享的文件或?qū)ο罅斜?。該列表就傳遞到網(wǎng)絡(luò)100上所有的客戶。在這種方式下,所有客戶知道哪個(gè)客戶有哪些文件和對象可用并能和那個(gè)客戶直接聯(lián)系。
所知的KaZaa文件共享網(wǎng)絡(luò)也能不需要服務(wù)器110而操作,但為克服了上面提到的問題使用兩種客戶超級節(jié)點(diǎn)和“普通”客戶。超級節(jié)點(diǎn)是擁有足夠帶寬、處理能力和內(nèi)存的客戶。普通客戶通過連接超級節(jié)點(diǎn)連接網(wǎng)絡(luò),并發(fā)送被共享的文件列表到該超級節(jié)點(diǎn)。超級節(jié)點(diǎn)有到許多客戶的連接并且還和許多其它超級節(jié)點(diǎn)連接。
一個(gè)超級節(jié)點(diǎn)同時(shí)也是一個(gè)普通客戶。也就是說,對于用戶來說他的計(jì)算機(jī)是超級節(jié)點(diǎn)的事實(shí)是透明的。當(dāng)用戶想搜索一個(gè)文件時(shí),它的客戶發(fā)送一個(gè)請求到當(dāng)前和他的客戶連接的超級節(jié)點(diǎn)。該超級節(jié)點(diǎn)返回它的客戶所發(fā)送的文件列表中的匹配文件。此外,如果需要,該超級節(jié)點(diǎn)轉(zhuǎn)發(fā)該請求到所有與它以類似上述Gnutella實(shí)施例中的方式連接的超級節(jié)點(diǎn)。但是,因?yàn)槌壒?jié)點(diǎn)之間的連接有巨大的帶寬,所以這種方法比Gnutella網(wǎng)絡(luò)更快。而且,它能擴(kuò)展到幾百萬個(gè)客戶。
被典型地稱為點(diǎn)對點(diǎn)或P2P文件共享網(wǎng)絡(luò)的該文件共享網(wǎng)絡(luò)十分普及。這些網(wǎng)絡(luò)的著名例子Napster,Musiccity,Gnutella,Kazaa,Imesh和Bearshare。一旦用戶已經(jīng)安裝了適當(dāng)?shù)目蛻糗浖剿麄兊膫€(gè)人電腦上,他們就能共享他們的文件并且他們能夠下載被其它用戶共享的文件??蛻?01-105可被連接到如因特網(wǎng)的網(wǎng)絡(luò),這能方便文件共享網(wǎng)絡(luò)100的建立。客戶可例如使用直接TCP/IP連接到另一個(gè)客戶來獲得文件或?qū)ο蟆?br>
在最流行的網(wǎng)絡(luò)上,通常超過500,000的人同時(shí)連接。在寫的時(shí)候,大多數(shù)人們共享音樂文件(經(jīng)常以MP3格式),但共享電影也不斷流行。術(shù)語“多媒體對象”被用在包括有音樂、歌曲、電影、TV節(jié)目、圖片和其它類型二進(jìn)制文件的指示文件,并且文本文件也可以用這種方式共享。注意到,多媒體對象可以由幾種不同文件組成。
網(wǎng)絡(luò)100還能包括分布式數(shù)據(jù)庫。分布式數(shù)據(jù)庫由多個(gè)各個(gè)部分201-205組成,每個(gè)部分分別由客戶101-105維護(hù)。這將在下面通過參考圖2解釋。
圖2更詳細(xì)地顯示了文件共享客戶101。文件共享客戶101最好能被實(shí)現(xiàn)為其上運(yùn)行文件共享軟件301的個(gè)人電腦,這是業(yè)界周知的。文件共享軟件301典型地利用網(wǎng)絡(luò)模塊302,比如現(xiàn)代操作系統(tǒng)中可用的TCP/IP棧。存儲器303包括一個(gè)或多個(gè)被文件共享軟件301共享的多媒體對象。典型地,該存儲器303可以是一個(gè)硬盤上的目錄。在一些情況下,存儲器303可包括存儲了已下載多媒體對象的不同部分。該部分,典型地也是目錄,不需要和存儲了要被共享的多媒體對象的目錄一樣。
文件共享客戶101還包括指紋模塊304,其能從多媒體對象計(jì)算指紋。如上所述,計(jì)算指紋的方法在國際專利申請WO 02/065782(律師訴訟事件表PHNL010110)中描述,雖然當(dāng)然可以使用任何計(jì)算指紋的方法。指紋模塊304還獲得多媒體對象的一個(gè)元數(shù)據(jù)集。
通常該元數(shù)據(jù)集被包括到多媒體對象或和多媒體對象一道被包括,這樣在獲得多媒體對象時(shí)自動(dòng)獲得該元數(shù)據(jù)集。
指紋模塊304最好能被實(shí)現(xiàn)為一個(gè)或多個(gè)硬件或者軟件模塊,例如作為在客戶101上運(yùn)行的文件共享軟件301的插件程序。
指紋模塊304能計(jì)算在存儲器303中的多媒體對象的指紋。多媒體對象的元數(shù)據(jù)集類似地能通過從存儲器303中的多媒體對象簡單地讀取來獲得。例如,含有以流行的MP3為格式的音樂的多媒體對象通常在對象末包含如ID3“tag”的元數(shù)據(jù)。
因?yàn)橛?jì)算多媒體對象指紋可能是CUP密集的,現(xiàn)在需要小心避免消耗太多的CPU能力。這樣做可能會(huì)使文件共享軟件的用戶煩惱,因?yàn)樗靼走@妨礙了正常的系統(tǒng)使用。
指紋可根據(jù)用戶請求計(jì)算或者在后臺中計(jì)算。在后一種情況下,推薦周期地掃描共享驅(qū)動(dòng)或指紋還未被計(jì)算的新多媒體對象的目錄。如果發(fā)現(xiàn)這樣的對象,指紋被自動(dòng)計(jì)算。如果對于該對象沒有可用元數(shù)據(jù),用戶可被提示輸入一個(gè)元數(shù)據(jù)集。
在任何情況下,一旦指紋模塊304已經(jīng)計(jì)算了多媒體對象的指紋并且已經(jīng)獲得該多媒體對象的元數(shù)據(jù)集,它就包含了在分布式數(shù)據(jù)庫201-205中的指紋和元數(shù)據(jù)集。推薦地,該指紋和元數(shù)據(jù)集被包括到由DBMS模塊305維護(hù)的部分201。
指紋數(shù)據(jù)庫維護(hù)(DBMS)模塊305維護(hù)分布式指紋數(shù)據(jù)庫的部分201。該數(shù)據(jù)庫201含有指紋和相關(guān)元數(shù)據(jù)集。如果存儲器303明顯沒有包含某個(gè)多媒體對象的多個(gè)拷貝,該數(shù)據(jù)庫201典型地能為每個(gè)共享多媒體對象包含指紋和相關(guān)元數(shù)據(jù)集。
另外,數(shù)據(jù)庫201可隨文件共享客戶101從在網(wǎng)絡(luò)100上的其它文件共享客戶102-105下載的多媒體對象的指紋和元數(shù)據(jù)而被擴(kuò)展。在多媒體對象被下載的同時(shí)該對象的指紋可以被計(jì)算。一些計(jì)算指紋的方法每次操作多媒體對象的一小部分。例如,上述歐洲專利申請計(jì)算多媒體對象中音頻數(shù)據(jù)每三秒鐘的“亞指紋”,并從所有的亞指紋中構(gòu)建出實(shí)際的指紋。三秒鐘量的數(shù)據(jù)被接收后可以立即計(jì)算亞指紋。
如果那個(gè)對象的元數(shù)據(jù)也可得,在對象被完全下載之前指紋和元數(shù)據(jù)能被包含到數(shù)據(jù)庫201中。如果在這個(gè)處理期間確定出指紋已經(jīng)在數(shù)據(jù)庫201中,那么用戶很可能已經(jīng)在他的所有物中已經(jīng)擁有這個(gè)特定多媒體對象的拷貝。那么用戶可以被警告,這樣他能退出下載。
當(dāng)文件共享客戶101從另一個(gè)客戶102下載多媒體對象時(shí),該客戶101還能從客戶102下載一個(gè)或多個(gè)指紋以及相關(guān)的元數(shù)據(jù)集。這些指紋相對較小(相對典型的多媒體對象幾兆比特,一般情況為十千比特)因此不會(huì)影響客戶101的性能。這提供了將數(shù)據(jù)庫有關(guān)的指紋和元數(shù)據(jù)以任意的形式分布到網(wǎng)絡(luò)100的客戶101-105上。
在KaZaa文件共享系統(tǒng)中,超級節(jié)點(diǎn)推薦被用作分布指紋和元數(shù)據(jù)到網(wǎng)絡(luò)100。在比如象Napster的文件共享系統(tǒng)中,可能是中心服務(wù)器分布指紋。
還可在超級節(jié)點(diǎn)或中心服務(wù)器的協(xié)助下獲得正確的元數(shù)據(jù)??蛻籼峤灰粋€(gè)對特定指紋的搜索請求到它所連接的超級節(jié)點(diǎn)。該超級節(jié)點(diǎn)將該請求傳遞到其它的超級節(jié)點(diǎn)。沒有一個(gè)過濾數(shù)據(jù)庫中元數(shù)據(jù)集來確定確切集的中心服務(wù)器,超級節(jié)點(diǎn)就可能收到多個(gè)對該詢問的回答。于是,超級節(jié)點(diǎn)應(yīng)用多數(shù)投票或另一種技術(shù)來確定確切的元數(shù)據(jù)集,該元數(shù)據(jù)集被提供回提交該請求的客戶。
例如,假設(shè)對特定指紋的搜索請求的響應(yīng)所接收的元數(shù)據(jù)集如下1.(artist=“Jewwel”,title=“Hands”)2.(artist=“Jewel”,title=“Hands”)3.(artist=“Jewel”,title=“Hnds”)4.(artist=“Jewel”,title=“Hands”)5.(artist=“Jewel”,title=“Hands”)可以容易看出在本例中五個(gè)集中的四個(gè)給出的藝人名字是“Jewel”,同時(shí)只有一個(gè)給出的名字是“Jewwel”。使用簡單的多數(shù)取勝方法,確切的元數(shù)據(jù)集所給出的藝人名字應(yīng)當(dāng)是“Jewel”。類似地,五個(gè)集中的四個(gè)給出的歌曲名稱是“Hands”,因此確切的元數(shù)據(jù)集所給出的歌曲名字也應(yīng)當(dāng)是“Hands”。同樣的方法當(dāng)然可以被用在其它類型的包括在集合中元數(shù)據(jù),比如專集名稱、發(fā)行年份、風(fēng)格、藝人網(wǎng)站的URL等等。
當(dāng)然也可以利用其它自動(dòng)從多個(gè)候選值中確定確切值的更先進(jìn)技術(shù)。這些技術(shù)在智能代理領(lǐng)域是普通的,其中它們被用作消除從代理上接收信息的噪音。它們包括決策樹剪枝和交叉驗(yàn)證。正好需要什么來組成“足夠數(shù)量”依賴于所使用技術(shù)。
可觀察到,不是所有的元數(shù)據(jù)集要求完整。例如,一個(gè)元數(shù)據(jù)集可能只包含某個(gè)特定歌曲的標(biāo)題和藝人的名字,同時(shí)另一個(gè)也可包含獲得該歌曲的專集標(biāo)題以及該專集發(fā)行的年份。那么,上面的過程應(yīng)當(dāng)在個(gè)別類型的元數(shù)據(jù)上執(zhí)行,例如一次是為基于所有可得標(biāo)題的標(biāo)題,一次是為基于所有可得藝人姓名的藝人名字,一次是為發(fā)行年份等等。在這種方式下,確切的元數(shù)據(jù)集能被盡可能寬廣地得到,即該元數(shù)據(jù)集不僅包括標(biāo)題和藝人,而且包括專集名稱和發(fā)行年份。該擴(kuò)展的確切元數(shù)據(jù)集是最有價(jià)值的。
隨后超級節(jié)點(diǎn)能用確切集更新它自己的數(shù)據(jù)庫,以避免必須在每次他的客戶的其中一個(gè)再次提交詢問時(shí)再次傳遞詢問到所有其它超級節(jié)點(diǎn)。但是,這要冒著他的信息可能在一些時(shí)候過期的危險(xiǎn)。
可以使由DBMS模塊305維護(hù)的分布式數(shù)據(jù)庫201部分的大小依靠于運(yùn)行它的個(gè)人電腦的性能。例如,可以考慮的帶寬限制、CPU數(shù)度和/或可用的工作內(nèi)存(RAM)。在這種方式下,數(shù)度慢的計(jì)算機(jī)不會(huì)負(fù)載一個(gè)大型指紋數(shù)據(jù)庫服務(wù)器。
文件共享客戶101-105能使數(shù)據(jù)庫201-205的至少一部分為其它部分所用。這可以通過,例如提供一個(gè)搜索接口來完成,通過該接口客戶提交指紋并接收返回的元數(shù)據(jù)集。從數(shù)據(jù)庫提取和所提交的指紋有關(guān)的元數(shù)據(jù)集的各種方法可以從如上所述的在國際專利申請WO02/065782(律師訴訟事件表PHNL010110),以及從國際專利申請WO02/058246(律師訴訟事件表PHNL010532)中得知。當(dāng)然也可以使用其它的方法。
如果特定客戶101不能在它的分布式數(shù)據(jù)庫部分201找到和所提交指紋有關(guān)的元數(shù)據(jù)集,它可以轉(zhuǎn)發(fā)該已提交指紋到連接文件共享網(wǎng)絡(luò)100的另一個(gè)客戶102。如果該網(wǎng)絡(luò)100包括超級節(jié)點(diǎn),該另外的客戶102最好是文件共享網(wǎng)絡(luò)100中的一個(gè)超級節(jié)點(diǎn)。該客戶102如果不能在它的部分202中找到這個(gè)集,類似地也能轉(zhuǎn)發(fā)已提交指紋,并且一直下去直到客戶101-105的其中一個(gè)在它的部分201-205找到這個(gè)元數(shù)據(jù)集,或直到在文件共享網(wǎng)絡(luò)100中的所有客戶101-105都沒有能找到該集。
分布式數(shù)據(jù)庫201-205的內(nèi)容能成為免費(fèi)或只支付訂費(fèi)?;蛘撸上蛎總€(gè)在數(shù)據(jù)庫執(zhí)行的詢問收取費(fèi)用。響應(yīng)提交指紋所返回給客戶的元數(shù)據(jù)量也可以變化例如,免費(fèi)服務(wù)只返回藝人和名稱,而基于訂費(fèi)的服務(wù)返回?cái)?shù)據(jù)庫中所有可得元數(shù)據(jù)。
需要注意上述實(shí)施例是列舉說明而不是限制本發(fā)明,業(yè)界技術(shù)人員能設(shè)計(jì)許多可選實(shí)施例而不需要偏離附加的權(quán)利要求的范圍。
在權(quán)利要求中,任何在括號之間的參考標(biāo)志不應(yīng)被解釋為對權(quán)利要求的限制。詞“包括”不排除那些列在權(quán)利要求之外的其它元素或步驟的存在。在一個(gè)元素前的冠詞“一”不排除多個(gè)該元素的存在。
本發(fā)明可以通過包括有多個(gè)不同元件的硬件方式和通過被適當(dāng)編程的計(jì)算機(jī)方式實(shí)現(xiàn)。在列舉了幾個(gè)裝置的設(shè)備權(quán)利要求中,這些設(shè)備的幾個(gè)可以由硬件的一個(gè)和相同項(xiàng)來體現(xiàn)。在不同的互相依賴的權(quán)利要求中書面陳述某個(gè)措施的事實(shí)不表明這些措施的組合能被用作取得優(yōu)勢。
權(quán)利要求
1.一種維護(hù)數(shù)據(jù)庫的方法,該數(shù)據(jù)庫包括多個(gè)多媒體對象的每一個(gè)的指紋和有關(guān)的元數(shù)據(jù)集,該方法包括把數(shù)據(jù)庫的各個(gè)部分分布到與被安排用于共享所述數(shù)量多媒體對象的文件共享網(wǎng)絡(luò)相連接的各個(gè)文件共享客戶。
2.一種文件共享客戶,包括存儲一個(gè)或多個(gè)多媒體對象的存儲器,在存儲器中與文件共享網(wǎng)絡(luò)上的其它文件共享客戶來共享多媒體對象的共享裝置,用于計(jì)算指紋和為被共享設(shè)備共享的多媒體對象獲取一組元數(shù)據(jù),以及用于添加計(jì)算出的指紋和所得到的元數(shù)據(jù)集到分布到和文件共享網(wǎng)絡(luò)相連的文件共享客戶上的數(shù)據(jù)庫的指紋裝置。
3.權(quán)利要求2的文件共享客戶,還包括用于維護(hù)部分分布式數(shù)據(jù)庫的DBMS裝置。
4.權(quán)利要求3的文件共享客戶,其中由DBMS裝置維護(hù)的分布式數(shù)據(jù)庫部分的大小依靠運(yùn)行它的計(jì)算機(jī)系統(tǒng)的性能。
5.權(quán)利要求3的文件共享客戶,其中DBMS裝置被安排用作添加計(jì)算出的指紋和獲得的元數(shù)據(jù)集到各個(gè)部分。
6.權(quán)利要求2的文件共享客戶,指紋裝置被安排用作傳輸計(jì)算出的指紋和獲得的元數(shù)據(jù)集到文件共享網(wǎng)絡(luò)上的另一個(gè)文件共享客戶。
7.權(quán)利要求6的文件共享客戶,其中其它的文件共享客戶是文件共享網(wǎng)絡(luò)中的超級節(jié)點(diǎn)。
8.權(quán)利要求6的文件共享客戶,其中該傳輸是和傳輸多媒體對象到其它文件共享客戶同時(shí)完成的。
9.權(quán)利要求2的文件共享客戶,當(dāng)多媒體對象正被存儲到存儲器中時(shí),該指紋裝置被安排用作計(jì)算指紋和獲取該多媒體對象的元數(shù)據(jù)集。
10.一個(gè)計(jì)算機(jī)程序產(chǎn)品,被安排用作使通用計(jì)算機(jī)能如權(quán)利要求2的文件共享客戶一樣運(yùn)行。
11.文件共享網(wǎng)絡(luò)包括權(quán)利要求2中所要求的至少一個(gè)客戶。
全文摘要
維護(hù)數(shù)據(jù)庫的方法包括對于多個(gè)多媒體對象的每一個(gè)的指紋和相關(guān)元數(shù)據(jù)集。數(shù)據(jù)庫的各個(gè)部分(201、202、203、204、205)被分布到與被安排用作共享所述多媒體對象數(shù)量的文件共享網(wǎng)絡(luò)(100)相連接的各個(gè)文件共享客戶(101-105)。文件共享客戶(101-105)能夠維護(hù)它們自己的各個(gè)數(shù)據(jù)庫部分(201-205),或傳輸指紋和元數(shù)據(jù)到另一個(gè)文件共享客戶。在后一種情況中,其它文件共享客戶最好是文件共享網(wǎng)絡(luò)(100)中的超級節(jié)點(diǎn)。
文檔編號G06F13/00GK1596407SQ02823766
公開日2005年3月16日 申請日期2002年10月31日 優(yōu)先權(quán)日2001年11月29日
發(fā)明者A·A·C·M·凱克, J·A·海特斯馬 申請人:皇家飛利浦電子股份有限公司