欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于處理并管理與對象相關(guān)的數(shù)據(jù)以供多個應(yīng)用程序使用的系統(tǒng)及方法

文檔序號:6335497閱讀:207來源:國知局
專利名稱:用于處理并管理與對象相關(guān)的數(shù)據(jù)以供多個應(yīng)用程序使用的系統(tǒng)及方法
用于處理并管理與對象相關(guān)的數(shù)據(jù)以供多個應(yīng)用程序使用的系統(tǒng)及方法
背景技術(shù)
在一個系統(tǒng)上存在著多個從計算機(jī)文件中收集數(shù)據(jù)并對其進(jìn)行標(biāo)引的軟件應(yīng)用 程序。例如,搜索引擎經(jīng)常對來自多個文件的數(shù)據(jù)進(jìn)行標(biāo)引,并且使用經(jīng)標(biāo)引的數(shù)據(jù)在這些 文件中快速地搜索特定的文件內(nèi)容。用于防止數(shù)據(jù)丟失、垃圾郵件過濾、內(nèi)容管理、歸檔、以 及備份目的的不同的應(yīng)用程序也可以在一個系統(tǒng)上生成并使用文件的索引。經(jīng)常,使用一 個文件索引的每個應(yīng)用程序必須與其他程序分別地生成該文件索引。因此,一個系統(tǒng)上的 多個不同的應(yīng)用程序可以各自對相同的程序文件進(jìn)行標(biāo)弓I。雖然文件索引可以使多個進(jìn)程(如搜索)能夠以一種有效率的方式來進(jìn)行,但是 創(chuàng)建這些文件索引經(jīng)常使用大量的處理資源。許多文件不能被直接分析來創(chuàng)建一個索引。 相反,這些文件必須首先被轉(zhuǎn)換為一種常用的格式,如HTML或純文本。因此,運(yùn)行不同標(biāo)引 程序的一個系統(tǒng)可能浪費(fèi)時間和資源來在不同的應(yīng)用程序上多次標(biāo)引不同的系統(tǒng)文件。這 些標(biāo)引進(jìn)程還可能顯著地消耗系統(tǒng)帶寬以及輸入/輸出性能。因此,本披露識別并著手解 決對于在一個系統(tǒng)上由多個應(yīng)用程序執(zhí)行的多種標(biāo)引功能進(jìn)行強(qiáng)化的系統(tǒng)及方法的需要。

發(fā)明內(nèi)容
如以下將更詳細(xì)說明的,本披露總體上涉及用于進(jìn)行數(shù)據(jù)標(biāo)引以供多個應(yīng)用程序 使用的系統(tǒng)及方法。根據(jù)某些實施方案,一種用于進(jìn)行數(shù)據(jù)標(biāo)引以供多個應(yīng)用程序使用的 計算機(jī)實施的方法可以包括在多個應(yīng)用程序中的一個第一應(yīng)用程序處接收一個數(shù)據(jù)對象; 將該數(shù)據(jù)對象令牌化以便從該數(shù)據(jù)對象中提取多個令牌;創(chuàng)建從該數(shù)據(jù)對象中提取的這些 令牌的一個索引(該索引被格式化為供該多個應(yīng)用程序中的每一個使用);并且將該索引 存儲到該多個應(yīng)用程序可以訪問的一個數(shù)據(jù)庫中。該多個應(yīng)用程序可以包括兩個或更多個 應(yīng)用程序的類型。常用形式的數(shù)據(jù)對象可以包括標(biāo)記語言(例如,HTML或XML)和/或純 文本中的至少一個。在一些實施方案中,這種數(shù)據(jù)對象可以包括被配置為被至少一種程序類型訪問的 一種程序?qū)S玫臄?shù)據(jù)對象,并且該方法可以進(jìn)一步包括將該程序?qū)S玫臄?shù)據(jù)對象轉(zhuǎn)換為一 種常用形式的數(shù)據(jù)對象。該方法還可以包括從該多個應(yīng)用程序中的一個第二應(yīng)用程序接收 對于該索引的一個請求并且允許該第二應(yīng)用程序訪問該數(shù)據(jù)庫。該方法可以進(jìn)一步包括生成與該程序?qū)S玫臄?shù)據(jù)對象相關(guān)聯(lián)的元數(shù)據(jù)和/或與 該程序?qū)S玫臄?shù)據(jù)對象相關(guān)聯(lián)的一個隱藏文件中的至少一項。該方法還可以包括執(zhí)行該程 序?qū)S玫臄?shù)據(jù)對象的一個數(shù)據(jù)分類,并且將這些數(shù)據(jù)分類結(jié)果與該常用形式的數(shù)據(jù)對象和 /或該索引中的至少一項相關(guān)聯(lián)。在至少一個實例中,將這些數(shù)據(jù)分類結(jié)果與該常用形式的 數(shù)據(jù)對象相關(guān)聯(lián)可以包括創(chuàng)建指代這些數(shù)據(jù)分類結(jié)果的數(shù)據(jù)標(biāo)簽。在一些實例中,執(zhí)行該 數(shù)據(jù)分類可以包括基于標(biāo)引的元數(shù)據(jù)、標(biāo)引的內(nèi)容、提取的模式、和/或提取的實體中的至 少一項對該程序?qū)S玫臄?shù)據(jù)對象中的數(shù)據(jù)進(jìn)行分類。根據(jù)一些實施方案,該方法可以進(jìn)一步包括基于該程序?qū)S玫臄?shù)據(jù)對象的數(shù)據(jù)分類執(zhí)行至少一個策略。該至少一個策略可以包括垃圾郵件策略、防病毒策略、防止數(shù)據(jù)丟失 策略、防止知識產(chǎn)權(quán)泄漏策略、歸檔策略、備份策略、內(nèi)容管理策略、遵守法律策略、和/或 電子采證策略中的至少一項。在一些實例中,該多個應(yīng)用程序的類型可以包括搜索引擎、 歸檔應(yīng)用程序、防止數(shù)據(jù)丟失應(yīng)用程序、垃圾郵件過濾應(yīng)用程序、防病毒應(yīng)用程序、備份應(yīng) 用程序、內(nèi)容管理應(yīng)用程序、遵守法律應(yīng)用程序、和/或電子采證應(yīng)用程序中的兩項或更多 項。根據(jù)不同的實施方案,該第一應(yīng)用程序可以執(zhí)行以下至少一項將該程序?qū)S玫?數(shù)據(jù)對象轉(zhuǎn)換為該常用形式的數(shù)據(jù)對象;將該常用形式的數(shù)據(jù)對象令牌化;創(chuàng)建該索引; 執(zhí)行該程序?qū)S玫臄?shù)據(jù)對象的數(shù)據(jù)分類;和/或在該常用形式的數(shù)據(jù)對象上執(zhí)行語言檢 測。在一些實例中,該第一應(yīng)用程序可以指示一個第三應(yīng)用程序執(zhí)行以下至少一項將該程 序?qū)S玫臄?shù)據(jù)對象轉(zhuǎn)換為該常用形式的數(shù)據(jù)對象;將該常用形式的數(shù)據(jù)對象令牌化;創(chuàng)建 該索引;執(zhí)行該程序?qū)S玫臄?shù)據(jù)對象的數(shù)據(jù)分類;和/或在該常用形式的數(shù)據(jù)對象上執(zhí)行 語言檢測。在不同的實例中,該方法可以包括執(zhí)行以下至少一項該數(shù)據(jù)對象上的語言檢測、 該數(shù)據(jù)對象上的模式檢測、和/或該數(shù)據(jù)對象上的實體提取。該方法可以額外地包括從該 多個應(yīng)用程序中的一個第二應(yīng)用程序接收對于該索引的一個請求并且允許該第二應(yīng)用程 序訪問該索引。在至少一個實施方案中,一種用于進(jìn)行數(shù)據(jù)標(biāo)引以供多個應(yīng)用程序使用的計算機(jī) 實施的方法可以包括在多個應(yīng)用程序中的一個第一應(yīng)用程序處接收一個數(shù)據(jù)對象;將該數(shù) 據(jù)對象令牌化以便從該數(shù)據(jù)對象中提取多個令牌;創(chuàng)建從該數(shù)據(jù)對象中提取的這些令牌的 一個對象索引(該對象索引被格式化為供該多個應(yīng)用程序中的每一個使用);并且將該對 象索引結(jié)合在包括與多個數(shù)據(jù)對象相關(guān)聯(lián)的標(biāo)引信息的一個主索引中(該主索引是該多 個應(yīng)用程序可以訪問的)。該多個應(yīng)用程序可以包括兩個或更多個應(yīng)用程序的類型。在至 少一個實例中,該主索引可以包括從該多個應(yīng)用程序中的兩個或更多個接收的多個對象索 引。在一些實施方案中,一種用于進(jìn)行數(shù)據(jù)標(biāo)引以供多個應(yīng)用程序使用的系統(tǒng)可以包括一 個通信模塊,該通信模塊被編程為在多個應(yīng)用程序中的一個第一應(yīng)用程序處接收一個數(shù)據(jù) 對象。該系統(tǒng)還可以包括一個令牌化模塊,該令牌化模塊被編程為將該常用形式的數(shù)據(jù)對 象令牌化以便從該數(shù)據(jù)對象中提取多個令牌,以及一個標(biāo)引模塊,該標(biāo)引模塊被編程為創(chuàng) 建從該數(shù)據(jù)對象中提取的這些令牌的一個索引。該系統(tǒng)還額外地包括一個用于存儲該索引 的數(shù)據(jù)庫,其中該多個應(yīng)用程序可以訪問該數(shù)據(jù)庫。在一些實例中,該系統(tǒng)還可以包括一個轉(zhuǎn)換模塊,該轉(zhuǎn)換模塊被編程為將該程序 專用的數(shù)據(jù)對象轉(zhuǎn)換為一種常用形式的數(shù)據(jù)對象;一個語言檢測模塊,該語言檢測模塊被 編程為在該常用形式的數(shù)據(jù)對象上執(zhí)行語言檢測;一個分類模塊,該分類模塊被編程為執(zhí) 行該程序?qū)S玫臄?shù)據(jù)對象的數(shù)據(jù)分類;以及一個安全模塊,該安全模塊被編程為將數(shù)據(jù)訪 問限于授權(quán)的應(yīng)用程序。


這些附圖展示了多個示例性實施方案并且是本說明書的一部分。這些附圖與以下 的說明一起展現(xiàn)并解釋了本披露的不同原理。
圖1是用于進(jìn)行數(shù)據(jù)標(biāo)引以供多個應(yīng)用程序使用的一個示例性系統(tǒng)的框圖。圖2是用于進(jìn)行數(shù)據(jù)標(biāo)引以供多個應(yīng)用程序使用的另一個示例性系統(tǒng)的框圖。圖3是用于進(jìn)行數(shù)據(jù)標(biāo)引以供多個應(yīng)用程序使用的另一個示例性系統(tǒng)的框圖。圖4是供多個應(yīng)用程序使用的另一個示例性系統(tǒng)的框圖。圖5是用于進(jìn)行數(shù)據(jù)標(biāo)引以供多個應(yīng)用程序使用的一種示例性方法的流程圖。圖6是用于進(jìn)行數(shù)據(jù)標(biāo)引以供多個應(yīng)用程序使用的另一種示例性方法的流程圖。圖7是一個示例性計算系統(tǒng)的框圖,該系統(tǒng)能夠?qū)嵤┰诖苏f明和/或展示的這些 實施方案中的一個或多個。圖8是一個示例性計算網(wǎng)絡(luò)的框圖,該網(wǎng)絡(luò)能夠?qū)嵤┰诖苏f明和/或展示的這些 實施方案中的一個或多個。貫穿這些附圖,同樣的參考字符以及說明表示相似的但并不一定完全相同的要 素。雖然在此說明的這些示例性實施方案可容許進(jìn)行不同的修改以及多種替代形式,在此 仍在附圖中以舉例的方式示出多個具體的實施方案并且對其進(jìn)行了詳細(xì)的說明。然而,在 此說明的多個示例性實施方案并非旨在被限于所披露的這些特定形式。相反,本披露覆蓋 落入所附權(quán)利要求范圍內(nèi)的所有修改、等效物、以及替代方案。
具體實施例方式如以下將更詳細(xì)說明的,本披露總體上涉及用于進(jìn)行數(shù)據(jù)標(biāo)引以供多個應(yīng)用程序 使用的不同的系統(tǒng)及方法。本披露的多個實施方案可以使得一個數(shù)據(jù)對象(例如,PDF、 D0C、XLS、PPT、或MSG文件)能夠被一個系統(tǒng)的多個應(yīng)用程序中的一個第一應(yīng)用程序(如兩 個或更多個不同的應(yīng)用程序的類型的多個應(yīng)用程序)進(jìn)行標(biāo)引。該數(shù)據(jù)對象的索引可以被 存儲在該系統(tǒng)中的該多個應(yīng)用程序中的每一個可以訪問的一個數(shù)據(jù)庫中,并且可以被該系 統(tǒng)中的該多個應(yīng)用程序中的每一個使用。因此,替代了要求該多個應(yīng)用程序中的每一個分 別地生成該數(shù)據(jù)對象的一個索引,在此披露的這些方法和系統(tǒng)可以使得遇到該數(shù)據(jù)對象的 第一應(yīng)用程序能夠生成一個索引,該索引可以被該多個應(yīng)用程序中的每一個所訪問。例如,一個第一應(yīng)用程序可以接收一種程序?qū)S玫臄?shù)據(jù)對象,并且可以將該程序 專用的數(shù)據(jù)對象轉(zhuǎn)換為一種常用形式的數(shù)據(jù)對象(例如,HTML、XML、或純文本文檔)。然后, 該第一應(yīng)用程序可以將該常用形式的數(shù)據(jù)對象令牌化,并且創(chuàng)建從該常用形式的數(shù)據(jù)對象 中提取的多個令牌的一個索引(例如,文字、字段、和/或元數(shù)據(jù)標(biāo)簽)。該索引可以被格式 化為供該多個應(yīng)用程序中的每一個使用(例如,搜索引擎、防止數(shù)據(jù)丟失應(yīng)用程序、垃圾郵 件過濾應(yīng)用程序、防病毒應(yīng)用程序、內(nèi)容管理應(yīng)用程序、歸檔應(yīng)用程序、和/或備份應(yīng)用程 序)。然后,該索引可以被存儲在一個數(shù)據(jù)庫中,該數(shù)據(jù)庫可以被該多個不同的應(yīng)用程序訪 問。以下將參照圖1至圖4提供對多個示例性系統(tǒng)的詳細(xì)說明,這些系統(tǒng)用于進(jìn)行數(shù) 據(jù)標(biāo)引以供多個應(yīng)用程序使用。還將結(jié)合圖5和圖6提供對相應(yīng)的多種計算機(jī)實施方法的 詳細(xì)說明。另外,將結(jié)合圖7和圖8對應(yīng)地提供一個示例性計算系統(tǒng)和網(wǎng)絡(luò)體系結(jié)構(gòu)的詳 細(xì)說明,它們能夠?qū)嵤┰诖苏f明的這些實施方案中的一個或多個。圖1是用于進(jìn)行數(shù)據(jù)標(biāo)引以供多個應(yīng)用程序使用的一個示例性系統(tǒng)100的框圖。 示例性系統(tǒng)100可以包括用于執(zhí)行一個或多個任務(wù)的一個或多個模塊110。如圖1所示,模塊110可以包括一個通信模塊112、一個安全模塊113、一個轉(zhuǎn)換模塊114、一個語言檢測模 塊115、一個令牌化模塊116、一個標(biāo)引模塊117、一個分類模塊118、以及一個數(shù)據(jù)共享模塊 119。通信模塊112可以被編程為接收一個數(shù)據(jù)對象,如被配置為被至少一種程序類型 訪問的一種程序?qū)S玫臄?shù)據(jù)對象。安全模塊113可以被編程為基于安全策略對數(shù)據(jù)(如索 引以及分類數(shù)據(jù))請求進(jìn)行過濾以確保相關(guān)數(shù)據(jù)和元數(shù)據(jù)僅被傳送到授權(quán)的應(yīng)用程序和 用戶。轉(zhuǎn)換模塊114可以被編程為將該數(shù)據(jù)對象轉(zhuǎn)換為一種常用形式的數(shù)據(jù)對象。語言檢 測模塊115可以被編程為在該數(shù)據(jù)對象上執(zhí)行語言檢測。令牌化模塊116可以被編程為在 語言檢測之后通過從該數(shù)據(jù)對象中提取多個令牌來將該數(shù)據(jù)對象令牌化。標(biāo)引模塊117可 以被編程為創(chuàng)建從該數(shù)據(jù)對象中提取的這些令牌的一個索引。分類模塊118可以被編程為 執(zhí)行該數(shù)據(jù)對象的一個數(shù)據(jù)分類。數(shù)據(jù)共享模塊119可以被編程為與多個應(yīng)用程序共享該 索引。盡管被展示為多個分離的元件,圖1的模塊110中的一個或多個可以代表一個單一 的模塊或應(yīng)用程序中的多個部分。在一些實施方案中,圖1的模塊110中的一個或多個可以代表一個或多個軟件應(yīng) 用程序或程式(例如,搜索、防止數(shù)據(jù)丟失、垃圾郵件過濾、內(nèi)容管理、歸檔、和/或備份軟 件),當(dāng)由一個計算裝置執(zhí)行時,該一個或多個軟件應(yīng)用程序或程式可以致使該計算裝置執(zhí) 行一個或多個任務(wù)。例如,正像以下將更詳細(xì)說明的,模塊110中的一個或多個可以代表被 存儲的并被配置為在一個或多個計算應(yīng)用程序和/或裝置上運(yùn)行的多個軟件模塊,如在圖 2中所示的這些應(yīng)用程序(即,第一應(yīng)用程序212、第二應(yīng)用程序222、和/或數(shù)據(jù)庫子系統(tǒng) 230)、圖3中所示的這些應(yīng)用程序及裝置(即,第一應(yīng)用程序312、第二應(yīng)用程序322、第三 應(yīng)用程序332、和/或數(shù)據(jù)庫子系統(tǒng)340)、圖4中所示的這些應(yīng)用程序及裝置(即,第一應(yīng) 用程序412、第二應(yīng)用程序422、和/或企業(yè)應(yīng)用程序432)、圖7中的計算系統(tǒng)710、和/或 圖8中的示例性網(wǎng)絡(luò)體系結(jié)構(gòu)800的多個部分。圖1的模塊110中的一個或多個還可以代 表被配置為執(zhí)行一個或多個任務(wù)的一種或多種專用計算機(jī)的全部或多個部分。如圖1所示,示例性系統(tǒng)100還可以包括一個或多個數(shù)據(jù)庫120。數(shù)據(jù)庫120可以 代表一個單一數(shù)據(jù)庫或計算裝置的多個部分或多個數(shù)據(jù)庫或計算裝置。如所示出的,數(shù)據(jù) 庫120可以包括用于存儲多個數(shù)據(jù)對象的索引的一個索引數(shù)據(jù)庫122。數(shù)據(jù)庫120還可以 包括用于存儲數(shù)據(jù)對象(如常用形式的數(shù)據(jù)對象)的一個數(shù)據(jù)對象數(shù)據(jù)庫124以及用于存 儲與這些數(shù)據(jù)對象相關(guān)的分類數(shù)據(jù)的一個分類數(shù)據(jù)庫126。在一些實施方案中,這些數(shù)據(jù)庫 中的一個或多個可以是索引本身。圖1中的數(shù)據(jù)庫120可以代表一個或多個計算裝置的一部分。例如,數(shù)據(jù)庫120可 以代表圖2中的數(shù)據(jù)庫子系統(tǒng)230的一部分、圖3中的數(shù)據(jù)庫子系統(tǒng)340、圖4中的企業(yè)數(shù) 據(jù)庫434、圖7中的計算系統(tǒng)710、和/或圖8中的示例性網(wǎng)絡(luò)體系結(jié)構(gòu)的多個部分??商?代地,圖1中的數(shù)據(jù)庫120可以代表可以被一個計算裝置訪問的一個或多個物理上分離的 裝置,如圖2中的數(shù)據(jù)庫子系統(tǒng)230、圖3中的數(shù)據(jù)庫子系統(tǒng)340、圖4中的企業(yè)數(shù)據(jù)庫434、 圖7中的計算系統(tǒng)710、和/或圖8中的示例性網(wǎng)絡(luò)體系結(jié)構(gòu)800的多個部分。在至少一個實施方案中,系統(tǒng)100的全部或一部分可以被配置為在一個單一的物 理計算裝置上運(yùn)行。例如,系統(tǒng)100的全部或一部分可以包括被配置為在一個單一的計算 裝置上運(yùn)行的多個不同的應(yīng)用程序。在多個另外的實施方案中,系統(tǒng)100可以被配置為在多個計算裝置(如多個網(wǎng)絡(luò)化的計算裝置)上運(yùn)行。在一些實施方案中,示例性系統(tǒng)100的全部或一部分可以代表圖2中所示的基于 網(wǎng)絡(luò)的系統(tǒng)200的多個部分。圖2是用于進(jìn)行數(shù)據(jù)標(biāo)引以供多個應(yīng)用程序使用的一個示例 性系統(tǒng)200的框圖。如在此圖中所展示的,示例性系統(tǒng)200可以包括與通過網(wǎng)絡(luò)240連接 的一個第二計算子系統(tǒng)220和數(shù)據(jù)庫子系統(tǒng)230相通信的一個第一計算子系統(tǒng)210。在一 些實施方案中,示例性系統(tǒng)200的全部或一部分可以代表一個云計算環(huán)境的多個部分。云 計算環(huán)境可以通過互聯(lián)網(wǎng)提供不同的服務(wù)和應(yīng)用程序。第一計算子系統(tǒng)210和第二計算子系統(tǒng)220可以位于一個或多個計算裝置上。例 如,第一計算子系統(tǒng)210和第二計算子系統(tǒng)220可以位于一個單一的計算裝置上。在另外 的實例中,第一計算子系統(tǒng)210可以位于一個第一計算裝置上,并且第二計算子系統(tǒng)220可 以位于與該第一計算裝置分離的一個第二計算裝置上。包括第一計算子系統(tǒng)210和/或 第二計算子系統(tǒng)220的計算裝置總體上代表了可以讀取計算機(jī)可執(zhí)行指令的任何類型或 形式的計算裝置,如膝上計算機(jī)、臺式計算機(jī)、服務(wù)器、嵌入式系統(tǒng)、它們中一個或多個的組 合、圖7中的示例性計算系統(tǒng)710、或任何其他適當(dāng)?shù)挠嬎阊b置。根據(jù)不同的實施方案,數(shù)據(jù)庫子系統(tǒng)230可以代表可以提供數(shù)據(jù)存儲和/或數(shù)據(jù) 共享服務(wù)的任何類型或形式的計算裝置。數(shù)據(jù)庫子系統(tǒng)230的實例包括但不限于不同類型 的計算裝置(例如,針對第一計算子系統(tǒng)210和第二計算子系統(tǒng)220列出的那些)、被配置 為運(yùn)行某些軟件應(yīng)用程序的應(yīng)用程序服務(wù)器、和/或被配置為提供不同的數(shù)據(jù)庫服務(wù)的數(shù) 據(jù)庫服務(wù)器。在一些實例中,數(shù)據(jù)庫子系統(tǒng)230可以位于與第一計算子系統(tǒng)210和/或第 二計算子系統(tǒng)220分離的一個計算裝置上。在另外的實例中,數(shù)據(jù)庫子系統(tǒng)230可以位于 與第一計算子系統(tǒng)210和/或第二計算子系統(tǒng)220相同的計算裝置上。網(wǎng)絡(luò)240總體上代表能夠協(xié)助通信或數(shù)據(jù)傳送的任何媒質(zhì)或體系結(jié)構(gòu)。網(wǎng)絡(luò)240 的實例包括(但不限于)一個內(nèi)部網(wǎng)的至少一部分、廣域網(wǎng)(“WAN”)、局域網(wǎng)(“LAN”)、 個人局域網(wǎng)(“PAN”)、互聯(lián)網(wǎng)、電力線通信(“PLC”)、蜂窩網(wǎng)絡(luò)(例如GSM網(wǎng)絡(luò))、圖8中 的示例性網(wǎng)絡(luò)體系結(jié)構(gòu)800、或類似的網(wǎng)絡(luò)。網(wǎng)絡(luò)240可以使用無線和/或有線連接來協(xié)助 通信或數(shù)據(jù)傳送。在一個實施方案中,網(wǎng)絡(luò)240可以協(xié)助第一計算子系統(tǒng)210、第二計算子 系統(tǒng)220、和/或數(shù)據(jù)庫子系統(tǒng)230之間的通信。如圖2所示,第一計算子系統(tǒng)210可以包括一個第一應(yīng)用程序212,并且第二計算 子系統(tǒng)220可以包括一個第二應(yīng)用程序222。第一應(yīng)用程序212和第二應(yīng)用程序222總體 上代表能夠執(zhí)行不同的計算機(jī)可執(zhí)行指令的任何類型的軟件應(yīng)用程序。第一應(yīng)用程序212 和第二應(yīng)用程序222的實例包括但不限于搜索引擎、歸檔應(yīng)用程序、備份應(yīng)用程序、防止數(shù) 據(jù)丟失應(yīng)用程序、垃圾郵件過濾應(yīng)用程序、防病毒應(yīng)用程序、遵守法律應(yīng)用程序、電子采證 應(yīng)用程序、內(nèi)容管理應(yīng)用程序、和/或任何其他適當(dāng)?shù)膽?yīng)用程序(如能夠執(zhí)行一個標(biāo)引功能 的應(yīng)用程序)。根據(jù)至少一個實施方案,第一應(yīng)用程序212可以包括一個通信模塊112(a)、一個 安全模塊113(a)、一個轉(zhuǎn)換模塊114、一個令牌化模塊116、一個標(biāo)引模塊117、以及一個分 類模塊118(a)。通信模塊112(a)可以將數(shù)據(jù)發(fā)送到一個或多個應(yīng)用程序(如連接到第一 計算子系統(tǒng)210和/或網(wǎng)絡(luò)240的應(yīng)用程序)和/或從其接收數(shù)據(jù)。在一些實例中,通信 模塊112(a)可以發(fā)送和/或接收不同的數(shù)據(jù)對象,如程序?qū)S玫臄?shù)據(jù)文件和/或文檔(例如,D0C、PDF、XLS、PPT、和/或MSG文件)??梢员煌ㄐ拍K112 (a)發(fā)送和/或接收的數(shù)據(jù) 對象的實例可以包括但不限于文字處理文件、便攜式文檔文件、電子表格文件、即時消息文 件、文本信息文件、多媒體演示文件、電子郵件文件、文本文件、超文本文件、和/或任何其 他適當(dāng)?shù)奈募愋?。通信模塊112(a)可以被編程為接收一種程序?qū)S玫臄?shù)據(jù)對象,該程序?qū)S玫臄?shù) 據(jù)對象被配置為被至少一個程序類型(如,文字處理程序、便攜式文檔觀看和/或編輯程 序、電子表格程序、即時消息程序、文本消息程序、多媒體演示程序、電子郵件程序、和/或 任何其他適當(dāng)?shù)能浖绦蝾愋?所訪問。根據(jù)至少一個實施方案,在系統(tǒng)200中,第一應(yīng)用 程序212可以在其他應(yīng)用程序(如第二應(yīng)用程序22 之前接收該程序?qū)S玫臄?shù)據(jù)對象。在一些實例中,在系統(tǒng)200中,第一應(yīng)用程序212可以確定該程序?qū)S玫臄?shù)據(jù)對象 是否在之前被另一個應(yīng)用程序(如,第二應(yīng)用程序22 接收、標(biāo)引、和/或存儲。例如,第 一應(yīng)用程序212可以向數(shù)據(jù)庫子系統(tǒng)230的數(shù)據(jù)共享模塊119發(fā)送一個請求與該程序?qū)S?的數(shù)據(jù)對象相關(guān)聯(lián)的數(shù)據(jù)(如標(biāo)引數(shù)據(jù))的請求。如果第一應(yīng)用程序212從數(shù)據(jù)庫子系統(tǒng) 230處接收了一個響應(yīng),該響應(yīng)表明與該程序?qū)S玫臄?shù)據(jù)對象相關(guān)聯(lián)的所請求的數(shù)據(jù)沒有 存儲在系統(tǒng)200的數(shù)據(jù)庫子系統(tǒng)230或其他位置中,第一應(yīng)用程序212可以繼續(xù)為該程序 專用的數(shù)據(jù)對象進(jìn)行標(biāo)引。第一應(yīng)用程序212可以使用與該對象相關(guān)聯(lián)的元數(shù)據(jù)(如它的 名稱、位置、大小、創(chuàng)建日期、最后修改日期、和/或該對象的指紋)以確定它之前是否已經(jīng) 看到過該對象。該指紋可以由一個散列或一個校驗和(如MD5或SHA-1、或任何其他適當(dāng)?shù)?散列算法)組成。轉(zhuǎn)換模塊114可以將一種程序?qū)S玫臄?shù)據(jù)對象轉(zhuǎn)換為一種常用形式的數(shù)據(jù)對象。 例如,轉(zhuǎn)換模塊114可以將一種程序?qū)S玫臄?shù)據(jù)對象(如D0C、PDF、XLS、PPT、和/或MSG文 件)轉(zhuǎn)換為一種常用形式的數(shù)據(jù)對象(如HTML、XML、和/或文本文件)。語言檢測模塊115 可以在該常用形式的數(shù)據(jù)對象上執(zhí)行語言檢測。然后,令牌化模塊116可以將該常用形式 的數(shù)據(jù)對象令牌化。令牌化可以包括令牌(如該常用形式的數(shù)據(jù)對象中的文字和/或其他 有意義的單元(例如,標(biāo)簽、日文漢字字符、和/或子字))的識別和提取。在一些實例中, 對該常用形式的數(shù)據(jù)對象的令牌化還可以包括在該常用形式的數(shù)據(jù)對象中被識別的不同 文字的詞根操作。在一些實例中,語言檢測和/或令牌化可以在這種程序?qū)S玫臄?shù)據(jù)對象 上執(zhí)行。標(biāo)引模塊117可以隨后創(chuàng)建從該常用形式的數(shù)據(jù)對象和/或該程序?qū)S玫臄?shù)據(jù)對 象中提取的令牌(如由令牌化模塊116提取的令牌)的一個索引。由標(biāo)引模塊117創(chuàng)建的 索引可以被格式化,這樣它能夠供多個不同的應(yīng)用程序的類型使用。例如,該索引可以被格 式化為供以下一個或多個使用,它們包括搜索引擎、歸檔應(yīng)用程序、防止數(shù)據(jù)丟失應(yīng)用程 序、垃圾郵件過濾應(yīng)用程序、防病毒應(yīng)用程序、內(nèi)容管理應(yīng)用程序、遵守法律應(yīng)用程序、電子 采證應(yīng)用程序、和/或被配置為使用在系統(tǒng)200中存儲的一個數(shù)據(jù)對象的索引的任何其他 適當(dāng)?shù)膽?yīng)用程序的類型。根據(jù)不同的實例,分類模塊118(a)可以對該程序?qū)S玫臄?shù)據(jù)對象 執(zhí)行一次數(shù)據(jù)分類。分類數(shù)據(jù)可以被一個或多個應(yīng)用程序用于容易地識別數(shù)據(jù)對象和/或 對其進(jìn)行歸類。根據(jù)至少一個實例,該數(shù)據(jù)對象的某些分類可以在標(biāo)引之前執(zhí)行。例如,用 于分類和模式檢測的正則表達(dá)式(例如,REGEX)可以在對該數(shù)據(jù)對象進(jìn)行標(biāo)引之前運(yùn)行。 在另外的實例中,也可以在標(biāo)引之前在數(shù)據(jù)上執(zhí)行模式檢測和實體提取。
根據(jù)不同的實施方案,第二應(yīng)用程序222可以包括一個通信模塊112(b)、一個安 全模塊113 (b)、以及一個分類模塊118 (b)。通信模塊112 (b)可以將數(shù)據(jù)發(fā)送到一個或多個 應(yīng)用程序(如連接到第二計算子系統(tǒng)210和/或網(wǎng)絡(luò)240的應(yīng)用程序)或從其接收數(shù)據(jù)。 分類模塊118(b)可以對通信模塊112(b)接收的數(shù)據(jù)執(zhí)行一個數(shù)據(jù)分類。根據(jù)至少一個實 例,第二應(yīng)用程序222還可以包括一個轉(zhuǎn)換模塊、一個語言檢測模塊、一個令牌化模塊、以 及一個標(biāo)引模塊,這些模塊類似于以上參見第一應(yīng)用程序212所說明的那些。在一些實例 中,第二應(yīng)用程序222可以在第一應(yīng)用程序212之前接收一種程序?qū)S玫臄?shù)據(jù)對象。在此 類實例中,第二應(yīng)用程序222可以將該程序?qū)S玫臄?shù)據(jù)對象轉(zhuǎn)換為一種常用形式的數(shù)據(jù)對 象、在該常用形式的數(shù)據(jù)對象上執(zhí)行語言檢測、將該常用形式的數(shù)據(jù)對象令牌化、和/或?qū)?該常用形式的數(shù)據(jù)對象進(jìn)行標(biāo)引。數(shù)據(jù)庫子系統(tǒng)230可以包括一個索引數(shù)據(jù)庫122、一個數(shù)據(jù)對象數(shù)據(jù)庫124、一個 分類數(shù)據(jù)庫126、和/或一個數(shù)據(jù)共享模塊119。索引數(shù)據(jù)庫122可以存儲一個或多個數(shù)據(jù) 元索引,如由標(biāo)引模塊117創(chuàng)建的數(shù)據(jù)對象的索引。根據(jù)至少一個實施方案,索引數(shù)據(jù)庫 122可以包括一個主索引,該主索引包括對兩個或更多個數(shù)據(jù)對象索引的一個編譯。數(shù)據(jù)對象數(shù)據(jù)庫1 可以存儲多個程序?qū)S玫臄?shù)據(jù)對象和/或常用形式的數(shù)據(jù)對 象。分類數(shù)據(jù)庫126可以存儲與一個或多個數(shù)據(jù)對象相關(guān)聯(lián)的分類信息。在一些實施方案 中,索引數(shù)據(jù)庫122、數(shù)據(jù)對象數(shù)據(jù)庫124、和/或分類數(shù)據(jù)庫1 可以被包括在一個單一的 索引中。數(shù)據(jù)共享模塊119可以與連接到網(wǎng)絡(luò)240的一個或多個應(yīng)用程序(如第一應(yīng)用程 序212和/或第二應(yīng)用程序22 共享索引信息、分類信息、和/或數(shù)據(jù)對象。根據(jù)至少一 個實例,存儲在數(shù)據(jù)庫子系統(tǒng)230上的數(shù)據(jù)可以是與一個或多個數(shù)據(jù)對象相關(guān)聯(lián)的。如之前所提及的,圖1中的示例性系統(tǒng)100能夠以多種的方式配置。例如,示例性 系統(tǒng)100的全部或一部分可以代表圖3中所示的示例性的基于網(wǎng)絡(luò)的系統(tǒng)300中的多個部 分。圖3是用于進(jìn)行數(shù)據(jù)標(biāo)引以供多個應(yīng)用程序使用的一個示例性的基于網(wǎng)絡(luò)的系統(tǒng)300 的框圖。如在此圖中所展示的,示例性系統(tǒng)300可以包括通過網(wǎng)絡(luò)350連接的一個第一計 算子系統(tǒng)310、一個第二計算子系統(tǒng)320、以及一個數(shù)據(jù)庫子系統(tǒng)340。網(wǎng)絡(luò)350的實例包括 但不限于不同類型的網(wǎng)絡(luò)(如為圖2中的網(wǎng)絡(luò)240列出的那些)。第一計算子系統(tǒng)310、第 二計算子系統(tǒng)320以及數(shù)據(jù)庫子系統(tǒng)340可以位于一個或多個計算裝置上。例如,第一計 算子系統(tǒng)310、第二計算子系統(tǒng)320、和/或數(shù)據(jù)庫子系統(tǒng)340可以被定為在一個單一的計 算裝置上或者兩個或更多個分離的計算裝置上。根據(jù)不同的實施方案,第一計算子系統(tǒng)310可以包括一個第一應(yīng)用程序312,該第 一應(yīng)用程序包括一個通信模塊112(a)、一個安全模塊113 (a)、以及一個分類模塊118(a), 并且第二計算子系統(tǒng)320可以包括一個第二應(yīng)用程序322,該第二應(yīng)用程序包括一個通信 模塊112(b)、一個安全模塊113(b)、以及一個分類模塊118(b)。在一些實例中,兩個或更 多個應(yīng)用程序和/或數(shù)據(jù)庫(例如,桌面搜索應(yīng)用程序、歸檔應(yīng)用程序、備份應(yīng)用程序、和/ 或防止數(shù)據(jù)丟失應(yīng)用程序)可以定位在一個單一的計算裝置(如個人臺式計算機(jī))上。例 如,如圖3所示,第二計算子系統(tǒng)320還可以包括一個第三應(yīng)用程序332。根據(jù)不同的實施 方案,第三應(yīng)用程序332可以包括一個通信模塊112(c)、一個安全模塊113(c)、一個轉(zhuǎn)換模 塊114、一個語言檢測模塊115、一個令牌化模塊116、一個標(biāo)引模塊117、以及一個分類模塊 118(c)。數(shù)據(jù)庫子系統(tǒng)340可以包括一個索引數(shù)據(jù)庫122、一個數(shù)據(jù)對象數(shù)據(jù)庫124、一個分類數(shù)據(jù)庫126、以及一個數(shù)據(jù)共享模塊119。第一計算子系統(tǒng)310、第二計算子系統(tǒng)320、 以及數(shù)據(jù)庫子系統(tǒng)340的實例包括但不限于不同類型的計算裝置(如針對圖2中的第一計 算子系統(tǒng)210、第二計算子系統(tǒng)220、以及數(shù)據(jù)庫子系統(tǒng)230列出的那些)。根據(jù)至少一個實施方案,第一應(yīng)用程序312可以在系統(tǒng)300中的其他應(yīng)用程序 (如第二應(yīng)用程序322或第三應(yīng)用程序33 之前接收一種程序?qū)S玫臄?shù)據(jù)對象。例如,第 一應(yīng)用程序312的通信模塊112(a)可以接收這種程序?qū)S玫臄?shù)據(jù)對象。在接收了程序?qū)?用的數(shù)據(jù)對象之后,第一應(yīng)用程序312可以指示另一個應(yīng)用程序?qū)⒃摮绦驅(qū)S玫臄?shù)據(jù)對象 轉(zhuǎn)換為一種常用形式的數(shù)據(jù)對象、在數(shù)據(jù)對象上執(zhí)行語言檢測、將數(shù)據(jù)對象令牌化、對數(shù)據(jù) 對象進(jìn)行標(biāo)引、和/或?qū)?shù)據(jù)對象分類。例如,第一應(yīng)用程序312可以指示第三應(yīng)用程序 332將該程序?qū)S玫臄?shù)據(jù)對象轉(zhuǎn)換為一種常用形式的數(shù)據(jù)對象、在數(shù)據(jù)對象上執(zhí)行語言檢 測、將數(shù)據(jù)對象令牌化、創(chuàng)建從數(shù)據(jù)對象提取的數(shù)據(jù)的一個索引、并且然后基于對象內(nèi)的數(shù) 據(jù)將不同的分類分配給該數(shù)據(jù)對象。由第三應(yīng)用程序332產(chǎn)生的標(biāo)引數(shù)據(jù)可以被存儲在數(shù)據(jù)庫子系統(tǒng)340中。由第三 應(yīng)用程序生成的常用形式的數(shù)據(jù)對象、分類數(shù)據(jù)、和/或任何其他數(shù)據(jù)也可以被存儲在數(shù) 據(jù)庫子系統(tǒng)340上。數(shù)據(jù)庫子系統(tǒng)340可以從第二應(yīng)用程序322(或系統(tǒng)300中的一個或 多個其他的應(yīng)用程序)處接收對于索引(如由第三應(yīng)用程序332創(chuàng)建的一個數(shù)據(jù)對象的索 引)的一個請求。在一些實施方案中,數(shù)據(jù)庫子系統(tǒng)340還可以從第二應(yīng)用程序322處接 收對于與該索引和/或數(shù)據(jù)對象相關(guān)聯(lián)的其他數(shù)據(jù)(如包括分類數(shù)據(jù)和/或代表該程序?qū)?用的數(shù)據(jù)對象的一種常用形式的數(shù)據(jù)對象)的一個請求。在至少一個實例中,根據(jù)如由安 全模塊113(d)所確定的安全策略,數(shù)據(jù)庫子系統(tǒng)340的數(shù)據(jù)共享模塊119可以允許第二應(yīng) 用程序322訪問所請求的數(shù)據(jù)。在一些實施方案中,根據(jù)如由安全模塊113(d)確定的安全 策略,數(shù)據(jù)共享模塊119可以將所請求的數(shù)據(jù)發(fā)送給第二應(yīng)用程序322和/或系統(tǒng)300中 的其他應(yīng)用程序。根據(jù)不同的實施方案,示例性系統(tǒng)100的全部或一部分可以代表圖4中所示的示 例性的基于網(wǎng)絡(luò)的系統(tǒng)400的多個部分。圖4是用于進(jìn)行數(shù)據(jù)標(biāo)引以供多個應(yīng)用程序使用 的一個示例性的基于網(wǎng)絡(luò)的系統(tǒng)400的框圖。如在此圖中所展示的,示例性系統(tǒng)400可以 包括通過網(wǎng)絡(luò)440連接的一個第一計算子系統(tǒng)410、一個第二計算子系統(tǒng)420、以及一個企 業(yè)子系統(tǒng)430。網(wǎng)絡(luò)440的實例包括但不限于不同類型的網(wǎng)絡(luò)(如為圖2中的網(wǎng)絡(luò)240列 出的那些)。第一計算子系統(tǒng)410、第二計算子系統(tǒng)420以及企業(yè)子系統(tǒng)430可以位于一個或多 個計算裝置上。例如,第一計算子系統(tǒng)410、第二計算子系統(tǒng)420、和/或企業(yè)子系統(tǒng)430可 以位于一個單一的計算裝置上或者兩個或更多個分離的計算裝置上。第一計算子系統(tǒng)410、 第二計算子系統(tǒng)420、以及企業(yè)子系統(tǒng)430的實例包括但不限于不同類型的計算裝置(如為 圖2中的第一計算子系統(tǒng)210、第二計算子系統(tǒng)220、以及數(shù)據(jù)庫子系統(tǒng)230列出的那些)。根據(jù)不同的實施方案,第一計算子系統(tǒng)410可以包括一個第一應(yīng)用程序412,該第 一應(yīng)用程序包括一個通信模塊112(a)、一個安全模塊113 (a)、以及一個分類模塊118(a), 并且第二計算子系統(tǒng)420可以包括一個第二應(yīng)用程序422,該第二應(yīng)用程序包括一個通信 模塊112 (b)、一個安全模塊113 (b)、以及一個分類模塊118 (b)。企業(yè)子系統(tǒng)430可以包括一 個企業(yè)應(yīng)用程序432,該企業(yè)應(yīng)用程序包括一個通信模塊112(c)、一個安全模塊113(c)、一個轉(zhuǎn)換模塊114、一個語言檢測模塊115、一個令牌化模塊116、一個標(biāo)引模塊117、以及一個 分類模塊118(c)。根據(jù)不同的實施方案,企業(yè)子系統(tǒng)430還可以包括一個企業(yè)數(shù)據(jù)庫434, 該企業(yè)數(shù)據(jù)庫包括一個索引數(shù)據(jù)庫122、一個數(shù)據(jù)對象數(shù)據(jù)庫124、一個分類數(shù)據(jù)庫126、以 及一個數(shù)據(jù)共享模塊119。在示例性系統(tǒng)400中,企業(yè)子系統(tǒng)430可以包括一個計算子系統(tǒng),該計算子系統(tǒng)被 編程為向多個計算裝置和/或子系統(tǒng)(如第一計算子系統(tǒng)410和第二計算子系統(tǒng)420)提 供服務(wù)。由企業(yè)子系統(tǒng)430提供的服務(wù)的實例包括但不限于數(shù)據(jù)搜索和/或存儲服務(wù)。根 據(jù)不同的實施方案,由企業(yè)子系統(tǒng)430提供的不同服務(wù)可以由多個不同的軟件應(yīng)用程序的 類型所提供。根據(jù)一些實例,第一計算子系統(tǒng)410和/或第二計算子系統(tǒng)420還可以執(zhí)行 不同的備份、歸檔、安全、和/或內(nèi)容管理操作(例如,防病毒保護(hù)、垃圾郵件過濾、以及數(shù)據(jù) 丟失防護(hù)服務(wù))。第一計算子系統(tǒng)410和/或第二計算子系統(tǒng)420可以使用由企業(yè)子系統(tǒng) 430獲得的數(shù)據(jù)(如索引和分類數(shù)據(jù))以執(zhí)行備份、歸檔、安全、和/或內(nèi)容管理操作。在至少一個實施方案中,企業(yè)子系統(tǒng)430可以包括一個企業(yè)應(yīng)用程序432(例如, 一個企業(yè)搜索設(shè)備、一個嵌入式搜索引擎、或一個托管的搜索引擎),該企業(yè)應(yīng)用程序被編 程為向系統(tǒng)400中的計算裝置和/或子系統(tǒng)提供服務(wù)(如搜索和/或存儲服務(wù))。例如,企 業(yè)應(yīng)用程序432可以被編程為在第一計算子系統(tǒng)410和/或第二計算子系統(tǒng)420上搜索一 個或多個數(shù)據(jù)對象元素。為了協(xié)助這些數(shù)據(jù)對象的搜索,轉(zhuǎn)換模塊114可以將這些數(shù)據(jù)對 象轉(zhuǎn)換為常用形式的數(shù)據(jù)對象,語言檢測模塊115可以在這些數(shù)據(jù)對象上執(zhí)行語言檢測, 令牌化模塊116可以將這些數(shù)據(jù)對象令牌化,并且標(biāo)引模塊117可以創(chuàng)建該一個或多個數(shù) 據(jù)對象的索引。當(dāng)企業(yè)應(yīng)用程序432接收了對一個或多個數(shù)據(jù)對象的搜索請求時,企業(yè)應(yīng) 用程序432可以對這些索引進(jìn)行搜索。根據(jù)至少一個實施方案,在系統(tǒng)400中,第一應(yīng)用程序412可以在其他應(yīng)用程序 (如第二應(yīng)用程序42 之前接收一個程序?qū)S玫臄?shù)據(jù)對象。例如,第一應(yīng)用程序412的通 信模塊112(a)可以接收該程序?qū)S玫臄?shù)據(jù)對象。在接收了該程序?qū)S玫臄?shù)據(jù)對象之后,第 一應(yīng)用程序412可以指示企業(yè)應(yīng)用程序432將該程序?qū)S玫臄?shù)據(jù)對象轉(zhuǎn)換為一種常用形式 的數(shù)據(jù)對象、將該數(shù)據(jù)對象令牌化、和/或?qū)υ摂?shù)據(jù)對象進(jìn)行標(biāo)引。例如,第一應(yīng)用程序412 可以指示企業(yè)應(yīng)用程序432將該程序?qū)S玫臄?shù)據(jù)對象轉(zhuǎn)換為一種常用形式的數(shù)據(jù)對象、在 該數(shù)據(jù)對象上執(zhí)行語言檢測、將該常用形式的數(shù)據(jù)對象令牌化、并且創(chuàng)建從該常用形式的 數(shù)據(jù)對象中提取的多個令牌的一個索引。在一些實例中,第一應(yīng)用程序412可以將一種程序?qū)S玫臄?shù)據(jù)對象轉(zhuǎn)換為一種常 用形式的數(shù)據(jù)對象、在該數(shù)據(jù)對象上執(zhí)行語言檢測、將該數(shù)據(jù)對象令牌化、和/或?qū)υ摂?shù)據(jù) 對象進(jìn)行標(biāo)弓I。由第一應(yīng)用程序412創(chuàng)建的數(shù)據(jù)對象的索引、和/或與該程序?qū)S玫臄?shù)據(jù)對 象相關(guān)聯(lián)的任何其他適當(dāng)?shù)臄?shù)據(jù)(如該常用形式的數(shù)據(jù)對象和/或任何相關(guān)的分類數(shù)據(jù)) 可以從第一應(yīng)用程序412傳送到企業(yè)應(yīng)用程序432。在一些實施方案中,第一應(yīng)用程序412可以確定該程序?qū)S玫臄?shù)據(jù)對象之前是否 被一個或多個其他的應(yīng)用程序(如第二應(yīng)用程序42 所接收、轉(zhuǎn)換、標(biāo)引、和/或另外地存 儲在系統(tǒng)400中。例如,第一應(yīng)用程序412可以將企業(yè)應(yīng)用程序432請求與該程序?qū)S玫?數(shù)據(jù)對象相關(guān)聯(lián)的數(shù)據(jù)(如標(biāo)引數(shù)據(jù))的一個請求發(fā)送給數(shù)據(jù)共享模塊119。如果第一應(yīng) 用程序412從企業(yè)應(yīng)用程序432處接收了一個響應(yīng),該響應(yīng)表明與該程序?qū)S玫臄?shù)據(jù)對象相關(guān)聯(lián)的所請求的數(shù)據(jù)沒有存儲在系統(tǒng)400中的企業(yè)數(shù)據(jù)庫434或其他位置中,第一應(yīng)用 程序412可以繼續(xù)對該程序?qū)S玫臄?shù)據(jù)對象進(jìn)行標(biāo)引和/或指示企業(yè)應(yīng)用程序432對該程 序?qū)S玫臄?shù)據(jù)對象進(jìn)行標(biāo)引。圖5是用于進(jìn)行數(shù)據(jù)標(biāo)引以供多個應(yīng)用程序使用的一種示例性計算機(jī)實施的方 法500的流程圖。圖5中所示的這些步驟可由任何適當(dāng)?shù)挠嬎銠C(jī)可執(zhí)行代碼和/或計算系 統(tǒng)來執(zhí)行。在一些實施方案中,如將在以下更詳細(xì)解釋的,圖5中所示的這些步驟可以由圖 1中的系統(tǒng)100的部件中的一個或多個、圖2中的系統(tǒng)200的子系統(tǒng)中的一個或多個、圖3 中的系統(tǒng)300的子系統(tǒng)中的一個或多個、和/或圖4中的系統(tǒng)400的子系統(tǒng)中的一個或多 個來執(zhí)行。在圖5中的步驟510處,該系統(tǒng)可以在多個應(yīng)用程序中的一個第一應(yīng)用程序處接 收一個數(shù)據(jù)對象。在至少一個實例中,該數(shù)據(jù)對象可以包括一種程序?qū)S玫臄?shù)據(jù)對象,該程 序?qū)S玫臄?shù)據(jù)對象被配置為被至少一個程序類型訪問。例如,通信模塊112可以接收一個 程序?qū)S玫臄?shù)據(jù)對象,如一個文字處理文件。通信模塊112可以在多種環(huán)境中接收該數(shù)據(jù) 對象。例如,通信模塊112通過在一個標(biāo)引過程中識別該程序?qū)S玫臄?shù)據(jù)對象并且確定該 程序?qū)S玫臄?shù)據(jù)對象尚未被另一個應(yīng)用程序標(biāo)弓I而可以接收該數(shù)據(jù)對象。在一些實施方案 中,通信模塊112可以包括一個插件程序(或其他的代碼),該插件程序被包括在一個執(zhí)行 標(biāo)引的應(yīng)用程序中,如備份應(yīng)用程序和/或桌面搜索應(yīng)用程序。該多個應(yīng)用程序可以包括兩個或更多個應(yīng)用程序的類型。例如,圖2中的第一應(yīng) 用程序212和第二應(yīng)用程序222可以各自包括一個不同的應(yīng)用程序類型。舉例說明,在系 統(tǒng)200中,第一應(yīng)用程序212可以包括被編程為指導(dǎo)對所標(biāo)引的數(shù)據(jù)對象進(jìn)行數(shù)據(jù)搜索的 一個應(yīng)用程序。另一方面,在系統(tǒng)200中,第二應(yīng)用程序222可以被配置為創(chuàng)建數(shù)據(jù)對象的 備份文件。第二應(yīng)用程序222可以使用與這些數(shù)據(jù)對象相關(guān)聯(lián)的索引數(shù)據(jù)來備份并且隨后 檢索已備份的數(shù)據(jù)。存儲在一個數(shù)據(jù)庫(如索引數(shù)據(jù)庫12 的系統(tǒng)中的索引可以被一個 第一應(yīng)用程序212和一個第二應(yīng)用程序222 二者使用。在一些實施方案中,該數(shù)據(jù)對象可以是一種程序?qū)S玫臄?shù)據(jù)對象,并且該系統(tǒng)可 以將該程序?qū)S玫臄?shù)據(jù)對象轉(zhuǎn)換為一種常用形式的數(shù)據(jù)對象。例如,轉(zhuǎn)換模塊114可以將 一個文字處理文件轉(zhuǎn)換為一種文件格式,該文件格式能夠被兩個或更多個應(yīng)用程序的類型 容易讀取和/或以其他方式來使用。一種常用形式的數(shù)據(jù)對象可以包括(例如)標(biāo)記語言 (例如,HTML或XML)和/或純文本語言。在至少一個實施方案中,該第一應(yīng)用程序(例如,第一應(yīng)用程序212)可以將程序 專用的數(shù)據(jù)對象轉(zhuǎn)換為常用形式的數(shù)據(jù)對象。在另外的實例中,該第一應(yīng)用程序可以指示 另一個應(yīng)用程序?qū)⒊绦驅(qū)S玫臄?shù)據(jù)對象轉(zhuǎn)換為常用形式的數(shù)據(jù)對象。例如,圖3中的第一 應(yīng)用程序312可以指示第三應(yīng)用程序332將一種程序?qū)S玫臄?shù)據(jù)對象轉(zhuǎn)換為一種常用形式 的數(shù)據(jù)對象。在至少一個實例中,圖4中的第一應(yīng)用程序412可以指示企業(yè)應(yīng)用程序432 將該程序?qū)S玫臄?shù)據(jù)對象轉(zhuǎn)換為一種常用形式的數(shù)據(jù)對象。然后,該系統(tǒng)可以在該數(shù)據(jù)對 象上執(zhí)行語言檢測。例如,語言檢測模塊115可以在將該數(shù)據(jù)對象令牌化并標(biāo)引之前在該 常用形式的數(shù)據(jù)對象上執(zhí)行語言檢測。在對圖5的這些步驟的以下討論中,短語“數(shù)據(jù)對 象”可以是指還沒有被轉(zhuǎn)換為一種常用形式的數(shù)據(jù)對象的數(shù)據(jù)對象或已經(jīng)被轉(zhuǎn)換為一種常 用形式的數(shù)據(jù)對象的數(shù)據(jù)對象。14
在圖5的步驟520處,該系統(tǒng)可以將該數(shù)據(jù)對象令牌化以從該數(shù)據(jù)對象中提取多 個令牌。例如,令牌化模塊116可以通過識別該常用形式的數(shù)據(jù)對象中的多個文字來將該 常用形式的數(shù)據(jù)對象令牌化。在一些實施方案中,可以在該數(shù)據(jù)對象的令牌化過程中識別 其他有意義的單元,如標(biāo)簽和/或子字。根據(jù)不同的實施方案,該第一應(yīng)用程序可以將數(shù)據(jù) 對象令牌化或該第一應(yīng)用程序可以指示另一個應(yīng)用程序(例如,第三應(yīng)用程序332和/或 企業(yè)應(yīng)用程序43 將該數(shù)據(jù)對象令牌化。在圖5的步驟530處,該系統(tǒng)可以創(chuàng)建從該數(shù)據(jù)對象中提取的這些令牌的一個索 引,它是該數(shù)據(jù)對象的一個索引。該索引可以被格式化為供該多個應(yīng)用程序中的每一個使 用。例如,標(biāo)引模塊117可以在該數(shù)據(jù)對象中創(chuàng)建從該數(shù)據(jù)對象中提取的多個令牌(如令 牌化的文字和/或其他有意義的單元)的一個索引。該第一應(yīng)用程序可以創(chuàng)建該索引和/ 或該第一應(yīng)用程序可以指示另一個應(yīng)用程序(例如,第三應(yīng)用程序332和/或企業(yè)應(yīng)用程 序43 對來自該數(shù)據(jù)對象的這些令牌進(jìn)行標(biāo)引。在圖5的步驟540處,該系統(tǒng)可以將該索引存儲在該多個應(yīng)用程序可以訪問的一 個數(shù)據(jù)庫中。例如,該索引可以被存儲在根據(jù)安全模塊113(c)建立并強(qiáng)制實施的安全策 略,第一應(yīng)用程序412和第二應(yīng)用程序422可以訪問的一個基于網(wǎng)絡(luò)的數(shù)據(jù)庫和/或一個 基于企業(yè)的數(shù)據(jù)庫中,如被定位在企業(yè)數(shù)據(jù)庫434上的一個數(shù)據(jù)庫。根據(jù)一些實施方案,該 索引能夠以一種壓縮的格式被保存在該數(shù)據(jù)庫中。該索引的壓縮格式可以減少在該數(shù)據(jù)庫 上使用的存儲空間和/或可以減少在網(wǎng)絡(luò)上傳送該索引所使用的帶寬。根據(jù)至少一個實施方案,方法500可以進(jìn)一步包括從該系統(tǒng)的另一個應(yīng)用程序處 接收對于該索引的一個請求。例如,系統(tǒng)200中的第二應(yīng)用程序222可以從數(shù)據(jù)庫子系統(tǒng) 230處請求該索引。在一些實例中,該方法可以進(jìn)一步包括允許該第二應(yīng)用程序訪問存儲在 索引數(shù)據(jù)庫122中的索引。例如,根據(jù)安全模塊113(c)建立并強(qiáng)制實施的這些安全策略,第 二應(yīng)用程序222可以被允許由本身來搜索該索引或利用企業(yè)應(yīng)用程序432來搜索該索引。根據(jù)不同的實施方案,方法500還可以包括將該數(shù)據(jù)對象存儲在該數(shù)據(jù)庫中。例 如,代表一種程序?qū)S玫臄?shù)據(jù)對象的一種常用形式的數(shù)據(jù)對象可以被存儲在數(shù)據(jù)對象數(shù)據(jù) 庫IM中。在一些實例中,該程序?qū)S玫臄?shù)據(jù)對象還可以被存儲在數(shù)據(jù)對象數(shù)據(jù)庫IM中。 在該數(shù)據(jù)庫中,該程序?qū)S玫臄?shù)據(jù)對象可以是與該常用形式的數(shù)據(jù)對象和/或該數(shù)據(jù)對象 的索引相關(guān)聯(lián)的。在一些實例中,該常用形式的數(shù)據(jù)對象能夠以一種壓縮的格式存儲在該 數(shù)據(jù)庫中。在至少一個實施方案中,該系統(tǒng)還可以生成與該程序?qū)S玫臄?shù)據(jù)對象相關(guān)聯(lián)的元 數(shù)據(jù)和/或與該程序?qū)S玫臄?shù)據(jù)對象相關(guān)聯(lián)的一個隱藏文件中的至少一項。該元數(shù)據(jù)和/ 或該隱藏文件可以與該程序?qū)S玫臄?shù)據(jù)對象一起被傳送到另一個應(yīng)用程序。在一些實例 中,當(dāng)該程序?qū)S玫臄?shù)據(jù)對象從該系統(tǒng)中被刪除或以其他方式被移除時,與該程序?qū)S玫?數(shù)據(jù)對象相關(guān)聯(lián)的元數(shù)據(jù)和/或隱藏文件也可以從該系統(tǒng)中被刪除。例如,對于存儲在WINDOWS NTFS文件系統(tǒng)上的一個文字處理文檔,一種常用形式 的數(shù)據(jù)對象可以存儲在存儲了該文字處理文檔自身的同一個文件的一個替代數(shù)據(jù)流中。該 索引可以存儲在這同一個文件的另一個數(shù)據(jù)流中。與該文字處理文檔相關(guān)聯(lián)的數(shù)據(jù)分類信 息可以被存儲在又另一個數(shù)據(jù)流中,或被包括在該常用形式或索引數(shù)據(jù)流中。多個應(yīng)用程 序可以各自為該文檔提供分離的數(shù)據(jù)分類,并且每個應(yīng)用程序可以將它的分類存儲在一個分離的數(shù)據(jù)流中或被集合在這些其他數(shù)據(jù)流的一個中。例如,一個防止數(shù)據(jù)丟失的應(yīng)用程 序可以提供一種分類,即一個文檔包含信用卡號和/或社會保險號。在一些實例中,一個防 病毒應(yīng)用程序可以將一個文檔分類為包含一個宏病毒。在另外的實例中,一個歸檔應(yīng)用程 序可以將一個文檔分類為需要被保留七年?;谟梢粋€安全模塊(如安全模塊113(c))建 立的多種安全策略,所有這些替代的數(shù)據(jù)流對最終用戶可以是隱藏的,但是對其他應(yīng)用程 序(如可能希望訪問它們的第一應(yīng)用程序212或22 可以是可供使用的。如果用戶刪除了該文檔,這些替代的數(shù)據(jù)流可以自動地被刪除。如果用戶將該文 檔移動到了同一個卷上的另一個位置上,這些替代的數(shù)據(jù)流可以隨該文檔一起移動。如果 用戶復(fù)制了該文檔,根據(jù)用于執(zhí)行該復(fù)制操作的方法,這些數(shù)據(jù)流可以被復(fù)制。例如,當(dāng)一 個MICROSOFT WORD文檔(或其他的MICROSOFT OFFICE文檔)被修改時,WORD可以將該文 檔的新版本寫入一個不同的文件,刪除該舊版本,并且然后將該新版本重新命名為正確的 名稱。這可以自動地刪除與該文檔的較舊文本相關(guān)聯(lián)的所有元數(shù)據(jù),如也許不適用于這個 新版本的元數(shù)據(jù)。對于就地修改的文件,這些替代的數(shù)據(jù)流可能不再適用于該文件。時間 戳、指紋、或其他的元數(shù)據(jù)可以被用于確定這些替代的數(shù)據(jù)流何時過期。在至少一個實施方案中,方法500還可以包括接收對于該常用形式的數(shù)據(jù)對象的 一個請求。例如,第二應(yīng)用程序222可以請求數(shù)據(jù)庫子系統(tǒng)230中的常用形式的數(shù)據(jù)對象, 而數(shù)據(jù)共享模塊119可以根據(jù)由安全模塊113(c)建立并強(qiáng)制實施的安全策略將該常用形 式的數(shù)據(jù)對象發(fā)送到第二應(yīng)用程序222。另外,數(shù)據(jù)共享模塊119還可以發(fā)送與該常用形式 的數(shù)據(jù)對象和/或該程序?qū)S玫臄?shù)據(jù)對象相關(guān)聯(lián)的任何其他被請求的數(shù)據(jù)。根據(jù)一些實施方案,方法500可以進(jìn)一步包括執(zhí)行該程序?qū)S玫臄?shù)據(jù)對象的一個 數(shù)據(jù)分類,并且將這些數(shù)據(jù)分類結(jié)果與該常用形式的數(shù)據(jù)對象、該程序?qū)S玫臄?shù)據(jù)對象、和 /或該索引中的至少一項相關(guān)聯(lián)。例如,分類模塊118可以識別該數(shù)據(jù)對象的元素,并且可 以對該數(shù)據(jù)對象和/或該數(shù)據(jù)對象的所識別的元素進(jìn)行分類。在至少一個實例中,將這些 數(shù)據(jù)分類結(jié)果與該常用形式的數(shù)據(jù)對象相關(guān)聯(lián)可以包括添加指代這些數(shù)據(jù)分類結(jié)果的數(shù) 據(jù)標(biāo)簽。在另外的實例中,方法500可以包括基于這些這些數(shù)據(jù)分類結(jié)果執(zhí)行至少一個策 略。該至少一個策略的實例可以包括但不限于垃圾郵件策略、防病毒策略、防止數(shù)據(jù)丟失策 略、防止知識產(chǎn)權(quán)泄漏策略、歸檔策略、以及備份策略、內(nèi)容管理策略(如分類和/或過濾策 略)、電子采證策略、和/或遵守法律策略。這些分類結(jié)果可以確定適用于該程序?qū)S玫臄?shù) 據(jù)對象的一個或多個策略。舉例說明,如果這些分類結(jié)果表明該程序?qū)S玫臄?shù)據(jù)對象包括 一封垃圾郵件,那么可以執(zhí)行一個垃圾郵件策略以將該程序?qū)S玫臄?shù)據(jù)對象隔離。圖6是用于進(jìn)行數(shù)據(jù)標(biāo)引以供多個應(yīng)用程序使用的一種示例性計算機(jī)實施方法 600的流程圖。圖6所示的這些步驟可以由任何適當(dāng)?shù)挠嬎銠C(jī)可執(zhí)行代碼和/或計算系統(tǒng) 來執(zhí)行。在一些實施方案中,如將在以下更詳細(xì)解釋的,圖6中所示的這些步驟可以由圖1 中的系統(tǒng)100的部件中的一個或多個、圖2中的系統(tǒng)200的子系統(tǒng)中的一個或多個、圖3中 的系統(tǒng)300的子系統(tǒng)中的一個或多個、和/或圖4中的系統(tǒng)400的子系統(tǒng)中的一個或多個 來執(zhí)行。在圖6中的步驟610處,該系統(tǒng)可以在多個應(yīng)用程序中的一個第一應(yīng)用程序處接 收一個數(shù)據(jù)對象。例如,該數(shù)據(jù)對象可以包括一種程序?qū)S玫臄?shù)據(jù)對象,該程序?qū)S玫臄?shù)據(jù)對象被配置為被至少一種應(yīng)用程序的類型訪問。在一些實施方案中,該系統(tǒng)可以將該程 序?qū)S玫臄?shù)據(jù)對象轉(zhuǎn)換為一種常用形式的數(shù)據(jù)對象,并且可以在該數(shù)據(jù)對象上執(zhí)行語言檢 測。在圖6的步驟620處,該系統(tǒng)可以將該數(shù)據(jù)對象令牌化。在圖6中的步驟630處,該系 統(tǒng)可以創(chuàng)建從該數(shù)據(jù)對象中提取的這些令牌的一個對象索引。該對象索引可以被格式化為 供該多個應(yīng)用程序中的每一個使用。圖6中的步驟610、620、以及630是與圖5中的步驟 510,520,以及530相類似的。因此,之前對步驟510至530的討論也可以適用于步驟610 至 630。在圖6中的步驟640處,該系統(tǒng)可以將該對象索引存儲在一個主索引中,該主索引 包括與多個數(shù)據(jù)對象相關(guān)聯(lián)的標(biāo)引信息。例如,該主索引可以包括從多個程序?qū)S玫臄?shù)據(jù) 對象轉(zhuǎn)換來的多個常用形式的數(shù)據(jù)對象的對象索引。在一些實例中,該主索引可以包括從 多個應(yīng)用程序中接收的多個索引。該主索引可以包括存儲在基于網(wǎng)絡(luò)的數(shù)據(jù)庫和/或基于 企業(yè)的數(shù)據(jù)庫(如定位在企業(yè)應(yīng)用程序432上的數(shù)據(jù)庫)上的一個索引。在一些實施方案 中,該主索引還可以被存儲在一個隱藏區(qū)域內(nèi),該隱藏區(qū)域所處的位置存儲了該程序?qū)S?的數(shù)據(jù)對象,如系統(tǒng)200中的第一計算子系統(tǒng)210上的一個數(shù)據(jù)庫。在存儲該程序?qū)S玫?數(shù)據(jù)對象的位置處,單獨(dú)的對象索引還可以被存儲為獨(dú)立的索引。根據(jù)不同的實施方案,該主索引可以被該系統(tǒng)中的多個應(yīng)用程序訪問。在至少一 個實例中,該多個應(yīng)用程序可以包括兩個或更多個應(yīng)用程序的類型。舉例說明,該系統(tǒng)中的 這些應(yīng)用程序中的至少一個(如第一應(yīng)用程序21 可以包括一個防止數(shù)據(jù)丟失的應(yīng)用程 序,并且該系統(tǒng)中的這些應(yīng)用程序中的另一個(如第二應(yīng)用程序222)可以包括一個歸檔應(yīng) 用程序。在不同的實施方案中,該主索引可以包括從該多個應(yīng)用程序中的兩個或更多個處 接收的多個對象索引。如此前所解釋的,通過提供用于進(jìn)行數(shù)據(jù)標(biāo)引以供多個應(yīng)用程序使用的一種手 段,在此說明的這些系統(tǒng)和方法可以使得多個應(yīng)用程序中的一個第一應(yīng)用程序能夠創(chuàng)建可 以被該多個應(yīng)用程序中的每一個使用的一個數(shù)據(jù)對象的索引,由此消除了對該多個應(yīng)用程 序中的每一個分別地創(chuàng)建該數(shù)據(jù)對象的索引的需要。例如,第一應(yīng)用程序412可能遇到一個尚未被標(biāo)引的MICROSOFT WORD文檔。它可 以通知企業(yè)子系統(tǒng)430上的企業(yè)應(yīng)用程序432來處理該WORD文檔,該企業(yè)應(yīng)用程序可以是 (例如)一個企業(yè)搜索裝置和/或引擎。然后,企業(yè)應(yīng)用程序432可以創(chuàng)建該文檔的一種 常用形式的版本、在該文檔的常用形式的版本上執(zhí)行語言檢測、將該文檔的常用形式的版 本令牌化、然后對該結(jié)果進(jìn)行標(biāo)引、將該文檔的常用形式的版本和該索引存儲在企業(yè)數(shù)據(jù) 庫434上。然后,第一應(yīng)用程序412可以使用該文檔的常用形式的版本或者該索引來執(zhí)行 它的任務(wù)。然后,第二應(yīng)用程序422可能遇到該相同的MICROSOFT WORD文檔,確定它是否 已經(jīng)被標(biāo)引,并且使用存儲在企業(yè)數(shù)據(jù)庫434上的索引來執(zhí)行該文檔的一個數(shù)據(jù)分類。然 后,第二應(yīng)用程序422可以將該數(shù)據(jù)分類的結(jié)果存儲在企業(yè)數(shù)據(jù)庫434上,這樣使得該分類 可以被任何其他能夠使用該分類的應(yīng)用程序來使用。圖7是一個示例性計算系統(tǒng)710的框圖,該系統(tǒng)能夠?qū)嵤┰诖苏f明和/或展示的 一個或多個實施方案。計算系統(tǒng)710廣義上代表能夠執(zhí)行計算機(jī)可讀指令的任何單處理器 或多處理器的計算裝置或系統(tǒng)。計算系統(tǒng)710的多個實例包括但不限于工作站、膝上計算 機(jī)、客戶側(cè)終端、服務(wù)器、分布式計算系統(tǒng)、手持裝置、或任何其他計算系統(tǒng)或裝置。在其最基本的配置中,計算系統(tǒng)710可以包括至少一個處理器714以及一個系統(tǒng)內(nèi)存716。處理器714總體上代表能夠處理數(shù)據(jù)或解釋并執(zhí)行多個指令的任何類型或形式 的處理單元。在某些實施方案中,處理器714可以從一個軟件應(yīng)用程序或模塊中接收指令。 這些指令可以致使處理器714執(zhí)行在此所說明和/或展示的一個或多個示例性實施方案的 功能。例如,處理器714可以獨(dú)自地或與其他元件相結(jié)合地執(zhí)行和/或作為一種手段來執(zhí) 行在此說明的接收、轉(zhuǎn)換、令牌化、創(chuàng)建、存儲、發(fā)送、進(jìn)行、生成、執(zhí)行、關(guān)聯(lián)、和/或者標(biāo)引 步驟中的一個或多個。處理器714還可以執(zhí)行和/或作為一種手段來執(zhí)行在此所說明和/ 或展示的任何其他步驟、方法、或進(jìn)程。系統(tǒng)內(nèi)存716總體上代表能夠存儲數(shù)據(jù)和/或其他計算機(jī)可讀指令的任何類型或 形式的易失性或非易失性存儲裝置或媒質(zhì)。系統(tǒng)內(nèi)存716的多個實例包括但不限于,隨機(jī) 存取存儲器(“RAM”)、只讀存儲器(“ROM”)、閃存、或任何其他適當(dāng)?shù)拇鎯ρb置。盡管沒 有要求,在某些實施方案中計算系統(tǒng)710可以既包括一個易失性內(nèi)存單元(例如像系統(tǒng)內(nèi) 存716)又包括一個非易失性存儲裝置(例如像以下詳細(xì)說明的主存儲裝置73 。在一個 實例中,來自圖1的模塊110中的一個或多個可以被載入系統(tǒng)內(nèi)存716之中。在某些實施方案中,示例性計算系統(tǒng)710還可以包括除了處理器714和系統(tǒng)內(nèi)存 716之外的一個或多個部件或元件。例如,如圖7所示的,計算系統(tǒng)710可以包括一個內(nèi)存 控制器718、一個輸入/輸出(“I/O”)控制器720、以及一個通信接口 722,它們各自均可以 通過一個通信基礎(chǔ)結(jié)構(gòu)712而相互連接。通信基礎(chǔ)結(jié)構(gòu)712總體上代表能夠協(xié)助在一種計 算裝置的一個或多個部件之間進(jìn)行通信的任何類型或形式的基礎(chǔ)結(jié)構(gòu)。通信基礎(chǔ)結(jié)構(gòu)712 的實例包括但不限于,一條通信總線(例如ISA、PCI、PCIe、或類似總線)和一個網(wǎng)絡(luò)。內(nèi)存控制器718總體上代表能夠處理內(nèi)存或數(shù)據(jù)或能夠控制計算系統(tǒng)710的一個 或多個部件之間通信的任何類型或形式的裝置。例如,在一些實施方案中,內(nèi)存控制器718 可以通過通信基礎(chǔ)結(jié)構(gòu)712控制處理器714、系統(tǒng)內(nèi)存716、以及I/O控制器720之間的通 信。在一些實施方案中,內(nèi)存控制器718可以獨(dú)自地或與其他元件相結(jié)合地用來執(zhí)行和/ 或作為一種手段來執(zhí)行在此說明和/或展示的多個步驟或特征中的一個或多個,如接收、 轉(zhuǎn)換、令牌化、創(chuàng)建、存儲、發(fā)送、實現(xiàn)、關(guān)聯(lián)、和/或者標(biāo)引。I/O控制器720總體上代表能夠協(xié)調(diào)和/或控制一種計算裝置的輸入和輸出功能 的任何類型或形式的模塊。例如,在一些實施方案中I/O控制器720可以控制或協(xié)助計算 系統(tǒng)710的一個或多個元件(如處理器714、系統(tǒng)內(nèi)存716、通信接口 722、顯示適配器726、 輸入接口 730、以及存儲接口 734)之間的數(shù)據(jù)傳送。例如,I/O處理器720可被用于獨(dú)自地 或與其他元件相結(jié)合地執(zhí)行和/或作為一種手段用來執(zhí)行在此說明的接收、轉(zhuǎn)換、令牌化、 創(chuàng)建、存儲、發(fā)送、進(jìn)行、生成、執(zhí)行、關(guān)聯(lián)、和/或者標(biāo)引步驟中的一個或多個。I/O控制器 720還可用于執(zhí)行和/或作為一種手段用于執(zhí)行本披露中提出的其他步驟和特征。通信接口 722廣義地代表能夠協(xié)助示例性計算系統(tǒng)710與一個或多個另外的裝置 之間進(jìn)行通信的任何類型或形式的通信裝置或適配器。例如,在一些實施方案中,通信接 口 722可以協(xié)助計算系統(tǒng)710與包括多個另外的計算系統(tǒng)的一個私人或公共網(wǎng)絡(luò)之間的通 信。通信接口 722的實例包括而不限于一種有線網(wǎng)絡(luò)接口(例如一個網(wǎng)絡(luò)接口卡)、一種 無線網(wǎng)絡(luò)接口(例如一種無線網(wǎng)絡(luò)接口卡)、一種調(diào)制解調(diào)器、以及任何其他適當(dāng)?shù)慕涌凇?在至少一個實施方案中,通信接口 722可通過到一個網(wǎng)絡(luò)(如互聯(lián)網(wǎng))的一種直接鏈接來提供到一臺遠(yuǎn)程服務(wù)器的直接連接。通信接口 722還可以間接地提供這種連接,例如通過 一個局域網(wǎng)(如一個以太網(wǎng))、一個個人局域網(wǎng)、一個電話或纜線網(wǎng)、一種蜂窩電話連接、一 種衛(wèi)星數(shù)據(jù)連接、或任何其他適當(dāng)?shù)倪B接。在某些實施方案中,通信接口 722還可以代表一種主機(jī)適配器,它被配置為用于 通過一條外部總線或通信信道協(xié)助計算系統(tǒng)710與一個或多個附加網(wǎng)絡(luò)或存儲裝置之間 的通信。主機(jī)適配器的實例包括而不限于,SCSI主機(jī)適配器、USB主機(jī)適配器、IEEE 794主 機(jī)適配器、SATA和eSATA主機(jī)適配器、ATA和PATA主機(jī)適配器、光纖通道接口適配器、以太 網(wǎng)適配器、或類似適配器。通信接口 722還可以允許計算系統(tǒng)710參與分布式計算或遠(yuǎn)程 計算。例如通信接口 722可以從一個遠(yuǎn)程裝置接收指令或向一個遠(yuǎn)程裝置發(fā)送指令用于執(zhí) 行。在一些實施方案中,通信接口 722可以獨(dú)自地或與其他元件相結(jié)合地執(zhí)行和/或作為 一種手段來執(zhí)行在此披露的接收、轉(zhuǎn)換、令牌化、創(chuàng)建、存儲、發(fā)送、實現(xiàn)、生成、執(zhí)行、關(guān)聯(lián)、 分類、和/或者標(biāo)引步驟中的一個或多個。通信接口 722還可以用于執(zhí)行和/或作為一種 手段用于執(zhí)行本披露中提出的其他步驟和特征。如圖7所示,計算系統(tǒng)710還可以包括通過一種顯示適配器7 連接到通信基礎(chǔ) 結(jié)構(gòu)712上的至少一個顯示裝置724。顯示裝置724總體上代表能夠視覺上顯示由顯示適 配器7 發(fā)來的信息的任何類型或形式的裝置。類似地,顯示適配器7 總體上代表被配 置為用于傳送來自通信基礎(chǔ)結(jié)構(gòu)712 (或來自一個幀緩沖器,如本領(lǐng)域中已知的)的圖形、 文本、以及其他數(shù)據(jù)用于在顯示裝置7M上進(jìn)行顯示的任何類型或形式的裝置。如圖7所示,示例性計算系統(tǒng)710還可以包括通過一個輸入接口 730連接到通信 基礎(chǔ)結(jié)構(gòu)712上的至少一個輸入裝置728。輸入裝置7 總體上代表能夠?qū)⒂嬎銠C(jī)或者人 產(chǎn)生的輸入提供到示例性計算系統(tǒng)710上的任何類型或者形式的輸入裝置。輸入裝置7 的實例包括而不限于一種鍵盤、一種指向裝置、一種語音識別裝置、或任何其他輸入裝置。 在至少一個實施方案中,輸入裝置7 可以獨(dú)自地或與其他元件相結(jié)合地執(zhí)行和/或作為 一種手段來執(zhí)行在此披露的接收、轉(zhuǎn)換、令牌化、創(chuàng)建、存儲、發(fā)送、實現(xiàn)、生成、執(zhí)行、關(guān)聯(lián)、 分類、和/或者標(biāo)引步驟中的一個或多個。輸入裝置7 還可以用于執(zhí)行和/或作為一種 手段來執(zhí)行本披露中提出的其他步驟和特征。如圖7所示,示例性計算系統(tǒng)710還可以包括通過一個存儲接口 734連接到通信 基礎(chǔ)結(jié)構(gòu)712上的一個主存儲裝置732以及一個備份存儲裝置733。存儲裝置732和733 總體上代表能夠存儲數(shù)據(jù)和/或其他計算機(jī)可讀指令的任何類型或形式的存儲裝置或媒 質(zhì)。例如,存儲裝置732與733可以是一種磁盤驅(qū)動器(例如,一種所謂的硬盤驅(qū)動器)、一 種軟盤驅(qū)動器、一種磁帶驅(qū)動器、一種光盤驅(qū)動器、一種閃存驅(qū)動器、或者類似裝置。存儲接 口 734總體上代表用于在存儲裝置732和733與計算系統(tǒng)710的其他部件之間傳送數(shù)據(jù)的 任何類型或形式的接口或裝置。在一個實例中,來自圖1的多個數(shù)據(jù)庫120可以被存儲在 主存儲裝置732中。在某些實施方案中,存儲裝置732和733可以被配置為用于讀取自和/或?qū)懭氲?一個可裝卸的存儲單元,該可裝卸的存儲單元被配置為用于存儲計算機(jī)軟件、數(shù)據(jù)、或其他 計算機(jī)可讀信息。合適的可裝卸存儲單元的實例包括而不限于一種軟盤、一種磁帶、一種 光盤、一種閃存裝置,或諸如此類。存儲裝置732和733還可以包括允許將計算機(jī)軟件、數(shù) 據(jù)、或其他計算機(jī)可讀指令載入計算系統(tǒng)710中的其他類似的結(jié)構(gòu)或裝置。例如,存儲裝置732和733可以被配置用于讀取和寫入軟件、數(shù)據(jù)、或其他計算機(jī)可讀信息。存儲裝置732 和733還可以作為計算系統(tǒng)710的一部分或可以是通過其他接口系統(tǒng)訪問的一個分離的裝置。在一些實施方案中,存儲裝置732和733可以被用于獨(dú)自地或與其他元件相結(jié)合 地執(zhí)行和/或作為一種手段來執(zhí)行在此披露的接收、轉(zhuǎn)換、令牌化、創(chuàng)建、存儲、發(fā)送、實現(xiàn)、 生成、執(zhí)行、關(guān)聯(lián)、分類、和/或者標(biāo)引步驟中的一個或多個。存儲裝置732和733還可以被 用于執(zhí)行和/或作為一種手段用于執(zhí)行本披露提出的其他步驟和特征。很多其他裝置或子系統(tǒng)可以被連接到計算系統(tǒng)710上。相反,圖7中所示的所有 部件和裝置不必都存在以實現(xiàn)在此所說明和/或示出的實施方案。以上提到的這些裝置和 子系統(tǒng)還能夠以不同于圖7中所示的方式進(jìn)行相互連接。計算系統(tǒng)710還可使用任何數(shù)目 的軟件、固件、和/或硬件的配置。例如,在此披露的一個或多個示例性實施方案可以作為 一種計算機(jī)可讀媒質(zhì)上的計算機(jī)程序(還可稱為計算機(jī)軟件、軟件應(yīng)用程序、計算機(jī)可讀 指令、或計算機(jī)控制邏輯)進(jìn)行編碼。短語“計算機(jī)可讀媒質(zhì)”總體上是指能夠存儲或攜帶 計算機(jī)可讀指令的任何形式的裝置、載體、或媒質(zhì)。計算機(jī)可讀媒質(zhì)的實例包括而不限于, 傳輸型媒介,如載波,以及物理媒質(zhì),如磁性存儲媒質(zhì)(例如硬盤驅(qū)動器和軟盤驅(qū)動器)、光 存儲媒質(zhì)(例如CD-ROM或DVD-ROM)、電子存儲媒質(zhì)(例如固態(tài)驅(qū)動器和閃存媒質(zhì)),以及 其他分布式系統(tǒng)。包括計算機(jī)程序的計算機(jī)可讀媒質(zhì)可以被載入計算系統(tǒng)710中。然后在計算機(jī)可 讀媒質(zhì)上存儲的全部或一部分計算機(jī)程序可以被存儲到系統(tǒng)內(nèi)存716和/或存儲裝置732 和733的不同部分中。當(dāng)由處理器714執(zhí)行時,載入到計算系統(tǒng)710中的一個計算機(jī)程序 可以致使處理器714執(zhí)行和/或作為一種手段用于執(zhí)行在此所說明和/或展示的一個或多 個示例性實施方案的多種功能。額外地或可替代地,在此所說明和/或展示的一個或多個 示例性實施方案可以在固件和/或硬件中實施。例如計算系統(tǒng)710可以被配置用作一種專 用集成電路(“ASIC”),它被適配為用于實施在此所披露的一個或多個示例性實施方案。圖8是一個示例性網(wǎng)絡(luò)體系結(jié)構(gòu)800的框圖,其中,客戶系統(tǒng)810、820、和830以及 服務(wù)器840和845可以被連接到一個網(wǎng)絡(luò)850上??蛻粝到y(tǒng)810、820、和830總體上代表任 何類型或形式的計算裝置或系統(tǒng),如圖7中的示例性計算系統(tǒng)710。在一個實例中,客戶系 統(tǒng)810、820、和/或830和/或服務(wù)器840和/或845可以包括來自圖1的系統(tǒng)100中的全 部或一部分。類似地,服務(wù)器840和845總體上代表被配置為用于提供不同的數(shù)據(jù)庫服務(wù)和/ 或運(yùn)行某種軟件應(yīng)用程序的計算裝置或系統(tǒng),如應(yīng)用服務(wù)器或數(shù)據(jù)庫服務(wù)器。網(wǎng)絡(luò)850總 體上代表任何電信或計算機(jī)網(wǎng)絡(luò);例如,它包括一種內(nèi)部網(wǎng)、一種廣域網(wǎng)(“WAN”)、一種局 域網(wǎng)(“LAN”)、一種個人局域網(wǎng)(“PAN”)、或互聯(lián)網(wǎng)。如圖8所示,一個或多個存儲裝置860(1)-(N)可直接附接到服務(wù)器840上。類似 地,一個或多個存儲裝置870 (1) - (N)可直接附接到服務(wù)器845上。存儲裝置860 (1) - (N)和 存儲裝置870 (I)-(N)總體上代表能夠存儲數(shù)據(jù)和/或其他計算機(jī)可讀指令的任何類型或 形式的存儲裝置或媒質(zhì)。在一些實施方案中,存儲裝置860 (1) - (N)和存儲裝置870 (1) - (N) 可以代表被配置為用于使用不同協(xié)議(如NFS、SMB、或CIFS)來與服務(wù)器840和845進(jìn)行 通信的網(wǎng)絡(luò)附聯(lián)存儲(“NAS”)裝置。
服務(wù)器840和845還可以被連接到一種存儲區(qū)域網(wǎng)絡(luò)(“SAN”)光纖通道880上。 SAN光纖通道880總體上代表能夠協(xié)助多個存儲裝置之間互相通信的任何類型或形式的計 算機(jī)網(wǎng)絡(luò)或體系結(jié)構(gòu)。SAN光纖通道880可以協(xié)助在服務(wù)器840和845與多個存儲裝置 890 (I)-(N)和/或一個智能存儲陣列895之間的通信。SAN光纖通道880還可以通過網(wǎng)絡(luò) 850以及服務(wù)器840和845協(xié)助客戶系統(tǒng)810、820、和830以及存儲裝置890 (I)-(N)和/ 或智能存儲陣列890之間的通信,其方式為使得裝置890 (1) - (N)以及陣列895對于客戶系 統(tǒng)810、820和830而言表現(xiàn)為好像是本地附聯(lián)的裝置。如同存儲裝置860 (1) - (N)和存儲 裝置870 (1) - (N),存儲裝置890 (1) - (N)和智能存儲陣列895總體上代表能夠存儲數(shù)據(jù)和/ 或其他計算機(jī)可讀指令的任何類型或形式的存儲裝置或媒質(zhì)。在一些實施方案中,并參照圖7的示例性計算系統(tǒng)710,一個通信接口(如圖7中 的通信接口 722)可以被用于在每個客戶系統(tǒng)810、820、和830以及網(wǎng)絡(luò)850之間提供連接 性。例如,客戶系統(tǒng)810、820、和830通過一個網(wǎng)絡(luò)瀏覽器或其他客戶軟件可以訪問服務(wù)器 840和845上的信息。此類軟件可以允許客戶系統(tǒng)810、820、和830訪問由服務(wù)器840、服務(wù) 器845、存儲裝置860 (1) - (N)、存儲裝置870 (1) - (N)、存儲裝置890 (1) - (N)、或智能存儲陣 列895托管的數(shù)據(jù)。雖然圖8描繪了使用一個網(wǎng)絡(luò)(如互聯(lián)網(wǎng))用于交換數(shù)據(jù),在此說明 和/或展示的這些實施方案并不局限于互聯(lián)網(wǎng)或任何特定的基于網(wǎng)絡(luò)的環(huán)境。在至少一個實施方案中,在此披露的一個或多個示例性實施方案的全部或一部分 可被編碼為一種計算機(jī)程序并且由服務(wù)器840、服務(wù)器845、存儲裝置860 (I)-(N)、存儲裝 置870(1)-(N)、存儲裝置890(1)-(N)、或智能存儲陣列895、或它們中的任意組合載入并執(zhí) 行。在此披露的一個或多個示例性實施方案的全部或一部分還可以被編碼成為一種計算機(jī) 程序,它存儲在服務(wù)器840中,由服務(wù)器845來運(yùn)行,并在網(wǎng)絡(luò)850上分發(fā)給客戶系統(tǒng)810、 820、和830。因此,網(wǎng)絡(luò)體系結(jié)構(gòu)800可以獨(dú)自地或與其他元件相結(jié)合地執(zhí)行和/或作為一 種手段來執(zhí)行在此披露的接收、轉(zhuǎn)換、令牌化、創(chuàng)建、存儲、發(fā)送、實現(xiàn)、生成、執(zhí)行、關(guān)聯(lián)、分 類、和/或者標(biāo)引步驟中的一個或多個。網(wǎng)絡(luò)體系結(jié)構(gòu)800還可以被用于執(zhí)行和/或作為 一種手段用于執(zhí)行本披露中提出的其他步驟和特征。雖然以上披露使用了多個具體的框圖、流程圖、以及實例闡明了不同的實施方案, 在此說明和/或展示的每個框圖部件、流程圖步驟、操作、和/或部件都可以單獨(dú)地和/或 共同地使用一個大范圍的硬件、軟件、或者固件(或者它們的任何組合)配置來實施。另外, 在其他部件之中所包括的任何部件的披露都應(yīng)該看作本質(zhì)上是示例性的,因為可以實施許 多其他的體系結(jié)構(gòu)來達(dá)到同樣的功能。在此說明和/或展示的進(jìn)程的參數(shù)以及步驟的順序僅僅是以舉例的方式給出并 且可以按希望來更改。例如,雖然在此展示和/或說明的這些步驟可以按照一個具體的順 序來示出或討論,但這些步驟并非必須按照所展示或者所討論的順序來執(zhí)行。在此說明和 /或展示的不同的示例性方法還可以省略在此說明或展示的一個或者多個步驟或者還可以 包括除所披露的那些之外的額外步驟。雖然不同的實施方案在此已經(jīng)在全功能性計算系統(tǒng)的背景下進(jìn)行了說明和/或 展示,這些示例性實施方案中的一個或者多個能夠以多種形式作為一個程序產(chǎn)品來分發(fā), 而無論實際用于進(jìn)行該分發(fā)的計算機(jī)可讀媒質(zhì)的具體形式如何。在此披露的這些實施方案 還可以通過使用執(zhí)行一些特定任務(wù)的軟件模塊來實施。這些軟件模塊可以包括腳本、成批文件、或者其他可執(zhí)行文件,它們可以存儲在一種計算機(jī)可讀的存儲媒質(zhì)上或者在一種計 算系統(tǒng)中。在一些實施方案中,這些軟件模塊可以將一個計算系統(tǒng)配置用于實施在此披露 的一個或者多個示例性的實施方案。在此說明的這些軟件模塊中的一個或多個可以將數(shù)據(jù)、物理裝置、和/或物理裝 置的表示從一種形式轉(zhuǎn)換到另一種形式。例如,在此說明的這些模塊中的一個或多個可以 通過將標(biāo)引數(shù)據(jù)存儲到一個數(shù)據(jù)存儲裝置中來轉(zhuǎn)換該數(shù)據(jù)存儲裝置的狀態(tài)。已經(jīng)提供了以上說明用于使本領(lǐng)域的其他普通技術(shù)人員能夠最好地使用在此披 露的這些示例性實施方案的不同方面。這種示例性說明并非旨在是窮盡性的或者被限制在 所披露的任何準(zhǔn)確的形式上。許多修改與變更都是可能的而不背離本披露的精神與范圍。 應(yīng)該認(rèn)為在此披露的這些實施方案在所有方面是展示性的而非限制性的。應(yīng)該參考所附權(quán) 利要求及其等效物來確定本披露的范圍。除非另外說明,如在本說明書與權(quán)利要求中所使用的,術(shù)語“一種”或“一個”將被 解釋為“至少一個”的意思。此外,為便于使用,如在本說明書以及權(quán)利要求中所使用的文 字“包含”和“具有”是可以互換的并且具有與文字“包括”相同的含義。
權(quán)利要求
1.一種計算機(jī)實施的方法,該方法用于進(jìn)行數(shù)據(jù)標(biāo)引以供多個應(yīng)用程序使用,該方法 的至少一部分是由一個計算裝置執(zhí)行的,該計算裝置包括至少一個處理器,該方法包括在多個應(yīng)用程序中的一個第一應(yīng)用程序處接收一個數(shù)據(jù)對象; 將該數(shù)據(jù)對象令牌化以便從該數(shù)據(jù)對象中提取多個令牌;創(chuàng)建從該數(shù)據(jù)對象中提取的這些令牌的一個索引,該索引被格式化為供該多個應(yīng)用程 序中的每一個使用;將該索引存儲在該多個應(yīng)用程序可以訪問的一個數(shù)據(jù)庫中, 其中該多個應(yīng)用程序包括兩個或更多個應(yīng)用程序的類型。
2.如權(quán)利要求1所述的方法,其中該數(shù)據(jù)對象包括一種程序?qū)S玫臄?shù)據(jù)對象,該程序?qū)S玫臄?shù)據(jù)對象被配置為被至少一 種程序類型訪問;該方法進(jìn)一步包括將該程序?qū)S玫臄?shù)據(jù)對象轉(zhuǎn)換為一種常用形式的數(shù)據(jù)對象。
3.如權(quán)利要求2所述的方法,其中該常用形式的數(shù)據(jù)對象包括以下至少一項 標(biāo)記語言;純文本。
4.如權(quán)利要求2所述的方法,進(jìn)一步包括 將該常用形式的數(shù)據(jù)對象存儲在該數(shù)據(jù)庫中;從該多個應(yīng)用程序中的一個第二應(yīng)用程序接收對于該常用形式的數(shù)據(jù)對象的一個請求;將該常用形式的數(shù)據(jù)對象發(fā)送到該第二應(yīng)用程序。
5.如權(quán)利要求2所述的方法,進(jìn)一步包括生成以下至少一項 與該程序?qū)S玫臄?shù)據(jù)對象相關(guān)聯(lián)的元數(shù)據(jù);與該程序?qū)S玫臄?shù)據(jù)對象相關(guān)聯(lián)的一個隱藏文件。
6.如權(quán)利要求2所述的方法,進(jìn)一步包括 執(zhí)行該程序?qū)S玫臄?shù)據(jù)對象的一個數(shù)據(jù)分類; 將這些數(shù)據(jù)分類結(jié)果與以下至少一項相關(guān)聯(lián) 該常用形式的數(shù)據(jù)對象;該索引。
7.如權(quán)利要求6所述的方法,其中該第一應(yīng)用程序執(zhí)行以下至少一項 將該程序?qū)S玫臄?shù)據(jù)對象轉(zhuǎn)換為該常用形式的數(shù)據(jù)對象;將該常用形式的數(shù)據(jù)對象令牌化; 創(chuàng)建該索引;執(zhí)行該程序?qū)S玫臄?shù)據(jù)對象的數(shù)據(jù)分類; 在該常用形式的數(shù)據(jù)對象上執(zhí)行語言檢測。
8.如權(quán)利要求6所述的方法,其中該第一應(yīng)用程序指示一個第三應(yīng)用程序執(zhí)行以下至 少一項將該程序?qū)S玫臄?shù)據(jù)對象轉(zhuǎn)換為該常用形式的數(shù)據(jù)對象; 將該常用形式的數(shù)據(jù)對象令牌化; 創(chuàng)建該索引;執(zhí)行該程序?qū)S玫臄?shù)據(jù)對象的數(shù)據(jù)分類; 在該常用形式的數(shù)據(jù)對象上執(zhí)行語言檢測。
9.如權(quán)利要求1所述的方法,進(jìn)一步包括執(zhí)行以下至少一項 該數(shù)據(jù)對象上的語言檢測;該數(shù)據(jù)對象上的模式檢測; 該數(shù)據(jù)對象上的實體提取。
10.如權(quán)利要求1所述的方法,進(jìn)一步包括從該多個應(yīng)用程序中的一個第二應(yīng)用程序接收對于該索引的一個請求; 允許該第二應(yīng)用程序訪問該索引。
11.如權(quán)利要求1所述的方法,其中該多個應(yīng)用程序的類型包括以下兩項或更多項 一個搜索引擎;一個歸檔應(yīng)用程序; 一個防止數(shù)據(jù)丟失應(yīng)用程序; 一個垃圾郵件過濾應(yīng)用程序; 一個防病毒應(yīng)用程序; 一個備份應(yīng)用程序; 一個內(nèi)容管理應(yīng)用程序; 一個遵守法律應(yīng)用程序; 一個電子采證應(yīng)用程序。
12.—種計算機(jī)實施的方法,該方法用于進(jìn)行數(shù)據(jù)標(biāo)引以供多個應(yīng)用程序使用,該方法 的至少一部分由一個計算裝置執(zhí)行,該計算裝置包括至少一個處理器,該方法包括在多個應(yīng)用程序中的一個第一應(yīng)用程序處接收一個數(shù)據(jù)對象; 將該數(shù)據(jù)對象令牌化以便從該數(shù)據(jù)對象中提取多個令牌;創(chuàng)建從該數(shù)據(jù)對象中提取的這些令牌的一個對象索引,該對象索引被格式化為由該多 個應(yīng)用程序中的每一個使用;將該對象索引存儲在包括與多個數(shù)據(jù)對象相關(guān)聯(lián)的標(biāo)引信息的一個主索引中,該主 索引是該多個應(yīng)用程序可以訪問的,其中該多個應(yīng)用程序包括兩個或更多個應(yīng)用程序的類 型。
13.如權(quán)利要求12所述的方法,其中該主索引包括從該多個應(yīng)用程序中的兩個或更多 個接收的多個對象索引。
14.一種用于進(jìn)行數(shù)據(jù)標(biāo)引以供多個應(yīng)用程序使用的系統(tǒng),該系統(tǒng)包括一個通信模塊,該通信模塊被編程為在多個應(yīng)用程序中的一個第一應(yīng)用程序處接收一 個數(shù)據(jù)對象;一個令牌化模塊,該令牌化模塊被編程為將該數(shù)據(jù)對象令牌化以便從該數(shù)據(jù)對象中提 取多個令牌;一個標(biāo)引模塊,該標(biāo)引模塊被編程為創(chuàng)建從該數(shù)據(jù)對象中提取的這些令牌的一個索 引,該索引被格式化為由該多個應(yīng)用程序中的每一個使用;一個數(shù)據(jù)庫,該數(shù)據(jù)庫存儲該索引,其中該數(shù)據(jù)庫是該多個應(yīng)用程序可以訪問的,并且 該多個應(yīng)用程序包括兩個或更多個應(yīng)用程序的類型。
15.如權(quán)利要求14所述的系統(tǒng),其中該數(shù)據(jù)對象包括一個程序?qū)S玫臄?shù)據(jù)對象,該程 序?qū)S玫臄?shù)據(jù)對象被配置為由至少一種程序類型訪問,該系統(tǒng)進(jìn)一步包括一個轉(zhuǎn)換模塊,該轉(zhuǎn)換模塊被編程為將該程序?qū)S玫臄?shù)據(jù)對象轉(zhuǎn)換為一個常用形式的 數(shù)據(jù)對象;一個語言檢測模塊,該語言檢測模塊被編程為在該常用形式的數(shù)據(jù)對象上執(zhí)行語言檢測;一個分類模塊,該分類模塊被編程為執(zhí)行該程序?qū)S玫臄?shù)據(jù)對象的數(shù)據(jù)分類; 一個安全模塊,該安全模塊被編程為將數(shù)據(jù)訪問限于授權(quán)的應(yīng)用程序。
全文摘要
一種用于進(jìn)行數(shù)據(jù)標(biāo)引以供多個應(yīng)用程序使用的計算機(jī)實施的方法可以包括在多個應(yīng)用程序中的一個第一應(yīng)用程序處接收一個數(shù)據(jù)對象。該方法可以包括將常用形式的數(shù)據(jù)對象令牌化以便從該數(shù)據(jù)對象中提取多個令牌,并且創(chuàng)建從該數(shù)據(jù)對象中提取的這些令牌的一個索引,將該索引格式化為被該多個應(yīng)用程序中的每一個使用。該方法可以進(jìn)一步包括將該索引存儲在一個數(shù)據(jù)庫中,該數(shù)據(jù)庫可以被該多個應(yīng)用程序訪問。該多個應(yīng)用程序可以包括兩個或更多個應(yīng)用程序的類型。在此還披露了其他不同的方法以及系統(tǒng)。
文檔編號G06F17/30GK102054022SQ20101053665
公開日2011年5月11日 申請日期2010年11月5日 優(yōu)先權(quán)日2009年11月6日
發(fā)明者E·蘇亞雷斯, R·斯特靈厄姆 申請人:賽門鐵克公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
南汇区| 淮南市| 榆中县| 珲春市| 容城县| 化州市| 镇沅| 梅河口市| 凤山市| 辽阳市| 军事| 和静县| 乌兰察布市| 金川县| 饶平县| 儋州市| 江阴市| 呼玛县| 靖州| 巩义市| 郯城县| 大足县| 罗平县| 河南省| 攀枝花市| 博罗县| 山阳县| 丽江市| 永兴县| 铜山县| 泰州市| 旺苍县| 中方县| 岑巩县| 娄烦县| 普兰县| 磐安县| 同心县| 巫山县| 鄯善县| 普宁市|