欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

使用記錄、鍵和/或數(shù)據(jù)字段值的重復(fù)解釋數(shù)據(jù)集合的制作方法

文檔序號:6350196閱讀:208來源:國知局
專利名稱:使用記錄、鍵和/或數(shù)據(jù)字段值的重復(fù)解釋數(shù)據(jù)集合的制作方法
技術(shù)領(lǐng)域
本描述涉及數(shù)據(jù)集合。
背景技術(shù)
例如,典型關(guān)系數(shù)據(jù)庫的表表示記錄的數(shù)據(jù)集合。每條記錄具有已經(jīng)針對該表所定義的字段中的數(shù)據(jù)值。每個字段針對該字段所表示的屬性可以具有最多一個值。該表具有將記錄與另ー記錄明確區(qū)分的唯一鍵(unique key)。數(shù)據(jù)庫中表的關(guān)系在正常情況下是事先定義的,并且所有數(shù)據(jù)和表以共同共享的本地格式表示。除了執(zhí)行數(shù)據(jù)庫中的事務(wù)之外,用戶通常能夠通過數(shù)據(jù)庫應(yīng)用所提供的界面觀看每個表的記錄,以及相關(guān)表中所包含的數(shù)據(jù)組合。有時,企業(yè)的相關(guān)數(shù)據(jù)并沒有保存在預(yù)先定義的嚴(yán)格規(guī)范(well-disciplined) 的數(shù)據(jù)庫中,而是被生成為可能具有不同的不相關(guān)格式的單獨文件、數(shù)據(jù)集合或數(shù)據(jù)流。雖然這些源中每ー個的數(shù)據(jù)可以被構(gòu)建為記錄,但是例如,從記錄到字段的界定可能并沒有在源內(nèi)定義。有時,雖然相關(guān),但是不同源中的數(shù)據(jù)可能是不一致或重復(fù)的。于2009年3月31日授權(quán)的與本專利申請同屬一家公司的美國專利7512610描述了一種對源文件、數(shù)據(jù)流或數(shù)據(jù)集合進(jìn)行處理,使其數(shù)據(jù)可以作為能夠由用戶操作和分析的記錄而被可輕易訪問和可觀看的方式,其全文通過引用結(jié)合于此。

發(fā)明內(nèi)容
總體上,在ー個方面,存在兩個或更多的數(shù)據(jù)集合。所述數(shù)據(jù)集合中的每ー個包含可以被解釋為記錄的數(shù)據(jù),每條記錄具有數(shù)據(jù)字段的數(shù)據(jù)值。所述數(shù)據(jù)集合中的每ー個包含至少ー些與其它數(shù)據(jù)集合中的至少ー個中的數(shù)據(jù)相關(guān)的數(shù)據(jù)。所述數(shù)據(jù)集合中的不同數(shù)據(jù)集合中的數(shù)據(jù)可以不同地組織或表達(dá)。所述數(shù)據(jù)集合中的每ー個容許針對數(shù)據(jù)集合的記錄定義鍵。數(shù)據(jù)集合的特征在于(a)記錄、(b)鍵的部分或(C)數(shù)據(jù)字段的值實例中至少 ー個的重復(fù)。向用戶提供關(guān)于所述重復(fù)的至少ー個的信息。實施方式的特征可以在于以下ー個或多個特征。所述數(shù)據(jù)集合中的至少ー個包括具有文件格式的文件。所述數(shù)據(jù)集合中的至少兩個包括具有不同文件格式的文件。從用戶接收關(guān)于所述數(shù)據(jù)集合中的至少ー個的數(shù)據(jù)可以被解釋為記錄的方式的信息,每條記錄均具有數(shù)據(jù)字段的數(shù)據(jù)值。從用戶接收能夠根據(jù)其確定所述數(shù)據(jù)集合中的每ー個的鍵的信息。所述數(shù)據(jù)集合中的一個的鍵具有與所述數(shù)據(jù)集合中的另ー個的鍵的定義的層級關(guān)系。 記錄的重復(fù)包括所述數(shù)據(jù)集合中的ー個中的重復(fù)記錄。鍵的部分的重復(fù)包括所述數(shù)據(jù)集合中的一個中的鍵值對應(yīng)于所述數(shù)據(jù)集合中的另ー個的鍵的部分的兩個不同值。數(shù)據(jù)字段的值實例的重復(fù)包括兩個或更多值實例被包括在給定字段中。用戶能夠?qū)λ鰯?shù)據(jù)集合中的至少ー個的記錄的值執(zhí)行標(biāo)記、取消標(biāo)記、過濾、取消過濾和頻率分析中的至少ー種。向用戶提供信息包括顯示該信息。顯示包括顯示所述數(shù)據(jù)集合的記錄、所述記錄的字段的標(biāo)識以及數(shù)據(jù)集合中重復(fù)的指示。顯示關(guān)于重復(fù)的信息包括顯示數(shù)據(jù)字段的重復(fù)值實例。顯示關(guān)于重復(fù)的信息包括指明數(shù)據(jù)集合中存在重復(fù)記錄。顯示關(guān)于重復(fù)的信息包括指明鍵的一部分存在重復(fù)。向用戶提供信息包括使用戶能夠創(chuàng)建包括所述數(shù)據(jù)集合的數(shù)據(jù)以及關(guān)于重復(fù)的信息的記錄的綜合文件(integrated file)。該綜合文件包含受鍵約束的記錄。該綜合文件的鍵包括數(shù)據(jù)集合的字段的層級串聯(lián)。重復(fù)數(shù)據(jù)值包括在該綜合文件的記錄的給定字段中。該綜合文件的記錄被顯示給用戶。顯示該綜合文件中的數(shù)據(jù)的視圖,該數(shù)據(jù)對應(yīng)于所述數(shù)據(jù)集合中的數(shù)據(jù),該綜合文件根據(jù)該數(shù)據(jù)集合的數(shù)據(jù)創(chuàng)建。權(quán)利要求的方法還使用戶能夠?qū)λ鰯?shù)據(jù)集合中的至少ー個的記錄的值執(zhí)行標(biāo)記、取消標(biāo)記、過濾、取消過濾和頻率分析中的至少ー種。使用戶能夠?qū)υ摼C合文件的記錄的值執(zhí)行標(biāo)記、取消標(biāo)記、過濾、取消過濾和頻率分析中的至少ー種,該標(biāo)記、取消標(biāo)記、過濾和頻率分析被自動應(yīng)用于數(shù)據(jù)的其它視圖??傮w上,在ー個方面,接收包含能夠被解釋為記錄的數(shù)據(jù)的數(shù)據(jù)集合,每條記錄均具有數(shù)據(jù)字段的數(shù)據(jù)值。該數(shù)據(jù)集合的特征在于數(shù)據(jù)字段中的至少ー個的值實例的任意數(shù)目的重復(fù)。關(guān)于至少ー個重復(fù)的信息被提供給用戶。該數(shù)據(jù)集合包括具有文件格式的文件。 從用戶接收關(guān)于該數(shù)據(jù)集合的數(shù)據(jù)可以被解釋為記錄的方式的信息,每條記錄均具有數(shù)據(jù)字段的數(shù)據(jù)值。從用戶接收能夠根據(jù)其確定該數(shù)據(jù)集合的鍵的信息。該用戶能夠?qū)υ摂?shù)據(jù)集合的記錄的值執(zhí)行標(biāo)記、取消標(biāo)記、過濾、取消過濾和頻率分析。向用戶提供信息包括顯示該信息。顯示包括顯示該數(shù)據(jù)集合的記錄、該記錄的字段的標(biāo)識以及數(shù)據(jù)集合中的重復(fù)的指示。顯示關(guān)于重復(fù)的信息包括顯示數(shù)據(jù)字段的重復(fù)值實例。總體上,在ー個方面,一種介質(zhì)承載數(shù)據(jù)記錄和所述記錄的鍵的綜合文件。每條記錄包含至少ー個數(shù)據(jù)字段的至少ー個數(shù)據(jù)值。該數(shù)據(jù)記錄包含表示至少兩個數(shù)據(jù)集合的數(shù)據(jù)的信息。所述數(shù)據(jù)集合中的每ー個包含能夠被解釋為記錄的數(shù)據(jù),每條記錄均具有數(shù)據(jù)字段的數(shù)據(jù)值。所述數(shù)據(jù)集合中的每ー個包含至少ー些與其它數(shù)據(jù)集合中的至少ー個的數(shù)據(jù)相關(guān)的數(shù)據(jù)。所述數(shù)據(jù)集合中的不同數(shù)據(jù)集合中的數(shù)據(jù)可能以不同方式組織或表達(dá)。所述數(shù)據(jù)集合中的每ー個容許針對該數(shù)據(jù)集合的記錄定義鍵。所述數(shù)據(jù)集合的特征在于(a) 記錄、(b)部分鍵或(C)數(shù)據(jù)字段的值實例中的至少ー個的重復(fù)。該綜合文件包括識別所述重復(fù)的信息。這些和其它方面及特征以及它們的組合可以表達(dá)為方法、過程、裝置、程序產(chǎn)品、 數(shù)據(jù)庫、經(jīng)營方法、系統(tǒng)、用于執(zhí)行功能的手段,以及其它方式。根據(jù)以下描述和權(quán)利要求,其它的優(yōu)勢和特征將是顯而易見的。


圖I是框圖。圖2至14是截屏。
具體實施例方式如圖I所示,我們在這里描述了處理12諸如(但并不限于)平面文件、MS*、MQ、 ODBC和XML的獨立的數(shù)據(jù)集合、文件或數(shù)據(jù)流10(源)的方式。數(shù)據(jù)源可以(a)包含相關(guān)數(shù)據(jù),(b)具有不同的組織方案和格式,并且(c)包括重復(fù)數(shù)據(jù)。這里所描述的處理使用戶14能夠通過用戶界面16對數(shù)據(jù)顯示進(jìn)行訪問、顯示、分析和操作。在一些實施方式中,至少 ー些處理基于由用戶提供的關(guān)于數(shù)據(jù)源的信息完成。在一些情況下,該處理提供了對數(shù)據(jù)源自身的記錄中的數(shù)據(jù)的訪問、顯示、分析和操作。在一些實施方式中,綜合文件18根據(jù)源文件創(chuàng)建并且為用戶提供了額外的訪問、顯示、分析和操作能力。所述特征可以在不需要用戶進(jìn)行編程或改編的情況下提供。這里所描述的至少ー些特征的實施方式和其它實施方式在可從威斯康辛州麥迪遜的MioSoft公司獲得的被稱作Business Data Tooltm的商業(yè)產(chǎn)品中找到。該產(chǎn)品及其手冊和描述通過引用結(jié)合于此。作為待處理的數(shù)據(jù)源的ー個示例,考慮三個單獨但相關(guān)的數(shù)據(jù)集合(在這種情況下,包含在三個數(shù)據(jù)文件中),其中至少ー些分別在圖2、圖3和圖4中示出。三個源數(shù)據(jù)文件的記錄分別包含關(guān)于特定計算機課程的課段教員、每門課程的名稱以及注冊了課程的學(xué)生的信息。當(dāng)數(shù)據(jù)集合以預(yù)先定義的文件格式(諸如.tXt或.CSV)表達(dá)時,有時我們將該數(shù)據(jù)集合稱作文件。但是我們在這里所描述的技術(shù)寬泛地可應(yīng)用于數(shù)據(jù)能夠在其中被構(gòu)建為記錄的任意類型的數(shù)據(jù)集合、文件或數(shù)據(jù)流。在一些情況下,記錄的定界符(delimiter) 在數(shù)據(jù)源中預(yù)先定義。在其它情況下,記錄及其定界符在具有或沒有用戶協(xié)助的情況下從數(shù)據(jù)源推斷出來。我們有時以非常寬泛的含義可互換地使用文件和數(shù)據(jù)集合(和其它術(shù)語)這些詞語,以包括任意類型、源、格式、長度、大小、內(nèi)容或其它特征的數(shù)據(jù)的任意集合。數(shù)據(jù)集合可以為組織的數(shù)據(jù)陣列或未組織數(shù)據(jù)的流(或二者的組合),其能夠被解析或分析以推斷出所謂的記錄以及記錄的定界符。我們意在使短語“數(shù)據(jù)集合的記錄”非常寬泛地包括該數(shù)據(jù)集合的任意數(shù)據(jù)群組,該數(shù)據(jù)群組包含與該數(shù)據(jù)集合的字段相關(guān)聯(lián)的屬性的ー個或多個值。在該示例中,圖2示出了名為sessions, txt的純文本文件的數(shù)據(jù)。該文件可以被解讀為包括記錄50,其中每條記錄在字段54中包括ー個值52,該字段54表示課程編號(例如69. 102)和該課程的課段字母(諸如a或b,其例如可以對應(yīng)于第一課段和第二課段或者單個課段中給定的課程的兩個不同分段)的組合。第二字段58中的每條記錄的第二值56 表示教員的姓名(例如,Chris Schulze)。名為courses, csv并且在圖3中示出的第二文件以逗號分隔變量(.csv)格式表達(dá)并且具有記錄60,每條記錄60包括在一個字段62中標(biāo)識課程編號的值61以及在第二字段64中表示課程名稱的相應(yīng)值63。例如,課程69. 102具有名稱Data Migrator (數(shù)據(jù)遷移器)。名為students_with_addresses. csv并且在圖4中不出的第三文件也以.csv格式表達(dá)。其許多字段(圖4中并未全部示出)包含值,除其它之外,所述值包括標(biāo)識每個學(xué)生的編號70的值69 (A欄)、名字72的值(B欄)、姓氏74的值(C欄)、以波浪字符分隔的一個或多個地址76’ 78的值(D欄)、課程課段的標(biāo)識符80的值(E欄),以及課程編號的值 (H欄,未不出)。三個源文件包含相關(guān)信息。例如,課程編號在所有三個文件中使用。并且課段標(biāo)識符(a 或 b)在 sessions, txt 和 students_with_addresses. csv 文件中使用。然而,出現(xiàn)在三個文件中的一些類型的信息之間的關(guān)系,特別是信息重復(fù)的屬性和數(shù)量,通過觀看這三個單獨的文件并不容易理解。這里,除其它之外,我們描述了這樣的工具該工具使用戶能夠在不進(jìn)行任何編程或改編或者對三個文件中包含信息之間的所有關(guān)系進(jìn)行詳細(xì)分析的情況下,使該三個文件被分析并且使其記錄以使用戶能夠理解三個文件中出現(xiàn)的信息重復(fù)的屬性和數(shù)量的方式
iU>/jN。雖然該示例中示出的三個文件僅包含相對少量的記錄,但是相同的方法可以被應(yīng)用于包含非常大量的記錄(數(shù)百萬或者甚至數(shù)十億)并且取自廣泛分布的源的文件,所述源包括可能并不完全處于相同一方控制之下的源。不同文件或記錄的集合可以以完全不同的文件格式表達(dá),或者在一些情況下沒有任何正式文件格式。我們首先描述分析并顯示關(guān)于每個文件的重復(fù)信息(除其它之外)并且使用戶能夠通過調(diào)用用戶界面的簡單特征對文件記錄的屬性進(jìn)行快速觀察和導(dǎo)航的工具。用戶界面 16的示例在圖5中示出。圖5表示了在(a)三個源數(shù)據(jù)文件92、94、96已經(jīng)由用戶導(dǎo)入軟件應(yīng)用,(b)每個文件已經(jīng)被解析為字段98 (借助用戶的協(xié)助,其例如能夠標(biāo)識出字段之間的定界符),并且已經(jīng)由用戶在鍵框102中標(biāo)識出文件的鍵100之后的用戶界面(這里被編號為90)和軟件應(yīng)用12(圖I)的狀態(tài)。文件A的記錄現(xiàn)在顯示在圖5中。三個導(dǎo)入的文件在窗格104中列出。文件之后的**注記指示在其被高亮和點擊時,該界面中示出的記錄是該文件的記錄。(在隨后討論的ー些情況下,在條目之后的窗格中缺少**注記指示當(dāng)該條目被調(diào)用時,該界面中示出的信息是文件中包含數(shù)據(jù)的視圖,但是并不是其本身直接取自現(xiàn)有文件。)在文件名或窗格中的其它條目上進(jìn)行點擊使其記錄顯示在可滾動的記錄窗格106中。圖5(和其它附圖)中圖示的用戶界面包括顯示特征、菜單項、分析工具以及在美國專利7512610中更為詳細(xì)描述和示出的其它功能,該專利的全部內(nèi)容通過引用結(jié)合于此。在窗格104中,在每個文件或其它條目的名稱之后的,示出了該文件的鍵105及其與至少ー個其它文件的其它鍵的關(guān)系。當(dāng)每個文件被導(dǎo)入并解析時,對其字段給出標(biāo)識符, 該標(biāo)識符跨所有三個文件是唯一的。例如,在該示例中,文件Courses被標(biāo)識為文件A并且其兩個字段被標(biāo)記為Al和A2。在許多情況下,所述字段的解析能夠基于數(shù)據(jù)源中包含的信息自動完成。在其它情況下,用戶參與字段及其定界符的標(biāo)識。文件的鍵可以是如用戶標(biāo)識的該文件的ー個或多個字段。例如,用戶在這里已經(jīng)標(biāo)識了唯一的課程編號Al欄作為文件A的鍵,這反映為出現(xiàn)標(biāo)題為[key](鍵)的左側(cè)欄。如圖6所示,文件B Sessions (課段)的鍵已經(jīng)由用戶在框102中標(biāo)識為B I欄 (課程編號)和B2欄(課段字母)的“串聯(lián)”。對于文件B,課程編號(BI欄)不能単獨用作鍵,原因在于可以有兩個承載給定課程編號的記錄,每個課段或分段ー個。通過將課段字母(B2欄)與BI欄“串聯(lián)”,可以形成唯一的鍵。這里,當(dāng)我們提到串聯(lián)時,意思是例如根據(jù)這兩個欄中的數(shù)據(jù)形成ー個2元組。因此,BI欄中的“X”和B2欄中的“YZ”將產(chǎn)生不同于 B I欄中的“XY”和B2欄中的“Z”的復(fù)合鍵。文件B的串聯(lián)鍵(BI,B2)與文件A的鍵(Al)相關(guān)。該關(guān)系105在窗格104中示出并且由注記B2,BI =Al表示。該注記表達(dá)了鍵BI與鍵Al相同,并且文件B中的鍵BI具有相同值但是B2具有不同值的記錄可能重復(fù)的事實。實際上,B1、B2是層級鍵。我們將這種層級布置稱作鍵級的重復(fù)。鍵級的重復(fù)是一起取得的三個文件的結(jié)構(gòu)特征(但是通過觀看文件A并不是顯而易見的并且通過觀看文件C也不一定是輕易顯而易見的)。用戶通過在文件B的鍵框102中輸入來向該應(yīng)用指示BI,B2到Al的關(guān)系。在圖7A和7B中,不出了 students_with_addressed文件C。在該文件中,欄C8 (課程編號)、C9(課段字母)和Cl(學(xué)生ID)的串聯(lián)產(chǎn)生了唯一的三級層級鍵。顯然,CS和C9 與文件B中的BI和B2相同,從而鍵110的關(guān)系可以表示為C8,C9,Cl = BI, B2以指示C8 和C9分別與BI和B2相同,并且該串聯(lián)鍵中的每個課程編號和課段字母的組合也可能重復(fù),原因在于多個學(xué)生通常針對給定課程的給定課段進(jìn)行注冊。在文件C的字段C4中,對于ー些記錄120存在學(xué)生的街道地址的實例的重復(fù)122、 124,并且對于該示例中的其它地址欄也可能出現(xiàn)這樣的重復(fù)。我們將這稱作字段級的重復(fù)。在源數(shù)據(jù)集合中,還可能具有鍵相同的復(fù)制記錄(duplicate records)。例如,在文件C中,承載相同鍵的兩條記錄可以在所有字段中都具有相同的值(雖然在圖7A和7B 中沒有示出這樣的示例)。我們將之稱作記錄級的重復(fù)。類似地,文件B可能包含具有相同鍵的多條記錄,可能指示由多個教員所教授的課程和課段(非尋常的安排)。文件C和B通過其鍵而不是其記錄相關(guān),所以不應(yīng)當(dāng)認(rèn)為C記錄具有父B記錄(或多個),相反,應(yīng)認(rèn)為C 記錄具有C鍵,該C鍵具有父B鍵,并且B記錄也具有B鍵。當(dāng)數(shù)據(jù)集合已經(jīng)被導(dǎo)入并且解析為字段和記錄,并且顯示該記錄、字段和值時,在該記錄的字段關(guān)系的首部(header)窗格127 (位于記錄窗格之上)中具有層級指示。最上方的首部129跨越所有字段并且表示整條記錄。直接處于所顯示記錄上方的級131的首部標(biāo)識每個字段。每個中間的首部級層級地示出在其下方的首部群組。數(shù)據(jù)集合的重復(fù)結(jié)構(gòu)在用戶界面中指示給用戶。如之前所提到的,鍵級的重復(fù)在窗格104以及鍵框102中聲明(call out)。鍵級的重復(fù)通過在鍵首部中顯示單詞 “repeat (重復(fù))”標(biāo)識。例如,取決于課段字母而可能出現(xiàn)的(文件A的)課程編號鍵Al 由出現(xiàn)在串聯(lián)鍵欄的首部中的單詞key 118(鍵)之后的單詞i^peat 116(重復(fù))指示。該注記向用戶指示課程編號為鍵,但是該鍵對于不同課段可能重復(fù)并且BI,B2 一起形成唯一鍵。在圖7A和7B中,字段級的重復(fù)由C4欄的首部中的單詞Rpeat 117指示,這告訴觀看者對于給定學(xué)生會存在重復(fù)的街道、城市和州地址字段的實例。(跨越所有字段的)頂層首部中的單詞repeat 119是指記錄級重復(fù)的可能性,向觀看者指示了文件C的整條記錄都可能重復(fù)。也就是說,給定學(xué)生可能在給定課程的給定課段中進(jìn)行了不止一次注冊。重復(fù)結(jié)構(gòu)還通過圖5、6、7A和7B中所示記錄中值周圍的括號組指示。例如,在圖6 中,在每個記錄的B I欄中,課程編號的值被包含在括號中以指示在文件B中可以存在課程編號的鍵級的重復(fù)(例如,因為給定課程可能有兩個課段)。在圖7中,C2欄中的值每個均被三組括號包圍,以指示學(xué)生名字的三種可能重復(fù)的情形(I)由關(guān)系BI,B2 = Al暗示的鍵級的重復(fù)(圖6中的117),其指示一門課程可能有多個課段,(2)關(guān)系CS,C9,Cl = BI, B2表示的第二鍵級的重復(fù)116,其指示一個課段中可以招收多個學(xué)生,以及(3)可能允許文件C中的多條學(xué)生記錄具有相同鍵(C8,C9,C1)的記錄級的重復(fù)119。在串聯(lián)欄C4~中,每條記錄中的每個值還攜帶第四組括號以指示可能存在字段級的重復(fù),這是因為每條記錄可以包括多于ー個的學(xué)生地址實例。因此,圖4至圖7(和相關(guān)應(yīng)用)中圖示的界面使用戶能夠?qū)雴为毜臄?shù)據(jù)集合 (例如,包含在潛在地具有不同文件格式或沒有文件格式的文件中,或者不包含在正式文件中),使該數(shù)據(jù)集合的記錄的字段得以被解析,并且標(biāo)識可能包含相關(guān)數(shù)據(jù)的單獨文件之間的鍵和鍵關(guān)系。該應(yīng)用基于鍵對數(shù)據(jù)集合進(jìn)行分析并且在任意數(shù)據(jù)集合的記錄的顯示中向用戶指示至少三個級鍵級、字段級和記錄級中存在的重復(fù)。該應(yīng)用并不形成任何新的文件,并且并不跨數(shù)據(jù)集合合并或結(jié)合數(shù)據(jù)。然而,該應(yīng)用向用戶掲示了每個數(shù)據(jù)集合的字段和記錄以及重復(fù)。該應(yīng)用確定了如何以及在何處通過“重復(fù)”命令而使用用戶提供的信息向顯示的記錄和首部中放置重復(fù)信息。該“重復(fù)”(可通過在首部上右鍵點擊并選擇解析隨后選擇重復(fù)而獲得)被用來規(guī)定首部中的哪些要素反映了重復(fù)的數(shù)據(jù)。在該示例中,在數(shù)據(jù)頁面B 上,存在關(guān)于鍵的重復(fù)指示,原因在于該數(shù)據(jù)可以具有關(guān)于A的鍵級的重復(fù),該事實已經(jīng)由用戶利用重復(fù)命令向應(yīng)用指示。無論記錄的字段中何處出現(xiàn)重復(fù),顯示的記錄數(shù)據(jù)都將包括至少ー組括號。嵌套示出的父/子括號指示重復(fù)的嵌套。在記錄的字段中的數(shù)據(jù)實際重復(fù)時使用并排示出而并非嵌套示出的同胞(sibling)括號。在首部和記錄的顯示中,括號基于用戶在“父”文件中定義的鍵重復(fù)而由應(yīng)用給出?!癧r印eat*] ”注記指示用戶已經(jīng)明確告知該應(yīng)用以預(yù)期(并提取)重復(fù)數(shù)據(jù)的每個地方,該重復(fù)數(shù)據(jù)為鍵、記錄或字段級。如果用戶并沒有規(guī)定重復(fù),則不示出括號。然而,由于在觀看期間沒有發(fā)生記錄間的處理,所以仍然示出所有記錄。顯示“ [^peat*] ”注記示出了用戶已經(jīng)請求應(yīng)用以預(yù)期重復(fù)數(shù)據(jù)的位置,而無論該重復(fù)數(shù)據(jù)是鍵、記錄或字段級。括號是應(yīng)用進(jìn)行的有多少重復(fù)處于該文件的格式等級分解以及文件的鍵空間和鍵空間祖先(ancestry)中的元素“之上”的指示。出于性能的原因, 該應(yīng)用通常并不在觀看普通文件時結(jié)合來自多條記錄的信息,從而沒有如實給出鍵級和記錄級的重復(fù)。括號仍然作為聲明的重復(fù)的剩余內(nèi)容而被包括,但是它們一直表現(xiàn)為單數(shù),這是因為在每一行中示出了正好來自一條記錄的信息。字段級的重復(fù)將可靠的重復(fù)信息示出為零或多個帶括號串的序列(例如,“ (foo) (bar) ”)。為了便利,該應(yīng)用使用暗的水平的分隔線在視覺上指示了具有相同父鍵的連續(xù)記錄。例如,在圖6中,線條119分隔記錄69. 208a與記錄69. 208b。由于兩條記錄的父鍵為 69. 208 (即,正好為BI欄),則實線分隔線121、123協(xié)助形成相關(guān)記錄的視覺組。當(dāng)連續(xù)記錄具有相同鍵(例如,BI和B2相同)時,使用更暗的分隔線,提供關(guān)于記錄分組的兩個級的信息。此外,使用該應(yīng)用的特征,用戶能夠?qū)?shù)據(jù)集合的記錄過濾、標(biāo)記并且執(zhí)行頻率分析和其它分析操作,這提供了對數(shù)據(jù)屬性的額外見識。許多操作在之前所引用的專利中了解釋。除其它之外,用戶能夠?qū)τ扇我馐撞吭谑撞繉蛹壍娜我獾燃壉硎镜牟糠謹(jǐn)?shù)據(jù)記錄執(zhí)行分析。例如,通過在文件C的記錄顯示的首部C4street (街道)120上右鍵點擊,并且選擇analysis (分析)選項并接著從出現(xiàn)的彈出菜單中選擇analyze column (分析欄)選項,用戶能夠使應(yīng)用在該欄中執(zhí)行數(shù)據(jù)分析并且例如在圖8所示的窗ロ 150中顯示分析結(jié)果。在圖8中,窗格152顯示了關(guān)于數(shù)據(jù)集合的記錄中的欄street的值的數(shù)據(jù)。窗格 154示出了關(guān)于street的各個值的出現(xiàn)頻率的信息。并且第三窗格156示出了窗格156的頻率的元頻率。例如,雖然文件C僅包含174條記錄,但是顯示窗格152示出了不同值的計數(shù)125 為295條不同街道。這反映了街道地址的實例可以在給定記錄的C4欄中重復(fù)(在該示例中就為重復(fù))的事實。窗格154以頻率降序列出了每個街道地址在文件中的出現(xiàn)頻率,包括出現(xiàn)數(shù)目, 該數(shù)目表示的出現(xiàn)百分比以及相關(guān)聯(lián)的街道值。例如,窗格154中的第一條目127指示街道地址10300W. Bluemound Rd. ,Apt. 310在文件C中出現(xiàn)了四次,其是該文件中街道地址出現(xiàn)總數(shù)的I. 149%。在窗格156中,(以降序)示出了窗格154中出現(xiàn)的給定頻率的次數(shù)的數(shù)目以及那些出現(xiàn)表示的地址出現(xiàn)總數(shù)目,和該出現(xiàn)數(shù)目表示的總出現(xiàn)的百分比。例如,窗格156中的第一條目指示文件C中出現(xiàn)四次的街道地址乘以這樣的地址的數(shù)目(在該情況下為2)等于8,這對應(yīng)于該文件中所有街道地址出現(xiàn)的2. 299%。另ー方面,該窗格中最后 ー個條目指示有250或71. 839%的記錄在該文件中僅出現(xiàn)一次??梢赃M(jìn)行類似的分析并且針對任意文件的任意欄顯示。在觀看圖8時,如果用戶的興趣在于僅看到窗格154中的一行表示的記錄,則用戶可以在該條目上雙擊。作為響應(yīng),文件C的記錄顯示變?yōu)閮H示出包含窗格154中的該行表示的地址的記錄。通過回顧那些顯示的記錄,用戶能夠推斷并理解關(guān)于文件中該記錄的信息以及在什么情況下出現(xiàn)重復(fù)。用戶能夠在顯示該數(shù)據(jù)集合的記錄的同時通過重復(fù)該過程而學(xué)習(xí)每個數(shù)據(jù)集合的數(shù)據(jù)值、重復(fù)、頻率和其它信息。在圖示的用戶界面中,用戶能夠得出對三個不同文件中的數(shù)據(jù)之間的關(guān)系的理解。例如,在圖6中,用戶能夠在標(biāo)題B3instructor (教員)上右鍵點擊,接著選擇選項 analysis以及彈出菜單中的analyze column。接著顯示出那些記錄中教員的頻率信息(但是在這里沒有示出)。通過在示出教員是Chris Schulze的兩條記錄的條目上進(jìn)行雙擊,記錄窗格被更新為僅示出那兩條記錄。通過在mark (標(biāo)記)框140中進(jìn)行點擊,那兩條記錄都被標(biāo)記。接下來,用戶能夠通過切換到Course文件A的顯示,在窗格104中的文件A上進(jìn)行右鍵點擊,調(diào)用mark across join(聯(lián)合標(biāo)記)選項,接著選擇文件B作為標(biāo)記源來調(diào)用聯(lián)合標(biāo)記(mark-across-join)特征。這使在Schulze教授的兩門課程記錄Data Migrator 和Context Server的記錄窗格中進(jìn)行標(biāo)記。用戶可以通過在文件B的記錄顯示中標(biāo)記Data Migrator課程的記錄,將顯示切換到文件C,在窗格中104的文件C上右鍵點擊,選擇mark across join選項并且選擇文件 C作為標(biāo)記源來重復(fù)該過程。文件C的記錄顯示接著將文件C的參與了 Chris Schulze教授課程的學(xué)生的標(biāo)記記錄示出為已標(biāo)記。接著通過在filter (過濾)按鈕上點擊,用戶僅被示出Chris Schulze教授課程的那些記錄。為了概括至此描述的ー些特定示例,用戶能夠?qū)刖哂邢嚓P(guān)數(shù)據(jù)并且具有不同文件格式且來自不同源的文件。如果有必要,用戶能夠規(guī)定每個文件的記錄和字段定界符,以及每個文件的鍵和鍵關(guān)系。該文件可以在三個級鍵級、記錄級和字段級中的每ー個具有數(shù)據(jù)重復(fù)。該工具可以指示重復(fù)級的存在。此外,使用該應(yīng)用的標(biāo)記、過濾和聯(lián)合標(biāo)記特征,用戶能夠理解三個文件中數(shù)據(jù)元素之間的關(guān)系。然而,前后導(dǎo)航以及使用那些功能來理解數(shù)據(jù)元素的關(guān)系的過程稍顯麻煩。例如,如果窗格154中的條目127被雙擊以掲示共提供包含地址10300W Bluemound的四個實例的兩條記錄,并且如果相同的學(xué)生標(biāo)識編號與那兩條記錄相關(guān)聯(lián),則除了切換到課段文件的顯示并且使用界面的聯(lián)合標(biāo)記、過濾、標(biāo)記和分析特征來找到示出所需信息的記錄之外,用戶就沒有簡單的方式來看到關(guān)于該學(xué)生注冊的課段的更多信息。 因此,用戶可能觀察并理解不同數(shù)據(jù)集合中數(shù)據(jù)的相互關(guān)系,但是在ー些情況下很麻煩。可以通過調(diào)用稱作join all (聯(lián)合所有)的工具的特征來簡化該過程并使其更為豐富。該join all的特征處理該三個文件(或數(shù)據(jù)集合)-它們已經(jīng)被解析并且已經(jīng)由用戶標(biāo)識出了其鍵及鍵關(guān)系-以產(chǎn)生新的綜合文件。該新的文件以允許用戶更快和更容易的分析的形式捕捉三個源文件A、B和C的數(shù)據(jù)。用戶通過在菜單項file (文件)上點擊并且選擇export data(導(dǎo)出數(shù)據(jù))選項并且接著選擇出現(xiàn)的對話框中的join all source files (聯(lián)合所有源文件)來創(chuàng)建該綜合文件。對于被聯(lián)合的記錄,聯(lián)合所有操作創(chuàng)建了鏡像它們的鍵之間的關(guān)系的相應(yīng)層級記錄。由于鍵是層級相關(guān)的,所以可以通過首先根據(jù)每個頁面的記錄的鍵對其分類并接著順序?qū)λ鼈冞M(jìn)行處理來簡化該聯(lián)合。我們通過頁面意指文件中與在聯(lián)合所有文件時被聯(lián)合的文件中的ー個相關(guān)聯(lián)的部分。例如,原始文件B對應(yīng)于聯(lián)合文件的頁面B。當(dāng)根據(jù)從原始文件得出的頁面創(chuàng)建最終的聯(lián)合文件吋,附加頁面被添加到該格式。該附加頁面能夠?qū)β?lián)合記錄解碼并且將每個適當(dāng)?shù)牟糠职l(fā)送到相應(yīng)頁面。因此,實際上,原始文件中的每ー個已經(jīng)被瀏覽頁面替代,該瀏覽頁面從聯(lián)合所有文件的另ー個頁面而不是原始文件中的一個接收其信息以便向用戶顯示(即,用于創(chuàng)建視圖時使用)。如圖14所示,解碼頁面(其是被稱作**D. Joined_Records的文件)中所示的首部圖示了聯(lián)合記錄的格式。在該圖所示的部分首部結(jié)構(gòu)中示出了與頁面B相關(guān)的記錄的解碼(我們通過頁面B意指聯(lián)合文件中表示從原始課段文件B得出的數(shù)據(jù)的部分)。在頂部要素開始并且繼續(xù)向下,首部結(jié)構(gòu)包括元素“Dl~~~JoinedRecords”、 “Dr~”、“Dl~”和“D14~~”。文件解碼的表示以元素“Dl~~”開始,其是“具有大小的”元素, 意指該記錄在數(shù)據(jù)之后的字節(jié)中包含指定該數(shù)據(jù)長度的大小字段。(大小字段本身在大端 (big-endian)格式中為4字節(jié)長。)“Dl~ ~ ”和“Dl~ ”用來對記錄解碼以便在數(shù)據(jù)頁面A 中使用?!癉14~~”和“D14~”用來對記錄解碼以便在數(shù)據(jù)頁面B中使用。第一元素“Dl~~” 對包含與聯(lián)合到數(shù)據(jù)頁面A中的相應(yīng)記錄的數(shù)據(jù)相關(guān)的所有數(shù)據(jù)的字段解碼。該元素進(jìn)而包含“D14~ ”,其具有“重復(fù)(I^peat) ”,這意指可以存在多條記錄,每條記錄都是具有大小的記錄。回頭來看“Dl~~”和“Dl~”,除了“Dl~”不具有重復(fù)之外,我們看到它們遵照與 “D14~~”和“D14~”相同的模式。這是因為該元素用來解碼根聯(lián)合記錄并且由此其并沒有被重復(fù)。嚴(yán)格來講,“Dl~”是冗余的,但是其出現(xiàn)提供了為層級聯(lián)合數(shù)據(jù)集合工作的重復(fù)模式。在“Dl~”之下為用于對頁面B的聯(lián)合數(shù)據(jù)的記錄進(jìn)行解碼的元素。該元素包括來自頁面C的記錄,其被聯(lián)合到頁面B的特定記錄。該包含模式針對所有聯(lián)合數(shù)據(jù)頁面重復(fù)。元素“D15~ ~ ”和“D15~ ”對僅與頁面B相關(guān)的數(shù)據(jù)解碼。如果記錄級的重復(fù)已經(jīng)在原始數(shù)據(jù)頁面B上被替代,則“[r印eat*]”將出現(xiàn)在元素D15~上?!癉15~”進(jìn)ー步由表示實際數(shù)據(jù)的主體及首部信息構(gòu)成。在元素D15中,注記“_>B. sessions [Joined record]” 意指該元素的輸出被發(fā)送到數(shù)據(jù)頁面B的輸入欄。由元素D16■'提取的首部進(jìn)ー步被元素D16至D23解碼。如所示出的,首部包含文件名、文件路徑和原始數(shù)據(jù)的記錄數(shù)目。其還包含聯(lián)合數(shù)據(jù)的記錄數(shù)目。每個首部字段之前有標(biāo)識字段的單個字節(jié)。類似的解釋將應(yīng)用于例如在其它附圖中圖示的其它首部元素。對于我們已經(jīng)討論過的示例,圖9示出了產(chǎn)生的join all綜合文件的七條記錄, 其被稱作D. Joined_Records并且在該示例中以稱作miodata格式的格式表達(dá)。如圖10A至10H(分段)所示的,并且在那些附圖的左側(cè)窗格中指示的,由兩個星號指示的被分析和觀看的文件是文件D。文件A、B和C的條目之后缺少兩個星號,并且注記 from file D指示當(dāng)調(diào)用那些條目并且顯示記錄時,該記錄是已經(jīng)從join_records file D 得出的記錄而不是三個源文件的記錄的直接視圖。例如,通過在窗格104中的條目A上進(jìn)行點擊,向用戶示出從原始源文件C得出并且被整合到綜合文件D中的數(shù)據(jù)。文件D恰好包含從被解析并且具有鍵的源文件創(chuàng)建的七條記錄。文件D中的每條記錄與一門課程相關(guān)聯(lián)。所以,例如,如首部欄中的單詞key指示的,Dl欄包含七門不同課程的編號并且作為文件D的鍵。D2欄包含每門課程的課程編號和課程名稱,其已經(jīng)基于鍵Dl從相應(yīng)文件A得出(聯(lián)合到文件A)。D2欄中的數(shù)據(jù)的源在首部欄中通過短語“-> A. Courses [Joined record],,指不。D4欄標(biāo)識了文件的名稱,從該文件中得出這些記錄的數(shù)據(jù),D6欄為從中得出數(shù)據(jù)的文件的文件路徑,D8欄是該文件中的原始記錄數(shù)目,并且DlO欄是記錄的當(dāng)前記錄數(shù)目。 D2至DlO欄共同構(gòu)成了所謂課程記錄欄D。D14欄包含每門課程的課段具有鍵的實例。例如,在文件D的記錄2中,對于課程69. 208具有2個課段鍵實例。為了簡要,該實例在顯示中通過分隔符00分隔。例如, “69. 20800a”實際上是“69. 208”、隨后是空字節(jié)(通常以紅色示出為00)、隨后是字母“ a”。 出現(xiàn)在該鍵的成分中的空字節(jié)將被編碼為01字節(jié)隨后是另ー個01字節(jié)。鍵成分中出現(xiàn)的任意01字節(jié)將被編碼為01字節(jié)隨后是02字節(jié)。這種編碼保留了復(fù)合鍵的歸類順序并且僅在鍵成分內(nèi)出現(xiàn)00或01字節(jié)時(不止通過該00字節(jié)分隔符)擴展鍵,而這是不太可能出現(xiàn)的情形。在D15欄的Body (主體)中,示出了每門課程和每個課段的教員的姓名。D15欄的 Sessions記錄跨越D17、D19、D21和D23,并且捕捉關(guān)于課段信息源的信息。在記錄2中,出現(xiàn)了兩名教員的名字,這是因為課程69. 208具有兩個不同的課段。D15欄中的信息已經(jīng)從文件B得出并被聯(lián)合(如欄首部中指示的),其列出了各個課段的教員姓名。雖然原始文件 B具有八條記錄來反映課程有八個課段的事實,但是在文件D中,所有那些八條記錄被捕捉在D15欄的僅六條記錄中,這是因為對于課程中的兩門,每門課程均具有兩個課段并且那些課段對可以記錄在相同的記錄中。D27欄顯示了每門課程中所有學(xué)生實例的鍵信息,以及關(guān)于學(xué)生注冊的課程和課段的相關(guān)聯(lián)信息。利用D14欄,課程、課段和學(xué)生ID的鍵信息由00分隔符分隔。例如,記錄 6保存了注冊該課程的非常大量的學(xué)生實例的鍵信息,每個鍵包括課程編號、課段字母和學(xué)生ID。
類似地,D28欄通過與文件C聯(lián)合捕捉學(xué)生地址記錄。D30、D32、D34、D36欄捕捉關(guān)于聯(lián)合信息的原始位置的信息。文件D是非矩形文件,其中對于每條課程記錄,記錄的各個欄可以在不同的重復(fù)級具有多個實例(重復(fù))。例如,可以具有許多注冊了ー個課程的學(xué)生的學(xué)生ID。D27欄捕捉多個ID并且對于每ー個捕捉相關(guān)聯(lián)的課程和課段標(biāo)識符。將源文件的數(shù)據(jù)聯(lián)系起來的信息因此被完全捕捉并且立即可用以便允許用戶觀看不同文件中的相關(guān)數(shù)據(jù)。這種布置不同于其中每條記錄為矩形的典型數(shù)據(jù)庫表,也就是說,每個欄具有該欄的屬性的單個值的空間;對于該屬性的附加值必須提供附加欄。所有記錄的長度,在值條目的數(shù)目方面,每個欄ー個,它們?nèi)渴窍嗤牟⑶彝ㄟ^欄的數(shù)目定義,就此而言,這樣的表是矩形的。作為比較,文件D是非矩形的,因為記錄的長度在值條目的數(shù)目方面可以比每個欄ー個更多,并且因此不需要全部都是相同的。該應(yīng)用不僅以平面形式生成了 join all綜合文件,而且還生成了對應(yīng)于三個源文件A、B和C的文件D的數(shù)據(jù)的三幅視圖。具有在文件D中的非矩形記錄中組織的數(shù)據(jù)并且具有與D中數(shù)據(jù)相關(guān)的三幅視圖(A、B和C),允許用戶有機會更容易、更快并且更直觀地觀看并使用三個源文件中的數(shù)據(jù)。例如,如圖11所示,假設(shè)用戶對文件D的第二條記錄表示的課程Configurable Parser (可配置解析器)感興趣,并且相應(yīng)地標(biāo)記了該記錄和過濾器,保留顯示該單個記錄?,F(xiàn)在假設(shè)用戶對關(guān)于注冊該課程的學(xué)生的細(xì)節(jié)感興趣。通過簡單地在文件C上進(jìn)行點擊,窗格104中的學(xué)生立即以圖12中所示的數(shù)據(jù)呈現(xiàn),其示出關(guān)于注冊該課程的學(xué)生的所有詳細(xì)信息的單個記錄。此外,當(dāng)用戶使應(yīng)用對給定欄的記錄分析頻率統(tǒng)計時,該分析立即體現(xiàn)于(carry over)視圖A、B和C以及文件D的視圖之中。例如,假設(shè)在對文件D中的記錄2 了標(biāo)記和過濾之后,用戶對該記錄中的學(xué)生信息執(zhí)行頻率分析并且得到如圖13所示的結(jié)果。因此,join all特征產(chǎn)生的綜合文件使用戶能夠更為容易地觀看、分析和理解數(shù)據(jù)、數(shù)據(jù)集合及其關(guān)系,包括可能存在的重復(fù)。使用存儲在大量存儲設(shè)備上的數(shù)據(jù)集合和綜合文件,這里所描述的工具能夠在運行于大量硬件配置上的大量軟件平臺上實施。其它實施方式處于權(quán)利要求的范圍之內(nèi)。例如,可以使用大量用戶界面風(fēng)格來顯示綜合文件的源數(shù)據(jù)集合的記錄或其它數(shù)據(jù)。類似地,可以提供大量用戶接ロ設(shè)備以使用戶能夠?qū)τ涗涍M(jìn)行標(biāo)記和取消標(biāo)記、對記錄進(jìn)行過濾和取消過濾、分析并顯示頻率統(tǒng)計、創(chuàng)建并撤銷聯(lián)合、創(chuàng)建綜合文件,以及觀看部分或所有數(shù)據(jù)集合、記錄和字段。用來標(biāo)識字段的標(biāo)題可以以不同方式顯示。關(guān)于重復(fù)的信息可以以各種方式向用戶圖示。
權(quán)利要求
1.一種計算機實現(xiàn)的方法,包括接收兩個或更多數(shù)據(jù)集合,所述數(shù)據(jù)集合中的每ー個包含能夠被解釋為記錄的數(shù)據(jù),每條所述記錄具有數(shù)據(jù)字段的數(shù)據(jù)值,所述數(shù)據(jù)集合中的每ー個包含至少ー些與其它數(shù)據(jù)集合中的至少ー個中的數(shù)據(jù)相關(guān)的數(shù)據(jù)。所述數(shù)據(jù)集合中的不同數(shù)據(jù)集合中的數(shù)據(jù)可以不同地組織或表達(dá),所述數(shù)據(jù)集合中的每ー個容許針對該數(shù)據(jù)集合的記錄定義鍵,所述數(shù)據(jù)集合的特征在于(a)記錄、(b)鍵的部分或(C)數(shù)據(jù)字段的值實例中的至少 ー個的重復(fù),并且向用戶提供關(guān)于所述重復(fù)中的至少ー個的信息。
2.根據(jù)權(quán)利要求I所述的方法,其中所述數(shù)據(jù)集合中的至少ー個包括具有文件格式的文件。
3.根據(jù)權(quán)利要求I所述的方法,其中所述數(shù)據(jù)集合中的至少兩個包括具有不同文件格式的文件。
4.根據(jù)權(quán)利要求I所述的方法,還包括從用戶接收關(guān)于所述數(shù)據(jù)集合中的至少ー個的數(shù)據(jù)可以被解釋為記錄的方式的信息,每條所述記錄均具有數(shù)據(jù)字段的數(shù)據(jù)值。
5.根據(jù)權(quán)利要求I所述的方法,還包括從用戶接收信息,根據(jù)所述信息能夠確定所述數(shù)據(jù)集合中的每ー個的鍵。
6.根據(jù)權(quán)利要求I所述的方法,其中所述數(shù)據(jù)集合中的一個的鍵與所述數(shù)據(jù)集合中的另ー個的鍵具有定義的層級關(guān)系。
7.根據(jù)權(quán)利要求I所述的方法,其中記錄的重復(fù)包括所述數(shù)據(jù)集合中的ー個中的復(fù)制記求。
8.根據(jù)權(quán)利要求I所述的方法,其中鍵的部分的重復(fù)包括所述數(shù)據(jù)集合中的一個中的鍵的值對應(yīng)于所述數(shù)據(jù)集合中的另ー個的鍵的部分的兩個不同值。
9.根據(jù)權(quán)利要求I所述的方法,其中數(shù)據(jù)字段的值實例的重復(fù)包括兩個或更多值實例被包括在給定字段中。
10.根據(jù)權(quán)利要求I所述的方法,還包括使用戶能夠?qū)λ鰯?shù)據(jù)集合中的至少ー個的記錄的值執(zhí)行標(biāo)記、取消標(biāo)記、過濾、取消過濾和頻率分析中的至少ー種。
11.根據(jù)權(quán)利要求I所述的方法,其中向所述用戶提供所述信息包括顯示所述信息。
12.根據(jù)權(quán)利要求11所述的方法,其中所述顯示包括顯示所述數(shù)據(jù)集合的記錄、所述記錄的字段的標(biāo)識以及數(shù)據(jù)集合中的重復(fù)的指示。
13.根據(jù)權(quán)利要求11所述的方法,其中顯示關(guān)于所述重復(fù)的信息包括顯示數(shù)據(jù)字段的重復(fù)值實例。
14.根據(jù)權(quán)利要求11所述的方法,其中顯示關(guān)于所述重復(fù)的信息包括指明數(shù)據(jù)集合中存在重復(fù)記錄。
15.根據(jù)權(quán)利要求11所述的方法,其中顯示關(guān)于所述重復(fù)的信息包括指明鍵的一部分存在重復(fù)。
16.根據(jù)權(quán)利要求I所述的方法,其中向所述用戶提供信息包括使所述用戶能夠創(chuàng)建記錄的綜合文件,所述綜合文件包括所述數(shù)據(jù)集合的數(shù)據(jù)以及關(guān)于所述重復(fù)的信息。
17.根據(jù)權(quán)利要求16所述的方法,其中所述綜合文件包含受鍵約束的記錄。
18.根據(jù)權(quán)利要求17所述的方法,其中所述綜合文件的鍵包括所述數(shù)據(jù)集合的字段的層級串聯(lián)。
19.根據(jù)權(quán)利要求16所述的方法,其中重復(fù)數(shù)據(jù)值被包括在所述綜合文件的記錄的給定字段中。
20.根據(jù)權(quán)利要求16所述的方法,還包括向所述用戶顯示所述綜合文件的記錄。
21.根據(jù)權(quán)利要求16所述的方法,還包括顯示所述綜合文件中的數(shù)據(jù)的視圖,該數(shù)據(jù)對應(yīng)于所述數(shù)據(jù)集合的數(shù)據(jù),所述綜合文件根據(jù)所述數(shù)據(jù)集合的數(shù)據(jù)創(chuàng)建。
22.根據(jù)權(quán)利要求16所述的方法,還使用戶能夠?qū)λ鰯?shù)據(jù)集合中的至少ー個的記錄的值執(zhí)行標(biāo)記、取消標(biāo)記、過濾、取消過濾和頻率分析中的至少ー種。
23.根據(jù)權(quán)利要求16所述的方法,還包括顯示所述綜合文件中的數(shù)據(jù)的視圖,該數(shù)據(jù)對應(yīng)于所述數(shù)據(jù)集合的數(shù)據(jù),所述綜合文件根據(jù)所述數(shù)據(jù)集合的數(shù)據(jù)創(chuàng)建,并且使用戶能夠?qū)λ鼍C合文件的記錄的值執(zhí)行標(biāo)記、取消標(biāo)記、過濾、取消過濾和頻率分析中的至少ー 種,并且所述標(biāo)記、取消標(biāo)記、過濾和頻率分析被自動應(yīng)用于所述數(shù)據(jù)的其它視圖。
24.一種計算機實現(xiàn)的方法,包括接收數(shù)據(jù)集合,所述數(shù)據(jù)集合包含能夠被解釋為記錄的數(shù)據(jù),每條所述記錄具有數(shù)據(jù)字段的數(shù)據(jù)值,所述數(shù)據(jù)集合的特征在于所述數(shù)據(jù)字段中的至少ー個的值實例的任意數(shù)目的重復(fù),并且向用戶提供關(guān)于所述重復(fù)中的至少ー個的信息。
25.根據(jù)權(quán)利要求24所述的方法,其中所述數(shù)據(jù)集合包括具有文件格式的文件。
26.根據(jù)權(quán)利要求24所述的方法,還包括從用戶接收關(guān)于所述數(shù)據(jù)集合的數(shù)據(jù)可以被解釋為記錄的方式的信息,每條所述記錄均具有數(shù)據(jù)字段的數(shù)據(jù)值。
27.根據(jù)權(quán)利要求24所述的方法,還包括從用戶接收信息,根據(jù)所述信息能夠確定所述數(shù)據(jù)集合的鍵。
28.根據(jù)權(quán)利要求24所述的方法,還包括使所述用戶能夠?qū)λ鰯?shù)據(jù)集合的記錄的值執(zhí)行標(biāo)記、取消標(biāo)記、過濾、取消過濾和頻率分析。
29.根據(jù)權(quán)利要求24所述的方法,其中向所述用戶提供所述信息包括顯示所述信息。
30.根據(jù)權(quán)利要求29所述的方法,其中所述顯示包括顯示所述數(shù)據(jù)集合的記錄、所述記錄的字段的標(biāo)識以及數(shù)據(jù)集合中的重復(fù)的指示。
31.根據(jù)權(quán)利要求29所述的方法,其中顯示關(guān)于所述重復(fù)的信息包括顯示數(shù)據(jù)字段的重復(fù)值實例。
32.—種承載數(shù)據(jù)記錄、所述記錄的鍵的綜合文件的介質(zhì),每條所述記錄包含至少ー個數(shù)據(jù)字段的至少ー個數(shù)據(jù)值,所述數(shù)據(jù)記錄包含表示至少兩個數(shù)據(jù)集合的數(shù)據(jù)的信息,所述數(shù)據(jù)集合中的每ー個包含能夠被解釋為記錄的數(shù)據(jù),每條所述記錄均具有數(shù)據(jù)字段的數(shù)據(jù)值,所述數(shù)據(jù)集合中的每ー個包含至少ー些與其它數(shù)據(jù)集合中的至少ー個中的數(shù)據(jù)相關(guān)的數(shù)據(jù),所述數(shù)據(jù)集合中的不同數(shù)據(jù)集合中的數(shù)據(jù)可以不同地組織或表達(dá),所述數(shù)據(jù)集合中的每ー個容許針對該數(shù)據(jù)集合的記錄定義鍵,所述數(shù)據(jù)集合的特征在于(a)記錄、(b)鍵的部分或(C)數(shù)據(jù)字段的值實例中的至少ー個的重復(fù),所述綜合文件包括標(biāo)識所述重復(fù)的信息。
全文摘要
除其它內(nèi)容之外,有兩個或更多的數(shù)據(jù)集合。所述數(shù)據(jù)集合中的每一個包括可以被解釋為記錄的數(shù)據(jù),每條記錄具有數(shù)據(jù)字段的數(shù)據(jù)值。所述數(shù)據(jù)集合中的每一個包含至少一些與至少一個其它數(shù)據(jù)集合中的至少一個中的數(shù)據(jù)相關(guān)的數(shù)據(jù)。不同數(shù)據(jù)集合中的數(shù)據(jù)可以不同地組織或表達(dá)。所述數(shù)據(jù)集合中的每一個容許針對數(shù)據(jù)集合的記錄定義鍵。所述數(shù)據(jù)集合的特征在于(a)記錄、(b)鍵的部分或(c)數(shù)據(jù)字段的值實例中至少一個的重復(fù)。向用戶提供關(guān)于所述重復(fù)中的至少一個的信息。
文檔編號G06F17/00GK102612681SQ201080036870
公開日2012年7月25日 申請日期2010年8月18日 優(yōu)先權(quán)日2009年8月18日
發(fā)明者特里·雷蒙德, 阿爾伯特·B·巴拉巴斯, 馬克·D·A·萬古利克 申請人:沒有束縛軟件有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
河曲县| 施甸县| 湄潭县| 噶尔县| 宁城县| 乐至县| 华宁县| 青海省| 乌苏市| 中西区| 常德市| 静乐县| 云阳县| 浑源县| 昌都县| 奈曼旗| 吴江市| 万山特区| 凯里市| 墨江| 大理市| 长岛县| 莎车县| 富蕴县| 富源县| 将乐县| 定日县| 历史| 黄冈市| 门源| 云和县| 波密县| 郑州市| 东港市| 福海县| 新乐市| 夏津县| 阿克陶县| 酉阳| 呼伦贝尔市| 三台县|