欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

使用記錄、鍵和/或數(shù)據(jù)字段值的重復解釋數(shù)據(jù)集合的制作方法_2

文檔序號:9375557閱讀:來源:國知局
符80的值(E欄),以及課程編號的值(H欄,未不出)ο
[0024]三個源文件包含相關信息。例如,課程編號在所有三個文件中使用。并且課段標識符(a 或 b)在 sess1ns, txt 和 students_with_addresses.csv 文件中使用。然而,出現(xiàn)在三個文件中的一些類型的信息之間的關系,特別是信息重復的屬性和數(shù)量,通過觀看這三個單獨的文件并不容易理解。
[0025]這里,除其它之外,我們描述了這樣的工具:該工具使用戶能夠在不進行任何編程或改編或者對三個文件中包含信息之間的所有關系進行詳細分析的情況下,使該三個文件被分析并且使其記錄以使用戶能夠理解三個文件中出現(xiàn)的信息重復的屬性和數(shù)量的方式顯不O
[0026]雖然該示例中示出的三個文件僅包含相對少量的記錄,但是相同的方法可以被應用于包含非常大量的記錄(數(shù)百萬或者甚至數(shù)十億)并且取自廣泛分布的源的文件,所述源包括可能并不完全處于相同一方控制之下的源。不同文件或記錄的集合可以以完全不同的文件格式表達,或者在一些情況下沒有任何正式文件格式。
[0027]我們首先描述分析并顯示關于每個文件的重復信息(除其它之外)并且使用戶能夠通過調用用戶界面的簡單特征對文件記錄的屬性進行快速觀察和導航的工具。用戶界面16的示例在圖5中示出。
[0028]圖5表示了在(a)三個源數(shù)據(jù)文件92、94、96已經(jīng)由用戶導入軟件應用,(b)每個文件已經(jīng)被解析為字段98 (借助用戶的協(xié)助,其例如能夠標識出字段之間的定界符),并且已經(jīng)由用戶在鍵框102中標識出文件的鍵100之后的用戶界面(這里被編號為90)和軟件應用12(圖1)的狀態(tài)。文件A的記錄現(xiàn)在顯示在圖5中。
[0029]三個導入的文件在窗格104中列出。文件之后的**注記指示在其被高亮和點擊時,該界面中示出的記錄是該文件的記錄。(在隨后討論的一些情況下,在條目之后的窗格中缺少**注記指示當該條目被調用時,該界面中示出的信息是文件中包含數(shù)據(jù)的視圖,但是并不是其本身直接取自現(xiàn)有文件。)在文件名或窗格中的其它條目上進行點擊使其記錄顯示在可滾動的記錄窗格106中。
[0030]圖5(和其它附圖)中圖示的用戶界面包括顯示特征、菜單項、分析工具以及在美國專利7512610中更為詳細描述和示出的其它功能,該專利的全部內容通過引用結合于此。
[0031]在窗格104中,在每個文件或其它條目的名稱之后的,示出了該文件的鍵105及其與至少一個其它文件的其它鍵的關系。當每個文件被導入并解析時,對其字段給出標識符,該標識符跨所有三個文件是唯一的。例如,在該示例中,文件Courses被標識為文件A并且其兩個字段被標記為Al和A2。在許多情況下,所述字段的解析能夠基于數(shù)據(jù)源中包含的信息自動完成。在其它情況下,用戶參與字段及其定界符的標識。
[0032]文件的鍵可以是如用戶標識的該文件的一個或多個字段。例如,用戶在這里已經(jīng)標識了唯一的課程編號Al欄作為文件A的鍵,這反映為出現(xiàn)標題為[key](鍵)的左側欄。
[0033]如圖6所示,文件B Sess1ns(課段)的鍵已經(jīng)由用戶在框102中標識為BI欄(課程編號)和B2欄(課段字母)的“串聯(lián)”。對于文件B,課程編號(BI欄)不能單獨用作鍵,原因在于可以有兩個承載給定課程編號的記錄,每個課段或分段一個。通過將課段字母(B2欄)與BI欄“串聯(lián)”,可以形成唯一的鍵。這里,當我們提到串聯(lián)時,意思是例如根據(jù)這兩個欄中的數(shù)據(jù)形成一個2元組。因此,BI欄中的“X”和B2欄中的“YZ”將產生不同于BI欄中的“ XY ”和B2欄中的“ Z ”的復合鍵ο
[0034]文件B的串聯(lián)鍵(B1,B2)與文件A的鍵(Al)相關。該關系105在窗格104中示出并且由注記B2,BI = Al表示。該注記表達了鍵BI與鍵Al相同,并且文件B中的鍵BI具有相同值但是B2具有不同值的記錄可能重復的事實。實際上,B1、B2是層級鍵。我們將這種層級布置稱作鍵級的重復。鍵級的重復是一起取得的三個文件的結構特征(但是通過觀看文件A并不是顯而易見的并且通過觀看文件C也不一定是輕易顯而易見的)。用戶通過在文件B的鍵框102中輸入來向該應用指示BI,B2到Al的關系。
[0035]在圖7A和7B中,不出了 students_with_addressed文件C。在該文件中,欄C8 (課程編號)、C9(課段字母)和Cl (學生ID)的串聯(lián)產生了唯一的三級層級鍵。顯然,CS和C9與文件B中的BI和B2相同,從而鍵110的關系可以表示為C8,C9, Cl = BI, B2以指示C8和C9分別與BI和B2相同,并且該串聯(lián)鍵中的每個課程編號和課段字母的組合也可能重復,原因在于多個學生通常針對給定課程的給定課段進行注冊。
[0036]在文件C的字段C4中,對于一些記錄120存在學生的街道地址的實例的重復122、124,并且對于該示例中的其它地址欄也可能出現(xiàn)這樣的重復。我們將這稱作字段級的重復。
[0037]在源數(shù)據(jù)集合中,還可能具有鍵相同的復制記錄(duplicate records)。例如,在文件C中,承載相同鍵的兩條記錄可以在所有字段中都具有相同的值(雖然在圖7A和7B中沒有示出這樣的示例)。我們將之稱作記錄級的重復。類似地,文件B可能包含具有相同鍵的多條記錄,可能指示由多個教員所教授的課程和課段(非尋常的安排)。文件C和B通過其鍵而不是其記錄相關,所以不應當認為C記錄具有父B記錄(或多個),相反,應認為C記錄具有C鍵,該C鍵具有父B鍵,并且B記錄也具有B鍵。
[0038]當數(shù)據(jù)集合已經(jīng)被導入并且解析為字段和記錄,并且顯示該記錄、字段和值時,在該記錄的字段關系的首部(header)窗格127 (位于記錄窗格之上)中具有層級指示。最上方的首部129跨越所有字段并且表示整條記錄。直接處于所顯示記錄上方的級131的首部標識每個字段。每個中間的首部級層級地示出在其下方的首部群組。
[0039]數(shù)據(jù)集合的重復結構在用戶界面中指示給用戶。如之前所提到的,鍵級的重復在窗格104以及鍵框102中聲明(call out)。鍵級的重復通過在鍵首部中顯示單詞“repeat (重復)”標識。例如,取決于課段字母而可能出現(xiàn)的(文件A的)課程編號鍵Al由出現(xiàn)在串聯(lián)鍵欄的首部中的單詞key 118(鍵)之后的單詞repeat 116(重復)指示。該注記向用戶指示課程編號為鍵,但是該鍵對于不同課段可能重復并且BI,B2 —起形成唯一鍵。
[0040]在圖7A和7B中,字段級的重復由C4欄的首部中的單詞^peat 117指示,這告訴觀看者對于給定學生會存在重復的街道、城市和州地址字段的實例。(跨越所有字段的)頂層首部中的單詞repeat 119是指記錄級重復的可能性,向觀看者指示了文件C的整條記錄都可能重復。也就是說,給定學生可能在給定課程的給定課段中進行了不止一次注冊。
[0041]重復結構還通過圖5、6、7A和7B中所示記錄中值周圍的括號組指示。例如,在圖6中,在每個記錄的BI欄中,課程編號的值被包含在括號中以指示在文件B中可以存在課程編號的鍵級的重復(例如,因為給定課程可能有兩個課段)。在圖7中,C2欄中的值每個均被三組括號包圍,以指示學生名字的三種可能重復的情形:(I)由關系BI,B2 = Al暗示的鍵級的重復(圖6中的117),其指示一門課程可能有多個課段,(2)關系C8,C9,C1 =B1,B2表示的第二鍵級的重復116,其指示一個課段中可以招收多個學生,以及(3)可能允許文件C中的多條學生記錄具有相同鍵(C8,C9,C1)的記錄級的重復119。在串聯(lián)欄C4~中,每條記錄中的每個值還攜帶第四組括號以指示可能存在字段級的重復,這是因為每條記錄可以包括多于一個的學生地址實例。
[0042]因此,圖4至圖7 (和相關應用)中圖示的界面使用戶能夠導入單獨的數(shù)據(jù)集合(例如,包含在潛在地具有不同文件格式或沒有文件格式的文件中,或者不包含在正式文件中),使該數(shù)據(jù)集合的記錄的字段得以被解析,并且標識可能包含相關數(shù)據(jù)的單獨文件之間的鍵和鍵關系。該應用基于鍵對數(shù)據(jù)集合進行分析并且在任意數(shù)據(jù)集合的記錄的顯示中向用戶指示至少三個級:鍵級、字段級和記錄級中存在的重復。該應用并不形成任何新的文件,并且并不跨數(shù)據(jù)集合合并或結合數(shù)據(jù)。然而,該應用向用戶揭示了每個數(shù)據(jù)集合的字段和記錄以及重復。
[0043]該應用確定了如何以及在何處通過“重復”命令而使用用戶提供的信息向顯示的記錄和首部中放置重復信息。該“重復”(可通過在首部上右鍵點擊并選擇解析隨后選擇重復而獲得)被用來規(guī)定首部中的哪些要素反映了重復的數(shù)據(jù)。在該示例中,在數(shù)據(jù)頁面B上,存在關于鍵的重復指示,原因在于該數(shù)據(jù)可以具有關于A的鍵級的重復,該事實已經(jīng)由用戶利用重復命令向應用指示。無論記錄的字段中何處出現(xiàn)重復,顯示的記錄數(shù)據(jù)都將包括至少一組括號。嵌套示出的父/子括號指示重復的嵌套。在記錄的字段中的數(shù)據(jù)實際重復時使用并排示出而并非嵌套示出的同胞(sibling)括號。
[0044]在首部和記錄的顯示中,括號基于用戶在“父”文件中定義的鍵重復而由應用給出?!癧r印eat*]”注記指示用戶已經(jīng)明確告知該應用以預期(并提取)重復數(shù)據(jù)的每個地方,該重復數(shù)據(jù)為鍵、記錄或字段級。如果用戶并沒有規(guī)定重復,則不示出括號。然而,由于在觀看期間沒有發(fā)生記錄間的處理,所以仍然示出所有記錄。
[0045]顯示“ [^peat*] ”注記示出
當前第2頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
永善县| 永顺县| 安康市| 林芝县| 休宁县| 马关县| 永平县| 景德镇市| 湟中县| 厦门市| 英吉沙县| 彭州市| 洪洞县| 弥勒县| 庆元县| 洪泽县| 平遥县| 宁波市| 丁青县| 天台县| 鄱阳县| 金山区| 西和县| 神池县| 西平县| 屏山县| 策勒县| 黄浦区| 建瓯市| 永新县| 巩义市| 云安县| 通许县| 阿鲁科尔沁旗| 东港市| 凯里市| 汉寿县| 威远县| 依安县| 财经| 泸州市|