專利名稱:一種關(guān)聯(lián)數(shù)據(jù)的索引、檢索、存儲和顯示控制的信息系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息技術(shù)領(lǐng)域,特別涉及一種具有關(guān)聯(lián)關(guān)系數(shù)據(jù)的存儲、索引、 檢索和呈現(xiàn)控制的信息系統(tǒng)。
背景技術(shù):
在當(dāng)前信息社會里,隨著信息技術(shù)的逐漸普及,信息系統(tǒng)得到了廣泛應(yīng)用。 隨著信息系統(tǒng)中積累的數(shù)據(jù)越來越多,人們已經(jīng)逐漸依賴于通過檢索來快速的 從信息系統(tǒng)中獲得信息。人們在信息系統(tǒng)中檢索信息時,常常會得到很多的結(jié) 果,其中夾雜的大量不相關(guān)內(nèi)容降低了人們獲取信息的效率,同時也降低了系 統(tǒng)資源的有效利用率。這種現(xiàn)象在海量信息系統(tǒng)的檢索中顯得尤為突出,例如 在現(xiàn)有的搜索引擎中檢索某個信息時,常常會得到大量信息,因此,人們不得 不對搜索引擎返回的大量結(jié)果逐個進行分辨,以確定是否是所需要的內(nèi)容,這 導(dǎo)致了低下的信息獲取效率。而檢索結(jié)果不準(zhǔn)確、檢索質(zhì)量不高則是目前海量 信息系統(tǒng)中普遍存在的問題。
目前,基于關(guān)鍵詞匹配技術(shù)的文本檢索系統(tǒng)在建立索引時,通常先將文本 中出現(xiàn)的關(guān)鍵詞與關(guān)鍵詞所在文本的定位信息生成索引數(shù)據(jù)庫,然后用信息系 統(tǒng)提供的檢索界面輸入檢索詞進行檢索,系統(tǒng)在索引數(shù)據(jù)庫中對用戶所提供的 檢索詞進行匹配查找,得到檢索詞所在文本的定位信息,最后顯示由該定位信息 所確定的文本的摘要或全文。在關(guān)鍵詞匹配技術(shù)的基礎(chǔ)上還可實現(xiàn)布爾檢索。
為給文本中存在的信息做索引,索引系統(tǒng)需對文本作語義分析,而文本的 歧義處理是文本語義分析中無法繞過的過程。歧義是指同一種語言形式可以表 示多種意義的現(xiàn)象,歧義可以在詞匯、句法、語義、語用等多個層面發(fā)生。形 成歧義的主要原因是以一維線性的文本方式組織的語言結(jié)構(gòu)是有限的,而語義 則是無窮的,用有限的結(jié)構(gòu)表達近乎無窮的意思會不可避免的造成一個語言結(jié)
構(gòu)表達多種語義內(nèi)容的一對多現(xiàn)象,這是產(chǎn)生歧義的根源,也是文本語義分析 技術(shù)的最大障礙。例如, 一個詞對應(yīng)于多個含義的一詞多義現(xiàn)象、不同的詞序 導(dǎo)致的詞序歧義等一對多現(xiàn)象?;谝痪S線性文本的信息組織方式是導(dǎo)致數(shù)據(jù) 處理系統(tǒng)難以解決其歧義問題的根本原因,因此,在目前信息系統(tǒng)中信息量急 劇增多的背景下,尋找一種能夠易于減小語義歧義的信息組織方法就變得非常 迫切。
從檢索詞與文檔這兩者之間的關(guān)系角度上來說,基于關(guān)鍵詞匹配技術(shù)的檢索 本質(zhì)上是一種對檢索詞在文檔中的出現(xiàn)關(guān)系的檢索。由此可以發(fā)現(xiàn),基于關(guān)鍵 詞匹配技術(shù)的檢索在如下兩個環(huán)節(jié)上存在不足第一個環(huán)節(jié)是在建立索引時, 除了關(guān)鍵詞在文本中是否出現(xiàn)的信息,索引數(shù)據(jù)中沒有保存文檔中存在的其它 信息。例如,存在于文本中的因果關(guān)系、時間先后秩序、空間關(guān)系等。這實際 上是在索引過程中就已經(jīng)丟失了文本里包含的信息,造成了信息缺失,從而使 得索引數(shù)據(jù)不足以完整的反映文本中的信息。第二個環(huán)節(jié)是在檢索時,由檢索 詞所構(gòu)成的布爾檢索條件描述的僅是檢索詞在文本中的出現(xiàn)條件,因此檢索條 件缺乏描述文本中復(fù)雜語義的能力,這使得用戶無法明確、詳細的描述檢索目 標(biāo)。上述兩個環(huán)節(jié)中存在的不足直接造成了基于簡單關(guān)鍵詞匹配技術(shù)的檢索查 不準(zhǔn)、檢索質(zhì)量不高的結(jié)果。
目前以web服務(wù)器一瀏覽器為主流模式的互聯(lián)網(wǎng)應(yīng)用存在的一個明顯的缺 點是,在絕大多數(shù)情況下人們只能通過瀏覽器被動地接收信息,而難以靈活的 對所瀏覽的信息進行加工處理(如標(biāo)記、增添、修改等)并對加工處理后所增 添的信息進行靈活共享,這種信息的單向傳播方式主要是由超文本的信息組織
方式、存取方式以及顯示方式所決定的。雖然有維客(wiki)這樣的應(yīng)用能夠在
線的使人們對瀏覽器中的信息做一些簡單的加工和處理,并對所加工后的信息 進行共享,但這仍然離交互的、便捷的對信息進行再加工并靈活共享加工后所 得信息的目標(biāo)相差甚遠。
相比較于用一維線性文本表達語義的方式,使用圖形或圖畫表達語義則更 加直觀、形象,這種直觀、形象地表達語義的方式最早可以追朔到有文字記載 初期的圖畫文字和象形文字,但是使用圖畫文字和象形文字難以表達某些實體 事物和抽象事物?,F(xiàn)代的概念圖則是一種既保留了圖形表達的直觀,同時又具 有較強抽象語義表達能力的語義表達方式,由于概念圖具有描述一階邏輯的能 力,因此概念圖常常被用來記錄及表達思維過程。概念圖是一種用圖示法來組
織和表達概念及概念間關(guān)系的方法。概念圖最早在20世紀(jì)60年代由美國康奈 兒大學(xué)諾瓦克(Jos印h D. Novak)根據(jù)奧蘇貝爾(David P. Ausubel)的有意 義學(xué)習(xí)理論提出,但概念圖(Conc印t Maps) —詞直到20世紀(jì)80年代才被提 出。Novak認為概念圖是某個主題的概念及其關(guān)系的圖形化表示,概念圖是用 來組織和表征知識的工具。概念圖通常將某一主題的有關(guān)概念放在圓圈或方框 中,然后用連線將相關(guān)的概念和命題連接,連線上標(biāo)明兩個概念之間的意義關(guān) 系(弓l自 Novak, J. D. , The Theory Underlying Concept Maps and How to Construct Them. Cornell University,1982)。
概念圖方法的主要特征是通過圖示的方式在不同的概念間建立各種顯式的 圖形聯(lián)系來直觀地呈現(xiàn)概念及概念之間的關(guān)系。目前市場上的各種概念圖工具 有很多,國外有代表性的部份產(chǎn)品有CmapTools , Conc印tDraw, Inspiration 等,國內(nèi)有代表性的產(chǎn)品有Keystone等。
目前,概念圖工具僅提供了按關(guān)鍵詞檢索的功能,而沒有提供直接檢索復(fù) 雜概念和關(guān)系(由多個簡單概念和關(guān)聯(lián)關(guān)系構(gòu)成的概念和關(guān)系),用戶在檢索時, 只能采取間接的方式,即只能按關(guān)鍵詞檢索到與待査復(fù)雜概念或復(fù)雜關(guān)聯(lián)關(guān)系 相關(guān)的簡單概念或簡單關(guān)系后,先定位到該簡單概念或簡單關(guān)系所在的顯示區(qū) 域,然后再移動該顯示區(qū)域來逐步確認該關(guān)系是否就是待査找目標(biāo)的步驟來完 成檢索,這種交互操作方式繁瑣、并且需花費用戶很大的精力來予以確認。對 這些工具的使用者而言,迫切需要有一種方法能快速檢索概念及概念間關(guān)聯(lián)關(guān) 系的功能,特別是需要有一種方法能快速檢索指定復(fù)雜概念或復(fù)雜關(guān)系的功能。
目前的概念圖工具是以整圖的數(shù)據(jù)為單位來進行存儲、處理和共享,因此, 如果一個概念圖的數(shù)據(jù)量較大,特別是當(dāng)圖中包含的圖像數(shù)據(jù)較多時,整個概 念圖所對應(yīng)的數(shù)據(jù)量就越大,從而導(dǎo)致在通過網(wǎng)絡(luò)進行共享時,數(shù)據(jù)傳輸?shù)倪^ 程中將需要更大的網(wǎng)絡(luò)帶寬以及導(dǎo)致更長的傳輸延遲。由于概念圖軟件把整圖 的數(shù)據(jù)全部放入數(shù)據(jù)處理設(shè)備的內(nèi)存中進行操作,因此對數(shù)據(jù)處理設(shè)備的內(nèi)存
資源要求也較高;整圖數(shù)據(jù)處理方式使得數(shù)據(jù)處理的粒度較大,因而不利于實 現(xiàn)多用戶對概念圖中多個對象的并發(fā)處理及共享,特別是在大規(guī)模多用戶并發(fā) 處理、共享海量概念圖數(shù)據(jù)的情況下,將直接導(dǎo)致數(shù)據(jù)處理系統(tǒng)難以進一步提 高處理性能,并且還會導(dǎo)致在共享海量數(shù)據(jù)時使數(shù)據(jù)訪問沖突的幾率增大,進 而導(dǎo)致出現(xiàn)系統(tǒng)性能瓶頸。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種能直接檢索關(guān)聯(lián)數(shù)據(jù)中的關(guān)聯(lián)信息、便于多用 戶并發(fā)處理并對處理后的信息靈活共享的涉及索引、檢索、數(shù)據(jù)存儲和呈現(xiàn)控 制的信息系統(tǒng)。
本發(fā)明索引系統(tǒng)至少包括兩個有關(guān)聯(lián)關(guān)系的數(shù)據(jù)塊,每個數(shù)據(jù)塊都由位置 信息塊和內(nèi)容信息塊組成,內(nèi)容信息塊是數(shù)據(jù)塊中除了位置信息塊之外的其余 數(shù)據(jù),位置信息塊記錄與本數(shù)據(jù)塊有關(guān)聯(lián)的其它數(shù)據(jù)塊的位置信息;按照以下 步驟生成索引數(shù)據(jù)
(1) .建立序列一選擇一個數(shù)據(jù)塊(a),以其位置信息(Pa)作為序列 的首項,再從數(shù)據(jù)塊(a)的位置信息塊中選取一條位置信息(Pb)作為序列的第2 項,然后從數(shù)據(jù)塊(b)的位置信息塊中選取一條位置信息(P。)作為序列的第 3項,同理,從數(shù)據(jù)塊(c)的位置信息塊中選取的一條位置信息(Pd)作為序列 的第4項,按照這種對應(yīng)關(guān)系建立序列(Pa, Pb, P。,Pd,...),直至位置信息塊 中沒有可選位置信息或該序列的長度達到設(shè)定長度時停止;
(2) .建立序列二以序列一中各位置信息下腳標(biāo)對應(yīng)的數(shù)據(jù)塊中內(nèi)容信
息塊的部份或全部數(shù)據(jù)建立序列(a, Cb, C。, Cd,...);
(3) .建立字符串用至少包括序列二中的每項并且不改變各項間的先后 順序,生成字符串;
(4) .確定索引記錄的關(guān)鍵詞用步驟(3)中所述的字符串作關(guān)鍵詞;
(5) .確定索引記錄的地址信息選擇序列一中至少一個不同項作為地址 息(Pa, Pb, Pc,…);
(6) .將步驟(4)生成的關(guān)鍵詞與步驟(5)確定的地址信息匹配生成一 條索引記錄; (7)重復(fù)步驟(1)到步驟(6),對所有的數(shù)據(jù)塊生成索引數(shù)據(jù)。 對于上述索引系統(tǒng)中序列一的每一項都不相同。關(guān)鍵詞也可以由序列二的 某一子序列的各項生成。
基于上述索引系統(tǒng),本發(fā)明的檢索方法是根據(jù)用戶輸入的信息生成所述 數(shù)據(jù)塊集合,用對應(yīng)于所述索引系統(tǒng)生成關(guān)鍵詞的方法生成檢索詞,然后用該 檢索詞進行檢索,并將結(jié)果顯示出來。
本發(fā)明信息系統(tǒng),至少包括兩個有關(guān)聯(lián)關(guān)系的數(shù)據(jù)塊,每個數(shù)據(jù)塊都由位 置信息塊、內(nèi)容信息塊和幾何信息塊組成,位置信息塊用于記錄與本數(shù)據(jù)塊有關(guān) 聯(lián)的其它數(shù)據(jù)塊的位置信息,幾何信息塊用于記錄數(shù)據(jù)塊在輸出設(shè)備上輸出時 所用到的坐標(biāo)信息和幾何形狀信息,不同數(shù)據(jù)塊的幾何信息可以被獨立地修改, 內(nèi)容信息塊記錄的是數(shù)據(jù)塊中除了位置信息塊和幾何信息塊之外的其余數(shù)據(jù), 每個數(shù)據(jù)塊最終被獨立地存儲在非易失性存儲設(shè)備中,在顯示區(qū)中不屬于任一 當(dāng)前已顯示數(shù)據(jù)塊的幾何區(qū)域里創(chuàng)建的內(nèi)容都被保存在獨立存取的數(shù)據(jù)塊中。
本發(fā)明基于上述信息系統(tǒng)的權(quán)限控制方法是:所述數(shù)據(jù)塊由位置信息塊、權(quán) 限信息塊、幾何信息塊和內(nèi)容信息塊組成,其中內(nèi)容信息塊記錄的是數(shù)據(jù)塊中 除了位置信息塊、幾何信息塊和權(quán)限信息塊之外的信息,權(quán)限信息塊用于記錄 允許哪些用戶進行哪些操作的權(quán)限信息,用戶只能對數(shù)據(jù)塊進行權(quán)限所允許的 操作。
基于上述信息系統(tǒng)的顯示控制方法是按如下步驟控制數(shù)據(jù)塊的顯示
(1) .用兩個空散列表Q和M;
(2) .將已顯示數(shù)據(jù)塊和需要顯示的數(shù)據(jù)塊的位置信息加入其中一個散列 表(Q)中;
(3) .如果Q為空就停止顯示過程,如果Q不為空,則從Q中任選一位置
信息(Pa),并將其對應(yīng)的數(shù)據(jù)塊(a)調(diào)入內(nèi)存;
(4) 將步驟3所述的位置信息(Pa)從Q中移除,將步驟3所述的位置 信息(Pa)加入到M中;
(5)如果所述的位置信息(Pa)所對應(yīng)的數(shù)據(jù)塊(a)所在的幾何區(qū)域與當(dāng)前 顯示區(qū)域相交,則顯示該數(shù)據(jù)塊,否則將該數(shù)據(jù)塊從內(nèi)存中銷毀,并返回步驟
(3);
(6) 如果數(shù)據(jù)塊(a)的位置信息塊的內(nèi)容不為空,則將所有不出現(xiàn)在M中的 (a)的位置塊中的位置信息添加到Q中;
(7) 重復(fù)步驟3-6。
上述顯示控制方法的步驟(5)還可以是如果所述的位置信息(Pa)所對 應(yīng)的數(shù)據(jù)塊(a)所在的幾何區(qū)域與當(dāng)前顯示區(qū)域相交并且用戶具有顯示該數(shù)據(jù) 塊的權(quán)限,則顯示該數(shù)據(jù)塊,否則將該數(shù)據(jù)塊從內(nèi)存中銷毀,并返回步驟(3)。
本發(fā)明的有益效果是本發(fā)明信息系統(tǒng)通過使用獨立存儲的所述數(shù)據(jù)塊來 記錄關(guān)聯(lián)數(shù)據(jù),從而有利于記錄易于檢索的新對象和新關(guān)聯(lián)關(guān)系,并且還有利 于對相應(yīng)數(shù)據(jù)地靈活存取、顯示及共享等處理,特別有助于實現(xiàn)對復(fù)雜對象和 多維關(guān)聯(lián)關(guān)系的索引及檢索,并且使信息(特別是文字信息)的組織使用更符 合現(xiàn)實世界中事物間聯(lián)系的網(wǎng)狀信息組織方式,而不再限于一維序列的組織方 式。在數(shù)據(jù)處理系統(tǒng)中創(chuàng)建有關(guān)聯(lián)關(guān)系的數(shù)據(jù)塊的同時,就可以根據(jù)數(shù)據(jù)塊的 內(nèi)容自動生成專門的關(guān)鍵詞用于記錄數(shù)據(jù)塊間的關(guān)聯(lián)信息,這種方法有助于減 少、甚至避免索引數(shù)據(jù)時語義分析過程中歧義處理的難題。本發(fā)明將反映數(shù)據(jù) 塊之間關(guān)聯(lián)關(guān)系的專門字符串作為索引數(shù)據(jù)和檢索條件的內(nèi)容,使得基于本發(fā) 明的信息系統(tǒng)具備了索引和檢索數(shù)據(jù)塊間復(fù)雜關(guān)聯(lián)關(guān)系的能力,因而有助于實 現(xiàn)較為準(zhǔn)確的檢索(相比較一般的基于關(guān)鍵詞匹配技術(shù)的檢索而言)。本發(fā)明信 息系統(tǒng)通過使用基于數(shù)據(jù)塊的存儲、索引和(二維或多維)圖形化顯示輸出, 實現(xiàn)了對關(guān)聯(lián)信息直觀、便捷地記錄、存儲、檢索和顯示。
本發(fā)明信息系統(tǒng),由于每個數(shù)據(jù)塊都獨立存儲和存取,從而有助于降低多 用戶同時訪問多個數(shù)據(jù)塊時可能發(fā)生訪問沖突的機率,這同時也有利于索引系 統(tǒng)并行建立索引性能的提高。采用獨立的數(shù)據(jù)塊存儲和存取方式也便于基于本 發(fā)明的索引、檢索以及共享功能通過簡單的增添數(shù)據(jù)處理設(shè)備來擴大系統(tǒng)的處 理容量以及提高并行處理能力。用戶在通過網(wǎng)絡(luò)下載數(shù)據(jù)和在客戶端處理數(shù)據(jù) 時,可以優(yōu)先傳輸用戶當(dāng)前所關(guān)心的數(shù)據(jù)(如處于當(dāng)前顯示區(qū)域內(nèi)的數(shù)據(jù)塊), 而沒有被關(guān)注的內(nèi)容(如沒有在當(dāng)前顯示區(qū)域內(nèi)顯示的數(shù)據(jù)塊)則可以在后臺 傳送,或者延后傳送或不傳送; 一旦被關(guān)注數(shù)據(jù)塊不在輸出顯示區(qū)域內(nèi)時,就 可以在將內(nèi)存中的數(shù)據(jù)塊保存到非易失性存儲設(shè)備之后立即將該對象從內(nèi)存中 移除掉。這樣的處理方式有利于降低網(wǎng)絡(luò)帶寬耗占,提高網(wǎng)絡(luò)利用效率,同時 還可以降低用戶端內(nèi)存資源的耗占,特別是在以圖示方式呈現(xiàn)數(shù)據(jù)塊及數(shù)據(jù)塊 間的關(guān)聯(lián)關(guān)系時,使用數(shù)據(jù)塊的存儲方式進行存取和處理,可使得對系統(tǒng)的內(nèi) 存資源耗占率始終保持在較低的水平。當(dāng)輸出設(shè)備支持二維或三維的輸出方式 時,用戶可以通過移動(二維或三維的移動)當(dāng)前顯示區(qū)域來改變傳統(tǒng)的頁面
切換方式的web瀏覽習(xí)慣。使用數(shù)據(jù)塊方式存儲共享信息時,有助于多用戶間 快速、靈活的實現(xiàn)共享信息的編輯、修改、傳輸和呈現(xiàn),因而有利于建立計算 機輔助支持的協(xié)同工作環(huán)境;同時,基于獨立存儲數(shù)據(jù)塊的權(quán)限控制和顯示控 制方法有利于用戶界面程序?qū)崿F(xiàn)靈活的呈現(xiàn)、編輯、修改、刪除及共享數(shù)據(jù)塊 的功能,解決了當(dāng)前互聯(lián)網(wǎng)應(yīng)用中信息處理粒度較大,難以被多用戶對其進行 并行加工處理(如添加、刪除、修改、注解、標(biāo)記等)及靈活共享加工后所得 信息的不足,并且還有助于改變傳統(tǒng)web服務(wù)器一瀏覽器應(yīng)用模式中人常常處 于被動接收信息的境況,從而有助于加速和促進(人的)知識處理(知識的保 存、積累、整理、檢索和分享)的迭代過程,促進知識的演化。
圖l是需建立索引的概念圖
圖2是針對圖1概念圖生成的數(shù)據(jù)塊。
圖3是進行檢索的第一種實施方式的概念圖。
圖4是針對圖3概念圖生成的數(shù)據(jù)塊。
圖5是針對圖3概念圖生成的另一種數(shù)據(jù)塊。
圖6是進行檢索的第二種實施方式的概念圖。
圖7是針對圖6概念圖生成的數(shù)據(jù)塊。
圖8是進行檢索的第三種實施方式的概念圖。
圖9是針對圖8概念圖生成的數(shù)據(jù)塊。
圖IO是進行檢索的第四種實施方式的概念圖。
圖11是針對圖io概念圖生成的數(shù)據(jù)塊。
圖12是基于數(shù)據(jù)塊權(quán)限控制實施方式的概念圖。
圖13是用戶2沒有對用戶1所創(chuàng)建的數(shù)據(jù)塊a、 b、 c的寫權(quán)限時的數(shù)據(jù)塊。 圖14是用戶2擁有對用戶1所創(chuàng)建的數(shù)據(jù)塊a、 b、 c的寫權(quán)限時的數(shù)據(jù)塊。 圖15是基于獨立存儲數(shù)據(jù)塊的顯示控制流程圖。
上述附圖中每個數(shù)據(jù)塊里的幾何信息用于記錄數(shù)據(jù)塊在被顯示時的大小、 形狀和位置。由于如何表示及確定物體間的幾何關(guān)系是非常成熟的技術(shù),為描 述方便,本發(fā)明中沒有對幾何信息的具體表示方式作詳細的說明。
具體實施例方式
一、本發(fā)明索引系統(tǒng)的實施方式
這是一個針對概念圖建立索引的實施方式,參見圖1-圖5。 圖l所示的是一個概念圖,該概念圖中示出了三個概念(概念a、概念b、概 念c)以及這些概念間的聯(lián)系,每一個概念都是一個包含文本的圖形,比如概念 a就是包含有字符串"文本A"的橢圓,概念b就是包含有字符串"文本B"的 橢圓,概念c就是包含有字符串"文本C"的橢圓。概念間的聯(lián)系用線條(如 帶箭頭的直線、曲線等)來表示,線條上的文字用于表示其聯(lián)系的類型,如左 邊帶箭頭的直線,上面有"箭頭1"的字樣,如右邊帶箭頭的直線,上面有"箭 頭2"的字樣,"箭頭1"和"箭頭2"用于標(biāo)識箭頭的關(guān)系。圖1所示的概念 圖中的每個概念和概念間的聯(lián)系都使用不同的數(shù)據(jù)塊表示成圖2的數(shù)據(jù)塊集 合。其中,數(shù)據(jù)塊a用于表示概念a,數(shù)據(jù)塊b用于表示概念b,數(shù)據(jù)塊c用于 表示概念c,數(shù)據(jù)塊d用于表示連接概念a和概念b的箭頭1,數(shù)據(jù)塊e用于表 示連接概念b和概念c的箭頭2。其中,概念a的文本內(nèi)容為"文本A",概念 b包含的文本內(nèi)容為"文本B",概念c包含的文本內(nèi)容為"文本C",箭頭l表 示連接概念a和概念b的箭頭聯(lián)系并且其包含的文本內(nèi)容為"箭頭1",曲線1 表示連接概念a和概念b的曲線聯(lián)系并且包含的文本內(nèi)容為"曲線1",箭頭2 表示連接概念b和概念c的箭頭聯(lián)系并且包含的文本內(nèi)容為"箭頭2"。 數(shù)據(jù)塊的位置信息可以使用URL或URI來表示。 針對圖2數(shù)據(jù)塊建立索引數(shù)據(jù)(假定指定最大序列長度為5):
(1).建立序列一 (本實施方式給出了四種方法)-方法1 :選擇數(shù)據(jù)塊a,以其位置信息Pa (表示下標(biāo)a所對應(yīng)數(shù)據(jù)塊的位置
信息)作為序列的首項,再從數(shù)據(jù)塊a的位置信息塊中選取第一條位置信息Pd
作為序列的第2項,然后從數(shù)據(jù)塊d的位置信息塊中選取第一條位置信息Pa作
為序列的第3項,然后依此類推直到達到指定序列長度,得到序列(Pa, Pd, Pa,
Pd, Pa);
方法2:選擇數(shù)據(jù)塊a,以其位置信息PJ乍為序列的首項,再從數(shù)據(jù)塊a的 位置信息塊中選取第二條位置信息Pf作為序列的第2項,然后從數(shù)據(jù)塊f的位 置信息塊中選取第二條位置信息Pb作為序列的第3項,然后依此類推,得到序 列(Pa, Pr, Pb, Pe, P丄
方法3:選擇數(shù)據(jù)塊a,以其位置信息Pa作為序列的首項,再從數(shù)據(jù)塊a 的位置信息塊中選取序列中未出現(xiàn)的任一位置信息Pd作為序列的第2項,然后 從數(shù)據(jù)塊d的位置信息塊中選取序列中未出現(xiàn)的任一位置信息P"乍為序列的第 3項,然后依此類推,得到序列(Pa, Pd, Pb, h, PJ;
方法4:選擇方法3中所得序列的一個子序列,如(Pa,Pb,巳);
(2) .建立序列二對應(yīng)于步驟一中各方法所生成的位置序列依各位置信 息下腳標(biāo)對應(yīng)的數(shù)據(jù)塊的內(nèi)容信息塊的數(shù)據(jù)建立如下序列
方法l:(文本A,箭頭l,文本A,箭頭1,文本A) 方法2:(文本A,曲線1,文本B,箭頭2,文本C) 方法3:(文本A,箭頭l,文本B,箭頭2,文本C) 方法4:(文本A,文本B,文本C)
(3) .建立字符串
方法l:"文本A箭頭1文本A箭頭1文本A" 方法2:"文本A曲線1文本B箭頭2文本C" 方法3:"文本A箭頭1文本B箭頭2文本C" 方法4:"文本A文本B文本C"
(4) .確定索引數(shù)據(jù)的關(guān)鍵詞用步驟(3)中所述的字符串分別作為不同 的關(guān)鍵詞;
方法l:"文本A箭頭1文本A箭頭1文本A" 方法2:"文本A曲線1文本B箭頭2文本C"
方法3:"文本A箭頭1文本B箭頭2文本C" 方法4:"文本A文本B文本C"
(5) .確定索引數(shù)據(jù)的地址信息將序列一中的一個或多個不同項作為地 址信息;
方法1: Pa, Pd
方法2: Pa, Pf, Pb, Pe,P。
方法3:Pa, Pd, Pb, Pe, Pc 方法4: Pa,Pb,Pc
(6) .生成索引記錄 方法l:["文本A箭頭1文本A箭頭1文本A", (P 方法2:["文本A曲線1文本B箭頭2文本C", (P 方法3:["文本A箭頭1文本B箭頭2文本C", (P 方法4:["文本A文本B文本C",(Pa,Pb,Pc)]
(7) .然后選擇數(shù)據(jù)塊b、 c、 d、 e重復(fù)步驟l-6,生成其它索引數(shù)據(jù)。 在上述的步驟(2)中還可以僅使用內(nèi)容數(shù)據(jù)塊的部份數(shù)據(jù)來生成序列二
方法l: (A,箭頭l, A,箭頭l, A)
方法2: (A,曲線l, B,箭頭2, C)
方法3: (A,箭頭l, B,箭頭2, C)
方法4: (A,B,C) 或者
方法l: (A,箭頭
方法2: (A,曲線
方法3: (A,箭頭
方法4: (A,B,C)
在上述的步驟(3)中還可以采用在每項的兩端添加字符或字符串對來生成字符 串
方法1:"<文本A〉〈箭頭1〉〈文本A〉〈箭頭1〉〈文本A〉" 方法2:"〈文本AX曲線1X文本B〉〈箭頭2><文本C〉"
Pd)]
Pf, Pb, Pe,Pc)]
Pd, Pb, Pe, Pc)]
,A,箭頭,A) ,B,箭頭,C) ,B,箭頭,C)方法3:"〈文本AX箭頭1〉〈文本BX箭頭2>〈文本C〉" 方法4:"〈文本AX文本BX文本C〉" 在上述的步驟(3)中還可以采用在每項的分隔處添加字符串來生成字符串 方法l:"文本Al箭頭ll文本Al箭頭ll文本A" 方法2:"文本Al曲線1l文本Bl箭頭2l文本C" 方法3:"文本Al箭頭ll文本Bl箭頭2l文本C" 方法4:"文本Al文本Bl文本C" 其中符號"〈"、"〉"和"I"可采用其它字符。
當(dāng)用于關(guān)鍵詞的字符串很長時,在步驟(6)中采用某一散列算法(如MD5、 SHA等,本例中用的MD5散列算法)計算關(guān)鍵詞的散列值,并以該散列值為主 關(guān)鍵詞,以原關(guān)鍵詞為輔關(guān)鍵詞,位置信息不變,生成索引記錄。例如,使用 ANSI編碼字符串,采用散列算法MD5時步驟(6)中得到的索引記錄如下(為 便于描述,使用16進制字符串表示散列值)
方法1: [ "7BF93490B2766297BD08A4247835B3B3","文本A箭頭1文本A 箭頭1文本A",(Pa, Pd)]
方法2: [ "421832D457CB458D13E6E0FB55266C7C","文本A曲線1文本B 箭頭2文本C",(Pa, Pf, Pb, Pe,Pj ]
方法3: [ "6D78190851FE8313BFF46E1438921352","文本A箭頭1文本B 箭頭2文本C",(Pa, Pd, Pb, Pe, Pc)]
方法4: ["2117BB3BF7FC07164614D83FB6416928","文本A文本B文本C", (Pa,Pb,Pc)]
本發(fā)明索引系統(tǒng)中所述數(shù)據(jù)塊的內(nèi)容信息塊可以是文字、圖形、圖像、音 頻、視頻、計算機外部設(shè)備的輸入及輸出指令等數(shù)據(jù)。
二、檢索方法的實施方式 用本發(fā)明檢索方法進行檢索時, 一般的情況下只需直接給出關(guān)聯(lián)數(shù)據(jù)塊, 然后由系統(tǒng)自動產(chǎn)生所述專門字符串進行檢索,也可以人工給出專門的字符串 進行檢索。當(dāng)采用計算機屏幕作為人機交互界面時,用戶可以通過圖示方法檢 索各概念及概念之間的關(guān)系。以下給出了四個圖示檢索實施方式,參見圖3-圖
實施方式一
這是本發(fā)明用于圖示檢索的實施方式參見圖3-圖11。
當(dāng)用戶在檢索時,首先通過人機交互界面給出如圖3所示概念圖,系統(tǒng)將 該概念圖生成如圖4所示數(shù)據(jù)塊集合數(shù)據(jù)塊a表示包含有文本內(nèi)容"A"的概
念a,數(shù)據(jù)塊b表示包含有文本內(nèi)容"B"的概念b,數(shù)據(jù)塊c表示包含有文本 內(nèi)容"C"的概念c,數(shù)據(jù)塊d表示連接概念a和概念b的箭頭1并且包含文本 內(nèi)容"箭頭1",數(shù)據(jù)塊e表示連接概念b和概念c的箭頭2并且包含文本內(nèi)容
"箭頭2",例如,當(dāng)按照步驟(6)的方法4中生成關(guān)鍵詞的方法,可以得到 檢索詞"文本A文本B文本C",然后以該檢索詞査找索引,返回檢索結(jié)果
(Pa,Pb,P。),然后通過人機界面,將對應(yīng)于這些地址的數(shù)據(jù)塊調(diào)入內(nèi)存并根據(jù) 數(shù)據(jù)塊的幾何信息顯示這些數(shù)據(jù)塊,將這些數(shù)據(jù)塊展現(xiàn)給用戶。
圖3還可表示成圖5的數(shù)據(jù)塊集合,其中后綴"-s"表示關(guān)系的起點,后 綴"-e"表示關(guān)系的終點。在生成字符串時,使用的是步驟(1)中方法3的 選取不重復(fù)數(shù)據(jù)塊的方法,這樣也同樣可得到"文本Al箭頭1l文本Bl箭頭21 文本C"等字符串,如果這時是生成索引數(shù)據(jù),那么只需將該字符串與其對應(yīng) 的數(shù)據(jù)塊的位置信息一起存入到數(shù)據(jù)庫中即可。若是在檢索時,那么將得到的 字符串直接到索引數(shù)據(jù)中進行匹配査找并返回結(jié)果即可。
在得到檢索詞"文本A文本B文本C"之后,使用MD5算法得到其散列值
"2117BB3BF7FC07164614D83FB6416928",然后到索引中查找。使用字符串的散 列值作為索引的關(guān)鍵詞可以使得索引使用的存儲空間更少,這是由于MD5散列 算法的結(jié)果只有16個字節(jié),因此可使用更少的索引存儲空間,另外,在查詢的 時候可由客戶端系統(tǒng)先計算出散列值后再到遠程服務(wù)器或其它客戶端進行匹配 查找,從而有利于將計算分?jǐn)傞_來,便于大規(guī)模檢索系統(tǒng)的實現(xiàn)。當(dāng)遇到有相 同的散列值的情況時,然后再以檢索詞作為輔關(guān)鍵詞進行匹配查找即可。
實施方式二參見圖6和圖7。首先用戶給出圖6概念圖,然后系統(tǒng)根據(jù) 圖6所示概念圖生成圖7數(shù)據(jù)塊集合,數(shù)據(jù)塊a用于表示概念a,數(shù)據(jù)塊b用 于表示概念b,數(shù)據(jù)塊c用于表示概念c,數(shù)據(jù)塊d用于表示連接概念a和概念
b的箭頭l,數(shù)據(jù)塊e用于表示連接概念a和概念c的箭頭2。其中,概念a包 含的文本內(nèi)容為"文本A",概念b包含的文本內(nèi)容為"文本B",概念c包含的 文本內(nèi)容為"文本C",箭頭1表示連接概念a和概念b的箭頭聯(lián)系并且其包含 的文本內(nèi)容為"箭頭1",箭頭2表示連接概念b和概念c的箭頭聯(lián)系并且包含 的文本內(nèi)容為"箭頭2"。則可以由圖6所示數(shù)據(jù)塊集合得到檢索詞"文本A| 箭頭I文本B"以及"文本Al箭頭l文本C",在檢索時,取這兩個檢索結(jié)果返回 的位置信息集合的交集作為檢索結(jié)果集,然后將檢索結(jié)果集的數(shù)據(jù)塊調(diào)入內(nèi)存 并根據(jù)數(shù)據(jù)塊的幾何信息顯示這些數(shù)據(jù)塊,將這些數(shù)據(jù)塊展現(xiàn)給用戶。
實施方式三參見圖8和圖9,反映的是具有包含關(guān)系的概念,在這種情 況下,概念間的關(guān)系用現(xiàn)有技術(shù)中文本是難以描述的。特別是圖示的內(nèi)容中所 包含的概念非常多,并且被包含的概念間具有復(fù)雜關(guān)系時,采用本發(fā)明數(shù)據(jù)塊 的組織方式來顯式的區(qū)分概念以及采用位置信息塊來顯式的表明概念間的抽象 關(guān)系,可以準(zhǔn)確地反映圖示中所存關(guān)系的信息,并進而以此生成準(zhǔn)確的關(guān)系索 引數(shù)據(jù)。首先用戶給出圖8概念圖,然后系統(tǒng)根據(jù)圖8概念圖生成圖9中的數(shù) 據(jù)塊,其中,當(dāng)有某個概念的顯示區(qū)域包含其它概念時,則生成一個新的數(shù)據(jù) 塊用于表示這種包含關(guān)系,并且該新數(shù)據(jù)塊的內(nèi)容信息塊的文本內(nèi)容為"包含", 位置信息塊則包含有滿足被包含關(guān)系的所有數(shù)據(jù)塊的位置信息,數(shù)據(jù)塊a用于 表示概念a,數(shù)據(jù)塊b用于表示概念b,數(shù)據(jù)塊c用于表示概念c,數(shù)據(jù)塊d用 于表示連接概念b和概念c的箭頭,數(shù)據(jù)塊e用于表示概念a包含概念b、概 念c以及箭頭的關(guān)系。其中,概念a的文本內(nèi)容為"文本A",概念b包含的文 本內(nèi)容為"文本B",概念c包含的文本內(nèi)容為"文本C",箭頭表示連接概念b 和概念c的箭頭聯(lián)系并且其包含的文本內(nèi)容為"箭頭",可以由圖9所示數(shù)據(jù)塊 集合得到檢索字符串"〈文本A〉〈包含X〈文本B〉〈箭頭〉〈文本D〉"。在索引中 檢索后,將得到的地址信息對應(yīng)的數(shù)據(jù)塊調(diào)入內(nèi)存并根據(jù)數(shù)據(jù)塊的幾何信息顯 示這些數(shù)據(jù)塊,將這些數(shù)據(jù)塊展現(xiàn)給用戶。
實施方式四參見圖10和圖11。該實施方式表示的是各概念間有相交關(guān) 系的首先由用戶給出圖10所示概念圖,然后系統(tǒng)根據(jù)圖10生成圖11數(shù)據(jù)塊 集合,其中,數(shù)據(jù)塊a用于表示概念a,數(shù)據(jù)塊b用于表示概念b,由圖ll數(shù)據(jù)塊集合可得到檢索字符串"〈A〉〈相交〉〈B〉"后進行檢索。然后再將對應(yīng)于檢 索結(jié)果(地址信息)的數(shù)據(jù)塊調(diào)入內(nèi)存并根據(jù)數(shù)據(jù)塊的幾何信息顯示這些數(shù)據(jù) 塊,將這些數(shù)據(jù)塊展現(xiàn)給用戶。
本發(fā)明所述索引或檢索系統(tǒng)在生成關(guān)鍵詞的步驟(1)中若指定的長度為l 時,則索弓I或檢索等價于現(xiàn)有的基于關(guān)鍵詞的索弓I或檢索系統(tǒng)。
本發(fā)明所述索引或檢索系統(tǒng)還可拓展到三維或更多維人機交互界面的情形, 這時幾何信息塊中的數(shù)據(jù)包括更多維的空間信息。本發(fā)明特別適用于可表示為 具有邏輯關(guān)聯(lián)、時間關(guān)聯(lián)或空間關(guān)聯(lián)的多個事件、多個事物或多個對象間關(guān)聯(lián) 信息的記錄和査詢,例如地理信息、書籍分類信息等。
從上述四種檢索實施方式可以看出,當(dāng)用戶使用本發(fā)明中描述的圖示檢索方 法時,用戶只需設(shè)定好圖示關(guān)系中的概念以及概念間的關(guān)聯(lián)關(guān)系,系統(tǒng)自動將 其轉(zhuǎn)換為對應(yīng)的數(shù)據(jù)塊表示之后,根據(jù)本發(fā)明所述方法生成專門的字符串,再 以該字符串作為檢索條件就可對圖示中所具有的概念間關(guān)聯(lián)關(guān)系進行檢索,這 種方法直觀明了,且更接近于人類的自然表達方式,從而可以在檢索時使用戶 更多的關(guān)注于如何描述所要查找的內(nèi)容,而無需關(guān)注與査詢內(nèi)容對應(yīng)的專門的 字符串的具體寫法,這給該該信息系統(tǒng)的使用者提供了便利的人機交互界面; 同時,由于這種圖示檢索方法較普通關(guān)鍵詞檢索方法更能夠直觀、便捷地描述 事物與事物或?qū)ο笈c對象間的關(guān)聯(lián)關(guān)系(如通過時間或空間關(guān)聯(lián)起來的事物或 對象之間的關(guān)聯(lián)關(guān)系),因此有助于人們在檢索時更準(zhǔn)確的描述所想要查詢的內(nèi) 容。
用戶還可以給出更為復(fù)雜的概念圖,用戶只需設(shè)定好概念及概念之間的關(guān) 系,由于這些概念圖都可以生成與概念圖相對應(yīng)的數(shù)據(jù)塊集合,因此,在關(guān)系 索引數(shù)據(jù)足夠詳盡的前提下,檢索時所提供的關(guān)聯(lián)關(guān)系越完整或越詳細(如使 用步驟(1)中的方法三來生成專門的關(guān)鍵詞進行檢索),則以該概念示作 為檢索條件進行檢索,就可以得到越準(zhǔn)確的檢索結(jié)果。如果以圖示中存在的部 份關(guān)系描述式為檢索條件,則檢索系統(tǒng)可以給出與完整圖示關(guān)系相關(guān)、相似或 相近的檢索結(jié)果。
本發(fā)明的索引和檢索系統(tǒng)并不局限于概念圖這樣的應(yīng)用,概念圖僅僅是本
發(fā)明中所述數(shù)據(jù)塊及其間關(guān)聯(lián)關(guān)系的呈現(xiàn)方式之一,數(shù)據(jù)塊的呈現(xiàn)或表現(xiàn)方式 還可以有其它的方式,例如三維的立體表示。另外,在概念圖這種數(shù)據(jù)呈現(xiàn)方 法中, 一些聯(lián)系也無需顯式地呈現(xiàn)出來,這種聯(lián)系是無形的,但卻是可以被檢 索的,這種無形的聯(lián)系,可以通過預(yù)先設(shè)定的規(guī)則得到,例如數(shù)據(jù)塊在被呈現(xiàn) 的時候,通過測量它們之間的幾何區(qū)域可以得到它們之間相互的幾何信息,如 被包含、相交、所在的相對方位、距離等,這些內(nèi)容都可以被編碼在數(shù)據(jù)塊中, 并且也可以成為索引的對象,從而可以實現(xiàn)對這些信息地檢索。
三、本發(fā)明信息系統(tǒng)的實施例在顯示屏幕上有圖3所示概念圖,根據(jù)關(guān) 聯(lián)關(guān)系信息的保存方式的不同(把關(guān)聯(lián)關(guān)系獨立的和非獨立存儲),在非易失性 存儲設(shè)備上或者存儲為五個(參見圖4,把關(guān)聯(lián)關(guān)系獨立存儲時)或者存儲為三 個(參見圖5,把關(guān)聯(lián)關(guān)系作為內(nèi)容數(shù)據(jù)的一部份存儲時)獨立存儲的數(shù)據(jù)塊。 這個信息系統(tǒng)的每個數(shù)據(jù)塊都由位置信息塊、內(nèi)容信息塊和幾何信息塊三部份 組成,位置信息塊用于記錄與本數(shù)據(jù)塊有關(guān)聯(lián)的其它數(shù)據(jù)塊的存儲位置信息,幾 何信息塊用于記錄數(shù)據(jù)塊在屏幕上輸出時的坐標(biāo)信息和幾何形狀信息,例如,
在圖3中概念a的圖形(橢圓)在被用戶移動時,如果用戶擁有修改數(shù)據(jù)塊a (對 應(yīng)于概念a的數(shù)據(jù)塊)的權(quán)限時,則數(shù)據(jù)塊a的幾何信息可以被獨立地修改并 被記錄下來,內(nèi)容信息塊記錄的是數(shù)據(jù)塊中除了位置信息塊和幾何信息塊之外 的其余數(shù)據(jù),系統(tǒng)中創(chuàng)建的每個新數(shù)據(jù)塊被獨立地存儲在非易失性存儲設(shè)備中。 數(shù)據(jù)塊的操作分為兩種情況第一種是把關(guān)聯(lián)關(guān)系作為獨立存儲的數(shù)據(jù)塊時(參 見圖4),首先在顯示區(qū)中標(biāo)出一個幾何區(qū)域,并在這個區(qū)域內(nèi)填上"文本A" 用于表示概念a,對應(yīng)于這個幾何區(qū)域的數(shù)據(jù)塊a是獨立存儲的,同理可建立 數(shù)據(jù)塊b和數(shù)據(jù)塊c,當(dāng)在概念a和概念b之間建立"箭頭l"的聯(lián)系時,建立 一個新的數(shù)據(jù)塊d用于表示"箭頭1",并且在數(shù)據(jù)塊a和數(shù)據(jù)塊b的位置信息 塊中都插入位置信息Pd,在數(shù)據(jù)塊d的位置信息塊中插入Pa和Pb,類似的,在 概念b和概念c之間建立"箭頭2"聯(lián)系時,則生成數(shù)據(jù)塊e,并且在數(shù)據(jù)塊e 的位置信息塊中插入Pb和P 。,同時在數(shù)據(jù)塊b和c的位置信息塊中都插入P 6。 當(dāng)要刪除概念a和概念b之間的箭頭1聯(lián)系時,則將P d從數(shù)據(jù)塊a、 b的位置 信息塊中刪除掉,并且將數(shù)據(jù)塊d從非易失性存儲設(shè)備中刪除掉,在修改概念
的幾何位置或外觀時,只需修改相應(yīng)數(shù)據(jù)塊的坐標(biāo)或幾何形狀信息。第二種情 形是把關(guān)聯(lián)關(guān)系作為內(nèi)容數(shù)據(jù)塊的一部份時的情形(參見圖5),首先在顯示區(qū)
中標(biāo)出一個幾何區(qū)域,并在這個區(qū)域內(nèi)填上"文本A"用于表示概念a,對應(yīng)于 這個幾何區(qū)域的數(shù)據(jù)塊a是獨立存儲的,同理可建立數(shù)據(jù)塊b和數(shù)據(jù)塊c,當(dāng) 在概念a和概念b之間建立"箭頭1"的聯(lián)系時,在數(shù)據(jù)塊a的位置信息塊中 插入Pb,并且在數(shù)據(jù)塊a的內(nèi)容數(shù)據(jù)中的某個區(qū)域?qū)懮蠈?yīng)聯(lián)系的名稱"箭頭 1-s" , "-s"表示起點,(如果系統(tǒng)采用事先定義的箭頭的呈現(xiàn)方式的話(例如 采用連接兩個概念的直線箭頭時,該箭頭可以直接由兩個概念的中心坐標(biāo)以及 其邊界來確定),那么可以只記錄箭頭的名稱而不用記錄關(guān)聯(lián)關(guān)系的幾何信息, 否則,為了詳細的體現(xiàn)每一聯(lián)系的具體幾何形狀,因此可以在內(nèi)容信息中同時 記錄該關(guān)聯(lián)關(guān)系的幾何信息。內(nèi)容數(shù)據(jù)中記錄關(guān)聯(lián)關(guān)系名稱或類型的區(qū)域的每 項的秩序與位置信息塊中每個位置信息的秩序是對應(yīng)的),同樣的,在數(shù)據(jù)塊b 的位置信息塊中插入Pa,并且在數(shù)據(jù)塊b的內(nèi)容信息塊中記錄對應(yīng)于h的關(guān)系 關(guān)系信息"箭頭l-e", "-e"表示關(guān)聯(lián)關(guān)系的終點,類似的,在概念b和概念 c之間建立"箭頭2"聯(lián)系時,則在數(shù)據(jù)塊b的位置信息塊中添加P。并且在數(shù)據(jù) 塊b的內(nèi)容信息塊中的對應(yīng)區(qū)域記錄上"箭頭2-s",同時在數(shù)據(jù)塊c的內(nèi)容信 息塊中的對應(yīng)區(qū)域記錄上"箭頭2-e"。當(dāng)要刪除概念a和概念b之間的箭頭1 聯(lián)系時,則將數(shù)據(jù)塊b的位置信息塊里的Pa以及對應(yīng)于Pa的關(guān)聯(lián)關(guān)系幾何信息 從刪除掉,同時將數(shù)據(jù)塊a中的位置信息塊里的Pb以及對應(yīng)于Pb的關(guān)聯(lián)關(guān)系幾 何信息刪除掉,在修改概念的幾何位置或外觀時,只需修改相應(yīng)的坐標(biāo)或幾何 形狀信息即可。
在對本信息系統(tǒng)的數(shù)據(jù)進行索引和檢索時,可以采用傳統(tǒng)的基于一般關(guān)鍵 詞匹配技術(shù)的索引方法和檢索方法,也可以采用本發(fā)明所提供的索引方法和檢 索方法。
通過TCP/IP協(xié)議或P2P協(xié)議,在兩個或多個基于本發(fā)明信息系統(tǒng)的信息系 統(tǒng)之間可以建立網(wǎng)絡(luò)連接,從而實現(xiàn)在多個系統(tǒng)之間檢索并下載其所存儲的數(shù) 據(jù)塊,由于將每個概念的圖示用獨立存取的數(shù)據(jù)塊來共享和實現(xiàn)權(quán)限控制,這 使得實時更新和共享當(dāng)前顯示界面中的概念圖示變得容易起來,從而有助于實
現(xiàn)實時協(xié)作的概念圖網(wǎng)絡(luò)環(huán)境。用戶可以通過設(shè)置每個數(shù)據(jù)塊的權(quán)限信息來決 定是否允許其它用戶存取、修改、刪除或顯示數(shù)據(jù)塊。
本發(fā)明信息系統(tǒng)在呈現(xiàn)數(shù)據(jù)塊時,各數(shù)據(jù)塊之間是可以被相互獨立的修改 的。只要用戶擁有對當(dāng)前數(shù)據(jù)塊的相應(yīng)權(quán)限,就可以修改該數(shù)據(jù)塊中的信息。 比如位置信息、內(nèi)容信息、幾何信息,當(dāng)修改位置信息時,用戶增加或刪除當(dāng) 前數(shù)據(jù)塊與其它數(shù)據(jù)塊的關(guān)聯(lián)關(guān)系,就可以修改位置信息中的相應(yīng)內(nèi)容;幾何 信息同樣也可以被修改(例如創(chuàng)建、移動、旋轉(zhuǎn)、改變圖形等),這一點本發(fā)明 系統(tǒng)與現(xiàn)有技術(shù)中基于格式化文本顯示的系統(tǒng)(如基于超文本顯示的瀏覽器) 是有本質(zhì)區(qū)別的,而本發(fā)明數(shù)據(jù)塊不僅便于體現(xiàn)數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系而且獨立 存儲在非易失性存儲設(shè)備中,這些特點使之能對關(guān)聯(lián)數(shù)據(jù)進行靈活的共享和顯 示控制,并便于多用戶并發(fā)處理,這是現(xiàn)有技術(shù)中概念圖不能實現(xiàn)的。
四、 基于數(shù)據(jù)塊的權(quán)限控制實施例參見圖12、 13、 14
若圖3概念圖是用戶1所創(chuàng)建的,用戶2在圖3所示概念圖上增加一個概 念d (參見圖12),其對應(yīng)的數(shù)據(jù)塊為數(shù)據(jù)塊d (參見圖13),并且概念d的幾 何區(qū)域?qū)⒏拍頰、概念b和概念c的幾何區(qū)域都包含在其內(nèi)部,若用戶2沒有 對用戶l所創(chuàng)建數(shù)據(jù)塊的修改權(quán)限時,這時對應(yīng)生成的數(shù)據(jù)塊集合如圖13所示, 這樣既避免了對用戶1所擁有的數(shù)據(jù)塊進行修改,同時又實現(xiàn)了與被處理信息 的同一顯示區(qū)域中記錄下用戶2加工后得到的信息的目的,這有助于日后用戶 2 了解相關(guān)信息或知識的演化歷史;而當(dāng)用戶2擁有對概念a、 b、 c所對應(yīng)的 數(shù)據(jù)塊的修改權(quán)限時,生成的數(shù)據(jù)塊集合如圖14所示。對數(shù)據(jù)塊中數(shù)據(jù)的刪除、 修改、顯示和存取等操作都根據(jù)數(shù)據(jù)塊中的權(quán)限信息來予以控制。每個數(shù)據(jù)塊 的權(quán)限信息只能或者由創(chuàng)建該數(shù)據(jù)塊的用戶,或者是數(shù)據(jù)塊的權(quán)限塊中記錄的 擁有權(quán)限的用戶,或者是系統(tǒng)管理員才能修改。
五、 數(shù)據(jù)塊的顯示控制流程如圖15所示,顯示控制方法的一個實施例為 若系統(tǒng)已經(jīng)顯示了如圖3所示概念圖,那么當(dāng)界面需要更新時(例如用戶通過 鼠標(biāo)移動當(dāng)前顯示窗口或其中某個概念的位置時,或者創(chuàng)建了新的概念,或者 刪除了某個概念或關(guān)聯(lián)關(guān)系、或者修改了某個概念的幾何信息時,如由橢圓的 外形轉(zhuǎn)為長方形時),就會激發(fā)執(zhí)行一次顯示控制-
(1) 首先清空兩個散列表Q和M;
(2) 將當(dāng)前已顯示的三個數(shù)據(jù)塊(用圖5數(shù)據(jù)塊存儲圖3信息時)的位置信息
加入到Q中;
(3) 如果Q為空則停止顯示控制,否則從Q中任取一位置信息(PJ,如果內(nèi)存 中沒有對應(yīng)數(shù)據(jù)塊(a)的內(nèi)容,則將數(shù)據(jù)塊(a)調(diào)入到內(nèi)存中;
(4) 將(Pa)從Q中刪除,并將(Pa)加入到M中;
(5) 將數(shù)據(jù)塊(a)的幾何信息與當(dāng)前顯示區(qū)域進行比較,如果(a)的幾何區(qū)域 與當(dāng)前顯示區(qū)域相交并且當(dāng)前用戶擁有顯示該數(shù)據(jù)塊的權(quán)限,則根據(jù)數(shù)據(jù) 塊(a)的幾何信息顯示數(shù)據(jù)塊(a),否則將數(shù)據(jù)塊(a)從內(nèi)存中銷毀, 并返回步驟(3);
(6) 將所有不出現(xiàn)在M中的數(shù)據(jù)塊(a)的位置信息塊中的位置信息添加到Q 中;
(7) 重復(fù)步驟(3) - (6)。
當(dāng)用戶在圖3中添加一個概念d時(見圖12和圖13),顯示控制方法的步 驟(2)修改為"將當(dāng)前已顯示的三個數(shù)據(jù)塊(用圖5數(shù)據(jù)塊存儲圖3信息時) 以及數(shù)據(jù)塊d的位置信息加入到Q中",然后重復(fù)步驟(3) - (6)。
權(quán)利要求
1、一種關(guān)聯(lián)數(shù)據(jù)的索引系統(tǒng),其特征在于至少包括兩個有關(guān)聯(lián)關(guān)系的數(shù)據(jù)塊,每個數(shù)據(jù)塊都由位置信息塊和內(nèi)容信息塊組成,內(nèi)容信息塊是數(shù)據(jù)塊中除了位置信息塊之外的其余數(shù)據(jù),位置信息塊用于記錄與本數(shù)據(jù)塊有關(guān)聯(lián)的其它數(shù)據(jù)塊的存儲位置信息;按照以下步驟生成索引數(shù)據(jù)(1).建立序列一選擇一個數(shù)據(jù)塊(a),以其位置信息(Pa)作為序列的首項,再從數(shù)據(jù)塊(a)的位置信息塊中選取一條位置信息(Pb)作為序列的第2項,然后從數(shù)據(jù)塊(b)的位置信息塊中選取一條位置信息(Pc)作為序列的第3項,同理,從數(shù)據(jù)塊(c)的位置信息塊中選取的一條位置信息(Pd)作為序列的第4項,按照這種對應(yīng)關(guān)系建立序列(Pa,Pb,Pc,Pd,...),直至位置信息塊中沒有可選位置信息或該序列的長度達到設(shè)定長度時停止;(2).建立序列二以序列一中各位置信息下腳標(biāo)對應(yīng)的數(shù)據(jù)塊中內(nèi)容信息塊的部份或全部數(shù)據(jù)建立序列(Ca,Cb,Cc,Cd,...);(3).建立字符串用至少包括序列二中的每項并且不改變各項間的先后順序,生成字符串;(4).確定關(guān)鍵詞用步驟(3)中所述的字符串作關(guān)鍵詞;(5).確定地址信息選擇序列一中至少一個不同項作為地址信息(Pa,Pb,Pc,...);(6).將步驟(4)生成的關(guān)鍵詞與步驟(5)確定的地址信息匹配生成一條索引記錄;(7)重復(fù)步驟(1)到步驟(6),對所有的數(shù)據(jù)塊生成索引數(shù)據(jù)。
2、 根據(jù)權(quán)利要求1所述的索引系統(tǒng),其特征在于所述序列一的每一項都不 相同。
3、 根據(jù)權(quán)利要求1或2所述的索引系統(tǒng),其特征在于將序列二中的至少一 項(Ca)所指代的內(nèi)容數(shù)據(jù)劃成n個區(qū)域,構(gòu)建長度為m的序列三,l<m《n, 該序列中的每項選擇所述n個區(qū)域中的某個區(qū)域的數(shù)據(jù),用至少包括序列三中 的每項生成字符串,用該字符串替換步驟(3)所述字符串中的對應(yīng)項(QO。
4、 根據(jù)權(quán)利要求l一3之一所述的索引系統(tǒng),其特征在于關(guān)鍵詞由序列二的某一子序列的各項生成。
5、 根據(jù)權(quán)利要求l一4之一所述的索引系統(tǒng),其特征在于以所述關(guān)鍵詞經(jīng) 過散列算法處理后得到的散列值作為索引數(shù)據(jù)的主關(guān)鍵詞,以所述關(guān)鍵詞作為索引數(shù)據(jù)的輔關(guān)鍵詞。
6、 一種對應(yīng)于權(quán)利要求1-5之一所述索引系統(tǒng)的檢索方法,其特征在于根 據(jù)用戶輸入的信息而生成的所述數(shù)據(jù)塊集合,用對應(yīng)于所述索引系統(tǒng)生成關(guān)鍵 詞的方法生成檢索詞,然后用該檢索詞進行檢索,并將結(jié)果顯示出來。
7、 一種信息系統(tǒng),其特征在于至少包括兩個有關(guān)聯(lián)關(guān)系的數(shù)據(jù)塊,每個數(shù) 據(jù)塊都由位置信息塊、內(nèi)容信息塊和幾何信息塊組成,位置信息塊用于記錄與本 數(shù)據(jù)塊有關(guān)聯(lián)的其它數(shù)據(jù)塊的位置信息,幾何信息塊用于記錄數(shù)據(jù)塊在輸出設(shè) 備上輸出時所用到的坐標(biāo)信息和幾何形狀信息,不同數(shù)據(jù)塊的幾何信息可以被 獨立地修改,內(nèi)容信息塊記錄的是數(shù)據(jù)塊中除了位置信息塊和幾何信息塊之外 的其余數(shù)據(jù),每個數(shù)據(jù)塊最終被獨立地存儲在非易失性存儲設(shè)備中,在顯示區(qū)中 不屬于任一當(dāng)前已顯示數(shù)據(jù)塊的幾何區(qū)域里創(chuàng)建的內(nèi)容都被保存在獨立存取的 數(shù)據(jù)塊中。
8、 一種基于權(quán)利要求7所述的信息系統(tǒng)的權(quán)限控制方法,其特征在于, 所述數(shù)據(jù)塊由位置信息塊、權(quán)限信息塊、幾何信息塊和內(nèi)容信息塊組成,權(quán)限 控制信息塊用于記錄哪些用戶可以進行哪些操作的權(quán)限信息,其中內(nèi)容信息塊 記錄的是數(shù)據(jù)塊中除了位置信息塊、幾何信息塊和權(quán)限信息塊之外的信息,用 戶只能對數(shù)據(jù)塊進行權(quán)限所允許的操作。
9、 一種基于權(quán)利要求7所述的信息系統(tǒng)的顯示控制方法,其特征在于按如 下步驟控制數(shù)據(jù)塊的顯示-(1) .用兩個空散列表Q和M;(2) .將需要顯示的數(shù)據(jù)塊和已經(jīng)在顯示區(qū)中被呈現(xiàn)的數(shù)據(jù)塊的位置信息 加入其中一個散列表(Q)中;(3) .如果Q為空就停止顯示控制過程,如果Q不為空,則從Q中任選一 位置信息(Pa),如果內(nèi)存中沒有與其對應(yīng)的數(shù)據(jù)塊,則將其對應(yīng)的數(shù)據(jù)塊(a)調(diào) 入內(nèi)存;(4)將步驟3所述的位置信息(Pa)從Q中移除,將步驟3所述的位置信 息(Pa)加入到M中;(5) 如果所述的位置信息(Pa)所對應(yīng)的數(shù)據(jù)塊(a)所在的幾何區(qū)域與當(dāng)前 顯示區(qū)域相交,則顯示該數(shù)據(jù)塊,否則將該數(shù)據(jù)塊從內(nèi)存中銷毀,并返回步驟(3);(6) 將所有不出現(xiàn)在M中的數(shù)據(jù)塊(a)的位置塊中的位置信息添加到Q中;(7) 重復(fù)步驟3-6。
10、 一種基于權(quán)利要求8所述的信息系統(tǒng)的顯示控制方法,其特征在于按 如下步驟控制數(shù)據(jù)塊的顯示(1) .用兩個空散列表Q和M;(2) .將需要顯示的數(shù)據(jù)塊和己經(jīng)在顯示區(qū)中被呈現(xiàn)的數(shù)據(jù)塊的位置信息 加入其中一個散列表(Q)中;(3) .如果Q為空就停止顯示控制過程,如果Q不為空,則從Q中任選一 位置信息(Pa),如果內(nèi)存中沒有與其對應(yīng)的數(shù)據(jù)塊,則將其對應(yīng)的數(shù)據(jù)塊(a)調(diào) 入內(nèi)存;(4) 將步驟3所述的位置信息(Pa)從Q中移除,將步驟3所述的位置信 息(Pa)加入到M中;(5) 如果所述的位置信息(Pa)所對應(yīng)的數(shù)據(jù)塊(a)所在的幾何區(qū)域與當(dāng)前 顯示區(qū)域相交并且用戶具有顯示該數(shù)據(jù)塊的權(quán)限,則顯示該數(shù)據(jù)塊,否則將該 數(shù)據(jù)塊從內(nèi)存中銷毀,并返回步驟(3);(6) 將所有不出現(xiàn)在M中的數(shù)據(jù)塊(a)的位置塊中的位置信息添加到Q中;(7) 重復(fù)步驟3-6。
全文摘要
本發(fā)明公開了一種涉及關(guān)聯(lián)數(shù)據(jù)的索引、檢索、存儲和顯示控制的信息系統(tǒng)。本發(fā)明索引系統(tǒng)至少包括兩個有關(guān)聯(lián)關(guān)系的數(shù)據(jù)塊,每個數(shù)據(jù)塊都由位置信息塊和內(nèi)容信息塊組成,內(nèi)容信息塊是數(shù)據(jù)塊中除了位置信息塊之外的其余數(shù)據(jù),位置信息塊記錄與本數(shù)據(jù)塊有關(guān)聯(lián)的其它數(shù)據(jù)塊的位置信息,按規(guī)定步驟生成索引數(shù)據(jù),檢索方法是根據(jù)用戶輸入的信息生成所述數(shù)據(jù)塊集合,用對應(yīng)于所述索引系統(tǒng)生成關(guān)鍵詞的方法生成檢索詞,然后用該檢索詞進行檢索,并將結(jié)果顯示出來?;跀?shù)據(jù)塊與當(dāng)前顯示區(qū)的幾何關(guān)系進行顯示控制。利用本發(fā)明系統(tǒng)能直接檢索關(guān)聯(lián)數(shù)據(jù)中的關(guān)聯(lián)信息、便于實現(xiàn)多用戶并發(fā)處理并對處理后的信息靈活共享。
文檔編號G06F17/30GK101178733SQ20071019253
公開日2008年5月14日 申請日期2007年12月7日 優(yōu)先權(quán)日2007年12月7日
發(fā)明者彭海杰 申請人:彭海杰