基于可配置模板的異構(gòu)數(shù)據(jù)庫(kù)集成方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于知識(shí)管理與數(shù)據(jù)集成技術(shù)領(lǐng)域,涉及一種基于可配置模板的異構(gòu)數(shù)據(jù)庫(kù)集成方法。
【背景技術(shù)】
[0002]隨著大數(shù)據(jù)時(shí)代的到來(lái)和知識(shí)經(jīng)濟(jì)的深入發(fā)展,企業(yè)、研宄所等研發(fā)和生產(chǎn)機(jī)構(gòu)愈發(fā)重視對(duì)知識(shí)的管理,實(shí)施了許多信息化軟件,并產(chǎn)生了大量的數(shù)據(jù),分別存儲(chǔ)于不同的數(shù)據(jù)庫(kù)中。而相對(duì)獨(dú)立、缺乏組織的知識(shí)難以發(fā)揮充分的價(jià)值,因此需要通過(guò)對(duì)異構(gòu)數(shù)據(jù)庫(kù)的集成將這些資源進(jìn)行有效的整合。
[0003]這些數(shù)據(jù)庫(kù)具有系統(tǒng)異構(gòu)、結(jié)構(gòu)異構(gòu)等特點(diǎn),稱(chēng)為異構(gòu)數(shù)據(jù)庫(kù)。常規(guī)的集成方法多采取定制的方式,對(duì)現(xiàn)有的異構(gòu)數(shù)據(jù)庫(kù)進(jìn)行集成,且要求在集成之前,完成對(duì)這些數(shù)據(jù)庫(kù)結(jié)構(gòu)的讀取工作,為后期構(gòu)建檢索語(yǔ)句提供基礎(chǔ),此步驟是實(shí)現(xiàn)集成方法的重要部分。而當(dāng)用戶提出新的需求時(shí),則需要人工對(duì)平臺(tái)進(jìn)行維護(hù)和改進(jìn),是一個(gè)漫長(zhǎng)而復(fù)雜的過(guò)程。當(dāng)前也存在一些支持用戶導(dǎo)入和管理數(shù)據(jù)庫(kù)的集成方法,但是,這些集成方法只能夠?qū)崿F(xiàn)初步的集成,在集成檢索中向用戶返回最基本的檢索字段,當(dāng)用戶對(duì)知識(shí)詳細(xì)內(nèi)容和結(jié)構(gòu)有進(jìn)一步需求時(shí),往往采取自動(dòng)獲取數(shù)據(jù)庫(kù)關(guān)聯(lián)表的方式向用戶返回一些可能相關(guān)的信息,而這些信息往往具有準(zhǔn)確度低、缺乏組織等特點(diǎn)。為解決此問(wèn)題,用戶往往要到該條知識(shí)所在的相應(yīng)信息系統(tǒng)或數(shù)據(jù)庫(kù)中進(jìn)行二次檢索。以上現(xiàn)象反映出現(xiàn)有的集成方法不能夠兼顧配置柔性和集成深度,使得集成平臺(tái)的開(kāi)放性和資源的整合程度難以滿足用戶的需求。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的是為了克服已有技術(shù)的缺陷,解決集成檢索平臺(tái)不能夠兼顧配置柔性和集成深度,使得集成平臺(tái)的開(kāi)放性和資源的整合程度難以滿足用戶需求的問(wèn)題,提出一種基于可配置模板的異構(gòu)數(shù)據(jù)庫(kù)集成方法。
[0005]本發(fā)明方法是通過(guò)下述技術(shù)方案實(shí)現(xiàn)的:
[0006]一種基于可配置模板的異構(gòu)數(shù)據(jù)庫(kù)集成方法,包括以下步驟:
[0007]步驟一、輸入待集成數(shù)據(jù)源的基本信息,新建知識(shí)模板,配置各個(gè)字段在數(shù)據(jù)源中的關(guān)聯(lián)關(guān)系,形成新的知識(shí)組織結(jié)構(gòu);
[0008]步驟二、為新建知識(shí)模板中的各個(gè)字段匹配屬性類(lèi)型,形成知識(shí)模板的展示界面;
[0009]步驟三、通過(guò)對(duì)各知識(shí)模板的索引表進(jìn)行跨庫(kù)檢索,返回檢索列表,基于用戶的點(diǎn)選,按照該條目所屬知識(shí)模板的組織結(jié)構(gòu)進(jìn)行深度檢索,并以所屬的知識(shí)模板為載體表達(dá)詳細(xì)內(nèi)容。
[0010]自此,就完成了/實(shí)現(xiàn)了基于可配置模板的異構(gòu)數(shù)據(jù)庫(kù)集成方法。
[0011]進(jìn)一步地,可配置模板的構(gòu)建包括三個(gè)要素:數(shù)據(jù)源基本信息、知識(shí)組織結(jié)構(gòu)和知識(shí)模板;數(shù)據(jù)源基本信息包括各個(gè)待集成數(shù)據(jù)庫(kù)的類(lèi)型、URL、用戶名、密碼,根據(jù)數(shù)據(jù)庫(kù)的不同類(lèi)型設(shè)置相應(yīng)的鏈接方法;知識(shí)組織結(jié)構(gòu)通過(guò)讀取各個(gè)數(shù)據(jù)庫(kù)的數(shù)據(jù)結(jié)構(gòu),截取其中的部分信息,根據(jù)用戶需求重新組合,組織成為新的知識(shí)架構(gòu);知識(shí)模板根據(jù)知識(shí)組織結(jié)構(gòu)從模板屬性類(lèi)型表配置生成的模板,被用來(lái)向用戶展示集成后的知識(shí)內(nèi)容和結(jié)構(gòu),并將模板的構(gòu)建規(guī)則將會(huì)存儲(chǔ)于模板庫(kù)中。
[0012]進(jìn)一步地,步驟一中配置過(guò)程如下:
[0013](I)導(dǎo)入所有待集成數(shù)據(jù)源的基本信息;
[0014](2)新建知識(shí)模板;
[0015](3)選擇索引表;每個(gè)知識(shí)模板對(duì)應(yīng)一個(gè)索引表,通過(guò)用戶需求與索引表中信息的匹配,返回給用戶相應(yīng)的知識(shí)條目;
[0016](4)新建知識(shí)模板字段;
[0017](5)選擇該字段對(duì)應(yīng)的數(shù)據(jù)庫(kù)中的表名和列名;
[0018](6)配置該字段與索引主表的映射關(guān)系:采用迭代配置的方法逐步遞進(jìn),通過(guò)邏輯關(guān)系配置,引導(dǎo)用戶將兩者之間映射關(guān)系存儲(chǔ)到模板庫(kù)中。
[0019]本發(fā)明的有益效果:
[0020](I)通過(guò)對(duì)異構(gòu)數(shù)據(jù)庫(kù)的深度集成,僅需在導(dǎo)入數(shù)據(jù)庫(kù)時(shí)進(jìn)行單次配置,即可在初步檢索的基礎(chǔ)上繼續(xù)深度挖掘知識(shí)的詳細(xì)信息,克服了傳統(tǒng)集成平臺(tái)在信息檢索中不能滿足用戶對(duì)知識(shí)詳情進(jìn)一步需求的缺陷。
[0021](2)通過(guò)柔性配置和存儲(chǔ)的機(jī)制,當(dāng)集成環(huán)境中的數(shù)據(jù)庫(kù)結(jié)構(gòu)等信息變化時(shí),支持用戶動(dòng)態(tài)的配置和變更相應(yīng)參數(shù),克服了傳統(tǒng)集成平臺(tái)過(guò)度依靠人工維護(hù)和調(diào)試的缺陷,有效提高集成平臺(tái)的實(shí)用性和穩(wěn)定性。
[0022](3)通過(guò)可配置模板整合異構(gòu)數(shù)據(jù)庫(kù)的信息,實(shí)現(xiàn)用戶交互的知識(shí)組織模式,克服知識(shí)集成導(dǎo)致的信息冗余。
【附圖說(shuō)明】
[0023]圖1為知識(shí)組織結(jié)構(gòu)導(dǎo)入流程圖;
[0024]圖2為數(shù)據(jù)源信息-知識(shí)組織結(jié)構(gòu)配置過(guò)程;
[0025]圖3為知識(shí)組織結(jié)構(gòu)-知識(shí)模板配置過(guò)程;
[0026]圖4為面向主索引表的跨庫(kù)檢索與結(jié)果列表。
【具體實(shí)施方式】
[0027](I)可配置知識(shí)模板的構(gòu)建過(guò)程
[0028]可配置知識(shí)模板的構(gòu)建涉及三個(gè)要素:數(shù)據(jù)源基本信息、知識(shí)組織結(jié)構(gòu)和知識(shí)模板。數(shù)據(jù)源基本信息包括各個(gè)待集成數(shù)據(jù)庫(kù)的類(lèi)型(Oracle、MySql、SQLSerVer等)、URL、用戶名、密碼等,本方法會(huì)根據(jù)數(shù)據(jù)庫(kù)的不同類(lèi)型設(shè)置相應(yīng)的鏈接方法。知識(shí)組織結(jié)構(gòu)是指,通過(guò)讀取各個(gè)數(shù)據(jù)庫(kù)的數(shù)據(jù)結(jié)構(gòu),截取其中的部分信息,根據(jù)用戶需求重新組合,組織成為新的知識(shí)架構(gòu)。知識(shí)模板是指,根據(jù)知識(shí)組織結(jié)構(gòu)從模板屬性類(lèi)型表配置生成的模板,被用來(lái)向用戶展示集成后的知識(shí)內(nèi)容和結(jié)構(gòu),這些模板的構(gòu)建規(guī)則將會(huì)存儲(chǔ)于模板庫(kù)中。其中模板屬性類(lèi)型表規(guī)定了知識(shí)模板配置能夠選擇的屬性類(lèi)型范圍,包括數(shù)字、單行文本、多行文本、時(shí)間、圖片、文件、視頻、表格等。這三個(gè)要素之間的互動(dòng)關(guān)系如圖2、3所示,該互動(dòng)關(guān)系展示了模板構(gòu)建的具體過(guò)程,共分為3個(gè)步驟:
[0029]步驟1:新建知識(shí)模板。根據(jù)用戶需求,從各個(gè)數(shù)據(jù)庫(kù)中獲取相應(yīng)的字段信息,并記錄相應(yīng)的名稱(chēng),成為新的知識(shí)組織結(jié)構(gòu)。詳細(xì)的配置過(guò)程如圖1所示:
[0030]1.導(dǎo)入