一種數(shù)據(jù)庫模糊檢索方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種數(shù)據(jù)庫模糊檢索方法和系統(tǒng),該方法包括:對對象圖的檢索以及利用模糊推理的方法計算相關(guān)性分?jǐn)?shù);對對象圖的檢索是根據(jù)對象圖中各個對象之間邊的最小權(quán)重使用寬度優(yōu)先算法來找到最適合的對象目標(biāo);根據(jù)各個對象之間聯(lián)系的重要性來確定各個對象之間具體的權(quán)重值的大??;模糊索引構(gòu)建,分為關(guān)鍵詞模糊索引和對象模糊索引;關(guān)鍵詞索引包括兩部分內(nèi)容;用戶根據(jù)自己想查詢的內(nèi)容輸入具體數(shù)據(jù);通過輸入的檢索關(guān)鍵詞,利用反向擴(kuò)展算法和寬度搜索算法搜索對象圖,得到不同的對象連接樹,這些對象連接樹表示不同的檢索結(jié)果,利用評分機(jī)制計算不同對象連接樹的IR分?jǐn)?shù),將最相關(guān)的檢索結(jié)果反饋給用戶。很好地改善數(shù)據(jù)庫結(jié)構(gòu)對搜索的影響。
【專利說明】
一種數(shù)據(jù)庫模糊檢索方法和系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及基于體育健身服務(wù)平臺管理與設(shè)計背景下的一種數(shù)據(jù)庫模糊檢索方 法,屬于計算機(jī)技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002] 隨著物聯(lián)網(wǎng)地進(jìn)一步發(fā)展,可以展望,物物相連的物聯(lián)網(wǎng)技術(shù)必將產(chǎn)生大量的數(shù) 據(jù)。傳統(tǒng)上,關(guān)系數(shù)據(jù)庫存儲的結(jié)構(gòu)化數(shù)據(jù)可以使用SQL語言查詢,以XML格式存儲的半結(jié)構(gòu) 化數(shù)據(jù)可以使用Xquery語言查詢,而存儲在文件系統(tǒng)和文檔數(shù)據(jù)庫中的非結(jié)構(gòu)化數(shù)據(jù)則使 用關(guān)鍵詞查詢。近年來,在應(yīng)用需求的推動下,數(shù)據(jù)庫信息檢索技術(shù)(Database InformationRetrieval,DBIR)的研究得到快速發(fā)展。DBIR只需用戶輸入檢索關(guān)鍵詞就可以 從關(guān)系數(shù)據(jù)庫中獲取信息,這一技術(shù)使得用戶既不需要了解底層的數(shù)據(jù)庫模式也不需要掌 握SQL語言。DBIR技術(shù)極大地提高了數(shù)據(jù)庫的可用性。但是,很多普通用戶對于數(shù)據(jù)庫中存 儲的具體數(shù)據(jù)名稱可能不能夠準(zhǔn)確掌握,讓用戶使用數(shù)據(jù)庫數(shù)據(jù)很不方便。在信息管理系 統(tǒng)中,許多信息的表示具有二義性,使用者在查詢有關(guān)信息時可能因為信息表示的不同而 找不到所需的數(shù)據(jù),給系統(tǒng)使用者帶來不便。如"計算機(jī)"、"電子計算機(jī)"與"電腦"同義等。 但計算機(jī)是講究精確的機(jī)器,若數(shù)據(jù)庫中保存著的是"計算機(jī)",而你卻按"電腦來進(jìn)行查 詢,這是不可能得到結(jié)果的。而本發(fā)明能夠解決上面的問題。
[0003] 現(xiàn)有技術(shù)大多是對于SATR算法的實現(xiàn),而STAR算法在解決上述問題時存在明顯的 缺點。具體表現(xiàn)在STAR算法簡單地采用隨機(jī)賦值的方式。在STAR算法的迭代優(yōu)化過程中,主 要是依據(jù)路徑值的大小也就是路徑中邊的權(quán)重值,進(jìn)行路徑替換的,隨機(jī)賦值的方式使得 最終檢索結(jié)果所包含的內(nèi)容并不一定具有關(guān)聯(lián)性。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明目的在于解決了上述現(xiàn)有技術(shù)的問題,提出了一種數(shù)據(jù)庫模糊檢索方法, 該方法實現(xiàn)了對STAR算法的改進(jìn),給出基于模糊邏輯的相關(guān)性評分機(jī)制,主要采用模糊推 理方法對對象進(jìn)行最終的評分,提高了檢索效果,在檢索過程中通過構(gòu)建索引以加快檢索 效率。
[0005] 本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:一種數(shù)據(jù)庫模糊檢索方法,該方法 針對一個對象級別的檢索,基于模糊邏輯的對象級別檢索。對象級別檢索算法是對STAR算 法的改進(jìn),主要實現(xiàn)對對象圖的檢索以及利用模糊推理的方法計算相關(guān)性分?jǐn)?shù),同時 D0FSTAR算法還考慮了數(shù)據(jù)庫結(jié)構(gòu)對關(guān)鍵詞檢索的影響。
[0006] 方法流程:
[0007] 步驟1:對對象圖的檢索以及利用模糊推理的方法計算相關(guān)性分?jǐn)?shù);
[0008] 對對象圖的檢索是根據(jù)對象圖中各個對象之間邊的最小權(quán)重使用寬度優(yōu)先算法 來找到最適合的對象目標(biāo)。根據(jù)各個對象之間聯(lián)系的重要性來確定各個對象之間具體的權(quán) 重值的大小。比如,可以根據(jù)各個對象具體關(guān)鍵詞屬性的字符串符合程度或者語義符合程 度來確定關(guān)鍵詞的具體值。
[0009] 步驟2:模糊索引構(gòu)建,分為關(guān)鍵詞模糊索引和對象模糊索引;關(guān)鍵詞索引主要包 括兩部分內(nèi)容,即一個是關(guān)鍵詞模糊索引,主要用于記錄關(guān)鍵詞的IR分?jǐn)?shù)及所屬對象;另一 個是對象模糊索引,主要用于記錄對象所包含的元組和屬性及其各種對象之間的重要性。
[0010] 步驟3:用戶根據(jù)自己想查詢的內(nèi)容輸入具體數(shù)據(jù);
[0011] 步驟4:通過輸入的檢索關(guān)鍵詞,利用反向擴(kuò)展算法和寬度搜索算法搜索對象圖, 可以得到不同的對象連接樹,這些對象連接樹表示了不同的檢索結(jié)果,利用評分機(jī)制計算 不同對象連接樹的IR分?jǐn)?shù),可以將最相關(guān)的檢索結(jié)果反饋給用戶。
[0012] 進(jìn)一步的,本發(fā)明基于模糊邏輯的對象級別檢索算法;所述的對象級別檢索算法 是對STAR算法的改進(jìn),實現(xiàn)對對象圖的檢索以及利用模糊推理的方法計算相關(guān)性分?jǐn)?shù),同 時D0FSTAR算法還考慮了數(shù)據(jù)庫結(jié)構(gòu)對關(guān)鍵詞檢索的影響。實現(xiàn)對對象圖的檢索主要通過 反向擴(kuò)展算法和寬度優(yōu)先搜索算法來實現(xiàn)。
[0013] 進(jìn)一步的,本發(fā)明數(shù)據(jù)庫模糊檢索方法能夠?qū)崿F(xiàn)用戶數(shù)據(jù)的多種轉(zhuǎn)義存儲,以及 檢索時的提供相關(guān)數(shù)據(jù)的任意別名查詢。
[0014] 進(jìn)一步的,本發(fā)明STAR算法就是利用Steiner樹的近似算法解決關(guān)系數(shù)據(jù)圖的關(guān) 鍵詞檢索問題。STAR算法主要分為兩部分:第一部分盡可能找到包含全部查詢關(guān)鍵詞的樹, 采用的是反向擴(kuò)展搜索策略。第二部分是查找圖中低權(quán)重的路徑替換樹中原有的路徑,通 過迭代優(yōu)化樹直到找到最小Steiner樹,主要采用的是寬度優(yōu)先搜索策略。
[0015] 進(jìn)一步的,本發(fā)明包括兩個索引,即:一個是關(guān)鍵詞模糊索引,主要用于記錄關(guān)鍵 詞的IR分?jǐn)?shù)及所屬對象;另一個是對象模糊索引,主要用于記錄對象所包含的元組和屬性 及其各種的重要性。
[0016] 進(jìn)一步的,本發(fā)明記錄關(guān)鍵詞的IR分?jǐn)?shù),對象的IR分?jǐn)?shù)的計算從對象的組成結(jié)構(gòu) 進(jìn)行考慮,即需要分別考慮關(guān)鍵詞在對象主題域和對象描述域中的IR分?jǐn)?shù)。
[0017] 本發(fā)明提供了一種數(shù)據(jù)庫模糊檢索系統(tǒng),該系統(tǒng)包括數(shù)據(jù)庫存儲模塊、算法模塊、 用戶查詢模塊。
[0018] 數(shù)據(jù)庫存儲模塊:用于存儲各種轉(zhuǎn)義數(shù)據(jù)以及存儲關(guān)鍵詞索引信息。當(dāng)用戶輸入 關(guān)鍵詞后,可以根據(jù)關(guān)鍵詞索引來查詢所屬對象,然后定位到相應(yīng)對象后,使用本算法來實 現(xiàn)相近對象的查詢。
[0019] 算法模塊:實現(xiàn)搜索算法。對于用戶輸入的關(guān)鍵詞,本模塊向數(shù)據(jù)庫查詢模塊查詢 關(guān)鍵詞所屬對象,然后經(jīng)過本發(fā)明上述方法的各個步驟查詢出關(guān)鍵詞所屬對象的相近對 象。
[0020] 用戶查詢模塊:主要用于接收用戶輸入的數(shù)據(jù),對于各種不符合格式的數(shù)據(jù)進(jìn)行 相應(yīng)反饋,以及根據(jù)算法模塊的響應(yīng)返回給用戶相應(yīng)數(shù)據(jù)。
[0021] 有益效果:
[0022] 1、本發(fā)明實現(xiàn)了對輸入關(guān)鍵詞的轉(zhuǎn)義查詢,即對一個客觀事物的多種別名之間在 數(shù)據(jù)庫中相當(dāng)于等義結(jié)果。
[0023] 2、本發(fā)明實現(xiàn)了對象級別的模糊查詢。使用對象之間的IR分?jǐn)?shù)的大小,代表對象 之間關(guān)聯(lián)的緊密程度。從而,可以使用本算法找到輸入關(guān)鍵詞對象對象的各個最相近對象。
[0024] 3、本發(fā)明改進(jìn)了STAR算法,考慮了檢索結(jié)點彼此之間的語義相關(guān)性,而不是像 STAR算法一樣簡單地采用隨機(jī)賦值的方式。在STAR算法的迭代優(yōu)化過程中,主要是依據(jù)路 徑值的大小也就是路徑中邊的權(quán)重值,進(jìn)行路徑替換的,隨機(jī)賦值的方式使得最終檢索結(jié) 果所包含的內(nèi)容并不一定具有關(guān)聯(lián)性。
[0025] 4、本發(fā)明能夠很好地改善數(shù)據(jù)庫結(jié)構(gòu)對搜索的影響。
【附圖說明】
[0026] 圖1為本發(fā)明的方法流程圖。
[0027]圖2為本發(fā)明的對象示意圖。
[0028]圖3為本發(fā)明的反向擴(kuò)展搜索結(jié)果圖。
[0029]圖4為本發(fā)明的關(guān)鍵詞模糊索引。
[0030]圖5為本發(fā)明的系統(tǒng)架構(gòu)圖。
【具體實施方式】
[0031]下面結(jié)合說明書附圖對本發(fā)明作進(jìn)一步的詳細(xì)說明。
[0032]如圖1所示,用戶輸入一個精確的輸入值即關(guān)鍵詞輸入,本發(fā)明根據(jù)關(guān)鍵詞在數(shù)據(jù) 庫中索引對應(yīng)的記錄定位到關(guān)鍵詞所屬對象,即進(jìn)行了關(guān)鍵詞的模糊化,然后根據(jù)此對象 在數(shù)據(jù)庫記錄中的IR分?jǐn)?shù)反向擴(kuò)展搜索得到對象優(yōu)化后的連接數(shù),即進(jìn)行了模糊推理。根 據(jù)得到的連接數(shù),取出最小路徑的一條最有路徑得到最符合輸入關(guān)鍵詞的精確輸出結(jié)果進(jìn) 行輸出。
[0033] 如圖2所示,是DBLP對象圖的一部分,輸入查詢關(guān)鍵詞kl = object、k2 = retrieVaK、k3 = databaSe,利用反向擴(kuò)展搜索得到圖3所示的搜索結(jié)果,再進(jìn)行迭代優(yōu)化即 可得到圖2所示的對象連接樹a/T,這是下面本發(fā)明方法的設(shè)計的前提。
[0034] 本發(fā)明方法流程由以下六步組成,包括:
[0035] (1)根據(jù)對象圖的結(jié)構(gòu)計算每條邊的權(quán)重(即對象聯(lián)系的重要性);
[0036] (2)依據(jù)關(guān)鍵詞模糊索引定位對象在對象圖中的位置,同時計算這些對象的IR分 數(shù);
[0037] (3)利用反向擴(kuò)展搜索算法搜索對象圖,得到對象連接樹;
[0038] (4)利用對象圖中低權(quán)重的路徑來替換對象連接樹中的路徑,直到得到的對象連 接樹不能再被優(yōu)化為止;
[0039] (5)根據(jù)包含關(guān)鍵詞的對象的IR分?jǐn)?shù)計算對象連接樹中未包含關(guān)鍵詞的對象的IR 分?jǐn)?shù);
[0040] (6)利用包含關(guān)鍵詞的對象的IR分?jǐn)?shù),不包含關(guān)鍵詞的對象的IR分?jǐn)?shù)以及對象聯(lián) 系的重要性計算對象連接樹a/T的IR分?jǐn)?shù)。
[0041 ]本發(fā)明的數(shù)據(jù)庫模糊檢索方法能夠?qū)崿F(xiàn)用戶數(shù)據(jù)的多種轉(zhuǎn)義存儲,以及檢索時的 提供相關(guān)數(shù)據(jù)的任意別名查詢。檢索時只要使用SQL語句在數(shù)據(jù)庫中根據(jù)關(guān)鍵詞對應(yīng)的字 段得到的關(guān)鍵詞對應(yīng)的關(guān)鍵詞對象,然后使用本算法,就可以得到最符合輸入關(guān)鍵詞的結(jié) 果。
[0042]本發(fā)明的STAR算法就是利用Steiner樹的近似算法解決關(guān)系數(shù)據(jù)圖的關(guān)鍵詞檢索 問題。STAR算法主要分為兩部分:第一部分盡可能找到包含全部查詢關(guān)鍵詞的樹,采用的是 反向擴(kuò)展搜索策略。第二部分是查找圖中低權(quán)重的路徑替換樹中原有的路徑,通過迭代優(yōu) 化樹直到找到最小Steiner樹,主要采用的是寬度優(yōu)先搜索策略。
[0043] 本發(fā)明主要包括兩個索引,即:一個是關(guān)鍵詞模糊索引,主要用于記錄關(guān)鍵詞的IR 分?jǐn)?shù)及所屬對象;另一個是對象模糊索引,主要用于記錄對象所包含的元組和屬性及其各 種的重要性。
[0044] 本發(fā)明所述的一種模糊邏輯的對象級別檢索方法,其特征在于:所述記錄關(guān)鍵詞 的IR分?jǐn)?shù),對象的IR分?jǐn)?shù)的計算從對象的組成結(jié)構(gòu)進(jìn)行考慮,即需要分別考慮關(guān)鍵詞在對 象主題域和對象描述域中的IR分?jǐn)?shù)。
[0045]本發(fā)明是利用模糊數(shù)學(xué)知識,主要是模糊集理論知識與模糊邏輯中的模糊推理方 法,設(shè)計一個基于模糊邏輯的關(guān)系數(shù)據(jù)庫對象級別檢索方法。
[0046] 與STAR算法相比,本發(fā)明設(shè)計的方法首先實現(xiàn)的是對象級別的信息檢索;其次考 慮了檢索結(jié)點彼此之間的語義相關(guān)性,而不是簡單地采用隨機(jī)賦值的方式。在STAR算法的 迭代優(yōu)化過程中,主要是依據(jù)路徑值的大小也就是路徑中邊的權(quán)重值,進(jìn)行路徑替換的,隨 機(jī)賦值的方式使得最終檢索結(jié)果所包含的內(nèi)容并不一定具有關(guān)聯(lián)性;最后設(shè)計的算法不僅 考慮了包含關(guān)鍵詞的結(jié)點的重要性對檢索結(jié)果排序的作用還考慮了不包含關(guān)鍵詞的結(jié)點 對排序的影響。此種算法的偽碼如圖所示。
[0047] 算法 1:D0FSTAR 算法
[0049] 本發(fā)明提出的系統(tǒng)中主要包括兩個索引,即:一個是關(guān)鍵詞模糊索引,主要用于記 錄關(guān)鍵詞的IR分?jǐn)?shù)及所屬對象;另一個是對象模糊索引,主要用于記錄對象所包含的元組 和屬性及其各種的重要性。
[0050] 關(guān)鍵詞模糊索引由關(guān)鍵詞所屬位置、屬性上關(guān)鍵詞的權(quán)重(即IR分?jǐn)?shù))及關(guān)鍵詞所 屬的對象三部分組成。當(dāng)用戶輸入檢索關(guān)鍵詞后,利用關(guān)鍵詞模糊索引可快速定位關(guān)鍵詞 所屬對象,以便實現(xiàn)對對象圖的快速檢索。屬性上關(guān)鍵詞的IR分?jǐn)?shù)未直接利用數(shù)據(jù)庫的全 文檢索得到分?jǐn)?shù),主要考慮實現(xiàn)數(shù)值型關(guān)鍵詞的IR分?jǐn)?shù)的計算,直接采用數(shù)據(jù)庫的全文檢 索無法實現(xiàn)此過程。關(guān)鍵詞模糊索引結(jié)構(gòu)如圖4所示。
[0051]如圖4所示,關(guān)鍵詞模糊索引由關(guān)鍵詞所屬位置、屬性上關(guān)鍵詞的權(quán)重(即IR分?jǐn)?shù)) 及關(guān)鍵詞所屬的對象三部分組成。當(dāng)用戶輸入檢索關(guān)鍵詞后,利用關(guān)鍵詞模糊索引快速定 位關(guān)鍵詞所屬對象,以便實現(xiàn)對對象圖的快速檢索。屬性上關(guān)鍵詞的IR分?jǐn)?shù)未直接利用數(shù) 據(jù)庫的全文檢索得到分?jǐn)?shù),主要考慮實現(xiàn)數(shù)值型關(guān)鍵詞的IR分?jǐn)?shù)的計算,直接采用數(shù)據(jù)庫 的全文檢索無法實現(xiàn)此過程。
[0052] 對象模糊索引由構(gòu)成對象的元組、元組重要性、屬性及屬性重要性組成。通過對象 模糊索引就可以知道對象的組成部分。對象模糊索引中每個對象對應(yīng)一個由〈元組,元組重 要性〉鏈接而成的列表,而在每個〈元組,元組重要性〉下對應(yīng)一個由〈屬性,屬性重要性〉鏈 接而成的列表。對象模糊索引結(jié)構(gòu)如圖2所示。通過對象模糊索引可以快速獲取元組和屬性 的重要性,這樣可以加快對象IR分?jǐn)?shù)的計算速度。
[0053] 通過輸入的檢索關(guān)鍵詞,利用圖搜索算法搜索對象圖,可以得到不同的對象連接 樹,這些對象連接樹表示了不同的檢索結(jié)果。利用評分機(jī)制計算不同對象連接樹的IR分?jǐn)?shù), 可以將最相關(guān)的檢索結(jié)果反饋給用戶。對對象連接樹評分的影響。主要包括兩個方面:一方 面是對象的IR分?jǐn)?shù);另一方面是對象聯(lián)系的重要性。在對象IR分?jǐn)?shù)的計算中分兩種情況考 慮:一種是包含關(guān)鍵詞的對象;另一種是不包含關(guān)鍵詞的對象。
[0054] 如圖5所示,本發(fā)明提供了一種數(shù)據(jù)庫模糊檢索系統(tǒng),該系統(tǒng)包括數(shù)據(jù)庫存儲模 塊、算法模塊、用戶查詢模塊。
[0055] 數(shù)據(jù)庫存儲模塊:用于存儲各種轉(zhuǎn)義數(shù)據(jù)以及存儲關(guān)鍵詞索引信息。當(dāng)用戶輸入 關(guān)鍵詞后,可以根據(jù)關(guān)鍵詞索引來查詢所屬對象,然后定位到相應(yīng)對象后,使用本算法來實 現(xiàn)相近對象的查詢。
[0056]算法模塊:實現(xiàn)本發(fā)明上述搜索方法。對于用戶輸入的關(guān)鍵詞,本模塊向數(shù)據(jù)庫查 詢模塊查詢關(guān)鍵詞所屬對象,然后經(jīng)過本發(fā)明上述方法的各個步驟查詢出關(guān)鍵詞所屬對象 的相近對象。
[0057]用戶查詢模塊:主要用于接收用戶輸入的數(shù)據(jù),對于各種不符合格式的數(shù)據(jù)進(jìn)行 相應(yīng)反饋,以及根據(jù)算法模塊的響應(yīng)返回給用戶相應(yīng)數(shù)據(jù)。
【主權(quán)項】
1. 一種數(shù)據(jù)庫模糊檢索方法,其特征在于,所述方法包括如下步驟: 步驟1:對對象圖的檢索以及利用模糊推理的方法計算相關(guān)性分?jǐn)?shù); 對對象圖的檢索是根據(jù)對象圖中各個對象之間邊的最小權(quán)重使用寬度優(yōu)先算法來找 到最適合的對象目標(biāo);根據(jù)各個對象之間聯(lián)系的重要性來確定各個對象之間具體的權(quán)重值 的大小,即根據(jù)各個對象具體關(guān)鍵詞屬性的字符串符合程度或者語義符合程度來確定關(guān)鍵 詞的具體值; 步驟2:模糊索引構(gòu)建,分為關(guān)鍵詞模糊索引和對象模糊索引;關(guān)鍵詞索引包括兩部分 內(nèi)容,即一個是關(guān)鍵詞模糊索引,用于記錄關(guān)鍵詞的IR分?jǐn)?shù)及所屬對象;另一個是對象模糊 索引,用于記錄對象所包含的元組和屬性及其各種對象之間的重要性; 步驟3:用戶根據(jù)自己想查詢的內(nèi)容輸入具體數(shù)據(jù); 步驟4:通過輸入的檢索關(guān)鍵詞,利用反向擴(kuò)展算法和寬度搜索算法搜索對象圖,可以 得到不同的對象連接樹,這些對象連接樹表示了不同的檢索結(jié)果,利用評分機(jī)制計算不同 對象連接樹的IR分?jǐn)?shù),將最相關(guān)的檢索結(jié)果反饋給用戶。2. 根據(jù)權(quán)利要求1所述的一種數(shù)據(jù)庫模糊檢索方法,其特征在于:所述方法基于模糊邏 輯的對象級別檢索算法;所述的對象級別檢索算法是對STAR算法的改進(jìn),實現(xiàn)對對象圖的 檢索以及利用模糊推理的方法計算相關(guān)性分?jǐn)?shù),同時DOFSTAR算法還考慮了數(shù)據(jù)庫結(jié)構(gòu)對 關(guān)鍵詞檢索的影響,采用對對象圖的檢索通過反向擴(kuò)展算法和寬度優(yōu)先搜索算法。3. 根據(jù)權(quán)利要求2所述的實現(xiàn)對對象圖的檢索,其實現(xiàn)方法在于通過反向擴(kuò)展算法和 寬度優(yōu)先搜索算法來找到和輸入關(guān)鍵詞相關(guān)聯(lián)對象的關(guān)聯(lián)對象,形成關(guān)系樹。4. 根據(jù)權(quán)利要求1所述的一種模糊邏輯的對象級別檢索方法,其特征在于:所述數(shù)據(jù)庫 模糊檢索是對用戶數(shù)據(jù)的多種轉(zhuǎn)義存儲,以及檢索時的提供相關(guān)數(shù)據(jù)的任意別名查詢。5. 根據(jù)權(quán)利要求4所述的一種模糊邏輯的對象級別檢索方法,其特征在于,所述數(shù)據(jù)庫 模糊檢索實現(xiàn)過程是:將已知客觀事物的多種別名在數(shù)據(jù)庫中對應(yīng)表的字段中進(jìn)行存儲, 以及根據(jù)用戶搜索習(xí)慣即使修改各個對象之間的IR分?jǐn)?shù)。6. 根據(jù)權(quán)利要求2所述一種模糊邏輯的對象級別檢索方法,其特征在于:所述STAR算法 利用Steiner樹的近似算法解決關(guān)系數(shù)據(jù)圖的關(guān)鍵詞檢索問題,STAR算法分為兩部分,即第 一部分盡可能找到包含全部查詢關(guān)鍵詞的樹,采用的是反向擴(kuò)展搜索策略,第二部分是查 找圖中低權(quán)重的路徑替換樹中原有的路徑,通過迭代優(yōu)化樹直到找到最小Steiner樹,采用 的是寬度優(yōu)先搜索策略。7. 根據(jù)權(quán)利要求1所述的一種模糊邏輯的對象級別檢索方法,其特征在于:所述方法是 對STAR算法的改進(jìn),即首先通過STAR算法的反向擴(kuò)展策略來找到包含全部關(guān)鍵詞的樹,然 后通過寬度優(yōu)先算法策略來找到最小的Steiner樹。8. 根據(jù)權(quán)利要求1所述的一種模糊邏輯的對象級別檢索方法,其特征在于:所述模糊索 引包括兩個索引,即一個是關(guān)鍵詞模糊索引,用于記錄關(guān)鍵詞的IR分?jǐn)?shù)及所屬對象;另一個 是對象模糊索引,用于記錄對象所包含的元組和屬性及其各種的重要性。9. 根據(jù)權(quán)利要求1所述的一種模糊邏輯的對象級別檢索方法,其特征在于:所述記錄關(guān) 鍵詞的IR分?jǐn)?shù),對象的IR分?jǐn)?shù)的計算從對象的組成結(jié)構(gòu)進(jìn)行考慮,即需要分別考慮關(guān)鍵詞 在對象主題域和對象描述域中的IR分?jǐn)?shù)。10. -種數(shù)據(jù)庫模糊檢索系統(tǒng),其特征在于:所述系統(tǒng)包括數(shù)據(jù)庫存儲模塊、算法模塊、 用戶查詢模塊; 數(shù)據(jù)庫存儲模塊:用于存儲各種轉(zhuǎn)義數(shù)據(jù)以及存儲關(guān)鍵詞索引信息;當(dāng)用戶輸入關(guān)鍵 詞后,根據(jù)關(guān)鍵詞索引來查詢所屬對象,然后定位到相應(yīng)對象后,實現(xiàn)對相近對象的查詢; 算法模塊:對于用戶輸入的關(guān)鍵詞,向數(shù)據(jù)庫查詢模塊查詢關(guān)鍵詞所屬對象,然后查詢 出關(guān)鍵詞所屬對象的相近對象; 用戶查詢模塊:用于接收用戶輸入的數(shù)據(jù),對于各種不符合格式的數(shù)據(jù)進(jìn)行相應(yīng)反饋, 以及根據(jù)算法模塊的響應(yīng)返回給用戶相應(yīng)數(shù)據(jù)。
【文檔編號】G06F17/30GK105912649SQ201610218737
【公開日】2016年8月31日
【申請日】2016年4月8日
【發(fā)明人】朱洪波, 武吉濤, 李國防, 郭永安
【申請人】南京郵電大學(xué)