欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

面向電力生產管理系統(tǒng)關系數據庫的關鍵詞搜索方法

文檔序號:6375185閱讀:218來源:國知局
專利名稱:面向電力生產管理系統(tǒng)關系數據庫的關鍵詞搜索方法
技術領域
本發(fā)明屬于電力信息技術領域,具體涉及面向電力生產管理系統(tǒng)關系數據庫的關鍵詞搜索方法。
背景技術
基于關鍵詞的搜索引擎是目前信息檢索的主要方式,現有的互聯網搜索引擎主要針對靜態(tài)網頁進行索引,而企業(yè)級搜索引擎則更多地關注于文檔、視頻、圖像等非結構化數據的檢索。對于電力應用而言,往往同時需要結構化數據和非結構化文本,兩類信息的融合成為一個核心問題。目前兩類信息的檢索分別使用關系數據庫和關鍵詞查詢技術實現,尚無有機集成。解決這一問題的關鍵在于尋求高效的信息查詢方法,從而實現對兩類信息的自由查詢。鑒于關鍵詞查詢在非結構化數據檢索中的易用性,目前的熱點在于將關鍵詞查詢技術應用到關系數據庫領域。在電力行業(yè)的實際應用中,大量數據保存在后臺關系型數 據庫,需要特定的查詢接口,同時數據查詢要求操作人員具有專業(yè)的背景知識來分析數據間的關聯關系。針對這一問題,現有的網絡搜索引擎無法提供電力結構化數據的檢索,需要研究基于關鍵詞的數據庫搜索技術。目前數據庫搜索技術研究主要包括三個方面I)基礎理論和算法的研究,涉及關系庫建模、系統(tǒng)體系結構設計和搜索排序算法分析;2)搜索準確性研究,涉及搜索性能、搜索結果顯示等重要環(huán)節(jié)的優(yōu)化;3)傳統(tǒng)搜索引擎擴展,涉及面向用戶的語義搜索分析,以及研究如何將數據庫搜索技術向分布式環(huán)境遷移。目前數據庫搜索技術主要存在如下需要解決的問題I)在實時性要求較高的場合,搜索引擎需要從數據庫模式中分析用戶輸入的關鍵字與數據庫查詢語言間的關系,并提供在線的數據查詢,但數據庫模式的復雜性導致查詢效率低下;2)在實時性要求較低的場合,現有的解決方案通過數據采集將數據庫中的記錄進行組織和本地存儲,但數據記錄的規(guī)模的急劇膨脹導致數據的存儲和分析效率不高;3)現有的搜索結果排序一般使用IR索引或繼承傳統(tǒng)搜索引擎的PageRank算法,但這類排序機制是否適用于數據庫搜索的場合尚無定論。

發(fā)明內容
為了克服上述現有技術的不足,本發(fā)明提供一種面向電力生產管理系統(tǒng)關系數據庫的關鍵詞搜索方法,該方法能夠有效關聯業(yè)務數據庫的不同關系表,結合業(yè)務知識和流程規(guī)范實現全局化的數據查詢,降低業(yè)務數據查詢的復雜性,使得用戶可以快速、方便地獲取所需的搜索結果。為了實現上述發(fā)明目的,本發(fā)明采取如下技術方案
一種面向電力生產管理系統(tǒng)關系數據庫的關鍵詞搜索方法,所述方法包括以下步驟步驟I :根據關鍵詞定位關系表;步驟2 :依據業(yè)務詞典規(guī)約查詢過程;步驟3 :以關鍵詞為中心查詢數據;步驟4 :依據業(yè)務規(guī)則擴展查詢模式;步驟5:返回查詢結果。所述步驟I中,用戶通過查詢節(jié)點索引表,在數據庫模式圖中找到至少包含一個搜索關鍵詞的節(jié)點,其中數據庫模式圖是無向圖G= (V,E),V為頂點的集合,每個頂點對應于一個關系表,E為邊的集合,每條邊對應于一個外鍵關系。所述節(jié)點索引表創(chuàng)建過程為將數據表關系表中的每列的各個字段拼接成文檔,對該文檔抽取關鍵詞,形成關鍵詞到表名、列名的倒排索引。所述步驟2中,篩選所述關鍵詞對應的節(jié)點,若關鍵詞不存在于節(jié)點對應的業(yè)務詞典,則去除該節(jié)點。所述業(yè)務詞典的創(chuàng)建過程為選取關系表中的關鍵屬性,將表格中所有關鍵屬性列拼接成文檔,對該文檔抽取關鍵詞,形成該關系表對應的業(yè)務詞典。所述步驟3中,以生成的節(jié)點為中心進行擴展,生成候選的數據查詢模式,每個查詢模式是數據庫模式圖的子圖,且包含了所有的關鍵詞。根據權利要求6所述的面向電力生產管理系統(tǒng)關系數據庫的關鍵詞搜索方法,其特征在于采用寬度遍歷方法生成所述數據查詢模式,過程如下I)定義隊列Q、V,將所有產生的中心節(jié)點作為初始模式添加到隊列Q和V ;2)從Q中取出模式P,將P的關聯模式(P1, P2,…,P1J添加到隊列Q和V,其中關聯模式Pi(i=l,2,…,η)滿足如下條件a) IPi I = |Ρ|+1,Pi SPi 中包含節(jié)點的個數;b)Pi為連通圖且不存在于V ;3)依次遍歷Q中所有的模式,直到Q為空,選取符合如下條件的查詢模式作為輸出
結果a)輸出模式需要包含所有的關鍵詞;b)所有葉子節(jié)點均包含至少一個關鍵詞;c)輸出模式的大小應小于預定的最大值。所述步驟4中,先引入業(yè)務規(guī)則形成先驗知識庫,再對生成的查詢模式進行擴展,將密切相關的其它節(jié)點加入到該查詢模式。所述業(yè)務規(guī)則是業(yè)務流程上密切關聯的多個關系表的集合ITiIi=I, 2,…,N},其中Ti為表名,N為該規(guī)則的長度。所述步驟5中,對每個候選查詢模式均拼接SQL查詢語句,通過用戶關鍵詞查詢所述索引表,得到表名和列名信息寫入SQL語句,SQL語句的查詢條件通過數據庫全文索引使用Contains法實現。與現有技術相比,本發(fā)明的有益效果在于I.對電力業(yè)務數據庫和關鍵詞查詢加以整合,將傳統(tǒng)搜索引擎的關鍵詞檢索應用于電力關系數據庫的數據查詢范疇,用戶無需了解數據庫查詢語言以及業(yè)務模式,僅通過給出所關心的關鍵詞集合,就可以查詢數據庫中的記錄和復雜的關聯關系;2.本發(fā)明以關鍵詞為中心的PMS關系據庫的關鍵字搜索方法,通過對PMS數據庫進行數據索引和模式分析,歸納出面向電力業(yè)務數據庫的業(yè)務詞典,并基于該業(yè)務詞典對數據查詢模式進行篩選,縮小搜索空間,同時在業(yè)務工作流程基礎上梳理出詳細的業(yè)務規(guī)貝U,實現業(yè)務規(guī)則指導下的查詢模式擴展,生成符合電力業(yè)務規(guī)范的查詢結果;3.該方法完全通過自主設計來實現電力業(yè)務數據庫的信息查詢,屏蔽了底層復雜的數據庫模式,克服了傳統(tǒng)結構化數據查詢在靈活性和實用性上的弊端,使得該方法能夠有效降低非專業(yè)人員查詢業(yè)務數據庫的技術門檻,更好地利用業(yè)務數據的價值。


圖I是面向電力生產管理系統(tǒng)關系數據庫的關鍵詞搜索方法的體系結構圖; 圖2是電力生產管理系統(tǒng)關系數據庫查詢樣例圖。
具體實施例方式下面結合附圖對本發(fā)明作進一步詳細說明。如圖I和圖2,一種面向電力生產管理系統(tǒng)關系數據庫的關鍵詞搜索方法,所述方法包括以下步驟步驟I :根據關鍵詞定位關系表;步驟2 :依據業(yè)務詞典規(guī)約查詢過程;步驟3 :以關鍵詞為中心查詢數據;步驟4 :依據業(yè)務規(guī)則擴展查詢模式;步驟5:返回查詢結果。所述步驟I中,用戶通過查詢節(jié)點索引表,在數據庫模式圖中找到至少包含一個搜索關鍵詞的節(jié)點,其中數據庫模式圖是無向圖G= (V,E),V為頂點的集合,每個頂點對應于一個關系表,E為邊的集合,每條邊對應于一個外鍵關系。如圖2所示的數據庫模式圖中,頂點集 V 和邊集 E 分別表述為V= (T1, T2,. . . , T5,. . . }, E = ((T11T2), (H),···}。所述節(jié)點索引表創(chuàng)建過程為將數據表關系表中的每列的各個字段拼接成文檔,對該文檔抽取關鍵詞,形成關鍵詞到表名、列名的倒排索引。所述步驟2中,篩選所述關鍵詞對應的節(jié)點,若關鍵詞不存在于節(jié)點對應的業(yè)務詞典,則去除該節(jié)點。所述業(yè)務詞典的創(chuàng)建過程為選取關系表中的關鍵屬性,如關系表“變電一次設備臺帳”中的“運行編號、“設備型號”等屬性,將表格中所有關鍵屬性列拼接成文檔,對該文檔抽取關鍵詞,形成該關系表對應的業(yè)務詞典。所述步驟3中,以生成的節(jié)點為中心進行擴展,生成候選的數據查詢模式,每個查詢模式是數據庫模式圖的子圖,且包含了所有的關鍵詞,即用戶輸入的關鍵詞均對應于子圖中的一個或多個節(jié)點。根據權利要求6所述的面向電力生產管理系統(tǒng)關系數據庫的關鍵詞搜索方法,其特征在于采用寬度遍歷方法生成所述數據查詢模式,過程如下
I)定義隊列Q、V,將所有產生的中心節(jié)點作為初始模式添加到隊列Q和V ;2)從Q中取出模式P,將P的關聯模式(P1, P2,…,P1J添加到隊列Q和V,其中關聯模式Pi(i=l,2,…,η)滿足如下條件a) IPi Hp 1+1,Pi SPi中包含節(jié)點的個數;b)Pi為連通圖且不存在于V ;3)依次遍歷Q中所有的模式,直到Q為空,選取符合如下條件的查詢模式作為輸出
結果a)輸出模式需要包含所有的關鍵詞; b)所有葉子節(jié)點均包含至少一個關鍵詞;c)輸出模式的大小(即包含的節(jié)點數)應小于預定的最大值。如圖2所示的數據庫模式圖,圖中的節(jié)點T1、T2、…T5對應了業(yè)務系統(tǒng)中變電設備包中的關系數據表,圖中的邊表示相鄰的數據表關系表間存在外鍵關系,其中關系表“Τ3:設備擴展屬性”包含關鍵詞Κ1,“Τ4 :一次設備附件”包含關鍵詞Κ2,“Τ5 :設備附件屬性”包含關鍵詞Κ3,且Τ3、Τ4、Τ5間存在外鍵關系,則“Τ3-Τ4-Τ5”為一個輸出子模式查詢模式。所述步驟4中,先引入業(yè)務規(guī)則形成先驗知識庫,再對生成的查詢模式進行擴展,將滿足如下條件的候選節(jié)點加入到該查詢模式I)查詢模式中存在節(jié)點與候選節(jié)點隸屬于同一條業(yè)務規(guī)則;2)查詢模式中不包含該候選節(jié)點。所述業(yè)務規(guī)則是業(yè)務流程上密切關聯的多個關系表的集合ITiIi=I, 2,…,N},其中Ti為表名,N為該規(guī)則的長度。所述步驟5中,對每個候選查詢模式均拼接SQL查詢語句,通過用戶關鍵詞查詢所述索引表,得到表名和列名信息寫入SQL語句,SQL語句的查詢條件通過數據庫全文索引使用Contains法實現,如圖2中關鍵詞Kl對應表Tl和列Cl,則查詢條件為WHERECONTAINS (Cl1Kl)。最后應當說明的是以上實施例僅用以說明本發(fā)明的技術方案而非對其限制,盡管參照上述實施例對本發(fā)明進行了詳細的說明,所屬領域的普通技術人員應當理解依然可以對本發(fā)明的具體實施方式
進行修改或者等同替換,而未脫離本發(fā)明精神和范圍的任何修改或者等同替換,其均應涵蓋在本發(fā)明的權利要求范圍當中。
權利要求
1.面向電力生產管理系統(tǒng)關系數據庫的關鍵詞搜索方法,其特征在于所述方法包括以下步驟 步驟I :根據關鍵詞定位關系表; 步驟2 :依據業(yè)務詞典規(guī)約查詢過程; 步驟3 :以關鍵詞為中心查詢數據; 步驟4 :依據業(yè)務規(guī)則擴展查詢模式; 步驟5:返回查詢結果。
2.根據權利要求I所述的面向電力生產管理系統(tǒng)關系數據庫的關鍵詞搜索方法,其特征在于所述步驟I中,用戶通過查詢節(jié)點索引表,在數據庫模式圖中找到至少包含一個搜索關鍵詞的節(jié)點,其中數據庫模式圖是無向圖G= (V,E),V為頂點的集合,每個頂點對應于一個關系表,E為邊的集合,每條邊對應于一個外鍵關系。
3.根據權利要求2所述的面向電力生產管理系統(tǒng)關系數據庫的關鍵詞搜索方法,其特征在于所述節(jié)點索引表創(chuàng)建過程為將數據表關系表中的每列的各個字段拼接成文檔,對該文檔抽取關鍵詞,形成關鍵詞到表名、列名的倒排索引。
4.根據權利要求I所述的面向電力生產管理系統(tǒng)關系數據庫的關鍵詞搜索方法,其特征在于所述步驟2中,篩選所述關鍵詞對應的節(jié)點,若關鍵詞不存在于節(jié)點對應的業(yè)務詞典,則去除該節(jié)點。
5.根據權利要求4所述的面向電力生產管理系統(tǒng)關系數據庫的關鍵詞搜索方法,其特征在于所述業(yè)務詞典的創(chuàng)建過程為選取關系表中的關鍵屬性,將表格中所有關鍵屬性列拼接成文檔,對該文檔抽取關鍵詞,形成該關系表對應的業(yè)務詞典。
6.根據權利要求I所述的面向電力生產管理系統(tǒng)關系數據庫的關鍵詞搜索方法,其特征在于所述步驟3中,以生成的節(jié)點為中心進行擴展,生成候選的數據查詢模式,每個查詢模式是數據庫模式圖的子圖,且包含了所有的關鍵詞。
7.根據權利要求6所述的面向電力生產管理系統(tǒng)關系數據庫的關鍵詞搜索方法,其特征在于采用寬度遍歷方法生成所述數據查詢模式,過程如下 1)定義隊列Q、V,將所有產生的中心節(jié)點作為初始模式添加到隊列Q和V; 2)從Q中取出模式P,將P的關聯模式{P1;P2,…,PJ添加到隊列Q和V,其中關聯模SPiQ = Id, ···,!!)滿足如下條件 a)Ipi I = |p|+1,Pi為Pi中包含節(jié)點的個數; b)Pi為連通圖且不存在于V; 3)依次遍歷Q中所有的模式,直到Q為空,選取符合如下條件的查詢模式作為輸出結果 a)輸出模式需要包含所有的關鍵詞; b)所有葉子節(jié)點均包含至少一個關鍵詞; c)輸出模式的大小應小于預定的最大值。
8.根據權利要求I所述的面向電力生產管理系統(tǒng)關系數據庫的關鍵詞搜索方法,其特征在于所述步驟4中,先引入業(yè)務規(guī)則形成先驗知識庫,再對生成的查詢模式進行擴展,將密切相關的其它節(jié)點加入到該查詢模式。
9.根據權利要求8所述的面向電力生產管理系統(tǒng)關系數據庫的關鍵詞搜索方法,其特征在于所述業(yè)務規(guī)則是業(yè)務流程上密切關聯的多個關系表的集合ITiIi=IJ,…,N},其中Ti為表名,N為該規(guī)則的長度。
10.根據權利要求I所述的面向電カ生產管理系統(tǒng)關系數據庫的關鍵詞捜索方法,其特征在于所述步驟5中,對每個候選查詢模式均拼接SQL查詢語句,通過用戶關鍵詞查詢所述索引表,得到表名和列名信息寫入SQL語句,SQL語句的查詢條件通過數據庫全文索引使用Contains法實現。
全文摘要
本發(fā)明提供面向電力生產管理系統(tǒng)關系數據庫的關鍵詞搜索方法,包括以下步驟根據關鍵詞定位關系表;依據業(yè)務詞典規(guī)約查詢過程;以關鍵詞為中心查詢數據;依據業(yè)務規(guī)則擴展查詢模式;返回查詢結果。該方法能夠有效關聯業(yè)務數據庫的不同關系表,結合業(yè)務知識和流程規(guī)范實現全局化的數據查詢,降低業(yè)務數據查詢的復雜性,使得用戶可以快速、方便地獲取所需的搜索結果。
文檔編號G06Q10/06GK102819600SQ20121029127
公開日2012年12月12日 申請日期2012年8月15日 優(yōu)先權日2012年8月15日
發(fā)明者丁杰, 胡斌, 朱力鵬, 楊佩, 汪超 申請人:中國電力科學研究院, 國家電網公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
建昌县| 石林| 白朗县| 汪清县| 宿迁市| 洮南市| 滁州市| 汉源县| 淮滨县| 迁安市| 丰都县| 桓台县| 九江市| 镇巴县| 隆安县| 油尖旺区| 武夷山市| 柘荣县| 武汉市| 吴旗县| 锡林浩特市| 丹阳市| 泽普县| 凤山县| 泗阳县| 安仁县| 开封县| 鄂伦春自治旗| 永定县| 富平县| 明星| 宜丰县| 新泰市| 龙口市| 台前县| 抚顺县| 蓬溪县| 东明县| 葵青区| 彭泽县| 仪征市|