電網(wǎng)調(diào)度結(jié)構(gòu)化數(shù)據(jù)的檢索方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及電網(wǎng)調(diào)度自動化技術(shù)領(lǐng)域,尤其涉及一種電網(wǎng)調(diào)度結(jié)構(gòu)化數(shù)據(jù)的檢索方法及裝置。
【背景技術(shù)】
[0002]隨著電力工業(yè)的不斷發(fā)展,電網(wǎng)機(jī)構(gòu)每日處理的管理信息快速增長。一方面,是由于電網(wǎng)結(jié)構(gòu)日趨復(fù)雜,接入設(shè)備無論數(shù)量還是類型均明顯增加;另一方面,是因?yàn)楣╇娰|(zhì)量標(biāo)準(zhǔn)不斷提高,要求電網(wǎng)機(jī)構(gòu)對各類生產(chǎn)信息和管理信息處理的及時(shí)性增強(qiáng)。
[0003]在電力調(diào)度控制領(lǐng)域,隨著冀北省地兩級分布式調(diào)度管理系統(tǒng)建設(shè)的逐步深入,調(diào)度管理工作的信息化程度不斷提高。調(diào)度管理系統(tǒng)包含的業(yè)務(wù)越來越豐富,業(yè)務(wù)關(guān)系也逐步清晰,逐步形成了模塊清晰、結(jié)構(gòu)龐大的調(diào)度管理類應(yīng)用框架。隨著系統(tǒng)的復(fù)雜度不斷提高,業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)量也日漸豐富,系統(tǒng)匯集了海量的調(diào)度運(yùn)行和管理數(shù)據(jù)。海量的數(shù)據(jù)里蘊(yùn)含了豐富的電力調(diào)度業(yè)務(wù)的價(jià)值,同時(shí)也存在著如何開發(fā)和利用這些數(shù)據(jù)的問題,搜索引擎面對這種需求應(yīng)運(yùn)而生,搜索引擎能夠根據(jù)一定的策略和算法,快速的收集和檢索信息,為用戶提供檢索服務(wù),將用戶檢索相關(guān)的信息展示給用戶。
[0004]從數(shù)據(jù)存儲格式上來說,當(dāng)前調(diào)度運(yùn)行和管理數(shù)據(jù)有兩種存儲格式:結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。針對非結(jié)構(gòu)化數(shù)據(jù)的檢索,主要對非結(jié)構(gòu)化的文件進(jìn)行解析和分析,建立索引文件,然后根據(jù)搜索詞與文件的匹配度實(shí)現(xiàn)檢索功能和排序功能。但是,針對結(jié)構(gòu)化數(shù)據(jù)的檢索就無法滿足了,通用的檢索方法只是將模糊的搜索結(jié)果返回給用戶,而用戶對結(jié)構(gòu)化數(shù)據(jù)的檢索需求通常很明確或者具有唯一性,例如查詢?yōu)春与姀S的今日電量,用戶需要的返回結(jié)果應(yīng)該是某個表里的一條數(shù)據(jù),而不是一大堆名稱匹配但是無關(guān)的數(shù)據(jù)。
[0005]導(dǎo)致檢索結(jié)果不準(zhǔn)確,檢索效率低的原因如下:電網(wǎng)調(diào)度領(lǐng)域積累了大量數(shù)據(jù),數(shù)據(jù)來源多種多樣、數(shù)據(jù)關(guān)系復(fù)雜,人工梳理數(shù)據(jù)之間的關(guān)系非常困難,無法梳理清楚數(shù)據(jù)之間的關(guān)系就很難提高搜索的全面性和準(zhǔn)確性。電網(wǎng)調(diào)度領(lǐng)域的數(shù)據(jù)來源多種多樣,比如文件服務(wù)器、各類應(yīng)用服務(wù)器、數(shù)據(jù)庫服務(wù)器等。同時(shí),數(shù)據(jù)種類復(fù)雜,包括了結(jié)構(gòu)化、非結(jié)構(gòu)化、半結(jié)構(gòu)化等各種類型的數(shù)據(jù)。面對這些來源復(fù)雜、種類繁多的海量數(shù)據(jù),需要解決海量數(shù)據(jù)存儲問題。針對海量的存儲數(shù)據(jù),電網(wǎng)調(diào)度領(lǐng)域傳統(tǒng)的技術(shù)難以實(shí)現(xiàn)數(shù)據(jù)的快速檢索。
[0006]針對上述問題,目前尚未提出有效的解決方案。
【發(fā)明內(nèi)容】
[0007]本發(fā)明提供了一種電網(wǎng)調(diào)度結(jié)構(gòu)化數(shù)據(jù)的檢索方法及裝置,以至少解決現(xiàn)有的電網(wǎng)調(diào)度結(jié)構(gòu)化數(shù)據(jù)的檢索結(jié)果與用戶需求匹配度不高,檢索效率低的問題。
[0008]根據(jù)本發(fā)明的一個方面,提供了一種電網(wǎng)調(diào)度結(jié)構(gòu)化數(shù)據(jù)的檢索方法,包括:接收用戶輸入的查詢詞;在預(yù)先構(gòu)建的語義表達(dá)式模板中匹配所述查詢詞對應(yīng)的語義表達(dá)式;對匹配的語義表達(dá)式進(jìn)行解析,結(jié)合所述查詢詞得到查詢表達(dá)式;根據(jù)所述查詢表達(dá)式中的查詢條件,在預(yù)先構(gòu)建的結(jié)構(gòu)化數(shù)據(jù)索引文件中進(jìn)行檢索,得到檢索結(jié)果,其中,所述結(jié)構(gòu)化數(shù)據(jù)索引文件是基于結(jié)構(gòu)化數(shù)據(jù)與預(yù)先構(gòu)建的電網(wǎng)調(diào)度領(lǐng)域知識庫的關(guān)系構(gòu)建的,所述電網(wǎng)調(diào)度領(lǐng)域知識庫包括:關(guān)鍵詞、關(guān)鍵詞所屬的類別、類別對應(yīng)的一個或多個特征、類別之間的關(guān)系;所述檢索結(jié)果包括與所述查詢詞關(guān)聯(lián)的數(shù)據(jù);按照預(yù)設(shè)排序指標(biāo)對所述檢索結(jié)果進(jìn)行排序;輸出排序后的檢索結(jié)果。
[0009]在一個實(shí)施例中,在接收用戶輸入的查詢詞之前,所述方法還包括:構(gòu)建所述電網(wǎng)調(diào)度領(lǐng)域知識庫;從數(shù)據(jù)庫中獲取結(jié)構(gòu)化數(shù)據(jù),基于所述電網(wǎng)調(diào)度領(lǐng)域知識庫,建立各個類別與結(jié)構(gòu)化數(shù)據(jù)之間的關(guān)系,得到多個數(shù)據(jù)表;利用倒排索引技術(shù)基于各個關(guān)鍵詞與結(jié)構(gòu)化數(shù)據(jù)之間的關(guān)系構(gòu)建所述結(jié)構(gòu)化數(shù)據(jù)索引文件;為每個數(shù)據(jù)表構(gòu)建語義表達(dá)式模板。
[0010]在一個實(shí)施例中,為每個數(shù)據(jù)表構(gòu)建語義表達(dá)式模板,包括:針對每個數(shù)據(jù)表,根據(jù)該數(shù)據(jù)表對應(yīng)的查詢條件以及返回結(jié)果建立語義表達(dá)式模板,其中所述語義表達(dá)式模板包括:該數(shù)據(jù)表用到的所有查詢條件的組合以及所有返回結(jié)果的組合。
[0011]在一個實(shí)施例中,在預(yù)先構(gòu)建的語義表達(dá)式模板中匹配所述查詢詞對應(yīng)的語義表達(dá)式,包括:將所述查詢詞拆分成一個或多個詞匯;根據(jù)所述電網(wǎng)調(diào)度領(lǐng)域知識庫,在所述一個或多個詞匯中選取電力詞匯,刪除無用的詞匯;在所述預(yù)先構(gòu)建的語義表達(dá)式模板中,匹配所述電力詞匯對應(yīng)的語義表達(dá)式;對匹配的語義表達(dá)式進(jìn)行解析,結(jié)合所述查詢詞得到查詢表達(dá)式,包括:對匹配的語義表達(dá)式進(jìn)行解析,結(jié)合所述電力詞匯得到所述查詢表達(dá)式。
[0012]在一個實(shí)施例中,按照預(yù)設(shè)排序指標(biāo)對所述檢索結(jié)果進(jìn)行排序,包括:根據(jù)所述預(yù)設(shè)排序指標(biāo)計(jì)算所述檢索結(jié)果的排序因子,其中,所述預(yù)設(shè)排序指標(biāo)包括:權(quán)重、時(shí)間、查詢詞與語義表達(dá)式的匹配度、檢索熱度;按照排序因子由大到小的順序?qū)λ鰴z索結(jié)果進(jìn)行排序。
[0013]在一個實(shí)施例中,所述排序因子是權(quán)重因子值、時(shí)間因子值、匹配度因子值和檢索熱度因子值的和。
[0014]在一個實(shí)施例中,在輸出排序后的檢索結(jié)果之后,所述方法還包括:結(jié)合用戶搜索日志,對所述電網(wǎng)調(diào)度領(lǐng)域知識庫、所述語義表達(dá)式模板、所述結(jié)構(gòu)化數(shù)據(jù)索引文件、所述預(yù)設(shè)排序指標(biāo)進(jìn)行調(diào)整和優(yōu)化。
[0015]根據(jù)本發(fā)明的另一個方面,提供了一種電網(wǎng)調(diào)度結(jié)構(gòu)化數(shù)據(jù)的檢索裝置,包括:接收單元,用于接收用戶輸入的查詢詞;匹配單元,用于在預(yù)先構(gòu)建的語義表達(dá)式模板中匹配所述查詢詞對應(yīng)的語義表達(dá)式;解析單元,用于對匹配的語義表達(dá)式進(jìn)行解析,結(jié)合所述查詢詞得到查詢表達(dá)式;檢索單元,用于根據(jù)所述查詢表達(dá)式中的查詢條件,在預(yù)先構(gòu)建的結(jié)構(gòu)化數(shù)據(jù)索引文件中進(jìn)行檢索,得到檢索結(jié)果,其中,所述結(jié)構(gòu)化數(shù)據(jù)索引文件是基于結(jié)構(gòu)化數(shù)據(jù)與預(yù)先構(gòu)建的電網(wǎng)調(diào)度領(lǐng)域知識庫的關(guān)系構(gòu)建的,所述電網(wǎng)調(diào)度領(lǐng)域知識庫包括:關(guān)鍵詞、關(guān)鍵詞所屬的類別、類別對應(yīng)的一個或多個特征、類別之間的關(guān)系;所述檢索結(jié)果包括與所述查詢詞關(guān)聯(lián)的數(shù)據(jù);排序單元,用于按照預(yù)設(shè)排序指標(biāo)對所述檢索結(jié)果進(jìn)行排序;輸出單元,用于輸出排序后的檢索結(jié)果。
[0016]在一個實(shí)施例中,所述裝置還包括:構(gòu)建單元,用于構(gòu)建所述電網(wǎng)調(diào)度領(lǐng)域知識庫;從數(shù)據(jù)庫中獲取結(jié)構(gòu)化數(shù)據(jù),基于所述電網(wǎng)調(diào)度領(lǐng)域知識庫,建立各個類別與結(jié)構(gòu)化數(shù)據(jù)之間的關(guān)系,得到多個數(shù)據(jù)表;利用倒排索引技術(shù)基于各個關(guān)鍵詞與結(jié)構(gòu)化數(shù)據(jù)之間的關(guān)系構(gòu)建所述結(jié)構(gòu)化數(shù)據(jù)索引文件;為每個數(shù)據(jù)表構(gòu)建語義表達(dá)式模板。
[0017]在一個實(shí)施例中,所述構(gòu)建單元具體用于:針對每個數(shù)據(jù)表,根據(jù)該數(shù)據(jù)表對應(yīng)的查詢條件以及返回結(jié)果建立語義表達(dá)式模板,其中所述語義表達(dá)式模板包括:該數(shù)據(jù)表用到的所有查詢條件的組合以及所有返回結(jié)果的組合。
[0018]在一個實(shí)施例中,所述匹配單元包括:拆分模塊,用于將所述查詢詞拆分成一個或多個詞匯;處理模塊,用于根據(jù)所述電網(wǎng)調(diào)度領(lǐng)域知識庫,在所述一個或多個詞匯中選取電力詞匯,刪除無用的詞匯;匹配模塊,用于在所述預(yù)先構(gòu)建的語義表達(dá)式模板中,匹配所述電力詞匯對應(yīng)的語義表達(dá)式;所述解析單元具體用于對匹配的語義表達(dá)式進(jìn)行解析,結(jié)合所述電力詞匯得到所述查詢表達(dá)式。
[0019]在一個實(shí)施例中,所述排序單元包括:計(jì)算模塊,用于根據(jù)所述預(yù)設(shè)排序指標(biāo)計(jì)算所述檢索結(jié)果的排序因子,其中,所述預(yù)設(shè)排序指標(biāo)包括:權(quán)重、時(shí)間、查詢詞與語義表達(dá)式的匹配度、檢索熱度;排序模塊,用于按照排序因子由大到小的順序?qū)λ鰴z索結(jié)果進(jìn)行排序。
[0020]在一個實(shí)施例中,所述排序因子是權(quán)重因子值、時(shí)間因子值、匹配度因子值和檢索熱度因子值的和。
[0021 ]在一個實(shí)施例中,所述裝置還包括:調(diào)整單元,用于結(jié)合用戶搜索日志,對所述電網(wǎng)調(diào)度領(lǐng)域知識庫、所述語義表達(dá)式模板、所述結(jié)構(gòu)化數(shù)據(jù)索引文件、所述預(yù)設(shè)排序指標(biāo)進(jìn)行調(diào)整和優(yōu)化。
[0022]通過本發(fā)明的電網(wǎng)調(diào)度結(jié)構(gòu)化數(shù)據(jù)的檢索方法及裝置,分析用戶輸入的查詢詞,根據(jù)預(yù)先構(gòu)建的語