欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于電力關鍵詞分詞的數(shù)據(jù)檢索方法及裝置制造方法

文檔序號:6631150閱讀:245來源:國知局
基于電力關鍵詞分詞的數(shù)據(jù)檢索方法及裝置制造方法
【專利摘要】本發(fā)明公開了一種基于電力關鍵詞分詞的數(shù)據(jù)檢索方法及裝置,其中該方法包括如下步驟:S01、在頁面上待輸入的文本框中輸入關鍵詞;S02、根據(jù)輸入的關鍵詞構造單次搜索記錄解析結(jié)構對象,并將關鍵詞切分成兩個或兩個以上的關鍵字并形成關鍵字集合;S03、判斷關鍵字集合內(nèi)的關鍵字與詞庫的匹配關系,包括完全匹配、不完全匹配以及沒有匹配,并對關鍵詞進行處理,S04、根據(jù)權重大小對搜索記錄解析結(jié)構對象中存入的所有關鍵字進行排序,并過濾要在頁面上展示的關鍵字;S05、組裝成SQL并查詢數(shù)據(jù)庫后,輸出數(shù)據(jù)。本發(fā)明能夠極大地提高搜索效率,方便電力關鍵詞的檢索。
【專利說明】基于電力關鍵詞分詞的數(shù)據(jù)檢索方法及裝置

【技術領域】
[0001 ] 本發(fā)明涉及關鍵詞檢索方法,尤其涉及一種基于電力關鍵詞分詞的數(shù)據(jù)檢索方法及裝置。

【背景技術】
[0002]對于中文搜索引擎而言,中文分詞作為其核心技術之一。中文分詞技術屬于自然語言處理技術范疇,其應用不僅僅局限于中文搜索引擎,它也是中文信息處理中的一個主要組成部分。中文信息處理是計算機對中文的音、形、義等信息進行處理和加工的過程,它是自然語言處理的一個分支,是一門與計算機科學、語言學、數(shù)學、信息學、聲學等多種學科相關聯(lián)的綜合性學科。中文分詞的基本方法包括如下三種:基于字符串匹配的分詞方法、基于理解的分詞方法以及基于統(tǒng)計的分詞方法。
[0003]基于字符串匹配的分詞方法又叫做機械分詞方法,它是按照一定的策略將待分析的漢字串與一個“充分大的”機器詞典中的詞條進行配,若在詞典中找到某個字符串,則匹配成功識別出一個詞。按照掃描方向的不同,串匹配分詞方法可以分為正向匹配和逆向匹配;按照不同長度優(yōu)先匹配的情況,可以分為最大最長匹配和最小最短匹配;按照是否與詞性標注過程相結(jié)合,又可以分為單純分詞方法和分詞與標注相結(jié)合的一體化方法。
[0004]基于理解的分詞方法是通過讓計算機模擬人對句子的理解,達到識別詞的效果。其基本思想就是在分詞的同時進行句法、語義分析,利用句法信息和語義信息來處理歧義現(xiàn)象。它通常包括三個部分分詞子系統(tǒng)、句法語義子系統(tǒng)、總控部分。在總控部分的協(xié)調(diào)下,分詞子系統(tǒng)可以獲得有關詞、句子等的句法和語義信息來對分詞歧義進行判斷,即它模擬了人對句子的理解過程。這種分詞方法需要使用大量的語言知識和信息。由于中文語言知識的籠統(tǒng)、復雜性,難以將各種語言信息組織成機器可直接讀取的形式,因此目前基于理解的分詞系統(tǒng)還處在試驗階段。
[0005]基于統(tǒng)計的分詞方案,從形式上看,詞是穩(wěn)定的字的組合,因此在上下文中,相鄰的字同時出現(xiàn)的次數(shù)越多,就越有可能構成一個詞。因此字與字相鄰共現(xiàn)的頻率或概率能夠較好的反映成詞的可信度??梢詫φZ料中相鄰共現(xiàn)的各個字的組合的頻度進行統(tǒng)計,計算它們的互現(xiàn)信息。定義兩個字的互現(xiàn)信息,計算兩個漢字、的相鄰共現(xiàn)概率?;ガF(xiàn)信息體現(xiàn)了漢字之間結(jié)合關系的緊密程度。當緊密程度高于某一個閡值時,便可認為此字組可能構成了一個詞。這種方法只需對語料中的字組頻度進行統(tǒng)計,不需要切分詞典,因而又叫做無詞典分詞法或統(tǒng)計取詞方法。但這種方法也有一定的局限性,會經(jīng)常抽出一些共現(xiàn)頻度高、但并不是詞的常用字組?;ヂ?lián)網(wǎng)上的搜索引擎是通過搜索引擎爬蟲技術,根據(jù)一定的策略、運用特定的計算機程序從互聯(lián)網(wǎng)上抓取新的、公共可訪問的web網(wǎng)頁、圖片和文檔資源,在對信息進行組織和處理后,為用戶提供檢索服務,將用戶檢索相關的信息展示給用戶的系統(tǒng),它的處理對象是互聯(lián)網(wǎng)網(wǎng)頁,而電網(wǎng)設備全景監(jiān)測平臺的臺賬數(shù)據(jù)和監(jiān)測數(shù)據(jù)都是大量的存儲在數(shù)據(jù)庫當中,直接用互聯(lián)網(wǎng)上的搜索引擎技術無法實現(xiàn)對用戶所關心的設備或者設備類型進行全文檢索。
[0006]電網(wǎng)設備全景監(jiān)測平臺是跨越輸、變、配、用多個環(huán)節(jié)的業(yè)務場景,集成了智能電網(wǎng)配電自動化、電能質(zhì)量監(jiān)測、用電信息采集、狀態(tài)監(jiān)測、生產(chǎn)管理系統(tǒng)等各業(yè)務子系統(tǒng)的信息,形成綜集綜合業(yè)務、數(shù)據(jù)信息、可視化技術為一體的多維度、全方位、立體式的全省統(tǒng)一監(jiān)測平臺,涵蓋的數(shù)據(jù)體量之巨大,靠現(xiàn)有的把各類檢測系統(tǒng)的查詢菜單簡單組合在一起的方式,雖然查詢速度快,但是用戶需要記憶菜單層級,用戶記憶負擔較大且操作較為繁瑣。又或者是把所有的設備甚至所有的監(jiān)測系統(tǒng)數(shù)據(jù)儲存在一張表只用一個菜單查詢,雖然操作相對簡單,但是數(shù)據(jù)查詢速度很慢。


【發(fā)明內(nèi)容】

[0007]本發(fā)明所要解決的技術問題是:提供一種操作簡單、能夠極大地提高數(shù)據(jù)檢索效率的基于電力關鍵詞分詞的數(shù)據(jù)檢索方法及裝置。
[0008]為了解決上述技術問題,本發(fā)明采用的技術方案為:提供一種基于電力關鍵詞分詞的數(shù)據(jù)檢索方法,包括如下步驟:
[0009]S01、在頁面上待輸入的文本框中輸入關鍵詞,其中,所述關鍵詞包括為設備表名、設備類型或者監(jiān)測主題;
[0010]S02、根據(jù)輸入的關鍵詞構造單次搜索記錄解析結(jié)構對象,并將關鍵詞切分成兩個或兩個以上的關鍵字并形成關鍵字集合;
[0011]S03、判斷關鍵字集合內(nèi)的關鍵字是否滿足與詞庫完全匹配的搜索條件,若關鍵字集合內(nèi)的關鍵字均存在于詞庫中,則在詞庫中直接獲取與關鍵字關聯(lián)的設備表名、設備類型、監(jiān)測主題及權重信息,并存入搜索記錄解析結(jié)構對象,否則執(zhí)行步驟S04 ;
[0012]S04、判斷搜索詞匯集合內(nèi)的搜索詞匯是否滿足與詞庫不完全匹配的搜索條件,若關鍵字集合內(nèi)的關鍵字部分存在于詞庫中,則根據(jù)詞庫計算出匹配的關鍵字的權重,并存入搜索記錄解析結(jié)構對象,否則執(zhí)行步驟S05 ;
[0013]S05、若在詞庫中沒有找到匹配的關鍵字,則使用默認的詞庫中的配置表進行檢索,并將檢索結(jié)果存入搜索記錄解析結(jié)構對象;
[0014]S06、根據(jù)權重大小對搜索記錄解析結(jié)構對象中存入的所有關鍵字進行排序,并過濾要在頁面上展示的關鍵字;
[0015]S07、組裝成SQL并查詢數(shù)據(jù)庫后,輸出數(shù)據(jù)。
[0016]為了解決上述技術問題,本發(fā)明采用的另一技術方案為:提供一種基于電力關鍵詞分詞的數(shù)據(jù)檢索裝置,包括輸入模塊、構造模塊、第一判斷模塊、第二判斷模塊、第三判斷模塊、過濾模塊以及查詢輸出模塊;
[0017]所述輸入模塊,用于在頁面上待輸入的文本框中輸入關鍵詞,其中,所述關鍵詞包括為設備表名、設備類型或者監(jiān)測主題;
[0018]所述構造模塊,用于根據(jù)輸入的關鍵詞構造單次搜索記錄解析結(jié)構對象,并將關鍵詞切分成兩個或兩個以上的關鍵字并形成關鍵字集合;
[0019]所述第一判斷模塊,用于判斷關鍵字集合內(nèi)的關鍵字是否滿足與詞庫完全匹配的搜索條件,若關鍵字集合內(nèi)的關鍵字均存在于詞庫中,則在詞庫中直接獲取與關鍵字關聯(lián)的設備表名、設備類型及權重信息,并存入搜索記錄解析結(jié)構對象;
[0020]所述第二判斷模塊,用于判斷搜索詞匯集合內(nèi)的搜索詞匯是否滿足與詞庫不完全匹配的搜索條件,若關鍵字集合內(nèi)的關鍵字部分存在于詞庫中,則根據(jù)詞庫計算出匹配的關鍵字的權重,并存入搜索記錄解析結(jié)構對象;
[0021]所述第三判斷模塊,用于在詞庫中沒有找到匹配的關鍵字,則使用默認的詞庫中的配置表進行檢索,并將檢索結(jié)果存入搜索記錄解析結(jié)構對象;
[0022]所述過濾模塊,用于根據(jù)權重大小對搜索記錄解析結(jié)構對象中存入的所有關鍵字進行排序,并過濾要在頁面上展示的關鍵字;
[0023]所述查詢輸出模塊,用于組裝成SQL并查詢數(shù)據(jù)庫后,輸出數(shù)據(jù)。
[0024]本發(fā)明的有益效果在于:區(qū)別于現(xiàn)有的把各類檢測系統(tǒng)的查詢菜單簡單組合在一起的方式和把所有的設備甚至所有的監(jiān)測系統(tǒng)數(shù)據(jù)儲存在一張表只用一個菜單查詢的方式操作更加簡單,用戶不需要再去面對龐大的業(yè)務系統(tǒng),也不用再去記憶要打開的菜單項的問題,本發(fā)明提供了基于電力關鍵詞分詞的數(shù)據(jù)檢索方法,一種用戶只需在頁面的文本框中輸入想要查詢的設備名稱或者設備類型關鍵字即可。而且查詢速度快,用戶記憶負擔小且用戶體驗效果良好。由于吸收互聯(lián)網(wǎng)搜索引擎的精髓,在實現(xiàn)對用戶所關系的設備、設備類型或者監(jiān)測主題進行全文檢索之外本專利申請能夠無縫適配電網(wǎng)系統(tǒng)。

【專利附圖】

【附圖說明】
[0025]圖1為本發(fā)明基于電力關鍵詞分詞的數(shù)據(jù)檢索方法的流程示意圖;
[0026]圖2為本發(fā)明基于電力關鍵詞分詞的數(shù)據(jù)檢索方法的整體流程示意圖;
[0027]圖3為本發(fā)明斷詞算法的流程圖;
[0028]圖4為本發(fā)明一實施例的示意圖。

【具體實施方式】
[0029]為詳細說明本發(fā)明的技術內(nèi)容、所實現(xiàn)目的及效果,以下結(jié)合實施方式并配合附圖予以說明。
[0030]本發(fā)明最關鍵的構思在于:在頁面的文本框中輸入關鍵詞,并對關鍵詞進行切分以及在詞庫中搜索對切分后的關鍵字及關聯(lián)的設備名稱、設備表名及權重,根據(jù)權重大小對搜索記錄解析結(jié)構對象中存入的所有關鍵字進行排序,并過濾要在頁面上展示的關鍵字后組裝搜索,能夠極大地提高搜索效率。
[0031]請參照圖1及圖2,一種基于電力關鍵詞分詞的數(shù)據(jù)檢索方法,包括如下步驟:
[0032]S01、在頁面上待輸入的文本框中輸入關鍵詞,其中,所述關鍵詞包括為設備表名、設備類型或者監(jiān)測主題;
[0033]S02、根據(jù)輸入的關鍵詞構造單次搜索記錄解析結(jié)構對象,并將關鍵詞切分成兩個或兩個以上的關鍵字并形成關鍵字集合;
[0034]S03、判斷關鍵字集合內(nèi)的關鍵字是否滿足與詞庫完全匹配的搜索條件,若關鍵字集合內(nèi)的關鍵字均存在于詞庫中,則在詞庫中直接獲取與關鍵字關聯(lián)的設備表名、設備類型、監(jiān)控主題及權重信息,并存入搜索記錄解析結(jié)構對象,否則執(zhí)行步驟S04,其中,權重信息是指根據(jù)用戶對相關設備的搜索頻率的量化,頻率越高權重值越大,并且此處的權重信息包括設備表名、設備類型、監(jiān)控主題各自的權重信息;
[0035]S04、判斷搜索詞匯集合內(nèi)的搜索詞匯是否滿足與詞庫不完全匹配的搜索條件,若關鍵字集合內(nèi)的關鍵字部分存在于詞庫中,則根據(jù)詞庫計算出匹配的關鍵字的權重,并存入搜索記錄解析結(jié)構對象,否則執(zhí)行步驟S05 ;
[0036]S05、若在詞庫中沒有找到匹配的關鍵字,則使用默認的詞庫中的配置表進行檢索,并將檢索結(jié)果存入搜索記錄解析結(jié)構對象;
[0037]S06、根據(jù)權重大小對搜索記錄解析結(jié)構對象中存入的所有關鍵字進行排序,并過濾要在頁面上展示的關鍵字;
[0038]S07、組裝成SQL并查詢數(shù)據(jù)庫后,輸出數(shù)據(jù)。在組裝的過程中必須能夠?qū)υ陧撁嫔蟼€要展示的字段進行控制實現(xiàn)展示頁面的多樣性。
[0039]從上述描述可知,本發(fā)明的有益效果在于:本發(fā)明提供了基于電力關鍵詞分詞的數(shù)據(jù)檢索方法,一種用戶只需在頁面的文本框中輸入想要查詢的設備名稱或者設備類型關鍵字即可。而且查詢速度快,用戶記憶負擔小且用戶體驗效果良好。由于吸收互聯(lián)網(wǎng)搜索引擎的精髓,在實現(xiàn)對用戶所關系的設備、設備類型或者監(jiān)測主題進行全文檢索之外本專利申請能夠無縫適配電網(wǎng)系統(tǒng)。
[0040]進一步的,所述步驟S05之后,還對搜索的關鍵字的搜索頻率進行記錄,并更新詞庫中關鍵字權重的步驟。在后臺記錄用戶搜索某個設備、設備類型或者監(jiān)測主題的頻率,使用最近最少使用算法(LRU),設立時間標志位,用以跟蹤最近最少被使用的緩存數(shù)據(jù)。一個數(shù)據(jù)每被使用一次,其他數(shù)據(jù)的時間標志位數(shù)值(頻率)就增加,從而提高排列權重。
[0041]進一步的,所述步驟SOl具體包括,在帶輸入的文本框中輸入多個關鍵詞,并且多個關鍵詞用空格隔開。
[0042]所述步驟SOl中“在頁面上待輸入的文本框中輸入關鍵詞”時還包括,在文本框中顯示輸入與關鍵詞的多個關聯(lián)詞的步驟,所述多個關聯(lián)詞按照與輸入關鍵詞匹配的權重排列。對用戶輸入的關鍵字以及在搜索結(jié)果中對常用設備、設備類型或者監(jiān)測主題的點擊頻率進行統(tǒng)計之后在搜索框下方給予輸入關鍵字聯(lián)想,羅列出跟關鍵字匹配度較高且點擊率較高的詞匯方便用戶的輸入。由于電力的全文檢索不同于互聯(lián)網(wǎng)的全文檢索,其對關鍵字的要求主要是電力行業(yè)里的專業(yè)術語。此外,在對常用電力關鍵字也不能單純只是收集關鍵詞,還必須將關鍵字所涉及或者關聯(lián)到的包括設備類型如配變、配電室、饋線、以及監(jiān)測主題如日負荷、日電量等數(shù)據(jù)信息也加入搜索的詞庫中。詞庫的設計除了包含這些信息之外還應能夠?qū)x詞進行歸類和識別,詞庫里的關鍵字還必須可以設置不同的權重值從而可以實現(xiàn)對搜索結(jié)果在展示順序上可控。
[0043]進一步的,所述步驟S02具體包括,根據(jù)輸入的關鍵詞構造單次搜索記錄解析結(jié)構對象,并根據(jù)空格將關鍵詞切分成兩個或兩個以上的關鍵字并形成關鍵字集合。
[0044]進一步的,所述步驟S02中“將關鍵詞切分成兩個或兩個以上的關鍵字”采用的算法為正向最大匹配算法、逆向最大匹配算法及雙向最大匹配算法中任意一種?;谠~庫對用戶輸入的關鍵字用相關算法進行斷詞,中文斷詞不同于英文斷詞,英文斷詞可以根據(jù)單詞之間的空格來進行劃分,而中文斷詞必須建立在詞庫的基礎上,同時避免出現(xiàn)將已經(jīng)是單獨的詞再次隔斷,例如將廈門斷詞成“廈”和“門”,因此應借鑒目前比較主流的斷詞算法,如正向最大匹配算法、逆向最大匹配算法和雙向最大匹配算法,結(jié)合這三種算法的有優(yōu)缺點設計一個最適于電力行業(yè)的斷詞算法。同時斷詞算法需要能夠根據(jù)權重對斷詞結(jié)果進行排序,權重越高則排序越靠前。
[0045]綜上所述,本發(fā)明提供的基于電力關鍵詞分詞的數(shù)據(jù)檢索方法,采用在頁面上待輸入的文本框中輸入關鍵詞,然后對關鍵詞進行切分,以及在詞庫中搜索對切分后的關鍵字及關聯(lián)的設備名稱、設備表名及權重,根據(jù)權重大小對搜索記錄解析結(jié)構對象中存入的所有關鍵字進行排序,并過濾要在頁面上展示的關鍵字后組裝搜索,能夠極大地提高搜索效率,方便電力關鍵詞的檢索。另外,本發(fā)明還支持多個關鍵詞同時輸入,在輸入關鍵詞時還支持關鍵詞聯(lián)想,方便用戶輸入。關鍵詞切分準確,搜索的范圍小,簡化搜索的難度。
[0046]參閱圖3,圖3為本發(fā)明斷詞算法的流程圖,該斷詞算法包括S10、設定帶切分字符串S1、輸出字串S2以及最大詞長ML ;S20、判斷SI是否為空,若是則輸出結(jié)果S2,若否則從SI左邊開始,去除候選字符串W,W的長度小于或等于ML ;S30、判斷W是否在詞典(詞庫)中,若否去掉W最右邊的一個字后判斷W是否為單字,若是則計算SI及S2的長度,其中,S2=W+“,”、S1 = S1-W,返回步驟S20,并輸出S2,否則返回步驟S30,若是則計算SI及S2的長度,其中,S2 = W+ “,”、SI = S1-W,返回步驟S20,并輸出S2。
[0047]參閱圖4,具體的,例如用戶輸入關鍵字“海峽開閉所”,則本分詞算法根據(jù)詞庫,將“海峽開閉所”關鍵詞拆分為“海峽”、“開閉所”兩個詞,然后根據(jù)電力關鍵詞“開閉所”獲取到對應設備臺賬表,從中查詢與“海峽”匹配的設備信息。
[0048]本發(fā)明還提供了一種基于電力關鍵詞分詞的數(shù)據(jù)檢索裝置,包括輸入模塊、構造模塊、第一判斷模塊、第二判斷模塊、第三判斷模塊、過濾模塊以及查詢輸出模塊;
[0049]所述輸入模塊,用于在頁面上待輸入的文本框中輸入關鍵詞,其中,所述關鍵詞包括為設備表名、設備類型或者監(jiān)測主題;
[0050]所述構造模塊,用于根據(jù)輸入的關鍵詞構造單次搜索記錄解析結(jié)構對象,并將關鍵詞切分成兩個或兩個以上的關鍵字并形成關鍵字集合;
[0051]所述第一判斷模塊,用于判斷關鍵字集合內(nèi)的關鍵字是否滿足與詞庫完全匹配的搜索條件,若關鍵字集合內(nèi)的關鍵字均存在于詞庫中,則在詞庫中直接獲取與關鍵字關聯(lián)的設備表名、設備類型及權重信息,并存入搜索記錄解析結(jié)構對象;
[0052]所述第二判斷模塊,用于判斷搜索詞匯集合內(nèi)的搜索詞匯是否滿足與詞庫不完全匹配的搜索條件,若關鍵字集合內(nèi)的關鍵字部分存在于詞庫中,則根據(jù)詞庫計算出匹配的關鍵字的權重,并存入搜索記錄解析結(jié)構對象;
[0053]所述第三判斷模塊,用于在詞庫中沒有找到匹配的關鍵字,則使用默認的詞庫中的配置表進行檢索,并將檢索結(jié)果存入搜索記錄解析結(jié)構對象;
[0054]所述過濾模塊,用于根據(jù)權重大小對搜索記錄解析結(jié)構對象中存入的所有關鍵字進行排序,并過濾要在頁面上展示的關鍵字;
[0055]所述查詢輸出模塊,用于組裝成SQL并查詢數(shù)據(jù)庫后,輸出數(shù)據(jù)。
[0056]綜上所述,本發(fā)明提供的基于電力關鍵詞分詞的數(shù)據(jù)檢索裝置為上述方法方案的進一步應用,能夠極大提聞搜索效率,方便電力領域的關鍵詞的檢索。
[0057]以上所述僅為本發(fā)明的實施例,并非因此限制本發(fā)明的專利范圍,凡是利用本發(fā)明說明書及附圖內(nèi)容所作的等同變換,或直接或間接運用在相關的【技術領域】,均同理包括在本發(fā)明的專利保護范圍內(nèi)。
【權利要求】
1.一種基于電力關鍵詞分詞的數(shù)據(jù)檢索方法,其特征在于,包括如下步驟: 501、在頁面上待輸入的文本框中輸入關鍵詞,其中,所述關鍵詞包括為設備表名、設備類型或者監(jiān)測主題; 502、根據(jù)輸入的關鍵詞構造單次搜索記錄解析結(jié)構對象,并將關鍵詞切分成兩個或兩個以上的關鍵字并形成關鍵字集合; 503、判斷關鍵字集合內(nèi)的關鍵字是否滿足與詞庫完全匹配的搜索條件,若關鍵字集合內(nèi)的關鍵字均存在于詞庫中,則在詞庫中直接獲取與關鍵字關聯(lián)的設備表名、設備類型、監(jiān)測主題及權重信息,并存入搜索記錄解析結(jié)構對象,否則執(zhí)行步驟S04 ; 504、判斷搜索詞匯集合內(nèi)的搜索詞匯是否滿足與詞庫不完全匹配的搜索條件,若關鍵字集合內(nèi)的關鍵字部分存在于詞庫中,則根據(jù)詞庫計算出匹配的關鍵字的權重,并存入搜索記錄解析結(jié)構對象,否則執(zhí)行步驟S05 ; 505、若在詞庫中沒有找到匹配的關鍵字,則使用默認的詞庫中的配置表進行檢索,并將檢索結(jié)果存入搜索記錄解析結(jié)構對象; 506、根據(jù)權重大小對搜索記錄解析結(jié)構對象中存入的所有關鍵字進行排序,并過濾要在頁面上展示的關鍵字; 507、組裝成SQL并查詢數(shù)據(jù)庫后,輸出數(shù)據(jù)。
2.根據(jù)權利要求1所述的基于電力關鍵詞分詞的數(shù)據(jù)檢索方法,其特征在于,所述步驟S05之后,還對搜索的關鍵字的搜索頻率進行記錄,并更新詞庫中關鍵字權重的步驟。
3.根據(jù)權利要求1所述的基于電力關鍵詞分詞的數(shù)據(jù)檢索方法,其特征在于,所述步驟SOl具體包括,在帶輸入的文本框中輸入多個關鍵詞,并且多個關鍵詞用空格隔開。
4.根據(jù)權利要求1所述的基于電力關鍵詞分詞的數(shù)據(jù)檢索方法,其特征在于,所述步驟SOl中“在頁面上待輸入的文本框中輸入關鍵詞”時還包括,在文本框中顯示輸入與關鍵詞的多個關聯(lián)詞的步驟,所述多個關聯(lián)詞按照與輸入關鍵詞匹配的權重排列。
5.根據(jù)權利要求1所述的基于電力關鍵詞分詞的數(shù)據(jù)檢索方法,其特征在于,所述步驟S02具體包括,根據(jù)輸入的關鍵詞構造單次搜索記錄解析結(jié)構對象,并根據(jù)空格將關鍵詞切分成兩個或兩個以上的關鍵字并形成關鍵字集合。
6.根據(jù)權利要求1所述的基于電力關鍵詞分詞的數(shù)據(jù)檢索方法,其特征在于,所述步驟S02中“將關鍵詞切分成兩個或兩個以上的關鍵字”采用的算法為正向最大匹配算法、逆向最大匹配算法及雙向最大匹配算法中任意一種。
7.一種基于電力關鍵詞分詞的數(shù)據(jù)檢索裝置,其特征在于,包括輸入模塊、構造模塊、第一判斷模塊、第二判斷模塊、第三判斷模塊、過濾模塊以及查詢輸出模塊; 所述輸入模塊,用于在頁面上待輸入的文本框中輸入關鍵詞,其中,所述關鍵詞包括為設備表名、設備類型或者監(jiān)測主題; 所述構造模塊,用于根據(jù)輸入的關鍵詞構造單次搜索記錄解析結(jié)構對象,并將關鍵詞切分成兩個或兩個以上的關鍵字并形成關鍵字集合; 所述第一判斷模塊,用于判斷關鍵字集合內(nèi)的關鍵字是否滿足與詞庫完全匹配的搜索條件,若關鍵字集合內(nèi)的關鍵字均存在于詞庫中,則在詞庫中直接獲取與關鍵字關聯(lián)的設備表名、設備類型及權重信息,并存入搜索記錄解析結(jié)構對象; 所述第二判斷模塊,用于判斷搜索詞匯集合內(nèi)的搜索詞匯是否滿足與詞庫不完全匹配的搜索條件,若關鍵字集合內(nèi)的關鍵字部分存在于詞庫中,則根據(jù)詞庫計算出匹配的關鍵字的權重,并存入搜索記錄解析結(jié)構對象; 所述第三判斷模塊,用于在詞庫中沒有找到匹配的關鍵字,則使用默認的詞庫中的配置表進行檢索,并將檢索結(jié)果存入搜索記錄解析結(jié)構對象; 所述過濾模塊,用于根據(jù)權重大小對搜索記錄解析結(jié)構對象中存入的所有關鍵字進行排序,并過濾要在頁面上展示的關鍵字; 所述查詢輸出模塊,用于組裝成SQL并查詢數(shù)據(jù)庫后,輸出數(shù)據(jù)。
【文檔編號】G06F17/30GK104281702SQ201410565782
【公開日】2015年1月14日 申請日期:2014年10月22日 優(yōu)先權日:2014年10月22日
【發(fā)明者】蘇學源, 熊軍, 莊玉林, 蘇華衍, 陳輝河, 魏云飛 申請人:國家電網(wǎng)公司, 廈門億力吉奧信息科技有限公司, 國網(wǎng)福建省電力有限公司廈門供電公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
丽水市| 丹东市| 商南县| 邳州市| 驻马店市| 晋宁县| 元氏县| 施甸县| 新郑市| 孝义市| 吉安县| 香河县| 齐齐哈尔市| 北宁市| 牙克石市| 潮安县| 乌苏市| 全州县| 沙坪坝区| 墨竹工卡县| 兴城市| 兴国县| 宝兴县| 南投市| 雷山县| 常宁市| 孝昌县| 武隆县| 富阳市| 延寿县| 汽车| 轮台县| 巫溪县| 贵南县| 时尚| 隆德县| 班戈县| 延长县| 岢岚县| 临泽县| 襄城县|