欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種電網(wǎng)設(shè)計評審指標(biāo)結(jié)構(gòu)信息識別方法

文檔序號:9631531閱讀:376來源:國知局
一種電網(wǎng)設(shè)計評審指標(biāo)結(jié)構(gòu)信息識別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及數(shù)據(jù)處理領(lǐng)域和電力系統(tǒng)設(shè)計領(lǐng)域,尤其涉及一種電網(wǎng)設(shè)計評審指標(biāo) 結(jié)構(gòu)信息識別方法。
【背景技術(shù)】
[0002] 一直以來,在電網(wǎng)工程設(shè)計評審應(yīng)用領(lǐng)域,存在無法從電網(wǎng)工程設(shè)計文檔中準(zhǔn)確 提取關(guān)鍵技術(shù)指標(biāo)供評審的問題。導(dǎo)致評審專家需要現(xiàn)場獲取大量關(guān)鍵技術(shù)指標(biāo)信息,評 審標(biāo)準(zhǔn)不統(tǒng)一、評審效率低、評審效果差。通過機器學(xué)習(xí)方法,可以利用專家知識對電網(wǎng)工 程設(shè)計評審報告文檔中的有意義的指標(biāo)值(如新建變電站主變的功率、新建線路工程的曲 折系數(shù))進行抽取。然而,由于電網(wǎng)工程設(shè)計評審文檔中需要抽取的指標(biāo)不僅存在通過電 網(wǎng)工程和指標(biāo)名稱可唯一確定的簡單指標(biāo),而且大量存在電網(wǎng)工程設(shè)計評審體系中的復(fù)雜 指標(biāo)需要綜合考慮各種文檔結(jié)構(gòu)信息才能夠有效識別,例如對于可行性研究報告中存在多 個線路工程的情況,任何一個線路指標(biāo)均需要確定其所對應(yīng)的線路工程。對于電力設(shè)計評 審報告文檔的指標(biāo)識別,需要解析其文檔描述對應(yīng)指標(biāo)的結(jié)構(gòu)信息。
[0003] 經(jīng)過研究發(fā)現(xiàn),電網(wǎng)工程初步設(shè)計文檔和電網(wǎng)工程可行性研究報告文檔作為指導(dǎo) 電網(wǎng)工程建設(shè)的設(shè)計文檔,具有較為復(fù)雜的文檔結(jié)構(gòu),有以下幾大特點:
[0004] (1)文檔段落結(jié)構(gòu)復(fù)雜,不同研究院或不同編寫團隊提交的文檔段落結(jié)構(gòu)不一致, 但是一般每個章節(jié)或小章節(jié)只涉及一類或部分類別指標(biāo)。文檔章節(jié)段落結(jié)構(gòu)信息能夠有效 的排除或初篩一部分指標(biāo),提尚識別效率和性能。
[0005] (2)部分復(fù)雜指標(biāo)具有層級結(jié)構(gòu),如"接線方式",其屬性有"工期"和"電壓等級"。 對于該類復(fù)雜指標(biāo),需要確定其各個層級屬性的取值。
[0006] (3)往往在電網(wǎng)工程文檔會同時羅列幾套方案供對比參考,只有一套方案被推薦 采用,而推薦采用的方案內(nèi)的指標(biāo)通常是更應(yīng)該被關(guān)注的內(nèi)容。
[0007] (4)對于電網(wǎng)工程可行性研究報告,每份報告中會同時提及幾個分工程,一個報告 文檔中可能獲得多個不同取值的指標(biāo),這些指標(biāo)分別對應(yīng)不同的分工程,需要將分工程提 及的指標(biāo)分別對應(yīng)至相應(yīng)的分工程。

【發(fā)明內(nèi)容】

[0008]為解決現(xiàn)有技術(shù)的問題,本發(fā)明的目的在于提供一種電網(wǎng)設(shè)計評審指標(biāo)結(jié)構(gòu)信息 識別方法。
[0009] 本發(fā)明的目的可通過以下的技術(shù)措施來實現(xiàn):
[0010] 一種電網(wǎng)設(shè)計評審指標(biāo)結(jié)構(gòu)信息識別方法,包括如下步驟:
[0011] 段落信息識別:識別文章段落結(jié)構(gòu),對文本切分并按照切分后的段落所涉及的類 別歸并;
[0012] 指標(biāo)對應(yīng)屬性識別:匹配每個待識別所對應(yīng)屬性的指標(biāo)的多個屬性值;
[0013]指標(biāo)可選方案匹配:匹配每個指標(biāo)的所對應(yīng)的備選方案,并確定何種候選方案為 推薦方案;
[0014] 電網(wǎng)分工程識別與指標(biāo)對應(yīng):識別分工程的作用域,匹配每個指標(biāo)對應(yīng)的分工程 信息。
[0015] 所述段落信息識別包括如下步驟:
[0016] 文檔歸一化處理:將文檔轉(zhuǎn)換為以行為單位的文本流,同時修正因轉(zhuǎn)換格式帶來 的錯誤;
[0017] 章節(jié)識別與去噪:識別正確的章節(jié)目錄信息,去掉錯誤的噪音信息;
[0018] 章節(jié)標(biāo)題抽取:抽取得到正確的章節(jié)標(biāo)題和文檔結(jié)構(gòu);
[0019] 章節(jié)信息識別:提供對每一個章節(jié)標(biāo)題進行分類、關(guān)鍵詞抽取、上下文結(jié)構(gòu)對應(yīng)的 功能。
[0020] 所述章節(jié)信息識別步驟包括如下步驟:
[0021] 章節(jié)分類:對章節(jié)按照章節(jié)標(biāo)題進行文本分類,分成六類章節(jié);
[0022] 章節(jié)關(guān)鍵詞抽?。簩φ鹿?jié)抽取最能體現(xiàn)章節(jié)信息的關(guān)鍵詞;
[0023] 上下為結(jié)構(gòu)對應(yīng):提供任意章節(jié)的父章節(jié)、子章節(jié)列表和兄弟章節(jié)列表。
[0024] 所述指標(biāo)對應(yīng)屬性識別步驟包括如下步驟:
[0025] 屬性歸并:分析指標(biāo)體系結(jié)構(gòu),將同類指標(biāo)的同類屬性進行合并;
[0026] 屬性抽?。簩傩园凑諝w并后的指標(biāo)體系進行抽取;
[0027] 指標(biāo)屬性對應(yīng):確定指標(biāo)和屬性的對應(yīng)關(guān)系。
[0028] 所述指標(biāo)可選方案匹配包括如下步驟:
[0029] 方案作用域確定:通過查找方案描述關(guān)鍵詞,確定方案作用域;
[0030] 指標(biāo)方案匹配:確定指標(biāo)和方案的匹配關(guān)系;
[0031] 推薦方案確定:識別電網(wǎng)設(shè)計評審報告中描述推薦方案的語句,確定推薦方案。
[0032] 所述電網(wǎng)分工程識別與指標(biāo)對應(yīng)中包括如下步驟:
[0033] 電網(wǎng)分工程名稱識別:從電網(wǎng)設(shè)計評審報告中抽取其描述的分工程名稱;
[0034] 電網(wǎng)分工程鏈接對應(yīng):通過給定的標(biāo)注分工程名稱,模糊匹配對應(yīng)到電網(wǎng)設(shè)計評 審報告抽取的分工程名稱;
[0035] 電網(wǎng)分工程作用域識別:確定任意指標(biāo)其所對應(yīng)的電網(wǎng)評審設(shè)計報告抽取的分工 程名稱;
[0036] 指標(biāo)分工程對應(yīng):確定任意指標(biāo)其所對應(yīng)的規(guī)范的工程名稱。
[0037] 本發(fā)明對比現(xiàn)有技術(shù),有如下優(yōu)點:
[0038] 本發(fā)明能夠從電網(wǎng)設(shè)計評審報告中將技術(shù)指標(biāo)的文檔結(jié)構(gòu)信息進行抽取,包括使 用結(jié)構(gòu)信息識別將文本中使用的分工程的簡稱或別稱與分工程的完整規(guī)范名稱進行匹配 的方法,并準(zhǔn)確識別每個分工程的作用域;識別每個方案的作用域并識別文檔作者推薦的 方案的方法;識別復(fù)雜指標(biāo)值的屬性的方法。識別指標(biāo)結(jié)構(gòu)信息能夠精確指標(biāo)的描述對象, 并有助于提尚指標(biāo)抽取的效果。
【附圖說明】
[0039] 圖1是本發(fā)明的電網(wǎng)設(shè)計評審指標(biāo)結(jié)構(gòu)信息識別方法的流程圖;
[0040] 圖2是本發(fā)明方法的段落信息識別流程圖;
[0041] 圖3是本發(fā)明方法的章節(jié)信息識別流程圖;
[0042] 圖4是本發(fā)明方法的指標(biāo)對應(yīng)屬性識別流程圖;
[0043] 圖5是本發(fā)明方法的指標(biāo)可選方案匹配流程圖;
[0044] 圖6是本發(fā)明方法的電網(wǎng)分工程識別與指標(biāo)對應(yīng)流程圖。
【具體實施方式】
[0045] 如圖1所示,本發(fā)明公開了一種電網(wǎng)設(shè)計評審指標(biāo)結(jié)構(gòu)信息識別方法,包括如下 步驟:
[0046] 步驟100 :段落信息識別,準(zhǔn)確識別文章段落結(jié)構(gòu),將可以實現(xiàn)文本切分并按照切 分后的段落所涉及的類別歸并。如圖2所示,在段落信息識別中,包括如下步驟:
[0047] 步驟110 :文檔歸一化處理:將文檔轉(zhuǎn)換為以行為單位的文本流,同時修正因轉(zhuǎn)換 格式帶來的錯誤。
[0048] 步驟120 :章節(jié)識別與去噪:識別正確的章節(jié)目錄信息,去掉錯誤的噪音信息。
[0049] 步驟130 :章節(jié)標(biāo)題抽?。簭奈臋n中抽取得到正確的章節(jié)標(biāo)題和文檔結(jié)構(gòu)。
[0050] 步驟140 :章節(jié)信息識別:提供對每一個章節(jié)標(biāo)題進行分類、關(guān)鍵詞抽取、上下文 結(jié)構(gòu)對應(yīng)的功能。
[0051] 如圖3所示,在章節(jié)信息識別中,包括如下步驟:
[0052] 步驟141:章節(jié)分類:對章節(jié)按照章節(jié)標(biāo)題進行文本分類,分成六類(變電二次、變 電一次、電纜信息、建設(shè)規(guī)模、土建、線路工程)章節(jié)。
[0053] 步驟142:章節(jié)關(guān)鍵詞抽?。簩φ鹿?jié)抽取最能體現(xiàn)章節(jié)信息的關(guān)鍵詞。
[0054] 步驟143:上下文結(jié)構(gòu)對應(yīng):提供任意章節(jié)的父章節(jié)、子章節(jié)列表和兄弟章節(jié)列 表。
[0055] 步驟200 :指標(biāo)對應(yīng)屬性識別:準(zhǔn)確匹配每個待識別所對應(yīng)屬性的指標(biāo)的多個屬 性值。如圖4所示,指標(biāo)對應(yīng)屬性識別包括如下步驟:
[0056] 步驟210 :屬性歸并:分析指標(biāo)體系結(jié)構(gòu),將同類指標(biāo)的同類屬性進行合并。
[0057] 步驟220 :屬性抽取:將對屬性按照歸并后的指標(biāo)體系進行抽取。
[0058] 步驟230 :指標(biāo)屬性對應(yīng):確定技術(shù)指標(biāo)和屬性的對應(yīng)關(guān)系。
[0059] 步驟300 :指標(biāo)可選方案匹配:準(zhǔn)確匹配每個指標(biāo)的所對應(yīng)的備選方案,并確定何 種候選方案為推薦方案。如圖5所示,指標(biāo)可選方案匹配包括如下步驟:
[0060] 步驟310 :方案作用域確定:通過查找方案描述關(guān)鍵詞,確定方案作用域。
[0061] 步驟320 :指標(biāo)方案匹配:確定指標(biāo)和方案的匹配關(guān)系。
[0062] 步驟330 :推薦方案確定:識別電
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
洪洞县| 长兴县| 重庆市| 石狮市| 霍林郭勒市| 芜湖县| 平舆县| 法库县| 吉水县| 蒙阴县| 琼结县| 沈阳市| 谷城县| 章丘市| 保定市| 达孜县| 红桥区| 阜平县| 哈密市| 汽车| 景东| 山丹县| 康定县| 团风县| 焉耆| 赣榆县| 平舆县| 阿拉尔市| 垣曲县| 广安市| 当涂县| 郸城县| 禄丰县| 枣阳市| 阿城市| 高碑店市| 哈尔滨市| 祥云县| 安义县| 盘锦市| 大邑县|