一種危險化學品安全管理評估方法
【專利摘要】本發(fā)明公開了一種危險化學品安全管理評估方法,極大的提高了數(shù)據(jù)挖掘效率,減少的了工作量。該方法通過利用粗糙集對大規(guī)模數(shù)據(jù)進行約簡,解決屬性數(shù)目多、候選集過大的問題,并運用改進Apriori算法提高運行效率,快速獲得關聯(lián)規(guī)則,找到制約不同企業(yè)提高安全管理水平的主要問題,為政府部門日常執(zhí)法檢查內容的制定提供理論依據(jù)。
【專利說明】
一種危險化學品安全管理評估方法
技術領域
[0001] 本發(fā)明涉及危險化學品安全管理評估領域,尤其涉及一種危險化學品安全管理評 估方法。
【背景技術】
[0002] 危險化學品是指具有易燃、易爆、有毒、有害和放射性等在運輸裝卸和儲存保管過 程中易造成人員傷亡和財產損毀而需要特別保護的物品。
[0003] 為更好的加強危險化學品安全管理,督促企業(yè)落實主體責任,相關部門從作業(yè)安 全、特種設備管理、場所環(huán)境功能分區(qū)、場所環(huán)境安全等十余個方面開展了多次全市企業(yè)安 全大檢查,每家企業(yè)均涉及百余項檢查內容。面對海量檢查數(shù)據(jù),政府部門很難采用簡單統(tǒng) 計方法了解制約企業(yè)提高安全管理能力的主要問題。需要借助數(shù)據(jù)挖掘方法探索現(xiàn)有數(shù)據(jù) 中企業(yè)存在問題與安全管理能力的聯(lián)系,協(xié)助政府部門完善不同類型企業(yè)日常執(zhí)法檢查的 檢查標準及重點檢查內容。
[0004] 目前采用數(shù)據(jù)挖掘技術探索數(shù)據(jù)潛在聯(lián)系的研究較多,但是極少應用于危險化學 品管理領域;同時,現(xiàn)有的數(shù)據(jù)挖掘技術復雜,且耗時耗力。
【發(fā)明內容】
[0005] 本發(fā)明的目的是提供一種危險化學品安全管理評估方法,極大的提高了數(shù)據(jù)挖掘 效率,減少了工作量。
[0006] 本發(fā)明的目的是通過以下技術方案實現(xiàn)的:
[0007] -種危險化學品安全管理評估方法,其特征在于,包括:
[0008] 步驟1、收集各類危險化學品安全管理數(shù)據(jù),并錄入到系統(tǒng)數(shù)據(jù)庫中;
[0009]步驟2、通過粗糙集的特征屬性約簡算法對系統(tǒng)數(shù)據(jù)庫中各類危險化學品安全管 理數(shù)據(jù)進行屬性約簡;
[0010] 步驟3、利用改進的Apriori算法,尋找并確定屬性約簡后的危險化學品安全管理 數(shù)據(jù)中的檢查項目與企業(yè)危險化學品安全管理能力間的聯(lián)系,從而實現(xiàn)危險化學品安全管 理評估。
[0011] 進一步的,所述通過粗糙集的特征屬性約簡算法對系統(tǒng)數(shù)據(jù)庫中海量的危險化學 品安全管理數(shù)據(jù)進行屬性約簡包括:
[0012] 步驟2-1、建立決策表S,表示為:
[0013] S={U,CUD,V,f};
[0014] 式中,U為研究對象的集合,其中一類危險化學品安全管理數(shù)據(jù)為一研究對象;C為 條件屬性集,D為決策屬性,C U D組成全部屬性集,V為屬性值集合,f為一個映射函數(shù);
[0015] 步驟2-2、設集合U中研究對象的數(shù)量為u,條件屬性集C包含η個條件屬性{ru, n2,...,n n},決策屬性D為單一決策屬性;計算決策屬性D對各個條件屬性的依賴度:
[0016] a、按決策屬性D將研究對象劃分為不同子集:對比研究對象中決策屬性取值,將同 值的研究對象作為一個子集,將所有子集歸納到同一集合中,該集合則為同類決策屬性集 合;
[0017] b、按條件屬性將研究對象劃分為不同子集:對比研究對象中條件屬性IU的取值, 將同值的研究對象作為一個子集,將所有子集歸納到同一集合中,該集合則為同類條件屬 性集合;其中,i = [l,n]
[0018] c、求解同類條件屬性集合中的子集完全包含在同類決策屬性D集合中的子集的集 合 ms·" (/));
[0019] d、計算決策屬性D對條件屬性m的依賴度:
[0020] k = Y11 (D) = Iposii(D)^ \υ\·,
[0021] e、重復執(zhí)行上述步驟a~d直至計算出解決策屬性D對各個條件屬性的依賴度;
[0022] 步驟2-3、利用依賴度求解粗糙集屬性重要性:
[0023] a、計算決策屬性D對條件屬性集C的依賴度γ C(D);
[0024] b、將條件屬性m從條件屬性集C去除后,計算決策屬性D對剩余條件屬性集的依賴 度 ?,(功;
[0025] c、計算條件屬性m的重要性) = r( "(β);
[0026] d、重復執(zhí)行上述步驟a~c直至計算出所有條件屬性的重要性,將重要性小于閾值 的條件屬性約簡。
[0027] 進一步的,所述利用改進的Apriori算法,尋找并確定屬性約簡后的危險化學品安 全管理數(shù)據(jù)中的檢查項目與企業(yè)危險化學品安全管理能力間的聯(lián)系包括:
[0028] 步驟3-1、掃描屬性約簡后的危險化學品安全管理數(shù)據(jù),找到初始項集A1;
[0029] 步驟3-2、根據(jù)最小支持度supjnin從初始項集A1中篩選出頻繁項集L1;
[0030] 步驟 3-3、設k = l;
[0031 ]步驟3-4、借助Lk利用優(yōu)化連接策略生成候選(k+1)項集Ak+i;
[0032]步驟3-5、根據(jù)設定的最小支持度sup_min,從候選(k+Ι)項集Ak+i中篩選出頻繁(k+ 1)項集 Lk+i ;
[0033] 步驟3-6、如果Lk+i非空,則k = k+l,轉到步驟3-4,否則,轉到步驟3-7;
[0034] 步驟3-7、根據(jù)設定的最小置信度conjnin,由所有的頻繁項集產生強關聯(lián)規(guī)則。
[0035] 進一步的,所述利用優(yōu)化連接策略生成候選(k+Ι)項集Lk+1包括:
[0036] 根據(jù)前k-Ι項相同的頻繁項集都是相鄰的這一1性質,利用如下兩個函數(shù)creat(Lk, heads[],tails[])和genjoin(head, tail)表示用一個頭結點和尾結點連接和生成的候選 頻繁項集的結合;則所有連接生成的頻繁項集表示為Cgen j〇 in (heads [ ], tai I s [])。
[0037] 由上述本發(fā)明提供的技術方案可以看出,可以利用粗糙集對大規(guī)模數(shù)據(jù)進行約 簡,解決屬性數(shù)目多、候選集過大的問題,并運用改進Apriori算法提高運行效率,快速獲得 關聯(lián)規(guī)則,找到制約不同企業(yè)提高安全管理水平的主要問題,為政府部門日常執(zhí)法檢查內 容的制定提供理論依據(jù)。
【附圖說明】
[0038] 為了更清楚地說明本發(fā)明實施例的技術方案,下面將對實施例描述中所需要使用 的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本 領域的普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他 附圖。
[0039] 圖1為本發(fā)明實施例提供的一種危險化學品安全管理評估方法的流程圖;
[0040] 圖2為本發(fā)明實施例提供的傳統(tǒng)數(shù)據(jù)挖掘技術與本發(fā)明方案的執(zhí)行時間比較示意 圖。
【具體實施方式】
[0041] 下面結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整 地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒?發(fā)明的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施 例,都屬于本發(fā)明的保護范圍。
[0042] 圖1為本發(fā)明實施例提供的一種危險化學品安全管理評估方法的流程圖。如圖1所 示,其主要包括如下步驟:
[0043]步驟1、收集各類危險化學品安全管理數(shù)據(jù),并錄入到系統(tǒng)數(shù)據(jù)庫中。
[0044] 步驟2、通過粗糙集的特征屬性約簡算法對系統(tǒng)數(shù)據(jù)庫中各類危險化學品安全管 理數(shù)據(jù)進行屬性約簡。
[0045] 本步驟具體可以包括如下三個過程:
[0046] 步驟2-1、建立決策表S,表示為:
[0047] S={U,CUD,V,f};
[0048] 式中,U為研究對象的集合,其中一類危險化學品安全管理數(shù)據(jù)為一研究對象;C為 條件屬性集,D為決策屬性,C U D組成全部屬性集,V為屬性值集合,f為一個映射函數(shù);
[0049] 步驟2-2、設集合U中研究對象的數(shù)量為u,條件屬性集C包含η個條件屬性{ru, n2,...,n n},決策屬性D為單一決策屬性;計算決策屬性D對各個條件屬性的依賴度:
[0050] a、按決策屬性D將研究對象劃分為不同子集:對比研究對象中決策屬性取值,將同 值的研究對象作為一個子集,將所有子集歸納到同一集合中,該集合則為同類決策屬性集 合;
[0051] b、按單一條件屬性將研究對象劃分為不同子集:對比研究對象中單一條件屬性m 的取值,將同值的研究對象作為一個子集,將所有子集歸納到同一集合中,該集合則為同類 條件屬性集合;其中,i = [l,n]
[0052] c、求解{單一條件屬性m同類}的子集完全包含在{:決策屬性D同類}子集中的子集 的集合β)。
[0053] 所述{單一條件屬性ru同類}表示同類條件屬性集合。例如,集合U包含8個研究對 象,al~a8,其中,按照單一條件屬性分類時,al、a5為一個子集,a2、a8為一個子集,a3、a4、 a6a7各屬于一個子集,則同類條件屬性集合為:
[0054] U/ru= {{al ,a5}, {a2 ,a8}, {a3}, {a4}, {a6}, {a7}};
[0055] 所述{:決策屬性D同類}表示同類決策屬性集合。例如,集合U包含8個研究對象,al ~a8,其中,決策屬性D分類時,al為一個子集,a4為一個子集,a2、a7為一個子集,a3、a6為一 個子集,a5、a8為一個子集,則同類決策屬性集合為:
[0056] U/D= {{al}, {a2 ,a7}, {a3 ,a6}, {a4}, {a5 ,a8}}
[0057] 則{單一條件屬性m同類}的子集完全包含在{:決策屬性D同類}子集中的子集的集 合 msni(m 為:
[0058] /)()5" (/)) = !>3丨 >4丨 >6丨]"7}}
[0059] d、計算決策屬性D對條件屬性m的依賴度:
[0060] k = (D) = PQSrt (D) /1£/| ;
[0061] e、重復執(zhí)行上述步驟a~d直至計算出解決策屬性D對各個條件屬性的依賴度;
[0062] 步驟2-3、利用依賴度求解粗糙集屬性重要性:
[0063] a、計算決策屬性D對條件屬性集C的依賴度γ C(D);
[0064] b、將條件屬性m從條件屬性集C去除后,計算決策屬性D對剩余條件屬性集的依賴 度,r肩''
[0065] c、計算條件屬性m的重要性:O^dC",) =,( Φ) - ,
[0066] d、重復執(zhí)行上述步驟a~c直至計算出所有條件屬性的重要性,將重要性小于閾值 的條件屬性約簡。
[0067]步驟3、利用改進的Apriori算法,尋找并確定屬性約簡后的危險化學品安全管理 數(shù)據(jù)中的檢查項目與企業(yè)危險化學品安全管理能力間的聯(lián)系,從而實現(xiàn)危險化學品安全管 理評估。
[0068] 本步驟具體可以包括如下七個過程:
[0069]步驟3-1、掃描屬性約簡后的危險化學品安全管理數(shù)據(jù),找到初始項集Alt3 [0070]所述初始項集又稱候選項集,由約簡后數(shù)據(jù)組成,每個項中僅包含一個數(shù)據(jù)。
[0071 ]步驟3-2、根據(jù)最小支持度sup_min從初始項集Ai中篩選出頻繁項集Li;
[0072] 步驟 3-3、設k = l;
[0073] 步驟3-4、借助Lk利用優(yōu)化連接策略生成候選(k+1)項集Ak+i;
[0074]步驟3-5、根據(jù)設定的最小支持度sup_min,從候選(k+Ι)項集Ak+i中篩選出頻繁(k+ 1)項集 Lk+i ;
[0075] 步驟3-6、如果Lk+i非空,則k = k+l,轉到步驟3-4,否則,轉到步驟3-7;
[0076] 步驟3-7、根據(jù)設定的最小置信度conjnin,由所有的頻繁項集產生強關聯(lián)規(guī)則。
[0077] 本發(fā)明實施例中,所述利用優(yōu)化連接策略生成候選(k+Ι)項集的集合Lk+1包括:
[0078] 根據(jù)前k-Ι項相同的頻繁項集都是相鄰的這一性質,利用如下兩個函數(shù)Creat(Lk, heads[],tails[])和genjoin(head, tail)表示用一個頭結點和尾結點連接和生成的候選 頻繁項集的結合;則所有連接生成的頻繁項集表示為Cgen j〇 in (heads [ ], tai I s [])。
[0079] 為了便于理解,下面結合一具體示例進行說明。本領域技術人員可以理解,下述示 例所涉及的各個參數(shù)的具體數(shù)值僅為舉例。
[0080] 步驟1、收集各類危險化學品安全管理數(shù)據(jù),并將這些數(shù)據(jù)錄入到系統(tǒng)數(shù)據(jù)庫中。
[0081] 以北京市某區(qū)縣部分加工企業(yè)危險化學品安全管理數(shù)據(jù)為例,其數(shù)據(jù)如表1所示:
[0083] 表1企業(yè)危險化學品安全管理數(shù)據(jù)
[0084] 步驟2、通過粗糙集的特征屬性約簡算法對系統(tǒng)數(shù)據(jù)庫中各類危險化學品安全管 理數(shù)據(jù)進行屬性約簡。
[0085] 為方便運用粗糙集算法進行數(shù)據(jù)約簡,用數(shù)字編號各屬性值,其概化表如表2所 示:
[0087]表2概化后的企業(yè)危險化學品安全管理數(shù)據(jù) [0088] 表2中1-10的含義如下:
[0089] 1)有專用?;穾?是一1;否一2
[0090] 2)有安全管理制度:是一 3;否一 4
[0091 ] 3)氣瓶存放應符合相關要求:符合一 5;基本符合一 6;不符合一 7
[0092] 4)安全管理是否合格:是一 8;否一 9。
[0093]本示例中,有專用?;穾?A)、有安全管理制度(B)、氣瓶存放應符合相關要求 (C)為條件屬性,安全管理是否合格(D)為決策屬性。基于前文所述三個步驟(步驟2-1~2-3)進行各個條件屬性重要性計算,發(fā)現(xiàn)有安全管理制度(B)這一條件屬性的重要性低于閾 值,則可以將其簡約,簡約后的企業(yè)危險化學品安全管理數(shù)據(jù)如表3所示:
[0095]表3簡約的企業(yè)危險化學品安全管理數(shù)據(jù)
[0096]步驟3、利用改進的Apriori算法,尋找并確定屬性約簡后的危險化學品安全管理 數(shù)據(jù)中的檢查項目與企業(yè)危險化學品安全管理能力間的聯(lián)系,從而實現(xiàn)危險化學品安全管 理評估。
[0097]本領域技術人員可以理解,根據(jù)前文步驟3-1所述的方法從表3所示的數(shù)據(jù)中找到 初始項集六:,初始項集的每個項中僅包含一個數(shù)據(jù),即=A1= {{1},{2},{5},{6},{7},{8}, {9}}〇
[0098]企業(yè)危險化學品安全管理數(shù)據(jù)集U中包含的同類項集X(XEU)中的個數(shù),稱為同類 項集X的支持數(shù),用α(χ)表示。同類項集X的支持度為SUpport(X),表示同類項集X的支持數(shù) 和數(shù)據(jù)集U的事務個數(shù)的比值,即同類項集X的概率,其計算公式為
[0099] support(X) =a(X)/IUI =P(X) (I)
[0100] 例如,初始項集A1中,項集{I}的支持數(shù)為3 (XI~X3的有專用?;穾?I),則項 集{1}的支持度為8卯?〇竹(1)=3/8 = 0.375;項集{2}的支持數(shù)為6〇4~乂8的有專用?;?庫=2),則項集{2}的支持度為support(2) =6/8 = 0.675;同理,可以計算出項集{5},{6}, {7},{8},{9}的支持度分別為0.25、0.375、0.375、0.375、0.625。
[0101] 再根據(jù)前述的步驟3-2從初始項集A1中篩選出頻繁項集L1,本發(fā)明實施例中,設定 最小支持度sup_min = 0.125,則將支持度大于等于0.125的項集篩選為頻繁項集1^,即本實 施例中的頻繁項集L1= {{1},{2},{5},{6},{7},{8},{9}};
[0102] 然后,設k=l,借助L1利用優(yōu)化連接策略生成候選2項集A2,即此時的項集A2中的各 個項集包含了2個數(shù)據(jù),再利用前述公式(1)計算各個項集的支持度,并利用最小支持度 sup_min從候選2項集A2中篩選出頻繁2項集L2:
[0103] 類似的,再設置k = 2,結合頻繁2項集LdU用優(yōu)化連接策略生成的候選3項集A3,同 理,再次利用最小支持度sup_min從候選3項集A 3中篩選出頻繁3項集L3: L3 = {{1,5,8},{1, 6,8},{1,7,9},{2,5,8},{2,6,9},{2,7,9}}。
[0104] 此時,獲得了所有頻繁項集L1、L2、L3,其支持度如表4所示。 LU1U/J 表4頻緊壩集
[0108] 企業(yè)危險化學品安全管理數(shù)據(jù)集U中包含同類項集X的同時也包含同類項集Y(Ye U),則稱;T 4 F為關聯(lián)規(guī)則,conf idenCe(f 4 Γ)為關聯(lián)規(guī)則的置信度,其計算公式為:
[0109] confidence^ A' Y) = suj)pori{X u y) / suj)pori{X) = P(XY) / P(X) ^2'1
[0110] 本發(fā)明實施例中,設置最小置信度conjnin = 100%。
[0111] 例如:《)/咖=、.〃/"")廠/(1,5,8) / λ."/"斯."1,5) = /J(l1.」5 u8)/
[0112] 由表4可知:support( 1,5,8) = 0 · 125,support( 1,5) = 0 · 125;
[0113] 因此有:⑶續(xù)驗_武1,54 8) = 0· 125 /0.125 =:1 = 100%:。
[0114]依據(jù)所有的頻繁項集,可得到強關聯(lián)規(guī)則如表5所示:
[0117]表5關聯(lián)規(guī)則挖掘結果
[0118] 通過置信度為100 %的強關聯(lián)規(guī)則,可以得出如下結論:
[0119] 1,51即企業(yè)有專用?;穾烨覛馄看娣欧舷嚓P要求時,認定安全管理合格;
[0120] 2,5#即企業(yè)無專用?;穾?,但氣瓶存放符合相關要求時,也認定安全管理合 格;
[0121] 1,64β即企業(yè)有專用?;穾烨覛馄看娣呕痉舷嚓P要求時,認定安全管理合 格;
[0122] 5=?即企業(yè)氣瓶存放符合相關要求時,認定安全管理合格;
[0123] 1,749即企業(yè)有專用危化品庫,但氣瓶存放不符合相關要求時,認定安全管理不合 格;
[0124] 2,7=?即企業(yè)無專用?;穾?,且氣瓶存放不符合相關要求時,認定安全管理不合 格;
[0125] 2,6^9即企業(yè)無專用?;穾?,且氣瓶存放基本符合相關要求時,認定安全管理不 合格;
[0126] 749即企業(yè)氣瓶存放不符合相關要求時,認定安全管理不合格;
[0127] 從結論可看出,在加工企業(yè)安全管理檢查過程中應高度關注氣瓶的存放是否符合 相關規(guī)定的要求,該項是日常執(zhí)法檢查的一票否決項。
[0128] 此外,為了說明本發(fā)明方案的執(zhí)行效率還與傳統(tǒng)的Apriori算法進行了比較,比較 結果如圖2所示,從圖2中可以看出隨著數(shù)據(jù)的增加,經過本發(fā)明的方案可大大降低分析時 間,有效提高了數(shù)據(jù)挖掘效率。
[0129] 通過以上的實施方式的描述,本領域的技術人員可以清楚地了解到上述實施例可 以通過軟件實現(xiàn),也可以借助軟件加必要的通用硬件平臺的方式來實現(xiàn)。基于這樣的理解, 上述實施例的技術方案可以以軟件產品的形式體現(xiàn)出來,該軟件產品可以存儲在一個非易 失性存儲介質(可以是CD-ROM,U盤,移動硬盤等)中,包括若干指令用以使得一臺計算機設 備(可以是個人計算機,服務器,或者網絡設備等)執(zhí)行本發(fā)明各個實施例所述的方法。
[0130]以上所述,僅為本發(fā)明較佳的【具體實施方式】,但本發(fā)明的保護范圍并不局限于此, 任何熟悉本技術領域的技術人員在本發(fā)明披露的技術范圍內,可輕易想到的變化或替換, 都應涵蓋在本發(fā)明的保護范圍之內。因此,本發(fā)明的保護范圍應該以權利要求書的保護范 圍為準。
【主權項】
1. 一種危險化學品安全管理評估方法,其特征在于,包括: 步驟1、收集各類危險化學品安全管理數(shù)據(jù),并錄入到系統(tǒng)數(shù)據(jù)庫中; 步驟2、通過粗糖集的特征屬性約簡算法對系統(tǒng)數(shù)據(jù)庫中各類危險化學品安全管理數(shù) 據(jù)進行屬性約簡; 步驟3、利用改進的Apriori算法,尋找并確定屬性約簡后的危險化學品安全管理數(shù)據(jù) 中的檢查項目與企業(yè)危險化學品安全管理能力間的聯(lián)系,從而實現(xiàn)危險化學品安全管理評 估。2. 根據(jù)權利要求1所述的方法,其特征在于,所述通過粗糖集的特征屬性約簡算法對系 統(tǒng)數(shù)據(jù)庫中海量的危險化學品安全管理數(shù)據(jù)進行屬性約簡包括: 步驟2-1、建立決策表S,表示為: S={U,CUD,V,f}; 式中,U為研究對象的集合,其中一類危險化學品安全管理數(shù)據(jù)為一研究對象;C為條件 屬性集,D為決策屬性,C U D組成全部屬性集,V為屬性值集合,f為一個映射函數(shù); 步驟2-2、設集合U中研究對象的數(shù)量為U,條件屬性集C包含η個條件屬性{ηι,η2, ..., η。},決策屬性D為單一決策屬性;計算決策屬性D對各個條件屬性的依賴度: a、 按決策屬性D將研究對象劃分為不同子集:對比研究對象中決策屬性取值,將同值的 研究對象作為一個子集,將所有子集歸納到同一集合中,該集合則為同類決策屬性集合; b、 按條件屬性將研究對象劃分為不同子集:對比研究對象中條件屬性m的取值,將同值 的研究對象作為一個子集,將所有子集歸納到同一集合中,該集合則為同類條件屬性集合; 其中,i = [l,n] C、求解同類條件屬性集合中的子集完全包含在同類決策屬性D集合中的子集的集合 POS,,{[)).' d、 計算決策屬性D對條件屬性m的依賴度:e、 重復執(zhí)行上述步驟a~d直至計算出解決策屬性D對各個條件屬性的依賴度; 步驟2-3、利用依賴度求解粗糖集屬性重要性: a、 計算決策屬性D對條件屬性集C的依賴度γ e(D); b、 將條件屬性ni從條件屬性集C去除后,計算決策屬性D對剩余條件屬性集的依賴度 C、計算條件屬性m的重要性:聽凸(",')=片(巧; d、重復執(zhí)行上述步驟a~C直至計算出所有條件屬性的重要性,將重要性小于闊值的條 件屬性約簡。3. 根據(jù)權利要求1所述的方法,其特征在于,所述利用改進的Apriori算法,尋找并確定 屬性約簡后的危險化學品安全管理數(shù)據(jù)中的檢查項目與企業(yè)危險化學品安全管理能力間 的聯(lián)系包括: 步驟3-1、掃描屬性約簡后的危險化學品安全管理數(shù)據(jù),找到初始項集Ai; 步驟3-2、根據(jù)最小支持度sup_min從初始項集Ai中篩選出頻繁項集 步驟3-3、設k=l; 步驟3-4、借助Lk利用優(yōu)化連接策略生成候選化+1)項集Ak+1; 步驟3-5、根據(jù)設定的最小支持度sup_min,從候選化+1)項集Ak+i中篩選出頻繁化+1)項 集 Lk+1 ; 步驟3-6、如果Lk+i非空,貝化=k+1,轉到步驟3-4,否則,轉到步驟3-7; 步驟3-7、根據(jù)設定的最小置信度con_min,由所有的頻繁項集產生強關聯(lián)規(guī)則。4.根據(jù)權利要求3所述的方法,其特征在于,所述利用優(yōu)化連接策略生成候選化+1)項 集Lk+i包括: 根據(jù)前k-1項相同的頻繁項集都是相鄰的運一性質,利用如下兩個函數(shù)creat(Lk,heads [],1:ails[])和genjoin化ead,tail)表示用一個頭結點和尾結點連接和生成的候選頻繁項 集的結合;Cgenjoin化eads[],tails[])即為所有頭結點和尾結點連接和生成的候選頻繁 項集。
【文檔編號】G06Q10/06GK105844414SQ201610179178
【公開日】2016年8月10日
【申請日】2016年3月25日
【發(fā)明人】李陽, 戴波, 劉學君, 劉建東, 田小平
【申請人】北京石油化工學院