欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

隨機(jī)森林模型的轉(zhuǎn)換方法及裝置與流程

文檔序號:11627693閱讀:253來源:國知局
隨機(jī)森林模型的轉(zhuǎn)換方法及裝置與流程

本發(fā)明涉及計算機(jī)領(lǐng)域,具體而言,涉及一種隨機(jī)森林模型的轉(zhuǎn)換方法及裝置。



背景技術(shù):

在商務(wù)智能等涉及業(yè)務(wù)分析的場景中,如銀行防詐騙分析、電信用戶流失分析等場景中,決策樹受到業(yè)務(wù)人員的普遍歡迎。通過決策樹,不僅能從業(yè)務(wù)數(shù)據(jù)中挖掘出有效的、可能連業(yè)務(wù)人員也無法意識到的有效規(guī)則,而且更重要的,它還能通過業(yè)務(wù)語言展示這些規(guī)則,以便于業(yè)務(wù)人員結(jié)合自己的業(yè)務(wù)經(jīng)驗(yàn),判斷決策樹所提煉出來的規(guī)則的合理性,并進(jìn)一步判斷是否采用該規(guī)則。

但是,隨著數(shù)據(jù)規(guī)模和類型的大幅增長,大數(shù)據(jù)時代已經(jīng)到來。面對如此之多的數(shù)據(jù),決策樹的劣勢就顯現(xiàn)出來。首先,決策樹不適合基于大規(guī)模數(shù)據(jù)的計算,因?yàn)闆Q策樹無法做到并行化,從而導(dǎo)致計算非常緩慢以致不可接受;其次,決策樹不適合基于超多維度的計算,容易導(dǎo)致深度決策樹計算非常緩慢,甚至?xí)苋菀壮霈F(xiàn)過擬合現(xiàn)象。在這種背景下,隨機(jī)森林算法的價值被學(xué)術(shù)界和工業(yè)界所認(rèn)識。隨機(jī)森林算法通過抽樣生成多棵決策樹,然后用組合投票的方式生成決策結(jié)果,不僅有效地避免了過擬合的問題,提高了推廣使用能力。更重要的是,它天然地適用于分布式計算方式,提高了數(shù)據(jù)處理能力。

但是,對商務(wù)智能來說,隨機(jī)森林模型有比較大的問題,這在一定程度上限制了隨機(jī)森林算法在商務(wù)智能中的推廣使用,那就是目前的隨機(jī)森林模型是一個黑匣子模型,業(yè)務(wù)人員無法了解其結(jié)果是如何輸出的,不知道其內(nèi)在的規(guī)則是什么。如果業(yè)務(wù)人員無法知道其內(nèi)在規(guī)則,將導(dǎo)致業(yè)務(wù)人員不敢輕易采用其輸出結(jié)果,無法結(jié)合業(yè)務(wù)經(jīng)驗(yàn)檢查其規(guī)則的合理性。

針對上述的問題,目前尚未提出有效的解決方案。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明實(shí)施例提供了一種隨機(jī)森林模型的轉(zhuǎn)換方法及裝置,以至少解決由于相關(guān)技術(shù)中隨機(jī)森林模型內(nèi)部規(guī)則不可知造成的隨機(jī)森林算法在商務(wù)智能應(yīng)用中受限的技 術(shù)問題。

根據(jù)本發(fā)明實(shí)施例的一個方面,提供了一種隨機(jī)森林模型的轉(zhuǎn)換方法,包括:將隨機(jī)森林模型中包含的每棵決策樹進(jìn)行邏輯表達(dá)式轉(zhuǎn)換,得到每棵決策樹對應(yīng)的等價邏輯表達(dá)式集;將所有決策樹的等價邏輯表達(dá)式集進(jìn)行合并,得到上述隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集,其中,上述隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集為上述隨機(jī)森林模型的等價轉(zhuǎn)換形式。

進(jìn)一步地,將隨機(jī)森林模型中包含的每棵決策樹進(jìn)行邏輯表達(dá)式轉(zhuǎn)換,得到每棵決策樹對應(yīng)的等價邏輯表達(dá)式集包括:獲取上述隨機(jī)森林模型中包含的任意一棵決策樹;以獲取的決策樹的根節(jié)點(diǎn)為起點(diǎn),通過遍歷該決策樹來依次訪問該決策樹的每個葉節(jié)點(diǎn);將從上述根節(jié)點(diǎn)到上述每個葉節(jié)點(diǎn)之間的路徑轉(zhuǎn)換成各路徑對應(yīng)的等價邏輯表達(dá)式;將上述各路徑對應(yīng)的等價邏輯表達(dá)式存儲在表達(dá)式集中以得到該決策樹的等價邏輯表達(dá)式集。

進(jìn)一步地,由上述每棵決策樹對應(yīng)的等價邏輯表達(dá)式集構(gòu)成上述隨機(jī)森林模型中包含的所有決策樹的等價邏輯表達(dá)式集的集合,其中,將所有決策樹的等價邏輯表達(dá)式集進(jìn)行合并,得到上述隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集包括:從上述集合中包含的所有等價邏輯表達(dá)式集中任意選出兩個等價邏輯表達(dá)式集;對選中的兩個等價邏輯表達(dá)式集進(jìn)行合并,得到一個新的等價邏輯表達(dá)式集;更新上述集合,得到更新后的集合,其中,該步驟包括:將新得到的等價邏輯表達(dá)式集存儲到更新前的集合中,同時從上述更新前的集合中刪除上述選中的兩個等價邏輯表達(dá)式集;繼續(xù)從上述更新后的集合中選出兩個等價邏輯表達(dá)式集進(jìn)行合并,直到等價邏輯表達(dá)式集的集合中只有一個等價邏輯表達(dá)式集為止,其中,當(dāng)?shù)葍r邏輯表達(dá)式集的集合中只有一個等價邏輯表達(dá)式集時,該等價邏輯表達(dá)式集為上述隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集。

進(jìn)一步地,對選中的兩個等價邏輯表達(dá)式集進(jìn)行合并,得到一個新的等價邏輯表達(dá)式集包括:統(tǒng)計上述選中的兩個等價邏輯表達(dá)式集中出現(xiàn)的屬性及屬性值;根據(jù)屬性及屬性值統(tǒng)計結(jié)果,將上述選中的兩個等價邏輯表達(dá)式集中的每個等價邏輯表達(dá)式按照所有出現(xiàn)的屬性及屬性值進(jìn)行展開表示,得到展開表示后的等價邏輯表達(dá)式;將等價邏輯表達(dá)式展開表示后的兩個等價邏輯表達(dá)式集進(jìn)行合并、去冗余,得到一個新的等價邏輯表達(dá)式集。

進(jìn)一步地,在將等價邏輯表達(dá)式展開表示后的兩個等價邏輯表達(dá)式集進(jìn)行合并、去冗余之后,上述方法還包括:記錄每個合并、去冗余后的等價邏輯表達(dá)式的運(yùn)算結(jié)果部分的所有標(biāo)簽及標(biāo)簽計數(shù),其中,每個標(biāo)簽用于表示對應(yīng)決策樹的一種決策結(jié)果;在得到上述隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集之后,上述方法還包括:對得到的 上述隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集中的每個等價邏輯表達(dá)式,根據(jù)表達(dá)式的運(yùn)算結(jié)果部分的所有標(biāo)簽及標(biāo)簽計數(shù)進(jìn)行過濾,得到上述隨機(jī)森林模型的過濾后的等價邏輯表達(dá)式集。

進(jìn)一步地,對得到的上述隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集中的每個等價邏輯表達(dá)式,根據(jù)表達(dá)式的運(yùn)算結(jié)果部分的所有標(biāo)簽及標(biāo)簽計數(shù)進(jìn)行過濾包括:獲取上述隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集中的任意一個等價邏輯表達(dá)式;在根據(jù)獲取的等價邏輯表達(dá)式的運(yùn)算結(jié)果部分的所有標(biāo)簽及標(biāo)簽計數(shù),確定各種標(biāo)簽對應(yīng)的支持度均等的情況下,刪除該等價邏輯表達(dá)式,其中,每種標(biāo)簽對應(yīng)的支持度通過該種標(biāo)簽的標(biāo)簽計數(shù)衡量得到;和/或在根據(jù)獲取的等價邏輯表達(dá)式的運(yùn)算結(jié)果部分的所有標(biāo)簽及標(biāo)簽計數(shù),確定上述各種標(biāo)簽對應(yīng)的支持度不均等情況下,給獲取的等價邏輯表達(dá)式賦值為對應(yīng)的支持度最高的標(biāo)簽,并保留賦值后的等價邏輯表達(dá)式。

進(jìn)一步地,在得到上述隨機(jī)森林模型的過濾后的等價邏輯表達(dá)式集之后,上述方法還包括:對得到上述隨機(jī)森林模型的過濾后的等價邏輯表達(dá)式集中的等價邏輯表達(dá)式進(jìn)行合并、去冗余,得到上述隨機(jī)森林模型的合并、去冗余的等價邏輯表達(dá)式集。

根據(jù)本發(fā)明實(shí)施例的另一方面,還提供了一種隨機(jī)森林模型的轉(zhuǎn)換裝置,包括:轉(zhuǎn)換單元,用于將隨機(jī)森林模型中包含的每棵決策樹進(jìn)行邏輯表達(dá)式轉(zhuǎn)換,得到每棵決策樹對應(yīng)的等價邏輯表達(dá)式集;第一合并單元,用于將所有決策樹的等價邏輯表達(dá)式集進(jìn)行合并,得到上述隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集,其中,上述隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集為上述隨機(jī)森林模型的等價轉(zhuǎn)換形式。

進(jìn)一步地,上述轉(zhuǎn)換單元包括:第一獲取模塊,用于獲取上述隨機(jī)森林模型中包含的任意一棵決策樹;遍歷模塊,用于以獲取的決策樹的根節(jié)點(diǎn)為起點(diǎn),通過遍歷該決策樹來依次訪問該決策樹的每個葉節(jié)點(diǎn);轉(zhuǎn)換模塊,用于將從上述根節(jié)點(diǎn)到上述每個葉節(jié)點(diǎn)之間的路徑轉(zhuǎn)換成各路徑對應(yīng)的等價邏輯表達(dá)式;存儲模塊,用于將上述各路徑對應(yīng)的等價邏輯表達(dá)式存儲在表達(dá)式集中以得到該決策樹的等價邏輯表達(dá)式集。

進(jìn)一步地,由上述每棵決策樹對應(yīng)的等價邏輯表達(dá)式集構(gòu)成上述隨機(jī)森林模型中包含的所有決策樹的等價邏輯表達(dá)式集的集合,其中,上述第一合并單元包括:選擇模塊,用于從上述集合中包含的所有等價邏輯表達(dá)式集中任意選出兩個等價邏輯表達(dá)式集;合并模塊,用于對選中的兩個等價邏輯表達(dá)式集進(jìn)行合并,得到一個新的等價邏輯表達(dá)式集;更新模塊,用于更新上述集合,得到更新后的集合,其中,該步驟包括:將新得到的等價邏輯表達(dá)式集存儲到更新前的集合中,同時從上述更新前的集合中刪除上述選中的兩個等價邏輯表達(dá)式集;循環(huán)模塊,用于繼續(xù)從上述更新后的集合中選出兩個等價邏輯表達(dá)式集進(jìn)行合并,直到等價邏輯表達(dá)式集的集合中只有一個等 價邏輯表達(dá)式集為止,其中,當(dāng)?shù)葍r邏輯表達(dá)式集的集合中只有一個等價邏輯表達(dá)式集時,該等價邏輯表達(dá)式集為上述隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集。

進(jìn)一步地,上述合并模塊包括:統(tǒng)計子模塊,用于統(tǒng)計上述選中的兩個等價邏輯表達(dá)式集中出現(xiàn)的屬性及屬性值;展開子模塊,用于根據(jù)屬性及屬性值統(tǒng)計結(jié)果,將上述選中的兩個等價邏輯表達(dá)式集中的每個等價邏輯表達(dá)式按照所有出現(xiàn)的屬性及屬性值進(jìn)行展開表示,得到展開表示后的等價邏輯表達(dá)式;合并子模塊,用于將等價邏輯表達(dá)式展開表示后的兩個等價邏輯表達(dá)式集進(jìn)行合并、去冗余,得到一個新的等價邏輯表達(dá)式集。

進(jìn)一步地,上述裝置還包括:記錄單元,用于在將等價邏輯表達(dá)式展開表示后的兩個等價邏輯表達(dá)式集進(jìn)行合并、去冗余之后,記錄每個合并、去冗余后的等價邏輯表達(dá)式的運(yùn)算結(jié)果部分的所有標(biāo)簽及標(biāo)簽計數(shù),其中,每個標(biāo)簽用于表示對應(yīng)決策樹的一種決策結(jié)果;過濾單元,用于在得到上述隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集之后,對得到的上述隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集中的每個等價邏輯表達(dá)式,根據(jù)表達(dá)式的運(yùn)算結(jié)果部分的所有標(biāo)簽及標(biāo)簽計數(shù)進(jìn)行過濾,得到上述隨機(jī)森林模型的過濾后的等價邏輯表達(dá)式集。

進(jìn)一步地,上述過濾單元包括:第二獲取模塊,用于獲取上述隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集中的任意一個等價邏輯表達(dá)式;刪除模塊,用于在根據(jù)獲取的等價邏輯表達(dá)式的運(yùn)算結(jié)果部分的所有標(biāo)簽及標(biāo)簽計數(shù),確定各種標(biāo)簽對應(yīng)的支持度均等的情況下,刪除該等價邏輯表達(dá)式,其中,每種標(biāo)簽對應(yīng)的支持度通過該種標(biāo)簽的標(biāo)簽計數(shù)衡量得到;和/或保留模塊,用于在根據(jù)獲取的等價邏輯表達(dá)式的運(yùn)算結(jié)果部分的所有標(biāo)簽及標(biāo)簽計數(shù),確定上述各種標(biāo)簽對應(yīng)的支持度不均等情況下,給獲取的等價邏輯表達(dá)式賦值為對應(yīng)的支持度最高的標(biāo)簽,并保留賦值后的等價邏輯表達(dá)式。

進(jìn)一步地,上述裝置還包括:第二合并單元,用于在得到上述隨機(jī)森林模型的過濾后的等價邏輯表達(dá)式集之后,對得到上述隨機(jī)森林模型的過濾后的等價邏輯表達(dá)式集中的等價邏輯表達(dá)式進(jìn)行合并、去冗余,得到上述隨機(jī)森林模型的合并、去冗余的等價邏輯表達(dá)式集。

在本發(fā)明實(shí)施例中,采用轉(zhuǎn)換隨機(jī)森林模型的方式,通過將隨機(jī)森林模型中包含的每棵決策樹進(jìn)行邏輯表達(dá)式轉(zhuǎn)換,得到每棵決策樹對應(yīng)的等價邏輯表達(dá)式集;將所有決策樹的等價邏輯表達(dá)式集進(jìn)行合并,得到隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集,其中,隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集為隨機(jī)森林的等價轉(zhuǎn)換形式,實(shí)現(xiàn)了將隨機(jī)森林模型轉(zhuǎn)換為等價邏輯表達(dá)式的目的,從而達(dá)到了使隨機(jī)森林模型內(nèi)部規(guī)則可知的技術(shù)效果,進(jìn)而解決了由于相關(guān)技術(shù)中隨機(jī)森林模型內(nèi)部規(guī)則不可知造成的隨機(jī) 森林算法在商務(wù)智能應(yīng)用中受限的技術(shù)問題。

附圖說明

此處所說明的附圖用來提供對本發(fā)明的進(jìn)一步理解,構(gòu)成本申請的一部分,本發(fā)明的示意性實(shí)施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定。在附圖中:

圖1是根據(jù)本發(fā)明實(shí)施例的一種可選的計算機(jī)終端的硬件結(jié)構(gòu)框圖;

圖2是根據(jù)本發(fā)明實(shí)施例的一種可選的隨機(jī)森林模型的轉(zhuǎn)換方法的流程圖;

圖3(a)和圖3(b)是根據(jù)本發(fā)明實(shí)施例的一種可選的決策樹與邏輯表達(dá)式等價轉(zhuǎn)換的示意圖;

圖3(a)是根據(jù)本發(fā)明實(shí)施例的決策樹1與其邏輯表達(dá)式等價轉(zhuǎn)換的示意圖;

圖3(b)是根據(jù)本發(fā)明實(shí)施例的決策樹2與其邏輯表達(dá)式等價轉(zhuǎn)換的示意圖;

圖4(a)是根據(jù)圖3(a)的決策樹1的等價邏輯表達(dá)式進(jìn)行展開的示意圖;

圖4(b)是根據(jù)圖3(b)的決策樹2的等價邏輯表達(dá)式進(jìn)行展開的示意圖;

圖5是根據(jù)圖4(a)和圖4(b)的展開后的等價邏輯表達(dá)式進(jìn)行合并的示意圖;

圖6是根據(jù)圖5的合并后的等價邏輯表達(dá)式進(jìn)行過濾的示意圖;

圖7是根據(jù)圖6的過濾后的等價邏輯表達(dá)式進(jìn)行去冗余的示意圖;

圖8是根據(jù)本發(fā)明實(shí)施例的隨機(jī)森林模型與其等價邏輯表達(dá)式集的示意圖;

圖9(a)是根據(jù)本發(fā)明實(shí)施例的決策樹1的可選示例的示意圖;

圖9(b)是根據(jù)本發(fā)明實(shí)施例的決策樹2的可選示例的示意圖;

圖10是根據(jù)本發(fā)明實(shí)施例的可選的隨機(jī)森林模型與其等價邏輯表達(dá)式集的示意圖;

圖11是根據(jù)本發(fā)明實(shí)施例的一種可選的隨機(jī)森林模型的轉(zhuǎn)換裝置的示意圖;

圖12是根據(jù)本發(fā)明實(shí)施例的另一種可選的計算機(jī)終端的硬件結(jié)構(gòu)框圖。

具體實(shí)施方式

為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實(shí)施例中的 附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分的實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本發(fā)明保護(hù)的范圍。

需要說明的是,本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語“第一”、“第二”等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本發(fā)明的實(shí)施例能夠以除了在這里圖示或描述的那些以外的順序?qū)嵤?。此外,術(shù)語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。

實(shí)施例1

根據(jù)本發(fā)明實(shí)施例,還提供了一種隨機(jī)森林的轉(zhuǎn)換方法的方法實(shí)施例,需要說明的是,在附圖的流程圖示出的步驟可以在諸如一組計算機(jī)可執(zhí)行指令的計算機(jī)系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。

本申請實(shí)施例一所提供的方法實(shí)施例可以在移動終端、計算機(jī)終端或者類似的運(yùn)算裝置中執(zhí)行。以運(yùn)行在計算機(jī)終端上為例,圖1是本發(fā)明實(shí)施例的一種隨機(jī)森林模型的轉(zhuǎn)換方法的計算機(jī)終端的硬件結(jié)構(gòu)框圖。如圖1所示,計算機(jī)終端10可以包括一個或多個(圖中僅示出一個)處理器102(處理器102可以包括但不限于微處理器mcu或可編程邏輯器件fpga等的處理裝置)、用于存儲數(shù)據(jù)的存儲器104、以及用于通信功能的傳輸模塊106。本領(lǐng)域普通技術(shù)人員可以理解,圖1所示的結(jié)構(gòu)僅為示意,其并不對上述電子裝置的結(jié)構(gòu)造成限定。例如,計算機(jī)終端10還可包括比圖1中所示更多或者更少的組件,或者具有與圖1所示不同的配置。

存儲器104可用于存儲應(yīng)用軟件的軟件程序以及模塊,如本發(fā)明實(shí)施例中的隨機(jī)森林模型的轉(zhuǎn)換方法對應(yīng)的程序指令/模塊,處理器102通過運(yùn)行存儲在存儲器104內(nèi)的軟件程序以及模塊,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理,即實(shí)現(xiàn)上述的應(yīng)用程序的漏洞檢測方法。存儲器104可包括高速隨機(jī)存儲器,還可包括非易失性存儲器,如一個或者多個磁性存儲裝置、閃存、或者其他非易失性固態(tài)存儲器。在一些實(shí)例中,存儲器104可進(jìn)一步包括相對于處理器102遠(yuǎn)程設(shè)置的存儲器,這些遠(yuǎn)程存儲器可以通過網(wǎng)絡(luò)連接至計算機(jī)終端10。上述網(wǎng)絡(luò)的實(shí)例包括但不限于互聯(lián)網(wǎng)、企業(yè)內(nèi)部網(wǎng)、局域網(wǎng)、移動通信網(wǎng)及其組合。

傳輸裝置106用于經(jīng)由一個網(wǎng)絡(luò)接收或者發(fā)送數(shù)據(jù)。上述的網(wǎng)絡(luò)具體實(shí)例可包括計算機(jī)終端10的通信供應(yīng)商提供的無線網(wǎng)絡(luò)。在一個實(shí)例中,傳輸裝置106包括一個網(wǎng)絡(luò)適配器(networkinterfacecontroller,nic),其可通過基站與其他網(wǎng)絡(luò)設(shè)備相連從而可與互聯(lián)網(wǎng)進(jìn)行通訊。在一個實(shí)例中,傳輸裝置106可以為射頻(radiofrequency,rf)模塊,其用于通過無線方式與互聯(lián)網(wǎng)進(jìn)行通訊。

在上述運(yùn)行環(huán)境下,本申請?zhí)峁┝巳鐖D2所示的隨機(jī)森林模型的轉(zhuǎn)換方法。圖2是根據(jù)本發(fā)明實(shí)施例的一種可選的隨機(jī)森林模型的轉(zhuǎn)換方法的流程圖。如圖2所示,該方法包括:

步驟s202,將隨機(jī)森林模型中包含的每棵決策樹進(jìn)行邏輯表達(dá)式轉(zhuǎn)換,得到每棵決策樹對應(yīng)的等價邏輯表達(dá)式集;

步驟s204,將所有決策樹的等價邏輯表達(dá)式集進(jìn)行合并,得到隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集,其中,隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集為隨機(jī)森林模型的等價轉(zhuǎn)換形式。

需要說明的是,在隨機(jī)森林算法中,每個隨機(jī)森林模型一般包括一棵或者多棵決策樹,每棵決策樹一般具有一個或者多個決策分支,每個決策分支對應(yīng)一種決策結(jié)果。對于隨機(jī)森林算法而言,由于其訓(xùn)練結(jié)果模型(以下簡稱“隨機(jī)森林模型”)是一個黑匣子,導(dǎo)致業(yè)務(wù)人員難以直觀地了解這些訓(xùn)練結(jié)果。

而通過本發(fā)明所提供的技術(shù)方案,對于任意一個隨機(jī)森林模型而言,可以先通過應(yīng)用程序?qū)⒃撾S機(jī)森林模型中包含的每棵決策樹表示成等價邏輯表達(dá)式集合(以下簡稱“邏輯表達(dá)式集”),再將所有決策樹的邏輯表達(dá)式集合并成該隨機(jī)森林模型的邏輯表達(dá)式集,其中,隨機(jī)森林模型的邏輯表達(dá)式集就是隨機(jī)森林模型的等價轉(zhuǎn)換形式。進(jìn)一步地,為了便于業(yè)務(wù)人員了解和查看隨機(jī)森林算法的訓(xùn)練結(jié)果,可以將該算法對應(yīng)的隨機(jī)森林模型的等價轉(zhuǎn)換形式進(jìn)行可視化展示。

通過本發(fā)明實(shí)施例,采用轉(zhuǎn)換隨機(jī)森林模型的方式,通過將隨機(jī)森林模型轉(zhuǎn)換成等價邏輯表達(dá)式集,實(shí)現(xiàn)了將隨機(jī)森林模型轉(zhuǎn)換為等價邏輯表達(dá)式的目的,從而達(dá)到了使隨機(jī)森林模型內(nèi)部規(guī)則可知的技術(shù)效果,進(jìn)而解決了由于相關(guān)技術(shù)中隨機(jī)森林模型內(nèi)部規(guī)則不可知造成的隨機(jī)森林算法在商務(wù)智能應(yīng)用中受限的技術(shù)問題。

可選地,將隨機(jī)森林模型中包含的每棵決策樹進(jìn)行邏輯表達(dá)式轉(zhuǎn)換,得到每棵決策樹對應(yīng)的等價邏輯表達(dá)式集包括:

s2,獲取隨機(jī)森林模型中包含的任意一棵決策樹;

s4,以獲取的決策樹的根節(jié)點(diǎn)為起點(diǎn),通過遍歷該決策樹來依次訪問該決策樹的每個葉節(jié)點(diǎn);

s6,將從根節(jié)點(diǎn)到每個葉節(jié)點(diǎn)之間的路徑轉(zhuǎn)換成各路徑對應(yīng)的等價邏輯表達(dá)式;

s8,將各路徑對應(yīng)的等價邏輯表達(dá)式存儲在表達(dá)式集中以得到該決策樹的等價邏輯表達(dá)式集。

需要說明的是,可以并行或者串行對一個隨機(jī)森林模型中的所有決策樹進(jìn)行等價邏輯表達(dá)式集轉(zhuǎn)換處,但是為了提高工作效率,在實(shí)施時,一般選擇并行處理方式。

實(shí)施時,在對隨機(jī)森林模型中任意一棵決策樹進(jìn)行邏輯表達(dá)式轉(zhuǎn)換時,可以先從該隨機(jī)森林模型中獲取相應(yīng)的決策樹,再從該決策樹的根節(jié)點(diǎn)開始,遍歷整棵決策樹以訪問該決策樹的每個葉節(jié)點(diǎn),同時記錄將從根節(jié)點(diǎn)到每個葉節(jié)點(diǎn)之間的路徑,并將這些路徑轉(zhuǎn)換成各自對應(yīng)的等價邏輯表達(dá)式。具體地,可以通過以下步驟實(shí)現(xiàn):(1)從根節(jié)點(diǎn)開始,采用深度優(yōu)先的方法遍歷整棵決策樹;(2)每訪問一個葉節(jié)點(diǎn),則記錄從根節(jié)點(diǎn)到該葉子節(jié)點(diǎn)間的路徑;(3)將該路徑轉(zhuǎn)化為等價邏輯表達(dá)式;(4)對每一個葉節(jié)點(diǎn),執(zhí)行(2)至(3)的步驟;(5)對每一棵決策樹,執(zhí)行(1)至(4)的步驟,得到每一棵決策樹的邏輯表達(dá)式集。進(jìn)一步地,為了便于存放,在得到各棵決策樹的邏輯表達(dá)式集后,可以將其全部存儲在一個集合中。

例如,假設(shè)隨機(jī)森林模型a中包括兩棵決策樹,分別為決策樹1(如圖3(a)所示)和決策樹2(如圖3(b)所示),其中,按照本發(fā)明實(shí)施例提供的技術(shù)方案,對決策樹1和決策樹2進(jìn)行轉(zhuǎn)換,分別可以得到如圖3(a)和圖3(b)所示的邏輯表達(dá)式集。

通過本發(fā)明實(shí)施例,從隨機(jī)森林算法的原理出發(fā),實(shí)現(xiàn)了對隨機(jī)森林模型中包含的每棵決策樹進(jìn)行等價邏輯表達(dá)式轉(zhuǎn)換的目的,進(jìn)而可以將隨機(jī)森林模型進(jìn)行規(guī)則化展示以使業(yè)務(wù)人員能夠明晰隨機(jī)森林模型的決策規(guī)則。

可選地,由每棵決策樹對應(yīng)的等價邏輯表達(dá)式集構(gòu)成隨機(jī)森林模型中包含的所有決策樹的等價邏輯表達(dá)式集的集合,也即,對于一個隨機(jī)森林模型而言,可以將其所有決策樹各自對應(yīng)的等價邏輯表達(dá)式集全部存儲在一個集合中。在本發(fā)明實(shí)施例中,對這個集合中的等價邏輯表達(dá)式集進(jìn)行處理時,可以同時合并所有的等價邏輯表達(dá)式集,也可以每次任取其中的兩個等價邏輯表達(dá)式集進(jìn)行合并處理。其中,采用后一種處理方式時,將所有決策樹的等價邏輯表達(dá)式集進(jìn)行合并,得到隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集包括:

s10,從集合中包含的所有等價邏輯表達(dá)式集中任意選出兩個等價邏輯表達(dá)式集;

s12,對選中的兩個等價邏輯表達(dá)式集進(jìn)行合并,得到一個新的等價邏輯表達(dá)式集;

s14,更新集合,得到更新后的集合,其中,該步驟包括:將新得到的等價邏輯表達(dá)式集存儲到更新前的集合中,同時從更新前的集合中刪除選中的兩個等價邏輯表達(dá)式集;

s16,繼續(xù)從更新后的集合中選出兩個等價邏輯表達(dá)式集進(jìn)行合并,直到等價邏輯表達(dá)式集的集合中只有一個等價邏輯表達(dá)式集為止,其中,當(dāng)?shù)葍r邏輯表達(dá)式集的集合中只有一個等價邏輯表達(dá)式集時,該等價邏輯表達(dá)式集為隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集。優(yōu)選地,對新的邏輯表達(dá)式集的集合而言,可以根據(jù)邏輯表達(dá)式集的屬性重合度,對屬性重合度最高的兩個等價邏輯表達(dá)式集執(zhí)行s16,直到等價邏輯表達(dá)式集的集合中只有一個邏輯表達(dá)式集時停止,得到隨機(jī)森林模型的等價邏輯表達(dá)式集。

依舊以隨機(jī)森林模型a為例,可以從a中任意選取兩棵決策樹的等價邏輯表達(dá)式集進(jìn)行合并處理,由于a中只有兩棵決策樹(即決策樹1和決策樹2),因此,可以合并決策樹1和決策樹2,合并結(jié)果即為隨機(jī)森林模型a對應(yīng)的等價邏輯表達(dá)式集。基于此,需要說明的是,在執(zhí)行s16前,需要先判斷存儲所有的等價邏輯表達(dá)式集的集合中是否僅僅包含兩個等價邏輯表達(dá)式集,在是的情況下,可以直接將合并結(jié)果作為隨機(jī)森林模型a對應(yīng)的等價邏輯表達(dá)式集;在否的情況下,則需要執(zhí)行s16。

實(shí)施時,從上述集合中選取某兩個決策樹的等價邏輯表達(dá)式集,進(jìn)行合并,得到合并后的新的邏輯表達(dá)式集,同時刪除合并前的選中的兩個決策樹的等價邏輯表達(dá)式集,進(jìn)而構(gòu)成新的邏輯表達(dá)式集的集合。

通過本發(fā)明實(shí)施例,從隨機(jī)森林算法的原理出發(fā),實(shí)現(xiàn)了對隨機(jī)森林模型中包含的每棵決策樹進(jìn)行等價邏輯表達(dá)式轉(zhuǎn)換的目的,并進(jìn)一步對隨機(jī)森林模型中的等價邏輯表達(dá)式集進(jìn)行合并,最終進(jìn)而可以得到隨機(jī)森林模型的簡化等價邏輯表達(dá)式集,實(shí)現(xiàn)簡化等價轉(zhuǎn)換結(jié)果的目的。

可選地,對選中的兩個等價邏輯表達(dá)式集進(jìn)行合并,得到一個新的等價邏輯表達(dá)式集包括:

s18,統(tǒng)計選中的兩個等價邏輯表達(dá)式集中出現(xiàn)的屬性及屬性值;

s20,根據(jù)屬性及屬性值統(tǒng)計結(jié)果,將選中的兩個等價邏輯表達(dá)式集中的每個等價邏輯表達(dá)式按照所有出現(xiàn)的屬性及屬性值進(jìn)行展開表示,得到展開表示后的等價邏輯表達(dá)式;

s22,將等價邏輯表達(dá)式展開表示后的兩個等價邏輯表達(dá)式集進(jìn)行合并、去冗余,得到一個新的等價邏輯表達(dá)式集。

需要說明的是,具體合并過程如下:(1)統(tǒng)計選出的兩棵決策樹各自對應(yīng)的等價邏輯表達(dá)式集中出現(xiàn)的屬性和屬性值;(2)根據(jù)(1)的結(jié)果,將這兩個邏輯表達(dá)式集中的每一個邏輯表達(dá)式用(1)中所有的屬性進(jìn)行展開表示;(3)且將(2)中得到的展開表示的邏輯表達(dá)式的屬性按照一定的順序表示;(4)合并、化簡這兩個邏輯表達(dá)式集,并記錄合并后每一個邏輯表達(dá)式所支持的標(biāo)簽及其計數(shù),得到新的合并后的新的邏輯表達(dá)式集。

例如,對應(yīng)隨機(jī)森林模型a而言,經(jīng)統(tǒng)計可知,決策樹1和決策樹2各自對應(yīng)的等價邏輯表達(dá)式集中出現(xiàn)的屬性包括:a、b、c,它們的屬性值分別為+a(簡寫為“a”)和+b(簡寫為“b”)和+c(簡寫為“c”)和根據(jù)這些屬性和屬性值將決策樹1對應(yīng)的等價邏輯表達(dá)式集展開表示,可以得到圖4(a)中右端所示的等價邏輯表達(dá)式集;同理,根據(jù)這些屬性和屬性值將決策樹2對應(yīng)的等價邏輯表達(dá)式集展開表示,可以得到圖4(b)中右端所示的等價邏輯表達(dá)式集。進(jìn)一步地,將上述兩個展開后的等價邏輯表達(dá)式集進(jìn)行合并,可以得到圖5中右端所示的等價邏輯表達(dá)式集,其中,合并得到的等價邏輯表達(dá)式集中,每個等價邏輯表達(dá)式結(jié)果部分包括該等價邏輯表達(dá)式所支持的標(biāo)簽及其計數(shù),例如,對于“a^b^c=>t,t”而言,其所支持的標(biāo)簽有兩個,都是“t”。

通過本發(fā)明實(shí)施例,可以達(dá)到簡化隨機(jī)森林模型的轉(zhuǎn)換結(jié)果的目的。

可選地,在將等價邏輯表達(dá)式展開表示后的兩個等價邏輯表達(dá)式集進(jìn)行合并、去冗余之后,上述方法還包括:

s24,記錄每個合并、去冗余后的等價邏輯表達(dá)式的運(yùn)算結(jié)果部分的所有標(biāo)簽及標(biāo)簽計數(shù),其中,每個標(biāo)簽用于表示對應(yīng)決策樹的一種決策結(jié)果;在得到隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集之后,上述方法還包括:

s26,對得到的隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集中的每個等價邏輯表達(dá)式,根據(jù)表達(dá)式的運(yùn)算結(jié)果部分的所有標(biāo)簽及標(biāo)簽計數(shù)進(jìn)行過濾,得到隨機(jī)森林模型的過濾后的等價邏輯表達(dá)式集。

實(shí)施時,可以根據(jù)表達(dá)式的運(yùn)算結(jié)果部分的標(biāo)簽計數(shù)以及各標(biāo)簽所支持的決策結(jié)果、標(biāo)簽是否唯一等屬性條件,進(jìn)行過濾操作,也即,根據(jù)其表達(dá)式右端各個標(biāo)簽的支持度,過濾表達(dá)式,得到過濾后的邏輯表達(dá)式集。進(jìn)一步地,合并后,可以根據(jù)各等價邏輯表達(dá)式結(jié)果部分的標(biāo)簽和標(biāo)簽數(shù)進(jìn)行去冗余處理,從而得到圖6中右端所示 的等價邏輯表達(dá)式集。

通過本發(fā)明實(shí)施例,可以達(dá)到簡化隨機(jī)森林模型的轉(zhuǎn)換結(jié)果的目的。

可選地,對得到的隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集中的每個等價邏輯表達(dá)式,根據(jù)表達(dá)式的運(yùn)算結(jié)果部分的所有標(biāo)簽及標(biāo)簽計數(shù)進(jìn)行過濾包括:

s28,獲取隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集中的任意一個等價邏輯表達(dá)式;

s30,在根據(jù)獲取的等價邏輯表達(dá)式的運(yùn)算結(jié)果部分的所有標(biāo)簽及標(biāo)簽計數(shù),確定各種標(biāo)簽對應(yīng)的支持度均等的情況下,刪除該等價邏輯表達(dá)式,其中,每種標(biāo)簽對應(yīng)的支持度通過該種標(biāo)簽的標(biāo)簽計數(shù)衡量得到,例如,如圖6所示,對于而言,由于標(biāo)簽t和f的對應(yīng)的支持度均等,因此,需要刪除該等價邏輯表達(dá)式;和/或

s32,在根據(jù)獲取的等價邏輯表達(dá)式的運(yùn)算結(jié)果部分的所有標(biāo)簽及標(biāo)簽計數(shù),確定各種標(biāo)簽對應(yīng)的支持度不均等情況下,給獲取的等價邏輯表達(dá)式賦值為對應(yīng)的支持度最高的標(biāo)簽,并保留賦值后的等價邏輯表達(dá)式,例如,如圖6所示,對于“a^b^c=>t,t”而言,由于標(biāo)簽t和f對應(yīng)的支持度不均等,且支持度最高的標(biāo)簽只包括t,因此,需要將“t”賦給“a^b^c”,得到“a^b^c=>t”,并保留賦值后的等價邏輯表達(dá)式。

需要說明的是,上述過濾過程也是去冗余操作過程,其中,具體過濾過程如下:判斷各個標(biāo)簽的支持度是否均等,如果各個標(biāo)簽的支持度均等,則刪除該表達(dá)式;如果各個標(biāo)簽的支持度不均等,則給獲取的等價邏輯表達(dá)式賦值為支持度最高的標(biāo)簽,并保留該賦值后的邏輯表達(dá)式。

依舊以隨機(jī)森林模型a為例,在根據(jù)各等價邏輯表達(dá)式結(jié)果部分的標(biāo)簽和標(biāo)簽數(shù)進(jìn)行去冗余處理后,可以得到圖6中右端所示的等價邏輯表達(dá)式集。

可選地,在得到隨機(jī)森林模型的過濾后的等價邏輯表達(dá)式集之后,上述方法還包括:

s34,對得到隨機(jī)森林模型的過濾后的等價邏輯表達(dá)式集中的等價邏輯表達(dá)式進(jìn)行合并、去冗余(去冗余即化簡),得到隨機(jī)森林模型的合并、去冗余的等價邏輯表達(dá)式集。也即,對過濾后得到的邏輯表達(dá)式集中的每一個表達(dá)式,進(jìn)行合并、化簡,得到最終的、隨機(jī)森林模型的等價規(guī)則(即等價邏輯表達(dá)式)。此時,等價規(guī)則非常簡單,并而非常清晰明了,很容易展示給業(yè)務(wù)人員,使其對隨機(jī)森林算法的訓(xùn)練結(jié)果有一個較直觀地了解。

依舊以隨機(jī)森林模型a為例,在使用本發(fā)明實(shí)施例提供的技術(shù)方案進(jìn)行去冗余處理后,可以得到圖7中右端所示的等價邏輯表達(dá)式集,而整個隨機(jī)森林模型a的規(guī)則化展示如圖8所示。

在大數(shù)據(jù)時代,通過本發(fā)明提供的技術(shù)方案,能夠有效地將隨機(jī)森林算法的訓(xùn)練結(jié)果模型進(jìn)行規(guī)則化展示,為業(yè)務(wù)人員結(jié)合自身經(jīng)驗(yàn)判斷模型的有效性提供了大力支持;并且,這種規(guī)則化展示,還可以為業(yè)務(wù)人員理解算法的訓(xùn)練結(jié)果提供直觀地方法;本發(fā)明填補(bǔ)了隨機(jī)森林算法在訓(xùn)練結(jié)果展示領(lǐng)域的空白,有利于隨機(jī)森林算法在商務(wù)智能中的推廣和應(yīng)用。

以下結(jié)合圖9(a)和圖9(b),以一個具體實(shí)施例詳細(xì)闡述本發(fā)明:

依舊以隨機(jī)森林模型a為例,假設(shè)需要判斷某個用戶是否是作弊用戶,可以從用戶性別、所在城市、下載量、重復(fù)下載量、下載時間分布等多個特征出發(fā),用隨機(jī)森林算法得到如圖9(a)和圖9(b)所示的隨機(jī)森林算法的訓(xùn)練結(jié)果,其中,a表示用戶性別、b代表下載量大于50、c代表重復(fù)下載量大于25,判斷結(jié)果將由決策樹1和決策樹2這兩棵樹的規(guī)則來決定,其中,通過使用本發(fā)明,對隨機(jī)森林模型a進(jìn)行等價轉(zhuǎn)換,得到的規(guī)則化展示結(jié)果為“如果下載量大于50且重復(fù)下載量大于25,則確定這個用戶作弊;如果下載量小于等于50,則確定這個用戶正?!保唧w如圖10所示。

綜上可見,如果直接使用隨機(jī)森林算法的訓(xùn)練結(jié)果,將難以看出其判斷的規(guī)則和依據(jù),但是,本發(fā)明提供的技術(shù)方案則可以將隨機(jī)森林算法的訓(xùn)練結(jié)果,以簡化的、等效的規(guī)則表示出來,使業(yè)務(wù)人員清楚了解該算法對應(yīng)的訓(xùn)練結(jié)果的決策依據(jù)。

通過本發(fā)明實(shí)施例,實(shí)現(xiàn)了利用邏輯表達(dá)式推理的方法,對隨機(jī)森林算法的訓(xùn)練結(jié)果進(jìn)行轉(zhuǎn)換,以及進(jìn)行等效化簡,并以直觀的規(guī)則化的形式進(jìn)行展示的目的。

需要說明的是,對于前述的各方法實(shí)施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動作順序的限制,因?yàn)橐罁?jù)本發(fā)明,某些步驟可以采用其他順序或者同時進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動作和模塊并不一定是本發(fā)明所必須的。

通過以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到根據(jù)上述實(shí)施例的方法可借助軟件加必需的通用硬件平臺的方式來實(shí)現(xiàn),當(dāng)然也可以通過硬件,但很多情況下前者是更佳的實(shí)施方式。基于這樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機(jī)軟件產(chǎn)品存儲在一個存儲介質(zhì)(如rom/ram、磁碟、光盤)中,包括若干指令用以使得一臺終端 設(shè)備(可以是手機(jī),計算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實(shí)施例所述的方法。

實(shí)施例2

根據(jù)本發(fā)明實(shí)施例,還提供了一種用于實(shí)施隨機(jī)森林模型的轉(zhuǎn)換方法的裝置,如圖11所示,該裝置包括:轉(zhuǎn)換單元112,用于將隨機(jī)森林模型中包含的每棵決策樹進(jìn)行邏輯表達(dá)式轉(zhuǎn)換,得到每棵決策樹對應(yīng)的等價邏輯表達(dá)式集;第一合并單元114,用于將所有決策樹的等價邏輯表達(dá)式集進(jìn)行合并,得到隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集,其中,隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集為隨機(jī)森林的等價轉(zhuǎn)換形式。

需要說明的是,在隨機(jī)森林算法中,每個隨機(jī)森林模型一般包括一棵或者多棵決策樹,每棵決策樹一般具有一個或者多個決策分支,每個決策分支對應(yīng)一種決策結(jié)果。對于隨機(jī)森林算法而言,由于其訓(xùn)練結(jié)果模型(以下簡稱“隨機(jī)森林模型”)是一個黑匣子,導(dǎo)致業(yè)務(wù)人員難以直觀地了解這些訓(xùn)練結(jié)果。

而通過本發(fā)明所提供的技術(shù)方案,對于任意一個隨機(jī)森林模型而言,可以先通過應(yīng)用程序?qū)⒃撾S機(jī)森林模型中包含的每棵決策樹表示成等價邏輯表達(dá)式集合(以下簡稱“邏輯表達(dá)式集”),再將所有決策樹的邏輯表達(dá)式集合并成該隨機(jī)森林模型的邏輯表達(dá)式集,其中,隨機(jī)森林模型的邏輯表達(dá)式集就是隨機(jī)森林模型的等價轉(zhuǎn)換形式。進(jìn)一步地,為了便于業(yè)務(wù)人員了解和查看隨機(jī)森林算法的訓(xùn)練結(jié)果,可以將該算法對應(yīng)的隨機(jī)森林模型的等價轉(zhuǎn)換形式進(jìn)行可視化展示。

通過本發(fā)明實(shí)施例,采用轉(zhuǎn)換隨機(jī)森林模型的方式,通過將隨機(jī)森林模型轉(zhuǎn)換成等價邏輯表達(dá)式集,實(shí)現(xiàn)了將隨機(jī)森林模型轉(zhuǎn)換為等價邏輯表達(dá)式的目的,從而達(dá)到了使隨機(jī)森林模型內(nèi)部規(guī)則可知的技術(shù)效果,進(jìn)而解決了由于相關(guān)技術(shù)中隨機(jī)森林模型內(nèi)部規(guī)則不可知造成的隨機(jī)森林算法在商務(wù)智能應(yīng)用中受限的技術(shù)問題。

可選地,上述轉(zhuǎn)換單元包括:第一獲取模塊,用于獲取隨機(jī)森林模型中包含的任意一棵決策樹;遍歷模塊,用于以獲取的決策樹的根節(jié)點(diǎn)為起點(diǎn),通過遍歷該決策樹來依次訪問該決策樹的每個葉節(jié)點(diǎn);轉(zhuǎn)換模塊,用于將從根節(jié)點(diǎn)到每個葉節(jié)點(diǎn)之間的路徑轉(zhuǎn)換成各路徑對應(yīng)的等價邏輯表達(dá)式;存儲模塊,用于將各路徑對應(yīng)的等價邏輯表達(dá)式存儲在表達(dá)式集中以得到該決策樹的等價邏輯表達(dá)式集。

可選地,由每棵決策樹對應(yīng)的等價邏輯表達(dá)式集構(gòu)成隨機(jī)森林模型中包含的所有決策樹的等價邏輯表達(dá)式集的集合,其中,上述第一合并單元包括:選擇模塊,用于從集合中包含的所有等價邏輯表達(dá)式集中任意選出兩個等價邏輯表達(dá)式集;合并模塊,用于對選中的兩個等價邏輯表達(dá)式集進(jìn)行合并,得到一個新的等價邏輯表達(dá)式集;更 新模塊,用于更新集合,得到更新后的集合,其中,該步驟包括:將新得到的等價邏輯表達(dá)式集存儲到更新前的集合中,同時從更新前的集合中刪除選中的兩個等價邏輯表達(dá)式集;循環(huán)模塊,用于繼續(xù)從更新后的集合中選出兩個等價邏輯表達(dá)式集進(jìn)行合并,直到等價邏輯表達(dá)式集的集合中只有一個等價邏輯表達(dá)式集為止,其中,當(dāng)?shù)葍r邏輯表達(dá)式集的集合中只有一個等價邏輯表達(dá)式集時,該等價邏輯表達(dá)式集為隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集。

可選地,上述合并模塊包括:統(tǒng)計子模塊,用于統(tǒng)計選中的兩個等價邏輯表達(dá)式集中出現(xiàn)的屬性及屬性值;展開子模塊,用于根據(jù)屬性及屬性值統(tǒng)計結(jié)果,將選中的兩個等價邏輯表達(dá)式集中的每個等價邏輯表達(dá)式按照所有出現(xiàn)的屬性及屬性值進(jìn)行展開表示,得到展開表示后的等價邏輯表達(dá)式;合并子模塊,用于將等價邏輯表達(dá)式展開表示后的兩個等價邏輯表達(dá)式集進(jìn)行合并、去冗余,得到一個新的等價邏輯表達(dá)式集。

可選地,上述裝置還包括:記錄單元,用于在將等價邏輯表達(dá)式展開表示后的兩個等價邏輯表達(dá)式集進(jìn)行合并、去冗余之后,記錄每個合并、去冗余后的等價邏輯表達(dá)式的運(yùn)算結(jié)果部分的所有標(biāo)簽及標(biāo)簽計數(shù),其中,每個標(biāo)簽用于表示對應(yīng)決策樹的一種決策結(jié)果;過濾單元,用于在得到隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集之后,對得到的隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集中的每個等價邏輯表達(dá)式,根據(jù)表達(dá)式的運(yùn)算結(jié)果部分的所有標(biāo)簽及標(biāo)簽計數(shù)進(jìn)行過濾,得到隨機(jī)森林模型的過濾后的等價邏輯表達(dá)式集。

可選地,上述過濾單元包括:第二獲取模塊,用于獲取隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集中的任意一個等價邏輯表達(dá)式;刪除模塊,用于在根據(jù)獲取的等價邏輯表達(dá)式的運(yùn)算結(jié)果部分的所有標(biāo)簽及標(biāo)簽計數(shù),確定各種標(biāo)簽對應(yīng)的支持度均等的情況下,刪除該等價邏輯表達(dá)式,其中,每種標(biāo)簽對應(yīng)的支持度通過該種標(biāo)簽的標(biāo)簽計數(shù)衡量得到;刪除模塊,用于在根據(jù)獲取的等價邏輯表達(dá)式的運(yùn)算結(jié)果部分的所有標(biāo)簽及標(biāo)簽計數(shù),確定各種標(biāo)簽對應(yīng)的支持度均等的情況下,刪除該等價邏輯表達(dá)式,其中,每種標(biāo)簽對應(yīng)的支持度通過該種標(biāo)簽的標(biāo)簽計數(shù)衡量得到;和/或保留模塊,用于在根據(jù)獲取的等價邏輯表達(dá)式的運(yùn)算結(jié)果部分的所有標(biāo)簽及標(biāo)簽計數(shù),確定各種標(biāo)簽對應(yīng)的支持度不均等的情況下,給獲取的等價邏輯表達(dá)式賦值為對應(yīng)的支持度最高的標(biāo)簽,并保留賦值后的等價邏輯表達(dá)式。

可選地,上述裝置還包括:第二合并單元,用于在得到隨機(jī)森林模型的過濾后的等價邏輯表達(dá)式集之后,對得到隨機(jī)森林模型的過濾后的等價邏輯表達(dá)式集中的等價邏輯表達(dá)式進(jìn)行合并、去冗余,得到隨機(jī)森林模型的合并、去冗余的等價邏輯表達(dá)式 集。

需要說明的是,上述功能單元和/或功能模塊對應(yīng)于實(shí)施例1中各實(shí)施方式中的步驟,這些功能單元和/或功能模塊與對應(yīng)的步驟所實(shí)現(xiàn)的示例和應(yīng)用場景相同,但不限于上述實(shí)施例1所公開的內(nèi)容,在此不再贅述。需要說明的是,上述功能單元和/或功能模塊作為裝置的一部分可以運(yùn)行在實(shí)施例1提供的計算機(jī)終端10中。

實(shí)施例3

本發(fā)明的實(shí)施例可以提供一種計算機(jī)終端,該計算機(jī)終端可以是計算機(jī)終端群中的任意一個計算機(jī)終端設(shè)備??蛇x地,在本實(shí)施例中,上述計算機(jī)終端也可以替換為移動終端等終端設(shè)備。

可選地,在本實(shí)施例中,上述計算機(jī)終端可以位于計算機(jī)網(wǎng)絡(luò)的多個網(wǎng)絡(luò)設(shè)備中的至少一個網(wǎng)絡(luò)設(shè)備。

在本實(shí)施例中,上述計算機(jī)終端可以執(zhí)行應(yīng)用程序的隨機(jī)森林模型的轉(zhuǎn)換方法中以下步驟的程序代碼:將隨機(jī)森林模型中包含的每棵決策樹進(jìn)行邏輯表達(dá)式轉(zhuǎn)換,得到每棵決策樹對應(yīng)的等價邏輯表達(dá)式集;將所有決策樹的等價邏輯表達(dá)式集進(jìn)行合并,得到隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集,其中,隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集為隨機(jī)森林的等價轉(zhuǎn)換形式。

可選地,圖12是根據(jù)本發(fā)明實(shí)施例的另一種可選的計算機(jī)終端的硬件結(jié)構(gòu)框圖。如圖12所示,該計算機(jī)終端a可以包括:一個或多個(圖中僅示出一個)處理器、存儲器、以及傳輸裝置。

其中,存儲器可用于存儲軟件程序以及模塊,如本發(fā)明實(shí)施例中的安全漏洞檢測方法和裝置對應(yīng)的程序指令/模塊,處理器通過運(yùn)行存儲在存儲器內(nèi)的軟件程序以及模塊,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理,即實(shí)現(xiàn)上述的系統(tǒng)漏洞攻擊的檢測方法。存儲器可包括高速隨機(jī)存儲器,還可以包括非易失性存儲器,如一個或者多個磁性存儲裝置、閃存、或者其他非易失性固態(tài)存儲器。在一些實(shí)例中,存儲器可進(jìn)一步包括相對于處理器遠(yuǎn)程設(shè)置的存儲器,這些遠(yuǎn)程存儲器可以通過網(wǎng)絡(luò)連接至終端a。上述網(wǎng)絡(luò)的實(shí)例包括但不限于互聯(lián)網(wǎng)、企業(yè)內(nèi)部網(wǎng)、局域網(wǎng)、移動通信網(wǎng)及其組合。

處理器可以通過傳輸裝置調(diào)用存儲器存儲的信息及應(yīng)用程序,以執(zhí)行下述步驟:將隨機(jī)森林模型中包含的每棵決策樹進(jìn)行邏輯表達(dá)式轉(zhuǎn)換,得到每棵決策樹對應(yīng)的等價邏輯表達(dá)式集;將所有決策樹的等價邏輯表達(dá)式集進(jìn)行合并,得到隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集,其中,隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集為隨機(jī)森林的等價轉(zhuǎn)換形式。

可選的,上述處理器還可以執(zhí)行上述實(shí)施例1中其他實(shí)施方式中的步驟的程序代碼,在此不再一一贅述。

通過在本發(fā)明實(shí)施例中,采用轉(zhuǎn)換隨機(jī)森林模型的方式,通過將隨機(jī)森林模型中包含的每棵決策樹進(jìn)行邏輯表達(dá)式轉(zhuǎn)換,得到每棵決策樹對應(yīng)的等價邏輯表達(dá)式集;將所有決策樹的等價邏輯表達(dá)式集進(jìn)行合并,得到隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集,其中,隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集為隨機(jī)森林的等價轉(zhuǎn)換形式,實(shí)現(xiàn)了將隨機(jī)森林模型轉(zhuǎn)換為等價邏輯表達(dá)式的目的,從而達(dá)到了使隨機(jī)森林模型內(nèi)部規(guī)則可知的技術(shù)效果,進(jìn)而解決了由于相關(guān)技術(shù)中隨機(jī)森林模型內(nèi)部規(guī)則不可知造成的隨機(jī)森林算法在商務(wù)智能應(yīng)用中受限的技術(shù)問題。

本領(lǐng)域普通技術(shù)人員可以理解,圖12所示的結(jié)構(gòu)僅為示意,計算機(jī)終端也可以是智能手機(jī)(如android手機(jī)、ios手機(jī)等)、平板電腦、掌聲電腦以及移動互聯(lián)網(wǎng)設(shè)備(mobileinternetdevices,mid)、pad等終端設(shè)備。圖10其并不對上述電子裝置的結(jié)構(gòu)造成限定。例如,計算機(jī)終端10還可包括比圖10中所示更多或者更少的組件(如網(wǎng)絡(luò)接口、顯示裝置等),或者具有與圖10所示不同的配置。

本領(lǐng)域普通技術(shù)人員可以理解上述實(shí)施例的各種方法中的全部或部分步驟是可以通過程序來指令終端設(shè)備相關(guān)的硬件來完成,該程序可以存儲于一計算機(jī)可讀存儲介質(zhì)中,存儲介質(zhì)可以包括:閃存盤、只讀存儲器(read-onlymemory,rom)、隨機(jī)存取器(randomaccessmemory,ram)、磁盤或光盤等。

實(shí)施例4

本發(fā)明的實(shí)施例還提供了一種存儲介質(zhì)??蛇x地,在本實(shí)施例中,上述存儲介質(zhì)可以用于保存上述實(shí)施例1所提供的隨機(jī)森林模型的轉(zhuǎn)換方法所執(zhí)行的程序代碼。

可選地,在本實(shí)施例中,上述存儲介質(zhì)可以位于計算機(jī)網(wǎng)絡(luò)中計算機(jī)終端群中的任意一個計算機(jī)終端中,或者位于移動終端群中的任意一個移動終端中。

可選的,在本實(shí)施例中,存儲介質(zhì)被設(shè)置為存儲用于執(zhí)行以下步驟的程序代碼:將隨機(jī)森林模型中包含的每棵決策樹進(jìn)行邏輯表達(dá)式轉(zhuǎn)換,得到每棵決策樹對應(yīng)的等價邏輯表達(dá)式集;將所有決策樹的等價邏輯表達(dá)式集進(jìn)行合并,得到隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集,其中,隨機(jī)森林模型對應(yīng)的等價邏輯表達(dá)式集為隨機(jī)森林的等價轉(zhuǎn)換形式。

可選的,上述存儲介質(zhì)還可以存儲上述實(shí)施例1中其他實(shí)施方式中的步驟的程序代碼,在此不再一一贅述。

上述本發(fā)明實(shí)施例序號僅僅為了描述,不代表實(shí)施例的優(yōu)劣。

在本發(fā)明的上述實(shí)施例中,對各個實(shí)施例的描述都各有側(cè)重,某個實(shí)施例中沒有詳述的部分,可以參見其他實(shí)施例的相關(guān)描述。

在本申請所提供的幾個實(shí)施例中,應(yīng)該理解到,所揭露的技術(shù)內(nèi)容,可通過其它的方式實(shí)現(xiàn)。其中,以上所描述的裝置實(shí)施例僅僅是示意性的,例如所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,單元或模塊的間接耦合或通信連接,可以是電性或其它的形式。

所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。

另外,在本發(fā)明各個實(shí)施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨(dú)物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。

所述集成的單元如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時,可以存儲在一個計算機(jī)可讀取存儲介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機(jī)軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機(jī)設(shè)備(可為個人計算機(jī)、服務(wù)器或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實(shí)施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:u盤、只讀存儲器(rom,read-onlymemory)、隨機(jī)存取存儲器(ram,randomaccessmemory)、移動硬盤、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。

以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤飾,這些改進(jìn)和潤飾也應(yīng)視為本發(fā)明的保護(hù)范圍。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
高平市| 普兰县| 钦州市| 邵东县| 遂宁市| 桃江县| 曲沃县| 锦屏县| 蒙城县| 定州市| 上犹县| 新乡市| 滕州市| 宾阳县| 疏勒县| 大丰市| 虞城县| 赫章县| 石泉县| 稻城县| 上林县| 石狮市| 彰武县| 漾濞| 新邵县| 柏乡县| 久治县| 札达县| 和平区| 财经| 焦作市| 沙洋县| 吉木萨尔县| 平阳县| 义马市| 黎川县| 杭锦旗| 屯昌县| 鄂温| 工布江达县| 修武县|