本發(fā)明涉及信息技術(shù)領(lǐng)域。更具體地說(shuō),本發(fā)明涉及一種基于基因表達(dá)式編程的計(jì)算機(jī)用戶行為分析方法。
背景技術(shù):
用戶行為分析,是指在獲得網(wǎng)站訪問(wèn)量基本數(shù)據(jù)的情況下,對(duì)有關(guān)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)、分析的過(guò)程。通過(guò)用戶行為分析可以發(fā)現(xiàn)用戶訪問(wèn)網(wǎng)站的規(guī)律,并將這些規(guī)律與網(wǎng)絡(luò)營(yíng)銷策略等相結(jié)合,從而發(fā)現(xiàn)目前網(wǎng)絡(luò)營(yíng)銷活動(dòng)中可能存在的問(wèn)題,并為進(jìn)一步修正或重新制定網(wǎng)絡(luò)營(yíng)銷策略提供依據(jù)。
基因表達(dá)式編程(Gene Expression Programming,GEP)是是葡萄牙學(xué)者Candida Ferreira于2001年在遺傳算法(Genetic Algorithm,GA)和遺傳編程(Genetic Programming,GP)的基礎(chǔ)上發(fā)展的新概念。與用固定長(zhǎng)度的線性串表示個(gè)體的GA和用長(zhǎng)度和形狀不同的非線性實(shí)體表示個(gè)體的GP不同,GEP是將個(gè)體編碼成固定長(zhǎng)度的線性串(基因組或染色體),然后將其轉(zhuǎn)換為不同長(zhǎng)度和形狀的非線性實(shí)體,從而實(shí)現(xiàn)了用簡(jiǎn)單編碼表示復(fù)雜問(wèn)題,同時(shí)易于遺傳操作,并且通過(guò)遺傳操作所產(chǎn)生的新個(gè)體在語(yǔ)法上都是有效的,不需要對(duì)新個(gè)體進(jìn)行有效性判斷和處理,在速度上比GP提高了2~4個(gè)數(shù)量級(jí)。
現(xiàn)有的用戶行為分析方案中實(shí)時(shí)對(duì)用戶的當(dāng)前操作行為、瀏覽網(wǎng)頁(yè)內(nèi)容等方面進(jìn)行敏感性分析的涉及不多,一方面,在獲取用戶行為數(shù)據(jù)時(shí),由于會(huì)不停的向各應(yīng)用服務(wù)請(qǐng)求,面臨巨大的數(shù)據(jù)請(qǐng)求下,往往會(huì)造成擁堵崩潰等問(wèn)題。另一方面,數(shù)據(jù)庫(kù)不夠完整,需要隨時(shí)補(bǔ)正修正,不利于分析統(tǒng)計(jì)多重行為的情況,不利于查詢單個(gè)用戶行為,并且對(duì)于大數(shù)據(jù)量的數(shù)據(jù)計(jì)算能力差,數(shù)據(jù)存儲(chǔ)能力也差,容易造成系統(tǒng)瓶頸。因此考慮利用GEP的智能分析技術(shù)研究一種自動(dòng)化程度和精度更高的計(jì)算機(jī)用戶行為分析方法。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的一個(gè)目的是解決上述問(wèn)題,并提供后面將說(shuō)明的優(yōu)點(diǎn)。
本發(fā)明還有一個(gè)目的是提供一種基于基因表達(dá)式編程的計(jì)算機(jī)用戶行為分析方法,采用多庫(kù)協(xié)同的模式,實(shí)時(shí)對(duì)用戶的當(dāng)前操作行為、瀏覽網(wǎng)頁(yè)內(nèi)容等方面進(jìn)行敏感性分析,人工干預(yù)少,自動(dòng)化程度和精度更高,系統(tǒng)運(yùn)行更順暢。
為了實(shí)現(xiàn)根據(jù)本發(fā)明的這些目的和其它優(yōu)點(diǎn),提供了一種基于基因表達(dá)式編程的計(jì)算機(jī)用戶行為分析方法,包括以下步驟:
步驟一:獲取計(jì)算機(jī)用戶的個(gè)人信息和進(jìn)程信息;
步驟二:由進(jìn)程信息對(duì)應(yīng)得到規(guī)則庫(kù)中的計(jì)算規(guī)則,根據(jù)個(gè)人信息和進(jìn)程信息得到對(duì)應(yīng)的原始數(shù)據(jù)后,將原始數(shù)據(jù)保存到數(shù)據(jù)庫(kù);
步驟三:將獲取的原始數(shù)據(jù)和計(jì)算規(guī)則結(jié)合知識(shí)庫(kù)中的GEP算法,得到計(jì)算數(shù)據(jù),將計(jì)算數(shù)據(jù)保存到數(shù)據(jù)庫(kù);
步驟四:將得到的計(jì)算數(shù)據(jù)與知識(shí)庫(kù)中的前提條件進(jìn)行匹配后,得到前提條件的推理結(jié)論,當(dāng)推理結(jié)論與數(shù)據(jù)庫(kù)中已有的特征數(shù)據(jù)不同時(shí),將推理結(jié)論作為新的特征數(shù)據(jù)保存在數(shù)據(jù)庫(kù),用推理結(jié)論代替計(jì)算數(shù)據(jù)重復(fù)步驟四,直至推理結(jié)論與數(shù)據(jù)庫(kù)中已有的特征數(shù)據(jù)相同時(shí)結(jié)束;
步驟五:將與數(shù)據(jù)庫(kù)中已有的特征數(shù)據(jù)相同的推理結(jié)論作為結(jié)果輸出。
優(yōu)選的是,步驟三中得到計(jì)算數(shù)據(jù)具體包括以下步驟:
S1:自定義初始化參數(shù),初始化參數(shù)包括種群大小N、子種群大小M、最大評(píng)價(jià)次數(shù)MAX_FE、函數(shù)符和終結(jié)符、基因長(zhǎng)度、基因個(gè)數(shù)、變異概率、插串概率、插串長(zhǎng)度以及重組概率,將獲取的原始數(shù)據(jù)定義為初始種群Pt={X1,X2,…,XN},并根據(jù)計(jì)算規(guī)則計(jì)算初始種群中每個(gè)個(gè)體的適應(yīng)度f(wàn)i;
S2:通過(guò)執(zhí)行基因表達(dá)式編程的選擇、變異、插串以及重組對(duì)種群Pt中的N個(gè)個(gè)體生成M個(gè)新個(gè)體,并將M個(gè)新個(gè)體組織成子種群Ot,根據(jù)計(jì)算規(guī)則計(jì)算Ot中的每個(gè)個(gè)體的適應(yīng)度,其中適應(yīng)度最大的個(gè)體為最優(yōu)個(gè)體;
S3:將種群Pt中的N個(gè)個(gè)體和子種群Ot中的M個(gè)個(gè)體組成臨時(shí)種群P’t,并根據(jù)計(jì)算規(guī)則計(jì)算臨時(shí)種群P’t的中的每個(gè)個(gè)體的適應(yīng)度,然后刪除臨時(shí)種群P’t中適應(yīng)度最大的前M個(gè)個(gè)體,得到由N個(gè)個(gè)體組成的新一代種群Pt+1;
S4:重復(fù)S2至S3直至評(píng)價(jià)次數(shù)達(dá)到MAX_FE后結(jié)束,結(jié)束時(shí)得到的新一代種群Pt+1即為計(jì)算數(shù)據(jù)。
優(yōu)選的是,步驟二的數(shù)據(jù)庫(kù)包括存儲(chǔ)數(shù)據(jù)庫(kù)、知識(shí)庫(kù)以及規(guī)則庫(kù),存儲(chǔ)數(shù)據(jù)庫(kù)中分別存儲(chǔ)有原始數(shù)據(jù)、計(jì)算數(shù)據(jù)和特征數(shù)據(jù)。
優(yōu)選的是,步驟四的知識(shí)庫(kù)中包括IF-THEN規(guī)則,IF-THEN規(guī)則中C=C(P),其中,C為結(jié)論,P為前提條件,n為每條規(guī)則的前提數(shù),θ={AND,OR},且每條規(guī)則的可信度為CF,CF=[0,1]。
優(yōu)選的是,步驟一中獲取的進(jìn)程信息包括實(shí)時(shí)進(jìn)程和歷史進(jìn)程;
步驟二中的計(jì)算規(guī)則包括對(duì)應(yīng)的實(shí)時(shí)進(jìn)程的發(fā)生時(shí)間的錄入和對(duì)是否執(zhí)行對(duì)應(yīng)的實(shí)時(shí)進(jìn)程的判斷。
優(yōu)選的是,步驟二中的計(jì)算規(guī)則還包括周期的計(jì)算和對(duì)周期內(nèi)歷史進(jìn)程中與實(shí)時(shí)進(jìn)程中相同進(jìn)程的發(fā)生頻次的統(tǒng)計(jì)。
優(yōu)選的是,步驟一中獲取計(jì)算機(jī)用戶的個(gè)人信息時(shí),根據(jù)每個(gè)賬戶中與每個(gè)計(jì)算機(jī)用戶一一對(duì)應(yīng)的用戶標(biāo)識(shí)對(duì)應(yīng)獲得計(jì)算機(jī)用戶的個(gè)人信息,其中,每個(gè)計(jì)算機(jī)用戶對(duì)應(yīng)一個(gè)或多個(gè)賬戶。
本發(fā)明至少包括以下有益效果:
本發(fā)明中利用GEP的智能分析技術(shù)強(qiáng)大的函數(shù)發(fā)現(xiàn)功能以及IF-THEN規(guī)則生成功能,建立一個(gè)智能化、集成化、協(xié)調(diào)化的專家系統(tǒng),基于基因表達(dá)式編程對(duì)計(jì)算機(jī)用戶行為進(jìn)行分析,采用存儲(chǔ)數(shù)據(jù)庫(kù)、知識(shí)庫(kù)以及規(guī)則庫(kù)等多數(shù)據(jù)庫(kù)協(xié)同的模式,實(shí)時(shí)對(duì)用戶的當(dāng)前操作行為、瀏覽網(wǎng)頁(yè)內(nèi)容等方面進(jìn)行敏感性分析和監(jiān)控,計(jì)算能力和存儲(chǔ)能力強(qiáng)大,系統(tǒng)運(yùn)行更加穩(wěn)定、順暢,人工干預(yù)少,自動(dòng)化程度和精度更高,有助于實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)用戶行為的監(jiān)管,更好的凈化網(wǎng)絡(luò)環(huán)境,降低或避免不良網(wǎng)絡(luò)信息對(duì)計(jì)算機(jī)用戶尤其是未成年用戶的有害影響。
本發(fā)明的其它優(yōu)點(diǎn)、目標(biāo)和特征將部分通過(guò)下面的說(shuō)明體現(xiàn),部分還將通過(guò)對(duì)本發(fā)明的研究和實(shí)踐而為本領(lǐng)域的技術(shù)人員所理解。
附圖說(shuō)明
圖1為本發(fā)明的基于基因表達(dá)式編程的計(jì)算機(jī)用戶行為分析方法的流程示意圖。
具體實(shí)施方式
下面結(jié)合附圖對(duì)本發(fā)明做進(jìn)一步的詳細(xì)說(shuō)明,以令本領(lǐng)域技術(shù)人員參照說(shuō)明書文字能夠據(jù)以實(shí)施。
如圖1所示,本發(fā)明提供一種基于基因表達(dá)式編程的計(jì)算機(jī)用戶行為分析方法,包括以下步驟:
步驟一即101:獲取計(jì)算機(jī)用戶的個(gè)人信息和進(jìn)程信息;
步驟二即102:由進(jìn)程信息對(duì)應(yīng)得到規(guī)則庫(kù)中的計(jì)算規(guī)則,根據(jù)個(gè)人信息和進(jìn)程信息得到對(duì)應(yīng)的原始數(shù)據(jù)后,將原始數(shù)據(jù)保存到數(shù)據(jù)庫(kù);
步驟三即103:將獲取的原始數(shù)據(jù)和計(jì)算規(guī)則結(jié)合知識(shí)庫(kù)中的GEP算法,得到計(jì)算數(shù)據(jù),將計(jì)算數(shù)據(jù)保存到數(shù)據(jù)庫(kù);
步驟四即104:將得到的計(jì)算數(shù)據(jù)與知識(shí)庫(kù)中的前提條件進(jìn)行匹配后,得到前提條件的推理結(jié)論,當(dāng)推理結(jié)論與數(shù)據(jù)庫(kù)中已有的特征數(shù)據(jù)不同時(shí),將推理結(jié)論作為新的特征數(shù)據(jù)保存在數(shù)據(jù)庫(kù),用推理結(jié)論代替計(jì)算數(shù)據(jù)重復(fù)步驟四,即重復(fù)與前提條件匹配的過(guò)程,直至得到的新的推理結(jié)論與數(shù)據(jù)庫(kù)中已有的特征數(shù)據(jù)相同時(shí)結(jié)束;
步驟五即105:將與數(shù)據(jù)庫(kù)中已有的特征數(shù)據(jù)相同的推理結(jié)論作為結(jié)果輸出。
本發(fā)明中首先利用GEP技術(shù)進(jìn)行用戶訪問(wèn)模式分類,建立相關(guān)分類模型,分類模型中的分類數(shù)據(jù)可以離線保存供后面調(diào)用,然后利用知識(shí)庫(kù)中的IF-THEN規(guī)則等前提條件,結(jié)合不同用戶的分類數(shù)據(jù)進(jìn)行推理,提高GEP技術(shù)應(yīng)用的實(shí)時(shí)性,達(dá)到在線分析的目的。采用多庫(kù)協(xié)同的模式,建立了數(shù)據(jù)庫(kù)、規(guī)則庫(kù)以及知識(shí)庫(kù)等,實(shí)時(shí)對(duì)用戶的當(dāng)前操作行為、瀏覽網(wǎng)頁(yè)內(nèi)容等方面進(jìn)行敏感性分析和監(jiān)控,人工干預(yù)少,自動(dòng)化程度和精度更高,系統(tǒng)運(yùn)行更順暢。
局域網(wǎng)中有2臺(tái)主機(jī)S、C,其中,S為服務(wù)端,C為客戶端;S上裝載了包括知識(shí)庫(kù)、存儲(chǔ)數(shù)據(jù)庫(kù)和規(guī)則庫(kù)的數(shù)據(jù)庫(kù)、調(diào)度控制器以及推理機(jī),存儲(chǔ)數(shù)據(jù)庫(kù)中分別存儲(chǔ)有原始數(shù)據(jù)、計(jì)算數(shù)據(jù)和特征數(shù)據(jù),其中知識(shí)庫(kù)中由GEP技術(shù)生成了一系列IF-THEN規(guī)則。
其中,存儲(chǔ)數(shù)據(jù)庫(kù)存儲(chǔ)了有關(guān)的數(shù)據(jù)和結(jié)果,規(guī)則庫(kù)存放著一些有關(guān)的數(shù)學(xué)計(jì)算模型、方法和程序,知識(shí)庫(kù)存放著一些有關(guān)計(jì)算機(jī)網(wǎng)絡(luò)領(lǐng)域中專家性、規(guī)律性的知識(shí)。推理過(guò)程采用數(shù)據(jù)驅(qū)動(dòng)、正向的不確定性推理策略,推理的實(shí)質(zhì)是把知識(shí)規(guī)則鏈接起來(lái),形成一條或多條推理鏈。系統(tǒng)根據(jù)用戶的測(cè)量結(jié)果,經(jīng)過(guò)文字、圖像的處理后,將相應(yīng)的信息特征以存儲(chǔ)數(shù)據(jù)的形式保存,作為輸入的事實(shí)供推理機(jī)使用。
調(diào)度控制器是在網(wǎng)絡(luò)模型的基礎(chǔ)上,建立起的一種多庫(kù)之間、知識(shí)庫(kù)與推理機(jī)之間的協(xié)同策略。因?yàn)?,?duì)于每一個(gè)具體的項(xiàng)目來(lái)說(shuō),輸入輸出的形式都是固定的,推理關(guān)系也是相同的,不同的是推理過(guò)程中具體的內(nèi)容,調(diào)度控制器是連接各信息庫(kù)和功能模塊的樞紐,主要依靠編程手段來(lái)實(shí)現(xiàn)的。
實(shí)施例1
用戶希望借助服務(wù)端S監(jiān)督未成年用戶的游戲時(shí)間,如只能在晚上6~7點(diǎn)玩游戲,預(yù)先在服務(wù)端S上設(shè)置未成年用戶只有在晚上6~7點(diǎn)才能打開(kāi)游戲,其余時(shí)間不能打開(kāi)游戲,成年用戶則不限,此條信息作為規(guī)則存儲(chǔ)在知識(shí)庫(kù)中,即IF-THEN規(guī)則中C=C(P,CF),其中,前提條件P包括P1和P2,滿足P1或P2能得到結(jié)論C即游戲進(jìn)程運(yùn)行,此條規(guī)則可信度CF為1。P1為未成年、晚上6~7點(diǎn)和進(jìn)行游戲,對(duì)應(yīng)前提數(shù)為3,三個(gè)前提同時(shí)滿足才能使游戲進(jìn)程運(yùn)行,P2為成年和進(jìn)行游戲,對(duì)應(yīng)前提數(shù)為2,兩個(gè)前提同時(shí)滿足能使游戲進(jìn)程運(yùn)行。
當(dāng)客戶端C上未成年用戶在夜晚9點(diǎn)開(kāi)啟客戶端C打開(kāi)音樂(lè),然后點(diǎn)擊游戲。
首先,服務(wù)端S從客戶端C上獲取用戶的個(gè)人信息和實(shí)時(shí)進(jìn)程信息后輸入調(diào)度控制器,由于未成年用戶在登錄賬戶信息中顯示用戶為未成年用戶,實(shí)時(shí)登錄時(shí)間為夜晚10點(diǎn),實(shí)時(shí)進(jìn)程信息為音樂(lè)進(jìn)程和游戲進(jìn)程,調(diào)度控制器根據(jù)用戶的個(gè)人信息和實(shí)時(shí)進(jìn)程信息得到對(duì)應(yīng)的原始數(shù)據(jù)為未成年、夜晚10點(diǎn)、音樂(lè)進(jìn)程和游戲進(jìn)程,計(jì)算規(guī)則為判斷此時(shí)每個(gè)進(jìn)程是否運(yùn)行。
將獲取的原始數(shù)據(jù)和計(jì)算規(guī)則結(jié)合,并通過(guò)知識(shí)庫(kù)中的GEP算法,得到計(jì)算數(shù)據(jù)為未成年在夜晚10點(diǎn)音樂(lè)進(jìn)程運(yùn)行且游戲進(jìn)程運(yùn)行、未成年在夜晚10點(diǎn)音樂(lè)進(jìn)程運(yùn)行且游戲進(jìn)程不運(yùn)行、未成年在夜晚10點(diǎn)音樂(lè)進(jìn)程不運(yùn)行但游戲進(jìn)程運(yùn)行以及未成年在夜晚10點(diǎn)音樂(lè)進(jìn)程不運(yùn)行且游戲進(jìn)程不運(yùn)行,調(diào)度控制器將得到的計(jì)算數(shù)據(jù)與知識(shí)庫(kù)中的前提條件即未成年用戶晚上6~7點(diǎn)才能打開(kāi)游戲進(jìn)行匹配后,得到前提條件的推理結(jié)論為未成年在夜晚10點(diǎn)音樂(lè)進(jìn)程運(yùn)行且游戲進(jìn)程不運(yùn)行,此推理結(jié)論不存在于之前已有的特征數(shù)據(jù)中,將此推理結(jié)論作為新的特征數(shù)據(jù)保存到數(shù)據(jù)庫(kù),然后將未成年在夜晚10點(diǎn)音樂(lè)進(jìn)程運(yùn)行且游戲進(jìn)程不運(yùn)行與知識(shí)庫(kù)中的前提條件即未成年用戶b晚上6~7點(diǎn)才能打開(kāi)游戲進(jìn)行匹配后,得到未成年在夜晚10點(diǎn)音樂(lè)進(jìn)程運(yùn)行且游戲進(jìn)程不運(yùn)行這一推理結(jié)論,將此推理結(jié)論作為又一新的特征數(shù)據(jù)保存到數(shù)據(jù)庫(kù)時(shí)發(fā)現(xiàn)與數(shù)據(jù)庫(kù)中已有的特征數(shù)據(jù)相同,將未成年在夜晚10點(diǎn)音樂(lè)進(jìn)程運(yùn)行且游戲進(jìn)程不運(yùn)行這一推理結(jié)論作為結(jié)果輸出,此時(shí)未成年用戶b使用的客戶端C上音樂(lè)進(jìn)程能運(yùn)行但游戲進(jìn)程不能運(yùn)行,從而達(dá)到對(duì)未成年用戶的游戲時(shí)間進(jìn)行監(jiān)管的目的。同理可監(jiān)管未成年用戶的上網(wǎng)時(shí)間或?yàn)g覽網(wǎng)頁(yè)內(nèi)容。
在另一種技術(shù)方案中,步驟三中得到計(jì)算數(shù)據(jù)具體包括:
S1:自定義初始化參數(shù),初始化參數(shù)包括種群大小N、子種群大小M、最大評(píng)價(jià)次數(shù)MAX_FE、函數(shù)符和終結(jié)符、基因長(zhǎng)度、基因個(gè)數(shù)、變異概率、插串概率、插串長(zhǎng)度以及重組概率,將獲取的原始數(shù)據(jù)定義為初始種群Pt={X1,X2,…,XN},并根據(jù)計(jì)算規(guī)則計(jì)算初始種群中每個(gè)個(gè)體的適應(yīng)度f(wàn)i。
S2:通過(guò)執(zhí)行基因表達(dá)式編程的選擇、變異、插串以及重組對(duì)種群Pt中的N個(gè)個(gè)體生成M個(gè)新個(gè)體,并將M個(gè)新個(gè)體組織成子種群Ot,根據(jù)計(jì)算規(guī)則計(jì)算Ot中的每個(gè)個(gè)體的適應(yīng)度,其中適應(yīng)度最大的個(gè)體為最優(yōu)個(gè)體。
S3:將種群Pt中的N個(gè)個(gè)體和子種群Ot中的M個(gè)個(gè)體組成臨時(shí)種群P’t,并根據(jù)計(jì)算規(guī)則計(jì)算臨時(shí)種群P’t的中的每個(gè)個(gè)體的適應(yīng)度,然后刪除臨時(shí)種群P’t中適應(yīng)度最大的前M個(gè)個(gè)體,得到由N個(gè)個(gè)體組成的新一代種群Pt+1。
S4:重復(fù)S2至S3直至評(píng)價(jià)次數(shù)達(dá)到MAX_FE后結(jié)束,結(jié)束時(shí)得到的新一代種群Pt+1即為計(jì)算數(shù)據(jù)。
其中,適應(yīng)度的引入是為了更好地表達(dá)知識(shí)的模糊性和不確定性,本系統(tǒng)的適應(yīng)度區(qū)間定義為[0,1],適應(yīng)度的大小由多位心理專家研究和系統(tǒng)反復(fù)實(shí)驗(yàn)相結(jié)合的途經(jīng)來(lái)獲取。
基于GEP的分析過(guò)程是一個(gè)動(dòng)態(tài)學(xué)習(xí)的自適應(yīng)過(guò)程,多次成功的分析結(jié)果可以作為新的分析規(guī)則存在,并可以根據(jù)系統(tǒng)積累的分析經(jīng)驗(yàn)來(lái)自動(dòng)棄用長(zhǎng)期無(wú)效的規(guī)則,從而達(dá)到優(yōu)化推理規(guī)則庫(kù),提高分析準(zhǔn)確度的目的。
結(jié)合此種GEP算法可對(duì)復(fù)雜的或樣本數(shù)目較多的用戶行為進(jìn)行分析,先分類再分析,并分別得到每一類的適應(yīng)度使整體數(shù)據(jù)更加可靠,分析出的結(jié)論更具通用性,適用于更多的人群。
在另一種技術(shù)方案中,數(shù)據(jù)庫(kù)包括存儲(chǔ)數(shù)據(jù)庫(kù)、知識(shí)庫(kù)以及規(guī)則庫(kù),存儲(chǔ)數(shù)據(jù)庫(kù)中分別存儲(chǔ)有原始數(shù)據(jù)、計(jì)算數(shù)據(jù)和特征數(shù)據(jù)。
在另一種技術(shù)方案中,知識(shí)庫(kù)中包括由GEP算法生成的IF-THEN規(guī)則,IF-THEN規(guī)則中C=C(P),其中,C為結(jié)論P(yáng)為前提條件,n為每條前提條件的前提數(shù),θ={AND,OR},將每條規(guī)則的可信度賦值為CF,CF=[0,1]。每個(gè)IF-THEN規(guī)則中可包括多個(gè)前提條件,每個(gè)前提條件中可能包括多個(gè)前提,多個(gè)前提相互之間可能包含多種和/或關(guān)系。
在另一種技術(shù)方案中,步驟一中獲取的進(jìn)程信息包括實(shí)時(shí)進(jìn)程和歷史進(jìn)程;
步驟二中的計(jì)算規(guī)則包括對(duì)應(yīng)的實(shí)時(shí)進(jìn)程的發(fā)生時(shí)間的錄入和對(duì)是否執(zhí)行對(duì)應(yīng)的實(shí)時(shí)進(jìn)程的判斷。
結(jié)合包括實(shí)時(shí)進(jìn)程和歷史進(jìn)程的原始數(shù)據(jù)和計(jì)算規(guī)則后續(xù)可以判斷或根據(jù)實(shí)時(shí)進(jìn)程的發(fā)生時(shí)間判斷對(duì)應(yīng)的實(shí)時(shí)進(jìn)程是否執(zhí)行,使收集的信息更加完整,使后續(xù)的推理能得到歷史數(shù)據(jù)支持,更加可靠。
在另一種技術(shù)方案中,步驟二中的計(jì)算規(guī)則還包括周期的計(jì)算和對(duì)周期內(nèi)歷史進(jìn)程中與實(shí)時(shí)進(jìn)程中相同進(jìn)程的發(fā)生頻次的統(tǒng)計(jì)。可實(shí)現(xiàn)對(duì)較長(zhǎng)周期內(nèi)用戶行為的分析,使分析有效性更加長(zhǎng)久可靠,也可僅對(duì)一段時(shí)間計(jì)算機(jī)用戶行為進(jìn)行分析,長(zhǎng)期或短期可根據(jù)用戶的需要靈活選擇。
在另一種技術(shù)方案中,步驟一中獲取計(jì)算機(jī)用戶的個(gè)人信息時(shí),根據(jù)每個(gè)賬戶中與每個(gè)計(jì)算機(jī)用戶一一對(duì)應(yīng)的用戶標(biāo)識(shí)對(duì)應(yīng)獲得計(jì)算機(jī)用戶的個(gè)人信息,其中,每個(gè)計(jì)算機(jī)用戶對(duì)應(yīng)一個(gè)或多個(gè)賬戶。按照與每個(gè)計(jì)算機(jī)用戶一一對(duì)應(yīng)的用戶標(biāo)識(shí)識(shí)別每個(gè)計(jì)算機(jī)用戶,避免由于計(jì)算機(jī)用戶切換不同賬戶引起獲取的個(gè)人信息和進(jìn)程信息不完整,使數(shù)據(jù)更加完整可靠。
實(shí)施例2
局域網(wǎng)中有服務(wù)端S,客戶端a、b、c、d等,S上裝載了包括知識(shí)庫(kù)、特征數(shù)據(jù)數(shù)據(jù)庫(kù)和規(guī)則庫(kù)的數(shù)據(jù)庫(kù)、調(diào)度控制器以及推理機(jī)。
服務(wù)端用戶希望借助服務(wù)端S監(jiān)管客戶端用戶在某一網(wǎng)絡(luò)論壇上的不文明用語(yǔ),將不文明用語(yǔ)如等過(guò)濾掉,如客戶端用戶發(fā)表的不文明用語(yǔ)m或n不顯示,若在1小時(shí)內(nèi)連續(xù)發(fā)表5次及以上含不文明用語(yǔ)的言論則禁言半小時(shí),其他則不限,此條信息作為規(guī)則存儲(chǔ)在知識(shí)庫(kù)中,即第一個(gè)IF-THEN規(guī)則中前提條件P為言論含不文明用語(yǔ)m或n,滿足P能得到結(jié)論C即不文明用語(yǔ)m或n不顯示,發(fā)表的此條規(guī)則可信度CF為1。第二個(gè)IF-THEN規(guī)則中前提條件P為同一用戶1小時(shí)內(nèi)連續(xù)發(fā)表5次及以上含不文明用語(yǔ)的言論,結(jié)論C為禁言半小時(shí)。
當(dāng)客戶端C上某用戶第一次在網(wǎng)絡(luò)論壇上發(fā)表含詞匯m的不文明用語(yǔ)時(shí),得到原始數(shù)據(jù)為某用戶在某一時(shí)間發(fā)表不文明用語(yǔ)m,計(jì)算規(guī)則為判讀不文明用語(yǔ)m是否顯示,并開(kāi)始計(jì)時(shí)1小時(shí)內(nèi)頻次為1;
通過(guò)知識(shí)庫(kù)中的GEP算法,得到計(jì)算數(shù)據(jù)為此用戶發(fā)表的不文明用語(yǔ)m顯示、此用戶發(fā)表的不文明用語(yǔ)m不顯示,與知識(shí)庫(kù)中的前提條件即用戶不能發(fā)表含詞匯m或n的不文明用語(yǔ)進(jìn)行匹配后,得到前提條件的推理結(jié)論為此用戶發(fā)表的不文明用語(yǔ)m不顯示,此推理結(jié)論不存在于已有的特征數(shù)據(jù)中,將此推理結(jié)論作為新的特征數(shù)據(jù)保存到數(shù)據(jù)庫(kù),然后將此用戶發(fā)表的不文明用語(yǔ)m不顯示與知識(shí)庫(kù)中的前提條件即客戶端用戶發(fā)表的不文明用語(yǔ)m或n不顯示進(jìn)行匹配后,得到此用戶發(fā)表的不文明用語(yǔ)m不顯示這一推理結(jié)論,將此推理結(jié)論作為又一新的特征數(shù)據(jù)保存到數(shù)據(jù)庫(kù)時(shí)發(fā)現(xiàn)與數(shù)據(jù)庫(kù)中已有的特征數(shù)據(jù)相同,將此用戶發(fā)表的不文明用語(yǔ)m不顯示作為結(jié)果輸出。
當(dāng)用戶再次發(fā)表不文明用語(yǔ)時(shí),只需要經(jīng)過(guò)1次推理即可得到此用戶發(fā)表的不文明用語(yǔ)m不顯示的結(jié)論,可見(jiàn)本發(fā)明的基于基因表達(dá)式編程的計(jì)算機(jī)用戶行為分析方法是一個(gè)動(dòng)態(tài)學(xué)習(xí)的自適應(yīng)過(guò)程。
當(dāng)用戶在1小時(shí)內(nèi)發(fā)表5次不文明用語(yǔ)時(shí),根據(jù)第一個(gè)IF-THEN規(guī)則此用戶發(fā)表的不文明用語(yǔ)m不顯示,根據(jù)第二個(gè)IF-THEN規(guī)則得到推理結(jié)論為禁言半小時(shí),從而根據(jù)多個(gè)規(guī)則更好的實(shí)時(shí)對(duì)用戶的當(dāng)前操作行為、瀏覽網(wǎng)頁(yè)內(nèi)容等方面進(jìn)行敏感性分析和監(jiān)管。期間,當(dāng)用戶切換其他賬號(hào)發(fā)表不文明用語(yǔ)時(shí),由于每個(gè)用戶對(duì)應(yīng)一個(gè)用戶標(biāo)識(shí)即多個(gè)賬戶之間相互關(guān)聯(lián),步驟一中獲取計(jì)算機(jī)用戶的個(gè)人信息時(shí),統(tǒng)計(jì)信息的包括多個(gè)賬戶中的信息,因此即使用戶切換其他賬號(hào)發(fā)表不文明用語(yǔ)也能按照計(jì)算規(guī)則計(jì)入頻次統(tǒng)計(jì)的數(shù)據(jù)中。
盡管本發(fā)明的實(shí)施方案已公開(kāi)如上,但其并不僅僅限于說(shuō)明書和實(shí)施方式中所列運(yùn)用,它完全可以被適用于各種適合本發(fā)明的領(lǐng)域,對(duì)于熟悉本領(lǐng)域的人員而言,可容易地實(shí)現(xiàn)另外的修改,因此在不背離權(quán)利要求及等同范圍所限定的一般概念下,本發(fā)明并不限于特定的細(xì)節(jié)和這里示出與描述的圖例。