一種處理異常業(yè)務(wù)數(shù)據(jù)的方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本申請(qǐng)涉及互聯(lián)網(wǎng)領(lǐng)域,更具體地涉及一種處理異常業(yè)務(wù)數(shù)據(jù)的方法和裝置。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)的快速發(fā)展,各種惡意數(shù)據(jù),尤其是異常業(yè)務(wù)數(shù)據(jù)頻繁出現(xiàn),極大地干擾了數(shù)據(jù)的分析和統(tǒng)計(jì)工作。因此,如何能夠快速并及時(shí)地判斷和捕獲異常數(shù)據(jù),并且能夠及時(shí)對(duì)異常數(shù)據(jù)進(jìn)行后續(xù)處理,就顯得尤為重要。
[0003]現(xiàn)有的方法通常是根據(jù)歷史業(yè)務(wù)數(shù)據(jù)的規(guī)則積累,利用黑名單庫(kù)進(jìn)行異常數(shù)據(jù)的抓取。
[0004]但是,盡管存在上述技術(shù)方案,但是該方案存在缺陷。一方面,上述方案僅僅考慮了歷史業(yè)務(wù)數(shù)據(jù)中的遠(yuǎn)期歷史業(yè)務(wù)數(shù)據(jù),如10天前的歷史業(yè)務(wù)數(shù)據(jù)。這種方案忽略了當(dāng)前業(yè)務(wù)之前某段相近時(shí)間的業(yè)務(wù)數(shù)據(jù),而這部分?jǐn)?shù)據(jù)對(duì)異常數(shù)據(jù)的捕獲是非常重要的,尤其是當(dāng)遠(yuǎn)期歷史數(shù)據(jù)中未出現(xiàn)過(guò)的某些顯著特征,在與當(dāng)前業(yè)務(wù)時(shí)間相近的業(yè)務(wù)數(shù)據(jù)中可能會(huì)出現(xiàn)。另一方面,現(xiàn)有方法中,對(duì)異常數(shù)據(jù)的判斷是延遲進(jìn)行的。如延遲一天根據(jù)規(guī)則抓取異常數(shù)據(jù),然后再對(duì)抓取的異常數(shù)據(jù)進(jìn)行需要的后續(xù)處理。這種延遲抓取和處理異常數(shù)據(jù)的情況,使得異常數(shù)據(jù)不能及時(shí)被捕獲,相應(yīng)的,也延遲了對(duì)異常數(shù)據(jù)的后續(xù)處理。
[0005]因此,在本領(lǐng)域中,需要一種處理異常業(yè)務(wù)數(shù)據(jù)的方案,能夠及時(shí)、準(zhǔn)確地判斷和處理異常數(shù)據(jù),避免現(xiàn)有技術(shù)中異常數(shù)據(jù)漏檢和處理延遲等的問(wèn)題。
【發(fā)明內(nèi)容】
[0006]本申請(qǐng)的主要目的在于,提供一種處理異常業(yè)務(wù)數(shù)據(jù)的技術(shù),以解決現(xiàn)有技術(shù)中異常數(shù)據(jù)漏檢和處理延遲等的問(wèn)題。
[0007]根據(jù)本申請(qǐng)的一個(gè)方面,提供一種處理異常業(yè)務(wù)數(shù)據(jù)的方法,其特征在于,包括:獲取當(dāng)前業(yè)務(wù)數(shù)據(jù);根據(jù)當(dāng)前業(yè)務(wù)數(shù)據(jù)和近期歷史業(yè)務(wù)數(shù)據(jù),確定當(dāng)前業(yè)務(wù)數(shù)據(jù)是否是異常業(yè)務(wù)數(shù)據(jù);以及對(duì)所確定的異常業(yè)務(wù)數(shù)據(jù)進(jìn)行處理。
[0008]根據(jù)本申請(qǐng)的另一方面,提供一種處理異常業(yè)務(wù)數(shù)據(jù)的裝置,其特征在于,包括:獲取模塊,用于獲取當(dāng)前業(yè)務(wù)數(shù)據(jù);確定模塊,用于根據(jù)當(dāng)前業(yè)務(wù)數(shù)據(jù)和近期歷史業(yè)務(wù)數(shù)據(jù),確定當(dāng)前業(yè)務(wù)數(shù)據(jù)是否是異常業(yè)務(wù)數(shù)據(jù);以及處理模塊,用于對(duì)異常業(yè)務(wù)數(shù)據(jù)進(jìn)行處理。
[0009]與現(xiàn)有技術(shù)相比,根據(jù)本申請(qǐng)的技術(shù)方案,能夠不僅考慮遠(yuǎn)期歷史業(yè)務(wù)數(shù)據(jù),而且結(jié)合近期歷史業(yè)務(wù)數(shù)據(jù),并且實(shí)時(shí)地對(duì)當(dāng)前業(yè)務(wù)數(shù)據(jù)進(jìn)行異常判斷和處理,從而避免現(xiàn)有技術(shù)中異常數(shù)據(jù)漏檢和處理延遲等的問(wèn)題。
【附圖說(shuō)明】
[0010]此處所說(shuō)明的附圖用來(lái)提供對(duì)本申請(qǐng)的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本申請(qǐng)的示意性實(shí)施例及其說(shuō)明用于解釋本申請(qǐng),并不構(gòu)成對(duì)本申請(qǐng)的不當(dāng)限定。在附圖中:
[0011]圖1是根據(jù)本申請(qǐng)一個(gè)實(shí)施例的處理異常業(yè)務(wù)數(shù)據(jù)的方法的流程圖;
[0012]圖2是根據(jù)本申請(qǐng)一個(gè)實(shí)施例的根據(jù)當(dāng)前業(yè)務(wù)數(shù)據(jù)和近期歷史業(yè)務(wù)數(shù)據(jù)來(lái)確定當(dāng)前業(yè)務(wù)數(shù)據(jù)是否是異常業(yè)務(wù)數(shù)據(jù)的方法的流程圖;
[0013]圖3是根據(jù)本申請(qǐng)另一實(shí)施例的處理異常業(yè)務(wù)數(shù)據(jù)的方法的流程圖;
[0014]圖4是根據(jù)本申請(qǐng)另一實(shí)施例的處理異常業(yè)務(wù)數(shù)據(jù)的方法的流程圖;以及
[0015]圖5是根據(jù)本申請(qǐng)一個(gè)實(shí)施例的處理異常業(yè)務(wù)數(shù)據(jù)的裝置的結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0016]本申請(qǐng)的主要思想在于,通過(guò)獲取當(dāng)前業(yè)務(wù)數(shù)據(jù),根據(jù)當(dāng)前業(yè)務(wù)數(shù)據(jù)和近期歷史業(yè)務(wù)數(shù)據(jù),確定當(dāng)前業(yè)務(wù)數(shù)據(jù)是否是異常業(yè)務(wù)數(shù)據(jù),并對(duì)異常業(yè)務(wù)數(shù)據(jù)進(jìn)行處理。該技術(shù)方案能夠?qū)崟r(shí)、準(zhǔn)確地判斷和處理異常數(shù)據(jù),從而避免現(xiàn)有技術(shù)中異常數(shù)據(jù)漏檢和處理延遲等的問(wèn)題。
[0017]為使本申請(qǐng)的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本申請(qǐng)具體實(shí)施例及相應(yīng)的附圖對(duì)本申請(qǐng)技術(shù)方案進(jìn)行清楚、完整地描述。顯然,所描述的實(shí)施例僅是本申請(qǐng)一部分實(shí)施例,而不是全部的實(shí)施例。基于本申請(qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員所獲得的所有其他實(shí)施例,都屬于本申請(qǐng)保護(hù)的范圍。
[0018]參考圖1,圖1是根據(jù)本申請(qǐng)一個(gè)實(shí)施例的處理異常業(yè)務(wù)數(shù)據(jù)的方法100的流程圖。如圖1所示,方法100開(kāi)始于步驟101。
[0019]在步驟101,獲取當(dāng)前業(yè)務(wù)數(shù)據(jù)。
[0020]在本申請(qǐng)的實(shí)施例中,當(dāng)前業(yè)務(wù)數(shù)據(jù)可以包括當(dāng)前與業(yè)務(wù)變更相關(guān)的業(yè)務(wù)數(shù)據(jù)??梢酝ㄟ^(guò)監(jiān)測(cè)用戶(hù)操作請(qǐng)求或監(jiān)測(cè)數(shù)據(jù)庫(kù)日志文件等方式來(lái)獲取當(dāng)前業(yè)務(wù)數(shù)據(jù)。
[0021]根據(jù)本申請(qǐng)的一個(gè)具體實(shí)施例,可以實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)庫(kù)中的日志文件,以獲取與業(yè)務(wù)變更相關(guān)的業(yè)務(wù)操作數(shù)據(jù)(當(dāng)前業(yè)務(wù)數(shù)據(jù)),從而可以實(shí)時(shí)地對(duì)該業(yè)務(wù)操作是否異常進(jìn)行判斷和處理。具體而言,日志文件記載了與業(yè)務(wù)變更相關(guān)的操作數(shù)據(jù),其中包括當(dāng)前時(shí)刻發(fā)生變更的當(dāng)前業(yè)務(wù)數(shù)據(jù)和在當(dāng)前時(shí)刻之前發(fā)生過(guò)變更的歷史業(yè)務(wù)數(shù)據(jù),并且業(yè)務(wù)變更數(shù)據(jù)的記錄都是按照業(yè)務(wù)發(fā)生時(shí)間先后順序排列的。因此,可以從日志文件中提取或?qū)С霎?dāng)前時(shí)刻發(fā)生變更的當(dāng)前業(yè)務(wù)數(shù)據(jù)(記錄),該條記錄例如可以包括用戶(hù)標(biāo)識(shí)(例如,買(mǎi)家或賣(mài)家標(biāo)識(shí))、當(dāng)前業(yè)務(wù)發(fā)生變更的時(shí)間、業(yè)務(wù)類(lèi)型(例如,是“購(gòu)買(mǎi)”還是“出售”)、業(yè)務(wù)對(duì)象類(lèi)型(例如,作為業(yè)務(wù)對(duì)象的商品的所屬類(lèi)別)等方面的變更數(shù)據(jù)。
[0022]在步驟102,根據(jù)當(dāng)前業(yè)務(wù)數(shù)據(jù)和近期歷史業(yè)務(wù)數(shù)據(jù),確定當(dāng)前業(yè)務(wù)數(shù)據(jù)是否是異常業(yè)務(wù)數(shù)據(jù)。
[0023]具體而言,為了對(duì)當(dāng)前業(yè)務(wù)數(shù)據(jù)是否是異常業(yè)務(wù)數(shù)據(jù)進(jìn)行準(zhǔn)確的判斷,可以參考與當(dāng)前業(yè)務(wù)發(fā)生時(shí)間之前相隔比較近的時(shí)間段內(nèi)的歷史業(yè)務(wù)數(shù)據(jù),通過(guò)對(duì)這段時(shí)間內(nèi)的業(yè)務(wù)數(shù)據(jù)進(jìn)行統(tǒng)計(jì),可以得到近期歷史業(yè)務(wù)數(shù)據(jù)。通過(guò)這種方式,能夠更準(zhǔn)確地確定當(dāng)前業(yè)務(wù)數(shù)據(jù)是否存在異常。
[0024]在實(shí)際操作中,根據(jù)本申請(qǐng)的一個(gè)實(shí)施例,當(dāng)獲取到一條當(dāng)前業(yè)務(wù)數(shù)據(jù)后,可以將該條記錄轉(zhuǎn)化為一條或多條基礎(chǔ)業(yè)務(wù)數(shù)據(jù),并且存儲(chǔ)該基礎(chǔ)業(yè)務(wù)數(shù)據(jù),例如,可以將該基礎(chǔ)業(yè)務(wù)數(shù)據(jù)存儲(chǔ)在內(nèi)存或數(shù)據(jù)庫(kù)中,以供后續(xù)統(tǒng)計(jì)近期歷史業(yè)務(wù)數(shù)據(jù)使用。
[0025]將基礎(chǔ)業(yè)務(wù)數(shù)據(jù)與近期歷史業(yè)務(wù)數(shù)據(jù)進(jìn)行合并,以得到合并后的業(yè)務(wù)數(shù)據(jù)。具體而言,通過(guò)將每條基礎(chǔ)業(yè)務(wù)數(shù)據(jù)合并到當(dāng)前業(yè)務(wù)數(shù)據(jù)的近期歷史業(yè)務(wù)數(shù)據(jù)中,并且根據(jù)合并后的業(yè)務(wù)數(shù)據(jù)計(jì)算預(yù)設(shè)維度特征的維度特征值,并根據(jù)維度特征值判斷當(dāng)前業(yè)務(wù)數(shù)據(jù)是否是異常業(yè)務(wù)數(shù)據(jù)。預(yù)設(shè)維度特征例如可以是來(lái)自同一 IP地址的用戶(hù)數(shù)目、用戶(hù)的不同行為類(lèi)別的占比、用戶(hù)的異常行為的占比等等。
[0026]根據(jù)本申請(qǐng)的一個(gè)實(shí)施例,可以將合并后的業(yè)務(wù)數(shù)據(jù)存儲(chǔ)在內(nèi)存或數(shù)據(jù)庫(kù)中,以便作為后續(xù)業(yè)務(wù)數(shù)據(jù)的近期歷史業(yè)務(wù)數(shù)據(jù)使用。
[0027]這里需要指出的是,對(duì)于當(dāng)前業(yè)務(wù)數(shù)據(jù)而言,其近期歷史業(yè)務(wù)數(shù)據(jù)實(shí)際上是當(dāng)前業(yè)務(wù)發(fā)生時(shí)刻之前的較短時(shí)間段內(nèi)的歷史業(yè)務(wù)數(shù)據(jù)的統(tǒng)計(jì)結(jié)果。具體而言,該近期歷史業(yè)務(wù)數(shù)據(jù)實(shí)際上也是通過(guò)將每條歷史業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)化為一條或多條基礎(chǔ)業(yè)務(wù)數(shù)據(jù),然后根據(jù)預(yù)定維度特征從這些基礎(chǔ)業(yè)務(wù)數(shù)據(jù)統(tǒng)計(jì)而來(lái)的。
[0028]根據(jù)本申請(qǐng)的一個(gè)實(shí)施例,近期歷史業(yè)務(wù)數(shù)據(jù)可以是當(dāng)前業(yè)務(wù)發(fā)生時(shí)刻之前某一段時(shí)間內(nèi)所產(chǎn)生并經(jīng)過(guò)處理的業(yè)務(wù)數(shù)據(jù)。例如,近期歷史業(yè)務(wù)數(shù)據(jù)可以是當(dāng)前業(yè)務(wù)發(fā)生時(shí)刻之前的近數(shù)個(gè)小時(shí)內(nèi)所產(chǎn)生并經(jīng)過(guò)處理的業(yè)務(wù)數(shù)據(jù),例如,可以是24小時(shí)、12小時(shí)、6小時(shí)、I小時(shí)、0.5小時(shí)等等,還可以是當(dāng)天內(nèi)所產(chǎn)生并經(jīng)過(guò)處理的業(yè)務(wù)數(shù)據(jù)。
[0029]在步驟103,對(duì)