欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種串并案分類方法及串并案分類系統(tǒng)與流程

文檔序號:11865396閱讀:1590來源:國知局
一種串并案分類方法及串并案分類系統(tǒng)與流程
本發(fā)明涉及串并案分析
技術(shù)領(lǐng)域
,特別是涉及一種串并案分類方法及串并案分類系統(tǒng)。
背景技術(shù)
:串案和并案(簡稱串并案)是偵破系列案件、特別是在個案偵查陷入困境時的常用方法。串并案分析是指通過對不同地域或不同時間的起案件中發(fā)現(xiàn)的各種痕跡、線索進行分析,找出其中可能為同一犯罪主體所為的案件,并把看似無關(guān)聯(lián)的線索、物證進行綜合分析,找出足夠的證據(jù)鎖定犯罪嫌疑人。當今社會,隨著犯罪呈現(xiàn)職業(yè)化、團伙化、流竄化的趨勢,系列案件占有相當大的比重,因此對若干有內(nèi)在聯(lián)系的不同案件進行串并,發(fā)現(xiàn)其規(guī)律和特征,可變個案偵查為串案偵查,使得偵查工作效益最大化。公安系統(tǒng)經(jīng)過多年的建設(shè)已經(jīng)初見成效,但在公安情報工作的研究中尚處于起步階段,尤其是對公安系統(tǒng)刑事案件的偵查決策方面的深入應(yīng)用還較少見。目前公安系統(tǒng)已經(jīng)積累了大量的案事件及其相關(guān)數(shù)據(jù),但對這些數(shù)據(jù)的使用方式多數(shù)還停留在傳統(tǒng)的檢索查詢上,數(shù)據(jù)價值正在被浪費,為了避免“數(shù)據(jù)豐富,知識貧乏”的現(xiàn)象,應(yīng)積極開展公共安全數(shù)據(jù)的分析挖掘方面的研究,盡早發(fā)現(xiàn)案事件的相似程度、發(fā)展趨勢,進而探尋犯罪的規(guī)律與特點,進行必要的犯罪預(yù)測和預(yù)防?,F(xiàn)有技術(shù)中,通常會將預(yù)偵破的案件(待偵破案件)在公安系統(tǒng)里查詢,從而得到該案件的串并案,然而,這種方法無法將公安系統(tǒng)內(nèi)的各個案件相互關(guān)聯(lián),無法將公安系統(tǒng)內(nèi)的大量案件進行串并案分類,從而無法更有效的利用公安系統(tǒng)進行串并案分析。因此,希望有一種技術(shù)方案來克服或至少減輕現(xiàn)有技術(shù)的至少一個上述缺陷。技術(shù)實現(xiàn)要素:本發(fā)明的目的在于提供一種串并案分類方法來克服或至少減輕現(xiàn)有技術(shù)的至少一個上述缺陷。為實現(xiàn)上述目的,本發(fā)明提供了一種串并案分類方法,所述串并案分類方法包括:統(tǒng)計一種類案件的數(shù)量N,并獲取數(shù)量N下的每個案件的六維特征信息,根據(jù)各個案件的六維特征信息,進行相似度計算,得到該數(shù)量N下的相似度矩陣數(shù)組;采用聚類分析算法將相似度矩陣數(shù)組進行聚類計算,將數(shù)量N的案件分為K類;將K類案件中的每類案件均進行如下方法:將每類案件中所包含的各個案件相互進行相似度計算,從而得到每個案件與其他案件的相似度,為每個案件設(shè)定預(yù)設(shè)篩選條件,去除未滿足預(yù)設(shè)篩選條件的案件,則符合預(yù)設(shè)篩選條件的各個案件之間形成一個族群,該族群為一個串并案族群。優(yōu)選地,所述六維特征信息中每一維特征信息包括一個或多個數(shù)據(jù)元素。優(yōu)選地,所述六維特征信息包括:地理特征信息、天氣時間特征信息、嫌疑人特征信息、受害人特征信息、涉案物品特征信息;其中,所述地理特征信息包括:地域范圍元素、行政區(qū)劃元素、處所特征元素;所述天氣時間特征信息包括:天氣元素、按日期的特征元素、按時間的特征元素;所述嫌疑人特征信息包括:嫌疑人性別元素、嫌疑人年齡特征元素、嫌疑人身高元素、嫌疑人體型元素、嫌疑人職業(yè)元素、嫌疑人口音元素、嫌疑人專長元素;嫌疑人體貌特征元素;所述受害人特征信息包括:受害人性別元素、受害人年齡特征元素、受害人職業(yè)元素、受害人對象特征元素、受害人受害形式元素、受害人傷害程度元素;所述涉案物品特征信息包括:唯一編號元素、物品特征元素;案件自身特征信息包括:作案特點元素、作案手段元素、侵入方式元素。優(yōu)選地,所述統(tǒng)計一種類案件的數(shù)量N,并獲取數(shù)量N下的每個案件的六維特征信息,根據(jù)各個案件的六維特征信息,進行相似度計算,得到該數(shù)量N下的相似度矩陣數(shù)組具體為:首先虛擬六個案件作為相似度量化的基礎(chǔ)案件,其中,每個案件均自六維特征信息中選取一個一維特征信息,且各個案件所選取的一維特征信息不同,所述六個案件的其他五維特征信息任意賦值或取零值,該六個案件稱為相似度計算基礎(chǔ)案件;其次,為六維特征信息賦予權(quán)重,并單獨為每個一維特征信息內(nèi)的數(shù)據(jù)元素賦予權(quán)重,并設(shè)置不同元素之間的相似度值獲取規(guī)則;最后,將數(shù)量N下的各個案件與相似度計算基礎(chǔ)案件根據(jù)權(quán)重及相似度獲取規(guī)則進行相似度計算,從而形成相似度矩陣數(shù)組。優(yōu)選地,所述單獨為每個一維特征信息內(nèi)的數(shù)據(jù)元素賦予權(quán)重具體為:為各個數(shù)據(jù)元素賦予規(guī)則,根據(jù)規(guī)則設(shè)置權(quán)重,其中,地域范圍元素、行政區(qū)劃元素、唯一編號元素為規(guī)則A;嫌疑人性別元素、嫌疑人年齡特征元素、嫌疑人身高元素、嫌疑人體型元素、嫌疑人口音元素、受害人性別元素、受害人年齡特征元素、受害人受害形式元素、受害人傷害程度元素為規(guī)則B;處所特征元素、天氣元素、按日期的特征元素、按時間的特征元素、嫌疑人職業(yè)元素、受害人職業(yè)元素、受害人對象特征元素為規(guī)則C;嫌疑人專長元素;嫌疑人體貌特征元素、物品特征元素、作案特點元素、作案手段元素、侵入方式元素為規(guī)則D;所述規(guī)則A為:特殊篩選類:輸入值?。綄Ρ戎?,結(jié)果分值=0;輸入值=對比值,直接選出此對比值,并排在所有對比值的最前面;所述規(guī)則B為:一對一完全匹配類,輸入值?。綄Ρ戎?,結(jié)果分值=0,輸入值=對比值,保留對比案件,結(jié)果分值=權(quán)重分值;所述規(guī)則C為:多/一對一匹配類;輸入值?。綄Ρ戎担Y(jié)果分值=0,保留對比案件,結(jié)果分值=數(shù)據(jù)元素對應(yīng)的權(quán)重分值;所述規(guī)則D為:多對多匹配類,輸入值∩對比值=0,結(jié)果分值=0,輸入值∩對比值!=0,保留對比案件,結(jié)果分值=[(輸入值∩對比值)/輸入值]*數(shù)據(jù)元素對應(yīng)的權(quán)重分值。優(yōu)選地,所述采用聚類分析算法將相似度矩陣數(shù)組進行聚類計算,將數(shù)量N的案件分為K類具體為:采用K-means算法進行聚類分析。優(yōu)選地,所述將每類案件中所包含的各個案件相互進行相似度計算,從而得到每個案件與其他案件的相似度,為每個案件設(shè)定預(yù)設(shè)篩選條件,去除未滿足預(yù)設(shè)篩選條件的案件,則符合預(yù)設(shè)篩選條件的各個案件之間形成一個族群,該族群為一個串并案族群具體為:步驟1:將該類案件中的各個案件兩兩計算相似度,則任意一個案件i與其他案件的相似度值可記為:Ri={SSij}(i=1,2…M,j=1,2…M,i≠j),其中,SSij為任意一個案件i與任意一個案件j的相似度值;Ri代表該任意案件i與其他案件的相似度集合;步驟2:對任意一個案件i的相似度集合中的相似度值進行從高到低排序;步驟3:設(shè)定預(yù)設(shè)篩選條件:設(shè)置可串并案件的相似度最低門限Smin和串并案件的數(shù)量范圍h個,獲取任意一個案件i的相似度集合中大于Smin且排序不低于h的相似度值,與該相似度值對應(yīng)的案件與該任意一個案件i形成所述族群,該族群為案件i的串并案族群;步驟4:重復(fù)所述步驟1至所述步驟3,直至獲得所述步驟1中的該類案件中的各個案件所形成的串并案族群。優(yōu)選地,所述相似度計算公式為:S=λ1×(r1×ω1+r2×ω2+r3×ω3)+λ2×(r4×ω4+r5×ω5+r6×ω6)+λ3×(r7×ω7+r8×ω8+r9×ω9+r10×ω10+r11×ω11+r12×ω12+r13×ω13)+λ4(r14×ω14+r15×ω15+r16×ω16+r17×ω17+r18×ω18+r19×ω19)+λ5(r20×ω20+r21×ω21)+λ6(r22×ω22+r23×ω23+r24×ω24);]]>其中,S表示兩個案件的相似度值,λi為六維特征信息所對應(yīng)的權(quán)重,ωj為數(shù)據(jù)元素dj對應(yīng)的權(quán)重,rj為數(shù)據(jù)元素dj在兩個案件的間的相似度值,i=(1,2…6),j=(1,2,…24),Ti代表六維特征信息,dj代表數(shù)據(jù)元素,具體含義參見圖2。優(yōu)選地,所述統(tǒng)計一種類案件的數(shù)量N,并獲取數(shù)量N下的每個案件的六維特征信息,根據(jù)各個案件的六維特征信息,進行相似度計算,得到該數(shù)量N下的相似度矩陣數(shù)組進一步包括:對數(shù)量N下的案件進行預(yù)處理。本申請還提供了一種串并案分類系統(tǒng),所述串并案分類系統(tǒng)用于上所述的串并案分類方法,所述串并案分類系統(tǒng)包括:案件預(yù)處理模塊,所述案件預(yù)處理系統(tǒng)用于統(tǒng)計一種類案件的數(shù)量N,并獲取數(shù)量N下的每個案件的六維特征信息,根據(jù)各個案件的六維特征信息,進行相似度計算,得到該數(shù)量N下的相似度矩陣數(shù)組;計算模塊,所述計算模塊用于采用聚類分析算法將相似度矩陣數(shù)組進行聚類計算以及將每類案件中所包含的各個案件相互進行相似度計算,從而得到每個案件與其他案件的相似度,為每個案件設(shè)定預(yù)設(shè)篩選條件,去除未滿足預(yù)設(shè)篩選條件的案件,則符合預(yù)設(shè)篩選條件的各個案件之間形成一個族群,該族群為一個串并案族群。本發(fā)明中串并案分類方法可以將公安系統(tǒng)的任意一種類案件(例如盜竊)進行串并案分類,從而將該一種類案件下的所有案件自動排序、形成各個串并案族群,此時,辦案人員一旦想偵破某個案件時,即可知道該案件的串并案族群,從而最有效的利用公安系統(tǒng)資源,方便破案。附圖說明圖1是根據(jù)本發(fā)明一實施例的串并案分類方法的流程示意圖。圖2是圖1所示的串并案分類方法中的六維特征含義圖。具體實施方式為使本發(fā)明實施的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行更加詳細的描述。在附圖中,自始至終相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例。下面通過參考附圖描述的實施例是示例性的,旨在用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。下面結(jié)合附圖對本發(fā)明的實施例進行詳細說明。在本發(fā)明的描述中,需要理解的是,術(shù)語“中心”、“縱向”、“橫向”、“前”、“后”、“左”、“右”、“豎直”、“水平”、“頂”、“底”“內(nèi)”、“外”等指示的方位或位置關(guān)系為基于附圖所示的方位或位置關(guān)系,僅是為了便于描述本發(fā)明和簡化描述,而不是指示或暗示所指的裝置或元件必須具有特定的方位、以特定的方位構(gòu)造和操作,因此不能理解為對本發(fā)明保護范圍的限制。圖1是根據(jù)本發(fā)明一實施例的串并案分類方法的流程示意圖。圖2是圖1所示的串并案分類方法中的六維特征含義圖。如圖1所示的串并案分類方法包括:統(tǒng)計一種類案件的數(shù)量N,并獲取數(shù)量N下的每個案件的六維特征信息,根據(jù)各個案件的六維特征信息,進行相似度計算,得到該數(shù)量N下的相似度矩陣數(shù)組;采用聚類分析算法將相似度矩陣數(shù)組進行聚類計算,將數(shù)量N的案件分為K類;將K類案件中的每類案件均進行如下方法:將每類案件中所包含的各個案件相互進行相似度計算,從而得到每個案件與其他案件的相似度,為每個案件設(shè)定預(yù)設(shè)篩選條件,去除未滿足預(yù)設(shè)篩選條件的案件,則符合預(yù)設(shè)篩選條件的各個案件之間形成一個族群,該族群為一個串并案族群。在本實施例中,六維特征信息中每一維特征信息包括一個或多個數(shù)據(jù)元素。具體地,六維特征信息包括:地理特征信息、天氣時間特征信息、嫌疑人特征信息、受害人特征信息、涉案物品特征信息。上述六維特征信息摘自《中華人民共和國公共安全行業(yè)標準GA240.1~240.57》。本申請之所以采用上述的六維特征信息,主要是為了摒棄案件要素中和串并案分析無關(guān)或者關(guān)系不緊密的其他要素,從案件的地理特征、天氣時間特征、嫌疑人特征、受害人特征、涉案物品特征、案件自身特征六個方面入手,從而使串并案的分類更為簡單。在本實施例中,地理特征信息包括:地域范圍元素、行政區(qū)劃元素、處所特征元素;天氣時間特征信息包括:天氣元素、按日期的特征元素、按時間的特征元素;嫌疑人特征信息包括:嫌疑人性別元素、嫌疑人年齡特征元素、嫌疑人身高元素、嫌疑人體型元素、嫌疑人職業(yè)元素、嫌疑人口音元素、嫌疑人專長元素;嫌疑人體貌特征元素;受害人特征信息包括:受害人性別元素、受害人年齡特征元素、受害人職業(yè)元素、受害人對象特征元素、受害人受害形式元素、受害人傷害程度元素;涉案物品特征信息包括:唯一編號元素、物品特征元素;案件自身特征信息包括:作案特點元素、作案手段元素、侵入方式元素。在本實施例中,統(tǒng)計一種類案件的數(shù)量N,并獲取數(shù)量N下的每個案件的六維特征信息,根據(jù)各個案件的六維特征信息,進行相似度計算,得到該數(shù)量N下的相似度矩陣數(shù)組具體為:首先虛擬六個案件作為相似度量化的基礎(chǔ)案件,其中,每個案件均自六維特征信息中選取一個一維特征信息,且各個案件所選取的一維特征信息不同,所述六個案件的其他五維特征信息任意賦值或取零值,該六個案件稱為相似度計算基礎(chǔ)案件;其次,為六維特征信息賦予權(quán)重,并單獨為每個一維特征信息內(nèi)的數(shù)據(jù)元素賦予權(quán)重,并設(shè)置不同元素之間的相似度值獲取規(guī)則;最后,將數(shù)量N下的各個案件與相似度計算基礎(chǔ)案件根據(jù)權(quán)重及相似度獲取規(guī)則進行相似度計算,從而形成相似度矩陣數(shù)組。具體地,參見圖2,單獨為每個一維特征信息內(nèi)的數(shù)據(jù)元素賦予權(quán)重具體為:為各個數(shù)據(jù)元素賦予規(guī)則,根據(jù)規(guī)則設(shè)置權(quán)重,其中,地域范圍元素、行政區(qū)劃元素、唯一編號元素為規(guī)則A;嫌疑人性別元素、嫌疑人年齡特征元素、嫌疑人身高元素、嫌疑人體型元素、嫌疑人口音元素、受害人性別元素、受害人年齡特征元素、受害人受害形式元素、受害人傷害程度元素為規(guī)則B;處所特征元素、天氣元素、按日期的特征元素、按時間的特征元素、嫌疑人職業(yè)元素、受害人職業(yè)元素、受害人對象特征元素為規(guī)則C;嫌疑人專長元素;嫌疑人體貌特征元素、物品特征元素、作案特點元素、作案手段元素、侵入方式元素為規(guī)則D;規(guī)則A為:特殊篩選類:輸入值?。綄Ρ戎?,結(jié)果分值=0;輸入值=對比值,直接選出此對比值,并排在所有對比值的最前面;規(guī)則B為:一對一完全匹配類,輸入值?。綄Ρ戎?,結(jié)果分值=0,輸入值=對比值,保留對比案件,結(jié)果分值=權(quán)重分值;規(guī)則C為:多/一對一匹配類(說明:輸入值為多個,也可以為一個);輸入值?。綄Ρ戎?,結(jié)果分值=0,保留對比案件,結(jié)果分值=數(shù)據(jù)元素對應(yīng)的權(quán)重分值;規(guī)則D為:多對多匹配類,輸入值∩對比值=0,結(jié)果分值=0,輸入值∩對比值?。?,保留對比案件,結(jié)果分值=[(輸入值∩對比值)/輸入值]*數(shù)據(jù)元素對應(yīng)的權(quán)重分值。參見圖1,在本實施例中,所述采用聚類分析算法將相似度矩陣數(shù)組進行聚類計算,將數(shù)量N的案件分為K類具體為:采用K-means算法進行聚類分析。舉例來說,該算法包括如下步驟:對含有n個元素(案子)的集合x,假定I表示聚類迭代的次數(shù)(I<Imax),先隨機選擇k個初始聚類中心,此時I=0,可以用Zj(0)來表示,其中j=1,2,…,k。分別計算數(shù)據(jù)元素xi和聚類中心的距離D(Xi,Zj(I)),i=1,2,…,n-k,j=1,2,…,k,本案例中計算距離的公式采用歐式距離:其中:x表示數(shù)據(jù)元素xi的所代表的點,x=(a1,a2,…am)y表示第I次聚類中心Zj(I)所代表的點,y=(b1,b2,…bm)d表示x與y之間歐式距離,ii=(1,2,…m),m為數(shù)據(jù)元素xi所包含的數(shù)據(jù)元素維度。對于滿足判斷條件的D(Xi,Zk(I))=min{D(Xi,Zj(I)),i=1,2,…,n-k},就將數(shù)據(jù)元素xi劃入Zj(I)類。重新計算這k個聚類中心如果Zj(I+1)的變化大于設(shè)定的閾值且I+1<Imax,就表示聚類算法還在變化,需要繼續(xù),令I(lǐng)=I+1,跳轉(zhuǎn)到步驟(2)繼續(xù)執(zhí)行,否則算法結(jié)束。在本實施例中,將每類案件中所包含的各個案件相互進行相似度計算,從而得到每個案件與其他案件的相似度,為每個案件設(shè)定預(yù)設(shè)篩選條件,去除未滿足預(yù)設(shè)篩選條件的案件,則符合預(yù)設(shè)篩選條件的各個案件之間形成一個族群,該族群為一個串并案族群具體為:步驟1:將該類案件中的各個案件兩兩計算相似度,則任意一個案件i與其他案件的相似度值可記為:Ri={SSij}(i=1,2…M,j=1,2…M,i≠j),其中,SSij為任意一個案件i與任意一個案件j的相似度值;Ri代表該任意案件i與其他案件的相似度集合;步驟2:對任意一個案件i的相似度集合中的相似度值進行從高到低排序;步驟3:設(shè)定預(yù)設(shè)篩選條件:設(shè)置可串并案件的相似度最低門限Smin和串并案件的數(shù)量范圍h個,獲取任意一個案件i的相似度集合中大于Smin且排序不低于h的相似度值,與該相似度值對應(yīng)的案件與該任意一個案件i形成所述族群,該族群為案件i的串并案族群;步驟4:重復(fù)步驟1至步驟3,直至獲得步驟1中的該類案件中的各個案件所形成的串并案族群。采用這種方式,即可將K類案件中的每類案件中的每個案件及其串并案族群均分類出來。在本實施例中,相似度計算公式為:S=λ1×(r1×ω1+r2×ω2+r3×ω3)+λ2×(r4×ω4+r5×ω5+r6×ω6)+λ3×(r7×ω7+r8×ω8+r9×ω9+r10×ω10+r11×ω11+r12×ω12+r13×ω13)+λ4(r14×ω14+r15×ω15+r16×ω16+r17×ω17+r18×ω18+r19×ω19)+λ5(r20×ω20+r21×ω21)+λ6(r22×ω22+r23×ω23+r24×ω24);]]>其中,S表示兩個案件的相似度值,λi為六維特征信息所對應(yīng)的權(quán)重,ωj為數(shù)據(jù)元素dj對應(yīng)的權(quán)重,rj為數(shù)據(jù)元素dj在兩個案件的間的相似度值,i=(1,2…6),j=(1,2,…24),Ti代表六維特征信息,dj代表數(shù)據(jù)元素,具體含義參見圖2。在本實施例中,統(tǒng)計一種類案件的數(shù)量N,并獲取數(shù)量N下的每個案件的六維特征信息,根據(jù)各個案件的六維特征信息,進行相似度計算,得到該數(shù)量N下的相似度矩陣數(shù)組進一步包括:對數(shù)量N下的案件進行預(yù)處理??梢岳斫獾氖?,該預(yù)處理包括針對每個案件的在相關(guān)六維特征信息中去除一些記錄不完整、不一致或有錯誤的信息,并利用數(shù)據(jù)詞典提取、人工補錄等方式從簡要案情中提取模型中所需的數(shù)據(jù)元素。為了方便理解,下面以舉例的方式對本申請進行詳細闡述,可以理解的是,該舉例并不構(gòu)成對本申請的任何限制。假設(shè)現(xiàn)在要進行盜竊案的串并案分類,設(shè)定盜竊類的案件總量為300個,此時,獲取300個案件中的每個案件的六維特征信息,并進行預(yù)處理,從而使每個案件都具有六維特征信息,且每維特征信息中的各個數(shù)據(jù)元素信息的信息內(nèi)容也是完整的。此時,該300個案件記為:(C1,C2,…,C300);其中,任意一個案件CN內(nèi)含有六維特征信息,包括24個數(shù)據(jù)元素信息。下面將這300個案件進行相似度金酸,從而得到300個案件的相似度矩陣數(shù)組,在本申請中,采用如下方式進行計算:首先虛擬六個案件作為相似度量化的基礎(chǔ)案件,其中,每個案件均自六維特征信息中選取一個一維特征信息,且各個案件所選取的一維特征信息不同,所述六個案件的其他五維特征信息任意賦值或取零值,該六個案件稱為相似度計算基礎(chǔ)案件;具體地,將這六個相似度計算基礎(chǔ)案件記為:(B1,B2,B3,B4,B5,B6);其中,任意一個相似度計算基礎(chǔ)案件BN代表的含義為:具有一個維度特征信息,而其他維度特征信息為零值。例如,我們?nèi)。築1為在地理特征信息上具有信息,而其他五個維度特征信息為零值;B2為在天氣時間特征信息上具有信息,而其他五個維度特征信息為零值;B3為在嫌疑人特征信息上具有信息,而其他五個維度特征信息為零值;B4為在受害人特征信息上具有信息,而其他五個維度特征信息為零值;B5為在涉案物品特征信息上具有信息,而其他五個維度特征信息為零值;B6為在案件自身特征信息上具有信息,而其他五個維度特征信息為零值。可以理解的是,本實施例中,任何一個BN的其他五個維度特征信息為零,在其他實施例中,還可以使其他五個維度特征信息為任意值。設(shè)置完六個相似度計算基礎(chǔ)案件之后或者在設(shè)置六個相似度計算基礎(chǔ)案件之前均可,通過人工配置為六維特征信息賦予權(quán)重,并單獨為每個一維特征信息內(nèi)的數(shù)據(jù)元素賦予權(quán)重,并設(shè)置不同元素之間的相似度值獲取規(guī)則。具體地,本申請的權(quán)重規(guī)則上文已經(jīng)敘述,在此不再敘述。將權(quán)重設(shè)置完成并且將六個相似度計算基礎(chǔ)案件設(shè)置完成后,將該300個案件(C1,C2,…,C300)與相似度計算基礎(chǔ)案件(B1,B2,B3,B4,B5,B6)根據(jù)權(quán)重及相似度獲取規(guī)則進行相似度計算,從而形成相似度矩陣數(shù)組SN×6。下面將相似度矩陣數(shù)組通過聚類分析算法進行聚類,假設(shè)我們需要分成5類(假設(shè)為A類、B類、C類、D類、E類),則采用聚類分析算法步驟如下:對300個案子所組成的相似度矩陣數(shù)組SN×6,設(shè)定聚類迭代次數(shù)I(I<Imax),先在該相似度矩陣數(shù)組SN×6中隨機選擇k個初始聚類中心,本申請假設(shè)選取5個初始聚類中心,此時I=0,可以用Zj(0)來表示,其中j=1,2,…,5。分別計算每個數(shù)據(jù)元素和聚類中心的距離,假設(shè)該數(shù)據(jù)元素為xi,則計算該數(shù)據(jù)元素xi和聚類中心的距離D(Xi,Zj(I)),i=1,2,…,n-k,j=1,2,…,k,本案例中計算距離的公式采用歐式距離:其中:x表示數(shù)據(jù)元素xi的所代表的點,x=(a1,a2,…a24)y表示第I次聚類中心Zj(I)所代表的點,y=(b1,b2,…b24)d表示x與y之間歐式距離,ii=(1,2,…24)對于滿足判斷條件的D(Xi,Zk(I))=min{D(Xi,Zj(I)),i=1,2,…,n-k},就將數(shù)據(jù)元素xi劃入第I次聚類中心Zj(I)代表的類。重新計算這k個聚類中心如果Zj(I+1)的變化大于設(shè)定的閾值且I+1<Imax,就表示聚類算法還在變化,需要繼續(xù),令I(lǐng)=I+1,跳轉(zhuǎn)到步驟(2)繼續(xù)執(zhí)行,否則算法結(jié)束。通過上述聚類分析,將案件分為5類(假設(shè)為A類、B類、C類、D類、E類)。其中,每類案件均采用如下方法進行:將每類案件中所包含的各個案件相互進行相似度計算,從而得到每個案件與其他案件的相似度,為每個案件設(shè)定預(yù)設(shè)篩選條件,去除未滿足預(yù)設(shè)篩選條件的案件,則符合預(yù)設(shè)篩選條件的各個案件之間形成一個族群,該族群為一個串并案族群。具體地,采用如下步驟進行:步驟1:將該類案件中的各個案件兩兩計算相似度,則任意一個案件i與其他案件的相似度值可記為:Ri={SSij}(i=1,2…M,j=1,2…M,i≠j),其中,SSij為任意一個案件i與任意一個案件j的相似度值;Ri代表該任意案件i與其他案件的相似度集合;可以理解的是,該步驟中的相似度計算可是采用上述的相似度計算公式。步驟2:對任意一個案件i的相似度集合中的相似度值進行從高到低排序;步驟3:設(shè)定預(yù)設(shè)篩選條件:設(shè)置可串并案件的相似度最低門限Smin和串并案件的數(shù)量范圍h個,獲取任意一個案件i的相似度集合中大于Smin且排序不低于h的相似度值,與該相似度值對應(yīng)的案件與該任意一個案件i形成所述族群,該族群為案件i的串并案族群。步驟4:重復(fù)所述步驟1至所述步驟3,直至獲得所述步驟1中的該類案件中的各個案件所形成的串并案族群。為了方便敘述,下面以A類案件為例,假設(shè)經(jīng)過聚類分析后,A類案件中包括36個案件,設(shè)置可串并案件的相似度最低門限Smin和串并案件的數(shù)量范圍h個,具體地,設(shè)置相似度最低門限Smin大于40,個數(shù)10個,通過相似度公式,計算出這36個案件中的1個案件(記為A案件)與其他各個案件(35個)的兩兩之間的相似度,并將其與其他案件的相似度進行上述預(yù)設(shè)篩選條件的篩選,從而選出10個相似度最低門限Smin大于40的案件(記為B案件、C案件、D案件、E案件、F案件、G案件、H案件、I案件、J案件、K案件),此時,B案件、C案件、D案件、E案件、F案件、G案件、H案件、I案件、J案件、K案件與A案件形成族群,該族群為A案件的串并案族群。采用這種方式,將A類案件中的其他35個案件按照上述方法進行,從而得到剩下35個案件的串并案族群。同理,將B類、C類、D類以及E類案件按照上述方法進行,從而得到B類、C類、D類以及E類案件下的各個案件的串并案族群??梢岳斫獾氖?,在本實施例中,該串并案分類方法還進一步包括向用戶(使用該串并案分類方法的使用者)進行推薦的步驟,此時,求得各個已經(jīng)形成的串并案族群中的總相似度平均值,總相似度平均值高的則優(yōu)先向用戶推薦(認為相似度更高,更有可能是同一個人或者組織作案。舉例來說,上述的A案件的串并案族群的10個案件的兩兩相似度之和除以案件數(shù)量(10個),從而得到A案件的串并案族群中的總相似度平均值,再計算另一個案件的串并案族群中的總相似度平均值,若A案件的串并案族群中的總相似度平均值大于另一個案件的串并案族群中的總相似度平均值,則優(yōu)先推薦A案件的串并案族群。本申請還提供了一種串并案分類系統(tǒng),該串并案分類系統(tǒng)用于如上所述的串并案分類方法,該串并案分類系統(tǒng)包括案件預(yù)處理模塊以及計算模塊,案件預(yù)處理系統(tǒng)用于統(tǒng)計一種類案件的數(shù)量N,并獲取數(shù)量N下的每個案件的六維特征信息,根據(jù)各個案件的六維特征信息,進行相似度計算,得到該數(shù)量N下的相似度矩陣數(shù)組;計算模塊用于采用聚類分析算法將相似度矩陣數(shù)組進行聚類計算以及將每類案件中所包含的各個案件相互進行相似度計算,從而得到每個案件與其他案件的相似度,為每個案件設(shè)定預(yù)設(shè)篩選條件,去除未滿足預(yù)設(shè)篩選條件的案件,則符合預(yù)設(shè)篩選條件的各個案件之間形成一個族群,該族群為一個串并案族群。可以理解的是,在一個實施例中,該串并案分類系統(tǒng)還進一步包括推薦模塊,該推薦模塊用于向用戶推薦各個已經(jīng)形成的串并案族群中的總相似度平均值高的串并案族群。在本發(fā)明所提供的實施例中,應(yīng)該理解到,所揭露的相關(guān)系統(tǒng)和方法,可以通過其他的方式實現(xiàn)。例如,以上所描述的系統(tǒng)僅僅是示意性的,例如,所述模塊和單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信臨街,可以是電性、機械或其他的形式。所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。另外,在本發(fā)明的實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用軟件功能單元的形式實現(xiàn)。所述集成的單元如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機可讀取存儲介質(zhì)中,基于這樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使計算機處理器執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括U盤、移動硬盤、只讀存儲器、隨機存取存儲器、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。最后需要指出的是:以上實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制。盡管參照前述實施例對本發(fā)明進行了詳細的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當理解:其依然可以對前述各實施例所記載的技術(shù)方案進行修改,或者對其中部分技術(shù)特征進行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的精神和范圍。當前第1頁1 2 3 
當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
吉安市| 鄱阳县| 外汇| 柏乡县| 商城县| 阿鲁科尔沁旗| 高青县| 玉门市| 宣武区| 莲花县| 综艺| 青田县| 龙井市| 周宁县| 临湘市| 青冈县| 墨竹工卡县| 姚安县| 孟连| 贞丰县| 开化县| 元谋县| 资溪县| 肃北| 彩票| 康平县| 泗阳县| 长泰县| 新乡市| 二手房| 大渡口区| 庆阳市| 老河口市| 霍山县| 黎城县| 广州市| 平湖市| 长沙县| 阿拉善左旗| 锡林浩特市| 沙雅县|