本發(fā)明涉及法院案件檢索技術(shù)領(lǐng)域,尤其涉及一種相似案件檢索方法及裝置。
背景技術(shù):
在某些疑難案件的審判過程中,審判人員(法官)除依靠自身業(yè)務(wù)水平和經(jīng)驗(yàn)以外,經(jīng)常需要檢索已有相似案件,來把握相關(guān)情節(jié)的處理。現(xiàn)有常用檢索技術(shù)(途徑)包括通用搜索引擎、行業(yè)網(wǎng)站、指導(dǎo)性案例;特點(diǎn)如下:
(1)通用搜索引擎:如百度、雅虎等;沒有針對司法領(lǐng)域定制,檢索準(zhǔn)確率和覆蓋率低。
(2)行業(yè)網(wǎng)站:如裁判文書網(wǎng)、無訟網(wǎng)等;與通用搜索相比,檢索準(zhǔn)確率和覆蓋率有較大提升,并允許多重過濾;但是檢索主要基于關(guān)鍵字匹配,過于機(jī)械,準(zhǔn)確率依然較低;過濾條件預(yù)設(shè),不夠靈活。
(3)指導(dǎo)性案例:最高院發(fā)布,具有權(quán)威性,針對性;但是案件數(shù)量少,滯后嚴(yán)重,并且彼此孤立,檢索覆蓋率低;地方適應(yīng)性也有待考量。
另外,上述檢索技術(shù)均不支持語義檢索,無法自由組合過濾、查詢條件,不能基于結(jié)果連續(xù)檢索,沒有實(shí)現(xiàn)對檢索結(jié)果的統(tǒng)計(jì)和直觀展示。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是為了解決現(xiàn)有技術(shù)中存在的缺點(diǎn),而提出的一種相似案件檢索方法及裝置。
一種相似案件檢索方法及裝置,包括以下步驟:
S1:組織裁判文書:將裁判文書按照案由分層分類組織;
S2:構(gòu)造案件特征樹:對于指定案由,篩選共有特征和私有特征,并按特征間邏輯關(guān)系,組織稱樹形結(jié)構(gòu),每個(gè)案由對應(yīng)一個(gè)特征樹,其結(jié)構(gòu)隨選取特征的變動(dòng)而調(diào)整,待特征樹結(jié)構(gòu)穩(wěn)定,從裁判文書中抽取對應(yīng)特征信息,組成特征樹集合;
S3:訓(xùn)練案件特征權(quán)重樹:根據(jù)案件特征樹數(shù)據(jù)訓(xùn)練生成特征權(quán)重樹;
S4:輸入檢索信息:用戶輸入檢索條件,構(gòu)造案件相似矩陣;
S5:計(jì)算案件相似矩陣:根據(jù)過濾條件從特征樹集合中篩選有效特征樹,根據(jù)查詢條件,利用權(quán)重樹,計(jì)算有效特征樹集合中兩兩相似度,組成相似矩陣;
S6:展示檢索結(jié)果:通過既定閾值,從案件相似矩陣中獲取相似案件,對相關(guān)信息進(jìn)行統(tǒng)計(jì),并進(jìn)行可視化展示。
優(yōu)選的,所述案件特征樹與所在案由相對應(yīng),并按案由層級關(guān)系組織。
優(yōu)選的,所述抽取的方式為模式匹配和語義分析。
優(yōu)選的,所述特征權(quán)重樹采用決策樹方法,針對不同目標(biāo)多次訓(xùn)練計(jì)算綜合權(quán)重,且樹中父節(jié)點(diǎn)權(quán)重為子節(jié)點(diǎn)權(quán)重和。
優(yōu)選的,所述檢索信息包括過濾條件和查詢條件。
優(yōu)選的,所述相似度的計(jì)算方法采用加權(quán)曼哈頓距離,并對結(jié)果進(jìn)行歸一化。
一種相似案件檢索方法及裝置,還包括:
錄入模塊,用于在信息數(shù)據(jù)庫中錄入案由詳細(xì)信息;
分類模塊,用于將數(shù)據(jù)庫中的信息按照特征進(jìn)行逐層、逐條分類,歸檔;
檢索模塊,用于輸入檢索信息,并對檢索信息進(jìn)行拆分,將拆分后的檢索信息分別與信息數(shù)據(jù)庫中的信息進(jìn)行比對、組合,排列成相似矩陣;
展示模塊,用于將統(tǒng)計(jì)的相關(guān)檢索信息進(jìn)行有序展示。
本發(fā)明以精心構(gòu)造的案件特征樹為基礎(chǔ),大幅提高檢索準(zhǔn)確率和覆蓋率;以檢索信息為綱領(lǐng),自由組合過濾和查詢條件;通過構(gòu)造案件相似矩陣,實(shí)現(xiàn)基于案件的連續(xù)檢索;對檢索結(jié)果進(jìn)行統(tǒng)計(jì)分析,直觀展示相關(guān)信息。
附圖說明
圖1為本發(fā)明提出一種相似案件檢索方法及裝置的流程示意圖。
圖中:S10裁判文書、S20特征樹、S30權(quán)重樹、S40檢索、S50相似矩陣、S60相似案件。
具體實(shí)施方式
下面結(jié)合具體實(shí)施例對本發(fā)明作進(jìn)一步解說。
本發(fā)明提出的一種相似案件檢索方法及裝置,包括以下步驟:
S1:組織裁判文書S10:將裁判文書S10按照案由分層分類組織;
S2:構(gòu)造案件特征樹S20:對于指定案由,篩選共有特征和私有特征,并按特征間邏輯關(guān)系,組織稱樹形結(jié)構(gòu),每個(gè)案由對應(yīng)一個(gè)特征樹S20,其結(jié)構(gòu)隨選取特征的變動(dòng)而調(diào)整,待特征樹S20結(jié)構(gòu)穩(wěn)定,從裁判文書S10中抽取對應(yīng)特征信息,組成特征樹S20集合;
S3:訓(xùn)練案件特征權(quán)重樹S30:根據(jù)案件特征樹S20數(shù)據(jù)訓(xùn)練生成特征權(quán)重樹S30;
S4:輸入檢索S40信息:用戶輸入檢索S40條件,構(gòu)造案件相似矩陣S50;
S5:計(jì)算案件相似矩陣S50:根據(jù)過濾條件從特征樹S20集合中篩選有效特征樹S20,根據(jù)查詢條件,利用權(quán)重樹S30,計(jì)算有效特征樹S20集合中兩兩相似度,組成相似矩陣;
S6:展示檢索S40結(jié)果:通過既定閾值,從案件相似矩陣S50中獲取相似案件S60,對相關(guān)信息進(jìn)行統(tǒng)計(jì),并進(jìn)行可視化展示。
本發(fā)明中,所述案件特征樹S20與所在案由相對應(yīng),并按案由層級關(guān)系組織;所述抽取的方式為模式匹配和語義分析;所述特征權(quán)重樹S30采用決策樹方法,針對不同目標(biāo)多次訓(xùn)練計(jì)算綜合權(quán)重,且樹中父節(jié)點(diǎn)權(quán)重為子節(jié)點(diǎn)權(quán)重和;所述檢索S40信息包括過濾條件和查詢條件;所述相似度的計(jì)算方法采用加權(quán)曼哈頓距離,并對結(jié)果進(jìn)行歸一化。
本發(fā)明中,所述的案件特征樹S20包括公有特征和私有特征,其中公有特征為案件一般屬性,例如案件時(shí)間、地區(qū)與案件實(shí)體信息等;私有特征為案件特殊屬性,例如離婚糾紛案中離婚原因、子女信息、共同財(cái)產(chǎn)等。
本發(fā)明中,所述的過濾條件用于限定案件時(shí)間、地區(qū)等,不參與案件相似度計(jì)算;查詢條件用于指定檢索S40維度,構(gòu)成案件相似度計(jì)算維度。
本發(fā)明中,一種相似案件檢索方法及裝置,還包括:
錄入模塊,用于在信息數(shù)據(jù)庫中錄入案由詳細(xì)信息;
分類模塊,用于將數(shù)據(jù)庫中的信息按照特征進(jìn)行逐層、逐條分類,歸檔;
檢索模塊,用于輸入檢索信息,并對檢索信息進(jìn)行拆分,將拆分后的檢索信息分別與信息數(shù)據(jù)庫中的信息進(jìn)行比對、組合,排列成相似矩陣;
展示模塊,用于將統(tǒng)計(jì)的相關(guān)檢索信息進(jìn)行有序展示。
本發(fā)明以精心構(gòu)造的案件特征樹S20為基礎(chǔ),大幅提高檢索S40準(zhǔn)確率和覆蓋率;以檢索S40信息為綱領(lǐng),自由組合過濾和查詢條件;通過構(gòu)造案件相似矩陣S50,實(shí)現(xiàn)基于案件的連續(xù)檢索S40;對檢索S40結(jié)果進(jìn)行統(tǒng)計(jì)分析,直觀展示相關(guān)信息。
以上所述,僅為本發(fā)明較佳的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),根據(jù)本發(fā)明的技術(shù)方案及其發(fā)明構(gòu)思加以等同替換或改變,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。