本申請(qǐng)涉及信息搜索領(lǐng)域,具體而言,涉及一種裁判文書(shū)的搜索方法及裝置。
背景技術(shù):
裁判文書(shū)記載人民法院審理過(guò)程和結(jié)果,是訴訟活動(dòng)結(jié)果的載體,也是人民法院確定和分配當(dāng)事人實(shí)體權(quán)利與義務(wù)的惟一憑證。一份結(jié)構(gòu)完整、要素齊全、邏輯嚴(yán)謹(jǐn)?shù)牟门形臅?shū),既是當(dāng)事人享有權(quán)利和負(fù)擔(dān)義務(wù)的憑證,也是上級(jí)人民法院監(jiān)督下級(jí)人民法院民事審判活動(dòng)的重要依據(jù)。當(dāng)今,法律工作者在訴訟案件中經(jīng)常需要尋找與當(dāng)前正在處理的案情相似,并且已經(jīng)生效判決的裁判文書(shū)。對(duì)普通人而言,在遇到糾紛時(shí),也希望能夠?qū)ふ业筋?lèi)似其遭遇,并且生效判決的裁判文書(shū)作為后續(xù)處理的參考。當(dāng)前在對(duì)目標(biāo)裁判文書(shū)的搜索過(guò)程中,當(dāng)前的搜索引擎主要是針對(duì)基于案情輸入的搜索查詢(xún)文本進(jìn)行拆分和匹配。相關(guān)技術(shù)的目標(biāo)裁判文書(shū)搜索過(guò)程中,為了提高匹配相關(guān)性,通??紤]引入關(guān)鍵詞的近義詞。當(dāng)搜索引擎對(duì)搜索查詢(xún)文本中關(guān)鍵詞和近義詞同時(shí)進(jìn)行匹配時(shí),會(huì)造成搜索到的目標(biāo)裁判文書(shū)與搜索查詢(xún)文本之間的相關(guān)性不明確,因?yàn)橐黄繕?biāo)裁判文書(shū)可能匹配到多個(gè)關(guān)鍵詞,也可能匹配到一個(gè)關(guān)鍵詞的多個(gè)近義詞。
針對(duì)相關(guān)技術(shù)中搜索到的目標(biāo)裁判文書(shū)的相關(guān)性不明確的問(wèn)題,目前尚未提出有效的解決方案。
技術(shù)實(shí)現(xiàn)要素:
本申請(qǐng)的主要目的在于提供一種裁判文書(shū)的搜索方法及裝置,以解決相關(guān)技術(shù)中搜索到的目標(biāo)裁判文書(shū)的相關(guān)性不明確的問(wèn)題。
為了實(shí)現(xiàn)上述目的,根據(jù)本申請(qǐng)的一個(gè)方面,提供了一種裁判文書(shū)的搜索方法。該方法包括:獲取匹配詞集合,其中,匹配詞集合中包含搜索查詢(xún)文本中的各個(gè)搜索關(guān)鍵詞和搜索關(guān)鍵詞的近義詞,匹配詞集合中的每個(gè)元素為一個(gè)匹配詞;根據(jù)匹配詞集合進(jìn)行搜索匹配,得到目標(biāo)裁判文書(shū)和匹配序列,其中,匹配序列是匹配詞集合匹配到目標(biāo)裁判文書(shū)后,由與目標(biāo)裁判文書(shū)匹配的匹配詞組成的序列;以及根據(jù)匹配序列確定目標(biāo)裁判文書(shū)的相關(guān)性。
進(jìn)一步地,根據(jù)匹配序列確定目標(biāo)裁判文書(shū)的相關(guān)性包括:對(duì)匹配序列進(jìn)行拆分, 得到由與目標(biāo)裁判文書(shū)匹配的匹配詞構(gòu)成的匹配詞組;計(jì)算匹配詞組的相關(guān)性數(shù)值;根據(jù)匹配詞組的相關(guān)性數(shù)值計(jì)算目標(biāo)裁判文書(shū)的相關(guān)性數(shù)值;以及根據(jù)目標(biāo)裁判文書(shū)的相關(guān)性數(shù)值確定目標(biāo)裁判文書(shū)的相關(guān)性。
進(jìn)一步地,計(jì)算匹配詞組的相關(guān)性數(shù)值包括:獲取匹配詞組中每個(gè)匹配詞的位置信息;確定匹配詞組中每個(gè)匹配詞的位置信息對(duì)應(yīng)的權(quán)重值;根據(jù)匹配詞組中每個(gè)匹配詞的位置信息對(duì)應(yīng)的權(quán)重值、第一預(yù)設(shè)權(quán)重值和第二預(yù)設(shè)權(quán)重值計(jì)算匹配詞組中每個(gè)匹配詞的相關(guān)性數(shù)值,其中,第一預(yù)設(shè)權(quán)重值為搜索關(guān)鍵詞的預(yù)設(shè)權(quán)重值,第二預(yù)設(shè)權(quán)重值為搜索關(guān)鍵詞的近義詞的預(yù)設(shè)權(quán)重值;以及統(tǒng)計(jì)匹配詞組中每個(gè)匹配詞的相關(guān)性數(shù)值,得到匹配詞組的相關(guān)性數(shù)值。
進(jìn)一步地,根據(jù)目標(biāo)裁判文書(shū)的相關(guān)性數(shù)值確定目標(biāo)裁判文書(shū)的相關(guān)性之后,該方法還包括:根據(jù)目標(biāo)裁判文書(shū)的相關(guān)性數(shù)值對(duì)目標(biāo)裁判文書(shū)的相關(guān)性進(jìn)行排序,得到排序后的目標(biāo)裁判文書(shū);以及按照排序后的目標(biāo)裁判文書(shū)的次序,對(duì)排序后的目標(biāo)裁判文書(shū)進(jìn)行顯示。
進(jìn)一步地,根據(jù)匹配詞集合進(jìn)行搜索匹配,得到目標(biāo)裁判文書(shū)和匹配序列包括:通過(guò)匹配詞集合中的各個(gè)匹配詞在候選裁判文書(shū)進(jìn)行搜索匹配,得到各個(gè)匹配詞對(duì)應(yīng)的目標(biāo)裁判文書(shū);獲取各個(gè)匹配詞中對(duì)應(yīng)同一目標(biāo)裁判文書(shū)的匹配詞;合并對(duì)應(yīng)同一目標(biāo)裁判文書(shū)的匹配詞,得到匹配結(jié)果詞集合;以及根據(jù)匹配結(jié)果詞集合,得到匹配序列。
為了實(shí)現(xiàn)上述目的,根據(jù)本申請(qǐng)的另一方面,提供了一種裁判文書(shū)的搜索裝置。該裝置包括:獲取單元,用于獲取匹配詞集合,其中,匹配詞集合中包含搜索查詢(xún)文本中的各個(gè)搜索關(guān)鍵詞和搜索關(guān)鍵詞的近義詞,匹配詞集合中的每個(gè)元素為一個(gè)匹配詞;搜索單元,用于根據(jù)匹配詞集合進(jìn)行搜索匹配,得到目標(biāo)裁判文書(shū)和匹配序列,其中,匹配序列是匹配詞集合匹配到目標(biāo)裁判文書(shū)后,由與目標(biāo)裁判文書(shū)匹配的匹配詞組成的序列;以及確定單元,用于根據(jù)匹配序列確定目標(biāo)裁判文書(shū)的相關(guān)性。
進(jìn)一步地,確定單元包括:拆分模塊,用于對(duì)匹配序列進(jìn)行拆分,得到由與目標(biāo)裁判文書(shū)匹配的匹配詞構(gòu)成的匹配詞組;第一計(jì)算模塊,用于計(jì)算匹配詞組的相關(guān)性數(shù)值;第二計(jì)算模塊,用于根據(jù)匹配詞組的相關(guān)性數(shù)值計(jì)算目標(biāo)裁判文書(shū)的相關(guān)性數(shù)值;以及確定模塊,用于根據(jù)目標(biāo)裁判文書(shū)的相關(guān)性數(shù)值確定目標(biāo)裁判文書(shū)的相關(guān)性。
進(jìn)一步地,第一計(jì)算模塊包括:獲取子模塊,用于獲取匹配詞組中每個(gè)匹配詞的位置信息;確定子模塊,用于確定匹配詞組中每個(gè)匹配詞的位置信息對(duì)應(yīng)的權(quán)重值;計(jì)算子模塊,用于根據(jù)匹配詞組中每個(gè)匹配詞的位置信息對(duì)應(yīng)的權(quán)重值、第一預(yù)設(shè)權(quán)重值和第二預(yù)設(shè)權(quán)重值計(jì)算匹配詞組中每個(gè)匹配詞的相關(guān)性數(shù)值,其中,第一預(yù)設(shè)權(quán) 重值為搜索關(guān)鍵詞的預(yù)設(shè)權(quán)重值,第二預(yù)設(shè)權(quán)重值為搜索關(guān)鍵詞的近義詞的預(yù)設(shè)權(quán)重值;以及統(tǒng)計(jì)子模塊,用于統(tǒng)計(jì)匹配詞組中每個(gè)匹配詞的相關(guān)性數(shù)值,得到匹配詞組的相關(guān)性數(shù)值。
進(jìn)一步地,該裝置還包括:排序單元,用于根據(jù)目標(biāo)裁判文書(shū)的相關(guān)性數(shù)值對(duì)目標(biāo)裁判文書(shū)的相關(guān)性進(jìn)行排序,得到排序后的目標(biāo)裁判文書(shū);以及顯示單元,用于按照排序后的目標(biāo)裁判文書(shū)的次序,對(duì)排序后的目標(biāo)裁判文書(shū)進(jìn)行顯示。
進(jìn)一步地,搜索單元包括:匹配模塊,用于通過(guò)匹配詞集合中的各個(gè)匹配詞在候選裁判文書(shū)進(jìn)行搜索匹配,得到各個(gè)匹配詞對(duì)應(yīng)的目標(biāo)裁判文書(shū);第一獲取模塊,用于獲取各個(gè)匹配詞中對(duì)應(yīng)同一目標(biāo)裁判文書(shū)的匹配詞;合并模塊,用于合并對(duì)應(yīng)同一目標(biāo)裁判文書(shū)的匹配詞,得到匹配結(jié)果詞集合;以及第二獲取模塊,用于根據(jù)匹配結(jié)果詞集合,得到匹配序列。
通過(guò)本申請(qǐng),采用以下步驟:獲取匹配詞集合,其中,匹配詞集合中包含搜索查詢(xún)文本中的各個(gè)搜索關(guān)鍵詞和搜索關(guān)鍵詞的近義詞,匹配詞集合中的每個(gè)元素為一個(gè)匹配詞;根據(jù)匹配詞集合進(jìn)行搜索匹配,得到目標(biāo)裁判文書(shū)和匹配序列,其中,匹配序列是匹配詞集合匹配到目標(biāo)裁判文書(shū)后,由與目標(biāo)裁判文書(shū)匹配的匹配詞組成的序列;以及根據(jù)匹配序列確定目標(biāo)裁判文書(shū)的相關(guān)性,解決了相關(guān)技術(shù)中搜索到的目標(biāo)裁判文書(shū)的相關(guān)性不明確的問(wèn)題,對(duì)匹配序列中搜索關(guān)鍵詞和搜索關(guān)鍵詞的近義詞的權(quán)重值進(jìn)行區(qū)分,從而確定出目標(biāo)裁判文書(shū)的相關(guān)性,進(jìn)而達(dá)到提升返回相關(guān)程度的目標(biāo)裁判文書(shū)的效果。
附圖說(shuō)明
構(gòu)成本申請(qǐng)的一部分的附圖用來(lái)提供對(duì)本申請(qǐng)的進(jìn)一步理解,本申請(qǐng)的示意性實(shí)施例及其說(shuō)明用于解釋本申請(qǐng),并不構(gòu)成對(duì)本申請(qǐng)的不當(dāng)限定。在附圖中:
圖1是根據(jù)本申請(qǐng)第一實(shí)施例的裁判文書(shū)的搜索方法的流程圖;
圖2是根據(jù)本申請(qǐng)第二實(shí)施例的裁判文書(shū)的搜索方法的流程圖;以及
圖3是根據(jù)本申請(qǐng)實(shí)施例的裁判文書(shū)的搜索裝置的示意圖。
具體實(shí)施方式
需要說(shuō)明的是,在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互組合。下面將參考附圖并結(jié)合實(shí)施例來(lái)詳細(xì)說(shuō)明本申請(qǐng)。
為了使本技術(shù)領(lǐng)域的人員更好地理解本申請(qǐng)方案,下面將結(jié)合本申請(qǐng)實(shí)施例中的 附圖,對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本申請(qǐng)一部分的實(shí)施例,而不是全部的實(shí)施例?;诒旧暾?qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本申請(qǐng)保護(hù)的范圍。
需要說(shuō)明的是,本申請(qǐng)的說(shuō)明書(shū)和權(quán)利要求書(shū)及上述附圖中的術(shù)語(yǔ)“第一”、“第二”等是用于區(qū)別類(lèi)似的對(duì)象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本申請(qǐng)的實(shí)施例。此外,術(shù)語(yǔ)“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過(guò)程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒(méi)有清楚地列出的或?qū)τ谶@些過(guò)程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
根據(jù)本申請(qǐng)的實(shí)施例,提供了一種裁判文書(shū)的搜索方法。
圖1是根據(jù)本申請(qǐng)第一實(shí)施例的裁判文書(shū)的搜索方法的流程圖。如圖1所示,該方法包括以下步驟:
步驟S101,獲取匹配詞集合,其中,匹配詞集合中包含搜索查詢(xún)文本中的各個(gè)搜索關(guān)鍵詞和搜索關(guān)鍵詞的近義詞,匹配詞集合中的每個(gè)元素為一個(gè)匹配詞。
本申請(qǐng)實(shí)施例中的搜索查詢(xún)文本即是在當(dāng)事人需要獲得生效判決的裁判文書(shū)作為處理糾紛的參考時(shí),基于糾紛案情輸入的文本。例如,當(dāng)事人基于正在處理的糾紛案情輸入的搜索查詢(xún)文本為:一車(chē)正在飆車(chē)時(shí),撞上正常行駛的客車(chē),相關(guān)補(bǔ)償事宜。當(dāng)事人通過(guò)輸入搜索查詢(xún)文本希望獲取到與輸入的文本相關(guān)的生效判決的裁判文書(shū)作為后續(xù)處理的參考。
獲取搜索查詢(xún)文本中的搜索關(guān)鍵詞。例如,搜索查詢(xún)文本為:一車(chē)正在飆車(chē)時(shí),撞上正常行駛的客車(chē),相關(guān)補(bǔ)償事宜。獲取到搜索查詢(xún)文本中的搜索關(guān)鍵詞為“飆車(chē)”、“補(bǔ)償”。獲取搜索關(guān)鍵詞的近義詞。例如,獲取到搜索查詢(xún)文本中的搜索關(guān)鍵詞為“飆車(chē)”、“補(bǔ)償”。獲取到搜索關(guān)鍵詞的近義詞為“追逐競(jìng)駛”、“賠償”等。
將搜索查詢(xún)文本中的搜索關(guān)鍵詞和搜索關(guān)鍵詞的近義詞組成匹配詞集合。
需要說(shuō)明的是,本申請(qǐng)不僅限于根據(jù)搜索關(guān)鍵詞擴(kuò)充至搜索關(guān)鍵詞的近義詞,也可以是搜索關(guān)鍵詞的同義詞等等。即匹配詞集合也可以由搜索關(guān)鍵詞和搜索關(guān)鍵詞的同義詞組成,后續(xù)步驟對(duì)應(yīng)相同。
步驟S102,根據(jù)匹配詞集合進(jìn)行搜索匹配,得到目標(biāo)裁判文書(shū)和匹配序列,其中,匹配序列是匹配詞集合匹配到目標(biāo)裁判文書(shū)后,由與目標(biāo)裁判文書(shū)匹配的匹配詞組成 的序列。
通過(guò)由搜索查詢(xún)文本中的搜索關(guān)鍵詞和搜索關(guān)鍵詞的近義詞組成的匹配詞集合進(jìn)行搜索匹配,在更大的范圍內(nèi)對(duì)目標(biāo)裁判文書(shū)進(jìn)行檢索,從而得到更豐富的搜索結(jié)果即返回更多的目標(biāo)裁判文書(shū)提高了目標(biāo)裁判文書(shū)的召回率。
優(yōu)選地,在本申請(qǐng)實(shí)施例提供的裁判文書(shū)的搜索方法中,根據(jù)匹配詞集合進(jìn)行搜索匹配,得到目標(biāo)裁判文書(shū)和匹配序列包括:通過(guò)匹配詞集合中的各個(gè)匹配詞在候選裁判文書(shū)進(jìn)行搜索匹配,得到各個(gè)匹配詞對(duì)應(yīng)的目標(biāo)裁判文書(shū);獲取各個(gè)匹配詞中對(duì)應(yīng)同一目標(biāo)裁判文書(shū)的匹配詞;合并對(duì)應(yīng)同一目標(biāo)裁判文書(shū)的匹配詞,得到匹配結(jié)果詞集合;以及根據(jù)匹配結(jié)果詞集合,得到匹配序列。
在進(jìn)行搜索匹配時(shí),需要對(duì)全部的搜索關(guān)鍵詞和搜索關(guān)鍵詞的近義詞進(jìn)行裁判文書(shū)的匹配查詢(xún)。在匹配查詢(xún)過(guò)程中,系統(tǒng)首先查詢(xún)到每一個(gè)詞對(duì)應(yīng)的裁判文書(shū),然后將具有相同裁判文書(shū)ID的詞進(jìn)行合并,即可以得到每一篇目標(biāo)裁判文書(shū)的匹配詞集合。
例如,搜索關(guān)鍵詞為A、B、C、D等,搜索關(guān)鍵詞A的近義詞為a1,a2,a3……,搜索關(guān)鍵詞B的近義詞為b1,b2,b3……,等等。對(duì)某一裁判文書(shū)進(jìn)行匹配時(shí),匹配到三個(gè)搜索關(guān)鍵詞A、B、D,并且匹配到A的近義詞a1、a3,B的近義詞b2,C的近義詞c4以及D的近義詞d3。對(duì)匹配到的搜索關(guān)鍵詞和搜索關(guān)鍵詞的近義詞進(jìn)行合并,即得到匹配序列為ABDa1a3b2c4d3。
步驟S103,根據(jù)匹配序列確定目標(biāo)裁判文書(shū)的相關(guān)性。
匹配序列由搜索關(guān)鍵詞和搜索關(guān)鍵詞的近義詞組成,通過(guò)對(duì)搜索關(guān)鍵詞和搜索關(guān)鍵詞的近義詞的權(quán)重值進(jìn)行區(qū)分,即突出搜索關(guān)鍵詞的貢獻(xiàn),同時(shí)兼顧搜索關(guān)鍵詞的近義詞的作用,從而確定出的目標(biāo)裁判文書(shū)的相關(guān)性,進(jìn)而達(dá)到提升返回相關(guān)程度的目標(biāo)裁判文書(shū)的效果。
本申請(qǐng)實(shí)施例提供的裁判文書(shū)的搜索方法,獲取匹配詞集合,其中,匹配詞集合中包含搜索查詢(xún)文本中的各個(gè)搜索關(guān)鍵詞和搜索關(guān)鍵詞的近義詞,匹配詞集合中的每個(gè)元素為一個(gè)匹配詞;根據(jù)匹配詞集合進(jìn)行搜索匹配,得到目標(biāo)裁判文書(shū)和匹配序列,其中,匹配序列是匹配詞集合匹配到目標(biāo)裁判文書(shū)后,由與目標(biāo)裁判文書(shū)匹配的匹配詞組成的序列;以及根據(jù)匹配序列確定目標(biāo)裁判文書(shū)的相關(guān)性,解決了相關(guān)技術(shù)中搜索到的目標(biāo)裁判文書(shū)的相關(guān)性不明確的問(wèn)題,對(duì)匹配序列中搜索關(guān)鍵詞和搜索關(guān)鍵詞的近義詞的權(quán)重值進(jìn)行區(qū)分,從而確定出目標(biāo)裁判文書(shū)的相關(guān)性,進(jìn)而達(dá)到提升返回相關(guān)程度的目標(biāo)裁判文書(shū)的效果。
圖2是根據(jù)本申請(qǐng)第二實(shí)施例的裁判文書(shū)的搜索方法的流程圖。圖2可以作為圖1所示實(shí)施例的一種優(yōu)選實(shí)施方式。如圖2所示,該方法包括以下步驟:
步驟S201,獲取匹配詞集合,其中,匹配詞集合中包含搜索查詢(xún)文本中的各個(gè)搜 索關(guān)鍵詞和搜索關(guān)鍵詞的近義詞,匹配詞集合中的每個(gè)元素為一個(gè)匹配詞。步驟S201同上述步驟S101,在此不再贅述。
步驟S202,根據(jù)匹配詞集合進(jìn)行搜索匹配,得到目標(biāo)裁判文書(shū)和匹配序列,其中,匹配序列是匹配詞集合匹配到目標(biāo)裁判文書(shū)后,由與目標(biāo)裁判文書(shū)匹配的匹配詞組成的序列。
步驟S202同上述步驟S102,在此不再贅述。
步驟S203,對(duì)匹配序列進(jìn)行拆分,得到由與目標(biāo)裁判文書(shū)匹配的匹配詞構(gòu)成的匹配詞組。
對(duì)匹配序列進(jìn)行拆分,得到由與目標(biāo)裁判文書(shū)匹配的匹配詞構(gòu)成的匹配詞組可依照下述兩個(gè)原則進(jìn)行:1,對(duì)于匹配到的某搜索關(guān)鍵詞并且匹配到搜索關(guān)鍵詞的近義詞的情況,應(yīng)當(dāng)將匹配詞組內(nèi)部按照搜索關(guān)鍵詞在前的方式排列。2,對(duì)于匹配到多個(gè)搜索關(guān)鍵詞的近義詞的情況,應(yīng)當(dāng)將各匹配到的搜索關(guān)鍵詞的近義詞按照在目標(biāo)裁判文書(shū)中出現(xiàn)的先后順序排列。
例如,匹配序列為ABDa1a3b2c4d3,對(duì)匹配序列進(jìn)行拆分,得到由與目標(biāo)裁判文書(shū)匹配的匹配詞構(gòu)成的匹配詞組為:{A,a1,a3}、{B,b2}、{c4}和{D,d3}。
步驟S204,計(jì)算匹配詞組的相關(guān)性數(shù)值。
對(duì)于匹配搜索而言,匹配到搜索關(guān)鍵詞則表示匹配搜索直接命中了目標(biāo)裁判文書(shū),而匹配到搜索關(guān)鍵詞的近義詞僅能夠表示匹配搜索近似的命中了目標(biāo)裁判文書(shū),因此,這兩種匹配雖然都屬于命中目標(biāo)裁判文書(shū),但是命中的程度是不同的。另外,如果一個(gè)匹配搜索包含有兩個(gè)不同的搜索關(guān)鍵詞的信息,那么一篇包含有全部這兩個(gè)搜索關(guān)鍵詞的信息的目標(biāo)裁判文書(shū),和一篇僅包含一個(gè)搜索關(guān)鍵詞的信息但覆蓋了搜索關(guān)鍵詞的近義詞的目標(biāo)裁判文書(shū),具有的匹配程度,相關(guān)性、相關(guān)程度也是不同的。因此需要根據(jù)搜索關(guān)鍵詞和搜索關(guān)鍵詞的近義詞計(jì)算匹配詞組的相關(guān)性數(shù)值。
可選地,本申請(qǐng)實(shí)施例提供的裁判文書(shū)的搜索方法,計(jì)算匹配詞組的相關(guān)性數(shù)值包括:獲取匹配詞組中每個(gè)匹配詞的位置信息;確定匹配詞組中每個(gè)匹配詞的位置信息對(duì)應(yīng)的權(quán)重值;根據(jù)匹配詞組中每個(gè)匹配詞的位置信息對(duì)應(yīng)的權(quán)重值、第一預(yù)設(shè)權(quán)重值和第二預(yù)設(shè)權(quán)重值計(jì)算匹配詞組中每個(gè)匹配詞的相關(guān)性數(shù)值,其中,第一預(yù)設(shè)權(quán)重值為搜索關(guān)鍵詞的預(yù)設(shè)權(quán)重值,第二預(yù)設(shè)權(quán)重值為搜索關(guān)鍵詞的近義詞的預(yù)設(shè)權(quán)重值;以及統(tǒng)計(jì)匹配詞組中每個(gè)匹配詞的相關(guān)性數(shù)值,得到匹配詞組的相關(guān)性數(shù)值。
例如,設(shè)匹配詞組中每個(gè)詞的基本貢獻(xiàn)值為1,根據(jù)該詞是否是搜索關(guān)鍵詞調(diào)整貢獻(xiàn)值:若匹配的詞為搜索關(guān)鍵詞,則對(duì)貢獻(xiàn)值乘以權(quán)重一(第一預(yù)設(shè)權(quán)重值),若匹 配的詞是搜索關(guān)鍵詞的近義詞,則貢獻(xiàn)值乘以權(quán)重二(第二預(yù)設(shè)權(quán)重值)。權(quán)重一和權(quán)重二分別表示搜索關(guān)鍵詞和搜索關(guān)鍵詞的近義詞對(duì)目標(biāo)裁判文書(shū)帶來(lái)的相關(guān)性因子,取值在0~1之間。即對(duì)于每一個(gè)匹配詞組,依次進(jìn)行遍歷,并按照順序(位置信息)對(duì)貢獻(xiàn)值乘以依次遞減的權(quán)重。一般情況下,遞減的權(quán)重策略包括定差遞減和定比遞減,對(duì)于定差遞減,若公差值為x,x的取值范圍為0~1之間,則第一個(gè)詞的權(quán)重為1,第二個(gè)詞的權(quán)重為1-x,第三個(gè)詞的權(quán)重為1-2x,若從第i個(gè)詞開(kāi)始,1-(i-1)x<0,則自第i個(gè)詞以后該匹配詞組的全部詞的調(diào)整因子都為0;對(duì)于定比遞減,若公比值為y,y的取值范圍為0~1之間,則第一個(gè)詞的權(quán)重為1,第二個(gè)詞的權(quán)重為y,第三個(gè)詞的權(quán)重為y^2,以此類(lèi)推。因此,匹配詞組中每一個(gè)詞的權(quán)重=詞的貢獻(xiàn)因子*詞序的貢獻(xiàn)因子。詞序的貢獻(xiàn)因子根據(jù)定差遞減或定比遞減確定。統(tǒng)計(jì)每一篇目標(biāo)裁判文書(shū)的匹配詞組中每個(gè)匹配詞的相關(guān)性數(shù)值,得到每一篇目標(biāo)裁判文書(shū)的匹配詞組的相關(guān)性數(shù)值。
步驟S205,根據(jù)匹配詞組的相關(guān)性數(shù)值計(jì)算目標(biāo)裁判文書(shū)的相關(guān)性數(shù)值。
根據(jù)上述計(jì)算出的匹配詞組的相關(guān)性數(shù)值,確定每一篇目標(biāo)裁判文書(shū)的相關(guān)性數(shù)值。
步驟S206,根據(jù)目標(biāo)裁判文書(shū)的相關(guān)性數(shù)值確定目標(biāo)裁判文書(shū)的相關(guān)性。
本申請(qǐng)實(shí)施例提供的裁判文書(shū)的搜索方法,獲取匹配詞集合,其中,匹配詞集合中包含搜索查詢(xún)文本中的各個(gè)搜索關(guān)鍵詞和搜索關(guān)鍵詞的近義詞,匹配詞集合中的每個(gè)元素為一個(gè)匹配詞;根據(jù)匹配詞集合進(jìn)行搜索匹配,得到目標(biāo)裁判文書(shū)和匹配序列,其中,匹配序列是匹配詞集合匹配到目標(biāo)裁判文書(shū)后,由與目標(biāo)裁判文書(shū)匹配的匹配詞組成的序列;對(duì)匹配序列進(jìn)行拆分,得到由與目標(biāo)裁判文書(shū)匹配的匹配詞構(gòu)成的匹配詞組;計(jì)算匹配詞組的相關(guān)性數(shù)值;根據(jù)匹配詞組的相關(guān)性數(shù)值計(jì)算目標(biāo)裁判文書(shū)的相關(guān)性數(shù)值;以及根據(jù)目標(biāo)裁判文書(shū)的相關(guān)性數(shù)值確定目標(biāo)裁判文書(shū)的相關(guān)性。解決了相關(guān)技術(shù)中搜索到的目標(biāo)裁判文書(shū)的相關(guān)性不明確的問(wèn)題,對(duì)匹配序列中搜索關(guān)鍵詞和搜索關(guān)鍵詞的近義詞的權(quán)重值進(jìn)行區(qū)分,從而確定出目標(biāo)裁判文書(shū)的相關(guān)性,進(jìn)而達(dá)到提升返回相關(guān)程度的目標(biāo)裁判文書(shū)的效果。
可選地,在本申請(qǐng)實(shí)施例提供的裁判文書(shū)的搜索方法中,根據(jù)目標(biāo)裁判文書(shū)的相關(guān)性數(shù)值確定目標(biāo)裁判文書(shū)的相關(guān)性之后,該方法還包括:根據(jù)目標(biāo)裁判文書(shū)的相關(guān)性數(shù)值對(duì)目標(biāo)裁判文書(shū)的相關(guān)性進(jìn)行排序,得到排序后的目標(biāo)裁判文書(shū);以及按照排序后的目標(biāo)裁判文書(shū)的次序,對(duì)排序后的目標(biāo)裁判文書(shū)進(jìn)行顯示。
通過(guò)對(duì)目標(biāo)裁判文書(shū)的相關(guān)性進(jìn)行排序,按照排序后的目標(biāo)裁判文書(shū)的次序,對(duì)排序后的目標(biāo)裁判文書(shū)進(jìn)行顯示。不僅明確了目標(biāo)裁判文書(shū)的相關(guān)性,還按照目標(biāo)裁 判文書(shū)的相關(guān)性進(jìn)行顯示,提高了用戶(hù)的體驗(yàn)度。
需要說(shuō)明的是,在附圖的流程圖示出的步驟可以在諸如一組計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。
本申請(qǐng)實(shí)施例還提供了一種裁判文書(shū)的搜索裝置,需要說(shuō)明的是,本申請(qǐng)實(shí)施例的裁判文書(shū)的搜索裝置可以用于執(zhí)行本申請(qǐng)實(shí)施例所提供的用于裁判文書(shū)的搜索方法。以下對(duì)本申請(qǐng)實(shí)施例提供的裁判文書(shū)的搜索裝置進(jìn)行介紹。
圖3是根據(jù)本申請(qǐng)實(shí)施例的裁判文書(shū)的搜索裝置的示意圖。如圖3所示,該裝置包括:獲取單元10、搜索單元20和確定單元30。
獲取單元10,用于獲取匹配詞集合,其中,匹配詞集合中包含搜索查詢(xún)文本中的各個(gè)搜索關(guān)鍵詞和搜索關(guān)鍵詞的近義詞,匹配詞集合中的每個(gè)元素為一個(gè)匹配詞。
搜索單元20,用于根據(jù)匹配詞集合進(jìn)行搜索匹配,得到目標(biāo)裁判文書(shū)和匹配序列,其中,匹配序列是匹配詞集合匹配到目標(biāo)裁判文書(shū)后,由與目標(biāo)裁判文書(shū)匹配的匹配詞組成的序列。
確定單元30,用于根據(jù)匹配序列確定目標(biāo)裁判文書(shū)的相關(guān)性。
本申請(qǐng)實(shí)施例提供的裁判文書(shū)的搜索裝置,由于包括獲取單元10獲取匹配詞集合,其中,匹配詞集合中包含搜索查詢(xún)文本中的各個(gè)搜索關(guān)鍵詞和搜索關(guān)鍵詞的近義詞,匹配詞集合中的每個(gè)元素為一個(gè)匹配詞;搜索單元20根據(jù)匹配詞集合進(jìn)行搜索匹配,得到目標(biāo)裁判文書(shū)和匹配序列,其中,匹配序列是匹配詞集合匹配到目標(biāo)裁判文書(shū)后,由與目標(biāo)裁判文書(shū)匹配的匹配詞組成的序列;確定單元30根據(jù)匹配序列確定目標(biāo)裁判文書(shū)的相關(guān)性,解決了相關(guān)技術(shù)中搜索到的目標(biāo)裁判文書(shū)的相關(guān)性不明確的問(wèn)題,通過(guò)確定單元30對(duì)匹配序列中搜索關(guān)鍵詞和搜索關(guān)鍵詞的近義詞的權(quán)重值進(jìn)行區(qū)分,從而確定出目標(biāo)裁判文書(shū)的相關(guān)性,進(jìn)而達(dá)到提升返回相關(guān)程度的目標(biāo)裁判文書(shū)的效果。
可選地,為了提升根據(jù)匹配序列確定目標(biāo)裁判文書(shū)的相關(guān)性的準(zhǔn)確性,在本申請(qǐng)實(shí)施例提供的裁判文書(shū)的搜索裝置中,確定單元30包括:拆分模塊,用于對(duì)匹配序列進(jìn)行拆分,得到由與目標(biāo)裁判文書(shū)匹配的匹配詞構(gòu)成的匹配詞組;第一計(jì)算模塊,用于計(jì)算匹配詞組的相關(guān)性數(shù)值;第二計(jì)算模塊,用于根據(jù)匹配詞組的相關(guān)性數(shù)值計(jì)算目標(biāo)裁判文書(shū)的相關(guān)性數(shù)值;以及確定模塊,用于根據(jù)目標(biāo)裁判文書(shū)的相關(guān)性數(shù)值確定目標(biāo)裁判文書(shū)的相關(guān)性。
可選地,為了提升計(jì)算匹配詞組的相關(guān)性數(shù)值的準(zhǔn)確性,在本申請(qǐng)實(shí)施例提供的裁判文書(shū)的搜索裝置中,第一計(jì)算模塊包括:獲取子模塊,用于獲取匹配詞組中每個(gè) 匹配詞的位置信息;確定子模塊,用于確定匹配詞組中每個(gè)匹配詞的位置信息對(duì)應(yīng)的權(quán)重值;計(jì)算子模塊,用于根據(jù)匹配詞組中每個(gè)匹配詞的位置信息對(duì)應(yīng)的權(quán)重值、第一預(yù)設(shè)權(quán)重值和第二預(yù)設(shè)權(quán)重值計(jì)算匹配詞組中每個(gè)匹配詞的相關(guān)性數(shù)值,其中,第一預(yù)設(shè)權(quán)重值為搜索關(guān)鍵詞的預(yù)設(shè)權(quán)重值,第二預(yù)設(shè)權(quán)重值為搜索關(guān)鍵詞的近義詞的預(yù)設(shè)權(quán)重值;以及統(tǒng)計(jì)子模塊,用于統(tǒng)計(jì)匹配詞組中每個(gè)匹配詞的相關(guān)性數(shù)值,得到匹配詞組的相關(guān)性數(shù)值。
可選地,為了提升用戶(hù)的體驗(yàn)度,在本申請(qǐng)實(shí)施例提供的裁判文書(shū)的搜索裝置中,該裝置還包括:排序單元,用于根據(jù)目標(biāo)裁判文書(shū)的相關(guān)性數(shù)值對(duì)目標(biāo)裁判文書(shū)的相關(guān)性進(jìn)行排序,得到排序后的目標(biāo)裁判文書(shū);以及顯示單元,用于按照排序后的目標(biāo)裁判文書(shū)的次序,對(duì)排序后的目標(biāo)裁判文書(shū)進(jìn)行顯示。
可選地,在本申請(qǐng)實(shí)施例提供的裁判文書(shū)的搜索裝置中,搜索單元20包括:匹配模塊,用于通過(guò)匹配詞集合中的各個(gè)匹配詞在候選裁判文書(shū)進(jìn)行搜索匹配,得到各個(gè)匹配詞對(duì)應(yīng)的目標(biāo)裁判文書(shū);第一獲取模塊,用于獲取各個(gè)匹配詞中對(duì)應(yīng)同一目標(biāo)裁判文書(shū)的匹配詞;合并模塊,用于合并對(duì)應(yīng)同一目標(biāo)裁判文書(shū)的匹配詞,得到匹配結(jié)果詞集合;以及第二獲取模塊,用于根據(jù)匹配結(jié)果詞集合,得到匹配序列。
所述裁判文書(shū)的搜索裝置包括處理器和存儲(chǔ)器,上述獲取單元、搜索單元、確定單元等均作為程序單元存儲(chǔ)在存儲(chǔ)器中,由處理器執(zhí)行存儲(chǔ)在存儲(chǔ)器中的上述程序單元來(lái)實(shí)現(xiàn)相應(yīng)的功能。
處理器中包含內(nèi)核,由內(nèi)核去存儲(chǔ)器中調(diào)取相應(yīng)的程序單元。內(nèi)核可以設(shè)置一個(gè)或以上,通過(guò)調(diào)整內(nèi)核參數(shù)來(lái)完成對(duì)相關(guān)裁判文書(shū)的搜索。
存儲(chǔ)器可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲(chǔ)器,隨機(jī)存取存儲(chǔ)器(RAM)和/或非易失性?xún)?nèi)存等形式,如只讀存儲(chǔ)器(ROM)或閃存(flash RAM),存儲(chǔ)器包括至少一個(gè)存儲(chǔ)芯片。
本申請(qǐng)還提供了一種計(jì)算機(jī)程序產(chǎn)品,當(dāng)在數(shù)據(jù)處理設(shè)備上執(zhí)行時(shí),適于執(zhí)行初始化有如下方法步驟的程序代碼:獲取匹配詞集合,其中,匹配詞集合中包含搜索查詢(xún)文本中的各個(gè)搜索關(guān)鍵詞和搜索關(guān)鍵詞的近義詞,匹配詞集合中的每個(gè)元素為一個(gè)匹配詞;根據(jù)匹配詞集合進(jìn)行搜索匹配,得到目標(biāo)裁判文書(shū)和匹配序列,其中,匹配序列是匹配詞集合匹配到目標(biāo)裁判文書(shū)后,由與目標(biāo)裁判文書(shū)匹配的匹配詞組成的序列;以及根據(jù)匹配序列確定目標(biāo)裁判文書(shū)的相關(guān)性。
需要說(shuō)明的是,對(duì)于前述的各方法實(shí)施例,為了簡(jiǎn)單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本申請(qǐng)并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本申請(qǐng),某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù) 人員也應(yīng)該知悉,說(shuō)明書(shū)中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本申請(qǐng)所必須的。
在上述實(shí)施例中,對(duì)各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒(méi)有詳述的部分,可以參見(jiàn)其他實(shí)施例的相關(guān)描述。
在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的裝置,可通過(guò)其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。
所述作為分離部件說(shuō)明的單元可以是或者也可以不是物理上分開(kāi)的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上。可以根據(jù)實(shí)際的需要選擇其中的部分或者全部單元來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。
另外,在本申請(qǐng)各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以?xún)蓚€(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。
顯然,本領(lǐng)域的技術(shù)人員應(yīng)該明白,上述的本申請(qǐng)的各模塊或各步驟可以用通用的計(jì)算裝置來(lái)實(shí)現(xiàn),它們可以集中在單個(gè)的計(jì)算裝置上,或者分布在多個(gè)計(jì)算裝置所組成的網(wǎng)絡(luò)上,可選地,它們可以用計(jì)算裝置可執(zhí)行的程序代碼來(lái)實(shí)現(xiàn),從而,可以將它們存儲(chǔ)在存儲(chǔ)裝置中由計(jì)算裝置來(lái)執(zhí)行,或者將它們分別制作成各個(gè)集成電路模塊,或者將它們中的多個(gè)模塊或步驟制作成單個(gè)集成電路模塊來(lái)實(shí)現(xiàn)。這樣,本申請(qǐng)不限制于任何特定的硬件和軟件結(jié)合。
以上所述僅為本申請(qǐng)的優(yōu)選實(shí)施例,并不用于限制本申請(qǐng),對(duì)于本領(lǐng)域的技術(shù)人員來(lái)說(shuō),本申請(qǐng)可以有各種更改和變化。凡在本申請(qǐng)的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本申請(qǐng)的保護(hù)范圍之內(nèi)。