欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于戶籍信息數(shù)據(jù)的親屬關(guān)系分析方法

文檔序號:10489048閱讀:524來源:國知局
一種基于戶籍信息數(shù)據(jù)的親屬關(guān)系分析方法
【專利摘要】本發(fā)明提供一種基于戶籍信息數(shù)據(jù)的親屬關(guān)系分析方法,包括以下步驟:步驟S1:將親屬關(guān)系中的基礎(chǔ)類關(guān)系用字母和數(shù)字字符進行編碼,獲得基礎(chǔ)類關(guān)系的字符編碼集;步驟S2:約定連接符號,其是連接所述基礎(chǔ)類關(guān)系對應(yīng)的字符編碼的符號;以及約定正向關(guān)系及逆向關(guān)系,將已知的親屬關(guān)系定義為正向關(guān)系,與正向關(guān)系相對的另一個關(guān)系定義為逆向關(guān)系;步驟S3:根據(jù)待分析親屬關(guān)系的數(shù)據(jù),通過所述字符編碼和所述連接符號、逆向關(guān)系獲得表示所述待分析親屬關(guān)系的字符串;步驟S4:根據(jù)化簡規(guī)則對所述字符串化簡,獲得長度小于等于原字符串的新字符串;以及步驟S5:根據(jù)匹配規(guī)則對化簡后的新字符串進行字符串匹配,獲得待分析親屬關(guān)系的分析結(jié)果。
【專利說明】
一種基于戶籍信息數(shù)據(jù)的親屬關(guān)系分析方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及智能信息處理技術(shù),特別涉及基于戶籍信息數(shù)據(jù)的親屬關(guān)系的編碼和 分析方法。
【背景技術(shù)】
[0002] 對家庭關(guān)系網(wǎng)的數(shù)據(jù)挖掘技術(shù)應(yīng)用在案件偵破、銀行征信、反欺詐分析、金融風(fēng)險 評估等關(guān)系公共安全和經(jīng)濟民生的諸多領(lǐng)域。戶籍信息數(shù)據(jù)主要由居民家庭信息、居民個 人信息以及與戶籍變動記錄幾部分組成,為家庭關(guān)系網(wǎng)絡(luò)分析提供了優(yōu)質(zhì)數(shù)據(jù)。居民戶籍 信息數(shù)據(jù)(以下簡稱戶籍?dāng)?shù)據(jù))的內(nèi)容示意圖如表1所示,包括了:家庭識別編號(以下簡稱 "戶號ID")是居民所在家庭的標識;居民個人身份識別編號(簡稱"人員ID")是個體識別標 識,個人信息包括姓名、性別、出生日期、人員ID與戶主人員ID的親屬關(guān)系(以下簡稱"與戶 主關(guān)系")等。為了便于記錄關(guān)系數(shù)據(jù),戶籍信息系統(tǒng)中對90余類關(guān)系用2~99的整數(shù)進行數(shù) 字化編碼,如表2所示。
[0007] 表2.戶籍?dāng)?shù)據(jù)關(guān)系數(shù)字化編碼表(部分內(nèi)容)
[0008] 目前,戶籍?dāng)?shù)據(jù)記錄了以戶主人員為中心,其他家庭成員與戶主的單向的關(guān)系數(shù) 據(jù)。但是,當(dāng)需要調(diào)查戶主與其他成員、非戶主成員彼此間的相互關(guān)系時,超出了戶籍?dāng)?shù)據(jù) 記錄內(nèi)容,無法根據(jù)戶籍?dāng)?shù)據(jù)獲得。以表1為例,戶籍?dāng)?shù)據(jù)中記錄的關(guān)系信息包括:
[0009] 【張妻】與【張戶主】的親屬關(guān)系為【妻】,即【張妻】是【張戶主】的【妻】;
[0010] 【張子】與【張戶主】的親屬關(guān)系為【子】,即【張子】是【張戶主】的【子】;
[0011] 表1隱含的潛在關(guān)系信息包括:
[0012] 1.戶主與其他成員關(guān)系,比如:
[0013] 【張戶主】與【張妻】的親屬關(guān)系為【夫】;
[0014] 【張戶主】與【張子】的親屬關(guān)系為【父】;
[0015] 2.非戶主成員之間的關(guān)系,比如:
[0016] 【張子】與【張妻】的親屬關(guān)系為【子】;
[0017] 【張妻】與【張子】的親屬關(guān)系為【母】;
[0018] 但是,上述潛在的關(guān)系無法根據(jù)戶籍?dāng)?shù)據(jù)直接查詢。
[0019] 如表2所示,為了描述關(guān)系類數(shù)據(jù),稱謂所使用的數(shù)字化編碼超過了90個,即便如 此仍然只能表示有限的常用稱謂,超出的部分無法登記。增加稱謂以及對應(yīng)的數(shù)字編碼,充 實親屬關(guān)系稱謂表內(nèi)容,無論在設(shè)計還是使用都會更加不方便。

【發(fā)明內(nèi)容】

[0020] 本發(fā)明的目的是改進現(xiàn)有戶籍?dāng)?shù)據(jù)中戶籍信息中描述親屬關(guān)系類數(shù)據(jù)的數(shù)字編 碼方法,針對目前使用的戶籍信息中親屬關(guān)系類數(shù)據(jù)可計算性差,無法發(fā)掘潛在親屬關(guān)系 的問題,提供一種基于戶籍信息數(shù)據(jù)親屬關(guān)系的字符編碼,通過字符串操作實現(xiàn)化簡和匹 配,分析潛在親屬關(guān)系的方法。
[0021] 本發(fā)明的一種基于戶籍信息數(shù)據(jù)的親屬關(guān)系分析方法,包括如下步驟:步驟SI:將 親屬關(guān)系中的基礎(chǔ)類關(guān)系用字母和數(shù)字字符進行編碼,獲得基礎(chǔ)類關(guān)系的字符編碼集;步 驟S2:約定連接符號,其是連接所述基礎(chǔ)類關(guān)系對應(yīng)的字符編碼的符號;以及約定正向關(guān)系 及逆向關(guān)系,將已知的親屬關(guān)系定義為正向關(guān)系,與正向關(guān)系相對的另一個關(guān)系定義為逆 向關(guān)系;步驟S3:根據(jù)待分析親屬關(guān)系的數(shù)據(jù),通過所述字符編碼和所述連接符號、逆向關(guān) 系獲得表示所述待分析親屬關(guān)系的字符串;步驟S4:根據(jù)化簡規(guī)則對所述字符串化簡,獲得 長度小于等于原字符串的新字符串;以及步驟S5:根據(jù)匹配規(guī)則對化簡后的新字符串進行 字符串匹配,獲得待分析親屬關(guān)系的分析結(jié)果。
[0022]本發(fā)明的有益效果在于:
[0023] 通過本發(fā)明的方法,基于戶籍?dāng)?shù)據(jù)的親屬關(guān)系類型數(shù)據(jù)的單向關(guān)系數(shù)據(jù),實現(xiàn)關(guān) 系數(shù)據(jù)的累加和分析,可計算性好,能夠快速、有效地發(fā)掘和獲得潛在的親屬關(guān)系的關(guān)系網(wǎng) 絡(luò)。
【附圖說明】
[0024] 圖1是根據(jù)本發(fā)明的基于戶籍信息數(shù)據(jù)的親屬關(guān)系分析方法的流程圖。
[0025] 圖2是正向關(guān)系、逆向關(guān)系示意圖(以表1中數(shù)據(jù)為例)。
【具體實施方式】
[0026] 以下結(jié)合附圖對本發(fā)明進行詳細說明。以下實施例并不是對本發(fā)明的限制。在不 背離發(fā)明構(gòu)思的精神和范圍下,本領(lǐng)域技術(shù)人員能夠想到的變化和優(yōu)點都被包括在本發(fā)明 中。
[0027] 圖1是本發(fā)明的一種基于戶籍信息數(shù)據(jù)的親屬關(guān)系分析方法的流程圖。如圖1所 示,本發(fā)明通過親屬關(guān)系累加計算,可以實現(xiàn)計算機處理親屬類數(shù)據(jù)關(guān)系的目的,包括以下 具體步驟:
[0028] 首先是對將親屬關(guān)系中的基礎(chǔ)類關(guān)系用字母和數(shù)字字符進行編碼,獲得基礎(chǔ)類關(guān) 系的字符編碼集(步驟SI)。
[0029] 類似于數(shù)字可以用0-9的阿拉伯?dāng)?shù)字來表示,將親屬關(guān)系中的基礎(chǔ)類關(guān)系的集合 用字母和數(shù)字字符進行編碼。組成基礎(chǔ)類關(guān)系的元素稱為基礎(chǔ)類關(guān)系元素。為了方便用戶 使用和計算機處理,將基礎(chǔ)類關(guān)系元素"父"用F標識、"母"用M標識。
[0030] 以分析戶籍?dāng)?shù)據(jù)應(yīng)用場景為例,基礎(chǔ)類關(guān)系集以及其對應(yīng)字符編碼集如表3所示:
[0033]表3.基礎(chǔ)類關(guān)系集以及對應(yīng)字符編碼集
[0034]字符編碼集可以根據(jù)應(yīng)用場景增加所用編碼字符的個數(shù)或者改變編碼具體符號。
[0035] 接下來,約定連接符號以及約定正向關(guān)系及逆向關(guān)系(步驟S2)。
[0036] 連接符號是用于連接所述基礎(chǔ)類關(guān)系對應(yīng)的字符編碼的符號,體現(xiàn)相鄰關(guān)系字符 的某種邏輯關(guān)系,也是編碼字符串的切分標識。連接符號包括:關(guān)系累加符號、關(guān)系并列符 號和關(guān)系等價符號。以分析戶籍?dāng)?shù)據(jù)為例:
[0037] 關(guān)系累加符號(用"+"表示),表示相鄰字符是累加的關(guān)系。(字符1) + (字符2)表示 (基礎(chǔ)類關(guān)系1)的(基礎(chǔ)類關(guān)系2)。例如:父親的父親,記成F+F。
[0038]關(guān)系編碼字符并列符號(用"&"表示),表示相鄰字符是并列的關(guān)系。(字符1)&(字 符2)表示(基礎(chǔ)類關(guān)系1)或(基礎(chǔ)類關(guān)系2)。例如:姐姐或妹妹,記成j&m。
[0039]關(guān)系字符串并列符號(用";"表示),表示相鄰字符串是并列關(guān)系,與上述&區(qū)別在 于分號V'表示字符串并列,"&"表示字符并列。
[0040] 關(guān)系等價符號(用"="表示),表示兩端親屬關(guān)系邏輯是相互等價的。比如父=F, 祖父= F+F。
[0041] 可以根據(jù)需要增加或者替換關(guān)系字符集所使用字符以及關(guān)系連接符號。
[0042] 通常戶籍信息中記錄的關(guān)系數(shù)據(jù)是單向的,親屬關(guān)系(或稱謂)總是成對出現(xiàn),為 了方便表示相互關(guān)系,約定正向關(guān)系及逆向關(guān)系,即將已知的親屬關(guān)系定義為正向關(guān)系,與 正向關(guān)系相對的另一個關(guān)系定義為逆向關(guān)系。例如:已知【張子】指向【張戶主】的關(guān)系是 【子】,按照上述人為約定將【張子】指向【張戶主】的關(guān)系視為正向關(guān)系,【張戶主】指向【張 子】視為逆向關(guān)系。
[0043] 根據(jù)即的起點人員(正向關(guān)系中被指向人員)的性別,逆向關(guān)系進一步分成"逆向 男"和"逆向女"兩類。例如逆向關(guān)系起點人員【張戶主】為男性,則【張戶主】指向【張子】的關(guān) 系是【父】;如果【張戶主】是女性,則【張戶主】指向【張子】的關(guān)系是【母】。
[0044] 下一步,根據(jù)待分析親屬關(guān)系的數(shù)據(jù),通過前述步驟Sl和步驟S2定義的字符編碼 和連接符號、逆向關(guān)系獲得表示該待分析親屬關(guān)系的字符串(步驟S3)。該字符串通過連接 符號將待分析親屬關(guān)系路徑中相鄰節(jié)點之間關(guān)系對應(yīng)的字符編碼依次連接而獲得。例如, 字符串"F+Γ作為字符編碼表達式表示父親的父親,即祖父。
[0045] 如何獲得待分析親屬關(guān)系的字符串將在下文的【具體實施方式】中進一步詳細說明。
[0046] 接下來,根據(jù)化簡規(guī)則對所述字符串化簡,獲得長度小于等于原字符串的新字符 串(步驟S4)。
[0047] 原字符串和新字符串表示的親屬邏輯關(guān)系不變。例如:M+H表示母親的丈夫等價于 父親F,新編碼F字符長度小于M+H字符串長度。編碼化簡是等價的親屬關(guān)系編碼字符串之間 的映射關(guān)系。
[0048] 這里的化簡規(guī)則是根據(jù)步驟Sl和步驟S2定義的字符編碼和連接符號、關(guān)系而設(shè)定 的。具體地,在字符編碼集合中選擇兩個編碼字符用+連接,如果累加結(jié)果(步驟S3獲得的字 符串)能夠被化簡,將該纟目合與其化簡結(jié)里對應(yīng)"例如衷5所示:

[0050] 表5化簡規(guī)則(部分)
[0051] 最后,根據(jù)匹配規(guī)則對化簡后的字符串進行字符串掃描查找并替換,獲得待分析 親屬關(guān)系的分析結(jié)果,即該親屬關(guān)系的稱謂(步驟S5)。
[0052] 這里的編碼匹配是根據(jù)步驟Sl和步驟S2定義的字符編碼和連接符號、關(guān)系而設(shè)定 的,是將化簡后的字符串對應(yīng)關(guān)系稱謂的映射關(guān)系的解碼過程。例如:將編碼F+F映射到關(guān) 系稱謂"祖父",F(xiàn)+F =祖父,稱為編碼字符串F+F匹配為稱謂祖父。
[0053]具體地,匹配規(guī)則即編碼字符、不同組合的字符串與親屬關(guān)系稱謂映射關(guān)系如表6 所示。
LUUDDj 衣 OIZkK 規(guī)則〈邯
[0056]本發(fā)明中,上述步驟S3、S4和S5可以通過字典來實現(xiàn)。當(dāng)然,本領(lǐng)域的技術(shù)人員也 可以根據(jù)本發(fā)明提出的方案用其他已知的方式/手段來實現(xiàn)。本文中所述的字典是指"字典 函數(shù)",計算機處理查表類任務(wù)時通常借助"字典函數(shù)"(以下簡稱"字典")來實現(xiàn)輸入索引 值(通常稱為字典的key),得到返回值(通常稱為字典的value)的映射操作。不同程序語言 實現(xiàn)字典的方法略有差別。僅以Python編程語言為例,說明創(chuàng)建并使用字典的流程:
[0057] 1.編寫待查表數(shù)據(jù),并保存文檔。以表2的內(nèi)容為例,創(chuàng)建空白文檔,輸入數(shù)據(jù):
[0058] relation,num
[0059] 戶主,2
[0060] 配偶,10
[0061] 夫,11
[0062] 妻,12
[0063] ……,……
[0064] 女婿,28
[0065] 其他子,29
[0066] ……,……
[0067] 其他,99
[0068] 逗號分隔值(Comma-Separated Values)csv文檔中每一行是一組key,value值,用 逗號分隔。第一行是列的名稱,比如relation,num。全部輸入完成后,以后綴.csv格式保存 數(shù)據(jù)文檔,例如保存為dict_data. csv。
[0069] 2.讀取待查表數(shù)據(jù)文檔并生成字典,以Python編程語言為例,定義生成字典函數(shù) createDict(dataFi IeName ,keyCol ,valueCol ),新建dataDict字典,將兩列num和relation 分別設(shè)置為字典的key和value,見代碼模塊1: imporlfunclools dc Ic rca Ic D i cl( daUi F i I cN ani c, 1< eyCo I, v ai u cC o i): kcy=Iist( dataFrilcNanic [keyCol j).aslypc(inl))
[0070] value=!ist(dauiFilcNamc [valueCol]) dataDict =dict(zip(kcy,value)) rclurndalaDict daUiDiet =creal.cDict('''dici_dala.csv","iutm",''relation")
[0071 ] 代碼模塊I讀取字典映射關(guān)系dict_data. csv并生成字典dataDict
[0072] 3使用字典,輸入查詢值得到返回值。
[0073] 例如查詢值(key) = 2,返回值(value)=戶主;查詢值(key) = 11,返回值(value) =夫。以Py thon編程語言為例:
[0074] dataDict[2]=戶主
[0075] dataDict[ll]=夫
[0076] 本實施例中,具體地,根據(jù)前述步驟Sl和步驟S2的定義和約定的字符編碼和連接 符號、關(guān)系進一步建立獲得映射關(guān)系表,即數(shù)字編碼至字符編碼的映射關(guān)系。根據(jù)該映射關(guān) 系可以創(chuàng)建字典,將在下文詳細描述。
[0077]具體地,映射關(guān)系表的創(chuàng)建可以利用現(xiàn)成的表2,在表2中創(chuàng)建列,名稱encoding, 記錄親屬關(guān)系reIation的字符編碼;倉ij建列,名稱reverse_male,記錄逆向男的字符編碼; 創(chuàng)建列,名稱reverse_female,將逆向女的字符編碼。如表4所示。

[0079]表4字符編碼映射關(guān)系(部分)
[0080] 根據(jù)前述映射關(guān)系創(chuàng)建字典,包括:創(chuàng)建編碼規(guī)則字典num2EnC〇dingDict,逆向關(guān) 系男編碼規(guī)則字典num2RevMaleDict,逆向關(guān)系女編碼規(guī)則字典num2RevFemaleDict。以及 創(chuàng)建化簡規(guī)則字典s imp I i fyD i c t,匹配規(guī)則字典mapp ingD i c t。
[0081]下面詳細介紹步驟S3中如何通過編碼規(guī)則字典獲得累加字符串。選擇待分析的起 點人員和終點人員,建立由起點人員指向終點人員的親屬關(guān)系數(shù)據(jù)路徑;戶籍?dāng)?shù)據(jù)中正向 關(guān)系的數(shù)字編碼形式,借助數(shù)字編碼至字符編碼規(guī)則字典num2En C〇dingDict,轉(zhuǎn)換成正向 關(guān)系字符編碼形式;根據(jù)逆向關(guān)系終點人員性別選擇逆向關(guān)系編碼規(guī)則字典 num2RevMaleDict(逆向男)和num2RevFemaleDict(逆向女),轉(zhuǎn)換成逆向關(guān)系的字符編碼形 式;通過前述定義的連接符號連接字符編碼得到親屬關(guān)系路徑的相鄰節(jié)點之間雙向關(guān)系的 累加編碼字符串。具體步驟包括:
[0082]步驟3.1,利用編碼規(guī)則字典,根據(jù)正向關(guān)系數(shù)字編碼得到正向關(guān)系字符編碼。類 比表示有向線段方法,由起點對旨向終點Y的字符編碼記為XY。數(shù)字編碼η作為編碼規(guī)則字典 key,返回與數(shù)字η相應(yīng)的關(guān)系字符編碼Ζ。例如:ΧΥ =編碼規(guī)則字典[η] =Ζ,即起點X與終點Y 字符編碼為Z。
[0083] 例如如圖2所示利用表1中數(shù)據(jù),正向關(guān)系NiQ()iNi()()2,與戶主關(guān)系數(shù)字編碼12,在編 碼規(guī)則字典中輸入key值12,有num2EncodingDict[12]=W,即N1QQ1N 1QQ2 = W;正向關(guān)系 NiooiNiQtB,與戶主關(guān)系數(shù)字編碼20,num2EncodingDict [20]= z,即:NiQQiNiQra = z。
[0084] 步驟3.2,根據(jù)逆向關(guān)系起點性別男(女)性,利用逆向男(女)編碼規(guī)則字典,輸入 key為關(guān)系數(shù)字編碼,得到相應(yīng)的逆向關(guān)系表達式。
[0085] 如圖2所示,所示利用表1中數(shù)據(jù),圖中實心圖形表示家庭成員,其中圓形用來戶主 N1001,矩形表示非戶主成員N臓和Ν·3。實線表示正向關(guān)系,即已知關(guān)系數(shù)據(jù)。虛線表示逆向 關(guān)系。
[0086] 例如如圖2所不,NlQt^NlQQl是NlQQlNl()()2逆向關(guān)系字符編碼,NlQt^NlQQl的終點NlQQl為男 性,與戶主關(guān)系數(shù)字編碼12,逆向男字典num2RevMaleDict[ 12] =HJPNiqq2Niqqi = H; N1003N1QQI是NlQQlNlQra逆向編碼,NioraNlQQl的終點NlQQl為男性,與戶主關(guān)系數(shù)字編碼20,逆向男 字典 num2RevMaleDict[20] =F,即NioraNiQQi = F;
[0087] 步驟3.3,選擇起點人員和終點人員,連接起點指向終點的路徑,沿路徑方向相鄰 節(jié)點的編碼順次連接得到累加編碼(字符串)。例如選擇起點N i指向終點1,假設(shè)Ni+1…… 表示連接起點Ni和終點1路徑的相鄰點,起點Ni指向終點1的累加編碼NiN n表示成 由NiNi+1SNn-眞編碼字符串的累加(連接),即:
[0088] NiNn = NiNn-ι+Ni-iNi-2^-----i~Ni+j-iNi+jH-----ι~Νη-2Nn-ι+Νη-ιΝ η
[0089] 編碼累加操作規(guī)則:
[0090] +表示是親屬關(guān)系的累加,對應(yīng)編碼字符串的連接操作;
[0091] 編碼字符串中如果含有連接符&,表示&兩端的編碼字符屬于并列存在的關(guān)系,累 加規(guī)則是A+B&C+D = A+B+D;A+C+D,其中A、B、C和D都是編碼字符,表示A分別與并列關(guān)系B、C 累加之后再與D累加,根據(jù)累加規(guī)則A+B&C+D等價于累加編碼A+B+D與A+C+D的并列。例如:F+ j&m+H=F+j+H;F+m+H〇
[0092] 計算關(guān)系編碼NlQQ2Nl(X)3以及NlQQ3Nl(X)2,由圖2可知利用中間節(jié)點NlQQl,可獲得字符串 H+z及H+z,具體過程如下:
[0093] N1002N1003 = Νιο〇2Νιοοι+ΝιοοιΝιο〇3 = H+z
[0094] N1003N1002 = Nio〇3Niooi+NiooiNio〇2=F+ff
[0095] 步驟S4是將步驟S3得到的累加編碼通過化簡規(guī)則字典進行編碼化簡,具體步驟包 括:
[0096] 步驟4.1,如果連接符號";"存在于累加編碼,以";"作為標記對累加編碼字符串進 行拆分,存儲成字符串?dāng)?shù)組(或列表)結(jié)構(gòu),比如F+j+H; F+m+H拆分為F+j+H和F+m+H;
[0097] 步驟4.2,對數(shù)組的子編碼字符串,從左向右掃描,依次將相鄰兩個編碼和連接符+ 作為檢查字符串。例如:H+z+W+j的檢查字符代碼依次為H+z,z+W和W+j。判斷檢查字符串是 否屬于化簡規(guī)則字典的key,如果屬于key得到相應(yīng)的value編碼,替換該檢查字符串,更新 累加編碼,重新從最左端開始掃描更新后字符串;如果不屬于key,則繼續(xù)判斷下一個檢查 字符代碼。直到全部檢查并更新完為止;
[0098] 步驟4.3,重復(fù)步驟4.2,掃描完數(shù)組的全部子編碼字符串;
[0099] 步驟4.4,返回化簡字符串?dāng)?shù)組(或列表),稱為化簡編碼數(shù)組(或列表)。經(jīng)過化簡 操作的關(guān)系編碼字符串稱為化簡編碼。
[0?00] 以累加編碼H+z+W+j為例說明編碼化簡過程:
[0101]連接符號;不存在,不需要進行拆分成字符串?dāng)?shù)組。檢查字符串H+z,將H+z作為化 簡規(guī)則字典的key,該key存在,simplifyDict[ 'H+z' ] = Z,用z替換H+z+W+j中的H+z,更新后 z+W+j;
[0102]從最左開始,檢查字符串Z+W,z+W作為化簡規(guī)則字典的key不存在;
[0103]繼續(xù)檢查字符串W+j,W+j作為化簡規(guī)則字典的key不存在;
[0104]停止檢查,得到化簡后字符串z+W+j。
[0105] 最后是步驟S5,將上述步驟4的化簡編碼(字符串?dāng)?shù)組或字符串列表)用匹配規(guī)則 字典進行解碼。
[0106] 首先說明代際指數(shù)。代際指數(shù)是用來指示編碼與參考人(比如戶主)的相對輩分的 數(shù)值,平輩指數(shù)為〇,年長一輩指數(shù)+1,低一輩指數(shù)-1。計算代際指數(shù)方法是:檢查編碼字符 串,每出現(xiàn)一次字符F或M,代際指數(shù)+1,每出現(xiàn)一次字符z或n,代際指數(shù)-1。
[0107] 例如計算編碼F+F的代際指數(shù)+1 + 1 =+2,表不年長2輩;編碼M+n代際指數(shù)+I-I = 0 表不平輩;j+z代際指數(shù)0-1 =_1,表不低一輩;
[0108]匹配具體包括以下步驟:
[0109]步驟5.1對化簡編碼進行正向最大匹配查找。具體分為:
[0110]步驟5.1.1,從上述步驟4得到的化簡編數(shù)組(或列表)中選擇每一個進行化簡,從 左向右掃描,添加通過+連接的編碼字符串作為檢查字符串,并判斷是否為匹配規(guī)則字典的 key。如果是key,則繼續(xù)向右增加檢查字符串;如果不是key,則將已經(jīng)得到的最長的檢查式 切分出去,將匹配規(guī)則字典的返回值作為一個稱謂,更新化簡編碼字符串。
[0111] 步驟5.1.2,繼續(xù)從左向右,重復(fù)步驟5.1.1直到全部字符串都匹配完成;
[0112] 步驟5.1.3,編碼匹配得到稱謂用"的"連接,表示關(guān)系遞進。計算每個稱謂的代際 指數(shù),以及代際指數(shù)的數(shù)學(xué)統(tǒng)計方差。
[0113] 以編碼 F+j+z+W+F 為例:
[0114]從左向右掃描,檢查編碼F,F(xiàn)是匹配規(guī)則字典的key(mappingDict[ "F" ]=父);檢 查F+j,F(xiàn)+j是匹配規(guī)則字典的key(mappingDict[ "F+j" ]=姑);檢查F+j+z,F(xiàn)+j+z是匹配規(guī) 則字典的key(mappingDict[ "F+j+z" ]=堂兄);繼續(xù)檢查F+j+z+W,F(xiàn)+j+z+W不再是匹配規(guī)則 字典的key,因此F+j+z是已經(jīng)找到最長的編碼字符串,將原編碼式F+j+z+W+F切分F+j+z,返 回一個稱謂"堂兄弟"。更新后編碼W+F,繼續(xù)從左向右檢查編碼W,W是匹配規(guī)則字典的key (mappingDict[ "W" ]=妻);繼續(xù)檢查W+F,是匹配規(guī)則字典的key(mappingDict[ "W+F0' ]=岳 父),編碼字符串全部匹配結(jié)束,因此返回第二個稱謂"岳父"。
[0115] 切分的編碼F+j+z的代際指數(shù)=+1+0-1 = 0 ;W+F的代際指數(shù)+0+1 = I J+j+z+W+F的 稱謂結(jié)果是"堂兄弟的岳父",稱謂的代際指數(shù)統(tǒng)計方差={(0-0.5)2+(1-0.5) 2}/2 = 0.25
[0116] 步驟5.2,與步驟5.1的操作類似,唯一區(qū)別是檢查方向從編碼末尾的最右向左檢 查。稱為逆向最大匹配查找。
[0117] 步驟5.3:如果步驟5.1正向最大匹配查找稱謂和步驟5.2逆向最大匹配查找稱謂 不一致,取代際指數(shù)最小的稱謂作為最終結(jié)果。如果一致,則取該一致的查找稱謂作為最終 結(jié)果。
[0118] 步驟5.4:對于代碼數(shù)組重復(fù)步驟5.1到5.2得到稱謂數(shù)組,用"或"連接不同的稱 謂,連接結(jié)果作為編碼數(shù)組的稱謂。
[0119] 顯然,本技術(shù)領(lǐng)域中的普通技術(shù)人員應(yīng)當(dāng)認識到,以上的實施例僅是用來說明本 發(fā)明,而并非用作為對本發(fā)明的限定,只要在本發(fā)明的實質(zhì)精神范圍內(nèi),對以上所述實施例 的變化、變型都將落在本發(fā)明的權(quán)利要求書范圍內(nèi)。
【主權(quán)項】
1. 一種基于戶籍信息數(shù)據(jù)的親屬關(guān)系分析方法,其特征在于,包括如下步驟: 步驟S1:將親屬關(guān)系中的基礎(chǔ)類關(guān)系用字母和數(shù)字字符進行編碼,獲得基礎(chǔ)類關(guān)系的 字符編碼集; 步驟S2:約定連接符號,其是連接所述基礎(chǔ)類關(guān)系對應(yīng)的字符編碼的符號;以及約定正 向關(guān)系及逆向關(guān)系,將已知的親屬關(guān)系定義為正向關(guān)系,與正向關(guān)系相對的另一個關(guān)系定 義為逆向關(guān)系; 步驟S3:根據(jù)待分析親屬關(guān)系的數(shù)據(jù),通過步驟S1和步驟S2中的所述字符編碼和所述 連接符號、正向關(guān)系、逆向關(guān)系形成表示所述待分析親屬關(guān)系的字符串; 步驟S4:根據(jù)化簡規(guī)則對所述字符串化簡,獲得長度小于等于原字符串的新字符串;以 及 步驟S5:根據(jù)匹配規(guī)則對化簡后的新字符串進行字符串匹配,獲得待分析親屬關(guān)系的 分析結(jié)果。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟S2中,所述連接符號包括:關(guān)系累加符 號、關(guān)系編碼字符并列符號、關(guān)系字符串并列符號和關(guān)系等價符號。3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,步驟S2中,逆向關(guān)系進一步包括"逆向男" 和"逆向女"兩類關(guān)系。4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,根據(jù)前述步驟S1和步驟S2定義和約定的字 符編碼和連接符號、關(guān)系進一步建立映射關(guān)系表,即數(shù)字編碼至字符編碼的映射關(guān)系,并根 據(jù)所述映射關(guān)系創(chuàng)建字典,包括編碼規(guī)則字典、化簡規(guī)則字典和匹配規(guī)則字典。5. 根據(jù)權(quán)利要求4所述的方法,其特征在于,步驟S3中,所述字符串利用所述編碼規(guī)則 字典通過所述連接符號將待分析親屬關(guān)系路徑中相鄰節(jié)點之間關(guān)系對應(yīng)的所述字符編碼 依次連接而獲得,其中,所述路徑為根據(jù)待分析的親屬關(guān)系數(shù)據(jù)建立的連接起點和終點的 路徑,起點Ni與終點化之間通過中間節(jié)點聯(lián)通,假設(shè)N i+1……Nn-2,Nh表示連接起點Ni和終點 Nn路徑中的相鄰節(jié)點,起點Ni指向終點化的編碼NiNn表示成NiNi+iSNnNn的編碼字符串的依 次連接: NiNn = NiNn-1+Ni-lNi-2^-----!~Ni+j-lNi+jH-----l~Nn-2Nn-l+Nn-lNn 〇6. 根據(jù)權(quán)利要求5所述的方法,其特征在于,步驟S4中的連接后的編碼字符串化簡操作 通過對所述化簡規(guī)則字典的查找和替換操作實現(xiàn)。7. 根據(jù)權(quán)利要求6所述的方法,其特征在于,步驟S4中,如果關(guān)系字符串并列符號存在 于所述字符串中,以并列符號作為標記對所述字符串進行拆分,存儲成字符串?dāng)?shù)組或列表 結(jié)構(gòu),然后再對所述數(shù)組或列表的子字符串進行化簡。8. 根據(jù)權(quán)利要求7所述的方法,其特征在于,步驟S5中,所述字符串匹配通過匹配規(guī)則 字典實現(xiàn),包括以下步驟: 步驟5.1:進行正向最大匹配; 步驟5.2:進行逆向最大匹配;以及 步驟5.3:如果正向最大匹配查找稱謂和逆向最大匹配查找稱謂不一致,則取代際指數(shù) 方差最小的稱謂作為最終稱謂結(jié)果。9. 根據(jù)權(quán)利要求8所述的方法,其特征在于,所述代際指數(shù)是用來指示編碼與參考人的 相對輩分的值,平輩指數(shù)為〇,年長一輩指數(shù)+1,低一輩指數(shù)-1。
【文檔編號】G06F17/30GK105843923SQ201610178705
【公開日】2016年8月10日
【申請日】2016年3月25日
【發(fā)明人】郝明瑞, 張如高, 彭莉, 張偉, 虞正華
【申請人】博康智能網(wǎng)絡(luò)科技股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
顺义区| 霍州市| 朝阳市| 延长县| 富源县| 丽水市| 板桥市| 宜川县| 七台河市| 颍上县| 鲁山县| 青铜峡市| 大冶市| 托里县| 永丰县| 兴业县| 民权县| 林芝县| 长武县| 周口市| 苗栗市| 南昌县| 同仁县| 盐城市| 宁海县| 安宁市| 武平县| 宝坻区| 英山县| 巨野县| 道孚县| 江津市| 新津县| 东源县| 临江市| 葫芦岛市| 阜城县| 侯马市| 沁源县| 漳州市| 仙游县|