一種確定用戶身份信息的方法及設備的制造方法
【技術領域】
[0001]本發(fā)明實施例涉及數(shù)據(jù)挖掘技術領域,尤其涉及一種確定用戶身份信息的方法及設備。
【背景技術】
[0002]隨著互聯(lián)網、移動互聯(lián)網技術的不斷發(fā)展,人們越來越頻繁的使用社交網絡和家人、同事、朋友進行溝通交流,社交網絡已經成為人們生活中不可分割的一部分,是人們獲取信息的重要媒體。用戶在社交網絡上所使用的注冊信息往往是虛擬的,比如用戶注冊的昵稱等。但是很多應用場景均需要確定出用戶的身份信息,比如,根據(jù)用戶的身份信息向用戶進行更精準的電商網站推薦,或者當用戶使用在社交網絡上虛擬的注冊信息在網上發(fā)布謠言、進行詐騙等犯罪活動時,根據(jù)確定出的該用戶的身份信息對該用戶進行抓捕。
[0003]現(xiàn)有技術中主要通過用戶自行填寫的方式獲取用戶的身份信息。具體來說,社交網絡在注冊頁面增加用戶的身份信息的填寫項,比如用戶的姓名、用戶所在單位、用戶的職位等等信息,用戶在該社交網絡上進行注冊時,用戶在注冊頁面自行填寫用戶的身份信息。但是在具體實施中,用戶會非常反感填寫此類身份信息,通常僅僅會填寫一些虛擬的信息,比如網名等?;蛘弋斣擃惿矸菪畔⒉皇潜靥铐棔r,用戶不進行填寫,有時,甚至由于該社交網絡需要填寫此類身份信息,用戶不使用該社交網絡。
[0004]綜上,亟需一種確定用戶身份信息的方法及設備,用于確定出用戶的身份信息。
【發(fā)明內容】
[0005]本發(fā)明實施例提供一種確定用戶身份信息的方法及設備,用于確定出用戶的身份?目息O
[0006]本發(fā)明實施例提供一種確定用戶身份信息的方法,包括:
[0007]獲取待處理用戶的社交網絡通訊錄,社交網絡通訊錄包括N個聯(lián)系人的標識信息;其中,N為大于等于I的整數(shù);
[0008]根據(jù)N個聯(lián)系人的標識信息,確定出N個聯(lián)系人中每個聯(lián)系人的社交網絡通訊錄;
[0009]從N個聯(lián)系人中每個聯(lián)系人的社交網絡通訊錄中,獲取為待處理用戶設置的M個備注用戶身份信息;M為小于等于N,且大于等于I的整數(shù);
[0010]根據(jù)M個備注用戶身份信息及預設的身份信息匹配庫,確定出待處理用戶的身份
?目息O
[0011]可選地,獲取待處理用戶的社交網絡通訊錄,具體包括:
[0012]在確定N大于聯(lián)系人數(shù)量閾值時,獲取待處理用戶的社交網絡通訊錄。
[0013]可選地,待處理用戶的身份信息至少包括待處理用戶的姓名;
[0014]根據(jù)M個備注用戶身份信息及預設的身份信息匹配庫,確定出待處理用戶的身份信息,具體包括:
[0015]針對M個備注用戶身份信息中的每個備注用戶身份信息,將每個備注用戶身份信息與身份信息匹配庫中的姓字段和名字段進行匹配;
[0016]將成功匹配出姓字段和名字段的備注用戶身份信息,確定為姓名備選信息;
[0017]根據(jù)所有姓名備選信息,確定待處理用戶的姓名。
[0018]可選地,待處理用戶的身份信息至少包括待處理用戶的姓名;
[0019]根據(jù)M個備注用戶身份信息及預設的身份信息匹配庫,確定出待處理用戶的身份信息,具體包括:
[0020]針對M個備注用戶身份信息中的每個備注用戶身份信息,將每個備注用戶身份信息與身份信息匹配庫中的姓字段進行匹配;
[0021]將成功匹配出姓字段的備注用戶身份信息,與身份信息匹配庫中的名字段進行匹配;
[0022]將成功匹配出名字段的備注用戶身份信息,確定為姓名備選信息;
[0023]根據(jù)所有姓名備選信息,確定待處理用戶的姓名。
[0024]可選地,將成功匹配出姓字段的備注用戶身份信息,與身份信息匹配庫中的名字段進行匹配,具體包括:
[0025]將成功匹配出姓字段的備注用戶身份信息中,與姓字段相匹配的姓之后的所有字段與身份信息匹配庫中的名字段進行匹配。
[0026]可選地,根據(jù)所有姓名備選信息,確定待處理用戶的姓名,具體包括:
[0027]針對所有姓名備選信息中的每個姓名備選信息,確定姓名備選信息中與身份信息匹配庫中的姓字段相匹配的姓,以及與身份信息匹配庫中的名字段中相匹配的名,將與身份信息匹配庫中的姓字段相匹配的姓和與身份信息匹配庫中的名字段中相匹配的名確定為姓名備信息對應的第一備選姓名;
[0028]統(tǒng)計各第一備選姓名的數(shù)量,將數(shù)量最多的第一備選姓名確定為第二備選姓名;
[0029]根據(jù)第二備選姓名,確定待處理用戶的姓名。
[0030]可選地,根據(jù)第二備選姓名,確定待處理用戶的姓名,具體包括:
[0031 ]將第二備選姓名確定為待處理用戶的姓名;或者
[0032]在確定第二備選姓名的數(shù)量在所有第一備選姓名的數(shù)量中占比大于第一姓名閾值時,則將第二備選姓名確定為待處理用戶的姓名;或者
[0033]在確定第二備選姓名的數(shù)量在所有第一備選姓名的數(shù)量中占比大于第一姓名閾值時,且第二備選姓名的數(shù)量與N的比值大于第二姓名閾值時,則將第二備選姓名確定為待處理用戶的姓名;其中,第一姓名閾值不小于第二姓名閾值。
[0034]可選地,根據(jù)M個備注用戶身份信息,確定出待處理用戶的身份信息之后,還包括:
[0035]獲取待處理用戶在與社交網絡通訊錄對應的社交網絡上的標識信息;
[0036]根據(jù)待處理用戶在社交網絡上的標識信息,確定出待處理用戶在與社交網絡有關聯(lián)的網絡上的標識信息;
[0037]根據(jù)待處理用戶在與社交網絡有關聯(lián)的網絡上的標識信息,獲取待處理用戶在與社交網絡有關聯(lián)的網絡上所輸入的身份信息,對確定出的待處理用戶的身份信息進行校驗。
[0038]可選地,根據(jù)M個備注用戶身份信息,確定出待處理用戶的身份信息之后,還包括:
[0039]調用存儲有待處理用戶的身份信息的網站接口,根據(jù)存儲的待處理用戶的身份信息,對確定出的待處理用戶的身份信息進行校驗。
[0040]可選地,獲取待處理用戶的社交網絡通訊錄,具體包括:
[0041]周期性獲取待處理用戶的社交網絡通訊錄;
[0042]根據(jù)M個備注用戶身份信息及預設的身份信息匹配庫,確定出待處理用戶的身份信息,具體包括:
[0043]根據(jù)M個備注用戶身份信息及預設的身份信息匹配庫,確定出當前周期內待處理用戶的身份信息;
[0044]根據(jù)M個備注用戶身份信息及預設的身份信息匹配庫,確定出待處理用戶的身份信息之后,還包括:
[0045]將待處理用戶的身份信息,與當前周期之前的周期內確定的待處理用戶的身份信息進行比對。
[0046]本發(fā)明實施例提供一種確定用戶身份信息的設備,包括:
[0047]獲取單元,用于獲取待處理用戶的社交網絡通訊錄,社交網絡通訊錄包括N個聯(lián)系人的標識信息;其中,N為大于等于I的整數(shù);
[0048]確定單元,用于根據(jù)N個聯(lián)系人的標識信息,確定出N個聯(lián)系人中每個聯(lián)系人的社交網絡通訊錄;從N個聯(lián)系人中每個聯(lián)系人的社交網絡通訊錄中,獲取為待處理用戶設置的M個備注用戶身份信息;M為小于等于N,且大于等于I的整數(shù);
[0049]處理單元,用于根據(jù)M個備注用戶身份信息及預設的身份信息匹配庫,確定出待處理用戶的身份信息。
[0050]本發(fā)明實施例提供一種確定用戶身份信息的方法,包括:
[0051]獲取待處理用戶的社交網絡通訊錄,社交網絡通訊錄包括N個聯(lián)系人的標識信息;其中,N為大于等于I的整數(shù);
[0052]根據(jù)N個聯(lián)系人的標識信息,確定出N個聯(lián)系人中每個聯(lián)系人的社交網絡通訊錄;
[0053]從N個聯(lián)系人中每個聯(lián)系人的社交網絡通訊錄中,獲取為待處理用戶設置的M個備注用戶身份信息;M為小于等于N,且大于等于I的整數(shù);
[0054]根據(jù)M個備注用戶身份信息及預設的身份信息匹配庫,確定出待處理用戶的身份
?目息O
[0055]可選地,待處理用戶的身份信息至少包括待處理用戶的社會屬性信息;
[0056]根據(jù)M個備注用戶身份信息及預設的身份信息匹配庫,確定出待處理用戶的身份信息,具體包括:
[0057]針對M個備注用戶身份信息中的每個備注用戶身份信息,將每個備注用戶身份信息與身份信息匹配庫中的社會屬性字段進行匹配;
[0058]將成功匹配出社會屬性字段的備注用戶身份信息,確定為社會屬性備選信息;
[0059]根據(jù)所有社會屬性備選信息,確定待處理用戶的社會屬性信息。
[0060]可選地,針對M個備注用戶身份信息中的每個備注用戶身份信息,將每個備注用戶身份信息與身份信息匹配庫中的社會屬性字段進行匹配,具體包括:
[0061 ]針對M個備注用戶身份信息中的每個備注用戶身份信息,執(zhí)行:
[0062]將備注用戶身份信息中的所有字段與身份信息匹配庫中的社會屬性字段進行匹配;
[0063]在確定備注用戶身份信息的所有字段中存在與身份信息匹配庫中的社會屬性字段中的至少一個社會屬性字段相同或相近的詞時,確定備注用戶身份信息為社會屬性備選?目息O
[0064]可選地,根據(jù)社會屬性備選信息,確定待處理用戶的社會屬性信息,具體包括:
[0065]針對所有社會屬性備選信息中的每個社會屬性備選信息,確定社會屬性備選信息中與社會屬性字段相匹配的社會屬性字段,將與社會屬性字段相匹配的社會屬性字段確定為社會屬性備選信息對應的第一備選社會屬性信息;
[0066]統(tǒng)計各第一備選社會屬性信息的數(shù)量,將數(shù)量最多的第一備選社會屬性信息確定為第二備選社會屬性信息;
[0067]根據(jù)第二備選社會屬性信息,確定待處理用戶的社會屬性信息。
[0068]可選地,根據(jù)第二備選社會屬性信息,確定待處理用戶的社會屬性信息,具體包括:
[0069]將第二備選社會屬性信息確定為待處理用戶的社會屬性信息;或者
[0070]在確定第二備選社會屬性信息的數(shù)量在所有第一備選社會屬性信息的數(shù)量中占比大于第一社會屬性閾值時,則將第二備選社會屬性信息確定為待處理用戶的社會屬性信息;或者,
[0071]在確定第二備選社會屬性信息的數(shù)量在所有第一備選社會屬性信息的數(shù)量中占比大于第一社會屬性閾值時,且第二備選社會屬性信息的數(shù)量與N的比值大于第二社會屬性閾值時,則將第二備選社會屬性信息確定為待處理用戶的社會屬性;其中,第一社會屬性閾值不小于第二社會屬性閾值;或者,
[0072]在確定第二備選社會屬性信息的數(shù)量在所有第一備選社會屬性信息的數(shù)量中占比大于第一社會屬性閾值時,且第二備選社會屬性信息的數(shù)量與N的比值大于第二社會屬性閾值時,且第二備選社會屬性信息的數(shù)量大于第三社會屬性閾值時,則將第二備選社會屬性信息確定為待處理用戶的社會屬性;其中,第一社會屬性閾值不小于第二社會屬性閾值。
[0073]可選地,待處理用戶的身份信息為待處理用戶與其它聯(lián)系人之間的社會關系;
[0074]根據(jù)M個備注用戶身份信息及預設的身份信息匹配庫,確定出待處理用戶的身份信息,具體包括:
[0075]針對M個備注用戶身份信息中的每個備注用戶身份信息,執(zhí)行:
[0076]將每個備注用戶身份信息與身份信息匹配庫中的社會關系字段進行匹配;
[0077]在確定備注用戶身份信息中存在與社會關系字段中的任一個相匹配的字段時,將備注用戶身份信息中與社會屬性字段相匹配的字段確定為備注用戶身份信息對應的第一社會關系字段;
[0078]根據(jù)備注用戶身份信息對應的第一社會關系字段,確定備注用戶身份信息對應的聯(lián)系人與待處理用戶之間的社會關系為第一社會關系字段對應的社會關系。
[0079]可選地,將每個備注用戶身份信息與身份信息匹配庫中的社會關系字段進行匹配,具體包括:
[0080]將備注用戶身份信息與社會關系字段進行匹配;
[0081]在確定備注用戶身份信息中存在與社會關系字段中的任一個社會關系字段相同或相近的詞時,確定備注用戶身份信息中存在與社會關系字段中的任一個相匹配的字段。
[0082]可選地,根據(jù)備注用戶身份信息對應的第一社會關系字段,確定備注用戶身份信息對應的聯(lián)系人與待處理用戶之間的社會關系為第一社會關系字段對應的社會關系之后,還包括:
[0083]從待處理用戶的社交網絡通訊錄中確定第一社會關系字段對應的聯(lián)系人的備注用戶身份信息;
[0084]將第一社會關系字段對應的聯(lián)系人的備注用戶身份信息與社會關系字段進行匹配;
[0085]在確定第一社會關系字段對應的聯(lián)系人的備注用戶身份信息中存在與社會關系字段中的任一個相匹配的字段時,將與社會屬性字段相匹配的字段確定為第一社會關系字段對應的聯(lián)系人與待處理用戶的第二社會關系字段;
[0086]在確定第一社會關系字段和第二社會關系字段與預設的社會關系相匹配時,確定第一社會關系字段對應的聯(lián)系人與待處理用戶之間的社會關系為第一社會關系字段對應的社會關系校驗成功;
[0087]其中,預設的社會關系中包括成對的社會關系字段。
[0088]可選地,待處理用戶的身份信息至少包括待處理用戶的姓名;
[0089]根據(jù)所有社會屬性備選信息,確定待處理用戶的社會屬性信息之后,還包括:
[0090]從M個備注用戶身份信息中確定出待處理備注用戶身份信息;其中,待處理備注用戶身份信息包括:針對M個備注用戶身份信息中的未與身份信息匹配庫中的社會屬性字段匹配成功的備注用戶身份信息,以及與身份信息匹配庫中的社會屬性字段匹配成功且備注用戶身份信息中字段長度大于預設字段長度的備注用戶身份信息;
[0091]針對每個待處理備注用戶身份信息,將每個待處理備注用戶身份信息與身份信息匹配庫中的姓字段進行匹配;
[0092]將成功匹配出姓字