欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于索引進(jìn)行文件比對(duì)的方法和裝置制造方法

文檔序號(hào):6499732閱讀:248來(lái)源:國(guó)知局
一種基于索引進(jìn)行文件比對(duì)的方法和裝置制造方法
【專利摘要】本發(fā)明公開一種基于索引進(jìn)行文件比對(duì)的方法和裝置,該文件由多個(gè)記錄組成。該方法包括以下步驟:獲取第一文件和第二文件中的記錄的主鍵,根據(jù)獲取的主鍵,為所述第一文件和第二文件中的記錄建立索引,按照索引,匹配所述第一文件和第二文件中的記錄的主鍵,將主鍵匹配的記錄進(jìn)行比對(duì),并且將比對(duì)結(jié)果寫入結(jié)果文件。
【專利說(shuō)明】—種基于索引進(jìn)行文件比對(duì)的方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及文件比對(duì),并且尤其涉及基于索引進(jìn)行文件比對(duì)的方法和裝置。
【背景技術(shù)】
[0002]目前,在進(jìn)行文件比對(duì)通常會(huì)讀取整個(gè)文件,將整個(gè)文件裝入內(nèi)存逐個(gè)記錄或逐行進(jìn)行比較,需要對(duì)雙邊文件進(jìn)行兩次遍歷,耗時(shí)較長(zhǎng),占用系統(tǒng)資源較大,效率較低。而且,現(xiàn)有技術(shù)中的文件比對(duì)方法不能對(duì)文件中的記錄進(jìn)行排序,在處理記錄亂序文件的時(shí)候無(wú)法有效找出異同記錄,對(duì)于兩個(gè)記錄相同,但是記錄順序不同的文件無(wú)法進(jìn)行有效比較,甚至出現(xiàn)錯(cuò)誤的比對(duì)結(jié)果。

【發(fā)明內(nèi)容】

[0003]根據(jù)本發(fā)明的一個(gè)目的,公開一種基于索引進(jìn)行文件比對(duì)的方法,該文件由多個(gè)記錄組成,該方法包括以下步驟:
獲取第一文件和第二文件中的記錄的主鍵,
根據(jù)獲取的主鍵,為所述第一文件和第二文件中的記錄建立索引,
按照索引,匹配所述第一文件和第二文件中的記錄的主鍵,
將主鍵匹配的記錄進(jìn)行比對(duì),并且將比對(duì)結(jié)果寫入結(jié)果文件。
[0004]優(yōu)選地,將主鍵不匹配的索引信息寫入結(jié)果文件。
[0005]優(yōu)選地,根據(jù)預(yù)置的主鍵解析規(guī)則從第一文件和第二文件中的記錄獲取主鍵。
[0006]優(yōu)選地,所述索引還包括與獲取的主鍵對(duì)應(yīng)的記錄在文件中的行號(hào)。
[0007]優(yōu)選地,根據(jù)匹配的主鍵獲取記錄的行號(hào),根據(jù)行號(hào)定位文件中的該記錄。
[0008]根據(jù)本發(fā)明的另一個(gè)目的,公開一種基于索引進(jìn)行文件比對(duì)的裝置,該文件由多個(gè)記錄組成,該裝置包括:
文件比對(duì)器和索引生成器,其中,
索引生成器被配置成:
獲取第一文件和第二文件中的記錄的主鍵,
根據(jù)獲取的主鍵,為所述第一文件和第二文件中的記錄建立索引,
文件比對(duì)器被配置成:
按照索引,匹配所述第一文件和第二文件中的記錄的主鍵,
將主鍵匹配的記錄進(jìn)行比對(duì),并且將比對(duì)結(jié)果寫入結(jié)果文件。
[0009]優(yōu)選地,索引生成器進(jìn)一步被配置成:
將主鍵不匹配的索引信息寫入結(jié)果文件。
[0010]優(yōu)選地,索引生成器進(jìn)一步被配置成:
根據(jù)預(yù)置的主鍵解析規(guī)則從第一文件和第二文件中的記錄獲取主鍵。
[0011]優(yōu)選地,所述索引還包括與獲取的主鍵對(duì)應(yīng)的記錄在文件中的行號(hào)。
[0012]優(yōu)選地,文件比對(duì)器進(jìn)一步被配置成: 根據(jù)匹配的主鍵獲取記錄的行號(hào),根據(jù)行號(hào)定位文件中的該記錄。
[0013]本發(fā)明通過對(duì)文件進(jìn)行預(yù)處理,建立索引,然后再按照索引比對(duì)文件。本發(fā)明的一個(gè)優(yōu)勢(shì)在于可以在文件比對(duì)之前對(duì)文件中的記錄進(jìn)行排序,實(shí)現(xiàn)對(duì)于記錄亂序的文件的比對(duì)。本發(fā)明的另一個(gè)優(yōu)勢(shì)在于是能夠?qū)ξ募M(jìn)行預(yù)處理,找出單邊不存在(雙方不匹配)的記錄不對(duì)其進(jìn)行比對(duì),節(jié)約了系統(tǒng)資源也節(jié)約了重復(fù)比對(duì)的時(shí)間成本。本發(fā)明的另一個(gè)優(yōu)勢(shì)在于按照索引進(jìn)行排序避免按照行內(nèi)容進(jìn)行排序,節(jié)省了內(nèi)存空間,縮短了排序時(shí)間,提高了比對(duì)效率。
【專利附圖】

【附圖說(shuō)明】
[0014]在參照附圖閱讀了本發(fā)明的【具體實(shí)施方式】以后,本領(lǐng)域技術(shù)人員將會(huì)更清楚地了解本發(fā)明的各個(gè)方面。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解的是,這些附圖僅僅用于配合【具體實(shí)施方式】說(shuō)明本發(fā)明的技術(shù)方案,而并非意在對(duì)本發(fā)明的保護(hù)范圍構(gòu)成限制。其中,
圖1是根據(jù)本發(fā)明實(shí)施例的基于索引進(jìn)行文件比對(duì)的方法的示意圖。
[0015]圖2是根據(jù)本發(fā)明實(shí)施例的索引生成示例。
[0016]圖3是根據(jù)本發(fā)明實(shí)施例的基于索引進(jìn)行文件比對(duì)的方法的步驟示意圖。
【具體實(shí)施方式】
[0017]下面參照附圖,對(duì)本發(fā)明的【具體實(shí)施方式】作進(jìn)一步的詳細(xì)描述。在下面的描述中,為了解釋的目的,陳述許多具體細(xì)節(jié)以便提供對(duì)實(shí)施例的一個(gè)或多個(gè)方面的透徹理解。然而,對(duì)于本領(lǐng)域技術(shù)人員可以顯而易見的是,可以這些具體細(xì)節(jié)的較少程度來(lái)實(shí)踐各實(shí)施例的一個(gè)或多個(gè)方面。因此下面的描述不被視為局限性的,而是通過所附權(quán)利要求來(lái)限定保護(hù)范圍。
[0018]圖1是根據(jù)本發(fā)明實(shí)施例的基于索引進(jìn)行文件比對(duì)的方法的示意圖。如圖1所示,基于索引進(jìn)行文件比對(duì)總體上可以分為兩個(gè)步驟,即文件比對(duì)和索引生成。在索引生成的步驟中,首先分別從文件I和文件2獲取主鍵,這里的主鍵對(duì)應(yīng)于文件I和文件2中的記錄??梢苑謩e對(duì)文件I的主鍵和文件2的主鍵排序,然后生成索引。
[0019]如圖2所示,圖2是根據(jù)本發(fā)明實(shí)施例的一個(gè)索引生成示例。從圖中可以看出,文件I的主鍵和文件2的主鍵根據(jù)字母順序被排序。按照索引,匹配文件I和文件2中的記錄的主鍵,結(jié)果前3條記錄匹配成功,文件I和文件2中的最后一條記錄匹配失敗。再參考圖1,在一個(gè)示例中,在索引生成之后,可以再生成主鍵匹配的索引。主鍵匹配的索引不包括在文件I和文件2中單邊存在的記錄的主鍵而僅包括主鍵匹配的記錄的索引。可以理解,在文件比對(duì)過程中,也可以直接參考初始生成的索引進(jìn)行文件的比對(duì)。
[0020]進(jìn)一步參考圖2,生成的索引結(jié)構(gòu)還可以包括與主鍵對(duì)應(yīng)的記錄的行號(hào)。由此,在文件比對(duì)的步驟中,可以通過參考索引中的主鍵所對(duì)應(yīng)的記錄的行號(hào),快速定位文件中的記錄,從而迅速讀取記錄進(jìn)行比對(duì)。
[0021]返回參考圖1,在文件比對(duì)過程中,將主鍵匹配的記錄進(jìn)行比對(duì),并且將比對(duì)結(jié)果寫入結(jié)果文件。而在索引生成的步驟,可以將主鍵不匹配的索引信息寫入結(jié)果文件。
[0022]圖3是根據(jù)本發(fā)明實(shí)施例的基于索引進(jìn)行文件比對(duì)的方法的步驟示意圖。該方法包括以下步驟: S1:獲取第一文件和第二文件中的記錄的主鍵。在該步驟中,可以根據(jù)預(yù)置的主鍵解析規(guī)則從第一文件和第二文件中的記錄獲取主鍵。可以通過參數(shù)配置的方式定義主鍵解析規(guī)貝U。例如,可以選擇一條記錄中的多個(gè)字段的組合作為主鍵,也可以選擇記錄中特殊字符前后的字段作為主鍵,或者還可以根據(jù)文件中記錄的格式和分隔符來(lái)選擇主鍵。
[0023]S2:根據(jù)獲取的主鍵,為所述第一文件和第二文件中的記錄建立索引。在該步驟中,所述索引還可以包括與獲取的主鍵對(duì)應(yīng)的記錄在文件中的行號(hào)。根據(jù)匹配的主鍵獲取記錄的行號(hào),可以根據(jù)行號(hào)定位文件中的記錄。
[0024]S3:按照索引,匹配所述第一文件和第二文件中的記錄的主鍵。作為示例,可以將匹配成功的主鍵的索引信息(例如,主鍵、行號(hào)、排序信息)保留在內(nèi)存中作為上文所述的主鍵匹配的索引,以及將匹配不成功的主鍵的索引信息從內(nèi)存中刪除。
[0025]S4:將主鍵匹配的記錄進(jìn)行比對(duì),并且將比對(duì)結(jié)果寫入結(jié)果文件。
[0026]以下描述根據(jù)本發(fā)明實(shí)施例的一種基于索引進(jìn)行文件比對(duì)的裝置,該文件由多個(gè)記錄組成,該裝置包括:文件比對(duì)器和索引生成器,其中,索引生成器被配置成:獲取第一文件和第二文件中的記錄的主鍵,根據(jù)獲取的主鍵,為所述第一文件和第二文件中的記錄建立索引。文件比對(duì)器被配置成:按照索引,匹配所述第一文件和第二文件中的記錄的主鍵,將主鍵匹配的記錄進(jìn)行比對(duì),并且將比對(duì)結(jié)果寫入結(jié)果文件。索引生成器可以進(jìn)一步被配置成:將主鍵不匹配的索引信息寫入結(jié)果文件。索引生成器可以進(jìn)一步被配置成:根據(jù)預(yù)置的主鍵解析規(guī)則從第一文件和第二文件中的記錄獲取主鍵。所述索引還可以包括與獲取的主鍵對(duì)應(yīng)的記錄在文件中的行號(hào)。文件比對(duì)器可以進(jìn)一步被配置成:根據(jù)匹配的主鍵獲取記錄的行號(hào),根據(jù)行號(hào)定位文件中的該記錄。
[0027]通過以上實(shí)施方式的描述,本領(lǐng)域中的普通技術(shù)人員能夠理解,在不偏離本發(fā)明的精神和范圍的情況下,還可以對(duì)本發(fā)明的【具體實(shí)施方式】作各種變更和替換。這些變更和替換都落在本發(fā)明權(quán)利要求書所限定的范圍內(nèi)。
【權(quán)利要求】
1.一種基于索引進(jìn)行文件比對(duì)的方法,該文件由多個(gè)記錄組成,其特征在于,該方法包括以下步驟: 獲取第一文件和第二文件中的記錄的主鍵, 根據(jù)獲取的主鍵,為所述第一文件和第二文件中的記錄建立索引, 按照索引,匹配所述第一文件和第二文件中的記錄的主鍵, 將主鍵匹配的記錄進(jìn)行比對(duì),并且將比對(duì)結(jié)果寫入結(jié)果文件。
2.如權(quán)利要求1所述的方法,其特征在于, 將主鍵不匹配的索引信息寫入結(jié)果文件。
3.如權(quán)利要求1所述的方法,其特征在于, 根據(jù)預(yù)置的主鍵解析規(guī)則從第一文件和第二文件中的記錄獲取主鍵。
4.如權(quán)利要求1所述的方法,其特征在于, 所述索引還包括與獲取的主鍵對(duì)應(yīng)的記錄在文件中的行號(hào)。
5.如權(quán)利要求4所述的方法,其特征在于, 根據(jù)匹配的主鍵獲取記錄的行號(hào),根據(jù)行號(hào)定位文件中的該記錄。
6.一種基于索引進(jìn)行文件比對(duì)的裝置,該文件由多個(gè)記錄組成,其特征在于,該裝置包括: 文件比對(duì)器和索引生成器,其中, 索引生成器被配置成: 獲取第一文件和第二文件中的記錄的主鍵, 根據(jù)獲取的主鍵,為所述第一文件和第二文件中的記錄建立索引, 文件比對(duì)器被配置成: 按照索引,匹配所述第一文件和第二文件中的記錄的主鍵, 將主鍵匹配的記錄進(jìn)行比對(duì),并且將比對(duì)結(jié)果寫入結(jié)果文件。
7.如權(quán)利要求6所述的裝置,其特征在于, 索引生成器進(jìn)一步被配置成: 將主鍵不匹配的索引信息寫入結(jié)果文件。
8.如權(quán)利要求6所述的裝置,其特征在于, 索引生成器進(jìn)一步被配置成: 根據(jù)預(yù)置的主鍵解析規(guī)則從第一文件和第二文件中的記錄獲取主鍵。
9.如權(quán)利要求6所述的裝置,其特征在于, 所述索引還包括與獲取的主鍵對(duì)應(yīng)的記錄在文件中的行號(hào)。
10.如權(quán)利要求9所述的裝置,其特征在于, 文件比對(duì)器進(jìn)一步被配置成: 根據(jù)匹配的主鍵獲取記錄的行號(hào),根據(jù)行號(hào)定位文件中的該記錄。
【文檔編號(hào)】G06F17/30GK103970792SQ201310042343
【公開日】2014年8月6日 申請(qǐng)日期:2013年2月4日 優(yōu)先權(quán)日:2013年2月4日
【發(fā)明者】張遜, 李嶺, 吳金壇, 呂蘇, 馬軍 申請(qǐng)人:中國(guó)銀聯(lián)股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
偏关县| 天全县| 安仁县| 阆中市| 栾城县| 鄂伦春自治旗| 汽车| 景德镇市| 璧山县| 马鞍山市| 长葛市| 威信县| 襄垣县| 桐柏县| 上犹县| 交城县| 砚山县| 古交市| 信阳市| 宜兴市| 海丰县| 航空| 土默特右旗| 绵竹市| 育儿| 淮南市| 安达市| 讷河市| 三台县| 华蓥市| 南溪县| 通化县| 永仁县| 垣曲县| 湘乡市| 托里县| 潜山县| 孝昌县| 萍乡市| 潞城市| 桃源县|