一種數(shù)據(jù)一致性匹配處理方法和設(shè)備的制作方法
【專(zhuān)利摘要】本發(fā)明的實(shí)施方式提供了一種數(shù)據(jù)一致性匹配處理方法。該方法包括:獲得待處理的第一數(shù)據(jù)文件;基于所述第一數(shù)據(jù)文件生成與所述第一數(shù)據(jù)文件唯一對(duì)應(yīng)的第一校驗(yàn)信息;其中,不同的數(shù)據(jù)文件生成的校驗(yàn)信息不同,所述第一校驗(yàn)信息的信息量小于所述第一數(shù)據(jù)文件的信息量;所述第一校驗(yàn)信息用于進(jìn)行數(shù)據(jù)一致性匹配處理;其中,所述數(shù)據(jù)一致性匹配處理包括:將所述第一校驗(yàn)信息與對(duì)應(yīng)于第二數(shù)據(jù)文件的第二校驗(yàn)信息進(jìn)行比較,如果所述第一校驗(yàn)信息與所述第二校驗(yàn)信息一致,則確定所述第一數(shù)據(jù)文件和所述第二數(shù)據(jù)文件相同。本發(fā)明的方法顯著地降低了數(shù)據(jù)傳輸?shù)臅r(shí)間,并且減少了數(shù)據(jù)比較的耗時(shí),提高了數(shù)據(jù)處理效率,并提高了數(shù)據(jù)傳輸?shù)陌踩浴?br>
【專(zhuān)利說(shuō)明】一種數(shù)據(jù)一致性匹配處理方法和設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明的實(shí)施方式涉及數(shù)據(jù)處理領(lǐng)域,更具體地,本發(fā)明的實(shí)施方式涉及一種數(shù)據(jù)一致性匹配處理方法和設(shè)備。
【背景技術(shù)】
[0002]本部分旨在為權(quán)利要求書(shū)中陳述的本發(fā)明的實(shí)施方式提供背景或上下文。此處的描述不因?yàn)榘ㄔ诒静糠种芯统姓J(rèn)是現(xiàn)有技術(shù)。
[0003]在整個(gè)數(shù)據(jù)處理【技術(shù)領(lǐng)域】中,為了保證數(shù)據(jù)的一致性和正確性,經(jīng)常需要對(duì)數(shù)據(jù)進(jìn)行一致性的核對(duì)與匹配處理。目前,已經(jīng)出現(xiàn)一些數(shù)據(jù)一致性匹配處理方法,由請(qǐng)求方向被請(qǐng)求方發(fā)送數(shù)據(jù)請(qǐng)求,被請(qǐng)求方形成數(shù)據(jù)文件后,將全部原始數(shù)據(jù)文件發(fā)送給請(qǐng)求方,由請(qǐng)求方周期性地查找數(shù)據(jù)文件是否存在,并根據(jù)數(shù)據(jù)文件中的各項(xiàng)內(nèi)容,進(jìn)行逐筆地核對(duì),以判斷兩個(gè)數(shù)據(jù)文件中的各項(xiàng)數(shù)據(jù)是否一致。
【發(fā)明內(nèi)容】
[0004]但是,由于需要核對(duì)的數(shù)據(jù)量非常大,一般至少在幾百KB甚至幾十M,現(xiàn)有技術(shù)采用實(shí)時(shí)傳輸整個(gè)原始數(shù)據(jù)文件的方式,一旦網(wǎng)絡(luò)不穩(wěn)定,則會(huì)產(chǎn)生傳輸中斷或者造成傳輸速度緩慢、傳輸周期長(zhǎng)的問(wèn)題。此外,由于數(shù)據(jù)文件的傳輸是明文傳輸,而核對(duì)的數(shù)據(jù)文件往往涉及到例如資金明細(xì)等敏感信息,數(shù)據(jù)傳輸?shù)陌踩砸驳貌坏奖WC。此外,在執(zhí)行數(shù)據(jù)一致性匹配時(shí),需要對(duì)全部數(shù)據(jù)文件進(jìn)行逐筆核對(duì),需要反復(fù)多次讀寫(xiě)數(shù)據(jù)庫(kù),降低了服務(wù)器、數(shù)據(jù)庫(kù)的使用性能。
[0005]因此在現(xiàn)有技術(shù)中,數(shù)據(jù)的一致性匹配過(guò)程存在實(shí)時(shí)性差、傳輸速度慢、耗費(fèi)周期長(zhǎng)、安全性差的問(wèn)題,這是非常令人煩惱的過(guò)程。
[0006]為此,非常需要一種改進(jìn)的數(shù)據(jù)一致性匹配處理方法,以期待提高數(shù)據(jù)一致性匹配的實(shí)時(shí)性,提高數(shù)據(jù)處理效率,增強(qiáng)數(shù)據(jù)傳輸?shù)陌踩浴?br>
[0007]在本上下文中,本發(fā)明的實(shí)施方式期望提供一種數(shù)據(jù)一致性匹配處理方法和設(shè)備。
[0008]在本發(fā)明實(shí)施方式的第一方面中,提供了一種數(shù)據(jù)一致性匹配處理方法,包括:
[0009]獲得待處理的第一數(shù)據(jù)文件;
[0010]基于所述第一數(shù)據(jù)文件生成與所述第一數(shù)據(jù)文件唯一對(duì)應(yīng)的第一校驗(yàn)信息;其中,不同的數(shù)據(jù)文件生成的校驗(yàn)信息不同,所述第一校驗(yàn)信息的信息量小于所述第一數(shù)據(jù)文件的信息量;所述第一校驗(yàn)信息用于進(jìn)行數(shù)據(jù)一致性匹配處理;
[0011]其中,所述數(shù)據(jù)一致性匹配處理包括:將所述第一校驗(yàn)信息與對(duì)應(yīng)于第二數(shù)據(jù)文件的第二校驗(yàn)信息進(jìn)行比較,如果所述第一校驗(yàn)信息與所述第二校驗(yàn)信息一致,則確定所述第一數(shù)據(jù)文件和所述第二數(shù)據(jù)文件相同。
[0012]在本發(fā)明實(shí)施方式的第二方面中,提供了一種數(shù)據(jù)一致性匹配處理設(shè)備,包括:獲得單元,配置用于獲得待處理的第一數(shù)據(jù)文件;
[0013]校驗(yàn)信息生成單元,配置用于基于所述第一數(shù)據(jù)文件生成與所述第一數(shù)據(jù)文件唯一對(duì)應(yīng)的第一校驗(yàn)信息;其中,不同的數(shù)據(jù)文件生成的校驗(yàn)信息不同,所述第一校驗(yàn)信息的信息量小于所述第一數(shù)據(jù)文件的信息量;所述第一校驗(yàn)信息用于進(jìn)行數(shù)據(jù)一致性匹配處理;其中,所述數(shù)據(jù)一致性匹配處理包括:將所述第一校驗(yàn)信息與對(duì)應(yīng)于第二數(shù)據(jù)文件的第二校驗(yàn)信息進(jìn)行比較,如果所述第一校驗(yàn)信息與所述第二校驗(yàn)信息一致,則確定所述第一數(shù)據(jù)文件和所述第二數(shù)據(jù)文件相同。
[0014]根據(jù)本發(fā)明實(shí)施方式的數(shù)據(jù)一致性匹配處理方法和設(shè)備,可以基于待處理的數(shù)據(jù)文件生成與所述數(shù)據(jù)文件唯一對(duì)應(yīng)的校驗(yàn)信息,利用所述校驗(yàn)信息進(jìn)行數(shù)據(jù)文件的一致性匹配處理。在本發(fā)明實(shí)施例中,由于生成了校驗(yàn)信息,數(shù)據(jù)的傳輸和比較過(guò)程均可以基于校驗(yàn)信息進(jìn)行,而無(wú)需傳輸數(shù)據(jù)量龐大的數(shù)據(jù)文件以及利用原始數(shù)據(jù)文件進(jìn)行逐筆核對(duì),由于所述校驗(yàn)信息的信息量遠(yuǎn)遠(yuǎn)小于待處理的數(shù)據(jù)文件的信息量,從而顯著地降低了數(shù)據(jù)傳輸?shù)臅r(shí)間,并且減少了數(shù)據(jù)比較的耗時(shí),提高了數(shù)據(jù)處理效率,為用戶(hù)帶來(lái)了更好的體驗(yàn)。此外,由于傳輸?shù)氖腔跀?shù)據(jù)文件而生成的校驗(yàn)信息,相當(dāng)于傳輸加密后的數(shù)據(jù),顯著提高了數(shù)據(jù)傳輸?shù)陌踩浴?br>
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0015]通過(guò)參考附圖閱讀下文的詳細(xì)描述,本發(fā)明示例性實(shí)施方式的上述以及其他目的、特征和優(yōu)點(diǎn)將變得易于理解。在附圖中,以示例性而非限制性的方式示出了本發(fā)明的若干實(shí)施方式,其中:
[0016]圖1示意性地示出了根據(jù)本發(fā)明實(shí)施方式的可以在其中實(shí)現(xiàn)的應(yīng)用場(chǎng)景;
[0017]圖2示意性地示出了根據(jù)本發(fā)明一實(shí)施例的數(shù)據(jù)一致性匹配處理方法流程示意圖;
[0018]圖3示意性地示出了根據(jù)本發(fā)明又一實(shí)施例的數(shù)據(jù)一致性匹配處理方法流程示意圖;
[0019]圖4示意性地示出了根據(jù)本發(fā)明再一實(shí)施例的數(shù)據(jù)一致性匹配處理方法流程示意圖;
[0020]圖5示意性地示出了根據(jù)本發(fā)明實(shí)施例的數(shù)據(jù)一致性匹配處理設(shè)備框圖。
[0021]在附圖中,相同或?qū)?yīng)的標(biāo)號(hào)表不相同或?qū)?yīng)的部分。
【具體實(shí)施方式】
[0022]下面將參考若干示例性實(shí)施方式來(lái)描述本發(fā)明的原理和精神。應(yīng)當(dāng)理解,給出這些實(shí)施方式僅僅是為了使本領(lǐng)域技術(shù)人員能夠更好地理解進(jìn)而實(shí)現(xiàn)本發(fā)明,而并非以任何方式限制本發(fā)明的范圍。相反,提供這些實(shí)施方式是為了使本公開(kāi)更加透徹和完整,并且能夠?qū)⒈竟_(kāi)的范圍完整地傳達(dá)給本領(lǐng)域的技術(shù)人員。
[0023]本領(lǐng)域技術(shù)技術(shù)人員知道,本發(fā)明的實(shí)施方式可以實(shí)現(xiàn)為一種系統(tǒng)、裝置、設(shè)備、方法或計(jì)算機(jī)程序產(chǎn)品。因此,本公開(kāi)可以具體實(shí)現(xiàn)為以下形式,即:完全的硬件、完全的軟件(包括固件、駐留軟件、微代碼等),或者硬件和軟件結(jié)合的形式。
[0024]根據(jù)本發(fā)明的實(shí)施方式,提出了一種數(shù)據(jù)一致性匹配的方法和設(shè)備。
[0025]此外,附圖中的任何元素?cái)?shù)量均用于示例而非限制,以及任何命名都僅用于區(qū)分,而不具有任何限制含義。
[0026]下面參考本發(fā)明的若干代表性實(shí)施方式,詳細(xì)闡釋本發(fā)明的原理和精神。
[0027]發(fā)曰月概沐
[0028]本發(fā)明人發(fā)現(xiàn),由于需要核對(duì)的數(shù)據(jù)量非常大,一般至少在幾百KB甚至幾十M,現(xiàn)有技術(shù)采用實(shí)時(shí)傳輸整個(gè)原始數(shù)據(jù)文件的方式,一旦網(wǎng)絡(luò)不穩(wěn)定,則會(huì)產(chǎn)生傳輸中斷或者造成傳輸速度緩慢、傳輸周期長(zhǎng)的問(wèn)題。此外,由于數(shù)據(jù)文件的傳輸是明文傳輸,而核對(duì)的數(shù)據(jù)文件往往涉及到例如資金明細(xì)等敏感信息,數(shù)據(jù)傳輸?shù)陌踩砸驳貌坏奖WC。此外,在執(zhí)行數(shù)據(jù)一致性匹配時(shí),需要對(duì)全部數(shù)據(jù)文件進(jìn)行逐筆核對(duì),需要反復(fù)多次讀寫(xiě)數(shù)據(jù)庫(kù),降低了服務(wù)器、數(shù)據(jù)庫(kù)的使用性能。
[0029]因此針對(duì)現(xiàn)有技術(shù)中數(shù)據(jù)的一致性匹配過(guò)程存在實(shí)時(shí)性差、傳輸速度慢、耗費(fèi)周期長(zhǎng)、安全性差的技術(shù)問(wèn)題,提供了一種數(shù)據(jù)一致性匹配處理方法和設(shè)備,可以基于待處理的數(shù)據(jù)文件生成與所述數(shù)據(jù)文件唯一對(duì)應(yīng)的校驗(yàn)信息,利用所述校驗(yàn)信息進(jìn)行數(shù)據(jù)文件的一致性匹配處理。在本發(fā)明實(shí)施例中,由于生成了校驗(yàn)信息,數(shù)據(jù)的傳輸和比較過(guò)程均可以基于校驗(yàn)信息進(jìn)行,而無(wú)需傳輸數(shù)據(jù)量龐大的數(shù)據(jù)文件以及利用原始數(shù)據(jù)文件進(jìn)行逐筆核對(duì),由于所述校驗(yàn)信息的信息量遠(yuǎn)遠(yuǎn)小于待處理的數(shù)據(jù)文件的信息量,從而顯著地降低了數(shù)據(jù)傳輸?shù)臅r(shí)間,并且減少了數(shù)據(jù)比較的耗時(shí),提高了數(shù)據(jù)處理效率,為用戶(hù)帶來(lái)了更好的體驗(yàn)。此外,由于傳輸?shù)氖腔跀?shù)據(jù)文件而生成的校驗(yàn)信息,相當(dāng)于傳輸加密后的數(shù)據(jù),顯著提高了數(shù)據(jù)傳輸?shù)陌踩浴?br>
[0030]在介紹了本發(fā)明的基本原理之后,下面具體介紹本發(fā)明的各種非限制性實(shí)施方式。
[0031]應(yīng)用場(chǎng)景總覽
[0032]首先參考圖1,示意性地示出了根據(jù)本發(fā)明實(shí)施方式的可以在其中實(shí)現(xiàn)的應(yīng)用場(chǎng)景。數(shù)據(jù)發(fā)送方為發(fā)送數(shù)據(jù)的一方,數(shù)據(jù)接收方為接收數(shù)據(jù)的一方。在一種典型的應(yīng)用場(chǎng)景中,所述數(shù)據(jù)發(fā)送方發(fā)送第一校驗(yàn)信息,所述數(shù)據(jù)接收方接收所述第一校驗(yàn)信息,并執(zhí)行數(shù)據(jù)一致性匹配處理。所述數(shù)據(jù)發(fā)送方和數(shù)據(jù)接收方可以是任意一種客戶(hù)端或者服務(wù)器,所述客戶(hù)端可以應(yīng)用到電子設(shè)備中,所示電子設(shè)備可以是現(xiàn)有的、正在研發(fā)的或?qū)?lái)研發(fā)的任何電子設(shè)備,包括但不限于:現(xiàn)有的、正在研發(fā)的或?qū)?lái)研發(fā)的、臺(tái)式計(jì)算機(jī)、膝上型計(jì)算機(jī)、移動(dòng)終端(包括智能手機(jī)、非智能手機(jī)、各種平板電腦)等。本領(lǐng)域技術(shù)人員可以理解,圖1所示的示意圖僅是本發(fā)明的實(shí)施方式可以在其中得以實(shí)現(xiàn)的一個(gè)示例。本發(fā)明實(shí)施方式的適用范圍不受到該框架任何方面的限制。
[0033]示例性方法
[0034]下面結(jié)合圖1的應(yīng)用場(chǎng)景,參考圖2來(lái)描述根據(jù)本發(fā)明示例性實(shí)施方式的用于數(shù)據(jù)一致性匹配處理的方法。需要注意的是,上述應(yīng)用場(chǎng)景僅是為了便于理解本發(fā)明的精神和原理而示出,本發(fā)明的實(shí)施方式在此方面不受任何限制。相反,本發(fā)明的實(shí)施方式可以應(yīng)用于適用的任何場(chǎng)景。
[0035]參見(jiàn)圖2,示意性地示出了根據(jù)本發(fā)明一實(shí)施例的數(shù)據(jù)一致性匹配處理方法流程圖,該方法具體例如可以包括:
[0036]S201,獲得待處理的第一數(shù)據(jù)文件。
[0037]其中,待處理的第一數(shù)據(jù)文件可以是原始數(shù)據(jù)文件,也可以是對(duì)原始數(shù)據(jù)文件進(jìn)行篩選處理后獲得的關(guān)鍵信息所生成的數(shù)據(jù)文件。對(duì)應(yīng)后一種方式,獲得待處理的第一數(shù)據(jù)文件包括:獲得待處理的原始數(shù)據(jù)文件,從所述原始數(shù)據(jù)文件篩選出預(yù)設(shè)范圍和/或預(yù)設(shè)類(lèi)目的關(guān)鍵信息。具體實(shí)現(xiàn)時(shí),進(jìn)行數(shù)據(jù)一致性匹配處理的任何一方,可以各自從數(shù)據(jù)庫(kù)批量讀取出待處理的原始數(shù)據(jù)文件,從所述原始數(shù)據(jù)文件篩選出預(yù)先設(shè)定范圍的關(guān)鍵信息作為待處理的第一數(shù)據(jù)文件。預(yù)先設(shè)定的范圍可以是預(yù)設(shè)的時(shí)間范圍,例如可以是根據(jù)數(shù)據(jù)的生成時(shí)間篩選出的固定時(shí)間范圍的數(shù)據(jù)。預(yù)先設(shè)定的范圍還可以是預(yù)設(shè)的區(qū)域范圍,例如某一地區(qū)范圍的數(shù)據(jù)。預(yù)先設(shè)定的范圍還可以是預(yù)設(shè)的賬號(hào)范圍,例如設(shè)置賬號(hào)區(qū)間,(0, 1000) (1000, 2000)等。具體的預(yù)設(shè)范圍還可以是其他范圍,可以根據(jù)需要靈活設(shè)置,在此不進(jìn)行限定。當(dāng)然,還可以從原始數(shù)據(jù)文件中篩選出預(yù)設(shè)類(lèi)目的關(guān)鍵信息。所述預(yù)設(shè)類(lèi)目包括但不限于金額、訂單狀態(tài)、訂單號(hào)、序列號(hào)、交易方式等,可以由用戶(hù)或者系統(tǒng)根據(jù)需要具體設(shè)置。其中,金額具體可以為交易金額。訂單狀態(tài)具體可以包括交易成功、交易失敗、退款等狀態(tài)。其中,預(yù)設(shè)類(lèi)目為執(zhí)行數(shù)據(jù)一致性匹配處理的兩方,數(shù)據(jù)接收方和數(shù)據(jù)發(fā)送方均共有的數(shù)據(jù)類(lèi)目。
[0038]在一種可能的實(shí)現(xiàn)方式中,所述待處理的第一數(shù)據(jù)文件為經(jīng)過(guò)排序處理后的數(shù)據(jù)文件,所述排序處理包括:對(duì)篩選出的所述關(guān)鍵信息進(jìn)行排序,所述排序過(guò)程基于預(yù)設(shè)的格式和/或排列規(guī)則而執(zhí)行。具體地,執(zhí)行數(shù)據(jù)一致性匹配處理的兩方可以預(yù)先約定固定的格式和/或排列規(guī)則,雙方基于預(yù)設(shè)的格式和/或排列規(guī)則對(duì)篩選出的關(guān)鍵信息進(jìn)行排序,以獲得一致的待處理數(shù)據(jù)文件。例如,雙方預(yù)先設(shè)置相同的數(shù)據(jù)格式和序列,包括數(shù)據(jù)每一行、每一列對(duì)應(yīng)的字段,數(shù)據(jù)的類(lèi)型、長(zhǎng)度等信息。預(yù)設(shè)的排列規(guī)則可以包括數(shù)據(jù)按照升序還是降序排列,以哪一個(gè)關(guān)鍵字段作為基準(zhǔn)字段進(jìn)行升序或者降序排列等。這樣,數(shù)據(jù)接收方和數(shù)據(jù)發(fā)送方均可以獲得一致的待處理的第一數(shù)據(jù)文件。
[0039]S202,基于所述第一數(shù)據(jù)文件生成與所述第一數(shù)據(jù)文件唯一對(duì)應(yīng)的第一校驗(yàn)信息;其中,不同的數(shù)據(jù)文件生成的校驗(yàn)信息不同,所述第一校驗(yàn)信息的信息量小于所述第一數(shù)據(jù)文件的信息量;所述第一校驗(yàn)信息用于進(jìn)行數(shù)據(jù)一致性匹配處理;其中,所述數(shù)據(jù)一致性匹配處理包括:將所述第一校驗(yàn)信息與對(duì)應(yīng)于第二數(shù)據(jù)文件的第二校驗(yàn)信息進(jìn)行比較,如果所述第一校驗(yàn)信息與所述第二校驗(yàn)信息一致,則確定所述第一數(shù)據(jù)文件和所述第二數(shù)據(jù)文件相同。
[0040]本發(fā)明具體實(shí)現(xiàn)時(shí),基于所述第一數(shù)據(jù)文件生成與所述第一數(shù)據(jù)文件唯一對(duì)應(yīng)的第一校驗(yàn)信息。所述第一校驗(yàn)信息用于執(zhí)行數(shù)據(jù)的一致性匹配處理,第一校驗(yàn)信息的信息量遠(yuǎn)小于第一數(shù)據(jù)文件的信息量。生成第一校驗(yàn)信息的方法可以是多樣的,只要能夠使得不同的數(shù)據(jù)文件生成不同的校驗(yàn)信息,相同的數(shù)據(jù)文件生成相同的校驗(yàn)信息即可。在一種可能的實(shí)現(xiàn)方式中,本發(fā)明可以使用MD5(英文全稱(chēng)為Message Digest Algorithm MD5,中文名稱(chēng)為中文名為消息摘要算法第五版)加密算法生成基于第一數(shù)據(jù)文件的第一校驗(yàn)信息。具體實(shí)現(xiàn)時(shí),所述第一校驗(yàn)信息為一組加密字符串,不同內(nèi)容的數(shù)據(jù)文件在經(jīng)過(guò)MD5加密算法生成的校驗(yàn)信息即加密字符串是不同的。
[0041]其中,MD5函數(shù)具體可以是:
[0042]void MD5Encode(unsigned char氺output, unsigned int氺input, unsigned intlen)。
[0043]其中input為輸入的信息,即待處理的第一數(shù)據(jù)文件,output為經(jīng)過(guò)MD5加密后得到的校驗(yàn)信息加密字符串,len是計(jì)算出校驗(yàn)字符串長(zhǎng)度即校驗(yàn)信息的位數(shù),一般為32。
[0044]當(dāng)然,本領(lǐng)域技術(shù)人員可以理解的是,除了 MD5算法外,還可以利用其它方法生成校驗(yàn)信息。例如可以包括:RSA (—種公鑰加密算法)、DSA (英文全稱(chēng)為Digital SignatureAlgorithm,中文全稱(chēng)為數(shù)字簽名算法)等。但這種方法需要公私鑰的配置,相對(duì)復(fù)雜,但安全性也更高。校驗(yàn)信息的生成還可以使用CRC(英文全稱(chēng)為Cyclic Redundancy Check,中文全稱(chēng)為循環(huán)冗余校驗(yàn)碼),其缺點(diǎn)是沖突性較高,但生成方式比較簡(jiǎn)單。本發(fā)明對(duì)生成第一校驗(yàn)信息的方式不進(jìn)行限定,本領(lǐng)域技術(shù)人員在付出創(chuàng)造性勞動(dòng)下獲取的其他實(shí)現(xiàn)方式均屬于本發(fā)明的保護(hù)范圍。
[0045]需要說(shuō)明的是,數(shù)據(jù)發(fā)送方可以在基于第一數(shù)據(jù)文件生成第一校驗(yàn)信息后,向數(shù)據(jù)接收方發(fā)送所述第一校驗(yàn)信息,所述第一校驗(yàn)信息用于所述數(shù)據(jù)接收方利用所述第一校驗(yàn)信息進(jìn)行數(shù)據(jù)一致性匹配處理。其中,數(shù)據(jù)接收方基于待匹配處理的第二數(shù)據(jù)文件生成第二校驗(yàn)信息,而后將接收的第一校驗(yàn)信息與所述第二校驗(yàn)信息進(jìn)行比較,如果所述第一校驗(yàn)信息與所述第二校驗(yàn)信息一致,則確定所述第一數(shù)據(jù)文件和所述第二數(shù)據(jù)文件相同。如果所述第一校驗(yàn)信息與所述第二校驗(yàn)信息不一致,則確定所述第一數(shù)據(jù)文件和所述第二數(shù)據(jù)文件不相同。這時(shí),可以由數(shù)據(jù)接收方采取傳統(tǒng)的逐筆核對(duì)的方式進(jìn)行數(shù)據(jù)的一致性匹配。
[0046]當(dāng)然,生成第一校驗(yàn)信息的一方還可以作為數(shù)據(jù)接收方,接收第三校驗(yàn)信息,所述第三校驗(yàn)信息基于第三數(shù)據(jù)文件而生成,所述第三校驗(yàn)信息與所述第三數(shù)據(jù)文件具有一一對(duì)應(yīng)關(guān)系;將所述第三校驗(yàn)信息與所述第一校驗(yàn)信息進(jìn)行比較,如果一致,則確定所述第三數(shù)據(jù)文件與所述第一數(shù)據(jù)文件相同。
[0047]進(jìn)一步,所述方法還包括:當(dāng)完成對(duì)校驗(yàn)信息的比較,更新與所述校驗(yàn)信息對(duì)應(yīng)的數(shù)據(jù)文件的狀態(tài)為已處理。這樣,可以再重新獲取未處理的數(shù)據(jù)文件執(zhí)行上述流程。
[0048]在本發(fā)明實(shí)施例中,由于生成了校驗(yàn)信息,數(shù)據(jù)的傳輸和比較過(guò)程均可以基于校驗(yàn)信息進(jìn)行,而無(wú)需傳輸數(shù)據(jù)量龐大的數(shù)據(jù)文件以及利用原始數(shù)據(jù)文件進(jìn)行逐筆核對(duì),由于所述校驗(yàn)信息的信息量遠(yuǎn)遠(yuǎn)小于待處理的數(shù)據(jù)文件的信息量,從而顯著地降低了數(shù)據(jù)傳輸?shù)臅r(shí)間,并且減少了數(shù)據(jù)比較的耗時(shí),提高了數(shù)據(jù)處理效率,為用戶(hù)帶來(lái)了更好的體驗(yàn)。此外,由于傳輸?shù)氖腔跀?shù)據(jù)文件而生成的校驗(yàn)信息,相當(dāng)于傳輸加密后的數(shù)據(jù),顯著提高了數(shù)據(jù)傳輸?shù)陌踩浴?br>
[0049]參見(jiàn)圖3,示意性地示出了根據(jù)本發(fā)明又一實(shí)施例的數(shù)據(jù)一致性匹配處理方法流程示意圖。在此示意圖中,以數(shù)據(jù)接收方執(zhí)行數(shù)據(jù)一致性匹配處理為例進(jìn)行說(shuō)明,所述數(shù)據(jù)接收方可以是任一客戶(hù)端或者服務(wù)器。所示實(shí)施例的各處理步驟的先后執(zhí)行順序并不是必須的,可以根據(jù)需要調(diào)整步驟之間的先后執(zhí)行順序,一些步驟可以并行地執(zhí)行。
[0050]S301,數(shù)據(jù)接收方獲得待處理的第一數(shù)據(jù)文件。
[0051]所述待處理的第一數(shù)據(jù)文件可以是對(duì)原始數(shù)據(jù)文件篩選出預(yù)設(shè)范圍和/或預(yù)設(shè)類(lèi)目的關(guān)鍵信息,并對(duì)所述關(guān)鍵信息基于預(yù)設(shè)的格式和/或排列規(guī)則進(jìn)行排序處理后得到的數(shù)據(jù)文件。
[0052]S302,所述數(shù)據(jù)接收方基于所述第一數(shù)據(jù)文件生成與所述第一數(shù)據(jù)文件唯一對(duì)應(yīng)的第一校驗(yàn)信息。
[0053]S303,數(shù)據(jù)發(fā)送方獲得待處理的第三數(shù)據(jù)文件。
[0054]其中,所述第三數(shù)據(jù)文件與所述第一數(shù)據(jù)文件具有對(duì)應(yīng)關(guān)系,為執(zhí)行匹配處理的對(duì)象。
[0055]S304,所述數(shù)據(jù)發(fā)送方基于所述第三數(shù)據(jù)文件生成第三校驗(yàn)信息。
[0056]其中,所述數(shù)據(jù)發(fā)送方基于所述第三數(shù)據(jù)文件生成第三校驗(yàn)信息的方式與數(shù)據(jù)接收方生成第一校驗(yàn)信息的方式相同。所述第三校驗(yàn)信息的信息量小于所述第三數(shù)據(jù)文件的信息量。
[0057]需要說(shuō)明的是,S30US302與S303、S304之間可以并行地執(zhí)行。
[0058]S305,當(dāng)符合預(yù)設(shè)的觸發(fā)條件時(shí),所述數(shù)據(jù)發(fā)送方向所述數(shù)據(jù)接收方發(fā)送第三校驗(yàn)信息。
[0059]其中,所述預(yù)設(shè)的觸發(fā)條件包括:響應(yīng)于所述數(shù)據(jù)接收方的數(shù)據(jù)請(qǐng)求。所述數(shù)據(jù)請(qǐng)求用于請(qǐng)求進(jìn)行數(shù)據(jù)一致性匹配處理的數(shù)據(jù)文件,所述數(shù)據(jù)請(qǐng)求中可以包含用于標(biāo)識(shí)請(qǐng)求的數(shù)據(jù)文件的標(biāo)識(shí),例如第一數(shù)據(jù)文件和/或第三數(shù)據(jù)文件的標(biāo)識(shí),或者與所述數(shù)據(jù)文件對(duì)應(yīng)的信息,例如數(shù)據(jù)的范圍和/或數(shù)據(jù)的類(lèi)目信息等,在此不進(jìn)行限定。
[0060]所述預(yù)設(shè)的觸發(fā)條件還可以包括:當(dāng)預(yù)設(shè)的定時(shí)器被觸發(fā)時(shí)。例如,執(zhí)行數(shù)據(jù)匹配處理的雙方可以預(yù)先設(shè)定在預(yù)定的周期或者時(shí)間段進(jìn)行數(shù)據(jù)一致性匹配處理,當(dāng)預(yù)設(shè)的定時(shí)器被觸發(fā)時(shí),由一方向另一方發(fā)送相應(yīng)的數(shù)據(jù)。
[0061]這里,數(shù)據(jù)發(fā)送方發(fā)送的數(shù)據(jù)不是待比較的全部原始文件,而是基于數(shù)據(jù)文件生成的校驗(yàn)信息,由于校驗(yàn)信息的信息量遠(yuǎn)遠(yuǎn)小于數(shù)據(jù)文件的信息量,因此在雙方傳輸數(shù)據(jù)的過(guò)程中,可以有效減少傳輸?shù)臄?shù)據(jù)量,從而減少了數(shù)據(jù)傳輸對(duì)網(wǎng)絡(luò)的依賴(lài),并減少了帶寬資源占用,減少了等待時(shí)間。此外,由于傳輸?shù)男r?yàn)信息盡管基于數(shù)據(jù)文件而生成,但無(wú)法通過(guò)校驗(yàn)信息還原出原始數(shù)據(jù)文件,即便校驗(yàn)信息在網(wǎng)絡(luò)傳輸過(guò)程中被竊取,也不會(huì)影響數(shù)據(jù)安全,從而有效降低了原始數(shù)據(jù)文件被竊取、暴露的風(fēng)險(xiǎn),提高了數(shù)據(jù)安全性和保密性。
[0062]S306,數(shù)據(jù)接收方接收所述第三校驗(yàn)信息,將所述第三校驗(yàn)信息與所述第一校驗(yàn)信息進(jìn)行比較。
[0063]本發(fā)明具體實(shí)施時(shí),數(shù)據(jù)的一致性匹配是通過(guò)比較校驗(yàn)信息是否一致來(lái)確定數(shù)據(jù)文件是否相同。由于不同的數(shù)據(jù)文件生成的校驗(yàn)信息不同,因此通過(guò)比較校驗(yàn)信息,即可以確定數(shù)據(jù)文件是否相同。相對(duì)于將數(shù)據(jù)文件的各項(xiàng)條目逐筆比對(duì)的方式,本發(fā)明實(shí)施例提供的方法只需要比對(duì)一條校驗(yàn)信息,即可確定數(shù)據(jù)文件是否相同,大大減少了數(shù)據(jù)處理量,減少了對(duì)數(shù)據(jù)庫(kù)的訪問(wèn),提高了數(shù)據(jù)處理效率。
[0064]S307,當(dāng)所述第三校驗(yàn)信息與所述第一校驗(yàn)信息一致時(shí),則確定所述第三數(shù)據(jù)文件與所述第一數(shù)據(jù)文件相同。
[0065]S308,當(dāng)所述第三校驗(yàn)信息與所述第一校驗(yàn)信息不一致時(shí),則確定所述第三數(shù)據(jù)文件與所述第一數(shù)據(jù)文件不相同。
[0066]當(dāng)確定所述第三數(shù)據(jù)文件與所述第一數(shù)據(jù)文件不同時(shí),可以采取現(xiàn)有技術(shù)中逐筆核對(duì)的方式,從而確定宄竟是哪一個(gè)部分不一致。當(dāng)然,還可以采取圖4所示的處理方式。
[0067]參見(jiàn)圖4,示意性地示出了根據(jù)本發(fā)明再一實(shí)施例的數(shù)據(jù)一致性匹配處理方法流程示意圖。在圖3所示實(shí)施例后,當(dāng)在S308確定所述第三數(shù)據(jù)文件與所述第一數(shù)據(jù)文件不相同時(shí),可以執(zhí)行步驟S401所示方法。
[0068]S401,將待處理數(shù)據(jù)文件劃分為至少兩部分,包括第一部分和第二部分。
[0069]其中,當(dāng)確定所述第三校驗(yàn)信息與所述第一校驗(yàn)信息不一致時(shí),對(duì)第一數(shù)據(jù)文件進(jìn)行劃分,劃分后的第一數(shù)據(jù)文件至少包括第一部分和第二部分。
[0070]S402,基于待處理數(shù)據(jù)文件的第一部分生成對(duì)應(yīng)的第四校驗(yàn)信息,基于待處理的數(shù)據(jù)文件的第二部分生成第五校驗(yàn)信息。
[0071]具體地,當(dāng)待處理數(shù)據(jù)文件是第一數(shù)據(jù)文件時(shí),則基于所述第一數(shù)據(jù)文件的第一部分生成第四校驗(yàn)信息,基于所述第一數(shù)據(jù)文件的第二部分生成第五校驗(yàn)信息。
[0072]S403,向第三校驗(yàn)信息的發(fā)送方發(fā)送數(shù)據(jù)請(qǐng)求,用于請(qǐng)求第六校驗(yàn)信息和第七校驗(yàn)信息。
[0073]S404,接收第六校驗(yàn)信息與第七校驗(yàn)信息。
[0074]其中,所述第六校驗(yàn)信息基于所述第三數(shù)據(jù)文件的第一部分而生成,所述第七校驗(yàn)信息基于所述第三數(shù)據(jù)文件的第二部分而生成;所述第三數(shù)據(jù)文件的劃分方式與所述第一數(shù)據(jù)文件的劃分方式相同。也就是說(shuō),數(shù)據(jù)發(fā)送方響應(yīng)于數(shù)據(jù)接收方的請(qǐng)求,將第三數(shù)據(jù)文件劃分為至少兩個(gè)部分,并基于第三數(shù)據(jù)文件的第一部分生成第六校驗(yàn)信息,基于第三數(shù)據(jù)文件的第二部分生成第七校驗(yàn)信息。劃分第三數(shù)據(jù)文件的方式與劃分第一數(shù)據(jù)文件的方式相同。
[0075]S405,將所述第四校驗(yàn)信息與所述第六校驗(yàn)信息進(jìn)行比較,將所述第五校驗(yàn)信息與所述第七校驗(yàn)信息進(jìn)行比較。
[0076]S406,當(dāng)所述第四校驗(yàn)信息與所述第六校驗(yàn)信息不一致時(shí),則確定所述第一數(shù)據(jù)文件的第一部分與所述第三數(shù)據(jù)文件的第一部分不同。
[0077]S407,所述第五校驗(yàn)信息與所述第七校驗(yàn)信息不一致時(shí),則確定所述第一數(shù)據(jù)文件的第二部分與所述第三數(shù)據(jù)文件的第二部分不同。
[0078]需要說(shuō)明的是,如果確定第四校驗(yàn)信息與第六校驗(yàn)信息、第五校驗(yàn)信息與第七校驗(yàn)信息均不一致時(shí),則停止處理。
[0079]如果確定第四校驗(yàn)信息與第六校驗(yàn)信息、第五校驗(yàn)信息與第七校驗(yàn)信息僅有一者不一致時(shí),還可以繼續(xù)執(zhí)行二分比較處理。
[0080]則所述方法還包括:
[0081]當(dāng)確定所述第一數(shù)據(jù)文件的第一部分與所述第三數(shù)據(jù)文件的第一部分不同時(shí),將所述第一數(shù)據(jù)文件的第一部分劃分為至少兩部分,并基于劃分結(jié)果獲得第八校驗(yàn)信息與第九校驗(yàn)信息;
[0082]將所述第八校驗(yàn)信息與第九校驗(yàn)信息分別與基于劃分后的第三數(shù)據(jù)文件的第一部分獲得的第十校驗(yàn)信息與第十一校驗(yàn)信息比較。
[0083]重復(fù)上述過(guò)程,直到兩兩比較結(jié)果表明兩兩校驗(yàn)信息均不一致時(shí),停止比較校驗(yàn)信息,對(duì)所述校驗(yàn)信息對(duì)應(yīng)的數(shù)據(jù)文件進(jìn)行逐筆核對(duì)處理。
[0084]根據(jù)上述處理方式,替代于逐筆核對(duì)數(shù)據(jù)文件的方式,可以?xún)H通過(guò)劃分?jǐn)?shù)據(jù)文件,并基于劃分后的數(shù)據(jù)文件生成校驗(yàn)信息,比較校驗(yàn)信息的方式可以逐步確定數(shù)據(jù)不一致的部分,從而大大減少了數(shù)據(jù)處理的工作量,提高了數(shù)據(jù)處理效率。特別是對(duì)于大型的數(shù)據(jù)庫(kù)處理而言,上述方式有效減少了數(shù)據(jù)的輸入輸出處理,提高了數(shù)據(jù)庫(kù)性能。當(dāng)然,當(dāng)兩個(gè)數(shù)據(jù)文件的數(shù)據(jù)不一致地方較多且分布不均勻時(shí),當(dāng)發(fā)現(xiàn)對(duì)數(shù)據(jù)文件劃分的至少兩部分所生成的校驗(yàn)信息均不一致時(shí),說(shuō)明無(wú)法區(qū)分不一致的地方在哪一部分,則停止迭代比較處理。由于在大部分情況下,待處理的兩份數(shù)據(jù)文件很少出現(xiàn)數(shù)據(jù)不一致的情況,因此應(yīng)用本發(fā)明的方法從整體處理效率上仍遠(yuǎn)遠(yuǎn)由于現(xiàn)有技術(shù)逐筆核對(duì)的方法。
[0085]示例件設(shè)各
[0086]在介紹了本發(fā)明示例性實(shí)施方式的方法之后,接下來(lái),參考圖5對(duì)本發(fā)明示例性實(shí)施方式的、用于執(zhí)行數(shù)據(jù)一致性匹配處理的設(shè)備進(jìn)行介紹。
[0087]—種設(shè)備500,包括:
[0088]獲得單元501,配置用于獲得待處理的第一數(shù)據(jù)文件。
[0089]校驗(yàn)信息生成單元502,配置用于基于所述第一數(shù)據(jù)文件生成與所述第一數(shù)據(jù)文件唯一對(duì)應(yīng)的第一校驗(yàn)信息;其中,不同的數(shù)據(jù)文件生成的校驗(yàn)信息不同,所述第一校驗(yàn)信息的信息量小于所述第一數(shù)據(jù)文件的信息量;所述第一校驗(yàn)信息用于進(jìn)行數(shù)據(jù)一致性匹配處理;其中,所述數(shù)據(jù)一致性匹配處理包括:將所述第一校驗(yàn)信息與對(duì)應(yīng)于第二數(shù)據(jù)文件的第二校驗(yàn)信息進(jìn)行比較,如果所述第一校驗(yàn)信息與所述第二校驗(yàn)信息一致,則確定所述第一數(shù)據(jù)文件和所述第二數(shù)據(jù)文件相同。
[0090]進(jìn)一步的,所述獲得單元501具體配置用于:獲得待處理的原始數(shù)據(jù)文件,從所述原始數(shù)據(jù)文件篩選出預(yù)設(shè)范圍和/或預(yù)設(shè)類(lèi)目的關(guān)鍵信息;將所述關(guān)鍵信息作為待處理的第一數(shù)據(jù)文件。
[0091]進(jìn)一步的,所述獲得單元501獲得的所述待處理的第一數(shù)據(jù)文件為經(jīng)過(guò)排序處理后的數(shù)據(jù)文件,所述排序處理包括:對(duì)篩選出的所述關(guān)鍵信息進(jìn)行排序,所述排序過(guò)程基于預(yù)設(shè)的格式和/或排列規(guī)則而執(zhí)行。
[0092]進(jìn)一步的,所述設(shè)備還包括:
[0093]發(fā)送單元,配置用于向數(shù)據(jù)接收方發(fā)送所述第一校驗(yàn)信息,所述第一校驗(yàn)信息用于所述數(shù)據(jù)接收方利用所述第一校驗(yàn)信息進(jìn)行數(shù)據(jù)一致性匹配處理。
[0094]進(jìn)一步的,所述設(shè)備還包括:
[0095]接收單元,配置用于接收第三校驗(yàn)信息,所述第三校驗(yàn)信息基于第三數(shù)據(jù)文件而生成,所述第三校驗(yàn)信息與所述第三數(shù)據(jù)文件具有一一對(duì)應(yīng)關(guān)系;
[0096]比較單元,配置用于將所述第三校驗(yàn)信息與所述第一校驗(yàn)信息進(jìn)行比較;
[0097]確定單元,配置用于如果所述第三校驗(yàn)信息與所述第一校驗(yàn)信息一致,則確定所述第三數(shù)據(jù)文件與所述第一數(shù)據(jù)文件相同。
[0098]進(jìn)一步的,所述設(shè)備還包括:
[0099]劃分單元,配置用于當(dāng)確定所述第三校驗(yàn)信息與所述第一校驗(yàn)信息不一致時(shí),對(duì)所述第一數(shù)據(jù)文件進(jìn)行劃分,劃分后的第一數(shù)據(jù)文件至少包括第一部分和第二部分;
[0100]所述校驗(yàn)信息生成單元還配置用于基于所述第一數(shù)據(jù)文件的第一部分生成第四校驗(yàn)信息,基于所述第一數(shù)據(jù)文件的第二部分生成第五校驗(yàn)信息;
[0101]所述發(fā)送單元還配置用于向第三校驗(yàn)信息的發(fā)送方發(fā)送數(shù)據(jù)請(qǐng)求,用于請(qǐng)求第六校驗(yàn)信息和第七校驗(yàn)信息;
[0102]所述接收單元還配置用于接收第六校驗(yàn)信息與第七校驗(yàn)信息;其中,所述第六校驗(yàn)信息基于所述第三數(shù)據(jù)文件的第一部分而生成,所述第七校驗(yàn)信息基于所述第三數(shù)據(jù)文件的第二部分而生成;所述第三數(shù)據(jù)文件的劃分方式與所述第一數(shù)據(jù)文件的劃分方式相同;
[0103]所述比較單元還配置用于將所述第四校驗(yàn)信息與所述第六校驗(yàn)信息進(jìn)行比較,將所述第五校驗(yàn)信息與所述第七校驗(yàn)信息進(jìn)行比較;
[0104]所述確定單元還配置用于當(dāng)所述第四校驗(yàn)信息與所述第六校驗(yàn)信息不一致時(shí),則確定所述第一數(shù)據(jù)文件的第一部分與所述第三數(shù)據(jù)文件的第一部分不同;當(dāng)所述第五校驗(yàn)信息與所述第七校驗(yàn)信息不一致時(shí),則確定所述第一數(shù)據(jù)文件的第二部分與所述第三數(shù)據(jù)文件的第二部分不同。
[0105]進(jìn)一步的:
[0106]所述劃分單元還配置用于當(dāng)確定所述第一數(shù)據(jù)文件的第一部分與所述第三數(shù)據(jù)文件的第一部分不同時(shí),將所述第一數(shù)據(jù)文件的第一部分劃分為至少兩部分,并基于劃分結(jié)果獲得第八校驗(yàn)信息與第九校驗(yàn)信息;
[0107]所述比較單元還用于將所述第八校驗(yàn)信息與第九校驗(yàn)信息分別與基于劃分后的第三數(shù)據(jù)文件的第一部分獲得的第十校驗(yàn)信息與第十一校驗(yàn)信息比較;
[0108]所述設(shè)備還包括:
[0109]迭代單元,配置用于重復(fù)上述過(guò)程,直到兩兩比較結(jié)果表明兩兩校驗(yàn)信息均不一致時(shí),停止比較校驗(yàn)信息,對(duì)所述校驗(yàn)信息對(duì)應(yīng)的數(shù)據(jù)文件進(jìn)行逐筆核對(duì)處理。
[0110]進(jìn)一步的,所述設(shè)備還包括:
[0111]狀態(tài)更新單元,配置用于當(dāng)完成對(duì)校驗(yàn)信息的比較,更新與所述校驗(yàn)信息對(duì)應(yīng)的數(shù)據(jù)文件的狀態(tài)為已處理
[0112]應(yīng)當(dāng)注意,盡管在上文詳細(xì)描述中提及了數(shù)據(jù)一致性匹配處理設(shè)備的若干裝置或子裝置,但是這種劃分僅僅并非強(qiáng)制性的。實(shí)際上,根據(jù)本發(fā)明的實(shí)施方式,上文描述的兩個(gè)或更多裝置的特征和功能可以在一個(gè)裝置中具體化。反之,上文描述的一個(gè)裝置的特征和功能可以進(jìn)一步劃分為由多個(gè)裝置來(lái)具體化。
[0113]此外,盡管在附圖中以特定順序描述了本發(fā)明方法的操作,但是,這并非要求或者暗示必須按照該特定順序來(lái)執(zhí)行這些操作,或是必須執(zhí)行全部所示的操作才能實(shí)現(xiàn)期望的結(jié)果。附加地或備選地,可以省略某些步驟,將多個(gè)步驟合并為一個(gè)步驟執(zhí)行,和/或?qū)⒁粋€(gè)步驟分解為多個(gè)步驟執(zhí)行。
[0114]雖然已經(jīng)參考若干【具體實(shí)施方式】描述了本發(fā)明的精神和原理,但是應(yīng)該理解,本發(fā)明并不限于所公開(kāi)的【具體實(shí)施方式】,對(duì)各方面的劃分也不意味著這些方面中的特征不能組合以進(jìn)行受益,這種劃分僅是為了表述的方便。本發(fā)明旨在涵蓋所附權(quán)利要求的精神和范圍內(nèi)所包括的各種修改和等同布置。
【權(quán)利要求】
1.一種方法,包括: 獲得待處理的第一數(shù)據(jù)文件; 基于所述第一數(shù)據(jù)文件生成與所述第一數(shù)據(jù)文件唯一對(duì)應(yīng)的第一校驗(yàn)信息;其中,不同的數(shù)據(jù)文件生成的校驗(yàn)信息不同,所述第一校驗(yàn)信息的信息量小于所述第一數(shù)據(jù)文件的信息量;所述第一校驗(yàn)信息用于進(jìn)行數(shù)據(jù)一致性匹配處理; 其中,所述數(shù)據(jù)一致性匹配處理包括:將所述第一校驗(yàn)信息與對(duì)應(yīng)于第二數(shù)據(jù)文件的第二校驗(yàn)信息進(jìn)行比較,如果所述第一校驗(yàn)信息與所述第二校驗(yàn)信息一致,則確定所述第一數(shù)據(jù)文件和所述第二數(shù)據(jù)文件相同。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲得待處理的第一數(shù)據(jù)文件包括: 獲得待處理的原始數(shù)據(jù)文件,從所述原始數(shù)據(jù)文件篩選出預(yù)設(shè)范圍和/或預(yù)設(shè)類(lèi)目的關(guān)鍵?目息; 將所述關(guān)鍵信息作為待處理的第一數(shù)據(jù)文件。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述待處理的第一數(shù)據(jù)文件為經(jīng)過(guò)排序處理后的數(shù)據(jù)文件,所述排序處理包括:對(duì)篩選出的所述關(guān)鍵信息進(jìn)行排序,所述排序過(guò)程基于預(yù)設(shè)的格式和/或排列規(guī)則而執(zhí)行。
4.根據(jù)權(quán)利要求1所述的方法,還包括: 向數(shù)據(jù)接收方發(fā)送所述第一校驗(yàn)信息,所述第一校驗(yàn)信息用于所述數(shù)據(jù)接收方利用所述第一校驗(yàn)信息進(jìn)行數(shù)據(jù)一致性匹配處理。
5.根據(jù)權(quán)利要求1所述的方法,還包括: 接收第三校驗(yàn)信息,所述第三校驗(yàn)信息基于第三數(shù)據(jù)文件而生成,所述第三校驗(yàn)信息與所述第三數(shù)據(jù)文件具有一一對(duì)應(yīng)關(guān)系; 將所述第三校驗(yàn)信息與所述第一校驗(yàn)信息進(jìn)行比較,如果一致,則確定所述第三數(shù)據(jù)文件與所述第一數(shù)據(jù)文件相同。
6.根據(jù)權(quán)利要求5所述的方法,還包括: 當(dāng)確定所述第三校驗(yàn)信息與所述第一校驗(yàn)信息不一致時(shí),對(duì)所述第一數(shù)據(jù)文件進(jìn)行劃分,劃分后的第一數(shù)據(jù)文件至少包括第一部分和第二部分; 基于所述第一數(shù)據(jù)文件的第一部分生成第四校驗(yàn)信息,基于所述第一數(shù)據(jù)文件的第二部分生成第五校驗(yàn)信息; 向第三校驗(yàn)信息的發(fā)送方發(fā)送數(shù)據(jù)請(qǐng)求,用于請(qǐng)求第六校驗(yàn)信息和第七校驗(yàn)信息; 接收第六校驗(yàn)信息與第七校驗(yàn)信息;其中,所述第六校驗(yàn)信息基于所述第三數(shù)據(jù)文件的第一部分而生成,所述第七校驗(yàn)信息基于所述第三數(shù)據(jù)文件的第二部分而生成;所述第三數(shù)據(jù)文件的劃分方式與所述第一數(shù)據(jù)文件的劃分方式相同; 將所述第四校驗(yàn)信息與所述第六校驗(yàn)信息進(jìn)行比較,將所述第五校驗(yàn)信息與所述第七校驗(yàn)信息進(jìn)行比較; 當(dāng)所述第四校驗(yàn)信息與所述第六校驗(yàn)信息不一致時(shí),則確定所述第一數(shù)據(jù)文件的第一部分與所述第三數(shù)據(jù)文件的第一部分不同;當(dāng)所述第五校驗(yàn)信息與所述第七校驗(yàn)信息不一致時(shí),則確定所述第一數(shù)據(jù)文件的第二部分與所述第三數(shù)據(jù)文件的第二部分不同。
7.根據(jù)權(quán)利要求6所述的方法,還包括: 當(dāng)確定所述第一數(shù)據(jù)文件的第一部分與所述第三數(shù)據(jù)文件的第一部分不同時(shí),將所述第一數(shù)據(jù)文件的第一部分劃分為至少兩部分,并基于劃分結(jié)果獲得第八校驗(yàn)信息與第九校驗(yàn)信息; 將所述第八校驗(yàn)信息與第九校驗(yàn)信息分別與基于劃分后的第三數(shù)據(jù)文件的第一部分獲得的第十校驗(yàn)信息與第十一校驗(yàn)信息比較; 重復(fù)上述過(guò)程,直到兩兩比較結(jié)果表明兩兩校驗(yàn)信息均不一致時(shí),停止比較校驗(yàn)信息,對(duì)所述校驗(yàn)信息對(duì)應(yīng)的數(shù)據(jù)文件進(jìn)行逐筆核對(duì)處理。
8.根據(jù)權(quán)利要求1所述的方法,還包括: 當(dāng)完成對(duì)校驗(yàn)信息的比較,更新與所述校驗(yàn)信息對(duì)應(yīng)的數(shù)據(jù)文件的狀態(tài)為已處理。
9.一種設(shè)備,包括: 獲得單元,配置用于獲得待處理的第一數(shù)據(jù)文件; 校驗(yàn)信息生成單元,配置用于基于所述第一數(shù)據(jù)文件生成與所述第一數(shù)據(jù)文件唯一對(duì)應(yīng)的第一校驗(yàn)信息;其中,不同的數(shù)據(jù)文件生成的校驗(yàn)信息不同,所述第一校驗(yàn)信息的信息量小于所述第一數(shù)據(jù)文件的信息量;所述第一校驗(yàn)信息用于進(jìn)行數(shù)據(jù)一致性匹配處理;其中,所述數(shù)據(jù)一致性匹配處理包括:將所述第一校驗(yàn)信息與對(duì)應(yīng)于第二數(shù)據(jù)文件的第二校驗(yàn)信息進(jìn)行比較,如果所述第一校驗(yàn)信息與所述第二校驗(yàn)信息一致,則確定所述第一數(shù)據(jù)文件和所述第二數(shù)據(jù)文件相同。
10.根據(jù)權(quán)利要求9所述的設(shè)備,其特征在于,所述獲得單元具體配置用于:獲得待處理的原始數(shù)據(jù)文件,從所述原始數(shù)據(jù)文件篩選出預(yù)設(shè)范圍和/或預(yù)設(shè)類(lèi)目的關(guān)鍵信息;將所述關(guān)鍵信息作為待處理的第一數(shù)據(jù)文件。
【文檔編號(hào)】G06F21/64GK104504347SQ201510028018
【公開(kāi)日】2015年4月8日 申請(qǐng)日期:2015年1月20日 優(yōu)先權(quán)日:2015年1月20日
【發(fā)明者】沈國(guó)鑫, 王磊 申請(qǐng)人:網(wǎng)易寶有限公司