技術(shù)總結(jié)
一種基于樣本數(shù)據(jù)的數(shù)據(jù)探測和擴充方法及裝置,所述方法包括如下步驟:基于數(shù)據(jù)庫中的至少一條數(shù)據(jù)確定所述樣本數(shù)據(jù),所述數(shù)據(jù)庫存儲有從海量數(shù)據(jù)中探測獲得的多條數(shù)據(jù);基于所述樣本數(shù)據(jù)在所述海量數(shù)據(jù)中查找,以獲得所述海量數(shù)據(jù)中與所述樣本數(shù)據(jù)相匹配的匹配數(shù)據(jù);對所述匹配數(shù)據(jù)進(jìn)行處理以獲得匹配規(guī)則,并更新指紋庫,所述指紋庫存儲有歷史上獲得的匹配規(guī)則;基于更新后的指紋庫在所述海量數(shù)據(jù)中進(jìn)行匹配提取,以獲得所述海量數(shù)據(jù)中與所述更新后的指紋庫中的匹配規(guī)則相匹配的數(shù)據(jù),并將匹配獲得的數(shù)據(jù)擴充至所述數(shù)據(jù)庫。通過本發(fā)明提供的技術(shù)方案能夠更加準(zhǔn)確、高效的對海量數(shù)據(jù)進(jìn)行全局、系統(tǒng)的分析和處理。
技術(shù)研發(fā)人員:湯奇峰;李炳輝
受保護的技術(shù)使用者:晶贊廣告(上海)有限公司
文檔號碼:201611264829
技術(shù)研發(fā)日:2016.12.30
技術(shù)公布日:2017.06.13