技術(shù)特征:
技術(shù)總結(jié)
本發(fā)明實施例公開了一種處理數(shù)據(jù)的方法及裝置。該方法包括:獲取數(shù)據(jù)樣本以及數(shù)據(jù)樣本各屬性的屬性信息;根據(jù)所述屬性信息對所述數(shù)據(jù)樣本進行聚類計算以確定各類數(shù)據(jù)樣本對應(yīng)的填充值,并根據(jù)所述填充值更新對應(yīng)的數(shù)據(jù)樣本;如果更新后的數(shù)據(jù)樣本符合結(jié)束條件,則結(jié)束操作;否則,則對更新后的數(shù)據(jù)樣本重新進行聚類計算,直至更新后的數(shù)據(jù)樣本符合結(jié)束條件為止。本發(fā)明實施例通過采用上述技術(shù)方案,通過聚類計算確定填充值以及各填充值對應(yīng)的包含缺失值的數(shù)據(jù)樣本,可以提高填充值的正確性與數(shù)據(jù)信息的有效性,提高缺失值的處理速度,減少處理缺失值所需的時間,進而提高后續(xù)數(shù)據(jù)處理流程的準確性與整個數(shù)據(jù)處理過程的平均速度。
技術(shù)研發(fā)人員:徐驕
受保護的技術(shù)使用者:廣州視源電子科技股份有限公司
技術(shù)研發(fā)日:2017.03.10
技術(shù)公布日:2017.07.04