技術編號:10580140
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術詳細信息。近幾年,人們收集了大量的數(shù)據(jù)。同時,數(shù)據(jù)科學家也成為各大公司炙手可熱的工作。但是,現(xiàn)在缺乏足夠的工具幫助數(shù)據(jù)科學家分析數(shù)據(jù)流。隨著數(shù)據(jù)科學的任務越來越復雜,許多數(shù)據(jù)分析師開始改造代碼版本工具,比如說Git。但是,數(shù)據(jù)科學的任務并不是Git可以完全處理的。首先,數(shù)據(jù)科學是以數(shù)據(jù)為中心的。一個數(shù)據(jù)集可以經(jīng)過清洗、標記和預處理等幾個操作。這樣數(shù)據(jù)集就產(chǎn)生了多個版本。數(shù)據(jù)科學家需要記錄這些版本以及隨時修改數(shù)據(jù)。一種常見但并不推薦的方法就是保存多個副本,并將些副本分...
注意:該技術已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權人授權前,僅供技術研究參考不得用于商業(yè)用途。
該專利適合技術人員進行技術研發(fā)參考以及查看自身技術是否侵權,增加技術思路,做技術知識儲備,不適合論文引用。
請注意,此類技術沒有源代碼,用于學習研究技術思路。