資料集網站收集(持續更新)
1.Kaggle: https://www.kaggle.com/
- 可以按關鍵字搜尋資料集
- 自帶讨論區
- 有熱心群衆分享自己的Kernel,可供參考(熱心群衆們自己對資料的分析代碼)
2.天池: https://tianchi.aliyun.com/competition/gameList/algorithmList
- 包括阿裡系公司(淘寶,餓了麼)的部分業務資料(不是很全,隻作為賽題資料)
- 需要登入才可以下載下傳
2.UCI Machine Learning Repositoryhttp://archive.ics.uci.edu/ml/datasets.php
- 可以按任務類型(用于分類,回歸,聚類),資料類型(文本,時序),領域(工程,CS,商業),特征數量等進行篩選
3.美國政府開放資料Data.gov https://www.data.gov/
- 分為農業,氣候,教育等多個主題
4.中國國家統計局 http://data.stats.gov.cn/easyquery.htm?cn=A01
- 需要登入
- 網站自帶一定的可視化功能
- 資料可導出為csv,pdf等格式
- 包括國家的工業,農業,運輸業,經濟等方方面面的資料
- 可以自行選擇資料的時間跨度,例如按年導出(2015-2019工業年産值),按月導出(2015.2-2020.2鐵路旅客運輸量)