天天看點

資料集網站收集(可用于機器學習,資料挖掘等,持續更新)

資料集網站收集(持續更新)

1.Kaggle: https://www.kaggle.com/

  • 可以按關鍵字搜尋資料集
  • 自帶讨論區
  • 有熱心群衆分享自己的Kernel,可供參考(熱心群衆們自己對資料的分析代碼)

2.天池: https://tianchi.aliyun.com/competition/gameList/algorithmList

  • 包括阿裡系公司(淘寶,餓了麼)的部分業務資料(不是很全,隻作為賽題資料)
  • 需要登入才可以下載下傳

2.UCI Machine Learning Repositoryhttp://archive.ics.uci.edu/ml/datasets.php

  • 可以按任務類型(用于分類,回歸,聚類),資料類型(文本,時序),領域(工程,CS,商業),特征數量等進行篩選

3.美國政府開放資料Data.gov https://www.data.gov/

  • 分為農業,氣候,教育等多個主題

4.中國國家統計局 http://data.stats.gov.cn/easyquery.htm?cn=A01

  • 需要登入
  • 網站自帶一定的可視化功能
  • 資料可導出為csv,pdf等格式
  • 包括國家的工業,農業,運輸業,經濟等方方面面的資料
  • 可以自行選擇資料的時間跨度,例如按年導出(2015-2019工業年産值),按月導出(2015.2-2020.2鐵路旅客運輸量)

繼續閱讀