該項目是浙江大學地理空間資料庫課程作業8:空間分析中,使用 flask + pyecharts 搭建的簡單新冠肺炎疫情資料可視化互動分析平台,包含疫情資料擷取、态勢感覺、預測分析、輿情監測等任務
包含完整代碼和實作的github位址:
https://github.com/yunwei37/COVID-19-NLP-vis 項目分析報告已部署到網頁端,可點選 http://flask.yunwei123.tech/進行檢視
互動可視化分析截圖:

空間資料分析 作業要求
作業目的:
了解空間資料在日常生活中的應用,熟悉空間資料統計分析、空間資料挖掘、空間資料可視化等技術。
作業内容:
新型冠狀病毒肺炎(COVID-19,簡稱“新冠肺炎”)疫情肆虐全球多個國家,2020年3月11日,世界衛生組織 (WHO) 正式宣布将新冠肺炎列為全球性大流行病。在全球抗擊新型冠狀病毒疫情的過程中,産生了前所未有的大規模疫情資料,利用大資料分析技術和方法能夠協助發現病毒傳染源、監測疫情發展、調配救援物資,進而更好地進行疫情防控工作。空間資料分析作為大資料分析的重要組成,将資料智能處理、直覺展示和互動分析有機地結合,使機器智能和人類智慧深度融合、優勢互補,為疫情防控中的分析、指揮和決策提供有效依據和指南。
作業要求以新冠疫情或其它重大公共衛生事件的相關時空資料為基礎,利用資料清洗與管理、統計分析、資料挖掘、資料可視化等相關技術和方法,探索并發現疫情大資料背後隐藏的模式和規律。請選擇一個具體的研究題目,進行深入分析。
選題:疫情預測與輿情監測:
本項目希望能利用互動式空間資料分析技術,感覺和預測疫情發展趨勢與關鍵節點、分析社交媒體話題與情感的動态演變、對社會輿情進行态勢感覺。
文檔與目錄結構
- dataSets:使用的資料集
- china_provincedata.csv 中國各省、直轄市、自治區、特别行政區的疫情資料
- countrydata.csv 全球214個國家地區以及鑽石公主号郵輪的疫情資料
- nCoV_900k_train.unlabled.csv
資料集依據與“新冠肺炎”相關的230個主題關鍵詞進行資料采集,抓取了2020年1月1日—2020年2月20日期間共計100萬條微網誌資料,并對其中10萬條資料進行人工标注,标注分為三類,分别為:1(積極),0(中性)和-1(消極)。
- nCoV_100k_train.labled.csv 同上,有标注
資料集太大了就先不上傳了
- nCov_10k_test.csv 同上
- yqkx_data-5_21.csv 使用爬蟲擷取的人民網疫情快訊新聞100篇
- 中國社會組織_疫情防控-5_21.csv 中國社會組織公共服務平台疫情防控專區新聞
- weiboComments-5_21.csv 5.21微網誌《戰疫情》主題下的微網誌和評論資料
- notebook 分析時使用的notebook
- scripts python腳本(爬蟲、可視化、資料處理等等)
- spider-yqkx.py 人民網爬蟲
- spider-社會組織.py 中國社會組織公共服務平台爬蟲
- weibo_戰疫情爬蟲_spider.py 微網誌《戰疫情》爬蟲
- pyecharts-zhexian-country.py 使用pyecharts繪制任一國家疫情資料曲線圖
- hierachy.py 層次聚類分析代碼
- jiebafenci.py jieba分詞代碼及詞雲圖渲染
- lineCountry.py 生成疫情曲線圖
- logistic.py logistic分析代碼
- mapchina.py 生成中國疫情地圖
- mapworld.py 生成世界疫情地圖
- mergeweibo.py weiboprocess.py 微網誌資料處理工具
- weiboAnalyse.py 微網誌資料分析代碼
- wordData.py weiboWordData.py 詞雲圖儲存資料
- tfidf.py tfidf值可視化
- sentiments.py 情感分析
- templates: 網站html/css/js及圖檔檔案
作業部分相關技術棧
- 資料庫的建構與sql語句查詢
- pyEcharts可視化
- postgres sql資料分析
- snownlp 情感分析
- jieba
- flask