這兩天,又一個關于新冠肺炎的 GitHub 登上了中文趨勢榜的首位,截至目前,已經收獲近 5K Star,600+ Fork。
介紹
此處收集内地各類傳媒和公衆号釋出(原創或轉載)的有關新型冠狀病毒感染的肺炎(2019-nCoV)的深度報道、非虛構作品及親曆者個人叙述,并将持續更新。希望這一選編有助于了解疫情及其影響下的每一個人,并幫助相關研究者做初步的資料收集。
聲明
這個站點的目的,是建立一個友善網友及研究人士(如自然語言處理、疫情防治)取用相關資料的資料庫,并無其他考量。其中所有内容均來自網絡。我們十分感謝創作這些文章的傳媒、記者及其他寫作者。本文檔除搜集行為本身,并無原創性,僅為交流學習之用。若遇侵權投訴,将視情況撤除相關内容。
資料庫中收錄了 2020 年新型冠狀病毒感染的肺炎相關媒體報道、非虛構作品和親曆者個人叙述。所有的内容均來源于網絡,一個完整的條目從可信的信源收錄内容,包括日期、标題、原始 URL、截圖、archive 等要素,并且暫時不收錄評論、分析、科普等類别的作品。

項目的具體結構如下:
├─archive 文章的存檔,目前提供jpg格式
│ └─jpg
│ ├─1.jpg
│ └─...
├─data csv格式的文章資料
│ └─data.csv
├─docs 一個用于展示README的github page
├─gh-page
├─template README模闆
│ └─README.handlebars
├─utils 建構README的工具
│ ├─generateReadmeFromCsv.js
│ └─...
└─README.md 主文檔
複制
項目意義何在?
毫無疑問,這次的疫情已經成為了一場全民戰争。從最開始的武漢加油到現在的中國加油,我們不停的讨論着疫情的發展。
我們會為在疫情中失去生命的人員痛惜,為醫護人員、抗疫一線人員的奉獻精神所感動;我們會自我隔離、随時佩戴戴口罩,這些都是我們力所能及的小事兒,但我們每一個人都在為抗疫勝利而努力。
但不管最終結果如何、疫情何時結束,這都是一段在我們心中無法忘卻的曆史,而我們能做的,就是通過記錄完整的事件曆程,通過大資料分析來得出一些相關結論,避免悲劇的再次發生。這也是大資料給我們帶來的價值之一。
技術從業者們在用這樣的方式,和媒體人一起努力,共同記錄、儲存曆史。
無論是傳統媒體,還是自媒體,作者們都不希望自己記錄下的文字和影像隻是昙花一現,便在資訊海洋中歸于沉寂,以後再也不會被發現。
這樣的項目也為後人的檢視提供了詳細、完善整理的資料。當疫情後平靜的世界再想研究這次疫情的發生、傳播和結束,再想去系統的觀察疫情中的醫務人員、公務人員以及各行各業中的普通人的經曆,都可以在這個地方找到豐富的資料。
項目的原作者是為了這個項目單獨開的小号,我們不知道這是一位媒體人還是一位經常使用 GitHub 的程式員,但是在這個滿是代碼的平台上,不止這一個項目在用共享代碼的技術,共享并儲存着 2019nCov 的相關資訊。
「2020新冠肺炎記憶:報道、非虛構與個人叙述」GitHub 項目位址:https://github.com/2019ncovmemory/nCovMemory