天天看點

《社會調查資料管理——基于Stata 14管理CGSS資料》一1.2 資料管理内容不清

本節書摘來自異步社群《社會調查資料管理——基于stata 14管理cgss資料》一書中的第1章,第1.2節,作者 唐麗娜,更多章節内容可以通路雲栖社群“異步社群”公衆号檢視

資料管理不被重視,原因很多,其中一個最重要的緣由當屬資料管理的工作内容不清。資料管理,乍一聽起來,好像知道是什麼,但是真要動手做起來,就有些找不着北。特别是對社會調查資料來說,資料管理的界限更是一個讓人頭疼的問題。

資料管理,簡單地說,在社會調查中,凡是和資料有關的工作都屬于資料管理的範疇,除此之外,當社會調查資料收集完成後,資料的錄入、清洗、儲存、存檔、釋出等也都是資料管理的重要組成部分。根據工作時間,可以把社會調查資料管理分為三個階段:資料收集前的管理工作、資料收集過程中的管理工作和資料收集後的管理工作。

目前,國内的資料管理做得非常淺,尤其是資料收集前的資料管理幾乎無人問津,理所當然地認為這個階段沒有和資料有關的工作。實際上,撇開這個階段的問卷設計和抽樣設計等和資料管理息息有關的工作,單是編碼手冊的制定,就是任何一項資料管理的重中之重,它會直接影響到問卷設計、樣本設計、資料采集、資料錄入、資料清理。通常,資料收集後的管理階段是很多人認為的資料管理,即便如此,這個階段的工作也做得馬馬虎虎,很多社會調查項目都忽視了這個階段的資料清理工作,以為把資料錄入計算機後,得到的電子版資料能直接用于統計分析和學術研究,忽略了資料中多變量間的邏輯模式檢驗、對缺失值模式的設計、删除敏感資訊/識别資訊等。沒有經過這些管理的資料,大多數都是糟糕的資料,不僅不利于學術研究和社會研究,而且有可能使研究結果産生誤導性,甚至是災難性的影響。

繼續閱讀