本節書摘來自異步社群《社會調查資料管理——基于stata 14管理cgss資料》一書中的第2章,第2.2節,作者 唐麗娜,更多章節内容可以通路雲栖社群“異步社群”公衆号檢視
對社會調查資料而言,資料管理工作從調查工作啟動之日開始。調查資料來源于社會調查,社會調查是生産資料的一種重要工具。資料管理的最終目标是確定資料品質。高品質資料有兩個基本判斷标準:真實、有效,即資料盡量接近事實(真實性),且能為研究所用(有效性)。為此,資料管理工作至少要滿足以下6個基本要求。
1.目标清晰
上面提到,資料管理貫穿整個社會調查全程,不僅曆時長,且任務雜。在這種情況下,每一階段、每一步的管理目标都要明确清晰,以便管理工作的配置設定和管理人員的安排,否則容易出現漏做、重做等問題,影響資料品質。
2.任務可行
确定目标後,接下來要做的工作就是把目标分解成各級任務。資料管理者一定要注意:任務可以是不完美的,但一定要可行。在資料管理過程中,常見的一種困境是:任務明确,但不具備可操作性。舍棄“完美主義”,在現有的時間、資金、人力等資源條件下,盡可能好地完成任務。同理,在這個世界上很難找出沒有問題的社會調查,找不到能完全真實反映社會現實的資料,一切社會調查所得的資料都隻能是無限接近事實。
3.流程簡易
目标和任務确定後,接下來要考慮到工作流程。制定工作流程的基本标準:簡易。越複雜的工作流程,越容易出錯。在某一項具體的資料管理工作中,參與的人員越多,工作流程的制定就越簡易,因為對不同的人而言,簡易的标準不一樣,如同樣的事情,能用常見軟體完成,就不要用小衆軟體,如果采用小衆軟體,不僅給合作者帶來很多負擔和學習壓力,而且會增加出錯的可能性。
4.職責明确
目标不會自動實作,任務不會自動完成,流程不會自動走完,事情最終是由人來完成的,再完美的工作計劃如果沒有合适的人承擔,那它幾乎就等于零。任何一項資料管理工作都不可能由一個人單獨完成,後面會講到“雙錄”“雙校”,任何一項和資料管理有關的工作,都盡量保證由兩個人獨立完成,并做事後校驗。 在大型資料管理項目中,整個工作流程類似工業生産的生産線,環環相扣,每個環節的從業人員都要清楚地知道自己的權限和職責,否則一環出錯,整個流程就會崩潰。比如:通常,資料編碼手冊在問卷設計時就要考慮到,而且問卷一旦确定,資料編碼手冊也就基本定型。資料清理員在拿到原始資料之後,必須要對照資料編碼手冊對每個變量逐一進行檢驗。
5.标準統一
在大型資料管理中,标準統一極其重要。隻有用同一标準管理的資料,才有可能進行合并,“外人”才有可能讀懂資料。資料管理的忌諱是:标準不一,朝令夕改。假設有一個關于健康的、5年的追蹤調查,體重這個變量在第一年的資料中機關是公斤,第二年機關變成斤,第三年也是斤,第四年又變成公斤,第五年也用到公斤。這樣,使用者使用資料時稍不注意,就有可能直接把5年的體重合并在一起比較。再如,在一個多年的追蹤調查中,同一個變量“收入”使用的是不同的變量名:income、incomeyr、perincome等。
6.靈活拓展
好的資料管理工作标準和工作流程應該具備一定的可拓展性。對不同的項目進行資料管理時,可能會用到不同的标準和流程,但沒有必要對所有的項目都重建立立一套新的标準和流程,相似的資料管理項目可以互相借鑒,比如:對cgss2012年的資料管理工作流程進行一定的拓展和修改後,即可用作cgss2013年的工作流程。再如,中國宗教調查是一個全新的項目,針對這個項目的資料管理就是基于cgss的資料管理工作流程和内容改出來的,既省時、省力,還行之有效。
在上述标準基礎之上,盡量提高管理效率,優化管理流程,實作管理自動化,保證管理标準化。