天天看點

如何避免問卷裡的哪些“坑”?多的是你不知道的事

學術研究中,通過問卷收集資料,進行分析的情況越來越多。但在問卷收集資料時,難免會出現填寫者亂填,或者不知道如何填寫等,最終導緻收集資料不準确,研究結論不可靠等問題。

如果問卷收集資料不準确,通常會帶來資料信度和效度的影響。單獨從肉眼看資料都挺正常,但使用研究方法進行測量就會立刻現出原形。

學術研究上使用量表居多,而且也隻有量表也才能進行信度和效度測量,資料的信度即可靠性是最為基礎,同時資料的有效性也是資料品質的基本要求。研究者可通過SPSSAU問卷研究子產品進行信度和效度測量。

既然資料問題會帶來信度和效度問題,那應該如何防範呢,出現問題時又如何解決呢?本文從兩個部分進行闡述,如何保證資料品質。

一、防範無效樣本

首先從防範的角度來看,從問卷設計和問卷收集兩個角度提供以下六點建議:

1. 題目不能過多

題目過多會導緻填寫者不耐煩,越到後面的問題越不準确,如果是學術研究,通常有一個标準是測量變量的5倍左右,比如測量變量有10個,每個測量變量通常對應4~7個題,那麼加起來共有50個題左右,除此之外再加上一些基本的個人資訊題和一些樣本行為特征題即可。是以如果研究越複雜,研究變量越多,那麼問卷設計的題目也會越多,對于收集資料的品質控制也應該越高;問卷設計時不是題越多越好,而應該以剛好比對研究目的為準。

2. 設定測謊題

問卷設計時可加入個别測謊題,此種做法的好處是可以在後續處理時很好的進行識别出無效樣本,快速地檢查出樣本是否真實回答問卷。

3. 問卷整體規範

比如問卷設計時措詞表達的簡潔易懂,問卷結構的清晰簡單,問卷是給使用者填寫使用的,一定需要站在填寫問卷人的角度進行換角度考慮,設計出結構清晰簡單易懂的問卷,别人也更加願意為你填寫。

4. 互填問卷需謹慎

問卷研究時樣本數量一般要求是量表題的5倍,嚴格是10倍。比如問卷中有40道量表題,那至少需要200個樣本才适合。問卷設計好後,通常是讓朋友同學進行填寫,但是數量有限,還是不夠,是以現在出現較多的問卷互填QQ群,陌生人幫助填寫等,陌生人為你填寫,也沒有利益問題,是以此類樣本的準确度沒辦法保證,是以在問卷設計時有個測謊題就可以用于後面的識别。

5. 收費樣本需謹慎

目前有比較多的問卷網站提供樣本收集服務,如果使用此類服務,建議自己設定一些測謊題用于判斷是否真實有效的樣本。

6. 問卷預測試

上述已經說明,問卷是否真實可靠,是否有效,肉眼根本無法識别,但是使用分析方法一下子就能看出。是以一般可以先收集小部分(比如50個)資料後,進行預測試分析,一般是做信度分析,大概看下效度分析情況。先做到心中有數,如果預測試出現大的問題,提前發現問題,修改一些問卷規範,重新找有效的樣本等。

二、無效樣本處理

上述六種辦法,已經做好各種防範,相信問卷中無效樣本已經非常少,餘下的都是有效樣本了。但實際上并非如此,比如說會出現這樣的樣本,很多個量表題都選擇同一個答案(比如‘同意’)。也或者填空年齡,結果出現一個數字110。類似這樣的都屬于無效,應該進行處理。

如果對無效樣本不進行處理,肯定會導緻分析出現問題。是以在做好各種防範後,還需要在資料收集完成後對資料無效性進行處理。接下來以SPSSAU無效樣本和異常值處理這兩個功能點進行說明。

1. 無效樣本

首先找到SPSSAU提供的無效樣本處理功能。資料處理》無效樣本,如下圖:

SPSSAU提供兩種情況的無效樣本設定:第一種是完全相同數字超過一定比例時設定成無效樣本。不認真填寫者通常有個特别是完全選擇相同的答案,一般以量表題選擇相同數字超過70%作為标準。

性别、學曆這種是樣本本身的屬性,到底是男還是女,無法測試。是以一般選中問卷中的所有量表題,比如30道題表題,30個量表題中70%都是相同數字,意味着21個題都選擇同樣一個答案,這種一般就算無效樣本。這裡70%是常見處理方式,當然也可以設定成60%或者80%的标準。

除了相同數字識别成無效樣本,SPSSAU還提供缺失樣本比例超過某數字後,也設定成無效樣本。如果一大堆答案都不選擇,那肯定也屬于無效。具體有多少比例的答案沒有做出回答算成無效,沒有固定的标準,一般70%以上肯定是無效樣本。

設定好無效樣本後,預設會新生成一個标題,用來辨別那些樣本是有效,那些是無效,在分析的時候直接進行篩選下就好。

2. 異常值

除上述無效樣本外,還有一種情況是異常值也需要特别注意,比如有一個題是問年齡,樣本回答為1歲,那肯定這個數字是有問題的,有可能填寫者沒有看清楚,也或者看清楚了寫錯了,也可能亂填,都有可能。

無論如何,當出現此種情況下都需要進行處理。SPSSAU資料處理裡面的異常值功能可進行設定,并且提供多種選項處理方式等,如下圖:

異常值的判斷标準上,可按數字為null即‘缺失數字’當成是異常值,也可以設定在某個範圍的數字(比如年齡大于100或小于0)為異常值,當然還有一種标準是資料超過3個标準差當成異常值。

異常值标準設定後,具體如何處理,正常情況下是設定成null值。當然也可以考慮進行填補,用正常的資料特征(比如平均值)去填補異常資料。具體情況視研究者偏好而定,沒有固定的标準。

本文針對問卷無效樣本的防範,以及通過SPSSAU對無效樣本進行處理進行說明。除此之外還特别提示大家,如果問卷是量表題,多做信度和效度分析等,利用科學的研究方法進行分析,這樣才具有說服力,資料是否真實可靠,問卷設計是否規範,不是個人說了算,而是通過科學的研究結論進行論證。