信度
如果你體重穩定,但在同一個秤上測了多次,體重浮動很大,就是信度不足。換言之,信度是用同一測量工具對同一對象反複測量,所得到的答案的相似度。在問卷調查中,信度通常用來檢驗量表結果是否可靠。
評估信度的方法有:測試-再測試、等價形式、内在一緻性。
測試-再測試(再測信度)
懷疑秤不準的第一反應,當然是再稱一次。
顧名思義,測試-再測試就是讓同一批受訪者再答一次,看前後答案是否基本一緻。
但正如那句哲言:人不能兩次踏進同一條河流。再測試可能會存在一些不确定性:不是100%受訪者都願意配合再次調查;經過再思考、再判斷後的答案會改變;兩次測試間隔時間内,受訪者的想法可能因為各種因素轉變。
等價形式信度(複本信度)
秤不準還可以換個秤試試。電子體重秤不準,我就換機械體重秤,它們都是用kg表示重量。
等價形式信度,就是用等價形式測量工具重測,從而有效避免上文中提到的問題。比如,間隔2-4周後再測試同一組受訪者,但使用另一套完全等價的問卷量表。問題在于設計兩份數量相等的量表很簡單,但測量尺度100%相等幾乎不可能。等價量表不僅設計難度大,要投入的金錢和時間等成本也高。
内在一緻性信度
内在一緻性信度可以彌補上述兩種方法的缺點,當量表内部各題間難度相當,且相關性很高時,表示它内在一緻性信度很高。内在一緻性信度有三種計算方法。
而信度系數較低,一般是樣本量小、每個維度的題項少導緻的。如果問卷設計質量不高,或者樣本量太小,那麼即使被試都是真實作答,信度也不會好。
風鈴系統建議問卷設計中參考成熟量表,并在問卷發放之前做好預調查,并盡量保證樣本量。
風鈴系統擁有400萬 真實人群的自有樣本庫,覆蓋全國各地、各行業、各年齡段,同時,風鈴系統與國内頭部電商和國内頭部招聘企業合作,可以根據用戶的購物行為和職業标簽進行精準抽樣,觸達4.7億電商樣本和2億職場樣本,一般的問卷調查對象都能在這裡找到。
風鈴系統樣本的代表性、真實性均達到業内領先水平,足以滿足您的數據需求。北京大學國家發展研究院是我國的頂級智庫,每個季度都會發布《中國消費者信心指數》,該指數用到的調研數據全部來自我們的受訪者。
效度
效度指測量工具本身的有效性,也就是能否通過量表找到研究問題的答案。效度也涉及測量工具避免誤差(系統誤差和随機誤差)的程度,也就是測量分數的出入隻反應了我們所測量的特性的真正差異,而非系統或随機誤差。
比如,測量體重的最終目的是衡量自己的胖瘦,如果體重增加能說明體形變寬、脂肪增加,那就具有一定效度。
測量效度的方法有:表面效度、内容效度、準則效度和結構效度。
所以調查者在設計問卷時,需要收集大量資料和數據,對測量概念、對象做出精準界定,也可以通過焦點小組訪談、專家座談會、增加預測試中的開放題等方法集思廣益。
預測效度是當前量表可以預測一個準則變量的未來值的程度。比如,入學考試能預測學生新學期的績點,那麼效度合格。
同時效度是預測變量和準則變量之間同時段的關系。比如,面向生物學專業大學生一份評估生物知識的綜合測試,如果他們的測試分數和績點存在高度相關性,那麼效度合格。
·收斂效度:用不同方式測量同一概念會産生類似的結果。比如被試用自我報告和觀察兩種測量方法,得出的結果高度相似,說明效度可靠。也可以用不同測試檢驗效度,比如韋氏智商測試的效度,可以對比斯坦福-比奈版智商測試的結果進行檢驗。
·區别效度:如果某品牌忠誠度測試和競品的品牌忠誠度測試,二者結果之間相關性越低,那麼說明測試的效度越高。
如果将靶心當作調研目的,投飛镖的過程看做是問卷調查。各個靶點集中,說明調查結果能準确反映調查對象的想法,即信度高;而集中于靶心,說明調查結果能切實解決研究問題,即效度高。
信度是效度的必要條件,信度不高效度必然不高,但信度高不代表效度一定會高。正如一個壞掉的秤總比實際重3斤,雖然每次都能得到相同結果,但也不能有效說明你的胖瘦變化。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!