沒有幾個行業可以完全不涉及統計學思維的,絕大多數學科都多少需要使用統計學….. 統計學已經從我們日常思維的一個方面發展為無處不在的系統性研究工具….統計學思維承認: 我們對世界的觀察總存在某些不确定性,永不可能完全準确。
統計是指收集、處理和解釋數據的方法。由于統計方法是科學探索的固有内容,因此我們的文章已經在研究設計、方法、結果、圖表等數處提及統計。但考慮到統計在多數科學研究中的重要性,有必要專門講解其使用和表達。
在開始研究之前,在初步的研究設計中就應該考慮統計。首先,要考慮你需要收集哪些信息來檢驗你的假設或解答你的研究問題。研究有個正确的開始非常重要;雖然數據檢驗錯誤相對容易彌補,要用另外的樣本組重新收集數據或者從同一樣本中追加獲取變量可就費時費力得多。如果你想檢驗某種療法對普通人群的效果,你的樣本要能夠代表這個群體。如果比較的是分别有兩種疾病或行為的兩個群體,那這兩個群體的其他變量如年齡、性别、種族需要盡可能一緻。這些涉及的都是數據收集;如果在這一步就犯了錯,你就有可能遇到嚴重的問題,甚至可能會在數個月後在同行審稿階段遭到嚴重質疑而推翻重來。
其次,你要考慮要采用何種統計檢驗才能從數據中提煉出有意義的結論。這取決于數據類型。是用來表達某種标志物存在與否的分類數據嗎?還是有具體數值的定量數據?如果是定量數據,是連續數據(測量所得)還是離散數據(計數所得)?例如,年齡、體重、時間和溫度都是連續數據因為他們的值是在連續,無限可分的尺度上測量出來的;相反,人和細胞的數目都是離散數據,他們不是無限可分的,他們的值是通過計數得到的。你也需要知道你數據的分布:是正态(高斯)分布還是偏态分布?這也關系到你該采取何種檢驗。你一定要知道你收集的是何種類型的數據,這樣才能用适宜的統計檢驗來分析和恰當的方式來表示。
最後,需要知道如何解讀統計檢驗的結果。P值(或 t、 χ2 等)代表什麼意思?這是統計檢驗的關鍵:确定結果到底意味着什麼,你能下什麼結論?統計能告訴我們某一數據集的集中趨勢(如平均值和中位數)和離散趨勢(标準差、标準誤和百分位間距),從而明确該數據集的分布情況。統計學可以比較(如用t檢驗、方差分析和χ2檢驗)兩個或多個樣本組之間是否有非偶然的系統性差别。如果檢驗表明無效假設可能性很小,則差别具有顯著性。一定要記住,用概率簡化差别的“真實性”造成了兩種風險,兩種都取決于所選取顯著性的阈值。第一個是第1類錯誤,是指本沒有顯著性差異之處檢出了顯著性差異。另一個是第2類錯誤,是指本有顯著性差異但由于差别不夠大而不能撿出。降低第1類錯誤的風險就會增加第2類錯誤的風險;不過這也比下不存在的結論要好。統計學也能給出關聯的強度,從而允許從樣本組中推斷出适用于更廣群體的結論。統計學賦予了本身價值有限的結果更多意義,并允許我們用概率下結論,雖然總是存在錯誤的可能。
實例
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!