tft每日頭條

 > 科技

 > 數據驗證不能修改但可以删除數據

數據驗證不能修改但可以删除數據

科技 更新时间:2024-07-20 06:15:57

來源:【中國科學報】

文 | 王德華(山東大學生命科學學院特聘教授)

科學是以數據說話的,任何科學結論都需要數據支持。數據不嚴謹,會産生不嚴謹的結論,甚至是錯誤荒唐的結論。這對社會的影響是極大的,尤其是涉及國計民生問題時,錯誤的數據很可能會導緻錯誤的決策,進而造成巨大的損失。所以,實驗科學無論怎樣強調數據都不為過。

最近,我和學生們在組會上又聊到了數據取舍的問題。我的研究生剛剛獲得了一個實驗的部分數據,需要統計處理組與對照組的差異,但統計後他發現,有一組數據标準差太大,統計結果是“差異不顯著”。

我們的實驗研究需要檢驗處理組和對照組之間的差異,或不同因素處理的效應,在這一過程中,令研究人員最頭疼的問題就是實驗結果與預期不一緻,本該有差異顯著性的數據,卻檢測不到差異顯著性,概率值大于0.05。在我們平時的科研工作中,這種情況很常見。

在讨論的時候,我跟他說:“如果個别數據偏離了整個樣本的變化趨勢,要特别重視,首先分析自己的實驗過程是否有問題、樣品是否有問題等。不符合預期的數據是絕對不能随便删除的,可以在分析數據的散點圖和标準差後,決定是重複一次實驗,還是增加樣本數。”

數據取舍,是我們組會上經常讨論的問題。我一般會跟我的學生說,出現個别偏離的數據,要認真分析是不是這個樣本有問題,并結合這個樣本的其他參數予以考慮。比方說,如果同一個動物實驗中,多個參數都出現了問題,就要考慮可能是動物樣本的問題;如果僅是某個參數不符合預期,可以分析測定過程是否出了問題。但基本原則是,不能随便删除數據。

面對個别偏離的數據時,我們的處理方法一般有以下三種。第一,再重複測定一次;第二,如果問題依然存在,又不好解釋,按照數據散點圖,将偏離平均值範圍太大的數據在散點圖上标記出來,統計分析時,說明這個數據沒有被統計進來;第三,根據統計學中判斷奇異值的方法,進行個别數據取舍。

有時我們會發現,統計結果是由個别數據引起的,如果去掉偏離平均值範圍大的數據,差異顯著性就出來了。這時,有些研究人員就會産生一種取舍數據的沖動,想删除這個不理想數據。但這是很危險的,因為随便取舍數據,或根據自己的需要取舍數據、選擇性使用數據,就觸碰到了學術不端的紅線。

我認為,研究人員産生數據不當取舍行為的一個直接原因是功利化心态、浮躁心态。例如,研究生有畢業發表論文的需要,年輕學者有晉升和申請各種名譽獎項的需要等。如果沒有正确對待科學的心态,沒有對待科學數據嚴謹的态度,而是論文至上,再加上沒有強有力的監督機制和懲罰措施,出問題是不奇怪的。

為避免不當的數據取舍,應該對實驗的原始記錄給予高度重視。我們實驗室每周都有組會,大家有數據就會在組會上讨論。研究生和導師交流時,也要提供原始數據。

在我以前工作的中國科學院動物研究所,我負責研究生教育工作多年,研究所學位委員會制定了導師檢查研究生實驗記錄的制度,每學期都要進行檢查,記錄本上有導師的簽字。導師檢查學生實驗記錄,也是研究生中期考核、申請學位論文答辯的一個重要條件。研究所為此專門定做了實驗記錄本,每頁都有頁碼,不能随便撕掉。實施效果還是不錯的。

總之,做實驗要尊重原始數據,嚴肅認真,認真對待每一個數據,認真對待科研和實驗過程的每一個步驟,認真做好實驗記錄。不可以更改數據,不可以選擇性地取舍實驗數據!

(《中國科學報》記者倪思潔采訪整理)

《中國科學報》 (2022-05-25 第1版 要聞)

編輯 | 趙路

排版 | 志海

數據驗證不能修改但可以删除數據(不符合預期的數據絕不能随便删除)1

本文來自【中國科學報】,僅代表作者觀點。全國黨媒信息公共平台提供信息發布傳播服務。

ID:jrtt

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved