數據統計分析的幾個重要方法-tft每日頭條

數據統計分析的幾個重要方法

科技更新时间:2026-07-26 09:21:34

此文是《10周入門數據分析》系列的第7篇

想了解學習路線，可以先閱讀學習計劃 | 10周入門數據分析

統計學是數據分析的基石。學了統計學，你會發現很多時候的分析并不靠譜。比如很多人都喜歡用平均數去分析一個事物的結果，但是這往往是粗糙的，不準确的。如果學了統計學，那麼我們就能以更多更科學的角度看待數據。

大部分的數據分析，都會用到統計方面的以下知識，可以重點學習：

基本的統計量：均值、中位數、衆數、方差、标準差、百分位數等

概率分布：幾何分布、二項分布、泊松分布、正态分布等

總體和樣本：了解基本概念，抽樣的概念

置信區間與假設檢驗：如何進行驗證分析

相關性與回歸分析：一般數據分析的基本模型

通過基本的統計量，你可以進行更多元化的可視化，以實現更加精細化的數據分析。這個時候也需要你去了解更多的Excel函數來實現基本的計算，或者python、R裡面一些對應的可視化方法。

有了總體和樣本的概念，你就知道在面對大規模數據的時候，怎樣去進行抽樣分析。

你也可以應用假設檢驗的方法，對一些感性的假設做出更加精确地檢驗。

利用回歸分析的方法，你可以對未來的一些數據、缺失的數據做基本的預測。

了解統計學的原理之後，你不一定能夠通過工具實現，那麼你需要去對應的找網上找相關的實現方法，也可以看書。先推薦一本非常簡單的：吳喜之-《統計學·從數據到結論》。也可以看《商務與經濟統計》，結合業務能更容易理解。

另外，如何精力允許，請掌握一些主流算法的原理，比如線性回歸、邏輯回歸、決策樹、神經網絡、關聯分析、聚類、協同過濾、随機森林。再深入一點，還可以掌握文本分析、深度學習、圖像識别等相關的算法。關于這些算法，不僅需要了解其原理，你最好可以流暢地闡述出來，還需要你知曉其在各行業的一些應用場景。如果現階段不是工作剛需，可不作為重點。

本文算是一個知識點彙總，不做細緻展開，讓大家了解統計學有哪幾大塊，每一類分别用于什麼樣的分析場景。後面幾篇會以實際案例的方式，細緻講講描述性統計、概率分布等。

知識點彙總：

1.集中趨勢

2.變異性

3.歸一化

4.正态分布

5.抽樣分布

6.估計

7.假設檢驗

8.T檢驗

一、集中趨勢

1.衆數

出現頻率最高的數；

2.中位數

把樣本值排序，分布在最中間的值；

樣本總數為奇數時，中位數為第(n 1)/2個值；

樣本總數為偶數時，中位數是第n/2個，第(n/2) 1個值的平均數；

3.平均數

所有數的總和除以樣本數量；

現在大家接觸最多的概念應該是平均數，但有時候，平均數會因為某些極值的出現收到很大影響。舉個小例子，你們班有20人，大家收入差不多，19人都是5000左右，但是有1個同學創業成功了，年入1個億，這時候統計你們班同學收入的“平均數”就是500萬了，這也很好的解釋了，每年各地的平均收入數據出爐，小夥伴們直呼給祖國拖後腿了，那是因為大家收入被平均了，此時，“中位數”更能合理的反映真實的情況；

二、變異性

1.四分位數

上面說到了“中位數”，把樣本分成了2部分，再找個這2部分各自的“中位數”，也就把樣本分為了4個部分，其中1/4處的值記為Q1，2/4處的值記為Q2，3/4處的值記為Q3

2.四分位距 IQR=Q3-Q1

數據統計分析的幾個重要方法（數據分析必掌握的統計學知識）1

3.異常值

小于Q1-1.5(IQR)或者大于Q3 1.5(IQR);

對于異常值，我們在數據處理的環節就要剔除；

4.方差

數據統計分析的幾個重要方法（數據分析必掌握的統計學知識）2

5.平方偏差

方差的算術平方根

6.貝塞爾矯正：修正樣本方差

實際在計算方差時，分母要用n-1，而不是樣本數量n。原因在于，比如在高斯分布中，我們抽取一部分的樣本，用樣本的方差表示滿足高斯分布的大樣本數據集的方差。由于樣本主要是落在x=u中心值附近，那麼樣本如果用如下公式算方差，那麼預測方差一定小于大數據集的方差（因為高斯分布的邊沿抽取的數據也很少）。為了能彌補這方面的缺陷，那麼我們把公式的n改為n-1，以此來提高方差的數值，這種方法叫貝塞爾矯正系數。

三、歸一化

1.标準分數

一個給定分數距離平均數多少個标準差？

标準分數是一種可以看出某分數在分布中相對位置的方法。

标準分數能夠真實的反映一個分數距離平均數的相對标準距離。

數據統計分析的幾個重要方法（數據分析必掌握的統計學知識）3

四、正态分布

1.定義：随機變量X服從一個數學期望為μ，方差為σ⊃2;的正态分布，記為N(μ,σ⊃2;)

随機取一個樣本，有68.3%的概率位于距離均值μ有1個标準差σ内；

有95.4%的概率位于距離均值μ有2個标準差σ内；

有99.7%的概率位于距離均值μ有3個标準差σ内；

數據統計分析的幾個重要方法（數據分析必掌握的統計學知識）4

五、抽樣分布

1.中心極限定理

設從均值為μ，方差為σ⊃2;的任意一個總體中抽取樣本量為n的樣本，當n充分大時，樣本均值的抽樣分布近似服從均值為μ、方差為σ⊃2;/n的正态分布

2.抽樣分布

設總體共有N個元素，從中随機抽取一個容量為n的樣本，在重置抽樣時，共有N·n種抽法，即可以組成N·n不同的樣本，在不重複抽樣時，共有N·n個可能的樣本。每一個樣本都可以計算出一個均值，這些所有可能的抽樣均值形成的分布就是樣本均值的分布。但現實中不可能将所有的樣本都抽取出來，因此，樣本均值的概率分布實際上是一種理論分布。數理統計學的相關定理已經證明：在重置抽樣時，樣本均值的方差為總體方差的1/n。

舉個例子：

48盆MM豆，計算出每盆有幾個藍色的MM豆，48個數據構成了總體樣本。然後随機選擇五盆，計算五盆中含有藍色MM豆的平均數，然後反複進行了50次。這就是n為5的樣本均值抽樣。

數據統計分析的幾個重要方法（數據分析必掌握的統計學知識）5

六、估計

1. 誤差界限

數據統計分析的幾個重要方法（數據分析必掌握的統計學知識）6

2. 置信度

We are some % sure the true population parameter falls within a specific range

我們有百分之多少确信總體中的值落在一個特定範圍内；

一般情況下，取95%的置信度就可以；

3. 置信區間

數據統計分析的幾個重要方法（數據分析必掌握的統計學知識）7

七、假設檢驗

數據統計分析的幾個重要方法（數據分析必掌握的統計學知識）8

1.問題：什麼是顯著性水平？

顯著性水平是估計總體參數落在某一區間内，可能犯錯誤的概率，也就是Type I Error

A Type II Error is when you fail to reject the null when it is actually false.

數據統計分析的幾個重要方法（數據分析必掌握的統計學知識）9

數據統計分析的幾個重要方法（數據分析必掌握的統計學知識）10

2. 如何選擇備選檢驗和零假設？

一個研究者想證明自己的研究結論是正确的，備擇假設的方向就要與想要證明其正确性的方向一緻；

同時将研究者想收集證據證明其不正确的假設作為原假設H0

八、T檢驗

1. 主要用于樣本含量較小（例如n<30），總體标準差σ未知的正态分布。

流程如下：

數據統計分析的幾個重要方法（數據分析必掌握的統計學知識）11

是用t分布理論來推論差異發生的概率，從而比較兩個平均數的差異是否顯著；

一般檢驗水準α取0.05即可；

計算檢驗統計量的方法根據樣本形式不同;

2. 獨立樣本T檢驗：

現在要分析男生和女生的身高是否相同兩者的主要區别在于數據的來源和要分析的問題。

數據統計分析的幾個重要方法（數據分析必掌握的統計學知識）12

問題：為什麼T檢驗查表時候要n-1?

樣本均值替代總體均值損失了一個自由度

3. 配對樣本t檢驗

分析人的早晨和晚上的身高是否不同，于是找來一撥人測他們早上和晚上的身高，這裡每個人就有兩個值，這裡出現了配對

數據統計分析的幾個重要方法（數據分析必掌握的統計學知識）13

樣本誤差（Standard Error）

數據統計分析的幾個重要方法（數據分析必掌握的統計學知識）14

數據統計分析的幾個重要方法（數據分析必掌握的統計學知識）15

4. Pooled variance 合并方差

當樣本平均數不一樣，但實際上認為他們的方差是一樣的時候，需要合并方差

不要被公式吓到，他的本質是兩個樣本方差加權平均

數據統計分析的幾個重要方法（數據分析必掌握的統計學知識）16

數據統計分析的幾個重要方法（數據分析必掌握的統計學知識）17

5. Cohen’s d

效應量(effect size):提示組間真正的差異占統計學差異的比例，值越大，組間差異越可靠。

數據統計分析的幾個重要方法（數據分析必掌握的統計學知識）18

數據統計分析的幾個重要方法（數據分析必掌握的統計學知識）19

此文是《10周入門數據分析》系列的第7篇。

想了解學習路線，可以先行閱讀“ 學習計劃 | 10周入門數據分析

公衆号上已更新到第13篇，歡迎前往關注~

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技 win10電腦實用技巧大全
今天和大家分享7個WIN10電腦的超實用技巧，不管是辦公還是學習，都能用得上！1.窗口隐藏當電腦上出現的窗口過多時，許多軟件窗口放在疊在一起難免顯得雜亂，這是你可以用鼠标點擊想要保留窗口，晃動該窗口就能最小化除該窗口之外的所有軟件。2.快速... 2023-02-12
科技 photoshop怎樣自己制作封面
做視頻也好，寫文章也好，一個好的封面可以幫助我們吸引很多的粉絲，那麼我們需要制作一些特殊一點的封面，跟别人不一樣的封面。如下圖的封面是不是就很特别，那麼我們就學習這樣的效果如何制作。這樣的視頻封面如何？第一種牆面字體的效果牆體文字1.我們用... 2023-01-10
科技外牆聚苯闆保溫施工工藝
今天和大家聊一聊一種新型的外牆保溫材料——STP真空絕熱闆。首先說說它的優點，防火等級A級，該闆材保溫效果優異，保溫效果相當于常規聚苯闆的5倍，擠塑闆的4倍，聚氨酯的2.8倍，大部分地區的建築一般用1.5厘米厚就能達到65%的節能要求。不同... 2022-12-18
科技電腦正常關機不了怎麼辦
電腦有開機的時候自然也有需要關機的時候，很多朋友在使用完電腦後都習慣于将它關閉。可是有時卻出現了異常情況，電腦竟然無法關機——點擊關機鍵後，系統顯示正在關機，等了老半天就是沒有關閉。此時大家的耐心已被消磨殆盡，幹脆長按電源按鈕将電腦強制關閉... 2022-11-29
科技怎麼找正規的手機維修店
經常會有一些粉絲朋友問哪裡修手機比較好？哪裡修手機比較靠譜？諸如此類的問題，現在滿大街都是修手機的，不管是修手機的還是賣手機的，個個門口都是寫着專業手機維修，作為消費者的我們到底應該怎樣去判斷這家手機維修店到底靠不靠譜，專不專業呢？小編從事... 2023-03-08
科技頭條視頻怎樣私信
頭條視頻怎樣私信?打開今日頭條app，點擊你想私信的人發布的視頻文章；，我來為大家科普一下關于頭條視頻怎樣私信?下面希望有你要的答案，我們一起來看看吧!頭條視頻怎樣私信打開今日頭條app，點擊你想私信的人發布的視頻文章；點擊你想私信的人的帳... 2022-07-02
科技用手機充電器充充電寶會不會變滿
用充電寶給手機充電，電量越充越少？是手機壞了還是充電寶壞了？出門在外手機不能離手，一旦身邊沒有手機大家會覺得非常沒有安全感。因為娛樂，通訊，購物付款等都是通過手機來完成的。相信大家都有一個通病就是要時刻保持手機電量是百分之百的，如果電量不足... 2022-12-14
科技 oppo手機與華為手機比哪個好
主要是看你在意的是哪個方面吧！華為還有榮耀這個子品牌了，和小米是一樣的，走的互聯網路線，所以兩者沒有太大的可比性，如果從實際使用角度來就講的話，當然是華為手機更加切合實際使用了，而OPPO手機走的是顔值路線，所以在用料方面更好，但是性能方面... 2023-04-03
科技電腦啟動黑屏不顯示桌面怎麼辦
電腦啟動黑屏不顯示桌面怎麼辦?1.找到一個支持高分辨率的顯示器，連接到主機，啟動後調低分辨率，我來為大家科普一下關于電腦啟動黑屏不顯示桌面怎麼辦?以下内容希望對你有幫助!電腦啟動黑屏不顯示桌面怎麼辦1.找到一個支持高分辨率的顯示器，連接到主... 2022-11-02
科技如何快速創建一個月的報表
面對這些數據，我們如何快速制作這樣的同比數據報表呢？下面我跟大家具體說一下。首先，點擊這些數據中的任何一個單元格。在菜單欄中找到“插入”，“數據透視表”。因為我們需要在新的工作表中形成新的報表，所以這裡直接點擊“确定”第二步，把“字段列表”... 2023-03-26
科技壓力傳感器Adascl
如需要重新校準，則按以下狀态說明和步驟操作：校準流程：（準備工作：将傳感器線接好并上電至EtherCAT運行狀态）第一路校準：1、零電平校準：壓力傳感器在空載的狀态下，命令值寫入0x0121，等待狀态值返回0x0101，若此時LEDRUN1... 2022-11-12
科技成龍曆險記20年後的小玉
在我們的童年動畫中有一部根據真人為原型制作的動畫我們一定都看過，那就是《成龍曆險記》。在這部動畫中講述的是以成龍龍哥為首的幾人組在世界各地探索各種神秘謎團，因為裡面的反派身上擁有魔法所以整體看起來還有些魔幻很是過瘾。但其實這部動畫有新版叫做... 2023-03-15
科技新時代軟件正版化創新發展大事記正式發...
新時代軟件正版化創新發展大事記正式發布?中國網2月28日訊2月27日，第七屆中國網絡版權保護與發展大會在四川省成都市召開會上，推進使用正版軟件工作部際聯席會議辦公室發布了《新時代軟件正版化創新與發展大事記》，我來為大家講解一下關于新時代軟件... 2023-04-04
科技陳浩民版段譽名場面
在金庸先生的15部武俠小說中，《天龍八部》是其中格局最大、氣勢最為恢弘的一部。而段譽作為該書的第一男主，雖然不及喬峰那樣光芒四射，也沒有虛竹那樣“用和尚的方式過着皇帝的生活”這樣的傳奇人生，但因為一個“癡”字，這個角色同樣受到了很多觀衆的喜... 2023-02-18
科技華為富士山壁紙高清豎屏
相信不少小夥伴都有過這樣的經曆：上課、參加會議或培訓時，看到PPT上精彩的觀點和幹貨，就會立刻拿出手機拍照記錄，但由于拍照角度、距離和光線問題，這些照片上的信息經常難以準确辨認。這樣的照片，不僅沒有起到記錄信息的作用，還給整理信息造成困難，... 2023-03-01
科技手機無質量問題的情況下可以換嗎
如何判斷一部手機該換了，我相信每個人都有不同的答案，像我們身邊的不少人，他們換新手機取決于舊手機是否完全不能用，今天我們就要教大家如何判斷一部手機該換了，基本上隻要出現這三種情況，那麼最好就換了吧。第1種，白屏狀态下手機泛紅嚴重，手機屏幕的... 2022-11-27
科技手機上的nfc一般有什麼功能
最近許許多多的小夥伴，問我一個問題，為什麼許多旗艦機上都取消了NFC功能，這個NFC功能到底好不好用呢，有些小夥伴則表示，自從買了帶NFC功能的手機，就從來沒有用過，今天潮爆就帶大家了解一下NFC功能，我們就拿一直以NFC為旗艦标配的小米舉... 2022-12-02
科技常用的智能系統
老年髋部骨折通常被稱為“人生的最後一次骨折”，老年人發生髋部骨折後，死亡率和緻殘率很高。其中，靜脈血栓栓塞症（VTE）更是老年髋部骨折患者的“隐形殺手”。加之手術持續時間長，患者年齡大、需要卧床、多有基礎疾病等，老年髋部骨折患者是VTE極高... 2022-12-05
科技 ffmpeg怎麼播放mp4
引言之前我們已經分享過很多關于音視頻處理的文章。其中最繞不開的就是ffmpg工具，這個命令行工具構建了當今大小智能設備音頻，視頻，圖片等多媒體文件處理的方方面面。可是有很多讀者反映ffmpg入門門檻太高。面對英文的文檔幾乎無從下手，其涵蓋衆... 2022-12-15
科技萬代shf鋼鐵蜘蛛俠的測評
蜘蛛俠作為人氣最高的超級英雄，其遊戲作品深受玩家喜愛。在《破碎維度》之後便缺乏優秀的作品，直到《漫威蜘蛛俠》的出現讓所有蜘蛛愛好者狂喜。如今《漫威蜘蛛俠》登錄PC平台，讓更多玩家可以體驗到在城市蕩蛛絲的快感。與PS5版本相同，PC版本支持R... 2022-12-02
科技 ppt上怎麼免費摳圖
我們經常在PPT或者海報中看到這樣的效果，在人物/産品之後穿插文字或者形狀：要做到這樣的效果，其實并不難，前提是你得把圖完好地摳出來，所以，我今天就跟大家分享5個，免費的一鍵摳圖網站！01fococlipping摳圖速度超快的網站，操作起來... 2023-02-12
科技夢幻西遊千萬方寸跨服
關于70級五開，相信很多玩家都是非常陌生的，但是對于70五開的玩家來說，大多數玩家都是已娛樂為主要目的的，畢竟對于五開黨而言，低級别是無法賺到足夠的夢幻币的，但是喜歡70娛樂五開的玩家卻是能夠在這個級别花少量的錢，玩出遊戲更多的樂趣，這裡給... 2022-12-07
科技微信聊天框特效代碼
了解更多熱門資訊、玩機技巧、數碼評測、科普深扒，點擊右上角關注我們----------------------------------技能：微信聊天特效代碼難度系數：1顆星适用系統：安卓，iOS昨天，所長終于鼓起勇氣約了自己喜歡了很久的女生... 2022-11-23
科技長安univ黑科技
UNI-T作為長安汽車全新序列“引力”的首款車型，從亮相之初便以其前衛的造型設計吸引了許多年輕消費者的目光。新車定位于緊湊型跨界SUV，長寬高分别為4515/1870/1565mm，軸距為2710mm。動力方面，長安UNI-T将搭載藍鲸NE... 2023-03-12
科技英特爾和amd極限性能測試
衆所周知，中國的超級計算機是很強的，原因在于申威芯片。早期中國的超級計算機是用intel芯片的，後來美國限制intel出品超級計算機芯片給我們。于是沒辦法了，中國自己造，申威芯片就是這種情況之下誕生的，而一誕生就是巅峰，使用自主研發的申威芯... 2023-04-03
科技 vivo手機最簡單截屏方法
vivo手機最簡單截屏方法?手機截屏是大家經常用到的功能，不少廠商還針對其開發出來“長截屏”“字母手勢截屏”等今天我為大家介紹的是Vivo手機的趣味截屏功能，截出你的“愛心”哦~，我來為大家科普一下關于vivo手機最簡單截屏方法?下面希望有... 2022-10-06
科技微軟筆記本surfacego
微軟在10月6日紐約發布會上推出全新一代SurfacePro4，據微軟透露SurfacePro4比上一代SurfacePro3快30%，比競争對手蘋果MacbookAir快50%。下面是IT之家為大家整理的SurfacePro4完全配置規格... 2023-03-26
科技沒有權限修改hosts文件
一般情況下，如果我們需要進入一個網站，都可以直接輸入該網站的網址來進行訪問，這個過程中，網址會被轉換為IP地址，然後IP地址再通向該網站的服務器，但是這個過程相對較長，所以訪問速度就慢了。接下來就說一下如何通過修改hosts文件來禁止訪問和... 2023-01-22
科技台式電腦桌面截屏方法
台式電腦桌面截屏方法?首先，打開到桌面，保證現在的電腦并不卡，下面我們就來聊聊關于台式電腦桌面截屏方法?接下來我們就一起去了解一下吧!台式電腦桌面截屏方法首先，打開到桌面，保證現在的電腦并不卡。接着，在鍵盤上找到Ctrl、Shift和D這幾... 2022-06-02
科技幾款良心軟件
CrossOverCrossOver是一款優秀的練習打字軟件。前段時間突然想練習打字，于是去下載金山打字通，發現我MAC電腦上竟然沒有，然後就找到這款軟件，使用CrossOver可以在Mac或者Linux上安裝Windows軟件，就是.ex... 2022-12-16

tft每日頭條

> 科技

> 數據統計分析的幾個重要方法

數據統計分析的幾個重要方法

相关科技资讯推荐

热门科技资讯推荐

网友关注