tft每日頭條

 > 科技

 > 統計學十個常見的基本概念

統計學十個常見的基本概念

科技 更新时间:2024-09-02 19:17:59

哈喽,大家好,我是可樂

今天給大家推薦這本《深入淺出統計學》,文末有我總結的知識圖譜。

《深入淺出統計學》這本書我看了好幾遍,一直沒法下筆寫它的總結,因為感覺還沒有征服它,每次感覺懂了的時候,總會遇到不明白的地方,不過我還是鼓起勇氣來寫這篇讀書筆記,目的是向大家推薦這本神書,值得反複咀嚼。

統計學十個常見的基本概念(能把統計學的原理和應用說明白)1

建議同時結合賈俊平老師的《統計學》這本書一起食用,效果會更佳哦。

第一部分:數據的度量

第一節 信息圖形化 的内容是講作圖的,數據總歸要化繁為簡,進行可視化的,我在如何進行數據圖形化 這篇文章中也有寫過這部分内容,大家可以去看看,這一節最後還着重講了怎麼做直方圖,這個内容我也是寫了很久,兩年前的冷飯再來炒一下吧:

我們拿到數據首先要對數據進行一個概括性的度量,從哪幾個方面去度量呢?第二節 集中趨勢的量度和第三節 分散性與變異性的量度,這兩節内容就是在講數據的概括性度量問題,也就是描述性統計分析,包含集中趨勢的度量和離散程度的度量,我在 如何做好描述統計分析 這篇文章中也有具體寫。

第二部分:概率的基本概念

概率的計算可以幫助我們做出有根據的決策,在 你真的了解概率嗎? 這篇文章中寫了概率計算中的一些名詞解釋等内容。第四節内容 概率計算 在教我們如何計算事件的概率,概率和統計總是相輔相成,

至于第六節内容 排列組合 我也把它放了進來,這一章對階乘的計算進行了講解,這位後續的概率分布函數提供了計算基礎。其實排列組合是我們初中/高中數學裡都學到過了,這裡就不重點講它了,大家知道它的表達式是什麼意思以及怎麼計算的就可以了。

統計學十個常見的基本概念(能把統計學的原理和應用說明白)2

排列組合

第三部分:随機變量及其分布

本書的7、8、9節内容在講離散型随機變量的概率分布以及連續型随機變量的概率分布,離散型随機變量分布包括二項分布、泊松分布等,連續型随機變量分布有均勻分布、指數分布、正态分布,這部分内容在:離散型随機變量的概率分布連續型随機變量的概率分布

第四部分:抽樣

本書的第10小節内容 統計抽樣的運用 主要講樣本及抽樣的運用。

統計是需要數據的,那麼數據從哪裡來呢?這一章就是介紹在實際工作中如何正确、有效地收集數據。

Q:要檢查某公司生産的糖果質量情況,難道要把它們全都吃一遍嗎?

當然不用,答案就是抽樣,這裡先是介紹了總體和樣本的概念,接着講解了一些普遍的抽樣方法,如簡單随機抽樣,分層抽樣等,以及抽樣會産生的誤差。需要明确的是,這些抽樣方法都無法保證樣本的無偏性,但是可以将偏倚的概率降低,并且樣本越大,偏倚的概率就越小。

關于總體和樣本,在我之前的文章 簡單地聊聊統計學 中有寫到,大家可以點進去複習下哦。

統計學十個常見的基本概念(能把統計學的原理和應用說明白)3

第五部分:參數估計

第11小節 總體和樣本的估計 和第12小節 置信區間的構建 在講參數估計的知識點。

前面說了抽樣的方法,那麼我們究竟是為什麼要抽樣呢?如果可以通過樣本推斷總體的信息,豈不是很好嗎?這就是抽樣的目的了。

參數估計是推斷統計的重要内容,根據樣本來推斷總體,這裡經常會提到的兩個名詞:估計量和參數:

  • 估計量,就是樣本的值,是用來估計總體參數的統計量,如樣本的均值、比例等,就是估計量。
  • 參數,就是總體的值,如總體的均值。

評價估計量的标準有3個:

  • 無偏性
  • 有效性
  • 一緻性咦是不是很眼熟,要是你看過我 2020年小紅書校招數據分析筆試題 這篇文章的話,裡面就有這道題,學以緻用,聯動起來!

這一章還講到了中心極限定理,中心極限定理說的是,從一個非正态總體中取出一個樣本,如果取出的樣本足夠大,那麼樣本均值的分布接近正态分布。中心極限定理是非常重要的一個概念,因為它其實在告訴我們正态分布的重要性,同時也揭露了為什麼實際應用中正态分布會那麼廣泛。

和中心極限定理需要一起說明的還有大數定律,這個我們後面再慢慢聊。

剛剛是參數估計中的點估計方法,下面要說的是區間估計的方法。

給總體參數一個區間範圍,該區間通常由樣本統計量加減誤差得到,這個區間就是我們說的置信區間。

在構建置信區間的步驟裡有一個決定置信水平這一步,什麼是置信水平呢?

置信水平是你希望自己對于 置信區間包含總體統計量 這一說法有多大的把握。比如,我們希望總體均值的置信水平為95%,意思就是總體均值處于置信區間中的概率為0.95。

統計學十個常見的基本概念(能把統計學的原理和應用說明白)4

以上是這本書的部分内容,後面還有假設檢驗、相關與回歸等内容,假設檢驗我是打算單獨拎出來的,所以這裡就先不展開了。總的來說,這本書對每個知識點講解的很細,具體到每一個公式是怎麼出來的就像在給小朋友講課一樣地通過一個一個的案例讓讀者自己挖掘出來,是一本非常不錯的統計學入門書籍。

最後是這本書的知識圖譜,圖片有壓縮,如想要高清大圖,請加我data_cola

統計學十個常見的基本概念(能把統計學的原理和應用說明白)5

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved