tft每日頭條

 > 科技

 > 數據分析必掌握的統計學知識

數據分析必掌握的統計學知識

科技 更新时间:2025-05-01 17:56:12

通常,對數據分析領域感興趣的人會認為“數據分析就是處理數據”,這在一定程度上是正确的,但主要問題是“你将如何處理數據?”。

首先為了建立機器學習模型,我們需要了解數據中的底層模式,這将有助于決定應該使用哪種特定的 ML 算法來提供問題的解決方案。

為了理解,我們需要統計學的基礎知識,所以下面我們就要來讨論一些非常基礎和重要的統計學知識。

數據分析必掌握的統計學知識(九道門數據分析必備統計學知識)1

數據是事實和記錄的集合,它提供了對“發生了什麼”、“什麼時候發生”和“正在發生什麼”的理解。

在數據分析方法論的幫助下,我們使用可用的相關數據,并嘗試預測“未來可能發生的事情”和“可能發生的時間”。為了得出這些結果,我們需要掌握大量的統計知識,這有助于理解數據代表什麼。

例如,假設你被要求在一個研讨會上談論全球變暖,你要做的第一件事是什麼?

找出什麼是全球變暖,它的曆史,它對地球的影響,然後你需要拿出一些有用的信息,整合它,為演講做準備。

這裡,全球變暖是你擁有的數據,使用這些數據你需要提供信息,如果是主觀數據,我們可以在互聯網上浏覽或閱讀一些書籍來收集信息,但是,如果數據是分類數據或數字數據(分類指的是使用字符串值表示的數據,例如,狗的品種或貓的品種等;數字是指使用數字表示的數據,例如,過去兩年的溫度等),則需要統計數據,從這些數據中提取信息。

我們有兩類統計數據:1. 描述性統計,2. 推斷統計。

描述性統計:當有很多的數據時,我們會嘗試用一些有代表性的數字來表示這些數據。通過計算平均值、中位數或衆數,來反映總體的特征。比如,已知一個班級所有同學的身高,我們可以通過計算這些數據的平均值,然後得出該班級學生的平均身高是165cm,這就是描述性統計。

推斷統計:當我們從數據中抽取樣本,并試圖從中推斷出一些有用的信息,這些信息就代表了整個數據。簡單來說,我們從整個數據中獲取樣本數據,并嘗試将樣本推斷與整個數據聯系起來。

假設我現在需要知道某個省的人口的身高,那麼該如何表示這些數據呢?數據分析優質社群,等你加入哦~

數據分析必掌握的統計學知識(九道門數據分析必備統計學知識)2

計算總人口的算術平均值非常困難,因此我們可以考慮一個代表總體的樣本。通過計算樣本中身高的算術平均值來得出結論。

總體均值用 μ 表示,樣本均值用 x̄ 表示。

數據分析必掌握的統計學知識(九道門數據分析必備統計學知識)3

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2025 - www.tftnews.com All Rights Reserved