tft每日頭條

 > 科技

 > 數據基本分析方法估計和檢驗

數據基本分析方法估計和檢驗

科技 更新时间:2024-07-20 02:12:26

在做數據分析的時候,通常會遇到分析的總體數據過于龐大,這樣會大大降低系統分析的運行效率,因此,一般會抽取一部分具有代表性的樣本數據進行分析,并根據這一部分樣本估計與推斷總體情況。這種方法被稱為抽樣分析方法。抽樣分析方法是利用已知的有效樣本去估計未知的龐大總體,之前提到過抽樣分布,現在結合Excel中的“抽樣”分析工具來進一步講解。

抽樣分析

“抽樣”分析工具既可以實現随機抽取數據,也可以實現周期性間隔抽取數據。我們以“用戶消費數據”為例來學習這兩種數據抽樣方法。

例子:公司市場部為刺激客戶消費,提升産品銷量,經常會策劃一些市場優惠活動,其中需要我們随機或有規律地抽取一些在活動中進行交易的客戶作為幸運客戶,以發放相應的獎品,這時應該如何處理呢?

1、在【數據】選項卡中選擇【抽樣】,在彈出的對話框中進行相關設置,可以選擇周期間隔,也可以選擇随機抽樣;

數據基本分析方法估計和檢驗(每天一點數據分析)1

相關分析

做數據分析,不僅要描述數據本身呈現出來的基本特征,有時候 還有進一步挖掘變量深層次的關系,為後期模型的建立及預測做準備。在統計學中,這種深層次的關系分為相關關系和回歸函數關系兩大類。

  • 相關關系。相關關系是指現象之間存在的非嚴格的、不确定的依存關系。這種依存關系的特點是:某一現象在數量上發生的變化會影響另一現象數量上的變化,而且這種變化具有一定的随機性,即當給定某一現象以一個數值時,另一個現象會有若幹個數值與之對應,并且總是遵循一定規律,圍繞這些數值的平均數上下波動,其原因是影響現象發生變化的因素不止一個。

  • 回歸函數關系。回歸函數關系是指現象之間存在的依存關系中,對于某一變量的每一個數值,都有另一變量值與之相對應,并且這種依存關系可用一個數學表達式反映出來。

相關分析是研究兩個或兩個以上随機變量之間相互依存關系的方向和密切程度的方法,直線相關用相關系數表示,曲線相關用相關指數表示,多重相關用複相關系數表示。其中我們常用的是直線相關,所以主要研究相關系數。

相關系數

相關系數就是反映變量之間線性相關程度的一個度量指标,通常用r表示,它的取值範圍為[-1,1]。r>0時表示線性正相關;r<0時表示線性負相關;r的大小可以反映相關的程度,r=0表示兩個變量之間不存在線性關系。

數據基本分析方法估計和檢驗(每天一點數據分析)2

我們以“企業季度數據”為例,使用Excel"相關系數"分析工具來實現,來分析“銷售額”、“推廣費用”及“其他費用”這三個變量件的相關關系。

1、在【數據】選項卡中選擇【相關系數】,在彈出的對話框中進行相關設置;

數據基本分析方法估計和檢驗(每天一點數據分析)3

2、生成結果如下:

數據基本分析方法估計和檢驗(每天一點數據分析)4

生成的結果與輸入區域選擇的數據集有關,如果隻選擇銷售額與推廣費用的數據集,則生成銷售額與推廣費用之間的相關系數的2*2矩陣;如果選擇的是銷售額、推廣費用與其他費用的數據集,則生成這三個變量之間相關系數的3*3矩陣。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved