1、數據分析是什麼?
數據分析是指利用合适的工具在統計學理論的支撐下,對數據進行一定程度的預處理,然後結合具體業務分析數據,幫助相關業務部門監控、定位、分析、解決問題,從而幫助企業高效決策,提高經營效率,發現業務機會點,讓企業獲得持續競争的優勢。
2、為什麼要做數據分析?
數據分析可以把隐藏在大量數據背後的信息提煉出來,總結出數據的内在規律。代替了以前那種拍腦袋、靠經驗做決策的做法,因此越來越多的企業重視數據分析。具體來說,數據分析在企業日常經營分析中有三大作用,即現狀分析、原因分析、預測分析。
2.1 現狀分析
現狀分析可以告訴業務在過去發生了什麼。一般通過日常報表來實現,如日報、周報、月報等形式。
1)現階段的整體運營情況。通過各個關鍵指标的表現情況來衡量企業的運營情況,掌握企業目前的發展趨勢。
2)各項業務的構成。
2.2 原因分析
原因分析可以告訴某一現狀為什麼會存在。一般通過專題分析來完成,根據企業運營情況選擇針對某一現狀進行原因分析。
2.3 預測分析
預測分析告訴未來可能發生什麼。一般通過專題分析來完成,通常在制定企業季度、年度計劃時進行。
3、數據分析究竟在分析什麼?
數據分析重點在分析,而不是在工具。
3.1 總體概覽指标
總體概覽指标又稱統計絕對數,是反映某一數據指标的整體規模大小,總量多少的指标。如當日銷售額為60萬。
經常關注的總體概覽指标稱為關鍵性指标,這些指标的數值将會直接決定公司的盈利情況。
3.2 對比性指标
對比性指标是說明現象之間數量對比關系的指标,常見的是同比、環比、差這幾個指标。
同比是指相鄰時間段内某一共同時間點上指标的對比,環比就是 相鄰時間段内指标的對比;差就是兩個時間段内的指标直接做差, 差的絕對值就是兩個時間段内指标的變化量。
3.3 集中趨勢指标
集中趨勢指标是用來反映某一現象在一定時間段内所達到的一般水平,通常用平均指标來表示。包含平均值、中位數、衆數、分位數。
3.4 離散程度指标
離散程度指标是用來表示總體分布的離散(波動)情況的指标,如果這個指标較大,則說明數據波動比較大,反之則說明數據相對比較穩定。全距(又稱極差)、方差、标準差等幾個指标用于衡量數值的離散情況。
3.5 相關性指标
相關系數反應數據整體内的變量之間存在什麼關系,一個變化時會引起另一個怎麼變化。相關系數用r表示。
其中,Cov(X,Y)為X與Y的協方差,Var[X]為X的方差,Var[Y]為Y的方差。關于相關系數需要注意以下幾點。● 相關系數r的範圍為[-1,1]。● r的絕對值越大,表示相關性越強。● r的正負代表相關性的方向,正代表正相關,負代表負相關。
3.6 相關關系與因果關系
相關關系說明兩件事情有關聯;因果關系是說明一件事情導緻了另一件事情的發生。
4、數據分析的常規流程
4.1 熟悉工具
EXCEL、SQL、Python、BI等軟件工具
4.2 明确目的
希望通過數據分析得出什麼結論。
4.3 獲取數據
● 需要什麼指标。 ● 需要什麼時間段的數據。 ● 這些數據都存在哪個數據庫或哪個表中。 ● 怎麼提取,是自己寫Sql還是可以直接從ERP系統中下載。
4.4 熟悉數據
熟悉數據類型,是否滿足分析。
4.5 處理數據
處理異常數據,包含:異常數據、重複數據、缺失數據、測試數據。
4.6 分析數據
圍繞數據指标展開分析,常采用的方法是下鑽法。
4.7 得出結論
通過分析數據,得出結論。
4.8 驗證結論
數據分析和實際業務相聯系,去驗證結論是否正确。
4.9 展示結論
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!