估計很多人都聽過數據分析,但是真正做起來卻不是那麼一回事了。要麼胡子眉毛一把抓,要麼無從下手。這說明缺少理論知識的支持,那麼本文就将盤點一下數據分析常用的方法論和思路,作為數據分析入門的基礎。
數據分析的流程在介紹數據分析方法論和思路之前,我們還是先不厭其煩地看一下數據分析的流程,簡單來說分為以下六個步驟:
1、明确分析的目的,提出問題。隻有弄清楚了分析的目的是什麼,才能準确定位分析因子,提出有價值的問題,提供清晰的指引方向。
2、數據采集。收集原始數據,數據來源可能是豐富多樣的,一般有數據庫、互聯網、市場調查等。具體辦法可以通過加入“埋點”代碼,或者使用第三方的數據統計工具。
3、數據處理。對收集到的原始數據進行數據加工,主要包括數據清洗、數據分組、數據檢索、數據抽取等處理方法。
4、數據探索。通過探索式分析檢驗假設值的形成方式,在數據之中發現新的特征,對整個數據集有個全面認識,以便後續選擇何種分析策略。
5、分析數據。數據整理完畢,就要對數據進行綜合分析和相關分析,需要對産品、業務、技術等了如指掌才行,常常用到分類、聚合等數據挖掘算法。Excel是最簡單的數據分析工具,專業數據分析工具有FineBI、Python等。
6、得到可視化結果。借助可視化數據,能有效直觀地表述想要呈現的信息、觀點和建議,比如金字塔圖、矩陣圖、漏鬥圖、帕累托圖等,同時也可以使用報告等形式與他人交流。
數據分析方法論
數據分析的方法論很多,小編為大家介紹其中六種比較常見的理論。
1、PEST分析法
PEST,也就是政治(Politics)、經濟(Economy)、社會(Society)、技術(Technology),能從各個方面把握宏觀環境的現狀及變化趨勢,主要用戶行業分析。
宏觀環境又稱一般環境,是指影響一切行業和企業的各種宏觀力量。
對宏觀環境因素作分析時,由于不同行業和企業有其自身特點和經營需要,分析的具體内容會有差異,但一般都應對政治、經濟、技術、社會,這四大類影響企業的主要外部環境因素進行分析。
政治環境:政治體制、經濟體制、财政政策、稅收政策、産業政策、投資政策等。
社會環境:人口規模、性别比例、年齡結構、生活力式、購買習慣、城市特點等。
技術環境:折舊和報廢速度、技術更新速度、技術傳播速度、技術商品化速度等。
經濟環境:GDP 及增長率、進出口總額及增長率、利率、彙率、通貨膨脹率、消費價格指數、居民可支配收入、失業率、勞動生産率等。
2、5W2H分析法
5W2H,即為什麼(Why)、什麼事(What)、誰(Who)、什麼時候(When)、什麼地方(Where)、如何做(How)、什麼價格(How much),主要用于用戶行為分析、業務問題專題分析、營銷活動等。
該分析方法又稱為七何分析法,是一個非常簡單、方便又實用的工具,以用戶購買行為為例:
Why:用戶為什麼要買?産品的吸引點在哪裡?
What:産品提供的功能是什麼?
Who:用戶群體是什麼?這個群體的特點是什麼?
When:購買頻次是多少?
Where:産品在哪裡最受歡迎?在哪裡賣出去?
How:用戶怎麼購買?購買方式什麼?
How much:用戶購買的成本是多少?時間成本是多少?
3、SWOT分析法
SWOT分析法也叫态勢分析法,S (strengths)是優勢、W (weaknesses)是劣勢,O (opportunities)是機會、T (threats)是威脅或風險。
SWOT分析法是用來确定企業自身的内部優勢、劣勢和外部的機會和威脅等,通過調查列舉出來,并依照矩陣形式排列,然後用系統分析的思想,把各種因素相互匹配起來加以分析。
運用這種方法,可以對研究對象所處的情景進行全面、系統、準确的研究,從而将公司的戰略與公司内部資源、外部環境有機地結合起來。
4、4P營銷理論
4P即産品(Product)、價格(Price)、渠道(Place)、推廣(Promotion),在營銷領域,這種以市場為導向的營銷組合理論,被企業應用最普遍。
可以說企業的一切營銷動作都是在圍繞着4P理論進行,也就是将:産品、價格、渠道、推廣。通過将四者的結合、協調發展,從而提高企業的市場份額,達到最終獲利的目的。
産品:從市場營銷的角度來看,産品是指能夠提供給市場,被入們使用和消費并滿足人們某種需要的任何東西,包括有形産品、服務、人員、組織、觀念或它們的組合。
價格:是指顧客購買産品時的價格,包括基本價格、折扣價格、支付期限等。影響定價的主要因素有三個:需求、成本與競争。
渠道:是指産品從生産企業流轉到用戶手上全過程中所經曆的各個環節。
促銷:是指企業通過銷售行為的改變來刺激用戶消費,以短期的行為(比如讓利、買一送一,營銷現場氣氛等等)促成消費的增長,吸引其他品牌的用戶或導緻提前消費來促進銷售的增長。廣告、宣傳推廣、人員推銷、銷售促進是一個機構促銷組合的四大要素。
5、邏輯樹法
邏輯樹又稱問題樹、演繹樹或分解樹等。它是把一個已知問題當成“主幹”,然後開始考慮這個問題和哪些相關問題有關,也就是“分支”。邏輯樹能保證解決問題的過程的完整性,它能将工作細分為便于操作的任務,确定各部分的優先順序,明确地把責任落實到個人。
邏輯樹的使用必須遵循以下三個原則:
要素化:把相同的問題總結歸納成要素。
框架化:将各個要素組織成框架。遵守不重不漏的原則。
關聯化:框架内的各要素保持必要的相互關系,簡單而不獨立。
6、AARRR模型
AARRR模型是所有運營人員都要了解的一個數據模型,從整個用戶生命周期入手,包括獲取(Acquisition)、激活(Activition)、留存(Retention)、變現(Revenue)和傳播(Refer)。
每個環節分别對應生命周期的5個重要過程,即從獲取用戶,到提升活躍度,提升留存率,并獲取收入,直至最後形成病毒式傳播。
數據分析思路
數據分析方法論主要是從宏觀角度介紹如何進行數據分析,它就像是一個數據分析的前期規劃,搭建一個清晰的數據分析框架。那麼對于具體的業務場景問題,就要靠具體的分析方法來支撐了,下面小編就介紹幾種常用的數據分析思路。
1、趨勢分析
最簡單、最常見的數據分析方法,一般用于核心指标的長期跟蹤,比如點擊率、GMV、活躍用戶數。可以看出數據有那些趨勢上的變化,有沒有周期性,有沒有拐點等,繼而分析原因。
2、多維分解
也就是通過不同的維度對于數據進行分解,以獲取更加精細的數據洞察。舉個例子,對網站維護進行數據分析,可以拆分出地區、訪問來源、設備、浏覽器等等維度。
3、用戶分群
針對符合某種特定行為或背景信息的用戶,進行特定的優化和分析,将多維度和多指标作為分群條件,有針對性地優化供應鍊,提升供應鍊穩定性。
4、漏鬥分析
按照已知的轉化路徑,借助漏鬥模型分析總體和每一步的轉化情況。例如将漏鬥圖用于網站關鍵路徑的轉化率分析,不僅能顯示用戶的最終轉化率,同時還可以展示每一節點的轉化率。
5、留存分析
留存分析是一種用來分析用戶參與情況/活躍程度的分析模型,考察進行初始行為的用戶中,有多少人會進行後續行為。衡量留存的常見指标有次日留存率、7日留存率、30日留存率等。
6、A/B 測試
A/B測試是為了達到一個目标,采取了兩套方案,通過實驗觀察兩組方案的數據效果,判斷兩組方案的好壞,需要選擇合理的分組樣本、監測數據指标、事後數據分析和不同方案評估。
7、對比分析
分為橫向對比(跟自己比)和縱向對比(跟别人比),常見的對比應用有A/B test,A/B test的關鍵就是保證兩組中隻有一個單一變量,其他條件保持一緻。
8、交叉分析
交叉分析法就是将對比分析從多個維度進行交叉展現,進行多角度的結合分析,從中發現最為相關的維度來探索數據變化的原因。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!