“你做數據分析有啥方法論?”無論是工作還是面試,此問題一出,都會難倒一片同學。媽耶,每天照單跑數就知道,但方法論是個什麼鬼!今天介紹給大家基礎的九種方法,先開個頭哦。
什麼是基礎方法從本質上看,幾乎所有工作都和數據有關系,都或多或少需要一些數據分析方法。但數據本身是有門檻的,很多人上學的時候就怕數學課,更不要說複雜的理論了。
因此,所謂基礎數據分析方法,應該是:
1、不涉及高等數學、統計學、運籌學、算法原理
2、不涉及複雜的業務邏輯、因果推斷邏輯
3、不局限于特定的業務場景,有普适性
總之,人人能用的,才是基礎方法。
基于這個理念,我請我的運營小妹小熊妹,為大家整理了九種基礎分析方法,簡單又好用。
從一個指标開始
▌周期性分析法
最基礎的分析方法,可以從一個指标開始,這就是“周期性分析法”。所謂“周期性分析法”,操作上非常簡單,就是把一個指标的觀察時間拉長,看它是否有周期變化規律。
這種方法分析簡單,但是非常實用。因為新手經常因為不懂看周期變化,引發笑話。
諸如:
“我發現昨天指标大跌”——昨天是周末,本來就該跌(自然周期變化)
“我發現A産品賣得很好”——A産品剛上市,它就該賣得好(産品生命周期)
很多時候,我們看的指标是總體指标,而總體指标是由若幹部分組成的,比如:
總公司-分公司A、分公司B、分公司C
總銷售-商品A、商品B、商品C
因此看到一個總體指标以後,可以根據它的組成部分,對總體做拆解,了解各部分組成,是為結構分析法(分析總體的内部結構)。
▌結構分析法
結構分析法在很多時候都好用,比如問:“為什麼業績下滑呀!”答:“因為XX區域沒有做好!”通過看結構,能很快找到責任人。
▌分層分析法
除了單純地看結構,人們也喜歡做排名,區分個高中低,這就是分層分析法。
很多同學會把分層和結構搞混,大家隻要記得以下兩句:
結構是客觀存在的,問清楚即可
分層是主觀的,要定個高低出來
這三種方法,是基礎中的基礎。一來,它們都是在分析一個指标,二來,它們都是基于事實陳述,不需要啥計算。當我們初到一個公司,初接觸一個新數據,都可以用這三種方法,建立基礎認知。
從一個指标到2個指标▌矩陣分析法
當指标從一個增加到2個的時候,最好的方法就是矩陣分析法。矩陣分析法,通過兩個指标的交叉,構造分析矩陣,利用平均值切出四個象限,從而發現問題(如下圖)。
矩陣分析法的最大優勢,在于:直觀易懂。可以很容易從兩個指标的交叉對比中發現問題。特别是當這兩個指标是投入/成本指标的時候,成本高 收入低,成本低 收入與高兩個類别,能直接為業務指示出改進方向,因此極大避免了:“不知道如何評價好壞”的問題。
很多咨詢公司都喜歡用這種方法,類似KANO模型或者波士頓矩陣,本質就是找到了兩個很好的評價指标,通過兩指标交叉構造矩陣,對業務分類。分類的區分效果很好,就廣為流傳了。
從2個指标到多個指标當分析指标變得更多的時候,最重要的工作,就是弄清楚:到底這些指标是什麼關系。典型的關系有兩種。
第一種:并列關系。
幾個指标相互獨立,且是上一級指标的組成部分。
比如我們常說的:業績=客戶數*消費率*客單價
在這個公式裡
1、一級指标:業績
2、二級指标:客戶數、消費率、客單價
3、客戶數、消費率、客單價相互獨立
此時,客戶數、消費率、客單價就是并列的三個指标,并且都是業績的子指标。
第二種:串行關系。
幾個指标相互關聯,有前後順序關系。
比如我們常說的:新注冊用戶數=廣告浏覽人數*落地頁轉化率*注冊頁轉化率。
1、一級指标:新注冊用戶數
2、二級指标:廣告浏覽人數、落地頁轉化率、注冊頁轉化率
3、用戶要先看到廣告,再點擊廣告進入落地頁,再完成注冊
此時,廣告頁、落地頁、注冊頁的指标相互關聯,用戶要一步步走。
這兩種關系,分别對應兩種基礎分析方法:
并列關系:指标拆解法,通過拆解一個一級指标,從二級指标裡發現問題。
漏鬥分析法:通過觀察一串流程,了解其流程轉化率,發現轉化率短點。
▌指标拆解法
指标拆解法,一般在經營分析中使用較多。舉個簡單的例子,一個小程序商城,上月銷售業績150萬,本月120萬。如果隻看結果,除了少了30萬以外啥也不知道。但是進行指标拆解以後,就能發現很多東西(如下圖)
拆解以後可以明顯看出:本月雖然注冊用戶人數增加了,但是消費率大幅度降低,所以收入少了。後續可以進一步思考:如何提高消費率。
▌漏鬥分析法
漏鬥分析法,則在互聯網産品/推廣/運營分析中使用較多,因為互聯網産品能記錄較多用戶數據,因此可以呈現整個用戶轉化流程,從而進行分析。
舉個簡單例子,在網上看到一個商品廣告,我們很感興趣,點擊進入購買。需要經曆廣告頁→詳情頁→購物車→支付幾個步驟,每多一個步驟,就會有一些用戶流失,如同漏鬥一樣。
此時可以用一個轉化漏鬥,形象地表示這種關系(如下圖)。
有了轉化漏鬥以後,就能進一步基于漏鬥分析,從而指導業務改善:
1、哪個環節漏掉的用戶最多,需要改善?
2、不同的商品,漏鬥形态如何,哪個更适合推廣?
3、新的産品改版後,是否減少了漏掉的用戶數量?
▌相關分析法
當然,還有一些指标,可能不是直接的并行/串行關系,但是在工作中,也很想知道他們有沒有關系,比如:
1、廣告投入與銷售業績
2、下雨刮風和門店人流
3、用戶點擊和消費行為
此時,需要掌握相關分析法。注意:指标之間可能天生存在相關關系。
常見的天生相關,有三種形态:
1、在結構分析法中,整體指标與部分指标之間關系
2、在指标拆解法中,主指标與子指标之間的關系
3、在漏鬥分析法中,前後步驟指标之間的關系
這三種情況,稱為:直接相關。直接相關不需要數據計算,通過指标梳理就能看清楚關系。相關分析法,更多是利用散點圖/相關系數,找到潛在的相關關系(如下圖)。
但是要注意:相關不等于因果,到底如何解讀相關系數,需要結合具體業務含義,不能胡亂下結論哦
從指标到業務邏輯▌标簽分析法
以上所有方法,都是基于數據指标計算,但實際業務中,很多關系并不能直接用數據指标表示。
比如:
● 是不是社區店比步行街店,生意更好?
● 是不是私域流量比公域流量,轉化更佳?
● 是不是刮風下雨比晴空萬裡,銷售更好?
社區店/私域流量/刮風下雨,很難用一個數據指标來衡量。但這些因素,又确實會對企業經營産生影響,該怎麼分析呢?這就需要采用:标簽分析法。
舉個簡單的例子,南方某省,8月份經常下暴雨。大家都覺得:下雨會影響門店業績。那麼怎麼分析呢?按照五步法,可以針對該省份門店,做分析如下圖:
那麼可以得出結論:下雨對業績影響不大,這就做完了。
注意,上邊的小例子裡,标簽做的很粗糙,隻有簡單粗暴的下雨/沒下雨兩類。除了下雨以外,還可能有台風、冰雹、高溫等等情況。因此,做标簽的精細程度,決定了标簽分析的準确度。而能否選取到合适的标簽,則考驗的是分析人員對業務的理解程度。
到這裡,一共介紹了八種基礎方法。在實際工作中,一般都是多種方法綜合使用的。因為業務提的問題會很複雜,很有可能涉及多個指标,多個标簽。此時千頭萬緒,要理清思路,就得祭出第九種方法:MECE法。
▌MECE法
MECE是(Mutually Exclusive Collectively Exhaustive)的縮寫,指的是“相互獨立,完全窮盡”的分類原則。通過MECE方法對問題進行分類,能做到清晰準确,從而容易找到答案。
MECE法是基礎分析和高級分析的分水嶺,也是從基礎提升到高級的通道。所有複雜的問題,都需要經過認真的梳理和分解,才能成為一個個能解決的小問題。所謂的業務分析模型,其實就是對業務問題的MECE分解。
看到這裡,肯定很多小夥伴想看這九大方法的操作細節,可以關注公衆号碼工小熊,每一種方法,小熊妹都單獨寫了一篇詳細的操作文章。接下來小熊妹會把九大分析方法整理成PDF供大家下載使用。
當然,肯定也有同學好奇:掌握了這九種方法以後,還可以怎麼深入呢?
一般有三條深入路線,可以進行深入分析。
掌握了基礎方法以後▌路線一:業務分析模型。
業務模型,用來解決:定義模糊、數據貧瘠、需指導業務的問題。
比如業務在糾結:
1、到底做什麼用戶更好?
2、到底怎樣才能激勵銷售?
3、到底活動起了多大作用?
這些問題聽起來簡單,其實定義非常模糊,什麼算好?怎麼叫起作用?不發錢的激勵真的有用?各種問題錯綜複雜,且很有可能摻雜了業務部門自己的小心思。因此,需要細細的梳理業務邏輯,推導出可行的解題邏輯。
▌路線二:算法分析模型。
算法模型,用來解決:定義清晰、數據豐富、計算過程複雜的問題。
比如,高價值用戶識别問題,業務上已經定義清楚了:
1、用什麼指标衡量用戶價值
2、用什麼标準評價價值“高”
3、采集了豐富的數據(性别、年齡、興趣、關聯商品、互動、評論……)
4、有一批人工标注過的“高價值”用戶做成樣本
此時,可以用各種算法來建模了。建模的目的,不是為了增加分析深度,而是提高從分析到業務應用的效率。有了相對準确的模型判斷,業務可以通過CDP MA,自動觸發營銷規則,不需要每次都寫ppt寫很久。算法模型需要一些
▌路線三:統計推斷。
統計推斷方法,用來解決:定義清晰、沒有數據、需測試收集數據的問題。
比如:要上一個新版本産品,業務已經定義了:新版本要提升用戶的人均在線時長(均值問題),現在要做測試,從兩個預備版本裡選一個。此時要用:雙總體均值比較假設檢驗的方法。
當然,實際問題會更複雜,考慮各種控制變量、假設前提,還要考慮系統開發、數據采集方案,不單單靠分析師解決。
以上就是數據掌握了基礎方法以後,深入學習的三個路線。如果大家感興趣,關注接地氣學堂公衆号,我們選一個主題深入講解,敬請期待哦。
作者:接地氣的陳老師,接地氣學堂、碼工小熊。十年資曆的數據分析師,推出的數據分析系列課程,已有逾2萬學員。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!