上次,我們給大家講述了一些數據分析師面試的必備技巧,本期我們主要給大家分享一些筆試的題目(當然,即便是筆試用不到,面試也可以用得到哈),希望當遇到這類典型題目時,大家可以輕松應對。
1、不用任何公開參考資料,估算今年新生兒出生數量。
關于類題目,在作答前,我們應該去分解思考會涉及到哪些内容,并通過總結性思維,将你聯想到的内容加以描述。
首先,我們應該知道這是在考查費米估計問題,所以我們可以采用兩層模型(人群畫像x人群轉化):新生兒出生數=Σ各年齡層育齡女性數量*各年齡層生育比率。來作為回答的主線。
然後,先從數字到數字:如果有前幾年新生兒出生數量數據,建立時間序列模型進行預測(PS:這裡還需要考慮到二胎放開的突變事件)。
接着,找出先兆指标。如:嬰兒類用品的新增活躍用戶數量X表示新生兒家庭用戶。Xn/新生兒n為該年新生兒家庭用戶的轉化率,如X2007/新生兒2007為2007年新生兒家庭用戶的轉化率。當然,該轉化率會随平台發展而發展,我們可以根據往年數量,推出今年的大緻轉化率。
最後,我們可以通過今年大緻的轉化率,并根據今年新增新生兒家庭用戶數量,推出今年估計的新生兒數量。
2、什麼是PCA?PCA為什麼要中心化?它的主成分是什麼?
在統計學中,主成分分析(PCA)是一種簡化數據集的技術。它是一個線性變換。這個變換把數據變換到一個新的坐标系統中,使得任何數據投影的第一大方差在第一個坐标(稱為第一主成分)上,第二大方差在第二個坐标(第二主成分)上,依次類推。
主成分分析的原理,是設法将原來變量重新組合成一組新的相互無關的幾個綜合變量,同時根據實際需要,從中可以取出幾個較少的綜合變量,盡可能多地反映原來變量信息。這種統計方法叫做主成分分析,或稱主分量分析。它也是數學上處理降維的一種方法。
主成分分析是設法将原來衆多具有一定相關性(比如P個指标),重新組合成一組新的、互相無關的、綜合的指标,來代替原來的指标。通常數學上的處理就是将原來P個指标作線性組合,作為新的綜合指标。
最經典的做法就是用F1(選取的第一個線性組合,即第一個綜合指标)的方差來表達,即Va(rF1)越大,表示F1包含的信息越多。因此在所有的線性組合中選取的F1應該是方差最大的,故稱F1為第一主成分。
如果第一主成分不足以代表原來P個指标的信息,再考慮選取F2即選第二個線性組合,為了有效地反映原來信息,F1已有的信息就不需要再出現再F2中,用數學語言表達就是要求Cov(F1,F2)=0,則稱F2為第二主成分,依此類推可以構造出第三、第四,……,第P個主成分。
另外,主成分分析經常用減少數據集的維數,同時保持數據集的對方差貢獻最大的特征。這是通過保留低階主成分,忽略高階主成分做到的。這樣低階成分往往能夠保留住數據的最重要方面。但是,這也不是一定的,要視具體應用而定。
3、如何計算出頭條廣告的廣告收益?(無需計算,給出作答思路即可。)
首先,我們要知道:收益 = 出價x流量x點擊率x有效轉化率。
那麼,顯而易見,廣告投放的數量,會在一定程度上拉升流量,同時也會造成匹配程度的降低,從而影響因點擊率。
由此觀之,最大收益是找到這個乘積的最大值,同時,還需考慮有約束條件下的最優化問題。另外,我們還可以參考價格歧視方案,對不同的用戶,投放不同數量的廣告。
4、關于次日用戶留存率降低,我們應該怎麼分析?
首先,我們要采用“兩層模型”分析法來作答。通過對用戶進行新老、渠道、活動、畫像等多個維度的細分,然後分别計算出每個維度下不同用戶的次日留存率。通過數據,定位到導緻留存率下降的,是哪個群體。
當然,對于用戶留存率下降問題,我們還應具體情況具體分析。你還可以通過“内部-外部”因素,來分析這個問題。。
1)内部因素:包括獲客(渠道質量低、活動獲取非目标用戶)、滿足需求(新功能改動引發某類用戶不滿)、提活手段(簽到等提活手段沒達成目标、産品自然使用周期低導緻上次獲得的大量用戶短期内不需要再使用等);
2)外部因素:包括宏觀經濟環境(可采用PEST分析法)、政治(政策影響)、經濟(短期内主要是競争環境,如對競争對手的活動)、社會(輿論壓力、用戶生活方式變化、消費心理變化、價值觀變化等偏好變化)、技術(創新解決方案的出現、分銷渠道變化等)。
5、在銷售大豆時,如何做可以提升收益?價格提升至什麼水平,收益最大?
我們都知道,收益 = 單價*銷售量。因此,在回答這道題目時,我們應該從提高單位溢價,或者提高銷售規模這兩個方向着手。
>>提高單位溢價:
1)如果前期營銷資金充足,我們可以通過打造品牌,從而獲得長期溢價能力;
2)如果前期資金不足,我們還可以通過增加産品的附加值來提高溢價。比如,增加商品加工環節,将大豆做成豆奶粉、豆漿、豆幹、大豆蛋白粉等;或者重新定位商品,将商品禮品化,打造有機大豆等産品形象。
>>提高銷售規模:
我們都知道,銷售量=流量x轉化率。如果我們通過上述提高單位溢價的方法,從而增加商品的收益,在對流量産生影響的同時,也會對轉化率産生影響。
因此,在銷售過程中,我們還可以通過價格歧視,根據客戶對商品的敏感度,采用不同定價的方法,來提升銷售規模,以達到增加收益的目的。
當然,為了促銷,我們還應該控制價格歧視的時間、投放的數量、價格定檔策略等。比如,不同時間段、不同商圈的大豆價格不同,采取高定價,然後對價格敏感的用戶提供優惠券等方式,充分發揮價格歧視的優勢,從而達到收益最大化。
寫在最後
也許你在面試中,不一定能碰到這些題目,但一定會有運用相同思路,去分析其他問題的可能。因此,希望大家能夠提前做好準備,将筆試部分穩穩拿下,為後續面試做好鋪墊。最後,如果你在參加面試時,遇到了一些數據分析“奇葩”題目,歡迎來留言去留下你的足迹。
我們也将結合大家的疑惑,後續為大家提供相應的答題思路分析。所以,請不要吝啬留言哈~
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!