tft每日頭條

 > 科技

 > 信息流運營幹貨

信息流運營幹貨

科技 更新时间:2024-12-05 13:22:03

編輯導讀:本文作者帶領大家對信息流的基礎推薦引擎和影響因子有了初步了解,并通過信息流feeds數據運營中的一個實際案例梳理總結了數據運營的價值,供大家一共學習和參考。

信息流運營幹貨(數據運營實操案例)1

一、信息流引言

信息流(Feeds)的形态已經近乎無所不在,貫穿在我們24小時的互聯網生活的當中。當你通勤時在地鐵刷刷今日頭條了解最新資訊,信息流已經把一篇篇時事熱文整齊地排成隊列等待你的閱讀;當你想要好好美餐一頓,大衆點評的信息流給你“種草”了不少同城餐廳;夜不能寐想剁手來犒勞下辛苦工作一天的自己,淘寶上琳琅滿目的推薦商品流怎麼那麼精準,刷得停不下來……

盡管信息流這種形态已經廣泛應用,但其實最早的應用是在資訊内容場景,始于Facebook在2006年發布的資訊信息流(News Feed)功能。

平台通過既定的算法、規則排序後聚合内容,用戶可以在單頁面内進行流暢而高效的内容消費。用戶不再需要如移動互動網史前時代那樣,在門戶網站、博客站點之間進行頻繁地跳轉;平台也通過提供聚合的内容展示平台,更高效地把用戶留在了自己的轄區内。

信息流的英文是“Feed”,實在是用得很妙的一詞了。Feed在英文裡是“喂養”的意思,生動地刻畫了信息流場景裡,用戶被平台按一定的順序“投喂”内容的場景。

用戶消費的内容時間是有限的,平台如何在有限的時間内,給用戶投喂TA最喜歡消費的内容、從而讓TA在平台消費更多的内容(從而給平台帶來更高的潛在商業價值),就是所有Feed場景運營人員經年累月在不斷鑽研的“推薦排序”問題了。

二、信息流的基礎:推薦引擎

推薦引擎的核心,是“如何把合适的物品推薦給合适的用戶”,所以“物品”和“用戶”之間聯系的建立,是推薦算法裡最核心的命題。整個推薦的過程基本可以總結為“召回”→“排序”→“調權”→“輸出結果”的過程,對這個過程進行一個簡單的比喻,來幫助大家理解這個過程。

大家應該都曾經在學生時代參加過軍訓,軍訓最後的分列式檢閱是整個軍訓過程的高光時刻。那該如何對隊列進行合理的排布呢?

  • 首先,教官會需要先“召回”A班的所有學生來到操場上,等待進行排列,隻能是A班的學生,其他B、C班的同學先不需要參與;
  • 緊接着,教官會要求同學們按從高到矮的規則進行“排序”,這樣隊伍看起來就不會參差不齊;這時,雖然同學們已經按從高到矮排好了,但可能有個别學生彙演時需要在軍樂團做演奏,教官就需要對這些學生進行“調權”,把他們排除在外;
  • 最後,按這樣的規則排列下來的隊伍,就是最後彙演時A班的隊伍排布了。

推薦算法是一門頗深的學問,技術性也很強,但因為本書面向的讀者主要是運營人員,所以筆者嘗試從更顯性的層面總結如今影響信息流排序的主要影響因子:

  • 時間因子。時間是比較基礎的一個排序影響因子,很多内容産品最初都以時間為第一排序因子,比如公衆号最初則是完全的時間排序。但随着内容不斷增多,如何利用推薦算法幫助用戶找到其最關注的内容,則是其他因子的命題。
  • 用戶畫像因子。這個因子的假設前提很直觀,“蘿蔔青菜,各有所愛”。雖然我們常說不能把人“标簽化”,但對于算法來說的确隻有“标簽化”才能更好地認識一個人。打個比方,如果你有“互聯網從業人員”的标簽,那給你推薦的内容自然會更多地傾向于互聯網行業資訊、科技新動向等;如果你有“孕期媽媽”的标簽,那給你推薦的内容也會有更多育兒類資訊。
  • 興趣因子。同樣是對人的理解,用戶畫像更多關注的是人的“屬性”,興趣則更多關注的是人的“愛好”。部分産品對用戶的興趣理解方式比較直接,讓用戶在新進時勾選自己的興趣領域,從而推薦給用戶對應内容;其次還可以通過一些側面的辦法,比如“用戶在某條資訊中閱讀的時長”、“用戶點擊某類資訊的概率”等方式側面去了解用戶的興趣。
  • 正負反饋因子。顧名思義,即是用戶對平台推薦的内容作出的正面或負面的反饋行為。正面反饋,如“點贊”、“一鍵三連”行為;負面反饋,如“舉報”、“不願再看到”等行為。許多用戶也深谙此道,在接觸一個新的信息流産品時會用這個方式去“馴化”信息流,“調教”出最适合自己的内容。
  • 互動因子。可以認為是正負反饋因子的進一步細化,比如B站許多UP主常說的“轉評贊”,則是希望通過用戶的轉發分享、評論、點贊等互動指标,幫助其内容被算法認為是優質的内容,從而獲得更高的曝光。另外,用戶的一些具體行為,比如“購買”,對推薦算法來說也是一個很重要的對相關物品提權的信号。
  • 社交因子。對于具有社交關系的産品來說,推薦算法就有更多的可發揮空間了。具有最得天獨厚優勢的莫過于微信,沉澱了中國十多億用戶的深厚社交關系信息。比如“看一看”的内容排序,則用到了用戶的社交關系做算法推薦,某個内容如果有越多我們的好友“在看”,那其在我們的“看一看”中的排序則會更優。
  • 熱度因子。時事變化瞬息萬變,當下的突發新聞事件往往會引起更多人的關注,導緻熱門的時事事件得到更高的推薦排序。社會潮流不斷更叠,最近熱播的影視劇或最新潮流風向,也會使一些商品成為最近熱門,從而獲得更高推薦排序。
  • 人工運營幹預因子。基于推薦算法的排序基本能解決大部分的效率問題,但對于部分劣質内容,如虛假消息、低俗内容,則需要人工運營的幹預,對其進行降權或過濾。
三、難題:資訊Feeds如何做冷啟動?

講到這裡,給大家分享筆者此前運營一款工具産品的經曆。大多工具産品的困境大家可能都有所了解:用戶停留時間長、粘性差,從而導緻變現的效率和方式都很有限。市場上競品衆多,如果不能快速從數據指标上證明我們産品的價值,那整個産品都面臨着被砍掉的風險。

于是,如何提高用戶提高時長,成了我們團隊内一個很重要的命題。我們這款工具産品具有WiFi連接的功能,此前用戶在連接WiFi成功後跳轉的落地頁就是一個“連接成功”的頁面,除此之外,沒有别的承接;

但此時用戶處在操作完成的情緒高點、且在流量不敏感的WiFi場景,我們想,是不是可以通過承接資訊Feeds的内容,從而提供給用戶一些内容消費的價值,同時還創造了一個商業化變現的場景?

但我們是工具産品的團隊,此前完全沒有内容運營的經驗,要如何從0到1做一個資訊Feeds出來?分析了我們團隊的現狀,我們決定從以下幾個方面快速啟動:首先,資訊内容從哪兒來?我們的一些兄弟産品有現成的資訊内容,但具體的推薦算法需要我們自研;我們的算法團隊雖然沒有内容推薦的經驗,但在軟件分發上推薦的經驗,也有異曲同工可借鑒複用的地方。

巧婦難為無米之炊,“米”和“巧婦”都已具備,但要做成“炒飯”還是“湯飯”我們的用戶才覺得最好吃,我們得多嘗試才能得出結論。

推薦排序的因子那麼多,但對于我們來說,因為工具産品的屬性,所以能用的并不多。根據我們的情況,我們決定做如下三組的A/Btest實驗:

  • 基于用戶畫像排序。我們可以獲得的用戶屬性數據有:用戶的軟件安裝列表數據,可以一定程度推測用戶的喜好;用戶的地理位置數據,可以推薦一些本地新聞、附近景點等資訊。綜合這兩方面的用戶數據,混合給用戶推薦合适的資訊内容。
  • 基于熱度排序。因為我們拿到的資訊内容并沒有附帶在其他平台的熱度數據,所以熱度排序在我們産品中是相對滞後的過程,需要用戶不斷通過點擊行為去“投喂”給算法進行學習,從而把産品内更熱門的内容推薦給更多的用戶閱讀。
  • 基于資訊發布時間排序。相當于是一個基礎對照組,不對資訊做太多算法排序上的幹預,用于對比前兩組實驗的效果。

基于三組實驗的設定,我們選定了三組随機測試的用戶群進行策略的投放,并且設定了“平均資訊消費時長”作為關鍵評估指标。等待實驗效果回收的時間有三天那麼漫長,這三天的期間我們團隊内也在打賭哪個策略表現會最優。讀者們,你們也來猜猜哪個策略的表現會最好呢?

四、分析:找到問題更深層的原因

團隊内的打賭,基本都集中認為是前兩組的策略會更優。認為用戶畫像更好的同事的觀點直截了當,用戶會對與自己更相關的内容更感興趣。認為熱度排序效果會更好的同事也很在理,更多人點擊的内容往往是獵奇新鮮的,自然也會吸引更多人閱讀。

但我們運營人員回收整理了實驗數據後,卻有點大跌眼鏡:最不為大家青睐的基于時間排序的方案三,竟然“平均資訊消費時長”都要優于前兩個方案。團隊内一時間有點洩氣,對算法團隊同事的技術能力質疑也在暗暗有聲。

作為運營人員,此時我們需要通過數據分析去多走一步看看:數據指标所呈現的,就是全部的真相了嗎?

為了分析這個問題,首先我們對問題進行了拆解。

實驗的數據指标上:

  1. 我們設定的數據指标有沒有問題?
  2. 數據指标的計算有沒有問題?
  3. 各實驗方案的數據指标計算是否都在同一個口徑上?

實驗的方案設計上:

  1. 實驗組用戶的選擇上是否足夠随機?
  2. 實驗策略所需要的數據需要齊全?
  3. 實驗策略是否對其用戶組完全生效?

拆解分析後發現,我們看到前兩組方案數據指标不好的現狀,并不盡然是全部的真相。首先我們發現,“平均資訊消費時長”的指标設定存在一定問題。因為我們的産品屬性畢竟是工具産品,大部分用戶在連接上WiFi後是用完即走,資訊Feeds注定隻是給一部分相對有閑的用戶的功能。

所以,實驗組之間用戶的“平均資訊消費時長”十分離散,方案三中存在個别極端值用戶拉高了整體平均時長數據。為了解決這個問題,我們在計算時可以對極端值做一定處理,并增加“平均資訊點擊率”的數據指标,可以更客觀地評估各方案之間的效果。

其次通過分析還發現,方案一和方案二由于數據采集上的原因,并沒有完全實現其策略各自的效果。比如方案一“基于用戶畫像排序”,許多實驗組用戶由于安卓權限限制,安裝列表數據不全;對部分用戶IP的地理位置識别也不夠精準,測試發現給有的在廣州的用戶推薦了北京的本地新聞,自然也會影響策略的效果。

比如方案二,由于部分“标題黨”内容點擊率很高,所以導緻實驗組用戶首屏全是“标題黨”内容,内容質量很低,用戶點擊後也很快跳出,導緻策略的實驗效果很差。

五、數據運營思維的重要性

如果我們沒有對數據指标呈現出來的情況做進一步分析,單看實驗的結果,我們可能直接就會認為對于我們的用戶,“時間排序”就是最好的方案了,以後都應該往這個方向去發展,所謂模型算法的優化也都沒有必要了。但隻有通過分析,才能更清晰地看到事實的全貌,不斷提出優化方案進行叠代。

這裡體現出的,是問題拆解思維的重要性,是有邏輯的問題分析思維的重要性。希望通過本書,可以跟讀者你分享這些思維框架,成為一個更優秀的運營。

寫在後面

後續在平台上會分享更多數據運營、互聯網産品(或夾帶一些個人的藝術愛好私貨)的文章,歡迎各位交流!

本文由 @黃一元 原創發布于人人都是産品經理,未經作者許可,禁止轉載。

題圖來自Unsplash,基于CC0協議。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved