本文将以B站為例,詳細回答軟件是怎麼把信息更有效率的推送到你面前的?作為創作者和用戶,如何利用推薦系統反哺自身?
零售電商給你推薦喜愛的日用品、新聞閱讀給你推薦合口味的知識、短視頻軟件向你推薦你最愛的娛樂視頻……自個性化推薦算法在各種軟件廣泛應用開來,千人千面的說辭已經被互聯網用戶熟稔于心。可以說,這些被頻繁使用的軟件可能比消費者本身還要了解你的偏好。
但,你真的知道,這些軟件是怎麼把這些信息更有效率的推送到你面前的麼?作為創作者和用戶,如何利用推薦系統反哺自身?本文将以B站為例,詳細回答這些問題。
本篇文章結構如下:
一、Tag處理:構建内容和用戶側寫
- Tag處理:構建内容和用戶側寫
- 打造圈層:内容類聚和用戶群分
- 巧用推薦:B站up主與平台運營
所謂千人千面,放在産品中,人指的是用戶,面指的是内容。一方面,用戶因為年齡、性格、愛好、生活閱曆的不同,對内容有不同的需求;另一方面,内容的種類和質量也影響用戶的偏好。用戶和内容的高效連接和互相成全,是推薦系統,尤其是推薦算法的最高目标。
1. 内容tag化
我們先來走一遍用戶視角。
進入B站,有明确的動畫、音樂、舞蹈、科技等按内容類型劃分的一級導航區,以科技區為例,又可以展開為科學科普、社科人文、演講公開課等二級導航,當你選擇科學科普欄目,又能看到環境、科學、生物、氣象這些小分類。
我們以羅翔教授的這篇《為什麼刑法要嚴格解釋》為例,從科技>社科人文頻道,進入視頻詳情頁,可以在頁面中部看到和視頻相關的信息。這裡有三塊重要信息。
第一,視頻播放量、彈幕量、評論數和數據排行表現,分别為161.1萬、2.6萬、7967和全站日排行最高第七。
第二,點贊數、不喜歡數、投币數、收藏數和分項數,其中不喜歡數并不顯示,其餘可量化的數據為24.1萬、10萬、3.3萬和7616。
第三,視頻标簽,這裡區分了比較熱門的羅翔、法考專輯标簽,也有刑法、校園星UP、厚大等普通熱度話題。
這樣就可以得到一份有關視頻内容的Tag标簽。
那這些标簽是怎麼來的?我們從投稿流程看一下哪些是可以由創作者控制的。
從投稿頁面可以發現,用戶上傳視頻後,可以填寫的内容有五項,分别是分區、标題、類型、标簽和簡介,其中标簽的選擇可以是自定義、推薦來源和參與活動。如果按照視頻投稿前後來給一份内容畫側寫,創作者相關信息和内容信息可以歸為靜态數據,而具體的數據表現随時間會随時間變化歸為動态數據。
2. 用戶tag化
萬物皆有聯系,“你的氣質裡,藏着你讀過的書和走過的路”告訴我們人格特質會受讀書習慣和生活經驗影響,而用戶的浏覽、消費等操作行為也隐藏着個人的偏好。
先來看一下B站用戶會被記錄哪些信息和行為數據。
曆史浏覽行為:
播放曆史的記錄使得用戶可以方便的追蹤到自己在什麼時間看了什麼視頻,但用戶往往并不會關注自己看到了哪裡,而隻在乎下一次點進去是否可以跳過已播放的部分。
但播放時長比是對視頻質量評判的一個重要标準:播放時間短,用戶可能隻是被播放量或标題吸引點進來随便看看, 但實際并不偏好此類内容;播放時間中等,用戶可能偏好此類内容,但視頻時長或質量會影響觀看完整度;播放時間長,反映出這類内容可能正對用戶興趣。
此外,用戶在視頻詳情頁對内容的點贊、收藏或不喜歡等操作,也反映出了個人偏好;評論作為文本數據,也可以從其長度、情感偏頗、可讀性反映出用戶對内容的喜好程度。
上述可以被用戶明确感知到的行為被歸為顯式行為,而另一類包含屏幕操作軌迹、停留時長等不易被用戶感知到的操作被稱為隐式行為。後者除了被用于構建用戶側寫外,也可以用于激發用戶的顯式行為,如在B站視頻詳情頁停留時間滿足一定水平後,會觸發分享圖标轉為顔色鮮明的微信圖标。
關注和訂閱:
關注和訂閱的up主、話題等,也會暴露用戶的興趣,例如,用戶的關注列表裡70%都是類似巫師财經、硬核的半佛仙人、财經藥丸這類up主,那系統在評估用戶愛好的時候大幾率會給貼上金融愛好者的标簽。
消費行為:
B站用戶的消費除了會員外,還包含課程、虛拟遊戲、演出展覽、線下遊戲等,而消費會留下交易金額、時間、地址、類型等痕迹。B站數億活躍用戶中,移動遊戲月均付費用戶接近150萬,直播季度付費用戶120萬,占比僅為1%左右,作為“金主”,他們不僅在權益享受上優于普通用戶,也會因其出色的消費能力而被推薦系統“盯上”,貼上“消費能力佳”的标簽。
身份信息:
用戶的身份信息包含性别、年齡、教育水平、地理位置等,允許訪問通訊錄、上網記錄後,平台還可以獲取到社交關系和其他産品使用情況,來推算用戶對産品的需求程度。
綜上,本文得出一份有關用戶信息和行為的Tag标簽。
從B站首頁,我們可以發現,目前基于興趣的推薦視頻一般可以分為這幾種:已關注、高贊視頻、新星計劃、關注的人贊過、廣告和互動視頻,這些标簽正是基于内容或用戶的tag标簽推送到了用戶面前,但單一的tag處理,推薦精确度上還有可以優化的空間。
二、打造圈層:内容類聚和用戶群分
完成對内容和用戶的tag處理後,這兩者仍是個體,但個體間會因為标簽的類似産生聯系,從而多個個體能夠進入同一圈子,權重和相似性通常被用作劃分圈子内個體關聯程度的标準。
1. 内容類聚
内容和内容之間的相似度常用創作者相關信息(認證、關注)或内容信息(頻道、話題活動、關鍵詞)來計算,而數據表現則一般用于排序展示在排行榜或熱門中。
這一算法通常用于熱榜推薦場景,比如動物圈下的熱門标簽汪星人、喵星人、大熊貓等,就是因為内容信息中關鍵詞的相似而被劃分為同一類視頻,進而可以集中展示;或是搜索場景,依據關鍵詞進行搜索,關鍵詞用于和數據庫内的創作者或内容信息進行匹配。
2. 用戶群分
用戶和用戶之間的相似度常用用戶行為來計算,這一過程被稱為協同過濾,主要以基于物品的協同和基于用戶的協同為底層框架。
基于内容的協同:
主體是内容,根據用戶喜歡的視頻,找到和這些視頻相似的内容再推薦給用戶。區别于上述的内容類聚,内容協同的過濾标準是用戶行為指向内容的相似性,而後者的标準沒有納入用戶的偏好。
基于用戶的協同:
主體是用戶,根據某一用戶喜歡的視頻,找到和這位用戶有類似偏好的用戶,再把這個群體所偏好的視頻推薦給用戶。
我們以B站不同視頻的用戶浏覽情況舉例,來區分這兩類推薦方式。假設用戶A喜歡看科技和數碼區的内容,B站會給這類用戶推薦什麼視頻:
根據給出的内容分區和浏覽用戶來判斷用戶的喜好,在基于内容的協同下,系統會給用戶A推薦遊戲區的内容,因為這三個分區的浏覽用戶相似度更高;而在基于用戶的協同下,系統會給用戶A推薦動畫和遊戲區,因為A和用戶B、C的浏覽曆史相似度更高,而這個群體似乎更偏好這兩個分區。
這一算法更常出現在推薦場景。觀察下面這個例子,可以發現用戶近期觀看的偏好和關注up主皆是舞蹈音樂類,所以首頁推薦同類視頻的占比可以達到60%以上。
三、巧用推薦:B站up主與平台運營
1. up主運營建議
(1)内容冷啟動
對于一個B站内新生産的視頻來說,其數據表現在短期内并不具備很高的參考價值,所以可供推薦系統參考的是内容方的靜态信息。從創作者相關信息來看,一個過去創作記錄更優質的up主的新内容會在冷啟動階段獲得更高推薦量;從内容信息看,标題、更新時間、關鍵詞和封面則是主要因素。
(2)持續創作能力的培養
對于一名up主來說,标題、關鍵詞的選取不過是短時間的嘩衆取寵,真正能獲得穩定關注者和預期收益的關鍵在于提高内容質量、培養自身的持續創作能力。基于平台對内容原創度、垂直度和傳播度的衡量,up主可以更有針對性的尋找自身擅長、熱點度高的版塊,并構建自身創作的周期體系,在更新時間、内容質量上保持穩定性。
(3)普通用戶也可以訓練自己的待看清單
利用推薦算法的機制,普通用戶也可以參照其原理,訓練自己的推薦清單,從而合理利用B站。比如,喜歡科普知識類分享的用戶,在關注同類up主、延長科普類視頻播放時長、增加點贊、評論、分享行為後,會發現首頁推送會更合自己的興趣。
2. 平台運營建議
(1)用戶冷啟動
相對内容,用戶從注冊到活躍,也會面臨一個從0到1的過程,平台在此期間最重要的目的是通過優質内容提高用戶活躍和留存。相比行為數據,身份信息是平台可以獲取到第一手信息,比如依據手機品牌對用戶偏好做出第一輪興趣猜想。
但要留住用戶,平台更重要的任務是尋找到小白用戶的興趣點,給他貼上标簽、劃分興趣圈。一方面,平台可以通過某頻道的強曝光逐步探索用戶的興趣,鎖定具體分區并逐漸縮小範圍,或是根據年齡這一維度更多元的屬性來做用戶協同推薦;另一方面,平台可以積極利用用戶在初始階段主動選擇的分區、關鍵詞搜索行為來逐步構建側寫。
(2)内容多樣性和質量優化
平台給出的頻道是有限的,而B站月均PUG視頻提交量就可以達到310萬,顯然,把規模如此大的視頻數僅用幾個标簽劃分是遠遠不夠的。因此,B站不僅允許創作者給視頻添加已有标簽和自定義标簽,還允許觀衆給視頻添加标簽,豐富視頻維度。
從質量上看,B站目前延長了對視頻的審核流程,意味着對視頻真實性、原創、價值引導上的審核會更加嚴格,這一優化不僅是對用戶的尊重,更有利于平台的長期維護。
(3)推薦算法也要跳出封地
推薦算法的怪圈在于“信息繭房”,一種體現是,用戶越是消費某一類内容,系統越會推薦同類内容,而其他内容被隔離在外;另一種體現是,數據表現越好的内容越能獲得推薦,而長尾視頻無出頭之日。
針對前者,B站的推薦系統并不會止步于用戶已有興趣的推薦,而是會在探索中鼓勵用戶發現自身更多元化的興趣,這就是基于用戶的協同推薦要優于基于内容的協同的地方。
針對後者,B站在長尾視頻曝光上,引入了新星計劃(具體可參考:《從三個方面解讀:B站用戶激勵體系》),也會提高首頁推薦的權重。
(4)推薦系統>推薦算法
推薦算法并不等同于推薦系統,人工編輯也有一席之地。推薦算法下的信息流容易遇到熱點話題刷屏等問題,而在價值、新鮮話題的反應上,人為和機器推薦的組合有時更能起到畫龍點睛的作用。
(5)up主持續創作的引導
Up主持續創作的動力不僅來自于金錢激勵,也來自于成就感、社交互動等心理激勵,而合理運用推薦算法可以在滿足創作者心理需求的同時,帶來金錢激勵。
尤其需要注意的是,B站目前月均活躍up主的數量已達到百萬級,如何按照活躍度、關注度、創作質量等維度合理分配up主的推薦比重,是B站運營迫切需要解決的問題之一。
作者:47,關注内容&社交産品,信奉keep exercising , keep learning , keep optimistic
本文由 @47 原創發布于人人都是産品經理,未經許可,禁止轉載。
題圖來自網絡
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!