本文圍繞個性推薦展開了一系列的分析思考,并主要講了獨立因素推薦、融合因素推薦、推薦方式以及回聲室陷阱等内容。
- 你剛在微信和朋友讨論AJ款式,看公衆号就刷到了AJ的廣告,淘寶首頁也驚喜般地出現了AJ推薦;
- 晚上刷抖音總是刷個不停,感覺刷到的每一個視頻都有某個點能戳中自己,你陷入尋找刺激的循環。
為什這些APP都知道你在想要什麼且清楚你的興奮點,是他們監控你的聊天記錄?
不,是你的個人基礎信息和行為數據告訴了他們你需要這些,他們就把你的需要主動給到你罷了。
那他們是怎麼做到的呢?下面我們就來簡單探讨下個性推薦。
這裡是文章的結構圖,圖和文章可以對照看,方便理解。
首先,個性推薦系統是為了解決信息過載,通過個性化推薦提高信息分發的效率和準确性,使得用戶更有粘性而被廣泛使用的系統。通俗的說他就是為了讓你更爽,你要什麼我就給你什麼。
這很美好,但這裡有一個陷阱,
意思是你不要什麼我就少點給你或者不給你——你也就失去了與你意見相左的知識領域接觸的機會,單一的内容被推薦多了用戶也會感到疲勞。
個性推薦用在電商領域來說應該叫“精準投放”——你想買什麼淘寶就推薦給你什麼,這像是雙赢的感覺。
但對于内容領域(短視頻等)來說,隻推薦你有興趣的内容,刺激你興奮點的同時也讓你接觸世界的邊界越來越窄,沉浸于自己營造的狹小的世界;難道我們進入這種回音室的怪圈之後就無法破解了嗎?
(回音室效應:一些意見相近的聲音不斷重複,令身處其中的多數人認為這些聲音就是事實的全部。)
我們先不急着解答,待我們逐步探讨下個性推薦的内容後,自己就能解答以上的問題;
獨立因素推薦
獨立因素推薦,就是推薦系統基于單個因素篩選的内容或商品推送給用戶;我們在了解獨立因素推薦的同時也了解下推薦的兩種模式被動推薦和主動推薦;
被動推薦
推薦是用戶被動的接收信息,需要用戶去觸發而産生的推薦結果。
例如淘寶上用戶依據價格區間的獨立因素篩選商品,這種行為完全依據用戶有意識的自主操作告訴淘寶我需要特定獨立因素的商品,淘寶後台會依據你的輸入信息進而對前端的你進行反饋。
假如用戶不是選一個因素而是同時選擇價了格區間 發貨地區 品牌這三個獨立因素時,這時後台進行篩選,把同時具備這幾個獨立因素的商品推薦給用戶,這隻是多個獨立因素的簡單物理标簽相的加可以說還是屬于獨立因素推薦的範疇。(當然淘寶真實推薦結果更為複雜,因為有商品競價排名,這些都會影響推薦的結果,目前是舉例說明)
與之類似的還有網易雲音樂的歌單廣場,歌單廣場将歌單分為了
流行、民謠、電子等不同的類别,每一個類别就是一個因素,用戶選擇哪個因素的标簽,後台系統就更新屬于該因素的歌單的數據給到前端界面上展示,這類都是獨立因素的被動推薦。
主動推薦
主動推薦,由系統定時更新數據并主動推薦到用戶面前,用戶打開界面就能接觸到主動推薦的結果;如網易雲音樂的熱歌榜,抖音的人氣熱搜榜等就是主動推薦的方式。
但這種熱榜這種統一推薦的方式有一定程度的成馬太效應——火的内容會得到更多的曝光越來越火,但大部分人喜歡的内容并不帶代表每一個用戶都是喜愛的,熱門推薦滿足用戶從衆心理的同時也忽略了用戶的個性差異體驗,所以就需要依據用戶個性的推薦來彌補,随着用戶對自我獨特性的感知越來越強,需要個性化定制的需求也越來越明顯。如何讓特定的内容滿足特定的用戶,讓用戶開開心心的走進個性推薦的陷阱裡就是接下來我們要講的重點。
融合因素推薦
融合因素推薦就是将幾個不同的因素依據特定算法融合
而産生新的屬性标簽,并推薦到與該屬性标簽匹配的用戶手機上。
我們把融合因素推薦分為基于内容本身屬性推薦、基于内容屬性與用戶屬性協同推薦、基于相似用戶協同推薦這三種推薦方式。
基于内容本身屬性推薦(推薦對象一般是所有人)
還是以抖音熱門短視頻為例,我們需要做的是依據内容的本身屬性建立内容畫像,用數據模型來表示内容的特征。
由抖音熱搜榜可看到,我們把點贊數排名在前30的視頻放上熱搜榜。
當然決定點贊數的因素除了視頻内容本身的類型及質量外,很大的關鍵還在于平台給多少人推薦了這個視頻,即有多少人可以刷到了這個視頻。平台判斷一個視頻是否值得推薦給更多的用戶群體,又與曆史用戶對視頻的交互行為息息相關。
例如:
短視頻平台将一個審核過後的新視頻先推薦給10w人的基礎用戶池進行播放展示,如果這10w人有很多人進行完全播放、點贊、評論、轉發等操作,平台就判斷該視頻為優質内容進而推薦給100w、1000w的用戶池如此類推。
如果該視頻在10w的展示量中大部分用戶對該視頻不感冒,很少播放完或點贊,就會減少該視頻的展示量或不會再推薦給更多的用戶。
這形成一個優質内容能得到更多展示劣質内容減少展示的良性循環。(用戶池也分不同種類的用戶池,舉例用非真實數據)
這樣判斷一個視頻能否進入到下一個用戶池的标準就成為了關鍵,現實中這個标準是根據模型動态變化的,現在我們先進行标準的性靜态分析這樣便于理解;根據下面初級的算法公式可看到一個視頻的優質程度與用戶對這個視頻的喜愛程度成正比,我們先用用戶的喜愛程度這個特性來反應視頻的優質程度。
視頻優質度=用戶喜愛度 X 視頻質量基數 X 題材類别基數 X 平台廣告基數
影響用戶喜愛程度的獨立因素有用戶對視頻的平均播放時長、點贊、評論、分享、關注以及不感興趣等操作,每一個操作都會為一個獨立因素增加數值;而且每個獨立因素對與平台判斷用戶對視頻的喜愛程度的重要性是不同的,如,分享>評論>點贊。我們用權重來表示,對喜愛度高的因素進行數據加權,數據加權一般有兩種常用方式;
自定義加權:産品經理、運營經理依據平時的數據報表人為的定義這些獨立因素和設置權重因子的數值,這種方式比較直接也比較簡單,但他局限于團隊的自身經驗,沒有經過大數據的驗證與現實還是有較大的偏差。
數據建模:數據建模簡單的說就是将時間變量、獨立因素、權重因子通過特定的算法公式進行計算得出該視頻的一個優質度數值。根據這個數值進行推薦和排名,随着時間變量的改變,獨立因子、甚至是權重因子也會依據一定的函數關系進行改變,整個模型的輸入和輸出都是動态變化的,而且我們不斷的采集用戶行為數據用來訓練模型使其更加接近現實預測的數值。
基于以上信息我們就可以粗劣的得出一張反映用戶對視頻喜愛程度的參考表,該表也可以反映出視頻的優質程度;
用戶喜愛度=(播放時長量 點贊量 評論量 分享量 – 不感興趣量 …)X 權重因子 X 衰減因子
(正常情況下,需要對各個指标做線性方程回歸分析,确定各個指标具有獨立性後,再做權重分析,以上面表格是非真實數據)
根據以上思路我們可以對視頻進行優質程度和類型的評定,有了内容畫像現在隻需找到對這個視頻内容感興趣的用戶把視頻推送給他就行了,下面就是我們要說到的基于内容屬性與用戶屬性的協同的推薦。
基于内容屬性與用戶屬性協同推薦(推薦給特定屬性的人)
我們通過采集一個人的基礎信息和行為數據來對一個用戶做定性分析,得出一個用戶在互聯網及現實中的各種特征,所有特征整合在一起就成為一個代表現實中用戶的虛拟畫像。
構建用戶畫像數據會用到靜态和動态兩類數據:
- 靜态用戶畫像數據:我們在注冊APP時通常會輸入姓名、年齡、性别、允許獲取位置、這些基礎信息相對穩定。
- 動态用戶畫像數據:用戶在平時生活對手機産生的操作行為,如你玩過的遊戲、關注的公衆号、消費記錄,有沒有房貸車貸發過紅包買過保險,這些行為最後都會變成幾千個事實标簽,用這些事實标簽構建模型計算用戶的行為偏好。
(圖片來源于回形針PaperClip)
還是用上面提到的用戶對視頻的喜愛度的情況為例。
當用戶刷抖音看到一個标簽為美女類的視頻點了一個贊,并不意為者該用戶就喜歡看美女可能是不小心點的,這就需要更多的行為來判斷該用戶對美女類視頻的喜愛程度;根據前面提到的初級公式:
對美女的喜愛權重=(播放時長量 點贊量 評論量 分享量 – 不感興趣量 …)X 權重因子 X 衰減因子
除了點贊、評論、分享,關注了某作者這些行為外還有一個時間的限定,短期行為無法代表長期興趣,單次行為的權重會随着時間流逝不斷衰減,用戶每次打開美女類内容都會生成一個興趣權重,把一段時間内你所有的美女類興趣權重進行累加,再用S型函數标準化就能得到一個0-10區間的興趣值,标簽值數值越高,就代表用戶對美女就越感興趣程度。
到了這裡平台已可以計算出用戶對某一類視頻的喜愛程度和厭惡程度,同時也對視頻做了分類處理,可直接根據用戶的偏好将視頻推薦給用戶。
平台除了可以計算出用戶在内容興趣上面的權重外還可以在消費能力、社交偏好等方向進行建模計算,進而得出一個交為完整的用戶畫像。
另外通過行為直接推薦視頻的效果往往不如通過同類視頻推薦,找到和你一樣的人,把他們的浏覽記錄推薦給你,往往比直接猜你喜歡什麼效果更好!
基于相似用戶協同推薦(人以群分)
如何找到和你一樣的人
根據以上思路,我們在用戶的美女喜愛偏好權重、社交偏好權重、消費能力權重等多個維度建立模型,計算用戶的偏好,之後将這些偏好反映的權重值轉化為特征向量!
如,我們把用戶對美女的喜愛權重為8,社交偏好權重為5,消費能力權重為2,将向量理解成多維空間上的一個坐标,通過把每個用戶的向量坐标代入餘弦公式和距離公式中,就能計算出和你相似的人,進而把用戶分類。
(這裡用到的是鄰近技術:利用用戶的曆史喜好信息計算用戶之間的距離空間中的點越近越相似。)
這樣廣告主或平台就可以依據與你相似群體的消費記錄和喜愛偏好給你推薦商品或視頻,這也恰巧就是你喜歡的類型。
需要說明的是,微信淘寶們采集的行為數據不僅僅對應你的賬号,更與你的手機唯一識别碼綁定在一起,這意味着你就算不注冊不登陸,你的行為數據一樣會被采集。同時廣告平台也可以根據你的手機識别碼在其他APP上為你投放廣告,這樣你在刷抖音的時候也能看到淘寶的AJ廣告了!
總的來說,你的一切上網行為都會在手機上留下操作的痕迹(基礎信息和行為數據)。平台采集到這些曆史痕迹進行數據清洗——結構化數據——建模分析,計算出你的行為偏好,根據你的偏好或同類人的偏好向你推薦商品和内容。
這也就是為什麼你剛在微信和朋友讨論AJ款式,刷公衆号就刷到了AJ的廣告,淘寶首頁也驚喜般的出現了AJ推薦;晚上刷抖音總是刷個不停,感覺刷到的每一個視頻都有某個點能戳中自己;
那麼陷入回音室的怪圈又是怎麼回事呢?(回音室怪圈:隻推薦你有興趣的内容,讓你接觸世界的邊界越來越窄,沉浸于自己營造的狹小的世界)
回音室怪圈的陷阱是我們自己挖的
由個以上個性化推薦機制的流程可知,你現在的行為數據将決定你将來會接收到什麼樣的内容,從這個角度看個性化推薦的結果完全取決于你自己本身的傾向。
如果你刷抖音時能包容那些和你意見不同的人,能耐心看完或評論互動,那麼根據個性推薦的機制,你的内容信息流中既有自己喜歡的内容也會有自我認知之外的内容,不用擔心個性化推薦會把你留在回音室裡面。
相反,如果你隻接受那些你認同的意見或人,不能包容異己,将與自己觀點不對等的内容拉黑處理,長此以往你的信息流裡就會隻剩下你喜歡的内容,沉浸在自己打造的回音室裡。
個性推薦隻是依據你的習慣做出的推薦結果,讓你掉進回音室怪圈裡的還是你自己。
參考書籍:《個性推薦》
用例及圖片來源于:回形針PaperClip
本文由 @瓶蓋 原創發布于人人都是産品經理,未經作者許可,禁止轉載。
題圖來自Unsplash,基于CC0協議
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!