推薦系統為客戶推薦商品自動完成-tft每日頭條

推薦系統為客戶推薦商品自動完成

科技更新时间:2026-07-22 10:44:01

編輯導語：相信大家都聽說過協同過濾算法，那到底什麼是協同過濾，有何用處。本文将為大家介紹推薦系統召回策略中基于協同過濾算法的召回，希望你能對此有更深的理解，一起來看看。

前言：上一篇為大家介紹了推薦系統召回策略裡面基于規則的召回，本篇将為大家介紹推薦系統召回策略中基于協同過濾算法的召回。
一、協同過濾算法綜述
大家應該在很多場合或者文章中都聽到過協同過濾算法，首先到底什麼是協同過濾（Collaborative Filtering），它的核心思想是什麼。

何為協同：

協同字面意思就是大家在一起互相配合來做成某一件事情。在協同過濾算法裡指的就是利用群體的數據去尋找規律，去尋找物料與物料，用戶與用戶之間的相似性。

何為過濾：

過濾字面意思就是把不符合條件的東西給過濾掉。在協同過濾算法裡指的就是當我們基于物料相似度或者用戶相似度進行推薦時，需要把那些相似性很低的物料和用戶過濾掉。

那“協同過濾”：其實就是利用群體的數據去尋找規律，去尋找物料與物料，用戶與用戶之間的相似性，然後再把相似性很低物料和用戶過濾掉，挑選出相似度最高的物料和用戶。

協同過濾算法的産生是推薦算法1.0時代“基于内容的标簽召回”算法後，人們開始利用數據本身探讨用戶與用戶，物料與物料之間的關聯性，從而演化出來了協同過濾（Collaborative Filtering）算法。

标志性的算法就是基于用戶的協同過濾算法，該算法在1992年被提出。協同過濾算法可以說是推薦領域最經典的算法了。甚至可以說協同過濾算法的出現，代表了推薦系統的出現。協同過濾算法一共分為兩個大的方式：基于鄰域的方法和基于模型的方式。

下面我們将詳細展開介紹：
二、基于領域的方法
2.1 基于用戶的協同過濾（User-Based）

AB用戶擁有相同的背景和興趣，基于用戶之間的相似性，為A推薦用戶B感興趣且用戶A沒有接觸過的内容。比如大學時候，我們都會問同專業的學長學姐應該選什麼課。這個就是學長學姐和我們有一樣的專業背景，基于他們過去經驗上過的課，一定可以推薦出哪些考試簡單給分又高的課，如果這個課很難給分又低，學長學姐們一定不會去上這個課。整個算法分為兩個大的步驟：

第一步：挖掘和目标用戶相似的用戶集合；

如何計算用戶之間的相似性，一般我們使用Jaccard系數或者餘弦相似度。具體公式如下：

上圖左側為曆史用戶浏覽商品數據，右側為計算用戶相似度的公式。用戶數很龐大，所以一般我們會設置一個K值，找出與用戶A最相似的Top K個用戶。例子中我們設置K為2，根據公式我們可以計算出與用戶A相似度最高的兩個用戶是用戶B和用戶E。

第二步：挖掘該集合中受歡迎的Item，同時目标用戶沒有接觸過的，将其推薦給目标用戶；

用戶B和E曆史浏覽過的商品中，商品d和e用戶A沒有浏覽過，需要計算用戶A對于商品d和e的興趣度。計算公式如上圖所示，我們以用戶A對商品d的興趣度舉例：（用戶A與用戶B的相似度 * 用戶B對于商品d的興趣度）（用戶A與用戶E的相似度 * 用戶E對于商品d的興趣度），這裡用戶之間的相似度第一步裡面已經計算過了，用戶B & E對于商品d的興趣度，我們統一設定：如果浏覽過興趣度就為1，沒有浏覽過興趣度就為0。

實際業務中，我們可以更加細化，比如同一時間段浏覽的次數等将興趣度計算方式更加細化。最終計算出用戶A對商品e的興趣度為1.15，對商品d的興趣度為0.4，所以優先推薦商品e。

User-CF算法1992年就已經在某電子郵件的個性化推薦系統上得到了應用，關于User-CF算法的優缺點我們在介紹完Item-CF算法以後進行統一對比介紹。
2.2 基于物料的協同過濾（Item-Based）

基于物料之間的相似性，通過用戶曆史喜歡的物料，為其推薦相似的物料。這裡面的物料相似性并不是基于物料之間标簽重合度來計算相似度，Item CF是基于用戶對于物料的曆史行為數據來計算物料之間的相似度。Item-CF最早是由亞馬遜公司提出的，目前在各大互聯網公司應用都十分頻繁。

整個算法同樣分為兩個步驟：

第一步：計算商品之間的相似度；

首先我們基于用戶曆史浏覽的行為，統計兩個商品被同一用戶浏覽過的次數，比如pair（e,d）同時被3個用戶都浏覽過，那麼相似度矩陣裡面就填入3。最後我們使用餘弦相似度公式來計算商品之間的相似度。

第二步：基于目标用戶曆史浏覽行為和商品之間的相似度，為其推薦感興趣且未浏覽過的商品；

相似度計算完以後，我們需要計算用戶對這些沒有浏覽過商品的興趣度。比如我們計算用戶A對于商品d的興趣度，案例中因為一共隻出現了5個商品，隻有d和e用戶A沒有浏覽過，這裡的K值我們就設置為3，我們隻基于商品d和a,b,c之間的相似度以及用戶A對于商品a,b,c的興趣度進行計算。

實際案例中用戶A浏覽過的商品很多，和d有交集的商品也會很多，我們需要設置一個合理的K值，無法計算商品d和所有商品的相似度，再去乘以用戶A對于這些商品的興趣度。最終根據上述公式計算得出用戶A對e的興趣度為1.74，對d的興趣度為1.17。所以優先為用戶A推薦商品e。

最後我們用下面這張圖将User CF和Item CF之間的區别進行歸納：

上圖裡面有幾個核心的點需要關注。

（1）應用領域

User-CF在新聞社交網站等UGC社區使用的較多，而Item-CF在電商、電影&音樂等網站使用的較多。一方面因為新聞等網站内容更新快，使用Item-CF無法滿足時效更新的要求，另一方面新聞等網站上用戶的興趣相對粗粒度，很多用戶群體喜歡閱讀同一内容。而在電商、電影等網站上用戶興趣相對比較個性化，使用Item-CF更能夠反映用戶興趣的傳承。

（2）可解釋性

User-CF的解釋性弱于Item-CF，因為User-CF是側重于人與人之間的相似，給用戶A推薦用戶B感興趣的東西。而Item-CF是側重于基于用戶A曆史買過的商品，為其推薦相似的商品。從直觀上用戶也更願意相信Item-CF這種推薦方式。
三、基于模型的方法
協同過濾是一種思想，很多時候大家在講協同過濾時就講User-CF和Item-CF，其實協同過濾中有很大一部分甚至說當前先進的協同過濾算法都是基于模型的協同過濾。下面為大家介紹幾種常見基于模型的協同過濾。
3.1 基于圖模型（Graph-based model）

第一步：将數據由表格轉化為二分圖；

我們将表格用戶曆史浏覽過的數據轉化為Graph，左邊為用戶Node，右邊為物料Node。用戶浏覽過的物料兩個頂點之間就連一條線，頂點與頂點之間的連線我們叫做邊Edge。

第二步：基于兩個頂點之間路徑數、路徑長度及經過的節點出度判斷相關性；

比如我們計算用戶Node-A與物料Node-c和Node-e之間的相關性。首先我們統計Node-A到Node-c可以有幾條路徑，這裡面隻有一條路徑可以到達就是A—a—B—c，長度是3。而Node-A與Node-e之間一共有兩條路徑可以到達，分别是A—b—C—e和A—d—D—e，長度均為3。所以Node-A和Node-e的相關性要強于NodeA與Node-c。

同時我們再去比較同樣是兩條長度為3的路徑“A—b—C—e”，哪條路徑産生的鍊接更強了？我們分别去統計兩個路徑經過Node的出度，何為出度？

出度就是該Node對外連接幾個其他Node，比如Node-A的出度就是3。

兩條路徑經過節點的出度分别是【3,2,2,3】和【3,2,3,3】，該某個節點的出度越大代表這個節點的鍊接越多，該節點和連接的單個節點的相關性就越弱。所以路徑A—b—C—e産生的A與e的相關性要強于A—d—D—e産生的A與e的相關性。

以上就是基于圖模型的協同過濾算法。

下一篇将重點為大家介紹基于向量的召回，大家經常聽到的FM模型以及雙塔模型，大家敬請期待~

本文由 @King James 原創發布于人人都是産品經理。未經許可，禁止轉載。

題圖來自 Unsplash，基于 CC0 協議
,
更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技手機nfc講解
相信很多人都聽說過NFC這個詞，知道它是手機的一個功能，但是具體有什麼用？是幹什麼的？也許就很少有人知道了。很多人在購買手機時會聽導購員或産品介紹裡有NFC，但是買到手機後，用了一段時間，發現這個功能可有可無亦或者壓根就沒發現這個功能怎麼用... 2022-10-26
科技電腦屏幕保護黑屏怎麼消除?
電腦屏幕保護黑屏怎麼消除?點擊【開始】菜單--找到【控制面闆】并打開，接下來我們就來聊聊關于電腦屏幕保護黑屏怎麼消除?以下内容大家不妨參考一二希望能幫到您!電腦屏幕保護黑屏怎麼消除點擊【開始】菜單--找到【控制面闆】并打開。點擊【系統安全】... 2022-06-20
科技鐵絲網門頭招牌
鐵絲網門頭招牌?現如今，在傳統裝修材料樹大根深、風起雲湧的大環境下，北京雅點作為門頭革命的領軍者，以“考工”品牌無縫門頭引領行業風向，以改變傳統材料為使命在洶湧的浪潮中奮鬥着，這時有人就會問，北京雅點憑什麼談颠覆傳統？，我來為大家講解一下關... 2022-11-03
科技防僞防拆标簽制作方法
防僞防拆标簽制作方法?随着社會的發展，一物一碼的防僞功能在各行各業都成了需要做的工作，所以制作防僞标簽也成了印刷行業的重要工作，下面我們來看一下如下圖中防僞标簽該如何批量制作：，我來為大家科普一下關于防僞防拆标簽制作方法?以下内容希望對你有... 2022-10-13
科技拆盲盒拆到隐藏款的
最近盲盒蠻火的，張大媽衆測小手辦也挺誘人，不過咱暫時沒這個運氣，隻能瞅着哪家白菜自己買了嘗個鮮。拿下一個66元數碼禮包當做“盲盒”回來拆，體驗一下什麼叫“未知的快感”，不過總價不咋高，心理預期也就很平淡，猜想有幾根數據線就了不得了，沒想到裡... 2022-10-23
科技五大素顔霜測評
廢話不多說，直接上幹貨#素顔霜##Dr.Jart##瑪麗黛佳##芭妮蘭##九朵雲##韓後##Cellapy##G9skin#關于素顔霜，那些你可能不知道的事？1）素顔霜是繼氣墊CC後，又被韓國opa開創出的一個護膚底妝的新類型産品，其牛逼程... 2022-11-28
科技 8月12号螞蟻莊園課堂答案
8月12号螞蟻莊園課堂答案?我國的手機号碼是11位數字，這也是非常有講究的，今日的螞蟻莊園小問題就和手機号碼位數有關，不同國家手機位數會有所不同，那麼，我國手機号碼11位原因是什麼？下面八寶網小編就帶來詳細介紹，下面我們就來聊聊關于8月12... 2023-02-14
科技 iqoo855版nfc功能怎麼用
iqoo855版nfc功能怎麼用?在iqoo855版桌面找到“設置”并且點擊進入，我來為大家講解一下關于iqoo855版nfc功能怎麼用?跟着小編一起來看一看吧!iqoo855版nfc功能怎麼用在iqoo855版桌面找到“設置”并且點擊進入... 2022-06-12
科技最新iphone支持雙卡雙待麼
9月10日消息，日前，一位網友在微博上面曝光了一張中國電信的宣傳海報，海報是宣傳蘋果即将發布的新iPhone，上面有“雙卡全網通”，“雙卡雙網雙4G，天生絕配是天翼”的語句。很明顯中國電信在提醒消費者，這次全新的iPhoneXS能同時插兩個... 2022-12-07
科技電腦d盤打不開的原因
電腦D盤無法訪問打不開，裡面存儲了許多重要的文件怎麼辦？今天就和大家一起分析一下D盤打不開的具體原因以及如何從D盤恢複數據。D盤打不開故障描述及原因我們都知道，電腦硬盤一般都會分為多個分區，例如C盤，D盤，E盤等。其中，C盤是系統盤，用于安... 2022-11-12
科技蘋果手機突然屏幕失靈怎麼辦
蘋果手機突然屏幕失靈怎麼辦?首先要做的是重啟iphone，同時按住“Home鍵”和“電源鍵”，今天小編就來聊一聊關于蘋果手機突然屏幕失靈怎麼辦?接下來我們就一起去研究一下吧!蘋果手機突然屏幕失靈怎麼辦首先要做的是重啟iphone，同時按住“... 2022-06-16
科技手機隐藏的一些功能你知道嗎
我們現在買手機，包裝盒裡都有什麼？手機主機、充電頭、數據線、卡針、保修卡，如果廠商比較良心，還會送你保護殼、貼膜、耳機、轉接頭。也許你會問：這有什麼好說，不一直都這樣麼？還真不是這樣，相比于十幾年前的手機包裝盒少了一樣大件兒：一本厚到可以裝... 2022-10-21
科技手機網速怎麼越來越慢
手機網速怎麼越來越慢?打電話給運營商客服來刷新上網數據：因為運營商分配給每個賬号的存儲空間較小，長時間使用難免會積累較大的曆史數據，從而導緻手機上網速度過慢這時用戶隻需緻電當地運營商的人工客服，尋求刷新數據，15分鐘之後再進行開關機，網速遲... 2022-06-12
科技高考後購買什麼手機好
沉瓜浮李的六月底不僅烈日炎炎，也正是高考學子喜提一生中最重要的高考成績的日子，一分耕耘一分收獲，相信努力勤奮的學子一定可以收獲不錯的成績！高考成績放榜後，相信各位考生最興奮的事應該是換新手機了，終于可以告别陪伴高中三年的舊手機了！今天作為一... 2023-02-14
科技 win10系統網速是不是很慢
如果網絡慢的話，對我們工作學習的效率影響非常打，打遊戲體驗感也非常的不好，那有的用戶覺得自己的Win10系統網絡特别慢不知道什麼原因？其實影響網絡的問題有很多方面，下面給大家詳細說明一下為什麼Win10網絡速度慢及解決方法。方法如下方法一：... 2022-12-04
科技刺激戰場手機不卡怎麼辦
骁龍835等gpu性能領先660，理論情況下，流暢畫質下是可以60幀運行的。要知道怎麼解決卡，就得知道為什麼會卡。原因有以下幾點:第一，溫控限制了骁龍835的發揮，發熱就降頻，導緻手機不流暢。第二，刺激戰場幀數隻提供到中的25幀，甚至連30... 2022-12-29
科技最火的效率工具
作者：朱衛軍俗話說“工欲善其事，必先利其器”，真的一點沒錯，用對工具，你的幸福指數會立馬提升。我平時主要的工作是看數據、撸代碼、寫博文，這三樣事情都得靠電腦完成，幾乎占據了我90%的時間，因此用一些提升效率的小工具非常有必要。這些小工具既包... 2022-11-23
科技注音符号假名
注音符号假名?三種語言都有基本字符和注音符号，學習的時候都是從這些基本知識開始的，接下來我們就來聊聊關于注音符号假名?以下内容大家不妨參考一二希望能幫到您!注音符号假名三種語言都有基本字符和注音符号，學習的時候都是從這些基本知識開始的。首先... 2022-10-29
科技生根粉的正确使用方法和注意事項
植物根系的生長發育對提高植物的營養吸收能力、生物量的增加及植物品質都有重要的作用，而作為植物根系的促進劑，生根粉是一類高效、廣譜、複合型的植物生長調節劑，應用于植物扡插育苗、播種育苗、苗木移栽、飛機播種及農作物、蔬菜、果樹、藥用和特種經濟植... 2022-11-05
科技怎麼調電腦風扇轉速
怎麼調電腦風扇轉速?打開開始菜單，依次點擊【開始/Windows系統/控制面闆】菜單項，現在小編就來說說關于怎麼調電腦風扇轉速?下面内容希望能幫助到你，我們來一起看看吧!怎麼調電腦風扇轉速打開開始菜單，依次點擊【開始/Windows系統/控... 2022-06-17
科技柳州某中學推出學生定制華為手機
新京報快訊據柳州市教育局官方微信公衆号消息，針對昨日多家新聞媒體及網絡媒體陸續報道“柳州某中學推出學生定制華為手機”的事件，柳州市教育局5月13日回應稱，得知相關消息後，柳州市教育局責成柳州高級中學調查核實。經初步了解，該事件基本情況如下：... 2022-12-10
科技 ubuntu雙系統安裝教程
ubuntu雙系統安裝教程?給硬盤劃分空白空間安裝Ubuntu,如果不是用Windowshome版本的話，不需要工具，我來為大家科普一下關于ubuntu雙系統安裝教程?以下内容希望對你有幫助!ubuntu雙系統安裝教程給硬盤劃分空白空間安裝... 2022-06-01
科技新電腦設置
新電腦設置?WIN10系統都有語音提示，按着操作來就可以，可以手動設置，也可以語音控制，不過語音控制隻限于筆記本使用有一點注意的地方就是不要連接網絡，無論是台式或者是筆記本因為鍊接網絡在系統設置的時候會自動檢測更新的，進行更新會很慢的，現在... 2022-06-13
科技買手機需要身份證嗎
買手機需要身份證嗎?去營業廳或者網上購買手機是不需要身份證的，正常付款就可以購買手機了但是手機需要使用手機卡才可以進行通話及上網功能，手機卡需要另行購買，從“手機實名制”推行後，購買手機卡就必須登記身份證，否則手機卡就無法入戶，我來為大家科... 2022-06-12
科技電腦每天需要關機嗎
當下，電腦越來越普及，大家在使用過程中有沒有遇到過一些疑問呢？其實我們完全可以自己解決哦~Q1電腦有必要每天關機嗎?非常有必要！首先，每天關機可以省電；其次，每天都關機可以延長電腦壽命；還有關機還能避免電腦被不良分子利用、洩露隐私等；最後，... 2022-10-26
科技你知道你的手機上有哪些傳感器嗎
大家好，我是【廣州工控傳感★科技】傳感器事業部，張工。智能手機給我們帶來了極大的便利，它們可以幫助我們導航地圖、計算步數、測量我們的心率等等。所有這些功能都是由手機傳感器提供的，所以大家都知道手機的傳感器是什麼？為大家介紹一下手機的傳感器是... 2022-11-16
科技如何将舊手機的微信聊天記錄轉移
當我們更換手機後，微信裡的聊天記錄如何快速遷移到另外一部手機？這裡給大家說一個非常好用的方法，隻需要兩步就可以。首先将兩部手機連接同一個WIFI，或者一部手機分享個人熱點也可以。然後在舊手機裡點擊界面下方【我】→設置→聊天→聊天記錄備份與遷... 2022-11-04
科技手機如何投屏到電視上簡單操作
盡管智能電視與傳統電視相比已取得了顯着進步。但是智能程度仍然不如手機。在電視上搜索和輸入文字非常麻煩，而且許多電影和電視節目的來源也很難找到。想象一下，您使用遙控器操縱光标很難拼寫26個字母。體驗真的很酷。實際上，隻要将手機顯示在電視上，一... 2022-11-24
科技 b站回應衛星發射失敗成功之母
澎湃新聞記者揭書宜B站定制的“哔哩哔哩視頻衛星”成功升空。9月15日，我國首個由互聯網公司哔哩哔哩（Nasdaq:BILI，俗稱B站）定制、用于科普傳播的視頻遙感衛星——“哔哩哔哩視頻衛星”成功升空。該衛星由中國長征十一号運載火箭在黃海海域... 2022-10-29
科技太陽雨太陽能熱水器怎樣安裝
準備工作1、準備施工工具：扳手、電鑽、螺絲刀等。2、打開包裝，按裝箱單檢查配件是否齊全。（1）真空管數目及完好情況。（2）電加熱（可選件）外觀是否完好。（3）水箱箱體是否完好。（4）各支撐輔件是否齊全。（5）智能控制儀包裝是否完好。（6）恒... 2022-11-25

tft每日頭條

> 科技

> 推薦系統為客戶推薦商品自動完成

推薦系統為客戶推薦商品自動完成

2.1 基于用戶的協同過濾（User-Based）

2.2 基于物料的協同過濾（Item-Based）

3.1 基于圖模型（Graph-based model）

相关科技资讯推荐

热门科技资讯推荐

网友关注