知識圖譜的構建與存儲-tft每日頭條

知識圖譜的構建與存儲

科技更新时间:2026-08-03 11:12:44

　　本篇文章為大家介紹了什麼是推薦系統、推薦系統運作流程、圖譜應用的優勢、圖譜在推薦中的應用、圖譜推薦的原理、圖譜推薦的難點，并附上實際例子幫助大家進一步了解。

　　知識圖譜的構建與存儲（知識圖譜在推薦系統的落地）(1)

　　随着互聯網進入了下半場，精益化發展成為了主旋律，為了實現同樣的獲客成本下收益最大化，各家對推薦系統的需求日益強烈。

　　本文通俗的講述通過幾個段落簡單講述什麼是推薦系統、推薦系統運作流程、圖譜應用的優勢、圖譜推薦的原理、圖譜推薦的難點，供大家參考了解。

　　一、什麼是推薦系統

　　推薦系統，正如它的字面信息一樣，就是通過推薦内容滿足用戶個性化的需求，解決信息過載的問題的系統。

　　推薦系統根據形式的差異接入了不同的場景，在大家的日常生活中就無時不刻都在享受這它的便利。

　　當你一大早打開淘寶，掃一眼“猜您喜歡”，發現一個自己喜歡的寶貝，直接添加進購物車；打開今日頭條，看了下自己感興趣的新聞，中間看到一個自己不了解的内容，打開百度輸入後，輸入框下面展示了幾個相關内容……

　　知識圖譜的構建與存儲（知識圖譜在推薦系統的落地）(2)

　　根據推薦的形式能不能清晰地影響用戶的操作可以把推薦劃分為隐形推薦和顯性推薦。

　　隐形推薦不會對用戶預期的操作産生影響，如：新聞排序，搜索結果排序等在用戶不知不覺中給用戶展現；顯性推薦會改變用戶預期的操作，如：輸入聯想、推薦問句等用戶可以根據推薦的内容選擇自己期望的内容。另外，根據推薦的階段不同，也可以将推薦分為相關性推薦、預測式推薦、生成式推薦。

　　相關性推薦根據用戶當前信息，召回相似度較高的内容作為推薦的内容；預測式推薦為根據用戶曆史信息，可以是用戶信息、操作記錄、購買記錄等，預測用戶可能感興趣的内容，作為推薦的内容；根據用戶的信息推薦，不管是相關性還是預測式的都會導緻推薦的内容随用戶使用時長增加，變得内容單一，降低用戶的新鮮感，因此還需要生成一些無關的内容作為推薦的補充，以滿足用戶的新鮮感，這就是生成式推薦。

　　二、推薦流程

　　推薦的過程可以簡單理解為三個步驟：召回、過濾、排序。

　　首先系統根據獲取到的信息，召回适合推薦内容，獲取的信息可以是用戶的搜索記錄、購買記錄、評論等。召回的内容中有的是這個用戶不關注的，可能是他已經買過了的寶貝或者已經看過了的内容，這會兒就需要根據過濾的條件，将不需要的内容進行過濾。經過過濾産生的推薦集還需要根據内容的相關度進行排序，最後系統根據相關度的排序，将内容分配到對應的模塊，這樣用戶就能看到自己感興趣的内容了。知識圖譜的構建與存儲（知識圖譜在推薦系統的落地）(3)

　　有的系統也會将過濾放在第一步，先根據條件過濾一些輸入信息，然後喂給推薦系統。

　　這樣能夠減少推薦系統的計算量，縮短推薦系統處理時間，提高推薦系統的即時性，但是這麼做也會存在一些問題：減少輸入導緻類别特征的内容丢失，影響推薦系統的内容數量與質量。

　　三、知識圖譜在推薦應用的優勢

　　知識圖譜就是實體的屬性關系網，能夠很好的表達實體之間的關系，這個關系可以是具有同樣屬性的實體，也可以是上下位的實體關系。

　　對于推薦系統來說，這個圖譜中的實體不僅僅是推薦的内容，還包含了用戶的信息，或者是标簽，所以知識圖譜很好的提供了一個推薦對象的關系網。

　　通過知識圖譜，推薦系統可以很好給你推薦關聯内容，例如，你購買了手機，那麼它就可以給你推薦充電寶、保護套、鋼化膜等，因為在它的腦子中知道這些産品是手機的附件。

　　也可以通過用戶搜索的藍牙耳機，給他推薦同樣具有藍牙功能的耳機。

　　四、圖譜在推薦中的應用

　　我們通過一個簡單的商品圖譜和大家講解圖譜推薦的遍曆邏輯。這是一個數碼垂類下的耳機的簡化商品圖譜。

　　知識圖譜的構建與存儲（知識圖譜在推薦系統的落地）(4)

　　1. 下位實體遍曆

　　下位關系是相關性最強的關系，通常包含的含義是下一步操作、必要條件，例如：買了手機就會買手機殼、買了汽車就會買玻璃水等。

　　不過也不是所有的下位關系都是能放置在推薦序列的前列中的，例如：筆記本貼紙與筆記本相關，但是不是大家都會貼筆記本貼紙，所以下位關系也存在低概率的情況，這部分就會被其他高概率的遍曆邏輯給擠到較後的排列中。

　　2. 組合屬性遍曆

　　在圖譜中有的實體由多個相同的父實體連接，這種實體之間通常具有強相關性，就好比是你同父母的親兄弟，這種推薦也是應用的最多的。

　　在下面這個實例中就可以理解該用戶為bose的忠實用戶，計劃購買它的耳機，那麼我們根據用戶搜索QC30的記錄，推薦QC35、QC25等結果，這樣就既能夠提高成交的可能性，也能夠實現更高的客單價，實現商家、平台的雙赢。

　　知識圖譜的構建與存儲（知識圖譜在推薦系統的落地）(6)

　　3. 同屬性遍曆

　　除了上面兩種相關性較強的遍曆邏輯之外，相同父實體的子實體也具有相關性，但是我們需要注意當一個實體具有多個父實體的情況下，不是所有的父實體都适合被往下遍曆。

　　例如：用戶咨詢QC30，那麼我們給它推薦bose的家庭音響解決方案就不合适，因為用戶本質需求隻是購買耳機。

　　知識圖譜的構建與存儲（知識圖譜在推薦系統的落地）(7)

　　4. 二元實體遍曆

　　二元實體遍曆适合同類父實體的場景，同類的父實體通常表示這兩個産品是一個互補或者相似的含義。

　　例如：用戶咨詢QC30，那麼他可能需要一個MP4來搭配他的耳機，同樣的情況還有鼠标-鍵盤、短袖-短褲等。

　　知識圖譜的構建與存儲（知識圖譜在推薦系統的落地）(8)

　　5. 多路徑遍曆對比

　　優于圖譜中實體之間的關系是網狀的，所以在遍曆時存在兩個實體之間可以通過多種遍曆邏輯推理得到。

　　那麼我們就需要采取一種方式來對比那種遍曆邏輯的結果才是我們應該采用的。

　　一般會根據邊的權重計算得到兩個實體的相關度。

　　知識圖譜的構建與存儲（知識圖譜在推薦系統的落地）(9)

　　五、如何過濾

　　根據推薦系統生成的推薦序列過濾推薦結果，這個根據不同業務方的需要會有很大的差别，這裡就簡單說明一些通用的實例：

　　1. 時間區間内已經發生期望操作的結果

　　期望操作是指用戶使用産品時，我們期望用戶最終實現的行為，可能是點擊、購買等。

　　如果用戶已經對推薦的内容發生了期望操作，那麼繼續推薦這個内容，無疑會浪費有效面積，導緻客單量降低。

　　為了避免這種情況，推薦系統會針對不同的推薦内容設置一個時間區間，在這個時間區間内已經産生過期望操作的就不再進行推薦，例如，服飾可以設置為1個月，快消品則可以設置更短的時間限制。

　　2. 展示未産生期望操作的結果

　　一千個讀者就有一千個哈姆雷特，面對一千個用戶，推薦系統的結果肯定不可能都是一千個都是滿意的，所以當推薦的内容用戶沒有産生期望操作時，系統可以認為該推薦結果對于這個用戶是弱關聯性推薦或者說是無效推薦，那麼系統在再次生成推薦序列是就可以将其過濾，讓其他用戶可能感興趣的結果補充進行展示。

　　3. 同類型的結果

　　當生成的推薦序列中已經存在很多的同類産品時，我們也需要進行過濾。

　　同類的結果，用戶隻會對其中的幾個結果産生操作，如果過多地展示同類的内容，就會導緻推薦的内容豐富度不夠。

　　一般同類的結果，推薦系統隻會保留其中相關度最高的幾個，并且在展示上會将同類結果控制放置間隔，避免一起出現。

　　六、圖譜推薦指标

　　圖譜更新前都需要評估相對的效果，隻有相對效果優與原先的結果，圖譜才能上線。

　　評估相對結果的指标可以分為服務指标和業務指标。

　　服務指标是反映圖譜服務效果的指标，都是一些客觀數據；業務指标是與業務相關聯的，反映的是服務上線後的服務效果的指标。

　　1. 服務指标

　　實體識别準确率=實體解析正确數/用戶問句總數；

　　實體識别召回率=實體解析正确數/相關實體總數；

　　内容相關度=用戶評分/推薦數量。

　　2. 業務指标

　　展現點擊比=用戶點擊數/展現數量；

　　轉化率=用戶産生期望操作數/展現數量。

　　七、圖譜應用的難點

　　知識圖譜雖然在推薦系統中應用存在優勢，但是在實際應用中會因為它的種種難點被限制應用，下面和大家一起講講圖譜應用的困難。

　　1. 知識圖譜schema維護

　　在推薦系統中應用的圖譜都是大規模的圖譜，實體都是在萬級的，像阿裡的商品圖譜甚至達到了十億級。那麼大的圖譜完全由人工運營維護肯定是不現實的，實際上這些圖譜也的确由系統自動進行維護，人工隻是輔助進行運營。

　　系統通過現成的表結構數據、機器閱讀理解抽取的實體與關系自動構建知識圖譜。

　　例如：阿裡的商品圖譜部分數據來源就是寶貝下面的商品詳情：

　　知識圖譜的構建與存儲（知識圖譜在推薦系統的落地）(10)

　　但是目前的技術還不能做到100%的自動構建準确，因此構建後如何篩選出有問題的關系就需要人工借助工具進行調整了，常見的需要人工糾正的有:

　　同寶貝在不同商家出現不同詳情的情況，需要人工二次确認；寶貝詳情變化後，需要人工更新。

　　2. 推薦的時效性差

　　圖譜的量級達到了一定，如何快速的萬級億級的實體和屬性中找到對應的數據，對于模型來說是一個十分艱巨的工作。

　　另外大規模的圖譜，實體之間的關系密切，如果做到的二元遍曆，那麼延伸出的實體也是指數量級的，無法直接拿來做推薦。

　　所以圖譜推薦的時效性較差，不适合應用于需要實時返回推薦結果的場景，所以圖譜推薦往往應用在用戶使用的間隙生成推薦的内容。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技 word表格怎麼換下一行
演示機型：華為MateBookX系統版本：win10APP版本：word20161、點擊word工具欄裡的“表格”，在下拉菜單中選擇“表格屬性”。2、在“表格屬性”中單擊最右邊的“單元格”，然後單擊下面的“選項”。3、單擊去掉“自動換行”前面的對号，選擇& 2023-06-29
科技新速派2019落地價多少
1、斯柯達2019款速派TSI280DSG标準版的官方價格是16.99萬元，搭載的是1.4T渦輪增壓發動機，配備7擋雙離合變速箱，由于此次新車沒有手動擋，這車是算是目前的最低配版本了。2、按照16.99萬元的價格計算，它的全款購車價格必要花費大概是1.6391萬元，購置稅就需要1.4521萬元了，代辦上牌費算500元，車船使用稅是420元，交強險為950元。3、商業保險部分，新車一年全險需6300 2023-06-29
科技新手機第一次充電多長時間
1、手機第一次充電不應長時間充電，将手機電量充滿就可以了，最好是提示滿了，再繼續充15分鐘最好。2、... 2023-06-29
科技如何把word轉換成pdf
1、首先打開需要轉換成PDF格式的Word文檔。2、點擊左上角的“文件”選項卡。3、然後選中“另存為... 2023-06-29
科技 altiumdesigner是什麼軟...
是原Protel軟件開發商Altium公司推出的一體化的電子産品開發系統，主要運行在Windows操作系統。這套軟件通過把原理圖設計、電路仿真、PCB繪制編輯、拓撲邏輯自動布線、信号完整性分析和設計輸出等技術的完美融合，為設計者提供了全新的設計解決方案，使設計者可以輕松進行設計，熟練使用。電路設計自動化EDA（ElectronicDesignAutomation）指的就是将電路設計中各種工作交由計 2023-06-29
科技華為手機聲音小是什麼原因
1、音樂播放過程中如果來通知音（例如微信，短信等通知），通知音的優先級較高，讓您知道到通知的到來，産... 2023-06-29
科技世界上第一台電子計算機是什麼
1、世界第一台電子計算機問世是1946年2月15日，世界上第一台通用電子數字計算機“埃尼阿克”（EN... 2023-06-29
科技耳機有電流聲小妙招
1、以電腦調節耳機為例：将光标放在電腦右下角的小喇叭處，右擊選擇音頻設備選項。2、進入聲音選項框，點... 2023-06-29
科技一汽大衆寶來共有幾個款式
1、一汽大衆新寶來1.6LMT。2、一汽大衆寶來經典1.6/2V5-G時尚型TL。3、一汽大衆新寶來1.6LAT。4、一汽大衆新寶來2.0LAT。5、一汽大衆新寶來HS1.6L時尚手動型。6、一汽大衆寶來經典1.6/2V5-G豪華型HL。 2023-06-29
科技如何安裝windows7
1、下載系統鏡像文件，解壓到D盤根目錄下，然後雙擊硬盤安裝。2、一般默認安裝系統到C盤，選擇C盤中需... 2023-06-29
科技手機上顯示hd是什麼意思
1、hd是HighDefinition的縮寫，意思是高分辨率。手機上方若顯示了hd，則說明開通了Vo... 2023-06-29
科技 wps裡面如何做三條折線的圖
1、打開【WPS】軟件，點擊【WPS】文字下拉框中的新建，新建一篇文檔。2、在【WPS】文檔中，單擊... 2023-06-29
科技如何讓阿維手機聲音變大
1、如何将手機聲音變大，除了最常見的就是按住手機音量“+”鍵，來擴大手機外放的聲音，達到将手機聲音變... 2023-06-29
科技手機刷機教程是什麼
1、手機刷機需要安裝一款刷機軟件，這個軟件用的人也非常的多，還有一件ROOT的功能，刷機也需要ROOT，我們搜索引擎搜索卓大師”，然後點擊下載安裝。2、然後我們在進入自己的手機，點擊設置，然後點擊開發人員選項，然後把USB調試打開。不同安卓版本的手機打開的位置也不一樣，這需要自己在手機設置界面裡找。3、然後把手機用數據線連接好電腦，然後在打開安裝好的卓大師，卓大師連接手機成功之後，點擊ROM專區。 2023-06-29
科技怎樣磨好鑽頭
1、麻花鑽對于機械加工來說是一種常用的鑽孔工具，磨鑽頭前，先将鑽頭的主切削刃與砂輪面放置在一個水平面... 2023-06-29
科技 cpu散熱器怎麼安裝
1、拆開主闆包裝，我們會看看一個塑料罩子在主闆靠邊的位置，那裡一般就是CPU的所在了，我們用大指姆用... 2023-06-29
科技 q5藍牙音樂怎麼播放音樂
1、建立配對關系，分别開啟手機和導航機的藍牙功能。2、将手機上的藍牙設置設為“對所有人可見”搜索或打... 2023-06-29
科技冰箱響個不停是怎麼回事
1、冰箱出現響個不停的現象，更多的是壓縮機故障造成的。遇到這種問題，可以根據聲響來判斷壓縮機内部的問... 2023-06-29
科技雲閃付怎麼刷公交車
1、首先在應用商店下載一個雲閃付，并打開。2、然後用手機号進行注冊登錄，并綁定銀行卡。3、點擊下放中... 2023-06-29
科技開關電源變壓器型号标識
1、開關電源變壓器是我們生活中最常見的一種用電設備，開關電源變壓器型号有哪些?開關電源變壓器主要是由... 2023-06-29
科技電腦健盤各健功能和使用
1、F1幫助F2改名F3搜索F4地址F5刷新F6切換F10菜單2、CTRL+A全選CTRL+C複制C... 2023-06-29
科技拖拉機升降調節閥在哪個位置
1、一種用于大、中功率輪式拖拉機的液壓分配器，主要由殼體、回油閥、系統安全閥、主控制閥、下降速度調節... 2023-06-29
科技手機錄音誤删怎麼恢複
1、使用軟件前需要先将手機ROOT，将手機用USB數據線與電腦相連。2、同時打開手機中的“USB存儲... 2023-06-29
科技 oppo手機root權限怎麼開啟
演示機型：華為MateBookX&&OPPOFindX3系統版本：win10&&ColorOS11APP版本：一鍵rootv3.5.01、首先用電腦搜索“一鍵root”，下載安裝好備用。2、此時手機需要将USB調試啟用，打開手機，點擊設置按鈕。3、點擊關于手機按鈕，在版本号處連續按4次，然後會提示USB調試已經開啟。4、返回設置菜單，選擇其他設置，開發者選項，找到USB調試 2023-06-29
科技 icp是什麼儀器
icp-aes分析儀，主要用于無機元素的定性及定量分析，ICP-AES電感耦合原子發射光譜儀作為一種大型精密的無機分析儀器。廣泛地應用于稀土分析、貴金屬分析、合金材料、電子産品、醫藥衛生、冶金、地質、石油、化工、商檢以及環保等部門。icp-aes分析儀由于采用了計算機技術，儀器的智能化、屏幕顯示的圖和文及數據的采集、處理等都達到了目前國内先進水平，是諸多行業理想的分析儀器。 2023-06-29
科技液壓油缸密封圈規格
規格AB20-06/WF-WDOVIAB20-06/WF-WD10VIAB20-06/WF-WD12... 2023-06-29
科技線路老化會出現什麼狀況
電線外表絕緣層多用塑料和橡膠制成，使用時間長了就會老化，失去絕緣作用。一般家用電線正常情況使用壽命可達10－20年。電線老化後，絕緣性能下降，容易産生短路，尤其遇到潮濕天氣，電線外表雖完整，但絕緣性能已降低，當水分浸入到金屬導體時容易發生短路而發生火災。在購買更換電線時，一定要注意不要買到劣質電線，使用劣質電線也存在着很大的安全隐患。工商部門提醒消費者，購買電線電纜時，應該注意查看産品和合格證上是 2023-06-29
科技沒有交通信号燈控制的路口用什麼燈
《中華人民共和國道路交通安全法實施條例》第五十九條機動車在夜間通過急彎、坡路、拱橋、人行橫道或者沒有交通信号燈控制的路口時，應當交替使用遠近光燈示意。夜間在通過沒有交通信号燈控制的路口時，在快到達路口時，近光和遠光燈交替轉換，以提醒和你垂直方向及對方向路面的車輛及行人，同時自己也放慢車速。《中華人民共和國道路交通安全法實施條例》根據《中華人民共和國道路交通安全法》制定，于2004年4月28日國務院 2023-06-29
科技 vivox27多大屏幕尺寸
6.39英寸。vivoX27是vivo公司旗下一款智能手機，vivoX27系列一共有三個版本，采用6.39英寸屏幕，搭載高通骁龍710AIE處理器，配備4800廣角夜景三攝，擁有一塊4000mAn電池，支持22.5W雙引擎閃充。 2023-06-29
科技 iso提出的七層網絡模型是什麼
七層模型，亦稱OSI（Open-System-Interconnection）。參考模型是國際标準化組織（ISO）制定的一個用于計算機或通信系統間互聯的标準體系，一般稱為OSI參考模型或七層模型。它是一個七層的、抽象的模型體，不僅包括一系列抽象的術語或概念，也包括具體的協議。OSI的大部分設計工作實際上隻是HoneywellInformationSystem公司的一個小組完成的，小組的技術負責人是 2023-06-29

tft每日頭條

> 科技

> 知識圖譜的構建與存儲