向量的幾個基本概念-tft每日頭條

向量的幾個基本概念

職場更新时间:2025-08-07 14:21:50

【寫在前面】最近忙于多類目的測試，有段時間沒出來交流了。

今年7月是否不像往年搜索更新慢或者不更新的情況，今年的7月起品是非常快的基本沒有任何影響，那麼到底是什麼影響起品的效果，歸根到底還是實時“競争環境”。

很多同學還是問我什麼是向量，向量如何影響搜索。

今天給大家細聊一下“向量”和直通車的冷啟動及引力魔方最近為什麼數據那麼差的底層邏輯。

特别是新品新計劃車是否最近很難開？

引力魔方的拉新計劃是否數據很差？

歸根到底都是“向量”問題。

正文

向量是什麼？平台為什麼越來越注重人群特征标簽繼承。

不管是付費還是免費，人群繼承的權重越來越高，最近是否直通車出了一個冷啟動就發現新品新車很難開了，就是卡首屏你也不到前三的位置。

如果新品沒有權重，直通車的新計劃權重會非常低，以前直通車還有計劃權重和關鍵詞權重，現在直通車的計劃權重就跟着所開鍊接的搜索權重走的，鍊接沒有搜索權重，直通車計劃權重也會非常低。

為什麼平台越來越注重人群特征繼承？說白了還是由于平台搜索規則的召回機制，召回要有标準，那麼這個标準很大的權重來源于人群特征繼承，人群特征再細分一下就是人群标簽，标簽的延續就是向量問題。

什麼是标簽，什麼是人群這兩個概念談了很久，标簽的存在就是為了還原消費者的真實購物意圖的過程。

某種意義上說，人群特征繼承最精準的繼承是背後的相似或者相同的購物意圖。

标簽也好，向量也罷都是為了還原和證實消費者真實的成交購物意願。

從算法的角度來談：雙塔内積模型就是從用戶特征端行為序列來分析消費者的購物意圖，商品端也是通過商品特征來分析消費者的購物意圖。

用戶特征和商品特征系統是怎麼識别分析的，這裡就要談到一個算法向量召回，向量就是系統通過用戶端和商品端的行為序列隻要你有行為序列和行為動作就會形成一個實數值，隻要有實數值那麼就可以生成一個“向量”。系統就會把用戶端和商品端生成向量類似于數據庫的向量庫，向量就是基礎的倒排索引中的提前分類好的數據庫。

系統就會進行向量索引然後進行召回，向量檢索主要是基于空間向量和圖片。

可以說向量檢索和文本檢索很相似，文本檢索對應的是關鍵詞數據庫，向量檢索對應的是向量數據庫。

向量的生成：

舉個最簡單的例子讓大家理解：

為了簡單起見，從句子做詞頻向量對比。

詞頻（TF）=某個詞在文章中的出現次數。

　句子A：我喜歡看電視，不喜歡看電影。

　句子B：我不喜歡看電視，也不喜歡看電影。

問怎樣才能計算上面兩句話的相似程度？

基本思路是：如果這兩句話的用詞越相似，它們的内容就應該越相似。因此，可以從詞頻入手，計算它們的相似程度。

第一步，分詞。

　　句子A：我/喜歡/看/電視，不/喜歡/看/電影。

　　句子B：我/不/喜歡/看/電視，也/不/喜歡/看/電影。

第二步，列出所有的詞。

　　我，喜歡，看，電視，電影，不，也。

第三步，計算詞頻。

　　句子A：我 1，喜歡 2，看 2，電視 1，電影 1，不 1，也 0。

　　句子B：我 1，喜歡 2，看 2，電視 1，電影 1，不 2，也 1。

第四步，寫出詞頻向量。

　　句子A：[1, 2, 2, 1, 1, 1, 0]

　　句子B：[1, 2, 2, 1, 1, 2, 1]

到這裡，問題就變成了如何計算這兩個向量的相似程度。

我們可以把它們想象成空間中的兩條線段，都是從原點（[0, 0, ...]）出發，指向不同的方向。兩條線段之間形成一個夾角，如果夾角為0度，意味着方向相同、線段重合；如果夾角為90度，意味着形成直角，方向完全不相似；如果夾角為180度，意味着方向正好相反。因此，我們可以通過夾角的大小，來判斷向量的相似程度。夾角越小，就代表越相似。

向量的幾個基本概念（向量的生成及底層邏輯工作原理）1

以二維空間為例，上圖的a和b是兩個向量，

這樣就可以判斷兩個向量的相似度

向量相似度判斷：

具體怎麼判斷？餘弦定理告訴我們，可以用下面的公式求得：

向量的幾個基本概念（向量的生成及底層邏輯工作原理）2

向量的幾個基本概念（向量的生成及底層邏輯工作原理）3

假定a向量是[x1, y1]，b向量是[x2, y2]，那麼可以将餘弦定理改寫成下面的形式：

向量的幾個基本概念（向量的生成及底層邏輯工作原理）4

向量的幾個基本概念（向量的生成及底層邏輯工作原理）5

數學家已經證明，餘弦的這種計算方法對n維向量也成立。假定A和B是兩個n維向量，A是 [A1, A2, ..., An] ，B是 [B1, B2, ..., Bn] ，則A與B的夾角θ的餘弦等于：

向量的幾個基本概念（向量的生成及底層邏輯工作原理）6

使用這個公式，我們就可以得到，句子A與句子B的夾角的餘弦。

向量的幾個基本概念（向量的生成及底層邏輯工作原理）7

餘弦值越接近1，就表明夾角越接近0度，也就是兩個向量越相似，這就叫"餘弦相似性"。所以，上面的句子A和句子B是很相似的，事實上它們的夾角大約為20.3度。

由此，我們就得到了"向量相似度"的一種算法，這就是平台算法實際運用的向量召回的一種相似度算法。

向量相似度解決的是語義相似度的問題，因為當标題被拆分成分詞後關鍵詞與關鍵詞之間的語義關系就被破壞了，詞與詞之間的語義關系就沒有了，通過向量相似度再次進行語義相似度召回。

文本（标題）向量化在本文的應用場景中，用戶問句是最重要的文本形式。問句長度一般情況下為10~30 個詞左右。目前生成句向量的方式有很多種：Tfidf：此方式同倒排一樣，無法表征句子的意思。分詞，訓練詞向量模型，然後将問句中的詞的詞向量相加求平均；這在一定程度上表征了句子信息，在絕大多數場景下夠用。利用 Bert 等預訓練模型獲取相關的句向量。

度量相似度的方式還有很多種比如歐氏距離，cos,漢明距離，Jaccard相似度等等我這裡側重講向量召回，就是向量檢索現在是各大平台最常用的索引方式之一，也是為了讓大家更好的理解向量的工作原理和方式。

這裡特别強調：我給大家舉的例子是通過詞頻向量來解釋向量的生成和工作過程，但是實際算法工作中，萬物皆可向量，隻要背後能生成數值。

總結一下：向量召回是通過多維度多目标多模态的取實數值來解決語義精準度的問題。

向量召回就是通過将基于元素取實數值進行向量化表征來構建偏向于高效檢索的索引---向量索引。

背後都是基于精準的語義購物意圖，這就是向量，元素數值：

可以通過實時用戶行為軌迹數據獲得

可以通過曆史用戶的行為軌迹獲得

可以通過曆史點擊率數據獲得

可以通過曆史轉化率數據獲得

可以通過深度學習算法結合實時個性化标簽數據獲得等等

隻要背後行為軌迹或行為數據能取實數值就可以生成向量。等等

所取的元素--數值，都是一個相同的特征就是可以進行向量化表征（Embeding成語義向量）精準反應背後的精準需求意圖（表明向量表征）

這樣給大家講，能理解什麼是向量了嗎？

向量是一個N維向量，數學家已經證明，餘弦的這種計算方法對n維向量也成立。所以向量可以多維生成向量進行餘弦相似度解決語義精準度的問題，多向量維度解決語義精準度的問題，并不是像上述舉例那樣單一向量維度那麼簡單，背後取的都是個人行為數據和行為軌迹數據的數值，這些本身就不是模仿來的，而是長期沉澱下的數據取值。

那麼向量如何影響搜索？

一個向量背後就是一個精準的語義就是一個精準的購物意圖，做搜索就是在做“關鍵詞”背後的購物意圖。

明白了這兩點，就明白了向量的價值。上述有提到“文本向量化”也就是會把文體也就是标題進行分詞，分詞後詞與詞之間的語義就被破壞，就要通過向量賦予關鍵詞精準語義。

為什麼大家一直信奉關鍵詞背後的坑産可以解決排名和精準度的問題。

其實還是坑産思維的影響，因為那個時期是簡單的規則性算法排序主要是通過機器統計排序的方式所以坑産落到關鍵詞上面，有了排名也就有了流量，排名也就決定了轉化率的問題也就解決精準度的問題。

那個時期根本就沒有人群标簽的概念，沒有個性化所以誰能拿到排名就可以解決一切。

如果你真的看懂了向量是什麼，你就能瞬間明白為什麼一定要“尊重系統，順勢而為”去入池。

為什麼一定不能通過長期碰關鍵詞，通過遞增此關鍵詞坑産值來來強化關鍵詞的精準度。

因為現在沒有了排名一說，入池的背後的人群标簽背後表明的相似相同的購物意圖，成交是表明關鍵詞精準，如果長期人為幹預，那麼系統最終是通過用戶行為數據和商品數據通過取多維度，多目标，多模态的實數值來生成向量來确認精準語義也就是購物意圖精準度的問題的，你模仿的假數據越多，反而會影響系統取值生成向量的精準度，所以假的就是假的，就算生成向量背後也是假的元素過多後面就很難做承接的工作了。

隻有明白了這些核心底層邏輯，優化才有指引，你做的工作要以階段目标為核心實時調整自己的方案，知道系統真正要什麼。

明白了這些，為什麼要有冷啟動這個階段，你也就能徹底搞明白了。

如果喜歡我的文章轉發就是最大的支持。

本文由七掌櫃首席運營師--鬼哥提供（qdbz888）僅代表個人觀點！了解更多查看更多案例請看朋友圈。

鬼哥線下第十期課程

推薦反哺搜索篇

全店無付費推廣篇

預定報名啦，

開課時間暫定8月底

地點：廣州

廣州聖豐索菲特大酒店（中國廣州市天河區廣州大道中 988 号）

提前安排行程。

費用：29800/一人（食宿自理）

多人享優惠（食宿自理）

以往線下會員複訓隻需交1萬，送核心資料，組織公司内訓享特價待遇

付款方式：付9800定金先線上學習最新線上課程向量召回爆搜玩法3.0，提前賺回學費加強基礎理論學習。參加向量召回爆搜玩法的同學如不來參加線下定金不退作為線上會員學習向量召回爆搜玩法的學費。

注：如，所有線上會員想參加線下課程隻需補差價2萬。線下會員複訓隻需交1萬/人。

掃鬼哥二維碼報名

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

職場上班最累的坐姿
上班最累的坐姿?現代人大部分清醒的時間都是坐着的，無論是在家、通勤還是上班既然我們不得不久坐，那麼采取正确的坐姿就很重要很多人都以為正确的坐姿隻有一種，但實際上，工作類型不同，适合你的坐姿也不同，接下來我們就來聊聊關于上班最累的坐姿?以下内... 2022-10-03
職場易烊千玺未來的演員之路
近日，有粉絲在某高鐵車站偶遇易烊千玺。隻見易烊千玺打扮低調出行，身着黑色沖鋒衣和黑色束腳運動褲腳踩黑色運動鞋。一身黑的裝扮，十分地低調簡約。就連頭發也長了不少。這是易烊千玺于國考話劇院風波之後難得的露面。據了解易烊千玺是去參加自身代言某家紡... 2022-11-29
職場産假期間員工工資和生育津貼
産假期間的女員工，在照顧可愛寶寶的同時，最關心的恐怕就是自己的工資了。都說産假是帶薪休假，但每個公司關于産假的标準不一，有的公司直接發工資，有的公司直接發生育津貼，那究竟是發生育津貼好還是發工資好呢？哪一種更劃算呢？産假期間的工資要怎麼發才... 2023-02-19
職場年薪百萬怎麼面試
從2014年第二次來上海的月薪3000，2年内達到月薪15000，我是靠着跳槽實現的。跳槽必須經曆的一個過程就是面試，在我看來面試就像期末考試，是檢驗自己曆史實力的最佳方式；面試也像相親，沒有最優秀的匹配，隻有相對合适，在雙方都看對眼的時候... 2023-02-09
職場計提工資和發放工資的會計分錄
每個月發放工資，是公司員工的頭等大事，也是會計工作人員絕對不能出錯的一項工作内容。然而在計提工資和發放工資這塊，會計分錄稍不小心就會搞混，幾乎每個會計都曾經“掉進坑裡”呢~今天小編就來好好講講計提工資和發放工資的相關會計處理吧！計提工資和發... 2023-03-13
職場京東金融是做什麼的職業
對于剛畢業的小可愛們來說沒高學曆背景、沒強大的家庭背景、沒過硬的綜合實力頂尖投行是一個遙不可及的地方But拿到會計師事務所、互聯網等行業的金融Offer就會容易很多這些企業可為跳闆到頂尖企業做優質的背書！▽四大會計師事務所之一很多求職者申請... 2023-03-13
職場父母工作太忙都沒有時間陪孩子
父母工作太忙都沒有時間陪孩子?一個溫馨的故事，女兒研究生畢業之後，将小時候媽媽給她寫的便當盒小貼士整理分享了出來，這是母女交流的一種特殊方式簡短的話語，溫馨的交流，讓女兒在成長中經曆的困難和不适，在母親的愛裡慢慢散去，今天小編就來說說關于父... 2022-10-03
職場回爐重造有什麼好處
片名：新編輯部的故事英文名：NewsoftheNewNewsroom出品公司：新華網·寶藏青年制片廠首播時間：2020年集數：粉絲決定類型：情景喜劇導演：提醒大家開學千萬做好防疫的·領導制片：太忙忘了開學這天過生日的·劉洪執行導演：聽說孩子... 2023-01-10
職場印鈔廠工作經曆
伴随着設備的轟隆聲，一張張白紙“換裝”成為人民币。8月26日，距離新版人民币面世還有4天，石家莊印鈔有限公司車間内的工作人員們有序忙碌着。根據央行公告，此次“上新”的人民币包括50元、20元、10元、1元紙币及1元、5角、1角硬币，是201... 2022-12-12
職場電競經理0氪玩法攻略
作者：NGA-改個名字沒人認識本文不考慮氪金力度和跨大戰力對局情況，僅對可控操作進行分析；陣容目前排位環境強勢單卡22夏shy哥：上單大C，滾雪球能力極強，4個人頭起飛，基本可以單爆一路至高地；獲取方式：開局有送，可以許願，主線可以刷碎片，... 2023-03-14
職場天天快遞申請代理點
近日，一則“天天快遞老闆跑路”的新聞在網上傳的沸沸揚揚，最終被證實是上海浦東建業網點的老闆突然捐款潛逃。但許多不知情的人還以為，天天快遞被蘇甯收購以後，董事長奚春陽生無可戀，選擇“跑路”了呢？幾乎在同一天，北京某圓通快遞網點又被曝出存在大範... 2023-03-15
職場生活工作心累的說說
生活工作心累的說說?工作辛苦，收入低，生活累，人心疲憊，讓人憔悴有時候閑的要死，有時候忙的要死，我來為大家科普一下關于生活工作心累的說說?下面希望有你要的答案，我們一起來看看吧!生活工作心累的說說工作辛苦，收入低，生活累，人心疲憊，讓人憔悴... 2022-06-12
職場結構工程師如何快速成長
結構工程師如何快速成長?參加工作以來，小編在做一些結構方案彙報文本時，常常需要簡單渲染下模型針對于項目體系複雜、體量較大、構件尺度較多的項目，傳統的結構軟件的渲染效果往往有所欠佳，專業的渲染軟件往往缺少相應的軟件接口，必要時還需要花費部分時... 2022-10-03
職場新人職場社交技巧
新人職場社交技巧?領導最希望聽到的是手底下的員工在做事的過程中，或者之後給于更多的反饋，領導時不時給我們開會，甚至有的公司直接每天都會去開會，這裡邊的目的，不就是想要知道今天哪些事情沒有做好，是否有改進的方法，以及你計劃怎麼去做，等等，其實... 2022-06-29
職場職業經理人職業資格證
職業經理人的崗位職責是什麼？職業經理人證書怎麼樣？報考方式就目前來說，市場中的中小企業越來越多，并且發展迅速。如果一個企業沒有人來做出好的指引，那麼将不利于長久的發展，職業經理人便充當了這一角色。職業經理人的崗位職責是什麼？一般來說，職業經... 2023-02-19
職場三缸發動機工作原理
三缸發動機工作原理?發動機工作原理：内能轉化為機械能，進入汽缸的工質是純空氣，由于柴油機進氣系統阻力較小，進氣終點壓力比汽油機高，進氣終點溫度比汽油機低，我來為大家講解一下關于三缸發動機工作原理?跟着小編一起來看一看吧!三缸發動機工作原理發... 2022-06-11
職場社保公積金是否劃入個稅
11月22日，據媒體報道王思聰前女友網紅雪梨被查偷稅漏稅。并被追繳稅款、加收滞納金并拟處1倍罰款共計6555.31萬元。看到這個新聞的時候，我的第一反應是人家扣的稅竟然比我一輩子的工資還要高。回歸現實，還是說下咱們普通上班族所關注的内容吧。... 2022-12-12
職場工資的密薪制
工資的密薪制?來源：中國青年報日前，據媒體報道，以保密著稱的蘋果公司出人意料地告知員工：他們可以自由與同事讨論工資、工作時間和工作環境在内網通知中，蘋果公司表示：“我們鼓勵任何對此懷有疑慮的員工以自己認為最舒服的方式提出來，無論内部還是外部... 2023-01-01
職場駐馬店有哪些正規職業技術學院
駐馬店有哪些正規職業技術學院?【大河财立方消息】12月14日，駐馬店市政府辦公室發布《駐馬店市加快推進職業教育創新發展高地建設“一地一策”實施方案》（簡稱《方案》），部署了未來5年駐馬店市加快推進現代職業教育高質量發展的目标任務，下面我們就... 2022-10-03
職場最帥環衛大爺
來源：新華社一頭飄逸的長發标志性的胡須拉風大墨鏡沈陽故宮附近的環衛大爺楊俊山火了63歲的楊俊山性格灑脫退休後沒有随兒女去北京享福選擇成為一名環衛工人楊俊山說：“我從年輕就是這個造型，如果别人因為我的造型關注到環衛這個職業，那我很開心。環衛工... 2023-03-04
職場碧桂園物業服務标準細則
開始是兩天，後來三天，再後來說一個工作日等于一個禮拜，好想知道你老師是哪位超級無敵不要臉！, 2023-03-04
職場工作彙報三種方法
彙報工作是大多數職場人士經常要做的事情，但能做好的彙報的卻很少，下面就一起來看看如何做好彙報吧！彙報工作的意義和作用1、通過彙報可以減少工作的方向性錯誤。因為領導與員工的視角是不同的，領導看的是整個計劃，而員工看的是自己的需要解決的部分，因... 2023-03-19
職場考哪種電工證比較好找工作
做電工有前途嗎？出路在哪裡？咨詢181--7091--3875電工的準入門檻低，幾乎人人都能入門。外行聽說電工需求量大，就業非常容易，而且能月入上萬，像老鼠見到大米一樣，一窩蜂地湧入電工行業。入行才發現電工作業不僅十分辛苦，錢也沒有想象中的... 2023-03-13
職場 rng小虎真的很強嗎
Xiaohu原名：李元浩，ID：Xiaohu。前GT戰隊中單，現任RNG戰隊中單選手。早在2014年的時候，李元浩就以MD中單的身份開始了他的職業生涯，當時他的ID好像是叫中路财神，由于在比賽中的出色表現及操作，中路财神這個ID的名氣逐步提... 2023-02-02
職場佛教的佛爺指的是哪位佛
三世佛，是大乘佛教的主要崇敬對象，俗稱“三寶佛”。根據印度哲學，時間和空間是混淆的，因此三世佛分為以空間計算的“橫三世佛”與以時間計算的“縱三世佛”。橫三世佛（又名三方佛）：指中央釋迦牟尼佛，東方藥師佛（另一說是東方阿閦佛，又稱“不動佛”）... 2022-12-05
職場如何做好一個新型職業農民
“50後”種不動地，“60後”種不好地，“70後”不願種地，“80後”不會種地，“90後”不談種地。近年來，随着城鎮化進程提速，很多農民特别是新生代農民離開土地，到城市裡工作、定居。這個問題時常見諸報端。随着城鎮化的迅速發展，農業結構加快了... 2023-03-04
職場月利息5000要多少存款
不得不說，疫情的來襲，改變了大多數居民的生活習慣，如習慣超前消費的居民，也開始學會攢錢，不敢輕易消費，能夠控制個人欲望。然而疫情給我們帶來的影響不止于此，在當前這個不确定因素持續的社會狀态中，突發事件的發生幾率也在增長。而唯一能夠讓居民與其... 2023-02-14
職場物業項目經理需要證書麼
一、職業介紹：物業經理人是從事物業管理的專業人才。從1999年開始物業經理人實行持證上崗制度，物業經理人崗位證書由建設部頒發的證書，這個分三個證書等級，物業企業經理，物業部門經理（經理助理），物業管理員，目前這個證書的是注冊物業公司拿資質的... 2022-11-11
職場貴州文化旅遊職業學院是公辦的嗎
澎湃新聞記者趙思維貴州将建設一所文化旅遊職業院校。2月10日下午，貴州省政府官網發布“關于同意正式設立貴州文化旅遊職業學院的批複”。這意味着這所文旅職業學院宣布籌建7個多月後，辦學條件已然達到标準，向對外招生邁出重要一步。2020年6月，貴... 2023-03-18
職場公務員是穩定清閑的工作嗎
不輕松，真的不輕松。網上都說程序員很累的，提到程序員首先想到的就是996福報，其實吧，不得不修福報的程序員挺多的，但也并非所有的程序員都很辛苦，有的企業在工作強度上面就很不錯，比如我之前在一家軟件企業的工作了兩年半，在這兩年半裡面總共加班絕... 2022-10-26

tft每日頭條

> 職場

> 向量的幾個基本概念

向量的幾個基本概念

相关職場资讯推荐

热门職場资讯推荐

网友关注