大數據時代的弊端,就是被透明化的隐私安全。
我不知道大家有沒有這樣的生活經曆:早上還在用浏覽器搜“女生喜歡什麼樣的口紅”,中午就看到了推送的口紅廣告;剛和朋友打完電話說旅行帶什麼背包,打開購物網站就看到了旅行包的推薦。
這個時候有一個疑惑,手機為什麼知道我們想要什麼?
首先要知道,社交網站、購物網站包括你使用的蘋果、安卓手機,是沒有權限竊聽你的電話或者盜取你的搜索資料的,隻是你的行為數據讓你的手機意識到了你具體想要什麼。
再例如,你注冊一個賬号,需要輸入自己的名字;手機号;性别;所在地;這些是微不足道的基礎數據。
當然還有你的消費記錄;打車頻率;浏覽的公衆号類型;玩過的遊戲...這些行為最後統統會變成幾千個事實标簽,成為你行為數據的一環節。
采集标簽的目的,就是為了構建用戶畫像,從雜亂的标簽當中,最終模拟一個和你興趣、愛好、思想相近的“你”。
例如,你玩手機看到一篇内容标簽為“美女”的文章,而這并不表明你真的喜歡美女,也可能是手滑點的。因此,手機判斷你的興趣喜好還要根據浏覽的停留時間、搜索次數、是否評論轉發等等。
當然,這關系到一個初級的内容标簽權重算法:
興趣标簽( 美女 )權重 = 行為權重 x 訪問時長 x 衰減因子
行為權重:什麼都不幹 1 分,評論 0.5,點贊 0.5,轉發 2,收藏 1
時長權重:10S 以内權重為 0.5,10S-60S 為 1,60S 以上為 2
衰減因子:0 - 3 天内權重為 1,3 - 7 天權重為 0.85,7 - 15 天權重為 0.7,15 - 30 天權重為 0.5,30 天以上權重為 0.1
(算法引自百度會學)
興趣标簽權重和你的閱讀時長、評論、點贊、轉發收藏有着密切關系,并且不同操作有着不同的加分數值,最終累積成行為權重。
這點有點類似網易雲在私人FM為你推薦的歌曲類似。停留時間越長,時間權重也随之越高。
你經常浏覽美女,評論關于美女的文章,看關于美女的視頻,手機會将你一段時間内所有關于美女的興趣權重累加,再以S形函數标準化,最終得到一個從0到10的興趣标簽值。
這個數值越高,你就對含有美女的内容越感興趣。
不僅僅局限于内容興趣,這種算法還能夠根據你的消費能力、消費興趣、社交習慣等多個維度建立用戶畫像,并計算你的喜好。
之後,這些喜好會被轉換成特征向量,比如你的美女興趣标簽值是8,消費能力是5,社交偏好是2,那麼向量表示為r(8,5,2)。
我們可以将特征向量想象成一個多維空間的一個坐标點,通過每個用戶的向量坐标去帶入餘弦公式或距離公式中,就能計算出和你相似的人,進而把用戶分類。這是一個大工程。
但是行為數據隻能計算出你的喜好,而無法判斷出你的性别、學曆等深入的個人屬性。
這需要将已知性别和學曆的用戶作為樣本,一些用來訓練模型,一些用來測試精準度。現如今,各大平台對于用戶性别的預測準确度達到90%以上。
因此,你的手機就能夠得到大緻這樣一個用戶畫像,它包含了你的各項興趣權重:
所以說,APP根據這個畫像,便根據類似的廣告信息,找到對應的消費者。
我們來看看廣告主這邊是如何操作的。
下面顯示的是某廣告投放平台的後台,廣告主們可以自由組合用戶屬性,包括消費水平、婚戀情況、内容興趣等上千個定向标簽,最終選定廣告位及投放時間,據系統計算的1.5元/千次曝光的價格,完成一次精準的廣告投放。
并且,當一個住在北京海澱區大泥灣小區有過口紅消費記錄的單身男青年在刷到廣告位的一瞬間,廣告平台還會發起競價請求,最終,價位較高的廣告将會出現在用戶的視線中。也就被你刷到了。
在廣告推廣平台的開發者文檔,記錄着用戶詳細的行為數據,精确度很高,甚至可以篩選出“2019.2.1到2019.2.10去過北京西單5次以上的人”。
需要說明一點,社交軟件、購物網站、浏覽器等APP的行為數據不僅對應你的賬号,還和你手機唯一識别碼關聯在一起。
Android系統手機的可以采集到的的唯一設備編碼叫 IMEI,在iPhone 上叫IDFA
這也表示,就算你不注冊不登錄,行為數據照樣會被采集。
與此同時,廣告平台也能夠根據你手機識别碼在其他的APP上為你投放對應的廣告,因此,就算你在浏覽快手,也能夠刷到旅行包廣告。
我們的隐私誰來保護?
看到這裡,小夥伴們似乎驚出一身冷汗,信息都被采集了,那我們的隐私誰來保護?别急,根據《個人信息安全規範》法則,商業廣告平台的所有标簽都應該避免精确定位到個人,這種做法也是為了保護用戶的隐私安全。
當然,如果你是iPhone用戶,并且不想看到這種采集你行為數據信息并向你推送廣告的事情,你可以通過在設置中關閉IDFA碼來限制手機對你的行為數據采集。
寫到最後
可以肯定一點,隐私保護的程度和表達自由的觀念是稱正比的,我們自己的信息被監視而無法匿名的情況下,我們也很難盼望APP們能夠自由表達自己的想法和意見。所以說,将隐私有效地保護起來,實際上也是對政治性的重要需求。
如今,“全球網絡倡議”( the Global Network Initiative GNI),旨在保護和促進信息與通信技術的言論自由和隐私權。因此不比擔心我們的“數據主權”被剝奪,因為還有法律在保護着我們。
APP商店搜索中關村在線,看2018年最新手機、筆記本評價排行
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!