etl數據架構講解-tft每日頭條

etl數據架構講解

科技更新时间:2026-07-19 21:39:05

文章對數據ETL中的反作弊應用進行了簡單的梳理分析，希望通過此文能夠加深你對數據ETL的認識。

etl數據架構講解（反作弊的應用與基礎模型）1

一、反作弊作用于哪個階段？

在做反作弊之前，我們要明确整個數據從底層到數據中台過程中流向是什麼樣的。這裡，我梳理了一個模型，它可以反映這一過程。

etl數據架構講解（反作弊的應用與基礎模型）2

數據從原始采集經過“清洗規範”，會形成“通用數據”，這裡會過濾掉異常數據供上層使用。

通用數據會根據業務場景，聚合成符合業務指标計算的數據，即“應用數據”，比如說是“主題場景”的數據。“主題場景”的數據可以是基于大背景的場景（橫向），如：推薦業務場景、搜索業務場景。也可以是垂直到業務線的場景（縱向），如：某項購物時的推薦場景、短視頻搜索的業務場景。這一過程會産生“數據殘渣”，這部分數據是暫時沒有應用場景的數據。

比如，在推薦商品時，你隻取了用戶的年齡、性别等作為特征，剩下的用戶姓名這個特征數據在這個場景應用不到，它就成了暫時的“數據殘渣”。不過，你可能在信貸業務場景中使用到這個特征數據（用戶姓名），那種應用場景下它就不是“數據殘渣”。

應用數據隻是一個基礎可用的數據集市，還需要經過反作弊系統來過濾掉具體應用場景下的作弊用戶或者設備，形成“業務數據”。

最終，跟進業務需求等制定數據指标、維度等計算邏輯，并在數據中台形成可視化數據。

綜上，我們可以發現，反作弊是在“應用數據”與“業務數據”之間work的。

二、反作弊基礎模型

etl數據架構講解（反作弊的應用與基礎模型）3

1. 通用基礎設備過濾規則

這裡面可以是人為設定的一些規則（比如：設備中安裝有淘寶APP版本号大于線上最新版本的用戶都是作弊用戶），也可以是基于經驗總結的設備屬性。舉個例子：

etl數據架構講解（反作弊的應用與基礎模型）4

2. 數據分析系統

這裡面主要是根據業務場景，分析業務屬性與用戶屬性在結合的過程中産生的作弊用戶。當然，可以通過業務規則或者算法來找出這部分用戶。舉例，在投放廣告時，可以根據用戶的uid、ip等找出這些屬性與某些廣告是否存在強關聯關系，試圖找出用戶有惡意刷廣告的行為。下圖給大家介紹幾個算法以及其應用場景。

etl數據架構講解（反作弊的應用與基礎模型）5

3. 評分系統

評分系統也是基于業務場景來制定的規則或算法，從而産生對應的黑名單。比如，在短視頻領域中，可以根據用戶行為畫像和視頻畫像來給視頻或者用戶打分。其主要流程可以參考下圖：

etl數據架構講解（反作弊的應用與基礎模型）6

這裡面關鍵是如何建立“過濾模型”，由于保密問題，這塊需要大家根據業務場景自行建模。

4. 機器學習系統

這部分沒有什麼太多可以分享的，因為市面上機器學習的算法有很多，也很成熟，需要根據業務場景來選模、建模，甚至優化模型等等。

作者：軟院猛哥人人都是産品經理網“萌新一枚”

本文由 @軟院猛哥原創發布于人人都是産品經理。未經許可，禁止轉載。

題圖來自 Unsplash，基于 CC0 協議

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技用友t3怎麼拷貝安裝包
T3破解版，僅供行業交流，如需商業使用，請自覺購買正版軟件，如需要，請留下郵箱安裝請退出所有殺毒軟件1.環境設置檢查時間格式，必須是小橫杠的形式點擊事件，按照123步驟更改右擊計算機——屬性——檢查電腦名稱，更改後重啟電腦2.産品安裝點擊安... 2023-02-27
科技藍牙連接能不能加密
藍牙連接能不能加密?據外媒報道，最近曝出的一個加密錯誤（CryptoBug），對蘋果、博通、英特爾、高通等硬件供應商的藍牙實施和操作系統程序都産生了較大的影響其原因是支持藍牙的設備無法充分驗證“安全”藍牙連接期間使用的加密參數更準确的說法是... 2022-10-10
科技中文字藝術字體
1100款藝術字體安裝包文末獲取藝術字體是把傳統的字體表達成藝術性創造性的一種形式一種效果，藝術字體在我們的設計中使用的非常廣泛，我們電腦的字體庫裡面沒有藝術字體是不行的，本期為大家帶來了最常用的藝術字體安裝包，隻需要簡單安裝就可以使用，每... 2023-03-30
科技裝潢設計軟件學習
要學習裝潢設計的學生，首先想了解的就是裝潢設計都需要學習哪些軟件？每個軟件的應用角色都是什麼？在裝潢設計中各個軟件他們打造出來的都是什麼樣的畫面？要學習的軟件有：CAD、3DMAX、VRay、Photoshop、EXCEL（Lightsca... 2022-12-05
科技滿配scar制作
盲盒可以說是近兩年大熱的産品，不僅手辦有盲盒，奶茶有盲盒，就連快遞也有盲盒，沒有你買不到的，隻有你想不到的。這不，在緊俏的顯卡市場上，也有了盲盒的身影。隻要在電商關注過顯卡，那你多半會在閑魚和拼多多上收到顯卡的推送廣告，這裡我們不聊你的隐私... 2022-12-24
科技 vivo手機在印度什麼時候上市
經曆了地獄難度的競争之後，再轉到簡單模式往往很容易取得好成績，而國産手機品牌在印度市場的境遇就是如此，一直以來中國手機市場一直都是競争最為激烈的市場，多家國産手機品牌持續加碼競争，份額雖然沒能有太大的增長，但各自産品的實力都比以往有了不小的... 2022-12-24
科技聯想筆記本g460配置怎麼樣
2010年購買的筆記本LenovoG460，随便開幾個網頁都卡，開機内存占用50%以上，加了個固态硬盤和2G的内存，簡單升級下，普通的辦公用完全沒問題。一、準備升級的配件筆記本自帶的機械硬盤準備放在光驅位置，再加個固态，所以買了個120G固... 2022-12-05
科技抖音電腦版怎麼設置比較好
抖音電腦版怎麼設置比較好?抖音推出PC版啦，咱可以在電腦裡愉快地刷抖音啦，你還别說，在電腦裡刷抖音還真不賴，趕緊來試試，今天小編就來聊一聊關于抖音電腦版怎麼設置比較好?接下來我們就一起去研究一下吧!抖音電腦版怎麼設置比較好抖音推出PC版啦，... 2022-10-16
科技 2000元内最有性價比的三款手機
每天大家都會看到很多各類的手機推薦，今天就來和大家聊一聊，都有哪些頗有亮點的機型但是卻不會被推薦，而且即使是推薦了大家也不大概率會購買。華為MateX25G典藏版華為MateX2典藏版無疑是一款整體體驗非常出色的折疊屏手機，并且還配備了眼下... 2022-12-27
科技怎麼解決電腦開機沒反應
我們的電腦在開機的過程中可能會出現無任何的反應的現象，表現在開機時電腦顯示器無任何顯示，甚至有機箱電源指示燈都不亮的情況，接下來就為大家介紹下電腦開機沒反應的解決辦法。最常見的電腦開機沒反應的解決方法電腦開機沒反應最常見的有：電腦主機電源線... 2023-03-19
科技凱叔講故事會員和聽書會員的區别
很多家長為了提高孩子的閱讀量，不僅給孩子閱讀各種繪本、書籍，報閱讀課輕課，還給孩子安排上了一些兒童聽書app。市面上比較火的兩款app不外乎是凱叔講故事和樊登小讀者了，文章開始前，家長們先來看一下魚sir對它們的總結報告。凱叔講故事&樊登小... 2022-12-26
科技華為暢享5用不用貼膜
問答堂>手機>其他分類>華為暢享5手機黑邊框是為什麼上下左右有2毫米黑邊華為暢享5手機黑邊框是怎麼回事上下左右有2毫米黑邊已有10個回答你好，可通過如下四種方案解決：（1）打開手機管家/平闆管家，進入“病毒查殺”-“設置”-“手動更新病毒庫... 2023-02-25
科技 excel數據透視表教程
一、數據透視表1、什麼是數據透視表？數據透視表是一種交互式的表，可以進行某些計算，如求和與計數等。所進行的計算與數據跟數據透視表中的排列有關。2、為什麼叫數據透視表？因為可以動态地改變它們的版面布置，以便按照不同方式分析數據，也可以重新安排... 2023-02-10
科技楊紫真實體重多重
娛樂圈女明星的體重從來是敏感區，85斤的佟麗娅，穿着高跟鞋才92斤的楊穎都曾經對外直呼自己胖到不行。這讓許多微胖女孩都感覺到困擾。一直自诩娛樂圈裡的真吃貨，将減肥挂在臉上的樣子8月2日晚在某綜藝中也被黃曉明要求上稱，并約定兩人一起減肥十斤。... 2023-02-19
科技河南聯通有沒有8元套餐
【手機中國新聞】不知道是不是為了吸引用戶，幾乎每月我們都能看到聯通發布全新的互聯網套餐。近日聯通上線了學才卡套餐，該套餐每月5元，另有3元/月的定向流量包，可享受15GB的網易應用專屬流量，如果你經常使用網易系App，這個套餐還是相當實惠的... 2023-02-02
科技 iphone不開機怎麼判斷好不好
電流是手機的“脈搏”，穩壓電源好比醫生的聽診器，手機的電流變化就好比手機的脈搏。手機狀态分為開機狀态、待機狀态、發射狀态幾種，不同工作狀态有不同工作電流，維修師傅通過觀察電流情況，可以快速的判斷手機故障。今天給大家講解一下看電流快速維修i... 2022-12-05
科技 iphone網速慢怎麼設置
本文編輯今日頭條作者維權騎士簽約用戶：小俊技術分享獨家原創制作未經授權嚴禁轉載，發現抄襲者将進行全網維權投訴分享生活小妙招，享受科技新生活！大家好，歡迎來到今天的知識分享！我是你們的好朋友小俊！最近很多使用蘋果手機的朋友都向我咨詢這樣一個問... 2022-12-05
科技手機如何制作3D動畫
想要制作出屬于自己的一部特色動畫嗎？那你就需要一款好的手機動畫制作軟件app，其功能包含了3d動畫制作，flash動畫制作，定格動畫制作等集一身的動畫軟件。應某位粉絲的要求所整理的這些可以做動畫片的app軟件，希望可以給你們有所幫助。1、A... 2022-12-23
科技三星手機通用功能在哪
三星手機用戶們，你們是否羨慕蘋果那墓碑制，在手機應用打開時，它是運行的，在應用不使用時，應用還是保存在後台，應用再次打開時，還是上次使用的界面，但是不怎麼耗電，現在本人的三星S21ultra手機就可以手動把這個功能開關可以打開，接下來我将用... 2023-02-08
科技電腦鍵盤怎麼突然就不能用了
電腦鍵盤怎麼突然就不能用了?建議重新安裝操作系統detectingIDEdrivers，我來為大家科普一下關于電腦鍵盤怎麼突然就不能用了?下面希望有你要的答案，我們一起來看看吧!電腦鍵盤怎麼突然就不能用了建議重新安裝操作系統detectin... 2022-11-28
科技深信服網絡科技
中國青年報客戶端訊（中青報·中青網記者王海涵王磊）9月5日，深信服科技作為網絡安全廠商代表在國家網絡安全宣傳周網絡安全技術高峰論壇上進行分享，該公司董事長何朝曦提出，網絡安全産業急需一場“數字化轉型”，以助力用戶跨越網絡安全和數字業務間的鴻... 2022-10-26
科技怎麼做廣場舞最簡單的
廣場舞近些年來，已經遍布城市的各個地方這些廣場舞愛好者大部分也都是通過視頻來學習新的舞蹈然而很多人學會一個舞蹈後都想要把自己錄下來做成視頻分享給更多的人欣賞但是對于這些電腦技術的工作很少有人會懂的本次第一篇，先給大家介紹一下我制作的視頻流程... 2023-02-12
科技筆記本差評怎麼回複
1【微笑>：天下文章一大堆，就看那位高手炒的好。村花：“白癡你上那去？白癡：“我去買點清油幫你炒文章，你寫好了放在鍋裡等我回來。村花：“OMG我暈！2【微笑>：我一個朋友喝酒喝多了，回到家裡不睡覺，還把筆記本拿出來上網，接下來吐了。。。整個... 2023-02-03
科技截屏錄制怎麼操作
截屏錄制怎麼操作?很多人都不知道如何用電腦截圖，大部分小白還在用QQ微信截圖，但是畫質特别差今天就來教你6種快速截圖的方法，而且錄屏的同時還能截屏，現在小編就來說說關于截屏錄制怎麼操作?下面内容希望能幫助到你，我們來一起看看吧!截屏錄制怎麼... 2022-10-13
科技公交卡手機充值怎麼操作
在衆所科學産物中，手機可以說是最颠覆人類日常生活的一個發明！從最開始的單純打電話，到現在的滲透人們的生活，随着手機的更新換代，手機能看電影，能買票，能付賬，能交水電費不排隊，現在甚至連充公交卡都可以！NFC是手機中的一個小功能，由非接觸式射... 2022-11-16
科技原神2.2版本平民必練四星弓
原神2.7版本會上線2把新武器，一是夜蘭的專屬武器【若水弓】，另一把則是版本免費贈送的滿階4星武器【落霞弓】，這兩把武器的設定很有意思，本期我會為大家詳細（雲）解析這兩把新武器。若水【若水】屬于“暴擊傷害”屬性特化型武器，升到90級最多可以... 2023-03-16
科技新款斯巴魯力獅何時進國内
【太平洋汽車網新車頻道】日前，斯巴魯在美國正式發布了2023年款式的力獅（詢底價|查參配）。作為中期改款車型，新車主要針對前臉設計和安全系統有所升級更新，也将EyeSight主動安全系統升級為最新版本。此外，力獅Sport車型亦升級為可輸出... 2023-02-21
科技手機釘釘如何在家上課
手機釘釘如何在家上課?首先打開釘釘，登錄賬号然後打開班級群，點擊右上角三個黑點的圖标，接下來我們就來聊聊關于手機釘釘如何在家上課?以下内容大家不妨參考一二希望能幫到您!手機釘釘如何在家上課首先打開釘釘，登錄賬号。然後打開班級群，點擊右上角三... 2022-06-06
科技鄭州經開區科技孵化器
鄭州經開區科技孵化器?來源：【交彙點新聞客戶端】交彙點訊日前，科技部公布2021年度國家級科技企業孵化器名單，常州共有3家孵化器上榜，位于常州經開區的江蘇現代軌道交通産業孵化基地名列其中，成為全區首家國家級科技企業孵化器，今天小編就來聊一聊... 2022-12-28
科技隔夜水和千滾水
水是生命之源，如何正确喝水，是人們需要正視的事情。人們養生意識不斷加強的同時，千滾水和隔夜水會“緻癌”，純淨水會“骨質疏松”等問題也相繼曝出。不明事理的人，一刹那間，坐立不安，也有不少長輩對此深信不疑。事實真是這樣嗎？本文将通過科學實驗來還... 2023-02-11

tft每日頭條

> 科技

> etl數據架構講解