數據采集的兩個必要步驟-tft每日頭條

數據采集的兩個必要步驟

科技更新时间:2026-07-27 11:07:15

編輯導讀：随着“數智化”時代的到來,我們生活中的方方面面都離不開數據,而你真的了解數據嗎？本文将為你重新解讀數據的概念和價值，以及數據的價值是如何在“數智化”時代下一步一步得到運用與升華的；因内容頗多，筆者将分幾期為大家進行講解。

一、前言
上一期文章中，我們已經了解到“數據”是一個龐大的體系（如下圖所示）這篇文章把數據講透了（一）：數據來源；并用了菜市場的例子，為大家講解數據來源的含義；而今天小陳主要給大家到了指定“菜市場”後，我們怎樣“買菜”，即數據采集的過程。

二、數據采集（買菜）
首先，我們先對數據采集的方式進行一個簡單的分類介紹，後面分别介紹每一種數據采集形式需要注意的要點。

1. 按數據采集方式

線下（問卷、實地調研）——注意要點：遵循5大要素！

5個要素：

1）緊緊圍繞研究主題和目的

評價一份問卷調查優劣程度的準則中很重要的一點就是，問卷内容是否貼合研究主題，就算一份問卷設計得再精妙，如果與主題無關，也是毫無價值的，因為我們開展問卷調查的本質目的也是調查相關要素和調研群體背後千絲萬縷的聯系。

例如，調查用戶滿意度，一般涉及到産品本身（價格、包裝等）和受衆特點（年齡、地域、心理滿足等）兩個維度。

2）題目易讀、易理解、且具有一般性

問卷分發後，是需要受衆進行填寫的，所以問卷的易理解程度也最終決定者問卷的質量。

問卷并不是學術論文，不需要為了彰顯專業素養而涉及很多專業、晦澀難懂的詞彙，讓調查者能夠真的看懂才是關鍵。

而一般性則指的是這個問題的設置是否對所有受衆都具普遍意義。例如，調查居民出行方式的問卷中，你認為最安全的交通工具是，A火車 B飛機 C寶馬小轎車 D電動車，我們可以看到C選項不具有普遍意義，且和A、B、D不是一個維度的選項。

3）充分考慮被調者特點

在使用問卷調查方式時，要充分結合被調群體的特色，來進行問卷的設置；例如針對學齡前兒童和老年人，則不宜采取書面問卷調研的形式，要充分考慮到他們的語言偏好（有些老人可能普通話不标準，但方言流利）、對内容的理解能力，再派出訪談調研小組進行調研。

4）充分考慮問題排序（循序漸進）

問卷問題的設置除了考慮每個問題的規範性、合理性外，還需要考慮到問題與問題之間的邏輯性和連貫性，避免時間、空間、人稱等維度的頻繁跳躍。

5）充分考慮統計便利性

除了考慮問卷調查的受衆外，問卷設置還需要充分考慮後期問卷回收後的統計分析；盡可能減少後期工作壓力，變量不宜設置太多，應該用盡量少的變量高效獲取标簽信息，幫助後期研究定性。

線上（按數據采集端口細分為APP端和網頁端）

APP端（主）——數據埋點獲得相關數據：

首先，先和大家科普一下，數據埋點到底是什麼？以及APP端為何要特别重視數據埋點。

其實，所謂埋點就是在用戶使用APP的過程中，對他們的一系列行為數據進行收集，以優化産品和運營；而大多APP自帶服務和盈利性質（如淘寶、得到等），那麼想要實現轉化，引導購買就需要将“點”埋到具體的交互組件上（例如，點擊跳轉鍊接、購買按鈕等），然後對PV、UV；停留時間、跳出率、購買率等指标進行量化。

就埋點的形式而言，主要分為以下三種：

代碼埋點：控件操作發生時通過預先寫好的代碼來發送數據，目前百度統計、友盟都提供這一服務。

下面舉一個例子，例如，我們想統計淘寶APP裡面加入購物車這個按鈕的點擊次數，則在其被點擊時，可以在這個按鈕對應的 OnClick 函數裡面調用SDK提供的數據發送接口來發送數據。

優點：控制發送數據時間，事件自定義屬性詳細記錄；缺點：時間、人力成本大，數據傳輸的時效性。

可視化埋點：利用可視化交互手段，通過可視化界面配置控件操作與事件操作發生關系，通過後台截屏的方式采集數據；例如，當用戶産生多次刷新這一行動時，結合大數據算法，推算出用戶的喜好并切換推送内容、産品，再通過可視化埋點，自動切換到對應的個性化推薦内容頁面。

優點：成本低，速度快，産品、市場等各部門均能參與；缺點：行為記錄信息少，支持的分析方式少，減輕開發負擔。

無埋點：用戶展現UI界面元素時，平台會通過控件綁定觸發事件，事件被觸發的時候系統會有相應的接口讓開發者處理這些行為；上傳UI界面後，系統能夠自動識别生成控件的唯一ID，ID是在程序内部生成，隻需保證在不同的手機上面這些ID是一樣的，就能實現用戶端的無埋點數據獲取。

優點：無需埋點，方便快捷；缺點：行為記錄信息少，傳輸壓力大。

網頁端——網頁爬蟲（python，C…）：

就具體語法而言，因為使用工具不同，并不能就具體語法提供指導（大家根據自己使用的語言，在CSDN上進行搜索），但其總體方法論是一緻的。

方法論：人工确定爬取信息的維度→分析目标網站URL構成→确認爬取工具→編寫程序語言→獲取數據→保存于本地→後續進行數據挖掘。
三、結語
本期，筆者通過一個“買菜”的例子，帶着大家了解了數據采集的幾種方式，相信大家有所收獲！

下期，筆者講在數據采集的基礎上，為大家講解如何利用常用工具進行數據清洗和數據清洗的幾個維度！

本文由 @小陳同學ing. 原創發布于人人都是産品經理，未經作者許可，禁止轉載。

題圖來自Unsplash，基于CC0協議。
,
更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技怎麼用手機修改wifi密碼
怎麼用手機修改wifi密碼?現在手機桌面點擊【浏覽器】圖标，下面我們就來說一說關于怎麼用手機修改wifi密碼?我們一起去了解并探讨一下這個問題吧!怎麼用手機修改wifi密碼現在手機桌面點擊【浏覽器】圖标。打開浏覽器後，在地址欄輸入網址htt... 2022-06-11
科技為什麼現在手機不設耳機孔了
最近兩年國産手機基本都被蘋果帶壞了，取消了耳機孔，感覺喜歡耳機聽歌的人，非常不方便，剛開始我也非常排斥的。但是後面買國産手機，我個人喜歡用小米手機。而且我非常喜歡用耳機聽歌。大家都取消了耳機孔，那麼我們用耳機聽歌的，廠家怎麼解決的呢？那麼結... 2022-11-05
科技安卓哪個低端手機好
#高端機、中端機、低端機是怎麼樣來劃分的#其實對于這樣的說法我也是第一次聽說，這樣建立了太大的人格化的歧視味道了，人家并沒有這麼來劃分産品，正确的稱呼為：高端旗艦機、旗艦機（遊戲旗艦、拍照旗艦等系列）、千元機、百元機；可是被稱之為高端機、中... 2023-02-02
科技喬思伯v11itx機箱水冷
如果你玩鍵盤的話，應該聽說過被稱為“鋁廠”的品牌IQUNIX，IQUNIX就是因為一直堅持不懈地為鍵盤以及其他桌面設備大量采用鋁合金材質而聞名。而喬思伯則是機箱品牌中一直堅持用鋁合金材質的典範，全鋁合金材質設計的喬思伯機箱在機箱界的辨識度很... 2022-11-03
科技微軟edge浏覽器有什麼功能
IT之家12月4日消息，根據外媒WindowsLatests消息，微軟近期正在EdgeCanary版浏覽器中測試一項新功能，開啟後可以實現部分數據與Win10、Win11共享，在系統的搜索功能中可以搜索到浏覽器的曆史記錄、收藏夾等内容。用戶... 2022-11-21
科技你不知道小米手機的小技巧
相信對于小米手機，小夥伴們都非常熟悉了。它以高性能芯片相對低價位受到大家的青睐，特别值得一提的就是它的MIUI系統，具有很多貼心的小設計，可以說非常好用。也受到了一衆米粉們的青睐。那麼這裡我向大家介紹介紹小米手機中的6個高級技巧，學會後能讓... 2023-01-08
科技 office完全自學教程pdf
完全掌握Office2013高效辦公超級手冊，從融會貫通，Word基礎操作，Excel基本操作與數據輸入，PowerPoint基本操作到動感活力excel,更加豐滿性感的ppt,再到高大上的協同共享與雲辦公，讓你從此面對office一路封神... 2022-12-06
科技液壓執行元件是指各種類型的什麼
液壓執行元件是一種依靠壓力油使輸出軸作旋轉或往複運動而做功的各種元件的總稱。它可分為液壓馬達(輸出軸作旋轉運動)、液壓缸(輸出軸作直線往複運動)和擺動液壓馬達(輸出軸作旋轉往複運動)三大類。液壓執行元件還可以進一步作如下分類，見下表。液壓執... 2022-12-24
科技 excel提取文件名生成目錄
作者：祝洪忠轉自：EXCEL之家ExcelHome小夥伴們好啊，今天和大家分享一個高效好玩的技巧。如下圖所示，在“測試”文件夾内，包含有兩個Word文件和子文件夾“測試2”，在“測試2”文件夾内有Excel文檔和另外一個子文件夾。咱們看看如... 2022-11-12
科技 16款克萊斯勒300c動态評測
今天我們為大家帶來一款中大型車——它就是克萊斯勒300C(進口)。作為一台中大型車，它的顔值不遜于任何同級車，同時，克萊斯勒300C(進口)無論是在車型配置還是顔值上，都相當有檔次，并且一些主流的配置，它都有所配備。目前，克萊斯勒300C(... 2022-10-25
科技 windows使用記錄
在對SolarWinds事件的深入調查中，微軟發現部分内部帳号被黑客獲取，并訪問了公司的部分源代碼。而現在，有一名黑客以60萬美元的價格出售Windows10源代碼，但是無法确定真實性。來自RenditionInfosec的安全研究人員Ja... 2022-11-19
科技我的世界黃金種類介紹
我的世界很多的玩家我在玩到後期時都不知道玩什麼了，也有很多的人去創建新的存檔來玩新的生存。有的玩家會在遊戲中加一些mod來讓遊戲變得更加的有趣。我的世界在新加入這幾個黃金的食物後，不知道玩家們會不會去嘗試呢？黃金牛排：我的世界在原版的生存中... 2023-01-12
科技如何創建文件夾
如何創建文件夾?我們先來創建一個新建文件夾在桌面空白處點擊鼠标右鍵，會出現一個窗口，點擊新建，我來為大家科普一下關于如何創建文件夾?下面希望有你要的答案，我們一起來看看吧!如何創建文件夾我們先來創建一個新建文件夾。在桌面空白處點擊鼠标右鍵，... 2022-05-31
科技蘋果手機無法創建默認提醒事項
生活中有很多事情需要我們去做，而如果我們單純地使用腦袋記憶的話，可能會遺忘某些重要的事情，此時，利用手機上的提醒軟件進行備忘提醒，是一個非常明智的選擇。今天就拿我手機上的敬業簽提醒軟件為例來演示一下，如何在蘋果手機上設置提醒事項：1、點擊底... 2022-12-13
科技 win7超級管理員權限怎麼設置
經常使用電腦的用戶都知道，剛剛安裝好的win7系統超級管理員賬戶默認是被禁用的，這個設置是為了防止某些系統程序被改變，影響到相關的程序運行而優化的，不過在很多時候我們都需要獲取win7系統的超級管理員權限，那麼win7系統超級管理員被禁用如... 2023-03-20
科技用條碼軟件制作條形碼教程
在條形碼生成軟件中制作可以制作各種類型各種顔色的條形碼，比如說彩色條形碼、個性化條形碼、單色條形碼、漸變色條形碼（制作漸變色條形碼操作步驟可參考文章：條形碼生成軟件如何制作漸變色條形碼）等等。今天呢我們主要來詳細看下條形碼生成軟件是如何制作... 2022-11-12
科技實況足球好用的普卡左邊鋒
pes2020端遊上架了dlc2.0數據包，聽過本文頂部的官方宣傳片可以看出，除了更新衆多球員的臉型外，該數據包還包含了德科、裡瓦爾多、安迪·科爾、約克、利紮拉祖、魯梅尼格、阿爾沙文這7位之前從手遊外服數據庫中曝光的新增傳奇，也就是說這批新... 2023-01-16
科技同步在線近義詞
近義詞替換，什麼是近義詞替換工具。近義詞工具就是批量地替換近義詞。隻需要導入文章支持批量導入。批量替換近義詞。不僅支持近義詞替換還支持反義詞，翻譯、同義詞等批量替換詳細參考圖片教程。經過上面的學習我們曾經曉得内容關于SEO的重要性，近義詞替... 2022-12-07
科技文件橫向太長怎麼打印
您好，歡迎來到【爆炒Office】，這裡有原創的實用辦公軟件技巧。着手工作實際，解決辦公問題。概述工作和生活中總是會收到十幾幾十頁的長文件或者長文檔，需要打印出來傳閱的時候，或者打印保存的時候，如果直接用A4紙打印出來，厚厚的一疊，占用地方... 2023-02-07
科技網站怎麼申請
網站怎麼申請?搜索“自助建站”，選擇你想要的自助建站網站，接下來我們就來聊聊關于網站怎麼申請?以下内容大家不妨參考一二希望能幫到您!網站怎麼申請搜索“自助建站”，選擇你想要的自助建站網站。個人網站的申請注冊，選擇網站右上方的“免費注冊”選項... 2022-06-18
科技五角星黃金比例證明
五角星黃金比例證明?黃金比例分割是指把一條線段分割為兩部分，使其中一部分與全長之比等于另一部分與這部分之比其比值是一個無理數，取其前三位數字的近似值是0.618，我來為大家科普一下關于五角星黃金比例證明?下面希望有你要的答案，我們一起來看看... 2022-06-26
科技黑暗之魂3mod怎麼使用
大家好，我是可愛又迷人的反派角色，電競魔王。都知道《黑暗之魂》是一款“受苦受難”遊戲，但即使如此，還是有很多玩家源源不斷地願意去經曆這場“苦難”。可以說是非常抖M了。越是《黑暗之魂：重制版》隆重登場，畫面得到全面提升，TV模式下最高支持10... 2023-03-18
科技 2022年性能最好的10款手機推薦
近兩年來國内手機市場，少了華為的參與，感覺意思也少了很多。尤其是高端手機市場，幾乎被蘋果給霸榜了，其他廠商在高端市場中的存在感很低。近期就有博主統計了2022年一季度國内最暢銷的10款機型。第一款毫無意外又雙叒是iPhone13，我覺得也不... 2023-02-23
科技有什麼軟件可以把幾個合并
1.打開智兔剪輯2.點擊側邊功能目錄欄的混剪3.我們可以看到主功能區有：但文件夾多視頻混剪、1-5段視頻混剪、自定義段混剪、無聲混剪，我們一個一個來分析首先是單文件夾多視頻混剪，比如我們一個文件夾裡面有很多個視頻素材，我們想直接就從這個文件... 2022-11-28
科技同名文件怎麼更改
你有沒有遇到過這樣的一個情況，自己想要保存的文件因為和其他文件重名然後手速又太快直接按了确定之後原來需要的文件卻消失不見了，這種情況對于很多用戶來說是非常苦惱的，而不少的用戶都會遇到這種事情，而重要的文件一旦被覆蓋是非常讓人着急的，其實有兩... 2022-12-12
科技如臯現有人口
2022年如臯市新生網上報名系統操作指南（本地居民）新生報名系統8月17日00:00開啟——8月19日24:00關閉網上平台申報完成後，市義務教育學校招生工作組将進行大數據比對。填報信息比對成功的，網上平台将反饋信息至家長；信息比對未通過的... 2023-01-25
科技養豬能手勤勞緻富
2018-12-0310:59|嘉興日報80多個溫室大棚連體成片，120畝面積的棚頂實現光伏發電，一個個“神奇”的桑黃菌棒通過流水線離開菌種培養室、大棚裡控溫控濕生産加工全部實現自動化……走進位于海甯市袁花鎮的宏欣農業生物科技有限公司，眼前... 2023-01-13
科技夢想世界手遊百級招式
《夢想世界》手遊是2015首款仙俠回合手遊大作，繼承了見招拆招戰鬥玩法；六大職業天賦各異，帥氣戰寵各顯神通，打造全新策略回合手遊！不僅展現清新唯美仙俠世界，更讓你體驗指尖上的智慧對決！七夕将至，《夢想世界》手遊也将推出全新内容，翅膀系統便是... 2023-01-17
科技現在的手機防水
Hello大家好，我是兼容機之家的小牛。防水功能近年來已經基本成為中高端手機的标配功能了，大部分手機都有着IP68、IP67級别的防塵防水，但是這些防塵防水并不是代表着你就可以帶着手機去遊泳了，IP級别的防塵防水還是比較脆弱的。首先我們來看... 2023-01-01
科技創業者北漂姐最新
一把“殺豬刀”讓抖音“阿牛哥”一個月暴漲270萬粉絲；一個北漂女孩用17個時均10秒的視頻漲粉百萬……包工頭、北漂女孩，牛年第一波爆款賬号看似平平無奇，實則難以複制。一個其貌不揚的大叔在KTV唱着《殺豬刀》，渾然天成的魔性表情和動作，加上由... 2023-02-23

tft每日頭條

> 科技

> 數據采集的兩個必要步驟

數據采集的兩個必要步驟

1. 按數據采集方式

相关科技资讯推荐

热门科技资讯推荐

网友关注