過程數據分析和機器學習-tft每日頭條

過程數據分析和機器學習

科技更新时间:2026-07-28 21:51:56

過程數據分析和機器學習（什麼是最小可行性數據産品）1

大數據文摘出品

編譯：胡笳、睡不着的iris、halcyon

本文作者是一名數據科學家，現在離開了Pivotal公司加入了idealo公司，正在幫助其搭建數據科學團隊以及把機器學習整合到公司的産品中。

在執行計劃的過程中，他發現，作為一名優秀的數據科學團隊的領導人，必須定義機器學習産品路線圖。

結合自身經曆，本文作者帶大家探究一個好的最小可行性産品（MVP）究竟是什麼，以及機器學習産品一個好的MVP的不同維度究竟有哪些。

什麼是MVP?

在Pivotal Labs工作期間，我接觸到了Eric Ries推廣的精益創業思想。精益創業其實是當今最一流的産品開發方法論。其核心思想是，通過不斷的收集客戶的反饋來開發産品或服務，從而可以降低産品/服務失敗的風險（開發-衡量-學習）。

過程數據分析和機器學習（什麼是最小可行性數據産品）2

開發-衡量-學習概念中的一個不可分割的部分就是MVP，它本質上就是“在一個新産品的版本開發中，它讓團隊以最小的代價收集客戶盡可能多的使用後的認知”。一個衆所周知的例子就是，驗證交通工具是否會成功（如下圖所示）。

過程數據分析和機器學習（什麼是最小可行性數據産品）3

我們從最小的代價開始測試這個想法。在這個案例中，我們隻需要兩個車輪和一塊闆子。然後我們将這個産品推向市場，并獲取反饋，增加産品的複雜性來不斷改進我們的産品。

在這個案例中，我們以一輛集成了用戶的反饋的汽車告終。一個大衆熟悉的例子是Airbnb（愛彼迎，旅行房屋租賃社區）。2007年Brian Chesky 和Joe Gebbia想創業，但是無力承擔舊金山的房租。

與此同時，有一個設計展會正要在這個城市舉辦，他們決定将他們的公寓出租給那些沒有在附近找到酒店的展會與會者。他們為公寓拍照，并将照片上傳到一個簡單的網站上（見下圖），很快在展會期間就有三個付費客人。這個小測試帶給他們寶貴的領悟：人們願意付錢留在别人的家中而不是去酒店，并且不隻是附近的大學畢業生才會注冊這個網站。之後他們便創建了Airbnb，接下來的事大家都知道了。

過程數據分析和機器學習（什麼是最小可行性數據産品）4

與這種方法相反的另一種做法是，将一輛車從車輪逐一構建直到底盤，并且在此期間從未推向市場。但是，這種做法代價很高。在結束一天工作後，我們可能會推出一個客戶并不需要的産品。

讓我們以Juicero（智能榨汁機初創公司）為例。他們從投資者手中募集了1.2億美元，用于創造一款精心設計的榨汁機，經過一段時間的開發後以非常高的價格進行發售（最初的原價為699美元，随後降至399美元）。

除了榨汁機，你還可以購買裝滿原生水果和蔬菜的果蔬包，每包售價為5-7美元。可能有些人已經聽說過這個公司，但這家公司目前已經倒閉了，因為它并沒有意識到其實客戶并不真正需要一款價格高昂的榨汁機來将果蔬包榨汁。

他們并不真正了解他們的客戶。一個簡單的用戶研究就能讓他們意識到，客戶并不需要昂貴的機器來擠榨果蔬包，隻需要兩手擠壓就足夠了。

過程數據分析和機器學習（什麼是最小可行性數據産品）5

MVP的概念如何與機器學習産品進行關聯？

MVP概念也可以被應用于機器學習，因為最終，機器學習也是整個産品的一部分或者就是最終産品本身。考慮到這一點，我認為有三個重要的維度。

1.最小可行模型

過程數據分析和機器學習（什麼是最小可行性數據産品）6

機器學習産品的一個重要方面就是建模訓練過程本身。假設我們有一個分類問題，我們希望将一些數據分類到預定義的類别中，例如熱狗vs.非熱狗分類。

過程數據分析和機器學習（什麼是最小可行性數據産品）7

解決這個分類問題的一種可能的方法是采用一個包含一個隐藏層的神經網絡。接下來我們将訓練和評估此模型。然後根據結果，我們可能希望持續改進我們的模型。我們接下來将增加另一個隐藏層，然後再進行相同的模型訓練過程。

然後再根據結果，可能會增加越來越多的隐藏層。這種方法非常直接，實際上是解決熱狗與非熱狗分類問題的最佳解決方案，因為不需要特征工程（我們基本上可以将原始圖片作為輸入數據）。但是對于大多數的分類問題，除非它們不是那些像在計算機視覺或自然語言處理中遇到的專業問題，否則這不是解決這類問題的最佳方法。

深度學習的最主要缺點在于其缺乏可解釋性。通過采用的網絡種類來解釋此神經網絡的結果通常很難。并且你會花費大量的時間用在神經網絡的調參上，但對模型性能的提升卻影響甚微。

從簡單開始，建立基線。對于大多數分類問題，從邏輯回歸這類線性模型入手會比較可行。盡管在許多實際應用中，線性假設是不切實際的，但是，邏輯回歸做得相對好并可以提供基準，亦稱為基準模型。它的主要優點也是可解釋性，并且可以直接得到條件概率，這在很多情況下十分方便。

為了改進模型并放寬線性假設的條件，可以使用基于樹的模型。主要有兩大類這樣的模型，Bagging和Boosting模型。實際上，它們都使用的是決策樹，隻是采用不同的方式訓練模型。最後，如果所有的方法都已用，你還想不斷改進你的模型，那麼我們就可以利用深度學習技術。

2.最小可行性平台

過程數據分析和機器學習（什麼是最小可行性數據産品）8

我在Pivotal Labs工作期間，參與了許多項目來幫助财富500強企業開始他們的數據旅程。很多項目的共同點是開始對基礎架構進行巨額投資。他們花費大量資金采購大數據平台，即所謂的“數據湖”。

但在購買之後，他們甚至都不考慮潛在的用例，便将數據加載到他們的數據湖中。然後，他們聽說了一個名為Apache Spark的東西，并将其添加到基礎設施層。

現在，由于人工智能已經成為流行的風潮，他們也開始購買GPU，并在其上添加如TensorFlow那樣的深度學習框架。在一個地方擁有所有（酷）工具聽起來很棒吧？然而，最大的問題是，将所有數據放入數據湖之後，發現數據與用例并不匹配。要麼他們沒有收集到正确的數據，要麼不存在支持潛在用例的數據。

更可行的方法不是考慮硬件或者軟件，而更多的是解決問題。通過這種方法，可以盡早了解需要哪些數據來解決問題，并且還能避免各種數據錯誤。除此之外，迄今為止我所看到過的很多機器學習問題，實際上都可以在本地機器上解決。他們并不需要對基礎設施進行巨額投資。

而且，如果數據量真的很大，他們可以使用AWS或Google Cloud等雲服務提供商的服務，便可以非常輕松地啟動一個Spark群集。如果他們有一個深度學習問題，也會有很多的選擇。不但可以選擇已經提到的雲服務提供商，也可以選擇如FloydHub那樣提供的平台級服務（PaaS），在雲上訓練和部署深度學習模型。

3.最小可行（數據）産品

最後，我想談論的一點是數據産品本身。本質上，數據産品有很多例子，比如聊天機器人、垃圾郵件檢測器等等——這個清單很長（更多的機器學習産品，請查看Neal Lathia的精彩文章）。但是在這裡，鑒于當前我在電子商務領域工作，我将專注于推薦服務。

過程數據分析和機器學習（什麼是最小可行性數據産品）9

采用簡單的相似性算法以及使用矩陣分解技術是一種建立推薦服務的方法。最後，我們還可以嘗試使用深度學習方法等更加複雜的模型（例如，深層次的語義模型）。但是，我不建議采用這種方式。推薦是多種形式的。例如，你的朋友給出的建議是推薦，或者前100名最喜歡的産品也是推薦。并非我們所使用的每個複雜算法都會成功，但它必須經過測試。事實上，不要害怕在沒有機器學習的情況下建立推薦服務。

過程數據分析和機器學習（什麼是最小可行性數據産品）10

因此，正确的方法是像熱門産品那樣首先建立A/B測試框架和評估指标（例如，跳出率或點擊率），再采用簡單的方法開始。在測試之後，确定用戶傾向于點擊這些推薦的項目（有時他們必須先養成習慣，特别是如果它是新産品功能的話），最終用戶也可能會購買那些推薦的項目，我們可以嘗試使用諸如協作過濾技術更為複雜的方法。舉個例子，我們可以基于購買過此商品的用戶會對這類商品感興趣，或者查看此商品的用戶也對這類商品感興趣來創建一個推薦。“用戶對這個項目……也對這些項目感興趣”這類選項可以是無窮盡的。

總結

在這篇文章中，我講述了關于MVP對機器學習産品的意義的理解。實質上，就是從小處開始不斷叠代。此外，為了更清楚地解釋我對機器學習産品的MVP代表的意思，我讨論了三個主要維度，我認為這對于優秀的MVP數據産品至關重要：

最小可行性模型，
最小可行性平台，
最小可行（數據）産品。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技 sonos低頻過重
sonos低頻過重?不久前，作為世界目前頂級的無線智能音響品牌，SONOS正式宣布加入了美國亞馬遜打造的Echo生态陣營，也成為了了Echo可以直接控制的一款産品，而Sonos本身就作為一款音響來說，加入了亞馬遜的陣營背後是否也意味着他們放... 2023-01-10
科技手機攝影人像修圖
怎樣用軟件将兩張照片合成一張呢？用軟件，将兩張照片，合成一張，用手機就可以搞定。在手機上，也是有很多個軟件，可以制作。我先為朋友們展示效果圖，後面為大家介紹操作步驟。合成之後的圖一：合成之後的圖二：合成之後的圖三：原圖：用手機修圖軟件，講兩... 2022-11-26
科技電信欠費納入征信依據
所謂的個人征信，就是指依法設立的個人信用征信機構對個人信息采集并且加工，同時還提供個人信用信息查詢和評估服務的活動。一般來說，征信系統是通用的，也就是個人在貸款，違約等方面隻要某一方面涉及了負面的征信污點，那麼以後任何金融機構都能查詢得到。... 2022-11-18
科技 oppoa9x系列最值得買的手機
#頭号周刊#千元機性價比較高的手機第四名，今天帶大家了解下它。截止發稿時間銷售價格8GB128GB銷售價格1799元配置參數天玑800U雙卡雙待雙5G30WVOOC閃充OLED超清護眼屏4800萬前置攝像頭800萬超廣角鏡頭200萬微距鏡頭... 2022-10-30
科技手機屏幕參數哪個重要
主流旗艦手機越來越重視屏幕顯示效果，屏幕體驗提升到了更高的優先級。從去年底發布的小米11，到尚未發布的OPPOFindX3系列等産品，共同點都是會配備一塊高素質屏幕。對于用戶來說，每次使用手機基本都要通過屏幕進行交互，屏幕顯示效果會直接影響... 2023-01-03
科技順豐快遞東西丢了怎麼索賠
順豐快遞東西丢了怎麼索賠?夏女士花11000元買了一部全新的蘋果手機，通過順豐快遞從深圳寄往江蘇，卻遲遲未收到，向順豐詢問時被告知快遞丢了，隻能走理賠，因夏女士勾選了下單頁面中的2元保價，根據保價賠償1000元，夏女士則表示，下單時未注意到... 2022-12-13
科技本手機手電筒怎麼打開
本手機手電筒怎麼打開?下拉或上滑調出控制中心，點擊手電筒快捷開關開啟，我來為大家科普一下關于本手機手電筒怎麼打開?以下内容希望對你有幫助!本手機手電筒怎麼打開下拉或上滑調出控制中心，點擊手電筒快捷開關開啟。進入設置--快捷與輔助--開啟“快... 2022-06-04
科技 12代cpu配什麼主闆最性價比
【1】昂達H610M目前市面上零售H610系列主闆中，價格最低的應該就是昂達H610M，這張主闆名字簡單，BIOS本身也并無多少可操作、可調節性，包裝整體比較簡陋，長相也非常樸素，但價格則僅需429元，适合預算較為拮據的消費者選擇。昂達H6... 2022-11-04
科技電腦win10專業版怎麼恢複出廠設置
其實，我們的電腦都自帶了恢複出廠設置的功能，這個功能可以幫助用戶将電腦恢複到最初始的狀态，可以有效的解決一些電腦系統故障問題。那麼具體需要怎麼操作呢？下面，就和小編一起學習一下吧！操作方法：1、點擊win10系統左下角開機鍵，選擇設置。2、... 2022-12-01
科技 autocad建實體三維模型
剛開始用CAD時，基本用不上模型中視口這個功能，也不知道視口是做什麼用的。直到有一次到工地出差，偶爾偷瞥到一位高手在畫圖用到視口這個功能，從此一發而不可收拾。在模型中使用視口，目的就是為了方便畫圖。一般常用左右兩個視口，看左邊的資料，畫右邊... 2022-11-04
科技英特爾arc顯卡測評
上周。英特爾銳炫Arc系列桌面顯卡正式發布，延期許久僅有四款産品；英特爾13代酷睿規格曝光，高端功耗增加，中低端換皮擠牙膏；華碩秋季發布會帶來多款新品。折疊屏19999元起；RedmiGPro系列三款遊戲本發布，首發價真香。英特爾銳炫系列桌... 2023-02-06
科技高考報名填農村戶口
高考報名填農村戶口?高校專項計劃和地方專項計劃均要求考生及其父親或母親或法定監護人戶籍地為“農村”在“取消農業戶口與非農業戶口性質區分，統一登記為居民戶口”後，考生如何确定自己戶籍地是否為“農村”？省招辦6日發布的《關于做好2019年農村專... 2022-10-24
科技為什麼電腦屏幕突然變得特别黑
為什麼電腦屏幕突然變得特别黑?問答堂>手機>屏幕>電腦屏幕很白,腫麼調才能變得黑一點啊?，下面我們就來聊聊關于為什麼電腦屏幕突然變得特别黑?接下來我們就一起去了解一下吧!為什麼電腦屏幕突然變得特别黑問答堂>手機>屏幕>電腦屏幕很白,腫麼調才... 2022-10-13
科技寫字樓物業管理軟件有免費的嗎
快鲸寫字樓物業管理軟件介紹快鲸寫字樓物業管理軟件是快鲸科技有限公司旗下産品，有着強大的系統功能優勢，能助力商住不動産快速招商，智能租賃管理和高效的資産管理。适用于寫字樓、商場、公寓、辦公園區、創客空間、商業樓宇等業态。軟件自推出以後，經過了... 2023-01-11
科技手機電池不耐用别急着換電池
手機電池不耐用别急着換電池?一直以來，蘋果用戶都相當關心自己iPhone手機的電池健康，想要實時了解到自己手機電池的耐用程度而由于現在手機充電方式過于多樣，且大家的用機習慣又大不相同，這就使得許多人的iPhone電池健康都有着不少的偏差自己... 2022-10-13
科技普通馬桶可以裝智能馬桶蓋用嗎
在裝修時，馬桶安裝我們經常會遇到糾結的選擇，是選擇傳統馬桶好呢，還是選擇智能馬桶好？選擇了壁挂馬桶，又想帶着智能馬桶蓋的功能，那又怎麼辦呢，今天就和大家說一下，壁挂馬桶和我們的智能馬桶蓋，在裝修時應該有哪些注意事項。首先壁挂馬桶需要配合隐藏... 2022-12-08
科技 win7電腦開機密碼忘記了怎麼解除
方法一：通用設置您可以在啟動時進入用戶密碼輸入界面，然後使用快捷鍵：CtrlAltDelete。按下快捷鍵後，彈出一個麻木字段。輸入麻木框：麻木，然後按Enter鍵進入系統！方法二：如果您使用第一種方法，發現仍然需要密碼1.開機時可按F8鍵... 2022-09-29
科技樂視手機y2pro實測
樂視手機y2pro實測?你選誰？樂視手機樂Pro3雙攝版對比vivoY66，我來為大家講解一下關于樂視手機y2pro實測?跟着小編一起來看一看吧!樂視手機y2pro實測你選誰？樂視手機樂Pro3雙攝版對比vivoY66 2022-10-11
科技小米手機miui12小屏幕如何控制
小米手機miui12小屏幕如何控制?在設置全面屏手勢的情況下，首先把你要打開的APP點開後從屏幕最下方往上推，看到“拖到此處懸挂”處松手，這個APP就變成了小窗口，這時再打開另一個你要運行的APP，這個窗口是大屏，另一個是懸浮的小窗口，這個... 2023-01-25
科技趙本山小女兒球球直播
趙本山女兒球球和天佑的關系确實挺好的，雖然沒有傳出擦出火花，但兩人的互動讓粉絲們希望兩人能夠湊成一對。如今，球球到YY直播的時間僅20餘天，已經吸引了足夠的關注。從一開始在文靜直播間試播，到天佑助陣，球球在YY的直播起點顯然高很多。昨晚，趙... 2023-01-05
科技海康錄像機遠程錄像設置方法
今天接到一客戶打電話說上級檢查要求監控保存一個月，而又不想增加費用換更大的硬盤。7個h.265海康200W,硬盤是4TB的。按正常來計算：一個攝像頭一天20G,7個攝像頭一天140G,7個攝像頭30天4200G,4TB的硬盤是不夠用的，4T... 2022-12-31
科技一加手機刷機需要的工具
請點擊上面藍字關注本公衆号，為你詳細分享玩機經驗，教你刷機方法！（本文後部有詳細刷機教程）小米手機因MIUI而生，先有MIUI而後才有小米手機。那麼MIUI呢？MIUI因刷機而生。在MIUI橫空出世前的那些日子裡，國内用戶隻能忍受近似原生安... 2022-11-07
科技如何讓手機當門禁卡
為了提高安全保障，大多數小區都會設置門禁，并且隻有刷門禁卡才能進，但是經常上班或者出門走的急，忘記帶門禁卡，進不去家門就尴尬了。今天就來教大家一招，将門禁卡寫進手機裡面，碰一下能開小區大門，如果你是智能手機，那麼這一招可以學起來了。第一步、... 2022-10-21
科技花呗全面接入征信需要關閉嗎
花呗全面接入征信需要關閉嗎?澎湃新聞記者陳月石花呗真的要上征信了，我來為大家科普一下關于花呗全面接入征信需要關閉嗎?以下内容希望對你有幫助!花呗全面接入征信需要關閉嗎澎湃新聞記者陳月石花呗真的要上征信了。8月10日，據中國證券報報道，中國人... 2022-12-15
科技路由器怎麼安裝詳細
有些時候我們自己裝的寬帶路由器每次都要給裝線的人幫我們設置好路由器，可是以後出現問題需要自己重啟或者換了新的網線想設置到路由器呢？是不是又要叫人幫忙呢？那我就給大家講解一下如何安裝路由器。隻有自己會了想怎麼裝就怎麼裝。（我這裡以水星來介紹）... 2022-11-08
科技迷你世界0.44.0版本介紹
相信不少玩家都知道，迷你世界即将迎來1.0版本。在不少擁有先遣服賬号的玩家們爆料之後，不少玩家發現，迷你世界迎來了非常巨大的改變。這些改變，直接讓不少老玩家，直呼自己是新人！不過不管是新人還是舊人，這些變革裡面，還是有很多好點子的。在此前介... 2022-12-13
科技電腦怎樣解決内存不足的問題
因為電腦的安全性功能比較多，所以我們喜歡把文件儲存在電腦上。但是時間久了文件越來越多，我們的電腦内存就會不足。那麼電腦内存不足該怎麼辦呢？常見的方法有：一鍵加速、清空垃圾站、内存優化。大家還可以參考下面這三種方法。方法一：擴大虛拟内存1、打... 2022-11-18
科技建設強大國防演講稿
黃河長江奔騰萬裡，那是中國！古老文字源遠流長，唐詩宋詞代代相傳，那是中國！青藏，美麗的高原，新疆，遼闊的盆地，那是中國！如果我是一隻鳥，這片土地就是森林；如果我是一朵浪，我們的國家就是一片海洋。她生我養我，在我身上打下了深深的文化烙印。我倍... 2022-11-07
科技可視門鈴會被管理處反監控嗎
近年來帶有自動攝錄的可視門鈴走進越來越多家庭然而智能可視門鈴在給居民家庭帶來安全、防盜的同時也給鄰裡之間帶來了困擾有的甚至引發鄰裡糾紛訴至法院那麼在自家門口安裝可視門鈴是否侵犯鄰居隐私權？安裝前需要征得鄰居同意嗎？事例01對門鄰居裝可視門鈴... 2022-12-31
科技怎麼給電腦裝個收銀系統
如果你剛好開了店，如果你剛好用收銀系統，但又不想購買多餘的硬件設備，那麼，電腦收銀系統非常适合你，沒想到吧，電腦也可以用來做收銀！究竟電腦如何用來做收銀系統？一起來看看~全設備适用思迅天店收銀系統，基于雲計算技術開發，是一款新型的互聯網收銀... 2022-11-04

tft每日頭條

> 科技

> 過程數據分析和機器學習

過程數據分析和機器學習

相关科技资讯推荐

热门科技资讯推荐

网友关注