機器學習的實際問題-tft每日頭條

機器學習的實際問題

生活更新时间:2025-12-04 19:15:46

機器學習的實際問題（做了5年機器學習研究）1

在Mindsdb從事 3 年自動機器學習工作後，我辭職了，至少我不會在短時間内從事任何與機器學習相關的職業工作。掐指一算，我已經做了 5 年機器學習研究，但直到今天，我才終于搞清楚了很多自己之前不知道的事物，甚至我還可能覺察到一些别人不知道的東西。

本文總結了我從事機器學習工作以來總結到的收獲，請不要将這當作“專家總結”，你可以把它想象成局外人的一件藝術作品——一個對時代精神進行了不同尋常的深入研究，卻沒有成為“社區”一部分的某個人的收獲。

機器學習研究的作用是什麼？

早在 5 年前，我就曾接觸過機器學習研究。但直到今天，機器學習研究的作用對我來說仍然是個謎。

大多數科學子領域（真正的領域）都可以聲稱，它們是一個理論構建和數據收集的雙重過程。更多的理論領域，比如那些圍繞數學和計算機科學這兩個術語展開的領域，取得的進步幾乎完全來自概念層面。這些概念是如此基礎，似乎不太可能被取代，比如歐幾裡得元素等等。

但機器學習正處于一個奇怪的十字路口。即使我們承認它和物理學一樣具有理論上的嚴謹性，它仍然缺乏永恒的實驗觀察。這并不是因為參與者缺乏美德，隻是它研究的對象是一個移動的目标，而不是一個具體的現實。

人們最多可以提出這樣的永恒主張：

給定<某某硬件>，可以在 ImageNet 的<某某部分數據集>上獲得<某某精度>。

給定<X>數據集，并使用整個數據集保留一個 CV，我們可以獲得某些精度函數的 x/y/z 的最新值。

給定允許可編程代理與之交互的<Y>環境，我們可以在循環/懲罰/時間/觀察 & 獎勵/知識/理解矩陣上達到 x/y/z 點。

但這些并不是理論本身所圍繞的那種主張，機器學習帶來的易于驗證且永恒的收獲在理論上是無趣的。最多可以說，他們對在特定任務中的數字硬件性能設定了下限。

此外，機器學習也沒有強有力的理論保證作為後盾。雖然有一些“小”的理論保證可以幫助我們進行更廣泛的實驗，例如證明在特定範圍内的可微性等等。但在理想化條件下，一些理論保證最多可以指向潛在的實驗路徑。

可能有人會認為機器學習是一個非常模糊的領域，甚至大多數數據都是假的，大多數發表的論文都是為了在更廣泛的學術論文引用遊戲中獲勝。

然而，事實上，機器學習可能是學術界唯一正确運作的領域。通常情況下，機器學習論文要附帶代碼和數據，以及足夠嚴格的方法，以便于其他人重複研究。論文提出的觀點通常很容易用作者提供的工具進行證明和獲取。雖然也有例外，但整體而言還是比較少的。

更重要的是，與數學和計算機科學領域不同，機器學習中的重複研究不是留給十幾位有大量空閑時間的專家的。如果你想驗證一篇最新的 NLP 論文，你隻需要掌握 CS101 知識就可以了。但在數學等領域，這是不可能的。因為在數學領域，現代“定理”（有時寫在一本厚厚的書上）的有效性取決于少數專家的一緻意見，而不是一個自動化的定理證明器。

事實上，機器學習中的許多實際工作都是由圈外人完成的，他們沒有相關的學術背景，或者幾乎沒有學術背景。這與其他領域正相反。在其他領域中，證書主義是絕對的權威，并且人們也習慣于按資排輩。
什麼是軟件能做，而硬件做不到的？
廣義上，機器學習研究包括基于 LA 庫或集群工具的工作，這些研究似乎總是傾向于重蹈覆轍。機器學習中的主要現代技術，似乎可以被稱為對 20、30 甚至 50 年前想法的輕微概念重構。

試問一下，70 年代以來，機器學習的進步中有多少是軟件，多少是硬件？很遺憾，研究類似問題的論文少的驚人。因為衆所周知，在任何語言任務中，試圖用某種 T5 等價計算在一定規模上訓練一顆巨大的決策樹，都不會與 T5 相匹配，而且調整算法的任務也不簡單。

這個問題本身是一個沒有實際意義的問題，因為總是需要一些研究來開發最适合硬件發展的軟件。一個更好的問題可能是：如果機器學習研究的數量減少了 1000 倍，會對性能或可處理任務的廣度産生任何影響嗎？

直覺告訴我，未來的大多數進步都會是硬件産生的結果，而對于我們這些更喜歡專注于軟件的人來說，可以做的是：
先弄清楚硬件的進步能夠讓一個人在 2-4 年内做什麼，尋求資金，圍繞這些突然出現的機會創建一家公司；
試圖尋找範式轉變，修複浪費 99%資源的瓶頸，這些瓶頸深深紮根于我們的思維中，我們甚至無法看到它們。計算出 99%的可用計算能力正在/實際上/沒有被使用，并且可以使用這個很酷的技巧。想出一個簡單的抽象，在任何可用的任務上單獨執行接近于 SOTA。
自動化機器學習
過去幾年，我的大部分工作都是圍繞自動化機器學習的，所以我帶有偏見地認為，自動化機器學習是機器學習中很重要的一部分。事實上，無論是學術界還是産業界，在機器學習領域工作的大部分人，似乎都在從事自動化邊緣的工作。

相關的學術論文可以歸結為以下幾個步驟：
架構。
對超參數進行一些小的修改。
在幾個數據集上運行基準測試。
證明一些理論保證，這些保證通常不适用于任何現實世界的訓練場景，并且可以通過經驗證明（例如，當數據符合某種理想分布時，可微性、一緻收斂性）
添加足夠的填料。

而數據科學家和機器學習工程師的工作也可以歸結為以下幾個步驟：
嘗試一些易于使用的模型，如果設置正确，這些模型不需要 100 行代碼就可以使用。
在測試數據上盡量調優超參數的單元精度，即使它在現實中有點糟糕，也仍然值得部署到生産中。
将其包裝在某種 API 中供後端使用。
如果需要，編寫一個 cron 定時任務，時不時地對其進行訓練。
編寫一個很長的 PPT，并向 5 個（有 P 開頭或 C 開頭職位頭銜的）人演示，這樣他們就可以放心地允許你部署。

廣義上講，這似乎是一件非常容易自動化的事情。但似乎這些人的工作與第 1-4 步沒有任何關系，也許模糊的理論和幻燈片才是重點。

或許這是一種簡化的思考方式，但換種角度來看，如果自動化機器學習真的這麼好，為什麼更多的 Kaggle 排行榜不是由使用這些軟件包的人所主導？
機器學習中的基準和競争
與論文發表量相比，大家對基準和競争的興趣似乎并不高。arxiv 上每天出現的與機器學習相關的論文數量遠遠超過 100 篇，而登上代碼排行榜的論文數量卻要小得多。

我認為大多數研究人員證明這一點的方式是，他們沒有試圖用他們的技術在任何事情上“競争”，也沒有試圖提高某種精度分數，而是試圖為設計和思考模型提供有趣的理論支持方向。

這本身沒問題，但事實上，據我所知，沒有任何一個突破性的技術是完全基于數學保證的，并且需要數年才能成熟。通常的情況是，如果某個東西“起作用”并得到廣泛采用，這是因為它立即改善了結果。花費幾年甚至幾十年才能實現的突破是影響廣泛的架構理念，但這種突破非常少。

現實情況是，人們在論文中假設“通用”技術，例如優化器或增強方法，手搖幾個公式，然後在不到 12 個數據集的模型因變量（如優化器優化的架構、增強算法使用的估量器等）中，進行小到微不足道的基準測試。

這不是我對三流論文的批評。在我的腦海中，我可以說出像 LightGBM、改進的 ADAM 和 lookahead 等理論。對我和其他許多人來說，它們是遊戲規則的改變者，已經證明了它們在許多現實問題中的價值，并且它們最初是在幾乎沒有任何實驗的論文中被提出來的。

我認為當前的問題歸結為以下三點：
缺乏“通用”基準測試套件。OpenML自動機器學習基準測試最接近通用基準測試，但其問題焦點非常狹窄，僅限于測試端到端的自動機器學習方案。理想的通用基準測試應該具有多對多的體系結構到數據集的映射，允許替換某些組件，以便作為更大整體的一部分評估新技術。在某種程度上，我曾幻想将 Mindsdb 基準測試套件構建成這樣，但我懷疑是否有人真的想要這種解決方案，因為沒有激勵結構。
缺乏競争。我的意思是，像 Kaggle 這樣的網站和十幾個特定行業的克隆網站，它們的格式對用戶提出了很多要求，并且競賽頒發的獎勵也比較吝啬。
上述 2 個問題的一個潛在組合是，機器學習中最“有價值的”問題甚至很難進行基準測試或競争。翻譯、文本嵌入生成和自動駕駛等任務是各種級别的難以用一些指标進行檢測來客觀判斷的任務。

這又回到了一種觀點，即：如果你做技術開發工作，你最好專注于範式轉變或産品化，除非你明确地得到報酬去做其它事情。
機器學習在特定領域是否達到了“最先進水平”？
另一個有趣的問題是，機器學習在特定領域是否達到了“最先進水平”？這種問題可以包含在一個.csv 文件中，使用 0 到 1 的精度函數進行評估，并在速度、數學保證和“可解釋性”方面發生了很大變化。

盡管如此，我們目前還是無法确定地回答這個問題。

我幾乎能肯定回答的是，從學術研究人員到行業研究人員，再到普通的中型公司數據科學家，他們對獲得最先進結果的想法完全不感興趣。

我很幸運地（或者不幸地）與幾十個組織交流它們的機器學習實踐，我的印象是，大多數“想要使用機器學習”的組織和項目，甚至還沒達到機器學習的“數據驅動”階段。它們希望從結論開始，憑空做出預測。他們對評估一個算法是否足以用于生産的想法令人目瞪口呆。

大約 30 年前，一位醫生發表了一篇論文，在這篇論文中他重新發明了六年級數學，試圖找出如何評估他的糖尿病患者的方法。這發生在個人電腦普及的時代，人們會認為需要标準化計算的、生死攸關的決定肯定是由一台機器完成的，而不是一個連微積分都沒聽說的人。更糟糕的是，考慮到我們談論的是一個實際發表論文的人，這就是當時該領域 0.1%的頂尖人物，隻有神知道其他人在幹什麼。

我有一種感覺，無論這個問題所描述的更廣泛的現象是什麼，它仍然是機器學習對其它領域缺乏影響的根本原因。通過舍入誤差來提高某些問題的精度，或者從理論上保證算法是否在完美解的 0.3%以内，或者為了更容易解釋而對參數進行精簡，都不太可能有所幫助。

在我看來，人們在使用經典機器學習時的大多數問題都是人，沒有多少研究可以解決這個問題。
機器學習更像是外星人的大腦
另一方面，機器學習正越來越多地應用于“非經典”問題，例如語言問題或駕駛問題。在這個領域内，有監督和無監督的區别似乎消失了，人們試圖将算法解釋為簡單的數學，而不是基于約束的生成系統自我選擇，變得像用大腦做這件事一樣愚蠢。

宏觀來講，在某個方向上有一定的影響力會産生高度專業化的方法和算法，這些方法和算法可以（作為文件或服務）在研究人員之間傳播，作為構建更高級别功能的基礎。在 30 年後，機器學習似乎更像是巨大的無比複雜的外星大腦，控制着大部分社會，而不是做線性代數。

持懷疑論的人認為，在給定一行或兩千行代碼的情況下，機器可以從頭開始編寫 GPT-{x}，而且大部分工作都在并行化和易于實驗的代碼上，在實現數字百分比改進的技巧上。此外，缺乏客觀評估複雜任務的能力遲早會導緻崩潰，這幾乎是肯定的。

我不認為機器學習和自動駕駛的情境是相似的，我們已經在沒有多少自動駕駛的情況下度過了很長時間。對我來說，從多元回歸開始解釋機器學習，似乎比預測編碼和博弈論更好，後者奠定了更好的基礎。但我肯定對機器學習所能取得的成就印象更深刻，同時也懷疑進步是否會以類似的速度緩慢前進。
機器學習的 3 個發展方向
目前，在機器學習分支下，我看到了 3 個有趣的方向，而且這些方向正在進一步分裂。

第一個方向是“經典的”機器學習方法。它們現在有足夠的計算算力來處理大多數高維問題。其中的核心問題是提供更多的理論保證，産生作為“因果”模型基礎所需的那種“可解釋性”，并引導時代精神遠離直線、p 值和柏拉圖式的形狀。

第二個方向是行業應用。我認為這更多地涉及到典型的“自動化”工作，即數據争論、領域邏輯理解和政治活動。隻是新一輪的自動化浪潮現在和以往一樣，得到了更高級工具的支持。

最後一個方向是鍍金類型的研究，這是由一些理想主義者和許多試圖通過論文進入職業生涯軌道的學生進行的。這是最有趣的發現，它們隐藏在成堆無法操作或低影響的噪音中。我不确定在敞開的大門之外發生了什麼，因為我沒有足夠的能力去過濾噪音。但從表面來看，抽象概念正在轉移到以前被認為是強化學習的領域。

這三個方向任意兩兩組合，你會得到一些有趣的東西。比如，AlphaFold 是 Transformer 與科學領域專業知識的最後一分鐘進步，以取代蛋白質折疊的“手動”模型；特斯拉自動駕駛是 SOTA 願景、RL 和轉移學習，與遊說者、律師和營銷人員聯合起來，自動化減少了兩位數的工作；一些研究危機複現的人似乎處于前兩者之間，他們試圖通過系統化來避免分析數據和審查證據時的人為錯誤，盡管我認為這樣的研究為時過早。

雖然這是一個不完美的分類，但它幫助我了解整個領域。我認為這也是一個很好的範式，可以用來思考應該解決什麼問題，與誰合作，以及需要什麼樣的背景。
,
更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活拼多多如何開店鋪步驟
1、在浏覽器搜索欄中輸入“拼多多官網”，并點擊搜索。2、點擊拼多多官網鍊接，進入官網中；點擊首頁中的... 2023-06-30
生活 1990年農曆4月初6日是陽曆多少
1、1990年農曆4月初6日是陽曆1990年4月30日。公元1990年，公曆平年，共365天，53周... 2023-06-30
生活男女那點事知多少
第一、男生和女生在結婚之前一定要注意不能發生同居或者性行為。如果說因為客觀原因或者是其他不可抗的阻力，兩人發生同居關系的話，一定要注意做好安全措施。第二、男生和女生在一起應該有共同的興趣愛好和話題，這樣兩個人的感情才會更好，也能更容易聊得來。第三、男生和女生在婚後可能會發生争執現象，這是很正常的，但... 2023-06-30
生活薄荷葉可以直接泡水嗎
1、薄荷葉是可以直接泡水喝的，能夠清涼解暑，清熱解毒，醒腦提神。2、薄荷葉中含有薄荷醇，薄荷酮，可治... 2023-06-30
生活蘆筍催芽的方法
1、曬種是殺滅病菌、避免病菌傳人植株的經濟有用的辦法，還能夠有用進步發芽率，增強蘆筍種子發芽勢。耕種... 2023-06-30
生活羊毛連衣裙清洗方法
1、備用材料：準備網兜、水、中性洗滌劑、食鹽、米醋。2、準備一盆30度左右的溫水，水溫不宜太熱，因為... 2023-06-30
生活年會開場白台詞句子
1、年會開場白台詞（一）邱：各位領導、各位來賓周：各位在座的同仁們，邱周：大家晚上好！主持人向大家拜... 2023-06-30
生活灑脫不羁的唯美句子
1、我雖然渴，但不是什麼水都喝。2、我們都在人前裝得潇灑，卻還是在晚上流淚悲傷。3、時間是個好東西，... 2023-06-30
生活甜鴨脖的做法竅門
1、準備鴨脖子。輔料：辣椒粉、蔥姜蒜。調料：鹽、糖、料酒、食用油。2、鴨脖子去皮、洗淨後斬成段。3、... 2023-06-30
生活社保補繳有滞納金嗎
1、社保補繳是有滞納金的，且滞納金可不少。2、根據《中華人民共和國社會保險法》第十一章第八十六條的規... 2023-06-30
生活結婚登記流程
1、申請。必須雙方親自到一方戶口所在地的婚姻登記機關申請結婚登記。2、審查。婚姻登記管理機關對當事人... 2023-06-30
生活北京奧運會會徽的含義
1、會徽代表着中國文化，印章是中國淵源深遠的中國傳統文化藝術形式，至今仍是一種廣泛使用的社會誠信的表... 2023-06-30
生活加班工資怎麼算
1、國家規定的加班費計算方法：平時晚上的加班費是本人工資的150%，雙休日是200%，國定假日是30... 2023-06-30
生活食用油開蓋後6個月還能吃嗎
1、食用油開蓋6個月後，不建議繼續食用。根據相關的研究表明，沒有添加抗氧化劑的食用油，過氧化值在開封... 2023-06-30
生活交友如何交心
1、無論與任何友人交往，如果總是以審視的目光觀察他的缺點過失，對他的優點功德卻熟視無睹、視而不見，并... 2023-06-30
生活哈啰粉色共享單車哪裡有
1、哈啰粉色單車是校園限定款,隻在各大大學裡面投放,這種櫻花車很适合春天在學校裡騎車拍照,很多校園都... 2023-06-30
生活傳媒公司怎麼賺錢
1、傳媒公司的組成主要還是人才，例如通過文筆較好的人進行公衆号上發表文章，來提高自身傳媒公司的知名度... 2023-06-30
生活 qq紅包怎麼搶
1、打開手機QQ，選擇一個群，選擇屏幕下方的紅包似按鈕。2、在屏幕下面彈出選項，選擇紅包。3、選擇紅... 2023-06-30
生活核桃仁做餡怎麼處理
1、首先把面粉放到盤中，加酵母【按說明下料】适量的白糖。2、适量的水揉搓成面團，然後蓋住發酵。3、核... 2023-06-30
生活微信讀書私密閱讀模式怎麼開啟
1、打開手機中的微信讀書app，點擊屏幕下方的書架圖标，進入書架界面，然後點擊右上角的編輯按鈕。2、... 2023-06-30
生活何須淺碧深紅色自是花中第一流寫的是什...
1、答案：桂花。2、答案解析（1）“何須淺碧深紅色，自是花中第一流”出自宋代女詞人李清照的《鹧鸪天·... 2023-06-30
生活泡普洱茶的正确方法
1、先将蓋碗和茶具清洗幹淨，然後向蓋碗投入7g普洱茶（茶水比例為1:20），然後注入100℃沸水。2... 2023-06-30
生活過年必備的年貨
1、吃的的大緻可以分為：酒水、肉類、幹果、蔬菜等。一般來說，最費錢的就是酒水這一項了，這個要控制好。... 2023-06-30
生活怎麼減雙下巴
1、每晚潔面護膚後，揚起頭，用雙手的手背輪流依次有節奏的輕輕拍打下颌與頸部的銜接處。2、由頸部向下颌... 2023-06-30
生活尋找失物最靈方法
1、尋找失物的古歌訣其一、日見方位甲震乙離丙辛坤，丁乾戊坎己巽門，庚日失物兌上找，壬癸可在艮上尋。其... 2023-06-30
生活蛋糕怎麼保鮮
1、放進保鮮盒存放若是小蛋糕可以放入盒子裡，那種保鮮的盒子或者是密封盒子也是可以的，就不進行品牌推薦... 2023-06-30
生活秋燥吃什麼蔬菜
1、胡蘿蔔正值秋季，胡蘿蔔作為應季蔬菜作為首選，胡蘿蔔，性溫，富含豐富的胡蘿蔔素，維生素A，維生素B... 2023-06-30
生活如何清洗羽絨服污漬
1、在清洗羽絨服的過程中，可選擇使用軟毛刷，輕輕地刷洗髒的地方。清洗的時候，盡量避免或減少揉搓，以保... 2023-06-30
生活後期蛋鴨增重方法
1、用來喂鴨的新鮮豬血，應是無傳染疾病的健康豬身上的血，豬血要當天使用。用新鮮豬血喂鴨的方法是：将殺... 2023-06-30
生活寵物飼料屬于什麼垃圾
1、寵物飼料屬于濕垃圾。寵物飼料的成分通常為谷物極其加工食品或肉蛋極其加工食品，容易腐爛，屬于易腐的... 2023-06-30

tft每日頭條

> 生活

> 機器學習的實際問題

機器學習的實際問題

相关生活资讯推荐

热门生活资讯推荐

网友关注