tft每日頭條

 > 生活

 > 什麼是機器學習簡介

什麼是機器學習簡介

生活 更新时间:2024-10-01 20:17:14

機器學習是一個大約在1960年創造的術語,由兩個詞組成:機器:與計算機,機器人或其他設備相對應,以及學習人類擅長的活動或事件模式。

那麼為什麼我們需要機器學習,為什麼我們希望機器學習人類擅長的活動或事件模式呢?事實上我們生活中有很多問題涉及龐大的數據集或複雜的計算,這個時候讓計算機來完成這樣的工作就很棒。而且,通常來說,計算機和機器人不會累,也不必睡覺,而且可能更便宜。還有一種新興的思想流派,稱為主動學習或人為循環,它主張将機器學習者和人類的努力結合起來。這個想法是,有一些日常的無聊任務更适合計算機,而有創造力的任務更适合人類。這一理念告訴我們,機器和人是能配合完成任務的。

機器學習不涉及傳統編程。傳統的編程中我們追求的是程序需要涵蓋了機器與人交互的所有可能情況。那你可能要問為什麼我們不許多軟件程序員并繼續編寫新規則呢?

原因之一是,随着時間的流逝,定義,維護和更新規則變得越來越昂貴。活動或事件的可能模式數量可能很多,因此用盡所有枚舉實際上并不可行。當涉及到動态,不斷變化或實時變化的事件時,這樣做更具挑戰性。開發學習規則或算法來命令計算機學習和提取模式,并從大量數據中弄清楚事物,這将變得更加容易和高效。

另一個原因是數據量呈指數增長。如今,文本,音頻,圖像和視頻數據泛濫成災。在物聯網時代萬物互聯我們與日常設備互動的數據絕對是天量級别的。比如物聯網帶來的家用電器和自動駕駛汽車的數據。除了數量之外,由于存儲價格便宜,過去幾年中可用數據的質量一直在提高。這些推動了機器學習算法和數據驅動解決方案的發展。

馬雲(Jack Ma)在一次演講中解釋說,信息技術IT)是過去20年的重點,現在,在接下來的30年裡,我們将進入數據技術DT)時代。在IT時代,借助計算機軟件和基礎架構,公司變得越來越大,越來越強大。既然大多數行業的企業已經收集了大量數據,那麼現在正是利用數據技術來發掘洞察力,獲取模式并促進新業務增長的合适時機。廣義上講,機器學習技術使企業可以更好地了解客戶行為并與客戶互動,還可以優化運營管理。對于我們個人而言,機器學習技術已經使我們的生活每天都在改善。

我們都熟悉的機器學習應用是垃圾郵件過濾。另一個是在線廣告,即根據廣告商收集的有關我們的信息自動投放廣告。還有一個機器學習應用是搜索引擎。搜索引擎涉及信息檢索(解析我們要查找的内容并查詢相關記錄),以及上下文排名和個性化排名,這些主題按主題相關性和用戶喜好對頁面進行排序都涉及到機器學習。

在1997年,深藍超級計算機擊敗了世界象棋冠軍。2005年,一輛斯坦福自動駕駛汽車在沙漠中自行行駛了130多公裡。在2007年,另一支車隊的汽車行駛了50多公裡。2011年,Watson計算機赢得了針對人類對手的測驗。2016年,AlphaGo計劃擊敗了世界上最好的圍棋選手之一。

在現在,在将來機器學習大有可為!

什麼是機器學習簡介(什麼是機器學習)1

機器學習的高級概述

模仿人類智能的機器學習是人工智能的一個子領域,這屬于創建系統有關的計算機科學領域。機器學習還與線性代數,概率論,統計和數學優化密切相關。我們通常基于統計,概率論和線性代數建立機器學習模型,然後使用數學優化來優化模型。

機器學習系統需要接收輸入數據,可以是數字,文本,視覺或視聽。系統通常具有輸出-這可以是浮點數,例如自動駕駛汽車的加速度,可以是代表類别(也稱為class)的整數,例如圖像中的貓或老虎的類别。

機器學習的主要任務是探索和構建可從曆史數據中學習并根據新輸入數據做出預測的算法。對于數據驅動的解決方案,我們需要定義一個評估函數,稱為損失成本函數,來評估模型的學習情況。

根據學習數據的性質,機器學習任務可以大緻分為三類:

  • 無監督學習:當學習數據僅包含指示性信号而沒有附加任何描述(也叫标簽或标記)時,全靠我們自己發現隐藏的信息或确定如何描述數據。這種學習數據稱為未标記數據。無監督學習可用于檢測異常情況,例如欺詐或有缺陷的設備,或将具有類似在線行為的客戶分組以進行營銷活動。
  • 有監督的學習:當學習數據帶有指示性信号,描述,目标或期望的輸出時,學習目标就變成了尋找将輸入映射到輸出的通用規則。這種學習數據稱為标記數據。然後,我們會将學習到的規則用于标記具有未知輸出的新數據。這個标簽通常由事件記錄系統和專家提供。此外,如果可行,它們也可以由公衆通過衆包等方式制作。監督學習通常用于日常應用中,例如面部和語音識别,産品或電影推薦以及銷售預測。
  • 我們可以将監督學習進一步細分為回歸分類。回歸訓練并預測連續值的響應,例如預測房價,而分類則嘗試找到合适的類别标簽,例如分析積極/消極情緒和預測貸款違約。
  • 如果不是所有學習樣本都被标記,隻有一些被标記,就是半監督學習。除了少量标記外,它還利用未标記的數據(通常為大量)進行訓練。半監督學習适用于以下情況:獲取完全标記的數據集比較昂貴,而标記一小部分子集則更實用更容易。例如,通常我們獲取未标記的遙感圖像數據相對容易,然後我們需要熟練的專家來标記高光譜遙感圖像,并進行大量的現場實驗以發現油氣資源。
  • 強化學習:學習數據提供反饋,以便系統适應動态條件以實現特定目标。系統根據反饋響應評估其性能,并做出相應的反應。最著名的例子包括自動駕駛汽車和國際象棋大師AlphaGo。
  • 是不是有點弄不太明白,有點被抽象概念弄糊塗了?沒關系,我自己也是小白。之後的文章中我将努力給大家用具體的例子解釋機器學習,比如,垃圾郵件檢測與樸素貝葉斯、通過與Logistic回歸預測,股票價格預測與回歸算法等等。


    還是要加一句:發表這些東西的主要目的就是督促自己,希望大家關注評論指出不足,一起進步。内容我都會寫的很細,并且按照文章中的代碼自己也可以做出一樣的結果,一個目的就是零基礎也能懂,因為自己就是什麼基礎沒有從零學Python的。

    ,

    更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

    查看全部

    相关生活资讯推荐

    热门生活资讯推荐

    网友关注

    Copyright 2023-2024 - www.tftnews.com All Rights Reserved