機器學習是一個大約在1960年創造的術語,由兩個詞組成:機器:與計算機,機器人或其他設備相對應,以及學習人類擅長的活動或事件模式。
那麼為什麼我們需要機器學習,為什麼我們希望機器學習人類擅長的活動或事件模式呢?事實上我們生活中有很多問題涉及龐大的數據集或複雜的計算,這個時候讓計算機來完成這樣的工作就很棒。而且,通常來說,計算機和機器人不會累,也不必睡覺,而且可能更便宜。還有一種新興的思想流派,稱為主動學習或人為循環,它主張将機器學習者和人類的努力結合起來。這個想法是,有一些日常的無聊任務更适合計算機,而有創造力的任務更适合人類。這一理念告訴我們,機器和人是能配合完成任務的。
機器學習不涉及傳統編程。傳統的編程中我們追求的是程序需要涵蓋了機器與人交互的所有可能情況。那你可能要問為什麼我們不許多軟件程序員并繼續編寫新規則呢?
原因之一是,随着時間的流逝,定義,維護和更新規則變得越來越昂貴。活動或事件的可能模式數量可能很多,因此用盡所有枚舉實際上并不可行。當涉及到動态,不斷變化或實時變化的事件時,這樣做更具挑戰性。開發學習規則或算法來命令計算機學習和提取模式,并從大量數據中弄清楚事物,這将變得更加容易和高效。
另一個原因是數據量呈指數增長。如今,文本,音頻,圖像和視頻數據泛濫成災。在物聯網時代萬物互聯,我們與日常設備互動的數據絕對是天量級别的。比如物聯網帶來的家用電器和自動駕駛汽車的數據。除了數量之外,由于存儲價格便宜,過去幾年中可用數據的質量一直在提高。這些推動了機器學習算法和數據驅動解決方案的發展。
馬雲(Jack Ma)在一次演講中解釋說,信息技術(IT)是過去20年的重點,現在,在接下來的30年裡,我們将進入數據技術(DT)時代。在IT時代,借助計算機軟件和基礎架構,公司變得越來越大,越來越強大。既然大多數行業的企業已經收集了大量數據,那麼現在正是利用數據技術來發掘洞察力,獲取模式并促進新業務增長的合适時機。廣義上講,機器學習技術使企業可以更好地了解客戶行為并與客戶互動,還可以優化運營管理。對于我們個人而言,機器學習技術已經使我們的生活每天都在改善。
我們都熟悉的機器學習應用是垃圾郵件過濾。另一個是在線廣告,即根據廣告商收集的有關我們的信息自動投放廣告。還有一個機器學習應用是搜索引擎。搜索引擎涉及信息檢索(解析我們要查找的内容并查詢相關記錄),以及上下文排名和個性化排名,這些主題按主題相關性和用戶喜好對頁面進行排序都涉及到機器學習。
在1997年,深藍超級計算機擊敗了世界象棋冠軍。2005年,一輛斯坦福自動駕駛汽車在沙漠中自行行駛了130多公裡。在2007年,另一支車隊的汽車行駛了50多公裡。2011年,Watson計算機赢得了針對人類對手的測驗。2016年,AlphaGo計劃擊敗了世界上最好的圍棋選手之一。
在現在,在将來機器學習大有可為!
模仿人類智能的機器學習是人工智能的一個子領域,這屬于創建系統有關的計算機科學領域。機器學習還與線性代數,概率論,統計和數學優化密切相關。我們通常基于統計,概率論和線性代數建立機器學習模型,然後使用數學優化來優化模型。
機器學習系統需要接收輸入數據,可以是數字,文本,視覺或視聽。系統通常具有輸出-這可以是浮點數,例如自動駕駛汽車的加速度,可以是代表類别(也稱為class)的整數,例如圖像中的貓或老虎的類别。
機器學習的主要任務是探索和構建可從曆史數據中學習并根據新輸入數據做出預測的算法。對于數據驅動的解決方案,我們需要定義一個評估函數,稱為損失或成本函數,來評估模型的學習情況。
根據學習數據的性質,機器學習任務可以大緻分為三類:
是不是有點弄不太明白,有點被抽象概念弄糊塗了?沒關系,我自己也是小白。之後的文章中我将努力給大家用具體的例子解釋機器學習,比如,垃圾郵件檢測與樸素貝葉斯、通過與Logistic回歸預測,股票價格預測與回歸算法等等。
還是要加一句:發表這些東西的主要目的就是督促自己,希望大家關注評論指出不足,一起進步。内容我都會寫的很細,并且按照文章中的代碼自己也可以做出一樣的結果,一個目的就是零基礎也能懂,因為自己就是什麼基礎沒有從零學Python的。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!