摘要:人工智能和機器學習可謂火爆空前。自從AlphaGo完勝人類圍棋頂尖棋手後,人們關于人工智能的讨論就從未間斷過。 有人說,人工智能會使大批人失業,又有人說,人工智能會給人類帶來威脅。更多人期待的則是,人工智能可以幫助我們創造更多的價值。AI是一個非常廣義的概念。
關于機器學習最簡單的定義來自于Berkeley所表述的:機器學習是AI的一個分支,它探索了讓計算機根據經驗提高效率的方法。
為了更深刻的理解這一定義,接下來我們将對其進行拆分分析。
AI的分支:人工智能是一種能夠使得計算機及其系統能夠成功完成通常需要人類智能行為才能完成的任務的研究和開發。機器學習是訓練計算機完成上述任務的技術和過程,是其必不可少的一部分。
探索方法:現階段機器學習技術仍在不停地湧現,雖然一些用于訓練計算機的模型已經被識别和使用,但由于不同的業務問題需要不同的模型,在訓練計算機時也可以使用不同的模型,随着時間的推移将會開發出更多模型。
幫助計算機以提高其性能:大多數情況下,要讓計算機完成人工智能的任務,它需要借助于人工幫助去練習和适應。
機器學習如何運作?
讓我們來看看機器學習是如何運作的:
收集:機器學習取決于數據,第一步是确保按照你要解決的問題的要求擁有适合的數據。
清理:數據可以由不同的源生成,包含在不同的文件格式中,并以不同的語言表示。可能需要在數據集中添加或删除信息,因為某些實例可能缺少信息,而其他實例可能包含不需要的或無關的條目。它的準備工作将影響其可用性和結果的可靠性。
拆分:根據數據集的大小,可能隻需要一部分。從所選樣本中,應将數據分為兩組:一組用于訓練算法,另一組用于評估算法。
訓練:這個階段主要是為了找到準确完成所選目标的函數。根據所使用的模型類型,采用不同的訓練形式:如,在簡單的線性回歸模型中拟合一條線、生成随機森林算法的決策樹。為了更好地理解我們拿神經網絡來說,一般算法碰到數據集的一部分時,将會嘗試處理數據。測量其自身的性能并自動調整其參數(也稱為反向傳播),直到它能不斷産生期望的結果具有足夠的可靠性。直到它能不斷産生期望的結果,并具有足夠的可靠性。
評估:一旦算法在訓練數據上表現良好,它将再次使用沒有見過的數據進行測量。此過程允許你防止過度拟合,但這種情況僅發生在學習算法運行良好同時又與你的訓練數據相關的情況下。
優化:該模型針對目标應用程序内的集成進行了優化,以确保其效率。
是否有不同類型的機器學習?
在機器學習中可以使用許多不同的模型,但它們通常被分為三種不同的學習類型:監督、無監督和強化。根據要完成的任務,有些模型比其他模型更合适、性能更好。
監督學習:其特點是在訓練模型時明确标記每個數據點的正确結果,以便找它們之間的關系,确保在引入未分配的數據點時,可以正确的做出預測或分類。
如在對股票價格的研究中,分析數據點之間的關系,可以用回歸學習算法對下個數據點做出預測。
無監督學習:該類學習的特征是算法在訓練模型時期不對結果進行标記,而直接在數據點之間找有意義的關系,它的價值在于發現模式以及相關性。如,一個喜歡這瓶酒的人也喜歡這一個。
強化學習:這種類型的學習是有監督學習和無監督學習的結合。它通常用于解決更複雜的問題。在實踐中,該類學習類型可應用于控制機器人手臂、找到最有效的電機組合、機器人導航等領域。同時邏輯遊戲也很适合強化學習如撲克等。強化學習的其他應用在物流、日程安排和任務的戰略規劃中也很常見。
機器學習可以應用到哪裡?
企業需要考慮機器學習開發的三個階段及其應用。這三個階段是指:描述性階段,預測性階段和規範性階段。
描述性階段是指記錄和分析曆史數據增強商業智能。向管理者提供描述性信息,并更好地理解過去行動和決策的結果和後果。這個過程現在已成為全球大多數大型企業的常規工作。
應用機器學習的第二階段是預測。收集數據并使用它來預測特定結果可以提高反應性,使其更高效地做出決策。
最後一個規範性階段是最先進的機器學習階段,該階段已被應用與企業活動中,并且在新興企業的推動下不斷向前發展。在針對有效和高效的業務實踐時了解原因、動機和背景是最佳決策的先決條件,而隻預測行為或結果是不夠的。具體地說,當人和機器結合起來時,這個階段是可能的。機器學習用于找到有意義的關系并預測結果,而數據專家則充當翻譯者,以了解關系存在的原因。這樣,就可以更精确地作出決策。
此外,除了預測性洞察之外,感興趣的朋友還可以了解一下另一個機器學習應用程序:流程自動化。這裡是關于這兩個概念的介紹和對比。
以下是機器學習可以解決的問題的一些示例。
物流和生産:
lRethink Robotics使用機器學習來訓練機器人手臂并提高生産速度;
lJaybridge Robotics可實現工業級車輛自動化,以實現更高效的運營;
l Nanotronics自動化光學顯微鏡以改進檢查;
l Netflix和Amazon根據用戶需求優化資源分配;
l 其他例子包括:預測ERP/ERM需要;預測資産故障和維護,提高質量保證,提高生産線性能。
銷售和營銷:
l 6sense預測哪種鉛更容易被買,哪個時間更容易被買入;
l Salesforce Einstein幫助預測銷售機會并自動完成任務;
l Fusemachines通過AI助手自動完成銷售任務;
l AirPR提供了提高公關績效的洞察力;
l Retention Science建議跨渠道行動以推動參與;
l 其他示例包括:預測客戶的生命周期價值,提高客戶細分準确度,檢測客戶購物模式以及優化用戶的應用内體驗。
人力資源:
l Entelo幫助招聘人員識别和鑒定候選人;
l hiQ協助管理人員進行人才管理。
金融:
l Cerebellum Capital和Sentient利用機器學習驅動的軟件增強投資管理決策;
l Dataminr可以通過提供有關社交趨勢和突發新聞的早期警報來協助實時财務決策;
l 其他例子包括:檢測欺詐行為和預測股票價格。
衛生保健:
l Atomwise使用預測模型來減少藥物生産時間;
l Deep6 Analytics确定符合條件的患者進行臨床試驗;
l 其他例子包括:更準确地診斷疾病,改善個性化護理和評估健康風險。
你可以在Sam DeBrule彙集的精彩列表中找到更多機器學習和人工智能以及其他相關資源的示例。
阿裡雲雲栖社區組織翻譯。
文章原标題《Understanding Machine Learning》作者:Charles A.R
譯者:烏拉烏拉,審校:袁虎。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!