選自 Nextplatform
參與:王宇欣、黃小天
在過去的十年,企業已經開始使用機器學習(ML)收集和分析大量數據以獲得競争優勢。現在有一些人試圖走的更遠 — 使用稱為機器學習分支的深度學習(DL)技術。他們正在尋求探索隐藏在數據中更深奧的特性來為欺詐檢測、需求預測、點擊預測和其他數據密集型分析創建預測應用程序。
使用深度學習(DL)技術開發的計算機視覺、語音識别、自然語言處理和音頻識别應用需要大規模的計算能力來處理大量數據。為了獲得企業正在尋找的深度學習(DL)技術解決方法,需要在企業的層面上部署和管理底層的 IT 基礎設施。為了讓機構能夠更快更容易地從大量複雜的數據中獲得可行見解,新解決方案正在被研發。
如例子所示,其中最頂行明顯是孩子的圖像。對于計算機來說,包含在自行車上的,在沙灘上的孩子,或者是側向翻轉的位圖是完全不同的數據集。教計算機去區分它們是非常困難的一件事情。在某些情況下,這些圖片的差異關乎生死。比如,最底部包含着道路交通的标志。自主駕駛的汽車因為被雪覆蓋而不能辨認出道路标志是不可接受的。一個普通的駕駛員因為其八邊形的形狀可以辨認出它,那麼計算機應該也可以做到。
機器學習不僅讓企業從越來越龐大和多樣化的數據集中發現模式和趨勢,還能夠讓傳統上由人類完成的分析自動化,從商業相關的互動中學習并且提供基于證據的回應。它同樣提供了可能成功的建議行為的置信水平。它使企業提供新的差異化和個性化的産品和服務,以及提升現有産品和服務的影響力并且/或者降低其成本。然而,機器學習是一種非精确計算,因為其沒有确定性的建模特征的方法。特征通常需要被建模為神經網絡并且參數取決于輸入數據集的質量。
深度學習作為機器學習的一個分支,是一種模拟人腦的動态系統,尤其是神經元如何在大腦中相互作用,以及大腦中的不同層是如何協作的。與機器學習不同,在深度學習中,特征被建模為一個深度學習神經網絡與一些内部/隐藏層,其捕獲數據的微妙信息并且分配其物理意義。深度學習能夠将數字圖像分割稱為更易于分析的片段;這意味着可以提取高級信息并對其編碼以供計算機使用。
例如,對于人類,臉部有眼睛。對于計算機,臉部有着明暗的像素,構成了一些類型的抽象的線條。深度學習模型的每一層都會讓計算機識别同一對象的另一級别的抽象。使用較早的動物類比,深度學習會使用戶區分那些躺着地上的貓與那些跳躍的貓的圖片。
深度學習在過去幾年中取得了較大進步。例如,下圖展示了作為 ImageNet 大規模視覺識别挑戰(ILSCRC)的一部分的圖像識别研究的準确率,該技術評估了大規模的物體檢測和圖像分類的算法。這項研究為了使研究員可以比較更廣範圍的物體的檢測進步,并評估計算機視覺的大規模圖像索引檢測和注釋的進展。
圖中藍色部分顯示了在 2010 和 2011 年的可用的傳統計算機視覺方法,紫色顯示了最近使用的深度學習技術。紅色顯示了人的準确率,這是通過要求個體和小組來描述和分類圖像測量的。小組中的人被允許考慮所示的圖像并得出共同的答案。一個人立即注意到一個穩妥的改進方法。在 2015 年,使用深度學習技術的計算機已經變得和人一樣高效。
百度研究的深度語音項目(Deep Speech project)最近使用單一、深度循環神經網絡在英語和普通話的語音識别中實現了人類水平的準确性。這個結果表明深度學習在計算機視覺之外的領域也是可用的。
另一個有趣的例子是 Google DeepMind在 AlphaGo (一個被開發的圍棋計算機程序)中使用了深度學習技術。AlphaGo 的算法基于先前通過廣泛訓練的人工神經網絡(從人類和計算機遊戲)“學習”到的知識來采取其移動。在 2015 年,它成為了第一個在全尺寸的棋盤上無障礙地打敗專業人類圍棋選手的計算機圍棋程序。
人們對深度學習技術愈發感興趣的最後一個例子是 DeepMind 和 Blizzard 之間的合作,他們正在開發星際争霸 II (StarCraft II)。使用世界上最受歡迎的電腦遊戲,該項目正被開發為一個研究社區并對世界上的人工智能和機器學習的研究者們開放。
機器學習帶來的巨大計算挑戰
機器學習和深度學習技術的這些示例令人印象深刻,但是它們卻帶來了繁重的計算任務。對于深度學習的訓練通常需要幾十個五十億的浮點運算(FLOPs),這在小集群上需要轉換為幾周或者幾個月的時間。在迅速變換的環境中,許多,即使不是大多數,組織不能等待如此長的時間來提取智能。
深度學習軟件模塊如果使用開源存儲庫可以花費企業幾天的時間來下載和安裝。找到給定深度學習模塊或庫的所有依賴項會花費更長的時間。由于這些工具仍然是新的,許多這些依賴項仍然需要用戶确保特定庫的特定版本可用。一旦尋找到,用戶可能需要耗時地對所有庫和依賴項進行手動安裝。在某些情況下,它們必須滿足 60 多個依賴項。許多庫并不能從标準企業
Linux 發行版的開源存儲庫安裝,這意味着用戶需要尋找并手動安裝它們,以保證它們使用可以一起工作的版本。
用戶沒有從具有出色标稱性能特征但缺乏優化庫的新硬件中獲益,因為這将花費幾個月或者幾年的時間來創建這些庫。特别地,深度學習需要有效的 C 到 BLAS、FFTs、卷積、 malloc 和 memcopy 的接口。英偉達(NVIDIA )提供了這些需要的到 cuBLAS 和 cuFFT 的接口,但這樣的優化庫從其他密集的硬件平台丢失了。通常,需要幾年的時間才能在新的架構上優化這些庫。
對于那些尋找可用機器學習軟件包概述的人,Knowm 公司的過剩的機器學習工具提供了超過 40 個機器學習軟件包和庫的詳細比較。
為深度學習搭建一個框架
新的工具和框架正在出現,這使得深度學習更加容易。組織必須選擇在軟硬件、網絡、工具和庫方面的正确的組合以有效地開發和運行應用程序。
業務的第一個流程是簡化深度學習環境的部署、管理、操作和擴展。企業必須首先啟用分析師和開發人員。深度學習工具并不能獨立工作。為了更有效率,公司需要向開發人員和分析師提供正确的工具和支持軟硬件的框架的集合,而不必将其轉變為 IT 管理人員。
雖然人工智能和機器學習已經伴随了我們幾十年,深度學習仍然是一個新的領域,并在不斷變化。公司需要靈活地采用新的工具和做法,并以輕快的方式快速響應市場的需求。
現代深度學習環境
為了響應這些需求,Bright Computing 開發了它的 Bright for Deep Learning 解決方案,在 Bright Cluster Manager 7.3 版本可用。新的方法提供了機器學習框架的選擇,以簡化包括 Caffe、Torch、TensorFlow、Theano 和 CNTK在内的深度學習項目。它包括幾個最受歡迎的機器學習庫,以幫助訪問數據集,數據集包括 MLPython、cuDNN (NVIDIA CUDA Deep Neural Network library )、DIGITS (Deep Learning GPU Training System) 和 CaffeOnSpark(在大數據集群上的開源的分布式深度學習解決方案)。
為深度學習處理大量數據需要大量的計算能力。随着專為深度學習設計的新工具變得可用,開發人員正在使用它們并利用加速器(比如 NVIDIA GPUs)在高級高性能(HPC)的集群上搭建他們的應用。
GPUs 使得機器學習中所需的計算密集型程序的計算速度比僅适用 CPU 的解決方案快得多。The Bright for Deep Learning 解決方案提供了 GPU 加速版本的通用機器學習庫以便更輕松地布置和管理硬件以及相關軟件、APIs 和機器學習庫。這意味着研究員和開發者隻需要專注于他們的工作——而不是管理工具。
這也意味着用戶不必擔心查找、配置和部署運行這些深度學習庫和框架所需的所有依賴項,包括超過 400 MB 的支持機器學習軟件包的 Python 模塊,以及 英偉達(NVIDIA)硬件驅動、CUDA(平行計算平台 API)驅動程序、CUB(CUDA 構建塊)和 NCCL (标準集體通信程序庫)。在未來會增加更多,比如 CNTK、Bidmach、Keras、MXNet 和其他。
如果用戶需要更多的容量,他們可以使用深度學習功能将支持 GPU 的實例擴展到使用 Bright 的雲爆發功能的雲中。他們還可以輕松地集成深度學習應用程序,或者在私有 OpenStack 雲中運行它們。用戶甚至可以通過使用 CaffeOnSpark 運行深度學習應用程序來利用現代集群提供的性能。
企業将最先進的 HPC 集群與深度學習相結合
各種企業已經使用該解決方案将最先進的 HPC 集群和深度學習相結合。例如,斯坦福大學正在緻力于計算機視覺、自然語言處理和信用卡詐騙檢測研究。喬治梅森大學正在對科學模拟數據進行分析。
Illumina 開發了用于生命科學研究、翻譯和消費者基因組學以及分子診斷的測序和陣列技術,其正在進行基因預測研究以鑒定可以編碼某些功能的基因組部分。三星正在緻力于将 Caffe 深度學習網絡應用于醫療保健應用的計算機視覺工作。RICOH 正在研究圖像識别的深度學習技術,紐約大學(NYU)多媒體中心正在測試 HPC 集群的深度學習任務。
深度學習與傳統的 HPC 工作負載一緻(如大型密集線性代數問題)。然而,目前最快的深度學習集群和最快的超級計算機之間存在巨大的差距。雖然仍然有許多挑戰,但是有很大的機會來進一步推進深度學習的性能并可以使用更大的數據集。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!