李根 發自 凹非寺
量子位 報道 | 公衆号 QbitAI
如果你是數據工作者,到底對此是愛是恨?
因為這個名為RAPIDS的開源GPU加速平台出現,固有的數據工作,看起來将迎來變革。
有人歡迎,可能也有人讨厭。
其中,該平台的“始作俑者”黃教主認為會遭恨。因為以前大家都想當數據科學家,由于數據科學家不是在喝咖啡,就是在喝咖啡的路上——畢竟光數據加載的過程就非常漫長。
但認為大家會愛的,也是黃仁勳。看看他一臉燦爛的笑容,就知道他為這項新發布多麼得意。
50倍加速 這個新平台,要從10月10日的GTC歐洲大會說起。
會上,黃教主針對數據工作曉之以情、動之以理、斥之以大義後,正式發布針新的GPU加速平台:RAPIDS。
譯成中文,有“急流”之意,可能也是為顯示數據相關工作從此變天。
如何理解這個新的GPU加速平台?
英偉達給的三組關鍵詞:數據科學機器學習、軟件平台,以及開源。
而且很明确,RAPIDS的誕生,就是希望幫助企業以“前所未有”的速度分析海量數據并進行精準的業務預測。
有多“前所未有”?英偉達給出的答案是50倍。
拿來對比的,仍然是CPU。
英偉達稱,最初的RAPIDS基準分析利用了XGBoost機器學習算法在NVIDIA DGX-2TM系統上進行訓練,結果表明,與僅有CPU的系統相比,其速度能加快50倍。
所以這能夠幫助數據科學家将典型訓練時間從數天減少到數小時,或者從數小時減少到數分鐘——具體取決于其數據集的規模。
并且RAPIDS不是光比不用,發布之前,就已經經過一些企業真槍實彈檢驗。
比如沃爾瑪。其CTO Jeremy King就表示,GPU加速平台及RAPIDS軟件極大改進了沃爾瑪使用數據的方式,可以實現複雜模式大規模地運行,同時進行更加精準的預測。
此外,惠普、甲骨文、SAP、Cisco等一衆數據大戶,也紛紛點了贊。
但英偉達強調,這不是私人定制式的服務。
開源 因為RAPIDS,可以說從開源社區中來,到開源社區中去。
黃仁勳演講中介紹,RAPIDS構建于Apache Arrow、pandas和 scikit-learn等流行的開源項目之上,為最流行的Python數據科學工具鍊帶去GPU提速。
為了将更多的機器學習庫和功能引入RAPIDS, NVIDIA 廣泛地與開源生态系統貢獻者展開合作 ,其中包括 Anaconda、BlazingDB、 Databricks、Quansight、scikit-learn、Ursa Labs 負責人兼Apache Arrow締造者Wes McKinney,以及迅速增長的Python數據科學庫pandas等等。
此外,為了推動RAPIDS的廣泛應用,英偉達也努力将RAPIDS與Apache Spark進行整合,後者是分析及數據科學方面領先的開源框架。
所以現在,全套RAPIDS開源庫,前往 http://www.rapids.ai 就能獲得,且代碼經 Apache 許可公布。容器化RAPIDS版本,也能在NVIDIA GPU Cloud container registry 上獲取。
如果你是數據科學家,如果你希望數據準備和訓練加速,當前GPU給出了新選擇。
英偉達新蛋糕 或許你也會問Why?英偉達這一步的目的何在?
那就會得到“曆史進程”的回答。
英偉達方面說,數據分析和機器學習是高性能計算市場中最大的細分市場,不過目前尚未實現加速,在圖形圖像領域的版圖構建完整後,GPU不入數據誰入數據?
而且之前在解決深度學習算力的過程中,大數據和機器學習方面的呼聲,也在一日高過一日。
更何況,英偉達自己也承認,這會是一個利益巨大的細分市場。
他們援引分析預估,稱面向數據科學和機器學習的服務器市場每年價值約為200億美元,加上科 學分析和深度學習市場,高性能計算市場總價值大約為360億美元。
又有誰能拒絕這樣的大蛋糕誘惑?
而且按照英偉達的方式,越是把軟件平台打磨好開源,吸引的用戶越多,GPU的需求量也就會越多,英偉達賺得也會越多——進一步創新的資本和動力也會更強。
AI時代裡站着把錢掙了,英偉達外,還有誰?
最後,再次送上傳送門:
全套RAPIDS開源庫:
http://www.rapids.ai
— 完 —
活動策劃招聘
量子位正在招聘活動策劃,将負責不同領域維度的線上線下相關活動策劃、執行。歡迎聰明靠譜的小夥伴加入,并希望你能有一些活動策劃或運營的相關經驗。相關細節,請在量子位公衆号(QbitAI)對話界面,回複“招聘”兩個字。
量子位 QbitAI · 頭條号簽約作者
վ'ᴗ' ի 追蹤AI技術和産品新動态
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!