亞信安全報告?如果說人們對人工智能的到來可能會對人類本身造成威脅的擔憂還為時尚早,其實用人工智能、機器學習去解決網絡、信息安全問題已經成為現實自去年以來,機器學習的概念已經逐漸被網絡安全行業接受,越來越多的安全廠商推出基于AI的安全解決方案,甚至有多個初創安全公司将機器學習、人工智能作為自己的殺手锏在國内,亞信安全是進行人工智能、機器學習用于安全方案研究最為積極的那一個,從近日召開的“C3安全峰會”将主題定為“智進路禦遠”可見一斑,我來為大家科普一下關于亞信安全報告?以下内容希望對你有幫助!
如果說人們對人工智能的到來可能會對人類本身造成威脅的擔憂還為時尚早,其實用人工智能、機器學習去解決網絡、信息安全問題已經成為現實。自去年以來,機器學習的概念已經逐漸被網絡安全行業接受,越來越多的安全廠商推出基于AI的安全解決方案,甚至有多個初創安全公司将機器學習、人工智能作為自己的殺手锏。在國内,亞信安全是進行人工智能、機器學習用于安全方案研究最為積極的那一個,從近日召開的“C3安全峰會”将主題定為“智進路禦遠”可見一斑。
其實關于将人工智能用于網絡安全方面一直有争議,悲觀的人認為因為機器學習是尋找相似性,沒有足夠多的惡意訪問、攻擊的樣本,以緻無從訓練,并且安全防護往往也分行業場景,機器學習難以區分應對。激進的人則認為,現在利用人工智能、機器學習是時候擺脫創建于上世紀90年代基于簽名和哈希算法的陳舊方法了。
作為國内重量級的安全廠商,亞信安全對人工智能的态度更為溫和,在亞信安全通用安全産品中心總經理、亞信網絡安全産業技術研究院副院長童甯看來,“人工智能、機器學習毫無疑問在驅動網絡安全發展。”但亞信安全不會放棄基于特征碼比對的一代技術和基于行為分析的二代技術,它們的結合對于處置安全風險更為有效。
用機器學習解決安全問題的正确姿勢
其實談到機器學習,首先接觸的就是它的兩個主流學習方法:一是有監督學習,二是無監督學習。
有監督學習通過已有的訓練樣本(即已知數據以及其對應的輸出)來訓練,從而得到一個最優模型,再利用這個模型将所有新的數據樣本映射為相應的輸出結果,對輸出結果進行簡單的判斷從而實現分類的目的。無監督學習從無标記的訓練數據中推斷結論,最典型的無監督學習就是聚類分析,它可以在探索性數據分析階段用于發現隐藏的模式或者對數據進行分組。無監督學習可以監控到一些異常的行為,還可以運用于關聯分析領域。
機器學習技術用于安全的成功關鍵是什麼?童甯總結到,一是持續性高質量的安全數據,因為網絡環境一直在變化,所以機器要跟人一樣,“活到老,學到老”,保證它的學習能力。二是要有網絡安全領域的專家,機器要抽取哪些特征進行學習,完全由網絡安全專家判斷。三是要有機器學習的數據專家,包括模型、算法的建立等。
機器學習的安全應用
你也許有疑問機器學習的安全應用到底是怎樣的?首先以有監督學習的角度來說,有必要先回顧下我們過去是如何識别威脅的?過去基于特征的威脅識别技術發展經曆了三個階段:
路一維特征,黑白名單(文件,IP,域名等)
路二維特征,字符串的匹配或者其他應用于匹配的正則表達式(IPS,DLP)
路多維特征,組合多種特征含行為特征判定疑似對象(APT沙盒分析,網絡行為監控)
當然,越多維特征進行威脅識别意味着越準确,但是它卻是特别耗資源的一件事,開銷太大、效率低下。
亞信安全通用安全産品中心總經理、亞信網絡安全産業技術研究院副院長童甯
在有監督學習的應用裡,它是一個高效的多維度的特征發現。童甯介紹了有監督學習的應用過程:首先是數據的準備;第二是進行特征的抽取,安全專家找出與威脅最相關的特征,數據專家通過數學的方法學習出體現家族性的特征組合,不同特征對家族性體現的權重不一樣;第三是算法的選擇,安全領域主要是采用分類算法;第四在廠商的網絡進行學習;第五通過不斷的學習優化算法産生N維特征組合模型;最後應用于客戶的實際防禦系統。
有監督學習帶來了多維度的識别能力,速度效率也得到大幅度提升。雖如此但同樣面臨挑戰:一是模型的新鮮度,因為威脅進化非常迅速,所以要保證訓練數據的更新能力。二是分類識别的精度和誤判管理,主要包括兩個指标,正确率(Precision)與召回率(Recall)。
正确率和召回率是很多所謂的人工智能安全廠商不敢正面去談的話題,正确率指的是抓了多少是正确的,召回率指的是漏掉了多少沒有抓住。用童甯的話說,假設總共有100個文件,其中有10個惡意文件。如果人工智能從中找到5個,并且全部正确,那麼正确率是100%,召回率是50%。如果人工智能從中找到 20個,包含其中10個惡意文件,那麼正确率是50%,召回率是100%。也許有的廠商說我的AI安全正确率是100%,這話沒有錯,但确是片面的。
童甯坦言,亞信安全在實踐有監督學習時,實際上一直在平衡正确率和召回率,總有一定的錯誤率,想要前後都做到100%目前是不可能的,現在做的是如何控制在可控的範圍内。
再來看無監督學習的應用,以往基于特征的威脅治理無法滿足安全的需要、傳統通過建立行為基線的異常發現技術誤報太多、客戶對發現Unknown的未知威脅行為的需求大增。無監督學習大部分來自客戶環境的數據,特征的抽取針對的是客戶環境中的網絡流量、業務流量和審計流量,算法基本采用聚類算法及關聯分析算法,在客戶的網絡進行學習,模型通常設計為聚焦的簡單模型避免過多誤判,最終通過不斷的學習優化算法産生各種基線聚類,從而定義正常行為、發現異常行為。
無監督學習通常用于反欺詐、異常發現、攻擊發現、行為分析(UBA)等。但同樣面臨挑戰,例如如何讓用于建模學習的數據不受幹擾、避免投毒攻擊;在客戶環境中進行建模學習,一般要學習幾個星期甚至幾個月,廠商投入成本相對較高;客戶無能力持續繼續運維,模型更新緩慢。
所以,用戶面對機器學習安全技術的反應也不一,有的拒絕、有的相信、有的謹慎。
亞信安全在機器學習上的實踐
據介紹,亞信安全基于AI的安全引擎在數據、特征識别、算法、模型等層面均有深厚積累,在亞信安全防毒牆網絡版OfficeScan 12中使用了跨代整合技術,實現了AI-機器學習技術和其它防護技術融合創新。
童甯指出,在有監督學習方面,亞信安全利用其進行惡意程序及勒索病毒的防治,以及進行防治垃圾郵件等進行了實踐探索。無監督學習方面,亞信安全對UBA、态勢感知、以及反欺詐(信勢和信盾)等産品進行了機器學習的應用。
當然,作為一家在安全領域有多年技術積累的安全廠商,亞信安全并不會依賴于人工智能、機器學習,而是博采衆長,将基于特征碼比對的第一代技術、基于行為分析的第二代技術和基于機器學習的第三代技術進行融合創新,保證用戶高效的安全服務。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!