tft每日頭條

 > 生活

 > 開源ai技術圖譜

開源ai技術圖譜

生活 更新时间:2024-11-09 23:36:04

AI 生命科學發展曆史中,AlphaFlod2解決了困擾生物學界長達50年的蛋白質空間結構預測難題,成為AI 生命科學領域裡程碑事件。

在全球AI 生命科學技術快速發展背景下,全球已披露超過 30 款 AI 技術參與研發的藥物進入臨床試驗階段,資本市場上也受到認可,全球已有 10 多家公司成功上市。

未來,AI 生命科學還有哪些其他的想象空間?在由創新工場和清華大學智能産業研究院聯合主辦的DeeCamp人工智能訓練營中,來自AI與生命科學跨學科領域的多位高校學員給出了自己的答案。

在剛剛過去火熱的2個月中,來自清華大學、北京大學、南洋理工大學、複旦大學、中科院計算所、香港中文大學等全球各個地區頂尖高校的計算機、生命科學等專業的150多位學員自發組成30支隊伍,多所頂尖高校的30支參賽隊伍,聚焦用AI探索生命科學新邊界這一主題。

最終入圍辯論賽的6支隊伍,嘗試基于人工智能技術解決生命科學領域的PROTAC藥物研發、大規模蛋白質組學信息發現、藥物分子發現、全基因組表達預測、蛋白質相分離能力預測、蛋白結構預測酶活性等問題,最終挑戰大規模蛋白質組學信息發現賽題的ProteinMiner團隊摘得DeeCamp2022總冠軍的榮譽。

在本次大賽中,多支參賽團隊關注的問題也是産業關注的熱點,來自學生的全新視角和多位資深産業人士的碰撞,能夠碰撞出哪些新思路?

開源ai技術圖譜(DeeCamp2022結營AI如何挑戰生命科學關鍵難點)1

DeeCamp學員探索生命科學未解難題

DeeCamp人工智能訓練營是創新工場發起的一項面向全球大學生的公益項目,專注培養應用型AI人才,迄今已經舉辦六屆。

今年DeeCamp将AI應用聚焦于生命科學領域,當下這一時期也正是AI 生命科學從早期的技術積累逐漸過渡到價值驗證階段。

過去,制藥行業到目前依然是效率最低的行業之一,也是信息技術難以颠覆的行業,但AI技術對生物技術的改革依然勢不可擋。AI已經開始滲透到藥物研發的各個環節,包括虛拟篩選、分子生成、靶點發現、ADMET預測、藥物重定向、化合物合成等藥物發現階段。

有很多專家認為,AI将構建醫療行業的全新革命。DeeCamp的參賽學員們則為這場全新革命帶來了新想象。

其中,獲得總冠軍的ProteinMiner挑戰蛋白質組學信息發現。

蛋白質測序是人類理解生命活動,并對之進行調控的最重要的環節之一,雖然基因測序已經日漸成熟,但蛋白測序還缺乏高通量的測序技術。與此同時,傳統分析方法依賴已有蛋白質序列數據庫信息,無法分析全新的蛋白質或者抗體,蛋白質從頭測序的需求應運而生。

ProteinMiner立足于AI與大數據驅動的蛋白質的質譜測序技術,緻力于提升大規模地發現未知的蛋白序列與結構信息的能力。ProteinMiner提出預訓練的AI譜圖語言大模型,提升質譜從頭測序的精度,加速免疫相關的新抗原/抗體的發現,以推動個性化免疫治療的進程。此外,ProteinMiner提出譜圖分類深度模型,實現快速的交聯質譜數據的鑒定,構建實驗數據支撐的組學規模的蛋白質空間距離信息數據庫。

開源ai技術圖譜(DeeCamp2022結營AI如何挑戰生命科學關鍵難點)2

對于産業界未能解決的難題,DeeCamp的學員們通過AI技術探索突破口;在另一個維度上,DeeCamp學員們也創想通過AI為現有的解決方案降本增效。

以鎂伽科技為産業導師的InfGene團隊為例,InfGene探索基于代表性基因集的全基因組表達預測技術,這支由海内外高校成員組成的複合團隊通過算法計算減少必須的基因組檢測次數使用。

這一技術旨在減少超高通量測量的成本。全基因組表達譜的數據需要測量人類20000多個基因的轉錄表達水平,超高通量的檢測造成較高的成本。事實上,人類基因表達之間存在高度的關聯,不同基因的表達水平之間存在相互推算的可能。

在這一理論基礎上,美國國立衛生研究院(NIH)啟動了LINCS計劃,推出了低成本轉錄組檢測技術L1000。

L1000技術就利用了基因表達之間的相關性,基于大規模的統計分析辨識出978個基因作為全基因組的标志基因(landmark genes),通過測量标志基因的表達量,可以推算出其餘20 000多個基因的表達量。

InfGene團隊發現分形自編碼器(FAE)可以選取相比 L1000 Panel 更加精簡的代表性基因集作為特征,在XGBoost模型上達到比L1000 Panel更優的全基因組表達預測表現。該方法有望進一步節約大規模測量成本,形成可專利的新Panel,并拓展應用至建立組織特異性Panel,推動精準醫療。

開源ai技術圖譜(DeeCamp2022結營AI如何挑戰生命科學關鍵難點)3

對于未來,來自這些學員的探索在産業探索中有多大的作用?

鎂伽科技生物計算平台總監吳瓊博士表示:“本次大賽,我們收獲了很多創意和啟發。InfGene團隊的成員擁有生物學和計算機科學交叉背景。短短一個月内,他們大膽探索了多種基因集選取方法,比較了深度學習與傳統的數據處理算法,并成功從中篩選出了一個最優方案。雖然成果有待實際應用中進一步驗證,但在大規模藥物篩選的應用背景下,具有潛在商業轉化價值和可專利性,同時在未來還可以拓展到更多有價值的科學問題中,如疾病核心調控基因的發現,跨組學模态的表達預測等,為企業和科研機構提供方法參考。”

交叉創新成為産學研融合新範式

在AI 生命科學領域,阻礙行業高速發展的一大瓶頸就是複合型人才培養難度大,複合型人才培養困難。

DeeCamp在2017年由創新工場發起,從最初小規模的實驗性訓練營,到今天每年培訓幾百名來自高校的AI 人才,旨在為學生提供技術學習、工程實踐、産品轉化和商業思考的完整過程,推進産學研深度結合。

六年來,DeeCamp為中國AI應用型人才的培養搭建了一塊試驗田,來自産業、資本、頂級專家的授課為學員的創意提供豐厚的生長營養,為産業輸送新鮮血液。不少學員去了頂尖的科技企業或者科研機構,把掌握到的技術“學以緻用”。

六年間,DeeCamp獲得了多位頂級學者和專家的支持,李開複、張亞勤、陳潤生、吳恩達、張宏江、周明、周志華、周耀旗、馬維英、高欣等名師親自授課,講解當下全球AI領域熱點研究方向,以及“AI ”的未來機遇與挑戰,同時涉獵AI技術産品落地、AI賦能時代的投資與創業等技術商業化思考。

舉辦DeeCamp六年以來,DeeCamp已累計收到2萬餘名在校大學生報名,錄取并培養了1500餘名學員,是目前規模最大、周期最長、最具特色的AI公益訓練營。在國内外AI學子心中,DeeCamp訓練營也建立起良好的口碑。

開源ai技術圖譜(DeeCamp2022結營AI如何挑戰生命科學關鍵難點)4

2019年,創新工場主辦的DeeCamp人工智能訓練營在中國科學院大學雁栖湖校區開營,李開複博士出席并講授開學第一課。DeeCamp已培養了上千名國内外頂尖高校學生,很多學生已進入頂尖AI企業和科研機構。

在DeeCamp連續舉辦六屆的背後,是創新工場對AI領域人才的持續陪伴。創新工場作為國内領先的技術型創業投資機構,不止是為企業提供資金“彈藥”,更是用“VC+AI”深度科技賦能的模式,陪伴高科技創業者成長壯大。

随着生命科學行業發展不斷升級,AI、數字化、自動化等跨界技術不斷重塑行業發展業态,行業越來越需要真正懂交叉技術、懂跨界産業的複合性投資人耐心陪伴創業者成長。

在AI 生命科學領域,創新工場緊密鍊接産業界、學術界與資本界。瞄準生命科學領域尚未被解決的問題,從源頭出發培養、孵化能夠解決技術難題和行業痛點的創新團隊,從技術産品化到産品商業化,從企業融資到高端人脈資源補強等維度為創業者提供生态内的重要資源。

DeeCamp也搭建起一道産業界與高校間人才溝通培養的橋梁,數十家頂尖企業、機構參與到其中,提供了寶貴的課題資源、案例資源以及導師資源。

作為本屆DeeCamp的戰略合作夥伴,鎂伽科技是生命科學自動化智能化領域的領先者,一直緻力于提升生命科學研發和生産的效率。鎂伽科技從創立之初就開始布局在生命科學領域的應用,借助人工智能和機器人自動化的技術基底,打造“自動化+人工智能+生物學”的能力閉環,不斷在生命科學領域進行邊界探索,加速生命科學相關領域的前沿突破和科技創新,為改進人類生命健康盡一份力量。

在此次合作中,鎂伽科技提供了豐富的課題資源和導師資源。鎂伽科技創始人兼首席執行官黃瑜清先生表示:“非常高興此次鎂伽能作為戰略合作夥伴參與DeeCamp2022,與全球頂尖AI和生命科學領域的菁英們共同探索前沿科技為推動人類健康進步帶來的可能性。衆所周知,生命科學已經發展成為數據驅動的學科,人工智能正在改變生命科學領域的‘遊戲規則’。而鎂伽一直把數據作為核心資産,為算法的數據收集設計相關實驗,并利用大規模自動化實驗平台産生數據。此次DeeCamp2022,鎂伽借助在生命科學智能自動化領域多年積累的技術經驗和數據優勢,邀請相關領域的資深科學家與同學們進行深度交流和智慧碰撞。未來,希望同學們能以DeeCamp2022的這次經曆作為起點,為推動中國AI 生命科學的進階貢獻更多力量!”

如何提升生物學實驗的可重複性和可預測性,是提高産業研發生産力的關鍵。人工智能技術與生命科學行業的碰撞,為生物技術領域帶來新變革。DeeCamp2022中學員展現的想象力與智慧展現了AI 生命科學行業的活力,盡管在用AI設計藥物方面還有很長的路要走,但相信未來在各界的努力下,算法會更加完善,AI在生命科學領域将發揮更大的作用。

創新工場董事長兼CEO、HICOOL商學院榮譽院長李開複博士表示,AI+科學交叉是創新工場預測未來5到10年間會引爆的創新增長新範式,AI+生命科學更是造福人類、影響深遠的黃金賽道。這也是6年來一貫倡導“學以緻用”的DeeCamp首次聚焦AI+生命科學這一命題的深意所在。這次入圍總決賽的6支團隊都是由AI和生命科學相關專業的優秀同學組成,在頂尖科研、産業導師指導下,在蛋白質結構預測、全基因組表達預測等各種場景進行探索,挑戰了多個真實世界的難題。很高興決賽同學在這次大賽中脫穎而出,期待在不久的将來,成為中國“AI+生命科學”賽道的創新先鋒。我期許有志創業的DeeCamp同學,也可以把這次的項目實踐視為産業價值的初步探索,同時關注幫助高科技創業者的北京HICOOL創業大賽及HICOOL商學院的豐富資源。


,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved