近日,生物科技團隊天壤 XLab 正式上線了國内首個蛋白質設計工作台,免費開放給國内科研院校和機構。用戶無需編寫任何代碼即可進行蛋白質預測和設計等各項任務,并對計算結果進行可視化展示和分析。
AI 不斷在生物計算領域爆發巨大潛力,各方向的研究成果層出不窮,一條圍繞計算生物學的新賽道正在形成,可預見的是,能夠集成生物計算核心能力的平台型公司将賦能下遊生物應用,加速整個行業成熟與發展。
蛋白質設計領域的「EDA 軟件」
蛋白質是生命活動的直接執行者,其結構與功能由氨基酸序列所決定。如果有一款高效易用的蛋白質工作台,能夠從頭設計目标功能蛋白質,并完成其結構和特性的分析等全流程任務,就可以廣泛應用于生命科學研究的方方面面。
這是天壤 XLab 打造 xCREATOR 蛋白質工作台的初衷,背後也包含了布局生物計算平台商業化的戰略思考。
天壤 XLab 是國内最早實現近原子級精度預測蛋白質結構的創新企業,在蛋白質結構預測、蛋白質設計、複合體預測等方面實現了諸多突破。本次工作台的上線旨在打造一款國産 AI 蛋白質設計的「EDA 軟件」,圍繞通用蛋白質預測和設計工作,為生物科技産業轉化和落地服務。
2021 年,美國華盛頓大學 David Baker 團隊憑借已知結構天然蛋白質片段組裝和能量最小化的 Rosetta 蛋白質設計方法,獲得素有 “科學界奧斯卡” 之稱的 “生命科學突破獎”。
此次天壤發布的蛋白質工作台 xCREATOR,基于自研 TRDesign 蛋白質設計技術,能夠設計不受已知天然蛋白質限制的任意蛋白質,這一全新的創造方式将為生物計算時代的科研工作帶來極大便利。
無論是降解塑料或可持續生物燃料的開發,還是應用于疫苗、抗體藥物、腫瘤疾病療法的開發,高耗時、高成本、高人力的生物學研究,将獲得 AI 生物計算平台的極大賦能甚至最終完全被其所取代。
xCREATOR 通過集成世界前沿多樣化 AI 算法和強大的計算資源,為大家提供更高效、更便捷、更易用的蛋白質結構預測與設計服務。借助工作台,使用者幾分鐘内就可以獲得接近實驗解析精度的蛋白質結構,在過去這個時間可能是數個月甚至數年,并且得借助造價昂貴的專業器械。這将極大地幫助科研人員從繁瑣的工程和實驗中解放出來,投入到更有意義的生物創新與研究中去。
系統級應用降低科研人員技術門檻
AI 時代下的蛋白質設計計算和優化是非常複雜的流程,常常涉及幾種甚至幾十種算法應用,這背後不但需要大量算力,更需要研究人員在人工智能、計算生物學、計算化學、結構生物學等多個學科領域的技術與經驗積累。算力需求大、技術門檻高和流程複雜等困難常常阻礙了大量研究者進行更深入的蛋白質研究。
天壤 xCREATOR 為蛋白質研究者提供的是系統級平台,一站式解決算法、數據、算力以及科研流程複雜等所有難題,通過簡單的操作,就能完成結構預測、蛋白質設計、特性分析和優化等各項任務,适用于多肽、酶、抗體和各類功能蛋白質,使用時無需安裝軟件,在線登陸賬号就能啟用核心功能。
以蛋白質結構預測為例,平台可提供多種解決方案。其中自研最新的 TRFold-Single 核心算法,可以讓用戶直接從單序列生成預測結構,該算法在對 “de novo 86 測試集” 進行預測評測時,平均分達 86.2,優于 AlphaFold2 的 82.6 分。
工作台專為科研工作者開發,輕便、簡易、零門檻,無需重複安裝各類算法工具,也不必擔心沒有足夠的計算資源來承擔龐大的生物計算規模,在可視化的工作平台上,無需撰寫代碼,使用簡單的操作邏輯即可自由運行各類蛋白質任務。
項目式管理提升研發效率
不同于研發人員過往使用過的算法工具箱式平台,xCREATOR 工作台更關注蛋白質任務流程的設計和優化,研發人員能以項目管理的方式自由的對原本零散的各項任務進行分類、串聯、整合和管理,在工作台上從項目規劃、實施、計算、分析,一站式全流程地完成他的研發工作,有效賦能項目推進和管理。
在執行設計任務時,僅需四步操作,就可以端到端完成蛋白設計任務。用戶隻需要添加設計目标的蛋白質功能 motif 信息,啟動任務計劃,在任務計算結束後就可以查看設計結果及各項分析數據,并選取最适合的候選蛋白質進行下一步優化。
“我們希望蛋白質工作台能成為科學家們的研發 ‘利器’,可以像玩樂高一樣對蛋白質任務進行分類和重組,達到各種各樣的研究目的。點擊一個 ‘按鈕’,你就可以馬上預測一個蛋白質結構或者設計一個全新的蛋白質,這将大大提升大家的科研效率” 天壤 XLab 負責人苗洪江博士介紹。
強大算力支持速度提升百倍
除此以外,xCREATOR 最大的優點是速度非常快。由于蛋白質序列長度往往從數百到數千個氨基酸不等,可折疊空間巨大、計算複雜度極高,這對計算資源的挑戰巨大。xCREATOR 平台支持彈性調度算法,且自研核心算法具備大規模分布式計算能力,能夠發揮計算資源的最大價值。
尤其在預測任務方面性能更優,無需 MSA 的 TRFold-single 平均耗時 25 秒即可完成蛋白質單鍊結構預測,包含 MSA 搜索的 TRFold 預測耗時約 10 分鐘,實現預測速度和精度的最優組合,相較于傳統實驗方式速度提升百倍。
另外平台還可以實現複合體的結構預測與分析,其核心算法使用空間采樣的增強方式增加訓練數據多樣性,啟發式地搜索解決多鍊錯配和蛋白質手性問題。通過分子動力學力場優化結合表面原子結構,獲得準确的蛋白質相互作用信息,去繪制細胞内蛋白質相互作用通路圖。
AI for Science 加速釋放研究價值
蛋白質世界的空間巨大、功能豐富,100 氨基酸的蛋白質可能序列是 20^100 ~ 1.3×10^130,而目前人類僅探索了其中源于自然進化的極小一部分。未知空間中還有很多可能解決醫療健康、能源環保等挑戰的功能蛋白質沒有被觸及。
據了解,國外公司專注于從頭設計新型蛋白質的公司 Generate Biomedicines 已經創造了超過一百萬種在自然界中從未存在過的蛋白質,并對其中一些進行了測試。該公司還計劃濕實驗室和冷凍電鏡平台,以确定其創造的蛋白質的結構和功能。
“人類今天已經有了足夠的 AI 工具去探索微觀世界,我們希望通過打造算法、算力、數據融合的大型裝置,讓更多的人加入進來研究更具有挑戰的科學問題,幫助人類看清更大的蛋白質世界。” 天壤創始人、首席執行官薛貴榮博士表示。
基于在蛋白質領域的積澱,天壤 xCREATOR 平台目前已上線 TRFold-Single 單鍊結構預測(無 MSA)、TRComplex 複合體結構預測、TRDesign 等多項算法,供大家免費體驗試用。
後續将逐步開放蛋白質特性分析、蛋白質知識圖譜、功能 motif 數據庫、蛋白質表達水平預測、抗體從頭設計等功能。
當越來越多人借助工作台進行蛋白質的計算和優化時,将為行業帶來颠覆性改變,科學家們能夠專注科研,以更少時間、高小成本進行生産出更多元的功能性蛋白。
“我們的平台不僅支持個人用戶自由進行各類蛋白質任務,還可以與團隊協作共享研發成果,滿足靶點發現、蛋白質設計、藥物研發等各類更貼近場景的任務。希望通過平台挖掘生物、化工、農業、能源等下遊領域更多需求,也歡迎更多企業用戶在我們平台進行試用,我們将為特定的需求任務定制設計方案,從計算生物學的角度幫他們解決實際産業問題。” 苗洪江博士介紹。
未來會有越來越多的團隊、企業、高校利用軟件平台等新技術手段進行計算機模拟和研究實驗,從底層更理性科學的角度理解蛋白質和生命。期待科學家們将為長期以來醫藥、能源、化學、農業等技術方面的挑戰找到解決方案,從而推動更高效率的藥物研發、材料開發等過程,促進生物科技領域産業轉化落地和發展。
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!