出品丨虎嗅科技組
作者丨蘇北佛樓蜜
題圖丨視覺中國
近日,科學突破獎基金會宣布了2023科學突破獎(Breakthrough Prize)獲獎名單。科學突破獎有“科學界的奧斯卡”之稱,它旨在表彰在生命科學、基礎物理學和數學方面的突破性成就。
谷歌DeepMind科學家因開發人工智能 (AI) 系統而獲得了300萬美元的獎金,該系統預測了幾乎所有已知蛋白質如何折疊成3D形狀。
研究人員使用AlphaFold程序實現了這一壯舉,該程序于2018年首次開發并于2021年7月對外公開發布。開源程序可以根據構成蛋白質的氨基酸序列預測蛋白質的3D結構。蛋白質的結構決定了它的功能,因此AlphaFold識别2億個蛋白質結構的能力讓自己成為了幫助識别人類可以利用新蛋白質的主力軍。
早在發布之初,中國生物結構學領軍人物、西湖大學校長施一公就曾評價稱:“依我之見,這是人工智能對科學領域最大的一次貢獻,也是人類在 21 世紀取得的最重要的科學突破之一。”
知名藥企Dewpoint Therapeutics董事會成員兼戰略顧問、Relay Therapeutics聯合創始人Mark Murcko也認為,AlphaFold已經打開了一個工具箱,并向全世界展示了可能的東西。
“現在我們将有幾十個實驗室,每個實驗室都在思考略有不同的問題集,包括蛋白質-配體結構的預測、變構口袋的成藥性、蛋白質-蛋白質相互作用和RNA靶标,以及疫苗免疫原和從頭治療性蛋白質的設計。”Mark Murcko在曾采訪中表示。
從正式發布到此次的得獎已經過去了4年時間,業内有關AlphaFold的讨論始終更沒有終止,從最開始科學界的為之振奮到現階段更多應用的展開,如今,4歲的AlphaFold也給科學家帶來了新的驚喜。
成功預測蛋白質結構為什麼如此重要,新技術又能給人類社會帶來哪些便益?
生物“骨架”
蛋白質是組成人體所有細胞和組織的重要成分。在我們體内,幾乎所有重要組成部分都有蛋白質的影子。此外,蛋白質是生命的物質基礎,沒有蛋白質就沒有生命,它還是構成細胞的最基本的有機物,擔當着生命活動承擔者的角色。
在蛋白質中,氨基酸為最基本的組成單位,它是将生命和其他各種樣式的生命活動聯系在一起的基本物質。人體内的蛋白質分為很多種類型,它們的作用、性質各不相同,但所有蛋白質都是由20種氨基酸按照不同的比例相互組合而成的,并且在體内不斷進行着更新和代謝。
他們就像微小的、難以理解的謎題,存在于細菌、植物、動物各種生物體中,當它們被制造出來時,會在幾毫秒内折疊起來,但其結構非常複雜,試圖猜測它們會變成什麼形狀幾乎是不可能的。
蛋白質的基本機構
在結構上,蛋白質分子中的肽鍊并不是直鍊形狀,而是按照其内在規律發生卷曲或者是折疊,從而形成特定的空間結構,這就是蛋白質的二級結構。
在二級結構的基礎上,蛋白質肽鍊還會按照一定的空間結構,發展形成比二級結構更為複雜的三級結構。具有三級結構的肽鍊按照特定的空間排列順序組合在一起,形成的聚集體結構就是蛋白質的四級結構。由于構成蛋白質的氨基酸種類繁多,氨基酸的排列順序種類繁多,所以,雖然隻有20種氨基酸,但蛋白質的種類卻特别多。
蛋白質的各級結構
美國分子生物學家賽勒斯·萊文塔爾(Cyrus Levinthal)在1969年的一篇論文中指出了一個悖論,即盡管蛋白質具有大量可能存在構型,但仍能快速而精确地折疊成不同的構像。 據估計,給定的蛋白質可能有 10^300 種最終結構。
因此,如果人們試圖通過逐個嘗試來獲得正确的蛋白質形狀,那麼獲得正确答案所需要的時間将比宇宙存在的時間更長。
此前,科學家們有辦法可視化蛋白質并分析它們的結構,但這是一項緩慢而艱巨的工作。據《自然》雜志報道,最常見的蛋白質成像方法是利用X射線晶體學,通過在蛋白質的固體晶體上發射X射線,并測量這些射線是如何衍射,以确定蛋白質的排列方式。據DeepMind稱,這項實驗工作已經确定了大約190,000個蛋白質的形狀,這一技術也讓冷凍電鏡在過去十年中成為許多結構生物學實驗室的首選工具。
長期以來,科學家們一直想知道蛋白質的組成部分——一串不同的氨基酸是如何描繪出其最終形狀。研究人員表示,在1980年代和1990年代,早期使用計算機預測蛋白質結構的的結果并不理想。當科學家将其應用于不同蛋白質時,自己已發表論文中的結論往往會被反複推翻瓦解。
去年,DeepMind 發布了人體和20個研究物種中每種蛋白質的蛋白質形狀預測。如今,他們已經将這些預測擴展到基本上所有的蛋白質。
DeepMind的AlphaFold創建的蛋白質結構3D 圖像(圖片來源:DeepMind)
DeepMind在一份聲明中說: “如今算法包含植物、細菌、動物和其他生物的預測結構,為衆多重要問題的解決提供了許多新機會,包括可持續性發展、糧食不安全和被忽視的疾病等方面。”
開源程序根據蛋白質的氨基酸序列或構成蛋白質的分子單元進行預測。這些單獨的單元連接成一條長鍊,然後“折疊”成3D形狀。蛋白質的3D結構決定了該蛋白質可以做什麼,因此能夠從其氨基酸序列推斷蛋白質的形狀這一功能顯得十分強大。
AlphaFold在試圖解釋蛋白質結構時,主要功過積累有關氨基酸序列和相互作用的原理。該算法現在可以在幾分鐘内預測蛋白質的形狀,并精确到原子級别。
這一功能也讓AlphaFold一經發布,就收獲了大量關注及喝彩,曾經的轟動并未消散,它的影響仍在繼續蔓延。
從靶點到成藥的一場變革
2022年,挪威生命科學大學研究員Vilde Leipart 使用 AlphaFold 揭示了卵黃蛋白的結構——卵黃蛋白是一種由所有産卵動物制造的生殖和免疫蛋白,這一發現可能會帶來新的方法來保護蜜蜂和魚類等重要的産卵動物免受疾病侵害。不止于此,AlphaFold的速度和準确性正在加速藥物發現過程,能夠讓藥企更快地為患者提供新藥。
就像基因編輯工具CRISPR徹底改變了人類疾病研究和遺傳錯誤疾病的藥物設計方向,AlphaFold的正在從根本上改變新藥的發明方式。
X射線檢測的蛋白質晶體
想要研發藥物,通常需要第一時間鎖定導緻疾病的相關蛋白質或基因。然後對症下藥,尋找成功“擊中”目标的分子或化合物。這一工作的代價是巨大的,藥物發現平均需要 10 年以上的時間,每種藥物開發經費可達28億美元。
例如,冠狀病毒上的刺突蛋白被就是針對COVID-19的靶标,針對這一目标,我們發現了可以粘附在刺突上并中和刺突的疫苗及單克隆抗體。
但是,大多數疾病不像COVID-19一般,有一個大而明确的目标,可以用衆所周知的武器(如抗體)來“攻擊”它。不同的疾病可能有成千上萬的潛在藥物,這是一個反複試驗的過程。
人工智能已成為加速藥物發現的一種方式。訓練有素的系統可以查看治療目标,然後從選項庫中識别有希望成功的候選藥物,這比實驗室中的科學家人工研發的速度要快得多。不僅僅停留在Alphabet所依賴的理論,我們已經看到了更多實際的應用例子。
2022年8月,英國Exscientia公司開發的人工智能系統發現了一種抗癌分子,該分子現在正進入臨床試驗,這一過程僅用了短短的八個月。如果沒有人工智能,這一發現可能需要4到5年的時間。
如今,大多數治療癌症和其他疾病的新藥都是通過靶向體内特定的蛋白質來發揮作用的。理想情況下,我們希望設計小分子藥物以非常精确地結合到整個靶蛋白的一個微小區域,從而改變其功能。藥物化學家總是更喜歡擁有準确的3D蛋白質結構,以便他們可以基于結構來設計藥物。
甚至在藥物發現階段開始之前,3D蛋白質結構就可以幫助藥物研發團隊評估目标蛋白的成藥性,以便讓研究人員能夠了解哪些目标成藥相對簡單,哪些将帶來重大挑戰,
根據倫敦癌症研究發布的消息,在其開展的多個藥物發現項目中,明晰靶蛋白的3D結構發揮了重要作用。預測準确3D蛋白質結構的能力通常對藥物發現非常有價值,在設計化學探針以評估目标在生物學和疾病病理學中的作用時也是如此。例如,更好地預測有用的藥物靶點、翻譯疾病預測細胞和動物模型,以及預測人類的早期檢測毒理學。
除此之外,蛋白質機構預測還能改善抗生素的抗藥性難題。根據CDC估計,2019年,抗微生物藥物耐藥性每年給美國經濟造成550億美元的損失,其中包括200億美元的醫療保健成本及350億美元的生産力損失,抗生素耐藥性也助長了“超級細菌”的出現。
今年九月,科羅拉多大學博爾德分校的Marcelo Sousa和Megan Mitchell教授使用AlphaFold研究與抗生素耐藥性有關的蛋白質,并确定了蛋白質結構,科學家可以在大約30分鐘内識别出一種細菌蛋白質結構,在沒有人工智能的幹預下,這一動作可能會花費十年時間。
毫無疑問,AI技術正在潛移默化的影響着醫療行業,DeepMind僅僅是一個成功的開端,而這條路沒有終點。
正在改變與想要改變世界的人,都在 虎嗅APP
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!