tft每日頭條

 > 生活

 > 人工智能與生物基因

人工智能與生物基因

生活 更新时间:2025-03-14 07:26:13

人工智能與生物基因(DeepGenomics人工智能會把基因組學帶向何方)1

華大基因一紙關于成立前瞻業務單元,由前華大基因CEO王俊負責探索以人工智能為核心的新業務。一時間,各種猜想、祝福和陰謀論充斥于媒體和社交網絡。曆經十五年,華大基因在基因組方面的強悍實力早已蜚聲海内外,但人工智能?雖然炙手可熱,但這真的足以讓王俊投入下一個十五年?把目光投向一家美國初創公司,或許這能給我們一些啟示。

Deep Genomics,源自多倫多大學的一家創業公司。對人工智能稍有了解的人就能看出這個名字的含義:Deep Genomics = Deep Learning Genomics。Deep Genomics緻力于利用機器學習算法來預測基因組上的突變會如何改變細胞,進而知道會給人體帶來什麼改變。Deep Genomics的第一個産品是SPIDEX,預測基因組突變對RNA剪切的影響。關于SPIDEX的方法學細節,可以查看2015年1月的Science。機器學習專家、基因組學專家和精準醫療專家組成的團隊,讓這個公司很快就登上了Nature Biotechnology、科學美國人、WIRED、CBC新聞等學術、科普、科技和傳統媒體。

人工智能與生物基因(DeepGenomics人工智能會把基因組學帶向何方)2

餘凱

Deep Learning,深度學習,一種模拟人類大腦工作方式的機器學習算法,近年來被廣泛用于語音識别、圖像識别等海量非結構化數據學習。Google、Facebook、微軟等IT巨頭在深度學習領域都投入巨資,國内的百度挖來深度學習領域的華人大神餘凱成立百度深度學習研究院,随後再引入深度學習巨匠Andrea Ng擔任研究院院長。餘凱老師今年從百度離職,據悉将在人工智能芯片方面開始創業----可以相信,餘凱老師看到了以深度學習為代表的機器學習技術更廣闊的應用場景和商業化前景。

人工智能與生物基因(DeepGenomics人工智能會把基因組學帶向何方)3

Andrea Ng吳恩達

通過模拟人腦的工作方式設計和開發人工智能模型和算法一直以來就是人工智能領域的一個重要發展方向。腦科學的發展,讓我們知道人類的大腦是通過很多層結構對數據進行抽象和學習的。但傳統的神經網絡算法,受制于數據量和計算能力,往往隻有很少的幾層。即便如此,神經網絡算法也廣泛的用于互聯網、工業控制、以及生命科學等諸多領域。随着以分布式存儲和計算、GPU和MIC等衆核計算技術在最近十來年的神速進步,以及互聯網在采集數據方面的強大能力,人們開始研究如何實現有更複雜的層次結構,可以處理更複雜的數據,尤其是非結構化數據的機器學習算法。深度學習中所謂的深度就來自這複雜的層次結構,讓人覺得是一個深不見底的黑洞。

如前所述,深度學習在語音識别、圖像識别等領域取得了巨大的成功,讓這些之前隻存在于科幻電影中的技術迅速地步入大衆生活。但在生命科學領域,這個被宣稱正在快速從實驗科學變為理論科學、數據科學的領域,深度學習并沒有帶來革命性的變化,零星的科研論文出現在生物信息學和基因組學的學術期刊上,波瀾不驚。相對于圖像數據和語音數據,生命科學數據獲取的高成本使得數據積累量還遠遠滿足不了一般意義上的深度學習模型的需求,而商業模型的不成熟也阻礙了商業機構在這方面的投入。

Deep Genomics 在技術方面的工作已經發表在了今年一月份的Science和去年6月份的Bioinformatics上,最新的工作即将在Nature Biotechnology上發表。例如,在Bioinformatics上發表的文章中,主要的數據是11019份小鼠的可變外顯子(alternative exons)的RNA-Seq數據,然後據此構建深度神經網絡來預測組織間的剪切模式。顯然,使用小鼠和局限于外顯子,大幅度的降低了構建大規模訓練數據集的成本。一萬多份樣本,在圖形、機器感知等領域還是很小的樣本,但在生命科學領域,尤其是高通量組學領域,已經算得上是不小的樣本量了。但這并不是高不可攀,安徽醫科大學發表在Nature Genetics上的銀屑病項目也對約兩萬人的樣本進行了目标區域捕獲測序。對這樣規模的數據構建深度學習模型,在模型設計和計算效率上都不存在太大的困難。

随着基因組學技術在醫學,尤其是診斷領域的市場不斷擴大,華大基因已經從一家發不出工資的體制外科研機構走向基礎研究和商業化并重的行業巨頭。從買來無以倫比的測序能力,“工業化生産”的基因組學論文,到收購Complete Genomics進軍行業上遊獲得有自主知識産權的基因組數據産出能力。下一步,如何讓從這些數據中挖掘出更有價值的東西,人工智能是不可或缺的工具。

Deep Genomics走出了人工智能和基因組數據整合商業化的一步,華大基因會在這條道路上前進多遠?

十五年,或許還走不完這條路。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2025 - www.tftnews.com All Rights Reserved