來源:Quanta雜志
撰文:薇薇安·凱莉(Viviane Callier)
編譯:葉子
物種演化出新基因的同時,新性狀往往也會同步誕生,“新基因是如何出現的”始終是進化生物學領域的一大未解之謎。
過去半個多世紀以來,大多數生物學家都贊同遺傳學家大野幹在1970年發表的著作《基因重複造成的演化》中所做的總結。盡管他承認第一批基因肯定有自己的來源,但他在書中寫道:“但從嚴格意義來說,進化中沒有什麼東西是重新憑空出現的,每個新基因都一定來自某個現存的基因……”
這種解釋似乎很站得住腳,因為如果真的存在全新基因,它們隻能從基因之間的“非遺傳性”DNA(常被稱作垃圾DNA)着手,但很難想象這一過程要如何發生。一個細胞是否健康,一般取決于基因網絡能否順暢運作。
這些基因之間的合作已經持續了成百上千萬年,從其它基因衍生而來的新基因融入這套網絡中的可能性更大一些。而相比之下,全新基因的轉錄信息較為随機無序,可能會對細胞造成損害,随機序列對細胞的影響多半有害無益。
但在過去15年間,科學家發現了越來越多全新基因存在的迹象,因此讨論的内容也從“全新基因是否存在”轉向了“全新基因對進化和适應的貢獻有多大”。
近期開展了的一系列研究試圖量化全新基因在各類生物體内出現的概率,估測結果有高有低,但研究結果顯示,在許多剛出現不久、或剛剛出現的新基因中,全新基因與大野幹描述的基因幾乎各占一半,前者有時甚至還要更加常見。
全新基因“代表了一種前所未有的、或者說無與倫比的基因新奇性,對進化生物學家來說,這是一種非常令人激動的可能性。
孤兒基因是如何形成的?
每種物種體内的大多數基因都能在其它至少一種物種身上找到。這些基因之間可能存在一些細微差别,但相似度極高,很容易看出它們之間存在關聯,并且這種關聯往往來自生物進化。随機變異會使基因序列之間的區别逐漸加大,但這些同源基因仍然可以被歸于一類。例如,人類和其它哺乳動物體内的血紅蛋白分子盡管略有不同,但對應的基因都屬于同一家族。
遺傳學家曽提出,具有新功能的基因的誕生過程可以用“分歧機制”來解釋,新基因可以通過舊基因複制産生,後期再發生變異,導緻兩種同源基因的功能和序列之間出現分歧。
但随着研究人員掌握了完整的基因組信息,科學家在研究過程中發現,這張“拼圖”似乎仍有一些碎片尚未補齊。有些“孤兒基因”好像另成一派,找不到明顯的祖先或表親。這些孤兒基因的來源自然成了科學家們研究的重點。
許多人認為,這是“分歧機制”理論被發揚到極緻的表現,新基因與原基因的分歧已經大到了認不出其來源的地步。孤兒基因的序列可能進化得過快或過久,已經失去了與原基因家族的相似之處。
例如,孤兒基因可能從細菌或病毒的全部或部分基因水平轉移而來,但複雜生物體内找到的孤兒基因似乎極少來自于細菌。從理論上來說,假如某個基因在其它種系中的同源基因碰巧在進化過程中消失了,那麼該基因便會變成孤兒基因。此外,“全新基因”也是一種可能性,但該理論自身也存在諸多疑點。
不過,研究人員一直加州大學戴維斯分校的遺傳學家在果蠅測試中發現了由非遺傳性序列演變而來的基因。于是主題逐漸從“全新基因是否存在”轉變成了“全新基因有多常見。”
過去十年來,對于全新基因的和分歧機制的相對意義,研究人員們一直争論不休。但研究孤兒基因及其由來至今仍然困難重重。這一領域存在諸多障礙,因為你無法确定有多少基因是真正的全新基因,也不知道該現象的意義何在,然後就這麼陷入了瓶頸。
位置很關鍵
為解決這些疑惑,遺傳學家一同展開研究,試圖量化果蠅、酵母和人類基因組中能夠用序列分歧解釋的孤兒基因的比例。
他們采用了一種全新的分析方法,并在今年2月發表的論文中描述了實驗過程。要判斷幾種基因是否為同源基因,科學家通常會比較它們的核酸序列(或者對應的蛋白質氨基酸序列)。研究團隊則另辟蹊徑,從每個基因與相鄰基因的相對位置入手。該特性被遺傳學家稱作基因的“共線性”(synteny)。
我們可以用一個比喻來形象的解釋這個複雜的研究方法:假設你有一疊排列好的紙牌,然後稍微洗一洗牌。洗完牌後,最上面兩張分别為方塊9和方塊10,第三張翻過去不看,第四張和第五張分别是Q和K。那麼你就可以胸有成竹地認為第三張牌是J,因為這幾張牌的次序得到完整保留的概率比隻有第三張牌發生變動的概率要大。
實驗思路也與之類似。在進化過程中,一條染色體上的基因排列順序大部分都能保留下來。染色體的一些片段可能會發生重大變化,但在這些片段内部,基因的排布則通常會原樣保留。
研究人員做了一項保守的猜測:假如一個基因的相鄰基因在另一個物種的基因組中也以同樣的次序出現,則該基因便等同于另一個物種基因組中夾在兩個相鄰基因之間的基因,即使次序并不完全匹配,也可以做出這樣的推斷。
利用這種“共線性法”,研究人員估測,果蠅、酵母和人類基因組中有多達三分之一的孤兒基因都可以用過度分歧來解釋。剩下的肯定還要用其它方法來解釋,而“全新來源”理論也許是最佳的解釋方法。
分歧概率
遺傳學家韋斯曼則采用了一種略微不同的方法來研究同一個問題。他們的研究結果近期發表在了論文預印網站biorxiv上,并已經提交給一份期刊、進行同行評審。“我們要弄清的問題是,如果我在某種生物、或某個生物類群之外找不到某個基因的同源基因,究竟是因為我沒有檢測到,還是因為它根本不存在同源基因呢?”韋斯曼指出。
為弄清這個問題,她研究了幾種具有親緣關系的酵母和果蠅品種,對基因家族中的累積變異率進行了估測,然後便可通過統計學分析某個品種的某個基因的同源基因是否能在其“遠親”品種身上找到。
據估測,這些酵母中有55%至73%的孤兒基因可以由基因分歧機制解釋,這一比例比之前的研究結果還要高。盡管研究方法不同,但都得出了相同的結論:“這些基因中的确有一部分來自過度分歧,無論比例是30%、50%還是80%,對想研究孤兒基因的科學家來說,這都是一個顯而易見的問題。”
關于孤兒基因的起源,兩種研究結論大緻相同,隻不過一個更側重全新基因、另一個更側重過度分歧産生的基因。“一篇論文說‘杯子裡裝了一半的水’,另一篇則說‘杯子有一半是空的’。”
考慮到孤兒基因的起源混雜不一,最好将剛形成不久的新基因作為全新基因的研究重點。如果某個全新基因是最近剛形成的,就應當仍能在其演變而來的物種基因組中識别出對應的非遺傳性序列,這可以作為該孤兒基因的确是全新基因的證據。
功能是如何出現的
2019年,芝加哥大學遺傳學家龍漫遠對亞洲水稻基因組中新形成的全新基因展開了研究。他和同事們識别出了175個在過去340萬年間形成的全新基因。他們可以判斷出這些基因屬于全新基因,因為在近親物種中仍能找到對應的非遺傳性序列。這些全新基因似乎具有生物活性,即可以轉錄成RNA、再翻譯成肽鍊,并且其中大多數都表現出了經過自然選擇塑造的迹象。
龍漫遠的研究證實了全新基因的确相對普遍、并且具有重要功能。但仍未回答“非遺傳性序列如何變成具有功能性的基因”這一問題。對此,2012年《自然》期刊上曽發表的一篇論文中提出過一種名叫“原基因”( proto-gene)的假設:這些基因最初可能是DNA上的一部分,其對應的RNA和蛋白質産物起初不具備任何功能。但在适當的環境條件下,這些原基因可以為生物體帶來一些優勢,從此在自然選擇的作用下開始進化。
很多遺傳學家試圖通過實驗來驗證這一假設。首先,他們利用計算機找出了酵母基因組中似乎符合原基因定義(在進化尺度上較為年輕,能夠活躍轉錄、但不會生成功能性蛋白質的基因)的DNA序列,然後看看将這些序列删除或過度表達後,酵母的健康情況如何。
删除這些原基因序列似乎不會造成什麼傷害,這點很說得通,畢竟它們對酵母的健康沒做什麼貢獻。但令研究人員吃驚的是,當10%的原基因序列過度表達時,酵母菌落的增長速度竟然有所增加。事實上,過度表達原基因序列往往比過度表達功能性基因更加有益(因為進化已經為功能性基因預設好了最佳表達水平),沒想到這些随機序列竟然有這麼大的潛力。
這些結果說明原基因具有很大的适應潛力。雖然它們的影響還不太清楚,但可能會從多種方面為細胞做貢獻。如果這些随機序列逐漸進化成了功能性基因,它們的潛力就會漸漸顯露出來。
研究人員還觀察到,這些有益的原基因序列有一點相同之處:由這些基因翻譯而來的蛋白質産物一般都有使其能夠停留在細胞膜或細胞器膜表面的結構域。研究人員正在針對這一點展開調查。
雖然他們的研究體現了全新基因的适應潛力,但全新基因對生物适應能力的真正影響也許将永遠“謎團重重”。随着全新基因的累積變異越來越多,想判斷它們來自何種非遺傳性序列也會越來越難。達到一定時限後,也許就無法證明某個古老的基因其實曾經是全新基因了。因此,要想确定全新基因的真正數量、以及它們對大多數複雜生物适應能力的影響,将是一個極為棘手的問題。
但孤兒基因無論起源如何,其生物學機制都值得我們一探究竟,對那些分歧速度在某個時間點上突然加快的基因來說尤其如此,因為這些基因或許能幫助我們弄清新生物學功能是如何進化而來的。
我們現在知道孤兒基因有多種誕生機制,但為何有些生物學過程更容易促成全新基因的進化、有些則更容易促成基因的複制和分歧?對此,我們仍然毫無頭緒。除了全新基因的确存在、且似乎普遍存在之外,這一領域還沒有什麼結論是闆上釘釘的。情況還在不斷變化。年複一年,我們掌握的信息也會越來越多。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!