tft每日頭條

 > 生活

 > 突變體拟南芥

突變體拟南芥

生活 更新时间:2024-08-27 06:17:18

拟南芥(Arabidopsis thaliana)作為被廣泛應用的模式植物,其基因組序列加快了植物分子生物學研究。在首個基因組發布二十餘年後,仍存在大量未填補的缺口區域。在常用的TAIR10/Araport11版本的基因組序列中,存在165個缺口。這些缺失區域可能由高度重複的序列組成,包括端粒、着絲粒、5SrDNA簇和含有45SrDNA的核仁組織區(NORs)。近年來,ONT和PacBio等長讀段測序技術的發展為組裝高複雜度序列提供了有力工具。近期發表的兩個高完整度基因組Col-CEN和Col-XJTU填補了着絲粒等缺失區域,但這兩個新的組裝仍不完整且有相互矛盾之處。

為提供更好的參考基因組,中國科學院遺傳與發育生物學研究所焦雨鈴研究組與中國科學院大學汪穎研究組合作,結合長讀ONT、高保真的長讀PacBio HiFi和短讀Illumina NovaSeq測序數據獲得了接近完整的拟南芥Col-0生态型的參考基因組Col-PEK。Col-PEK組裝填補了包括五個着絲粒在内各區域中的絕大多數缺口。例如,Col-CEN中5号染色體中的缺口均已在Col-PEK中補齊。Col-PEK為目前最為完整的基因組組裝,完成了1、3、5号染色體從端粒到端粒的完整組裝,僅2号和4号染色體的多拷貝NORs區域尚不完全。Col-PEK組裝總長度133.92 Mb,比TAIR10組裝長14.77 Mb,即增加了12.4%的序列。在填補缺口之外,Col-PEK還修訂了Col-CEN等組裝中的拼接錯誤。

Col-PEK組裝具有較高的序列完整度,對Col-PEK的注釋揭示了重複序列的分布規律,特别是着絲粒區域的CENH3結合區域分布規律和CEN180重複序列分布特征。對編碼基因的注釋還發現了145個新的“隐藏基因重複”,其與已知基因序列高度相似,可能是由新近的串聯重複等基因組擴增機制所産生。

Col-PEK組裝補全了所有着絲粒序列及絕大部分其它缺口,糾正了之前的錯誤組裝。該研究的初步分析展示了重複序列的分布規律,并揭示了一批新基因。Col-PEK參考基因組為植物學科研工作者提供了新的參照序列和重要數據資源。

相關研究成果以A near-complete assembly of an Arabidopsis thaliana genome為題,于6月1日在線發表在Molecular Plant上(DOI:10.1016/j.molp.2022.05.014)。研究工作得到國家重點研發計劃的資助。

突變體拟南芥(研究發布拟南芥高質量參考基因組)1

圖1.不同參考基因組組裝的完整度比較

突變體拟南芥(研究發布拟南芥高質量參考基因組)2

圖2.基于Col-PEK的基因和重複序列注釋

來源:中國科學院遺傳與發育生物學研究所

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved