结构变异(SV)和基因拷贝数变异(gCNV)促进了作物的进化,驯化和改良。
2021年5月28日,四川农业大学李仕贵,钦鹏及中国科学院遗传发育生物学研究所梁承志共同通讯在Cell 在线发表题为“Pan-genome analysis of 33 genetically diverse rice accessions reveals hidden genomic variations”的研究论文,该研究收集了31种高质量的遗传多样性水稻种质的基因组。结合两个现有的程序集,该研究开发了全基因组规模的基因组资源,从而提供了水稻基因组变异的途径。
具体来说,该研究发现了171,072个SV和25,549 gCNV,并使用了Oryza glaberrima装配体来推断Oryza sativa种群中SV的衍生状态。该研究对SV形成机理,对基因表达的影响以及亚种群之间的分布的分析说明了这些资源在了解SV和gCNV如何影响水稻环境适应性和驯化方面的实用性。当仅使用SNP和单个参考装配体时。该研究工作提供了丰富的种群规模资源,并配有易于使用的工具,以促进水稻育种以及植物功能基因组学和进化生物学研究。
结构变异(SV)是遗传变异的主要来源。越来越多的人类研究证据支持SV导致许多众所周知的人类疾病,而在植物中的研究表明SV涉及多种表型。基于短读测序数据识别SV既困难又不可靠。因此,基于长读取的数据进行SV识别变得越来越普遍,例如在人类和植物研究中 。这种方法可以提高检测SV短读的灵敏度和准确性。但是,即使有了这些新的长读取的数据集,仍然很难识别位于重复区域附近或非常大的SV。
最近,由于高质量基因组装配的进展,越来越多基于高质量装配的植物研究已经在少数种质中分离了SV。但是,由于基于种群规模的高质量装配的研究很少,因此很难知道植物基因组变异的真实程度,特别是对于基因拷贝数变异(gCNV),这被认为是功能性遗传变异的重要来源。因此,期望基于高质量的装配体建立全基因组。泛基因组研究的最新趋势是构建基于图的基因组,该基因组包含种群中的所有变异。对于SV的准确和快速的基因分型,它们明显优于常规线性参考基因组。值得注意的是,有一个基于图的基因组基因组用于豆科植物双子叶植物。
水稻是全球一半人口的主要粮食作物,也是植物研究中单子叶植物和农作物的经典物种。也有一些基于短读的SV的研究。但是,SV和gCNV的范围及其对水稻环境适应和驯化的生物学影响的表征较差。缺乏合适的SV目录限制了我们了解植物中SV的形成的能力,尽管它们在模型哺乳动物和人类中得到了很好的研究。
在这里,该研究从头开始组装了31种不同水稻种质的高质量基因组。将它们与两个现有程序集:Nipponbare和R498结合起来,该研究发现了水稻基因组变异和驯化的隐藏遗产。
该研究利用全基因组规模的资源来构建基于图的基因组,并推断整个水稻种群中SV的衍生状态。该研究还分析了SV分布,并评估了SV形成的机制以及SV对基因表达的影响。该研究提供了SV和gCNV如何直接影响环境适应和农艺性状的示例。除了展示高质量基因组装配体和基于图的基因组进行植物基因组学和功能基因组学研究的功能外,该研究还介绍了一套资源和访问这些资源的强大工具。
版权声明:本文转自“iNature”,文章转载只为学术传播,不代表本号观点,无商业用途,版权归原作者所有,如涉及侵权问题,请联系我们,我们将及时修改或删除。
添加微信获取最新优惠、出版政策、课程直播信息,随时咨询客服/编辑,了解更多实时资讯