大豆是世界重要的粮油饲兼用作物,中国是全球最大的大豆消费国和进口国,近年来大豆供需失衡成为我国农业的重大“卡脖子”问题。基于基因组信息,克隆和解析重要农艺性状关键调控基因对于培育高产优质大豆新品种至关重要。2010年,大豆品种Williams 82的基因组被破译,成为首个大豆参考基因组。随后该基因组被多次更新,已成为广泛应用的大豆参考基因组,极大推动了大豆重要农艺性状的解析和分子育种。然而,该基因组仍存在数千个缺口。大豆完整基因组图谱的绘制不仅有助于优异基因的克隆,对复杂区域如着丝粒和端粒的研究也具有重要意义。
南京农业大学宋庆鑫团队此前利用大豆Williams 82品种,构建了世界上第一个覆盖全基因组且突变信息明确的大豆公开突变体库,并已免费向国内大豆科研团队发放2万余份突变体种质(Zhang, et al., 2022)。近日,该团队以大豆Williams 82为材料,整合PacBio HiFi,ONT超长测序和Hi-C技术,成功组装了第一个端粒到端粒无缺口的大豆基因组(Wm82-NJAU)。研究结果以题为“A telomere-to-telomere gap-free assembly of soybean genome”发表于Molecular Plant杂志。
与之前发表的William 82基因组(Wm82-v4.0)相比,Wm82-NJAU基因组填补了之前所有的染色体缺口,且包含所有20个着丝粒、40个端粒序列信息(图1)。新组装了~72 Mb的基因组序列,超过50%的新组装序列位于端粒和着丝粒区域。此外,该基因组也校正了已发表基因组中29个倒位和379个易位区域。
图1 Wm82-NJAU与Wm82-v4.0基因组间比较
对大豆端粒和着丝粒的研究发现,超过95%的端粒和着丝粒区域由转座子组成。其中,超过90%的着丝粒序列为Gypsy逆转录转座子,而90%以上的端粒序列为Mutator DNA转座子(图2A)。与之相对应的,着丝粒和端粒区域均呈现较高的DNA甲基化水平(图2B)。真核生物的着丝粒由重复序列组成,基于从头预测,该研究鉴定到大豆13号染色体着丝粒特异的未发表过的重复序列GmCent-3。相比于已知的GmCent-1和GmCent-2, GmCent-3序列间变异更小,表明13号染色体的着丝粒形成可能晚于其他染色体(图2C,D)。
图2 端粒与着丝粒的特征
综上所述,该研究破译了第一个端粒到端粒无缺口的大豆基因组,并解析了着丝粒和端粒的遗传和表观遗传特征。结合该团队前期发表的大豆突变体库(http://www.isoybean.org/),完整的大豆参考基因组将促进大豆功能基因组学研究。南京农业大学钟山青年研究员王龙飞为文章的第一作者,宋庆鑫教授为论文的通讯作者。该研究得到了国家重点研发计划、博士后创新人才支持计划和中国博士后基金等项目资助。
参考文献:
Zhang M, Zhang X, Jiang X, Qiu L, Jia G, Wang L, Ye W, Song Q*. (2022) iSoybean: a database for the mutational fingerprints of soybean. Plant Biotechnology Journal, 20:1435-1437
原文链接:
https://www.cell.com/molecular-plant/fulltext/S1674-2052(23)00247-2