首次解析瘿螨科 Setoptus koraiensis 染色体水平基因组,开启螨类遗传进化研究新篇

【字体:

时间:2025年03月19日

来源:Scientific Data 5.8

编辑推荐:

为探究瘿螨遗传进化,南京农大研究人员组装 Setoptus koraiensis 染色体水平基因组,助力相关研究。

# 探秘瘿螨的基因密码:开启螨类遗传进化研究新大门在神秘的微观世界里,有一群小小的 “居民”—— 瘿螨(Eriophyoidea),它们虽体型微小,体长仅约 200μm,却是蛛形纲中庞大的家族,全球已知超 5000 种 ,分布极为广泛。这些小家伙有着独特的外形,呈蠕虫状至梭形,而且只有两对腿,与常见的多腿昆虫大不相同。它们还是严格的植食性生物,对寄主植物有着极高的特异性。可别小瞧了它们,一些瘿螨会在农林领域兴风作浪,给农作物和林木带来严重损害,造成巨大的经济损失。

尽管瘿螨在生态和农业方面有着重要影响,但长期以来,科研人员对它们的了解却十分有限。一个关键的阻碍就是缺乏染色体水平的基因组数据。没有这些数据,就如同在黑暗中摸索,难以深入洞悉瘿螨的遗传奥秘和进化历程,也限制了对其进行更深入的比较基因组分析。为了打破这一困境,南京农业大学的研究人员挺身而出,踏上了探索瘿螨基因密码的征程。他们的研究成果发表在《Scientific Data》杂志上,为该领域带来了新的曙光。

研究人员开展的是对 Setoptus koraiensis 进行染色体水平基因组组装的研究。为了获取研究样本,他们前往江苏南京溧水,在红松(Pinus koraiensis Siebold & Zucc.)上采集了至少 100,000 只野生 Setoptus koraiensis,涵盖了卵、幼螨和成螨。这些样本经过形态特征和线粒体 COI 分子证据鉴定后,被妥善保存。

在研究过程中,研究人员运用了多种先进的关键技术方法。首先是基因组测序,他们分别利用 PacBio、Illumina 和 Hi-C 技术进行测序,获得了大量的测序数据,包括 24.25Gb(~496X)的 PacBio 长读长数据、9.5Gb(~194X)的 Illumina 短读长数据和 9Gb(~184X)的 Hi-C 数据 。接着进行基因组组装,先用 Flye 软件处理 PacBio 的 CLR 读长数据,再经 NextPolish 软件利用短读长数据进行两轮优化,之后借助 Purge_dups 软件去除重复序列,最后通过 Hi-C 数据将重叠群锚定到染色体上。在基因组注释环节,使用 RepeatModeler 和 RepeatMasker 软件识别重复元件,综合多种方法进行基因结构注释,并通过多个数据库对预测的蛋白质序列进行功能注释。

研究结果

基因组基本特征:通过一系列复杂而精细的操作,研究人员成功组装出 Setoptus koraiensis 的染色体水平基因组。该基因组大小为 47Mb,N50 达到 24.53Mb,并且被准确地锚定到两条染色体上 。利用 BUSCO 评估基因组完整性,结果显示其完整性高达 89%,这一数据表明组装的基因组质量较高,为后续研究提供了可靠的基础。

重复元件分析:研究人员对基因组中的重复元件进行了深入分析,发现重复元件占基因组的 13.82%(6.42Mb) 。其中,短散在核元件(SINEs)占 0.2%,长散在核元件(LINEs)占 1.29%,长末端重复序列(LTRs)占 0.92%,DNA 转座子占 1.61%,还有 5.14% 属于未分类的重复序列。这些重复元件在基因组的进化和功能中可能发挥着重要作用。

基因预测与注释:研究人员共识别出 5,954 个蛋白质编码基因,其中 4,770 个基因能够进行功能注释 。通过对蛋白质序列的 BUSCO 评估,其完整性为 77.3%。这些基因功能的注释为了解 Setoptus koraiensis 的生物学特性和代谢过程提供了关键信息。

研究结论与意义

这项研究成功完成了 Setoptus koraiensis 染色体水平的基因组组装,这在瘿螨研究领域尚属首次。它填补了瘿螨染色体水平基因组数据的空白,为深入探究瘿螨的遗传机制、进化历程和生物学特性提供了宝贵的数据资源。凭借这些数据,科研人员可以开展更深入的比较基因组学研究,揭示瘿螨与其他螨类或生物之间的遗传关系,进一步理解它们在生态系统中的角色和演化路径。同时,也为开发针对瘿螨的生物防治策略提供了理论依据,有望帮助农林领域更有效地应对瘿螨带来的危害,减少经济损失。可以说,这项研究成果为瘿螨研究开辟了新的方向,让我们对这些微小生物的认识向前迈进了一大步,在生命科学和农业领域都具有重要的意义。

相关新闻