大黄鱼(Larimichthys crocea)是关键的水产养殖物种,占全球鱼类产量的 60% 以上,其高市场需求、卓越的口感和丰富的营养价值进一步推动了其在东亚及其他地区的商业地位。根据种群遗传分析表明,北部寒冷地区种群和南部温暖地区种群之间存在不同的适应性景观。然而,它们适应不同环境压力的分子机制仍不清楚,缺乏完全解析的端粒和着丝粒区域。这些限制阻碍了对基因组组装和进化适应的全面理解。
2025年8月22日,集美大学水产学院王志勇教授团队,发表了大黄鱼T2T基因组资源(T2T-MYD和T2T-DQ)文章,该研究提供了迄今为止最完整的闽-粤东族(T2T-MYD)和岱衢族(T2T-DQ)大黄鱼参考基因组;同时,结合多组学数据系统解析了着丝粒特征及5S rRNA分布模式,开展了不同种群大黄鱼适应性演化分析,为大黄鱼重要经济性状遗传机制解析和遗传改良工作的开展提供了重要基础。该成果发表在期刊Advanced Science上,文章题目“T2T Genomes Unveil Centromere Architecture and Adaptive Divergence in Large Yellow Croaker (Larimichthys crocea)”。诺禾致源为本研究提供了基因组相关二代和三代建库测序服务。
主要结论
1.基因组组装与注释
利用PacBio HiFi reads (~48×)、ONT超长reads (~70×)和Hi-C reads(~150×)进行闽-粤东族(T2T-MYD)和岱衢族(T2T-DQ)大黄鱼基因组的组装。最终的T2T基因组T2T-MYD大小为708.23 Mb,包括24条染色体,组装contig N50为31.71 Mb,GC含量为41.57%,共检测到48个端粒和24个着丝粒,基因组QV组装评估平均质量值(QV)达到52.89,BUSCO值为99.3%,基因组共注释到26144个基因,重复序列占基因组的29.32%。T2T-DQ大小为706.62 Mb,包括24条染色体,组装contig N50为31.56 Mb,GC含量为41.58%,共检测到48个端粒和24个着丝粒,基因组QV组装评估平均质量值(QV)达到53.07,BUSCO值为99.2%,基因组共注释到26949个基因,重复序列占基因组的28.79%。
与先前发表基因组比较发现,在T2T-MYD和T2T-DQ中鉴定出533和351个新基因,主要位于难以组装的着丝粒和端粒区域。这些发现表明,本研究中产生的T2T组装代表了在解析大黄鱼基因组中复杂重复区域方面的重大进步。
图1 两种大黄鱼的T2T基因组组装
2.大黄鱼基因组端粒、着丝粒和5SrRNA的基因组表征
大黄鱼基因组T2T-MYD和T2T-DQ的组装结果中所有24条染色体的两端都检测到经典端粒重复序列“TTAGGG / CCCTAA”,每个染色体末端的平均拷贝数范围为1295至1352个。对于着丝粒,该区域主要由一个42 bp的串联重复单元(Cen-42)主导,该单元可进一步形成168 bp的高阶重复结构(Cen-168)。荧光原位杂交(FISH)实验进一步证实了Cen-42重复序列和端粒(TTAGGG)在染色体上的定位。
着丝粒区域高度富集转座元件,其中大多数被归类为LTR(长末端重复序列)中的ERV1(内源性逆转录病毒1型),具有高水平的5-甲基胞嘧啶(5mC)甲基化,在着丝粒区域内鉴定到数百个蛋白编码基因,其中相当一部分在两群体中均表现出转录活性(MYD: 207个;DQ: 322个)。然而,群体间着丝粒区域的基因数量和组成存在显著差异,仅有208个基因为同源基因。对转录活性基因进行KEGG富集分析,在MYD群体中,富集通路主要与真核生物的细胞萎缩、JAK-STAT信号通路、PI3K-Akt信号通路和核糖体生物发生有关。相比之下,DQ群体不仅在这些途径中富集,而且在其他免疫相关途径中也显示富集,包括自噬、麻疹、丙型肝炎和单纯疱疹病毒1感染。
该研究还揭示了5S rRNA基因在大黄鱼基因组中的独特分布模式。不同于大多数物种中5S rRNA基因的紧密聚集,大黄鱼的5S rRNA基因广泛分布在10/12条染色体的短臂上,并在相邻基因拷贝之间表现出高度保守的98 bp重复间隔,且这些区域显著富集LINE/L2型逆转录转座子。
图2 着丝粒中活性表达蛋白编码基因的功能分析、5S rRNA基因单元的串联重复结构和物种的系统发育树
3.大黄鱼两个种群对环境变化的适应性进化反应
通过对MYD和DQ的比较基因组分析表明,T2T-MYD中有45个扩增基因家族和139个收缩基因家族,扩张的基因家族主要在免疫相关途径和脂肪酸代谢途径中显着富集,而收缩基因家族主要与脂肪酸生物合成相关的途径中;T2T-DQ中有46个扩增基因家族和164个收缩基因家族,扩张的基因家族主要在与厌氧代谢相关、与嗅觉和味觉功能相关的基因中富集;在与光转导和视黄醇代谢的基因家族中收缩。
对直系同源基因对的 Ka/Ks 分析显示,DQ 基因组中有 913 个基因处于正选择状态,大多富集于与花生四烯酸代谢,产热,与嗅觉和味觉转导相关的通路中。差异表达分析(DEGs)在脑组织中验证了部分关键适应性基因的表达差异。通过结构变异(SV)分析鉴定出4个群体特异性SV,分别在花生四烯酸代谢、嗅觉和味觉、产热和昼夜节律途径中功能富集。
图3 大黄鱼基因组两个种群基因分化与差异表达分析
参考文献:
[1] Cui Y, Yuan Y, Wang B, Wu B, Cai M, Fang M, Shen W, Wu X, Han F, Wang Z. T2T Genomes Unveil Centromere Architecture and Adaptive Divergence in Large Yellow Croaker (Larimichthys crocea). Adv Sci (Weinh). 2025 Aug 22:e06374. doi: 10.1002/advs.202506374.
Copyright@2011-2025 All Rights Reserved 版权所有:北京诺禾致源科技股份有限公司 京ICP备15007085号-1