诺禾致源

 > 

科技服务

 > 

基因组测序

完美基因组(T2T基因组)

完美基因组—抵达探索生物奥秘的终点

T2T(Telomere-to-telomere)基因组:是指组装的无gap的端粒到端粒的基因组(在rDNA区域、性染色体、着丝粒中可能允许少量gaps);具有非常高的Q值(准确性)和BUSCO值(完整性);在原始数据与组装之间具有最小的结构性错误。
  • 1.策略推荐

    60X HiFi + 100X Ultra-long ONT(N50 > 100K)+ 50X 二代 + 100X Hic
    (1)60X HiFi数据使用Hifiasm进行组装,得到HiFi contig,较常规组装(30X)深度更高,可得到完整性、连续性更高的contig骨架基因组,同时还可为单体型-T2T提供深度支持,进行单体型-T2T组装;
    (2)100X Ultra-long ONT(N50 > 100K)数据使用Nextdenovo进行组装,并使用50X Illumina数据进行纠错,得到ONT contig,使用Ultra-long ONT组装目的是得到片段超长的contig基因组;
    (3)100X Hic数据经Hicup质控,对Hifi contig及ONT contig两版基因组进行Allhic挂载得到基因组染色体版本;
    以HiFi 染色体级别基因组作为Reference,将Ultra-long ONT染色体级别基因组与其进行相互Merge,最终得到T2T级别基因组。
  • 2.T2T基因组质量评估

    T2T基因组组装完成后,需要进行以下评估内容:
    1)基因组评估:包含BUSCO评估(>95%)、序列一致性评估(>98%)、QV评估(>45)等。
    2)与该物种发表最佳版本基因组进行共线性评估:Mummer。
    3)着丝粒、端粒鉴定:对着丝粒、端粒进行预测,若研究较成熟物种(序列已知),将其与基因组直接比对查验。例如:人类端粒(TTAGGG)、拟南芥端粒(TTTAGGG)。
    4)着丝粒也可使用Chip-seq、FISH等实验进行验证。
    5)填补Gap区域可使用PCR实验进行验证。
    诺禾致源端粒、着丝粒鉴定及已发表基因组比对
  • 3.适用物种推荐

    动物:哺乳动物、淡水鱼类(详细评估)。
    植物:3G以内常规物种,如玉米、大豆、棉花等。
    特殊物种:部分异源多倍体可承诺(仅限棉花、油菜等)。
  • 4.应用方向

案例展示

Two telomere-to-telomere gapless genomes reveal insights into Capsicum evolution and capsaicinoid biosynthesis




两个辣椒T2T基因组揭示辣椒进化和辣椒素生物合成的简介[1]

研究对象:辣椒
期 刊:Nature Communications
影响因子:16.6
合作单位:北京大学现代农学院
发表时间:2024年5月20日

研究思路:

研究结果:

  • (1)T2T无缺口辣椒基因组组装

    得到了两个辣椒的T2T无缺口基因组。C. annuum(CaT2T)包含12条染色体,基因组大小为3.1 Gb,contig N50为262.6 Mb; C. rhomboideum(CrT2T)包含13条染色体,基因组大小为1.7 Gb ,contig N50为146.0 Mb。
  • (2)基因组验证和注释

    CaT2T和CrT2T的质量值(QV)分别为56.60和77.18,BUSCO分别为98.62%和97.12%,这表明两个基因组具有很高的准确度和完整度。重复注释显示,C. annuum和C. rhomboideum基因组中79.5%(2.45 Gb)和74.6%(1.28 Gb)是重复序列。通过整合abinitio预测、同源蛋白和转录组数据等证据,在CaT2T和CrT2T中分别预测了34,428和33,512个蛋白编码基因。CaT2T填补的Ca59的Gap区域中共编码614个基因,其中110个是CaT2T中新注释出来的。
  • (3)辣椒的着丝粒广泛受到CRM逆转录转座子的侵入

    本文首先通过C. annuum的CENH3 ChIP-seq数据确定CaT2T的着丝粒,该数据清楚地划定了CaT2T中12个着丝粒的位置和边界。该研究还发现,着丝粒中的LTR插入爆发比整个基因组中的爆发要晚,这表明最近的着丝粒进化是由LTR入侵造成的。此外,共线性分析显示C. baccatum、C. pubescens和C. rhomboideum基因组中CRM反转座子富集的区域对应C. annuum中确定的着丝粒位置,这表明CRM是辣椒着丝粒的一种特征元件,可用于预测或识别辣椒着丝粒的位置。
  • (4)着丝粒和端粒具有转录和表观遗传活性

    基因组注释显示,CaT2T着丝粒中的60个基因在冷冻反应、DNA拓扑变化和减数分裂染色体分离等功能方面具有重要作用。相比之下,CrT2T着丝粒上编码了94个基因,富含对UV-B的响应、光合作用和昼夜节律调节。
  • (5)辣椒素生物合成途径的进化史

    辣椒素生物合成仅限于辣椒属作物,C. baccatum在约5百万年前与C. annuum和C. chinense分离,后者与不能产生辣椒素的C. rhomboideum在约13.4百万年前分化,这表明辣椒素生物合成途径可能是在约5-13.40万年前起源的。转录组分析显示CBG基因在辣椒果实中高度表达,而在不辣的植物如番茄、马铃薯、酸浆和野生辣椒中CS基因几乎不表达。
  • (6)染色质可及性调控组织特异性的辣椒素生物合成

    RNA-seq分析显示,CS及其转录调控因子MYB31和MYB48在胎座中特异性表达。提取了ATAC-seq鉴定到在多个CBG基因周围的OCR中发现了MYB等转录因子结合位点,表明转录因子(如MYB31)可能特异识别这些OCR区域内的顺式元件,实现在果实组织中协同调控CBG表达。

参考文献

[1]Chen, W., Wang, X., Sun, J. et al. Two telomere-to-telomere gapless genomes reveal insights into Capsicum evolution and capsaicinoid biosynthesis. Nat Commun 15, 4295 (2024).

拓展材料

  • 收藏好文

    育种专题 | 单体型基因组组装完整方案
  • 线上课程

    基于三代测序的基因组组装优势/流程/常用软件

更多内容,可扫描侧边栏"一对一业务咨询"二维码添加科研服务经理咨询。

售后服务可联系侧边栏"在线客服"、电话400-6581585,或发送邮件至 service@novogene.com

Copyright@2011-2024 All Rights Reserved    版权所有:北京诺禾致源科技股份有限公司    京ICP备15007085号-1

一对一业务咨询

一对一业务咨询

在线客服

联系方式

联系电话

400-658-1585

企业邮箱

service@novogene.com
返回顶部