诺禾致源

 > 

科技服务

 > 

基因组测序

基因组Survey—全面了解物种基因组特征

基因组Survey基于小片段文库的低深度测序数据,通过K-mer分析,从而有效的评估基因组大小、GC含量、杂合度以及重复序列含量等信息,是全面了解某一物种基因组特征的有效方法,为后续的全基因组 de novo 测序组装策略的制定提供理论依据。

诺禾优势

  • 1.方法优,周期短,准确度高

    基于K-mer分析,可快速确定基因组特征,该方法已广泛应用于评估基因组基本特征。
    • 30

      项目周期
    • K-mer

      分析方法
    • 99%

      准确率
  • 2.科学方案设计

    从材料选取,建库测序,到数据分析, 每一步都需要科学、缜密的设计,以保障高质量研究成果。

    材料选取

    DNA样品
    10μg

    文库构建
    350bp

    PE150测序

    信息分析

  • 3.分析全面

    测序深度为50×,基于小片段数据,通过K-mer分析,预估物种基因组大小,并对物种基因组, 重复序列情况进行分析。对基因组进行初步组装,进行GC含量和外源污染分析。
    基因组Survey 分析内容
    标准分析 基因组大小评估
    杂合度评估
    重复率评估
    初步组装
    GC含量评估
  • 4.悦读高质量测序数据,尽享HPC澎湃动力

    基因组Survey采用先进的Illumina测序平台,快速、高效地读取高质量的测序数据。 诺禾致源高性能计算平台(High Performance Computing,HPC)采用DELL计算节点和Isilon存储的高效组合,实现快速稳定的测序数据分析及交付。随着公司业务的发展,高性能计算平台将会持续更新并扩容, 以保证高效的数据处理和安全的数据存储。
    • 20,280个

      物理核数
    • 1,727 T flops

      计算峰值速度
    • 400 TB

      总内存
    • 58.6PB

      总储存
  • 5. 出色完成每一个项目环节

    诺禾致源已经成功对经济作物、粮食作物、园艺植物、无脊椎动物、海洋动物等多种物种进行基因组特征评估,结合丰富的项目经验,专业的项目方案指导和分析流程, 保证快速、准确的评估基因组特征
    • 50人

      分析团队
    • 8年

      项目经验
    • 500+

      结题项目
    • 1对1

      项目服务

常见问题

  • 1.怎样评估研究物种的基因组大小?

    • (1)网站查询
      查询植物基因组大小的网站:http://data.kew.org/cvalues
      查询动物基因组大小的网站:http://www.genomesize.com
      (2)流式细胞仪方法br 流式细胞仪是目前比较常用的估计基因组大小的实验方法。可以老师自己做流式评估,也可以我们帮助老师联系相关公司去做。
      (3)Survey 评估
      Survey分析,即将测序得到的 reads 打断成 K-mer,通过 K-mer 分析,从数学的角度评估基因组的大小,杂合以及重复等信息。并进行初步组装,从初步组装的 Contig 的 GC 分布图上,判断该物种是否有污染等信息,从而为后续组装策略的制定提供可靠的依据。为什么一定要做Survey?
  • 2.Survey是评估基因组的有效手段,对于没有参考基因组的物种,在启动de novo 项目之前,对基因组特征评估是十分必要的,基因组大小及复杂状况直接影响到项目价格,周期以及后续的组装策略等。 Survey评估和流式细胞仪评估有什么区别?

    • 两者都可以对基因组的大小进行评估,Survey评估中的K-mer分析是从数学角度上进行分析的,得到的信息更为全面和准确。而流式则是通过实验的手段,主要通过已知内参物种基因组大小来 评估被测物种的基因组大小。由于内参选择不同,实验预估基因组大小与实际会有一些偏差。
  • 3.做了基因组Survey是否就一定不用做流式了呢?

    • 不是。我们一般建议老师在做Survey之前先做一下流式对基因组大小有个初步的预估。原因如下:K-mer分析中,我们把K-mer分布最多的峰为主峰,主峰前的1/2的峰称为杂合峰,把主峰后2倍的位置 的峰称为重复峰。若出现主峰判断不清的时候,一般可以结合流式的结果来对我们的判断进行验证。
  • 4.K-mer分析时,为何选的K-mer长度不一样?

    • 一般来说,用来预估基因组大小的k-mer我们选取17-mer,其原因是ATCG四种不同的碱基若组成长度为17的核苷酸片段,在经过不同的排列组合可出现417种可能性,也就是17G足以覆盖一般的正常基因组;如果选择15的话,则只有415,只有1G的可能,对于正常的基因组可能覆盖度不够。导致估计不准确,当然对于较大的基因组(>15G),我们会尝试采用19-mer进行评估。 由于Reads上存在错误碱基,K-mer并非越大越好,若K-mer选择的越大,则包含这个错误位点的K-mer的个数就会越多。 另外为了避免回文序列,K-mer分析选择K长度均为奇数。而对于高重复的重复,我们通常会选择一些长度较长的K-mer,这是因为较大的K-mer能够跨过一些高重复区域,对于组装具有较好的结果。

拓展材料

更多内容,可扫描侧边栏"一对一业务咨询"二维码添加科研服务经理咨询。

售后服务可联系侧边栏"在线客服"、电话400-6581585,或发送邮件至 service@novogene.com

Copyright@2011-2024 All Rights Reserved    版权所有:北京诺禾致源科技股份有限公司    京ICP备15007085号-1

一对一业务咨询

一对一业务咨询

在线客服

联系方式

联系电话

400-658-1585

企业邮箱

service@novogene.com
返回顶部