外显子组测序

外显子是人类基因的一部分,包含着合成蛋白质所需要的信息。全部外显子,称为“外显子组”(Exome),只占人类基因组的百分之一。外显子组测序是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后进行高通量测序的基因组分析方法。由于外显子组测序只需针对外显子区域的DNA即可,因此远比进行全基因组序列测序更简便、经济、高效。它可用于寻找复杂疾病如癌症的致病基因和易感基因等的研究。同时,基于大量的公共数据库提供的外显子数据,科学家们能够结合现有资源更好地解释研究结果。

 

1. SNP位点过滤
1)Nocall rate>=10%
2)最小等位基因频率,Minor allele frequency<0.05
3)不符合哈维平衡的位点,HWE P value<0.001 的位点

 

2. 频数统计
计算case/control 组中各等位基因和基因型的频率

 

3. 关联分析
1)样品群的分层分析
2)卡方检验、Fisher精确检验,比较各allele的频率分布在case和control两组中是否具有统计学差异
3)卡方检验、Fisher精确检验和Cochran-Armitage趋势检验,比较各基因型频率分布在两组中是否具有统计学差异

 

4. 单倍型分析
1)选取包含显著的SNP的区段进行单倍型分析,以进一步定位候选区段
2)频率较高的几种单倍型各自的频率,在case/control两组中的分布状况,卡方统计量及p值,判断单倍型与疾病相关性

 

 

 


 

上海烈冰深入数据分析项目

1测序结果定位到基因组
使用相应的mapping软件(如MAQ等)将测序结果定位到人类基因组上(hg19),MAQ通过贝叶斯方法计算mapping quality,从而推算出一些不同于reference genome的变异体,包括SNP和短的缺失片段。将那些没有定位在目标区域(Exon之外)的序列摒弃,计算测序的深度或者覆盖率,统计可以定位到基因组上的reads的百分比、定位到exome上的百分比等等。但是由于MAQ不允许gap alignment,我们使用BWA方法检测缺失片段。
2得到candidate variant
MAQ和BWA可以得到可能的变异体,使用SAMtools得到SAM格式的数据,这个数据存储着测序序列和reference genome比对的情况,任何和reference genome不同的碱基都被当作可能的变异体(SNVs, single nucleotide variants)进行后续分析。
3 筛选variant
a) 使用Phred,得到每个碱基的quality score,去掉那些quality score小于45的candidate variant。
b) heterozygous variant应该具有10倍以上的覆盖率,并且相应的序列应该具有不同的起始端和终止端,不满足这个条件的需要筛掉。
c) 人类基因组中存在正常的SNPs,基于dbSNP数据库,筛掉这一部分候选。
4 variant分类
基于这些variant所在的位置,以及可能产生的后果可以将其分成不同的类别。包括synonymous variant, non-synonymous variant, premature termination, splicing site, indels等等。统计这些变异体的数目和基本信息。
5 实验验证
对于得到的candidate variant,使用Sanger sequencing方法测序,验证以上方法得到的变异体是否为真,统计实验的可靠性。
6 基因功能关联分析
如果得到较少的和所研究表型相关的基因变异,进行文献查阅,得到可能相关的基因功能,以支持实验结果。如果得到比较多的相关基因,选择GO Analysis,验证是否变异的基因富集了和特定表型相关的功能。
7 个性化定制分析
针对项目的特殊需求,制定多种方案供选择并开发相应的分析软件,满足客户的特定需求。


 
 
关于烈冰
企业介绍
发展历程
技术实力
新闻动态
开发日志
产品服务
基因组
转录组
代谢组
微生物
生物信息
生物应用
云平台
临床检测
个体化医疗
环境检测
科学研究
测序平台
实际案例
研究成果
技术互动
合作客户
021-51827998电话:4000-651-811
邮箱:tech@novelbio.com

上海市闵行区新骏环路138号漕河泾开发区2号楼2F

加入我们|资讯平台|法律声明

版权所有@上海烈冰信息科技有限公司 2015    沪ICP备14047938号

沪公网安备 31011202001835号