转录组测序

转录组是特定组织或细胞在某一发育阶段或功能状态下转录出来的所有RNA的集合。转录组研究能够从整体水平研究基因功能以及基因结构, 揭示特定生物学过程以及疾病发生过程中的分子机理。RNA-Seq 作为一种高效、快捷的转录组研究手段正在改变着人们对转录组的认识。RNA-Seq 利用高通量测序技术对组织或细胞中所有RNA 反转录而成的cDNA 文库进行测序, 通过统计相关读段(reads)数计算出不同RNA 的表达量,发现新的转录本; 如果有基因组参考序列, 可以把转录本映射回基因组,确定转录本位置、剪切情况等更为全面的遗传信息, RNA seq已广泛应用于生物学研究、医学研究、临床研究和药物研发等。
一.测序质量分析
对测序的原始数据进行初步质量分析,对低质量数据进行过滤,并给出测序质量信任度报告。

 

二.测序序列比对   
获得RNA-seq的原始数据后,首先需要将所有测序读段通过序列映射(mapping)定位到参考基因组上。我们通过与UCSC提供的标准参考序列(reference sequences)进行比对,结合客户要求选择不同的比对软件和参考序列。统计比对结果,例如唯一比对率,高质量比对率等。然后,我们可以基于多个数据库(客户自选)将测序结果定位到不同的注释中,比如基因组、外显子数据库、内含子数据库、UTR数据库、refseq基因库、miRNA数据库、ncRNA数据库、EST数据库、Ensemble数据库、调控位点数据库等等。然后给出测序结果在注释中的分配情况,制作成饼图进行展示。
三.测序序列可视化
提供特定格式文件,帮助客户实现RNAseq中Reads的可视化.例如:IGV,UCSC browser,Samtools

 

四.基因表达量定量
对RNA-seq的比对结果用RPKM(Reads Per Kilobase of exon per Million mapped sequence reads)的手段进行基因表达定量(Ali Mortazavi,2008)。RPKM是将map到基因的read数除以map到genome的所有read数(以million为单位)与RNA的长度(以KB为单位)。
其公式为:

 

其中,total exon reads / mapped reads (millions) 可以视为所有read 数中有百分之多少是map 到这个基因,然后再除以基因长度,就可以某基因得到单位长度有百分之多少的total mapped read 有表现。
五.表达水平整体分析
对表达水平进行总体分析,制作PCA图、聚类分析图等。

 

六.基因差异表达筛选
由于测序技术有更大的通量,并且可以获得新的转录本的信息,所以在做样本间不同表达基因的筛选的时候优势很大。对于不同的样本信息,采取不同的统计手段,比如student-t test, F-test等得到不同样本间特异表达的基因或基因集团。
七.基因本体分析(Gene Ontology Analysis)
对于得到的特定基因分类,我们基于权威的GO数据库进行功能分析,并得到可能的富集功能,绘制柱形图和表格。

 

八.KEGG Pathway Analysis
结合KEGG pathway等数据库,将得到的特定基因分类进行Pathway显著性分析。分析每个Pathway中所包含的差异基因个数,我们采取超几何分布检验等统计手段计算出反映Pathway中差异基因分布富集显著性的P-value,根据P-value大小判断差异基因在生物通路中富集程度,并最终得到显著富集的生物信号通路图。

 

九.差异基因上游序列的motif分析
针对特定转录因子的实验,可对差异基因进行转录因子结合位点的motif分析,从而推测差异基因中有哪些基因可能直接受该转录因子调节。

 

十.基因间相互作用关系分析(Gene-Act-Network)
实验中基因同时参与了很多Pathway,如果仅研究一个信号转导通路,直接将差异基因基因定位到Pathway即可,如果涉及基因较多,那么由于基因在多个PATHWAY中的交叉效应,会使基因间的调控过程变成复杂的调控网络。NovelBio将参与Pathway所有基因间的调控关系整理出来,通过信号转导网络的构建,可以轻松的发现基因间信号转导的脉络,以及处于信号转导节点的核心调控基因,甚至可以模拟出从药物靶蛋白(敲除的基因或者过表达的基因)到下游差异基因的全部信号转导流程,从而发现实验处理导致基因表达差异的原因。

 

十.基因间表达协同能力分析
基因表达强度的变化规律客观反映了基因间内在联系及动力学特点。根据实测数据的相关性,预测基因间存在的共表达关系,以此构建基因间共表达作用网络,然后根据图论计算每个基因在网络中的共表达能力。如果构建基因在实验组和对照组状态下的共表达情况,通过比较每个网络的网络结构及基因间的共表达能力,从中得到共表达能力发生巨大变化的基因。

 

十一.Gene与蛋白之间的关系
多个PATHWAY中的交叉效应,会使基因与蛋白间的调控过程变成复杂的调控网络

 

十二.物种近缘性分析

 

 


 
 
关于烈冰
企业介绍
发展历程
技术实力
新闻动态
开发日志
产品服务
基因组
转录组
代谢组
微生物
生物信息
生物应用
云平台
临床检测
个体化医疗
环境检测
科学研究
测序平台
实际案例
研究成果
技术互动
合作客户
021-51827998电话:4000-651-811
邮箱:tech@novelbio.com

上海市闵行区新骏环路138号漕河泾开发区2号楼2F

加入我们|资讯平台|法律声明

版权所有@上海烈冰信息科技有限公司 2015    沪ICP备14047938号

沪公网安备 31011202001835号