表达谱芯片分析方案

表达谱芯片是从转录组层面通过碱基配对杂交来研究基因的表达模式以及基因表达量的大小。除了常见的聚类分析,我们通过差异基因筛选,分别研究差异基因在功能和信号转导通路层面的显著性水平,找到实验过程中最关键的功能和信号转导通路群体。将同时出现在显著性功能和信号转导通路中的差异基因之间的调控关系整理成网络,找出信号转导节点的核心调控基因。再通过共表达的手段来发现差异基因的内部联系规律,增加研究的创新型。

 

方案简介

1、随机方差模型(RVM)或limma算法能够在芯片实验每组样本重复样本数量较少的情况下,更有效提高了特征筛选的准确性,大大降低假阳性率。
2、将NCBI、Swissport/Uniport、AmiGO等数据库整合去冗余,把筛选出来的差异基因进行显著性功能分析,运用elim算法考虑GO的层次结构,将非特异GO的信息进行弱化,更加合理的得到GO的显著性水平。
3、将KEGG、Biocarta、Reactome等数据库整合去冗余,把筛选出来的差异基因进行显著性信号转导通路分析,基于超几何分布的Fisher精确检验来进行Pathway的显著性分析。
4、将显著性Pathway之间的调控关系整理成数据库,通过构建信号通路调控网络,从宏观层面描述Pathway之间的信号传递关系,在多个Pathway中发现受实验影响的核心Pathway,以及实验影响的信号通路之间的调控机理。
5、以显著性GO和显著性Pathway所包含的差异基因为研究对象,构建基因间的相互作用关系网络,从而得到差异基因构成的信号转导流程以及差异基因中起到中枢核心调控基因。
6、从芯片实测表达值层面进行共表达分析,通过比较两个网络的网络结构及基因的共表达能力,从中得到表达能力发生巨大变化的基因,从而反映样本在实验处理后的真实变化,共表达分析反映差异基因内部的联系规律,大大增加研究的创新性。

 

以上图片源自上海烈冰生物客户文献:

1.Genome-wide search for the genes accountable for the induced resistance to HIV-1 infection in activated CD4+ T cells: apparent transcriptional signatures, co-expression networks and possible cellular processes(2013年)
2.Mechanism of BDE209 induced impaired glucose homeostasis based on gene microarray analysis of adult rat liver(2014年)
3.Microarray Analysis of the Effect of Streptococcus equi subsp. zooepidemicus M-Like Protein in Infecting Porcine Pulmonary Alveolar Macrophage(2013年)

 


 

表达谱芯片数据深入分析

表达谱芯片是从转录组层面通过碱基配对杂交来研究基因的表达模式以及基因表达量的大小。除了常见的聚类分析,我们通过差异基因筛选,分别研究差异基因在功能和信号转导通路层面的显著性水平,找到实验过程中最关键的功能和信号转导通路群体。将同时出现在显著性功能和信号转导通路中的差异基因之间的调控关系整理成网络,找出信号转导节点的核心调控基因。再通过共表达的手段来发现差异基因的内部联系规律,增加研究的创新型。
聚类分析
针对多芯片结果进行了芯片间及差异表达基因之间的双向聚类,同时对新基因的功能进行预测,目的是对不同的样本进行分类,并对差异基因进行相似性分析。聚类方法包括层次聚类,K-means聚类及SOM等。
主成分分析
主成分分析(PCA) 在大规模基因表达数据的分析工作中,由于组织样本例数远远小于所观察基因个数,如果直接采用前述聚类分析可能产生较大误差,故需要对聚类算法进行改进。
基因功能分析注释(GO分类)
对差异基因进行相应的生物学功能分类,采用GO(gene ontology) 数据库中的功能聚类注释结果,并根据统计检验方法(P-value)筛选显著显异的分类。最后针对客户的需求进行结果的输出。
pathway分析
建立信号通路和生物功能网络,将差异基因与相关的信号通路进行比较、整合,找出基因之间的相互关系,进行通路动态仿真。并根据统计检验方法(P-value)筛选显著显异的代谢通路,已期对致病基因构建模拟疾病状态的通路网络,对目的基因进行分析,以期发现目的基因与疾病之间在生物学通路或生化途径上的关联。
基因富集分析(GSEA)
基因富集分析是用统计学的方法分析多类功能基因簇(gene set)是否在不同的生物样本组中存在差异。通过芯片实验数据的分析,寻找不同样品的差异基因可能的生物学功能,为后期实验提供参考。
转录因子(TF)分析
利用相关的转录因子(TF)数据库,采用pwmatch算法对每个转录因子分析其在差异基因中的分布情况,利用chi-square test等统计方法寻找有差异的转录因子。目的在于找到调控目标生物性状,统计学上有显著差别的转录因子。
共表达网络分析
对差异基因进行Co-expression基因调控网络的构建。采用贝叶斯方法,通过对表达数据进行机器学习,来构建差异基因之间的动态网络。这是一种数据驱动的网络构建,可以发现一些新的调控关系。
蛋白相互作用 Network分析
通过整合PubMed text mining,同源预测,基因neighbor,蛋白-蛋白相互作用,基因融合等数据,建立一个all differentially expressed genes in a single plot的调控网络。这是一种已有知识驱动的网络构建。目的在于对前人的研究结果和本实验的生物信息进行关联分析,以期找到一些新的基因共表达的线索,发现新的规律。
疾病的分型
主要是针对复杂的 ,利用芯片数据对这些疾病的子类型进行区分,识别传统诊断手段无法辨别,但对预后却有重要意义的亚型。
预测模型的构建
利用Bayesian network, PAM及SVM等机器学习语言对芯片结果进行预测模型的构建,将部分芯片数据拿来做预测模型,然后部分芯片数据作为测试数据集(独立样本)来验证模型的准确性。目的在于利用实验数据来筛选出一批靶标基因,并以此构建模型,以进行早期诊断、疾病预测和预后分析。
标志物预测分析(Prediction analysis for microarray)
多年以来,为了提高对肿瘤或其他疾病的早期检测,鉴别诊断,疗效观察,以及预后判断,人们从肿瘤细胞的化学特性,细胞病理、免疫反应和基因表达产物等诸多角度,试图寻找各种特异性强,灵敏度高的分子标志物。但由于技术手段所限,寻找分子标志物的工作繁琐棘手,而且准确率一直不理想。我们采用Prediction analysis for microarrays(PAM)分析工具,可以最终对芯片数据进行处理,筛选出最小数目的分析标志物。相对于传统方法,PAM方法筛选出的分子标志物准确性高,可靠性强。


 
 
关于烈冰
企业介绍
发展历程
技术实力
新闻动态
开发日志
产品服务
基因组
转录组
代谢组
微生物
生物信息
生物应用
云平台
临床检测
个体化医疗
环境检测
科学研究
测序平台
实际案例
研究成果
技术互动
合作客户
021-51827998电话:4000-651-811
邮箱:tech@novelbio.com

上海市闵行区新骏环路138号漕河泾开发区2号楼2F

加入我们|资讯平台|法律声明

版权所有@上海烈冰信息科技有限公司 2015    沪ICP备14047938号

沪公网安备 31011202001835号