LncRNA芯片数据分析

lncRNA是一类长度超过200nt的长链非编码RNA分子,可在多种层面调控基因的表达。目前发现的许多lncRNA都具有保守的二级结构,特殊的剪切形式及亚细胞定位。他们在基因组上相对于蛋白编码基因的位置一般可以分为五种:正义链(sense)、反义链(antisense)、双向(bidirectional)、内含子间(intronic)、基因间(intergenic),其所在位置与功能具有一定相关性。
lncRNA起初被认为是基因组转录的“噪音”,是RNA聚合酶II转录的副产物,不具有生物学功能。然而,近年来的研究表明,lncRNA参与了X染色体沉默,基因组印记以及染色质修饰,转录激活,转录干扰,核内运输等多种重要的调控过程,lncRNA的这些调控作用也开始引起人们广泛的关注
生物信息学分析快速开展lncRNA研究的必要手段,通过分析lncRNA特征及差异表达,可以快速定位所需要研究的lncRNA。
根据lncRNA在基因组上的位置,可将其分为5种类型:1. sense, 2. antisense, 3. bidirectional, 4. intronic, 5. intergenic。图中编码RNA和非编码RNA外显子分本别用蓝色和绿色表示。

lncRNA的作用机制。根据近年来所发现的lncRNA的作用机制,lncRNA主要可能具有以下几个方面的功能:
1)通过在蛋白编码基因上游启动子区(桔)发生转录,干扰下游基因(蓝)的表达(如酵母中的SER3基因)。
2)通过抑制RNA聚合酶II或者介导染色质重构以及组蛋白修饰,影响下游基因(蓝)表达(如小鼠中的p15AS)。
3)通过与蛋白编码基因的转录本形成互补双链(紫),进而干扰mRNA的剪切,从而产生不同的剪切形式。
4)通过与蛋白编码基因的转录本形成互补双链(紫),进一步在Dicer酶作用下产生内源性的siRNA,调控基因的表达水平。
5)通过结合到特定蛋白质上,lncRNA转录本(绿)能够调节相应蛋白的活性。
6)作为结构组分与蛋白质形成核酸蛋白质复合体。
7)通过结合到特定蛋白上,改变该蛋白的胞质定位。
8)作为小分子RNA,如miRNA,piRNA的前体分子转录

 

 

 


 

上海烈冰LncRNA深入数据分析流程

一.差异lncRNA的精确筛选
根据最新的HG19数据库版本对进行芯片产生的原始数据进行预处理、均一化后,利用国际上认可度比较高的统计学方法筛选出差异表达LncRNA.
二.差异lncRNA的重注释
由于lncRNA芯片的注释不太完善,且注释的准确性不高,需要将差异lncRNA在基因组上进行重定位,确定其在染色体上的位置及与其他基因的关系.
三 利用NBC自主研发的算法进行差异lncRNA靶基因预测
lncRNA的靶基因较为复杂,主要分为正式和反式两种作用机制.lncRNA作用机制与miRNA类似,均可以通过调控相应的mRNA来行使功能,所以靶基因的预测在科学研究中都显得非常必要,
四 靶基因Gene Ontology分析
我们将靶基因向gene ontology数据库的各节点映射,计算每个节点的基因数目.
五 靶基因Pathway分析
信号通路分析需要完备的注释信息支持,NovelBio整合了KEGG、Biocarta、Reactome等多个数据库的信息。靶基因落到pathway的过程类似一个无放回的抽取过程,该过程服从超几何分布,因此适合选择基于超几何分布的Fisher精确检验来进行Pathway的显著性分析。
六 lncRNA与调控基因的表达机制
通过整合lncRNA的信息和靶基因之间的关系,我们可以得到一个lncRNA与靶基因之间的调控网络图.
七 转录因子结合位点预测
对于差异表达lncRNA,提取转录起始位点上下游序列,使用预测程序对其转录因子结合位点进行预测.
八 与mRNA芯片关联分析
现在市面上的lncRNA芯片均含有mRNA的表达探针,通过将lncRNA的靶基因分析结果与芯片上mRNA的表达结果做关联分析,可以更进一步的分析lncRNA的功能。

 

九 信号通路调控网络构建(Pathway-Act-Network):
实验中基因同时参与了很多Pathway, NovelBio将所有Pathway之间的相互调控关系整理成数据库,通过构建信号通路调控网络,从宏观层面看到Pathway之间的信号传递关系,在多个显著性Pathway中发现受实验影响的核心Pathway,以及实验影响的信号通路之间的调控机理。

 

十 lncRNA的Biomarker分析
对于高通量lncRNA表达数据和海量lncRNA多态性数据,通过Marker的最优化筛选分析以及大量交叉检验后,研究者将获得严谨的、准确的、适用于更多样本的诊断组合。同时,Marker还将并行测试12种诊断模型,在交叉检验的严谨评估后,筛选出最优诊断效率的分子标志物与诊断模型组合,并提供最优诊断准确率。最终,Marker还将根据分子标志物与诊断组合部署诊断软件系统,并与研究者密切配合,周期性维护、校正软件诊断能力,从而供研究者大批量测试疾病样本或应用于临床诊断。
十一、lncRNA的功能分析
Novelbio根据lncRNA最新的功能数据库,利用生物信息学工具,做出Function-Tar-Net图表,从而得出lncRNA与功能的关系。如下图:

 

 


 
 
关于烈冰
企业介绍
发展历程
技术实力
新闻动态
开发日志
产品服务
基因组
转录组
代谢组
微生物
生物信息
生物应用
云平台
临床检测
个体化医疗
环境检测
科学研究
测序平台
实际案例
研究成果
技术互动
合作客户
021-51827998电话:4000-651-811
邮箱:tech@novelbio.com

上海市闵行区新骏环路138号漕河泾开发区2号楼2F

加入我们|资讯平台|法律声明

版权所有@上海烈冰信息科技有限公司 2015    沪ICP备14047938号

沪公网安备 31011202001835号