基于转录组测序的植物染色体加倍相关研究

  众所周知,杂交后代的基因组一般更加复杂,同时由于继承了来源不同的调控元件,比如miRNA、lncRNA等等,他的调控因子也更加丰富。在这样的背景下,他的基因表达模式势必具有一定的特异性,这些因素综合在一起,最终导致了表型上的杂种优势。随着高通量测序技术的蓬勃发展,我们现在就可以利用RNA-seq的技术从基因表达层面去探究杂交种的差异表达模式,同时结合miRNA测序技术去研究miRNA这一个重要调控因子对基因表达影响。

  图1 杂交优势复杂的分子机理

  杨树是重要的经济、生态树种。上世纪50年代至今,科研人员培育出数代优秀的杨树杂交种,其生长速率、抗性和材质等指标都呈现出明显的杂种优势。但由于林木的遗传背景复杂,目前对杨树杂种优势的分子机理研究较少。

  2014-2015年,烈冰高通量测序和生物信息团队“四连助攻”了北京林业大学杨树育种课题组,利用RNA-seq和生信分析揭示了3倍体杂交杨树中等位基因差异表达、杂种与亲本间基因差异表达的机制, 探究了杨树3倍体杂种优势和多倍化的相关分子机理。



图2 烈冰杂交优势RNA-seq分析的基本框架

1. 实验设计和样本信息

 
图3 三倍体杂交杨树的父母本信息


图4 三倍体2n配子的不同形成机制

  北京林业大学杨树育种课题组一直深耕于杨树育种领域,他们以二倍体杂交品种ZY3为母本,利用育种手段获得了形成机制各异的三种2n配子(FDR、SDR、PMR),再与二倍体杂交品种BJY的花粉进行杂交实验,成功获得了三类不同的3倍体杂交杨树。由于这三类异源3倍体2n配子的形成机制不同,因此2n配子的杂合度各不相同,导致这三类异源3倍体杂交杨树在生长发育和光合指标上也呈现出各自不同的特征。这正是研究多倍化杂种优势的优良材料,研究者分别选择这三类3倍体杂交种、2倍体杂交种及其2倍体亲本群体为材料,利用RNA-seq技术研究染色体加倍后与光合碳同化相关基因变化,解析3倍体群体光合作用相关差异基因转录与表达水平和模式;探讨杂和性不同的2n配子类型来源的3倍体群体间,以及光合速率显著差异3倍体间在转录和翻译水平的基因差异表达变化;构建3倍体相关差异基因调控网络;阐明杨树3倍体营养生长遗传调控机制,从而揭示杨树异源3倍体营养生长优势形成的分子基础,为进一步制定杨树以及类似植物3倍体育种策略提供依据。

术语解释

2n配子:未减数分裂的配子,或者是减数分裂后又经诱导加倍的配子。下述的FDR、SDR、PMR正是形成2n配子的三种不同的方式
FDR:first-division restitution,第一次减数分裂核再组
SDR:second-division restitution,第二次减数分裂核再组
PMR:post-meiotic restitution,减数分裂后再组

图5 杂交杨树RNA-seq分析主要流程

图6 FDR组样本的株高表型差异

图7 PMR组样本的株高表型差

表1 SDR组样本的株高表型差异

2. 差异基因的筛选

  RNA-seq的原始数据经过数据过滤获得cleanreads,将clean reads mapping至杨树的基因组获得mapped reads。根据mapped reads利用Limma软件包计算差异表达基因。

图8 差异表达算法计算出的2倍体、3倍体杂交后代与亲本之间的差异表达基因

  从差异表达的基因开始就进入了杂交RNA-seq的核心分析步骤——非加性分析、超亲分析、亲本显性分析,该核心步骤分析得到杂交子代和亲本间DEG(差异表达基因)的表达模式。

  从差异基因中筛选出与亲本基因表达量的中值(mid-parent value,MPV)在统计学上有差异显著的基因,即非加性基因(pvalue<0.05)(对于3倍体杂交种,母本和父本对MPV贡献度比为2:1;而对于2倍体杂交种,父母本对MPV贡献度比为1:1)。比较后代与两亲本的基因表达模式,找到超亲基因和亲本显性表达模式。 

3. 非加性基因分析

图9 通过差异表达算法计算出的三种3倍体杂交杨树(a图)和2倍体杂交杨树(b图)的非加性基因

图10 SDR类型高的杂交子代与亲本之间的差异基因的GO注释(p<0.05),主要集中在代谢过程方面

图11 FDR类型长势高的样本与亲本的差异表达基因的GO和KEGG注释

图12 3倍体杂交杨树和2倍体杂交杨树的非加性基因的GO注释

图13 3种3倍体杂交种和2倍体杂交种的非加性基因的维恩分析图 

4. 亲本显性和超亲分析

图14 亲本显性表达模式图 ELD-Zheyin3#母本显性;ELD-BJY父本显性。x轴是FPKM,y轴是LOG2(FPKM)。

图 15 亲本显性基因的维恩分析图。

图 16 2倍体杂交后代和三种3倍体杂交后代超亲基因的分类与统计

图17 显著上调的超亲基因的GO注释主要与DNA甲基化、组蛋白赖氨酸的甲基化、组蛋白H3-K9的甲基化、RNA甲基化和细胞增殖相关

图 18 3种3倍体杂交种与2倍体杂交种的差异基因统计

图19 三种三倍体杂交种两两之间的差异基因统计

5. 其他分析

图20 利用基因-样本矩阵,对基因的相互作用关系进行动力学仿真及共表达相关性计算,以此构建基因间的共表达网络 

6. 结论

  在FDR内部,长势高的杂交后代与亲本之间的差异基因主要集中在细胞增殖、分生组织的形成、转录因子、DNA和RNA的甲基化相关。
在SDR内部,长势高的与长势低的样本之间的差异基因主要集中在代谢过程、生长激素的极性运输和分生组织的发育调控方面。 在PMR内部,三倍体子代与亲本之间的差异基因主要集中在细胞分化、分生组织的发育以及生长激素、赤霉素、茉莉酸相关的功能。 通过非加性分析、超亲分析、亲本显性分析揭示了3种不同类型3倍体杂交子代在基因表达模式上与2倍体亲本和2倍体杂交F1代之间显著地差异性。并且在异源3倍体杂交后代中呈现明显的亲本显性表达模式。而这种差异性与其各自2n配子的杂合度呈现一致的趋势。从非加性基因和超亲基因的数目上来看,FDR类型的三倍体杂交后代非加性表达和超亲表达的比率更高。 图17和图18的比较可以得出这样的结论:FDR类型的三倍体杂交后代跟其他类型的3倍体和2倍体相比,差异基因的数目更多。这些差异基因主要是集中在碳同化与应激相关的生物过程中。可能的原因是FDR类型2n配子具有更高的杂合度(如图4)。 三倍体杂交后代的非加性基因集中在甲基化和细胞增殖相关的功能上通过共表达网络分析确定了与生长发育、分生组织的发育、顶端分生组织形成相关的候选基因。这些候选基因主要受主要生长素响应因子(ARF)和乙烯响应因子(ERF)这两类转录因子调控。

关于烈冰
企业介绍
发展历程
技术实力
新闻动态
开发日志
产品服务
基因组
转录组
代谢组
微生物
生物信息
生物应用
云平台
临床检测
个体化医疗
环境检测
科学研究
测序平台
实际案例
研究成果
技术互动
合作客户
021-51827998电话:4000-651-811
邮箱:tech@novelbio.com

上海市闵行区新骏环路138号漕河泾开发区2号楼2F

加入我们|资讯平台|法律声明

版权所有@上海烈冰信息科技有限公司 2015    沪ICP备14047938号

沪公网安备 31011202001835号