苏震实验室


| 研究方向| 实验室成员| 论文专利| 数据库| 网络资源| English Version|
  


实验室研究方向:

20045月本实验室建立以来,致力于与农业生产密切相关的重要动植物生物信息学、功能基因组学和系统生物学研究,主要从以下几个方面展开:

(1)整合基因组学、转录组学、表观基因组学、蛋白质组学和代谢组学等综合信息,构建重要动植物功能基因组综合信息平台
随着高通量技术的发展与应用,公共数据库中的组学数据比任何一个实验室能产生的数据都多,具有更丰富的知识含量,并将提供更开阔的生物学研究视角。然而,信息的海量积累和技术平台的多样性给数据处理带来了多重挑战,急需数据整合的方法和思路。本课题组针对农业生物学研究的需求,已公开发布20余个数据库和网络服务 ,主要包括:

  i. 基因功能富集分析工具平台 (EasyGO/agriGO/PlantGSEA)
 ii. 植物非编码RNA数据整合与分析平台(PMRD/PNRD)
iii. 植物基因组学、转录组学、表观基因组学数据整合(PCSD)
iv. 植物功能基因组学数据整合与分析平台 (SFGD/SIFGD/GraP/ccNET等)

(2)通过对大规模表观基因组和转录组数据分析,研究基因表达调控机制
构建了识别节律性基因表达的算法ARSER/LSPR,并应用于拟南芥和水稻高通量时序基因表达谱分析; 利用ChIP-seq手段绘制了水稻callus和seedling组织的H2A.Z组蛋白变体的表观基因组学图谱 ,较为系统地分析了其在不同组织和不同时间下的分布特征,以及对基因表达的调控作用;通过对表观基因组学数据整合分析,挖掘水稻 、棉花等基因组中新的转录本;利用DNase-Seq手段研究了拟南芥在长时间黑暗处理下染色质结构的变化特征;等等。

(3)以系统生物学手段,在跨平台数据挖掘的基础上,展开与植物生长发育及应答逆境胁迫等相关的功能基因研究
系统研究水稻和拟南芥SPX基因影响生长发育和环境应答的分子机制;探索拟南芥和棉花JAZ家族基因在 叶片衰老和水分胁迫适应性的分子机制;对植物时序(如昼夜节律变化,叶片衰老等)的动态基因表达调控和表观遗传变化的规律进行探索,以期发现时序转录调控的关键因子,并尝试跨物种表观基因组比较分析(包括拟南芥、水稻 、棉花和玉米等)。
 

实验室研究项目:  

基于表观基因组与转录组数据的整合挖掘以及基因调控网络的动态解析构建棉花基因组结构与功能注释体系: 国家自然科学基金资助项目

多维组学数据集成分析以探索叶片衰老的转录和表观遗传调控机制: 国家自然科学基金资助项目

优质性状的分子机制与设计:国家重点基础研究发展计划(973计划)项目〈水稻优良品种的分子设计研究〉子课题 ,已结题

植物应答高盐、低温胁迫的分子调控网络机制研究: 国家重点基础研究发展计划(973计划)项目〈作物适应高盐、低温胁迫的分子调控机理〉子课题,已结题

能源高粱等能源植物选择性培育及遗传学规律: 国家重点基础研究发展计划(973计划)项目〈草本能源植物培育及化学催化制备先进液体燃料的基础研究〉子课题 ,已结题

降解农药残留的水稻细胞色素P450的功能基因组研究: 国家自然科学基金资助项目,已结题

小RNA网络数据资源整合体系: 国家高技术研究发展计划(863计划)项目《网络海量RNA数据搜索、二次挖掘与应用集成软件开发》子课题,已结题

拟南芥JAZ家族基因在茉莉酸和脱落酸间交互作用及协调水分胁迫适应性的分子机制研究: 国家自然科学基金资助项目,已结题

水稻籼粳亚种间细胞凋亡差异反应的分子机制研究: 国家自然科学基金资助项目,已结题

棉花和拟南芥应答水分胁迫的转录组数据比较分析及基因表达调控网络的构建: 国家自然科学基金资助项目,已结题

植物表观基因组和转录组数据整合及其时序动态变化规律探索: 国家自然科学基金资助项目,已结题

 

实验室主要研究进展:  

1、以Gene Ontology为主的基因功能富集分析工具平台的维护与升级(EasyGO/agriGO/PlantGSEA):

agriGO及其旧版EasyGO是针对农业物种的基因功能分类(GO)的分析工具,可以快速便捷地对大规模基因组学或功能基因组学实验结果进行功能分类,相关的论文于2007和2010年先后发表于BMC Genomics和Nucleic Acids Research上。我们在EasyGO/agriGO工具的基础上,整合其它一些注释工具如:KEGG、MapMan、文献中的基因功能相关数据,以及基因组上的一些非编码位点(如non-coding RNA、顺式作用元件等),进一步设计并构建了植物基因功能注释富集分析平台(PlantGSEA),相关的论文年发表在Nucleic Acids Research的Web server issue上目前EasyGO/agriGO/PlantGSEA相关论文的SCI引用合计已达1500余次,agriGO的论文被Faculty of 1000 Biology推荐,并被ESI收录为高被引论文,EasyGO/agriGO已成为AgBase Workshops中介绍的主要分析工具之一。

在线分析平台EasyGO/agriGO/PlantGSEA自发布以来,完成了十几万次在线分析,访问者来自70多个国家的3000多个IP地址。2017年应Nucleic Acids Research杂志的邀请,我们做了agriGO的升级版,agriGO v2.0版本的论文已发表于2017年的web server专刊上。 这次升级主要专注于分析平台的支持范围,目前agriGO v2.0平台已涵盖和农业相关的394个物种,包括865种数据类型,我们对平台结构做了一定的优化,以便使用者查找相应的物种及数据类型。同时,我们根据十多年来数据分析平台的维护经验,并总结了使用者的各项要求,研发了一些方便使用的工具,如batch analysis、SEACOMPARE、PVD等等,特别还对用户自定义类型的分析做了优化。

2植物非编码RNA数据整合与分析平台建设:

PMRD 是我们研发的国际上首个全面性的植物microRNA 数据库,相关的论文2010年发表在Nucleic Acids Research的Database issue上,PMRD论文的SCI引用已达162次。针对目前在植物非编码RNA领域研究的特点,结合我们前期在植物microRNA数据整合的经验积累,我们开发了一个升级版的PMRD数据库,命名为PNRD:植物非编码RNA数据库。相关的论文2015年也发表于Nucleic Acids ResearchDatabase issue上,目前SCI引用47次。植物非编码RNA数据整合与分析平台PMRD/PNRD自发布以来,已被访问8万余次,访问者来自70多个国家的2万余个IP 地址。

3、植物基因组学、转录组学、表观基因组学数据整合与挖掘 :

随着植物表观遗传学的发展,植物表观基因组数据也呈大幅增长的趋势,而对这些数据的整合、挖掘是一个新的挑战。2008年开始,我们逐步展开了植物表观基因组学的研究,首先是利用自行产生的水稻ChIP-seq(包括H3K4me3H3K4me2H3K9acH3K27ac 等)数据、mRNA-seq 数据,以及公开发表的DNase-seq数据,构建了一个高通量测序数据分析流程,根据基因组和数据的特点优化了参数,并进行了数据整合与挖掘。还利用UCSC基因组浏览器将数据整合结果以图形化的方式展示出来,目前我们定制的UCSC基因组浏览器平台已可支持多个植物物种,包括拟南芥、水稻、玉米、棉花等。同时,我们利用ChIP-seq手段,首次绘制了水稻callusseedling组织的H2A.Z组蛋白变体的表观基因组学图谱,结合我们自行构建的数据整合平台和数据分析流程进行分析与挖掘,研究了在水稻中H2A.Z组蛋白变体与其它表观修饰因子的关系(如:DNase I超敏感位点、H3K4me3H3K27ac组蛋白修饰、DNA甲基化等等),以及H2A.Z对基因表达的调控作用。这些工作已发表在Molecular PlantPlant Journal杂志上。

近年来,我们重点关注于如何有效整合分析植物表观遗传信息、特定转录因子结合位点、表观基因组学和转录组学等高通量测序数据,探索染色质结构和基因组稳定性对基因表达的调控机制。全基因组染色质状态(chromatin states)图谱可以显示染色质修饰在整个基因组范围内的分布模式和标识染色质特征。表观遗传修饰标记的分布模式具有位点特异、动态变化、相互偶联和高度复杂性等特征。我们根据多年积累的表观基因组数据整合分析和挖掘经验,利用Hidden Markov Model定义植物基因组的染色质状态(chromatin states),并采用self-organization mapping (SOM)方法和UCSC基因组浏览器平台作为可视化工具,构建了一个植物染色质状态数据库-PCSD。在这个数据库中,我们整合了216组拟南芥、100组水稻和95组玉米的表观基因组数据, 构建了36个拟南芥染色质状态(包含290,553片段),38个水稻的染色质状态(包含831,235片段)和26 个玉米的染色质状态(包含3,936,844片段)。PCSD数据库里包含基本的查询和浏览功能,支持对这些表观基因组数据之间的比较分析,并能与其它功能分析工具如agriGOmotif分析等相对接。同时也提供了自定义分析工具,以便使用者利用PCSD平台分析自行产生的数据。PCSD平台可以帮助使用者挖掘感兴趣基因的表观遗传调控位点(如启动子、增强子、转录激活和抑制区域等)。PCSD文章于2018年正式发表在Nucleic Acids Research杂志的Database专刊上。

4、植物/作物功能基因组学数据整合与分析平台的构建:

我们以多维组学数据整合(包括自行产生的转录组、表观基因组数据,和公共平台上的基因组、转录组等数据)为基础,以关键基因家族注释、Gene Ontology注释和基因簇分析、以及基因表达调控网络为核心,构建了多个植物(作物为主)功能基因组数据整合、基因功能挖掘与分析的平台,目前已完成与玉米、大豆、苜蓿、谷子、高粱、棉花等相关的功能基因组学平台建设,以期成为预测与作物农艺性状(品质、产量,耐逆抗病等)相关的关键基因及功能模块的数据挖掘和分析平台。

其中棉花功能基因组学平台的构建是随着国际上棉花全基因组测序工作的进展逐步展开的 :自2008年起,我们根据国内、国际上棉花全基因组测序计划的进程,和农科院棉花所等单位合作,先从棉花应答非生物胁迫的转录组图谱绘制做起,逐步积累数据,先后发表了陆地棉TM-1应答盐胁迫的转录组分析(论文2011年发表于Genomics),陆地棉不同品种应答盐胁迫的转录组比较分析(论文2015年发表于Plant Science),亚洲棉应答盐和渗透胁迫的转录组分析(论文2013年发表于PLoS ONE),亚洲棉应答盐和渗透胁迫的miRNA-seq分析等。随着雷蒙德氏棉全基因组测序结果的发表,构建了雷蒙德氏棉功能基因组学平台(论文2015年发表于Database);亚洲棉和陆地棉的全基因组测序结果陆续发表后,我们整合了自有的和公共平台的转录组数据,构建了棉花基因共表达网络动态分析平台(相关论文2016年先后发表于Nucleic Acids ResearchScientific Reports);并且完成了棉花组蛋白修饰的表观基因组图谱,结合转录组数据对亚洲棉和陆地棉的基因组进行进一步注释,发现了10000多个新基因(论文已发表在Scientific Reports上)。

5、基于组学数据挖掘解析拟南芥JAZ7和水稻OsSPX1基因功能

2005年起,利用自行整合的1700多个Affymetrix 拟南芥基因芯片数据进行数据挖掘分析,我们发现ZIM家族(2007年被命名为JAZ家族)基因与多种胁迫应答有关。接下来通过叶片衰老相关表达谱数据挖掘,我们发现多个JAZ家族基因在黑暗处理后发生了显著的变化,JAZ基因突变体表型分析显示jaz7突变体在黑暗处理后叶片衰老的表型最为明显。我们通过生理指标测定、转基因株系(包括过表达株系、恢复突变株系)分析、双突变体(jaz7×coi1jaz7×myc2)遗传分析、转录组分析等进一步解析了JAZ7基因影响黑暗诱导叶片衰老过程的分子机制,相关文章2015年发表于Journal of Experimental Botany杂志上。

与此同时,我们还对拟南芥和水稻 SPX 结构域蛋白的进行了系统的进化分析,并根据转录组数据分析提出水稻SPX基因可能与其耐冷性相关,并将 OsSPX1 基因转到烟草和拟南芥中,证实转OsSPX1基因烟草和拟南芥的耐冷性明显增强,其电导率增加缓慢,脯氨酸和蔗糖含量比野生型增加的更高。同时我们构建了水稻OsSPX1转基因株系,包括OsSPX1-senseOsSPX1-antisense株系,对OsSPX1对水稻的抗冷与抗氧化的协同作用做了进一步研究。利用这些水稻转基因材料我们还对OsSPX1基因影响水稻产量性状,如结实率、花粉发育等的表型,做了连续多年的观察并对其分子机制进行了初步分析。这些相关工作已陆续发表(2009Plant Biotechnology Journal杂志,2013PloS ONE杂志,2016Plant Biotechnology Journal杂志)。

 

 

地址:中国北京海淀区圆西路2号|邮编:100193|电话:+86(10)62731214|Email:genome01ATcau.edu.cn

Copyright© |中国农业大学苏震实验室| 2017 | All right reserved | Last updated: March, 2016