首页->研究

   

本中心主要从事以下五个方面的研究:

·
RNA二级结构预测 方法研究
·非编码RNA基因的预测和分类研究
·基于基因表达谱的样本分型研究
·
分子生物学实验辅助设计
·microRNA作用靶标的预测研究

 RNA二级结构预测方法研究

    RNA分子通常以单链形式存在,其功能的实现需要借助于一定的二级结构,甚至三级结构。如tRNA的转运氨基酸功能,在tRNA的典型三叶草结构中,其中间环的中间三个碱基为反密码子,通过与mRNA分子上的对应密码子联合配对而将对应的氨基酸运送至新生肽链的正确位置上;又如核酶的催化功能,通过其锤头状二级结构与底物的特异结合而发生作用;I型和II型内含子的自我剪切功能,这些内含子通过折叠成特定的结构而形成用于自我剪切反应的活性中心;特别是,mRNA的主要功能是作为蛋白质合成的模板但其5’3’端的非翻译区(UTR)的结构对蛋白质的合成效率有比较大的影响;在原核系统中,如果5’UTR的二级结构比较稳定,将影响核糖体的结合效率,从而使蛋白质的合成效率下降,同样,3’UTR的二级结构不是很稳定,将导致mRNA的降解,从而使mRNA的寿命(lifetime)缩短,最终导致蛋白质合成效率的下降,这一事实已在我们构建的原核系统pBV220载体中外源基因高效表达数学模型中得到了数学证明和实验验证。上述事实说明RNA二级结构和三级结构在RNA分子的功能实现中具有重要作用。但是,RNA分子具有降解快、晶体难于获得等特点,用实验方法测定其结构比较困难,故需发展RNA二、三级结构的预测方法。

    我们的主要兴趣是研究新的RNA二级结构预测方法,不断提高预测精度。到目前为止,已提出了基于螺旋区随机堆积的RNA二级结构预测方法和基于螺旋区分布的RNA二级结构预测方法,并与北京大学生物信息学中心合作构建了RNA二级结构预测服务器RDfolder。 相关的论文发表在Nucleic Acids Research、Bioinformatics等杂志上。

 

非编码RNA基因的预测和分类研究

    随着人类基因组草图与模式生物基因组序列的获得,人们已进入后基因组时代,如何识别出基因组(特别是人类基因组)中的各种基因并采用基因芯片等高通量生物技术来研究这些基因的功能已成为目前的研究热点。然而,在基因识别中,不仅包含编码蛋白质的基因识别,也包含非编码RNA基因(ncRNA基因)的识别。但是,传统的基因预测程序如GeneScan等,仅对基因编码区的识别有效,到目前为此,还没有高效且通用的ncRNA基因的预测算法。 因此,ncRNA基因的预测方法及分类研究具有重要意义:1、由于ncRNA基因在基因剪接、RNA核苷酸修饰、蛋白质合成、蛋白质转运和基因表达调控等方面起着重要的作用,从基因组(特别是人类基因组)序列中预测出ncRNA基因,对ncRNA基因的结构与功能关系研究具有重要意义;2、为ncRNA基因的实验研究提供帮助,通过预测手段从庞大的基因组序列中初步识别出ncRNA基因,将使实验研究更具有针对性;3、近年来随着各种具有重要调控作用的小RNA分子的发现,人们认识了RNA的许多新的功能,但一个基因组中究竟有多少类ncRNA基因,目前仍不清楚,通过ncRNA基因的识别及其分类研究,有可能发现新的ncRNA基因的类别及其在基因表达调控中的作用,从而使人们对基因组的结构与功能的理解登上一个新的台阶。

基于基因表达谱的样本分型研究

    基因芯片技术是功能性基因研究的重要手段。利用基因芯片技术,可以同时观察在特定生理或病理过程中细胞内基因群的动态表达水平,使研究人员能够在基因组水平上以系统的、全局的观念去研究生命现象及其本质。但是,从数据处理的角度来看,通过基因芯片实验直接获得的是一个基因表达谱,即基因表达矩阵,其行表示基因,列表示实验样本。对由基因芯片技术获得的基因表达谱数据而言,相关的数据分析和挖掘已经无法仅仅通过简单的计算来进行,辅助数据分析系统的建立已经成为基因芯片技术的必要工具。在基因芯片数据的处理和分析中,样本分型研究是其中及其重要的一环,是一个既是核心但同时又是具有挑战性的问题,开展此项研究具有下列意义:1、样本分型研究整合了常用的基因表达谱分析方法,通过开展此项工作可以促进整个基因表达谱的生物信息学研究,从而促进基因芯片技术的推广和应用;2、可以用来识别新的样本类型,与传统的基于表型的样本分型相比,有时即使表型没有显著变化,但样本的基因表达谱模式已发生了显著变化,所以基于基因表达谱的样本分型研究不仅摆脱了主观性,更能触及样本的本质,如在肿瘤分型研究中,当前的肿瘤分类技术高度依赖于病理学工作者对肿瘤组织的主观判断,而基于微阵列技术,即使一些组织没有显著变化,利用基因表达谱也可以对之做出早期诊断;另外,特别重要的一点是可以根据基因表达谱的变化来区分形态学上相似的肿瘤,这样对肿瘤类型的精确识别有助于制定配套的最佳方案,从而达到增加疗效、降低毒性的目的;并且,基于基因表达谱的肿瘤分型和分类研究对理解肿瘤的发生机制以及征服这些肿瘤提供了重要思路;3、可以确定与某一生理过程相关的基因集合,从而可将基因表达谱数据和相关的序列数据进行有效整合,在此基础上研究这些基因在特定生理条件下的表达模式和序列调控区的调控模式之间的定性或定量关系,最终构建与某一生理过程相关的基因调控网络。因此,本项目拟开展的工作在以基因芯片技术为基础的相关研究中,如:基于基因表达谱的肿瘤分型,中药现代化研究等许多方面,均具有重要意义,同时也将为蛋白质芯片技术提供强有力的生物信息学支持。

    到目前为止,我中心已研究开发了辅助寡核苷酸芯片的探针设计系统MProbe、辅助cDNA芯片的引物设计、基于基因表达谱的样本分类系统Tclass和基于基因表达谱的样本分型系统SamCluster。 这些功能均集成在本中心最近推出的软件BioSun中。

 

分子生物学实验辅助设计

    对于大多数的分子生物学工作者来说,他们关心的是如何利用生物信息学的方法和工具来解决他们在研究中遇到的问题,或对实验进行辅助设计,以加快实验进程和提高分子生物学研究的效率。到目前为止,本中心在外源基因高效表达设计、信号肽预测、跨膜区预测、抗原表位预测、蛋白质二级结构预测、蛋白质功能位点分析、motif检索、密码子偏性计算、PCR引物设计、酶切分析、RNA二级结构预测、转录因子结合位点分析、cDNA微阵列引物设计、寡核苷酸微阵列探针设计等方面做了扎实的工作,这些工作成果均集成在我们最近推出的软件BioSun中。

microRNA作用靶标的预测研究

    microRNAmiRNA)是一类内生的、长度约为22个核苷酸的小RNA。自1993年在秀丽线虫中发现第一个miRNA lin-4以来,研究人员在水稻、拟南芥、线虫、果蝇、褐家鼠、小家鼠、人和EBV病毒中发现了共计1300多个miRNA。在已确证功能的miRNA中,lin-4let-7参与控制秀丽线虫的幼虫发育时序,lsy-6控制秀丽线虫神经元左右不对称性,bantam控制果蝇细胞的增殖,mir-14控制果蝇细胞的死亡和正常的脂肪代谢,mir-172控制拟南芥花的发育,mir-JAW控制植物叶的形态,mir-181调整哺乳动物造血系统分化。上述miRNA的功能表明,miRNA参与着生物体中很多基本生命过程的调控,在生命活动中起着非常重要的 作用。正是这种功能的重要性,miRNA吸引了很多科研人员通过多种途径、从多种角度、利用多种模式生物来探讨miRNA的起源、作用机制和功能,也使得miRNA2002年和2003年连续两年被《Science》杂志评选为十大科技新闻。

    miRNA的研究意义之重大是毋庸置疑的。然而,与新的miRNA的频频发现相比,miRNA的功能研究相对缓慢。到目前为止,在发现的1300多个miRNA中,确定功能的miRNA仅有十个。导致miRNA功能研究进展缓慢的非常重要的原因是miRNA的作用靶标难以确定。到目前为止,通过实验方法确定miRNA的作用靶标非常耗时,尚无高通量的靶标鉴定方法,因此,通过理论方法预测miRNA的作用靶标成为当前识别miRNA作用靶标的较为理想的途径。