研究生物系统组成成分的构成与相互关系的结构、动态与发生,以系统论和实验、计算方法整合研究为特征的
生物学。20世纪中叶贝塔朗菲定义“
机体生物学”的“机体”为“整体”或“系统”概念,并阐述以开放系统论研究生物学的理论、数学模型与应用
计算机方法等。系统生物学不同于以往仅仅关心个别的
基因和蛋白质的分子生物学,在于研究
细胞信号传导和
基因调控网路、生物系统组成之间相互关系的结构和系统功能的涌现。
简介
概念
systems biology(
贝塔郎菲称为“有机生物学”,不同于“systematic biology”
生物系统学 - 过去也译为系统生物学)
“系统生物学” (systems biology) 一词在美国NIH 的PubMed 文献库最早可检索到Zieglgansberger W 和Tolle TR 于1993 年发表的一篇
神经系统疾病研究的论文摘要中,根据1968 年国际
系统理论与生物学 (systems theory and biology) 会议上Mesarovic D.提出systems biology词汇(术语)的定义为采用系统论方法研究生物学,1989 年在美国召开的生物化学系统论与
生物数学国际会议探讨了生物学的系统论与计算生物学模型研究。
区别
系统理论和系统思想对于中国知识分子并不陌生,1980 年代在中国学术界曾经流行过“三论”——系统论、
信息论和控制论与
系统科学。美籍奥地利科学家
贝塔朗菲 (L. Bertalanffy) 在 1970 年代创立的“
一般系统论” (general system theory),尽管贝塔朗菲是以
生物学家的身份思考、研究,并不仅适用于生命科学,而且广泛应用于物理学、心理学、经济学和社会科学等各门
学科;因而,过去所谈论的主要是在
理论生物学层面上和普适性强的一般系统论,本文所要介绍的系统生物学 (systems biology),则是生命科学研究领域的一门
组学、计算和
转基因系统生物技术等成熟的迅速发展学科。1924~1928 年贝塔郎菲多次发表系统论的文章,阐述生物学中有机体概念,提出把有机体当作一个整体或系统来研究,1950年发表生物学与
物理学中的系统论和1952年发表抗体系统论[注]等开创了系统生物学,第10 届国际分子系统生物学会议称贝塔郎菲为第一个系统生物学家(理论层面),贝塔郎菲开创的系统生物学模型至今仍然很现代。自20 世纪60 年代系统生物学概念和词汇的提出和60-80年代
系统生态学、系统生理学的进展,90年代系统生物医学、
系统医学、系统生物工程与
系统遗传学的概念发表,20 世纪未
细胞信号传导与
基因调控的研究与系统论方法的结合,进入了分子细胞层次的系统生物学(实验与理论结合)
研究与发展时期。
作为
人类基因组计划的发起人之一,
美国科学家莱诺伊·胡德 (Leroy Hood) 也是组学 (omics)
生物技术开创者之一。在胡德看来,系统生物学的重新提出和人类基因组计划有着密切的关系。正是在基因
组学、
蛋白质组学等新型大科学发展的基础上,孕育了系统生物学的高通量
生物技术和
生物信息技术。反之,系统生物学的诞生进一步提升了
后基因组时代的生命科学研究能力。1996 年在
北京举办的第 1 届国际
转基因动物学术研讨会,中科院
曾邦哲(曾杰)阐述了系统论与
生物遗传学、转基因研究等,1999 年元月于德国建立了
系统生物科学与工程网(英文),表述生物系统
结构论(structurity theory)的结构整合 (integrative)、调适稳态(stability)与层级建构(constructive) 等综合(synthetic)系统理论
规律,并定义实验、计算
系统研究,同系统科学、计算机科学、
纳米科学和生物医学、
生物工程等领域国际科学家广泛通讯,倡导
分子生物技术和计算机科学 - 实验生物学家与计算生物学家结合研究生物系统,唤起了一大批生物学研究领域以外的专家的关注。
正如1994年曾杰(曾邦哲)“论系统生物工程范畴”等表述的21世纪将进入“系统生命科学与生物工程的时代”,1999-2000年系统生物学与工程(合成生物学)领域论文大量涌现。也如胡德所说,“系统生物学将是 21 世纪医学和生物学的核心驱动力”,基于这一信念,在系统生物学已经就要成为新的学术潮流时,1992年建立
华盛顿大学分子
生物技术系的胡德,在1999 年年底辞去了美国
西雅图市华盛顿大学的教职,与另外两名志同道合的科学家一起2000 年创立了世界上第一个系统生物学研究所 (Institute for Systems Biology)。与此同时或1999年更早的中期不少科学家开始了论述,2000 年
日本举办了国际系统生物学会议,2000 年美国 E. Kool 重新提出合成生物学 - 基于系统生物学的
基因工程。随后,系统生物学便逐渐重新得到了
生物科学界的认同。2002 年03 月,美国《科学》周刊登载了系统生物学专集,该专集导论中的第一句话这样写道:“如果对当前流行的、时髦的关键词进行一番分析,那么人们会发现,‘系统’高居在排行榜上。”
阶段
系统生物学的基本工作流程有这样四个阶段。首先是对选定的某一生物系统的所有
组分进行了解和确定,描绘出该系统的结构,包括
基因相互作用网络和
代谢途径,以及细胞内和细胞间的作用机理,以此构造出一个初步的
系统模型。第二步是系统地改变被研究对象的内部组成成分(如基因突变)或外部生长条件,然后观测在这些情况下系统组分或结构所发生的相应变化,包括基因表达、
蛋白质表达和相互作用、代谢途径等的变化,并把得到的有关信息进行整合。第三步是把通过实验得到的数据与根据模型预测的情况进行比较,并对初始模型进行修订。第四阶段是根据修正后的模型的预测或假设,设定和实施新的改变系统状态的实验,重复第二步和第三步,不断地通过实验数据对模型进行修订和精练。第一到第三阶段,也就是以下的“整合”- 系统理论、“干涉”-
实验生物学和“信息”-
计算生物学等研究,即
系统论和实验(experimental)、计算(computational)方法整合的系统生物学概念,目标就是要得到一个理想的模型,使其理论预测能够反映出生物系统的真实性。
灵魂
——整合
作为后基因组时代的新秀,系统生物学与
基因组学、
蛋白质组学等各种“组学”的不同之处在于,它是一种整合型大科学。首先,它要把系统内不同性质的构成
要素 (基因、mRNA、蛋白质、生物
小分子等) 整合在一起进行研究。系统生物学研究所的第一篇研究论文,就是整合酵母的
基因组分析和蛋白质组分析,研究酵母的代谢网络[2]。由于不同生物分子的研究难度不一样,技术发展程度不一样,对它们的研究水平有较大的差距。例如,基因组和
基因表达方面的研究已经比较完善,而蛋白质研究就较为困难,至于涉及生物小分子的
代谢组分的研究就更不成熟。因此,要真正实现这种整合还有很长的路要走。
对于
多细胞生物而言,系统生物学要实现从基因到细胞、到组织、到个体的各个层次的整合。《科学》周刊系统生物学专集中一篇题为“心脏的模型化——从基因到细胞、到整个器官”的论文,很好地体现了这种整合性[3]。我们知道,系统科学的核心思想是:“整体大于部分之和”;系统特性是不同组成部分、不同层次间相互作用而“涌现”的新性质;对组成部分或低层次的分析并不能真正地预测高层次的行为。如何通过研究和整合去发现和理解涌现的系统性质,是系统生物学面临的一个带根本性的挑战。
系统生物学整合性的第三层含义是指研究思路和方法的整合。经典的分子生物学研究是一种垂直型的研究,即采用多种手段研究个别的基因和蛋白质。首先是在DNA水平上寻找特定的基因,然后通过基因突变、
基因剔除等手段研究基因的功能;在基因研究的基础上,研究蛋白质的
空间结构,蛋白质的修饰以及蛋白质间的相互作用等等。基因组学、蛋白质组学和其他各种“组学”则是水平型研究,即以单一的手段同时研究成千上万个基因或蛋白质。而系统生物学的特点,则是要把水平型研究和垂直型研究整合起来,成为一种“三维”的研究。此外,系统生物学还是典型的多
学科交叉研究,它需要生命科学、
信息科学、
数学、计算机科学等各种学科的共同参与。
系统生物学的整合性可以体现在两种不同的策略上。第一种就是切奇(Church)和后来胡德(Hood)的系统生物学研究所采用的方式,选定一个较为简单的系统,如
单细胞生物酵母,然后分析尽可能多的构成成分——基因组、
转录组、蛋白质组、相互作用组,以揭示整个系统的行为。另外一种策略是吉尔曼 (A. G. Gilman) 领导的“信号转导联军”采用的,以一个较为复杂的系统 (G 蛋白介导的和与其相关的
细胞信号转导系统) 为研究对象,采用尽可能多的研究手段去进行分析 (详细介绍见本刊 2002 年第 02 期第 36 页)。
基础
——信息
在前分子生物学时代,生物学家把生命视为具有特殊“活力”的有机体,遵循着无机界不存在的法则进行
生命活动。在分子生物学时代,研究者们把生命视为一架精密的机器,由基因和蛋白质根据物理、化学的规律来运转。
系统科学和非平衡热物理学,将生命是开放和
能量耗散的信息化过程,
控制论研究生物通讯与调控作信息系统,艾根提出生物信息进化的分子
超循环理论,在后基因组时代,
功能基因组学研究
细胞信号与基因调控等信息的分子相互作用网络等,像胡德这种类型的科学家,也把生命视为信息的载体,一切特性都可以从信息的流动中得到实现。
胡德提出,应该把生物学视为一门信息科学,也就是
生物信息学与
计算生物学。这个观点包含有三层意思。首先,生物学研究的核心——基因组,是数字化的 (digital)。生物学与所有其他
学科,如物理学、化学、
地理学,是完全不一样的科学,因为生物学以外的学科都只能通过类比的方式 (analog) 进行分析。既然生物学研究的核心是数字化的,因此生物学可以被完全破译。从理论上说,我们对生物学的把握应该超过其他任何一门学科。其次,生命的数字化核心表现为两大类型的信息,第一类信息是指编码蛋白质的基因,第二类信息是指控制基因行为的
调控网络。显然,由一段 DNA 序列组成的基因是数字化的。值得强调的是,基因调控网络的信息从本质上说也是数字化的,因为控制
基因表达的
转录因子结合位点也是
核苷酸序列。生物学是信息科学的第三层意思是,
生物信息是有等级次序的,而且沿着不同的层次流动。一般说来,生物信息以这样的方向进行流动:DNA→mRNA→蛋白质→蛋白质相互作用网络→细胞→器官→个体→群体。这里要注意的是,每个层次信息都对理解
生命系统的运行提供有用的视角。因此,系统生物学的重要任务就是要尽可能地获得每个层次的信息并将它们进行整合。
根据系统论的观点,构成系统的关键不是其组成的物质,而是组成部分的相互作用或部分之间的关系。这些相互作用或者关系,从本质上说就是信息。换一个角度来说,生命是
远离平衡态的开放系统,为了维持其有序性,生命系统必须不断地与外部环境交换
能量,以抵消其
熵增过程。奥地利物理学家
薛定谔 (E. Schrödinger) 早在 1940 年代发表的著作《生命是什么?》 (What is Life?) 中就已指出,生命以“
负熵流”为食,热物理学家布里渊提出“负熵”是信息的概念,而“负熵”其实就是信息的另一种表示方法。因此,我们可以这样说,生命系统是一个信息流的过程,系统生物学就是要研究并揭示这种信息的运行规律。
钥匙
——干涉
系统生物学一方面要了解
生物系统的结构组成,另一方面是要揭示系统的行为方式。相比之下,后一个任务更为重要。也就是说,系统生物学研究的并非一种静态的结构,而是要在人为控制的状态下,揭示出特定的生命系统在不同的条件下和不同的时间里具有什么样的动力学特征。
凡是实验科学都有这样一种特征:人为地设定某种或某些条件去作用于被实验的对象,从而达到实验的目的。这种对实验对象的人为影响就是干涉 (perturbation)。传统生物学采用非干涉方法如形态观察或分类研究生物体。20 世纪形成的分子生物学等实验生物学的特点就是,科学家可以在实验室内利用各种手段干涉生物学材料,如通过诱导基因突变或修饰蛋白质,由此研究其性质和功能。系统生物学同样也是一门实验性科学,也离不开干涉这一重要的工具。
系统生物学中的干涉有这样一些特点。首先,这些干涉应该是有系统性的。例如人为诱导
基因突变,过去大多是随机的;而在进行系统生物学研究时,应该采用的是定向的突变技术。
果蝇从受精开始到形成成熟个体一共有 66 个典型的
发育阶段,80年代诺奖获得者Christiane Nslein-Volhard等开展了系统的基因突变与规模的筛选,不久前科学家利用
基因芯片技术,对每一个发育阶段的
基因表达谱进行了系统的研究。上面所提到的对
酵母的系统生物学研究,胡德等人就是把已知的参与
果糖代谢的 9 个基因逐一进行突变,研究在每一个基因突变下的系统变化。这也是一类系统性的干涉方式。其次,系统生物学需要高通量的干涉能力,如高通量的
遗传变异。现有技术已经能做到在短时间内,把
酵母的全部 6000 多个基因逐一进行突变。对于较为复杂的多细胞生物,可以通过 RNA 干涉新技术来实现大规模的基因定向突变。随着研究技术的发展,一定还会有许多新的干涉技术应用于系统生物学。
需要提请人们注意的是,以测定
基因组全序列或全部蛋白质组成的基因组研究或
蛋白质组研究等“规模型大科学”,并不属于经典的实验科学。这类工作中并不需要干涉,其目标只是把系统的全部元素测定清楚,以便得到一个含有所有信息的数据库。胡德把这种类型的研究称为“发现的科学” (discovery science),而把上述依赖于干涉的实验科学称为“假设驱动的科学” (hypothesis-driven science),因为选择干涉就是在做出假设。系统生物学不同于一般的实验生物学就在于,它既需要“发现的科学”,也需要“假设驱动的科学”。首先要选择一种条件(干涉),然后利用“发现的科学”的方法,对系统在该条件下的所有元素进行测定和分析;在此基础上做出新的假设,然后再利用“发现的科学”研究手段进行新研究。这两种不同研究策略和方法的互动和整合,是系统生物学成功的保证。
笔者还要再强调一点,在注重这两类研究手段的同时,不应该忽略系统生物学的另一个特点——对理论的依赖和建立模型的需求。在本文一开始介绍系统生物学的概况时,特别指出过,系统生物学的理想就是要得到一个尽可能接近真正生物系统的
理论模型;
建模过程贯穿在系统生物学研究的每一个阶段。1999 年初系统生物科学与工程网 (genbrain biosystem network) 表述生物系统的
研究方法为基于系统论的实验、
计算机与工程等方法。离开了数学和计算机科学,就不会有系统生物学。也许正是基于这一考虑,科学家把系统生物学分为“湿”的实验部分(实验室内的研究)和“干”的实验部分(
计算机模拟和理论分析)。“湿”、“干”实验的完美整合 - 也就是1999年曾邦哲倡导的实验生物学家和计算生物学家合作研究,才是真正的系统生物学。随着
化学生物学、计算生物学、合成生物学的发展,高通量
生物芯片、计算机数学建模和基因人工合成等构成了系统生物学的技术基础。
从
某种意义上说,系统生物学在中国有很好的基础。1990 年代中西医学与哲学、
系统学探讨中,已经提出了
系统医学 (Zeng BJ,1992) 等概念。我们的
传统医学就是把人体视为一个系统,通过测定和改变系统的输入和输出来调节系统的状态。传统科学的缺点在于,它只能进行“黑箱操作”,不能解释系统的内部组成成分和动力学过程。而系统生物学则把生物系统化为“白箱”,不仅要了解系统的结构和功能,而且还要揭示出系统内部各组成成分的相互作用和运行规律。
学科年表
20 世纪中贝塔朗菲 (L. Von. Bertalanffy) 创立了一般
系统论和
理论生物学,并阐述了抗体系统论和系统、整体方法和计算机方法数学建模的方法研究生物开放系统的“机体生物学”概念。1929发表了Edward B. Titchener 的“systematic psychology”(
系统心理学),最早出现“systems psychology”名词是1958 年Parry J. B.有关个性
心理学的工业文稿,Maelzer DA. 在“Environment,semantics,and system theory in ecology”(J Theor Biol. 1965 May;8⑶:395-402)阐述应用系统论方法研究
生态学。
一、基础学科:1)、系统生物学 (systems biology,Zieglgansberger W,Tolle TR. 1993年提出以前的systems biology方法可用于神经疾病研究,最早systems biology的提出是1968年美国召开的学术会议论文集 - 见WolkenhauerO.的2004年论著);2)、系统生态学 (systems ecology,Van Dyne GM. 1966);3)、
系统生理学 (systems physiology,Sagawa K. 1973);4)、系统遗传学* (system genetics,Zeng BJ. 1994 年)。
二、应用学科:5)、
系统生物医学 (system biomedicine,Kamada T.,1992) 或系统医药学* (systems medicine & pharmacy,Zeng BJ. 1992 年);6)、
系统生物工程* (system bio-engineering/biotechnology,Zeng BJ. 1994 年)。
三、学科总论:1994 -1996 年中科院《转基因动物通讯》转载了1994 年5 月曾(杰)邦哲 (Zeng BJ)的“结构论-
泛进化论”(又称
自组织系统结构理论)。1995-2000年组织和筹备国际会议与协会时期,曾邦哲阐述了生物系统的结构论和实验、计算与工程方法整合的
生物系统与人工生物系统研究 - 提出从分子、细胞到器官、生态的生物系统层次研究,总称以上各学科为
系统生物科学(包括biosystem medicine,engineering of biosystem等),1999 年元月(其实始于1998年10月
以色列)在德国创建了系统生物科学与工程网(genbrain biosystem network)等并刊登于国际刊物和互联网媒体。2000-2003年国际学术界迅速兴起并终于形成了细胞、分子层次生物系统(biosystem)的系统论和实验、计算方法整合研究的现代系统生物学与合成生物学(即artificial biosystem和engineering of biosystem)等概念。
发展
实验方法与
系统方法构成科学研究的基该方法,19世纪是实验生物学(生态、生理、遗传与医学等)范式建立,20世纪是实验生物学迅速发展和系统生物学(生态、生理、遗传与医学等)范式形成。
系统科学(包括
控制论、信息论)根源于
生命科学,发展了计算机科学而又应用于生物科学,将开发出
生物计算机。
维纳与
香农从动物与
通讯行为的研究中提出
控制论与信息论,整个系统科学根植于有机体
哲学思维。系统生物学,最初开创于贝塔郎菲的
一般系统理论与理论生物学,
艾根的
超循环理论发展了细胞、
生物化学与分子层次的系统论。20世纪70年代国际召开了“系统论与生物学” (systems theory and biology) 会议,80年代召开了生物化学系统论、生物系统的计算机模型等探讨的国际会议 (第11届国际分子系统生物学会议2009 年6 月于中科院
上海召开)。系统生物学的概念在20世纪中叶已经提出,合成生物学的概念提出于
基因重组技术的产生,进化理论、
有机分子合成可以说是最早的探索。
系统生物学的发展经历了三个历史时期:第一期,
生态系统,系统生态学与行为、
心理学,开始于 20 世纪60~70 年代;第二期,生理系统,系统生理学与神经、内分泌、
免疫学,开始于20世纪70~80年代;第三期,遗传系统,系统
遗传学与胚胎、
发育生物学,系统遗传学的概念与词汇于20 世纪90 年代中科院
曾邦哲(曾杰)发表,并于1996年主办第1 届国际转基因动物学术研讨会(秘书长)阐述了系统论与生物工程、输卵管
生物反应器及基因组进化与
生物体发育自组织系统理论,遗传学从
染色体行为的细胞遗传学、基因表达信息流的
分子遗传学,发展到了系统遗传学的细胞发生
信号传导与基因调控网络研究,并重新于第19届国际遗传学大会阐述(包括指出C. Nuslein-Volhard、S. Brenner等是较早以systematic方法研究遗传学的科学家)。2008 年3 月美国
加州举办了整合与系统遗传学会议,2009 年10月
荷兰召开了系统遗传学研讨会。
1999 年初于德国建立
系统生物科学与工程网及筹备联合协会、国际会议等 (1999 年10 月Nature 和12 月Kybernetes),曾邦哲(ZengBJ)定义生物系统理论与实验、计算(computational)、工程方法的生物系统分析与人工生物系统研究,并阐述其
自组织系统结构理论基础,1999-2000年将筹备通知发送到系统科学、计算机科学、
纳米科学、生物医学、生物工程等广泛领域的国际科学家(包括邀请C. Nuslein-Volhard、Tomita等著名科学家),细胞是由大规模生物分子(纳米)构成的复杂生物系统,基因组是可以重编程序的智能系统,生命系统人工设计与改造,可以开发出细胞
生物机器。
2000 年同期,日本Kitnano 和Tomita 举办国际系统生物学会议,美国Hood 建立系统生物学研究所,美国 Kool 重新提出合成生物学的概念。2001年WolkenhauerO.6月(9月出版)、Ideker T & Hood L9月和Kitano H.10月(MIT出版2000年会议论文集)等发表文章论述系统生物学的系统论、组学和计算方法等,2002年日本
北野宏明(Kitano H.)、2003年美国胡德(Hood L.)也论述了系统生物学是实验与计算方法整合的生物系统研究,2008年Nature文章则论述了系统生物学与合成生物学的结构理论。2005年Ideker赞同是如同Kitnano的分子水平的系统生物学概念,2007年Kinano阐释系统生物学是在分子生物学层次的重新提出。计算生物技术、
组学 (omics) 生物技术与合成生物技术,构成系统生物学发展的技术基础 -
系统生物技术 (systems biotechnology),现代系统生物学是生物系统的理论与技术整合的研究体系。21 世纪伊始,权威刊物 Nature、Science 发表系统生物学、合成生物学等专刊,终于进入了系统生物科学(简称系统生物学)全球化迅速发展时代。