图1 无处不在的微生物
引言
图1 无处不在的微生物
环境微生物是自然界中分布最广、种类最多、数量最大的生物类群。自1663年,列文虎克利用自制显微镜首次揭开微生物神秘的面纱之后近300多年的时间里,人们对于微生物的研究主要是建立在纯培养基础上, 后来人们发现通过纯培养方法估计的环境微生物多样性只占总量的0.1%~1%, 这使得微生物的多样性资源难以得到全面的开发和利用,如何充分开拓利用环境微生物新资源是目前环境微生物研究的重要课题之一。
近年来发展起来的宏基因组学技术避开传统的微生物分离培养方法直接从环境样品中提取总DNA, 通过构建和筛选宏基因组文库来获得新的功能基因和生物活性物质, 宏基因组文库既包括了可培养的, 又包括了未可培养的微生物遗传信息, 因此增加了获得新生物活性物质的机会。
宏基因组 ( Metagenome)(也称微生物环境基因组Microbial Environmental Genome, 或元基因组)是由 Handelsman 等 1998 年提出的新名词, 其定义为“the genomes of the total microbiota found in nature” , 即环境中全部微小生物遗传物质的总和。它包含了可培养的和未可培养的微生物的基因,目前主要指环境样品中的细菌和真菌的基因组总和。宏基因组学(或元基因组学,metagenomics)是一种以环境样品中的微生物群体基因组为研究对象,以功能基因筛选和/或测序分析为研究手段,以微生物多样性、种群结构、进化关系、功能活性、相互协作关系及与环境之间的关系为研究目的的新的微生物研究方法。一般包括从环境样品中提取基因组DNA, 进行高通量测序分析,或克隆DNA到合适的载体,导入宿主菌体,筛选目的转化子等工作。
特定生物种基因组研究使人们的认识单元实现了从单一基因到基因集合的转变,宏基因组研究将使人们摆脱物种界限,揭示更高更复杂层次上的生命运动规律。在目前的基因结构功能认识和基因操作技术背景下,细菌宏基因组成为研究和开发的主要对象。细菌宏基因组、细菌人工染色体文库筛选和基因系统学分析使研究者能更有效地开发细菌基因资源,更深入地洞察细菌多样性。
宏基因组学的发展
宏基因组学的发展经历了4个阶段:
环境基因组学
1991年首次提出环境基因组学(environmental genomics)的概念,同年构建了第一个通过克隆环境样品中DNA 的噬菌体文库。
1998年美国国立环境卫生科学研究所启动了环境基因组计划(environmental genome project,EGP),开展有关人体遗传变异与环境胁迫相互关系的研究。
环境基因组学第一次提出特定生态条件下,全部生物基因组总体概念,这是基因组学的重要进展。
微生物基因组学
1998年提出生命研究对象应是生物环境中全部微小生物的基因组,首次提出针对特定环境样品中细菌和真菌的基因组总和进行研究的这一宏基因组(metagenome)概念
2007年3月,美国国家科学院以“环境基因组学新科学—— 揭示微生物世界的奥秘”为题发表咨询报告,指出宏基因组学为探索微生物世界的奥秘提供新的方法,这是继发明显微镜以来研究微生物方法的最重要进展,是对微生物世界认识的革命性突破
宏基因组学
广义宏基因组是指特定环境下所有生物遗传物质的总和,它决定了生物群体的生命现象。它是以生态环境中全部DNA作为研究对象,通过克隆、异源表达来筛选有用基因及其产物,研究其功能和彼此之间的关系和相互作用,并揭示其规律的一门科学
狭义宏基因组学则以生态环境中全部细菌和真菌基因组DNA作为研究对象,它不是采用传统的培养微生物的基因组,包含了可培养和还不能培养的微生物的基因,通过克隆、异源表达来筛选有用基因及其产物,研究其功能和彼此之间的关系和相互作用,并揭示其规律
人类宏基因组学的阶段。
把人体内所有微生物菌群基因组的总和称为“人体宏基因组”(human metagenome)。
人类宏基因组学(human metagenomics)研究人体宏基因组结构和功能、相互之间关系、作用规律和与疾病关系的学科。它不仅要把总体基因组序列信息都测定出来,而且还要研究与人体发育和健康有关的基因功能。
人类宏基因组计划目标是:把人体内共生菌群的基因组序列信息都测定出来,而且要研究与人体发育和健康有关的基因功能
宏基因组的研究步骤
图2宏基因组的研究步骤
图3宏基因组的主要研究方法
宏基因组的应用
宏基因组学在微生态学上的应用
Zhang 等构建红树林淤泥宏基因组文库, 通过PCR 扩增及变性梯度凝胶电泳(DGGE)对该区域固氮菌的多样性进行分析, 结果揭示红树林地区固氮菌的生物多样性特征, 其结果表明多数为变形菌, 也含少数的固氮菌属、除硫单胞菌属、德克斯氏菌属和根瘤菌等。
张薇等采用宏基因组技术对西北黄土高原柠条种植区土壤微生物多样性进行分析, 发现变形杆菌纲是根表土壤区系中的有优势微生物菌群(70.3%), 尤其存在大量能够诱导植物形成根瘤的根瘤菌和对植物有促生长作用的γ-Proteobacteria 类微生物, 说明了植物根系和土壤环境微生物菌群具有相互选择性。
Fierer 等通过构建牧场、沙漠、雨林土壤宏基因组文库对环境中细菌、古生菌、真菌及病毒多样性进行了研究, 并揭示了土壤环境中包含着大量不可培养的新病毒种类, 其基因型特征与常规培养获得的病毒具有很大的差异性。
Kim 等通过构建稻田土壤宏基因组文库, 利用多重置换扩增(MDA)技术对土壤样品中病毒基因多样性进行了研究, 结果表明扩增得到的病毒基因序列与目前报道的病毒序列具有很大的差异性, 进一步说明了土壤环境中包含着大量不可培养的病毒种类。
2003 年Breitbart 等首次通过构建宏基因组文库对人体排泄物中的未培养病毒多样性进行研究, 经过扩增及鸟枪测序鉴定,结果表明获得的病毒大约有1200 种基因型, 其基因序列与先前报道的病毒序列具有很大的差异性, 多为新的基因型病毒, 并揭示存在人体中的新病毒与人类疾病可能具有一定的相互性。
2005 年Cann 等通过构建宏基因组文库对马排泄物中的未培养病毒多样性进行研究, 经过测序鉴定, 获得233 种不同基因型的病毒, 其中52%为长尾噬菌体科, 26%为未分类的噬菌体, 17%为肌病毒科, 4%为短尾病毒科,2%为脊椎动物正痘病毒。
宏基因组学在海洋微生物资源开发上的应用
宏基因组工程与海洋生物学进行有机的结合,促使人类了解许多为培养海洋微生物的基因组序列及其功能产物,在海洋天然药物研究、海洋极端环境微生物研究、海洋微生物多样性探索中具有十分重要的应用前景。
Martín 等构建地中海深层水体微生物宏基因组文库, 通过序列分析和16S rRNA 系统发育比对,发现该水体的微生物种群与太平洋阿罗哈水域中层水体的微生物种群具有一定的相似性, 并提出在无光的条件下, 温度是影响微生物种群在水体中分布的主要因素。
2008 年肖凯等以宏基因组DNA 为模板, 采用不同的PCR 引物对温泉的高温水底沉积物微生物多样性进行分析, 发现了一株新的菌株JS-X2 与在美国黄石公园温泉发现的未培养细菌有95%的相似性, 并且与嗜热蓝细菌聚球藻有89%的相似性。
Sabet 等通过构建宏基因组文库对美国莫诺湖水体中噬菌体的多样性进行了研究, 研究发现不可培养的噬菌体才是该特殊生境中的优势群体, 揭示了海洋是一个巨大的未知RNA 病毒库。
Breitbart 等通过构建海水及海底沉积物宏基因组文库对该地区不可培养病毒的多样性进行分析, 结果发现扩增得到的病毒基因型中65%为新的基因型, 其中包含一类海藻病毒,多数病毒具有新的基因型, 与节肢动物和高等植物病毒存在很大的序列差异性。
宏基因组学在环境保护和污染修复上的应用
宏基因组学在医学领域的应用
宏基因组技术的出现为新药物的探索和发现提供了可能的技术支持, 并扩大了微生物代谢产物及分子活性物质筛选平台。例如早在2000 年, Wang 等构建土壤宏基因组文库, 通过文库筛选获得TerragineA 及其相关成分, 目前已广泛应用于医学治疗领域, 证明了自然环境中的丰富微生物代谢产物可以通过宏基因组技术为人们所利用; 同年Brady 等从土壤宏基因组文库中筛选发现一种长链N-酰氨基酸抗生素物质; 并在2004 年构建凤梨科植物树茎流出液宏基因组文库, 筛选鉴定获得了抗菌物质PalmitoylPutrescine。2001 年Macneil等构建了土壤宏基因组BAC 文库, 通过序列分析筛选获得5 个能产生抗菌小分子物质靛玉红并对其相关成分进行研究; 2002 年Gillespie 等构建土壤宏基因组文库筛选获得两种抗菌物质Turbomycin A和B, 并且发现Turbomycin A 和B 对革兰氏阴性和革兰氏阳性菌具有广谱抗菌活性; 2003 年DiazTorres 等通过构建人唾液宏基因组文库, 筛选获得一种新的四环素抗性基因Tet, 该活性物质对四环素具有很好的抗性; 2008 年Mori 等通过活性污泥宏基因组文库筛选获得两种不同的博来霉素抗性基因, 经过比对发现于来源放射菌类基因差异较大, 可能为新的博来霉素抗性基因。
国内在利用宏基因组技术获取新型药物的研究较少, 尚处于萌芽阶段, 赵晶等从南极中山站排污口采集污泥,构建宏基因组文库, 并通过差异性DNA 修复实验(DDRT)筛选得到具有抗肿瘤效应的物质。同时利用宏基因组技术研究探讨人类肠道中不可培养微生物多样性也有了很大进展。如Kurokawa 等利用宏基因组技术对13 个处于不同年龄层的健康人体粪便微生物种群进行了研究, 结果分析表明未断奶婴儿的肠道微生物种群在系统发育和基因组成上具有较大个体差异性, 而在成人及已断奶儿童则呈现出高度的功能一致性, 并对成人及婴儿肠道内编码该生境微生物主要功能的基因家族的特性进行分析, 发现了一个新的人类肠道微生物基因家族和一个共扼转座子。2003 年Breitbart 等通过构建宏基因组文库对人体排放物中的未培养病毒多样性进行研究,经过鸟枪测序法鉴定, 获得的病毒大约有1200 种基因型, 结果比对表明其基因序列与先前报道的病毒具有很大的差异性, 大多数为新病毒, 并证明这些病毒极有可能与人类的疾病有着密切的关系。2008 年Finkbeiner 等通过构建12 个腹泻小孩肠道内容物宏基因组文库, 来观察病人肠道中病毒的生物多样性, 发现扩增得到的病毒序列与GenBank 病毒库中的已知序列同源性很低, 并推断这些病毒极有可能与人类的腹泻疾病有着密切的关系。随着宏基因组技术的成熟, 必将加快宏基因组技术在医学中的应用。在人体微生物抗药性的研究, 人体与不可培养病原菌的相互关系的探索等方面将做出重大贡献。
宏基因组学在生物酶制剂开发中的应用
宏基因组学技术最引人注目的贡献主要集中在新型生物酶制剂的探索和开发领域。传统的新型酶的筛选方法大大限制了筛选的广泛性和有效性。宏基因组学通过直接从环境中提取DNA 样品,尽可能为后面的筛选提供更加全面和多样的基因资源,从而有效地提高了新酶的筛选效率。
近年来研究者们已成功构建了土壤、海底淤泥、温泉淤泥、油厂污泥、动物瘤胃内容物、动物粪便等宏基因组文库,并筛选到脂肪酶、蛋白酶、淀粉酶、乙醇氧化酶、木聚糖酶、纤维素酶及脱羧酶等酶制剂, 并且在此基础上获得新酶的许多特征信息。所采用的载体种类十分广泛, 包括Fosmid、Cosmid、BAC、λ噬菌体以及各种穿梭载体, 所采用的宿主系统为常用的大肠杆菌、链霉菌和假单胞菌等。通过宏基因文库筛选得到的生物分子大多数与已知的基因产物相似性差或者完全是新的分子, 这些新的生物分子主要来源于环境未培养微生物的基因和其多样的代谢物。
环境样品DNA 的克隆和筛选只是所有环境遗传信息多样性的一小部分, 环境微生物和宏基因组的多样性仍旧是发现新的天然活性产物的丰富广阔资源, 为研究者们探索开发新的生物催化剂提供了巨大的资源空间。
宏基因组学存在的问题
文库的质量,目前已发表的文库很少能够覆盖整个宏基因组,这需要进一步优化DNA的提取及克隆方法。
高通量的有效筛选平台,目前从几万或几十万个克隆中只能筛选到几个有活性的基因,这主要是由于微生物多样性高,宏基因组比较复杂,以及外源基因在宿主菌中的表达障碍等等。
宏基因组学研究主要集中于原核生物,对真菌等真核生物研究较少,所构建文库多为DNA文库,cDNA文库较少。
参考文献