站内检索

宏基因组测序
作者:陈龙 董亚晨 赵建华 赵芳芳 任一 发表时间:2017年07月03日

 

  宏基因组学(Metagenomics,又称元基因组学)1998年,最早由威斯康辛大学植物病理学部门的Jo Handelsman等提出,随后伯克利分校研究人员KevinChen和Lior Pachter将宏基因组定义为:应用现代基因组学技术直接研究自然状态下的微生物有机群落,而不需要在实验室中分离单一菌株的科学。鉴于环境中99%的微生物不可培养,宏基因组无需进行微生物分离操作的技术特点,打破了传统微生物学基于纯培养研究的限制,为充分认识全球和人体范围内微生物,开发利用未培养微生物,从完整的群落水平上研究微生物的活动并发掘潜在功能提供了可能。

  测序技术的发展

  在宏基因组学研究发展前沿中,核酸测序技术测序速度和通量的增长引人注目。下一代测序技术(NGS,又称第二代高通量测序技术)出现前,基于宏基因组测序的核酸序列差异分析通常使用Sanger测序(主要基于双脱氧核苷酸链终止反应)方法。该法通量较小、测序周期较长且价格昂贵。

  新一代测序技术迅猛发展及广泛应用使宏基因组测序方法发生翻天覆地变化。下一代测序方法使用了几种不同的高通量平台,最先使用的是基于焦磷酸聚合酶乳液的Roche GS20 454测序仪(又称焦磷酸测序仪)。该技术继承Sanger测序读长较长和准确率高的优点,显著提高了测序的通量,但其测序试剂成本高,均聚物错误率高(复杂重复序列的错读),基于磁珠DNA分子凝集的表面区域捕获限制了测序通量和获得reads的数目。第二个出现的下一代测序仪是2006年引入的Solexa(Illumina)Genome Analyzer(GA),这种测序技术将寡核苷酸阵列的flow cell、可逆的链聚合反应和桥式PCR反应集合于一体,并且一次运行能产生超过1.8TB的数据量。Illumina目前拥有多种技术平台,包括GA、MiSeq、HiSeq和NextSeq,并且具有多种可选择读长(100~300 bp PE reads)模式和通量应对各种实际测序需求。下一代测序技术进步使宏基因组研究中组装contigs的长度显著增加。

  第三代测序技术在更快速、高信息量的宏基因组研究中展示出巨大潜力。PacBio单分子实时定量(SMRT)技术具有优秀的读长和通量,能在DNA合成过程中不进行化学修饰检测非常规或修饰碱基。牛津纳米孔(Oxford Nanopore)测序平台是另一类新兴且有潜力的单分子测序仪。该平台不依赖边合成边测序(SBS)方法,通过纳米孔直接对核酸进行测序。牛津纳米孔测序仪最主要的益处是其能通过无线技术在个人笔记本电脑上实时监控测序过程。过去5年中,PacBio平台已经成为微生物单菌株从头(Denovo)测序和宏基因组拼接的强有力技术。就大规模研究而言,Oxford和PacBio平台通量仍较低,但两者在测序组装方面应用的优势使其在未来微生物组群落研究中前途光明。

  微生物组研究现状

  微生物组是指特定环境中的全部微生物及其遗传物质的集合。宏基因组测序技术为研究微生物组提供了极大便利,短短十几年来,基于宏基因组测序的微生物组研究已渗透到各个领域,从海洋到陆地,再到空气,从白蚁到小鼠,再到人体,从发酵工艺到生物能源,再到环境治理等。

  人类微生物组的研究主要由美国和加拿大主导,中国也参与其中。截止到今年,国际上启动的大型人类微生物组研究项目有13项,其中8项正在实施,另外5项已完成(表1)。

  环境微生物组的研究相比人体微生物组研究开展更早,涉及范围也更广泛。客观说,微生物组研究的很多工具、方法、思路等多来自于环境微生态学领域。综合看,美国在环境微生物组方面的大型研究项目占据绝对主导地位(表2)。

 

 

  整体讲,各国都在加紧制定符合本国经济利益的微生物组项目。项目的目标设定都比较宏观和长远,国际化合作项目越来越多,且精细化、专业化项目越来越多。其中,计算生物学和生物信息学、参考数据库和生物资源库、标准化的协议和工具等方面是微生物组研究的重点。纵向和功能性的微生物组研究及跨学科研究也越来越受欢迎。

  市场分析

  美国政府一直在微生物组研究领域进行投资。早在2007年,美国国家卫生研究院启动的人类微生物组计划(HMP)中,就累计投入资金2.15亿美元,为今天微生物组研究的迅猛发展奠定了基础。近几年,美国政府对微生物组领域的支持力度进一步增加。2016年,美国白宫宣布启动国家微生物组计划(NMI),美国政府将在未来两年投入1.21亿美元联邦资金作为该计划启动资金,除了联邦机构,数十所大学和研究机构将加入“国家微生物组计划”,将在未来几年投入总共4亿美元的启动资金。

  据不完全统计,2016年,提供宏基因组测序服务的公司在微生物业务方向的销售额超过1亿5000万元。其中上海美吉生物医药科技有限公司2016年微生物业务方向业绩达到4600万元,较2015年(3700万元)同期增长12.43%(表4)。

  2016年国家自然科学基金中标项目统计结果显示,微生物组研究领域的中标项目有584个,累计金额2.75亿元,占国家自然科学基金总金额(183.2亿元)的1.5%(表4)。

 

 

  研发动向与展望

  微生物群落分析最大障碍是生物信息学和计算瓶颈,如构建基因集改善reads组装,构建特定微生物类群注释平台并开发多组学综合算法,增强对微生物组群落和潜在功能的阐释。宏基因组学研究中还需解决的其它挑战包括:高度多样化和复杂样本类型(如土壤、沉积物和人体肠道)中DNA分子提取,直接从复杂生态系统中组装完整基因组序列而非序列片段,满足大型宏基因组denovo组装的高计算内存需求,对TB到PB数据足够的存储和分析选择,开发统计和数学模型来整合数据并提供有生物学意义注释信息。

  降低成本

  国内宏基因组学研究仍落后于国外水平,一部分原因归结于宏基因组研究成本较高。目前国内大部分科研及医疗机构仍依托扩增子测序技术(价格是宏基因组测序服务价格的十分之一)从事微生物组研究,并对宏基因组测序技术了解不深入。相较2015年,2016年测序成本降低至同期的四分之一,但宏基因组测序服务(测序+生物信息学分析)价格却只降低约30%,因此我们仍需促进宏基因组学研究的普及,提高科研及医疗机构研究人员生物信息学分析能力和水平,从而降低宏基因组学研究的服务成本。

  降低污染

  对于人体、动物和植物组织等含有宿主细胞及粘膜、血液和牙龈等微生物含量较低的样本类型,常规DNA提取手段无法有效避免宿主或环境(试剂盒)污染。目前针对宿主的污染情况可在后续生物信息分析时通过比对宿主参考序列剔除;微生物含量较低类型样本可以通过全基因组扩增(WGA)的方法提高微生物DNA的含量,但研究成本会相应增加。因此,仍需研发特殊方法,如基于宿主与微生物DNA沉降系数不同进行梯度离心,最大程度降低宿主DNA含量。此外,由于不同微生物(如细菌与真菌)细胞壁结构存在差异,目前市场上流通的DNA抽提试剂盒很难保证均一化抽提各类微生物DNA。就细菌与真菌而言,可在微生物细胞裂解前加入真菌破壁酶,提高真菌DNA抽提比率,以期最大程度客观还原环境中微生物的真实群落结构组成。

  优化生物信息分析流程

  目前微生物组研究主要集中在人体和实验室环境方向,对于极端环境领域尤其是未知的复杂微生物组样本类型的测序数据,数据拼接利用率较低(不足50%)。对此,一方面我们要拓展对未知环境领域的微生物组研究和认识,将已有数据整合构建参考数据库;另一方面还需优化宏基因组数据拼接流程并开发新算法,尽可能提高宏基因组数据利用率。也可以参考基因组学研究中酶切图谱技术,Hi-C(又称Meta3C)技术,三代测序数据辅助拼接,以及二代、三代数据混合拼接等方法以提高测序数据拼接效率和准确性。

  测序流程标准化

  微生物研究中,宏基因组测序技术作为主要方法,已经并且将继续产出海量测序数据和分析结果。在宏基因组测序中使用标准化的实验和分析流程将有助于后期数据整理、储存和共享。此外还需各领域研究组织和机构间相互协作,建立宏基因组数据共享平台,将测序数据及结果信息(Metadata)以标准化语言格式上传共享,以便不同研究者间进行相同或不同生态系统间微生物多样性和功能比较,以及检索特定生态系统中微生物群落和功能。

  与其它组学相结合

  核酸测序和质谱(MS)技术进步使各种日益复杂的生态系统中的微生物组分析成为可能。近十几年,国外科研工作者将先进测序和质谱技术相结合对不同多样性和复杂性的微生物组(包括切页蚁群、白蚁肠道、人体肠道、沉积物、海洋水体、冻土和草原土壤等)进行研究,而国内多组学研究目前仍不够成熟。随着技术手段不断提高,利用多组学结合技术(基因组学、转录组学、蛋白组学与代谢组学相结合)将微生物群落的新的和已有的研究结果进行整合,对于破译微生物在其栖息地的作用,确定微生物群落成员间复杂相互作用对生态系统持续性和健康的影响至关重要。对微生物群落表型的更深入认识将便于我们更好地理解环境扰动,如气候变化和疾病对微生物组功能的影响,更好地预测这些变化的影响并促进形成维持生态系统稳定性和人体健康的策略。

  启动中国人的微生物组计划

  中国人也应尽快启动自己的微生物组计划,利用中华民族遗传背景、生活方式和养生保健经验丰富多样的优势,把大规模样本资源、现代组学技术和大数据技术结合起来,建立中华民族典型人的健康与疾病微生物组标准数据库和菌种库;建立以微生物组结构和功能动态为核心的人体健康监测新技术;开发可调节微生物组以改善健康的药食同源食品、药品、益生元、益生菌及可重构健康微生物组的菌群移植等新产品和新技术;为预防疾病、改善中国民众健康、推动中国传统医药升级换代和走向世界作出独特的贡献。

  作者单位:上海美吉生物医药科技有限公司

首页投稿广告关于我们联系我们

版权:《高科技与产业化》编辑部版权所有 京ICP备12041800号

地址:北京市海淀区中关村北四环西路33号 邮编:100080

联系电话:(010)82626611-6618 传真:(010)82627674 联系邮箱:hitech@mail.las.ac.cn