站内检索

精准医学基因大数据时代来临
作者: 发表时间:2017年07月03日

 

  十几年前,人类基因组计划花费30亿美元初步完成第一个人类基因组数据草图。这是全面、准确、透彻地了解每个人种、民族到个体基因组的开端。

  近年来,下一代高通量测序技术发展迅猛,测序成本飞速下降,基因测序产生的数据量呈爆发式增长。测序技术带动“精准医学”成为国际医学发展最新趋势。精准医学的本质在于通过基因测序技术,对大样本人群进行基因组测序分析,并结合临床信息及健康记录信息精确寻找致病原因和治疗靶点,同时对疾病所处的不同状态和过程进行精确分类,最终实现特定患者人群精准区分,达到个体化精准治疗的目的,提高疾病诊治与预防效益。其发展的核心方法是大规模人群队列的基因组研究。

  发展现状

  2015年1月美国总统奥巴马宣布的百万精准医学启始(Precision Medicine Initiative)的目标就是完善已建立的研究体系,以开展更大规模的研究。其规划中的2.15亿美元启动基金,过半预算用于建立和登记精准医学研究的人群队列。在现有基础上,NIH已提出明确的阶段目标——“大数据到知识(Big Datato Knowledge)”。近年来,荷兰、挪威、加拿大、英国等国家都先后启动数万人的基因组研究计划,例如英国的目标是在2017年底获得10万名癌症及罕见病患者的全基因组信息。而人口仅33万的冰岛已完成10万人全基因组测序,对该国人群基因组结构及一些疾病相关基因做了深度分析。

  面向精准医学的大规模队列研究在我国虽起步稍晚,但一经提出,便受到国家层面的极大重视,并被纳入国务院的“十三五”规划中。国务院印发《“十三五”国家科技创新规划》(国发〔2016〕43号文),明确提出未来五年国家科技创新的指导思想、总体要求、战略任务和改革举措。其中针对精准医学关键技术提出,把握生物技术和信息技术融合发展机遇,建立百万健康人群和重点疾病病人的前瞻队列,建立多层次精准医疗知识库体系和国家生物医学大数据共享平台等。

  挑战和机遇

  大规模人群队列基因组研究存在多维度数据结构化存储困难、数据关联度低、数据分析速度慢、数据解读难度大、数据管理成本高等问题,迫切需要一个面向大规模人群队列提供服务的基因组分析解读平台,利用该平台解决基因组数据的分布式存储和多数据库整合查询、自动化分析解读及可视化的人机交互等一系列问题,以实现数据分析解读的精确化、快速化、自动化、可视化。

  国外近几年出现了众多提供基因组测序数据解读服务的平台。相比之下,目前国内非常缺乏具备强大分析能力和分析精度的精准医学大数据平台。该基因组分析解读平台的建立必将成为提升临床诊断合理化、精确化,加速我国疾病预防与治疗整体水平提高的重要保障。对我国进一步开展全民健康管理、提高国民身体素质和生活质量有着重大和里程碑式的意义。

  行业展望

  可以看到精准医学大数据时代正在来临,其发展将促使我们尽快构建一个实时、便捷、全方位的医药领域研究与应用系统。在生物信息方面,我国还没有设立类似美国国家生物技术信息中心(The National Center for Bio-technology In for mation,NCBI)和欧洲生物信息研究所(European Bioinformatics Institute,EBI)那样的机构,专门从事生物信息大数据的管理、汇聚、分析、发布等工作。因此,国内的生物信息资源整合还有很多工作,面临很大困难。在医学信息方面,我国还主要处在对医疗流程的信息化管理、质量控制等初级阶段,尚未开展面对“大数据”的系统研究与挖掘。但这种研究与挖掘必将成为精准医学发展的趋势,未来的赢家必然是以大数据为核心的技术。大数据的到来,既对临床医生、医院、研究人员、医疗监管机构等都提出了巨大的挑战,也为生物医学研究带来了前所未有的机遇。

  北京中科晶云科技有限公司

  北京中科晶云科技有限公司(以下简称中科晶云)由中国科学院计算技术研究所和中科信息产业研究院精准医学研究所的精准医学团队创办,由生物学、医学、生物信息学、计算科学等多学科交叉背景的人员组成。该团队从2008年起展开医学大数据平台的开发与医学大数据积累,在基因组学、转录组学、蛋白质组学、代谢组学、表观遗传等多个维度的基础上结合传统影像学、生化分析、临床症状等因素,挖掘组学大数据与临床大数据中潜在的联系与规律,从而对疾病的精准诊断与治疗提供帮助。

  技术研发

  团队在国内最早将云计算技术与基因测序分析相结合,利用hadoop云计算框架对宏基因组分析进行加速研究,取得了超过100倍的加速效果。数据库整合建设方面,构建了具有国际影响力的基因数据库NONCODE,该数据库于2012年被欧洲生物信息中心邀请成为核酸领域专家数据库,是我国生物领域唯一加入国际数据联盟的数据库,相关论文他引次数超过400次。生物信息算法研究方面,开发了RNA蛋白编码能力的预测模型CNCI,该模型在国际上首次采用二联密码子频率作为关键特征,对RNA编码能力进行跨物种预测,准确度从80%左右提升到99.7%。团队共申请发明专利3项,软件著作权登记3项。

  市场应用

  中科晶云团队致力创新技术在精准医疗市场的转化应用,在国内最早将云计算技术与基因组大数据分析相结合。在遗传病领域已发布晶读TM遗传病基因组数据解读平台,实现从遗传病基因组测序数据到临床关联分析报告的一站式处理;在肿瘤领域与多家医院开展合作,搭建了完备的肿瘤基因组学分析流程,开发了肿瘤解读与靶向用药一体化平台——晶锐TM一体机;在健康管理领域,依托基因大数据推出晶预TM健康管理基因检测产品,使疾病预防再提前。

  晶读TM遗传病基因组数据解读平台

  单基因遗传病种类多,单个病种的发病率低,大多数疾病发病机制不明,其诊断一直是临床医生面临的“老大难”问题。为辅助临床医生诊断单基因遗传病,中科晶云团队耗时两年精心打造晶读TM——基于NGS的遗传病解读平台,“准”、“易”地解决了遗传病所面临的两类测序数据分析问题。

  晶读TM平台以“协助专业的人做专业的事”为指导思想,借助首创的变异解读模式和CIVAR组件,协助临床医生和遗传学专家进行精准、便捷的NGS数据分析解读。自主开发的五大基因变异解读组件CIVAR由Caller(变异鉴定)、Interpreter(变异筛选)、Viewer(可视化)、Archiver(本地库构建)和Reporter(报告生成)五个组件构成,在确保解读结果一准再准的前提下,为医生提供简单易用的遗传病NGS数据解读解决方案。

  晶锐TM肿瘤一体化平台

  晶锐TM肿瘤一体化平台快速准确地对大规模人群列队的肿瘤基因组测序大数据进行分析,通过高通量测序检测患者肿瘤组织的变异,可快速准确地对肿瘤驱动基因及致病基因进行鉴定,为临床提供靶向治疗及个体化化疗依据,向医生推荐用药方案,包括靶向用药,化疗药等,同时向患者推荐可参与的药物临床试验。

  晶锐TM肿瘤一体化平台将广泛服务于全国的科研单位、医院及基因检测公司等机构,推进测序技术向临床应用的转化,加速癌症和遗传疾病研究,进而推动疾病诊疗和个人健康管理进入新时代。

  晶预TM健康管理基因检测产品

  中科晶云基于多年的科研和临床研究,依托“大数据+基因检测”,推出晶预TM健康管理基因检测产品,涵盖了遗传病,遗传性肿瘤风险评估,运动健康,药物反应,营养需求,体质特征等多个板块的检测,可全方位指导健康生活。

  内容由北京中科晶云科技有限公司提供

首页投稿广告关于我们联系我们

版权:《高科技与产业化》编辑部版权所有 京ICP备12041800号

地址:北京市海淀区中关村北四环西路33号 邮编:100080

联系电话:(010)82626611-6618 传真:(010)82627674 联系邮箱:hitech@mail.las.ac.cn