站内检索

赵屹:左手科研,右手临床
作者:王玲 发表时间:2016年07月25日

 

  虽然“精准医疗”还是相对较新的词汇,但中国科学院计算技术研究所生物信息实验室PI赵屹博士和他的团队却已在这个领域深耕了十几年:解读数据,为科研人员和医生提供高效、专业的生物信息技术支持是他们一直在坚持的事情。自2000年以来,赵屹在非编码RNA、网络算法、测序数据处理及癌症组学等领域不断积累,取得不俗成绩。

  不久前,赵屹在北京接受《高科技与产业化》杂志专访时表示,生物信息学是典型的应用型交叉学科,既能在科学研究方面发现很美妙的新现象、新规律,又很接近临床应用,有潜力造福患者。也正是因为如此,他在科研领域没有止步于发文章,写专利,而是将研发的软件和工具开源,让更多的科研人员受益,同时,他也基于自己的研究成果创办了以医学健康基因大数据分析为主营业务的高科技企业——中科晶云科技有限公司,努力实现科技成果转化为商业价值。

  从临床中来,到临床中去

  毕业于清华大学生物信息学系的赵屹博士具有医学背景,临床医生的从业经历让他对临床应用和疾病的认知更为深入,而生物信息领域的研究积累又让他能够针对临床问题,利用信息分析利器,找到答案。

  他举了一个生物信息学帮助临床肝癌分型的例子。众所周知,肝癌是中国高发的疾病,然而在临床诊断中,对于肝脏上多发的肿瘤病灶却依旧很难确定它们是散播的还是独立生长的,B超、核磁甚至病理都没有办法准确判断。从临床医生的经验来看,如果多个癌灶在肝内是彼此独立形成的,那么这类病人可能尚属于肝癌发生早期,通过手术切除能达到较为理想的效果,而且愈后较好;但如果癌灶之间存在遗传关系(肝内播散),换句话说,其中一些癌灶是通过其他癌灶转移而形成的,那么这类病人应属于肝癌晚期,手术效果差。然而这种假说之前从未被真正证实过,一直存在于肝脏外科医师的经验中。

  赵海涛医生就是这些肝脏外科医生中的一员,由于赵屹的医学背景使得他与这位协和医院的医生交流更为深入和便利,因此他们很快达成一致,并联合中国医学科学院基础医学研究所的蒋澄宇研究员就假说展开验证。

  在研究中,他们分别对愈后具有显著差别的病人的肝内多个病灶,灶旁组织以及外周血样本进行了全基因组及全转录组水平的高通量测序。利用生物信息学分析手段,鉴定了精确的HBV整合位点、体细胞突变、拷贝数变异、基因组结构变异以及差异表达基因等各类事件。

  结合临床数据,赵屹的团队建立了高复发潜质及低复发潜质的计算机分子模型,基于这两种模型比对出来的大量候选基因源源不断进入临床验证之中,逐渐成为肿瘤治疗的标记物及靶点。为解决肝癌病人临床治疗指南的制定及术后治疗问题提供了重要的科学依据。

  对于肝癌转移模型的病人,虽然不适合手术切除,但临床医生能够发现其个体化的致癌基因,针对原发癌灶的关键突变基因进行靶向纠正,可能会达到较好的治疗效果,而对于多中心独立起源的病人,医生在手术切除后实施定期监控,对新发的肿瘤依然可以进行后续切除的尝试。

  开源合作,加速精准医学发展

  虽然生物信息技术已经在临床中得到一定的应用,但在赵屹看来,需要深耕的领域依旧很多,“基因组中大概有95%的信息我们都还不能理解。要理解这些信息,最重要的一点就是要开放,要交流”。赵屹说,他的课题组由具有学医,生物学、计算学、物理、化学等多学科背景的科研人员组成,“生物信息学是交叉学科,不同专业的人看问题的角度也不一样,想法有差异,这样才能够碰撞出新的火花”。

  其实不仅是课题组内部,赵屹和中国科学院计算技术研究所其他课题组也有合作,比如侧重算法研究的课题组。因为一个人的全基因组有将近100G的数据量,不仅要求算得准,还要求算得快,对于硬件和算法要求非常高。赵屹说“计算所有一个很好的平台和氛围,各方优势互补,让我们在科研道路上走得更远”。

  数据的共享也是开放研究很重要的一部分,但从目前来看,精准医学研究领域的数据共享和分享情况不容乐观。“我们国家没有一个独立的数据存储和运营平台”,赵屹表示,“其实数据的聚合效应是1+1>2的,如果大家把数据放在一起,不同的人从不同的层面去抽取、分析数据会让数据发挥更大的价值,而且对于研究人员来说,开放数据让更多人看到,也能够使自己的研究得到更多人的关注,进而提高影响力”。

  实际上,数据是否公开、共享也折射出相关各方对于数据不同的态度和理念。对于医院和医生来说,临床医学数据是非常有价值的“金数据”,无论是对临床科研还是管理都很重要,另一方面由于临床数据包含患者的隐私,因此在数据公开共享方面,如何保障医生及医院的权益,维护患者的隐私是需要慎重考虑的问题。如果没有相关的政策和法规,医院和医生不愿意共享数据也容易理解。

  相对而言,受国家资金资助的公益性研究项目在数据公开共享方面面临的障碍理应较少,但由于缺乏统一的管理,没有统一的数据标准,要么数据存储随着项目的终结而终结,要么数据不能被有效利用,数据价值还是得不到充分释放。由此看来,建立各方都能参与并且有利益共享机制的平台显得尤为重要。

  赵屹建议,为了数据平台能够维持自身运营,可以设置数据开放不同等级的权限,公益性研究可以免费使用数据库,如果是商业性开发,就可以考虑向平台支付一定的费用。

  专业态度与精准技术缺一不可

  由于医学数据、健康数据维度相对很高,也非常专业,因此门槛很高。要刻画一种疾病,需要有各种各样的检测方法,比如临床上有生化检测、影像学检测、病理检测等等。加之基因检测,各个组学的检测,非常复杂,需要花大力气才能得到相对完整的数据。

  这样高维度的数据的采集和分析对专业性要求也就更高。一般来说,科学的数据采集和分析都需要质控和标准化,不同的方法之间要有对照。而事实上,真正开始从临床采样操作开始,具体到医院,或者具体到操作人都可能会引入一些偏差,而这些偏差现在还并没有被及时纠正。

  可喜的是,国内也正在紧锣密鼓制定精准医学相关数据标准。赵屹的实验室参加了抗癌协会的病理分会,正在参与数据采集到整个数据分析流程的质量控制和标准制定。

  不仅数据标准的制定,数据分析方法的不断改进和提升也是精准医学快速发展的“另一车轮”。由于精准医学的数据是不完美的、增速飞快的大数据,要想“精准”确实很难。“不过可以看到,随着人工智能、神经网络、深度学习等方法正在与生物数据包括精准医学的数据发生碰撞,让人们看到精准医学大数据处理和分析不断涌现出的可能性,以及未来精准医学向智能化医学发展的广阔前景”。

  赵屹博士简介

  中国科学院计算技术研究所生物信息实验室PI,主要从事疾病多组学数据挖掘算法研究及生物医药云计算平台研发。近十年在Cell stem cell等国际著名期刊发表论文40余篇,SCI总引用超过1100次,单篇SCI引用最高达269次;H-INDEX为16。

首页投稿广告关于我们联系我们

版权:《高科技与产业化》编辑部版权所有 京ICP备12041800号

地址:北京市海淀区中关村北四环西路33号 邮编:100080

联系电话:(010)82626611-6618 传真:(010)82627674 联系邮箱:hitech@mail.las.ac.cn