站内检索

大数据时代的新责任
作者:韩亦舜 发表时间:2016年03月02日

 

  随着传感器技术、移动互联网设备的普及,加之廉价的存储能力和计算能力及社会网络构成的新关系的发展,我们身边的数据经历了从量变到质变的跃迁。“忽如一夜春风来,千树万树梨花开”,大数据时代已然来临,无疑会影响和改变我们的工作和生活。

  面对新挑战,承担新责任

  大数据时代带来了很多新挑战,同时也意味着很多新责任。

  首先需要面对和解决的就是由于信息技术的发展所造成的信息不对称问题。互联网的出现极大地推动了信息的传播,使“秀才不出门便知天下事”成为可能。电子商务平台的兴起颠覆了传统的批发零售业态,让消费者能够便利地网购。然而,计算机屏幕的展示面积毕竟有限,令其成为了信息传播的新瓶颈,也成为了商家争抢的新资源,特别是移动终端,更是寸屏寸金。卖家贿赂也就有了滋生的土壤。如何在方寸之间公平、公正、公开地展示信息,成为大数据时代无法回避的难题。

  利用大数据减少资源利用不均衡的问题同样不可忽视。在11.11狂欢购物节时段,上网抢购的人数暴涨,对服务器和带宽的需求激增,物流需求更是被无限放大,商家忙得不亦乐乎,钱挣得盆满钵满。节后,购买欲望普遍下降,连带着服务器和带宽的需求也会随之下降。把原本相对均衡的供给与消费,人为地搞成了波动性潮差,不仅导致资源利用的不均衡,需求供给的不均衡,更容易引发商家的不当得利。其实,消费者更希望能随时方便地买到品质好价格合理的商品。如何减少社会资源的浪费也是大数据时代不得不面对的问题。

  理性发展大数据产业是中国特有的偏题。目前,中国各地都在争着建设数据中心,指望它能带动GDP的增长。但实际上数据中心普遍的装机量不足设计装机量的10%。资源配置不合理的问题十分突出;另一方面,多数数据中心的能耗也不达标,中国的绿色数据中心标准PUE是1.5,在一些发达国家的一流大公司,像Facebook、Google的数据中心,其PUE指标已经能够控制在1.1以下。这意味着在数据中心这个新兴产业中,我们的单位产量能耗指标大大落后于他人。数据中心往往都是耗能大户,对能源、甚至水资源都有超常的需求,对周边环境也有巨大的的影响。因此,我们在建设数据中心时,特别要避免它的副作用。

  如何减少大量的冗余数据也是中国特色的怪题。虽然大数据时代并不是悄然来临,但我们却没有用大数据的思维去采集数据、存储数据,而是沿用小农经济的思维习惯,洋洋得意于自给自足。在不少单位手上,都存有一大堆和别人几乎一样的数据,只是为了自己用着方便,就全然无视大量数据冗余造成的社会资源浪费。就连那些整天奔走呼吁数据开放共享的人,都不肯把手上的数据与人分享,以减少数据冗余。因此,我们应该全力推动数据的互联互通,把具有共用价值的数据放在一个可以分享的地方,让大家随用随取,进而节约社会资源。

  政府的数据互通与开放是政府重塑公信力的机会。由于管理模式的不同,我国政府拥有比西方政府更多的数据。无疑这是一笔宝贵的财富,但要使它的价值体现出来,却有很长的路要走。Global Open DataIndex的数据显示,2013年和2014年持续名列第一的是英国政府。在英国伦敦市政厅的网站上,单笔超过250英磅的政府开支全部列出向公民开放。政府数据开放其实是要告诉纳税人钱花在哪儿了,让老百姓行使监督权。从这个评测维度来看,中国还是走得慢了一些。

  大数据生产力释放的前提是生产力关系的变革。有位业内人士在谈到中美创新生态的比较时说:中国比较多的是商业模式创新,美国比较多的是技术创新。技术创新不容易,需要很多积累。中国更多的技术创新都被生产力关系所束缚,所以我们需要更多地去关注打破生产力关系对生产力的束缚,使之释放出新的能量。这不只是政府的事,我们每个人都有可能在不经意中就把某些生产力给束缚了。要注意,做大数据并不必然代表先进的生产关系,也不必然表明思想意识是超前的。如果不时时接受检查和监督,一样可以成为落后生产力关系的代表,一样造成新的浪费。这是我国大数据产业发展面临的最大挑战。

  用好大数据,承担大责任

  自有大数据以来,越来越多的人意识到数据是一笔重要的资产,而保证数据的安全则是一个重大责任。

  数据可以比较简单地划分为与人无关的数据和与人有关的数据。比如说自然界的天气、海啸、地震、石油等,这些与人没有太多直接关系的数据,谁采集谁拥有(当然是依法采集)。而与人有关的数据,采集的时候就要注意,这个数据的权属是数据拥有者的。我们每天都会遇到各种各样被迫要“同意”“接受”的应用,大多数情况下我们也都接受了(如果是苹果手机,你可能还有一些其他选择的权利;如果是安卓系统,也许你只能接受全部条款)。在这背后,隐含着数据拥有者和数据采集者之间建立的一种契约关系。采集别人的数据就要对别人的数据负责任。现在有不少企业热衷于在网上“扒数据”,却不想承担数据安全责任。大数据行业的从业人员必须要依法管好用好所采集管理的数据,如果客户数据出现了某种闪失,公司是要承担法律责任的。

  公民的个人数据比如身份证信息、出行信息、在公共区域被采集的影像信息,该由谁来负责?我想应该由政府负责。公民数据如何利用和保护是政府的责任。2014年底,上海外滩踩踏事件发生之后,很多单位拿出的数据显示,当天的人流与前一天相比变化巨大,有明显异常。由于对这样的数据没有加以共享和利用,结果发生了这么大的悲剧。像这类涉及公共安全的公民信息,政府应该加以合理利用。数据不加以利用就不会产生价值,拥有大量公民数据的政府,怎样把这些数据安全地用好是全新的责任。

  我们每个人都应该有私密的空间,在这个空间里有属于自己的个人隐私。但那些在公共区域被采集的个人数据你要想拥有或删除,就不一定合法。隐私的概念在大数据时代更不可以随意泛化。虽然个人的健康数据一般认为是属于隐私范畴,但我们也应该学会换位思考,每个病人的病历都是医生的知识、技能在病人身上具体实践的结果,成功亦或失败都是人类的财富,这些数据资源应该依法脱敏后加以利用。合理开放有益于社会发展进步的私人数据,是我们作为社会人的社会责任。

  编造虚假数据应该负什么责任?我认为应该严格立法,让编造数据、数据造假的行为被法律制裁。数据带给人类的价值是让我们把这个世界看得更真切精准。如果有人数据造假,就会严重干扰人类的认知,进而影响决策,是对人类尊严的冒犯。即使真实的数据不那么漂亮,只要是真实的就自有其价值。如何承担起这些大责任,迎接这些大挑战,是大数据时代赋予我们的使命!

  作者简介:清华大学数据科学研究院执行副院长

首页投稿广告关于我们联系我们

版权:《高科技与产业化》编辑部版权所有 京ICP备12041800号

地址:北京市海淀区中关村北四环西路33号 邮编:100080

联系电话:(010)82626611-6618 传真:(010)82627674 联系邮箱:hitech@mail.las.ac.cn