站内检索

大数据产业的美国经验与中国对策
作者:罗涛 发表时间:2014年08月28日

  大数据虽然是继云计算之后兴起的一个热门产业,但在西方其实已经度过了成长期,开始步入大规模商业化阶段,而大数据产业在我国则还处于成长阶段,与西方有较大差距。我国发展大数据产业,既要吸收和消化西方先进的技术和经验,又要鼓励自主创新,迎头赶上。

  美国是全球大数据产业的发祥地,也是全球大数据产业的中心,当前美国经济正在朝数据密集型经济和以数据为中心的经济转型,大数据在美国已进入大规模商用阶段,美国是全球发展大数据产业最成功的国家。

  美国发展大数据产业的经验

  信息技术企业纷纷转型

  美国是全球信息技术产业的领头羊,在硬件和软件领域都拥有超一流的实力,然而,早在大数据概念火热起来之前,美国信息技术产业在大数据领域已经有了很多技术积累,这使得美国的大型信息技术企业可以迅速转型为大数据企业。其中有的企业自身就是大数据技术的推出者,谷歌就是典型代表,大数据核心技术Hadoop则是雅虎员工Doug Cutting根据谷歌2003年发布的学术论文研究而来。有的企业则通过收购业内已经存在的大数据企业来建立大数据业务,典型代表是IBM,自2005年以来,IBM出资160亿美元收购了超过30家大数据企业。大数据不同于传统的结构化数据,而是充斥了非结构化数据和半结构化数据,美国在结构化数据库领域有数据库行业的领头羊甲骨文公司,但甲骨文公司也推出了大数据业务。不仅如此,全球最大的芯片企业英特尔也进入大数据产业,而全球最大的PC厂商惠普也在精简PC业务,2011年斥资110亿美元收购英国大数据企业Autonomy公司,进入大数据业务。

  初创企业层出不穷

  大数据技术创新速度快,而大数据产业的基础技术Hadoop是开源项目,这就为初创企业提供了极好的技术创新平台,而美国发达的风险资本行业为大数据初创企业提供了资本温床。美国大数据的初创企业主要有两个来源:最大的来源是大型信息技术企业员工出来创业。大型信息技术企业固然人才济济,创新能力强,但是也有弊端,很多优秀的科学家和工程师不断冒出好的想法,却不一定能受到企业的支持,在这种情况下,跳出大企业自己创业便成为一个极好的选择。第二大来源则是大学大数据技术转移的结果,美国大数据产业的基础技术虽然出自大型信息技术企业,但大学开放自由的学术环境为大数据教育和科研提供了平台,通过教育和发表论文,大学成为美国大数据产业的一个重要推动力,一些教授和学生通过大学技术转移的方式,组建大数据初创企业,是很自然的事情。因此,层出不穷的初创企业成为美国大数据产业不竭动力的一个重要来源。

  形成完整的产业链

  从当前看,美国大数据产业生态系统不仅已经形成,而且企业数量惊人。从长远看,美国大数据产业生态系统处于不断变化的过程中,因此,要对美国大数据产业生态系统做一个准确的描述是不易的。不过就大数据产业的特性看,美国大数据产业生态系统划分为纵向的两个层次、横向的三个层次,纵横交错形成完整的大数据产业链。从纵向看,处于底层的是一些开源项目,大数据产业底层的核心技术都是开源项目。建立在开源项目基础之上的则是基础架构、证析和应用。从横向看,依次是基础架构、证析和应用,其中,运用建立在数据源基础之上,而一些大型信息技术企业横跨基础架构和证析两个领域。开源项目、基础架构、证析、应用、数据源每个领域都可进一步细分为若干个子领域。从美国大数据企业数量分布看,有如下特点:一是开源项目企业数量较多,表明美国大数据产业基础技术多元化。其次,美国大数据企业主要分布在基础架构和证析两大领域,表明美国大数据产业基础技术已经成熟,目前产业重心已经上移。三是应用和数据源两个领域的企业数量不多,表明美国大数据产业还有成长的空间。

  应用拉动产业发展

  市场对大数据的旺盛需求是拉动美国大数据产业发展的一个重要动力,从市场蔓延的趋势看,美国大数据产业的需求主要来自以下方面:首先是一些信息技术企业,尤其是后起的信息技术企业。数据利用和分析在美国并不是一个新现象,但互联网时代数据的爆发式增长,使得一些新兴的信息技术企业虽然不是数据的最先利用者,但是毫无疑问开启了大数据时代的大门,典型代表是盈利模式基于大数据的信息技术企业,如搜索引擎企业谷歌,门户网站企业雅虎,电子商务平台eBay,在线购物企业亚马逊,社交网络企业Facebook、Twitter、LinkedIn。其次是传统上对数据管理极为依赖的企业,典型代表是华尔街的金融企业。一些大型金融企业在数据基础设施上投资力度之大,已使得自身与信息技术企业无异,金融数据正在成为金融企业的起点。第三是大数据应用潜力巨大的企业。典型代表是电信行业和医疗卫生行业。第四是数据驱动型企业越来越多,这些企业正在形成数据驱动文化,即利用数据的采集和证析来改善运营效率和决策水平,其典型代表是美国航空、百货、能源和汽车企业。

  联邦政府高度重视

  大数据在美国企业中的广泛应用引起美国政府和学术界的高度关注,美国政府高度重视大数据,这是因为,大数据与联邦政府职能息息相关,主要体现为两个方面:一是国家安全,二是科学研究。前者源自网络威胁,后者则源自1998年图灵奖得主、微软科学家吉姆·格雷2007年所做的科学研究第四范式的著名演讲,他在演讲中首次提出科学研究已经进入第四范式,即人类的科学研究已经历了经验、理论、计算三个科学研究范式,目前已经进入第四范式——数据探索。美国总统科技顾问委员会基于上述两个方面的考虑,2011年建议奥巴马总统建立专项计划推进国家安全和科学研究领域的大数据建设。2012年3月29日,奥巴马政府发布“大数据的研究和发展计划”,旨在加强政府和学术界的大数据应用能力,最终目的是加强大数据时代的国家安全和科学研究能力。

  融入教育和科研

  美国大学目前对大数据有很高的热情,大数据成为美国大学很多学科关注的焦点,主要表现为:一是大学计算机学科为大数据产业界输送和培养数据科学家。数据科学家被誉为21世纪最性感的职业,而美国大学的计算机学科是世界顶级的,主要分布在西部和东中部,西部有斯坦福大学、加州大学伯克利分校、华盛顿大学(西雅图)等,东中部有麻省理工学院、卡内基梅隆大学、伊利诺伊大学厄巴纳-香槟分校、康奈尔大学等。美国大学这些世界级的计算机系与大数据产业联系紧密,毕业生十分抢手。二是大学经济系、商学院等社会学科为大数据产业提供经济学分析和管理人才。例如,谷歌首席经济学家、著名信息技术经济学家Hal Varian出自加州大学伯克利分校。再例如,哈佛大学经济系教授Susan Athey利用微观经济学的最新研究成果为谷歌等搜索引擎企业的在线广告拍卖模式提供经济学分析。三是美国大学一些学科在科学研究领域率先引入大数据。典型代表是生物医学,2012年斯坦福大学医学院遗传学系已经开始运用临床和基因大数据进行科学研究。因此,大学纷纷将大数据融入教育和科研,使得大学成为美国大数据产业的一个重要推动力。

  我国发展大数据产业的对策

  及早对大数据进行产业规划

  大数据在西方已是成功商用化的技术,因此,我国对待大数据,不能只停留在科技攻关的层面,而是应该将大数据作为一个产业来发展。2011年11月工信部出台了《物联网“十二五”发展规划》。2012年9月,科技部发布《中国云科技发展“十二五”专项规划》,工信部也正在制定《云计算产业战略规划》。地方层面,在国家层面的带动下,各地纷纷出台云计算产业发展规划和物联网产业发展规划。而对大数据产业,不仅国家层面没有专门的产业规划,在地方层面,目前我国没有一个省市对大数据进行产业规划和布局,即便是发展大数据产业条件最为有利的北京,在《中关村战略性新兴产业集群创新引领工程(2013—2015年)》中,也只提出进行大数据应用示范工程,并未专门对大数据进行产业规划。

  统筹各方力量共同推进

  大数据是个跨学科的领域,涉及多个学科,目前我国还没有一个大数据的行业协会,只是个别学会成立了大数据专家委员会,例如2012年9月中国计算机学会成立了以中国工程院院士、中国计算机学会名誉理事长、中科院计算所研究员李国杰领衔的70人的大数据专家委员会;2012年10月中国通信学会成立了中国工程院院士、中南大学校长张尧学领衔的37人的大数据专家委员会。但这些只是在学术层面推动成立的咨询组织,还不能构成行业协会。此外,2012年12月,由云基地、宽带资本等公司共同发起的中关村大数据产业与创新联盟宣告成立,宽带资本董事长、云基地创始人田溯宁担任理事长,该联盟将在中关村管委会的指导下开展大数据产业推进工作,因此不是一个全国性的大数据行业协会。下一步我国应组建一个全国性的大数据行业协会。

  构建多层次产业生态系统

  西方大数据产业已经形成一个多层次的产业生态系统,不仅形成了完整的产业链,而且在产业链的每个环节,既有大企业参与,也有众多的初创企业。不仅大企业之间有并购,而且初创企业也经常成为并购对象,由此使得西方的大数据产业创新途径多元化。我国目前缺乏一个多层次的大数据产业生态系统,没有形成完整的产业链,而且大企业参与大数据产业的不多,技术型的初创企业也不多,因此大数据在我国虽然已有不少应用案例,但从产业形成和发展的角度看,目前大数据在我国还不成气候,还停留在业内的概念探讨阶段。

  推动信息技术企业转型升级

  西方的大型信息技术企业在信息技术不断进步的情况下,懂得跟上时代的步伐,主动进行战略的调整,目前美国IBM、惠普、英特尔、微软、谷歌、甲骨文、Facebook、亚马逊等大型信息技术企业在大数据时代纷纷调整战略,推出了大数据业务,转型升级为大数据企业,其步伐之一致,在信息技术产业历史上是少见的。反观我国信息技术企业,对于大数据业务态度并不积极,还停留在过去的发展思路上,跟不上时代前进的步伐。因此,我国要推动大型信息技术企业转型升级为大数据企业。

  加大软件知识产权保护力度

  大数据产业牵涉面广,带动了整个信息技术产业的技术创新和商业模式创新,大数据业务本身涉及硬件、软件、产品和服务,但就核心技术而言,主要是大数据的搜索和分析,这当中涉及到软件知识产权保护问题。软件知识产权保护主要分为著作权保护、专利保护和商业秘密保护三类,其中软件的著作权保护是自动生成的,不过,软件的著作权保护尽管最为普遍,但给予软件的知识产权保护力度并不大,因而很多软件企业选择不公布源代码的商业秘密保护方式。从软件开发的角度看,算法如果能给予专利保护,将大大激励软件开发的积极性。大数据的搜索和分析都要用到算法,而美国等西方国家早已加大了对软件的专利保护力度,为算法提供专利保护。全球知名的大数据企业、英国最大的软件企业、全球企业级搜索的领头羊Autonomy公司,以贝叶斯概率论和香农信息论为基础,获得了超过130项专利,就是很好的证明。因此,我国要发展大数据,必须加大软件的知识产权保护力度,为算法也提供专利保护,才能促进大数据企业的创新积极性,实现核心技术的突破。

  以应用为抓手有序推进

  大数据应用很广泛,电信、金融、医疗、电子政务、电子商务、科学研究等是产生大数据的主要领域,发展大数据产业不能一哄而上,而是要科学规划,稳步推进,以行业运用为抓手,有序推进大数据产业在我国的发展。

  市场主导和政府推动相结合

  大数据产业发展应该以市场为主导,市场需求是大数据产业最好的推动力量。但政府也不是毫无作为,政府以及下辖的国立和公立机构就是大数据的潜在大客户。在大数据的应用上,我国阿里巴巴、百度、腾讯等民营企业已经做出了表率,下一步,政府应该从自身信息化和智能化建设出发,拉动大数据在政府部门、国立和公立机构的应用。可以首先考虑在电子政务、国立大学、国立科研机构、公立医院中推行大数据。

  培育数据科学家

  发展大数据产业,我国不缺资金,缺的是学科和人才。大数据不仅涉及到计算机的硬件和软件,而且涉及算法、人工智能、通信和信号处理,因此需要汇聚多个学科的人才。我国在这些学科领域与西方有较大差距,仅就计算机学科为例,目前我国只有清华大学2004年从普林斯顿大学计算机系引进了2000年图灵奖得主姚期智。而从世界顶级计算机会议入选论文看,我国目前只有微软亚洲研究院和清华大学入围。因此,从学科建设和人才培养的角度看,发展大数据产业的一个重要前提是提高我国大数据的教育和科研水平。为此,我国必须着力提升大学计算机等相关学科的建设水平,加大海外优秀人才引进力度。在此基础上,大学要为大数据产业培育和输送数据科学家,数据科学家需要掌握多方面的技能,包括分析、数据挖掘、机器学习、统计学、算法等。

  作者单位:国务院发展研究中心

首页投稿广告关于我们联系我们

版权:《高科技与产业化》编辑部版权所有 京ICP备12041800号

地址:北京市海淀区中关村北四环西路33号 邮编:100080

联系电话:(010)82626611-6618 传真:(010)82627674 联系邮箱:hitech@mail.las.ac.cn