站内检索

技术挖掘:技术突破与创新效率提升之路
作者:谭一泓 发表时间:2019年05月21日

 

  在当前“大众创业,万众创新”、“供给侧改革”、“产业转型升级”、“区域协同创新”、“政府和园区招商引资”、“培育和发展战略新兴产业”的社会经济大环境中,产业创新与转型升级是政府、科技企业、与科技园区等共同关注的热点问题。技术突破与创新效率提升则是其中的核心与关键。

 

 

  应该怎么寻找、定位未来的技术突破方向,提升创新效率?2018年12月6日在浙江乌镇举办的2018“国际技术挖掘会议”专家认为,随着人工智能的发展,技术挖掘有望帮助更好地识别、预见关键突破技术,发现未来技术发展路径。

  “国际技术挖掘会议”是由美国佐治亚理工学院公共政策学院科技创新政策研究部门和美国Search Technology公司合作举办的科技大数据及知识服务领域知名国际会议。自2011年首次举办以来,已经在欧美国家举办了八届。此次在中国,会议围绕当下倍受关注的“双创”“产业升级”和“技术转移转化”问题,探索如何利用技术挖掘为中国产业科技创新服务提供高附加值的服务,提升科技创新与转化效率。

  大数据中挖掘技术方向

  技术挖掘是指从大数据中识别具有商业化潜在价值的前沿研究成果,从而实现追踪新兴技术、发现具有颠覆性技术变革的端倪的目的。“通过技术挖掘方法可把一些有用的信息,从科技创新信息中有效挖掘出来,”美国佐治亚理工大学教授Alan Porter通过视频报告的形式,在2018“国际技术挖掘会议”上介绍道。

  “科技创新对于可持续性发展变得越来越重要,无论是政府还是行业的决策者,需要一种科学的方法、工具和理论,更准确、更高效地理解科技发展的规律和趋势。技术挖掘是一种基于证据的方法,能够帮助理解和驾驭技术发展的潮流。”中国科学院曼谷创新合作中心主任助理陈兵在会上评价道。

  技术挖掘方法使用之前,若对技术发展做判断,需要请专家给意见做判断,属于定性评价。“针对新想法做交流,必须坐飞机到另一个地方,花3—4天的时间讨论,才能了解世界另外一端发生的事情,同时要阅读很多文献,这样的效率太低了。”美国Search Technogy公司总裁Nils Newman表示。

  Nils认为,“我们需要找到一个替代性的方法。当然它不是唯一的方法,面对科学技术知识爆发的时代,最好的方法就是技术挖掘。”

  技术挖掘不仅可以帮助预测技术发展的未来趋势,也可以通过对相关技术进行评估与分析,预测技术变革可能带来的影响。此外,技术挖掘也能促进技术转移转化。

  科技创新过程是科技成果,尤其是技术应用落地的过程,在某种意义上是科技成果转移转化的过程。在此过程中,无论是新兴技术,还是颠覆性的技术变革,“我们都希望能够尽早识别,”Alan说,“因此我们需要了解有哪些前沿的科技研究成果,尤其是我们感兴趣领域的成果,并定位关键问题与关键专家,寻求商业化发展。”

  技术挖掘方法如何实施操作?“要挖掘数据库,首先要找到相关的数据和规律,可利用某些专利数据库,或者一些有关科学发展的数据库。”Alan说,“不仅仅是找到几千篇文章、阅读这些文章,更要找到相关的规律,找到有潜在价值的技术,挑选出后再进行深入研究。”

  “不能让有用信息淹没在如山如海的数据中,要识别出感兴趣的话题或主题,分解成具体问题,再寻找答案;还要开发出一系列指标,再去找相关数据库和数据来源进行挖掘;利用适当分析工具,比如某些数据分析器,来回答之前提出的一系列问题,去看清技术的发展趋势。”Alan表示。

  芬兰国家技术研究中心高级研究员Arho Suominen以芬兰经验举例说,技术预测一般是由政府来推动,每年有一百多个技术发布会。“我们从海量数据当中抽取、分析和理解芬兰的知识基础和工业基础,从数据中得出判断,新兴技术有哪些,哪些技术对芬兰是至关重要的,如何开发和利用这些技术。”

  Arho坦言,这个系统中,有些地方也需要改进,希望产业界更多参与到这样的数据获取过程,让更多企业数据进入到数据智库当中。“要清楚企业当中哪些动态信息是我们所不知道的,利用现有的知识、信息推动技术进步。越是成熟的公司,越不能止步不前,要持续创新和更新自己。”

  数据集群效应推动创新

  “类似的技术挖掘模式越来越成熟,将帮助科技工作者更好地识别、预见一些突破技术”。中国科学院文献情报中心情报研究部副主任韩涛评价道。

  韩涛进而介绍在专利产业分类方面所做的尝试,专利分类是专利审查和专利分析工作的重要组成部分。“中科院文献情报中心从集成中国专利数据开始,多年来通过打造专利分析系统,开发了专利与产业类目映射等模型,帮助科研人员和科技管理人员了解中国专利技术的发展情况。”

  专利与产业类目映射模型综合考虑专利官方注释规范精炼性和大量专利数据覆盖面广的优点,通过自然语言处理技术自动化得到专利与产业类目的映射组合,较其他方法在节省大量人力成本的同时保证了正确率,并可方便地进行映射类目细粒度的调整。

  专利产业分类的意义不仅在于服务专利成果转移转化时,能够便于客户公司或企业从大量专利中快速定位跟自己业务相关的专利技术;也在于进行特定领域专利分析时,有助于进行地区之间、产业之间、机构之间专利技术储备更加具体的比对和分析。

  “在现有的专利情报服务工作中,通常采用的是人工分类的方法,花费巨大人力时间成本,遇到突发需求或者专利量大时极大影响效率和质量。亟需一种自动化、智能化的专利(技术)产业分类方法。”韩涛直言不讳地指出。

  类似技术挖掘方法在未来如何推动创新?韩涛认为,在数据方面,中国科学院正在推动科技论文的开放获取。如此一来,科技论文就可以被科学共同体甚至更广泛的群体深度挖掘、综合利用,“把数据集群效应发挥出来,群体的智慧才能被更有效地释放和放大”。

  在技术挖掘的领域,数据的开放和共享还需要有一些前瞻性的考虑。韩涛建议可以组建联盟,让专家按照平台型、技术型、资本型等形成不同的有效联盟,尝试在技术共享方面迈进一步。

  另一方面,技术挖掘的算法模型也需要突破,技术挖掘的算力需要进一步提高。“特别是在智能时代来临之际,智能的技术挖掘算法、技术挖掘的人机协同,希望能够有一些实质性的进展。”韩涛说。

 

  人机协同大有潜力

  技术挖掘方法给企业查询相关专利提供了途径,但更大范围来看,中国尚缺少数据收集和数据共享的机制。“这需要政府来推动,让企业知道相关领域有哪些最新的技术,让它们之间可以进行资源的对接。”Nils说。

  机制之外,在现在移动互联大数据环境下,知识往往有局限性、迟滞性。“知识变化太快,科研人员和产业专家群体对知识的把握很可能跟不上知识变化的节奏。而且,产业分类也往往是滞后于真实产业现状的。”韩涛认为,数据具有异构、瞬变、易缺失的特点,这是科技信息服务与情报研究最让人头疼的问题之一。

  此外,相对而言一些分析模型赶不上数据知识的变化,模型一旦不准确,会导致人们对真实现象把握发生偏离,这是数据知识分析的不足之处。传统的机器学习分类器也面临着数据稀疏的问题。

  与之相对,深度学习方法能够自动学习特征,性能相较于传统方法有一定优势。事实上,深度学习在文本分类中正不断取得更好效果。

  基于此,韩涛认为,有效的解决方案是把人的智慧和机器的智能进行有效结合。针对专利文本的语义关系特征、文本词序关系等特征,训练专利所属产业自动分类模型,将深度学习技术引入专利产业分类。同时,采用有监督的数据分类思路,设计合适的指标作为特征,充分利用和采集已知的颠覆性技术做训练和验证,以预测未知技术的潜在颠覆性。

  科技部发布的新一代人工智能重大项目申报指南,对人机混合发展进行了界定,其中核心要点是发展“人在回路机器学习的方法和混合增强智能评价方法”,就是要把复杂问题分析、响应高级认知机制和机器智能系统进行耦合。

  “我们有大量数据分析和大量专家咨询,所以人工智能中人在回路和混合增强,以及人机协同智能的发展,或许是未来弥补技术挖掘不足的发展路径。我们希望不仅把专家群体的智慧发挥出来,同时还要随着机器智能的提高,把机器群体智能和专家群体智慧进行融合,实现向人机协同智能模式的变迁。”韩涛说。

首页投稿广告关于我们联系我们

版权:《高科技与产业化》编辑部版权所有 京ICP备12041800号

地址:北京市海淀区中关村北四环西路33号 邮编:100080

联系电话:(010)82626611-6618 传真:(010)82627674 联系邮箱:hitech@mail.las.ac.cn