高科技与产业化

首页专题院士观点前沿产学研科技金融区域案例

从认知智能谈人工智能研究型人才培养

作者：黄永峰发表时间：2021年05月19日

　　清华大学电子工程系、清华北京信息科学与技术国家实验室教授黄永峰在“第三届中国高科技产业化高峰会议”上指出，在人工智能研究型人才培养方面，认知智能与数据和知识是密不可分的。针对如何让知识引导的认知智能在实践中发展，他给出了以下回答。

　　感知智能与认知智能

　　人工智能（Artificial Intelligence），英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。经过不断地发展和演进，人工智能已由最初的计算智能发展到感知智能，现在人工智能正从“感知智能”走向“认知智能”。

　　感知智能即机器具备像人类一样的感知能力，通过“眼睛”、“耳朵”、“皮肤”等器官，机器也拥有视觉、听觉、触觉等感知能力，它们能听会说，能看会认，能够帮助人类完成一些简单的工作，可以与人类相媲美。

　　认知智能是机器具备像人类一样的学习和思考能力，能够独自做出决策和采取行动，能理解、会思考、有感情，能够部分或全部替代人类的工作，甚至能完胜人类。

　　感知智能和认知智能与情感计算有着密不可分的关系。情感计算的历史是1997年由MIT的Picard教授提出的，她指出情感计算是与情感相关，来源于情感或能够对情感施加影响的计算。深层次地从机理方面探讨情感的产生和可计算性，涉及到心理、哲学等众多领域。

　　以Picard为代表的计算机学家们认为机器具有情感是可能的，情感计算在方法上也是可行的。他们认为情感并非如心理学家所认为的那样仅仅是人的内心体验状态，而是可以通过人的生理、表情、语言等体现出来，可以通过一定的技术进行测量与处理。

　　在获取诸如图像、语音、文本等多种形式的网络媒体大数据之后，对这些数据进行预处理、特征抽取和选择，运用各种情感识别方法，结合心理学基础对情感建模，从而可以最终推测出用户的情感状态。

　　情感计算的感知智能

　　什么是情感？这首先要对情感的模型进行理解。Plutchik's wheel of emotions是心理学界对情感的分类的主要依据，把人的情感分为八个类别，每类又按程度由强到弱（由内到外）分为3类，共24种类型，用锥形模型描述，相邻类型之间又存在相近的情感属性。由模型看出，人类的情感属性是非常丰富而且很难清晰分类的。

　　美国心理学家普拉奇克（R.Piutchik）提出了表示各种情绪之间关系的理论。从1962年开始,他提出情绪应该包括强度、相似性和两极性等三个维度。用锥形模型描述就是在一个倒置的椎体上，垂直方向表示强度,最强的情绪在椎体的顶部，最弱的情绪在椎体的底部。如憎恨比厌恶强，厌恶比厌烦强。椎体切成八个扇形,分别代表狂喜、悲痛、警惕、惊奇、狂怒、恐惧、接受和憎恨等八种基本情绪。

　　这些基本情绪产生于进化过程，并具有生存价值。各种情绪之间的相似性和对立性由排列的位置来表示。处于对立位置的是两极的情绪，排列的位置越接近,情绪之间就越相似。

　　认知情景下的情感计算

　　情感计算首先要研究情感认知，包括以下两方面，一个是从心理学的角度研究情感认知的内在机理，即探索在网络环境下网络用户通过网络媒体表达情感的心理学机理与构建网络用户（群）的性格特征模型。

　　二是用网络大数据挖掘情感产生的外在诱因，探索网络环境下情感的社会学属性与挖掘情感与诱因的关联关系。

　　基于情感认知的内在机理和外在诱因，研究者提出了二元情感认知计算模型。此模型是基于情感认知的心理机理和数据挖掘共同构建一个情感知识库，在情感知识库的基础上再解决情感计算不确定性的问题。在二元知识库的支撑下，情感分析引擎可以抽取3、4、5元等n-graph知识。

　　一般的应用程序与基于知识的系统之间的区别在于，一般的应用程序是把问题求解的知识隐含地编码在程序中，而基于知识的系统则将应用领域的问题求解知识显式地表达，并单独地组成一个相对独立的程序实体。

　　情感认知的内机理探索与外在关联分析

　　认知机理是根据心理学的情感理论，采用网络环境下的用户情感和用户行为等定量表征方法，探索网络虚拟人物的情感产生规律。

　　（1）创建网络环境下的情感决策模型；该模型主要引入性格—心情—情感三层模型来建立这种量化关系。

　　（2）刻画网络虚拟人物的情感空间、心情空间和性格空间的映射关系;

　　（3）建立情感向量和心情向量在时间维度上的更新方程。

　　在社交网络语境下的情感计算主要利用网络媒体大数据产生的文本和图片素材，根据关联规则挖掘出刺激因素、情感类型和强度，再根据概念层次库和应用统计学习方法寻找“激发事件”和“情感”之间的二元概率关系。

　　数据、知识与认知智能

　　随着大数据的发展，计算能力的快速增长，大数据为智能技术的发展带来了数据上的空前繁荣。我们的智能从“行万里路”的智能不断发展为现在“读万卷数据”的智能，由数据驱动的感知智能逐步转向为知识驱动的认知智能。

　　但随着数据红利的消耗殆尽，以深度学习为代表的感知智能不能满足当下的需求？认知智能将是未来一段时间人工智能的发展焦点。而认知智能的发展离不开知识图谱这一关键技术。

　　知识图谱，作为一种语义网络，是大数据时代知识表示的重要方式之一；作为一种技术体系，是大数据时代知识工程的代表性进展。这种知识图谱可广泛用于不同任务，从海量数据中进行知识学习和挖掘，可理解、可解释，类似人类的思考方式。知识图谱是实现认知智能的关键技术，也是实现机器认知智能的重要器物。

　　认知智能是由知识引导的，知识将增强智能机器的学习能力，因此，知识图谱的主要技术如何获取知识，更新和增长知识并进行知识的推理等。

　　AI皇冠上的明珠

　　长久以来，AI皇冠上的明珠——自然语言处理（NLP-Natural Language Processing）和概念思维处理（CTP-Concept Thought Processing）方面一直缺乏实质性的进展，在让机器“理解人类自然语言的含义”和“理解人类大脑的想法”这两个关键问题上尚未找到突破的正确方向，这已经成为AI发展的关键瓶颈和下一步重要的技术核心焦点。

　　近年来涌现出许多令人惊奇的新技术，如语音识别的准确率迅速提升，在理想环境下机器识别语句的准确率已经达到90%以上；图像识别技术可以快速在图片中识别出猫、鲜花等事物，甚至可以较准确地辨识出不同的人脸；索菲娅机器人逼真的面部表情和回答提问时的精妙之语；波士顿机器人可以完成酷跑，甚至可以做出绝大多数人（和狗）都难以做到的空翻等高难度……这些技能各具特色并在特定方面已超越了人类的能力。但惊叹之余，似乎总觉得少了些什么。缺失的东西让我们在看待和使用这些技术时感觉和真正的智能交互相比还有巨大的差距。

　　首先，多数技术只是完成识别等基础任务，而缺少人类思维具有的丰富、灵活、曲折的特点，完全感觉不到能像人一样连续流畅的逻辑能力；其次，这些技能都是分散的点，不能融合在一起形成智能综合体，甚至都还没有看到一个具体的融合趋势及技术方向。

　　回过头看，NLP技术迟滞不前的状态更是无法与之匹配同步。NLP与机器学习领域的其他技术相比，发展却是最慢、最落后的。

　　而以信息量的角度来比较，则体现出一个悖论：现在的图像技术对一幅像素上百万的图像可以迅速地进行处理识别，而对于一段只有几十个字符信息量的文字，反而无法达到完整、正确的理解，更遑论进行更深入的语义理解和逻辑处理。

　　再从技术层面上的输入-处理-输出的信息量作一个简单对比分析，自然语言处理和图像识别的特点正好相反。以冰山来比喻，一座冰山浮在水面上的部分只占很小一部分，在水下的才是主体。图像识别算法的输入信息量大，相当于冰山的水下部分，识别处理是对信息进行逐级简化的过程，最终输出简化和分类后的结果，相当于冰山的水上部分，输出的信息量远小于输入的信息量。而自然语言处理正相反，输出的信息量远大于输入的信息量。

　　解决自然语言的问题，本质上其实是要解决相关领域的知识构建和处理，这是一个哲学问题。

　　实际上，语言就是“将一些符号顺序排列”。这看似简单的表象后边隐藏着人脑思维最核心的秘密——概念思维的原理和方法，这就是人脑对这个多维、复杂的世界进行描述、理解、记忆、思考、交流、学习的基本方法，处理起来自然非常复杂。

　　在下一个十年，人工智能的突破一定是在自然语言处理的真正解决。这个瓶颈一旦突破，会刷新人们对人工智能的认识，极大地带动认知智能技术的全面提升，继而有效推动整个人工智能到达一个前所未有的全新境界——强人工智能时代。

　　要想做到对语言理解和处理的真正突破，必须突破语言的形式表象对我们认知的束缚和干扰，彻底从现有的以串对串的转换为基础模型，用概率统计方法来解决语言理解和处理问题的舒适区跳出来，将注意力集中于符号串的表象后蕴涵的本质——语言深度语义，构建起描述世界的深层次概念思维模型和知识库以及演算方法，实现将自然语言和概念思维融为一体的深度语义模型技术体系。这样才能从本质上解决自然语言处理的技术瓶颈问题，与此同时，人工智能领域其它一些关键问题——类似人脑的知识表达、记忆、计算、推理、思考、学习、创造等能力也将得到实现，奠定人工智能领域里最重要和最关键的技术基础。

　　人工智能研究型人才培养

　　语言和概念思维的问题的解决，需要在基础理论和实现方法上寻求关键性突破，使计算机真正掌握语言和概念思维的基本方法，就可以进行持续进化，不断逼近并最终达到类人的智能水平。

　　然而语言和概念思维的具体解决方法和计算机围棋、图像识别、语音识别有很大不同，甚至可以说是全新的技术体系。深度学习的方法对于语言和概念思维处理而言，无法解决根本问题。而这就需要我们在人工智能的人才培养上，讲究厚基础、敢交叉、重知识、善跨界、勤动手、早培养。知识虽可贵，系统价更高；欲成智能人，二者不可抛。

热点文章

首页投稿广告关于我们联系我们

地址：北京市海淀区中关村北四环西路33号邮编：100080

联系电话：（010）82626611-6618 传真：（010）82627674 联系邮箱：hitech@mail.las.ac.cn