随着新一轮科技革命和产业变革迅猛发展,数字技术、智能经济与数字化产业已成为催生新产业、新业态、新模式的重点领域。为贯彻落实党中央、国务院决策部署,推动人工智能赋能智能制造创新发展,促进人工智能与实体经济、工业制造深度融合,近日,“2022中国人工智能产业年会”在金鸡湖畔召开,旨在共享人工智能新技术和新理念,共探人工智能产业发展的新趋势,全面提升我国智能科学技术赋能行业创新应用。
会上,香港科技大学首席副校长、欧洲科学院院士、吴文俊人工智能科学技术奖杰出贡献奖获得者郭毅可做了题为《拥抱人机共生同创的新时代》的主题发言,以下为报告节选。
郭毅可
70年前的ChatGPT蓝图
郭毅可首先介绍了两篇发表于20世纪50年代的重要文献。图灵在《计算机械与智能》一文中描述了ChatGPT的蓝图,他认为这是一个“儿童程序”,可以通过对其教育达到成人的智力水平。“今天的ChatGPT正是这样一个‘儿童程序’,亿万网民每时每刻都在通过图灵测试教育它,让它日渐成熟,人工智能科学家们也在不断地更新教育‘儿童程序’的方法,不断地进化‘儿童程序’的学习能力。”郭毅可解释道。
控制论鼻祖维纳在1950年发表的《人有人的用处》中,对于发展这样的智能机器也进行了极富洞察力的阐述。和图灵一样,他指出智能机器的首要问题是学习,而且他认为人与人交互时,人与机器并没有什么区别。维纳乐观地认为“真正惊人的、活跃的生命和学习现象仅在有机体达到一定复杂性的临界度时开始实现,虽然复杂性也许可以由不太困难的纯粹机械手段来获得,但是,复杂性使这些手段本身受到极大的限制”。郭毅可认为维纳的预言非常准确,“今天的大模型具有空前的复杂度,体现在它巨大的参数量上,目前ChatGPT实现的功能正是这样的复杂性在临界态涌现出的智能行为。实现这样复杂性的挑战也是现在研究的重大课题,需要大数据、大算力的支撑。”
语言大模型:人工智能的基础引擎
图灵在《计算机械与智能》中明确主张:只要机器在语言行为(对话)时与人类没有明显差别,就可以算是能思维或有智能,这就是所谓的“图灵测试”。正因为语言是人类智能最根本的体现,所以图灵测试也是通过问答来实现的。ChatGPT的基本功能是一个问答系统,它的基础引擎是一个语言大模型。“人们之所以对ChatGPT产生关注、惊叹甚至担忧,就是由于它第一次在全人类面前接受着实时的图灵测试且表现不俗,这让人们对人类自身价值的认知产生了根本性冲击。”郭毅可说,“对于人工智能来说,实现感知、抽象、预测、决策、创造这五种功能至关重要,实际上目前的人工智能技术在这五个方面都有了长足的进步。”
“感知,就是通过视觉获得信号并进行深度学习,形成所见所闻 ;抽象,就是根据所见所闻抽取特征并在特征之间找出关联、形成概念,再映像到主观世界中去;预测,就是通过多观察对先验知识进行修正,这中间还要进行统计学习计算事物的分布以及分布之间的关系。有了分布,就掌握了世界在数据空间里的形态,从而可以进行判断和决策;决策,就是通过以上步骤学习一个策略,做出改变现有环境的行为;创造,就是把这个主观世界告诉客观世界。”郭毅可进一步解释道,“这是人类的五个智能行为,在脑区里面分别有五个地方对应这五种智能行为,脑区里面的World Model实际上就是我们讲的Language Model,这五种技术都已经有了突破性的进展。学得最好、做得最漂亮的就是ALPHA GO,ALPHA GO在训练机器过程中通过不断奖励对赢局产生正面影响的每一步棋、惩罚对赢局产生负面影响的每一步棋,形成了深度神经网络,只要数据足够多,最后机器获胜的可能性就非常大。”
ChatGPT做的就是语言模型。语言模型就是每一句话在人类语言中出现的概率,通过大数据可以把人的语言模型算出来。什么是机器的语言模型?就是算出一个机器产生这个词的概率,使它跟人的语言概率最接近。“ChatGPT通过三步形成语言模型。第一步,拿出一个预模型后请它回答 ;第二步,对回答进行微调,通过学一个奖励模型判断答案的优劣;第三步,用奖励模型训练出策略,使得每次答案都能得到高分。有人认为ChatGPT相当于把互联网上的所有信息做了一次漂亮的语义压缩,我认为这形容得非常准确。”郭毅可总结道。
ChatGPT眼里的人类优势
郭毅可在现场分享了一段他与ChatGPT4交流的经历。他向ChatGPT4提出的问题是:在人工智能时代,你认为人类还有哪些用处?“ChatGPT4的回复总是典型的三段式,前面告诉如何如何,后面会做个总结。但我认为它讲得很有道理”,郭毅可展示和复述了ChatGPT4的回答,“在人工智能时代,虽然AI技术在很多领域已经取得了令人瞩目的成就,但人类在以下几个方面仍然有着无可替代的作用,一是创造力:人类具有极高的创造力,能够创作出具有独特风格和意义的艺术品、音乐、文学等。尽管AI可以辅助创作,但真正的灵感和原创性仍然来自人类;二是情感智能:人类不仅具有理性思维,还具有丰富的情感体验和复杂的心理活动。人与人之间的情感交流、理解和共鸣是AI很难完全模拟和替代的;三是道德和伦理:人类社会有着深厚的道德和伦理观念,这些观念在很大程度上塑造了我们的价值观和行为准则,AI在道德和伦理方面的决策仍然需要人类进行引导和监督;四是复杂决策:在需要权衡多个方面,涉及不确定性和风险的复杂决策场景中,人类的直觉和经验往往能发挥关键作用。虽然AI可以进行数据分析和模式识别,但在很多情况下,人类的直觉和判断仍然不可或缺;五是教育和培训:人类在教育和培训领域具有丰富的经验和独特的方法。虽然AI可以辅助教学,但真正的教育仍然需要人类教师的指导和关怀,特别是在培养学生的情感、价值观和人际交往能力方面;六是科学研究:虽然AI可以帮助人类处理大量数据和实验,但在科学研究的过程中,人类的创新思维、独特见解和科学直觉仍然非常重要。总之,在人工智能时代,人类在很多方面仍然具有独特优势和不可替代的作用。我们应该正确看待AI技术的发展,将其视为人类的有益补充和助手,而不是替代人类的工具。在这个过程中,我们需要不断提升自身的能力和素质,与AI共同推动社会的进步和发展。”
对于与ChatGPT的上述交流,郭毅可认为它“已经有了相当不错的功能”,“它其实是有一个基本的价值函数的,就是避免和我争论,我说什么它同意什么。所以,当机器不具备人性时,它无法进行有意识的交流。对此,维纳先生在书中也讲得非常清楚:第一,如果机器不会学习,那么这样的机器什么用也没有;第二,如果机器不学习人的价值观,那么它不可能像人类一样做出决策,这种只能叫做没有价值函数的模型机。”郭毅可认为,让机器学习人性、学习人的价值函数是一个非常重要的挑战。
人工智能赋能艺术创作
郭毅可认为语言模型难度太大,如果要将人类情感嵌入到人工智能的生成空间去,艺术可能是一个相对较容易的突破口。“首先要有艺术数据,但这个艺术数据必须是艺术加上人类情感、人类经验。”2022年,郭毅可带领科研团队与香港浸会大学交响乐团为“香港人机共生艺术创造平台技术建设”项目联袂献上了第一份成绩单《东方之珠》。在一段时长约4分钟的3D音画里,人工智能共生成了近3000张图像,且画面之间逻辑顺畅,随着《东方之珠》的歌词和旋律的变化,人工智能动态生成的各种场景与之高度匹配。
“要做到这点,首先要让机器学会理解歌词的文字内涵,人先教会机器了解歌词中相对应的关系,比如香江代表香港,‘珠’的意象要成为贯穿音画的主线等,在此基础上让机器自主想象、自行创作。机器完成创作后,是否具备美感意义则通过人来反馈并修正,这就是人机交互的创作。”郭毅可说,“我们开发了一个人工智能驱动的媒体艺术家模型,‘东方之珠’音画是我们向超级人工智能艺术家目标迈出的重要一步。”
在以往的人工智能艺术创作中,一个传统的思路是机器模仿人,而郭毅可对此并不认同。他认为人工智能在艺术创作领域有自己独特的创造能力,随着人机交互技术的进步,它的创作可以与人类的创作不一样,也可以被人类理解和欣赏,并可能随着人类对美学的追求而不断改进。
“科学上的突破往往最先来自观念,我认为我们中国人有这个能力,不在人家的话语体系里转圈圈。我们这次的创新在于理念变了,由此找到了新的突破点。”郭毅可说,“《东方之珠》音画第一版,整个图像投影在一颗珠子上,然后珠子一层层打开,当歌词进行到‘流到香江去看一看’时,突然幻变成了一朵紫荆花——当时我们都惊呆了!‘香江’的概念居然以一朵紫荆花的形态展现,这就是人工智能奇妙的学习力和创造力。”
郭毅可最后总结道,未来机器学习和人工智能的进程“不求让机器做得多,但求要机器做得对”,“人类不是在制造一个仆人,而是培养一个伙伴。仆人不需要交流,人让它做什么它就做什么。而未来人和机器要互相理解,保证人机之间互相学习的过程。人类和机器的相互理解是人机共生世界的基础,人要理解机器的行为,机器要理解人的意图,才能呈现出互相交融的人工智能前景”。
个人名片
郭毅可,1962年出生于上海,计算机科学家,英国皇家工程院院士、欧洲科学院院士、香港工程科学院院士,曾任英国帝国理工学院数据科学研究所所长、英国计算机科学皇家特聘教授、香港浸会大学副校长(研究及拓展),现任香港科技大学首席副校长、计算机科学及工程学系讲座教授。
![]() |
版权:《高科技与产业化》编辑部版权所有 京ICP备12041800号 地址:北京市海淀区中关村北四环西路33号 邮编:100080 联系电话:(010)82626611-6618 传真:(010)82627674 联系邮箱:hitech@mail.las.ac.cn |