天天看点

自然人、机器人与数字人的情感交互

作者:AI自智体

原创 高科技与产业化 高科技与产业化 与产业化”可以订阅哦

自然人、机器人与数字人的情感交互

任福继

大模型涌现是元宇宙发展的催化剂

数字化的内涵已经从传统的信息化逐渐演变到智能化、智慧化、数字文明。元宇宙是数字文明的起爆剂,是虚实相生的网络世界,将其定义成已来的未来,意指其太超前、是“早产儿”。但元宇宙的产生符合时代的趋势,我们可以从虚拟世界、数字世界、意识世界、可编程世界、可检视世界看出一些规律。

元宇宙和先进智能可能成为塑造数字世界的核心。福布斯预测的2023年数字世界八大新兴科技趋势,均与元宇宙、机器人、先进智能密切相关,包括人工智能无处不在、机器人更加人性化以及基因编辑日趋普遍、区块链技术如日中天等。

此次大模型在理论上并没有多少创新,但它确实引起轰动,甚至引爆一场轰轰烈烈的人工智能大变革。这在于一个原本没有关注的现象“涌现”,大模型的涌现能力催化了元宇宙。我们本来对元宇宙还比较悲观,认为它的短板太多,但大模型出现后在某种意义上可能将加快元宇宙的落地化。

为什么大模型的涌现能力可以催化元宇宙?所谓“涌现”简单而言就是小规模、个体看不见的东西,当沉积成大规模时就会超过人类的智慧。最近的大模型包括ChatGPT、TPT4以及更新的GPT家族,虽然在理论上看似没有创新,但正因为涌现的能力,使得它能够“翻天倒海”带来深层次的变化。某种意义上这是不以人类意志为转移的进化。但大模型所带来的智能包括下一步要推动的情感,和人类是完全不同的方式,其情感机制、智能机理是另一个渠道。

如果ChatGPT4具备交互功能,以下这六点比较值得关注:第一,强大的自然语言处理能力;第二,高效的文本生成能力;第三,丰富的知识库及提供世界知识能力;第四,更强的创造性和适应性;第五,跨语言多模态交互能力;第六,强大的自我学习和自我进化的能力。

超世界模型将是元宇宙的最终归宿

为什么说超世界模型是元宇宙的最终归宿?在超世界模型里,不仅能身临其境、如见其人,而且可以身临其境、确如其人,机器人会来帮助他。人类生活在三个变量描述的时间、空间、人间中,人间被分成人物和实物。在超世界中就不再只是简单地体验二元世界,而是从正的时间到负的时间、从真实空间到虚拟时间、真实事物到虚拟事物、从自然人到虚拟人。在二十四维世界来回穿梭,我们称之为“超世界”。

增强现实在超世界模型中时间是正的、空间是实的,人间里的人物也是真正的人物,只是实物是虚拟的。过往的虚拟现实是什么概念?时间是负的。原本科幻小说中的内容现在可以实现一部分,比如和逝去的亲人再会、与历史的人物对话,同时实物也变成虚的实物。我们预测未来的虚拟现实,是时间上变成正的、空间上变成虚的。

具体而言,元宇宙主要是描状塑形,物理世界可以数字化、数字世界可以现实化,这是创造虚实相融。最近讨论的大模型实际上是注智赋能,推动虚拟系统感知和理解物理世界,促进虚实交互。超世界是交融共生,在虚实四维空间深度穿梭和无限延展,打造虚实交融,这就是我们提出来的超世界模型。

我们已经对元宇宙有一个大概的概括,现在的元宇宙是已来的未来,它走向虚实相生的网络世界。超世界是虚实交融的真实世界,其中最主要的关键因素就是先进智能。

先进智能是1956年由达特茅斯会议提出的人工智能、上亿年生物进化的自然智能,再加上不到30年的情感计算融合的研究范式。它可以负责打通现实世界与元宇宙的连接,赋予元宇宙感知、理解、推理的能力。情感智能负责打通现实世界与元宇宙最后一公里,提供自然、和谐的沉浸式体验和交付。

元宇宙的技术体系原本被称为“大蚂蚁”BIGANT。这个体系被认为支撑不了元宇宙的“行稳致远”,必然会出现泡沫。其原因就在于它将人工智能和其他几大支撑技术等同。人工智能是元宇宙的大脑,在新的元宇宙技术体系中,将人工智能放到了大蚂蚁的头脑上,同时在原来的六个板块中加入人工情感、情感计算。为什么要加上情感计算和人工情感?因为只要有交互、只要为人类服务,离开情感便寸步难行。

“三人”共舞的时代

什么叫自然人?在座各位都是自然人,是现实空间中真正的人类。机器人主要是指高仿真机器人即模仿人而制造的机器人,不仅外观上仿真,而且在计算机赋能技术之下要具备感知、决策、执行等基本的人类行为特征。数字人的定义是元宇宙的原住民,只通过计算机图形渲染、动作捕捉、深度学习、语音合成等技术打造的具有数字化外形、存在于非物理世界中的虚拟物,在一定程度上能复制人类的知识、情感、记忆、思维。

自然人、机器人、数字人“三人”同台,从人类的发展历程过程来看有很古老的传说。比如指南车、水牛流马、达・芬奇手术机器人以及情感机器人“想想”、“索菲亚”等。从自然人劳动到机器人带着数字人伙伴,奠定了未来“三人”同台的基础。

为什么数字人、机器人、自然人要进行“三人”共舞?清华大学发布的《元宇宙发展研报告3.0版》认为,2021年虚拟数字人核心产业规模约为336亿元,到2025年为998亿元。这些数据与我们最近了解到的数据有一些差异,但确实正按照这一趋势在增加。

更有观点认为,未来的自然人、机器人、数字人一起分工协作时,自然人的劳动比例只占5%——我们认为到2049年后这一比例会更低,机器人占15%、数字人占80%。此外,以后的机器人、汽车等硬件成本不能超过总成本的10%。

“三人”共舞将出现在哪些应用场景?比如在康养领域,基于机器人以及数字人大脑的情感交互能力,能对老年人产生陪伴和关怀,在情绪管理、心理治疗上都会起到积极作用。我们的调查显示,85% 的老年人认为最大的问题就是孤独,“三人”同台就可以减轻这种问题。此外还包括大教育、大文旅和大健康等, “三人”共舞拥有广阔的应用场景,自然人、机器人、数字人共舞会贯穿千行百业,甚至进入千家万户。

情感交互是“三人”共舞技术的“天王山”

情感是人类特有的,情感计算是世界性的难题。原本认为情感研究都属于文科以及认知科学,其实情感计算有强大的刚需,包括养老、陪伴、幼儿陪护、健康医疗、科教文化、国防军事、智慧小区等。

面对这样的世界性难题,我们该怎么做?这就回归到人工智能,大数据驱动本质上是迂回了人工智能的本质问题。因此对于未来30年以及60年,是基于脑智、心智、意识的理解这一范式。最近出现的大模型是不是有和人类不一样的智能机制、情感机理?这都是值得研究的。如果我们不进行情感这方面的研究,就有可能产生无情感共鸣、低沉浸体验,包括弱人机系统。

近年来,我们研究情感计算主要提出情感交互理论,包括融合感知、系统推理与情感交互,这使得情感从单模态、静态、被动、虚拟、无进化,过渡到多模态、动态、主动、真实、可进化的趋势。我们根据类脑多模态感知和情感计算平台打造“三人”共舞,包括真人、通过媒体交互、数字人,当然还有具体的机器人。为什么一直重视机器实体?因为我们始终认为,不管开放的是大模型、元宇宙还是超世界,最终的出发点是规定其为人类服务,所以要研究实体机器人。

具体而言,跨越“三人”交互的情感鸿沟,要推进情感感知、虚实交融、情感交互的技术创新,营造自然的“三人”情感交互环境——自然交互就是情感交互。

未来在全球乃至更大的范围里,要有自然人也需要机器人。“三人”同台的时候,谁给机器人发工资?数字人出现以后,谁给它定位?它的身份是什么、“机权”如何?人有人权,那么机器人也有“机权”。“机权”出现后,“三人”共舞的情况么办?这其中包括一系列的问题,不过都没发展到需要考虑的时候,要真正实现“三人”共舞还有很多课题要做,而目前最主要的课题就是情感交互。我们始终认为数字人如果产生智能,会和人类不一样,而且在交互过程当中,要互相理解、互相协助,这是所期待的未来“三人”同台。

(根据“2022 中国人工智能产业年会”主论坛报告整理,内容有删减)

自然人、机器人与数字人的情感交互