纽大发现婴儿天生拥有语言能力，甚至可能比ChatGPT更擅长学习

人类婴儿甚至比最好的大型语言模型更善于学习。为了能够写出合格的英语，ChatGPT 必须在包含数百万甚至上万亿个单词的海量数据集上接受训练。

而孩子们只能接触到这些数据中的一小部分，但到三岁时他们就能以相当复杂的方式进行交流。

纽约大学的一组研究人员想知道人工智能是否能像婴儿一样学习。如果给人工智能模型一个小得多的数据集，利用一个学习说话的孩子所经历的景象和声音，人工智能模型能做什么？

事实证明，可以做的事很多。人工智能模型成功地将单词与它们所代表的物体相匹配。

纽约大学的计算认知科学家、该研究的作者布伦登·莱克（Brenden Lake）说：“即使在孩童阶段的这一短暂经历中，也有足够的数据表明它可以进行真正的单词学习。”

相关论文发表在 Science 上，不仅为婴儿如何学习提供了见解，还可能带来更好的人工智能模型。

（来源：WAI KEEN VONG）

在这项实验中，研究人员使用了一段时长为 61 小时的视频，这段视频来自于一名居住在澳大利亚阿德莱德附近的儿童所佩戴的头盔摄像头所拍摄。

这个孩子叫山姆（Sam），从六个月大到两岁生日过后的一年半时间里，他一直断断续续地戴着这个摄像头。

相机捕捉到了山姆在醒着的大约 1% 的时间里所看到和注意的东西。它记录了山姆的两只猫、他的父母、他的婴儿床和玩具、他的房子、他的饭菜等等。

莱克说：“这个数据集完全是独一无二的。”“这是我们了解单个儿童所能获得的信息的最佳窗口。”

为了训练这个模型，莱克和他的同事们使用了 60 万个视频帧，并与山姆的父母或房间里其他人在拍摄图像时所说的短语配对，总共有 37500 个“语句”。

有时，单词和物体是匹配的，有时则不匹配。例如，在一张剧照中，山姆看着一个形状分类器，一位家长说：“你喜欢绳子。”

在另一张照片中，大人的手覆盖在一些积木上，家长说：“你也想要这些积木。”

研究小组给了模型两条线索。当物体和单词出现在一起时，说明它们可能有联系。但当一个物体和一个单词没有同时出现时，就表明它们可能不匹配。

纽约大学计算认知科学家、该研究的作者韦肯·冯（Wai Keen Vong）说：“因此，我们在模型中出现了这种时而匹配、时而不匹配的情况。”

他说：“希望数据中有足够多的例子表明，当父母说‘球’这个词时，孩子看到的是球。”

将单词与它们所代表的对象进行匹配似乎是一项简单的任务，但事实并非如此。为了让你了解问题的难度，请想象一下一个有年幼孩子的家庭的客厅。

客厅里有所有普通的家具，但也有孩子们的杂物。地板上堆满了玩具。蜡笔散落在茶几上。窗台上放着零食杯，椅子上放着洗好的衣服。

如果一个蹒跚学步的孩子听到“球”这个词，它可能指的是球。但它也可以指任何其他玩具，或沙发、或一条裤子、或物体的形状、或颜色、或一天中的时间。莱克说：“任何单词都有无数种可能的含义。”

这个问题非常棘手，以至于一些发展心理学家认为，儿童必须天生了解语言是如何运作的，才能如此快速地学习语言。

美国斯基德莫尔大学的发展心理学家杰西·沙利文（Jess Sullivan）是收集山姆头盔摄像头数据的团队的一员，但没有参与这项新研究。

不过她说这项研究表明，即使没有这种天生的能力，也可以从很小的一组经验中学会语言的某些部分。她表示：“对我来说，这确实颠覆了我的世界观。”

但沙利文指出，能够将单词与它们所代表的物体相匹配，虽然是一个困难的学习问题，但这只是构成语言的一部分。还有一些规则制约着词语的组合。

你的狗可能知道单词“ball”或“walk”，但这并不意味着它能听懂英语。因此，婴儿与生俱来的语言能力可能并不局限于词汇量。

这可能会影响他们在世界上的活动方式，包括他们所关注的事物，或者他们对语言的反应。她说：“如果婴儿没有创建神经网络学习的数据集，我认为这项研究就不会成功。”

莱克和他的同事们下一步要做的是，努力找出使模型学习更接近儿童早期语言学习的方法。他说：“要让模型完全具备两岁儿童的能力，还有更多的工作要做。”

这可能意味着要提供更多的数据。莱克的孩子现在已经 18 个月大，她每周戴几个小时的头盔相机，同时她也是下一批提供这些数据的孩子中的一员。

或者，这个模型需要注意父母的目光，或者要对物体的坚固性有一定的感知，这是孩子们能直观掌握的。创建更像儿童一样学习的模型将有助于研究人员更好地理解人类的学习和发展。

人工智能模型如果能掌握人类学习语言的一些方法，学习效率可能会高出很多。

他们的行为可能更像人类，而不像语言学家诺姆·乔姆斯基（Noam Chomsky）和他的同事曾经描述的 ChatGPT 等大型语言模型那样，是“一个笨拙的模式匹配统计引擎”。

霍华德·施罗布（Howard Shrobe）在美国政府国防高级研究计划局管理该项目，该项目帮助资助了莱克的团队。他说：“人工智能系统仍然很脆弱，而且缺乏常识。”

但是，能像孩子一样学习的人工智能或许能够理解意义，也能应对新情况并从新经验中学习。我们的目标是让人工智能离人类智能更近一步。

支持：大义

运营/排版：何晨龙

纽大发现婴儿天生拥有语言能力，甚至可能比ChatGPT更擅长学习

继续阅读

改河社区林城大道、城中路支部开展党纪学习教育暨主题党日活动

旅游集团召开党委理论学习中心组 2024年第4次集体学习会议

党纪学习教育丨加强党的纪律建设、推动全面从严治党向纵深发展——各地区各部门各单位全面启动党纪学习教育

健康为基，学习为翼，成长为魂——探索三重维度的人生蜕变

托福雅思学习，暑假是最好的时间吗？

孙卓高考在即，孙海洋忙直播带货，被质疑看重钱财不重视孩子学习

叶县县委党纪学习教育读书班开班

代县：远离毒品别好奇自觉防范多学习

“学习+调研+实践”，烹饪主题党日“三鲜汤”

日军石田干雄：为糟蹋一位母亲将其婴儿丢入沸水，晚年自责是野兽

某种程度上来说，周迅并不太值得大家学习，因为她身上没有那种敢争敢抢，敢折腾的气质。以前娱乐圈真的是百花齐放的，大部分女明

初高中用什么家教机好？深度评测多款学习机，为您孩子的学业加速

回顾男子肺癌淋巴转移后,治疗4年，转移灶消失，他的方法值得学习

科普｜试管婴儿是试管里长大的孩子吗？

男性不育，试管婴儿是最后的选择吗？这些方法同样有效！

杨浦区委中心组学习会举行，专题学习《中国共产党纪律处分条例》