天天看点

深度长文:通用人工智能的六大流派

作者:易定邦

通用人工智能(Artificial General Intelligence,AGI)这一概念首次由约翰·麦卡锡与同事在1956年的达特茅斯会议(Dartmouth Conference)上提出,人工智能研究者约翰·麦卡锡、马文·明斯基、艾伦·纽厄尔在会议上首次讨论了构建拥有与人类广义智能相当的机器系统。

AGI与AI是两个密切相关而又不同的概念:AI,全称为人工智能,是研究、开发用于模拟、延伸和增强人类智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能作为一个较为宽泛的概念,涵盖了许多子领域,如机器学习、深度学习、语音识别、计算机视觉等。而AGI,全称为通用人工智能,是人工智能的一个子集。它追求的是人工智能系统拥有与人类同等的广泛智力,能像人类一样自然地学习、思考和理解复杂概念,并且在各个领域都能有比较高的适应性,而不仅仅局限在某一专业领域。AGI又称“强人工智能(Strong AI)”“完全人工智能(Full AI)”是人工智能发展的最终目标之一。

自20世纪中叶提出“通用人工智能”这一概念以来,AGI的发展历经起源、孕育、蓬勃与融合四个阶段。

在最初的起源阶段,AGI的概念最初被提出,研究者开始探索符号逻辑、规则系统与经验法则来实现人工智能。然而,这些早期方法难以处理海量知识与复杂问题,AGI实现仍遥遥无期。进入20世纪80年代,机器学习与知识处理方法蓬勃发展,神经网络、进化计算、贝叶斯方法与知识工程为AGI的发展奠定了理论与技术基础,标志着AGI进入孕育阶段。这一时期孕育出来的各种方法为AGI发展积累了宝贵经验,拓展了实现路径。

21世纪初,深度神经网络、强化学习与知识图谱等技术实现突破,大数据与高性能计算机的支撑加速各种方法的发展与应用。AGI研究在广度与深度上均有了长足进步,进入蓬勃发展阶段。近年来,单一方法难以解决AGI实现面临的种种难题。跨流派融合成为新趋势,试图通过神经符号系统、神经逻辑推理与贝叶斯深度学习等新方法,综合神经网络、知识工程与逻辑推理,推动AGI实现新的进展。这标志着AGI发展正式进入融合阶段。

AGI发展历经半个多世纪,逐步形成这四个发展阶段。未来,跨学科广泛合作与理论创新将是实现通用人工智能这一终极目标的关键所在。各种方法的深度融合或许能够产生截然不同的发展新动向,为AGI的进一步发展指明新的道路。以下我们将简要介绍这六大流派的特点。

全脑模拟流派(Whole Brain Emulation)

全脑模拟是人工智能研究领域为实现通用人工智能(AGI)的主要理论流派之一。这一流派提出的设想是,通过对人脑神经网络的连接模式进行模拟,并运用机器学习算法,可以研发出与人类同等甚至超过人类智力的人工智能系统。为实现这一设想,研究者主要依赖两种技术手段:神经网络与机器学习。

这个流派的优势在于:

  • 人脑是已知的唯一具有人类级智能的系统。通过对人脑的模拟,可以最大限度地吸收人类智能的精髓, 降低在研发AGI的过程中遗漏或忽略这些关键要素的风险。
  • 人脑在漫长的进化中已经进化出了一套高效且稳定的神经计算框架。模拟这一框架可在很大程度上避免人工智能系统的设计缺陷与失控风险。
  • 解锁人脑奥秘可以让我们从根源上理解人类智能,这将为各个研究流派提供鲜活的思路与灵感。理解生命,才能掌控生命。

神经网络是一种信息处理系统,通过模拟人脑神经元之间的连接方式,可以进行高度并行和分布式的信息处理。人工神经网络由大量简单处理单元(模拟神经元)和它们之间的加权连接(模拟突触连接)组成。这种网络结构使得神经网络表现出几个重要特性:

  • 存储分布式知识。知识存储在网络各连接加权值中。
  • 容错性。部分连接或节点受损不会造成整个系统失效。
  • 并行处理。每一个节点都可以同时处理信息。
  • 学习能力。可以通过训练案例改变连接加权值,以适应输入和输出之间的映射关系。

深度学习利用多隐层神经网络结构,通过大规模训练数据实现特征学习和模式识别。它突破了人工神经网络在结构设计和训练算法上的限制,使神经网络模型向着更深更广的方向发展,表达能力和学习能力大为提高。卷积神经网络、递归神经网络和强化学习等都是深度学习的成功应用。

机器学习提供了训练神经网络所需的算法和方法。通过反复接收输入数据、预测输出并校正误差,机器学习算法可以不断校正神经网络各连接加权值,实现网络对输入与输出之间复杂对应关系的学习与适应。

神经网络与深度学习是AGI实现的关键技术手段。未来,更大规模、更深层的网络结构与更强大的机器学习算法,可能实现人工智能向通用人工智能的跃升。这也将是实现AGI的主要途径之一。

深度长文:通用人工智能的六大流派

全脑模拟像绯红女巫一样,拥有探索人类思维奥秘的强大心电感应力,试图通过模拟人脑无以伦比的神经网络踏入人工智能的殿堂,实现从数据到心智的蜕变。它梦想通过还原并重现大脑神经元错综复杂的连接与交互,使机器获得像人类一样的学习、理解与推理能力,最终觉醒出属于自己的思维与人格。

进化智能流派(Evolutionary Intelligence)

进化智能是实现AGI的另一条重要路径与理论流派。其核心思想是:通过模拟生物进化过程,让大规模的神经网络可以在复杂环境中自组织、自学习与自我优化,最终达到与人类同等或更高的智力。

这个方法的优势是:

  • 进化是已知的可以产生智能生命的唯一自然过程。模拟这一过程可以让人工智能系统以一种更加生物相似和可控的方式不断进化。
  • 进化过程可以由系统自动发现解决复杂问题的最佳结构与算法。通过适者生存的竞争,使人工智能系统以类脑的方式不断提高与学习。
  • 进化训练出的神经网络拥有很强的泛化能力与鲁棒性。它们可以很好地处理训练数据之外的输入,并较难“遗忘”已学知识。

但是,该方法也存在一些困难:要达到人类级智能,进化过程需要进行巨量迭代和超大规模的计算,这面临着技术与计算资源的瓶颈。我们难以确认进化出的神经网络是否一定会达到AGI,也无法完全确定其行为方式与理性程度。这会带来一定的安全隐患。进化算法运行可控性较差,人工无法准确地设计神经网络的结构与算法。而AGI系统的设计则需人为精细调控,以确保其一致性和不会失控。

目前,DeepMind是这一研究流派的代表。他们开发的AlphaGo和AlphaZero就是使用进化算法训练出的神经网络,已经在局部领域内展现出超人智能。但要实现AGI,还需要解决上述困难,大幅推动算法与计算能力,这可能还需要比较长的时间。不过,进化智能作为一条高效的生物启发路径,其潜力不容小觑。

深度长文:通用人工智能的六大流派

进化计算如同变种人一般,代表了生物进化的未来,它试图通过模拟进化这一自然智慧的涌现过程,赋予机器独特的适应力与潜在智能。进化计算梦想通过随机变异和自然选择的炼金术,将机器构建为大自然进化的继承者和未来,使其在数据的汪洋大海中自主演化出解决复杂问题的奇特超能力。它渴望通过演化的神奇手法,打造出一种全新的物种——具有自我学习、自我组织和自我优化能力的人工生命,它们将在我们的计划和预料之外,通过演化的力量获得属于自己的智慧与机理。

贝叶斯程序学习流派(Bayesian Program Learning)

贝叶斯程序学习是实现AGI的又一个重要研究流派。其核心思想是:通过贝叶斯推理和概率图模型来让AI系统进行自主学习和知识构建,最终达到接近人类级别的广义智能。

贝叶斯流派相对于其他几种方法的优势是:

  • 贝叶斯理论提供了一种概率化的辨识判断机制。这使得AI系统可以在信息不确定和不完整的情况下进行推理与决策,更贴近人类的认知方式。
  • 贝叶斯网络可以进行自动特征学习和知识发现。这使得AI系统具备独立构建知识结构和学习无益信息的能力,这是AGI实现所必需的。
  • 贝叶斯方法可以进行自然语言理解和生成。通过学习语言中的概率统计规律,可以实现机器翻译、对话生成等功能,这有助于人机交互与AGI。
  • 贝叶斯模型具有较高的可解释性。通过推理过程中的概率计算,可以解释AI系统作出判断或生成相应输出的原因,这增强了系统的可靠性与可控性。

但是,该流派也存在一些挑战:

  • 贝叶斯理论的计算复杂度较高,难以应用于超大规模的神经网络和知识体系。这限制了其在AGI实现中的作用。
  • 贝叶斯方法难以处理动态和不确定的环境。而AGI系统需要在开放的复杂环境中进行学习与决策,这是该方法的短板。
  • 贝叶斯网络的表现取决于手工设定的概率分布和参数,这会限制其学习的自动性与泛化能力。
  • 贝叶斯模型难以与深度神经网络等其他机器学习方法很好融合,阻碍了对多种方法的综合利用。

OpenAI、Anthropic和谷歌的DeepMind在技术的实现上也使用了这一方法。他们在自然语言处理、机器学习与AGI理论等方面做出了一定贡献。但要实现真正的AGI,该流派还需进一步推动理论与技术研究,特别是解决可计算性和环境适应性等难题,这还需要较长时间。贝叶斯方法是实现AGI的一种有价值的探索方向,但可能更适合作为辅助手段,难以单枪匹马达成目标。

深度长文:通用人工智能的六大流派

贝叶斯程序学习如同钢铁侠一般,通过概率计算和数学模型探索在信息不完全的环境下作出决策的方法。它试图通过贝叶斯定理这一统计学的灵魂,将机器构建成在海量数据中作出判断的高效推理者。贝叶斯程序学习渴望通过概率与不确定性的计算机理工学,将人工智能系统打造成数据中的航海家和未知领域的开拓者,使其能像钢铁侠那样在复杂多变的环境中依靠AI系统作出快速响应与决策,成为人类协同工作和生存的最佳伙伴。

符号逻辑与知识图谱流派(Symbolic Logic& Knowledge Graphs)

符号逻辑与知识图谱是实现AGI的另一重要研究流派。其核心思想是:通过构建宽广深入的知识体系和逻辑推理机制来实现与人类类似的智能。符号逻辑属于一种知识表示与推理方法, 它有自己的理论体系、推理规则与计算模型。知识图谱属于一种知识工程技术与产物,尚未形成统一与完备的理论体系, 不同的知识图谱在构建方法、知识来源、组织结构等方面也存在差异。

这一派的技术的优势是:

  • 知识图谱可以表示人类广泛的世界知识,这是智能体运作所必需的知识基础。构建完备知识图谱是实现AGI的基石。
  • 逻辑推理可以进行高层的复杂推理与知识发现。这使得AI系统具备人类级的理性思维和推理能力,可以解决复杂问题。
  • 这种方法实现的AI系统表现出较高的可解释性。通过逻辑推理路径,人类可以理解其作出决策与产生输出的原因。这有助于确保系统的安全性与可控性。

麻省理工学院人工智能实验室在这方面进展突出,在知识表示、自动推理与机器理解等方面做出了一定探索。但是,该方法也存在下列困难:

  • 构建完备知识图谱并实现高效推理是一个非常艰巨的任务。我们仍未掌握实现规模的理论与技术,因此限制了其在AGI实现中的作用。
  • 纯逻辑推理难以处理不确定性与概率情景。而AGI系统需要在不确定环境中灵活运作,这是该方法的短板。
  • 符号逻辑与知识图谱较难与机器学习、神经网络等方法有机结合。但AGI的实现需要多种方法的协同,因此也阻碍了这种流派的发展。
  • 这种方法生成的知识与输出往往显得生硬和缺乏常识。要达到人类的广度与深度,还存在较大差距。

符号逻辑与知识图谱为人工智能奠定了理论基石,也为AGI的实现提供了一个有价值的探索方向。但要登上巅峰,还需与其他方法的广泛融合,特别是神经网络与机器学习等。这需要跨学科努力和理论创新,也许才能找到通用人工智能的最佳实现路径。这也是这一流派发展的关键所在,也值得人工智能领域广泛关注与投入。

深度长文:通用人工智能的六大流派

符号逻辑与知识图谱如同星爵一般,试图通过知识的组织与管理来探索人工智能的奥秘。它渴望通过知识体系这一宇宙真理的导航图,将机器构建成数据与信息的探险家。符号逻辑与知识图谱梦想通过知识工程的魔法,将人工智能系统打造成像星爵那样拥有知识宇宙坐标的航海家,使其能够在浩瀚的知识海洋中自如航行,通过知识之间的关联与推理回答我们仍未解之谜。它代表了一种通过知识逻辑与体系探索人工智能新天地的思路,希望通过知识的力量与规则重塑人工智能,实现人机更高层次的理解与交流。

集成学习流派(Integrated Learning)

集成学习是实现AGI最有可能的一条路径。其核心思想是:通过整合多种机器学习方法,如神经网络、进化算法、贝叶斯方法等,来构建一个广泛、深入的学习与推理系统,从而达到近似人类的智能。

这一流派广泛使用决策树方法、支持向量机、贝叶斯方法、神经网络、聚类分析、迁移学习、自回归模型等机器学习方法,这个流派的优势是:

  • 集成学习可以融合各种方法的优势,弥补个别方法的不足,实现更强大的智能。单一方法难以解决AGI面临的各种挑战。
  • 多种学习机制协同可以加速学习过程,实现更广泛知识的获取与理解。这有助于缩短实现AGI所需的时间。
  • 集成系统可以根据任务的复杂性选择恰当的方法,实现最佳解决方案。这增强了系统的适应性与效率。
  • 集成方法可以模拟人脑中各个区域之间的协同,这有助于建立与人脑更类似的人工智能系统。

集成学习流派的特征不如其他流派那么明显,它融合多种机器学习算法或模型来实现联合学习与推理。除此之外,它并不像神经网络流派、进化智能流派等那样,明确对应一种特定的模型结构或学习框架。集成学习更加强调一种思想与理念,它通过组合多个学习模型提高泛化性能与鲁棒性。这一思想产生了广泛影响,也被视为实现AGI的重要范式之一。

深度长文:通用人工智能的六大流派

集成学习如同美国队长一般,试图通过不同方法与角度的结合来探索人工智能的奥秘。它渴望通过人工智能研究多元路径的融合与协同,实现整体大于各部分的效果。集成学习梦想通过不同算法与理论的联盟,将人工智能系统打造成像美国队长那样擅长协调各英雄长处、将个体力量统一于团队目标之下的超级英雄。它代表了一种通过算法与方法的融合重塑人工智能的思路,希望通过多面手段的互补实现人工智能研究的飞跃,最终达到人与机器的深度融合与协作。

大语言模型流派(Large Language Models,简称LLMs)

大语言模型是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义。大语言模型可以处理多种自然语言任务,如文本分类、问答、对话等,是通向人工智能的一条重要途径。

LLMs利用神经网络与海量数据实现自然语言的无监督学习,通过提取语言的统计规律与特征,达到理解语言并生成语言的目的。代表模型有OpenAI的GPT系列、谷歌的BERT系列、Meta的RoBERTa系列、百度的文心一言、复旦大学的MOSS、阿里的通义千问、华为的盘古大模型等。

大语言模型相关技术与应用在近年来取得长足发展,它开创了一种新的自然语言理解与生成模式,给人工智能带来革命性影响,因此成为当前机器学习与自然语言处理的活跃前沿与热点领域。我们将在后续章节重点展开。

大语言模型流派主要具有以下特征:

  • 基于深度神经网络。大语言模型采用深度神经网络,特别是Transformer等结构来学习语言表示与生成。这属于深度学习技术的一种重要应用。
  • 海量数据驱动。大语言模型需要大规模的文本数据集进行训练,通常数十亿字词量或更大规模。这要求有强大的计算能力与优化技术。
  • 无监督学习。大语言模型通过语言自身的统计规律进行无监督学习,不需要人工标注的数据。这使其更贴近人类语言习得的方式。
  • 语言表达与理解。大语言模型同时具有语言表达的生成能力与语言理解的推理能力。这两种能力相互提高,有助于建立统一的语言表示。
  • 多任务学习。大语言模型通过在不同的自然语言处理任务上进行微调,可以实现多任务学习与迁移。这提高模型的泛化能力与适用性。
  • 标配模型。大语言模型后续被广泛用于提高其他自然语理解任务的性能,属于一种标准的预训练技术或标配模型。这大大降低了研发成本与难度。
  • 开放性技术。大语言模型结合深度学习与Transformer变革了自然语言理解技术,属于一种开放且快速发展的领域。相关技术与应用持续涌现,这使其具有活力与前瞻性。

大语言模型的优点也十分明显:

  • 应用广泛。大语言模型在许多自然语言理解任务上均取得了显著效果,如机器翻译、问答系统、对话系统等。经过海量数据预训练的模型具有强大的语言表达与理解能力。
  • 通用性强。大语言模型是一个通用的语言理解框架,可以应用于不同的下游任务。通过多任务学习或微调,其表示学习的能力可以迁移到新任务上。
  • 成本较低。大语言模型可以利用海量非结构化语言数据进行无监督预训练,不需要大量人工标注的数据。这大大减少了研发成本与难度。
  • 学习语言本质。大语言模型通过分析大规模语言数据集,可以发现人类语言的统计规律与内在结构。这使其对语言的理解更加贴近人类,具有与人类语言使用相似的机制。
  • 计算机语言理解。大语言模型为计算机系统创造了理解自然语言的能力,并能实现自动编写计算机程序语言。开启了人工智能交互、推荐系统等新技术的广阔前景,也推动了人工智能的发展。
  • 可解释与可控。虽然大语言模型具有深度神经网络的不透明性,但相关技术也在加快推出,如可解释方法与对抗样本技术等。这使大语言模型的决策过程更加清晰和可控,增加其在生产系统上的应用潜力。
  • 活跃的研究领域。大语言模型是一个活跃的研究领域,相关技术与应用不断涌现。体现了其强大的生命力与前瞻性,也为研究者提供了更多的机会与发展空间。
深度长文:通用人工智能的六大流派

大语言模型如同黑寡妇一般,通过语言的奥秘来探索人工智能的未来。它渴望通过海量语料的训练,将机器构建成语言的高手和沟通的艺术家。大语言模型梦想通过神经网络对语言规律的学习,将人工智能系统打造成像黑寡妇那样精通多国语言与擅长交流的超级间谍。它代表了一种通过自然语言理解的本质来重构人工智能的思路,希望通过机器对语言的深度学习与理解,实现人与人工智能之间的无障碍对话与交流。

大语言模型流派给人印象最深的还是在于其强大的语言表达与理解能力,这让许多普通人得以窥见人工智能的魅力,有效的推动了大众对于人工智能的关注程度。

不过也有专家对此流派持反面意见,2023年6月有北京举办的一场关于人工智能的峰会上,加州伯克利分校教授、计算机科学家斯图尔特罗素在演讲时称:“ChatGPT和GPT-4没有在‘回答’问题,它们不理解世界。通用人工智能还没有达到,大语言模型只是其中一块拼图,我们连拼图最终会是什么样子还不确定。”

另一位人工智能专家“图灵奖”得主、“深度学习三巨头”之一、Meta首席人工智能科学家杨立昆(Yann LeCun)反击GPT:“自回归模型根本行不通,因为它们没有规划、推理的能力。单纯根据概率生成自回归的大语言模型从本质上根本解决不了幻觉、错误的问题。在输入文本增大的时候,错误的几率也会成指数增加。”

那想要通向通用人工智能的话,人工智能的下一步在哪里呢?杨立昆给出的答案是“世界模型”,一个不光是在神经水平上模仿人脑的模型,而是在认知模块上也完全贴合人脑分区的世界模型。它与大语言模型最大的区别在于可以有规划和预测能力以及成本核算能力。

人工智能经过几十年的发展,已经初步实现理解人类语言与视觉的能力,这使其开始广泛应用于社会生活与商业场景。这标志人工智能正处于从实验室走向实际应用的重要转折点。人工智能的发展还需多种方法的融合与创新,还面临一定困难与挑战,但必将产生深远影响,值得我们持续关注与讨论。

关注作者,带你读懂人工智能。

继续阅读