天天看点

AI“黑话”之再训练、微调、RAG和智能体

作者:开山怪阿土

再训练(Retraining)、微调(Fine-tuning)、检索增强生成RAG(Retrieval-Augmented Generation)和智能体(Agent)本质上都是调教AI以适应特定任务的技术方法,前三者使用私有数据定制AI大语言模型以增强其核心能力,智能体则是采用提示词工程方式让AI模型执行特定任务。我们常见的一些开源AI大语言模型(LLM),例如谷歌的Gemma、Meta的Llama、清华智谱的ChatGLM,都是预训练模型,适合广泛的普通任务。企业如果需要AI执行适合自己业务的任务,或者私人定制AI伴侣,需要采用上述方法对其进行训练和定制,从而让LLM能执行特定任务。

为什么要调教AI模型?

对于经济性和隐私安全的考虑,私人和企业部署自己的私有AI模型已成为一种趋势。公开的开源AI模型一般只是适应泛化性的普通需求,为了使AI更适应各种实际应用,就需要利用微调、再训练、检索增强生成 (RAG) 和智能体(Agent)技术对AI通用模型进行调教。

例如,医院可以利用医疗数据重新训练AI模型,让AI更好的适合医疗行业。

在股票交易行业,数据是动态、实时的,定期对模型进行微调,可以根据最新数据提高其准确性。

检索增强生成 (RAG)相当于AI的一个数据库外挂,或者说一个附件,企业可以利用这个增强搜索和信息检索系统,针对用户查询或问题,首先搜索私有知识库或数据库,以更好地理解和响应用户,确保回复结果更加相关和准确,减少AI幻觉。

AI智能体(AI Agent)有时也被称为bot,让AI扮演或执行指定的任务。Character.AI和OpenAI的GPTs里的AI角色和GPT就是智能体或者叫bot。

这些技术使AI模型能适应不同的特定任务,使其成为跨不同行业和部门的AI助手。

再训练

再训练(Retraining)是从头开始训练AI模型的过程。AI模型的再训练过程可以被认为是一次全新的训练,具有更新的输入数据集(任何原始数据集加上相关的新数据)。与微调相比,一次使用所有数据重新训练模型通常会提高核心模型能力。这有助于模型保持最新状态并提高其能力,特别是当有新事物需要学习或它处理的信息发生变化时。

AI“黑话”之再训练、微调、RAG和智能体

上图说明了再训练的工作原理。它需要一个AI模型、训练它的原始数据和新数据。它使用原始数据和新的数据从头开始训练模型。

微调

微调(Fine-tuning)是使用一组新数据对预训练模型进行调整的过程。想象一下,您有一个客服聊天机器人,它使用预训练的大语言模型 (LLM),例如ChatGPT或ChatGLM。该聊天机器人可以回答客户的询问。然而,它不知道公司的内部政策和新产品信息,相应的回答只能胡言乱语。这就是微调可以提供帮助的地方。您可以使用私有数据微调模型,让AI学习新的数据,以便为客户提供准确的答案。

AI“黑话”之再训练、微调、RAG和智能体

上图说明了微调的工作原理。它采用预训练模型和新的(可能是私有的)数据集作为输入。它的输出是通过附加知识增强的预训练模型。

不同于再训练AI模型,比较耗时且需要复杂的技术支持,这应该是企业私有化部署AI模型,首先考虑且比较经济的技术方案。

RAG

检索增强生成(RAG)引入了一个附加层,人工智能可以在其中实时动态地从外部或内部数据源检索信息。

AI“黑话”之再训练、微调、RAG和智能体

上图说明了RAG的工作原理。RAG就是提前根据用户的问题搜索相关信息片段,再把搜索结果放到AI模型的上下文中,让AI基于搜索结果回答问题。RAG背后是向量数据库和一整套信息检索系统。

RAG目前看是企业定制化AI最快捷、最经济的方案,但RAG的具体实施技术仍处于探索阶段。

智能体

智能体(Agent)的概念最早由斯坦福大学和谷歌于2023年4月7日提出,他们在预印本文库arXiv上发布了一篇题目为《生成式智能体:人类行为的交互式模拟》(Generative Agents:Interactive Simulacra of Human Behavior)的研究论文。本质上就是利用提示词工程方法,预设提示词让AI进行角色扮演或执行特定任务。

前面提到Character.AI和OpenAI的GPTs里哪些AI伴侣和角色以及执行各种任务的GPT都是智能体。这也是普通人更好利用AI执行任务最常用的技术。举个简单的智能体的例子,以Claude3的一个官方范本“职业导师角色”提示词为例:

<s> Syetem:你将担任AI职业教练公司创建的名为Joe的AI职业教练。你的目标是为用户提供职业建议。你将回复AI Career Coach Co.网站上的用户,如果你不以乔的角色回复,他们会感到困惑。

以下是一些重要的交互规则:

-永远保持本色,就像AI职业教练公司的人工智能乔一样。

-如果你不确定如何回答,可以说:“对不起,我不明白。你能重新表述你的问题吗?”

以下是提问前(用户和您之间)的对话历史记录。如果没有历史记录,它可能是空的:

<history>

User:嗨,希望你身体健康。我只是想让你知道,我很兴奋能开始和你聊天!

乔:很高兴认识你!我是Joe,AI职业教练公司创建的人工智能职业教练。今天我能帮你做什么?

</history>

User:我一直在读关于AI将如何改变一切的文章,我想把我的职业生涯转向人工智能。然而,我没有任何必要的技能。我该如何转换?</s>

以上介绍的几种技术并不是互相孤立排斥的,它们可以互相补充以增加AI的核心能力来执行特定任务。

继续阅读