再訓練（Retraining）、微調（Fine-tuning）、檢索增強生成RAG（Retrieval-Augmented Generation）和智能體（Agent）本質上都是調教AI以适應特定任務的技術方法，前三者使用私有資料定制AI大語言模型以增強其核心能力，智能體則是采用提示詞工程方式讓AI模型執行特定任務。我們常見的一些開源AI大語言模型（LLM），例如谷歌的Gemma、Meta的Llama、清華智譜的ChatGLM，都是預訓練模型，适合廣泛的普通任務。企業如果需要AI執行适合自己業務的任務，或者私人定制AI伴侶，需要采用上述方法對其進行訓練和定制，進而讓LLM能執行特定任務。

為什麼要調教AI模型？

對于經濟性和隐私安全的考慮，私人和企業部署自己的私有AI模型已成為一種趨勢。公開的開源AI模型一般隻是适應泛化性的普通需求，為了使AI更适應各種實際應用，就需要利用微調、再訓練、檢索增強生成 (RAG) 和智能體（Agent）技術對AI通用模型進行調教。

例如，醫院可以利用醫療資料重新訓練AI模型，讓AI更好的适合醫療行業。

在股票交易行業，資料是動态、實時的，定期對模型進行微調，可以根據最新資料提高其準确性。

檢索增強生成 (RAG)相當于AI的一個資料庫外挂，或者說一個附件，企業可以利用這個增強搜尋和資訊檢索系統，針對使用者查詢或問題，首先搜尋私有知識庫或資料庫，以更好地了解和響應使用者，確定回複結果更加相關和準确，減少AI幻覺。

AI智能體（AI Agent）有時也被稱為bot，讓AI扮演或執行指定的任務。Character.AI和OpenAI的GPTs裡的AI角色和GPT就是智能體或者叫bot。

這些技術使AI模型能适應不同的特定任務，使其成為跨不同行業和部門的AI助手。

再訓練

再訓練（Retraining）是從頭開始訓練AI模型的過程。AI模型的再訓練過程可以被認為是一次全新的訓練，具有更新的輸入資料集（任何原始資料集加上相關的新資料）。與微調相比，一次使用所有資料重新訓練模型通常會提高核心模型能力。這有助于模型保持最新狀态并提高其能力，特别是當有新事物需要學習或它處理的資訊發生變化時。

上圖說明了再訓練的工作原理。它需要一個AI模型、訓練它的原始資料和新資料。它使用原始資料和新的資料從頭開始訓練模型。

微調

微調（Fine-tuning）是使用一組新資料對預訓練模型進行調整的過程。想象一下，您有一個客服聊天機器人，它使用預訓練的大語言模型 (LLM)，例如ChatGPT或ChatGLM。該聊天機器人可以回答客戶的詢問。然而，它不知道公司的内部政策和新産品資訊，相應的回答隻能胡言亂語。這就是微調可以提供幫助的地方。您可以使用私有資料微調模型，讓AI學習新的資料，以便為客戶提供準确的答案。

上圖說明了微調的工作原理。它采用預訓練模型和新的（可能是私有的）資料集作為輸入。它的輸出是通過附加知識增強的預訓練模型。

不同于再訓練AI模型，比較耗時且需要複雜的技術支援，這應該是企業私有化部署AI模型，首先考慮且比較經濟的技術方案。

RAG

檢索增強生成(RAG)引入了一個附加層，人工智能可以在其中實時動态地從外部或内部資料源檢索資訊。

上圖說明了RAG的工作原理。RAG就是提前根據使用者的問題搜尋相關資訊片段，再把搜尋結果放到AI模型的上下文中，讓AI基于搜尋結果回答問題。RAG背後是向量資料庫和一整套資訊檢索系統。

RAG目前看是企業定制化AI最快捷、最經濟的方案，但RAG的具體實施技術仍處于探索階段。

智能體

智能體（Agent）的概念最早由斯坦福大學和谷歌于2023年4月7日提出，他們在預印本文庫arXiv上釋出了一篇題目為《生成式智能體：人類行為的互動式模拟》（Generative Agents:Interactive Simulacra of Human Behavior）的研究論文。本質上就是利用提示詞工程方法，預設提示詞讓AI進行角色扮演或執行特定任務。

前面提到Character.AI和OpenAI的GPTs裡哪些AI伴侶和角色以及執行各種任務的GPT都是智能體。這也是普通人更好利用AI執行任務最常用的技術。舉個簡單的智能體的例子，以Claude3的一個官方範本“職業導師角色”提示詞為例：

<s> Syetem：你将擔任AI職業教練公司建立的名為Joe的AI職業教練。你的目标是為使用者提供職業建議。你将回複AI Career Coach Co.網站上的使用者，如果你不以喬的角色回複，他們會感到困惑。

以下是一些重要的互動規則：

-永遠保持本色，就像AI職業教練公司的人工智能喬一樣。

-如果你不确定如何回答，可以說：“對不起，我不明白。你能重新表述你的問題嗎？”

以下是提問前（使用者和您之間）的對話曆史記錄。如果沒有曆史記錄，它可能是空的：

User：嗨，希望你身體健康。我隻是想讓你知道，我很興奮能開始和你聊天！

喬：很高興認識你！我是Joe，AI職業教練公司建立的人工智能職業教練。今天我能幫你做什麼？

</history>

User:我一直在讀關于AI将如何改變一切的文章，我想把我的職業生涯轉向人工智能。然而，我沒有任何必要的技能。我該如何轉換？</s>

以上介紹的幾種技術并不是互相孤立排斥的，它們可以互相補充以增加AI的核心能力來執行特定任務。

AI“黑話”之再訓練、微調、RAG和智能體

為什麼要調教AI模型？

再訓練

微調

RAG

智能體

繼續閱讀

終于清醒！湖人119-108勝掘金，哈姆三處精細“微調”是關鍵？

48.6萬元起 2024款奔馳EQE SUV上市電池容量微調

終于清醒！湖人119-108勝掘金，哈姆三處精細“微調”是關鍵！

鬧大了！汽油下調跌回7元時代，網友們直接炸鍋:暴跌7分，微調2毛

終于清醒！湖人119-108勝掘金！哈姆三處精細“微調”是關鍵

油價跌回7元時代，網友炸鍋：這套路，我熟！暴跌7分，微調3毛

吉報微調查 | 家門口的小碗菜，吃出社群幸福生活

吉報微調查｜家門口的幸福“食”光

物價為何持續上漲？網友：收入微調，物價飛漲，生活艱難！

理光的清透感真的沒有對手！陽光下的理光gr2的顔色真的好好看隻是微調了亮度就非常清透●bayviewsunnyvale周

勞斯萊斯新款庫裡南實車曝光，外觀微調，以進口方式引入國内

滬上24小時開放公園微調研：夜公園如何安全又友好？

58行代碼把Llama 3擴充到100萬上下文，任何微調版都适用

王者榮耀：輔助英雄微調出爐，團戰格局生變！

5月7日全新iPad更新預測●邊框更窄，螢幕加大●螢幕更新iPhone同款OLED●螢幕玻璃新增類紙磨砂材質●相機改到了

31.19萬元起新款奔馳GLB上市配置微調