天天看點

AI“黑話”之再訓練、微調、RAG和智能體

作者:開山怪阿土

再訓練(Retraining)、微調(Fine-tuning)、檢索增強生成RAG(Retrieval-Augmented Generation)和智能體(Agent)本質上都是調教AI以适應特定任務的技術方法,前三者使用私有資料定制AI大語言模型以增強其核心能力,智能體則是采用提示詞工程方式讓AI模型執行特定任務。我們常見的一些開源AI大語言模型(LLM),例如谷歌的Gemma、Meta的Llama、清華智譜的ChatGLM,都是預訓練模型,适合廣泛的普通任務。企業如果需要AI執行适合自己業務的任務,或者私人定制AI伴侶,需要采用上述方法對其進行訓練和定制,進而讓LLM能執行特定任務。

為什麼要調教AI模型?

對于經濟性和隐私安全的考慮,私人和企業部署自己的私有AI模型已成為一種趨勢。公開的開源AI模型一般隻是适應泛化性的普通需求,為了使AI更适應各種實際應用,就需要利用微調、再訓練、檢索增強生成 (RAG) 和智能體(Agent)技術對AI通用模型進行調教。

例如,醫院可以利用醫療資料重新訓練AI模型,讓AI更好的适合醫療行業。

在股票交易行業,資料是動态、實時的,定期對模型進行微調,可以根據最新資料提高其準确性。

檢索增強生成 (RAG)相當于AI的一個資料庫外挂,或者說一個附件,企業可以利用這個增強搜尋和資訊檢索系統,針對使用者查詢或問題,首先搜尋私有知識庫或資料庫,以更好地了解和響應使用者,確定回複結果更加相關和準确,減少AI幻覺。

AI智能體(AI Agent)有時也被稱為bot,讓AI扮演或執行指定的任務。Character.AI和OpenAI的GPTs裡的AI角色和GPT就是智能體或者叫bot。

這些技術使AI模型能适應不同的特定任務,使其成為跨不同行業和部門的AI助手。

再訓練

再訓練(Retraining)是從頭開始訓練AI模型的過程。AI模型的再訓練過程可以被認為是一次全新的訓練,具有更新的輸入資料集(任何原始資料集加上相關的新資料)。與微調相比,一次使用所有資料重新訓練模型通常會提高核心模型能力。這有助于模型保持最新狀态并提高其能力,特别是當有新事物需要學習或它處理的資訊發生變化時。

AI“黑話”之再訓練、微調、RAG和智能體

上圖說明了再訓練的工作原理。它需要一個AI模型、訓練它的原始資料和新資料。它使用原始資料和新的資料從頭開始訓練模型。

微調

微調(Fine-tuning)是使用一組新資料對預訓練模型進行調整的過程。想象一下,您有一個客服聊天機器人,它使用預訓練的大語言模型 (LLM),例如ChatGPT或ChatGLM。該聊天機器人可以回答客戶的詢問。然而,它不知道公司的内部政策和新産品資訊,相應的回答隻能胡言亂語。這就是微調可以提供幫助的地方。您可以使用私有資料微調模型,讓AI學習新的資料,以便為客戶提供準确的答案。

AI“黑話”之再訓練、微調、RAG和智能體

上圖說明了微調的工作原理。它采用預訓練模型和新的(可能是私有的)資料集作為輸入。它的輸出是通過附加知識增強的預訓練模型。

不同于再訓練AI模型,比較耗時且需要複雜的技術支援,這應該是企業私有化部署AI模型,首先考慮且比較經濟的技術方案。

RAG

檢索增強生成(RAG)引入了一個附加層,人工智能可以在其中實時動态地從外部或内部資料源檢索資訊。

AI“黑話”之再訓練、微調、RAG和智能體

上圖說明了RAG的工作原理。RAG就是提前根據使用者的問題搜尋相關資訊片段,再把搜尋結果放到AI模型的上下文中,讓AI基于搜尋結果回答問題。RAG背後是向量資料庫和一整套資訊檢索系統。

RAG目前看是企業定制化AI最快捷、最經濟的方案,但RAG的具體實施技術仍處于探索階段。

智能體

智能體(Agent)的概念最早由斯坦福大學和谷歌于2023年4月7日提出,他們在預印本文庫arXiv上釋出了一篇題目為《生成式智能體:人類行為的互動式模拟》(Generative Agents:Interactive Simulacra of Human Behavior)的研究論文。本質上就是利用提示詞工程方法,預設提示詞讓AI進行角色扮演或執行特定任務。

前面提到Character.AI和OpenAI的GPTs裡哪些AI伴侶和角色以及執行各種任務的GPT都是智能體。這也是普通人更好利用AI執行任務最常用的技術。舉個簡單的智能體的例子,以Claude3的一個官方範本“職業導師角色”提示詞為例:

<s> Syetem:你将擔任AI職業教練公司建立的名為Joe的AI職業教練。你的目标是為使用者提供職業建議。你将回複AI Career Coach Co.網站上的使用者,如果你不以喬的角色回複,他們會感到困惑。

以下是一些重要的互動規則:

-永遠保持本色,就像AI職業教練公司的人工智能喬一樣。

-如果你不确定如何回答,可以說:“對不起,我不明白。你能重新表述你的問題嗎?”

以下是提問前(使用者和您之間)的對話曆史記錄。如果沒有曆史記錄,它可能是空的:

<history>

User:嗨,希望你身體健康。我隻是想讓你知道,我很興奮能開始和你聊天!

喬:很高興認識你!我是Joe,AI職業教練公司建立的人工智能職業教練。今天我能幫你做什麼?

</history>

User:我一直在讀關于AI将如何改變一切的文章,我想把我的職業生涯轉向人工智能。然而,我沒有任何必要的技能。我該如何轉換?</s>

以上介紹的幾種技術并不是互相孤立排斥的,它們可以互相補充以增加AI的核心能力來執行特定任務。

繼續閱讀