像教小孩一樣訓練AI大模型！谷歌Deepmind如何指導訓練機器人任務

谷歌DeepMind有一個名為RT-2人工智能模型，可以指導它從未被訓練過的機器人任務。

該模型從網絡和機器人資料中學習。然後，它将此資訊轉換為機器的簡單說明。

在測試中，該模型被要求采取機器人資料中從未見過的動作，例如将橙子放入比對的碗中。為了遵循這些指令，系統必須從基于網絡的資料中轉換知識。根據DeepMind的資料，該模型在這些操作中取得了62%的成功率 - 是其前身RT-1模型的兩倍。

“就像語言模型在網絡上的文本上進行訓練以學習一般思想和概念一樣，RT-2從網絡資料中轉移知識以告知機器人行為，”DeepMind機器人負責人Vincent Vanhoucke說。“換句話說，RT-2可以說是真正的機器人。

RT-2在沒有經過訓練的機器人任務進行了各種機器人技能測試

測試表明RT-2具有令人印象深刻的泛化能力。它還改進了以前從未遇到過的對機器人資料的語義和視覺了解。

此外，該模型可以使用基本的推理來遵循新的使用者指令。令人印象深刻的是，它甚至可以執行多階段語義推理。例如，當訓示選擇一個可以用作錘子的物體時，RT-2正确地将岩石識别為最佳選擇。

在一次測試中，RT-2發現岩石是作為簡易錘子拾起的最佳物體

在另一項評估中，該模型被指令将一瓶番茄醬推向藍色立方體。

場景中有幾個項目，但訓練資料集中唯一的項目是立方體。盡管如此，RT-2還是成功地将番茄醬推向了指定的目的地。

RT-2在實際任務中表現良好

DeepMind将RT-2視為人工智能的突破。倫敦實驗室表示，該模型使我們更接近有用機器人的未來。.

“RT-2不僅展示了人工智能的進步如何迅速級聯到機器人技術中，它還顯示了對更多通用機器人的巨大希望，”Vanhoucke說。“雖然在以人為中心的環境中啟用有用的機器人仍有大量工作要做，但RT-2向我們展示了機器人技術的令人興奮的未來。

從谷歌DeepMind RT-2的訓練方式來看，這不就是像教會小孩一樣訓練學習各種事物？難怪大模型越來越變得聰明，不是嗎？

參考來源：https://robotics-transformer2.github.io/assets/rt2.pdf