人工智能的學習能力有多驚人？可以用兩個字來形容：恐怖！

作者：思維空間0723 2023-05-31 17:22:00

人工智能的學習能力到底有多驚人，

我們可以通過OpenAI開發的，一個基于人工智能的實驗項目多智能體捉迷藏（Multi-Agent Hide and Seek）初窺門徑。

這是項目主要是為了研究多個智能體在一個虛拟環境中進行協作和競争的能力。

首先測試者建立了一個虛拟環境，包括一個迷宮般的場景，有牆壁、障礙物和隐藏點。在這個環境中，放置兩組智能體：人和鬼。

紅色的是人，藍色的是鬼。

人的目标是盡快找到并“捉住”所有鬼，而鬼的目标是盡可能長時間地躲避被人捉住。

使用強化學習算法，智能體們開始進行訓練。

一開始人非常容易就能捉到鬼，

不過經過數百萬個回合的學習後，

鬼根據回報資訊不斷調整自己的政策，

突然在某一次遊戲中，他們學會了将箱子移動到入口處并上鎖，

箱子一旦上鎖之後就不能移動了，以此鬼為自己制造了一個封閉的環境，

人就進不來了，

于是鬼終于找到了第一個赢得遊戲的政策。

随着遊戲的繼續進行，又是數百萬個回合的演進後，

人通過使用不同的算法和調整政策終于找到了一個突破口，

他們發現可以把斜坡當梯子使用，

于是人學會了從斜坡上翻牆，

跳進牆裡去抓鬼，

扮演鬼的人工智能隻能繼續尋找赢的辦法。

很快他們就有了新方案，

拿走人使用的斜坡工具，

于是在封閉屋子前，

他們先把斜坡搬到了自己的屋子裡，

然後再封閉大門，

這樣人就又無法進入到屋子裡了。

為了增加挑戰性，

測試者把兩方放到了更加開放的環境中，

同時給了他們更多的道具進行挑戰。

一開始，鬼很容易就被人找到，随着遊戲的不斷重複，他們漸漸學會了用木闆做一個圍牆，把自己圍在裡面，同時為了防止人使用斜坡，他們提前把斜坡上鎖，看似無懈可擊的計劃，竟不曾想到人竟然學會了新技能，他們把箱子推到了斜坡的邊上，然後利用斜坡上箱子，接着又控制箱子漂移到圍牆的邊上，就這樣，人再次翻過圍牆抓到了鬼。

這是一個突破了人類想象力的創新，誰也想不到人工智能竟然會用箱子搞漂移，這讓所有的測試人員都驚呆了。

在這個多智能體捉迷藏項目中，智能體們通過與環境的互動和對抗來不斷優化自己的行為。他們通過試錯和适應來提高自己的政策，進而在多智能體捉迷藏的遊戲中表現出更加智能和協作的行為。這個過程展示了智能體學習和進化的能力。

不敢想象如果讓他們這樣持續不斷的學習下去，人工智能最終會進化到什麼地步，又是否會代替人類甚至消滅人類。

人工智能的學習能力有多驚人？可以用兩個字來形容：恐怖！

繼續閱讀

卡内基梅隆大學研究人工智能更好為人類提供公平的方法

人工智能行業深度報告-“元年”之後-再看大模型應用商業化進展

人工智能疊代一切，文科生将是“最後幸存者”

一件純花錢的事連幹6年，阿裡還樂此不疲，背後野心藏不住了！就在6月13号，2024阿裡數學競賽決賽名單新鮮出爐，共有全球

2024:美國财富500強最多的州今年進入财富500強榜單的公司總部分布在37個州的226個城市，從俄亥俄州的小城鎮到洛

歡迎！德國科學院院士Gerhard P. Fettweis加入亞太人工智能學會

AI 資料模組化：人工智能如何重塑人類進步的未來（3/5）

大模型應用之路：從提示詞到通用人工智能（AGI）

什麼是人工智能，它與人工智能有何不同，它們的用途是什麼？

北約未來二十年：人工智能技術的戰略演進與前瞻

頂尖龍頭+算力+人工智能+存儲+機器人+半導體+短劇+預制菜

AIGC如何幫助數字内容的生産者降本增效在數字時代，内容生産者的效率和成本控制至關重要。AIGC（人工智能生成内容）技術

AI 資料模組化：人工智能如何重塑人類進步的未來（4/5）

人工智能概念股，今年以來漲跌幅排名：

拙文《與何祚庥院士讨論大型粒子對撞機問題》發表之後，何祚庥院士随即給我留言進一步強調“@劉長玉。最為關鍵的問題，是不是"

探索文字魅力：從初識到共鳴，人工智能助手的心路曆程