人工智能的學習能力到底有多驚人,
我們可以通過OpenAI開發的,一個基于人工智能的實驗項目多智能體捉迷藏(Multi-Agent Hide and Seek)初窺門徑。
這是項目主要是為了研究多個智能體在一個虛拟環境中進行協作和競争的能力。
首先測試者建立了一個虛拟環境,包括一個迷宮般的場景,有牆壁、障礙物和隐藏點。在這個環境中,放置兩組智能體:人和鬼。
紅色的是人,藍色的是鬼。
人的目标是盡快找到并“捉住”所有鬼,而鬼的目标是盡可能長時間地躲避被人捉住。
使用強化學習算法,智能體們開始進行訓練。
一開始人非常容易就能捉到鬼,
不過經過數百萬個回合的學習後,
鬼根據回報資訊不斷調整自己的政策,
突然在某一次遊戲中,他們學會了将箱子移動到入口處并上鎖,
箱子一旦上鎖之後就不能移動了,以此鬼為自己制造了一個封閉的環境,
人就進不來了,
于是鬼終于找到了第一個赢得遊戲的政策。
随着遊戲的繼續進行,又是數百萬個回合的演進後,
人通過使用不同的算法和調整政策終于找到了一個突破口,
他們發現可以把斜坡當梯子使用,
于是人學會了從斜坡上翻牆,
跳進牆裡去抓鬼,
扮演鬼的人工智能隻能繼續尋找赢的辦法。
很快他們就有了新方案,
拿走人使用的斜坡工具,
于是在封閉屋子前,
他們先把斜坡搬到了自己的屋子裡,
然後再封閉大門,
這樣人就又無法進入到屋子裡了。
為了增加挑戰性,
測試者把兩方放到了更加開放的環境中,
同時給了他們更多的道具進行挑戰。
一開始,鬼很容易就被人找到,随着遊戲的不斷重複,他們漸漸學會了用木闆做一個圍牆,把自己圍在裡面,同時為了防止人使用斜坡,他們提前把斜坡上鎖,看似無懈可擊的計劃,竟不曾想到人竟然學會了新技能,他們把箱子推到了斜坡的邊上,然後利用斜坡上箱子,接着又控制箱子漂移到圍牆的邊上,就這樣,人再次翻過圍牆抓到了鬼。
這是一個突破了人類想象力的創新,誰也想不到人工智能竟然會用箱子搞漂移,這讓所有的測試人員都驚呆了。
在這個多智能體捉迷藏項目中,智能體們通過與環境的互動和對抗來不斷優化自己的行為。他們通過試錯和适應來提高自己的政策,進而在多智能體捉迷藏的遊戲中表現出更加智能和協作的行為。這個過程展示了智能體學習和進化的能力。
不敢想象如果讓他們這樣持續不斷的學習下去,人工智能最終會進化到什麼地步,又是否會代替人類甚至消滅人類。