天天看點

“比GPT-4強”!谷歌DeepMind自曝正開發新型AI模型

作者:澎湃新聞

·Google DeepMind首席執行官德米斯·哈薩比斯稱,Gemini将AlphaGo背後的技術與大語言模型相結合,目标是讓系統具有新的能力,如規劃或解決問題,比OpenAI的GPT-4能力更強。

“比GPT-4強”!谷歌DeepMind自曝正開發新型AI模型

Google DeepMind首席執行官德米斯·哈薩比斯。

不久前強強合并而成的人工智能巨頭Google DeepMind終于向ChatGPT發出實質性挑戰。

在上個月的谷歌(Google) I/O開發者大會上,谷歌公司首次透露了其正在開發的大型語言模型Gemini。據《連線》6月26日報道,DeepMind聯合創始人兼Google DeepMind首席執行官德米斯·哈薩比斯(Demis Hassabis)最近在采訪中進一步透露了Gemini的細節:該系統将AlphaGo背後的技術與大語言模型相結合,目标是讓系統具有新的能力,如規劃或解決問題,比OpenAI的GPT-4能力更強。

2016年,DeepMind開發的AlphaGo曾擊敗圍棋高手創造曆史。“你可以認為Gemini結合了AlphaGo系統的一些優勢和大模型的驚人語言能力。”哈薩比斯說,“我們也有一些新的創新,這些創新将非常有趣。”

可能會嘗試新想法

AlphaGo是基于DeepMind開創的一種叫做強化學習的技術,在這種技術中,軟體通過反複嘗試并接受關于其表現的回報,學會選擇采取何種行動以處理棘手的問題,比如圍棋或視訊遊戲。它還使用了一種叫做樹狀搜尋(tree search)的方法來探索和記憶棋盤上的可能動作。語言模型的下一個大飛躍,可能涉及讓這種技術在網際網路和計算機上執行更多任務。

哈薩比斯說,Gemini仍在開發中,這個過程将需要數月時間,可能花費數千或數億美元。OpenAI首席執行官山姆·奧特曼(Sam Altman)曾在4月透露,建立GPT-4的成本超過1億美元。

訓練像GPT-4這樣的大型語言模型,需要将來自書籍、網頁和其他來源的大量文本輸入被稱為Transformer(谷歌開發的一種深度學習模型,OpenAI在此基礎上開發了GPT)的機器學習軟體。它利用訓練資料中的規律,熟練地預測一段文本後面的字母和單詞,這種簡單的機制在回答問題和生成文本或代碼方面被證明是非常強大的。

要開發ChatGPT和類似能力的語言模型,需要一個重要的額外步驟:使用基于人類回報的強化學習來完善其性能。DeepMind在強化學習方面的深厚經驗可以讓其研究人員賦予Gemini新的能力。

哈薩比斯和他的團隊也可能嘗試用人工智能其他領域的想法來加強大型語言模型技術。DeepMind的研究人員涵蓋了從機器人到神經科學等各個領域,本周,該公司展示了一種算法,能夠學習用各種不同的機器人手臂執行操縱任務。

“比GPT-4強”!谷歌DeepMind自曝正開發新型AI模型

谷歌DeepMind的研究人員最近将人工智能與一款名為RoboCat的機器人結合起來,預計将在自我訓練機器人方面實作一大躍進。

人們普遍認為,像人類和動物那樣從世界的實體經驗中學習,對于使人工智能更有能力非常重要。一些人工智能專家認為,語言模型通過文本間接地學習世界,是一個主要的限制。

谷歌高層十分重視Gemini

Gemini是DeepMind迄今為止在該領域最有野心的項目。國外科技網站The Information在3月報道稱,受谷歌聊天機器人項目巴德(Bard)失敗的刺激,為了跟上ChatGPT的步伐,谷歌高層直接參與Gemini的研發,包括該公司最進階的人工智能研究主管傑夫·迪恩(Jeff Dean)。

Gemini的開發完成,可能會讓谷歌在與ChatGPT等生成式人工智能技術的競争中占據優勢。盡管谷歌開創了許多技術,并催生了最近的人工智能創新,但它選擇了謹慎地開發和部署産品。而到了4月,為了應對越來越激烈的競争,谷歌将其“谷歌大腦”實驗室與哈薩比斯上司的DeepMind合并為Google DeepMind。

哈薩比斯說,新團隊将結合兩個強大的人工智能團隊。“如果你看看我們在人工智能領域的地位,我會說80%或90%的創新來自這兩者之一。”哈薩比斯說。“過去十年裡,這兩個組織都取得了一些傑出的成就。”

哈薩比斯自己曾引發過一場人工智能狂熱。2014年,DeepMind被谷歌收購。在接下來的幾年裡,DeepMind展示了AI如何做到曾經看起來隻有人類才能做到的事情。當AlphaGo在2016年擊敗圍棋冠軍李世石時,許多人工智能專家都驚呆了,因為他們曾認為,機器要想熟練掌握如此複雜的遊戲,還需要幾十年。

值得注意的是,Gemini并不是DeepMind進入語言模型領域的第一次嘗試。去年,該公司推出了聊天機器人Sparrow,聲稱它比其他語言模型更不可能給出“不安全”或“不恰當”的答案。哈薩比斯今年1月在接受《時代》采訪時說,DeepMind将考慮在今年某個時候釋出Sparrow的私人測試版,目前還不清楚這些計劃是否仍在進行中。