天天看點

OpenAI下周要出什麼大招?奧特曼可能已經在這個訪談裡劇透了

OpenAI下周要出什麼大招?奧特曼可能已經在這個訪談裡劇透了

騰訊科技

2024-05-12 08:25釋出于北京騰訊新聞科技頻道官方賬号

劃重點:

  • 1

    奧特曼對全民基本收入的概念進行了研究,并探索了人工智能時代可能需要的新經濟模式。

  • 2

    OpenAI目前還未決定何時釋出GPT-5,也未決定最終名稱,緻力于確定釋出時達到高标準。

  • 3

    希望能夠開發出一個盡可能優秀的開源模型,能夠在手機上高效運作。

  • 4

    iPhone是人類曆史上制造出的最偉大的技術産品之一,想要超越必須設定更高的标準。

  • 5

    期望擁有一款始終處于激活狀态且極易使用的裝置,可以通過語音、文字,或者更理想的狀态,通過其他方式了解使用者需求。

騰訊科技訊 5月12日消息,據國外媒體報道,OpenAI首席執行官山姆·奧特曼(Sam Altman)日前參加了播客節目“All-in Podcast”。在活動中,奧特曼談到了推理計算、開源模型、正在開發中的GPT-5大語言模型、人工智能監管、後人工智能時代實施全民基本收入(UBI)、先進的智能體将如何改變我們與應用的互動方式、發生在去年年末的OpenAI“宮鬥”事件等一系列話題。

此外,周五有報道稱,蘋果即将與OpenAI合作,預計下一代移動作業系統iOS 18可能會內建ChatGPT的功能。在訪談中,奧特曼還探讨了未來可能出現的、能夠與具有人工智能功能的iPhone競争的産品可能具備哪些特征。

以下是節目内容的全文記錄。

問:我們非常榮幸地邀請到了山姆·奧特曼,一位在科技界引起轟動的創新者和企業家。讓我們把時鐘撥回到大約20年前,那時我有幸首次與奧特曼相遇。當時,他正緻力于開發一款名為Looped的本地移動應用,而這款應用後來獲得了紅杉資本的支援。我們兩人都成為了紅杉資本的天使投資人,奧特曼在那時就展現出了他非凡的洞察力,他主導了對當時還默默無聞的金融科技公司Stripe的投資,而我則對Uber進行了投資。我們共同參與的基金,以數百萬美元的投入,最終實作了超過2億美元的驚人回報。

在那段時期,奧特曼的事業軌迹轉向了創業孵化器Y Combinator,他在2014至2019年間擔任了該公司的總裁。2016年,他與合作夥伴共同創立了OpenAI,帶着一個宏偉的願景--創造能夠造福全人類的通用人工智能。2019年,奧特曼離開了Y Combinator,全身心投入到OpenAI的首席執行官角色中。到了2022年11月30日,随着OpenAI釋出ChatGPT,奧特曼的名字開始在科技界廣為人知。2023年1月,科技巨頭微軟對OpenAI進行了高達100億美元的投資。

然而,2023年11月,情況突然發生了戲劇性的變化。在短短的五天内,社交媒體上充斥着奧特曼被OpenAI董事會解雇的消息,許多人猜測他可能會加入微軟,而OpenAI這個即将實作通用人工智能技術的夢想團隊可能會是以解散。但就在幾天後,奧特曼戲劇性地重返OpenAI,再次擔任CEO。

最近的報道顯示,奧特曼正在尋求為一個人工智能晶片項目籌集高達7萬億美元的資金。此外,還有消息稱,他與蘋果前設計總監喬納森·伊夫(Jony Ive)聯手,計劃從軟銀CEO孫正義手中募集10億美元,開發一款能夠與iPhone競争的産品。自ChatGPT釋出以來,這項服務一直在不斷進步,對我們的工作方式産生了深遠的影響。據報道,ChatGPT已經成為史上使用者增長速度最快的消費級應用,僅用了兩個月時間就獲得了1億使用者。OpenAI的營收增長也同樣令人矚目,去年年底時的年化營收已經達到了20億美元。

現在,讓我們熱烈歡迎奧特曼來到“All-in Podcast”節目。

奧特曼:非常感謝!

GPT-5還沒确定釋出日期,但正在考慮采用新的釋出政策

問:業内都在迫不及待的等待着GPT-5的釋出。有報道稱,這款産品将會在今夏某時正式推出。能縮小時間範圍嗎?你們會在何時釋出GPT-5?

奧特曼:關于GPT-5的釋出時間,目前我們還沒有确定一個具體的日期。我們對新模型的推出持謹慎态度,緻力于確定它在釋出時能夠達到我們的高标準。正如您所提到的,自從GPT-4釋出以來,我們注意到模型性能的持續提升,這表明了技術進步的自然趨勢。我們相信,通過不斷的使用和優化,人工智能系統将能夠更好地服務于社會,而不僅僅是通過版本号的簡單遞增。

我們正在考慮采用一種新的釋出政策,這可能與以往的方式有所不同。我們的目标是讓人工智能技術更加普及,讓更廣泛的使用者群體能夠享受到先進的技術成果。我們認為,通過提供易于通路的人工智能工具,可以激發更多人的創新潛力,這是我們的核心使命之一。

我們對于GPT-5的命名和釋出政策仍在讨論之中,但可以肯定的是,我們緻力于讓這款新模型在釋出時能夠為使用者帶來卓越的體驗。我們将繼續關注技術的發展,并探索最佳的釋出政策,以便讓更多人受益于先進的人工智能技術。

問:這是否意味着不會有很長的訓練周期,而是持續不斷地反複訓練或訓練子模型。對于大模型,未來在架構方面會有哪些變化?

奧特曼:你可以想象是,繼續訓練正确的模型,這似乎是合理的事情。

問:剛才你談到GPT-5這次的釋出會有點不同。你是不是在想先向付費使用者釋出GPT-5;亦或是現在的安全風險還很高,你們打算先讓紅隊進行測試之後,再逐漸向使用者釋出?

奧特曼:我們非常重視讓人工智能技術變得更加普及和可及,這确實是我們的核心使命之一。目前,GPT-4主要面向付費使用者,但我們正在積極探索如何讓免費使用者也能享受到先進的技術成果。我們的理念是開發人工智能工具,并盡可能廣泛地免費提供給使用者,或者以非常低廉的成本提供服務。我們相信,這樣可以幫助人們利用這些工具去發明和創造新的事物,推動社會的進步和發展。雖然通用人工智能目前仍然是一個遙不可及的目标,但我們相信,通過不斷的創新和優化,我們可以逐漸接近這個目标。我們正在努力尋找方法,讓GPT-4這樣的先進模型能夠以免費或低成本的方式提供給更多的使用者。如果我們還沒有找到如何讓使用者免費使用GPT-4的方法,我會非常的難過。這是我們真正想做的事情。

開源、閉源都有其獨特的價值和作用,計劃未來開源更多模型

問:我認為人們經常談論着兩大因素。一是在某種程度上限制了殺手級應用發展的潛在成本和延遲。第二個因素是人們在開源環境中能夠長期開發應用,該領域的瘋狂之處在于開源社群非常狂熱。我們在一個多月前剛示範了Devin,給我們留下了非常深刻的印象。你認為開源模型在未來幾年會有什麼樣的發展?

奧特曼:關于你提到的速度和成本問題,我們非常重視這兩個因素。雖然目前我無法給出一個确切的時間表來說明何時能夠顯著降低成本,但我有信心我們能夠實作這一目标。我們緻力于減少延遲,并大幅降低成本。盡管我們仍處于對人工智能科學發展和工作原理了解的早期階段,但我們堅信通過不斷的努力和創新,我們最終能夠達到預期的目标。我們目前所有的開發工作都在穩步推進中。我們認識到,當人工智能的成本變得足夠低,以至于幾乎可以忽略不計,同時其速度變得如此之快,以至于對我們和其他使用者來說幾乎是即時的,這将是一個重大的突破。我們相信,實作這一目标将為我們自己以及所有使用者解鎖巨大的潛力。

在開源和閉源的問題上,我們認為兩者都有其獨特的價值和作用。我們已經有計劃在未來開源更多的模型,同時我們也在積極地開發通用人工智能,并探索如何廣泛地配置設定其帶來的利益。我們的這一戰略已經得到了很多人的認同,盡管它可能并不适合所有人。我們正在建構一個龐大的生态系統,其中将包括開源模型以及基于此建構的開發者社群。就我個人而言,我對開源領域特别感興趣,尤其是希望能夠開發出一個盡可能優秀的開源模型,使其能夠在手機上高效運作。目前,市場上似乎還沒有一個非常好的解決方案,但我相信這将是一項非常重要的技術進步。

問:你們何時會開發在手機上運作的開源模型?

奧特曼:我不清楚我們是否會這樣,也不清楚是否有人會這樣做。也許Llama 3或Llama 4能夠做到這些。

問:我猜測70億參數版本的Llama 3模型可能适合在手機上運作。

奧特曼:不管這個版本的Llama 3是否針對手機,但我認為它可以在手機上運作。我還不确定,我沒有體驗過它。

問:當Llama 3釋出時,許多人認為其性能已經與GPT-4相當,甚至在某些方面非常接近。OpenAI不久前剛釋出了新版本的GPT-4,而且還在開發GPT-5。鑒于開源的Devin的優異表現,OpenAI作為行業的領先者,需要采取什麼措施來維持其在人工智能領域的領先地位?

當Llama 3釋出時,許多人都認為它的表現性能已經追趕上了GPT-4。我認為Llama 3的能夠在所有方面都與GPT-4相當,但它好像已經非常接近。我的問題是,OpenAI不久前剛釋出了新版本的GPT-4,而且還在開發GPT-5。因為開源的Devin的優異表現,OpenAI如何保持對開源模型的領先地位?

奧特曼:我們的目标不僅僅是開發盡可能智能的算法權重,而是緻力于建立一個實用的智能層,供人們在各種場景中應用。在這個過程中,我們的模型雖然是核心元件,但也隻是整個智能系統的一部分。我相信OpenAI在這一領域将保持世界領先的地位,并且我們有決心維持這種優勢。要實作這一目标,我們還需要在系統周圍建構更多的基礎設施和支援工作。與其他任何企業一樣,我們必須以傳統的方式建立持久的價值。這意味着我們需要發現并堅持一個偉大的産品願景,這個願景能夠持續地為客戶提供價值。

我們正緻力于建構一個生态系統,它不僅包括先進的人工智能模型,還包括使用者界面、開發者工具、教育資源和社群支援等,以確定我們的技術能夠被廣泛地接受和有效利用。通過這樣的全面方法,我們希望能夠實作長期的成功,并在人工智能領域持續地為社會帶來積極的影響。

問:在創辦OpenAI之初,這家組織的目标就是開源,因為開源對任何一家公司來說都太重要了。後來開關就出現了,因為所有人輕而易舉的開發和使用這項技術過于為先,我們需要鎖定它。我認為這是正确的,因為憤世嫉俗的一面就像這樣。從開源走向閉源,我想知道你為何最終選擇了這樣的道路?

奧特曼:我們釋出ChatGPT的部分原因是向世界展示我們的成果。我們一直在努力傳達一個資訊:人工智能真的非常重要。回到2022年10月,當時并沒有太多人意識到人工智能的重要性或其即将帶來的影響。我們努力做這件事的一個重要部分是使人們能夠實際使用這項技術。現在,實作這一目标有多種不同的方式,我認為這确實起到了非常關鍵的作用。然而,事實上,目前許多人正在使用免費版的ChatGPT,而我們并沒有進行廣告宣傳,也沒有考慮過盈利的問題。我們推出免費版的ChatGPT,是因為我們希望人們能夠利用這些工具。我認為,這已經為人們提供了很多價值,就像是“授人以漁”。我們這麼做的原因也是為了讓人們更好地了解整個人工智能行業的發展态勢。

至于閉源戰略是否正确,目前我們還沒有标準答案。我們和其他公司一樣,也在探索中前行,并會在學習新事物的過程中多次調整政策。當我們創辦OpenAI時,我們并不清楚事情會如何發展。在我們開發出第一款語言模型之前,我們甚至還沒有開發出過任何産品。我們隻是一步步地努力探索,穩步前進。我們會繼續這樣做。

智能隻是物質的一種突現屬性,就像實體定律一樣

問:我認為你剛才在談論開源和閉源問題時是這麼說的:不管做出什麼商業決策,所有這些模型都将會變得無限接近某個準确度水準。不是全部,但比如說有四、五個模型,它們背後有足夠的資金支援,比如OpenAI、Meta、Google、微軟等等。假設有四、五個,也許還有一個初創公司,以及開源模型。然後很快,這些模型的準确性或價值可能會轉移到那些你能得到而别人得不到的專有訓練資料上,或者别人能得到而你得不到的資料上。你是這麼看待這件事的發展的嗎?開源讓每個人都達到一定的門檻值,然後就是對資料的競争,是不是這樣?

奧特曼:我絕對不認為這将變成一場關于資料的競賽,因為當模型變得足夠智能時,它們在某個點上,至少在訓練方面,将不再依賴于更多的資料。可能仍需資料來提升其實用性。在這一過程中,我學到的最重要的一課是,對于未來幾年的發展趨勢做出自信的預測是非常困難的,是以我目前不想嘗試這樣做。我确實期待世界上會出現許多卓越的模型。

在我看來,我們似乎剛剛發現了一個自然界或科學界的新事實,無論你想怎樣稱呼它,這幾乎是一種精神上的認知。智能隻是物質的一種突現屬性,它就像實體定律一樣。我相信人們将會了解這一點,但系統設計将會有多種不同的方法,人們會做出不同的選擇,并提出新的想法。我相信,就像任何其他行業一樣,人工智能領域也會出現多種不同的方法,不同的人會有不同的偏好。就像有些人喜歡iPhone,有些人喜歡安卓手機一樣,我認為人工智能模型也會呈現類似的多樣性。

問:關于成本和速度的問題。所有人工智能企業在某種程度上都有點受到英偉達産能的限制,是不是這樣?我認為你和幾乎所有其他人都已經有效地宣布了你們可以獲得的晶片數量,因為這隻是英偉達的最大産能。為了能夠更便宜、更快地計算,獲得更多的能源,需要在基礎設施層面上做些什麼,以便你們實際上可以解決這些問題。你們是如何幫助塑造整個行業解決這些問題的呢?

奧特曼:我們肯定會在算法上取得顯著的進步,我并不想低估這一點。我對晶片和能源領域非常感興趣。如果我們能夠使相同性能的模型效率提高一倍,那實際上就等于我們擁有了雙倍的計算能力,不是嗎?我相信在提升效率方面還有很多工作要做,并且我期待我們能夠真正開始看到這些成果的顯現。除了這些,整個供應鍊的複雜性不容忽視。這包括邏輯晶片的生産能力,高帶寬存儲器(HBM)的供應量,以及我們能夠以多快的速度獲得建設許可、澆築混凝土、建設資料中心,并且完成布線工作。能源的擷取也是一個巨大的瓶頸。但是,我相信,當這些技術對人們有足夠大的價值時,全世界都會采取必要的行動,我們也會努力推動這一程序加速發展。

當然,也存在一定的可能性,正如你之前提到的,如果在基礎設施方面取得重大突破,我們可能會擁有一種更加高效的計算方法。不過,我不願意過于依賴這種可能性,也不會花費太多時間去考慮它。

語音互動是通向未來互動方式的一個重要線索

問:那麼在裝置端的情況如何呢?你之前提到了能夠适配手機的模型,無論是大語言模型(LLM)還是小語言模型(SLM),我相信你肯定已經在考慮這些模型的應用。但是,裝置本身是否也會随之發生變化?這些裝置是否也會變得像iPhone那樣昂貴?

奧特曼:我對這個話題非常感興趣,并且對計算領域的創新形态充滿熱情。每一次技術的重大飛躍似乎都能開啟新的可能性。手機目前的卓越性能令人驚歎,是以要達到一個新的高度,門檻自然非常之高。我個人認為,iPhone是人類曆史上制造出的最偉大的技術産品之一。它真的是一款非凡的裝置。我之前也提到過,它已經非常出色,以至于想要超越它,我們必須設定一個相當高的标準。

問:它要麼必須設計得更加複雜,要麼實際上應該更經濟、更易于使用?

奧特曼:幾乎每個人都願意為手機花錢,是以,如果你能制造一個成本要低得多的裝置,我認為人們對于攜帶或使用第二個裝置還是有一定的抗拒感。鑒于我們大多數人都願意為手機支付費用,我不認為僅僅降低成本就是解決方案。

問:不同的(裝置)會是答案嗎?是否會存在一種專門的晶片,用來驅動手機,并且特别擅長于支援手機尺寸的人工智能模型呢?

奧特曼:很可能會有(這樣的晶片),但手機制造商肯定會朝這個方向努力。這并不一定要求我們去創造一個全新的裝置。我認為關鍵在于發掘一種真正與衆不同的互動模式,這種模式是由技術進步所催生的。如果我能知道那是什麼,我現在就會非常激動地投身于這個領域的開發。

問:不過,你們現在的應用已經具備了語音功能,實際上,我将手機上的快捷動作按鈕設定成了直接啟動ChatGPT的語音應用。我常和孩子們一起使用它,他們非常喜歡與它交流。盡管這個應用有時會出現一些延遲問題,但它真的非常出色。

奧特曼:我們将繼續改進并提升語音功能的品質。我相信語音互動是通向未來互動方式的一個重要線索。如果能夠實作真正優質的語音互動體驗,那将是一種與計算機互動的全新方式。

問:順便提一下,ChatGPT有時為何不響應,感覺就像是在使用一個收音機,确實非常煩人。但當它提供正确答案時,它同樣令人贊歎。

奧特曼:我們正在努力改進,目前它确實顯得有些笨拙,響應速度不夠快,且缺乏流暢和自然的感覺。我們緻力于讓這些方面的體驗得到顯著提升。

問:關于計算機視覺領域,是否可以這樣設想:配備有眼鏡或者佩戴一個挂墜,這樣就能将視覺或視訊資料與語音資訊相結合。通過這種結合,人工智能就能全面掌握你周圍發生的一切。

奧特曼:多模态互動的能力極其強大,例如,可以提問:“嘿!ChatGPT,我正在看什麼?”或者“我不太确定這是什麼植物。”這顯然是另一個探索方向。但關于人們是否願意佩戴眼鏡,或者在需要時舉起某個裝置來擷取資訊,我認為這涉及到許多社會和人際交往方面的複雜考量,尤其是在面部佩戴計算裝置的問題上。

問:我們見證了谷歌眼鏡的案例,曾經有人在執行任務時遭遇了身體沖突,這引發了許多問題。如果人工智能變得在每個人的手機上都無所不在,那麼可能會催生哪些應用程式呢?你有沒有預感到可能會發生什麼,或者你希望看到什麼樣的應用被開發出來?

奧特曼:我期望擁有的是一種始終處于激活狀态且極易使用的裝置,它可以通過語音、文字,或者更理想的狀态,通過其他方式了解我的需求。我設想有一個系統能夠全天候地輔助我,盡可能多地收集上下文資訊,成為世界上最出色的助理,不斷地幫助我提升自我。當讨論到人工智能的未來時,人們通常有兩種不同的觀點,它們聽起來可能頗為相似,但在系統設計的實際應用上卻有着顯著差異。一種觀點是希望人工智能成為個人的一種延伸,像一個幽靈或另一個自我,能夠代表我行動,甚至在不通知我的情況下處理郵件,它變得就像是我的一部分。另一種觀點是希望人工智能成為一個出色的進階雇員,它能夠非常了解我,我可以向它委派任務,它可以像有權通路我的電子郵件一樣了解我的需求,但我會将其視為一個獨立的實體。我個人更傾向于後者,認為這是我們未來發展的方向。在這個意義上,人工智能不是使用者的簡單延伸,而是一個始終可通路、始終卓越、能力超群的助理或高管。

智能體不隻是機械地執行指令,它能夠進行推理

問:智能體在某種程度上就像是你的代表,它能夠了解你的需求,并且預測你的意圖,這正是我對你所述内容的解讀。

奧特曼:我預期将會出現類似的智能體,但在進階雇員和智能體之間還是存在差別的。我欣賞進階雇員的一點在于他們能夠向我提供回報,有時他們可能會選擇不完全按照我的訓示行事。他們可能會告訴我,如果按照您的要求做,可能會産生這樣的後果,接着會是這樣的,然後是那樣的,你确定要這麼做嗎?智能體不隻是機械地執行指令,它能夠進行推理,是的,它具備推理能力。智能體與我之間的關系,是我所期待的那種與真正有能力的同僚之間的互動,這與那些隻會盲目遵從的人不同。

問:在這個設想的世界中,如果我們擁有像Jarvis(注:Jarvis是漫威宇宙中托尼·斯塔克的人工智能助手)這樣的進階智能體,它們将怎樣改變我們與應用程式的互動方式?這些智能體具備推理能力。這将對我們目前使用的産品界面産生哪些影響,尤其是在那些界面價值極高的應用上,比如Instacart、Uber和DoorDash等,它們并不是單純提供API接口的服務,而是直接為人們提供便利的。在這樣一個由智能體代表80億人進行互動的世界裡,我們對應用程式的工作方式和整個體驗架構的思考需要如何轉變?

奧特曼:我對打造一個既适合人類也适合人工智能使用的世界的構想非常感興趣。我青睐于這種設計的可解釋性、任務交接的流暢性,以及我們提供回報的能力。例如,DoorDash可以向我未來的人工智能助手提供一些API接口,讓助手能夠自動下單,或者我可以通過手機對人工智能助手說:“好的,人工智能助手,請幫我在DoorDash上下個訂單”,然後觀察應用如何響應,看到界面上的點選操作,如果需要,我可以即時糾正說:“嘿,不是這個選項”,或者“嗯,我想要的是那個”。

問:是以你意識到,語音互動這種方式有潛力使得傳統應用變得多餘。你隻需簡單地說出你想要壽司,它就能根據你以往的喜好來推薦你喜歡的壽司類型,同時避免那些你不喜歡的選項,并努力為你提供最佳的點餐體驗。

奧特曼:我很難想象我們完全進入一個隻需簡單地說“嘿,ChatGPT,給我訂份壽司”,然後它回應“好的,你想從哪家餐館訂?要哪種類型的壽司?什麼時間送達?”等等的世界。我相信使用者界面對于許多任務來說都是非常有用的。我很難想象一個你完全不再看螢幕,而隻依賴語音互動的世界,但我确實難以想象那樣的場景。

問:确實如此。對于許多事務來說是這樣的。比如,蘋果推出了Siri,按理說我們可以通過Siri來自動預約Uber,但我懷疑實際上很少有人這麼做。畢竟,為什麼要冒這個險呢?正如你所指出的,因為目前語音助手的服務品質還不夠高。然而,一旦服務品質足夠高,我認為人們真的會更傾向于使用語音助手,因為它更加便捷。你不需要拿出手機,不需要打開應用,不需要點選任何東西。如果遇到應用自動登出,或者需要重新登入,或者進行雙因素認證(TFA)的情況,整個過程就變得非常繁瑣和令人煩惱。

奧特曼:我明白,對于像設定計時器這樣簡單的任務,我總是使用Siri,因為它非常有效且友善,我也不需要其他額外的資訊。然而,對于像叫Uber這樣的服務,我可能想要比較幾種不同選項的價格,了解車輛距離我的實際遠近,甚至檢視司機在地圖上的實時位置,因為有時候我可能會選擇步行到某個更友善的地點。通過直接在Uber應用的界面上操作,我可以更快地擷取這些詳細資訊,這比通過語音指令來完成整個過程要高效得多。

問:我喜歡你提出的“觀看它發生“的想法,那真的很酷。

奧特曼:我認為将會有不同的界面用于不同的任務,而且我認為這種情況将會持續下去。

讓人工智能加速和改進科學發現過程,最讓我感興趣

問:在所有利用OpenAI平台開發應用和體驗的開發者中,是否有一些項目給您留下了深刻印象,它們即便還處于初期或類似玩具應用的階段,卻展現出了極具吸引力的發展潛力?或者說,是否有一些成果是你的團隊特别指出并認為具有重要意義的?

奧特曼:我今天早上遇到了一個建立的創業團隊,嚴格來說是由兩個人組成。他們計劃在夏季開展一個項目,緻力于開發人工智能導師功能。我對這一領域一直抱有濃厚興趣,盡管許多人已經在我們的平台上取得了傑出成果,但如果能夠有人實作--正如他們所形容的,這将是一次“單軌列車級别”的創新--徹底改變我們學習的方式,那将是非常令人興奮的。如果能夠找到一種新的途徑,讓人們能夠以個性化的方式探索和學習,我個人對這樣的前景感到非常激動。你之前提到的與編碼相關的許多事項,我認為這是對未來的一個非常酷的展望。我相信醫療保健是一個特别需要被徹底革新的領域。但就個人而言,我最感到興奮的是加速和改進科學發現過程的可能性。雖然GPT-4顯然還未在這方面實作重大突破,但它或許已經在一定程度上加快了程序,提升了科學家的工作效率。

問:這些模型與語言模型在訓練和建構上有所差別。雖然它們之間存在許多共同點,但也存在許多差異。這些模型中的許多都是基于一種全新的基礎架構設計的,它們專門針對特定的問題集或應用場景,例如化學互相作用的模組化。是這樣嗎?

奧特曼:确實,某些元素是必不可少的,但我認為我們目前普遍缺失的,對于我們讨論的衆多應用而言,是具備推理能力的模型。一旦模型能夠進行推理,便可以将它們與化學仿真器等工具相結合,或者用于進行預測和假設。

問:确實,我今天想探讨的一個關鍵話題是模型網絡的理念。在讨論智能體時,人們往往會想到一系列線性的函數調用,但在生物學中,我們觀察到的是系統之間複雜的網絡和互相作用。這些系統通過集合和網絡的整合作用産生結果,而不僅僅是簡單的線性調用。我們是否正處于這樣一個架構的興起之中:專業模型或網絡模型互相協作,共同解決更複雜的任務集,運用推理能力,其中一些計算模型專注于化學或算術運算,而其他模型則承擔不同的職責。這種架構避免了依賴單一的、全知全能的模型來處理所有問題。

奧特曼:我不确定推理能力最終能否成為一種廣泛适用的功能。我有這樣的預感,并且希望它是,如果真的能夠實作,那将是非常理想的。不過,我并不确定它是否真的會如此。

問:讓我們以蛋白質結構預測為例。存在大量蛋白質圖像和序列資料,研究人員利用這些資料建構了一個預測模型,并且遵循一系列流程和步驟來實作這一點。可以設想,未來可能會有一種人工通用智能或具備進階推理能力的模型,它能夠自主地建構出解決這一問題的子模型,通過搜集必要的資料并進行處理來解決蛋白質結構預測的問題嗎?

奧特曼:存在許多可能性,例如,它可能為特定任務訓練一個專門的模型;或者,它可能依賴于一個大型模型,該模型能夠識别出它所需的其他訓練資料,然後主動查詢這些資料,并據此更新自身的知識庫。

問:我想知道,是否真的所有這些初創公司都會失敗?目前許多初創公司都在采取這樣的政策:收集特定的資料,接着基于這些資料全新訓練一個模型,該模型專門針對某一任務進行優化,并且在這一任務上的表現超過了其他所有解決方案。

奧特曼:某種程度上,正如我們在讨論生物學和那些複雜的系統網絡時所指出的,我已經能夠窺見一二。我之是以會笑,是因為最近我經曆了一場嚴重的疾病,現在已大緻康複,但整個過程就像是身體系統逐一受到打擊。你真的可以明确指出,比如,這是消化系統的問題。這讓我想起了我們之前讨論的,你不知道這些系統之間互相作用的複雜性,直到出現問題,這本身是一個非常有趣的現象。同時,我嘗試使用ChatGPT來了解我的病情。我可能會說,我對某個問題不太确定。接着,我會在沒有閱讀的情況下,把相關的論文連結放入上下文中,然後發現,哦,這就是我不确定的那個問題,現在我認為應該是這樣。這就是你之前提到的一個例子,你可以說,我不知道這個資訊,然後你可以添加更多的上下文資訊,而不是重新訓練整個模型,你隻需要即時地增加上下文,然後你就能得出一個結論。

問:這些用于預測蛋白質結構的模型,比如說,構成了這個領域的基石。現在,我好奇的是,Alpha 3是否能夠處理其他分子類型的預測?如果可以,那麼理論上最好的通用模型将能夠接入、學習訓練資料,并自主解決問題。或許你可以為我們舉一個例子來闡釋這個過程。你能和我們談談Sora嗎?你的視訊模型能夠生成令人驚歎的動态圖像和視訊。你願意分享的話,能不能告訴我們它的架構有何獨特之處,以及它是如何差別于其他模型的?

奧特曼:确實,對于一般性問題,我們顯然需要專業的模拟器、連接配接器和各種資料片段等工具。我有一種直覺--盡管我得強調這并沒有科學依據--如果我們能夠了解通用推理的精髓,并将這一原理應用到新的問題領域,類似于人類的通用推理能力,我認為這是可以實作的。這可能會是一個快速的突破過程,至少我是這麼認為的。至于Sora,它并不是以語言模型為基礎,而是專門針對視訊處理而設計的模型。

問:顯而易見,我們還未能完全實作那樣的技術境界,對吧?以建構高效視訊模型為例,你們可能是從零開始,采用獨特的架構和特定的資料集進行開發。然而,展望未來,一個具備通用推理能力的系統--也就是我們所說的人工通用智能--理論上應該能夠通過自我學習和邏輯推理,掌握渲染視訊的方法。

奧特曼:我想說的是,以一個例子來看,據我所了解,目前全球最優秀的文本模型大多還是基于回歸的方法建構的。與此同時,頂尖的圖像和視訊模型則采用了擴散模型技術,這種情況在某種程度上顯得有些不尋常。

對訓練資料的使用存在差異性,暫時不會進入音樂産業

問:圍繞訓練資料的使用,存在廣泛争議。你們一直采用合理使用原則和尊重創作者權利的方式來處理問題。為何OpenAI選擇不涉足音樂産業?相較于其他公司,你們的做法顯得更加審慎。目前,你們已經建立了一些授權協定,但據我所知,你們與紐約時報的訴訟并未達成和解,我猜想這背後涉及的是訓練資料的使用問題。你們是如何看待和平衡公平使用原則的?我們在播客中對此有過激烈的讨論。你們通過簽訂授權協定的行動表明了你們追求公平的決心。對于創作美妙音樂、歌詞、書籍的藝術家的權利,你個人是如何看待的?當你們使用了他們的作品,創造了衍生産品,并将其商業化,這其中的公平性應如何定義?我們應如何建構一個世界,讓藝術家們能夠創作内容,并能夠控制他人對其作品的使用?我對你個人的看法很好奇,因為我知道你在這個問題上一直思考得很深入,而我們行業中的許多人對内容創作者的權利并沒有給予足夠的考慮。

奧特曼:我認為不同類型的情況之間存在着顯著差異。以公平使用為例,我認為根據現行法律,我們的立場是合理的。但人工智能的特殊性意味着,對于藝術等創造性工作,我們需要用新的角度來考慮這些問題。舉個例子,如果有人通過閱讀網上的數學資料學會了數學,我想大多數人會認為這是無可非議的。然而,對于其他情況,可能會有不同的看法……但為了避免回答過于冗長,我就不深入讨論了。

在我看來,人們普遍認為學習通用的人類知識,如數學定理,屬于公共領域的一部分。而另一方面,系統模仿某位藝術家的風格或創作肖像,則涉及到更為複雜的版權問題。在這兩個極端之間,存在許多不同的情況。傳統上,讨論往往集中在訓練資料上,但随着訓練資料價值的降低,我們越來越關注模型在推理時的行為,以及它如何實時地在上下文中通路和使用資訊。推理時的行為将成為新的讨論焦點,以及未來的經濟模式将如何發展。

以音樂為例,如果有人要求模型創作一首泰勒·斯威夫特(Taylor Swift)風格的歌,即使該模型從未在泰勒·斯威夫特的歌曲上進行過訓練,我們仍然面臨一個挑戰:模型可能已經了解了關于泰勒·斯威夫特的資訊和她的音樂主題。這就引出了一個問題:即使沒有直接訓練,模型是否應該被允許模仿她的風格?如果可以,那麼泰勒·斯威夫特應如何獲得報酬?在這種情況下,我認為首先應該有選擇加入或退出的機制,然後建立一個經濟模型來處理這些問題。

從音樂産業的采樣曆史中,我們可以找到一個有趣的視角,來觀察這種經濟模式是如何運作的。這雖然和人工智能創作不完全相同,但為我們提供了一個思考的起點。

問:山姆,我想對你提供的例子提出挑戰:模型通過學習歌曲結構、節奏、旋律、和聲關系等元素——這些是成就音樂成功的關鍵因素,然後利用訓練資料來創造新的音樂。這與一個人聆聽了大量音樂、吸收了這些知識,并在大腦中建構了相似的預測模型或了解的過程有何不同?這兩者之間的差異何在?你為什麼要主張藝術家應該獲得特别的報酬?這不是一個簡單的采樣案例,因為AI并沒有複制或存儲原始歌曲,而是在學習音樂的結構,不是嗎?

奧特曼:我并不是想表達那個觀點,因為我同意,就像人類從其他人類那裡獲得靈感一樣,我在說,如果你說“為我創造一首泰勒·斯威夫特風格的歌。”

問:我明白了,好的,提示語中含有某位藝術家的風格。

奧特曼:我個人認為這是兩個不同的案例。

問:你是否能夠接受這樣的情況:一個音樂模型在未向創作了這些音樂作品的藝術家支付版稅的前提下,自主地通過人類創作出的所有音樂作品庫進行訓練。接着,你不被允許提出特定藝術家的請求,而是可以這樣要求:“請為我播放一首相當現代的、關于心碎的流行歌曲,最好是女聲演唱的。”

奧特曼:我們已經決定暫時不進入音樂産業,部分原因在于圍繞如何界定使用界限的複雜問題。比如,我最近與一些我非常尊敬的音樂家會面,試圖探讨一些邊緣情況。設想一下,如果我們出資讓一萬位音樂家創作大量音樂,專門用于建構一個優質的訓練集,使我們的音樂模型能夠學習到所有關于強烈節奏結構和引人入勝的節奏的要素。如果我們僅利用這些音樂進行訓練,理論上我們仍能開發出一個傑出的音樂模型,或許我們能夠實作這一點。我曾将這作為一個思維實驗提出,音樂家們表示,到了那個階段,他們沒有原則上的反對理由。即便如此,我個人對此仍有所保留。這并不是說我們不應該這麼做,但确實存在一些考量。

問:你看到蘋果最近釋出的廣告了嗎?它将人類的所有創造力凝練在一台非常薄的iPad中。你對這有什麼看法?

奧特曼:人們對此産生了非常情感化的反應,比你想象的要強烈得多。我本人對人工智能持非常積極的态度,但我相信人類創造力和藝術表達中有些東西是非常寶貴的。對于能夠提升科學研究的人工智能,我們當然歡迎。然而,當涉及到能夠進行深刻而美妙的人類創造性表達的人工智能時,我認為我們應該審慎行事。這種技術的發展是不可避免的,它将成為幫助我們達到更高層次創造力的工具,但在這個過程中,我們應該找到一種方式,既能推動技術發展,又能保持我們所珍視的創造性精神。

一些先進的人工智能系統将有能力造成嚴重的全球性傷害

問:當讨論到人工智能的監管以及在一個由人工智能主導的世界中實施全民基本收入時,有人提倡“全面監管人工智能”。這究竟指的是什麼?你是否能夠就加州最近提出的監管提案分享一些看法?如果你願意,我們可以進一步探讨這個話題。

奧特曼:我對目前的情況有些憂慮。雖然我注意到有許多關于人工智能的監管提案正在讨論中,但就我個人所見,加州的許多提案引起了我的擔憂。同時,我普遍擔心如果每個州都獨立進行人工智能的監管工作。當讨論到“監管人工智能”時,我認為人們的想法并不統一。有些人可能主張完全禁止人工智能的發展,而另一些人則可能堅持認為人工智能應當是開源的,而不是封閉的。

我個人特别關注的是,我相信在不遠的将來,我們可能會面臨一個時刻--我得承認,這隻是一個前瞻性的聲明,做出此類預測總是伴随着風險--我的預測是,在不久的将來,一些先進的人工智能系統将有能力造成嚴重的全球性傷害。對于這些系統,我希望能有一個類似全球監管核武器或合成生物學的國際機構,來監督這些最強大系統,并確定它們經過合理的安全測試,以防止它們失控、自我遞歸改進或其他類似的風險。

問:批評的聲音指出,你擁有足夠的資源去進行遊說并與政治家建立緊密聯系,而且你已經非常積極地參與其中。然而,對于那些同樣對這一領域充滿熱情并投入資金的初創公司來說,它們可能沒有足夠的資源去進行遊說或應對監管俘獲的問題。正如風投大佬比爾·柯爾利(Bill Gurley)在去年的一次精彩演講中提到的那樣,這可能是一個值得關注的問題。也許你可以直面這個問題,并給出你的看法。

奧特曼:如果法規限定為“我們僅關注那些在價值超過10億或100億美元的計算機上訓練的模型”,我認為這是可以接受的,可以設定這樣一個标準。而且,我不覺得這樣的規定會為初創公司帶來監管上的負擔。

非常擔心監管可能會過度,GPT-4并不會構成實質性威脅

問:如果你擁有制造核武器的核材料,這通常隻限于少數人所持有,是以,可以将這種情況比作需要核檢查的類比。

奧特曼:确實,我覺得這個觀點很有趣。關于監管問題,我想補充一點,我非常擔心監管可能會過度。我相信,無論是做過了頭還是僅僅做過了一點點,我們都可能會犯錯。同樣,如果我們做得不夠,也可能出錯。但我真的認為,我們有責任也有使命去讨論我們認為可能會發生的事情,以及為了正确處理這些事情我們需要做些什麼。

問:挑戰在于,我們現有的法規本意是保護人民和整個社會,但我們正在面臨一種新類型的法規,這種法規可能會賦予政府審查代碼和商業機密的權力,這是我們以前從未遇到過的。例如,加州提出的立法和一些聯邦立法提案實質上要求聯邦政府對模型、軟體進行審計,檢查和核實模型的參數和權重。在獲得政府的認證之前,你無法将這些模型或軟體部署于商業或公共用途。對我來說,這似乎是因為人們對人工智能的了解和它潛在的影響感到恐懼,他們希望對其進行控制,而控制的一種方式就是要求在釋出前進行審計。我認為,這些立法者對人工智能的了解可能還很有限。正如你所知,甚至比任何人都清楚,随着技術的快速發展,這些法規在一年後可能就會變得不再适用。

奧特曼:我之是以提倡采取基于機構的方法來處理宏觀層面的問題,而不是将這些寫入法律,是因為我認為在12個月後,這些法律可能都會被證明是不正确的。即使這些立法者是世界級的專家,我也懷疑他們能否在12個月或24個月的時間架構内做出正确的決策。我不相信那些政策,比如我們要審查你的所有源代碼,逐一檢查你的所有權重,是的,我認為市面上有很多不切實際的提議。但是,就像飛機在獲得認證前需要經過一系列的安全測試一樣,這與閱讀你所有的代碼完全不同,我們更應該審查模型的輸出結果,而不是模型的内部細節。我想說的是,我認為進行安全測試是有意義的。

問:我們怎樣才能達到那個目标呢?我不隻是代表OpenAI,而是代表整個行業,乃至全人類發聲。我擔心,如果我們限制了那些能夠極大推動人類進步的卓越技術的發展,我們可能會讓自己回到一個類似于黑暗時代的局面。我們該如何轉變目前的情緒并實作這一目标?因為政府層面的進展太快,而許多人似乎并沒有正确處理這個問題。另外,Llama的架構決策非常有意思,它的理念是允許Llama盡可能自由地發展,同時我們還有另一個名為Llama衛士( Llama衛士)的系統,它旨在提供保護性的控制措施。你認為這種方法是否能夠正确解決問題,或者你對這個問題有何看法?

奧特曼:鑒于目前模型的能力,無疑會出現一些問題。我并不打算對這些問題輕描淡寫,也不想忽視它們的嚴重性,但對于像GPT-4這樣的模型,我個人并不擔心它們會帶來災難性的風險。我相信,對于如何安全地部署這類模型,存在着多種可行的方法。如果我們在這個觀點上達成一緻,可能會發現更多的共識。你提到的一個例子特别有趣,那就是技術上有潛力進行遞歸自我改進的模型,即便它們實際并不會被這樣使用,比如自主設計和部署生物武器,或者涉及到遞歸自我改進的新模型。

對于這些有潛在威脅的模型,我認為應該在國際層面進行安全測試。我認為GPT-4并不會構成實質性的威脅,并且有許多安全的方式來釋出這樣的模型。但你也了解,當涉及到可能導緻大量人員傷亡的情況時,比如飛機或其他許多例子,我們很樂意有一套測試架構來確定安全。當我登上飛機時,我通常不會擔心它的安全性,因為我假定它是安全的,對吧?現在,人們對此有很多不必要的擔憂。

未來可能不僅僅是關于全民基本收入,而更像是全民基本計算資源

問:關于工作的問題,你在Y Combinator的時候進行了一些測試,我想你對全民基本收入進行了一些研究,你的研究結果很快就會出來。

奧特曼:這是一項持續五年的研究項目,它現在已告一段落,或者說,這個項目實際上是五年前啟動的。項目初始階段進行了一項試驗性研究,之後則是長期的研究運作。

問:你能解釋一下為什麼決定啟動全民基本收入項目嗎?你的初衷是什麼?

奧特曼:我們在2016年開始探讨這個問題,也正是在那個時期,我們開始嚴肅地對待人工智能。我們的理論是,無論對于社會、就業、經濟,還是在更深層次上,比如社會契約的本質,可能發生的變化都是如此之大,以至于我們需要進行大量研究,探索重新組織社會結構的新方法。我也認為,我對政府在大多數旨在幫助貧困人口的政策上的做法并不十分滿意。我更傾向于相信,如果直接給人們金錢,他們能夠做出明智的選擇,市場也會相應地發揮作用。

我非常支援提高基本生活水準,減少并消除貧困,但我對于尋找一種比現有社會安全網和現行處理方式更有效的解決方案非常感興趣。我相信,金錢雖然不能解決所有問題,也不會讓人即刻感到幸福,但它可能能解決一些問題,可能為人們提供一個更好的起點,幫助他們自助,我對這樣的前景非常感興趣。現在,随着我們看到人工智能的發展方式,我在思考,是否有比傳統的全民基本收入(UBI)更好的做法。我在想,未來可能不僅僅是關于全民基本收入,而更像是全民基本計算資源。例如,每個人都可以獲得一定量的GPT-7計算能力,他們可以使用它,可以将其轉售,或者捐贈給其他人用于癌症研究等。但你所獲得的不是金錢,而是相當于一部分生産力的份額,你擁有的是生産力的一部分。

被解雇後幾小時都處于徹底的困惑狀态,董事會的意圖是真誠的

問:究竟發生了什麼事?你曾經被解雇,卻又回來了,那是一場内部的權力鬥争嗎?有沒有人背叛了你?你有沒有取得人工通用智能的突破?究竟是什麼情況?請告訴我們。

奧特曼:我遭遇了被解雇的情況,當時我在考慮是否傳回崗位,因為那時我感到非常沮喪,有些迷茫。但随後我意識到,我對OpenAI以及那裡的同僚們懷有深厚的感情,我決定要回去。我明白重返崗位将會面臨挑戰,實際上,這個過程比我預想的更加艱難,但我覺得可以應對。我同意重返OpenAI。董事會在搞清楚狀況上花費了一些時間,而在此期間,我們盡力保持團隊的完整,并繼續為我們的客戶提供服務。随後,我們開始制定新的計劃。最終,董事會決定任命另一位臨時CEO。當這位臨時CEO上任後,許多人感到驚訝,他的名字是埃米特·謝爾(Emmett Shear)?他在職的時間非常短暫。

我前一天晚上先收到了一條短信,緊接着又接到了一個電話,之後一切就變得非常混亂。我的手機幾乎變成了擺設,因為它不斷地震動,充斥着短信和來電。基本上,我就像是通過社交媒體被解雇的,這種情況在特朗普執政期間也發生過幾回。在酒店房間裡,我幾小時都處于一種徹底的困惑狀态,努力想弄清楚下一步該怎麼辦。然後事情變得非常奇怪。我大約在下午3點左右飛回家,一路上手機不停地響,電話和資訊幾乎沒有斷過。到了晚上,我和一些人面對面地見了面,我決定,好吧,我将繼續進行人工通用智能的研究,并對未來發展感到樂觀。然後第二天早晨,我和幾位董事會成員通了電話,讨論了我可能回歸的事情,這又引發了一連串的忙碌和混亂。最終,盡管中間經曆了許多瘋狂的時刻,但事情得到了解決。

OpenAI當時隻有一個非營利董事會,是以所有的董事會成員都是獨董。董事會的成員數量已經減少到了六個人。他們先是讓時任董事長兼總裁格雷格·布洛克曼(Greg Brockman)離開了董事會,随後又解雇了我。情況就是這樣。

問:我的意思是,是否在董事會中,那些隻具有非營利組織背景的成員與那些具有初創公司經驗的成員之間發生了文化沖突?如果你願意,你能否分享一些關于導緻這些決策背後的動機的資訊,或者是任何你願意透露的細節。

奧特曼:我總是認為文化沖突是不可避免的。顯然,并非所有董事會成員都是我特别喜愛的人,但我對他們對待人工通用智能的嚴肅态度以及對確定人工智能安全重要性的認識持有深深的敬意。盡管我對他們某些決策和行為持有強烈的異議--我确實有這樣的異議--但我從未對他們的誠信或對我們共同目标的承諾,也就是實作安全且有益的通用人工智能感到懷疑。

問:你是否認為他們在處理過程中做出了正确的決策,或者是否知道如何平衡所有需要妥善處理的事務?

奧特曼:我并不這麼認為。但我确實相信,他們的意圖是真誠的,他們對通用人工智能的重視以及對正确處理這項技術的承諾是認真的。

“7萬億美元”項目不是個人的項目,而是OpenAI的項目

問:我想詢問有關OpenAI的使命,其明确的目标是開發人工通用智能。這确實是一個非常有趣的目标。許多人認為,如果我們成功創造了通用人工智能,這可能會是一個意料之外的結果,甚至可能是某些事情出現了嚴重錯誤的标志,這讓他們感到非常害怕。然而,OpenAI實際上将此作為其核心使命。這樣的使命是否為您所從事的工作帶來了更多的擔憂?我了解,它同樣也能激發動力,但您是如何平衡這兩者的?您為什麼會選擇這樣的使命?

奧特曼:我首先會回答第一個問題,然後是第二個問題。我認為,人工通用智能的發展确實引起了廣泛的恐懼,這是可以了解的,因為許多人對目前的人工智能,乃至未來的AGI都感到害怕。盡管如此,他們對人工智能目前的發展感到興奮,對未來的可能性感到更加興奮,盡管這種興奮伴随着更深的憂慮。我們正在努力應對這些複雜的情感,但我認為通用人工智能的出現是不可避免的,它終将實作。我相信,盡管如此,它将帶來巨大的益處。然而,我們确實需要找到一種合理的方式來引導我們走向這一未來。将會有很多變化發生,而變化往往讓人們感到不适,是以我們需要在很多方面做出正确的決策和調整。

問:你是一位傑出的交易者。我見證了你整個職業生涯,你在交易方面的确非常出色。你擁有廣泛的人脈,而且在籌資方面技藝高超,成效顯著。你在投資界的動作,以及你所參與的公司籌集了巨額資金來建設晶片廠等事宜,所有這些都顯示了你的實力。不過,這裡稍微誇張了一點,我們都知道,你并非真的籌集了7萬億美元,那可能是某公司的市值。暫且不提這些,問題在于,盡管你完成了衆多交易,但有人對你缺乏信任,這究竟是為什麼?你的動機何在?你追求的最終目标是什麼?哪些機遇應當保留在OpenAI内部,而哪些可以歸屬于你個人?是不是因為那些非營利組織的人對你有所懷疑?

奧特曼:關于裝置公司或晶片制造公司的項目,這些并不是我個人的項目,而是OpenAI的項目。相應的,OpenAI将會獲得相關股權。我了解外界可能會有這樣的看法,尤其是那些不需要日常評論這些事務的人。這是公平的,因為我們還沒有宣布這些事項,它們尚未完成。我并不認為世界上大多數人會像你們這樣深入思考這些問題。

我也認同,這種情況确實容易引發衆多陰謀論,特别是在科技評論家中。如果能回到過去,我會更加明确地表達我持有股份的意圖,并確定這一點非常清晰。這樣,每個人都能了解,盡管如此,我依然會投身于其中,因為我深切關心通用人工智能,并相信這是全球最引人入勝的工作。至少,這樣做可以向所有人清楚地傳達晶片項目的本質。(編譯/無忌)

繼續閱讀