天天看點

【智能前線】第8期:特斯拉人形機器人發展機會,遠大于自動駕駛

【智能前線】第8期:特斯拉人形機器人發展機會,遠大于自動駕駛

2024年6月27日,摩根斯坦利釋出特斯拉研報指出,AI正在推動機器人技術變革性變化,人形機器人的發展機會,将遠大于自動駕駛汽車,采用速度更快,吸引更多資本投入,特斯拉正處于這一主題中心。

2024年6月28日,Meta創始人、CEO紮克伯格與科技創作者Robin Kallaway進行深度對話,讨論未來10年技術發展,特别是智能眼鏡、神經腕帶、AI技術在創作者與小企業中應用。紮克伯格認為,智能眼鏡将逐漸取代手機,未來AI技術将呈現多樣化,允許創作者與小企業建立定制化AI。

本期智能前線,選擇摩根斯坦利釋出特斯拉研報摘錄、紮克伯格接受Robin Kallaway專訪紀要,大師小站、有新Newin釋出,六合商業研選精校,分享給大家,Enjoy!

正文:

全文13,542字

預計閱讀27分鐘

【智能前線】第8期:特斯拉人形機器人發展機會,遠大于自動駕駛

特斯拉人形機器人Optimus Prime:Embodied AI展現式AI的投資影響

時間:2024年6月29日

來源:大師小站

字數:3,855

AI正在推動機器人技術的變革性變化,人形機器人的發展機會,将遠大于自動駕駛汽車,采用速度更快,吸引更多資本投入,特斯拉正處于這一主題中心,投資者可能需要在他們的Excel模型中新增标簽頁。

以下是摩根斯坦利最新BluePaper摘錄:《人形機器人:展現式AI的投資影響》

AI的進步,正在改變機器人行業。我們相信,Embodied AI展現式AI的采用,可能比自動駕駛車輛要快得多。

勞動力短缺與人口趨勢變化,增加在廣泛行業中的商業相關性與采用路徑,以及經濟回報期。

我們建立專有的TAM模型(總可尋址市場模型),考察勞動力動态與人形機器人的可選性,涵蓋超過830個工作分類,全球勞動市場價值30萬億美元。

我們包括了來自亞洲機器人團隊的全面競争分析與專有BotBOM,以幫助投資者思考硬體成本曲線。

爸爸,老虎寶寶通過觀察它們媽媽狩獵來學習。我9歲的兒子在家庭晚餐上宣布,它們在草地上撲躍,捕捉小鹿等小獵物來練習。

多年來,機器學習僅限于自我強化的軟體算法。大型語言模型LLMs與生成式AIGenAl的進步,使得機器人學習領域取得巨大飛躍,通過自然語言、模仿與仿真加速實體機器的學習。

GenAl正在改變機器人學習方式,讓它們有機會在實體與虛拟世界中觀察并模仿行為,通過自然語言連接配接,并在資料中心進行疊代。

就像大型語言模型LLM幫助推動ChatGPT能力不斷提升一樣,多模态模型MMM正在推動機器人技術的創新。

AI算法可以通過自動化重複任務、增強資料分析與預測能力、實作虛拟仿真,以及優化設計與測試流程,顯著縮短研發周期。

作為一個AI相鄰領域,人形硬體開發現在可以直接從增加的資本形成與對機器人主題的研發投資中獲益。

AI躍入實體/原子世界。AI無處不在,AI在聆聽你,AI看到你的臉與身體,AI知道你現在在哪裡,AI可以讀書,AI可以寫作,AI可以交談,AI可以制作戴着小牛仔帽的貓咪打卡納斯塔牌的圖檔。

除了運作大量算法與激活一些開關之外,AI很少實際移動。自然界中,運動能力是指生物體能夠獨立利用自身能量移動。化石記錄,地球上最早的運動能力追溯到前寒武紀時期細菌鞭毛,一種形狀像紡錘體的結構。現在,移動裝置與機器人之間的界限,正在逐漸變得模糊與不明顯。

為什麼我們需要人形機器人?我們有充分的理由,讓機器人采取許多高度專業化的形态機械臂、蛇形機器人、機器狗、機械塵等盡可能多的形态。

許多機器人與AI專家表示,對于人形機器人最強論點是,在一個已經為人類建立的世界中,為準備人形機器人的環境已經就緒。

英偉達創始人、CEO黃仁勳最近表示:适應世界的最簡單機器人是人形機器人,我們為自己建造了這個世界。我們也有訓練這些機器人的最多資料,我們擁有相同體型。想想人類能夠用我們雙手或使用工具執行衆多任務,以及為人類手與手指設計的衆多機器。機器人看起來像人,最重要的原因是,我們為自己建造了這個世界,工廠的工作站、工廠的生産線是為人們建立的。

界定TAM。截至2023年11月,美國勞動力約1.62億人。以平均薪資59,428美元計算,美國勞動市場每年價值接近10萬億美元。Statista資料,全球約有34億人就業。假設每個勞工年薪9千美元,全球勞動市場價值大約30萬億美元,約占全球GDP 30%。

我們預測,到2040年,理論上30萬億美元中,人形機器人累計/應用基數将達到800萬機關,影響工資3,570億美元;到2050年,将達到6,300萬機關,影響工資3萬億美元。我們的分析,目前沒有考慮人形機器人應用基數超過現有人類勞動力的情況,在某些情況下,這項技術的經濟效益可能使這成為現實。

特斯拉最近年度股東大會上,馬斯克表示他相信,人形機器人數量最終将至少是人類的2倍甚至更多:我認為人形機器人與人類比例至少将是二比一,大概是這樣,肯定至少是一比一。

也就是說,可能會有大約100億個人形機器人。也許,可能是200億、甚至300億。

2040年代,就有10億個人形機器人?根據馬斯克文章看,馬斯克近幾個月來一直專注Optimus帕洛阿爾托工程中心。特斯拉首次展示人形機器人Optimus,是在2022年9月30日。

特斯拉雙足機器人Optimus,包括28個執行器,分為兩類:

1、旋轉執行器,包括諧波減速器、球軸承與傳感器,用于肩部與肘部等旋轉動作;

2、直線執行器,包括行星滾輪、球軸承與傳感器,用于類似人類肌肉的直線運動。雙手共有12個執行器,許多更多的細節仍然保留在公司内部。

2024年1月,馬斯克表示,他預計到2040年代,将有超過10億人形機器人在運作。在特斯拉2024年6月13日年度股東大會上,他預計2025年,特斯拉至少将有1,000個Optimus機器人開始工作,事情将會從那裡迅速擴充。他認為人形機器人最終将超過人類數量,可能會達到200億或更多,未分享時間表。

一個動态、迅速變化的競争環境。除了特斯拉,數十家初創公司與成熟企業都在GenAl 2022/2023年的快速增長推動下,參與人形機器人開發。我們注意到,即使在NVIDIA 2024年3月主題演講之前,關于公司對實體AI機器人的意圖已經不言自明,AI機器人一直是MorganStanley TMT會議上一個重複主題。經過多次起伏,一系列風險投資者與公司正在押注展現式AI的前景。

2024年,人形機器人初創公司Figure AI、Agility Robotics分别在私募輪獲得26億美元與12億美元估值,更廣泛的主題吸引包括OpenAI、軟銀、老虎環球、亞馬遜、NVIDIA與微軟等主要投資者。

從汽車到消費電子等行業的主要上市公司,也在積極參與人形機器人開發,有些公司正在與人形機器人初創企業合作,探索潛在的未來用例。

機器人學正經曆ChatGPT時刻。谷歌DeepMind進階機器人學總監文森特·範霍克的說法,專家們将2年前稱為美好的舊時光。LLM與GenAl,突然将機器人學從孤立的機器人島牢固的帶入AI飛輪。LLM與GenAl科學,長期以來被視為與機器人學執行機構完全不同的世界。現在這些世界正在碰撞,影響深遠。

我們以前也見過這樣情況。1821年,法拉第通過懸挂在磁鐵上方的電線中通電,觀察電線的旋轉。這不僅标志着電能如何産生機械運動,第一個電動機的發明,還将看似無關的兩個科學領域,電與磁聯系了起來。愛因斯坦發現物質與光之間,以前從未設想的聯系e=mc^2。我們可能正處于揭開生成式AI與機器人學關系的邊緣?

網絡化集體機器人學習。想象一下,一個人形機器人站在廚房中島前,島上有一個小盤子,盤子上放着一個洋蔥,旁邊是一個削皮刀。現在想象一個大倉庫,有1,000個人形機器人,每個機器人都站在一個帶有同樣設定的廚房島旁。随着每次試錯的積累,整個群體以任何時間點最佳機器人的速度集體學習。

這種網絡化集體的聚合學習快速提升,實作團體學習的加速。當實體練習完成,表現最好的機器人,比其他999個剝洋蔥做得更好後,最佳實踐可以通過在模拟的全息宇宙中數億次試驗中的數字孿生體進一步分享與改進。

你今天見過或與機器人互動嗎?你們中的一些人可能見過,大多數在2024年夏天閱讀這篇文章的人可能沒有。這個頗具懷舊色彩的人類技術,曆史時期正在迅速過去。持續的LLM/GenAI革命,正處于早期階段,滲透到機器人學領域。

長期以來,LLM與機器人學,被視為兩個截然不同的科學領域。LLM的進步,加速在機器人的訓練與學習上可能有更多重疊。無論是汽車形狀的機器人、還是人形機器人,AI大腦正在尋找它的機器人身體。

人形機器人與自動駕駛汽車。自動駕駛車輛Avs,是相對簡單的機器人。簡單的意思是,機器人計程車隻有三個主要執行輸出:方向盤、加速踏闆角度、刹車踏闆。操作領域極其複雜,公共道路上充滿不可預測的元素。

我們相信,AVs操作環境的可變性(現實世界)與相應的安全含義(人類乘客、行人)與人形機器人的形态相比,人形機器人的商業化時間将會更快實作,後者可以在地理圍欄區域(倉庫/工廠封閉工作單元)中學習。人形機器人有更多實體輸出,自動駕駛車輛面臨的困難操作領域、安全問題與監管審查,推遲了它們采用曲線。

人形機器人采用的關鍵驅動因素:人形機器人的故事,涉及對三個主要領域的了解:AI、機器人、人。

不同階段,AI的進步多模态模型、神經網絡訓練、計算,可能比機器人學的實體科學,例如光學、執行機構、電池制造發展更快,後者可能沿着潛在非線性改進自己的路徑前進。同時,各行業與地區的勞動力因素的多個驅動因素,将顯著決定經濟回報期、采用率與社會接受度。

進階人形機器人的開發,仍處于初期階段。我們相信,過去幾年中,鄰近領域的進步, GenAI、執行器與機械、電池存儲,已被證明是人形機器人開發的重要貢獻者。這三個領域的進一步進展,将是實作人形機器人商業化的關鍵。

必須考慮一些限制因素。人形機器人的大規模商業化,必須克服一系列技術挑戰,以及廣泛的社會/政策/安全障礙。

技術方面,建立能夠駕馭人類環境的細微複雜性的人形機器人,可能需要持續的生成式AI進展,以及努力将這些先進模型專門為人形機器人量身定制。

進一步完善精密執行器、傳感器與電池容量,對于提高人形機器人可執行任務的範圍至關重要。

現代機器人學,已發展數10年,生成式Al模型的突然與快速崛起,可能會創造出心理能力超過實體能力的情況,進而開啟一系列潛在的硬體瓶頸問題,随着人形機器人變得越來越聰明,這些問題将需要解決。社會/政策/安全方面的考慮,與自動駕駛車輛AV的相關性,幫助我們了解人形機器人可能面臨的障礙範圍。

我們相信,相對公共街道,使用數字孿生體或在封閉地理圍欄工作單元中教育訓練人形機器人,為人形機器人在處理潛在安全規定方面提供相對優勢。

利用摩根士丹利亞洲工業區的優勢,從中國工業到日本工業與中國汽車供應商,我們深入了解人形機器人内部運作,分析元件成本與未來成本降低潛力。

根據我們估計,建構人形機器人的成本,可能根據配置與下遊應用而變化,從1萬美元到30萬美元不等。例如,根據主要元件供應商的價格報價與專有分析,我們估計特斯拉Optimus Gen2的目前BOM為每機關50~60k美元,不包括軟體。

規模效應幫助下,引入AI算法顯著縮短研發周期,使用來自中國成本效益高的元件,我們看到實作馬斯克目标的Optimus售價,約為2萬美元顯著成本降低的機會。

【智能前線】第8期:特斯拉人形機器人發展機會,遠大于自動駕駛

紮克伯格最新萬字洞察:資訊流媒體将更多轉向個人及AI互動,未看好這三類AI硬體類型

時間:2024年6月30日

來源:有新Newin

字數:9,587

【智能前線】第8期:特斯拉人形機器人發展機會,遠大于自動駕駛

近日,Meta CEO Mark Zuckerberg與科技創作者Robin Kallaway進行了一場深度對話,讨論未來10年技術發展,尤其是智能眼鏡、神經腕帶、AI技術在創作者與小企業中應用。

Zuckerberg詳細讨論智能眼鏡未來發展方向,認為将逐漸取代手機,成為主要的個人硬體裝置。未來智能眼鏡将分為三種類型:無顯示屏的基礎型、帶有擡頭顯示的中級型、全息顯示的進階型。

未來AI技術将不會是單一的,而是多樣化,允許創作者與小企業建立定制化AI。這種多樣化的AI體驗,将提升使用者互動的豐富性與個性化。智能眼鏡與神經腕帶将改變人們的互動方式。Zuckerberg認為,這些技術将使人們在現實世界中保持專注同時,以更自然與高效方式擷取資訊與互動。

以下是對話全文

Robin Kallaway:你能談談Meta在更廣泛AI領域的政策嗎?将會有成千上萬創作者聽到這個。他們了解AI,了解玩家,玩過一些工具,我認為聽你談談會非常有幫助。Meta AI計劃是什麼?它如何适應市場?

Mark Zuckerberg:我們方法與其他公司有很大不同,你會看到很多公司試圖建構一個主要AI供你使用。無論是Google Gemini,還是OpenAI ChatGPT。我們看法是,我們會有一個基本Meta AI助手供人們使用。我們總體觀點是,這不應該隻有一個。

我們認為人們希望與許多不同人與企業互動,需要建立許多不同AI來反映人們不同興趣。我們方法,很大一部分是讓每個創作者,最終也讓平台上每個小企業建立自己AI,以幫助他們與社群與客戶互動。

我們認為這将創造更加引人入勝的體驗,比僅使用一個單一的東西更加動态與有用,一部分是我們不是自己建構這些東西。

我們在建構底層技術,我們希望使我們正在建構的底層模型Llama 達到世界領先水準。我們想全力以赴,試圖建構完全通用的智能,建立領先的模型,我對我們進展非常滿意。

同樣重要的一部分,是為創作者與企業建構工具,使他們能夠随着時間推移建立反映他們自己的AI,創造各種不同體驗。

這就是本周AI Studio公告的内容,這是一個早期測試,在實作這一願景方面,是一個令人興奮的一步。

Robin Kallaway:這正是我想要探讨的内容,我認為這種網絡視圖,也許是單一目的,也許是多功能Agent結合在一起,為每個創作者與企業定制,這正是我認為我們未來的發展方向。

說在10年後,我們會有更多創作者并不具争議性,主流内容會更多通過創作者流動。Meta已經是今天鋪設這些軌道的主要一層,當你考慮創作者體驗的未來是什麼樣時,從戰術用例角度看,未來會是什麼樣?有什麼事情看起來,對你很有趣?

Mark Zuckerberg:首先我完全同意你的觀點。如果你看人類曆史更廣泛的軌迹,越來越多人有機會追求自己創造力與興趣,而不是做他們可能覺得單調乏味、或者僅僅為了工作的工作,我們越來越多做自己真正喜歡的事情。

很多技術的發展,是為了實作這一點,不僅通過提高其他任務生産力,還通過為人們提供各種新工具。

這絕對是未來的一部分,我們想要建構更多工具,讓更多人,包括今天不認為自己是創作者的人,每個人在某種程度上都有創造力。

就像我看到我孩子們一樣,他們不認為自己是創作者,他們肯定在玩樂高時,創造了各種不同東西。這是畢加索老話,每個孩子都是藝術家,挑戰在于長大後還能保持這種狀态。

我們要做的一部分,是建構允許每個人這樣做的工具。我看到的趨勢是什麼?在社交媒體方面,有幾個大趨勢。

一個是從基于資訊流的媒體,轉向更個人化的消息互動。比如,如果你看Instagram,私信是系統中增長最快的部分之一,這也是我對創作者工作室與AI工作室感到興奮的部分。

我們正在使人們能夠為自己AI版本建立一個角色,以幫助他們處理社群發送的所有私信。這就是經典問題,時間不夠用。

每個創作者都希望與每一個聯系他們的粉絲互動,你根本沒有時間。可能還有更多人比發送消息的人還多,想與創作者建立的内容互動。很多人可能根本不會發送消息,他們知道創作者不會有時間回複。

問題在于,創作者為自己建立的AI Agent品質有多高,這将成為一種藝術形式,會随時間推移發展與進步,會變得越來越好。

對很多人來說,知道他們在與創作者建立的東西互動,這很有意義。可能不如與創作者本人互動好,對很多人來說,這是不可得的,創作者沒有足夠時間來回應,這是一個重要部分,我們可以深入探讨這個話題。

另一個快速增長的領域是短視訊。最近有一個驚人趨勢,從電影與長篇電視節目,到人們一度認為YouTube是短視訊,人們将其與電視電影相比,今天與真正的短視訊相比,很多YouTube視訊感覺很長。

你在看YouTube視訊時,可能在做多任務,它持續了好幾分鐘。這種趨勢可能會繼續下去,人們有工具來建立非常吸引人的内容,使其非常緊湊與精練,這些工具的發展速度會繼續下去。

人們會使用AI來建立與編輯視訊,整個過程會有大量創造力,你需要精心打磨你正在建構的東西,就像雕塑一樣。

根本上說,它會變得更易獲得,内容品質會随着人們能夠嘗試更多不同想法而提高。這兩個大趨勢是消息與短視訊,這是我目前看到的兩個大趨勢。

Robin Kallaway:這種杠鈴政策,一端是超級原始、未編輯的長篇播客對話,另一端是超級精緻的短篇故事,似乎吸引力正流向這兩端。

我想讨論一下AI工作室在工具方面的情況,今天基本上是奠定基礎的階段,這是創作者如何在Meta世界與AI互動的基礎構模組化塊,今天是第一塊基礎工具。

你能談談你的政策,是如何逐漸實作的?今天釋出了什麼?為什麼你對此感到興奮?我可以分享我的回報作為測試。

Mark Zuckerberg:我們可以讨論這些戰術工具的逐漸實施,有幾條技術路徑是同時進行的。

一條是Llama 開發,底層模型的調優,這是我們在獲得回報過程中進行,這是底層核心基礎設施。在此基礎上,我們正在建立的所有産品體驗與工具,使人們能夠建立這些不同的AI。無論是創作者建立一個AI Agent版本,來與他們社群互動。

某個時候,我們還将推出讓任何人建立使用者生成内容AI的功能。不一定是你自己建立的,它可以是一個你想要在Instagram與其他應用程式上存在,并與人們互動的新虛拟角色。

今天我們可能不會詳細讨論,商業方面,小企業數量不亞于現在的創作者數量,這是一個巨大的機會。

對任何企業來說,按幾個按鈕建立一個能夠幫助你進行客戶支援與電商支援的Agent版本應該是非常簡單的,這将非常強大。

今天我們正在推出第一個測試階段,我們試圖分階段進行。我們與大約50位創作者一起啟動,将逐漸推出給一小部分人。随着我們調整這一點,可能在接下來1個月左右,我們會逐漸推出,讓更多人能夠與這些創作者建立的AI互動。也許到7月底或8月,我們會全面推出。

這将是一個非常有趣的體驗,看看人們如何喜歡與這些AI互動,以及為創作者建構工具是一個大部分。

很想聽聽你的回報,你在使用這個工具時有什麼感受,哪些地方表現良好,哪些地方需要改進。

Robin Kallaway:我很樂意分享。對我來說,作為一個創作者,我父母在俄亥俄州經營一個高爾夫球場。他們就是小企業的使用案例,他們有一個Instagram賬戶,收到很多請求,他們無法應對大量私信與消息。

我想法是,這有點像一個光譜,有事實性問題,這些問題大量湧入,我相信你也有這種經曆,很難想象,成千上萬的事實性問題。

比如,你有沒有這個連結,或者你做過這個視訊嗎,或者你襯衫從哪裡來?這些都是顯而易見的問題,隻需要克隆自己來回答,這是這個技術初步用例的驚人之處,每個小企業與創作者都會想要這個。

光譜另一端,我一直在玩的,更多是意見型問題。例如,如果有人問,如果你是我,你會如何發展你的品牌?這是一個多方面的問題,很難一口氣回答。

這也是我覺得有趣的地方,觀察AI在我與我的回應上進行訓練,并磨練它。如果我能擴充這些意見性回答,作為創作者,我目标之一是建立一對一的信任,這是我唯一關心的事情,我已經達到我能力極限。

我想到的一個問題是,事實性問題很有意義,每個粉絲都會同意他們隻想獲得資訊。在意見方面,一些粉絲會擔心AI助手,可能會使人與粉絲之間神奇的聯系去人性化。

問題是,你如何建構這些對創作者無比有用的AI工具,同時保持真實性與人性化聯系?

Mark Zuckerberg:你提到的意見型問題,更多是一種藝術形式展現。也就是說,這些東西的訓練過程。

首先是基礎Llama 模型。創作者在設定這些AI時,有機會從他們社交媒體存在與他們想要訓練系統的任何其他資訊中提取各種資訊。

事實性問題相對來說比較清晰,可以了解我們何時做對,何時沒有。意見方面,創作者會有更多意見,關于他們希望AI如何表達他們觀點。至于人們知道他們在與AI互動的那一點,這是我們核心設計原則之一,我們不想讓人們以為他們在與創作者本人互動。

我們希望它盡可能高保真反映創作者意圖,也會非常清楚标明這是AI,這樣就不會有任何混淆。當你與社群互動時,你可能會覺得可以在表達上更加自由或冒險,或者在某些可能更具風險表達上更加接近底線,你可能不希望你AI這樣做。

你可以讓它基于你社交媒體内容進行訓練,你可能希望訓練它在某些事情上保持更加謹慎,避免涉及某些話題,直到你對它能夠準确反映你的意圖有更多信心。

這些工具非常重要,這是一種藝術形式,我們在開始時不知道什麼是最具吸引力、最能建立信任的公式。我們希望提供工具,讓大家可以試驗,看看什麼最終效果最好。

Robin Kallaway:我真的很想讨論的是AI工作室未來功能創意,讓我給你一個非常酷的例子。

當你觀看這個視訊片段時,如果有人可以點選你的襯衫或我的帽子或這個燈,立即有一個AI層識别品牌與産品,自動添加到購物車,自動跟蹤返利。這種無形的層次,可以真正幫助實作貨币化。

由于基礎設施原因,每小時有數百萬個Reels被建立,今天支援這一點很困難,這可能在計劃中。還有哪些未來的AI工作室功能,是我們還沒讨論到,你認為我們在未來3~5年内可以實作?

Mark Zuckerberg:了解不同物品的功能,應該随時間推移适用所有文章,我們會達到那一點。我們在Ray-BanMeta眼鏡上有這種多模型AI早期版本,你可以說,Meta,看一下這個東西是什麼?它非常準确告訴你,我們在看什麼,并能夠回答相關問題。

随着Llama 模型不斷改進,以及我們完全推出下一版本,這隻會變得更好,這是一個大功能。還有很多類似事情,能夠自動翻譯與配音,是我對未來非常感興趣的事情。

講英語的人,常常忽視世界上很多人不講英語,能夠自動将所有内容翻譯成各種語言,使其對更多人可通路,如果能感覺到真實,并像你在說那種語言一樣,将非常強大。

這些是一些非常令人興奮的想法,這些不同于AI工作室,這是AI在内容、内容了解與内容翻譯等方面的不同應用。

對于AI工作室,将會是如何給創作者提供更多工具來調整體驗,使其更加有趣與建立信任的一種持續演進,我們還會添加不同模式。

起初是文本,随着時間推移,會有視訊、音頻,最終能讓它成為3D,這樣你就可以以全息圖形式出現在某人客廳裡,這将非常酷。我們專注元宇宙與所有具象化工作,這也是我們自然路徑,我們試圖讓創作者能夠以更自然方式與人們互動。

Robin Kallaway:我非常喜歡你提到的Agent網絡概念,我在玩這個時,我在想,這是一級,那二級會是什麼?一個例子是市場研究Agent,我試圖提出制作什麼視訊或向社群提供什麼産品或課程。

如果我有一個Agent,可以出去,并與5%觀衆進行一對一對話,挖掘他們痛點,自動完成這些事情,将非常棒。你把這些小的用例堆疊起來,突然之間,就有了一套對創作者非常有價值的Agent、AI或機器人。

Mark Zuckerberg:這是好觀點。商業環境中,這一點更清晰,企業需要客戶支援,更高一級的是能夠彙總分析,了解人們需要支援的所有事項,改進它們。對于創作者來說,也有類似版本,比如,我的社群如何喜歡與我内容互動,不同回報是什麼,我如何将這些因素納入我創作過程或商業模式中。

Robin Kallaway:我非常喜歡讨論未來所有這些用例,我們都是技術樂觀主義者,我相信幾乎所有這些技術,長遠看,都會對人類有淨效益。

有一個大問題,我肯定你也經常聽到,來自朋友、家人,我在評論區經常聽到。很多人對AI有很多恐懼與不确定性,主要是創意人士與藝術家害怕AI可能會取代他們,搶走他們工作。

我想起我的兄弟,他是出色的動畫設計師,他非常擔心,他擔心他所受教育與教育訓練,是否會變得毫無意義。

對這一群體而言,聽到像你分享關于AI驅動未來的原始想法會非常有益。這對他們來說意味着什麼?你能為他們提供一些心态或架構嗎?

Mark Zuckerberg:未來将會有比現在有更多的創意工作,你可以看一下人類軌迹,大多數人過去是農民,現在我們不需要這麼多人從事農業,人們可以追求更有創意的事情。

随着技術的發展,我們使用工具也會發展。成為一個有才華的人,關鍵在于與這些工具保持同步。根本上說,未來會有更多創意機會,伴随更強大工具,讓人們能夠做到這一點。

退一步說,我确實認為有一點讓我感到困惑的是,行業中一些人推動的叙事是,他們認為會有一個萬能AI,可以做所有事情,我不認為事情會這樣發展。

我了解,如果你在某個AI實驗室,你可能希望自己正在做的事情非常重要,你就會覺得,我們在為未來建構唯一的東西,現實情況并非如此。

這不像人們手機上的應用隻有一個,人們隻想從一個創作者獲得所有内容。人們重視多樣性,這創造了豐富性與我們在生活中學習與進步的感覺,體驗不同種類的事物。

我非常相信,未來不會隻有一個AI,會有很多不同AI,讓很多不同人能夠創造不同東西,這也是我信奉開源的部分原因。

我不認為AI技術應該被囤積,隻有一家公司可以使用它來建構他們中央産品。如果你相信最好的體驗與最好的未來,會有很多不同AI與很多不同體驗,你就希望它能在各種方式中傳播出去。

這部分是為創作者與平台使用者建構工具,使他們能夠建立自己AI,就像UGC類型的AI情況,還有所有商業内容。

另一部分是開源,這樣其他公司也可以建立不同東西,人們可以自己玩弄與修改。我有一個非常深刻的世界觀,當技術行業的人談論建構唯一AI時,我感到非常不舒服。他們好像認為自己在創造上帝,這不是我們在做的事情,我不認為事情會這樣發展。我們将在10年後,使用與今天不同的工具,就像我們今天使用的工具與10年前不同一樣,未來将會有比今天更多創意工作。

Robin Kallaway:我想到了數位相機。當時有很多攝影師,數位相機出現了,攝影的品味仍然很重要。他們隻是得到了一個更好的工具,可能用于不同的用例。我非常同意你所說的,很多公司試圖建構這種封閉的一體化平台,這對我來說也是一種打擊,這比有益更具破壞性。

Mark Zuckerberg:這不會在世界上創造更多價值,這是一個有點奇怪的意識形态,從我的角度看,我認為這不是為人們創造最佳體驗的方式。你想解鎖、釋放盡可能多的人來嘗試不同僚情,這就是文化的本質。這不是一群人壟斷一切,你希望有各種不同的想法在那裡。

Robin Kallaway:完全同意。我想回到你之前提到的Ray-BanMeta,我使用它時感到非常震驚。音頻、攝像頭品質,多模型AI的結合,遠遠超出我的預期。

我聽過你分享的一個架構,你認為像智能眼鏡這樣的裝置,可能會成為下一代手機,Quest3 VR這樣的裝置可能會成為下一代計算機與電視,這對我來說很有意義。作為一個産品建構者,我很好奇,Ray-BanMeta或智能眼鏡,還需要什麼才能讓數十億人更喜歡使用眼鏡,而不是手機作為主要硬體裝置?

Mark Zuckerberg:這是個有趣的問題。

如果你幾年前甚至1年半前問我,我會說我們需要達到全息AR水準,才能讓這成為人們使用的主要平台,我們正在努力解決這個問題。

我們從兩個不同方向回答這個問題。

對于Ray-BanMeta,我們看了一下,問自己,如果我們隻采用今天最好的眼鏡形式因素,我們能在不影響形式因素、重量等方面情況下,塞進多少技術,這就是我們得到的Ray-BanMeta。

我們從另一個角度出發,想要創造全息AR。這仍然需要是眼鏡,不是頭戴裝置,可能會有稍厚架構,你要塞入更多技術。

這不是我們擁有的原型版本,我很興奮,我們越來越接近展示它,這不是最時尚的東西,但它是好的。

它無疑是眼鏡,不是頭戴裝置。随着時間推移,這兩條路徑會逐漸融合。我以前認為我們需要全息來實作存在感,AI取得如此大飛躍,即使是一個簡單的産品也會更快吸引人。

Ray-BanMeta産品的需求,比我們預期的高得多。一方面,你喜歡看到這種情況,另一方面,我們沒有生産足夠産品,這有點令人沮喪。

它在大多數款式中已經售罄,你仍然可以買到基本的黑色款,很多人想要其他款式已經售罄。我們正在加速生産與工廠生産線,以制造更多産品。

我現在觀點是,會有很多這樣産品。我認為你可以用攝像頭、麥克風、揚聲器,以及多模态AI,創造一個很棒的體驗,即使眼鏡沒有任何顯示器。有趣的是,顯示器本身可能不會立即适合所有人,它增加了眼鏡重量,使它們變得更貴。

你可以300美元價格買到Ray-BanMeta,如果添加全息顯示器,将顯著增加成本,即使在可能實作的情況下,我們也能将其置于我們想要的形式因素中。

我仍然認為,對能負擔得起更昂貴裝置、不介意稍重的人,他們可能會想要全息功能。10年後,我們會得到真正小型全息裝置,将非常棒。

近期内,我認為很多人會更喜歡Ray-BanMeta産品。我們會繼續讓這種形式因素,随着時間推移變得越來越小,這是一個非常令人興奮的演變,基本上會有三種不同的産品。

1、無顯:沒有顯示器的眼鏡,隻能進行AI操作,捕捉内容,可以聽有聲書、音樂、接電話等。

2、非全息:非全息顯示器,意思是它不會像全息圖那樣覆寫你整個視野。它可能會有一點擡頭顯示,這會帶來很多有趣用例。可以收到通知,發送消息,與AI對話,回答問題,不僅能聽到,還能看到,這提供了更高帶寬。這會很令人興奮,有很多小螢幕的用處,即使隻是一個小小的擡頭顯示器。

3、全息:會有最頂級版本,即全視野全息顯示器,我們在未來對話中,你是坐在我客廳沙發上的全息圖,或者你在這裡,不僅是視訊通話,不僅是螢幕上的全息圖。我們可以互動,你想玩牌,我們可以有一副全息圖的牌。我們可以互動,亂搞同樣東西,你想一起創作藝術或内容,或者在白闆上畫畫,都可以做這些事情。這将非常瘋狂,這仍然是最終方向。我現在更樂觀的是,即使在我們到達那裡之前,這也将是一個大事件。

Robin Kallaway:就像托尼·斯塔克的眼鏡是最後一個用例,我聽說過你提到過一個腕帶,可以捕捉到皮下神經信号,我覺得這也很酷。

Mark Zuckerberg:是神經腕帶,神經接口腕帶。當人們聽到神經接口時,我想他們的第一個反應是,這一定是植入你大腦的東西。大多數人不想要什麼東西植入他們大腦,我同意。

你大腦通過神經系統向你身體發送信号,就是你如何激活所有肌肉的方式。事實證明,有很多不同路徑在你身體正常運作中沒有被使用。

你可以有一個腕帶,訓練它捕捉你大腦通過不同路徑傳遞的信号與方式,以不同于你通常方式移動你的手。最終會達到這樣一個程度,即使不明顯移動手,也能通過這個神經接口進行交流,它會從一些簡單的動作開始。

未來幾年,将能夠用它打字,做各種事情,控制光标,這将非常瘋狂。與眼鏡結合,将會帶來一系列非常驚人用例,即使隻是一個擡頭顯示器版本或者甚至沒有顯示器。

你可以坐在那裡,無論你在哪裡,你都可以給某人或AI發送消息。再一次,這不僅僅适用于Meta,随着時間推移,它将适用于所有不同AI,所有創作者的AI,任何你想互動的人。

你可以坐在那裡,默默、謹慎發送消息,你可以在耳邊聽到回答,或者如果你有顯示器版本,可以看到小小文字彈出,我覺得這會非常瘋狂。

對我來說,最好的一點是,我更喜歡與人面對面交流。對我來說,Zoom上小組對話的最好部分之一,是你可以有整個背後頻道,在主要會議或對話進行的同時,你還可以與一部分人聊天,有時在會議中,我有一個問題想問某人,我不想在所有人面前問,我隻能等到會議結束。

數字會議中,你可以在會議進行時,給某人發資訊,比如在WhatsApp上發消息。在面對面互動時,也能通過眼鏡做到這一點,會很棒。你可以與人互動,也可以在對話期間擷取資訊,使事情變得更加高效,這将非常強大。

Robin Kallaway:我以前低估的一點是,手機會打破你的專注。當你在用手機時,你完全在手機裡,而不是在外界。一旦你戴上眼鏡,甚至沒有擡頭顯示器,但有了它,也不會分散你的注意力,你會非常專注。你可以在現實世界中,同時以混合方式擷取資訊。這是一個非常有趣的平衡,有腕帶與眼鏡的結合。

Mark Zuckerberg:你問什麼時候這會取代手機。

技術史上,新平台通常不會完全使人們停止使用舊東西,隻是你會用得更少。很多人今天在手機上做的事情,以前會在電腦上做,更友善。你不再頻繁打開電腦,不去書桌前,你隻是直接在手機上完成。即使我坐在書桌前,我也會在手機上做很多以前10~15年前會在電腦上做的事情,眼鏡也會這樣發展。

不是說我們停止使用手機,隻是它會更多待在你口袋裡。你會在需要時拿出來,越來越多人會說,我可以用眼鏡拍照,我可以向AI提問,或者發送消息,這樣更友善。我不會感到驚訝,如果10年後我們仍然有手機,使用它們的方式會更加有意,不是僅僅為了任何技術需求,就随手拿起它。

Robin Kallaway:每隔幾年,社會就會經曆一些颠覆性的消費科技時刻。我想起第一次在Google上搜尋,第一次在Facebook上收到好友請求,或者第一次用Uber,人們幾乎能記住他們第一次經曆這些轉變的時刻。

你工作中最酷的部分之一,是你可以提前5~10年體驗颠覆性技術。我們談到眼鏡,我很好奇在未來10年Meta路線圖上,還有哪些技術,有可能成為颠覆性的消費科技時刻?

Mark Zuckerberg:我完全同意你的觀點,這是技術中最棒的部分之一。很多其他領域,你可以做同樣的事情很長時間,而在技術領域,每隔一段時間就會有一些新機會出現,你需要重新思考你在做什麼,這很令人興奮。

我不知道,我們已經讨論了很多内容。

眼鏡會是一個大事件,我們幾乎準備好開始展示全息眼鏡原型。我們不會廣泛銷售原型,而是專注建構完整的消費版本,而不是銷售原型,我們會開始向人們展示原型,這很瘋狂。我展示給每個人,他們反應都很興奮,我非常期待展示給更多人。

神經腕帶也很瘋狂,你可以通過微妙的手部動作輸入資訊,僅通過想象如何移動手。

随着時間推移,這将變得更加豐富。通常需要到第二版或第三版,這些東西才能真正調試好,人們才能了解。我們在Ray-BanMeta第二版也看到這一點,它真的大受歡迎。神經腕帶将是一個大事件,根據進展,它可能主要用于眼鏡與混合現實頭戴裝置的輸入,或者最終成為獨立的平台。你可以想象一個世界,你用神經腕帶控制家裡所有裝置或電腦,随着時間推移,這将非常酷。

AI方面,進展速度非常驚人。我們從2023年夏天Llama 2,到現在Llama 3,Llama 2不是最先進的,Llama 3接近趕上最好模型。這是開源的,向很多人開放,解鎖了很多很棒的東西。

我們開始研究Llama 4,我對此很興奮,每個版本都增加了更多模式。Llama 3有更多圖像模式與一些語音内容,Llama 4将更深入這些方面,增加一些推理能力。

這樣,當你是創作者,并在編輯某些内容時,你不需要非常較長的描述你在做什麼。你可以來回交流,嘗試不同想法,這将非常吸引人。

當它從回合制聊天機器人,轉變為你可以給出意圖,并完成更複雜任務的Agent時,這将非常酷。

我不知道,我确實認為我們在創作者AI方面開始的旅程,将是一個有趣的開始。現在很多人體驗這些AI,是通過幾個公司建構的主要AI。創作者AI與我們推出的一些商業AI,将使人們開始與更多樣化的體驗互動,這将為整個生态系統增加真正豐富性,非常棒。

Robin Kallaway:我完全同意,有時候這隻是一個新應用程式或以不同方式打包。就像我們談到的主題,從單一到多樣化。

這裡有一個有趣的問題,關于創作者方面,我想我從未聽過你回答這個問題。

你是一個非常多産的創作者,你設計自己衣服,制作音樂。我聽說過你的Mark肉品MarksMeats,還有你所有愛好。

很多創作者都會被問到一個問題,我也經常被問到,如果我要從頭開始在網上建立一個品牌或圍繞一個愛好建立品牌,我該怎麼做?我很好奇你會怎麼回答這個問題。

比如說,你隻是一個吉他手Mark,或者Mark肉品創始人Mark。你知道關于世界建構、粉絲心理學的一切知識,我們拿走所有資源。你會如何看待這個挑戰?如何作為企業家,嘗試線上上建立一個有意義的品牌?

Mark Zuckerberg:這很有趣,我們現在幾乎已經被反射性訓練去思考這些東西。

對于Mark肉品的例子,我不是想圍繞它建立一個商業,我本能從背後的故事來思考它。我們不僅是要養牛,我們試圖在夏威夷養出高品質牛,我們喂它們獨特的夏威夷果餐,我們釀造啤酒,并喂它們喝。我們垂直整合,我們種植夏威夷果樹,釀造啤酒。我發現這就是它有趣的部分,每個人都以獨特的方式做事情。

也許有一天當我退休時,Mark肉品會成為一個商業營運,現在隻是想做這件很棒的事情,讓它變得很棒的一部分,是圍繞它有一個叙述與故事。社交媒體與其他線上工具幫助人們講述這個故事,這也在某種程度上訓練我們思考事情的叙述與故事是什麼,這是一個有趣的問題。

相關研報:

【智能時代】自動駕駛:汽車iPhone時刻,中國三大流派演化形成中

諸神之戰:美國科技巨頭,從春秋五霸進入戰國七雄|GBAT 2023 大灣區智能時代産業峰會

人類未來文明三部曲之二:智能時代專題預售開啟,奇點臨近,未來已來

九宇資本趙宇傑:智能時代思考,認知思維,存在原生、降維、升維三波認知紅利

九宇資本趙宇傑:智能時代思考,以史為鑒,科技浪潮,從網際網路到AI

九宇資本趙宇傑:智能時代思考,宇宙視角,從碳基生物,到矽基智能體

人類未來文明三部曲之一:元宇宙專題預售開啟,59期45萬字

九宇資本趙宇傑:1.5萬字頭号玩家年度思考集,科技創新,無盡前沿

九宇資本趙宇傑:1.5萬字智能電動汽車年度思考集,軟體定義,重塑一切

【重磅】前沿周報:擁抱科技,洞見未來,70期合集打包送上

【重磅】六合年度報告全庫會員正式上線,5年多研究成果系統性傳遞

【智能電動汽車專題預售】百年汽車産業加速變革,智能電動汽車時代大幕開啟

【頭号玩家第一季預售】:科技巨頭探索未來,頭号玩家梯隊式崛起

【頭号玩家第二季預售】:科技創新帶來範式轉換,拓展無盡新邊疆

【首份付費報告+年度會員】直播電商14萬字深度報告:萬億級GMV風口下,巨頭混戰與合縱連橫

【重磅】科技體育系列報告合集上線,“科技+體育”深度融合,全方位變革體育運動

【重磅】365家明星公司,近600篇報告,六合君4年多研究成果全景呈現

九宇資本趙宇傑:CES見聞錄,開個腦洞,超級科技巨頭将接管一切

【萬字長文】九宇資本趙宇傑:5G開啟新周期,進入線上世界的大航海時代|GBAT 2019 大灣區5G峰會

九宇資本趙宇傑:抓住電子煙這一巨大的趨勢紅利,抓住産業變革中的變與不變

【IPO觀察】第一季:中芯國際、寒武紀、思摩爾、泡泡瑪特、安克創新等11家深度研報合集

【IPO觀察】第二季:理想、小鵬、貝殼、螞蟻、Snowflake、Palantir等12家公司深度研報合集

【IPO觀察】第三季:Coinbase、Roblox、快手、霧芯科技等12家公司深度研報合集

【重磅】年度觀察2019系列合集:曆時3個多月,超20萬字近500頁,複盤過去,展望未來,洞悉變與不變

【珍藏版】六合寶典:300家明星公司全景掃描,曆時3年,210萬字超5,000頁,重磅推薦

九宇資本趙宇傑:對智能電動汽車産業的碎片化思考

九宇資本趙宇傑:九宮格分析法,語數外教育教育訓練領域的道與術

【2023回鄉見聞錄】90、00後小夥伴們萬字記錄,生活回歸正軌,春節年味更濃

【2022回鄉見聞錄】20位90、00後2萬字,4國13地,全方位展現國内外疫情防疫、春節氛圍、發展現狀差異

【2021回鄉見聞錄】22位90後2萬字,就地過年與返鄉過年碰撞,展現真實、立體、變革的中國

【2020回鄉見聞錄】20位90後2萬字,特殊的春節,時代的集體記憶

【重磅】22位“90後”2萬字回鄉見聞錄,講述他們眼中的中國縣城、鄉鎮、農村

六合君3周歲生日,TOP 60篇經典研報重磅推薦

下午茶,網際網路世界的三國殺

5G助推AR開啟新産業周期,AR眼鏡開啟專用AR終端時代

新商業基礎設施持續豐富完善,賦能新品牌、新模式、新産品崛起,打造新型多元生活方式

【重磅】中國新經濟龍頭,赴港赴美上市報告合輯20篇

知識服務+付費+音頻,開啟内容生産新的産業級機遇,知識經濟10年千億級市場規模可期

從APP Store暢銷榜4年更替,看内容付費崛起

新三闆破萬思考:新三闆日交易量10年100倍?

九宇資本趙宇傑:科技改變消費,讓生活更美好|2017 GNEC 新經濟新消費峰會

九宇資本趙宇傑:創業時代的時間法則,開發使用者平行時間|2016 GNEC 新經濟新智能峰會

九宇資本趙宇傑:網際網路引領新經濟,内容創業連接配接新生态|2016 GNEC 新經濟新營銷峰會

請務必閱讀免責聲明與風險提示

【智能前線】第8期:特斯拉人形機器人發展機會,遠大于自動駕駛

繼續閱讀