天天看點

一分鐘内創造電影級視訊:谷歌Veo模型的非凡之旅,OpenAI你慌不

作者:科技前瞻

在I/O 2024開發者大會上,谷歌公司宣布了一項令人矚目的AI技術突破——Veo模型。這款AI模型能夠根據文本提示生成一分鐘長的1080p視訊,意味着視訊生成技術的新裡程碑。Veo的釋出不僅在視訊生成領域與Sora等領先模型展開競争,更在捕捉視覺風格和編輯調整方面展現了谷歌的創新實力。

一分鐘内創造電影級視訊:谷歌Veo模型的非凡之旅,OpenAI你慌不

谷歌DeepMind負責人Demis Hassabis在一次虛拟圓桌會議上透露,公司正在探索Veo在故事闆和生成更長場景方面的潛力,說明未來視訊制作的新方向。Veo模型建立在谷歌Imagen 2系列圖像生成模型的基礎上,與前代相比,在分辨率和視訊長度上取得了顯著進步。

雖然Veo的訓練資料來源未明确透露,但DeepMind的Douglas Eck确認,部分資料可能來自YouTube,且符合與創作者的協定。這一做法引發了關于資料使用權和創作者權益的讨論。Eck表示,谷歌将與電影業、音樂業等利益相關者合作,共同探索Veo的未來發展,并逐漸推廣至更廣泛的應用場景。

Veo模型的可控性展現在對錄影機運動和視覺特效的了解,以及對實體學的一定掌握,增強了視訊的真實感。谷歌已向部分創作者提供Veo試用,包括知名藝人Donald Glover,市場對其作為創意工具的定位反應積極。

一分鐘内創造電影級視訊:谷歌Veo模型的非凡之旅,OpenAI你慌不

這款AI模型不僅能夠根據文本提示生成一分鐘長的1080p視訊,更在捕捉視覺風格和編輯調整方面展現了谷歌的創新實力。Veo的釋出,意味着視訊生成技術的新裡程碑,再有也引發了關于資料使用權和創作者權益的讨論。

Veo模型建立在谷歌Imagen 2系列圖像生成模型的基礎上,與前代相比,在分辨率和視訊長度上取得了顯著進步。據DeepMind的Douglas Eck透露,Veo的訓練資料來源可能包括YouTube,且符合與創作者的協定。這一做法,雖然在技術上實作了突破,但也引發了關于資料使用權和創作者權益的讨論。

谷歌利用YouTube資料訓練AI模型的做法,引發了關于資料使用權和創作者權益的讨論。《紐約時報》今年4月的報道顯示,谷歌去年擴大了服務條款,部分原因是該公司能夠利用更多資料來訓練其人工智能模型。在舊的服務條款下,尚不清楚谷歌是否可以使用YouTube資料來建構視訊平台以外的産品。在新條款下,情況并非如此,這大大放松了缰繩。

一分鐘内創造電影級視訊:谷歌Veo模型的非凡之旅,OpenAI你慌不

谷歌遠非唯一一家利用大量使用者資料來訓練内部模型的科技巨頭。但肯定會讓一些創作者失望的是,Eck堅持認為谷歌在這裡設定了“黃金标準”,在道德方面。解決這一挑戰的方法将是讓所有利益相關者聚在一起,弄清楚下一步是什麼,Eck表示,除非我們與利益相關者一起采取這些步驟——我們談論的是電影業、音樂業、藝術家本身——否則我們不會迅速采取行動。

首先Veo模型的技術基礎與訓練過程值得關注。據DeepMind的Douglas Eck透露,Veo的訓練資料可能部分來源于YouTube,這引起了關于資料使用權和創作者權益的讨論。去年,谷歌擴大了其服務條款,使得公司能夠利用更多資料來訓練其人工智能模型。這一變化在一定程度上放寬了對資料使用的限制,但再有也引發了對創作者權益保護的擔憂。

在倫理考量方面,谷歌并非唯一利用使用者資料訓練内部模型的科技巨頭。然而Eck堅稱谷歌在道德方面設定了“黃金标準”。他提出,解決訓練資料挑戰的方法是讓所有利益相關者共同探讨未來的發展方向。這包括電影業、音樂業以及藝術家本身,他們的參與對于Veo模型的未來發展至關重要。

一分鐘内創造電影級視訊:谷歌Veo模型的非凡之旅,OpenAI你慌不

Veo模型的實際操作體驗也不容忽視。Veo對錄影機運動和視覺特效的了解,以及對實體學的掌握,增強了視訊的真實感。谷歌已向包括知名藝人Donald Glover在内的部分創作者提供Veo試用,市場對其作為創意工具的定位反應積極。

然而Veo模型并非完美無缺。它說明當今生成式人工智能的局限性,如物體在視訊中的消失和重新出現,以及實體上的失誤,例如汽車不可能地倒車等。這些問題表明,Veo模型仍需進一步的改進和優化。

一分鐘内創造電影級視訊:谷歌Veo模型的非凡之旅,OpenAI你慌不

在市場反應方面,Veo模型的逐漸推廣說明它可以為視訊制作領域帶來革命性的變化。但再有此技術的發展也伴随着倫理挑戰。如何平衡創新與創作者權益,将是谷歌未來需要面對的問題。Eck表示,谷歌将與各利益相關者合作,共同探索Veo的未來發展,并逐漸推廣至更廣泛的應用場景。

Veo模型的釋出不單純是技術上的一次飛躍,也為我們提出了關于資料使用權、創作者權益和倫理挑戰的重要問題。随着技術的不斷進步和應用的不斷擴充,我們期待谷歌能夠在創新與倫理之間找到恰當的平衡點,推動視訊生成技術向更加成熟和負責任的方向發展。

随着Veo模型的逐漸推廣,我們應該期待它可以為視訊制作領域帶來革命性的變化。然而此技術的發展也伴随着倫理挑戰,如何平衡創新與創作者權益,将是谷歌未來需要面對的問題。

一分鐘内創造電影級視訊:谷歌Veo模型的非凡之旅,OpenAI你慌不

在視訊制作的今後Veo模型說明個性化和自動化内容創作的新時代。随着技術的進步,我們可以預見到一個今後其中電影和視訊的制作将不再局限于專業工作室,而是可以由任何擁有創意和文本提示的人來實作。這種技術的普及化可能會引發内容創作的民主化,但再有也帶來了對原創性和版權保護的擔憂。

行動呼籲方面,谷歌和其他科技公司需要與創作者地區、法律專家以及倫理學者緊密合作,制定明确的指導原則和政策,以確定AI技術的發展不會侵犯個人創作者的權益。對于AI生成内容的版權、所有權和使用權等問題,需要有更加明确的法律規定和行業标準。

Veo模型的問世,不單純是技術的一大步,對現有創作生态的一大挑戰。谷歌在推動視訊生成技術發展的再有也承擔着引導這一變革走向良性循環的責任。我們期待在創新與倫理之間找到平衡點,共同開啟視訊制作的新篇章。

繼續閱讀