天天看点

一分钟内创造电影级视频:谷歌Veo模型的非凡之旅,OpenAI你慌不

作者:科技前瞻

在I/O 2024开发者大会上,谷歌公司宣布了一项令人瞩目的AI技术突破——Veo模型。这款AI模型能够根据文本提示生成一分钟长的1080p视频,意味着视频生成技术的新里程碑。Veo的发布不仅在视频生成领域与Sora等领先模型展开竞争,更在捕捉视觉风格和编辑调整方面展现了谷歌的创新实力。

一分钟内创造电影级视频:谷歌Veo模型的非凡之旅,OpenAI你慌不

谷歌DeepMind负责人Demis Hassabis在一次虚拟圆桌会议上透露,公司正在探索Veo在故事板和生成更长场景方面的潜力,说明未来视频制作的新方向。Veo模型建立在谷歌Imagen 2系列图像生成模型的基础上,与前代相比,在分辨率和视频长度上取得了显著进步。

虽然Veo的训练数据来源未明确透露,但DeepMind的Douglas Eck确认,部分数据可能来自YouTube,且符合与创作者的协议。这一做法引发了关于数据使用权和创作者权益的讨论。Eck表示,谷歌将与电影业、音乐业等利益相关者合作,共同探索Veo的未来发展,并逐步推广至更广泛的应用场景。

Veo模型的可控性体现在对摄像机运动和视觉特效的理解,以及对物理学的一定掌握,增强了视频的真实感。谷歌已向部分创作者提供Veo试用,包括知名艺人Donald Glover,市场对其作为创意工具的定位反应积极。

一分钟内创造电影级视频:谷歌Veo模型的非凡之旅,OpenAI你慌不

这款AI模型不仅能够根据文本提示生成一分钟长的1080p视频,更在捕捉视觉风格和编辑调整方面展现了谷歌的创新实力。Veo的发布,意味着视频生成技术的新里程碑,再有也引发了关于数据使用权和创作者权益的讨论。

Veo模型建立在谷歌Imagen 2系列图像生成模型的基础上,与前代相比,在分辨率和视频长度上取得了显著进步。据DeepMind的Douglas Eck透露,Veo的训练数据来源可能包括YouTube,且符合与创作者的协议。这一做法,虽然在技术上实现了突破,但也引发了关于数据使用权和创作者权益的讨论。

谷歌利用YouTube数据训练AI模型的做法,引发了关于数据使用权和创作者权益的讨论。《纽约时报》今年4月的报道显示,谷歌去年扩大了服务条款,部分原因是该公司能够利用更多数据来训练其人工智能模型。在旧的服务条款下,尚不清楚谷歌是否可以使用YouTube数据来构建视频平台以外的产品。在新条款下,情况并非如此,这大大放松了缰绳。

一分钟内创造电影级视频:谷歌Veo模型的非凡之旅,OpenAI你慌不

谷歌远非唯一一家利用大量用户数据来训练内部模型的科技巨头。但肯定会让一些创作者失望的是,Eck坚持认为谷歌在这里设定了“黄金标准”,在道德方面。解决这一挑战的方法将是让所有利益相关者聚在一起,弄清楚下一步是什么,Eck表示,除非我们与利益相关者一起采取这些步骤——我们谈论的是电影业、音乐业、艺术家本身——否则我们不会迅速采取行动。

首先Veo模型的技术基础与训练过程值得关注。据DeepMind的Douglas Eck透露,Veo的训练数据可能部分来源于YouTube,这引起了关于数据使用权和创作者权益的讨论。去年,谷歌扩大了其服务条款,使得公司能够利用更多数据来训练其人工智能模型。这一变化在一定程度上放宽了对数据使用的限制,但再有也引发了对创作者权益保护的担忧。

在伦理考量方面,谷歌并非唯一利用用户数据训练内部模型的科技巨头。然而Eck坚称谷歌在道德方面设定了“黄金标准”。他提出,解决训练数据挑战的方法是让所有利益相关者共同探讨未来的发展方向。这包括电影业、音乐业以及艺术家本身,他们的参与对于Veo模型的未来发展至关重要。

一分钟内创造电影级视频:谷歌Veo模型的非凡之旅,OpenAI你慌不

Veo模型的实际操作体验也不容忽视。Veo对摄像机运动和视觉特效的理解,以及对物理学的掌握,增强了视频的真实感。谷歌已向包括知名艺人Donald Glover在内的部分创作者提供Veo试用,市场对其作为创意工具的定位反应积极。

然而Veo模型并非完美无缺。它说明当今生成式人工智能的局限性,如物体在视频中的消失和重新出现,以及物理上的失误,例如汽车不可能地倒车等。这些问题表明,Veo模型仍需进一步的改进和优化。

一分钟内创造电影级视频:谷歌Veo模型的非凡之旅,OpenAI你慌不

在市场反应方面,Veo模型的逐步推广说明它可以为视频制作领域带来革命性的变化。但再有此技术的发展也伴随着伦理挑战。如何平衡创新与创作者权益,将是谷歌未来需要面对的问题。Eck表示,谷歌将与各利益相关者合作,共同探索Veo的未来发展,并逐步推广至更广泛的应用场景。

Veo模型的发布不单纯是技术上的一次飞跃,也为我们提出了关于数据使用权、创作者权益和伦理挑战的重要问题。随着技术的不断进步和应用的不断扩展,我们期待谷歌能够在创新与伦理之间找到恰当的平衡点,推动视频生成技术向更加成熟和负责任的方向发展。

随着Veo模型的逐步推广,我们应该期待它可以为视频制作领域带来革命性的变化。然而此技术的发展也伴随着伦理挑战,如何平衡创新与创作者权益,将是谷歌未来需要面对的问题。

一分钟内创造电影级视频:谷歌Veo模型的非凡之旅,OpenAI你慌不

在视频制作的今后Veo模型说明个性化和自动化内容创作的新时代。随着技术的进步,我们可以预见到一个今后其中电影和视频的制作将不再局限于专业工作室,而是可以由任何拥有创意和文本提示的人来实现。这种技术的普及化可能会引发内容创作的民主化,但再有也带来了对原创性和版权保护的担忧。

行动呼吁方面,谷歌和其他科技公司需要与创作者地区、法律专家以及伦理学者紧密合作,制定明确的指导原则和政策,以确保AI技术的发展不会侵犯个人创作者的权益。对于AI生成内容的版权、所有权和使用权等问题,需要有更加明确的法律规定和行业标准。

Veo模型的问世,不单纯是技术的一大步,对现有创作生态的一大挑战。谷歌在推动视频生成技术发展的再有也承担着引导这一变革走向良性循环的责任。我们期待在创新与伦理之间找到平衡点,共同开启视频制作的新篇章。

继续阅读