天天看点

如今,Sora已经开始尝试建构真实世界了……

如今,Sora已经开始尝试建构真实世界了……

本文作者尹烨,华大集团CEO

在美国当地时间2024年2月15日,OpenAI发布了Sora。简单理解就是,可以直接通过人工智能,由文字或者语言直接生成的视频大模型。OpenAI官方并没有单纯地把它叫做视频模型,而是称为“世界模拟器”。也就是说从这一刻,可拟合更多真实物理定律的数字孪生世界走进了人类社会。我愿意将其类比为,开启了AI发展的牛顿时代。

1894年,当北洋水师输给了日本海军,清朝的覆灭几成定局,其主因固然是综合的战斗素质,但就主力舰艇的参数来讲,它主要输在了速度上。日本海军的主力战舰,吉野号的航速达到了23节,致远舰为18.5节,而定远、镇远二舰仅仅为15节左右。

1945年,日本最大,也是人类史上最大的一级战列舰大和号,这艘满载排水量超过了7万吨的怪兽,仅仅参战数次就被轰沉。美军的航空母舰,从空中对其进行了围剿,这是一种降维打击,它输在了Z轴的维度上,而大舰巨炮的战列舰时代从此也就结束了。

两年前我的确认为扎克伯格的“元宇宙”忽悠得太早太过了,但一年多前ChatGPT出台以后,我跟很多朋友们对话都认为,这一波AI的机遇是不容错过的,应当积极拥抱技术变化,加大开放交流。

而就在正月初七的这一天,OpenAI的Sora横空出世,以Photoshop等设计软件而闻名于世的Adobe公司可能做梦也没有想到,股价会是这样一个走势。确实,如果一句话就能生成视频,美工或者视频剪辑师的前途又在哪里?正如结束方便面的,是外卖或者预制菜,而不是更好的方便面。

朋友们可以看看这些视频,在官网上都有。当我看着这一个个真假难辨的demo视频的时候,我更加清醒地明白了,我们遇到的不是一个周期,而是一个时代。周期还会回归,科技却只会呼啸而过,一个真正的、可以用真实物理定律孪生的数字世界,已经开始了它的时代。

为什么在ChatGPT3.5发布的时候,我们都觉得尚能一战呢?因为这个时候的竞争,主要依然是在语言和文本的一维层面,而Sora的到来,让我们看到了二维,乃至多维世界的模拟可能性。

虽然此时的Sora仍不完美,其依然是以二维为主的、真实世界模拟的展现。比如我们刚才看到的,这些以假乱真的视频,你仔细看,它里面都有很多的瑕疵。比如东京视频当中的左腿右腿的错误,就非常明显。但此时再去看看它的竞品,确实已经是一种石器时代的观感了。

推特上一位名叫GaborCsellev的博主,给Sora、Pika、Runway和StableVideo四个模型,输入了相同的prompt,就是提示语,那么我简单地翻译一下,他输的提示语是,“美丽而繁华的东京正在下雪,这个镜头要穿过繁忙的城市街道,跟随着几个正在享受着美丽雪景,并且在附近购物的人们,而盛开的樱花花瓣随风起舞,落英缤纷”。

我们可以看一看,这四个软件不同的生成效果,虽然漫天飘雪和樱花盛开,在真实世界当中,几乎不会同时出现。但这组简单的效果对比,我们已经足以看到,Sora性能的遥遥领先。

就怕学霸还谦虚,OpenAI在其技术报告当中,毫不掩饰地承认了它的众多不足,Sora在很多方面还不能契合真实世界的物理特性,但这有什么关系呢,谁会要求一个幼儿刚学算术,就要求他会懂方程,重要的是,他已经做好了持续学习并应用微积分的准备。

正如牛顿时代的物理建构并不完美,爱因斯坦量子力学在不断地对其补充,但1687年牛顿的《自然哲学的数学原理》一经问世,人类的科学革命由此高潮迭起。在疫情前的那几年,人类遇到了科技瓶颈的说法,不绝于耳,似乎我们已经被“智子”锁死,然而就在这短短四年,无论是生命时空组学技术的突破、mRNA疫苗的突破、可控核聚变的突破、超导材料的突破、量子计算的突破,特别是人工智能的突破,让我们又一次看到了,人类文明快速演进的可能。

如今,Sora已经开始尝试建构真实世界了……

在乐观之余,我们更要冷静地反观自身,这里面来自中国的原创贡献有多少?而在“脱钩断链”的不利大背景下,留给我们的机会和时间,真的足够吗?特朗普上台就开始打中美贸易战,打了几年发现伤敌一千、自损一千二,拜登虽然不断地被质疑身体健康有问题,尤其是脑健康问题,但不得不服气,他跟他的团队一出手就是王炸,直接打到了要害。

今天的芯片,不再仅仅只是一种电子元器件、一种商品,它是一种基础设施的提供者,如果把人类已经存在的语言、图像、音频、视频等这些资料库看成是人类文明的金矿,但是你已经有挖掘机了,我却被限制只能用铁锹,长此以往会是什么样的结果?

我们在芯片的问题上,可能犯了刻舟求剑的错误。比如总有一种声音,认为我们能够突破14纳米,甚至认为如果我们能追赶到7纳米,我们就会赢,但这个前提是我们的竞争对手就不进步了,就在原地等着。我并不是说,你追赶到14纳米、7纳米不重要,而是你要明白,竞争对手会在同样的时间,实现3纳米、2纳米,甚至1纳米。

我们可以在战略上藐视,但不能不在战术上重视,科技界、产业界、资本界,更不能揣着糊涂装明白,而我们在大模型的问题上,则可能陷入了一个概念炒作的资本套路。当下据不完全统计,国内号称有大模型的公司,已经有300多家,相信大部分还是“多小散乱”,面对GPT在简体中文的世界里,似乎尚能一战,但面对Sora的横空出世,可有一个能打的,甚至是接近的吗?

这就比如说在爬山,领先的一直在上面等你,好不容易气喘吁吁地快接近了,领先者再闲庭信步地,往上慢慢走一段,这就从心理上从体力上,不断地去消耗和打击你。

我讲这一段不是悲观,更不是长他人志气,灭自己威风,我是想说,知道落后不可怕,怕的是知道落后还不承认,那只会越拉越远。

1448年,当德国匠人古登堡发明了他的印刷术后,欧洲大量的书籍得以普及,学术思想交流加速,文学作品的范围扩大,文艺复兴开始加速,并逐渐催化出了科学革命。类似的,电报、广播、电视、互联网到移动互联网,大大加速了信息的对称,而人工智能则会以史无前例的速度,来促使人类的智力和知识平权。

在碳硅融合的重要关口,我们的科技,特别是我们的教育,又该何去何从?一味地做小镇做题家,还会有出路和未来吗?从李约瑟之问,到钱学森之问的尴尬,还要持续多久?这个问题就留给诸君共同考虑。

庄子在《齐物论》中云:“庄周梦为胡蝶,栩栩然胡蝶也,自喻适志与,不知周也……不知周之梦为胡蝶与,胡蝶之梦为周与?”刘慈欣《三体》当中,最著名的一句莫过于:“物理学不存在了。”Sora的问世,也让很多业内人士惊呼,“现实不存在了”。那么,不妨更大胆地想一步,如果我们已经可以模拟真实世界了,又焉知如今的真实世界,不是模拟的?

如今,Sora已经开始尝试建构真实世界了……

(本文仅代表作者个人观点)

继续阅读