马斯克到访中国后,特斯拉股价大涨,马斯克身价飙涨到1923亿美元,重返全球首富宝座。
财富惊人的暴涨效果,让英伟达再也按捺不住了,根据内部人士透露,英伟达CEO黄仁勋将于6月初到访中国。
市场消息称:黄仁勋此次访华,将会见腾讯、字节跳动、比亚迪、小米、理想等企业高管。其目的自然是卖他的AI芯片。
随着ChatGPT的爆火,AI产业快速发展,算力作为AI底座与基础更是需求暴涨,已经达到了10年前的30万倍。这让AI芯片龙头英伟达赚得盆满钵满。
受此影响,5月30日,英伟达股价大涨至419美元,市值突破1万亿美元,成为全球“最值钱”的芯片企业。
为了确保自身优势,进一步扩大全球市场,英伟达不断的向中国示好,CEO黄仁勋更是直言“不要低估中国芯片的实力”。
那么问题来了,英伟达会继续为中国企业提供AI芯片吗?国产AI芯片是买还是自主研发呢?
英伟达到底强在哪里?
英伟达创建于1993年1月,总部位于美国加州,是一家设计显示芯片为主的人工智能计算公司,也是GPU的发明者。
英伟达致力为游戏、娱乐、PC、云数据中心、网络、人工智能提供一流的芯片和软件服务。
英伟达究竟有多强呢?
最直观的市值对比:英伟达市值一度达到了1万亿美元(约合70800亿人民币),相当于A股的贵州茅台(2.1万亿),+工商银行(1.7万亿)+中国移动(2万亿)+宁德时代(近1万亿)。
是台积电市值的近2倍,英特尔市值的7倍,高通市值的8倍,中芯国际的16倍。也是全球“最贵”的芯片企业。
市场份额方面:英伟达在独立显卡市场占据了88%的份额,在AI 数据中心GPU领域占据了90%的份额,在全球AI市场领域,英伟达占据了80%的份额。
可以说,英伟达在游戏显卡、GPU、AI领域全面碾压英特尔、AMD。
应用场景方面:英伟达的GPU已经从单一的游戏显卡,快速渗透至人工智能、超算、量子加速、自动驾驶、互联网、光刻技术等多个领域。
未来,随着科技的快速发展,英伟达涉及的领域将越来越广,甚至会出现GPU≥CPU。
英伟达最强的是算力加持,遇到人工智能的风口,将越飞越高。
数字时代,算力为王,随着数字经济快速的发展,未来算力就是经济的基石,想要发展经济就必须夯实算力基础。
根据IDC研究报告:算力每提高1点,国家的数字经济和GDP将增加3.5%和1.8%。
当算力影响到GDP时,不要说经济学专家、芯片巨头,哪怕是普通老百姓也意识到人工智能芯片的重要性了。
然而,这些芯片的话语权,有很大一部分掌握在英伟达手中。
公开资料显示:全球前500的超算,70%使用了英伟达的GPU,最新超算使用比例达到了90%。而AI大模型更是离不开英伟达。
因此黄仁勋宣称:过去十年,摩尔定律的性能提升了100倍,而英伟达的GPU性能提升了100万倍,未来十年摩尔定律会失效,但自己的“黄氏定律”不会失效。
老黄直接将自己比肩戈登.摩尔,甚至宣称未来将是“黄氏定律”的天下,半导体领域CPU的地位也应该让给GPU。
老黄已经开始飘了,照这样发展下去,哪天老黄将挑战“牛顿定律”了。
按照黄仁勋的算法:未来十年,英伟达可以让人工智能的性能提升100万倍,让人工智能真正地觉醒。
为了让英伟达更快的扩大优势,黄仁勋还推出了一种全新的业务——“算力租赁”。
我们租房、租车、租电店面、租女友,如今我们可以租“算力”了。
举个例子:你是一家自媒体公司的老板,手下有十几个员工,每天写文章、拍视频、剪辑视频,但是产出量有限。你想提升效率,又不想招聘更多的文案员,怎么办?
使用AI大模型创造,但是通用的大模型,包括ChatGPT都无法做出高质量的文章和视频。
这就需要你自己训练一个特定的大模型,这个大模型更适合特定的领域,例如电商、历史、旅游等。
训练大模型需要庞大的算力,GPT-3训练一次的成本约为140万美元,普通企业根本承担不起,怎么办呢?租英伟达的算力,来训练自己的AI大模型。
每月3.7万美元,包含8个A100芯片,可以在云端训练ChatGPT。当然你也可以出更高的价格,体验更快的训练服务。
这种“算力租赁”的方式,可以让企业降低等待算力资源的时间,尽早介入人工智能,开展相关业务。
此外,英伟达还为芯片领域提供服务
英伟达发布了一个用2nm制造的突破性计算光刻技术——NVIDIA cuLitho计算光刻库。
芯片在设计和制造环节需要大量的计算,随着芯片制程的变小,晶体管数量的增加,传统的CPU计算方法越来越耗时。
而采用英伟达的GPU方案可以将计算速度提升40倍,大大提高了芯片设计和制造的速度。
例如,两周才能制造好的掩膜版,可以缩短至8小时。
这个方案已经吸引了制造龙头台积电、EDA龙头新思科技、光刻机龙头ASML等。
用黄仁勋的一句话说:“AI 的 iPhone 时刻已经来临!因为有了英伟达。”
英伟达继续为中国提供服务
2022年8月,英伟达接到通知,限制对中国提供用于人工智能和数据中心的顶级计算芯片。接到该通知的还有AMD何英特尔。
据悉,英伟达此次受限的产品包括 A100 和 H100 高性能GPU。
A100是是专门为无人驾驶量身打造的,蔚来、小鹏、法拉第FF 91等都采用了这款GPU。
A100采用了台积电7nm工艺,集成了540亿个晶体管,其性能也比上一代 V100 提高20倍。而且它是一块 3D 堆叠芯片,面积高达 826mm^2,GPU的最大功率达到 400W。
算力方面,A100的16位浮点算力达到312T、8位定点算力达到624T,在稀疏模式下算力可以实现翻倍。
同时,A100还支持多实例技术,可将一个A100 分割成7个独立的小型GPU,从而实现多个任务同时计算,大幅提高利用率。
H100是英伟达的杀手锏产品。
H100采用了Hopper架构,台积电4nm制造工艺,集成了800亿个晶体管,拥有18432个CUDA核心、576个Tensor核心、60MB二级缓存。
算力方面,H100 6位浮点算力达到1000T、8位定点算力达到2000T,在稀疏模式下算力可以实现翻倍。比上一代A100算力提升了3.2倍,整体性能提升了6倍。
在数据吞吐方面,H100可实现3TB/s 的显存带宽,5TB/s的互联网速度。
H100还可以拆分GPU,一个单元拆分为7个,同时进行不同的运算任务,并且可以将单个单元性能提升7倍。
H100售价达到了24万人民币,抵得上一款不错的轿车了。
按照美国的政策,我们很难购买到A100、H100,怎么办呢?英伟达想出了一个办法,那就是设计一款专门向中国供货的GPU,既符合政策要求,又能继续占领市场。
于是A800、H800诞生了,用来平替A100、H100。
A800还算良心,核心数量、单精度、双精度、显存带宽、整体算力都完整保留了下来。只是在多卡互连性能受到了影响。
A100毕竟是3年前的产品,并且明显落后于H100,如果再削弱太多的话,恐怕出货量将受到严重影响。
相比A800,H800则有点过分,H800主要将数据传输速率降低到H100速率的一半左右,这真是又要赚钱,又要限制别人,着实恶心。
在这场AI淘金热中,英伟达扮演着“铲子提供商”的角色,在某种程度上它并不在乎谁能挖到更多的金子,而是要考虑它的铲子卖的怎么样。
如果卖给美国企业“铁铲”,卖给中国企业“木铲”的话,差别太大,反而刺激中国企业大力搞自主研发,同时也会被其他铲子企业钻空子。
但是美国则不同,它要确保挖到最多、最大的金矿,因此必须要限制中国企业拿到先进的“铲子”,所以未来H800仍有可能会降低算力。
英伟达想继续为中国企业提供算力服务,而美国政府又想限制中国企业在AI领域的发展。这种政策,导致我们挥着昂贵的“破铲子”,去挖没有含金量的破石头。
如何破解这种局面呢?继续搞自主研发吧!
自主研发AI芯片究竟差在哪里?
其实国产AI芯片企业我们也有,壁仞科技、摩尔线程、景嘉微、寒武纪、燧原科技、瀚博半导体等。但是,整体与英伟达差距太大了。
侥幸有一家在算力方面突围了,却在生态和制造环节被限制了。
2022年世界人工智能大会上,上海壁仞科技发布了BR100系列AI芯片,绝对算是国产芯片的骄傲。
BR100采用了台积电7nm工艺,集成了770亿晶体管。16位浮点算力达到1000T以上、8位定点算力达到2000T以上,单芯片峰值算力达到PFLOPS级别。
BR100在算力方面可以媲美英伟达H100。
但是BR100存在两个最大的缺陷:第一、生态落后;第二、制造受限。
芯片设计由难到易依次是:手机SoC>CPU>GPU。
华为设计的麒麟系列手机SoC,已经可以媲美高通骁龙,甚至在某些方面超过了高通;而龙芯也早就研发出自主的LoongArch架构,性能方面也与英特尔差距缩小至4年。
那么相对简单的GPU设计不出来?这恐怕说不通吧!
国产GPU落后英伟达更多的是在生态方面,英伟达建立的GPU+CUDA生态模式,成为领先的关键。
CUDA平台易于编程和性能强大,同时拥有广泛而丰富的生态系统。
CUDA平台拥有可用的工具、库、应用程序和合作伙伴。
工具方面:CUDA工具包,提供了使用C/C++编程语言的开发环境,同时,还提供了一个PGI工具包来使用Fortran语言编程。
库方面:库可以优化计算架构、提高软件质量、节省程序开发时间,加速GPU。
英伟达提供了一个名叫CUDA-X的库,支持跨领域的加速下降,如线性代数、图像和视频处理、深度学习和图形分析。
众多合作伙伴也为英伟达平台贡献了许多库。
英伟达的合作伙伴众多,除了ARM、台积电、英特尔、三星、新思科技这类芯片巨头,还有亚马逊、FaceBook、百度、阿里、腾讯等互联网巨头。
如今在A股上,一旦攀上英伟达,股价就会狂飙。
英伟达实在太强大,国内AI芯片企业就是被卡在生态上,导致发展缓慢。
制造方面:
优秀的芯片基本都是由台积电代工的,苹果A系列、高通骁龙、华为麒麟、英伟达A、H皆是如此。
所以,即便你设计出了强大的AI芯片,依然要拿到台积电的代工资格。
众所周知,华为被列入实体清单后,就失去了台积电的代工资格。如果有一家中国企业达到了英伟达的水平,影响到老美的利益,它还会拿到代工资格吗?
内地中芯国际的水平落后台积电3代,这还是在使用进口设备的前提下,根本无法满足先进AI芯片的代工需求。
所以说,内地芯片企业不是设计不出先进的AI芯片,而是无法突破生态和制造。
写到最后
本月,也许是明天,或者下周,黄仁勋就会访问中国,届时会大谈如何为中国企业服务,如何保证供应中国先进的AI芯片。
同时对内地企业、政府展开攻关,以保证在中国市场的利益。
但是,英伟达保证的供应是建立在遵守美国意愿的前提下,在确保中国AI落后的前提下,在确保国产AI芯片无法超越的前提下。
如果,你想继续被他人“卡脖子”,就请接受黄仁勋的建议吧!别忘了5月29日,黄仁勋还说:“中国有很多GPU(图形芯片)的初创公司,不要低估中国在芯片领域的追赶能力。”
我是科技铭程,欢迎共同讨论!