天天看点

华为的大模型终于来了!我的评价是:相当震撼

作者:速说影视一二三

在华为开发者大会 2023 上,华为不仅仅展示了盘古大模型 3.0 的强大能力,还揭开了一系列令人瞩目的成果。这次发布会的精彩纷呈,让人目不暇接。然而,其中最引人瞩目的焦点,无疑是盘古大模型 3.0 在气象预测领域的革命性突破。

盘古大模型的革命性之处在于它在气象预测中的应用。以前的气象预测主要依赖于基于2D神经网络的模型,但气象系统的复杂性使得这种方法的效果受到限制。更糟糕的是,以往的AI模型在预测过程中会积累误差,这会影响结果的准确性,因此一直未能得到广泛应用。然而,盘古大模型通过采用3DEST的三维神经网络来处理气象数据,彻底改变了这一局面。

华为的大模型终于来了!我的评价是:相当震撼

3DEST网络训练和推理策略采用了层次化时域聚合策略,从根本上减少了迭代误差,提高了气象预测的精度。举个例子,传统的AI气象预测模型在预测台风来临时,通常提前6小时进行预测,然后在这6小时内多次计算台风到达的时间。这种方法可能导致不同的计算结果,误差积累,影响了预测的准确性。而盘古大模型通过训练4个不同预报间隔的模型,分别是1小时、3小时、6小时和24小时迭代1次,根据需要选择合适的模型进行迭代。这种策略有效地减小了误差,使得天气预报迈向了一个新的水平。

华为的大模型终于来了!我的评价是:相当震撼

盘古大模型之所以如此出色,还得归功于其独特的架构。华为盘古大模型3.0采用了5+N+X的三层架构,使其能够快速应用于各个行业。这一架构巧妙地解决了AI落地行业时所面临的数据获取难题。首先,盘古的第一层L0包含了5个基础大模型,它们学习了海量的百科知识、文学作品、程序代码等文本数据,以及数十亿张带文本标签的互联网图像,为模型建立了基本认知。然后,在第二层L1中的模型让L0中的某一个基础大模型学习了N个相关行业的数据,类似于大学的本科阶段,需要选择不同的专业进行学习。最后的L2则进一步细化到某个具体的场景,类似于研究生阶段,根据不同行业的需求定制模型。

华为的大模型终于来了!我的评价是:相当震撼

华为还加入了一个反馈环节,根据他们的说法,过去开发一个GPT-3规模的行业大模型通常需要5个月,但有了这套架构,开发周期能缩短至原来的1/5。这也使得许多行业数据集较小的限制得以解决,为各行各业带来了更多可能性。

不仅如此,华为还提出了算力国产化的概念,解决了AI算力方面的短板。他们的昇腾910处理器在性能上已经超越了英伟达A100,虽然实际应用中还存在差距,但这一举措表明了华为在AI领域的决心。而与此同时,华为还提供了全套的应用套餐,使用户能够更高效地训练大模型。

华为的大模型终于来了!我的评价是:相当震撼

综合来看,华为在AI领域的布局是深刻而令人印象深刻的。他们不仅关注AI的基础研究,还积极探索如何将AI落地应用于不同的行业。华为的盘古大模型3.0和算力国产化计划,为AI行业带来了新的活力,也让人看到了AI领域未来的巨大潜力。如华为创始人任正非所言,AI领域的真正时代还在后头,我们有理由期待更多创新和突破的出现。

华为的大模型终于来了!我的评价是:相当震撼