天天看点

大模型时代,创业厂商或中小型企业如何把握风口?

作者:你的沉默吵到我了

Meta旗下备受瞩目的Llama 3大模型本周正式亮相,其超4000亿的最大参数规模和15万亿的训练token规模震撼业界。与GPT-3.5对比,Llama 3在人类评估测评中胜率超六成,被誉为“地表最强开源模型”。

当前,大模型发展正处关键转折点,摩根士丹利报告指出,我们正迎来由软硬件共同推动的大模型能力快速增长新时代。然而,大模型训练所需算力前所未有,开发成本剧增,对科技巨头而言也是巨大挑战,创业厂商或中小企业更难涉足。

此外,芯片电力供应和AI技术壁垒的增加也构成大模型领域的进入障碍,中小企业恐难与巨头竞争。因此,摩根士丹利看好谷歌、Meta、亚马逊和微软等大型科技公司,它们在大模型发展中有望占据主导。同时,创业厂商或可通过发展成本更低的小模型寻找新机遇。

大模型时代,创业厂商或中小型企业如何把握风口?

大模型时代,创业厂商或中小型企业如何把握风口?

未来算力需求迅猛增长,英伟达Blackwell芯片或成关键引擎?

摩根士丹利报告揭示,大模型技术飞速发展,算力需求呈指数级跃升。英伟达Blackwell芯片以其卓越性能,成为引领这一增长的关键引擎。

GPT系列模型算力需求逐年攀升,GPT-4已消耗大量时间、资源,使用数万GPU处理庞大token数据。随着GPT-5等后续模型亮相,算力需求将进一步飙升。

超级计算机成为大模型训练重要工具。摩根士丹利预测,未来十年内,超级计算机为大模型开发提供的算力将比当前高出千倍。Blackwell芯片以其强大性能,助力实现这一飞跃。

采用Blackwell芯片的超级计算机能大幅缩短大模型训练时间,提升算力效率。这一变革将加速大模型技术发展,推动人工智能领域整体进步。

随着GPT系列模型不断演进,其算力需求将持续增长,占据英伟达芯片年销售额显著份额。英伟达将加大芯片研发和创新投入,满足未来算力需求。

未来算力增长将为大模型技术发展提供强大支持。英伟达Blackwell芯片作为关键引擎,将推动大模型训练效率提升,加速人工智能领域进步。期待英伟达未来推出更多创新产品,引领算力增长新时代。

大模型时代,创业厂商或中小型企业如何把握风口?

大模型时代,创业厂商或中小型企业如何把握风口?

科技巨头成大模型时代最大赢家?

大模型时代正蓬勃兴起,但背后的开发与训练却充满挑战,如资本投入、芯片供应、电力需求及软件开发能力等。这些挑战形成高门槛,让科技巨头独占鳌头。

摩根士丹利深入剖析了谷歌、Meta、亚马逊和微软在2024年的数据中心资本支出。超级计算机投入巨大,仅1吉瓦的设施就需300亿美元,更大规模的更是高达千亿。

预测显示,这四家超大规模计算公司将在未来两年迎来资本支出的爆发式增长,预计2024年和2025年分别达约1550亿美元和超过1750亿美元。小企业难以望其项背。

因此,摩根士丹利看好这四家公司的前景,认为它们将直接受益于算力增长。凭借雄厚的资本和技术实力,它们能克服大模型开发和超级计算机训练的挑战。机构给予它们增持评级,预示着它们将在大模型时代中继续领先,成为真正的赢家。

创业厂商的机会在哪里?

大模型时代,科技巨头虽占主导,但小公司亦有机可乘。摩根士丹利指出,小模型开发成本较低,为创业厂商提供了发展机会。小模型在特定行业领域能发挥重要作用,实现显著效益。

创业厂商可关注行业需求,开发符合特点的模型,提供定制化解决方案。其灵活性和专注力使中小企业能迅速响应市场变化。此外,随着大模型技术的普及和算力成本降低,创业厂商可利用先进技术提升产品和服务,与科技巨头合作,进行数据分析、预测和优化,提升竞争力。

比如作为AI准独角兽和超自动化头部企业,实在智能自研的垂直大模型TARS(塔斯)在国内大模型各类榜单名列前茅,具备“效果可用、成本可控、定制化训练、私有化部署”等差异化优势;在全行业首发可“一句话生成数字员工”的实在 AI Agent智能体产品,既是个人用户的AI助理,也是政企员工的办公助手,实现“你说PC做,所说即所得”

在实际应用中,实在Agent能够模拟并超越人工操作,不仅执行基于规则的重复任务,而且能够处理更复杂的决策过程,例如在银行贷款审核流程中识别潜在风险、解读非结构化数据,以及跨系统跨平台的数据同步整合。

大模型时代,创业厂商或中小型企业如何把握风口?

大模型时代,创业厂商或中小型企业如何把握风口?

因此,中小企业不必因科技巨头的主导地位而气馁。相反,应积极寻找发展机会,利用小模型优势,在特定行业中实现突破和创新。只有如此,创业厂商才能在这个充满挑战与机遇的时代中立足。

软件加持下,未来的大模型能做什么?

在芯片等硬件不断革新的同时,软件架构的创新也成为推动大模型能力飞跃的关键。其中,Tree of Thoughts架构备受瞩目。

2023年12月,谷歌DeepMind与普林斯顿大学的研究人员联手推出了这一创新架构,其灵感源于人类意识的运作机制,特别是“系统2”思维。与快速、无意识的“系统1”思维不同,“系统2”是一种深度、长期的认知过程,需要更多的思考和规划。

引入Tree of Thoughts架构后,大模型将能够更贴近人类的思考方式,展现出更强的创造力、战略思维以及处理复杂、多维任务的能力。这意味着未来的大模型将不再仅仅是简单的数据处理器,而是能够像人类一样进行深度思考、制定战略、甚至解决前所未有的复杂问题。

这一变革不仅将大幅提升大模型的能力边界,更将加速AI技术的普及和应用,为各行各业带来前所未有的机遇和挑战。我们期待着这一创新架构在未来能够发挥出更大的潜力,推动AI技术的持续发展。

计算成本大幅下降,大模型算力飙升

摩根士丹利最新预测显示,大模型算力的增长正推动计算成本显著下降。从英伟达Hopper到Blackwell的芯片升级,计算成本已降低约50%。OpenAI的CEO Sam Altman强调,算力未来或成关键资源,重要性堪比货币。

随着成本降低,大模型应用将更广泛,推动AI技术快速发展。此外,报告预测将建造少数超大型超级计算机,可能选址于核电站附近以满足能源需求。在美国,摩根士丹利看好宾夕法尼亚州和伊利诺伊州,因其核电站众多,能稳定供应多千兆瓦电力。

计算成本的下降与超级计算机的建设,将为大模型算力飙升提供强大支持,促进AI技术在各领域的创新应用。我们期待这一趋势带来更多突破,推动人工智能发展。

继续阅读