天天看点

2023年人工智能行业专题报告 META的AI能力分析

作者:豆汁派

核心观点:

核心观点:本报告聚焦于META的AI能力分析。Meta发力AI的目的简单明了,即“AI能够帮助公司更加了解用户需求” :Meta拥有大量社交与 元宇宙算法、成立人工智能研究院、推出Pytorch框架、发布Zion等硬件支撑算法运行等。本报告专门将Meta与Microsoft、Google、Amazon在AI 领域进行了对比,我们发现Meta在AI领域的某些方面与其他三巨头旗鼓相当甚至略胜一筹。我们认为,Meta的人工智能在Yann LeCun的带领下 已经成长为不可忽视的存在, Meta实际上是全球范围内值得重视的头号AI玩家之一。

公司以社交起家,目前在社交的基础上,聚焦元宇宙。Meta前身为Facebook,创立于2004年,是全球最大的互联网公司之一。公司主营业务包括 两部分,分别为Family of Apps(FoA)和Reality Labs(RL)。Family of Apps(FoA)是营业收入的绝大部分来源,其中广告收入占比超过95%。 FoA包括以Facebook、Messenger、Instagram、WhatsApp为主的社交媒体通讯软件,还有商业软件Workplace,以及元宇宙平台Meta Horizon, Reality Labs(RL)的业务主要有AR/VR设备、AI技术及元宇宙的开发。公司2022财年营业总收入为1166.09亿美元,净利润291.46亿美元。

AI贯穿公司全业务流程,公司系全球主要AI玩家。Meta发力AI的目的简单明了,即“AI能够帮助公司更加了解用户需求”。当前Meta有着丰 富的社交算法与元宇宙算法的积累,在公司展业过程中起到举足轻重的作用。Meta2013年就成立了AI研究院,主要关注人工智能(AI)和机 器学习(ML)这两个目前科技和商业领域中最为热门和前沿的技术领域,该研究院由Meta首席科学家、深度学习三巨头、卷积神经网络提出 者Yann LeCun领衔。2017年,Meta更是推出了PyTorch框架,其动态图编程方式能够帮助用户高效地进行模型构建,2023年推出的PyTorch 2.0 更是将模型编译速度提高了一个档次。在AI硬件方面,公司推出Zion平台在内的多个AI硬件产品,进行AI模型的训练与微调。此外,公司发 布Glow与ONNX进行AI模型的编译与生态的开放。

我们将Meta与Microsoft、Google、Amazon在AI领域进行了对比,结论如下:1)从AI管理战略层面来看,Meta业绩交流会纪要中出现“AI” 相关的次数仅次于Google,甚至在22Q1-22Q3中一度超越Google,这当然与Meta大力布局元宇宙息息相关;2)从AI工程实践领域来看,我们 发现就Github网站的粉丝数、项目数而言,Microsoft无疑是领先的,其次是Google、Meta、Amazon;3)从AI社会影响力来看,Meta社交媒 体粉丝数量仅次于Google;4)从AI学术能力来看,Meta的学术论文数量少于Google和Microsoft;

5)从AI应用领域来看,Meta AI更加集中在 C端和视觉领域,Microsoft AI也偏向C端用户,而Google、Amazon则更偏向B端;6)从AI发力点来看,因Yann LeCun的AI理念,Meta更加看 重AI自监督学习能力;7)从AI大模型来看,Meta在AI大模型的布局时间与数量弱于谷歌和微软,其中以LLaMA为最典型的代表。

一、Meta基本盘

以社交起家,目前聚焦元宇宙

Meta,前身为Facebook,是全球最大的互联网公司之一。该公司由马克·扎克伯格于2004年2月成立,是社交媒体平台、AR/VR领 域的领导者。2012年4月,公司在纳斯达克上市,代码为FB,后随公司更名改为META。 2011年起,公司继续深耕社交媒体平台领域,组成了由Facebook、Instagram、Messenger、WhatsApp为主体的社交媒体应用矩阵。 2014年,公司收购Oculus,开拓AI、VR/AR以及元宇宙相关业务。 2021年,为实现元宇宙战略目标、重塑品牌形象,公司宣布改名为“Meta”,并成立了Facebook Reality Labs专注于AR/VR等虚 拟现实技术的研发。由该实验室推出的Meta Quest独立头戴式VR 设备,可应用于社交媒体平台Meta Horizon及游戏、办公等领域。

Meta主要业务结构

公司主营业务包括两部分,分别为Family of Apps(FoA)和Reality Labs(RL)。2022财年,公司营业收入共计1166.09亿美元; 22Q4 ,公司实现营收321.65亿美元。 Family of Apps(FoA)是营业收入的绝大部分来源,其中广告收入占比超过95%。 FoA包括以Facebook、Messenger、Instagram、 WhatsApp为主的社交媒体通讯软件,还有商业软件Workplace,以及元宇宙平台Meta Horizon。 Reality Labs(RL)的业务主要有AR/VR设备、AR/VR技术、AI技术及元宇宙的开发。

受外部环境影响,营业收入略有下滑

自2022年以来,由于海外宏观压力,Meta收入利润持续下滑。 公司2022财年营业总收入为1166.09亿美元,同比下降1.1%。其中FoA业务营收1144.5亿美元,同比下降1%;RL业务营收21.59亿 美元,同比下降5%。公司2022财年净利润291.46亿美元,同比下降25%。 导致营业收入及净利润下降的原因有:1)元宇宙研发不及预期导致VR设备及软件销量不及预期; 2)海外宏观经济疲软,投放 需求减弱;3)随着元宇宙战略开展,公司加大了研发支出,2022财年公司净利润下降。 4) 2022年企业扩张速度加快,资本开支 大幅增加。

广告业务是主要来源,研发费用率显著提高

从业务类型来看,广告业务收入是Meta营业收入的最主要来源。2022财年,公司广告收入为1134.41亿美元,占比为98.15%。 2015-2019财年,广告收入占营业收入比例逐年升高,从2015财年的95.28%上升至98.53%。 2022财年,公司毛利率为25%,较2021财年有较大幅度下滑,其主要原因为研发费用的增加。2019财年,受Facebook用户数据泄 露事件,公司毛利率下降至34%。 2022财年公司研发费用率为30%。公司从2021年宣布转型,深入元宇宙,导致2022财年研发费用率较2021财年的21%有了较大幅 度的增长。

北美地区是主要营业收入来源

从地域分布来看,北美地区是业务收入的主要分布地区。22Q4北美地区共产生营业收入156.36亿美元,占总营业收入的48%。其 次是欧洲地区和亚太地区,其营业收入分别为70.5亿美元、60.5亿美元,占比分别为19.1%和 22.1%。其他地区产生营业收入 34.29亿美元,占比10.8%。 多年来,美国及加拿大始终是Meta广告业务收入的两个主要国家,亚太地区增长迅速。自2022年以来,亚太地区营收占总营业收 入比例不断提升,从20Q4的17%逐步上升至22年Q3的21%,其中菲律宾、印度尼西亚、越南等国家的日活用户高速增长推动亚 洲地区营业收入不断增长。

用户数呈现缓慢增长态势,人均营收有一定下滑

Facebook新用户增速放缓。截至22Q4,Facebook的月活用户(MAU)达29.6亿,同比增长0.2%;日活用户(DAU)达20亿,同 比增长0.8%。其中,北美地区日活人数为1.99亿人次(占比9.95%);欧洲地区日活人数为3亿人次(占比15%;亚太地区月活人 数为8.54亿人次(占比 42.7%);世界其他地区月活人数为6.43亿人次(占比32.15%)。 2022财年Meta人均营收为7.95美元/人,同比下降6%。22Q1年,由于宏观经济逆风,广告主竞价需求减弱,而库存又无明显增长, 导致收入开始显著放缓,人均营收有一定程度的下降。

即时通讯平台:WhatsApp和Messenger

WhatsApp是一款专注于通讯体验的软件,它允许用户发送文本语音消息、进行语音和视频通话、共享图像、文档、用户位置和 其他内容,可以一次与多达256位联系人分享消息、 照片和视频。在绑定银行卡后,WhatsApp的支付功能允许用户向好友转账或 分摊账单。 Messenger与WhatsApp类似,也是一款即时通讯应用和平台,用于发送消息和交换照片、视频、贴纸、音频和文件,并支持语音 和视频通话。此外,Messenger还支持好友转账、商业交流等功能。在跨平台通讯方面,Messenger可使用Facebook、Instagram、 Portal和Oculus聊天。

Meta元宇宙战略

2014年起,Meta通过收购Oculus VR等虚拟现实技术公司,逐步进入虚拟现实领域,并推出了一系列VR头戴式设备,如Oculus Rift 和Oculus Quest 2,推动虚拟现实技术向消费者市场普及。2020年,公司更名为Meta,并正式宣布其元宇宙战略,计划在未来10年 将重心转向元宇宙,投入数十亿美元进行研发和发展,推出了Horizon Workrooms和Spark AR Studio等产品,旨在改进远程办公、 推动用户生成内容和社交互动,并加强与跨行业合作伙伴的合作。 元宇宙技术方面,Meta在其Reality Labs实验室内进行了大量的技术研发,包括虚拟现实、增强现实、计算机图形学、人工智能等 领域的技术。公司投入大量资源用于技术研究和开发,推动虚拟现实技术的不断突破和创新,包括图形渲染、声音、交互、人体追 踪、眼球追踪等。

二、AI能力纵向介绍

AI研究机构:2013年Meta成立FAIR研究院

Meta于2013年成立FAIR(Facebook AI Research)研究院,主要关注人工智能(AI)和机器学习(ML)这两个目前科技和商业 领域中最为热门和前沿的技术领域。其研究目标包括改进社交媒体用户体验、增强信息安全和隐私保护、促进人工智能的公平、 透明和可解释性,以及推动人工智能在社会和经济领域的应用。这些研究涉及大规模数据处理、深度学习、强化学习、生成对抗 网络(GANs)、自监督学习、迁移学习等前沿的 AI 技术。 FAIR研究院致力于推动其研究成果在不同行业中的应用,如医疗健康、金融、交通、教育、元宇宙等领域,推动人工智能和机器 学习技术的落地和应用。

AML团队更加重视应用落地

AML(Applied Machine Learning)是Meta公司的机器学习应用团队,负责开发和优化应用于Meta产品和服务中的机器学习模型, 包括模型研发、数据挖掘和特征工程、模型部署和优化、实时监测和模型迭代,以及跨团队合作。 AML部门的工作涉及多个领域,包括推荐系统、广告排序、语音识别、图像识别等,用于Meta公司旗下的产品和服务,如 Facebook、Instagram、WhatsApp等。通过不断优化和迭代机器学习模型,AML部门在Meta公司中扮演着关键角色,推动着公 司的技术创新和业务发展,为用户提供更好的产品和服务体验。

AI科学家:Yann LeCun为Meta首席科学家

Meta拥有一支强大的AI团队,包括了深度学习领域的创始人Yann LeCun、首席技术官Andrew Bosworth、Facebook AI主管Hassan Sawaf、高级研究员Mike Schroepfer和人工智能科学家Jerome Pesenti、何恺明等。他们在人工智能和机器学习领域具有丰富的 经验和卓越的成就,推动了Meta在技术和创新方面的领先地位。 这些核心人员领导和推动了Meta在人工智能和机器学习领域的多个项目,包括广告排序、推荐系统等,对公司的技术发展和业务 创新起着至关重要的作用。他们的专业知识和经验使得Meta能够不断推动人工智能技术的前沿,应对未来的挑战并保持在全球科 技行业的领先地位。

AI硬件:Meta推出Zion平台在内的多个AI硬件产品

Zion是Meta推出的下一代大内存统一训练平台,旨在有效处理一系列神经网络,包括CNN、LSTM和SparseNN等。Zion平台可为人工 智能模型的关键工作负载提供高内存容量和带宽、灵活的高速互连和强大的计算能力。Zion系统包括三个模块:Angels Landing、Clear Creek和Emerald Pools,其中Angels Landing是CPU盒;Clear Creek是互连盒;Emerald Pools是加速器盒。 Meta的Kings Canyon是一款AI推理加速模块,用于提升人工智能及机器学习的计算性能。它可以嵌入到各种设备中,提供高效的AI推 理能力。Kings Canyon的推理加速模块可以加速设备中各线程的深度学习推理任务,从而实现更快速、更智能的计算。

相较于其他AI框架,Pytorch更加灵活

PyTorch是一种开源的深度学习框架,其最大的优势之一是灵活的动态图编程方式。相比于静态图的框架,PyTorch允许用户在模 型构建和调试过程中进行实时的计算图构建和修改。这意味着研究人员和开发者可以更加直观地调试和优化模型,更加高效地进 行实验和迭代。此外,动态图编程方式还使得模型构建更加灵活,允许用户在模型中引入控制流、动态形状等复杂的计算逻辑, 从而满足更加复杂的深度学习任务需求。

2023年Meta发布PyTorch2.0

PyTorch2.0发布于2023年3月,它在新版本中加入了一系列强大的功能,包括对分布式训练和量化推理的全面支持,使得其在模型 编译、大规模训练和高效推理方面更加出色。同时,PyTorch 2.0 还提供了全面的工具和库,以简化模型部署和模型生产环境的管 理,使得深度学习应用的落地变得更加轻松和可靠。 PyTorch2.0注重了开发者体验,提供了更加简洁、灵活和易用的API,使得模型的构建、训练和调试更加便捷。此外,PyTorch 2.0 还支持多种硬件加速和模型优化技术,包括 GPU、TPU 和量化加速等,以提供更高的性能和效率。

AI生态系统:ONNX,针对机器学习的开放生态系统

ONNX(Open Neural Network Exchange)是Meta发布的一个开放生态系统,它使AI开发人员能够随着项目的发展选择合适的工 具。ONNX为AI模型(包括深度学习和传统 ML)提供开源平台。它定义了一个可扩展的计算图模型,以及内置运算符和标准数 据类型的定义。目前该平台专注于推理(打分)能力的提升。 ONNX使模型可以在一个框架中进行训练,然后导出并部署到其他框架中进行推理。ONNX 模型目前可在PyTorch、Caffe2、 Microsoft Cognitive Toolkit、Apache MXNet 和 Chainer 等框架中兼容运行,并支持拓展至 Core ML、TensorFlow、Qualcomm SNPE、Nvidia 的 TensorRT 和英特尔的 nGraph等平台。

Web框架:React

React框架是一个用于构建用户界面的JavaScript库。该框架由Facebook团队开发并维护,是一个灵活、高效且强大的前端框架, 适用于构建各种规模和复杂度的Web应用程序。它已经成为现代前端开发中的重要工具,并在众多企业和社区中得到广泛应用。 React可用作开发具有Next.js等框架的单页、手机或伺服器渲染应用程式的基础。然而,React只专注状态管理和将状态渲染到 DOM,因此创建React应用程式通常需要使用额外的工具库来进行路由实作,以及某些客户端功能。 React的设计思想极其独特,属于革命性创新,性能出众,代码逻辑却非常简单。所以,越来越多的人开始关注和使用,认为它 可能是将来 Web 开发的主流工具。

三、AI能力横向对比

AI管理战略层:Meta业绩交流会纪要中出现“AI”数量领先

我们认为公司业绩交流会纪要中出现“AI”相关的次数代表管理层对相关AI布局的重视程度,出现AI次数越多,说明管理层在战 略层面越重视AI,因此,我们统计了几家厂商业绩交流会中AI出现的次数。 根据谷歌、微软、Meta、Amazon几家公司各季度业绩说明会中所提到AI次数来看,谷歌由2020Q1的4次增长至2022Q4的64次, 增长幅度最为明显;Meta由2021Q2的15次增长至2022Q4的37次,体现出Meta对于AI的布局相对较早;微软由2020Q1的26次波动 下降至2022Q4的7次;而亚马逊在业绩说明会几乎没有提到AI领域的相关内容。

AI社会影响力:Meta Twitter粉丝数量仅次于谷歌

在社会影响力方面,我们认为Twitter粉丝数量能够在一定程度上反映出各大厂商在社会层面的影响力,账号关注者数量越多代表 着越广泛的传播与覆盖范围。因此,我们统计了Google(Google、Google research、DeepMind)、Microsoft(Microsoft、 Microsoft Research、OpenAI)、Meta(Meta、Meta AI)、Amazon(aws)在Twitter上的相关数据。具体来看,谷歌的Twitter平台 粉丝数量为29,100,000,在各厂商中位列第一,有着较为明显的领先优势;Meta、Micosoft的粉丝数量分别为13,900,000和 12,800,000,位居Google之后但也相对较多,在一定程度上体现其社会影响力较大。

AI学术能力:Meta在学术论文数量少于谷歌和微软

从研究项目总量来看,Meta共有4478篇研究,Amazon有2679篇研究。 从具体领域来看,Meta的研究共涉及14个领域,主要分布在Artificial Intelligence(1200篇)、Computer Vision(949篇)、 Computer Vision(508篇)和Natural Language Processing & Speech(472篇)。亚马逊的研究共涉及13个领域,主要分布在 Conversational AI / Natural-language processing(1001篇)、Machine learning(756篇),占比65.58%,分布较为集中。

AI应用领域:Meta AI更加集中在C端和视觉领域

Meta AI能力主要集中在C端和视觉,包括图像识别和目标检测、图像生成、增强现实(AR)和虚拟现实(VR)、人脸识别和人 脸相关技术以及社交网络数据处理和隐私保护。 这些技术可以应用于社交媒体平台中,提供更好的用户体验和社交互动。如人脸识别登录、人脸特征提取、人脸情绪识别等技术 可增强社交媒体平台的娱乐属性;Meta AI 还提供数据处理和隐私保护技术,对用户在社交媒体平台上的数据进行处理和管理, 以保护用户隐私和数据安全,同时改进内容推荐和用户兴趣建模等功能.

四、Meta热点模型

Meta主要大模型:OPT

OPT(Open Pre-trained Transformer Language Models)模型是由Meta提出的一系列开源的大型因果语言模型,可用于生成创意文本、 解决基本数学问题、回答阅读理解等问题。 Meta已经开源OPT-175B,此模型拥有1750亿个参数,在公开数据库BookCorpus、CC-Stories、The Pile、Pushshift.io Reddit、 CCNewsV2等多个数据库上进行训练,训练数据共计1800亿个字符,超过800GB的文本数据。 OPT-175B在性能与 GPT-3 近似的同时,训练过程仅使用了 GPT3 的 1/7 的计算资源。

Meta主要大模型:LLaMa

LLaMa(Large Language Model Meta AI)是Meta最新开源的大规模语言模型,其参数范围可达70亿至650亿。LLaMA以相对少 量的参数获得了媲美超大模型的效果,130 亿参数的 LLaMA 模型在大多数基准测试上可以胜过参数量达 1750 亿的 GPT-3;最大 的 650 亿参数的 LLaMA 模型可以媲美谷歌的 Chinchilla-70B 和 PaLM-540B。并且该模型可以在单个 GPU 上运行,极大的降低了 NLP开发者的使用难度。 LLaMa共计在超过14,000 亿 tokens 、超过4800GB的的语料库中完成训练,其训练数据集包括CCNet (67%)、C4 (15%)、 GitHub (4.5%)、Wikipedia (4.5%)、Books (4.5%)、ArXiv (2.5%)和Stack Exchange(2%)。

Meta主要大模型:SAM

2023年4月5日,Meta发布SAM模型(Segment Anything Model),是 CV图像分割领域的基础模型。SAM由一个图像编码器、一个 提示编码器和一个掩码解码器组成,具有以下特点:1)使用提示工程进行任务学习,交互式点击、选择框甚至文本操作进行物 体分割;2)具有模糊感知功能,面对分割对象存在歧义时,可以输出多个有效掩码;3)与ChatGPT类似,SAM巧妙的将人工标 注与大数据结合(数据引擎),最终实现了“分割一切”的功能。

Meta主要大模型:DINOv2

DINOv2,是Meta在2023年4月17日发布的第一种使用自监督学习来训练计算机视觉模型方法。使用DINOv2方法的模型,可在任 何图像集上进行训练,在提供强大的性能的同时,不需要对模型进行微调,适合用作许多不同计算机视觉任务的骨干。由于自监 督特征学习和轻量化特定任务执行模块的加入,DINOv2在深度估计方面的表现明显优于其他算法。 测试结果显示,DINOv2对分类、分割和图像检索等任务的非常强大的预测能力。同时,该模型在图像网络分类、视频分类、目 标识别、密集识别任务等场景下,较其他模型表现更加优秀。

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

来源:未来智库

相关报告

  • 人工智能行业专题报告:全球AI“头号玩家”之一,META.pdf
  • (人工智能)人工智能基础考试大纲.docx
  • AI人工智能赋能智慧桥梁解决方案.pptx
  • 人工智能能推动多少经济增长?.pdf
  • 美国人工智能权利法案蓝图(英文).pdf
  • 互联网行业专题报告:逐浪大模型,互联网巨头的AI野望.pdf
  • 美股科技股复盘、业绩总结及展望:23Q1超预期,23Q2增速企稳,积极推进AI商用.pdf
  • 同花顺(300033)研究报告:金融+AI开启向上引擎,有望驱动业绩持续增长.pdf
  • 通信行业专题报告:开源竞速,AI大模型的“Linux时刻”降临.pdf
  • 传媒行业专题:从修复到成长,AIGC开启传媒互联网新时代.pdf

继续阅读