核心观点：

核心观点：本报告聚焦于META的AI能力分析。Meta发力AI的目的简单明了，即“AI能够帮助公司更加了解用户需求” ：Meta拥有大量社交与元宇宙算法、成立人工智能研究院、推出Pytorch框架、发布Zion等硬件支撑算法运行等。本报告专门将Meta与Microsoft、Google、Amazon在AI 领域进行了对比，我们发现Meta在AI领域的某些方面与其他三巨头旗鼓相当甚至略胜一筹。我们认为，Meta的人工智能在Yann LeCun的带领下已经成长为不可忽视的存在， Meta实际上是全球范围内值得重视的头号AI玩家之一。

公司以社交起家，目前在社交的基础上，聚焦元宇宙。Meta前身为Facebook，创立于2004年，是全球最大的互联网公司之一。公司主营业务包括两部分，分别为Family of Apps（FoA）和Reality Labs（RL）。Family of Apps（FoA）是营业收入的绝大部分来源，其中广告收入占比超过95%。 FoA包括以Facebook、Messenger、Instagram、WhatsApp为主的社交媒体通讯软件，还有商业软件Workplace，以及元宇宙平台Meta Horizon， Reality Labs（RL）的业务主要有AR/VR设备、AI技术及元宇宙的开发。公司2022财年营业总收入为1166.09亿美元，净利润291.46亿美元。

AI贯穿公司全业务流程，公司系全球主要AI玩家。Meta发力AI的目的简单明了，即“AI能够帮助公司更加了解用户需求”。当前Meta有着丰富的社交算法与元宇宙算法的积累，在公司展业过程中起到举足轻重的作用。Meta2013年就成立了AI研究院，主要关注人工智能（AI）和机器学习（ML）这两个目前科技和商业领域中最为热门和前沿的技术领域，该研究院由Meta首席科学家、深度学习三巨头、卷积神经网络提出者Yann LeCun领衔。2017年，Meta更是推出了PyTorch框架，其动态图编程方式能够帮助用户高效地进行模型构建，2023年推出的PyTorch 2.0 更是将模型编译速度提高了一个档次。在AI硬件方面，公司推出Zion平台在内的多个AI硬件产品，进行AI模型的训练与微调。此外，公司发布Glow与ONNX进行AI模型的编译与生态的开放。

我们将Meta与Microsoft、Google、Amazon在AI领域进行了对比，结论如下：1）从AI管理战略层面来看，Meta业绩交流会纪要中出现“AI” 相关的次数仅次于Google，甚至在22Q1-22Q3中一度超越Google，这当然与Meta大力布局元宇宙息息相关；2）从AI工程实践领域来看，我们发现就Github网站的粉丝数、项目数而言，Microsoft无疑是领先的，其次是Google、Meta、Amazon；3）从AI社会影响力来看，Meta社交媒体粉丝数量仅次于Google；4）从AI学术能力来看，Meta的学术论文数量少于Google和Microsoft；

5）从AI应用领域来看，Meta AI更加集中在 C端和视觉领域，Microsoft AI也偏向C端用户，而Google、Amazon则更偏向B端；6）从AI发力点来看，因Yann LeCun的AI理念，Meta更加看重AI自监督学习能力；7）从AI大模型来看，Meta在AI大模型的布局时间与数量弱于谷歌和微软，其中以LLaMA为最典型的代表。

一、Meta基本盘

以社交起家，目前聚焦元宇宙

Meta，前身为Facebook，是全球最大的互联网公司之一。该公司由马克·扎克伯格于2004年2月成立，是社交媒体平台、AR/VR领域的领导者。2012年4月，公司在纳斯达克上市，代码为FB，后随公司更名改为META。 2011年起，公司继续深耕社交媒体平台领域，组成了由Facebook、Instagram、Messenger、WhatsApp为主体的社交媒体应用矩阵。 2014年，公司收购Oculus，开拓AI、VR/AR以及元宇宙相关业务。 2021年，为实现元宇宙战略目标、重塑品牌形象，公司宣布改名为“Meta”，并成立了Facebook Reality Labs专注于AR/VR等虚拟现实技术的研发。由该实验室推出的Meta Quest独立头戴式VR 设备，可应用于社交媒体平台Meta Horizon及游戏、办公等领域。

Meta主要业务结构

公司主营业务包括两部分，分别为Family of Apps（FoA）和Reality Labs（RL）。2022财年，公司营业收入共计1166.09亿美元； 22Q4 ，公司实现营收321.65亿美元。 Family of Apps（FoA）是营业收入的绝大部分来源，其中广告收入占比超过95%。 FoA包括以Facebook、Messenger、Instagram、 WhatsApp为主的社交媒体通讯软件，还有商业软件Workplace，以及元宇宙平台Meta Horizon。 Reality Labs（RL）的业务主要有AR/VR设备、AR/VR技术、AI技术及元宇宙的开发。

受外部环境影响，营业收入略有下滑

自2022年以来，由于海外宏观压力，Meta收入利润持续下滑。公司2022财年营业总收入为1166.09亿美元，同比下降1.1%。其中FoA业务营收1144.5亿美元，同比下降1%；RL业务营收21.59亿美元，同比下降5%。公司2022财年净利润291.46亿美元，同比下降25%。导致营业收入及净利润下降的原因有：1）元宇宙研发不及预期导致VR设备及软件销量不及预期； 2）海外宏观经济疲软，投放需求减弱；3）随着元宇宙战略开展，公司加大了研发支出，2022财年公司净利润下降。 4) 2022年企业扩张速度加快，资本开支大幅增加。

广告业务是主要来源，研发费用率显著提高

从业务类型来看，广告业务收入是Meta营业收入的最主要来源。2022财年，公司广告收入为1134.41亿美元，占比为98.15%。 2015-2019财年，广告收入占营业收入比例逐年升高，从2015财年的95.28%上升至98.53%。 2022财年，公司毛利率为25%，较2021财年有较大幅度下滑，其主要原因为研发费用的增加。2019财年，受Facebook用户数据泄露事件，公司毛利率下降至34%。 2022财年公司研发费用率为30%。公司从2021年宣布转型，深入元宇宙，导致2022财年研发费用率较2021财年的21%有了较大幅度的增长。

北美地区是主要营业收入来源

从地域分布来看，北美地区是业务收入的主要分布地区。22Q4北美地区共产生营业收入156.36亿美元，占总营业收入的48%。其次是欧洲地区和亚太地区，其营业收入分别为70.5亿美元、60.5亿美元，占比分别为19.1%和 22.1%。其他地区产生营业收入 34.29亿美元，占比10.8%。多年来，美国及加拿大始终是Meta广告业务收入的两个主要国家，亚太地区增长迅速。自2022年以来，亚太地区营收占总营业收入比例不断提升，从20Q4的17%逐步上升至22年Q3的21%，其中菲律宾、印度尼西亚、越南等国家的日活用户高速增长推动亚洲地区营业收入不断增长。

用户数呈现缓慢增长态势，人均营收有一定下滑

Facebook新用户增速放缓。截至22Q4，Facebook的月活用户（MAU）达29.6亿，同比增长0.2%；日活用户（DAU）达20亿，同比增长0.8%。其中，北美地区日活人数为1.99亿人次（占比9.95%）；欧洲地区日活人数为3亿人次（占比15%；亚太地区月活人数为8.54亿人次（占比 42.7%）；世界其他地区月活人数为6.43亿人次（占比32.15%）。 2022财年Meta人均营收为7.95美元/人，同比下降6%。22Q1年，由于宏观经济逆风，广告主竞价需求减弱，而库存又无明显增长，导致收入开始显著放缓，人均营收有一定程度的下降。

即时通讯平台：WhatsApp和Messenger

WhatsApp是一款专注于通讯体验的软件，它允许用户发送文本语音消息、进行语音和视频通话、共享图像、文档、用户位置和其他内容，可以一次与多达256位联系人分享消息、照片和视频。在绑定银行卡后，WhatsApp的支付功能允许用户向好友转账或分摊账单。 Messenger与WhatsApp类似，也是一款即时通讯应用和平台，用于发送消息和交换照片、视频、贴纸、音频和文件，并支持语音和视频通话。此外，Messenger还支持好友转账、商业交流等功能。在跨平台通讯方面，Messenger可使用Facebook、Instagram、 Portal和Oculus聊天。

Meta元宇宙战略

2014年起，Meta通过收购Oculus VR等虚拟现实技术公司，逐步进入虚拟现实领域，并推出了一系列VR头戴式设备，如Oculus Rift 和Oculus Quest 2，推动虚拟现实技术向消费者市场普及。2020年，公司更名为Meta，并正式宣布其元宇宙战略，计划在未来10年将重心转向元宇宙，投入数十亿美元进行研发和发展，推出了Horizon Workrooms和Spark AR Studio等产品，旨在改进远程办公、推动用户生成内容和社交互动，并加强与跨行业合作伙伴的合作。元宇宙技术方面，Meta在其Reality Labs实验室内进行了大量的技术研发，包括虚拟现实、增强现实、计算机图形学、人工智能等领域的技术。公司投入大量资源用于技术研究和开发，推动虚拟现实技术的不断突破和创新，包括图形渲染、声音、交互、人体追踪、眼球追踪等。

二、AI能力纵向介绍

AI研究机构：2013年Meta成立FAIR研究院

Meta于2013年成立FAIR（Facebook AI Research）研究院，主要关注人工智能（AI）和机器学习（ML）这两个目前科技和商业领域中最为热门和前沿的技术领域。其研究目标包括改进社交媒体用户体验、增强信息安全和隐私保护、促进人工智能的公平、透明和可解释性，以及推动人工智能在社会和经济领域的应用。这些研究涉及大规模数据处理、深度学习、强化学习、生成对抗网络（GANs）、自监督学习、迁移学习等前沿的 AI 技术。 FAIR研究院致力于推动其研究成果在不同行业中的应用，如医疗健康、金融、交通、教育、元宇宙等领域，推动人工智能和机器学习技术的落地和应用。

AML团队更加重视应用落地

AML（Applied Machine Learning）是Meta公司的机器学习应用团队，负责开发和优化应用于Meta产品和服务中的机器学习模型，包括模型研发、数据挖掘和特征工程、模型部署和优化、实时监测和模型迭代，以及跨团队合作。 AML部门的工作涉及多个领域，包括推荐系统、广告排序、语音识别、图像识别等，用于Meta公司旗下的产品和服务，如 Facebook、Instagram、WhatsApp等。通过不断优化和迭代机器学习模型，AML部门在Meta公司中扮演着关键角色，推动着公司的技术创新和业务发展，为用户提供更好的产品和服务体验。

AI科学家：Yann LeCun为Meta首席科学家

Meta拥有一支强大的AI团队，包括了深度学习领域的创始人Yann LeCun、首席技术官Andrew Bosworth、Facebook AI主管Hassan Sawaf、高级研究员Mike Schroepfer和人工智能科学家Jerome Pesenti、何恺明等。他们在人工智能和机器学习领域具有丰富的经验和卓越的成就，推动了Meta在技术和创新方面的领先地位。这些核心人员领导和推动了Meta在人工智能和机器学习领域的多个项目，包括广告排序、推荐系统等，对公司的技术发展和业务创新起着至关重要的作用。他们的专业知识和经验使得Meta能够不断推动人工智能技术的前沿，应对未来的挑战并保持在全球科技行业的领先地位。

AI硬件：Meta推出Zion平台在内的多个AI硬件产品

Zion是Meta推出的下一代大内存统一训练平台，旨在有效处理一系列神经网络，包括CNN、LSTM和SparseNN等。Zion平台可为人工智能模型的关键工作负载提供高内存容量和带宽、灵活的高速互连和强大的计算能力。Zion系统包括三个模块：Angels Landing、Clear Creek和Emerald Pools，其中Angels Landing是CPU盒；Clear Creek是互连盒；Emerald Pools是加速器盒。 Meta的Kings Canyon是一款AI推理加速模块，用于提升人工智能及机器学习的计算性能。它可以嵌入到各种设备中，提供高效的AI推理能力。Kings Canyon的推理加速模块可以加速设备中各线程的深度学习推理任务，从而实现更快速、更智能的计算。

相较于其他AI框架，Pytorch更加灵活

PyTorch是一种开源的深度学习框架，其最大的优势之一是灵活的动态图编程方式。相比于静态图的框架，PyTorch允许用户在模型构建和调试过程中进行实时的计算图构建和修改。这意味着研究人员和开发者可以更加直观地调试和优化模型，更加高效地进行实验和迭代。此外，动态图编程方式还使得模型构建更加灵活，允许用户在模型中引入控制流、动态形状等复杂的计算逻辑，从而满足更加复杂的深度学习任务需求。

2023年Meta发布PyTorch2.0

PyTorch2.0发布于2023年3月，它在新版本中加入了一系列强大的功能，包括对分布式训练和量化推理的全面支持，使得其在模型编译、大规模训练和高效推理方面更加出色。同时，PyTorch 2.0 还提供了全面的工具和库，以简化模型部署和模型生产环境的管理，使得深度学习应用的落地变得更加轻松和可靠。 PyTorch2.0注重了开发者体验，提供了更加简洁、灵活和易用的API，使得模型的构建、训练和调试更加便捷。此外，PyTorch 2.0 还支持多种硬件加速和模型优化技术，包括 GPU、TPU 和量化加速等，以提供更高的性能和效率。

AI生态系统：ONNX，针对机器学习的开放生态系统

ONNX（Open Neural Network Exchange）是Meta发布的一个开放生态系统，它使AI开发人员能够随着项目的发展选择合适的工具。ONNX为AI模型（包括深度学习和传统 ML）提供开源平台。它定义了一个可扩展的计算图模型，以及内置运算符和标准数据类型的定义。目前该平台专注于推理（打分）能力的提升。 ONNX使模型可以在一个框架中进行训练，然后导出并部署到其他框架中进行推理。ONNX 模型目前可在PyTorch、Caffe2、 Microsoft Cognitive Toolkit、Apache MXNet 和 Chainer 等框架中兼容运行，并支持拓展至 Core ML、TensorFlow、Qualcomm SNPE、Nvidia 的 TensorRT 和英特尔的 nGraph等平台。

Web框架：React

React框架是一个用于构建用户界面的JavaScript库。该框架由Facebook团队开发并维护，是一个灵活、高效且强大的前端框架，适用于构建各种规模和复杂度的Web应用程序。它已经成为现代前端开发中的重要工具，并在众多企业和社区中得到广泛应用。 React可用作开发具有Next.js等框架的单页、手机或伺服器渲染应用程式的基础。然而，React只专注状态管理和将状态渲染到 DOM，因此创建React应用程式通常需要使用额外的工具库来进行路由实作，以及某些客户端功能。 React的设计思想极其独特，属于革命性创新，性能出众，代码逻辑却非常简单。所以，越来越多的人开始关注和使用，认为它可能是将来 Web 开发的主流工具。

三、AI能力横向对比

AI管理战略层：Meta业绩交流会纪要中出现“AI”数量领先

我们认为公司业绩交流会纪要中出现“AI”相关的次数代表管理层对相关AI布局的重视程度，出现AI次数越多，说明管理层在战略层面越重视AI，因此，我们统计了几家厂商业绩交流会中AI出现的次数。根据谷歌、微软、Meta、Amazon几家公司各季度业绩说明会中所提到AI次数来看，谷歌由2020Q1的4次增长至2022Q4的64次，增长幅度最为明显；Meta由2021Q2的15次增长至2022Q4的37次，体现出Meta对于AI的布局相对较早；微软由2020Q1的26次波动下降至2022Q4的7次；而亚马逊在业绩说明会几乎没有提到AI领域的相关内容。

AI社会影响力：Meta Twitter粉丝数量仅次于谷歌

在社会影响力方面，我们认为Twitter粉丝数量能够在一定程度上反映出各大厂商在社会层面的影响力，账号关注者数量越多代表着越广泛的传播与覆盖范围。因此，我们统计了Google（Google、Google research、DeepMind）、Microsoft（Microsoft、 Microsoft Research、OpenAI）、Meta（Meta、Meta AI）、Amazon（aws）在Twitter上的相关数据。具体来看，谷歌的Twitter平台粉丝数量为29,100,000，在各厂商中位列第一，有着较为明显的领先优势；Meta、Micosoft的粉丝数量分别为13,900,000和 12,800,000，位居Google之后但也相对较多，在一定程度上体现其社会影响力较大。

AI学术能力：Meta在学术论文数量少于谷歌和微软

从研究项目总量来看，Meta共有4478篇研究，Amazon有2679篇研究。从具体领域来看，Meta的研究共涉及14个领域，主要分布在Artificial Intelligence（1200篇）、Computer Vision（949篇）、 Computer Vision（508篇）和Natural Language Processing & Speech（472篇）。亚马逊的研究共涉及13个领域，主要分布在 Conversational AI / Natural-language processing（1001篇）、Machine learning（756篇），占比65.58%，分布较为集中。

AI应用领域：Meta AI更加集中在C端和视觉领域

Meta AI能力主要集中在C端和视觉，包括图像识别和目标检测、图像生成、增强现实（AR）和虚拟现实（VR）、人脸识别和人脸相关技术以及社交网络数据处理和隐私保护。这些技术可以应用于社交媒体平台中，提供更好的用户体验和社交互动。如人脸识别登录、人脸特征提取、人脸情绪识别等技术可增强社交媒体平台的娱乐属性；Meta AI 还提供数据处理和隐私保护技术，对用户在社交媒体平台上的数据进行处理和管理，以保护用户隐私和数据安全，同时改进内容推荐和用户兴趣建模等功能.

四、Meta热点模型

Meta主要大模型：OPT

OPT（Open Pre-trained Transformer Language Models）模型是由Meta提出的一系列开源的大型因果语言模型，可用于生成创意文本、解决基本数学问题、回答阅读理解等问题。 Meta已经开源OPT-175B，此模型拥有1750亿个参数，在公开数据库BookCorpus、CC-Stories、The Pile、Pushshift.io Reddit、 CCNewsV2等多个数据库上进行训练，训练数据共计1800亿个字符，超过800GB的文本数据。 OPT-175B在性能与 GPT-3 近似的同时，训练过程仅使用了 GPT3 的 1/7 的计算资源。

Meta主要大模型:LLaMa

LLaMa（Large Language Model Meta AI）是Meta最新开源的大规模语言模型，其参数范围可达70亿至650亿。LLaMA以相对少量的参数获得了媲美超大模型的效果，130 亿参数的 LLaMA 模型在大多数基准测试上可以胜过参数量达 1750 亿的 GPT-3；最大的 650 亿参数的 LLaMA 模型可以媲美谷歌的 Chinchilla-70B 和 PaLM-540B。并且该模型可以在单个 GPU 上运行，极大的降低了 NLP开发者的使用难度。 LLaMa共计在超过14,000 亿 tokens 、超过4800GB的的语料库中完成训练，其训练数据集包括CCNet (67%)、C4 (15%)、 GitHub (4.5%)、Wikipedia (4.5%)、Books (4.5%)、ArXiv (2.5%)和Stack Exchange(2%)。

Meta主要大模型：SAM

2023年4月5日，Meta发布SAM模型（Segment Anything Model），是 CV图像分割领域的基础模型。SAM由一个图像编码器、一个提示编码器和一个掩码解码器组成，具有以下特点：1）使用提示工程进行任务学习，交互式点击、选择框甚至文本操作进行物体分割；2）具有模糊感知功能，面对分割对象存在歧义时，可以输出多个有效掩码；3）与ChatGPT类似，SAM巧妙的将人工标注与大数据结合（数据引擎），最终实现了“分割一切”的功能。

Meta主要大模型：DINOv2

DINOv2，是Meta在2023年4月17日发布的第一种使用自监督学习来训练计算机视觉模型方法。使用DINOv2方法的模型，可在任何图像集上进行训练，在提供强大的性能的同时，不需要对模型进行微调，适合用作许多不同计算机视觉任务的骨干。由于自监督特征学习和轻量化特定任务执行模块的加入，DINOv2在深度估计方面的表现明显优于其他算法。测试结果显示，DINOv2对分类、分割和图像检索等任务的非常强大的预测能力。同时，该模型在图像网络分类、视频分类、目标识别、密集识别任务等场景下，较其他模型表现更加优秀。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）

来源：未来智库

2023年人工智能行业专题报告 META的AI能力分析

核心观点：

一、Meta基本盘

二、AI能力纵向介绍

三、AI能力横向对比

四、Meta热点模型

继续阅读

美国总统科学技术顾问委员会发布：《赋能研究：利用人工智能应对全球挑战》

新研究发现部分人工智能系统已擅长“说谎”……一起来听健康早闻！2024年5月14日

人工智能也能提供“情绪价值”了，OpenAI发布全新大模型GPT-4o

编织未见：人工智能与视觉叙事｜MC2 AI影像先导活动

马斯克谈中美人工智能发展：两者之间的差距正在迅速缩小

AMD全新AI芯片：颠覆Nvidia垄断，引领人工智能硬件新浪潮

延迟到65岁才能退休，万一35岁就被人工智能取代了，怎么办.

黄奇帆：人工智能时代也有进入千家万户的“四大件”“五大件”

【论坛】以“人工智能+”行动着力推动新质生产力发展||黄勇

北大光华学者沙龙解析人工智能的前沿发展与挑战

OpenAI、谷歌“掰手腕” 大模型给人工智能装上“眼睛耳朵嘴巴”

NetApp和Lenovo提供针对生成式人工智能进行优化的融合基础架构解决方案

英伟达、微软等大厂布局、投资不断，东南亚成为人工智能新热土

为什么人工智能可以给数学带来革命性变化

人类如何挣脱被人工智能替代的命运？

【意·调查】越来越多意大利学生使用人工智能做作业