天天看點

2023年人工智能行業專題報告 META的AI能力分析

作者:豆汁派

核心觀點:

核心觀點:本報告聚焦于META的AI能力分析。Meta發力AI的目的簡單明了,即“AI能夠幫助公司更加了解使用者需求” :Meta擁有大量社交與 元宇宙算法、成立人工智能研究院、推出Pytorch架構、釋出Zion等硬體支撐算法運作等。本報告專門将Meta與Microsoft、Google、Amazon在AI 領域進行了對比,我們發現Meta在AI領域的某些方面與其他三巨頭旗鼓相當甚至略勝一籌。我們認為,Meta的人工智能在Yann LeCun的帶領下 已經成長為不可忽視的存在, Meta實際上是全球範圍内值得重視的頭号AI玩家之一。

公司以社交起家,目前在社交的基礎上,聚焦元宇宙。Meta前身為Facebook,創立于2004年,是全球最大的網際網路公司之一。公司主營業務包括 兩部分,分别為Family of Apps(FoA)和Reality Labs(RL)。Family of Apps(FoA)是營業收入的絕大部分來源,其中廣告收入占比超過95%。 FoA包括以Facebook、Messenger、Instagram、WhatsApp為主的社交媒體通訊軟體,還有商業軟體Workplace,以及元宇宙平台Meta Horizon, Reality Labs(RL)的業務主要有AR/VR裝置、AI技術及元宇宙的開發。公司2022财年營業總收入為1166.09億美元,淨利潤291.46億美元。

AI貫穿公司全業務流程,公司系全球主要AI玩家。Meta發力AI的目的簡單明了,即“AI能夠幫助公司更加了解使用者需求”。目前Meta有着豐 富的社交算法與元宇宙算法的積累,在公司展業過程中起到舉足輕重的作用。Meta2013年就成立了AI研究院,主要關注人工智能(AI)和機 器學習(ML)這兩個目前科技和商業領域中最為熱門和前沿的技術領域,該研究院由Meta首席科學家、深度學習三巨頭、卷積神經網絡提出 者Yann LeCun領銜。2017年,Meta更是推出了PyTorch架構,其動态圖程式設計方式能夠幫助使用者高效地進行模型建構,2023年推出的PyTorch 2.0 更是将模型編譯速度提高了一個檔次。在AI硬體方面,公司推出Zion平台在内的多個AI硬體産品,進行AI模型的訓練與微調。此外,公司發 布Glow與ONNX進行AI模型的編譯與生态的開放。

我們将Meta與Microsoft、Google、Amazon在AI領域進行了對比,結論如下:1)從AI管理戰略層面來看,Meta業績交流會紀要中出現“AI” 相關的次數僅次于Google,甚至在22Q1-22Q3中一度超越Google,這當然與Meta大力布局元宇宙息息相關;2)從AI工程實踐領域來看,我們 發現就Github網站的粉絲數、項目數而言,Microsoft無疑是領先的,其次是Google、Meta、Amazon;3)從AI社會影響力來看,Meta社交媒 體粉絲數量僅次于Google;4)從AI學術能力來看,Meta的學術論文數量少于Google和Microsoft;

5)從AI應用領域來看,Meta AI更加集中在 C端和視覺領域,Microsoft AI也偏向C端使用者,而Google、Amazon則更偏向B端;6)從AI發力點來看,因Yann LeCun的AI理念,Meta更加看 重AI自監督學習能力;7)從AI大模型來看,Meta在AI大模型的布局時間與數量弱于谷歌和微軟,其中以LLaMA為最典型的代表。

一、Meta基本盤

以社交起家,目前聚焦元宇宙

Meta,前身為Facebook,是全球最大的網際網路公司之一。該公司由馬克·紮克伯格于2004年2月成立,是社交媒體平台、AR/VR領 域的上司者。2012年4月,公司在納斯達克上市,代碼為FB,後随公司更名改為META。 2011年起,公司繼續深耕社交媒體平台領域,組成了由Facebook、Instagram、Messenger、WhatsApp為主體的社交媒體應用矩陣。 2014年,公司收購Oculus,開拓AI、VR/AR以及元宇宙相關業務。 2021年,為實作元宇宙戰略目标、重塑品牌形象,公司宣布改名為“Meta”,并成立了Facebook Reality Labs專注于AR/VR等虛 拟現實技術的研發。由該實驗室推出的Meta Quest獨立頭戴式VR 裝置,可應用于社交媒體平台Meta Horizon及遊戲、辦公等領域。

Meta主要業務結構

公司主營業務包括兩部分,分别為Family of Apps(FoA)和Reality Labs(RL)。2022财年,公司營業收入共計1166.09億美元; 22Q4 ,公司實作營收321.65億美元。 Family of Apps(FoA)是營業收入的絕大部分來源,其中廣告收入占比超過95%。 FoA包括以Facebook、Messenger、Instagram、 WhatsApp為主的社交媒體通訊軟體,還有商業軟體Workplace,以及元宇宙平台Meta Horizon。 Reality Labs(RL)的業務主要有AR/VR裝置、AR/VR技術、AI技術及元宇宙的開發。

受外部環境影響,營業收入略有下滑

自2022年以來,由于海外宏觀壓力,Meta收入利潤持續下滑。 公司2022财年營業總收入為1166.09億美元,同比下降1.1%。其中FoA業務營收1144.5億美元,同比下降1%;RL業務營收21.59億 美元,同比下降5%。公司2022财年淨利潤291.46億美元,同比下降25%。 導緻營業收入及淨利潤下降的原因有:1)元宇宙研發不及預期導緻VR裝置及軟體銷量不及預期; 2)海外宏觀經濟疲軟,投放 需求減弱;3)随着元宇宙戰略開展,公司加大了研發支出,2022财年公司淨利潤下降。 4) 2022年企業擴張速度加快,資本開支 大幅增加。

廣告業務是主要來源,研發費用率顯著提高

從業務類型來看,廣告業務收入是Meta營業收入的最主要來源。2022财年,公司廣告收入為1134.41億美元,占比為98.15%。 2015-2019财年,廣告收入占營業收入比例逐年升高,從2015财年的95.28%上升至98.53%。 2022财年,公司毛利率為25%,較2021财年有較大幅度下滑,其主要原因為研發費用的增加。2019财年,受Facebook使用者資料洩 露事件,公司毛利率下降至34%。 2022财年公司研發費用率為30%。公司從2021年宣布轉型,深入元宇宙,導緻2022财年研發費用率較2021财年的21%有了較大幅 度的增長。

北美地區是主要營業收入來源

從地域分布來看,北美地區是業務收入的主要分布地區。22Q4北美地區共産生營業收入156.36億美元,占總營業收入的48%。其 次是歐洲地區和亞太地區,其營業收入分别為70.5億美元、60.5億美元,占比分别為19.1%和 22.1%。其他地區産生營業收入 34.29億美元,占比10.8%。 多年來,美國及加拿大始終是Meta廣告業務收入的兩個主要國家,亞太地區增長迅速。自2022年以來,亞太地區營收占總營業收 入比例不斷提升,從20Q4的17%逐漸上升至22年Q3的21%,其中菲律賓、印度尼西亞、越南等國家的日活使用者高速增長推動亞 洲地區營業收入不斷增長。

使用者數呈現緩慢增長态勢,人均營收有一定下滑

Facebook新使用者增速放緩。截至22Q4,Facebook的月活使用者(MAU)達29.6億,同比增長0.2%;日活使用者(DAU)達20億,同 比增長0.8%。其中,北美地區日活人數為1.99億人次(占比9.95%);歐洲地區日活人數為3億人次(占比15%;亞太地區月活人 數為8.54億人次(占比 42.7%);世界其他地區月活人數為6.43億人次(占比32.15%)。 2022财年Meta人均營收為7.95美元/人,同比下降6%。22Q1年,由于宏觀經濟逆風,廣告主競價需求減弱,而庫存又無明顯增長, 導緻收入開始顯著放緩,人均營收有一定程度的下降。

即時通訊平台:WhatsApp和Messenger

WhatsApp是一款專注于通訊體驗的軟體,它允許使用者發送文本語音消息、進行語音和視訊通話、共享圖像、文檔、使用者位置和 其他内容,可以一次與多達256位聯系人分享消息、 照片和視訊。在綁定銀行卡後,WhatsApp的支付功能允許使用者向好友轉賬或 分攤賬單。 Messenger與WhatsApp類似,也是一款即時通訊應用和平台,用于發送消息和交換照片、視訊、貼紙、音頻和檔案,并支援語音 和視訊通話。此外,Messenger還支援好友轉賬、商業交流等功能。在跨平台通訊方面,Messenger可使用Facebook、Instagram、 Portal和Oculus聊天。

Meta元宇宙戰略

2014年起,Meta通過收購Oculus VR等虛拟現實技術公司,逐漸進入虛拟現實領域,并推出了一系列VR頭戴式裝置,如Oculus Rift 和Oculus Quest 2,推動虛拟現實技術向消費者市場普及。2020年,公司更名為Meta,并正式宣布其元宇宙戰略,計劃在未來10年 将重心轉向元宇宙,投入數十億美元進行研發和發展,推出了Horizon Workrooms和Spark AR Studio等産品,旨在改進遠端辦公、 推動使用者生成内容和社互動動,并加強與跨行業合作夥伴的合作。 元宇宙技術方面,Meta在其Reality Labs實驗室内進行了大量的技術研發,包括虛拟現實、增強現實、計算機圖形學、人工智能等 領域的技術。公司投入大量資源用于技術研究和開發,推動虛拟現實技術的不斷突破和創新,包括圖形渲染、聲音、互動、人體追 蹤、眼球追蹤等。

二、AI能力縱向介紹

AI研究機構:2013年Meta成立FAIR研究院

Meta于2013年成立FAIR(Facebook AI Research)研究院,主要關注人工智能(AI)和機器學習(ML)這兩個目前科技和商業 領域中最為熱門和前沿的技術領域。其研究目标包括改進社交媒體使用者體驗、增強資訊安全和隐私保護、促進人工智能的公平、 透明和可解釋性,以及推動人工智能在社會和經濟領域的應用。這些研究涉及大規模資料處理、深度學習、強化學習、生成對抗 網絡(GANs)、自監督學習、遷移學習等前沿的 AI 技術。 FAIR研究院緻力于推動其研究成果在不同行業中的應用,如醫療健康、金融、交通、教育、元宇宙等領域,推動人工智能和機器 學習技術的落地和應用。

AML團隊更加重視應用落地

AML(Applied Machine Learning)是Meta公司的機器學習應用團隊,負責開發和優化應用于Meta産品和服務中的機器學習模型, 包括模型研發、資料挖掘和特征工程、模型部署和優化、實時監測和模型疊代,以及跨團隊合作。 AML部門的工作涉及多個領域,包括推薦系統、廣告排序、語音識别、圖像識别等,用于Meta公司旗下的産品和服務,如 Facebook、Instagram、WhatsApp等。通過不斷優化和疊代機器學習模型,AML部門在Meta公司中扮演着關鍵角色,推動着公 司的技術創新和業務發展,為使用者提供更好的産品和服務體驗。

AI科學家:Yann LeCun為Meta首席科學家

Meta擁有一支強大的AI團隊,包括了深度學習領域的創始人Yann LeCun、首席技術官Andrew Bosworth、Facebook AI主管Hassan Sawaf、進階研究員Mike Schroepfer和人工智能科學家Jerome Pesenti、何恺明等。他們在人工智能和機器學習領域具有豐富的 經驗和卓越的成就,推動了Meta在技術和創新方面的領先地位。 這些核心人員上司和推動了Meta在人工智能和機器學習領域的多個項目,包括廣告排序、推薦系統等,對公司的技術發展和業務 創新起着至關重要的作用。他們的專業知識和經驗使得Meta能夠不斷推動人工智能技術的前沿,應對未來的挑戰并保持在全球科 技行業的領先地位。

AI硬體:Meta推出Zion平台在内的多個AI硬體産品

Zion是Meta推出的下一代大記憶體統一訓練平台,旨在有效處理一系列神經網絡,包括CNN、LSTM和SparseNN等。Zion平台可為人工 智能模型的關鍵工作負載提供高記憶體容量和帶寬、靈活的高速互連和強大的計算能力。Zion系統包括三個子產品:Angels Landing、Clear Creek和Emerald Pools,其中Angels Landing是CPU盒;Clear Creek是互連盒;Emerald Pools是加速器盒。 Meta的Kings Canyon是一款AI推理加速子產品,用于提升人工智能及機器學習的計算性能。它可以嵌入到各種裝置中,提供高效的AI推 理能力。Kings Canyon的推理加速子產品可以加速裝置中各線程的深度學習推理任務,進而實作更快速、更智能的計算。

相較于其他AI架構,Pytorch更加靈活

PyTorch是一種開源的深度學習架構,其最大的優勢之一是靈活的動态圖程式設計方式。相比于靜态圖的架構,PyTorch允許使用者在模 型建構和調試過程中進行實時的計算圖建構和修改。這意味着研究人員和開發者可以更加直覺地調試和優化模型,更加高效地進 行實驗和疊代。此外,動态圖程式設計方式還使得模型建構更加靈活,允許使用者在模型中引入控制流、動态形狀等複雜的計算邏輯, 進而滿足更加複雜的深度學習任務需求。

2023年Meta釋出PyTorch2.0

PyTorch2.0釋出于2023年3月,它在新版本中加入了一系列強大的功能,包括對分布式訓練和量化推理的全面支援,使得其在模型 編譯、大規模訓練和高效推理方面更加出色。同時,PyTorch 2.0 還提供了全面的工具和庫,以簡化模型部署和模型生産環境的管 理,使得深度學習應用的落地變得更加輕松和可靠。 PyTorch2.0注重了開發者體驗,提供了更加簡潔、靈活和易用的API,使得模型的建構、訓練和調試更加便捷。此外,PyTorch 2.0 還支援多種硬體加速和模型優化技術,包括 GPU、TPU 和量化加速等,以提供更高的性能和效率。

AI生态系統:ONNX,針對機器學習的開放生态系統

ONNX(Open Neural Network Exchange)是Meta釋出的一個開放生态系統,它使AI開發人員能夠随着項目的發展選擇合适的工 具。ONNX為AI模型(包括深度學習和傳統 ML)提供開源平台。它定義了一個可擴充的計算圖模型,以及内置運算符和标準數 據類型的定義。目前該平台專注于推理(打分)能力的提升。 ONNX使模型可以在一個架構中進行訓練,然後導出并部署到其他架構中進行推理。ONNX 模型目前可在PyTorch、Caffe2、 Microsoft Cognitive Toolkit、Apache MXNet 和 Chainer 等架構中相容運作,并支援拓展至 Core ML、TensorFlow、Qualcomm SNPE、Nvidia 的 TensorRT 和英特爾的 nGraph等平台。

Web架構:React

React架構是一個用于建構使用者界面的JavaScript庫。該架構由Facebook團隊開發并維護,是一個靈活、高效且強大的前端架構, 适用于建構各種規模和複雜度的Web應用程式。它已經成為現代前端開發中的重要工具,并在衆多企業和社群中得到廣泛應用。 React可用作開發具有Next.js等架構的單頁、手機或伺服器渲染應用程式的基礎。然而,React隻專注狀态管理和将狀态渲染到 DOM,是以建立React應用程式通常需要使用額外的工具庫來進行路由實作,以及某些用戶端功能。 React的設計思想極其獨特,屬于革命性創新,性能出衆,代碼邏輯卻非常簡單。是以,越來越多的人開始關注和使用,認為它 可能是将來 Web 開發的主流工具。

三、AI能力橫向對比

AI管理戰略層:Meta業績交流會紀要中出現“AI”數量領先

我們認為公司業績交流會紀要中出現“AI”相關的次數代表管理層對相關AI布局的重視程度,出現AI次數越多,說明管理層在戰 略層面越重視AI,是以,我們統計了幾家廠商業績交流會中AI出現的次數。 根據谷歌、微軟、Meta、Amazon幾家公司各季度業績說明會中所提到AI次數來看,谷歌由2020Q1的4次增長至2022Q4的64次, 增長幅度最為明顯;Meta由2021Q2的15次增長至2022Q4的37次,展現出Meta對于AI的布局相對較早;微軟由2020Q1的26次波動 下降至2022Q4的7次;而亞馬遜在業績說明會幾乎沒有提到AI領域的相關内容。

AI社會影響力:Meta Twitter粉絲數量僅次于谷歌

在社會影響力方面,我們認為Twitter粉絲數量能夠在一定程度上反映出各大廠商在社會層面的影響力,賬号關注者數量越多代表 着越廣泛的傳播與覆寫範圍。是以,我們統計了Google(Google、Google research、DeepMind)、Microsoft(Microsoft、 Microsoft Research、OpenAI)、Meta(Meta、Meta AI)、Amazon(aws)在Twitter上的相關資料。具體來看,谷歌的Twitter平台 粉絲數量為29,100,000,在各廠商中位列第一,有着較為明顯的領先優勢;Meta、Micosoft的粉絲數量分别為13,900,000和 12,800,000,位居Google之後但也相對較多,在一定程度上展現其社會影響力較大。

AI學術能力:Meta在學術論文數量少于谷歌和微軟

從研究項目總量來看,Meta共有4478篇研究,Amazon有2679篇研究。 從具體領域來看,Meta的研究共涉及14個領域,主要分布在Artificial Intelligence(1200篇)、Computer Vision(949篇)、 Computer Vision(508篇)和Natural Language Processing & Speech(472篇)。亞馬遜的研究共涉及13個領域,主要分布在 Conversational AI / Natural-language processing(1001篇)、Machine learning(756篇),占比65.58%,分布較為集中。

AI應用領域:Meta AI更加集中在C端和視覺領域

Meta AI能力主要集中在C端和視覺,包括圖像識别和目标檢測、圖像生成、增強現實(AR)和虛拟現實(VR)、人臉識别和人 臉相關技術以及社交網絡資料處理和隐私保護。 這些技術可以應用于社交媒體平台中,提供更好的使用者體驗和社互動動。如人臉識别登入、人臉特征提取、人臉情緒識别等技術 可增強社交媒體平台的娛樂屬性;Meta AI 還提供資料處理和隐私保護技術,對使用者在社交媒體平台上的資料進行處理和管理, 以保護使用者隐私和資料安全,同時改進内容推薦和使用者興趣模組化等功能.

四、Meta熱點模型

Meta主要大模型:OPT

OPT(Open Pre-trained Transformer Language Models)模型是由Meta提出的一系列開源的大型因果語言模型,可用于生成創意文本、 解決基本數學問題、回答閱讀了解等問題。 Meta已經開源OPT-175B,此模型擁有1750億個參數,在公開資料庫BookCorpus、CC-Stories、The Pile、Pushshift.io Reddit、 CCNewsV2等多個資料庫上進行訓練,訓練資料共計1800億個字元,超過800GB的文本資料。 OPT-175B在性能與 GPT-3 近似的同時,訓練過程僅使用了 GPT3 的 1/7 的計算資源。

Meta主要大模型:LLaMa

LLaMa(Large Language Model Meta AI)是Meta最新開源的大規模語言模型,其參數範圍可達70億至650億。LLaMA以相對少 量的參數獲得了媲美超大模型的效果,130 億參數的 LLaMA 模型在大多數基準測試上可以勝過參數量達 1750 億的 GPT-3;最大 的 650 億參數的 LLaMA 模型可以媲美谷歌的 Chinchilla-70B 和 PaLM-540B。并且該模型可以在單個 GPU 上運作,極大的降低了 NLP開發者的使用難度。 LLaMa共計在超過14,000 億 tokens 、超過4800GB的的語料庫中完成訓練,其訓練資料集包括CCNet (67%)、C4 (15%)、 GitHub (4.5%)、Wikipedia (4.5%)、Books (4.5%)、ArXiv (2.5%)和Stack Exchange(2%)。

Meta主要大模型:SAM

2023年4月5日,Meta釋出SAM模型(Segment Anything Model),是 CV圖像分割領域的基礎模型。SAM由一個圖像編碼器、一個 提示編碼器和一個掩碼解碼器組成,具有以下特點:1)使用提示工程進行任務學習,互動式點選、選擇框甚至文本操作進行物 體分割;2)具有模糊感覺功能,面對分割對象存在歧義時,可以輸出多個有效掩碼;3)與ChatGPT類似,SAM巧妙的将人工标 注與大資料結合(資料引擎),最終實作了“分割一切”的功能。

Meta主要大模型:DINOv2

DINOv2,是Meta在2023年4月17日釋出的第一種使用自監督學習來訓練計算機視覺模型方法。使用DINOv2方法的模型,可在任 何圖像集上進行訓練,在提供強大的性能的同時,不需要對模型進行微調,适合用作許多不同計算機視覺任務的骨幹。由于自監 督特征學習和輕量化特定任務執行子產品的加入,DINOv2在深度估計方面的表現明顯優于其他算法。 測試結果顯示,DINOv2對分類、分割和圖像檢索等任務的非常強大的預測能力。同時,該模型在圖像網絡分類、視訊分類、目 辨別别、密集識别任務等場景下,較其他模型表現更加優秀。

(本文僅供參考,不代表我們的任何投資建議。如需使用相關資訊,請參閱報告原文。)

來源:未來智庫

相關報告

  • 人工智能行業專題報告:全球AI“頭号玩家”之一,META.pdf
  • (人工智能)人工智能基礎考試大綱.docx
  • AI人工智能賦能智慧橋梁解決方案.pptx
  • 人工智能能推動多少經濟增長?.pdf
  • 美國人工智能權利法案藍圖(英文).pdf
  • 網際網路行業專題報告:逐浪大模型,網際網路巨頭的AI野望.pdf
  • 美股科技股複盤、業績總結及展望:23Q1超預期,23Q2增速企穩,積極推進AI商用.pdf
  • 同花順(300033)研究報告:金融+AI開啟向上引擎,有望驅動業績持續增長.pdf
  • 通信行業專題報告:開源競速,AI大模型的“Linux時刻”降臨.pdf
  • 傳媒行業專題:從修複到成長,AIGC開啟傳媒網際網路新時代.pdf

繼續閱讀