调研显示,2023 年上半年涉及生成式AI大模型及其落地应用企业的投融资金额超过人民币 1000 亿元。这一数据在 2022 年仅为 96 亿人民币,这意味着,2023 年上半年 AIGC 赛道的投融金额已经超过 2022 年全年的 10 倍有多。值得一提的是,根据弯弓研究院调研发现,这些拿到融资的公司大多成立于 2020 年之后,集中于 2021 ~ 2023 年之间根据弯弓研究院从公开渠道收集的数据显示,图谱中的企业(去重)都有不同程度融资,且每年保持 1 - 2 轮融资。
投资者不仅有常规的投资机构,腾讯、阿里巴巴、百度、微软等互联网大厂也都快速切入,腾讯甚至在半个月内先后投资了三家企业,深言科技、MiniMax 和光年之外,其中深言科技聚焦于文本生成、信息抽取聚合、语义检索,MiniMax 则专注于智能对话机器人生成平台,具体应用场景不同,但都聚焦于 AIGC。
图源:弯弓研究院 2023中国AIGC与内容科技图谱 2.0,转载请备注出处「弯弓研究院」,图谱高清版请在公众号后台回复「图谱」领取
还有不少人在观望 AIGC 到底是泡沫还是长期趋势,毕竟元宇宙在前——2022 年元宇宙全球投融金额依然高达 868.67 亿元人民币,但字节跳动、Meta、微软等大厂对元宇宙团队的大范围裁员都让人感觉这一赛道「凉了」。
实际上,元宇宙那种「做不起来」、「离我们很远」的感觉来源于助力元宇宙发展的基础设施并不成熟,构成「宇宙」需要大量内容填充,可惜彼时的元宇宙还未遇上爆发的生成式 AI。
元宇宙是趋势不假,然而其对于现实世界的影响微乎其微,AIGC 则是元宇宙的反面,OpenAI 把高深的大模型放在 ChatGPT 的壳子里,应用场景覆盖 C端 与 B 端,实在落地并即刻反馈。
对于技术,是否能够快速获得市场,最大的推动力依然是「应用」,包含应用场景与应用程度。大模型并非 OpenAI 独一份优势,让 OpenAI 尊称一声前辈的 AI 公司并不少,只是,在应用层面与普及度的问题上, ChatGPT 确实前无古人。在 OpenAI 之前,大多数 AI 的应用场景并不直接体现在消费、营销场景中,同属 NLP(自然语言处理,Natural Language Processing)底层的人工智能客服( AI 外呼)算是最为广泛或成熟的营销技术。
对于市场而言,无论概念如何鹊起,要厘清其价值,就必须看其应用层面。
如今在各种大模型开源的环境下,AIGC 进入了大规模应用的阶段,比如,我们发现不少的技术公司都开始向市场提供 AIGC 工具进行客服、营销活动、广告投放等全链路解决方案。AIGC 的核心技术在演进,应用场景逐渐多元化,产品的形态日益成熟——AIGC 在不断释放其应用价值与商业潜力。
那么,在 AIGC 趋势是已知的情况下,作为商业世界中的一员,又有哪些更为具体的事情需要布局?我们的建议分为企业端和技术公司端,希望可以给大家带来启发:
01
企业端:行业格局将在 AIGC 主导下彻底重组
我们不妨假设一些 AIGC 深度参与的场景:
营销场景:利用文本生成、图像生成及数字人等AIGC工具生产营销内容
投放场景:营销内容自动分发至各大媒体平台并自动跟踪内容数据,按照设置好的参数进行分析及升级,最后自动优化投放方案
客服场景:人工智能客服替代人工客服,解决前端客服问题;AIGC 优化营销自动化内容,并根据客户画像不同立即输出定制化内容
实际上这已经不属于假设范畴,跨境电商 SaaS 服务商 Shopify 就在 OpenAI 开放 API 之后率先集成 GPT-4,包括升级人工智能客服,进而帮助消费进行个性化推荐、帮助商家节省互动时间,此外 ChatGPT 也提供平台商品评论数据分析、标题及关键词优化、营销文案撰写、网站智能化开发编程等多项功能,并能够将数据归档为购买动机、产品优缺点、使用场景、用户画像等,改善卖家运营效率及消费者体验。
图源:TopDevelopers
一个由GPT-4大语言模型驱动的应用程序AutoGPT甚至可以自主开发并管理业务,ChatGPT产生文字,AutoGPT产生流程,比如你给出一个目标「 复购率提升10% 」,AutoGPT 将会给出实现步骤及操作细节,并自动调度与复购率提升相关的企业业务系统以执行任务。
当下也许并未大范围利用 AIGC 进行商业模式改革,但可以预见的是,AIGC 终将改变许多行业的整体格局,尤其以电商行业为首,流量、商品、媒体及服务将在 AIGC 主导之下彻底重组。
作为品牌企业,我们需要做的事情也特别清晰,首先需要明确,人工智能的核心算法在于数据,数据参数大小,数据质量,算力资源等等,数据决定输出结果,从这一点出发,企业在 AIGC 趋势中必须要明确和布局的事情有:
1、针对公司业务找准可以优化的应用场景
应用场景的问题就相对简单了,搞清楚应用场景=解决企业脑子一热乱入局的问题。
在企业中,数据的应用场景常常包括内部的业务流程与外部营销,可能会包含业务流程监控、经营分析、市场传播、消费者洞察、消费者体验优化等场景。但哪一个场景可以/需要用 AIGC 进行提升、优化甚至重构?这需要企业针对自身业务特点与应用场景进行梳理。
比如,营销自动化场景,利用 AIGC 针对客户反馈实时生成各类文案与创意内容,一方面带来更准确和更智能的营销策略,另一方面,极大提高内容生产和创造的效率,直接帮助企业营销节省大量时间、精力和成本。
企业经营中的每一个环节都是成本,快速找准应用场景并进行升级也即意味着全面提高企业的竞争优势。
2、布局「企业级」大模型
弯弓研究院编撰的《中国AIGC与内容科技图谱》中已经收录了 50 个大模型(已有产品、已投入使用),但据《财经》统计,目前国内起码已经发布了79个基础大模型。然而,「大模型」其实并非企业需要的,这里指的是通用大模型。
企业需要考虑的是两个问题:
业务对标问题:既然是通用,也即意味着其知识体系必然是广而全,但也「杂」,对于不同行业、不同企业而言,应用侧关注点必然会有所不同,例如,C端消费者更关注消费者的个人需求,但B端用户可能更着重于效率与效果。大模型可能只能解决简单的问题,却不能够满足各行各业的对口业务,毕竟大模型概念虽然牛,但并不意味着企业使用大模型效果好。
数据安全问题:大模型算是数据与算力结合之下的暴力美学,目前各类大模型的训练数据均来源于互联网上的公开信息、从第三方处通过许可获取的信息以及用户或模型训练者提供的信息,大量数据喂养也代表大模型背后所存在的数据风险,是否会窃取、泄露用户数据,很大程度上基于大模型服务上的自制力(目前法律监管厘定较为模糊)。
而现在对于开源通用大模型的使用,一般是大模型的基础上对专业领域进行 Finetune(微调),在一定程度上也意味着企业必须给大模型喂养自己的数据,企业私域数据价值高,尤其在数据资产入表的背景下,如何对待数据是一个棘手的问题。
基于此,企业级大模型的存在就有了必要性。企业级大模型也可易理解为借助大模型开发平台的能力建立起自己的小模型(私有化部署),这里可能包含数据处理、模型训练等等环节,对企业的 IT 能力、AI 能力有一定要求。不过,这并不意味着大模型无法普适,大模型发展还处于初期,在生态与模型建立完善后自然会有更简单更低成本的方案出现。
正如陆奇所说,「未来将有更多大模型会更多的模型被建立,展开来说有两类:一类是事情的模型,人类每一类需求都有领域/工作模型,其中有结构模型、流程模型、需求模型和任务模型,尤其是记忆和先验;另一类是人的模型,包括认知/任务模型,它是个体的,其中有专业模型,有认知模型、运动模型和人的记忆先验。人基本是这几类模型的组合,律师也好,医生也好,大量领域会有大量模型往前走。」
图源:Wikipedia
3、建立企业知识库/知识图谱
企业需要用 AIGC 赋能业务,前提是 AIGC 必须有垂直行业/专业的数据集支撑才能够产生切实价值。举个最简单的例子,美妆类品牌与律师事务所所需要的知识是不同的。因此,企业就必须打造一个结构化的、可复用的知识集群,需要包含两方面信息:
一是行业 Knowhow,也可以理解为垂直场景,把行业相关、市场相关、领域相关的理论知识、实时数据甚至市场动态新闻等信息点都进行整理;二是企业知识,包含品牌文化、培训资料、客户资料、营销方案、服务标准等等,把零散的信息进行体系化的沉淀。
企业知识库利于数据训练,另一方面,从企业数据库的视角看,管理企业知识数据也有利于知识的高效共享、知识沉淀,如果目前还未做到这一点的企业可能加快角度了,随着业务和科技环境的进步,企业知识库的需求只会越来越大。
另外,如果只是从企业知识库的角度而言,这一部分可以利用 DAM 等内容科技完成。
在完成企业知识库后就是知识图谱(Knowledge Graph)的建立。
知识图谱也称为语义网络,是表示现实世界实体(即对象、事件、状况或概念)的网络,并说明它们之间的关系。大模型和知识图谱可以相互配合,实现更加复杂和精准的任务。
知识图谱能够把领域内复杂知识通过信息抽取、数据挖掘、语音匹配、语义计算、知识推理等过程精确地描述出来,并且可以描述知识的演化过程和发展规律,从而为研究和决策提供准确、可追踪、可解释、可推理的知识数据。
举个一看即明的例子:知识图谱有助于区分具有多种含义的单词,比如,确定 Apple(手机品牌)和 Apple(水果)之间的差异,识别是 Apple(手机品牌)还是Apple(水果)。
图源:Github jclian91 《神雕侠侣》知识图谱
当然,也有人认为,大模型的出现实际上是给知识图谱「判了死刑」,因为二者实际上有很多相似之处,但与静态的知识图谱对比,大模型的知识是动态的、根据外界「刺激」(提示词)以概率方式给出答案的知识,更加符合人类与世界交互的特点。
理论上基本可以替代,但实际上,两者在实际应用过程中更偏相互补充。比如,大模型由于其训练语料主要是一些通用的语言知识为主,专业知识方面可能会稍逊,导致模型缺乏专业性,知识图谱可以作为补充——基于知识图谱的推理解决大模型的「一本正经胡说八道」的问题。
02
技术公司端:AIGC时代的机会在「应用」
AIGC 的优势不可忽略,威胁也不该忽视。
在 ChatGPT-4 发布会上,OpenAI CEO Sam Altman 演示了如何利用 GPT-4 生成一个真实的网站:将手绘的网站框架照片输入给 GPT-4。一位没有小程序开发经验的朋友表示,「我描述出需求,GPT-4 教我开发小程序」,从后端框架到程序上架都在 GPT-4 指导下完成。
尽管目前可能还未到达脱离专业角色(程序员/技术公司)的程度,但 AIGC 显然已经对初级角色的生存空间产生了威胁,对于技术领域而言,这绝对是一个打击。对于企业而言,这是一支无可比拟的开发者团队。弯弓研究院在这半年里也收到了不少来自 MarTech 机构的忧虑:很多的环节似乎都可以用 AIGC 替代了。
我们对于这类看法的意见是:快速迭代。这里有几个具体的建议:
1、「可应用」
从一个例子开始。在 AIGC 之前,大多数人可能都没想过自己能够凭借一款软件和几个单词就能绘制出媲美专业设计师/艺术家的图片,这款软件叫做 Mid Journey,它是革命性的,且不说其所蕴含的巨大商业价值,MJ 的出现完全模糊了专业与非专业的界限,只要是会使用单词就能输出作品,甚至如果你对 Prompt 有更深入 的研究(仅限于文字输出),还能得到更为精美的作品。因此其在全球范围内的影响力迅速扩大。
ChatGPT 的火爆也同理,以文本生成作为窗口让大模型在短时间内被全球范围内的用户所关注到:是否「有人用」是一款受欢迎的技术的基本条件。
也就是说,AIGC 时代技术公司的机会在「应用」。
谁能让技术为用户所用,让用户有良好的用户体验,解决实际问题,谁就把握住了机会。至于为用户提供的是什么样的产品,该产品有多牛,说得再天花乱坠实际上也不如能用起来。
「用起来」还暗含了一点:清晰知道用户的应用场景(「打」到其痛点上)。
再举个例子,在大模型这件事情上,其实即便大模型化身小模型,对于企业而言可能也还是一件相当遥远的事情,但如果有一个技术服务商能够使大模型部署变成简单实施,比如拖拽板块即可完成搭建,快速完成安装并立即体验,判断它是否能够为公司带来价值 —— 很难做到,但能做到必然成功。
2、专业知识领域大数据
深耕某个垂直行业的大数据及解决方案。
数据是所有机器学习的核心,也是所有大模型发展的瓶颈所在,用于训练 AI 的数据的消耗速度可能远快于人类生产数据的速度,大量的数据是首要,但更需明确的是,建立更优的模型,需要的是更多专业知识领域数据,与企业建立知识库/知识图谱的优势相似,拥有专业领域大数据等同于技术公司在 AIGC 领域突破的优势。
越是垂直化的数据,价值越高。如果能够基于垂直领域数据对 AIGC 能力进行进一步升级,必然会产生更大的价值。
这里有两个真实的、来自技术公司的案例:
1、一个专注于美妆个护领域的 AIGC 服务商告诉我们,在 ChatGPT 开放 API 后他们迅速接入,并开始利用自己多年积累的美妆个护数据(包含多个品牌)对 GPT 展开一系列的训练,仅仅一周后就已经可以为客户输出质量并不低的美妆个护行业的 AIGC 内容,尽管当时还处于内测阶段,已经有不少客户咨询付费事宜;
2、这是一家专注于中台的公司。据透露,他们目前基本上聚焦于帮助客户建立企业级数据模型,比如,帮某个茶企挖掘门店数据,从中分析出用户需求,不断优化产品组合等等。该负责人告诉我们,对于企业而言,将来最需要的人是懂数据分析的人,在AI时代,大量的IT 岗位或许都会被数据岗位代替,比如,数据分析师,数据洞察师,数据工程师。「大公司自己会建立这样的数据分析团队,而小公司可能就会找外包团队,技术公司在未来有可能会变成数据运营公司。」
在未来,或许会出现 AIGC 版本的 APP STORE,「APP STORE」中出售的就是不同垂直领域数据训练出来的 AIGC 工具。这类公司可能会与各行业掌握垂直数据的公司合作,进行深度绑定,出现以行业为主的 AIGC 公司。
模型+数据+场景+算力或会成为成功技术公司的标配。
还有,请记住:未来都是数据的生意。
3、目前最火/应用最广的AIGC赛道
据弯弓研究院 2023中国AIGC与内容科技图谱 2.0版数据收集及分析情况来看,目前国内 AIGC 应用落地更快的是:音频生成、图像生成与数字人。
「音频」指的是对话式人工智能(人工智能客服/AI外呼) ,一种综合运用多种技术的复杂的人工智能形式,能够使人机间实现类似于真人的交互,应用场景一般为智能聊天机器人、网络音频语义识别、AI外呼,智齿科技、竹间智能与一知智能是音频生成类的代表性公司。
「图像」包含图生图、文生图、AI 图像侦测/识别、AI 辅助设计,应用场景多为平面设计在线工具、商品图生成(模特图/产品图),代表公司有 Tiamat、ZMO.AI。
「数字人」指以虚拟人为主要产品的公司,应用场景有影视创作/动画/虚拟偶像(角色生成)、VR \ AR \ MR、短视频拍摄、直播营销、元宇宙等等,代表公司有硅基智能、奇妙元、飞天云动。
这三个领域发展得更快很大程度在于:1、有应用场景;2、解放人力,提高工作效率;3、延长服务时间,你也可以简单理解为市场需求反推技术发展。
值得注意的是,弯弓研究院调研时发现,AIGC 类公司一般都拥有多模态的能力,可以提供一种或以上的技术服务,也即,提供文本生成产品的同时,也提供视频生成产品,这里有多种组合方式,比如文本生成+视频生成 、图像生成+视频生成 、音频生成+视频生成、音频生成+数字人、数字人+视频生成等等。
以蓝振忠博士的西湖心辰为例,西湖心辰同时提供 Friday (AI 写作)和 造梦日记(AI 绘画)两款产品,分别对标不同的客户群体和应用场景,如 Friday,提供的是文本生成的能力,有为生成符合各个社交平台风格的内容的垂直功能。「有明确的应用场景」始终是关键。
弯弓研究院是营销技术架构设计与内容战略提供商,如果你是企业,有应用 AIGC 的需求 / 如果你是技术服务商,想要寻找更多 AIGC 项目落地机会,如有需求,欢迎联系弯弓研究院助理,我们将提供对应的服务。