天天看点

第三代人工智能发展在即 AI大模型力促产业变革

作者:王琦 785

随着ChatGPT的出现,人工智能行业也在发生变迁。

“GPT的出现,有可能促使我们发展第三代人工智能产业。”7月13日,在2023京东全球科技探索者大会暨京东云峰会的主题演讲上,中国工程院院士张钹指出,在基础模型时代,AI正迎来科技革命及产业变革的双重机遇。

张钹认为,与第一代、第二代人工智能相比,第三代人工智能需要构建可解释与鲁棒(稳健)的AI理论与方法,发展安全、可控、可信、可靠和可扩展的AI技术。此外,张钹强调,第三代人工智能还需要利用知识、数据、算法、算力四大要素推动AI的创新应用与产业化。

在推动AI产业化方面,科技企业已在持续探索。当天,京东正式推出千亿级言犀大模型。京东集团技术委员会主席、京东云事业部总裁曹鹏指出,言犀大模型在训练过程中不仅使用标准语料,还使用了京东积累的大量产业数据,此外模型还具备良好的泛化性和安全性。言犀AI开发计算平台将于8月正式上线,目前已经启动预约注册。

“所有技术对于我们而言都是工具、手段,但不是目标。”近日,在接受包括21世纪经济报道在内的媒体采访时,曹鹏表示,“我们真正想利用这个技术带来产业变革,这才是我们想看到的。”

第三代人工智能

自1956年首次提出至今,人工智能技术已发展超60年,然而时至今日仍难言大规模应用。

张钹指出,受限于知识驱动及有限的算力,第一代人工智能产业并未发展起来。相较之下,第二代人工智能产业中AI技术应用广泛,但仍存在规模有限、数据安全、算法安全等问题。从一个侧面可一窥端倪:人工智能产业如今还未出现诸如IBM、微软等类似的巨头企业,这也意味着人工智能产业的发展任重道远。

个中原因,通过对比人工智能与信息产业的发展路径可一窥端倪。张钹分析称,信息产业发展经历了建立理论、信息技术产业化(出现通用的计算机硬件与软件)、产业(行业)信息化落地产业应用的过程。也正是在这个过程中,由于出现的软硬件是通用的,进而形成庞大的市场,从而支撑诸如微软、英特尔、IBM等龙头企业的成长。

反观人工智能产业则不然。“人工智能行业目前为止仍无理论,只有算法与模型,且存在一定的缺陷。”张钹表示。同时,依赖算法模型开发的AI软硬件均属于专用领域,应用及市场规模受限,“所以人工智能产业必须与应用领域紧密结合,深耕领域,才可能形成真正的人工智能产业。”

就此,张钹提出发展第三代人工智能的必要性,包含构建可解释与鲁棒(稳健)的AI理论与方法,发展安全、可控、可信、可靠和可扩展的AI技术,同时推动AI的创新应用与产业化。

张钹认为,此轮以ChatGPT为代表的AI大模型的火爆,则向通用人工智能(AGI)迈进了一步。具体而言,ChatGPT在对话上达到行为主义AI的目标,亦即与真人对话接近的地步,且在对话上达到开领域,亦即达到与领域无关的通用性。

而在基础模型时代,AI也正在迎来新的机遇。张钹认为,基础模型带来通用平台的同时,也将为各类应用提供技术基础。

就此,京东也在积极探索。“大模型真正实现自己的价值,一定是在产业应用中。”京东集团CEO许冉表示,大模型的价值=算法×算力×数据×产业厚度的平方。“前三个指标固然重要,但技术在产业场景落地应用,创造实际价值才是关键。当产业效率和产业的边界拓展得到质的提升以后,大模型才有了更重要的实际价值和意义,这将不亚于又一次工业革命。”

产业大模型

有别于其它的通用大模型,言犀大模型的特点是围绕产业展开。具体而言,其在训练时融合了70%的通用数据与30%数智供应链原生数据,能够聚焦知识密集型、任务型产业场景,解决真实产业问题。

“除了训练标准大模型通用的数据集外,我们把京东自己的数据都纳入到里面。数据集上的差异使我们可以在比较擅长的行业里提供差异化的模型能力。”曹鹏表示。

京东探索研究院院长、京东科技智能服务和产品部总裁何晓冬在接受包括21世纪经济报道在内的媒体采访时也指出,从零售、物流、健康、金融,再到工业品,京东供应链有整条链条,一头连着产业互联网,一头连着消费互联网,“从采购采销、交易、物流配送,包括终端服务一系列业务,每天都会产生大量的数据,这些数据和场景保障了我们的大模型是直接面向场景和行业应用的。”

而京东这种长链路、复杂协同、更多动态数据回流的场景,也成为了大模型最好的“练兵场”。

“京东的发展本身就来自于场景的历练,这也为我们积累了丰厚的产业数据和行业know-how,让我们有能力做出贴合于产业需求,能够解决产业痛点的大模型,并且持续在真实的场景中历练,形成一个有效良好的循环。”许冉表示。

此外,京东多年持续投入所积累的AI技术能力也是言犀大模型的重要优势之一。

据介绍,早自2021年,京东便推出了十亿级模型K-PLUG,彼时K-PLUG生成的商品文案可覆盖京东超3000个品类,累计生成30亿字,人工审核通过率超过95%。2022年,京东推出百亿级模型Vega,能够广泛应用于情感分析、语义匹配、语法纠错、智能问答、常识推理等多种下游自然语言处理任务。

如今,在多年研究基础之上,京东新一代千亿级大模型言犀正式亮相。“基于这样场景、数据以及多年的技术积累,京东成为了打造大模型的前沿高地,也是产生行业大模型的最佳阵地。”何晓冬指出。(实习生师洁对本文亦有贡献)

更多内容请下载21财经APP

继续阅读