天天看点

甩英伟达一条街!中国自研GPU出炉,比27万亿参数芯片还要牛

作者:寿与天齐

大模型的兴起

大模型(large model是指参数量极大、训练数据规模庞大的人工智能模型。这种模型通过预先在海量无标注数据上进行大规模训练,学习数据中蕴含的丰富模式,从而获得通用的表示能力。之后只需在特定任务上进行少量数据的微调,即可完成该任务。

大模型之所以能够成为人工智能发展的重要方向,主要得益于三个关键因素的共同推动:大数据、大算力和强算法。

甩英伟达一条街!中国自研GPU出炉,比27万亿参数芯片还要牛

大数据时代的到来,使得训练大模型所需的海量数据得以获取。算力硬件的飞速发展,例如GPU等专用AI芯片的出现,为训练大规模模型提供了必要的计算能力。再次是深度学习等机器学习算法的创新突破,使得训练大模型成为可能。

大模型最早在自然语言处理领域取得突破性进展。2018年,谷歌发布BERT模型,首次将Transformer编码器应用于语言理解任务,取得了卓越的效果。2020年,OpenAI发布GPT-3大模型,参数量高达1750亿,展现出强大的文本生成能力。

甩英伟达一条街!中国自研GPU出炉,比27万亿参数芯片还要牛

随后,大模型技术在计算机视觉、语音识别、多模态等领域也取得长足进展。例如OpenAI的DALL-E 2可以根据自然语言描述生成逼真的图像,DeepMind的AlphaFold 2能够准确预测蛋白质的三维结构。

大模型的现状

目前,大模型技术正在全球范围内快速发展,成为人工智能领域的主导方向。以下是一些代表性的大模型:

甩英伟达一条街!中国自研GPU出炉,比27万亿参数芯片还要牛

GPT系列(OpenAIGPT-3(1750亿参数、GPT-4(1.8万亿参数,具备强大的自然语言理解和生成能力。

LaMDA(Google对话式大语言模型,参数量达1.8万亿。

PanGu-Alpha(华为中文大模型,参数量达2000亿。

文心一言(百度中文大模型,参数量达1.7万亿。

通义千问(阿里中文大模型,参数量达7200亿。

甩英伟达一条街!中国自研GPU出炉,比27万亿参数芯片还要牛

除了上述通用大模型,各行业也在积极探索大模型在垂直领域的应用,例如金融、医疗、制造等。一些公司还在尝试将大模型部署在移动端等终端设备上。

大模型技术正在全球范围内加速发展和落地应用。但大模型也面临着一些重大挑战和瓶颈。

大模型面临的挑战

算力瓶颈

训练大规模大模型需要极高的算力支持,对GPU等专用AI芯片的需求激增。以GPT-4为例,其训练成本高达6300万美元。目前国内尚未能完全自主可控地提供足够的算力支持大模型训练。

甩英伟达一条街!中国自研GPU出炉,比27万亿参数芯片还要牛

数据瓶颈

大模型对高质量训练数据的需求巨大。以GPT-3为例,其训练所用数据量高达近500亿个token。获取如此规模的高质量数据并非易事,也存在数据隐私等风险。

模型可解释性

大模型内部的工作机理往往是一个"黑箱",缺乏可解释性,给其在关键领域的应用带来了障碍和风险。如何提高大模型的可解释性和可信赖性,是一个亟待解决的问题。

甩英伟达一条街!中国自研GPU出炉,比27万亿参数芯片还要牛

能耗和碳排放

训练大模型需要消耗大量能源,导致高昂的碳排放。据估算,GPT-3的碳排放量相当于驾车行驶57圈环绕地球。如何降低大模型的能耗是一个重要的可持发展考量。

知识产权和伦理风险

大模型训练所需的海量数据可能涉及知识产权等法律风险。大模型的输出结果也可能带有偏见、虚假信息等伦理风险,需要加强监管。

大模型的未来发展方向

甩英伟达一条街!中国自研GPU出炉,比27万亿参数芯片还要牛

算力创新

加快国产AI芯片的研发和产业化,提供自主可控的算力支持大模型训练。同时推动算力硬件和软件算法的协同创新,提高算力利用效率。

数据赋能

建设高质量数据集,促进数据要素跨领域、跨场景流通。探索隐私计算等技术手段,保护个人隐私。同时加强数据治理,规范数据采集和使用。

模型可解释性提升

加强对大模型内部机理的研究,提出新的可解释AI理论和方法。结合人工智能与因果推理等技术,增强大模型的可解释性和可信赖性。

甩英伟达一条街!中国自研GPU出炉,比27万亿参数芯片还要牛

绿色智能发展

推动算力设施绿色低碳发展,加大可再生能源在算力中心的使用比例。研究高效低碳的模型训练算法,降低大模型的能耗和碳排放。

伦理和监管

加强人工智能伦理研究,制定相关法律法规。建立大模型输出内容的审查和监管机制,防范虚假信息、有害内容的传播。

大模型技术正在引领人工智能发展进入新阶段,但仍需要持创新突破,解决一系列技术和社会挑战,才能真正释放其巨大潜能,造福人类社会。

甩英伟达一条街!中国自研GPU出炉,比27万亿参数芯片还要牛

继续阅读