天天看点

「360智脑大模型4.0」正式发布:文生视频的新时代已经来临

作者:您的AI小助手

360集团于6月13日举行了“360智脑大模型”应用发布会,正式推出了认知型通用大模型“360智脑4.0”。同时,他们还宣布360智脑已经接入了360旗下产品“全家桶”。

该发布会让人联想起不久前英伟达公司使用CEO的数字人开会的场景。在360的发布会上,他们正式推出了一款名为“360AI数字人平台”的产品。创始人周鸿祎亲自在现场创建了自己的数字分身,作为“360发言人”。

「360智脑大模型4.0」正式发布:文生视频的新时代已经来临

360创始人周鸿祎表示:“OpenAI给整个行业探索、指明了一个方向,我们也从善如流,把原来搜索、AI领域积累的能力整合到大模型里。”

360最新发布的智脑大模型是一个千亿级别的自研多模态大模型。该模型拥有四大核心能力,分别是文字处理、图像处理、语音处理和视频处理能力。它能够实现文本生成、文本与图像的结合、文本与表格的结合、图像生成、图像与文本的结合、以及视频理解等多种功能。

图片、文字、视频互相生成,接入360“全家桶

「360智脑大模型4.0」正式发布:文生视频的新时代已经来临

经过两个月的更新,目前的“360智脑”已经推出了4.0版本。然而,在当今市场上,各种大模型产品层出不穷,如何才能给用户留下深刻的印象呢?

为了实现这一目标,360智脑选择了走大而全的路线,直接与微软的全家桶进行竞争。在一次会议上,周鸿祎像倒豆子一样,展示了360大模型的各种功能。

目前,360智脑已经具备了十大核心能力,包括生成与创作、多轮对话、代码能力、文本分类、文本改写、阅读理解、逻辑与推理、知识问答、多模态和翻译等。这些能力涵盖了数百个细分功能,为用户提供了广泛而强大的应用领域。

「360智脑大模型4.0」正式发布:文生视频的新时代已经来临

周鸿祎提到360在发展大型模型方面的底气和积累来源于多个方面。首先,各个业务线为公司带来了技术积累。360早在2015年成立了AI研究院,并开始研究多模态数据。周鸿祎解释说:“360涉及智能家居互联网,如智能摄像头、车载行车记录仪、智能门铃,因此我们也需要具备智能视觉和智能音频处理技术,这是我们开始探索多模态的原因。同时,360的主要收入来源是搜索,所以我们对自然语言理解等大型模型核心技术的积累也是必不可少的。”

在数据方面,360每天抓取1.4亿个网站的数据,其中包括2.8亿份专业文献和1.2亿份行业数据,还有经过清洗的10T级别的用于大型模型训练的数据。

然而,周鸿祎坦承,在OpenAI取得突破之前,360的大型模型尝试主要局限在商业领域,例如“如何利用大型模型提高广告点击率和推荐精准度”。但是,OpenAI为整个行业设定了方向,360也迅速将其在搜索和人工智能领域的积累移植到大型模型中。

对于如何在大型模型时代取得突破,周鸿祎表示,多模态是关键。因此,在发布会上,周鸿祎展示了一些引人注目的功能,如文生文、文生图、文生表、图生图和文生视频。

目前,包括ChatGPT、文心一言和通义千问在内的主要大型模型产品仍停留在生成文字和图片的阶段,视频是多模态领域的难点,学术研究仍处于早期阶段。

「360智脑大模型4.0」正式发布:文生视频的新时代已经来临

在文生视频展示上,360展示了一项以提示词(Prompt)生成视频的功能。这项功能生成了一只在沙漠中洗澡的企鹅和奔跑的野马的视频片段。周鸿祎表示,这些视频的分辨率目前还不够高,只有5秒到10秒左右,但这是一个良好的起点。

目前,360的视频功能主要是在理解视频内容方面展开。可以将其类比为给图像、视频识别添加了一个更聪明的“AI语音助手”。例如,用户可以上传一段视频到模型中,并用自然语言描述一个问题,比如“视频中的车在哪里?”然后,大模型会通过对视频图像进行解析,给出相应的答案。

「360智脑大模型4.0」正式发布:文生视频的新时代已经来临

据介绍,360智脑迭代至4.0版本后,多模态关键能力也有质的提升,将下来全面接入“360全家桶”——包括搜索引擎、浏览器、安全卫士等核心产品中。

“中国进入百模大战时期,除了基础能力外,更重要的是应用场景的比拼。”周鸿祎表示。因此,360在他同时宣布“360智脑4.0”接入浏览器、搜索、安全卫士等360全端产品,实现全面智能化重塑。

主打“安全可信”大模型,推出数字人等应用

「360智脑大模型4.0」正式发布:文生视频的新时代已经来临

除了多模态,360大模型还以安全和应用生态作为两个重要卖点。

安全一直是360的核心业务,在搜索和互联网内容安全审核方面提供服务。360希望在大模型领域继续发展这一优势,尤其是在当前ChatGPT等类产品面临监管压力的情况下。

目前,大模型存在一些难以解决的安全问题,比如绕过模型的安全机制。用户希望通过模型学习如何防范诈骗,并获取有关危险问题的答案。360意识到这些问题,并在大模型中建立了多道安全防线。一方面,他们建立了一个名为"安全大脑"的大模型,用以监督大模型的不当行为,与OpenAI近期提出的监管思路类似。另一方面,360还创建了一个专门的大模型安全评估体系,即将发布。

360表示,他们的智脑已通过工信部信通院的测试,成为国内首个“安全可信”AIGC大模型。安全和可信性是国内大模型面临的重要问题之一。

除了安全,360还展示了一系列商业化计划。

其中一个重点是数字人领域,周鸿祎详细介绍了360 AI数字人广场的新产品。该平台目前拥有200多个角色,分为数字名人和数字员工两大类。数字名人包括历史人物、明星和文学形象等,用户可以与这些数字角色进行对话,获得沉浸式的交流体验。数字员工则可以作为企业员工的知识助手和办公助手。用户可以向数字员工咨询与特定职位相关的问题,如程序员、运营人员和法务专员等。

此外,360 AI数字人还支持定制功能,用户可上传私人知识库,以低成本生成个人定制的数字人,如数字分身、数字助理和数字偶像等。周鸿祎现场演示了以自己为基础创建的数字分身,并通过其声音回答现场问题,充当"360发言人"的角色。

「360智脑大模型4.0」正式发布:文生视频的新时代已经来临

他还表示,在未来,360AI数字人的发展计划是能够生成声音和视频,并具有长期记忆功能,甚至具备目标分解和规划的能力。此外,他们还计划为数字人增加“手和脚”,使其具备执行任务的能力,以更好地为人类提供服务。

就商业化的整体思路而言,360在C端计划将AI大模型能力嵌入核心产品中,使其像AI助手一样为用户提供服务。而在B端,360计划首先在行业大模型和大型企业领域进行应用。周鸿祎承认,基于360多年来为中小企业提供服务的经验来看,让大模型服务“平民化”、“产品化”,仅仅提供大模型API让企业使用并不现实,还需要进一步进行产品化工作。

继续阅读