天天看点

Falcon 2:阿联酋技术创新研究所发布新的AI模型系列,性能优于Meta的新Llama 3

作者:中电网

?下一代Falcon 2系列推出开源、多语言、多模式的AI模型,并且是唯一具有视觉到语言能力的AI模型

?新的Falcon 2 11B在性能上超越了Meta的Llama 3 8B,并且与领先的Google Gemma 7B模型表现相当,这一点已经得到Hugging Face排行榜的独立验证。

?近期计划包括探索“混合专家”以增强机器学习能力

阿布扎比, 阿拉伯联合酋长国--(美国商业资讯)--科技创新研究所(Technology Innovation Institute, 简称 "TII" ),作为全球顶尖的科学研究中心及阿布扎比高级技术研究委员会(Advanced Technology Research Council, 简称 "ATRC" )的应用研究支柱,今日发布了其知名大型语言模型(LLM)Falcon 2的第二版本。在此系列中,推出了两个开创性版本:一个是Falcon 2 11B,一个效率更高、更易使用的LLM,训练于5.5万亿token并拥有110亿参数;另一个是Falcon 2 11B VLM,以其视觉到语言模型(VLM)能力着称,能够将视觉输入无缝转化为文字输出。虽然两款模型均支持多语言,但值得一提的是,Falcon 2 11B VLM作为TII首款多模态模型,在当前顶尖市场中独树一帜,拥有图像转文本的能力,这代表了AI创新的一大突破。

本新闻稿包含多媒体。此处查看新闻稿全文: https://www.businesswire.com/news/home/20240513830073/zh-CN/

经过与其类别中多个知名的预训练AI模型的比较测试后,Falcon 2 11B在性能上超越了Meta新发布的具有80亿参数(8B)的Llama 3,并与排名第一的 Google Gemma 7B并驾齐驱(Falcon 2 11B: 64.28对比Gemma 7B: 64.29),这一结果已由位于美国的平台Hugging Face独立验证。Hugging Face是一个提供开放型LLM的客观评估工具和全球排行榜的平台。更为重要的是,Falcon 2 11B与11B VLM均为开源,为全球开发者提供无限制的访问机会。未来,计划将扩展Falcon 2下一代模型,推出多种不同规模的模型。这些模型将通过如“混合专家”(MoE)等先进的机器学习功能进行进一步的增强,目的在于将它们的性能提升到更加精细的水平。

TII至今发布的所有AI模型一直在全球名列前茅,被誉为最强大的开源大型语言模型(LLM)。新推出的、更为精巧多功能的Falcon 2 11B模型预计将使TII在快速变化的生成式AI世界中,得到更广泛的市场采纳。

Falcon 2 11B模型具备多语言处理能力,能够流畅地处理包括英语、法语、西班牙语、德语及葡萄牙语在内的多种语言任务,其多功能性和在不同场景下的效能因此得到了增强。而作为一款视觉到语言模型的Falcon 2 11B VLM,能识别并解读周围环境中的图像与视觉信息,提供了一系列在医疗保健、金融、电子商务、教育及法律等多个行业中的应用。这包括从文件管理、数字归档与上下文索引,到帮助视觉障碍人士等应用。更重要的是,这些模型能够仅利用一个图形处理单元(GPU)来高效运转,使其具有高度的扩展性和便于部署,且容易整合到笔记本电脑等轻型基础设施与其他设备中。

阿联酋总统战略研究与先进技术事务顾问、ATRC秘书长H.E. Faisal Al Bannai表示:“随着Falcon 2 11B的问世,我们为Falcon 2系列带来了第一款模型。Falcon 2 11B不仅展示了出色的表现,同时我们也借此再次确认了我们对开源运动的坚定承诺以及对Falcon基金会的支持。随着其他各种规模的多模式模型即将进入市场,我们希望确保那些重视隐私的开发者与实体可以使用到一流的AI模型,以实现他们的AI之旅。”

在谈及这款模型时,TII人工智能跨中心单位的执行董事兼代理首席研究员Dr. Hakim Hacid分享道:“随着AI技术不断进步,开发者逐渐意识到更小型、效率更高模型的种种优势。除了减少对计算能力的需求和达到可持续性的目标外,这些模型还能提供卓越的灵活性,轻松地与边缘AI基础设施完美融合——这是正在兴起的下一大趋势。加之,Falcon 2的视觉到语言功能为AI的易用性开拓了新天地,将图像转文本的创新互动方式带给用户。”

Falcon 2 11B的多样性也鼓励TII考虑投入更多令人兴奋的GenAI创新项目。其中,将采纳一种名为“混合专家”的新型机器学习技术。这种方法融合了具有不同专长的小型网络,确保最具专业知识的领域协同工作,提供高度精细和定制化的回应——仿佛拥有一个团队里的智能助手,每位成员都擅长不同的领域,并在需要时合作进行预测或做出决策。这种方式不仅增强了准确性,还加快了决策过程,为发展更加智能、高效的AI系统铺平了道路。

Falcon 2 11B 根据 TII Falcon License 2.0 获得授权,这是基于 Apache 2.0 的宽松软件许可证,其中包括促进负责任地使用人工智能的可接受的使用政策。 有关新型号的更多信息,请访问FalconLLM.TII.ae。

资料来源:AETOSWire

免责声明:本公告之原文版本乃官方授权版本。译文仅供方便了解之用,烦请参照原文,原文版本乃唯一具法律效力之版本。

在 businesswire.com 上查看源版本新闻稿: https://www.businesswire.com/news/home/20240513830073/zh-CN/

CONTACT:

Jennifer Dewan, 传播高级总监

[email protected]

Falcon 2:阿联酋技术创新研究所发布新的AI模型系列,性能优于Meta的新Llama 3

Falcon 图像字幕生成器(照片来源:AETOSWire)

继续阅读