天天看点

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

作者:新智元

编辑:庸庸 乔杨

【新智元导读】5月14日,开源的大语言模型Falcon 2发布,性能超越Llama 3,消息登上了Hacker News热榜第一。「猎鹰」归来,开源宇宙将会迎来新的霸主吗?

这几天,全世界的目光仿佛都被OpenAI发布的GPT-4o所吸引,与此同时,OpenAI的挑战者们也在同步创造历史。

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

就在5月14日,阿布扎比先进技术研究委员会(ATRC)下属的技术创新研究所(TII),发布了新一代的Falcon 2模型。

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

Falcon 2 11B已开启访问,Falcon 2 11B VLM将在5月14日中午12点开放

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

新一代「猎鹰」(Falcon意为猎鹰)重返竞技场,一经推出,迅速登上了HN热榜第一。

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

去年Falcon首次推出就技惊四座,以碾压性的优势超越了Llama。

根据Hugging Face排行榜,这次推出的Falcon 2 11B性能再次超越了Llama 3 8B,与领先的Gemma 7B性能相当,平均性得分仅差0.01。

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

Falcon 2包括两个版本:Falcon 2 11B和Falcon 2 11B VLM。

前者是在 5.5 万亿个token上训练出的大语言模型,后者则在此基础上开发的「视觉到语言」模型。

作为一款开源的大语言模型,Falcon 2不仅具备多语言能力,而且支持多模态,可以将视觉输入无缝转换为文本输出,这种功能是当今大模型市场中的首创。

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

只需要在用户界面上传一张图片并输入提示,就可以得到一段关于图片的文字描述

多语言+多模态

Falcon 2 11B 具有多语言能力,可以快速响应英语、法语、西班牙语、德语、葡萄牙语和其他各种语言的任务。

Falcon 2 11B VLM 作为视觉语言模型,能够从环境中识别和解释各种视觉信息,因此在医疗、金融、电子商务、教育和法律等领域有广泛的应用场景。

比如用于文档管理、上下文索引等任务,而且其「视觉到语言」的功能还有望在未来为视障人群提供帮助。

此外,Falcon 2只需一个GPU就能高效运行,可以轻易部署在笔记本电脑上。

为了加快推进Falcon商业化的进程,去年11月,ATRC就成立了一家新公司——AI71

基于Falcon模型,AI71已经进军阿联酋的教育、医疗、法律等多个领域,并计划很快拓展到阿联酋以外。Falcon的本次升级,为其商业化进程提供了有力支撑。

坚持开源的Falcon

TII发布的人工智能模型,在全球范围内一直名列前茅,新推出的Falcon 2 11B 模型让TII的地位再次得到稳固。

更重要的是,本次更新的两个模型版本均已开源,全世界的开发人员都可以不受限制地使用,并在此基础上进行开发和部署。模型展现出的优秀性能意味着TII有望与Meta竞争开源宇宙霸主的地位。

阿布扎比先进技术研究委员会(ATRC)秘书长 Faisal Al Bannai 承诺,将会坚持推动开源创新,帮助全世界的开发者们实现他们的AI之旅。

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

TII首席研究员Hakim Hacid博士也表示「开发人员正在认识到更小、更高效模型的无数好处······这是下一个新兴的大趋势。此外,Falcon 2的视觉转语言能力为人工智能的易用性开辟了新的前景,为用户提供了变革性的从图像到文本的交互方式。」

TII还透露其正在酝酿Falcon 2下一代模型,推出时间将在不久之后,这些模型的性能将通过专家混合(MoE)技术得到进一步增强。

开源与闭源之争,战局未定。但无论如何,TII已经成为AGI领域的一支劲旅,这背后是阿联酋自上而下形成的合力,他们正全力推动人工智能的发展,将这项技术视为继石油之后的下一个经济支柱。

Falcon不仅仅是作为「严肃的参与者」而存在,而是雄心勃勃振翅盘旋的「猎鹰」。