天天看點

時隔一年Falcon回歸!110億參數5.5萬億token,性能超越Llama 3

作者:新智元

編輯:庸庸 喬楊

【新智元導讀】5月14日,開源的大語言模型Falcon 2釋出,性能超越Llama 3,消息登上了Hacker News熱榜第一。「獵鷹」歸來,開源宇宙将會迎來新的霸主嗎?

這幾天,全世界的目光仿佛都被OpenAI釋出的GPT-4o所吸引,與此同時,OpenAI的挑戰者們也在同步創造曆史。

時隔一年Falcon回歸!110億參數5.5萬億token,性能超越Llama 3

就在5月14日,阿布紮比先進技術研究委員會(ATRC)下屬的技術創新研究所(TII),釋出了新一代的Falcon 2模型。

時隔一年Falcon回歸!110億參數5.5萬億token,性能超越Llama 3

Falcon 2 11B已開啟通路,Falcon 2 11B VLM将在5月14日中午12點開放

時隔一年Falcon回歸!110億參數5.5萬億token,性能超越Llama 3

新一代「獵鷹」(Falcon意為獵鷹)重返競技場,一經推出,迅速登上了HN熱榜第一。

時隔一年Falcon回歸!110億參數5.5萬億token,性能超越Llama 3

去年Falcon首次推出就技驚四座,以碾壓性的優勢超越了Llama。

根據Hugging Face排行榜,這次推出的Falcon 2 11B性能再次超越了Llama 3 8B,與領先的Gemma 7B性能相當,平均性得分僅差0.01。

時隔一年Falcon回歸!110億參數5.5萬億token,性能超越Llama 3

Falcon 2包括兩個版本:Falcon 2 11B和Falcon 2 11B VLM。

前者是在 5.5 萬億個token上訓練出的大語言模型,後者則在此基礎上開發的「視覺到語言」模型。

作為一款開源的大語言模型,Falcon 2不僅具備多語言能力,而且支援多模态,可以将視覺輸入無縫轉換為文本輸出,這種功能是當今大模型市場中的首創。

時隔一年Falcon回歸!110億參數5.5萬億token,性能超越Llama 3

隻需要在使用者界面上傳一張圖檔并輸入提示,就可以得到一段關于圖檔的文字描述

多語言+多模态

Falcon 2 11B 具有多語言能力,可以快速響應英語、法語、西班牙語、德語、葡萄牙語和其他各種語言的任務。

Falcon 2 11B VLM 作為視覺語言模型,能夠從環境中識别和解釋各種視覺資訊,是以在醫療、金融、電子商務、教育和法律等領域有廣泛的應用場景。

比如用于文檔管理、上下文索引等任務,而且其「視覺到語言」的功能還有望在未來為視障人群提供幫助。

此外,Falcon 2隻需一個GPU就能高效運作,可以輕易部署在筆記本電腦上。

為了加快推進Falcon商業化的程序,去年11月,ATRC就成立了一家新公司——AI71

基于Falcon模型,AI71已經進軍阿聯酋的教育、醫療、法律等多個領域,并計劃很快拓展到阿聯酋以外。Falcon的本次更新,為其商業化程序提供了有力支撐。

堅持開源的Falcon

TII釋出的人工智能模型,在全球範圍内一直名列前茅,新推出的Falcon 2 11B 模型讓TII的地位再次得到穩固。

更重要的是,本次更新的兩個模型版本均已開源,全世界的開發人員都可以不受限制地使用,并在此基礎上進行開發和部署。模型展現出的優秀性能意味着TII有望與Meta競争開源宇宙霸主的地位。

阿布紮比先進技術研究委員會(ATRC)秘書長 Faisal Al Bannai 承諾,将會堅持推動開源創新,幫助全世界的開發者們實作他們的AI之旅。

時隔一年Falcon回歸!110億參數5.5萬億token,性能超越Llama 3

TII首席研究員Hakim Hacid博士也表示「開發人員正在認識到更小、更高效模型的無數好處······這是下一個新興的大趨勢。此外,Falcon 2的視覺轉語言能力為人工智能的易用性開辟了新的前景,為使用者提供了變革性的從圖像到文本的互動方式。」

TII還透露其正在醞釀Falcon 2下一代模型,推出時間将在不久之後,這些模型的性能将通過專家混合(MoE)技術得到進一步增強。

開源與閉源之争,戰局未定。但無論如何,TII已經成為AGI領域的一支勁旅,這背後是阿聯酋自上而下形成的合力,他們正全力推動人工智能的發展,将這項技術視為繼石油之後的下一個經濟支柱。

Falcon不僅僅是作為「嚴肅的參與者」而存在,而是雄心勃勃振翅盤旋的「獵鷹」。