天天看點

國産AI殺瘋了!以小博大對戰GPT,或為對抗AI iPhone的最強後援

作者:熱點科技

昨日,全球最強端側多模态模型再次重新整理,僅用8B參數,擊敗了OpenAI的GPT-4V和谷歌的Gemini Pro,而且,其OCR長難圖識别重新整理SOTA,圖像編碼速度暴漲150倍,而這個全球最強端側多模态模型不是國外大廠的出品,而是國内大模型研發實力最頭部的公司面壁智能,最新打造出來的面壁小鋼炮MiniCPM-Llama3-V 2.5。

國産AI殺瘋了!以小博大對戰GPT,或為對抗AI iPhone的最強後援

據了解,面壁小鋼炮MiniCPM-Llama3-V 2.5僅憑8B量級的端側模型,在評測平台OpenCompass得分65.1,與閉源模型Qwen-VL-Max或可一戰,綜合性能直接力壓重量級選手GPT-4V和Gemini Pro。在OCR綜合基準測試中,又取得了725分的成績,大幅遠超GPT-4V,并在大模型的“頑疾”幻覺能力上也獲得了重大改進,還有各種基準測試,資料都遠超GPT-4V和Gemini Pro。

國産AI殺瘋了!以小博大對戰GPT,或為對抗AI iPhone的最強後援

簡單來說,MiniCPM-Llama3-V 2.5能看、能讀、速度快、更會思考,而且,還用最小的參數撬動了最強性能!那麼,抛開這些基準測試,這個小鋼炮到底能給我們普通人帶來啥?首先,它能支援30+種語言,包括德語、法語、西班牙語、意大利語、俄語等主流語言;其次,它支援難圖、長圖、長文本的精準識别,比如你在看一個吃瓜長文,總因為“太長不看”而煩惱,丢給它,它就能快速彙總出關鍵内容;如果是一張英文版的圖文資訊,它也能根據你的需求,給出非常精準的彙總;而且,它能夠在一張擁有多種要素資訊的圖檔中,“一眼”看懂圖檔的主題内容,并推理出圖檔的來源資訊,再把“思考”後的資訊整理彙總給我們。當它搭載到手機上,将能直接在裝置端快速、實時運作,減少資料洩露風險,而且,即使沒有網絡連接配接,也能正常工作,還适用于多種裝置,或成為真正的AI“貼身助理”。

國産AI殺瘋了!以小博大對戰GPT,或為對抗AI iPhone的最強後援

繼續閱讀