面壁新模型：早于Llama3、比肩 Llama3、推理超越 Llama3！

[雷峰网]两周前，面壁发布领先的开源大模型「Eurux-8x22B 」。相比口碑之作 Llama3-70B，发布时间更早，综合性能相当，尤其是拥有更强的推理性能——刷新开源大模型推理性能 SOTA，堪称开源大模型中「理科状元」。激活参数仅 39B，支持 64k 上下文，相比 Llama3 速度更快、可处理更长文本。

图注：面壁Eurux-8x22B 模型在 LeetCode 和 TheoremQA这两个具有挑战性的基准测试中，刷新开源大模型推理性能 SOTA。

图注：面壁Eurux-8x22B 模型综合性能比肩 LlaMa3-70B，超越开源模型 WizardLM-2-8x22b, Mistral-8x22b-Instruct,DeepSeek-67b，以及闭源模型 GPT-3.5-turbo。

Eurux-8x22B 由 Mistral-8x22B对齐而来。强劲战斗力，来自面壁 Ultra 对齐技术上新 UltraInterat 大规模、高质量对齐数据集。此前，面壁 Ultra 对齐系列数据集已经“强壮”了全球超 200 个大模型，堪称大模型上分神器。

Eurux-8x22B模型+对齐数据集，全家桶开源：

https://github.com/OpenBMB/Eurus

https://huggingface.co/openbmb/Eurux-8x22b-nca

开源大模型「理科状元」

复杂推理能力是体现大模型性能差异的最核心能力之一，也是大模型真正落地应用所需的关键能力所在。

Eurux-8x22B 在代码和数学等复杂推理的综合性能方面超越 Llama3-70B，刷新开源大模型 SOTA，堪称「理科状元」。特别在 LeetCode （180道LeetCode真题）和 TheoremQA（美国大学水准的STEM题目）这两个具有挑战性的基准测试中，超过现有开源模型。

图注：Eurux-8x22B 在代码和数学等复杂推理综合性能方面超越 Llama3-70B，刷新开源大模型 SOTA。

开源大模型「理科状元」Eurux-8x22B在实际应用中表现如何呢？

在近期 LeetCode 周赛，这一检验人类程序员编程能力的真实竞技场上：Eurux-8x22B 在 Python 编程方面取得综合排名超越了80% 的人类参赛选手的优秀成绩，成功解决四道算法题中的三道，可以初步通过互联网大厂的程序员编程面试。

下面是本次周赛中Eurux-8x22B对一道中等难度的算法题的真实解答：

除了代码能力优秀，Eurux-8x22B 解答数学题也是轻而易举。

例如给它一道高中排列组合题，Eurux-8x22B 首先给出了清晰的解题思路，然后一步步地拆解执行，再进行结果汇总，最后得到正确答案。

再考察它一道代数题，Eurux-8x22B 直击要害，运用二项式定理，清晰简洁地给出了正确的解答。

接着给它一道向量代数题，Eurux-8x22B 也能轻松拿下。

高考函数题可能是令很多人回忆起来就头疼的一类题，Eurux-8x22B 也能解答无误。

（需要说明的是，Eurux-8x22B 没有针对中文语料进行额外的微调和对齐!）

面壁 Ultra 对齐技术，大模型上分神器！

本次大模型「理科状元」 Eurux-8x22B 的优异表现，得益于来自面壁 Ultra 对齐技术的大规模、高质量对齐数据集UltraInteract上新。

好数据，才有好模型。此前，面壁 Ultra 对齐技术已经“强壮”了全球超 200 个大模型，堪称大模型上分神器。

➤ UltraInterat对齐数据集地址：

? https://github.com/OpenBMB/Eurus

UltraInteract是专门设计用于提升大模型推理能力的大规模、高质量的对齐数据集，包含了覆盖数学、代码和逻辑推理问题的12个开源数据集的86K条指令和220K偏好对，共有五十万（条）左右数据。相比而言，LLaMA 3-70B模型则是使用了千万量级的对齐数据，这从侧面证明了 UltraInteract 数据集的优质性——数据质量胜过数据数量。UltraInteract 数据集开源后在社区受到了广泛好评。

从领先的端侧模型「小钢炮」MiniCPM，到开源模型推理新 SOTA 的Eurux-8x22B，为什么面壁智能总能推出同等参数、性能更优的「高效大模型」？答案是，大模型是一项系统工程，而面壁作为国内极少数兼具大模型算法与 infra 能力的团队，拥有自研的全流程高效生产线：面壁 Ultra 对齐技术、Infra 工艺、独家「模型沙盒」实验和现代化数据工厂，从数据、训练到调校工艺环环相扣，一条优秀的大模型Scaling Law增长曲线由此而生。

Infra工艺方面，面壁构建了全流程优化加速工具套件平台ModelForce，可以实现 10 倍推理加速，90% 成本降低。

算法方面，通过上千次以上的「模型沙盒」实验，探索更加科学的训模方法。以小见大，寻找高效模型训练配置，实现模型能力快速形成。

➤ Eurux-8x22B模型GitHub地址：

https://github.com/OpenBMB/Eurus

➤ Eurux-8x22B模型HuggingFace地址：https://huggingface.co/openbmb/Eurux-8x22b-nc

➤ UltraInterat对齐数据集地址：

https://github.com/OpenBMB/Eurus

面壁新模型：早于Llama3、比肩 Llama3、推理超越 Llama3！

开源大模型「理科状元」

开源大模型「理科状元」

面壁 Ultra 对齐技术，大模型上分神器！

继续阅读

BIM复杂大模型轻量化难题，这款轻量化引擎帮你轻松解决！

【积木玩具车】39.9元起！四个车型，仿真模型，真车1:14比例复刻还原！积木衔接丝滑紧密，光滑无刺～

零一万物李谋：当大模型推理遇到算力瓶颈，如何进行工程优化？

人工智能也能提供“情绪价值”了，OpenAI发布全新大模型GPT-4o

李开复首次分享零一万物大模型方法论，并表示十年不变现

大模型效能工具之智能CommitMessage

众多企业都在用，大模型在中国全面落地，豆包大模型优势在哪？

初中数学几何模型之最短路径和将军饮马模型

探索大语言模型：理解Self Attention| 京东物流技术团队

谷歌I/O开发者大会总结：Gemini 1.5 Pro大模型、全新TPU芯片、多项AI功能

vivo发高端新机，卷上影像算法，也卷大模型

查理芒格已走，这100个思维模型永存

字节跳动打响大模型价格战？价格比同行低99.3%，称不用亏损换收入

华为HDC 2024大会将发盘古大模型5.0丨马斯克xAI计划融资60亿美元

2024热潮继续！本地跑AI大模型，解锁无网尽享它的魔力！

vivo发布首款Ultra版手机蓝心大模型升级为多模态