阿里开源编程神器CodeQwen1.5：领跑大型代码库处理与修改！

作者：不秃头程序员 2024-04-17 21:43:00

阿里千问团队推出最强开源编程助手‍‍‍‍‍‍‍‍‍‍‍CodeQwen1.5，有两个模型CodeQwen1.5-7B和CodeQwen1.5-7B-Chat，它们是基于Qwen1.5语言模型构建的专用codeLLM！

CodeQwen1.5 已使用 3T 代码相关数据进行预训练，在代码生成、长上下文建模（64K）、代码编辑和 SQL 方面表现出卓越的能力

此外，在 SWE-Bench 竞赛⚔️中，专有模型历来占据主导地位。然而，CodeQwen1.5 以 0.89 的成绩超越了 ChatGPT-3.5，凸显了开放代码 LLM 的巨大潜力。领先一众开源模型，比如StarCoder2、CodeLlama、DeepSeek-Coder 等‍‍‍

具体内容：

CodeQwen1.5 是一个基于 7B 参数的多语言代码生成模型,相比现有的 CodeLlama、StarCoder2 等, CodeQwen1.5 在代码生成、长序列建模、代码修改等关键能力上均有出色表现。在 HumanEval、MBPP 等基准测试中,CodeQwen1.5 的 0-shot 和 3-shot 成绩均位居前列,超越了GPT-3.5 以及更大模型 GPT-4。值得一提的是,CodeQwen1.5 不仅擅长 Python,在 C++、Java、JavaScript 等主流编程语言上也展现出强大的功能，支持 92 种编程语言

除了优秀的基础代码生成能力,CodeQwen1.5 在长序列建模方面也有明显优势。通过精心的数据收集和模型训练,该模型最长可以处理达 64K 字符的输入,在处理大型代码仓库中的问题时表现出色。在一项名为"Needle in the Code"的合成评测中,CodeQwen1.5 展现出了出色的长序列理解能力。更进一步,在更贴近实际场景的 SWEBench 评测中,CodeQwen1.5 也取得了不错的成绩,优于闭源的 ChatGPT3.5

除了代码生成与理解,CodeQwen1.5 在代码修改方面也颇有建树。在 CodeEditorBench 的 Debug、Translate、Switch、Polish 等任务中,CodeQwen1.5 在 7B 规模上达到了最好的效果,展现出优秀的代码修改能力。

同时,CodeQwen1.5 还表现出色的 SQL 专家能力,通过自然语言与数据库高效互动,大大降低了非编程人员使用 SQL 的门槛

结语

阿里坚定开源路线，千问家族已经推出很多开源基础模型了，从各种基准评估来看，表现很不错，可以说引领开源国产大模型

体验地址：

https://huggingface.co/spaces/Qwen/CodeQwen1.5-7b-Chat-demo

详细信息：

https://qwenlm.github.io/zh/blog/codeqwen1.5/

阿里开源编程神器CodeQwen1.5：领跑大型代码库处理与修改！

继续阅读

又一例！46岁茶农上山采茶被野狗咬伤，未及时处理狂犬病发身亡

白大拿调侃快递小哥，暴力处理快递，引发网民热议，素质也不高啊

教育男孩用对方法很重要，孩子做错事比道歉更有效的处理方式

想吐槽一下某宝：5.10那天某宝6周年，有买东西抽免单，我买了巧克力，抽了23.8无门槛免单优惠券，然后用这个券买了4本

吵架后，男人不理你，情商高的女人一般都是这样处理

5月2日，马来西亚掀起了一股华为Pura系列的预售热潮。华为商城上公布的处理器型号成为了热议焦点。便宜的Pura70搭载

2024年，三大神U推荐，近期想入手的小伙伴们可以考虑这几款处理器。#这是什么处理器##一起来讨论数码##一起来聊数码#

小女孩误打珍贵瓷瓶，展馆温情处理赢得网友点赞

七千买的手机维修费1.4万！手机维修水太深？官方处理结果公布！

1076元起！香橙派、华为发布鲲鹏Pro开发板：处理器很神秘

这名教师拒绝修改成绩，但家长却声称他们背后有人，并威胁校方和教师。教师深感困惑，挂科是正常现象，但为何要为难他？在教师表

双马风云再起：腾讯市值登顶，阿里何处去？

华为麒麟处理器为何要死磕超线程？因为手机超线程只有华为玩得转

放弃印度转道中国，国外网友马斯克处理好特斯拉的烂摊子了

智能眼镜重生：AR芯片、AI大模型、声效处理单元进入迭代新周期

诺基亚新版5300登场，搭载骁龙7Gen2处理器，音乐无敌