天天看点

阿里开源编程神器CodeQwen1.5:领跑大型代码库处理与修改!

作者:不秃头程序员
阿里开源编程神器CodeQwen1.5:领跑大型代码库处理与修改!

阿里千问团队推出最强开源编程助手‍‍‍‍‍‍‍‍‍‍‍CodeQwen1.5,有两个模型CodeQwen1.5-7B和CodeQwen1.5-7B-Chat,它们是基于Qwen1.5语言模型构建的专用codeLLM!

CodeQwen1.5 已使用 3T 代码相关数据进行预训练,在代码生成、长上下文建模(64K)、代码编辑和 SQL 方面表现出卓越的能力

此外,在 SWE-Bench 竞赛⚔️中,专有模型历来占据主导地位。然而,CodeQwen1.5 以 0.89 的成绩超越了 ChatGPT-3.5,凸显了开放代码 LLM 的巨大潜力。领先一众开源模型,比如StarCoder2、CodeLlama、DeepSeek-Coder 等‍‍‍

阿里开源编程神器CodeQwen1.5:领跑大型代码库处理与修改!

具体内容:

CodeQwen1.5 是一个基于 7B 参数的多语言代码生成模型,相比现有的 CodeLlama、StarCoder2 等, CodeQwen1.5 在代码生成、长序列建模、代码修改等关键能力上均有出色表现。在 HumanEval、MBPP 等基准测试中,CodeQwen1.5 的 0-shot 和 3-shot 成绩均位居前列,超越了GPT-3.5 以及更大模型 GPT-4。值得一提的是,CodeQwen1.5 不仅擅长 Python,在 C++、Java、JavaScript 等主流编程语言上也展现出强大的功能,支持 92 种编程语言

除了优秀的基础代码生成能力,CodeQwen1.5 在长序列建模方面也有明显优势。通过精心的数据收集和模型训练,该模型最长可以处理达 64K 字符的输入,在处理大型代码仓库中的问题时表现出色。在一项名为"Needle in the Code"的合成评测中,CodeQwen1.5 展现出了出色的长序列理解能力。更进一步,在更贴近实际场景的 SWEBench 评测中,CodeQwen1.5 也取得了不错的成绩,优于闭源的 ChatGPT3.5

除了代码生成与理解,CodeQwen1.5 在代码修改方面也颇有建树。在 CodeEditorBench 的 Debug、Translate、Switch、Polish 等任务中,CodeQwen1.5 在 7B 规模上达到了最好的效果,展现出优秀的代码修改能力。

同时,CodeQwen1.5 还表现出色的 SQL 专家能力,通过自然语言与数据库高效互动,大大降低了非编程人员使用 SQL 的门槛

阿里开源编程神器CodeQwen1.5:领跑大型代码库处理与修改!

结语

阿里坚定开源路线,千问家族已经推出很多开源基础模型了,从各种基准评估来看,表现很不错,可以说引领开源国产大模型

体验地址:

https://huggingface.co/spaces/Qwen/CodeQwen1.5-7b-Chat-demo

详细信息:

https://qwenlm.github.io/zh/blog/codeqwen1.5/

继续阅读