天天看點

阿裡開源程式設計神器CodeQwen1.5:領跑大型代碼庫處理與修改!

作者:不秃頭程式員
阿裡開源程式設計神器CodeQwen1.5:領跑大型代碼庫處理與修改!

阿裡千問團隊推出最強開源程式設計助手‍‍‍‍‍‍‍‍‍‍‍CodeQwen1.5,有兩個模型CodeQwen1.5-7B和CodeQwen1.5-7B-Chat,它們是基于Qwen1.5語言模型建構的專用codeLLM!

CodeQwen1.5 已使用 3T 代碼相關資料進行預訓練,在代碼生成、長上下文模組化(64K)、代碼編輯和 SQL 方面表現出卓越的能力

此外,在 SWE-Bench 競賽⚔️中,專有模型曆來占據主導地位。然而,CodeQwen1.5 以 0.89 的成績超越了 ChatGPT-3.5,凸顯了開放代碼 LLM 的巨大潛力。領先一衆開源模型,比如StarCoder2、CodeLlama、DeepSeek-Coder 等‍‍‍

阿裡開源程式設計神器CodeQwen1.5:領跑大型代碼庫處理與修改!

具體内容:

CodeQwen1.5 是一個基于 7B 參數的多語言代碼生成模型,相比現有的 CodeLlama、StarCoder2 等, CodeQwen1.5 在代碼生成、長序列模組化、代碼修改等關鍵能力上均有出色表現。在 HumanEval、MBPP 等基準測試中,CodeQwen1.5 的 0-shot 和 3-shot 成績均位居前列,超越了GPT-3.5 以及更大模型 GPT-4。值得一提的是,CodeQwen1.5 不僅擅長 Python,在 C++、Java、JavaScript 等主流程式設計語言上也展現出強大的功能,支援 92 種程式設計語言

除了優秀的基礎代碼生成能力,CodeQwen1.5 在長序列模組化方面也有明顯優勢。通過精心的資料收集和模型訓練,該模型最長可以處理達 64K 字元的輸入,在處理大型代碼倉庫中的問題時表現出色。在一項名為"Needle in the Code"的合成評測中,CodeQwen1.5 展現出了出色的長序列了解能力。更進一步,在更貼近實際場景的 SWEBench 評測中,CodeQwen1.5 也取得了不錯的成績,優于閉源的 ChatGPT3.5

除了代碼生成與了解,CodeQwen1.5 在代碼修改方面也頗有建樹。在 CodeEditorBench 的 Debug、Translate、Switch、Polish 等任務中,CodeQwen1.5 在 7B 規模上達到了最好的效果,展現出優秀的代碼修改能力。

同時,CodeQwen1.5 還表現出色的 SQL 專家能力,通過自然語言與資料庫高效互動,大大降低了非程式設計人員使用 SQL 的門檻

阿裡開源程式設計神器CodeQwen1.5:領跑大型代碼庫處理與修改!

結語

阿裡堅定開源路線,千問家族已經推出很多開源基礎模型了,從各種基準評估來看,表現很不錯,可以說引領開源國産大模型

體驗位址:

https://huggingface.co/spaces/Qwen/CodeQwen1.5-7b-Chat-demo

詳細資訊:

https://qwenlm.github.io/zh/blog/codeqwen1.5/

繼續閱讀