阿裡開源程式設計神器CodeQwen1.5：領跑大型代碼庫處理與修改！

作者：不秃頭程式員 2024-04-17 21:43:00

阿裡千問團隊推出最強開源程式設計助手‍‍‍‍‍‍‍‍‍‍‍CodeQwen1.5，有兩個模型CodeQwen1.5-7B和CodeQwen1.5-7B-Chat，它們是基于Qwen1.5語言模型建構的專用codeLLM！

CodeQwen1.5 已使用 3T 代碼相關資料進行預訓練，在代碼生成、長上下文模組化（64K）、代碼編輯和 SQL 方面表現出卓越的能力

此外，在 SWE-Bench 競賽⚔️中，專有模型曆來占據主導地位。然而，CodeQwen1.5 以 0.89 的成績超越了 ChatGPT-3.5，凸顯了開放代碼 LLM 的巨大潛力。領先一衆開源模型，比如StarCoder2、CodeLlama、DeepSeek-Coder 等‍‍‍

具體内容：

CodeQwen1.5 是一個基于 7B 參數的多語言代碼生成模型,相比現有的 CodeLlama、StarCoder2 等, CodeQwen1.5 在代碼生成、長序列模組化、代碼修改等關鍵能力上均有出色表現。在 HumanEval、MBPP 等基準測試中,CodeQwen1.5 的 0-shot 和 3-shot 成績均位居前列,超越了GPT-3.5 以及更大模型 GPT-4。值得一提的是,CodeQwen1.5 不僅擅長 Python,在 C++、Java、JavaScript 等主流程式設計語言上也展現出強大的功能，支援 92 種程式設計語言

除了優秀的基礎代碼生成能力,CodeQwen1.5 在長序列模組化方面也有明顯優勢。通過精心的資料收集和模型訓練,該模型最長可以處理達 64K 字元的輸入,在處理大型代碼倉庫中的問題時表現出色。在一項名為"Needle in the Code"的合成評測中,CodeQwen1.5 展現出了出色的長序列了解能力。更進一步,在更貼近實際場景的 SWEBench 評測中,CodeQwen1.5 也取得了不錯的成績,優于閉源的 ChatGPT3.5

除了代碼生成與了解,CodeQwen1.5 在代碼修改方面也頗有建樹。在 CodeEditorBench 的 Debug、Translate、Switch、Polish 等任務中,CodeQwen1.5 在 7B 規模上達到了最好的效果,展現出優秀的代碼修改能力。

同時,CodeQwen1.5 還表現出色的 SQL 專家能力,通過自然語言與資料庫高效互動,大大降低了非程式設計人員使用 SQL 的門檻

結語

阿裡堅定開源路線，千問家族已經推出很多開源基礎模型了，從各種基準評估來看，表現很不錯，可以說引領開源國産大模型

體驗位址：

https://huggingface.co/spaces/Qwen/CodeQwen1.5-7b-Chat-demo

詳細資訊：

https://qwenlm.github.io/zh/blog/codeqwen1.5/

阿裡開源程式設計神器CodeQwen1.5：領跑大型代碼庫處理與修改！

繼續閱讀

好戲将開始！華為自研PC處理器曝光，英特爾X86不再是桌面唯一

OPPO Reno12 Pro或搭載天玑9200處理器，還有平闆耳機等新品

承包土地被征用時土地承包合同解除及後續處理

模具鋼氮化處理技術介紹

同福“接手”阿裡零售通，實體經濟與網際網路格局生變？

今年最猛手機處理器曝光，性能秒殺高通和蘋果！

阿裡巴巴倚天710 128核心處理器實測：Arm史上最快！

阿裡廣告的黃金時代：無線推薦大浪潮

抽獎詳情這世界不會隻有我一個人洗衣服還在手搓吧？前陣子和朋友聚會，拿東西吃的時候不小心蹭到袖口，我吐槽說今晚回去又要搓好

iPhone16采用全新防炫光材料；傳iPadPro首發M4處理器提升AI性能

造孽！内蒙老人家門口放羊被罰3000元，羊被拉走！官方：處理合規

PT薄膜不進行等離子表面處理直接點膠會怎麼樣？-鴻展自動化

真行！外籍人員公然在迪士尼插隊引衆怒，從業人員被處理大快人心

12306授權，12306無法處理？高鐵wifi彈髒話隻對水果手機上熱搜！

姗姗來遲，英特爾正式回應13、14代酷睿處理器運作不穩定的問題

标題：豆腐煎之前，要洗一洗？中午，我婆婆在廚房裡忙碌着，準備着煎豆腐。我順口問了一句：“豆腐洗了嗎？”這個簡單的問題似乎