天天看點

科大訊飛正式釋出星火認知大模型V2.0,代碼能力和多模态能力均顯著提升

作者:注意管道

驅動中國2023年8月15日消息,今日14:00,科大訊飛召開了星火認知大模型V2.0的釋出會,正式公布了一些新能力,将上線“代碼生成、圖檔生成、視訊生成、星火插件”等新功能。

其中代碼生成能力可以實作代碼生成、代碼補齊、代碼糾錯、代碼解釋、單元測試生成等。

科大訊飛正式釋出星火認知大模型V2.0,代碼能力和多模态能力均顯著提升

在釋出會現場,科大訊飛還示範了通過星火認知大模型V2.0來一句話編寫代碼,僅僅是發出了用Python寫一個貪吃蛇小遊戲的指令,就自動生成了一個簡單的小遊戲,能力非常強大。

科大訊飛董事長劉慶峰介紹,訊飛星火V2.0代碼能力實作大幅度提升,從業界參考測試集上的效果對比來看,星火V2.0基于Python和C++進行代碼寫作能力已高度逼近ChatGPT,差距僅為1%和2%。

從Python語言的代碼生成、補齊、糾錯、解釋和單元測試生成這幾個次元都可以看到,現在訊飛星火V2.0代碼生成和補齊已經超過了Chat GPT,其他幾項能力也在快速追趕中。

科大訊飛正式釋出星火認知大模型V2.0,代碼能力和多模态能力均顯著提升

據劉慶峰介紹,目前訊飛星火V2.0對于代碼的邏輯、算法、方法、體系、資料準備已經全部就緒。

基于此,科大訊飛公布了基于星火2.0的智能程式設計助手:iFlyCode 1.0。

據悉,iFlyCode 1.0擁有星火大模型的所有代碼生成相關能力,并可以無縫內建至開發環境。

科大訊飛正式釋出星火認知大模型V2.0,代碼能力和多模态能力均顯著提升

此外,它還可以幫助開發者生成功能實作思路,提供修改建議,并解答相關的專業提問。

根據訊飛内部的研發效能統計,超過2000名員工在使用iFlyCode 1.0後,代碼的采納率提升30%以上,編碼效率提升30%以上,綜合效率提升超過了15%。

可以說,iFlyCode 1.0的推出,解放了開發的生産力,大大提升了效率。

此外,訊飛星火認知大模型V2.0還展示了語音生成圖檔、虛拟人等功能。據現場展示,訊飛星火認知大模型V2.0能夠快速根據指令生成準确圖檔,同時還能根據新指令對圖檔進行修改。

科大訊飛正式釋出星火認知大模型V2.0,代碼能力和多模态能力均顯著提升

比如,生成一副雪山壯麗景色,高聳山峰被白雪覆寫的圖檔後,又新增“加上小女孩登山”的需求,訊飛星火認知大模型V2.0都能正确生成内容。

在中文了解方面,訊飛星火認知大模型V2.0也能完美生成像“關羽騎機車”“山重水複疑無路,柳暗花明又一村”等圖檔,領先競品。

除圖檔外,訊飛星火認知大模型V2.0還支援生成帶有虛拟人的視訊,對公司企業來說,可以省去請真人拍攝産品等宣傳片的成本。

劉慶峰表示,目前代碼能力的邏輯、算法、方法體系、資料準備已就緒,所需要的就是時間和算力。

訊飛星火認知大模型V2.0的代碼能力和多模态能力均持續提升,2.0版本中,文本生成能力提升72%,語言了解提升78%,知識問答提升70%,邏輯推理提升60%,數學能力提升72%。

科大訊飛正式釋出星火認知大模型V2.0,代碼能力和多模态能力均顯著提升

訊飛星火認知大模型的數學能力在國内首屈一指,在聯考後各大第三方評測中遙遙領先。釋出會上,訊飛還示範了一道三角形數學題,并表示國内隻有訊飛星火認知大模型V2.0能解答這一數學問題。

此次釋出會的重頭戲就是代碼能力,訊飛稱,從代碼生成、補齊、糾錯、解釋和單元測試生成,這幾個次元都可以看到,現在在代碼生成和補齊上已經超過了ChatGPT,其他各項能力也正在快速追趕。

科大訊飛正式釋出星火認知大模型V2.0,代碼能力和多模态能力均顯著提升

劉慶峰表示,我們已經定了非常明确的目标,到今年10月24号,各個代碼的能力都會超越ChatGPT,明年上半年将正式對标GPT4。

在訊飛看來,代碼是一個硬碰硬的能力,不存在任何主觀評分的标準,是以它也應該被當成是大模型聰明程度的非常重要的标志。

繼續閱讀