作者|武靜靜
編輯|鄧詠儀
1月30日,科大訊飛釋出新更新的訊飛認知大模型星火V3.5,并釋出了自研的語音大模型,以及星火開源大模型——星火開源-13B。
過去一年,科大訊飛的重點都在大模型方向上,臨近歲末放出大量更新,某種程度也展示了訊飛的投入決心。就在1月29日,公司釋出了2023年業績預告:預計營收為200億元,比2022年增長了7%。不過,由于大模型方面的巨大投入,公司的淨利潤有所下降,2023年公司預計(扣除非經常性損益後)淨利潤在0.8億元-1.2億元區間,比2022年下滑了70%以上。
科大訊飛稱,訊飛星火V3.5基于全國産化算力底座飛星一号平台打造,是首個基于全國産化算力平台訓練的全民開放大模型。更新後的訊飛星火V3.5在邏輯推理、語言了解、文本生成、數學答題、代碼、多模态等七大能力上均有提升。
更新之後,訊飛星火的文本生成能力和數理運算能力都有提升,可以輕松回答初三的數學實體題。
現場示範中,對“前進20米、右轉60 、反複下去能否回到原點,如果能回到,需要多少米”這一問題,星火V3.5都可以輕松應對。
整體參數上,星火V3.5在語言了解、數學能力已超過GPT-4 Turbo,代碼能力和多模态了解能力,都已達到GPT-4V能力的90%以上。
星火V3.5與GPT能力對比
依靠星火V3.5的新更新,科大訊飛也釋出了新的AIGC工具“訊飛智文”。
在現場,科大訊飛同樣進行了實時示範。依據給定的文檔資訊,訊飛智文可以用20秒時間,快速制作出一套幾十頁PPT的新更新技能。PPT生成之後,還可以配備專業的虛拟人對PPT進行講解。
PPT生成能力依靠的是星火V3.5的要素抽取、概念了解、知識推理、問題生成、圖文生成能力。星火V3.5不僅可以邏輯化處理文檔資訊,還可以讓大模型提供更多文檔之外的增量資訊,拓展PPT内容的深度。
科大訊飛也釋出了新的多模态模型進展。
新釋出的“星火語音大模型”,基于大語言模型架構,結合訊飛語種、音色、内容等多元度語音屬性解耦表征預訓練而成。它可以實作多語種并達到超拟人的語音合成效果。其首批40個語種平均MOS分(評估音頻或視訊品質的一種标準,5分為最高)提升了0.25,拟人測試中MOS達到4.5分,拟人度達到83%,拟人語音合成能力超越ChatGPT。
星火語音大模型
開源方向上,此次科大訊飛釋出了星火開源-13B(iFlytekSpark-13B)模型。該模型為130億參數,經過3萬億以上tokens海量高品質資料集上進行預訓練,具備聊天、問答、文本提取、資料分析和代碼生成等功能。
星火開源大模型
同時,科大訊飛也基于星火V3.5的大模型能力,全線更新了翻譯機、錄音筆等硬體産品以及to B業務。
新推出的星火智慧黑闆,是基于星火大模型打造的一款AI硬體産品。這款智能黑闆具備多模态了解與推薦、全自然互動、虛拟人輔助教學、智慧化錄課等多種功能,能夠讓知識的講解更直覺,讓老師授課更便捷,也把名家如愛因斯坦等以虛拟人的形式搬進了課堂,輔助學生更高效的學習。
星火智慧黑闆
瞄準大模型在B端落地場景,科大訊飛不僅更新星火通用大模型,還優化了大模型相關的一系列套件服務。
底層,星火通用大模型有13B、65B、175B等多種尺寸,支援異構算力排程,行業大模型方面上,星火的全鍊條工具鍊可以行業大模型訓練效率提升90%,支撐企業主流場景的應用優化。
目前,星火大模型已經在能源、政務等場景落地。
星火大模型to B應用架構
關于未來計劃,科大訊飛稱,接下來會繼續發力提升模型能力,将會在2024年上半年,全面對标GPT4,釋出訊飛星火4.0也将釋出。