天天看點

科大訊飛劉聰:大模型是一個體系,包含在“721模式”全階段

作者:男孩發型
科大訊飛劉聰:大模型是一個體系,包含在“721模式”全階段

在這一波AI浪潮中,科大訊飛已經走在了前列。

作為中國對AI投入最早的大廠之一,科大訊飛踩對了節奏,這讓它在“百模大戰”中的知名度迅速提升。尤其值得一提的是,科大訊飛已宣布,訊飛星火認知大模型面向全民開放。

作為國内知名的AI廠商,科大訊飛憑借其深厚的技術積累和不斷的創新精神,一直是國内AI領域的佼佼者。而這次訊飛星火認知大模型面向全民開放,更是标志着科大訊飛在AI領域的開放與普惠的理念又向前邁進了一大步。

對于創新的投入,科大訊飛一直是不遺餘力。近十年來,科大訊飛每年的研發投入占營收比重大約在20%。

在技術研發層面,科大訊飛堅持“721模式”:70%投入到目前的主導産品,20%投入到戰略新産品,10%投入到前瞻性、探索型、不追求一定要有回報的研發中去。在科大訊飛研究院院長劉聰看來,大模型是一個體系,在不同階段都有,是以包含在“721模式”全過程中。

據本刊了解,劉聰出生于1984年,中國科學技術大學畢業後就入職訊飛,如今已是管理千人團隊的訊飛研究院院長。在2023年世界人工智能大會上,科大訊飛當選國家人工智能大模型标準化專題組的六家聯合組長機關之一,劉聰代表訊飛出任組長。

在訊飛,承擔AI研發主力正是劉聰帶領的訊飛研究院。

以下為本刊采訪内容,以飨讀者:

本刊:對于訊飛星火2.0的這一次的更新實作的可用度和好用度,從你的角度來講,你覺得可以打多少分?

劉聰:我重點說一下這次更新的代碼能力。先解釋一下為什麼8月15日的釋出會上,我們先示範了訊飛星火的代碼能力和相關産品。劉總(科大訊飛董事長劉慶峰)在5月6号的釋出會首先釋出的就是訊飛星火的通用能力,而通用能力的次元裡,有一個重要能力就是代碼能力。

根據OpenAI建構的代碼能力公開測試集HumanEval顯示,星火V1.5 Python語言的效果隻有41分,但是V2.0已經到了61分,接近ChatGPT。根據認知智能全國重點實驗室建構的代碼真實場景使用的測試集,訊飛星火認知大模型V2.0在代碼生成和補齊次元上已經超過了ChatGPT。這些客觀的名額可以呈現給大家看。

是以,我們可以站在場景、站在使用者的角度去看,基于代碼能力提升所推出的智能程式設計助手iFlyCode 1.0圍繞程式員所需要的場景功能去設計,并且持續做産品的優化疊代。

本刊:訊飛星火2.0在8月13号才開放内測,在這個過程中有沒有出現一些之前沒有預料到的難題,導緻可能中間會有一些困難,訊飛是怎麼去解決的?

劉聰:第一,代碼能力的提升其實比大家想象的難度更高。如果我想提升代碼的能力,它有可能會對大模型其他的能力造成影響。因為訊飛星火是一個統一基礎大模型實作所有的功能,這才是我們講的對标通用人工智能的目标。

其次,這次重點更新的多模态能力。可能大家對多模态的了解不是特别深,GPT-4在今年3月14号就釋出了多模态了解能力,但是它到現在還沒有全面地放開。

我們8月15日展示的多模态能力還不錯,但如果大家嘗試一下有些很複雜的圖,訊飛星火的了解可能不是那麼好。如果想要真正做到将語音、圖像、視訊等模态對齊到統一語義空間中,實作語義的貫穿、銜接,這是一個很複雜的問題。

再進一步,就是我之前經常說道的叫系統性創新,多種模态、類型的大模型,最終目标在哪裡?怎麼去實作多種功能,怎麼把各個子產品銜接融合,特别是訊飛星火這種功能較全的多模态能力,想象一下就更複雜了。

當然,最後成果整體還是符合預期的,中間可能會有部分調整的過程。最終大家頂住壓力,能把現在這樣一個整體産品的階段性成果拿出來,我覺得作為我個人來說是比較自豪的,當然很多部分也還需要持續優化。

本刊:基礎大模型能力趨同,您怎麼看待這一問題?

劉聰:我想從兩方面回答。第一,不要看大家說什麼,看大家做什麼,不要光是聽什麼,要去體驗。

劉慶峰董事長在釋出會上強調的那句話,我覺得非常之準确,叫做言之有物,這個是非常關鍵的一點。即使像因為文本生成,客觀來講,不同人對文本生成的要求是不一樣的,我們還是要客觀看到具體任務跟目前效果最好的模型差别在哪裡。

第二,我覺得還是要看站在什麼層面去看這個事兒。對于訊飛來說,我們一開始就是奔着通用人工智能的目标去的。哪些方面的能力要突破到什麼程度,怎樣的水準能夠達到實際應用,我們更關注的是落地是否能産生價值。

本刊:訊飛研究院有一個技術研發政策是“721”,就是70%要投入目前支撐公司的業務,20%是戰略新産品,10%是前瞻技術,不追求回報。大模型對于我們現在的情況來說,它是7是2還是1?過去幾年,大模型在我們研究政策過程中有沒有什麼變化?

劉聰:我個人了解大模型可能“721”都包含,它是未來我們一個底座、一個架構。首先,當大模型整個訓練流程走通了之後就要去覆寫更多的通用能力,提升更多的場景,這個可能是7的部分。

當然,我們一般會選比較優勢的行業去找到一些拓展應用場景,以及繼續深入多模态能力進行提升,我可能會把它歸成2,這裡面當然也要有1的部分。

是以,這個問題我的了解是大模型是一個體系,它在不同階段都有。

本刊:智能程式設計會讓開發者的角色發生什麼樣的變化?未來核心的競争力展現是在哪些方面?

劉聰:我覺得至少是兩個次元。

第一,就是持續提升開發者自己所關注的程式設計開發的能力。

第二,在開發者日常工作中幫助提高效率,能把大家的精力解放出來去做提升生産力、釋放想象力這些創造性的工作。

繼續閱讀