天天看點

科大訊飛星火超越ChatGPT?

作者:Hi每天一點點

這幾天看見新聞報道,科大訊飛進階副總裁胡國平在中關村論壇中釋出訊飛星火年度計劃。計劃6月9日,突破開放式問答,多輪對話能力再更新,數學能力再更新。計劃10月24日,通用模型對标ChatGPT(中文超越,英文相當)。

科大訊飛星火超越ChatGPT?

科大訊飛星火憑什麼有底氣說能超越ChatGPT?

截止目前,科大訊飛星火大模型還處于限訊飛開放平台生态合作夥伴用于體驗,還沒有正式對外正式公布。

早在今年的5.6日科大訊飛的釋出上公布了星火大模型,釋出會上就表明,為了科學 PK ChatGPT 能力,科大訊飛通過認知智能全國重點實驗室牽頭設計了通用認知大模型評測體系,并與中科院人工智能産學研創新聯盟和長三角人工智能産業鍊聯盟共同探讨形成了覆寫 7 大類 481 各細分任務類型。

科大訊飛星火超越ChatGPT?

釋出會現場

首先認識下科大訊飛星火認知大模型

科大訊飛推出的新一代認知智能大模型,擁有跨領域的知識和語言了解能力,能夠基于自然對話方式了解與執行任務。從海量資料和大規模知識中持續進化,實作從提出、規劃到解決問題的全流程閉環。以下是星火認知大模型目前支援的一些應用場景:

1、語言了解

l 機器翻譯:翻譯多種語言的文字,包括英語、中文、法語、德語、西班牙語等常用語種

l 文本摘要:根據文本提取簡潔而準确的摘要,快速了解文章的核心觀點

l 文法檢查:檢查文法錯誤并提供正确的文法建議,使寫作更加規範與專業

l 情感分析:分析文本中的情感色彩,如正面、負面或中性,更好了解内容觀點和态度

2、知識問答

l 生活常識:提供有關日常生活的知識,如飲食、運動、旅遊等方面的建議

l 工作技能:提供工作方面的知識,如溝通技巧、時間管理技巧、團隊協作等方面的建議

l 醫學知識:提供基本的健康保健知識以及疾病預防、診斷和治療方面的建議

l 曆史人文:提供有關曆史事件、文化傳承、名人故事、名言警句等方面的文案

3、邏輯推理

l 思維推理:通過分析問題的前提條件和假設來推理出答案或解決方案,給出新的想法和見解

l 科學推理:使用已有的資料和資訊進行推斷、預測和驗證等科學研究中的基本任務

l 常識推理:在進行對話交流時,運用已有的常識知識來分析、解釋和回應使用者的提問或需求

4、數學題解答

l 方程求解:包括一進制二次方程、二進制一次方程、三元一次方程等等

l 幾何問題:平面幾何(如直線、圓、三角形等的性質)和立體幾何(如體積、表面積、投影等)

l 微積分:處理導數、積分等微積分相關的問題,涉及基本概念如極限、連續性、導數等

l 機率統計:涉及随機變量、機率分布、假設檢驗等方面的内容

5、代碼了解與編寫

l 代碼了解:幫助使用者了解絕大部分程式設計語言、算法和資料結構,快速給出所需的解答

l 代碼修改:對已有代碼進行修改或優化,提供建議和指導,找出潛在的問題并提供解決方案

l 代碼編寫:幫助使用者快速編寫一些簡單的代碼片段,例如函數、類或循環等

l 步驟編譯:提供關于程式設計語言的文檔和工具,如文法規則、函數庫、自動補全代碼工具等

科大訊飛星火超越ChatGPT?

來源于網絡

科大訊飛星火超越ChatGPT?

來源于網絡

從釋出上看,目前星火通用能力業内明顯領先。中文方面,目前訊飛星火認知大模型已經在文本生成、知識問答、數學能力三大能力上已超 ChatGPT(實際情況還得正式公布後,待廣大使用者實際使用後,再做定論),10 月底将整體趕超 ChatGPT。不過釋出會現場劉慶峰表示,科大訊飛現在的語言能了解能力相比 ChatGPT 還略有差距,但已超越國内同類産品。

有一個示範比較有意思,輸入一份圖文并茂的英文菜單,星火不僅立刻給出了中文版菜單,還能應要求介紹沒有吃過的菜品基本情況,使用者甚至可以指定虛拟人以指定的合成聲音,給自己介紹這些菜單内容。

另外,星火的數理邏輯能力還是不錯,釋出會現場抛出了複雜的計算題:花壇裡有三種花,一共 88 朵,其中月季花的數量是菊花的4倍,牡丹花的數量是菊花的 5 倍少 2 朵,那麼請問花壇裡一共有多少朵牡丹花?大模型很快準确給出了答案,并給出了解題步驟。

劉慶峰表示,工業領域也是一個非常重要落地場景,降低沒有軟體背景普通工程師和勞工的程式設計門檻,我們可以期待 8 月的能力突破。同時表示,訊飛星火大模型不僅在國内系統中遙遙領先,也超過了 ChatGPT。而且還表示,10 月 24 日開發者大會上,星火要對标 ChatGPT,在中文上超過,在英文上要達到跟它相當的水準。

ChatGPT的水準?

先看看ChatGPT的發展

這款聊天工具由美國企業OpenAI 開發,自2022年11月釋出以來引發了全球轟動。釋出五天,使用者便超過100萬人,無情碾壓了臉書公司10個月破百萬使用者的紀錄。釋出短短兩個月,ChatGPT使用者數突破1億,而TikTok達到1億使用者也花了9個月的時間,成為史上使用者數增長最快的消費者應用。

2022年11月30日

ChatGPT上市。

2022年12月5日

OpenAI創始人山姆·奧特曼宣布 ,ChatGPT的使用者已經突破100萬人,僅用時5天。

2023年1月末

ChatGPT 使用者數突破1億,成為史上使用者數增長最快的消費者應用。

2023年1月末

微軟宣布向推出 ChatGPT的OpenAI公司追加投資100億美元。

2023年2月2日

OpenAI釋出ChatGPT試點訂閱計劃——ChatGPT Plus,以每月20美元的價格提供服務,訂閱者可獲得比免費版本更穩定、更快的服務,以及嘗試新功能和優化的優先權。

2023年2月2日

微軟宣布其旗下所有産品全線整合ChatGPT。

2023年2月6日

谷歌母公司字母表公司宣布将推出聊天機器人Bard,不同于ChatGPT的資料庫隻更新到2021年,Bard将收集最新的内容。

2023年2月7日

ChatGPT官網表示,大量使用者蜂擁而至導緻網站癱瘓,使用者在ChatGPT頁面提問顯示“一小時内提問太多次,請稍後再試”。

2023年2月8日

微軟宣布推出由ChatGPT 支援的最新版本人工智能搜尋引擎Bing和Edge浏覽器。

2023年3月15日

3月15日,淩晨,OpenAI釋出大型多模式模型GPT-4、ChatGPT Plus,據OpenAI官方介紹,GPT-4是一個大型的多模式模型,可以接受圖像和文本輸入,輸出文本,在各種專業和學術基準上表現出人類水準的性能。不少人在嘗試新版本之後表示,它比早先大家使用的ChatGPT的GPT-3.5強悍了一大截,再次重新整理了對AI的認知。

科大訊飛星火超越ChatGPT?
科大訊飛星火超越ChatGPT?

來源于網絡

和上一代相比,GPT-4 擁有了更廣的知識面和更強的解決問題能力,在創意、視覺輸入和長内容上表現都更好了。用在創意項目上,它能幫助使用者一起創作歌曲、編寫劇本或者學習使用者的寫作風格。值得注意的是, GPT-4 可以直接讀取 3.2 萬個 token,相當于給它 25000 英文字的背景資訊,就可以快速給出結論—也就是說,像律師助理這樣的職業真的要被取代了。而上一個版本隻能讀取 4096 個token,相當于3000 英文字資訊,這個版本的進步是跨越式的。除了文本以外,你還能把圖檔作為輸入内容給 GPT-4,它不僅能夠識别出圖中的物件,還能根據這些資訊進一步處理内容。

10秒鐘做出一個網站

一則有關GPT4釋出會的視訊在網上流傳,這則兩分鐘的視訊示範的内容是:

1. 在草稿本上用紙筆畫出一個非常粗糙的草圖;

2. 拍照告訴 GPT 我們要做一個網站,效果正如圖所示,讓其生成網站代碼;

3. 網站做完,總共曆時十秒鐘左右。

在官方示範中,GPT-4能根據一張草圖,幾乎隻花十來秒的時間就實時生成了一個網站完整的前端HTML代碼并制作出網站。

科大訊飛星火超越ChatGPT?
科大訊飛星火超越ChatGPT?

60秒做出一個遊戲

相關示範并非來自官方,而是網友進行了試驗。據報道,網友對話GPT-4,要求其做一個彈球遊戲,耗時約60秒。最終,在無需反複溝通的情況下,GPT-4一次性完成了這個遊戲。

另有網友要求GPT-4制作貪吃蛇遊戲,最終耗時約20分鐘,成功編寫和調試了整個貪食蛇遊戲。雖GPT-4無法在回複中一次性完成操作,但經過多次對話後還是完成了,而整個過程中網友隻需回複“繼續”即可。

可準确識别梗圖

這也是GPT-4一個質的飛躍,那就是開始處理圖像了。之前,人們可以用它來處理文本,即根據給定的語境生成文本,例如生成文章、詩歌、對話等。而GPT-4支援輸入的内容不再局限于文字,而是開始接受圖像作為輸入媒體。根據官方示範,面對一張“梗圖”,GPT-4精準描述出了圖檔的内容,并有思維條理的解釋了為什麼這張圖會讓人覺得好笑。

科大訊飛星火超越ChatGPT?
科大訊飛星火超越ChatGPT?
科大訊飛星火超越ChatGPT?
科大訊飛星火超越ChatGPT?

據 OpenAI 介紹,GPT-4 展示了「在多種專業和學術名額下展現了人類水準的表現」:類似于手機的跑分軟體,在 ChatGPT 剛出來的時候,也有不少人用它「刷題跑分」,在 GPT-3.5 版本模型下,它的 SAT 成績隻能排倒數 10% 的水準,然而 GPT-4 模型可以超越 90% 考生的水準。

科大訊飛星火超越ChatGPT?

在其他考試也呈現出類似對比效果,如果光是「跑分」,ChatGPT-4 屬于是可以考進哈佛、斯坦福的水準。

OpenAI的最新一代AI語言模型ChatGPT 4完成并通過了美國的幾個會計類考試,包括美國注冊會計師(CPA)、注冊管理會計師(CMA)、注冊内部審計師(CIA)和注冊稅務師(EA),平均得分85.1。

ChatGPT不僅「考過了」美國醫師執照考試,還以一作身份發表了一篇惡性良性腫瘤學論文。

ChatGPT 不僅通過了美國最具挑戰性的專業考試MBA、法律資格考試和美國醫學執照考試,ChatGPT 又通過了中國資料庫系統工程師考試。之前ChatGPT 以 18.3 萬美元的薪水通過了 3 級工程師的 Google 編碼面試。

OpenAI 最初的聯合創始人之一埃隆·馬斯克此前在推特上寫道:“這是一個新世界。再見作業!”目前看來,馬斯克的說法得到了證明。在寫論文方面,ChatGPT确實厲害。美國北密歇根大學哲學教授Antony Aumann不久前為自己的世界宗教課評出了全班最佳論文,但随後才得知該論文是學生用ChatGPT寫的。

ChatGPT 最突出的一個特點是,采用了注重道德水準的訓練方式,按照預先設計的道德準則,對不懷好意的提問和請求說“不”。一旦發現使用者給出的文字提示裡面含有惡意,包括但不限于暴力、歧視、犯罪等意圖,都會拒絕提供有效答案。這使使用者在互動過程中能明顯感覺到ChatGPT的“聰明勁”。

值得注意的是,ChatGPT的資料庫隻更新到了2021年,且目前是非聯網狀态,這和谷歌即将推出的Bard有較大差別。谷歌強調,Bard将采用最新的資料,這也是谷歌作為後來者同ChatGPT競争的一大優勢。

如今,多家科技巨頭紛紛啟動了相關産品規劃,一場超級“内卷”的人工智能競逐賽正在上演。

微軟是ChatGPT出品方OpenAI的主要支援者,目前已經将ChatGPT相關技術用于其Bing搜尋引擎。今年1月,微軟進一步宣布擴大合作,将向OpenAI投資100億美元(約合679.02億元人民币)。

有媒體報道,谷歌将ChatGPT視為“紅色警戒”級别威脅,特意請回幾年前離職的聯合創始人謝爾蓋·布林和拉裡·佩奇商讨對策。2月6日,谷歌母公司字母表公司宣布将推出聊天機器人Bard,據介紹,Bard 最初僅供一些測試人員使用,之後再大範圍推廣。

除了自研産品外,谷歌也在外腦方面猛發力。據媒體報道,谷歌公司2月初向人工智能初創公司Anthropic投資近4億美元(約合27.16億元人民币)。據悉,Anthropic的人工智能助手Claude也有望成為ChatGPT的競争對手。在2月初釋出最新财報時,谷歌首席執行官桑達爾·皮查伊放言,谷歌在人工智能領域處于有利地位,因為已經迎來了拐點。

資料顯示,亞馬遜部署的機器人數量也在快速增長,每天增量達到1000個左右。

此外,臉書母公司Meta也計劃2023年在資料中心上額外投入40億至50億美元,預計全部用于人工智能。

另外,國内的百度公司文心一言雲服務于3月27日上線。5 月 28 日,百度首席技術官王海峰在中關村論壇中示範了“文心一言”尚未公開上線的通過文本生成視訊功能、智能總結聊天記錄功能、智能程式設計功能。“飛槳”與“文心”聯合優化,近 1 個多月推理性能提升 10 倍。

ChatGPT的狂飙突進火速引發了新一輪的人工智能競賽。

科大訊飛星火大模型的底氣

2010年,科大訊飛開放平台正式上線,內建了語音合成、語音搜尋、自然語言處理和語音聽寫等多項能力,成為了當時行業内開放最早的智能語音平台。據了解,經過十幾年的發展,科大訊飛開放平台目前已對外開放了318項AI能力及方案,連結超200萬生态合作夥伴,累計支援超過28億終端。

科大訊飛在 2022 年度業績說明會答投資者問中提到,科大訊飛在 Transformer 深度神經網絡算法方面已經擁有豐富經驗,也廣泛應用于科大訊飛的語音識别、圖文識别、機器翻譯等任務并達到國際領先水準。

其中,核心技術方面一直保持國際領先水準。在人工智能技術從感覺智能邁向認知智能的攻堅階段,常識推理是重要一環。僅 2022 年,科大訊飛就在認知智能技術領域累計獲得 13 項世界冠軍。

例如,在 OpenBookQA 奪冠後,科大訊飛對奪冠系統、知識與大模型融合統一的了解架構 X-Reasoner 更新改造後,推出 X-Reasoner++ 又在 2022 年奪得 QASC 榜首,實作全球首次超越人類平均水準。

2022 年,他們還開源了 6 個大類、超過 40 個通用領域的系列中文預訓練語言模型,相關模型庫月均調用量超 1000 萬,在 Github 平台獲得星标數位列同類中文預訓練語言模型第一并遠超第二名。除了核心算法方面的積累,科大訊飛在多年認知智能系統研發推廣中積累了超過50TB 的行業語料和每天超 10 億人次使用者互動的活躍應用。

第三方資料看似擷取門檻較低,但想規模化擷取海量的高品質資料并非易事,需要長時間規範化積累,在資料合規性上也必須有一定保障,這也是為什麼科大訊飛在大模型領域的創新值得關注。

在教育領域,科大訊飛相關教育産品已在全國 32 個省級行政區得到應用,覆寫五萬餘所學校、1.3 億師生,擁有海量語音、成績單、題庫等資料。

在醫療領域,科大訊飛在業内是全國唯一通過國家執業醫師資格考試的人工智能系統,超過了 96.3% 的醫學考生,已累計為基層醫生提供了超過 5.8 億次、日均超過七十多萬人次的人工智能輔診。

同樣,作為首批國家新一代人工智能開放創新平台,日使用量超過 50 億人次,多年來也為大模型提供了海量文本語料和使用者回報資料。

在認知大模型相關的算力上,科大訊飛在總部自建有業界一流的資料中心,目前已建成四城七中心深度學習計算平台,為大模型訓練平台建設奠定了很好的硬體基石。

2022 年 12 月,科大訊飛開始星火認知智能大模型的專項攻關,能在五個月裡實作認知大模型的快速突破,和公司長期紮實積累密不可分。據了解,基于科大訊飛多年來業務根據地的穩紮穩打,訊飛星火認知大模型目前已在教育、辦公、車載、數字員工等多個行業和産品中落地。他舉例,比如訊飛AI學習機,不光可以幫助學生練習口語,還可以像老師一樣批改作文,精确指錯;訊飛智能辦公本可以直接根據手寫的關鍵詞自動生成會議紀要;訊飛聽見可以實作“一段錄音一鍵成稿”功能。

同時,訊飛星火認知大模型還賦能445萬名開發者,通過開放圖文識别、人臉識别、聲紋識别等560項AI能力,共建人工智能的“星火”生态,在教育、醫療、司法、汽車等民生領域解決行業剛需。

劉慶峰還在現場展示了訊飛星火的語言翻譯、邏輯推理等能力,并分享了訊飛星火認知大模型的更新疊代裡程碑計劃:6月9日将突破開放式問答,多輪對話能力和數學能力再更新;8月15日将突破代碼能力,多模态互動再更新;10月24日通用模型将對标ChatGPT(中文超越,英文相當)。

後話

當ChatGPT出來時,其實我更看好Google,國内的百度,其實模型有開源的,除了技術研發大模型,最重要的是學習,也就是要大規模的訓練,除了算法本身,還需要更高要求的硬體以及龐大的資料,這些是Google、百度最具有的優勢,特别是資料這塊。但Google剛出來就演砸了,百度的文心一言有很多诟病,并沒有達到期待的高度。反而ChatGPT無論是更新速度,還是資料量都極速的增長,這些少不了微軟強力的支援,包括技術以及資金,微軟可是砸了重金,同時已經開始将ChatGPT植入到微軟自己的各個産品當中,另外還關閉了元宇宙項目,可見一斑。即便是這樣也不能說國内沒有機會,肯定有但是否能把握,如:

地域優勢:畢竟國内使用者基數大,訊飛産品多(可以去了解訊飛的産品,早多少年前早就有AI的産品),資料也不少,如果能集合BAT那成功率大大提高,不過不太現實,原因就不用說了。

政策優勢:國家大力推動人工智能,本土企業優勢巨大,另外,國外平台進入國内有很多政策以及安全限制,比如,你用ChatGPT在國内做商業,資料有過境風險,這個是很大的隐患。國内公司先天性優勢。

總之,機會是有,速度有多快,城牆有多高?

你覺得誰最終會勝出?

歡迎在評論區,給出您的答案。

繼續閱讀