天天看點

清華系ChatGPT釋出!唐傑團隊打造,專對中文優化,把握新聞動态

作者:量子位

豐色 發自 凹非寺

量子位 | 公衆号 QbitAI

終于,清華大學唐傑團隊也出手了。

就在GPT4釋出的同一天,唐教授在微網誌宣布:

基于千億參數大模型的對話機器人ChatGLM,現在開啟邀請制内測。

清華系ChatGPT釋出!唐傑團隊打造,專對中文優化,把握新聞動态

據介紹,ChatGLM專門針對中文進行了優化,可以說是國人友好~

看起來,寫部落格提綱、創作劇本、解數學題、寫代碼,甚至是扮演高冷禦姐,它都拿捏的死死的:

△寫介紹ChatGLM的部落格提綱

△Cosplay聊天扮演高冷禦姐

量子位有幸拿到了内測名額,将在後文進行一波實測。

與此同時,還有另一個消息宣布:

唐傑團隊為了與社群一起更好地推動大模型技術的發展,同時開源了包含62億參數的雙語ChatGLM-6B模型。

它最大的特點是在普通電腦上就能進行部署,有一塊2080Ti就行。

一起來看看。

能寫文言文緻辭,知道何恺明最新動态,但……

先看ChatGLM,它是唐傑團隊大模型家族時隔半年誕生的一位新成員。

alpha内測版名稱叫QAGLM(全稱qa-glm-v0.7)。

清華系ChatGPT釋出!唐傑團隊打造,專對中文優化,把握新聞動态

淺試一下效果。

首先,我們讓它說了一下它和ChatGPT的差別。

清華系ChatGPT釋出!唐傑團隊打造,專對中文優化,把握新聞動态

它點出了自己的研發機構,和擅長中文的特點。

那麼,就讓它用文言文寫個緻謝詞叭。

清華系ChatGPT釋出!唐傑團隊打造,專對中文優化,把握新聞動态

咋說,雖然多了一個“餘”、出現了一個莫名其妙的繁體字,但讀着還可以,用的排比句增強了氣勢。

接着,我們把前幾日矽谷暴雷的文章開頭丢給它,讓它起個标題。

感覺還不錯,起碼抓住了幾個關鍵資訊。

清華系ChatGPT釋出!唐傑團隊打造,專對中文優化,把握新聞動态

不幸的是,論文挑戰沒有通過,我們把GLM-130B的連結扔給它,讓它簡要概括一下主題時,它說的根本不是這篇。

跟ChatGPT胡鄒參考文獻的操作簡直有得一拼(手動狗頭)。

清華系ChatGPT釋出!唐傑團隊打造,專對中文優化,把握新聞動态

接下來,考考它的數學能力吧。

這道國小應用題沒問題:

清華系ChatGPT釋出!唐傑團隊打造,專對中文優化,把握新聞動态

不過雞兔同籠,就難倒它了,最後居然還算出了負數==

清華系ChatGPT釋出!唐傑團隊打造,專對中文優化,把握新聞動态

程式設計方面,也可以解決簡單的算法題。

歸納資訊能力呢?我們給了一段英文需求,不難:

清華系ChatGPT釋出!唐傑團隊打造,專對中文優化,把握新聞動态

結果正确:

清華系ChatGPT釋出!唐傑團隊打造,專對中文優化,把握新聞動态

需要注意的是,目前ChatGLM每輪對話最多隻可以進行5個來回,每次最多輸入1000字。

它對新資訊的掌握度不錯,知道推特現在的CEO是馬斯克,也知道何恺明3月10日回歸學界的事情,但還沒發現GPT-4已經釋出了。

清華系ChatGPT釋出!唐傑團隊打造,專對中文優化,把握新聞動态

以及,目前響應速度還是非常快的,無論什麼問題,回答得對不對,基本幾秒内就能給出答案。

最後,量子位也讓它來了個cosplay,看看哄女朋友的本事如何:

清華系ChatGPT釋出!唐傑團隊打造,專對中文優化,把握新聞動态

emmm,雖然有點闆正,但聽完這段話“我”的氣确實消了。

那麼,以上就是我們的測試結果,各位覺得如何?

基于1300億參數的基座模型打造

據官方介紹,ChatGLM參考了ChatGPT的設計思路,在千億基座模型GLM-130B中注入了代碼預訓練,通過有監督微調等技術來實作人類意圖對齊(就是讓機器的回答符合人類價值觀、人類期望)。

清華系ChatGPT釋出!唐傑團隊打造,專對中文優化,把握新聞動态

這個GLM-130B的來頭值得說道一番。

它是由清華大學知識工程實驗室(KEG)與智譜AI共同研發的一個大規模中英文預訓練語言模型,參數1300億,去年8月正式對外釋出。

不同于BERT、GPT-3以及T5的架構,GLM-130B是一個包含多目标函數的自回歸預訓練模型。

它的優勢包括:

清華系ChatGPT釋出!唐傑團隊打造,專對中文優化,把握新聞動态

在Stanford報告的30個世界主流大模型評測中,GLM-130B也成為了亞洲唯一入選的模型。

且獲得了不錯的成績:

比如在準确性和惡意性名額上與GPT-3 175B (davinci) 接近或持平,魯棒性和校準誤差在所有千億規模的基座大模型(作為公平對比,隻對比無指令提示微調模型)中也可圈可點。

清華系ChatGPT釋出!唐傑團隊打造,專對中文優化,把握新聞動态

而就在CCF最近的一場會議上,有現場觀衆提問:ChatGPT為什麼沒有誕生在中國?是我們沒有關注這件事嗎?

嘉賓就把GLM-130B搬了出來(它也入選了ICLR’23)。

現在,GLM-130B也終于被派上了“大用場”。

關于内測,唐傑團隊表示,後續會逐漸擴大範圍,有興趣的朋友可以再等一等。

60億參數的縮小版同時開源

除了這個聊天機器人ChatGLM,唐傑團隊這次也把GLM-130B的“縮小版”ChatGLM-6B開源了出來。

△GitHub已經攬獲近2k标星

ChatGLM-6B使用與ChatGLM相同的技術,初具中文問答和對話功能。

特點如下:

清華系ChatGPT釋出!唐傑團隊打造,專對中文優化,把握新聞動态

當然,缺點就是容量隻有60億,其模型記憶和語言能力較弱,不擅長邏輯類問題(如數學、程式設計),以及多輪對話可能會出現上下文丢失和了解錯誤的情況。

但它主打的就是一個低門檻,在單張2080Ti上就能進行推理使用,硬體需求不高。

是以,隻要有興趣都可以下載下傳下來試試,進行研究和(非商用的)應用開發都可以。

傳送門:

https://chatglm.cn/

https://github.com/THUDM/ChatGLM-6B

參考連結:

[1]https://weibo.com/2126427211/MxlsQ6w4A#repost

[2]https://chatglm.cn/blog?continueFlag=d70d7590143c950d12ac7283214d879d

— 完 —

量子位 QbitAI · 頭條号簽約

關注我們,第一時間獲知前沿科技動态