天天看點

國内首個專為數學打造的千億級大模型推出 MathGPT開啟内測

作者:速途網

速途網訊 8月24日,在好未來20周年直播活動中,CTO田密宣布好未來自研的數學領域千億級大模型MathGPT正式推出并開啟内測。即日起,使用者可通過官網()申請新增賬號免費試用體驗。

今年5月,好未來曾公布正在進行自研數學大模型的研發,命名為MathGPT。MathGPT是面向全球數學愛好者和科研機構,以解題和講題算法為核心的數學垂直領域的大模型,也是國内首個專為數學打造的大模型。

使用者使用MathGPT時,用文字或圖檔方式上傳數學題,即可得到對話式的解答回報,也可以通過“随機來一題”的按鈕,随機生成數學題目并由系統給出解答。目前,MathGPT支援中文、英文版本的PC端和移動端體驗。

國内首個專為數學打造的千億級大模型推出 MathGPT開啟内測

領先的數學解題能力

田密介紹,MathGPT彙集了好未來多年教育教研資料積累,專注于數學領域。千億級大模型的訓練、推理、部署架構,為模型賦予了強大能力。通過優質教育資料,實作題目計算、講解、問答等多任務持續訓練和有監督微調,呈現出卓越表現。此外,借助人類回報對齊,還将進一步提升模型綜合素養。MathGPT在解題準确率、穩定性及使用者體驗方面均有明顯的優勢。

MathGPT官網顯示,MathGPT的數學計算能力已覆寫國小、國中、高中的數學題,題目類型涵蓋計算題、應用題、代數題等多個類型,還可以針對題目進行追問,暫未開放數學之外的問答互動。

國内首個專為數學打造的千億級大模型推出 MathGPT開啟内測

MathGPT技術報告

MathGPT技術報告顯示,在CEval-Math、AGIEval-Math、APE5K、CMMLU-Math、聯考數學和Math401等6個公開數學評測集合的測試結果中,好未來的MathGPT取得了多項測試的最高分數。同時,MathGPT在C-Eval的初高中的全科測試集合上也均有不錯的表現。

國内首個專為數學打造的千億級大模型推出 MathGPT開啟内測

MathGPT在C-Eval榜單初高中各科成績

在解題穩定性、講解友好度方面,MathGPT基于海量名師解題過程的資料進行模型訓練,模型的解題步驟專業清晰。

以一道數列題為例,MathGPT給出的答案包含“分析”、“詳解”、“點睛”三個部分,比通用大模型的粗略講解方式更為細緻,“分析”提供了題目的解題思路、思考方式,幫助使用者更好地了解題目,“詳解”則給出具體的計算方式和答案,最後“點睛”的環節,對題目的考點、難點、關鍵點進行提示,幫助使用者回顧反思出題意圖、舉一反三。

國内首個專為數學打造的千億級大模型推出 MathGPT開啟内測

對于使用者而言,研究數學問題不僅在于得到答案本身,更在于答案背後的解題原理、思路邏輯。與其他通用大模型相比,MathGPT能實作更高準确度的解題,也能把答案解析得更清楚、講解得更明白,更好地滿足使用者使用AI産品解答數學問題的核心需求。

在MathGPT釋出同時,好未來也在官網更新了一個具有代表性和挑戰性的數學任務評測集,供全球人工智能專家、數學愛好者體驗和測評。田密介紹,希望讓MathGPT在數學教育領域發揮更大作用,好未來願意把基于大規模、高品質的内容的千億級大模型研發經驗方法和業内分享,和行業共同進步。

好未來AI的厚積薄發

在AI浪潮的推動下,今年以來多家科技公司宣布推出通用大語言模型産品,而好未來選擇了另一個方向,不基于将現有大語言模型做微調和接口調用、不做通用大語言模型,而是深入數學的垂直領域研發大模型,緻力于打造自主、穩定、可持續、高品質的數學解決方案。

通用大模型“重文輕理”,在數學問題的解決、講解、問答和推薦方面則存在明顯的短闆。而在另一個層面,在通往通用人工智能的路上,數學推理能力很重要,全球有很多大型公司在做這方面的研究。

“好未來在數學的資料和業務上有20年的積累,有大量的教育資料的積累和持續生産教育資料的能力,是以選擇做這個難而正确的事情。”田密稱,好未來希望用自己在數學和AI上的多年積累,做好AI大模型時代的數學基礎工作。

早在2017年,好未來便成立了AI lab人工智能實驗室。基于智慧教育人工智能開放創新平台助力,好未來AI lab獲得各類頂級學術會議比賽冠軍16項,亞軍6項,發表國際期刊和會議高水準學術論文近百篇。

2019年,科技部宣布依托好未來建設智慧教育國家新一代人工智能開放創新平台,好未來成為教育行業首批唯一一家人工智能“國家隊”成員,在人工智能領域有多年深入研究。多年來,好未來以教育行業重大需求為牽引,建構了面向教育的人工智能算法能力、應用解決方案、基礎軟硬體體系和開源開放服務的國家教育科技創新平台。

好未來也在積極參與推動大模型标準體系建設,先後作為核心機關參與了由國家人工智能标準化總體組組織的大模型系列國家标準、中國信通院牽頭編制的“大模型預訓練模型技術和應用評估方法”系列團體标準,以及教育部教育資訊化技術标準委員會暨全國資訊技術标準化技術委員會主導的“教育通用大模型”系列标準編制工作。

近期,好未來正作為牽頭機關與中國信通院、複旦大學、科大訊飛、百度等行業領先科研機構、高校、企業一同編制教育大模型團體标準,從覆寫場景、應用成效、服務可靠等次元全面評估教育大模型能力,為教育大模型應用落地提供參考與指導。

用AI實作大規模因材施教

随着大語言模型的興起,如何用AI技術服務各行各業是社會關注的焦點。教育行業是最早開始布局AI領域的行業之一,AI能為教育生态帶來何種變化一直備受關注。

“AI帶來了重新定義教育行業的機會,大模型技術使得大規模的因材施教真正有了實作的可能。”田密介紹,20年來,好未來一直在探索個性化學習,從線下小班到線上大班,再到AI課,形式不斷進化,但教的内容始終是固定的、學生和老師互動較少、顆粒度隻能到題目級别。

田密認為,大模型的本質,是一種更高效的、從資料中學習知識并加以應用的方式。在AI能力的加持下,“學生自學+AI答疑”的新型學習方式成為廣泛的可能。學習者獲得優質教學内容的門檻、成本降低,獲得的教學内容個性化、精細化程度持續升高,可以實作千人千面的AI教學和答疑輔導,每個學生都能得到最适合自己的學習内容。

以MathGPT為基礎,好未來将不斷探索AI環境下的學習方式,更好地服務于全球的學習者、數學愛好者,并将經驗及時與行業分享,通過AI技術助力教育科技的積極改變。

據田密介紹,随着内測的順利進行,MathGPT的解題能力将得到持續提升,基于MathGPT的産品級應用也正在加速研發中,将于近期釋出。(栀橙)