CNCC | 大語言模型在數學領域的前瞻問題與挑戰：理論、方法與應用

CNCC2023将于10月26日至28日在沈陽舉行，會議期間将舉辦129場技術論壇，涵蓋人工智能、安全、計算+、軟體工程、教育、網絡、晶片、雲計算等30餘個方向。本文特别介紹将于10月28日舉辦的【大語言模型在數學領域的前瞻問題與挑戰：理論、方法與應用】技術論壇。

數學一直被視為人工智能的試金石。當大語言模型突破其“先天性的缺陷”，成功應對數學方面的挑戰時，世界人工智能将進入新的紀元。論壇将深入探讨大語言模型推理能力在數學領域的進展和挑戰,分析如何提升大模型數學推理能力，展望大語言模型在數學領域的前景和研究方向。

報名及了解更多技術論壇資訊請識别下圖二維碼進入CNCC2023官網。

在生成文本段落、模拟人類對話及解決數學問題表現驚人的大語言模型，是這幾年人工智能發展最熱門的領域之一。大語言模型執行個體ChatGPT的橫空出世，則為其發展注入了一針強心劑，帶來AI研發應用新範式并改變AI生态格局。然而大模型在以數學推理為代表的複雜推理上表現欠佳，難以應對數學領域的研究難題。另一方面，由于大模型在數學概念了解與生成能力、可解釋性與透明度、泛化能力、誤差與穩定性、個性化與趣味性等方面存在不足，尚難滿足基礎教育應用要求。

如何提升大模型數學能力，突破語言模型的先天性不足，成為了當下人工智能領域關注的重點。本論壇将從大模型的前世今生出發，結合當下最新研究成果，分析探讨大語言模型推理能力在數學領域的進展和挑戰。包括如何準确衡量語言模型的數學推理表現；探讨模型在數學推理中生成結果錯誤率高的原因，以及可能的解決政策；研讨新方法、新技術，使模型在數學推理時産生更穩定、連貫的解題步驟；研讨如何讓模型提升學習體驗和效果；面向未來，語言模型在數學推理上的應用将如何改變傳統的教學模式。

論壇安排

順序	主題	主講嘉賓	機關
1	大模型基座賦能：由通到專的實踐和思考	吳飛	浙江大學
2	面向教學的大規模多模态預訓練模型	劉均	西安交通大學
3	大模型讓大規模個性化學習真正成為可能	田密	好未來集團
4	融合教育心理學的對話大模型：EduChat	周愛民	華東師範大學

論壇主席

劉子韬

暨南大學教授、廣東智慧教育研究院院長

CCF進階會員、暨南大學廣東智慧教育研究院教授，博士生導師，研究院院長。在ICML、NeurIPS等人工智能領域頂級會議和期刊上發表論文80餘篇，國内外授權發明專利40餘項。擔任國際人工智能教育協會執行委員、第25屆國際人工智能教育大會(AIED)程式主席。主持和參與國家重點研發計劃課題、科技創新2030-新一代人工智能重大項目等多項科研工作。研究成果獲得了包含CCTV新聞聯播、CCTV正點财經、人民網、新華網等多家新聞媒體和新聞網站報道。

共同主席

王延峰

上海人工智能實驗室主任助理

上海交通大學人工智能研究院副院長、未來媒體網絡協同創新中心副主任

現任第十六屆上海市人大代表。國家科技創新2030——“新一代人工智能”重大項目指南編制專家組成員、國家科技創新2030——“新一代人工智能”重大項目管理專家組成員、國家發改委“網際網路+”行動專家咨詢委員會成員、國家發改委人工智能産業咨詢專家委員會成員。

論壇講者

吳飛

浙江大學教授、人工智能研究所所長

CCF進階會員、浙江大學求是特聘教授，博士生導師。主要研究領域為人工智能、多媒體分析與檢索。浙江大學上海高等研究院常務副院長、浙江大學人工智能研究所所長。國家傑出青年科學基金獲得者（2016年），科技部科技創新2030“新一代人工智能”重大項目管理專家組成員和指南編制專家、教育部人工智能科技創新專家組工作組組長(2018.8-2020.12)、中國工程院院刊《Engineering》資訊與電子工程學科執行主編，浙江大學第九屆永平傑出教學貢獻獎獲得者。曾獲教育部科技進步一等獎（排名第一）和中國電子學會科技進步一等獎（排名第一），著有《人工智能導論：模型與算法》和《走進人工智能》（高等教育出版社），開設國家級首批線上一流課程《人工智能：模型與算法》。

大模型基座賦能：由通到專的實踐和思考

本報告介紹大模型訓練過程中預訓練、有監督微調和人在回路回報等代表性算法，刻畫“預訓練模型+提示學習+預測”機器學習範式中資料和模型為大、語言點金的特點。同時介紹以高品質教材級語料打造的面向101計劃核心課程《人工智能引論》教學的垂直領域大模型智海三樂以及通過邏輯豐富語料打造的面向智能司法的垂直領域大模型智海-錄問。

劉均

西安交通大學計算機學院教授/博導

CCF進階會員，斯坦福大學進階通路學者，陝西省大資料知識工程重點實驗室主任，曾入選國家級領軍人才。擔任IEEE TNNLS 編委以及多個期刊等客座編輯。主要研究方向為自然語言處理、計算機視覺、智慧教育。近年來，承擔了國家重點研發計劃項目、國家自然科學基金重點項目。在IEEE TPAMI、IJCV、IEEE TKDE等發表論文百餘篇，出版專著2部，授權發明專利20項；獲國家科技進步二等獎、國家教學成果二等獎、陝西省技術發明一等獎、中國自動化學會科技進步特等獎；獲陝西省優博指導教師、王寬誠育才獎等榮譽與獎勵。

面向教學的大規模多模态預訓練模型

以ChatGPT為代表的大模型大大提升了通用智能與内容生成能力，有望成為教育數字化的人工智能基礎設施。然而，現在大模型應用于教學場景還面臨一系列挑戰：一是生成内容存在幻覺、意識形态、價值觀等問題；二是跨媒體教學内容了解能力弱，特别是對于包含示意圖的教學資源；三是缺少分而治之的規劃與推理能力；四是很難生成符合使用者需求、認知水準等的個性化内容。對此，需要建構面向教育的大規模多模态預訓練項模型，突破 “臨門一腳”關鍵技術，推動關鍵環節自主可控。

田密

好未來集團CTO

CCF會員，好未來集團CTO。全面負責好未來的技術研發工作。目前，他聚焦在教育大模型的研發上，帶領團隊研發了MathGPT大模型和基于大模型的AI Tutor産品。他曾經是阿裡巴巴集團的資深技術總監、騰訊集團研發總監。田密擁有北京航空航天大學計算機學院的大學和碩士學位，碩士研究所學生師從李德毅院士，研究方向是人工智能和資料挖掘。

大模型讓大規模個性化學習真正成為可能

因材施教、有教無類，是人類上千年來追求的目标。LLM技術的興起，讓大規模個性化學習有了解決的可能性。LLM的本質是一種更高效的、從資料中學習知識并加以應用的方式。在AI能力的加持下，“學生自學+AI答疑”的新型學習方式将成為廣泛的可能。令人遺憾的是，雖然全球已經有很多優秀的LLM，如GPT-4，但是都無法直接用于個性化學習，尤其是數學學習。針對這一難題，學而思推出國内首個數學領域千億級大模型——MathGPT，創造性将大模型和計算引擎兩者能力進行結合，有效解決LLM在數學領域的三大挑戰——解對題、講清步驟、内容有趣生動。本次報告将會從MathGPT的研發邏輯、效果等方面詳細闡述MathGPT如何破解數學領域應用難題。

周愛民

華東師範大學計算機科學與技術學院院長

CCF會員，華東師範大學計算機科學與技術學院院長、華東師範大學上海智能教育研究院院長、教育部華東師範大學智能教育實驗室副主任、上海市IV高峰學科（智能教育）負責人。主要研究領域包括演化優化與學習、機器學習、智能教育等。發表SCI一區/CCF A類期刊會議學術論文40餘篇，相關成果谷歌學術累計引用8400餘次。擔任期刊Swarm and Evolutionary Computation副編輯、Complex & Intelligent Systems編委以及Chinese Journal of Electronics副編輯。獲愛思唯爾2020-2022年度中國高被引學者稱号、2022年上海市高等教育優秀教學成果（大學教育）二等獎。

融合教育心理學的對話大模型：EduChat

大模型在通用任務展現出了較好的處理能力，然而在教育垂直領域仍然面臨很多問題，如幻覺和知識更新滞後、缺乏啟發式引導、缺乏深度情感互動、缺乏個性化等，這些問題嚴重影響了大模型的落地應用。針對這些問題，團隊近期在教育學和心理學等理論指導下，研發了面向教育垂直領域的對話大模型EduChat。本報告将介紹我們在教育大模型方面的一些探索，包括教育功能設計、資料建構、模型訓練等細節，以及在數學和心理等方面的應用。

今年恰逢CNCC創辦20周年。二十年來，CNCC已逐漸發展到涵蓋數十個方向129場技術論壇，700餘位國内外講者積極參與，超過13000人注冊的計算領域年度盛會。二十載不斷超越，作為國内計算領域參會人員衆多，規模大，水準高的年度盛會，CCF将精心籌劃，為參會者帶來一場前沿碰撞、展望未來的技術盛宴，讓每位參會者都能在CNCC這個超大體量專業平台上提升自身的專業價值，獲得前行的動能！等你來，馬上行動，歡迎參會報名！

CNCC | 大語言模型在數學領域的前瞻問題與挑戰：理論、方法與應用

繼續閱讀

3倍靈敏度，搜尋百萬蛋白對隻需幾秒，複旦等開發新的語言模型

8.3K Stars!《多模态大語言模型綜述》重大更新

Meta研究員破解大模型逆轉詛咒，推出《語言模型實體學》

解碼 AI：揭秘聊天機器人的“大腦” - 大語言模型

預測蛋白質共調控和功能，哈佛&MIT訓練基因組語言模型

【英特爾釋出新一代AI晶片，或成英偉達産品勁敵】英特爾在人工智能加速器領域取得了重要進展，其子公司HabanaLabs在

研究者提出人工智能新概念，讓大語言模型與真實實體世界進行互動

Llama 3：開源大語言模型的下一個前沿

大語言模型的應用秘訣：如何通過高效的提示詞掌控AI？

蘋果又被曝大動作，自研裝置端大語言模型，AI才是“重振雄風”新出路？

難怪之前傳iPhone16系列國行版本AI功能将由百度提供，原來百度在中國人工智能發明專利企業排名中還是靠前的。排名前十

蘋果釋出OpenELM，基于開源訓練和推理架構的高效語言模型

所羅門諾夫：大語言模型的先知

大語言模型部署：vLLM 與量化技術

蘋果發高效語言模型 OpenELM；小米策劃 15 萬元新車；AI 成功改寫人類 DNA|極客早知道

深度學習與化學語言模型結合，用于藥物從頭設計，登Nature子刊