科學家開發基于生成式模型的學生智能體，有望增強個性化教育輔導

近期，美國加州大學聖疊戈分校團隊提出了一種基于生成式模型的學生智能體系統 EduAgent。利用大語言模型，全方位模拟學生的細粒度實體行為、心理狀态和學習過程。

實驗表明，EduAgent 不僅可以模拟和預測真實學生的學習行為，而且可以在沒有真實資料的情況下，生成虛拟學生的合理學習行為。

近日，相關論文以《EduAgent: 在學習中的生成式學生智能體》（EduAgent: Generative Student Agents in Learning）為題，發表在預印本網站 arXiv 上[1]。

加州大學聖疊戈分校博士研究所學生徐嵩霖為第一作者兼通訊作者，該研究在覃蓮卉助理教授和張新宇教授共同指導下完成。

圖丨相關論文（來源：arXiv）

挑戰：用大語言模型模拟學生的細粒度行為

雖然在大模型之前，已經有很多研究用深度學習來模拟學生行為，但是深度學習受限于大量的訓練資料，難以直接模拟不同性格的學生。

随着大語言模型的爆發，越來越多的研究證明，即使不提供新的訓練資料來調整模型，大語言模型也具有很強的學習和模拟能力。

基于大語言模型的預訓練，已經教會了它很強的上下文學習能力和廣泛的知識庫。是以，使用大語言模型來模拟學生行為更加可行，隻需要給它上下文的語境資訊。

盡管大語言模型已經被充分證明具有很強的人類行為的模仿能力，但用它來模拟學生的細粒度行為更有挑戰性。

該團隊在此前已有研究的基礎上，提供了更細粒度的資料集标記，包含學生在上網課的過程中，采集到的實時眼球追蹤資訊、各種不同的心理狀态和最終的學習效果。

然而，需要模拟的學生行為太多（包括實體行為、心理狀态和對知識點的了解能力），并且上下文過于複雜，大語言模型難以從大量資訊中抓住重點。

徐嵩霖表示：“我們提出基于認知先驗的方法，來引導模型思考和推理不同行為之間的潛在聯系和互相影響，進而實作效果更好的學生行為模拟。”

圖丨EduAgent 架構（來源：arXiv）

此外，在很多場景中，很難獲得真實的學生資料。是以，研究人員還探索了在沒有任何真實學生資料的情況下，大語言模型模拟的虛拟學生智能體是否仍然可産生合理的行為。

通過模拟不同性格的學生，他們發現，虛拟學生智能體生成的實體行為、心理狀态和知識點的掌握能力三者之間的交叉聯系，與很多已有的認知科學研究所證明的三者關系保持一緻。

“這證明了利用大語言模型在不依賴真實資料的情況下，生成合理、完全虛拟的學生行為是可行的。”他說。

據悉，在教育場景的數字孿生系統方面，研究人員開發了更細粒度和更接近學生真實學習狀态的智能體模拟系統。

這樣的系統可以全面模拟學生的各種真實的學習行為和狀态。

比如，不僅模拟學生回答問題，還可以模拟授課過程中學生的眼球動作，甚至學生的心理狀态是否對某個知識點感覺困惑，以及是否在課堂上很專注或走神等。

與此同時，基于數字孿生的智能教學系統，比已有的智能教學系統有更進一步的提升，不再局限于簡單地為老師提供建議或為學生提供回答，而是深入融合到教學過程中。

在學生學習的整個過程中，通過細粒度的學習行為（比如專注點）和每個學生獨特的知識背景和了解能力，提供及時和個性化的教育輔導。

除了教育領域，該論文所提出的“利用大語言模型模拟人的實體行為（如眼神動作）”的思路，有望被拓展到其他包含使用者行為的場景。

例如，真人和虛拟數字人的互動。通過生成虛拟數字人的眼神和真人的眼神動作進行眼神接觸和互動，使使用者獲得認同感和情感交流。

開發基于生成式模型的學生智能體

據介紹，該研究大緻經曆五個階段，包括：尋找重要的問題、文獻調研、提出新模型、設計實驗評價模型和思考模型的潛在應用場景和局限性。

具體來說：

第一，尋找重要的問題。

實際上，研究人員在此前的項目裡已經發現該問題：如何用更少的資料，更真實地模拟學生更細粒度和全面的學習行為？

已有的深度學習模型需要大量的資料集進行訓練，是以亟需研究新的模型，滿足好的效果的同時，又不需要大量額外的訓練資料。

第二，文獻調研，了解針對這個問題的最新已有論文的解決方法、效果和局限性。

徐嵩霖介紹道：“通過調研我們發現，雖然已有研究利用大模型進行學生學習的模拟，但是效果甚至沒有深度學習的模型好。”

其中的主要原因之一在于，已有的研究隻利用學生回答問題的準确率進行模組化，忽略了上下文資訊。比如，具體知識點的内容、學生在學習這個知識點過程中的行為狀态。

第三，針對已有研究的局限性，提出新的模型。

對于上述提到的已有研究的局限性，該課題組提出結合學生的實體行為、心理狀态和知識了解能力，對學生行為進行更全面模組化，打造真正意義上的學生智能體 EduAgent。

“該智能體可以像真實的學生一樣，擁有自己的眼神動作、心理狀态和了解能力，而不是簡單地對學生在考試成績中的準确率進行預測。”徐嵩霖表示。

圖丨資料集與現有學生學習行為資料集的比較（來源：arXiv）

第四，設計實驗評價模型。

研究人員設計了兩個實驗，來對模型進行評價。第一個實驗用于對特定學生的模組化，通過真實學生的、少量曆史學習行為資料，預測未來的學習行為和狀态。

第二個實驗是在不依賴任何真實實驗資料的情況下，對不同性格的虛拟學生，生成特定的虛拟學習行為。可應用于虛拟學生資料的生成，來訓練特定的教學政策模型。

徐嵩霖解釋說道：“其中，第三和第四階段往往是互相疊代的，因為不可能一次模型設計，就達到很理想的效果。”

第五，思考模型的潛在應用場景和局限性，以及尚未解決的問題。

例如，對生成的虛拟學生行為進行更深入的研究，以保證它的合理性。另外，還需要處理針對大語言模型可能存在的偏見等問題。

希望增強對學生的個性化教學

目前，徐嵩霖在加州大學聖疊戈分校博士三年級在讀，主要研究方向是基于 AI 的人類增強（Human-AI Integration）。也就是說，通過 AI 來增強人的認知能力以及在教育、健康等場景的應用。

基于該研究，該課題組後續将進行更多的拓展研究。包括：基于本次研究的資料集來探索更強大的模型，應用于團隊的實驗平台開發智能教學系統，通過針對性的教學，解決學生的個性化培養問題等。

圖丨徐嵩霖（來源：徐嵩霖）

據介紹，目前他們已經開發了一個教學網站，通過內建最新的模型和算法，來為不同性格、不同學習背景的學生，提供有針對性的教學和引導。

例如，通過學生的曆史學習行為，為每個學生自動建立個性化的資料庫，來描述每個學生獨特的學習狀态和對知識點的掌握能力。

對每個獨特的學生建立有針對性的學生模拟器，來訓練智能教學模型（AI 教師），使 AI 教師能夠根據不同學生的曆史學習記錄，反複探索不同的教學政策，并選出最優的教學政策。

“希望我們的系統可以為所有學生提供真正意義的個性化教學，來克服個性化和多樣化教學的障礙，并保證教育的包容性。”徐嵩霖表示。

據悉，他們正在考慮招募志願者（包括老師和學生），來免費遠端體驗這種個性化教學系統，歡迎對該項目感興趣的夥伴聯系徐嵩霖 [email protected]。

參考資料：

1.https://arxiv.org/pdf/2404.07963.pdf

營運/排版：何晨龍

科學家開發基于生成式模型的學生智能體，有望增強個性化教育輔導

繼續閱讀

驿城區蟻蜂鎮龐閣村史館：紅色教育的閃耀之星

OpenAI驚變！首席科學家突然離職！王煜全獨家分析！

期刊精粹 | 基于謹慎城市更新理論的德國柏林滕博爾霍夫機場綜合開發模式的啟迪【2024.2期】

傳清華系大模型公司高層變動

58同城孫啟明：生活服務垂類大模型怎麼搭？自研+開源兩手抓

黨紀學習教育丨關于黨員信仰宗教、搞迷信活動的處分規定

第五師雙河市各團場深入開展黨紀學習教育

【黨紀學習教育】每日一課 | 《中國共産黨紀律處分條例》這樣操辦婚喪喜慶事宜将受處分

「教育強國」楊斌：如何衡量一位好校長，關鍵在于這四個字

【黨紀學習教育】第12課對發表、傳播有嚴重政治問題言論的處分規定有哪些？

【教育】上蔡二小開展“最美大課間” 展示活動

這樣操辦婚喪喜慶事宜将受處分 | 黨紀學習教育

違規為特定關系人謀利的情形和處分規定 | 黨紀學習教育

AI天玑全量推送國内首個端到端大模型量産上車小鵬開啟AI智駕時代

助力學子擁抱青春期築夢前行隆回縣三閣司鎮中心學校舉辦心理健康教育講座

家長的韭菜割不完，教育孩子為何還要請“專家”？