天天看點

當「養老」遇上 AI 大模型

作者:雷峰網

作者:賴文昕

編輯:陳彩娴

鮮少有人關注到這樣一個現象:

在大模型的發展初期,「研發」與「産品」往往來自同一個群體——程式員。

由于大模型技術的系統複雜,新一代大模型産品經理的數量稀少,程式員往往既是技術、又是産品。是以,程式員對 AI 大模型「究竟能解決什麼問題」、「如何解決某個問題」的思考,也就在一定程度上刻畫了第一批大模型落地應用的模樣。

換言之,程式員不僅難以被淘汰,反而對大模型的進步扮演重要角色。

基于這個背景,由中國電子學會主辦、ATEC 前沿科技探索社群承辦的第四屆 ATEC 科技精英賽(ATEC2023),也以程式員為中心,将鏡頭聚焦在了程式員與大模型技術的「對話」上,探索程式員會如何利用大模型技術來解決現實生活中的實際難題,如「科技助老」。

上周,ATEC 2023 的比賽内容以真人綜藝節目《燃燒吧!天才程式員》的形式播出,讓觀衆在 48 小時的直播中觀看了青年一代程式員應用大模型思考應用解法的真實工作情況,在各大網絡平台上引起了廣泛關注。

從賽題的内容設定來看,ATEC 2023 一反正常,在評測程式員的大模型解法時,不是基于現有的學術界制定的性能評測榜單,如 C-Eval 等,而是從真實世界的使用者體驗出發,圍繞老人用支付寶在生活繳費、醫療服務、紅包社交等場景中的問題,直接向程式員發起挑戰。

這也是國内首個圍繞大模型如何解決真實社會難題的程式員比賽。

48 小時的大模型極限挑戰

4 月 21 日晚,國内首個基于真實場景的大模型全鍊路應用競賽——ATEC 2023 的最後一輪比賽結束。

通過多輪線上賽、線下賽的比拼與評委的層層篩選,最終角逐出一支冠軍隊伍。團隊成員分别是畢業于哈爾濱工業大學(深圳) 電子與通信工程專業的周青松,東南大學軟體工程專業碩士在讀的吳東冬,華中科技大學軟體工程專業碩士在讀的“最年少選手”邱晨浩,以及華中科技大學網絡空間安全專業碩士在讀的王浩宇。

當「養老」遇上 AI 大模型

ATEC 2023 的線下比賽是一個「48 小時大模型極限挑戰」,進入線下賽的 16 名選手面對直播鏡頭的全程記錄,使用由賽事提供的近50張 A100 卡資源實戰,最終勝出者能獲得 100 萬元獎金。

作為國内程式員與在校大學生首選的一線賽事,這已經是 ATEC 科技精英賽連續舉辦的第四個年頭了。

與傳統的技術競賽不同,ATEC 通過緊扣社會價值的命題設計,搭模組化拟真實工作環境的比賽環境,旨在考察選手及其團隊成員間的綜合性問題解決能力。這種賽制設計不僅考驗參賽者的專業技能,也鍛煉了他們的團隊合作和現場應變能力,為應用型技術人才的培養提供了實踐平台。

ATEC 一直倡導緊貼當下技術發展趨勢和産業實際需求命題,以反映真實工業場景中的挑戰。選手們在參賽過程中所面臨的技術難題和解決方案,正是工業界中亟待解決的技術或産品痛點。

圍繞真實場景和資料設計考點,ATEC 還為産業界提供了一個觀察和選拔人才的機會。在前三屆,線下賽的命題分别為「野生動物保護」、「科技反詐」與「科技助實」。

通過營運《燃燒吧!天才程式員》這一業内首檔代碼競技真人秀,ATEC 科技社群全景展現了比賽過程中青年科技選手間的競争與合作、挑戰與反擊,真實地呈現了中國年輕一代科技從業者的面貌。

當「養老」遇上 AI 大模型

48小時線下賽現場

剛剛結束的 ATEC 2023 則首次圍繞大模型技術,以「科技助老」為題,基于真實場景和資料,使用清華大學計算機科學與技術系與智譜華章公司共同研發的千億參數多模态大模型 GLM,并采用全鍊路應用的考察形式,對選手的算法及工程實作能力提出了更高的要求。

比賽由中國電子學會主辦,ATEC 前沿科技社群承辦,清華大學、浙江大學、西安交通大學、上海交通大學、螞蟻集團共同協辦,包括北京大學、南京大學、新加坡南洋理工大學在内的12所高校參與合作。

作為本屆賽事的命題方之一,清華大學全程參與了線上賽、答辯、線下賽階段的命題及組織工作。

評審組負責人、清華大學副教授任炬在賽後指出:“我們希望用貼近真實工業場景的考察方式,鼓勵技術從業者和學習者腳踏實地,關注實踐應用、拒絕空中樓閣;每年會錨定一個具有社會價值的命題,提醒所有的行業同侪,技術應當造福社會;同時借助科技競技、甚至極限挑戰的形式,培養青年科技人堅忍不拔、勇于奮進的态度和面貌。”

比賽吸引了行業内衆多年輕有為的高手,賽事報名人數創下了曆史新高,一共有1901支隊伍、3000餘位選手報名,并且超過51%的報名者來自211及以上院校。選手們來自清華大學、北京大學、中國科學技術大學、華中科技大學、中山大學、哈爾濱工業大學等高校,平均年齡隻有 26 歲。

經過「大模型的知識引入」、「大模型的工具學習」、「AI新聞檢測」、「網絡安全大模型」這四個賽道長達三個月的線上淘汰賽後,最終有16支隊伍從千人競技中脫穎而出,成功殺入線下賽環節。

線下賽賽題貼近工業真實,清華大學與螞蟻集團圍繞「科技助老」來聯合命題,從「生活助老」、「智慧醫療」、「安全守護」三大闆塊展開,選手們需要依托大模型技術,為銀發族開發一套能夠提供服務多方面養老需求的智能助理。

當「養老」遇上 AI 大模型

具體而言,這16支隊伍需要基于支付寶智能助理的真實場景,以老年人在支付寶上常用的生活類場景為例(生活繳費、醫療服務、紅包社交等),去探索如何借助大模型提供的自然語言互動的方式,使得老年人無需學習繁瑣的App操作方式,即可便捷地完成想要的操作。

在綜合性的考察下,選手們需要在48小時的極限直播中通過大模型技術破解老年人異地就醫所遇到的一系列現實問題。

冠軍團隊中的周青松認為,本屆比賽「科技助老」的主題很有實用價值,能降低智能工具的學習門檻,幫助老年人及其他存在學習障礙的人群,借助 AI 大模型的幫助,以簡單的對話就能辦理業務。

當養老乘上「Agent」快車

為什麼本屆 ATEC 會聚焦「科技助老」呢?

ATEC出題人、螞蟻集團基礎智能部技術總監張志強告訴雷峰網,人口老齡化已經成為目前國家人口變化發展趨勢的重要主題。一方面技術日新月異給銀發族帶來了科技鴻溝,另一方面,城市與農村地區人口分布不均衡帶來了失養難題,生活需求、醫療需求、安全保障需求,已經成為滿足銀發族養老需求、改善養老環境的三大重要命題。

如何依托先進的大模型技術,為老年人實作智慧養老,自然成為科技工作者面臨的重要挑戰。

基于「科技助老」這個主旨,選手們需要在比賽中解決技術與應用兩大層次的難題。

當「養老」遇上 AI 大模型

賽時選手代碼頁

在技術角度上,選手們面臨的第一個考核要點是檢索。模型需要通過網絡搜尋引擎或者内部的檢索擷取文檔,然後再基于文檔來回答醫療相關的問題,文檔具有權威性,回答自然就可以更精确。

第二個考核要點則是對工具的調用。語言模型隻能回複文字,但如果選手們的方案能調用工具完成實際任務,得分就會更高。比如,在對話框輸入自然語言需求“幫我訂一張明天十點從杭州到上海的二等座票”後,模型就能直接預訂好火車票。

此外,技術層面中檢測謠言、異常提問等均為語言大模型使用中的安全問題,同樣是本屆 ATEC 科技精英賽的重要考核點。

而從應用角度出發,能否讓語言模型為老年人提供更好的智能化體驗,則是評判選手們的方案能否獲得高分的關鍵。其中,智能化體驗需緊密圍繞老年人需求,如出行、政策咨詢、醫療咨詢、安全能力等。

另外,探索如何降低模型部署的成本,是大模型面臨的現實問題與技術難點,同樣也是出題方設計賽題、考驗選手們是否充分思考、發揮創造力的考點之一。

“以前的模型不大,可以獨立部署,但現在模型部署成本很高。如果能通過隐私保護技術,對語言模型的輸入或互動方式提供保護,就可能節省大量資源。我們希望模型能變成類似發電站的工具,就不可能把發電機放在家裡。是以,将原模型放在計算平台上,通過一次計算方式調用或使用,這是一個非常有前景的技術與工程問題。”張志強在賽事直播時向觀衆解讀道。

當「養老」遇上 AI 大模型

節目直播講解現場

當然,想在48小時内完成一個功能完備的 Agent 開發任務并不現實。是以,出題方将 Agent 完整的鍊路拆開成數個環節,每個環節再提供對應的資料邏輯,讓選手們在有限時間内逐一攻破不同階段的任務。

周青松和團隊成員一起,赢得了這場「大模型極限挑戰賽」的冠軍,2022年碩士畢業于哈爾濱工業大學(深圳) 電子與通信工程專業的他,目前在科技大廠擔任進階工程師一職。

周青松擅長自然語言處理(NLP)與資料挖掘,曾獲「kaggle master」稱号,也在2021年的ATEC科技精英賽赢得了冠軍。兩年後,周青松在ATEC的賽場上再度奪得桂冠。

在談及參賽目的時,周青松坦言,高額的獎金是吸引他參賽的最初動力,同時,來自真實工業場景的命題,也讓「科技競技」變得更有價值。

讓周青松印象最深刻的是線下賽的最後一道賽題。題目落腳于醫療領域,選手們需要将醫療垂類知識引入大模型,盡可能提升大模型對診療相關問題的了解能力,增加其醫療知識的深度和廣度。

具體而言,模型需要在被問到一系列的疾病症狀時,能提供準确的診斷并給出詳細的治療意見。診斷越精确、治療意見越恰當,選手們的得分就更高。

當「養老」遇上 AI 大模型

周青松與隊友們

在周青松看來,整場比賽中最具挑戰的部分是提升代碼的運作速度。代碼運作速度變慢,就會顯著增加訓練模型所需的時間和成本。

“這是一個非常極限的比賽,我們要在有限的時間内完成一系列任務,就特别依賴平時可能不太關心的代碼運作速度。”周青松告訴雷峰網,“在限時場景裡,提高代碼運作速度很難也很重要,如果把它優化好的話,就相當于整體的疊代速度都會領先于其他隊伍。”

AI First

作為國内首個基于真實場景的大模型全鍊路應用競賽,ATEC 精英賽是從本屆起開始聚焦大模型的。

“大模型技術在去年上半年火起來,在我們去年線下賽時已經很熱門,是以就提出今年賽題一定要做大模型相關的考題,這是熱點更是挑戰。”

張志強告訴雷峰網,“大模型在業内有競賽,但結合應用的比賽較少。在判斷完各個次元後,我們認為自然語言互動一定是一種很重要的、面向未來的、AI 産品的互動模式,能夠彌補傳統互動模式的一些短闆。本屆的主旨是科技助老,因為老年人不易了解手機操作邏輯,而自然語言互動對他們來說很簡單,是以基于大語言模型技術研發的 AI 産品尤其适合老年人使用。”

張志強花名「零幺」,作為螞蟻大模型的技術核心負責人,他與團隊負責螞蟻基礎技術的研發,包括語言模型、知識圖譜與圖神經網絡,這些技術在支付寶中的人臉識别與金融、醫療等産品中都有所應用。

目前,語言模型的語料優化是張志強團隊最重要的工作内容之一,團隊負責千億參數模型研發與語料優化,并在百靈大語言模型基座的基礎上研發醫療行業大模型。

作為聯合命題方之一的螞蟻集團,與清華大學一起決定将本屆 ATEC 賽事以大模型為技術基座,也折射了螞蟻近年來「All In AI」的力度。

2023年,螞蟻集團提出了「AI First」戰略,與「支付寶雙飛輪」同「加速全球化」一起并稱為集團三大戰略。

其實早在「AI First」戰略對外宣布之前,螞蟻集團就已經對 AI 領域進行了深入投資和研究。大約在2022年9月,公司内部已經明确了以大模型為核心的 AI 研究方向。2022年底,螞蟻集團正式啟動大模型的研發項目。2023年11月,螞蟻百靈大模型通過備案。

除了自研模型的程序外,螞蟻的「AI First」戰略更展現在其不斷将大模型融入生活、金融、醫療健康等業務場景的努力中:

現正産品灰測、下月逐漸開放的支付寶智能助理,能為使用者提供出行、健康、政務等領域的數字生活服務;

「金融管家」支小寶,可為使用者提供高品質的行情分析、持倉診斷、資産配置和投教陪伴等專業服務;

智能研發工具 CodeFuse,則支援整個軟體開發生命周期,可為企業提供AI研發全周期管理;

安全一體化解決方案「蟻天鑒」,能提供從檢測到防禦的大模型一站式安全服務解決方案……

通過将特定領域的專業知識整合進通用大模型基座,大模型能夠更精準地适應并優化多種垂直行業場景的應用。目前來看,螞蟻集團的大模型技術已在醫療、遙感、政務、金融等多個行業展現出顯著的應用成效,推動了這些領域的智能化轉型和效率提升。

而螞蟻自2020年起參與的 ATEC 科技精英賽也在不知不覺中成為國内最熱門的 AI 賽事之一,搭起連接配接優秀技術研發者的橋梁,并以綜藝節目的方式向大衆傳播當下最新的 AI 技術。

寫在最後

ATEC 2023 由清華大學與螞蟻集團聯合命題,基于「科技助老」的主旨引入支付寶智能助理的場景和資料,賽題及資料庫會在不久後向全國衆多高校開放。清華學子們将首批在課程中直接學習到 AI 大模型在工業場景的實際應用。

不言而喻,在 ATEC 2023 中,學術界與産業界的深度合作相輔相成,中國電子學會、ATEC 前沿科技探索社群與以清華大學為代表的頂尖學術機構為競賽提供了強大的理論支援和人才培養平台,螞蟻集團則提供了真實的工業場景及資料,雙方共同推動了 AI 大模型産學結合的發展。這種合作模式不僅為學生提供了實踐機會,也為科技企業輸送了高品質的人才。

作為出題方之一,螞蟻聚焦「AI First」戰略,在以賽事吸引 AI 人才的同時,也緊鑼密鼓的布局着自研模型與大模型的落地應用,再加上多年打磨出來的技術和積累的資料資産,螞蟻在大模型競賽中逐漸築起一條「護城河」,擁有獨特的優勢。

除了螞蟻集團外,随着 AI 行業的焦點從「百模大戰」轉向 AI 應用落地,中國科技企業主導或深度參與的 STEM、程式設計、AI 領域的賽事越來越多,比如華為軟體精英挑戰賽、華為極客算法精英大賽、百度AI科技科技創新大賽、騰訊廣告算法大賽與阿裡巴巴全球數學競賽等等。

科技企業紛紛在賽事布局與加注,除了讓科技青年們能提前「步入戰場」,在真卡、真算力、真場景下練兵外,更是以高額的獎金與校内難接觸的算力資源,拉開了一場企業間吸引尖端科技人才的較量。

畢竟,在大模型競賽中,人才方為攻城略地的關鍵。

以 ATEC 科技精英賽為首的一衆競賽不僅是科技企業對資源、技術實力的展示,更是對 AI 領域專業人才的深度挖掘和培養。通過競賽,企業能夠識别并吸引那些對大模型技術有深刻了解的人才,同時激發他們的創新潛力,促進與企業的合作。

賽事不斷,人才不斷,競争亦不斷。

本文作者 anna042023 将持續關注AI大模型領域的人事、企業、商業應用以及行業發展趨勢,歡迎添加交流,互通有無。

繼續閱讀