在即将于今年10月24-26日在浙江橫店舉辦的CNCC2024上,138個技術論壇覆寫了人工智能、安全、AI+、網絡、計算+、系統軟體、教育、晶片等34個專業領域,推動不同領域的交叉融合,為各界專業人士提供了廣泛的專業内容。包括國際知名學者、兩院院士、産學研各界代表在内的800餘位報告嘉賓将着力探讨計算技術與未來宏觀發展趨勢,為參會者提供深度的學術和産業交流機會,當中不乏在各領域深具影響力的重磅學者專家親自擔綱論壇主席。
本專題力邀CNCC2024技術論壇主席親自撰稿,分享真知灼見,歡迎走進CNCC,領略計算領域專業大觀魅力!
本期特别嘉賓:
陳紅陽 之江實驗室資料樞紐與安全研究中心副主任
作者:CNCC2024【第二屆大模型與科學計算論壇:大模型開啟科學計算新篇章】論壇主席 陳紅陽
大模型是一種預先在海量非标記資料集上訓練、具有大量參數的深度神經網絡。其顯著特點之一是具有“湧現能力”,能夠在多個領域中展現出高品質的智能表現。随着技術的不斷進步,大模型的應用在通用領域和特定領域中變得日益廣泛。伴随計算能力的提升與資料資源的廣泛積累,研究者們越來越關注利用大模型進行科學計算與問題求解的方法。科學問題通常具有極高的複雜性,涉及海量資料和複雜計算。大模型的使用能夠有效應對這些複雜性,在加速資料處理與分析的同時,提供高度準确的預測結果,進而顯著推動科學研究的發展與進步。
大模型的強大計算能力和自動化資料處理能力對地球科學研究領域産生了影響,推動了地學研究在資料收集、分析和應用等各個環節的全面更新。地學研究往往涉及大量多源資料,如遙感影像、地質圖、氣象資料等。大模型能夠高效地處理這些大規模、多元度的資料,提取出其中的複雜模式和隐含資訊。例如,遙感技術生成的影像資料量巨大,傳統的人工解譯方法費時費力。通過應用大模型可以實作對遙感影像進行分類、目标檢測和變化檢測等操作, 這在資源勘探、環境監測和災害評估中具有重要意義。大模型在自然語言進行中的應用,特别是預訓練語言模型,可以用于建構地學領域的知識圖譜。通過解析地學文獻、報告和資料集,大模型能夠自動生成結構化的知識圖譜,支援地學研究中的知識發現與知識管理。之江實驗室研發了地學大模型Geogpt旨在提供包括知識查詢、資料擷取、科研啟發、分析推理在内的科研能力,幫助地球科學工作者提升科研效率,促進創新成果的産出。
在數學研究方面,由于推理能力和訓練資料的不足,大模型在解決幾何和數學中的複雜問題時常常面臨困難。然而,LLEMMA、Mathstral、InternLM-Math 和 AlphaGeometry等數學大模型在這一領域取得了顯著進展。特别是AlphaGeometry,在對30道奧數幾何題的基準測試中,AlphaGeometry在标準奧數時限内解決了25道題目,而人類金牌得主的平均解答數為25.9道。它在解決複雜幾何問題上的表現已經接近人類奧林匹克金牌得主的水準,這是人工智能性能的重大突破。
在醫療領域,早期的醫療語言模型主要是在通用預訓練語言模型的基礎上,利用醫學文獻或臨床文本進行領域适應。這些模型的參數規模從幾億到幾十億不等。然而,随着模型架構和訓練方法的進步,醫療大語言模型的規模迅速增長,達到了數千億參數的規模。BioMistral是一個為生物醫學領域設計的開源預訓練大型語言模型集合,它基于Mistral模型并在PubMed Central上進一步預訓練。BioMistral通過量化和模型合并技術提供輕量化模型,具備出色的醫學問答能力。Med-PaLM 2則在醫學文本訓練和特定任務中表現優異,能夠回答複雜醫學問題并生成優質的長篇回答,在多項醫學應用中超越了人類專家。在基因組學領域,大模型也顯示出了巨大的潛力,scGPT是一種生成式預訓練模型,旨在應用于單細胞多組學領域。scGPT利用生成式預訓練變換器架構,通過超過3300萬個細胞的單細胞RNA測序資料,建構了細胞和基因的嵌入表示。該模型能夠高精度地執行細胞類型注釋、多批次整合、多組學整合和遺傳擾動預測等任務。在蛋白質模型領域,2024年5月釋出的AlphaFold3能夠預測所有已知生物的蛋白質結構。此版本在AlphaFold2的基礎上特别優化了對多蛋白複合體的預測能力,并且能更好地考慮蛋白質間的互相作用。AlphaFold3的這些進步預示着它在生物醫學研究和藥物開發方面的巨大潛力,可能引領生物科學的重大變革。未來,這些大模型将增強對生物分子資料的解釋和生成能力,顯著推進基因組學和個性化醫療的發展。
未來,大模型發展的課題将包括模型規模與複雜性的持續增長、能效與計算優化、專用領域模型的研發、多語言和跨文化适應性提升,以及更強的人機協作與增強智能等。
論壇時間:10月26日13:30-17:30
論壇地點:浙江東陽市橫店圓明新園 秋苑-含晖樓二樓
想了解更多關于CNCC2024技術論壇資訊,歡迎觀看CCF公衆号【CNCC專家談】專題及CCF視訊号【CNCC會客廳】直播,我們将陸續邀請本屆CNCC技術論壇的論壇主席或重磅嘉賓,圍繞今年CNCC涉及到的熱門話題進行研讨交流,親自帶觀衆走進CNCC,敬請随時關注。歡迎一鍵預約,準時觀看!