CNCC2024
論壇簡介:
多模态大模型在NPU上的應用能否開創新的互動範式
舉辦時間:10月26日13:30-17:30
地點:夏苑-諧奇趣西角樓一樓
注:如有變動,請以官網(https://ccf.org.cn/cncc2024)最終資訊為準
2022年11月,OpenAI釋出了一款名為ChatGPT的實驗性聊天機器人,帶動起生成式人工智能、大模型熱潮,成為人工智能應用普及的加速器、催化劑,提速了各行各業的智能化轉型。全新的AI體驗也将在智能終端加速落地。大模型技術将成為PC行業的分水嶺,在未來五年帶來PC産品體驗的革命性提升和巨大的增長機遇。包括AI PC在内的智能終端裝置是人工智能觸達終端使用者的終極載體之一,是真正意義上面向消費者的算力普慧。
數目繁多,快速疊代的大模型為人們帶來了高效與便利,随着使用者規模擴大,大模型的計算負載将逐漸由雲端向邊緣側和端側下沉,越來越多的人工智能的推理任務将會在邊緣和裝置端進行,為了支援更多生成式人工智能的應用,不僅需要提升雲端的算力,在邊緣和端側也需要更強大算力的配合,形成“端-邊-雲”混合計算架構下更平衡的算力配置設定。但同時也帶來了很現實的問題,例如如何滿足端側給使用者提供更具特色的大模型服務,如何在端側為大模型推理提供更強大且低功耗的算力解決方案,神經網絡處理器(NPU)在這個方案中能夠扮演什麼角色,在神經網絡處理單元之上,相應的模型推理部署軟體棧和模型算法會有什麼樣的突破?這些課題已經成為業界前沿的研究方向。
論壇亮點
探讨新的AI PC體系架構有哪些潛在的突破點和趨勢?
探讨何種大模型服務是終端裝置更具優勢的服務?
終端裝置如何更好的通過軟體和硬體緊密結合,充分發揮CPU、圖形處理單元(GPU)和神經網絡處理器(NPU)的優勢?
論壇日程
專題演講 (主持人:朱文武)
順序 | 主題 | 主講嘉賓 | 機關 |
1 | 人工智能自動設計處理器晶片 | 陳雲霁 | 中國科學院計算技術研究所 |
2 | 面向多核處理器的圖神經網絡推理優化 | 李東升 | 國防科技大學 |
3 | 面向AI2.0的高能效電路與系統設計 | 汪玉 | 清華大學 |
4 | 視覺感覺與具身智能 | 魯繼文 | 清華大學 |
5 | 面向大算力的SRAM存算晶片設計 | 司鑫 | 東南大學 |
6 | 基于NPU的個人計算體系和互動創新 | 顔毅強 | 聯想集團 |
Panel環節: (主持人:王哲鵬)
主題 | 主講嘉賓 | 機關 |
大模型和NPU對智能終端創新的影響 | 陳雲霁 | 中國科學院計算技術研究所 |
李東升 | 國防科技大學 | |
司 鑫 | 東南大學 | |
李 原 | 珠海市芯動力科技有限公司 | |
顔毅強 | 聯想集團 | |
關超宇 | 清昴智能科技(北京)有限公司 |
論壇主席及嘉賓介紹
論壇主席
朱文武
CCF會士,清華大學教授
清華大學計算機系教授,資訊科學與技術國家研究中心副主任。CCF會士、ACM Fellow、IEEE Fellow、AAAS Fellow、歐洲科學院外籍院士。獲2024年度IEEE電路與系統學會Charles A. Desoer技術成就獎和2023年ACM SIGMM技術成就獎。3次獲國家自然科學二等獎。
論壇共同主席
王哲鵬
聯想集團副總裁
聯想研究院個人電腦與生态創新實驗室負責人,智能無人系統産學研聯盟副理事長。自2001年持續從事智能裝置,柔性顯示技術,智能零售,智慧教育等領域的研發工作,擁有專利160餘項。主持研發的創新産品在CES,MWC, IFA三大展會獲得150多項大獎,視覺算法在CVPR, ICCV, ECCV三大會議獲得10餘項競賽冠軍,并獲得北京市科技進步獎一項和CCF科技進步獎一項。目前承擔科技創新2030重大項目和國家重點研發計劃重點專項各一項。
論壇講者
陳雲霁
CCF體系結構專委會主任,中國科學院計算技術研究所副所長
中科院計算所副所長,處理器晶片全國重點實驗室主任,CCF體系結構專委會主任。長期從事處理器晶片與人工智能的交叉研究,研制了國際首款深度學習處理器晶片(寒武紀1号),被Science雜志刊文評價為深度學習處理器的“先驅”和“引領者”。龍芯3号CPU的主架構師之一,2019年開設了國内首門智能計算系統課,2020年編寫的《智能計算系統》教材已重印多次。 曾獲國家自然科學二等獎、國家傑出青年科學基金、全國五一勞動獎章、中國青年五四獎章、何梁何利科技創新獎,被MIT技術評論評為全球35位傑出青年創新者。
報告題目:人工智能自動設計處理器晶片
報告摘要:圖靈的博士導師阿隆佐•邱奇(Alonzo Church)在1957年提出了面向電路綜合的邱奇問題(Church's Problem),即機器能否自動設計電路。這個問題被很多計算機和人工智能學者視為計算機科學的一個“聖杯”。但此前業界幾十年的探索卻一直沒有突出的進展,機器隻能設計一千個門的玩具電路。我們通過長期的研究,在此問題上取得了突破,形成了國際上首個由AI自動設計的CPU晶片“啟蒙1号”。該晶片包含了超過4,000,000個邏輯門,被Nature新聞報道為“對中國晶片發展的好消息”。
李東升
CCF體系結構專委會副主任,國防科技大學計算機學院教授
CCF傑出會員、大資料專委會委員。國防科技大學計算機學院教授、并行與分布計算全國重點實驗室副主任。國家傑出青年基金、首批國家優秀青年基金、全國優博獲得者,入選教育部新世紀優秀人才計劃。主要從事并行與分布式計算、高性能資料中心、資料智能處理等方面研究工作,在《中國科學》、IEEE/ACM Transactions等學術期刊和會議上發表學術論文100 餘篇,主持研制的系統在國家重要領域得到應用。獲國家科技進步二等獎、軍事科技進步一等獎、湖南省自然科學一等獎、湖南省教學成果特等獎、中國青年科技獎、國務院政府特殊津貼等。
報告題目:面向多核處理器的圖神經網絡推理優化
報告摘要:近年來圖神經網絡(GNNs)受到了關注。圖資料集規模越來越大以及圖神經網絡的圖計算模式多樣,給計算平台上圖神經網絡的推理帶來了挑戰。報告将分析圖神經網絡推理在多核CPU上的性能瓶頸,通過對圖資料記憶體通路模式的優化,設計高效的負載均衡政策以及利用多核處理器的向量化指令重新建構圖神經網絡的核心算子,有效提高GNN在多核CPU上的推理性能。在Intel、AMD、ARM等多種架構的多核處理器上,該方法與目前主流的圖神經網絡架構DGL和PYG等相比,可顯著提高圖神經網絡的推理性能。
汪玉
清華大學電子工程系長聘教授、系主任
清華大學電子工程系長聘教授、系主任,IEEE Fellow,國家自然科學基金傑出青年基金獲得者,清華大學資訊科學技術學院副院長,清華大學天津電子資訊研究院院長。汪玉教授長期從事智能晶片、高能效電路與系統研究,發表IEEE/ACM期刊論文60餘篇、會議論文270餘篇,谷歌學術引用20,000餘次。主持國家級以及企業聯合項目多項,獲CCF科學技術獎技術發明一等獎、國際設計自動化會議40歲以下創新者獎、CCF青竹獎等榮譽。曾獲得4次國際學術會議最佳論文獎及12次最佳論文提名。2016年知識成果轉化入股深鑒科技,打造世界一流的深度學習計算平台,2018年被業内龍頭企業賽靈思(現AMD)收購。2023年推動成立無問芯穹,形成面向大模型的軟硬體聯合優化平台,在國内外十餘種晶片上實作業界領先的大模型推理性能。
報告題目:面向AI2.0的高能效電路與系統設計
報告摘要:基于Transformer架構的大語言模型在多種應用上取得了優異的性能,标志着AI 2.0時代的來臨。随着模型參數量的激增,大模型的計算、存儲和訪存開銷相比傳統深度學習模型增加了4-5個數量級,導緻現有端側硬體平台難以實作大語言模型的高效部署。本報告将首先聚焦大模型時代下軟硬體系統方面的關鍵挑戰和發展現狀,介紹面向AI 2.0的高能效電路與系統設計方法,包括算法模型壓縮、軟體算子優化、到硬體架構設計等一系列軟硬體協同優化方法。其次,本報告将介紹我們在AI PC場景下開展大模型軟硬體協同優化的相關工作。最後,本報告将對AI PC上軟體和硬體的未來發展趨勢進行展望。
魯繼文
清華大學自動化系副主任、長聘教授
清華大學長聘教授,博士生導師,自動化系副主任,國家傑出青年科學基金獲得者,IEEE/IAPR Fellow,國際期刊Pattern Recognition Letters主編,國家重點研發計劃項目負責人,中國仿真學會視覺計算與仿真專業委員會主任,中國自動化學會專家咨詢工作委員會副主任。長期從事計算機視覺、模式識别、具身智能等方面研究,發表IEEE彙刊論文140餘篇(其中T-PAMI論文40篇),CVPR、ICCV、ECCV、NeurIPS論文160餘篇,谷歌學術引用32000餘次,獲授權國家發明專利60餘項,主持國家自然科學基金重點項目2項,獲中國電子學會自然科學一等獎1項(排名1)和國家級教學成果獎二等獎1項,擔任T-IP、T-CSVT、T-BIOM、PR、自動化學報等期刊編委和ACCV2026、FG2023、ICME2022、VCIP2022、AVSS2021等會議大會主席/程式委員會主席。
報告題目:視覺感覺與具身智能
報告摘要:具身智能是人工智能與機器人領域的研究熱點,在工業、農業、服務業等有着重要的應用前景。報告将回顧視覺感覺與具身智能近年來的研究進展,主要包括自主環境感覺、三維場景表示、視覺定位巡航等方法,以及在多模态場景了解、機器人抓取與打包、大模型端側部署等任務中的應用,最後對未來發展趨勢進行展望。
司鑫
東南大學內建電路學院副教授/博導
長期從事存内計算和高算力AI晶片研究,近年來累計發表高水準論文45篇,包含12篇有着“晶片奧林匹克”之稱的ISSCC論文以及8篇內建電路頂刊JSSC、Nature Electronics等。曾獲IEEE CICC最佳學生論文提名獎和MCSoC最佳論文獎。主持多項國家、省部級科研項目。擔任IEEE VLSI-TSA、ICTA和MCSoC會議技術委員會委員。
報告題目:面向大算力的SRAM存算晶片設計
報告摘要:随着大資料時代的蓬勃發展,面向邊緣端的AIGC場景受到越來越多的關注,它需要對資料進行大量且頻繁地通路和計算,因而迫切需要高能效的智能處理器晶片。在基于傳統馮諾依曼架構的處理器設計中,存儲單元和計算單元之間的資料互動必須經由有限的資料總線,系統的性能很大程度上限制在總線的帶寬以及存儲單元的讀寫功耗。為了打破這一“存儲牆”的瓶頸,存内計算受到了廣泛的關注,基于存内計算的系統架構在保留存儲單元自身所具有的存儲和讀寫通路功能的同時,還可以支援不同的邏輯或者矩陣乘加運算,進而在很大程度上減少了計算單元和存儲單元之間頻繁的總線互動,也進一步減少了大量的資料搬移量和由此帶來的功率消耗,進而極大地提升系統的能耗效率。本報告将根據國内外基于靜态随機存儲器(SRAM)的存内計算設計現狀,着重分析存内計算晶片設計的挑戰和最新發展趨勢。
顔毅強
聯想集團首席研究員
聯想集團首席研究員,長期從事智能裝置開發工作,上司多款業界首創的裝置開發工作,包括:無線顯示裝置、智能電視、柔性裝置、智慧零售、平闆電腦二合一裝置。主持研發的産品在CES、MWC上斬獲120多項大獎,并與2021年獲得CCF科技進步獎。目前主持面向大模型的個人電腦計算體系架構和互動創新。累計發表發明專利78項,其中海外專利19篇。
報告題目:基于NPU的個人計算體系和互動創新
報告摘要:端側大模型的推理需求,對傳統以CPU+GPU為核心的個人電腦提出了巨大的挑戰。報告将探讨CPU+GPU+NPU能否成為下一代主流架構?基于NPU如何實作大模型的快速部署、推理優化以及異構計算,常見的模型優化方式有哪些,在端側的應用前景如何?報告将進一步讨論,端側模型推理能力提升将帶來個人電腦互動創新的機會,并總結對未來AI PC發展的預期。
關于CNCC2024
CNCC2024将于10月24-26日在浙江省東陽市橫店鎮舉辦,大會主題為“發展新質生産力,計算引領未來”。大會為期三天,包括18個特邀報告、3個大會論壇、138個專題論壇及34場專題活動和100餘個展覽。圖靈獎獲得者、兩院院士、國内外頂尖學者、知名企業家在内的超過800位講者在會上展望前沿趨勢,分享創新成果。預計參會者超過萬人。