斯坦福2023 AI指數報告出爐，都講了啥？

新智元報道

編輯：桃子

【新智元導讀】2023年人工智能指數報告釋出了！這份報告顯示，中國在AI頂會論文上表現世界居首，然而引用量卻低于美國。另外，AI論文發表量世界前十的機構中，中國占了9席，紛紛趕超MIT。

今天，斯坦福釋出了2023年AI指數報告。

值得注意的是，斯坦福AI指數報告列出了「AI論文發表量」世界前十的機構，9所全部來自中國，紛紛趕超MIT。

它們分别是：中國科學院、清華大學、中國科學院大學、上海交通大學、浙江大學、哈爾濱工業大學、北京航空航天大學、電子科技大學、北京大學、以及MIT。

今年的報告主要分為八大節：研究與發展，技術表現，人工智能技術倫理，經濟，教育，政策和治理，多樣性，以及公衆觀點。

以下内容提取了報告幾項要點。

中美論文合作全球居首

從2010年-2021年，盡管AI論文跨國合作的步伐已經放緩，但是自2010年以來，美國和中國的人工智能研究合作數量增加了大約4倍，比中國和英國合作總數多2.5倍。

然而，從2020年-2021年，中美合作的總數僅增長了2.1%，是自2010年以來的最小同比增長率。

此外，人工智能論文的總數自2010年以來翻了一番以上。從2010年的20萬篇增長到2021年的近50萬篇（49601）。

就AI論文發表的類型來看， 2021 年，所有已發表的AI論文中有60%是期刊文章，17%是會議論文，13%來自存儲庫。

雖然在過去12年中期刊和儲存庫論文分别增長了3倍和26.6倍，但會議論文的數量自2019年以來有所下降。

模式識别、機器學習和計算機視覺依舊是人工智能領域研究的熱門話題。

中國在期刊、會議和儲存庫論文總量方面依舊處于領先地位。

美國在人工智能會議和儲存庫引用方面仍然領先，但這些領先優勢正被慢慢削弱。盡管如此，世界上大多數的大型語言模型和多模态模型（2022年54%）是由美國機構産生的。

中國霸榜AI頂會，但引用量低于美國

AI期刊論文的發表，中國始終保持領先地位，2021年為39.8%，其次是歐盟和英國（15.1%），然後是美國（10.0%）。

自2010年以來，中國人工智能期刊論文被引頻次占比逐漸上升，歐盟、英國、美國均有所下降。中國、歐盟和英國、美國占全球總引用量的65.7%。

那麼，世界頂會論文發表的情況又如何？

2021年，中國以26.15%的比例在全球AI頂會發表的論文數所占份額最大，而歐盟和英國以20.29%緊随其後，美國以17.23%位居第三。

從頂會論文引用量來看，中國雖然高産，但引用量相較于美國來說較低。美國頂會論文引用量23.9%，中國為22.02%。

從側面可以看出，中國論文發表數量最多，但品質不如美國高。

在AI論文儲存庫送出方面，美國在世界居首，23.48%。中國最低，11.87%。

中國9所機構，AI論文發表趕超MIT

2021年，發表論文總量世界前十機構中，中國占了9所，不同機構發表的論文總數如下圖，MIT位列第十，發表論文1745。

就計算機視覺領域（CV）來看，中國的十所機構位居世界前十，它們分别是，中國科學院、上海交通大學、中國科學院大學、清華大學、浙江大學、北京航空航天大學、武漢大學、北京理工大學、哈爾濱工業大學，以及天津大學。

在自然語言處理（NLP）領域，就有所不同了。

世界前十的機構/公司有：中國科學院、卡内基梅隆大學、微軟、清華大學、卡内基梅隆大學-澳洲分校、谷歌、北京大學、中國科學院大學、阿裡、亞馬遜。

語音識别領域排名如下：

工業界領先學術界

在2022年釋出的重要人工智能機器學習系統中，語言系統占最多，有23個，是多模态系統數量的6倍。

在論文産量上，工業界領先于學術界。

直到2014年，大多數重要的模型都是由學術界釋出的。從那時起，工業界便逆襲翻身。到2022年，32個重要的機器學習模型都誕生在工業界，而學術界僅有3個。

由此可見，與非營利組織和學術界相比，建構最先進的人工智能系統越來越需要大量的資料、計算機能力和資金資源，而行業參與者固然有更多的資金資源去做這件事情。

2022年，美國産生了數量最多的重要機器學習系統，有16個，其次是英國（8個）和中國（3個）。

此外，自2002年以來，就建立的重要機器學習系統總數而言，美國已經超過了英國和歐盟、中國

再來看做出這些重要AI系統背後研究者國分布，美國有最多的研究者，285人，是英國的2倍多，是中國的近6倍。

LLM越來越大，算力越貴

大型語言和多模态模型，有時稱為基礎模型，是目前一種新興且日益流行的AI模型類型，它在大量資料上進行訓練并适用于各種下遊應用程式。

ChatGPT、DALL-E 2和MakeA-Video等大型語言和多模态模型已經展示了令人印象深刻的功能，并開始在現實世界中廣泛部署。

通過對這些模型作者的國家隸屬關系進行了分析，這些研究人員中的大多數來自美國機構（54.2%）。

斯坦福AI指數報告還列出了大型語言和多模态模型釋出的時間表。

大型語言模型正變得越來越大，也越來越昂貴。

第一個大型語言模型GPT-2于2019年釋出，有15億參數，訓練成本約50000美元。谷歌PaLM是2022年推出的大型語言模型之一，有5400億參數，成本高達800萬美元。

從參數和訓練成本來看，PalM比GPT-2大360倍，成本高出160倍。

不僅僅是 PalM，從整體上看，大型語言和多模态模型變得越來越大和昂貴。

例如，DeepMind于2022年5月推出的大型語言模型Chinchilla估計耗資210萬美元，而BLOOM的訓練大約耗資230 萬美元。

随着時間的推移，GAN在人臉生成方面的進展，最後一個圖像由Diffusion-GAN生成，這一模型在STL-10上取得了最新的SOTA。

去年，随着OpenAI的DALL-E 2、Stability AI的Stable Diffusion、Midjourney、Meta的Make-AScene，以及谷歌的 Imagen等模型的釋出，文本到圖像生成模型逐漸走進大衆視野。

如下，輸入相同的提示，「一隻熊貓在溫暖的巴黎夜晚彈鋼琴」，分别由DALL-E 2、Stable Diffusion和Midjourney這三個可公開通路的 AI 文本到圖像系統生成的圖像。

在最近釋出的所有文本到圖像生成模型中，谷歌的Imagen在COCO基準測試中表現最好。

今年，建立Imagen的谷歌研究人員還釋出了一個更難的文本到圖像基準測試 DrawBench，旨在挑戰功能越來越強大的文本到圖像模型。

此外，報告還介紹了目前生成式AI模型存在一些偏見，比如給DELLE-2提示CEO時，每個人似乎都采取了交叉雙臂自信的姿勢。

在Midjourney中，當提示生成「有影響力的人」時，它會生成4張看起來年長的白人男性圖像。

完整報告内容請參見：

https://aiindex.stanford.edu/wp-content/uploads/2023/04/HAI_AI-Index_Report_2023.pdf

斯坦福2023 AI指數報告出爐，都講了啥？

繼續閱讀

陳健淋｜通用人工智能視野下企業資料賦權的類型展開

科學家利用新型人工智能揭開嬰兒學習和發育的秘密

南沙和華為強強聯手！共建人工智能生态基地

2025年人工智能十大趨勢！最新預測→

發表首篇論文10年後，近半學者“退圈”丨科技周覽

張藝謀透露《三體》進度：隻拍一部、大幅删改、引入人工智能

法蘭克福書展聚焦人工智能發展與監管

周日靜學（194）：期刊論文1 引言

周日靜學（193）：博士論文5.6 效率分析

人工智能未來十大趨勢

研學報道|“探索科技前沿引領未來創新”人工智能創新應用博覽會研學之旅啟航

論壇直擊|人工智能創新應用發展領航交流會圓滿舉辦

數字科技、人工智能拯救春晚收視率

DeepSeek出世，人工智能厲害，教師會被取代嗎？讀書還有意義嗎？

馬斯克釋出“地球最聰明AI”，還是華人撐腰？DeepSeek同日出論文

一邊大量失業一邊搞人工智能，發展搶了幾億人飯碗，未來怎麼辦？