天天看點

記錄時間:2021年,中國的人工智能為什麼還沒走到「黃金時代」?

作者:第一賽馬網
記錄時間:2021年,中國的人工智能為什麼還沒走到「黃金時代」?

作者 | 陳彩娴

編輯 丨 岑峰

在過去的一年裡,「AI科技評論」做了什麼?

年關将至,筆者在思考摸魚時回憶365天的無間斷文章更新之餘,最常想起的是2021年5月底我們對UC Berkeley大學知名華人學者馬毅ICML投稿被4個評審接收卻仍遭AC拒絕進行報道一事。當時文章一經發出,立刻引來AI研究者們的關注,甚至馬教授本人也po到了微網誌:

記錄時間:2021年,中國的人工智能為什麼還沒走到「黃金時代」?

不過,在這件事中,最引起筆者注意的并非馬毅本人的轉發,而是教授微網誌下的一條評論(有一種課間休息玩得正嗨被老師點名叫去辦公室交待行為動機的錯覺):

記錄時間:2021年,中國的人工智能為什麼還沒走到「黃金時代」?

要知道,AI科技評論的口号就是「聚焦 AI 前沿研究,關注 AI 青年成長」,要實作這兩大目标,對學者的研究論文進行關注與解讀報道是必不可少的。要說有啥動機?除了殷勤關切每一位AI學者的動态與青年學生的成長,還能有啥動機?

(至于如何盈利,隻要老闆不提,咱也不敢說,咱也不敢問……畢竟做研究的人都是知識分子,談錢多少有點俗氣……)

記錄時間:2021年,中國的人工智能為什麼還沒走到「黃金時代」?

不服氣歸不服氣,作為一個科技号,尤其是目前資訊爆炸、媒體管道多,現代人的注意力容易被分散,而關注人工智能科技的群體又呈現出越來越複雜的多層次特征,我們多少也有點「身份危機」。借年底給甲方爸爸上司彙報工作的機會,AI科技評論的「打勞工」編輯組盤點了過去一年的精品文章,發現在過去的一年,我們實在是太理想主義星辰大海了(狗頭)!

接下來,給大家分享一下過去一年「AI科技評論」為網際網路記憶人工智能研究進展的幾個重要角色專業八卦姿勢:

一、學術圈「紀檢委」

2021年,人工智能研究領域仍是風波不斷的一年。在這一年,AI科技評論定點跟蹤、「曝光」了超過30起學術研究腐敗或不公平事件。其中,1月份北大教授饒毅舉報裴鋼院士造假一事最為轟動,「低情商學術造假、高情商圖檔誤用」也成為編輯組茶餘飯後最「有味」的談話:

  • 《饒毅深夜舉報裴鋼院士學術不端!網友評:低情商學術造假,高情商圖檔誤用》
  • 《裴鋼學生淩堃發信請饒毅配合,饒毅:不要幫倒忙》
  • 《“饒毅舉報”事件塵埃落定,裴鋼表示未發現裴鋼造假。網友:我有信心一年發20篇SCI》
  • 《饒毅憤慨發問「圖檔誤用」在中國可以被除名嗎?中國「無科研造假」元年:“空前絕後”》
記錄時間:2021年,中國的人工智能為什麼還沒走到「黃金時代」?

論文造假的普遍性正在影響中國的學術信譽。在2021年3月23日Nature所釋出的文章“The fight against fake-paper factories that churn out sham science”中,Nature便稱「從去年一月份開始,Nature雜志已經撤回了370篇論文,而且數量目前還在增多,這些論文全部來自中國。」而且,在這些論文中,有197篇是醫學類論文,這些論文都因為圖檔問題被打假鬥士标記了出來。

饒毅教授被稱為中國知識分子的「脊梁」,其呼籲建立公平學術環境的訴求與努力一向為人稱道。與饒毅教授有關的另一起知名學術研究打假事件是:饒毅于2019年11月舉報中國科學院上海藥物研究所學術所長耿美玉學術造假,後同被以「大量圖檔誤用」的說辭處理,耿美玉反告饒毅名譽侵權案。所幸,2021年12月中旬,該訴訟一審宣判饒毅勝。

這件事給編輯組最大的感受是:學術打假是需要技術實力的。普通人或知識積累一般的人,根本無法在海量的研究工作中發現高深莫測的科研論文下的技術原理性錯誤與「造假」嫌疑。換言之,在科研領域,打假需得是同行「抓」同行,魔高一尺,道高一丈。

除了饒毅裴鋼一事,AI科技評論在過去一年揭露的學術不端事件還有:

  • 《明尼蘇達大學華人教授故意向Linux送出漏洞代碼來做研究!整所大學被Linux列入黑名單......》
  • 《花3W買論文發核心的幽靈講師被扒,北大:已啟動調查!》
  • 《強迫投稿者引用自己論文,IEEE進階會員被終身“禁賽”,網友:這事在國内很常見......》
  • ……

被寄予維護學術公平與健康發展的「同行評審」制度,在2021年也是屢次翻車:

5月27日,ACM Fellow、美國布朗大學計算機科學系教授邁克爾·利特曼(Michael L. Littman)在ACM通訊上發文,痛斥部分學者在頂會論文的送出與稽核中利用同行評審機制共謀「走後門」,同行評審機制首次在權威學術期刊平台上被嚴肅曝光與遭受指責。

緊接着,5月28日,Nature爆料同行評審機制并無法有效識别、「拒收」計算機軟體自動生成的垃圾文章,且這些文章中,有64%來自中國。

8月3日,IEEE Fellow李濤被ACM罕見公開點名、撤銷其ACM的會員資格,又一次将「同行評審」機制推到學術不端的浪尖上,因為李濤被譴責違反了科研誠信的理由中,第一條就是走了同行評審的漏洞:「有數十條證據表明,李濤以多種方式違反論文的同行評審程式。例如分享評審人員的資訊,要求他人撰寫資訊并在會議評審系統釋出,進而推動某一篇稿件過審。」

  • 《學術圈要炸鍋:論文作者和審稿人串通欺騙盲審,ACM Fellow發文痛斥!頂會“想中就中”》(頭條1.9W+,在看36,評論14,點贊數34,轉載7)-5.27
  • 《同行評審就是個笑話!Nature最新爆料計算機生成的垃圾文章竟還能被接受,64%來自中國》(頭條2.1W+,在看42,評論16,點贊數35,轉載9)-5.28
  • 《開除IEEE Fellow李濤的會員資格!ACM罕見公開點名:不忘悲劇,警示未來》(頭條4.4W+,在看132,評論28,點贊數142,轉載9)-8.3

如何促進高校健康科研環境的建設,也在2021年持續引起關注。其中,6月7日複旦大學數學系教師姜文華殺害該系黨委書記王某一事最為轟動,也最為令人唏噓,「非升即走」的長聘教軌制(Tenure Track)再次引起熱議。

記錄時間:2021年,中國的人工智能為什麼還沒走到「黃金時代」?

如AI科技評論當時總結:

  • 對比國外的Tenure Track,中國的“非升即走”淘汰率确實偏高;
  • 「非升即走」缺乏明确的可衡量名額,「winner take all」的機制容易造成「養蠱」的直覺觀感;
  • AI科技評論也曾經報道過“一箪食一瓢飲”的北大數學天才韋東奕。對于大多數選擇了科研道路的人來說,他們實際上對物質需求并沒有特别高的要求,卻仍然要在一刀切的“非升即走”機制中掙紮,在被剝奪尊嚴的環境中求生存。

雪崩的時候,沒有一片雪花是無辜的。時隔兩個月,X乎又爆出疑似關系戶的雙非博士出任985高校助理教授,被網友評為「這才是『飛升疾走』」……學術環境是否正在割裂?

記錄時間:2021年,中國的人工智能為什麼還沒走到「黃金時代」?

這一系列事件警惕我們:在談科研成果與研究突破時,或許我們的目光不應該單單集中在「科研」,還應該關注推進「科研」發展的土壤與環境,思考如何從建立良好的組織架構上促進科學的健康發展。而同行評審究竟是不是目前最有效的機制?這一點值得深思。如果是,我們應該如何改進?如果不是,我們又應該如何破舊立新?

再回到人工智能領域。各AI頂會也幺蛾子不斷:1月,UC伯克利、哈佛等高校聯名投稿 ICLR 抨擊 ICLR 評審存偏見,稱AC決策偏好有名氣的機構與作者;6月,CVPR 出台一條「離奇」政策,禁止社交媒體讨論正在評審中的論文,被圖靈獎得主 Yann LeCun 批「這是在限制科學進步」;7月,ICML 2021在19日公布傑出論文獲獎名單,20日又将原定傑出論文改為榮譽提名論文,鬧出大烏龍;11月,ICLR又出現抄襲論文……

  • 《套娃?UC伯克利、哈佛等聯名投稿ICLR抨擊ICLR評審存偏見,程式主席:好稿,拒了吧》
  • 《禁止社交媒體讨論“評審中”論文,CVPR新政引熱議!LeCun痛斥:這是在限制科學進步》
  • 《AI頂會真奇葩!ICML傑出論文說變就變,田淵棟差點獲大獎?獨家揭秘背後大瓜》
  • 《ICLR 2022出現抄襲論文 | reddit 網友熱議:迷惑行為?》
記錄時間:2021年,中國的人工智能為什麼還沒走到「黃金時代」?

咱也不敢說,咱也不敢問。

總而言之,在新的一年裡,AI科技評論會持續關注國内外的學術研究環境與作風問題,當好一名「紀檢委」吃瓜專業戶。

二、AI前沿研究「記錄者」

說完大的學術關鍵關注,再說到具體的科技成果記錄。作為一枚「人工智能愛好号」,在過去的一年,我們記錄了上百個影響力或大或小的研究工作。

2021年開年,1月6日,語言與視覺領域就出現了一個重磅級成果:OpenAI 釋出了名為「DALL·E」的神經網絡模型,可以按照自然語言文字描述像變魔法般地直接生成對應的圖檔,

記錄時間:2021年,中國的人工智能為什麼還沒走到「黃金時代」?

2017年釋出的Transformer,在2021年也仍有不少相關的研究工作推出。其中,谷歌在5月推出的MLP-Mixer更是引起國内外知名學者的讨論,且争議不斷……

  • 《Transformer又來搞事情!百萬像素高清圖輕松合成,效果迷人》
  • 《Transformer全面超越ResNet:依圖開源“可大可小”T2T-ViT,輕量版優于MobileNet》
  • 《谷歌最新提出無需卷積、注意力 ,純MLP構成的視覺架構!網友:MLP is All You Need ?》
  • 《CV圈殺瘋了!繼谷歌之後,清華、牛津等學者又發表三篇MLP相關論文,LeCun也在發聲》
  • 《AI圈真魔幻!谷歌最新研究表明卷積在NLP預訓練上竟優于Transformer?LeCun暧昧表态》
  • 《ICCV 2021放榜!發現一篇寶藏論文——如何一次性訓練100,000+個Vision Transformers?》

Transformer開創性的颠覆了以往序列模組化和RNN劃等号的思路,GPT、BERT等在NLP各業務屢創佳績的語言模型,都是基于Transformer的。而谷歌、OpenAI、微軟、META(Facebook)等企業掀起的AI大規模模型擴軍備戰的浪潮,正如Percy Liang、李飛飛等百餘位學者聯名釋出研究報告指明「基礎模型」的機遇與挑戰,大模型時代已經到來,而産業界也将在打破人工智能天花闆發揮更大的作用。

這并不是說學術界毫無作為。無論是Hinton一作新論文:如何在神經網絡中表示“部分-整體層次結構”?、還是Yann LeCun最新文章:自監督學習的統一架構,人類嬰兒般學習,以及他們提出了一個大膽的猜想:GWT(深度學習)→通用人工智能的新範式,學術界和産業界在人工智能的推進上選擇了各自擅長的方式。

讓我們來看看學術界和企業界的研究有何差異:

學術界:

  • 《UC伯克利發現「沒有免費午餐定理」加強版:每個神經網絡,都是一個高維向量》
  • 《深度穩定學習:因果學習的最新進展 | 清華大學團隊 CVPR 研究》
  • 《普林斯頓研究“最小值”:平方和的破局,二次和三次優化問題的極限》
  • 《還在滿足“小池塘”模拟?這篇圖形學論文征服了汪洋大海!UBC博士:一起來“整”個世界》

企業界:

  • 《超火AI變臉特效來襲!馬雲、馬斯克與蔡徐坤一起「螞蟻呀嘿」,李開複随即“Only you”~》
  • 《DeepMind 訓練 AI 玩足球,風騷走位堪比人類!傳球、搶斷、進球、配合比中國男足都強(狗頭)》
  • 《為了讓AI不斷打怪更新,DeepMind打造了一個“元宇宙”》
  • 《打破GANs“壟斷”|OpenAI新研究:Diffusion Models 圖文轉換效果超越DALL-E》

同樣,也不乏學術界與産業界的聯手:

  • 《ResNets王者回歸!谷歌、伯克利聯合發文:它當初輸給EfficientNets不是架構問題》
  • 《訓練AI來玩CS反恐精英!清華朱軍與劍橋博士後的這項研究太燃了 | 童年回憶》
  • 《有了“大資料”,還需“多任務”,谷歌AI大牛Quoc V. Le發現大模型零樣本學習能力的關鍵》
  • 《10倍GPT-3!全球最大預訓練模型“悟道2.0”問世:9項世界第一,多項任務逼近圖靈測試》

如果說前幾年的趨勢是學者從學術界去往産業界,那麼到今天,這一批去往産業界的科學家開始分化。在企業逐漸接過人工智能研究的話語權的同時,人工智能也正在逐漸落地,産品化成為新一輪産學結合的重心。不管是從AI大廠“出走”回到企業界,還是繼續留在産業界“再出發”,理論與工程實踐的碰撞,也将進一步推進前沿研究的深化。

新的一年,AI科技評論将圍繞科學家們在學術界與産業界之間的切換,持續進行AI前沿研究的報道。

三、AI for Science 「水電工」

2021年12月,Science公布了2021年十大“年度突破”,排名首位的是人工智能在生命科學領域中的應用——“用AI預測蛋白質結構”,科學家使用基于AI的軟體根據氨基酸序列準确預測了大量蛋白質的三維(3D)結構。在2021年,多個研究機構以AlphaFold為标杆開展了相關研究,而AI for Science(以AI為工具開展科學研究)也成為了2021年的一個熱門話題。

記錄時間:2021年,中國的人工智能為什麼還沒走到「黃金時代」?

早在2017年,吳恩達在斯坦福商學院的演講中就提出“人工智能是新的‘電力’”,這一觀點在他此後的多個場合及演講中均有提及。從這個角度看,AI for Science在2021年的爆發并非偶然——從2017年到2021年,正好是一個4年的創新周期,4年的厚積薄發,也足以将一個“AI+X”從概念推動到爆發的前夜。

資料擷取、調節和數字化方法、計算基礎設施和算法訓練方法的快速發展,預示着人工智能将在幾乎所有醫療領域和疾病上得到應用。從某種意義上說,2021年可以算作AI+生物醫療的爆發元年。

  • 《AlphaFold 2不再一家獨大!DeepMind和華盛頓大學團隊同日搶發Nature和Science》
  • 《斯隆獎獲得者李婧翌:AI+X并非總是有效,生物資料量小、噪音大,可解釋性是關鍵》
  • 《CMU馬堅團隊用機器學習算法呈現基因組折疊過程,登頂Nature!》
  • 《專注AI藥物發現,Demis Hassabis宣布成立“同構實驗室”,與DeepMind比肩!(招人中)》
  • 《可解釋AI先驅、深理工潘毅教授:AI制藥,要多做「用結構找小分子」的逆向工程》
  • 《為了醫療AI,他們做出了一個“違背祖師爺”的決定》
  • 《三個半月,「清華系」創企用AI造出一款高效新冠抗體,創始人曾獲「計算生物學」最高獎項》

而在數學、實體、化學等基礎研究領域,AI也成為了助力研究的利器:

  • 《登頂Nature | DeepMind用AI首次實作數學領域重大進展,助力科學家證明兩大猜想》
  • 《這5個數學猜想最早在30年前提出,如今AI證明它們都錯了》
  • 《2021年, 别再隻沉迷于GANs 和 Transformer,GNN爆發已經從CV蔓延到實體化學》
  • 《戈登貝爾獎獲得者張林峰:當AI遇上實體模型,會有怎樣的質變?》
  • 《DeepMind與谷歌又出大招!用神經網絡解決NP-hard的MIP問題》
  • 《再登Nature!從玻璃箱的水流到200萬平方公裡的降雨預報,DeepMind的AI實體模拟上天了》
  • 《P vs. NP 五十年:AI正在解決不可解問題》

在AI科技評論看來,AI不僅僅是新時代的電力,它還像我們所熟悉又無處不在的水一樣,與電共同成為驅動社會進步的基礎設施。在未2022,AI科技評論将做一名合格的水電(搬運)工,讓更多人能領略到AI對科學研究的促進。

記錄時間:2021年,中國的人工智能為什麼還沒走到「黃金時代」?

四、技術思考「杠精」

猴子為何能用意念遊戲?油管網紅部落客打造「百發百中」自動瞄準弓箭閉上眼睛也能射中,當中有何道理?113億參數的中國最大 AI 模型,為何熱衷作詩和告訴你男朋友該不該分手?如何欣賞《三體》中二向箔吞噬地球的場景成真?把一塊石頭變成CPU,是解決全球晶片荒還是彌天騙局?......

這一切的背後,究竟是技術的進步,道德淪喪的炒作?

作為一家關注技術進展的公衆号,2021年,AI科技評論也報道了多個技術熱點話題。從少年極客單槍匹馬動手DIY到大公司團隊一篇論文數十名作者的“團體作戰”,以及在腦機接口、自動駕駛等領域的“突破性進展”,往往都能收獲上萬的流量;但AI科技評論編輯部在做處理選題的時候,最大的困擾還是如何做好技術本身的報道和“抓觀衆眼球”的平衡。

  • 《太賽博朋克了!華為天才少年自制B站百大Up獎杯,網友:技術難度不高,但侮辱性極強》
  • 《真·自行車!華為天才少年剛剛「釋出」了一款無人駕駛自行車,網友:這TM不比特斯拉燃?》
  • 《因買不到RTX 3090,他花19萬搭了一個專業級機器學習工作站》
  • 《“意念打字”速度接近常人手機聊天,專家:這比馬斯克的“猴子玩遊戲”難多了 | Nature封面》
  • 《》
  • 《時隔兩載"黑洞"翻新:人類首次獲得黑洞邊緣的高清照片》

根據維基百科的定義,所謂技術,是指人類對機器、硬體或人造器具的運用,也包括更廣的架構、如系統、組織方法和技巧。具體到我們所關注的具體業務中,一項技術最初是為某個業務服務,但對着技術的發展,技術本身也可以轉化為一項新的業務(一個典型的例子是雲計算),為其他人、組織提供有價值的解決方案。

按技術的生命周期理論,一項技術的成長通常分為四個階段:導入期(理論及實驗室階段)、成長期(技術原型階段)、成熟期(産業落地階段)及衰退期。目前人工智能落地所遭遇的困難,主要在于成熟度1-3的高校原始創新和成熟度7-10的産品應用中存在巨大的鴻溝,在科技新聞報道中,這也是最容易“翻車”的地方。

記錄時間:2021年,中國的人工智能為什麼還沒走到「黃金時代」?

2021年也是諸多科技大V的翻車之年。AI科技評論深刻感受到,要做好技術話題的科普并非易事,對于一件刷爆朋友圈的熱點事件,要想讓我們的報道真正“出圈”,不僅要去深入了解技術的本質,還要在對新技術所取得的進步歡欣鼓舞的同時,更要保持一份求真和質疑,充當一個“杠精”的角色,Stay hungury,Stay foolish,才能做好技術話題的科普和報道,而非用标題爆眼球。

2022,你對AI科技評論還有什麼期待?歡迎留言。