天天看点

记录时间:2021年,中国的人工智能为什么还没走到「黄金时代」?

作者:第一赛马网
记录时间:2021年,中国的人工智能为什么还没走到「黄金时代」?

作者 | 陈彩娴

编辑 丨 岑峰

在过去的一年里,「AI科技评论」做了什么?

年关将至,笔者在思考摸鱼时回忆365天的无间断文章更新之余,最常想起的是2021年5月底我们对UC Berkeley大学知名华人学者马毅ICML投稿被4个评审接收却仍遭AC拒绝进行报道一事。当时文章一经发出,立刻引来AI研究者们的关注,甚至马教授本人也po到了微博:

记录时间:2021年,中国的人工智能为什么还没走到「黄金时代」?

不过,在这件事中,最引起笔者注意的并非马毅本人的转发,而是教授微博下的一条评论(有一种课间休息玩得正嗨被老师点名叫去办公室交待行为动机的错觉):

记录时间:2021年,中国的人工智能为什么还没走到「黄金时代」?

要知道,AI科技评论的口号就是「聚焦 AI 前沿研究,关注 AI 青年成长」,要实现这两大目标,对学者的研究论文进行关注与解读报道是必不可少的。要说有啥动机?除了殷勤关切每一位AI学者的动态与青年学生的成长,还能有啥动机?

(至于如何盈利,只要老板不提,咱也不敢说,咱也不敢问……毕竟做研究的人都是知识分子,谈钱多少有点俗气……)

记录时间:2021年,中国的人工智能为什么还没走到「黄金时代」?

不服气归不服气,作为一个科技号,尤其是当前信息爆炸、媒体渠道多,现代人的注意力容易被分散,而关注人工智能科技的群体又呈现出越来越复杂的多层次特征,我们多少也有点「身份危机」。借年底给甲方爸爸领导汇报工作的机会,AI科技评论的「打工人」编辑组盘点了过去一年的精品文章,发现在过去的一年,我们实在是太理想主义星辰大海了(狗头)!

接下来,给大家分享一下过去一年「AI科技评论」为互联网记忆人工智能研究进展的几个重要角色专业八卦姿势:

一、学术圈「纪检委」

2021年,人工智能研究领域仍是风波不断的一年。在这一年,AI科技评论定点跟踪、「曝光」了超过30起学术研究腐败或不公平事件。其中,1月份北大教授饶毅举报裴钢院士造假一事最为轰动,「低情商学术造假、高情商图片误用」也成为编辑组茶余饭后最「有味」的谈话:

  • 《饶毅深夜举报裴钢院士学术不端!网友评:低情商学术造假,高情商图片误用》
  • 《裴钢学生凌堃发信请饶毅配合,饶毅:不要帮倒忙》
  • 《“饶毅举报”事件尘埃落定,裴钢表示未发现裴钢造假。网友:我有信心一年发20篇SCI》
  • 《饶毅愤慨发问「图片误用」在中国可以被除名吗?中国「无科研造假」元年:“空前绝后”》
记录时间:2021年,中国的人工智能为什么还没走到「黄金时代」?

论文造假的普遍性正在影响中国的学术信誉。在2021年3月23日Nature所发布的文章“The fight against fake-paper factories that churn out sham science”中,Nature便称「从去年一月份开始,Nature杂志已经撤回了370篇论文,而且数量目前还在增多,这些论文全部来自中国。」而且,在这些论文中,有197篇是医学类论文,这些论文都因为图片问题被打假斗士标记了出来。

饶毅教授被称为中国知识分子的「脊梁」,其呼吁建立公平学术环境的诉求与努力一向为人称道。与饶毅教授有关的另一起知名学术研究打假事件是:饶毅于2019年11月举报中国科学院上海药物研究所学术所长耿美玉学术造假,后同被以「大量图片误用」的说辞处理,耿美玉反告饶毅名誉侵权案。所幸,2021年12月中旬,该诉讼一审宣判饶毅胜。

这件事给编辑组最大的感受是:学术打假是需要技术实力的。普通人或知识积累一般的人,根本无法在海量的研究工作中发现高深莫测的科研论文下的技术原理性错误与「造假」嫌疑。换言之,在科研领域,打假需得是同行「抓」同行,魔高一尺,道高一丈。

除了饶毅裴钢一事,AI科技评论在过去一年揭露的学术不端事件还有:

  • 《明尼苏达大学华人教授故意向Linux提交漏洞代码来做研究!整所大学被Linux列入黑名单......》
  • 《花3W买论文发核心的幽灵讲师被扒,北大:已启动调查!》
  • 《强迫投稿者引用自己论文,IEEE高级会员被终身“禁赛”,网友:这事在国内很常见......》
  • ……

被寄予维护学术公平与健康发展的「同行评审」制度,在2021年也是屡次翻车:

5月27日,ACM Fellow、美国布朗大学计算机科学系教授迈克尔·利特曼(Michael L. Littman)在ACM通讯上发文,痛斥部分学者在顶会论文的提交与审核中利用同行评审机制共谋「走后门」,同行评审机制首次在权威学术期刊平台上被严肃曝光与遭受指责。

紧接着,5月28日,Nature爆料同行评审机制并无法有效识别、「拒收」计算机软件自动生成的垃圾文章,且这些文章中,有64%来自中国。

8月3日,IEEE Fellow李涛被ACM罕见公开点名、撤销其ACM的会员资格,又一次将「同行评审」机制推到学术不端的浪尖上,因为李涛被谴责违反了科研诚信的理由中,第一条就是走了同行评审的漏洞:「有数十条证据表明,李涛以多种方式违反论文的同行评审程序。例如分享评审人员的信息,要求他人撰写信息并在会议评审系统发布,从而推动某一篇稿件过审。」

  • 《学术圈要炸锅:论文作者和审稿人串通欺骗盲审,ACM Fellow发文痛斥!顶会“想中就中”》(头条1.9W+,在看36,评论14,点赞数34,转载7)-5.27
  • 《同行评审就是个笑话!Nature最新爆料计算机生成的垃圾文章竟还能被接受,64%来自中国》(头条2.1W+,在看42,评论16,点赞数35,转载9)-5.28
  • 《开除IEEE Fellow李涛的会员资格!ACM罕见公开点名:不忘悲剧,警示未来》(头条4.4W+,在看132,评论28,点赞数142,转载9)-8.3

如何促进高校健康科研环境的建设,也在2021年持续引起关注。其中,6月7日复旦大学数学系教师姜文华杀害该系党委书记王某一事最为轰动,也最为令人唏嘘,「非升即走」的长聘教轨制(Tenure Track)再次引起热议。

记录时间:2021年,中国的人工智能为什么还没走到「黄金时代」?

如AI科技评论当时总结:

  • 对比国外的Tenure Track,中国的“非升即走”淘汰率确实偏高;
  • 「非升即走」缺乏明确的可衡量指标,「winner take all」的机制容易造成「养蛊」的直观观感;
  • AI科技评论也曾经报道过“一箪食一瓢饮”的北大数学天才韦东奕。对于大多数选择了科研道路的人来说,他们实际上对物质需求并没有特别高的要求,却仍然要在一刀切的“非升即走”机制中挣扎,在被剥夺尊严的环境中求生存。

雪崩的时候,没有一片雪花是无辜的。时隔两个月,X乎又爆出疑似关系户的双非博士出任985高校助理教授,被网友评为「这才是『飞升疾走』」……学术环境是否正在割裂?

记录时间:2021年,中国的人工智能为什么还没走到「黄金时代」?

这一系列事件警惕我们:在谈科研成果与研究突破时,或许我们的目光不应该单单集中在「科研」,还应该关注推进「科研」发展的土壤与环境,思考如何从建立良好的组织架构上促进科学的健康发展。而同行评审究竟是不是当前最有效的机制?这一点值得深思。如果是,我们应该如何改进?如果不是,我们又应该如何破旧立新?

再回到人工智能领域。各AI顶会也幺蛾子不断:1月,UC伯克利、哈佛等高校联名投稿 ICLR 抨击 ICLR 评审存偏见,称AC决策偏好有名气的机构与作者;6月,CVPR 出台一条「离奇」政策,禁止社交媒体讨论正在评审中的论文,被图灵奖得主 Yann LeCun 批「这是在限制科学进步」;7月,ICML 2021在19日公布杰出论文获奖名单,20日又将原定杰出论文改为荣誉提名论文,闹出大乌龙;11月,ICLR又出现抄袭论文……

  • 《套娃?UC伯克利、哈佛等联名投稿ICLR抨击ICLR评审存偏见,程序主席:好稿,拒了吧》
  • 《禁止社交媒体讨论“评审中”论文,CVPR新政引热议!LeCun痛斥:这是在限制科学进步》
  • 《AI顶会真奇葩!ICML杰出论文说变就变,田渊栋差点获大奖?独家揭秘背后大瓜》
  • 《ICLR 2022出现抄袭论文 | reddit 网友热议:迷惑行为?》
记录时间:2021年,中国的人工智能为什么还没走到「黄金时代」?

咱也不敢说,咱也不敢问。

总而言之,在新的一年里,AI科技评论会持续关注国内外的学术研究环境与作风问题,当好一名「纪检委」吃瓜专业户。

二、AI前沿研究「记录者」

说完大的学术关键关注,再说到具体的科技成果记录。作为一枚「人工智能爱好号」,在过去的一年,我们记录了上百个影响力或大或小的研究工作。

2021年开年,1月6日,语言与视觉领域就出现了一个重磅级成果:OpenAI 发布了名为「DALL·E」的神经网络模型,可以按照自然语言文字描述像变魔法般地直接生成对应的图片,

记录时间:2021年,中国的人工智能为什么还没走到「黄金时代」?

2017年发布的Transformer,在2021年也仍有不少相关的研究工作推出。其中,谷歌在5月推出的MLP-Mixer更是引起国内外知名学者的讨论,且争议不断……

  • 《Transformer又来搞事情!百万像素高清图轻松合成,效果迷人》
  • 《Transformer全面超越ResNet:依图开源“可大可小”T2T-ViT,轻量版优于MobileNet》
  • 《谷歌最新提出无需卷积、注意力 ,纯MLP构成的视觉架构!网友:MLP is All You Need ?》
  • 《CV圈杀疯了!继谷歌之后,清华、牛津等学者又发表三篇MLP相关论文,LeCun也在发声》
  • 《AI圈真魔幻!谷歌最新研究表明卷积在NLP预训练上竟优于Transformer?LeCun暧昧表态》
  • 《ICCV 2021放榜!发现一篇宝藏论文——如何一次性训练100,000+个Vision Transformers?》

Transformer开创性的颠覆了以往序列建模和RNN划等号的思路,GPT、BERT等在NLP各业务屡创佳绩的语言模型,都是基于Transformer的。而谷歌、OpenAI、微软、META(Facebook)等企业掀起的AI大规模模型扩军备战的浪潮,正如Percy Liang、李飞飞等百余位学者联名发布研究报告指明「基础模型」的机遇与挑战,大模型时代已经到来,而产业界也将在打破人工智能天花板发挥更大的作用。

这并不是说学术界毫无作为。无论是Hinton一作新论文:如何在神经网络中表示“部分-整体层次结构”?、还是Yann LeCun最新文章:自监督学习的统一框架,人类婴儿般学习,以及他们提出了一个大胆的猜想:GWT(深度学习)→通用人工智能的新范式,学术界和产业界在人工智能的推进上选择了各自擅长的方式。

让我们来看看学术界和企业界的研究有何差异:

学术界:

  • 《UC伯克利发现「没有免费午餐定理」加强版:每个神经网络,都是一个高维向量》
  • 《深度稳定学习:因果学习的最新进展 | 清华大学团队 CVPR 研究》
  • 《普林斯顿研究“最小值”:平方和的破局,二次和三次优化问题的极限》
  • 《还在满足“小池塘”模拟?这篇图形学论文征服了汪洋大海!UBC博士:一起来“整”个世界》

企业界:

  • 《超火AI变脸特效来袭!马云、马斯克与蔡徐坤一起「蚂蚁呀嘿」,李开复随即“Only you”~》
  • 《DeepMind 训练 AI 玩足球,风骚走位堪比人类!传球、抢断、进球、配合比中国男足都强(狗头)》
  • 《为了让AI不断打怪升级,DeepMind打造了一个“元宇宙”》
  • 《打破GANs“垄断”|OpenAI新研究:Diffusion Models 图文转换效果超越DALL-E》

同样,也不乏学术界与产业界的联手:

  • 《ResNets王者回归!谷歌、伯克利联合发文:它当初输给EfficientNets不是架构问题》
  • 《训练AI来玩CS反恐精英!清华朱军与剑桥博士后的这项研究太燃了 | 童年回忆》
  • 《有了“大数据”,还需“多任务”,谷歌AI大牛Quoc V. Le发现大模型零样本学习能力的关键》
  • 《10倍GPT-3!全球最大预训练模型“悟道2.0”问世:9项世界第一,多项任务逼近图灵测试》

如果说前几年的趋势是学者从学术界去往产业界,那么到今天,这一批去往产业界的科学家开始分化。在企业逐步接过人工智能研究的话语权的同时,人工智能也正在逐步落地,产品化成为新一轮产学结合的重心。不管是从AI大厂“出走”回到企业界,还是继续留在产业界“再出发”,理论与工程实践的碰撞,也将进一步推进前沿研究的深化。

新的一年,AI科技评论将围绕科学家们在学术界与产业界之间的切换,持续进行AI前沿研究的报道。

三、AI for Science 「水电工」

2021年12月,Science公布了2021年十大“年度突破”,排名首位的是人工智能在生命科学领域中的应用——“用AI预测蛋白质结构”,科学家使用基于AI的软件根据氨基酸序列准确预测了大量蛋白质的三维(3D)结构。在2021年,多个研究机构以AlphaFold为标杆开展了相关研究,而AI for Science(以AI为工具开展科学研究)也成为了2021年的一个热门话题。

记录时间:2021年,中国的人工智能为什么还没走到「黄金时代」?

早在2017年,吴恩达在斯坦福商学院的演讲中就提出“人工智能是新的‘电力’”,这一观点在他此后的多个场合及演讲中均有提及。从这个角度看,AI for Science在2021年的爆发并非偶然——从2017年到2021年,正好是一个4年的创新周期,4年的厚积薄发,也足以将一个“AI+X”从概念推动到爆发的前夜。

数据获取、调节和数字化方法、计算基础设施和算法训练方法的快速发展,预示着人工智能将在几乎所有医疗领域和疾病上得到应用。从某种意义上说,2021年可以算作AI+生物医疗的爆发元年。

  • 《AlphaFold 2不再一家独大!DeepMind和华盛顿大学团队同日抢发Nature和Science》
  • 《斯隆奖获得者李婧翌:AI+X并非总是有效,生物数据量小、噪音大,可解释性是关键》
  • 《CMU马坚团队用机器学习算法呈现基因组折叠过程,登顶Nature!》
  • 《专注AI药物发现,Demis Hassabis宣布成立“同构实验室”,与DeepMind比肩!(招人中)》
  • 《可解释AI先驱、深理工潘毅教授:AI制药,要多做「用结构找小分子」的逆向工程》
  • 《为了医疗AI,他们做出了一个“违背祖师爷”的决定》
  • 《三个半月,「清华系」创企用AI造出一款高效新冠抗体,创始人曾获「计算生物学」最高奖项》

而在数学、物理、化学等基础研究领域,AI也成为了助力研究的利器:

  • 《登顶Nature | DeepMind用AI首次实现数学领域重大进展,助力科学家证实两大猜想》
  • 《这5个数学猜想最早在30年前提出,如今AI证明它们都错了》
  • 《2021年, 别再只沉迷于GANs 和 Transformer,GNN爆发已经从CV蔓延到物理化学》
  • 《戈登贝尔奖获得者张林峰:当AI遇上物理模型,会有怎样的质变?》
  • 《DeepMind与谷歌又出大招!用神经网络解决NP-hard的MIP问题》
  • 《再登Nature!从玻璃箱的水流到200万平方公里的降雨预报,DeepMind的AI物理模拟上天了》
  • 《P vs. NP 五十年:AI正在解决不可解问题》

在AI科技评论看来,AI不仅仅是新时代的电力,它还像我们所熟悉又无处不在的水一样,与电共同成为驱动社会进步的基础设施。在未2022,AI科技评论将做一名合格的水电(搬运)工,让更多人能领略到AI对科学研究的促进。

记录时间:2021年,中国的人工智能为什么还没走到「黄金时代」?

四、技术思考「杠精」

猴子为何能用意念游戏?油管网红博主打造「百发百中」自动瞄准弓箭闭上眼睛也能射中,当中有何道理?113亿参数的中国最大 AI 模型,为何热衷作诗和告诉你男朋友该不该分手?如何欣赏《三体》中二向箔吞噬地球的场景成真?把一块石头变成CPU,是解决全球芯片荒还是弥天骗局?......

这一切的背后,究竟是技术的进步,道德沦丧的炒作?

作为一家关注技术进展的公众号,2021年,AI科技评论也报道了多个技术热点话题。从少年极客单枪匹马动手DIY到大公司团队一篇论文数十名作者的“团体作战”,以及在脑机接口、自动驾驶等领域的“突破性进展”,往往都能收获上万的流量;但AI科技评论编辑部在做处理选题的时候,最大的困扰还是如何做好技术本身的报道和“抓观众眼球”的平衡。

  • 《太赛博朋克了!华为天才少年自制B站百大Up奖杯,网友:技术难度不高,但侮辱性极强》
  • 《真·自行车!华为天才少年刚刚「发布」了一款无人驾驶自行车,网友:这TM不比特斯拉燃?》
  • 《因买不到RTX 3090,他花19万搭了一个专业级机器学习工作站》
  • 《“意念打字”速度接近常人手机聊天,专家:这比马斯克的“猴子玩游戏”难多了 | Nature封面》
  • 《》
  • 《时隔两载"黑洞"翻新:人类首次获得黑洞边缘的高清照片》

根据维基百科的定义,所谓技术,是指人类对机器、硬件或人造器具的运用,也包括更广的架构、如系统、组织方法和技巧。具体到我们所关注的具体业务中,一项技术最初是为某个业务服务,但对着技术的发展,技术本身也可以转化为一项新的业务(一个典型的例子是云计算),为其他人、组织提供有价值的解决方案。

按技术的生命周期理论,一项技术的成长通常分为四个阶段:导入期(理论及实验室阶段)、成长期(技术原型阶段)、成熟期(产业落地阶段)及衰退期。目前人工智能落地所遭遇的困难,主要在于成熟度1-3的高校原始创新和成熟度7-10的产品应用中存在巨大的鸿沟,在科技新闻报道中,这也是最容易“翻车”的地方。

记录时间:2021年,中国的人工智能为什么还没走到「黄金时代」?

2021年也是诸多科技大V的翻车之年。AI科技评论深刻感受到,要做好技术话题的科普并非易事,对于一件刷爆朋友圈的热点事件,要想让我们的报道真正“出圈”,不仅要去深入了解技术的本质,还要在对新技术所取得的进步欢欣鼓舞的同时,更要保持一份求真和质疑,充当一个“杠精”的角色,Stay hungury,Stay foolish,才能做好技术话题的科普和报道,而非用标题爆眼球。

2022,你对AI科技评论还有什么期待?欢迎留言。