天天看点

世间再无汤晓鸥:他是中国最有趣的AI科学家

作者:袁文泽

●撰文 王亚坤

世间再无汤晓鸥:他是中国最有趣的AI科学家

我的演讲都是从铭铭的照片开始的,因为第一,这是我儿子;第二,他长得很帅。

我的演讲都是从铭铭的照片开始的,因为第一,这是我儿子;第二,他长得很帅。

“每天晚上睡觉前,我都是一边听着于谦老师的相声,一边想:机器怎么可能超过这样有趣的灵魂?我不信。”

“今天的听众大部分是中国人,讲国语的,所以我的演讲会用英文,这是一个很好的机会让大家练练英语。”

说出这些话的人是汤晓鸥,一个科学家,同样有着一个有趣的灵魂。

和很多人对科学家“木讷”的刻板印象不同,汤晓鸥善谈,爱讲段子,爱晒娃,自诩“AI界的郭德纲”。

当然,他在AI界的身份更为著名:既是全球顶级人工智能科学家,研制出世界上首个准确率超越人眼的面部识别算法;也是著名“伯乐”,建立了被誉为计算机视觉领域“黄埔军校”的香港中文大学多媒体实验室,培养出中国在该领域的半数顶尖人才;还是亚洲最赚钱的AI企业——商汤科技的创始人。

只是,这样重要又有趣的人,走了。

2023年12月15日深夜,汤晓鸥因病抢救无效去世,年仅55岁。

甘愿做跳板

55岁的汤晓鸥,有着符合人们想象的知识分子的干练气质。公开露面时,他经常穿着一丝不苟的西装,戴着眼镜,笑眯眯的。

1968年,汤晓鸥出生在辽宁鞍山。17岁时,他考上中国顶尖高校之一中国科学技术大学。毕业后,汤晓鸥到美国深造,先是在纽约罗切斯特大学读研,之后转到世界顶级高校麻省理工学院读博。

当时,他进入曾发现泰坦尼克号残骸的海底机器人实验室学习,第一次接触到人脸识别技术,并为此惊叹,“这个很酷”。之后,他决定将其作为自己的研究方向。

1996年,博士毕业的汤晓鸥在香港中文大学找到讲师的教职。5年后,他创办了只有一个博士后做助手的多媒体实验室,研究人脸识别技术。彼时,他刚三十多岁。

汤晓鸥很快遇到了很多青年学者都会遇到的困难:没有人脉,缺乏资金,招不到学生。

生源问题尤其严重。香港地区高校的优秀学生大多计划去声望更高、就业前景更好的美国名校深造,汤晓鸥纵有三寸不烂之舌,也招不到本地优秀学生。

头脑灵活的他,很快想出一条“曲线救国”道路:到内地招生。

为了增强对学生的吸引力,汤晓鸥甚至明确告诉学生们,不介意他们过来只读硕士,“如果这之后你想去欧美深造,我帮你一起申请”。

这在当时是“另类”。

很多教授一旦招到研究生,特别是优秀的那些,就不愿放他们离开,会想方设法把这些学生留下读博,继续给自己“打工”。这在包括计算机在内的工科尤其明显。

事物的本质有两个方面,一个是可笑的一面,一个是更可笑的一面。

汤晓鸥反其道而行,他经常把最好的学生送出去。他觉得,站在学生角度考虑,去麻省理工、斯坦福等顶级学府深造,对他们来说是最好的选择;另一方面,自己也会在无形中受益:学生更愿意来读研,并且出国读博结束,也愿意再回到自己的实验室工作。

最先被汤晓鸥“盯上”的,是他母校中科大的学弟们,之后是清华等著名高校的学生。那时内地名校的学生素质普遍很高,但缺乏对国际前沿研究的把握,有的中科大精英学子,甚至是在被汤晓鸥邀请到港中文访学后,才知道计算机视觉领域有三大国际顶级学术会议(国际计算机视觉与模式识别会议;国际计算机视觉大会;欧洲计算机视觉国际会议)。

具备国际视野同时甘愿做学生“跳板”的汤晓鸥,很快吸引到一批极其优秀的研究生,其中包括他日后最引以为傲、堪称天才的三个学生:在中科大拿到本科生最高荣誉“郭沫若奖”的王晓刚、林达华,以及在清华基础研究班就读的2003年广东高考状元何恺明。

汤晓鸥也没有耽误这批“好苗子”。

“华山论剑”与世界第一

招到一群“天才”后,汤晓鸥再一次“不走寻常路”,给他们找了一条与众不同的成长道路。

汤晓鸥给实验室定了两条原则:一是要海量阅读论文,二是要到国际顶级学术会议上发表论文,他称之为“华山论剑”。

所谓“海量”,指的是论文以“箱”来计算。林达华记得,他加入港中文多媒体实验室第一天,就收到汤晓鸥送的几大箱论文,都是前辈王晓刚看过的。他全部看完,而新的成箱的论文,正在路上。

两年研究生生涯,林达华总共看完2000多篇论文,基本涵盖了计算机视觉方向的全部论文。

除了输入,也要输出,而且是到最顶级舞台上。

汤晓鸥觉得,在国际顶级学术会议上发表论文并和最优秀同行切磋,是磨练学生的最佳方式。“做研究就像比武论剑,论剑一定要到华山,如果去太行山或者大别山……华山以外,很难论出好剑。”

港中文多媒体实验室就此奠定了自己的研究氛围:以顶级学术会议投稿截止日期为准,制定科研计划,投稿前熬夜备战冲刺,并海量阅读论文。

这种方法训练下的学生,取得的成绩惊人。

普通研究生想都不敢想的三大国际顶级学术会议论文,王晓刚在两年研究生生涯中发了5篇。毕业后,他成功获得麻省理工学院的博士录取通知,并拿到全额奖学金。

过去商汤没有那么多产品时,发布会上半场是徐立(CEO)讲笑话,下半场是我讲笑话。现在产品已经丰富起来,没时间讲笑话了。

世间再无汤晓鸥:他是中国最有趣的AI科学家

2023年7月8日,上海,世界人工智能大会,商汤科技展区的“人工智能生成图像”

取得成绩的不仅仅是王晓刚。多年后汤晓鸥曾调侃称:“晓刚是我见到的第一个天才学生,在硕士阶段就发表了5篇国际顶级学术会议论文。他的才华和人品如此出众,以至于我毫不犹豫地将妹妹嫁给他(真事)。后来我的另一个天才级学生达华发表了更多文章,可是我已经没有妹妹可以再嫁了。

好在最近的一个天才级学生靖宇,来的时候就有女朋友了。”

研究生毕业后,林达华和崔靖宇分别收到了麻省理工和斯坦福大学的博士录取通知,并和王晓刚一样,拿到了全额奖学金。

一篇篇高水平论文的发表,也推高了港中文多媒体实验室的地位。

从2005年到2008年,汤晓鸥团队在国际顶级学术会议上共发表60多篇论文,数量上高居世界第一。

每天晚上睡觉前,我都是一边听着于谦老师的相声,一边想:机器怎么可能超过这样有趣的灵魂?我不信。

世间再无汤晓鸥:他是中国最有趣的AI科学家

2016年6月30日,浙江杭州举行人和机器对抗的“人脸识别大赛”

2009年,由汤晓鸥和学生何恺明以及微软亚洲研究院另一位科学家孙剑合作的论文《基于暗原色的单一图像去雾技术》被评选为国际计算机视觉与模式识别会议(计算机视觉领域三大国际最高学术会议之一)的年度最佳论文,这是亚洲历史上第一篇获此荣誉的论文。

这是港中文多媒体实验室崛起的标志,在一次又一次“论剑”中,它已经成为计算机视觉领域的“一方霸主”。

也就在这年,实验室的研究方向发生“革命”性转折。

“黑羊”远去

汤晓鸥意识到了新的研究机遇。

2009年,微软雷蒙德研究院第一次把深度学习运用到大规模语音识别,很短时间内就取得了一个庞大团队几个月才能完成的成果,这在业内引发轰动。

汤晓鸥敏锐觉察到了深度学习领域的潜力,立刻组织团队“摸着石头过河”,开始探索。

“先走一步”的优势很快体现出来。2012年“深度学习”概念爆火,而从2011年到2013年,汤晓鸥团队在两个顶级学术会议上一共发表了14篇基于深度学习的研究论文,占了这两个会议在全球范围内接收的深度学习论文总量(29篇)的近一半。

2014年,汤晓鸥团队人脸识别算法数据库准确率首次超过人眼识别率;几个月后,系列算法准确率进一步提升至99%以上,突破落地门槛。

资本的嗅觉很敏锐,知名投资公司IDG负责人牛奎光立刻飞往香港拜访汤晓鸥,在多媒体实验室看了十几个实验演示后,很快投出了罕见的、高达数千万美元的天使轮投资。当年,滴滴这家中国风头很盛的科技公司,在天使轮之后的A轮也才仅拿到300万美元融资。

(演讲时)组委会很紧张,问我会不会超时,我就保证说,一定会的。

中国视觉AI市场从此拉开帷幕:2014年10月,商汤科技成立。

“商”是中国最古老朝代之一,“汤”是其创始人,用“商汤”这个名字,意味着汤晓鸥对自己团队创意和成就的希冀。它的另一个意思,则被调侃为“从了商的汤老师”。

汤晓鸥在商汤科技推崇“黑羊”文化。他认为,中国互联网公司往往有一种“狼性文化”,他们互相竞争,击垮竞争者。但商汤的文化是“羊文化”,“我们选择合作,我们都是好人,大家惺惺相惜,我们知道每个人的思维方式是不一样的,我们的成长路径不一样,接受的锻炼不一样,我们能够理解别人的想法,但是当然我们也不想做一只循规蹈矩的羊,因为这样的羊会随大流,我们想成为一只黑羊,一只与众不同的羊”。

正如他当年坚持要做深度学习研究一样。

商汤科技的口号是“坚持原创”,之后成为中国第一家上市的AI“独角兽”企业,也是亚洲收入最高的AI企业。

但汤晓鸥在商汤科技最辉煌的2019年前后,就选择“急流勇退”,卸任董事长和CEO职位,回归到科研生活中去。

汤晓鸥最后一场公开演讲,是在2023年7月的世界人工智能大会上,他在总结自己最得意的三个学生的学术成就后,引用了于谦主演的电影《老师好》中的一句台词,说:“我不是在最好的时光遇见了你们,而是遇见了你们,我才有了这段最好的时光。”

只是,世间再无汤晓鸥。

●资料来源:

雷锋网、《天下第一铭》、虎嗅,36氪、公号“晚点LatePost”“甲子光年”“智能涌现”等。

继续阅读