当今世界百年未有之大变局加速演进,新冠肺炎疫情影响广泛深远,不稳定性不确定性明显增加。科技创新成为国际战略博弈的主要战场,围绕科技制高点的竞争空前激烈。
6月19日,远望智库、中信出版集团联合举办了新书《科学:无尽的前沿》分享会,特别邀请小冰公司CEO李笛、中国科学院大学教授樊春良、中国科技大学教授房汉廷、北京大学先进技术研究院副院长钟灿涛参会。
在本次分享会上,小冰公司CEO李笛做了主题演讲。他从如下几个方面,讲述了他对世界重心向亚洲移动的理解,并描绘出他眼中“中国企业如何打造科研的应许之地”。让我们一起来梳理他的睿见,希望能对你有所启发。
科学的重心正在向亚洲,尤其是中国转移,我们迎来了历史赋予我们的重大机遇
人类整个文明的发展是需要通过科学的方式不断向前推进的,只有科学,才能够真正使一个地区、一个国家、一个机构获得更好的核心竞争力。我们看到的一个很明确的情况,就是当今全球产生了一个科学向亚洲迁移的过程,而是这个过程实实在在发生了至少20年左右的时间,而今天它来到了一个最终的拐点。未来科学的推动很可能在亚洲进行。
今天我们重读《科学:无尽的前沿》这份70多年前的报告其实是正逢其时的。因为从我个人的角度,历史发生了一些相似性。二次世界大战之后的美国,如果不是很多人都开始观察到,原来基础科学的研究,当它一旦在某些时刻产生贯通效应的时候,它会如此地富有力量,包括政府、企业、机构、科学家本身都能够从中获得巨大的收益,从而使这些人更确信这是一件他们必须做的事情,那么就不会有《科学:无尽的前沿》这份影响至今的,改变了全球科研格局的伟大报告,即使有,可能也不会得到如此坚实地贯彻和落实。
70多年之后的今天,在中国,我们也开始注意到,原来基础科学研究是很重要的未来基石,从上到下,关于这一点正在逐渐地成为共识。从这个意义上来说,今天的历史来到了一个非常巧合的关键点。
01 科研重心的转移
由于我对于其他领域不是太了解,因此只能从计算机和人工智能这个领域说明一下这个问题。
我们可以很明确地看到一点,就是世界的重心包括科研的重心在向亚洲转移。很抱歉的事情是,并不是说直接向中国转移,而是整体上向亚洲转移,这其中也包括日本、印度等其他国家。
从某种程度来讲,这是一个很大的巧合,也给了中国机会。关于这一趋势,不是今天美国推出一个《创新与竞争法案》就能逆转的。也不是我们国内认为应该更多地推进基础研究,就能够一下就把所有的重心都转移到中国的。它实际上是一个综合作用的结果。
从我的角度来讲,我认为创新的基础在向亚洲转移特别是向中国转移的过程,至少从2006年开始就已经在进行,推动人工智能发展有很多的因素,最主要的几个因素,一个是数据。在2006年左右,因为我们做搜索引擎,大概观察到全球范围内都有一个明显的数据的暴增,而中国是其中一个非常大的增量。2009年的时候,中国这边跟计算机和人工智能相关的基础设施也在逐步开始完善。大家如果回头去看,国内的一些云计算的厂商,比如阿里云等这些在这个时候就完成了。到2015年的时候,在各种学术的顶级会议上面,中国的科研机构开始有刷榜,开始有各种各样的曝光,然后是专利申请的激增,中国的人工智能和计算机方面的专利开始大幅度提高。
2018年,中国进一步形成一些贯通产品。从2018年开始,我们看到国内有很多端到端的产品,而这些端到端的产品甚至开始影响全世界。作为主体是中国人的研究团队,我们是很兴奋的。像Tiktok这样的项目在此之前是不可想象的,一款来自中国的产品影响世界,这是很罕见的创举,虽然说其中有很多问题,比如算法的威胁,但是从端到端角度来讲,这代表了中国的力量。
02 未来的竞争不是单点突破,而是框架和指标的竞争
我们今天讨论的基础科学研究的特点,很重要的一点是,它往往覆盖多个学科、多个领域,而不是单点突破。在五六十年代、六七十年代,咱们国家老一辈科学家和政治家们,只要勒紧裤腰带,想各种办法排除万难,我们也能在某一点科研上面取得很好的成果,给国家带来几十年的和平,但这个是单点技术科学的突破。真正能够抓住无尽前沿的方式,是要完成系统性的覆盖多个学科领域的突破。
举一个例子。在人工智能领域,计算机语音角度有一个很重要的任务就是如何让人工智能的声音可以拟合人,这听起来是一个很小的事情,但背后有很多的算法。30多个算法模型就够做人脸识别了,而语音可能需要一两百个模型。
把时间拉回到2013年,在2013年的时候,通过实验室走出来的人工智能的声音是像Siri那样的声音,它是非常机械的。在那时候,全世界的针对语音合成上面的指标,还停留在语音的识别上,也就是把内容准确地以语音的方式传到你的耳朵里去,所以它更多的要求是这个内容不要念错。
那个时候我们开始考虑是不是能够做出一个相对自然的声音,这个声音能够有更好的情感,它背后会有一些情绪化的特征。这也就要求建立一种新的指标,我们把它叫做“语音自然度”。所谓的自然度,取决于当你听到这个声音的时候,你能够在多长时间内听它而不会感觉受不了,比如你听7分钟就再也受不了这个声音了,那么用这个声音驱动很多的东西,就全部不能超过7分钟。三年前,我们通过很多技术的创新,实现了21分钟的平均舒适时长的声音。到此为止,用单点的技术突破、单点的科研突破都还可以做到。
但是再接下来,我们做了一个舒适时长达到31分钟的声音,这个声音就没法依靠单点突破完成了,它需要很多很多跨学科的技术。因为针对这种声音,我们更多做的事情是在这个版本上开始还原人类的瑕疵、人类的不足、人类的那些不好的地方,其实会带来更多的自然结果。
如果我们再把这些技术成果进一步工程化,我们可以做到用15分钟的时间模拟出一个人可以说以假乱真的声音,我们其实很谨慎,因为当人工智能这种技术在不停地向前突破,并且形成贯通的时候,新的指标可能会产生新的效果,但是也有可能产生很多新的问题。比如像这样的声音从此以后就很难去描述,我们说法律方面有7种证据,视听资料是其中一种证据,那就很难再评价这个人的录音是不是还具有法律意义上的证据价值,这是基础科学研究转入到应用的时候经常出现的新的情况,但是它的前提是你确实能够贯通,你能提出新的指标。
像刚才这个声音意味着我们已经需要再提出一些新的指标了,整个行业都需要新的指标。这个指标是谁提出的,谁就更有先发优势,我们原来说一流企业做标准,现在一流企业做指标,这是非常具有先发优势的。所以一个系统的重要性是不言而喻的。
我们很高兴地看到这么多年的中国在往系统性的方面发展,不再追求单点的一个技术的突破,就是用一个技术解决一个具体的问题,用一种研发的方式去解决一种新药的研制,而是尽可能用通用的方法解决一系列新药的研制,或者用一个更通用的框架解决各种各样药物的研制,包括新药,包括过去传统的药,包括整个的测试环节等等,这就是系统的重要性,它是美国曾经具有的,它是我们需要的。
从这个角度来讲,中国实际上有很多优势,因为我们国家有特别好的纵深。我们有一线到六线的城市,我们有大量不同的数据,我们也有大量各种各样应用的场景,这些场景化的应用再加上数据的轮转就可以让基础科学研究不断地在这个轮盘中间加速,然后再把它适用到不同的场景当中去,这是很重要的。
03 理念创新同样重要
再一个就是理念的创新。之前整个世界对于对话系统,对于自然语言处理王冠上的宝石,大家的认识都是一致的,它要么像一个战士一样无所不能,要么像爱因斯坦一样无所不知,但是所有这两个方面的研究都面临着哲学层面的困局,这就造成在此之前的对话人工智能其实都没有很好的延展。
举一个例子。我们在微软的时候想做一个智能助理项目,所以我们去采访了做得很好的人类助理,希望让人工智能助理可以向人学习。我们设想了一种场景,给这个助理下达这样一个指令:中午帮我订一份汉堡包加薯条。我们一开始认为最好的方式就是用一轮对话马上就可以把这个东西订了。再好一点,可以预判第二天的情况,因为你中午要开会,所以它直接就帮你预判并且给你订了,这是很智能的。再进一步,你如果给它授权,它可以动用你的钱包,你就不用再跟它说什么,它就直接帮你订了,这是我们认为最智能的。
当我们跟人类助理去聊的时候,人类助理说不是这样的,他很有可能会拒绝,他会说我不给你订麦当劳,我们当时就很蒙,因为要迭代一个系统必须得确保这个系统完成任务得满分,现在不完成任务就能得满分,反而没法迭代了。我们下意识以为,可能存在更高的智能要求,去达成更加基础的目标,比如健康,健康难道不是比中午订一份麦当劳更重要的任务吗,显然这个助理是更智能的,它还知道有健康的任务要完成。
然而这个人类助理反而嘲笑了我们,他说你们真的想多了,我就是要拒绝我老板,找各种各样的理由。因为我要让我这个合作伙伴知道我不是一个只有手没有脑子的人,我是一个有我自己的观念、有我自己的思考、有我自己的观点的这样一个人。从此以后,当我跟他建立起很好的关系,不光是订餐这些简单的任务他会很信任我,以后很多其他的工作我们也能够相处得很好。所以它不取决于任何一个单独的任务应该怎样去完成,而是更大范围的事情怎么去完成。
我想跟大家说的是,这种新的理念更多是从亚洲观测到的,而不是从欧洲或者美国观测到的。当你观察到这个现象的时候,你就有一个机会引入这个新的理念,那么当我们建立人工智能的对话系统时,它背后的核心理念就不再是完成当下这个任务,而是营造出人和人工智能的长久的关系。
我们通过在中国和日本大量的数据观测到,这种长久的关关系可以坚持下来的,这种关系就被固定下来了。我们看美国很多的创新,殊不知这些创新在中国早就开始了。当我们做这种长久关切的时候,亚马逊就在悬赏百万美元,奖励那些能让它的智能助理Alexa跟人聊30分钟的人;像Facebook曾经想要做贾维斯那样的完成任务的机器人,那个项目已经被关闭了,现在做的项目叫做Facebook Blender,而它们对标的都是我们中国的东西。其实很多创新理念层面来说,已经是由我们这边来进行了。
如何确定这些理念是合理的,这个是咱们国家需要重视的一点,就是我们要学会包容各种各样的思想。如果我们看《科学:无尽的前沿》这份报告诞生的时刻,我会看到在那个时候,任何一种理念的创新涉及到基础科学研究的时候,在这个国家里面都有非常大的包容度,它的研究人员在里面也有非常好的包容度,它会去尝试和辨别各种各样的可能性。对大量的框架和理念进行试错,一个机构是不可以的,但是一个国家是可以的,所以我们现在特别需要百花齐放,也许有些机构赌错了方向,但是科学整体的沃土不会赌错方向,这是很关键的一件事情。我们这个时候比任何时候都更需要包容。
04 对于科学发展的一些建议
(一)中国团队需要自信
我们要明确一件事,中国的团队真的需要自信起来,中国的科研人员、中国的企业、中国的机构、中国的大众确实需要自信,当然不是盲目自信。为什么?第一,今天我们提要把基础研究放在中国,由中国来推动全世界,这不是刚刚发生的事情,它其实已经发生很久了。第二,我们今天也确实拥有这样的土壤,我们可以有单点技术的创新,也可以有系统性技术的创新,我们可以有指标性的,也可以有理念性的。而这些跟早先不一样,其实已经在被全世界关注了,尤其已经被美国关注了,这是事实。我们需要避免更多地去看美国的创新,然后去复制它。大家知道在计算机包括互联网这个领域,很长时间我们都是me too的模式,就是在硅谷有的东西,我们中国才会有,中国自己的创新我们不是特别关注,这个是不自信的,也许自信来得有点晚,但是是需要的。
(二)重视负样本的作用
科学发展,尤其是基础科研部分,重要的往往不光是它的正样本,就是它的好的结果,它的不好的结果也是特别关键的。咱们国家有一个特别好的地方,就是我们的负样本特别多,我们如果要做人工智能的规划,或者做图象识别视觉上面的东西,我们会拿到大量不好的案例。我们的自动驾驶在路上跑的时候,会得到大量不对的数据,中国的交通环境总体而言比较糟糕,这些都是负样本,这些负样本是很牛的。从其他角度来讲,我们国家的医生到美国去,咱们国家的医生也是非常强的,因为美国没有那么多案例,一个医生没有那么多的训练机会,中国有,当然也包括失败的训练机会。所以这就有一个很关键的事情,就是我们需要共享负样本,整个行业需要共享的不仅仅是科研成果,也需要共享失败的案例,包括失败的数据集。只有这样,这些基础科学研究才会加速。
(三)科学普及是必要的
第三个很重要的事情也是这份报告提到的一件事情,就是科学是否应该对大众进行普及。我自己认为这件事情从《科学:无尽的前沿》那儿,仍然可以得到很好的启发,这也是我很钦佩这个人的原因之一。一般大众都会争论说,某一种科学技术是有用的,或者某一种科学技术是无用的,然后科学家会说你不要管它有没有用,你让我自己弄就行了,最好离我们远一点,我们是象牙塔。这样的问题在70年前也遇到了,但是这种象牙塔其实是在阻隔科学。因为确实需要一种向大众普及科学的态度以及身体力行进行这样的工作,才有可能使大众保持对科学的热情,它不仅能够推动科学家不停地新陈代谢,它也能够使科学向各个行业、各个具体细节的链条去延伸的时候,能够畅通无阻。我们往往不愿意告诉大家这些背后的事情,对于一个普通人而言,他手上拿到的手机是他能接触到的实实在在的创新,但是手机背后有着一个基础科研的链条,这个链条涉及到了电子科学很多领域的进展,他都已经不再关注了,我们所需要做的事情就是告诉大家这中间的链条。
我们今天能够讨论科学发展,科学重心转移,科学发展路径这些问题,是幸运的一代,再早20年我们都没有这个机会讨论。今天我们有机会在中国做科研,去尝试把当年美国的优点传承过来。正所谓面壁十年图破壁,历史的机遇已经来到了我们面前。唯有珍惜和奋斗,才能不负这大好韶光。
书名:《科学:无尽的前沿》
定价:59.00 元
ISBN:9787521729597
作者:范内瓦·布什;拉什·D.霍尔特
出版时间:2021年5月
出版社:中信出版集团
内容简介:
《科学:无尽的前沿》是美国科学政策的“开山之作”,使得美国迅速摆脱对于欧洲基础研究以及科研人才的依赖,成就了美国今日的科技强国地位,也永久改变了人类科学发展的格局。是我们看懂美国科技政策的由来、科学发展的路径以及其未来走向的重要著作。
《科学:无尽的前沿》系统解析了科学对于国家经济与安全、社会福祉以及个人发展的重要意义,着重提出要重视基础科学研究,给予科研工作者以高度的研究自由,政府应拨款以资助科研项目的顺利进行,以及设立国家研究基金会等。这些理念和建议直到今天,仍然熠熠生辉,常读常新。
当下的中国和当时的美国状况类似。我们的科学虽然发展迅速,但依然严重依赖国外的基础性研究成果,在很多关键领域被核心技术卡住了脖子。透过《科学:无尽的前沿》研究美国科学大发展的原因,培育全民的科学思维和科学精神,加大对于基础科学和前沿科学的投入,提升企业的科技实力和全球竞争力,都具有无可比拟的现实意义。