天天看点

万物皆可“贝叶斯”:不确定性时代的知识哲学

万物皆可“贝叶斯”:不确定性时代的知识哲学

苏婉/温 你正在走在暮色的街区,突然看到一个毛茸茸的东西在草丛里移动。接近夜幕降临,光线不好,你凭直觉判断,这么大的概率就是你经常遇到海狸猫。你不停地观察,你看到它小而尖尖的耳朵,你加深了这是海狸的信念。然后它的条纹尾巴出来,蜷缩起来,摇曳着,你几乎可以肯定是那只猫。最后,毛茸茸的身影闪过,消失在灌木丛中。你回到家,告诉你的家人,"我可能在两天前遇到了那只大海狸!""

一个典型的贝叶斯可能会告诉你,这种不寻常的观察和推测反映了你非凡的大脑刚刚进行了复杂的贝叶斯计算:你根据自己的直觉,根据依次出现的视觉信息,对特定现象的原因做出判断。

万物皆可“贝叶斯”:不确定性时代的知识哲学

贝叶斯游戏:数学、思维和人工智能

作者: 黄丽源

发行商: 图灵|人民邮电出版社

转换器:方形字符串

发布日期: 2021-3

18世纪英国哲学家休谟在他的怀疑论中指出,"我们没有办法知道因果关系,只有某些事情总是联系在一起的。"这种"相关的非因果关系"思想反映在他1748年关于神迹的文章中,其中他对见证人的见证永远无法证明神迹(即基督的复活),这可能导致托马斯·J·托马斯·贝叶斯(Thomas J. Thomas Bayes)指出:我们真的不能通过观察结果来找出真正的原因吗?如果我们预先形成一个信念,需要观察多少证据来确定它的正确性?

在他的文章中,贝叶斯想象自己背对着一张桌子上有一个白球,然后让他的助手随机地把黑球放在桌子上,问白球相对于黑球的位置。白球的位置是黑球处于相对位置的原因,在已知黑球相对于白球位置的情况下确定白球可能位置的过程,是可以回答休谟问题的典型反向概率计算过程。对于贝叶斯来说,只要放置的黑球数量足够,白球绝对位置的归纳推测就可以无限接近准确,因此,由此产生的原因的归纳思维模式不仅有用,而且不像休谟所说的那样,不是非理性的。

贝叶斯的主要业务是神学,他不会想到他自己没有信心发表高调的概率论(尽管他的结论与他认为奇迹可以用足够的证据反过来证明的信念并不矛盾),他身后的数学世界经历了争议和沉默,最后, 两个世纪后,计算机一出现就重生了,在人类越来越依赖和擅长处理大量数据的时代,他命名的定理被广泛用于医学诊断、机器学习、认知神经科学等前沿领域。这个原本粗糙的理论雏形,经过许多天才的修改和推广,现在被看作一种学说、一种知识哲学,甚至是一种抽象的模型,可以概括人脑的认知工作。

贝叶斯博弈:数学,思维和人工智能是一本解释贝叶斯定理"宇宙的普遍性"的书。该书的原始法语版本"知识公式:基于贝叶斯定理的统一知识哲学"(La Formuledusavoir:Unephilo Sophieunifeedusavodéde deBayes)由毕业于巴黎综合技术学院的年轻亚裔法国数学家L'Nguyen HOANG撰写。他现在是瑞士洛桑联邦理工学院的研究员。

黄丽媛长期专注于人工智能的伦理学,是一位活跃而受欢迎的科普视频博主,在数学,计算机科学和物理学领域经营着法语视频频道"Sci-ence4All"。在他的书中,他热情洋溢地赞扬了贝叶斯公式的实际有效性和哲学启迪,称其为"智慧方程"。这本书告诉我们,从贝叶斯公式中衍生出来的贝叶斯方法和贝叶斯知识哲学就像一个可以传播到世界各地的思想密码,我们甚至可以说一切都可以是"贝叶斯"。

贝叶斯公式用于描述事件发生在已知条件下的概率,其表达式为P(A|B)=P(A)P(B|A)/P(B)。我们可以将贝叶斯公式解释为一种基于可靠证据(例如观察,数据,信息)计算信念(例如,假设,命题或论点)有效性的方法,简单地作为原始信念和新证据,具有改进的新信念。其中P代表概率,A代表原始信念,B代表新证据或新条件。P(A)是A的真实概率,也称为先验概率,这是贝叶斯的"主观偏差",但它|也是贝叶斯反对者用来攻击贝叶斯统计科学的"弱点";A)A为真B的概率,又称思维实验的出现或"需要一些想象"。这个公式实际上是由法国数学家皮埃尔-西蒙·拉普拉斯(Pierre-Simon Laplace)获得的,他被认为是贝叶斯主义之父,以重新发现贝叶斯概率。也许,就像微积分公式的全名牛顿-莱布尼茨公式一样,贝叶斯公式至少应该被称为贝叶斯-拉普拉斯公式。

如何应用贝叶斯公式?以药物为例。医学检查通常检测呈阳性或阴性,以确定受试者是否生病。在现实世界中,测试很少是完全可靠的,并且会发生假阳性和假阴性。假设一个75岁的人在75岁时测试了癌症发病率为1%的癌症,当他测试呈阳性时,这个人可能会绝望地觉得他必须写遗嘱。但测试通常并不完全可靠,假设准确率为99%,这意味着100名癌症患者中有99名检测呈阳性,而100名健康人中有99名检测呈阴性。如果检测呈阳性,癌症的真正可能性是多少?贝叶斯定理告诉你,如果他只测试一次并得到阳性结果,他只有50%的机会患癌症。

贝叶斯公式如何计算50%的相对乐观概率?P(A)的先验概率,或75岁时癌症发病率的1%;P( B |答)在癌症的情况下,有99%的机会检测呈阳性。所以P(A)乘以P(B|A) 等于 0.01 乘以 0.99 或 0.0099。分母P(B)是检测结果为阳性的概率,包括真假,无论是否患有癌症,手术稍微复杂一些,结果为0.0198。最后P(A|B)=P(A)P(B|A)/P(B) 结果,即在 P(A| 检测呈阳性的同时患癌症的概率B) 0.5,或50%。但如果第二次检测结果仍然呈阳性,并且再次应用贝叶斯公式,则癌症的概率从50%增加到99%。我们看到第一次测试结果会影响第二次测试结果,这表明迭代贝叶斯定理可以逐渐产生更准确的信息,这也表明任何医学诊断都需要多次进行以防止误诊。

然而,这样一个具有无限潜力的公式,却经历了被学术权威冷落的历史。在统计学中,频率主义者将贝叶斯主义作为激烈的竞争对手。诞生于20世纪20年代的频率主义实际上是我们在数学教科书中学到的最经典的统计框架。频率主义假设概率是频率的度量,强调当样本量变得足够大时,误差逐渐消失。频率主义的核心是使用p值来测试理论模型的可信度,这只有在测试了足够的新数据时才是科学的。

频率主义在当时的基因研究中非常出色,更相信客观性是唯一的黄金法则,并且非常反感贝叶斯主义,贝叶斯主义带来了先验概率,因为它相当于在发现之前给予理论主观信心。他们将这种主观性(作者在书中称之为"偏见")视为洪水野兽,并认为包含主观性的统计方法根本不是科学。

在整个20世纪中叶,"主观"、"先验"和"贝叶斯"等术语被逐出统计系,由频率统计学家如埃贡·皮尔逊(Egon Pearson)和罗纳德·费舍尔(Ronald Fisher)领导。Fisher是一位前医学科学家,他曾使用贝叶斯定理来证明烟草在引起肺癌方面的危害,但从烟草业获得资助的频率学家Fisher指责该科学家未能遵循对照组并重复基于频率的方法所需的实验,然后颠倒因果顺序, 这表明潜在的肺癌可能导致人们吸烟。

然而,频率主义也有不可避免的弱点。首先,p值可以通过大量的实验来操纵,并且对于许多小概率事件的预测,例如地震,我们可以获得的测量数据和实验机会非常少。贝叶斯统计的神奇之处在于,当数据稀缺时,有可能接近准确的值。因此,在前计算机时代,当信息更难收集和处理时,贝叶斯仍然是人们可以依赖的工具,因为他们试图掌握罕见事件的不确定性。除了通过偏爱使用词语来识别《联邦人文科学集》的匿名作者的众所周知的例子,以及搜索天蝎座核潜艇在广阔的大西洋中的位置之外,贝叶斯计算还被用来估计核电站发生重大事故的概率,预测火箭发射时发生重大事故的概率, 等等。

贝叶斯主义是一种概率哲学,它再次问,什么是概率?频率主义认为,概率取决于事件重复发生的频率。但是当有一定程度的重复时,即当数据不足时,很难根据以前的模式准确预测未来。例如,如果将前一个事件的发生视为一组数组"1,2,4,8,16",则下一个发生的事件应为 32,并具有简单的推理。但是,当数字表示圆的各个部分的数量,该圆分为由周长上2,3,4和5个点连接的几条直线时,当点数为6时,出现的下一个副本数,即事件,应该是31,而不是32。

万物皆可“贝叶斯”:不确定性时代的知识哲学

贝叶斯公式

在什么时候,我们确信我们熟悉的规则会突然失效?大多数时候,人们不想面对这个问题。人类对确定性和控制的渴望写在基因中。前科学时代的巫术是对确定性的终极追求。例如,根据前阿赞德时期的生活逻辑,小概率的厄运归因于敌人故意强加的巫术,即追溯性确定性的外部原因。科学,尤其是概率认知,与巫术最大的区别在于,巫术是在接受不确定性存在的前提下,逐渐掌握一种动态的不确定性方法。一个好的预测应该能够计算出上述序列中下一个项目的所有候选值发生的概率,这里的概率应该是对这些可能性的置信度。这就是贝叶斯公式试图实现的目标。

这本书强调,我们探索世界、积累知识的思维模式,很大程度上可以用贝叶斯定理来概括。例如,看到乌鸦是黑色的,推断世界上所有的乌鸦都是黑色的,根据观察结果做出假设并纠正它们,要么通过增加推论是正确的概率,要么通过削减它。贝叶斯的父亲拉普拉斯曾经说过,概率论本质上只是被转化为计算的常识。它以一种准确的方式评估正常思维通过一种通常未被发现的直觉来感知事物。

归根结底,贝叶斯公式指向一种知识哲学,作者甚至认为"理性"可以归因于贝叶斯公式的应用,因此可以称之为贝叶斯主义。贝叶斯主义是假设所有"现实"的模型,理论或概念都只不过是信仰,虚构或诗歌,特别指出"所有模型都是错误的";贝叶斯比波普尔的伪证理论更准确地定义了科学。

贝叶斯在今天显得尤为重要,随着计算机性能的提高,数据收集和处理技术已经远远超过了人脑,商业、政策等领域都更加依赖大数据分析的结果,"技术的演进让我们重新审视贝叶斯公式及其在知识建设中的地位。

贝叶斯计算对于减少繁文缛节并在分析大量数据时保持小规模特别有用。从天体物理学和航空航天,到基因组测序和蛋白质研究,从医学中的癌症可追溯性和病毒检测到计算机科学中的图像识别和信息加密,从保险,广告,物流到社会政治领域的选举和资源分配。贝叶斯应用无处不在。

除了应用纯数学框架和尖端技术之外,贝叶斯哲学非常适合作为思考个人生活快速变化的时代的指南。贝叶斯哲学反映了人类对不确定性的焦虑,并通过接受不确定性,大胆地做出直觉假设同时防止过度自信,并保持新证据更新以保持自己在寻找答案来应对不确定性。正如诺贝尔物理学奖得主费曼曾经说过的那样:"我可以忍受怀疑、不确定和无知......我对每个问题的确定性或高或低水平有一些类似的答案和一些合理的信念,但我并不完全确定任何事情。"

贝叶斯并非没有缺陷。虽然它给了主观性一个地方,但如果主观起点是伪科学或谣言,那么就有可能援引可疑的证据来支持甚至加强这种可疑的信念。但贝叶斯主义最强大的方面在于其哲学包容性,强调"一片不兼容模型的森林比其中的每一棵树都更聪明。""

"根据贝叶斯定理,没有一个理论是完美的,"书中说。相反,这是一项未完成的工作,总是在锤击和测试的过程中。"贝叶斯状态是一种信念和怀疑之间的平衡状态,在这种状态下,人们不能轻易地被说服谣言,可以摆脱厄运,或者可以勇敢地捍卫不公正。贝叶斯公式可能并不完美,但贝叶斯主义也许是最适合这个不确定时代的知识哲学。