天天看點

什麼是轶事證據(anecdotal evidence)?

作者:王智遠
什麼是轶事證據(anecdotal evidence)?

文:王智遠| ID:Z201440

如果你看到别人吃某種食物後,不舒服,或在某種動物周圍做了某些事情後受傷,就不會做同樣的事。不幸的是,這種“走捷徑”的思維不一定能得到正确結論。

比如:

  • 今天下場大雪,是以全球變暖
  • 爺爺抽煙活到80歲,是以抽煙不可能緻癌
  • 打完疫苗又流鼻涕,可能是疫苗引起的

這些案例代表什麼?也許你會說“因果謬誤”。不對,我把它稱為轶事證據(anecdotal evidence)。什麼意思呢?

按照定義,以非正式手段,收集的源于私下傳聞的證據,進行概括歸納,用在工作中。就像,有些案例以八卦、假新聞被人一傳再傳,造成三人成虎,讓人聽久便信以為真。

它的關鍵是,不同尋常的故事,不能代表完整的經驗。

比如:

遇到奇妙經曆,我們更有可能撰寫離奇怪異的評論,結果,從轶事中吸取的經驗是,這種單一事件有可能會發生。

你聽到“有人抽煙沒得肺癌”,隻能證明,你不抽煙的話,不能保證一定會得肺癌;僅依靠這則轶事,你并無法知曉普通吸煙者患肺癌的機率,或吸煙者患肺癌機率的可能性,比不抽煙者大多少。

轶事證據會引發什麼呢?

統計學家用“相關性不代表因果性”(correlation does not imply causation)描述過這種謬論,當出現轶事時,人們會忽略某個混淆因素。

“混淆因素”指,并非顯而易見的第三方因素,該因素既會影響“假定的原因”,也會影響觀察者的效應,進而造成人們無法得到正确結論。

比如:

人們在季節交替接種疫苗,就很容易把感冒和流感混淆;其實,不論是否接種,這段時期都容易得病。

其他情況下,相關性可能随機出現,如今網際網路發達,各種資訊之間的相關性比任何時候容易,當中必然出現諸多虛假資訊。

有本書叫《虛假相關》(Spurious Correlations),指兩個沒有因果關系的事件,可能基于其他沒有見過的幹擾因素,讓人猜想“兩件事有所聯系”,然而,這種聯系并不能通過精細的分析得到結論。

作者泰勒·維根(Tyler Vigen)展示了一些可笑的案例。

比如:

勞倫上高中時,有一回覺得自己好像要感冒,爸爸讓她多喝水,說這樣能夠好起來;那一天她足足喝掉半箱斯納普(Snapple)牌樹莓果汁。

令人驚訝,第二天居然感覺好很多,這種情況你在現實中,是不是也遇到過?難道,該證據就能表明,樹莓果汁有治療普通感冒的功效嗎?

顯然,不能。

她可能因為喝了一大堆果汁後,身體原本的自愈能力,恰巧讓她康複了;也可能根本沒病,隻是前天沒睡好,造成第二天感覺不好。

許多品牌宣傳會借助順勢療法,加入類似的巧合轶事,它們并不會提到,如果沒有進行治療,可能會發生什麼事,畢竟,你的确得病後,每天的症狀也不同。

是以,在相信任何品牌(商品)具備某功效前,應該先擷取可靠資料,甚至相關權威性報道來重新審視。

也許,你作為品牌方并不知道商品有這些功效,想靠市場調研收集回報,第一步就是“界定或了解假設”,對所有研究的效應提出解釋。

提前弄清楚有助于避免“德州神槍手謬誤”(Texassharpshooter fallacy),該謬誤得名一個笑話,說一個人來到一座谷倉,發現牆上畫着很多靶子,每個靶子中間都有一個彈孔。

他為射手的精準度感到驚歎不已,後來發現,射手在亂射一通後繞過彈孔畫的靶子,與此相似的概念叫“移動的目标”,指,得出實驗結果前修改目标,以便支援自己的結論。

簡單的說,大量資料或者證據中,隻挑選對自己有利的證據。想避免上述情況發生,可以采用A/B測試法(A/B testing)。

該方法被稱為“黃金标準”。

在網際網路中會分為A或B兩個版本來對照使用者行為,或者将參與者分為兩組,比較兩組的結果。

另外,最理想的狀态,還可以進行“盲測”(blinded),也就是,不讓參與者知道自己是哪一組,這樣可以避免他們有意、無意的偏好影響實驗結果。

盲測目的有助于減少“觀察者期望偏差”,但并不能完全避免,因為分析中,我們會通過選擇性的閱讀背景資料,根據先前構想的概念假設,以及選擇性地彙報實驗結果等。

你肯定聽說過“安慰劑效應”。

分析時收到的東西看起來,感覺起來與實作時類似,隻是本該毫無結果,很多老闆在工作中,經常讓員工調研一番,最後還是會依照此前決定進行,這種效應并非純粹出于想象。

比如:

“止痛藥”引起的大腦活動和“緩解疼痛的藥物”基本一緻、對父母來說,“愛的親親”能緩解孩子内心疼痛,但是安慰劑效應,也很容易出現副作用。

如果你想設計出可靠的實驗,難點在于“關鍵名額”,它可能包括,是否有人購買産品、使用者是否點選了網站上的某個按鈕等。

有些關鍵名額并無法準确衡量,我們會采用“替代名額”(surrogate marker),以保證與自己想要測量的最終結果接近。

就像:

《美國新聞與世界報道》雜志,每年都會将一系列客觀性和相對主觀的衡量标準,綜合起來,用一種替代名額給各所學校排名。

資料分析中,常見替代名額還包括衡量肥胖度的“體質指數”(BMI)和測量智力的“智商”(IQ),它們更容易遭到吐糟,因為不準确,是間接性。

是以,你必須警惕虛假,相關性、微妙的認知偏差,以促進思考的結果,看似精心設計的實驗有時都會出現問題,更别說轶事證據。

總結而言:

工作中的“轶事證據”和“相關性”會促使你提出假設、進行有效思考,但相關性不代表“因果性”。

混淆因素,會影響原因與決策品質,我們必須避免“得州神槍手謬誤”,最理想狀态通過盲測、A/B測試法來避開安慰效應出現。

有些關鍵名額我們無法衡量,會通過“替代名額”完成,這些替代,隻能作為參考性之一。

什麼是轶事證據(anecdotal evidence)?

繼續閱讀