什麼是轶事證據（anecdotal evidence）？

文：王智遠| ID:Z201440

如果你看到别人吃某種食物後，不舒服，或在某種動物周圍做了某些事情後受傷，就不會做同樣的事。不幸的是，這種“走捷徑”的思維不一定能得到正确結論。

比如：

今天下場大雪，是以全球變暖
爺爺抽煙活到80歲，是以抽煙不可能緻癌
打完疫苗又流鼻涕，可能是疫苗引起的

這些案例代表什麼？也許你會說“因果謬誤”。不對，我把它稱為轶事證據（anecdotal evidence）。什麼意思呢？

按照定義，以非正式手段，收集的源于私下傳聞的證據，進行概括歸納，用在工作中。就像，有些案例以八卦、假新聞被人一傳再傳，造成三人成虎，讓人聽久便信以為真。

它的關鍵是，不同尋常的故事，不能代表完整的經驗。

比如：

遇到奇妙經曆，我們更有可能撰寫離奇怪異的評論，結果，從轶事中吸取的經驗是，這種單一事件有可能會發生。

你聽到“有人抽煙沒得肺癌”，隻能證明，你不抽煙的話，不能保證一定會得肺癌；僅依靠這則轶事，你并無法知曉普通吸煙者患肺癌的機率，或吸煙者患肺癌機率的可能性，比不抽煙者大多少。

轶事證據會引發什麼呢？

統計學家用“相關性不代表因果性”（correlation does not imply causation）描述過這種謬論，當出現轶事時，人們會忽略某個混淆因素。

“混淆因素”指，并非顯而易見的第三方因素，該因素既會影響“假定的原因”，也會影響觀察者的效應，進而造成人們無法得到正确結論。

比如：

人們在季節交替接種疫苗，就很容易把感冒和流感混淆；其實，不論是否接種，這段時期都容易得病。

其他情況下，相關性可能随機出現，如今網際網路發達，各種資訊之間的相關性比任何時候容易，當中必然出現諸多虛假資訊。

有本書叫《虛假相關》(Spurious Correlations)，指兩個沒有因果關系的事件，可能基于其他沒有見過的幹擾因素，讓人猜想“兩件事有所聯系”，然而，這種聯系并不能通過精細的分析得到結論。

作者泰勒·維根(Tyler Vigen)展示了一些可笑的案例。

比如：

勞倫上高中時，有一回覺得自己好像要感冒，爸爸讓她多喝水，說這樣能夠好起來；那一天她足足喝掉半箱斯納普（Snapple）牌樹莓果汁。

令人驚訝，第二天居然感覺好很多，這種情況你在現實中，是不是也遇到過？難道，該證據就能表明，樹莓果汁有治療普通感冒的功效嗎？

顯然，不能。

她可能因為喝了一大堆果汁後，身體原本的自愈能力，恰巧讓她康複了；也可能根本沒病，隻是前天沒睡好，造成第二天感覺不好。

許多品牌宣傳會借助順勢療法，加入類似的巧合轶事，它們并不會提到，如果沒有進行治療，可能會發生什麼事，畢竟，你的确得病後，每天的症狀也不同。

是以，在相信任何品牌（商品）具備某功效前，應該先擷取可靠資料，甚至相關權威性報道來重新審視。

也許，你作為品牌方并不知道商品有這些功效，想靠市場調研收集回報，第一步就是“界定或了解假設”，對所有研究的效應提出解釋。

提前弄清楚有助于避免“德州神槍手謬誤”（Texassharpshooter fallacy），該謬誤得名一個笑話，說一個人來到一座谷倉，發現牆上畫着很多靶子，每個靶子中間都有一個彈孔。

他為射手的精準度感到驚歎不已，後來發現，射手在亂射一通後繞過彈孔畫的靶子，與此相似的概念叫“移動的目标”，指，得出實驗結果前修改目标，以便支援自己的結論。

簡單的說，大量資料或者證據中，隻挑選對自己有利的證據。想避免上述情況發生，可以采用A/B測試法（A/B testing）。

該方法被稱為“黃金标準”。

在網際網路中會分為A或B兩個版本來對照使用者行為，或者将參與者分為兩組，比較兩組的結果。

另外，最理想的狀态，還可以進行“盲測”（blinded），也就是，不讓參與者知道自己是哪一組，這樣可以避免他們有意、無意的偏好影響實驗結果。

盲測目的有助于減少“觀察者期望偏差”，但并不能完全避免，因為分析中，我們會通過選擇性的閱讀背景資料，根據先前構想的概念假設，以及選擇性地彙報實驗結果等。

你肯定聽說過“安慰劑效應”。

分析時收到的東西看起來，感覺起來與實作時類似，隻是本該毫無結果，很多老闆在工作中，經常讓員工調研一番，最後還是會依照此前決定進行，這種效應并非純粹出于想象。

比如：

“止痛藥”引起的大腦活動和“緩解疼痛的藥物”基本一緻、對父母來說，“愛的親親”能緩解孩子内心疼痛，但是安慰劑效應，也很容易出現副作用。

如果你想設計出可靠的實驗，難點在于“關鍵名額”，它可能包括，是否有人購買産品、使用者是否點選了網站上的某個按鈕等。

有些關鍵名額并無法準确衡量，我們會采用“替代名額”（surrogate marker），以保證與自己想要測量的最終結果接近。

就像：

《美國新聞與世界報道》雜志，每年都會将一系列客觀性和相對主觀的衡量标準，綜合起來，用一種替代名額給各所學校排名。

資料分析中，常見替代名額還包括衡量肥胖度的“體質指數”（BMI）和測量智力的“智商”（IQ），它們更容易遭到吐糟，因為不準确，是間接性。

是以，你必須警惕虛假，相關性、微妙的認知偏差，以促進思考的結果，看似精心設計的實驗有時都會出現問題，更别說轶事證據。

總結而言：

工作中的“轶事證據”和“相關性”會促使你提出假設、進行有效思考，但相關性不代表“因果性”。

混淆因素，會影響原因與決策品質，我們必須避免“得州神槍手謬誤”，最理想狀态通過盲測、A/B測試法來避開安慰效應出現。

有些關鍵名額我們無法衡量，會通過“替代名額”完成，這些替代，隻能作為參考性之一。

什麼是轶事證據（anecdotal evidence）？

繼續閱讀

分享幾種玩dota2時顯示藍字正在登陸中一直藍字的解決方法

太狠了！因為這個片段，我連夜看完整部劇。陸文昭：你未經上官批許擅自下令全城通組，你當田都督和本鎮撫是擺設嗎？這厮若不嚴懲

#dota2#電競賽事快報#職業選手#電競精神#泰酷辣

深度學習目标檢測常用工具型代碼：對訓練資料的trainval.txt進行資料清洗

#dota2#電競賽事快報#這個遊戲很好玩#職業選手#打call

JUDE畫UML（11dota簡易猜想）

【資料應用案例】openFive dota5v5戰勝人類

（娛樂）從資料的來看第4屆DOTA2國際邀請賽（TI4）戰隊奪冠預測

OpenAI Five：人工智能進化的新方向

劍聖

一個遊戲，一段青春

一種高效、安全的Dota全圖新思路

深度學習目标檢測常用工具型代碼：對檢測出來的結果單獨進行nms操作

深度學習目标檢測常用工具型代碼：對檢測出來的結果單獨進行softnms操作

#電競賽事快報#dota2#職業選手#這個遊戲很好玩#打call

DotA法球探讨