對比是最基本的資料分析方法,要講資料分析思維,這個最基礎的方法是肯定繞不開的。不過現在的文章提到對比思維,很多都是淺嘗辄止,很少看到有人把對比思維講的更加深入,導緻很多資料分析初學者對于對比思維的了解非常片面。本篇文章作者通過對穆勒五法的詳細闡述,帶大家深入了解了對比思維,一起來看看!

說到對比思維,基本就是以下這種狀态:
本月目标100萬,業務現狀是80萬,通過這兩者的對比得出目前沒有達到目标,距離目标還有20萬,完成率80%。
好一點的再加一些同比環比的資料,一個所謂的對比分析就算完成了。
如果對比思維是這麼簡單的話,有必要存在資料分析師這個崗位嗎?估計現在的資料分析師都得失業了吧?
業務人員學會這種方法隻需要5秒鐘,還有資料分析師什麼事兒啊。
上述案例隻能算是對比方法中最簡單的一種方法——比大小。所做的工作隻是将資料轉化成結論,也就是從80萬這個資料,變成“未達到目标”這樣一個結論。
雖然相比資料,結論要更容易被人記住和了解,但是“比大小”很難得出一些更深層次的資訊。
那對比思維除了“比大小”,還有哪些更進階的方法?
我今天就帶大家探尋一下對比思維到底是怎麼回事。
在子產品一底層思維的文章中,我介紹了邏輯思維。而邏輯思維最基礎的是歸納法。在之前的文章裡,我隻是簡單的介紹了一下歸納法,今天我們介紹一種更系統的歸納方法——穆勒五法。
穆勒五法是英國哲學家穆勒關于确定現象因果聯系的五種歸納方法,分别是求同法、求異法、共用法、共變法、剩餘法。
如果能深入了解穆勒五法,基本上也就算熟練掌握對比思維了。
一、求同法,比相同
1960年,英國某農場十萬隻火雞和小鴨吃了發黴的花生,在幾個月内得癌症死了。
後來,用這種花生喂羊、貓、鴿子等動物,又發生了同樣的結果。1963年,有人又用發了黴的花生喂大白鼠、魚和雪貂,也都紛紛得癌而死,上述各種動物患癌症的前提條件中,對象、時間、環境都不同,唯一相同的就是吃了發黴的花生。
于是,人們推斷:吃了發黴的花生可能是這些動物得癌死亡的原因。
後來通過化驗證明,發黴的花生内含黃曲黴素,黃曲黴素是緻癌物質。
以上分析方法就是“求同”。
求同法的思路是,如果各個不同場合除一個條件相同外,其他條件都不同,那麼,這個相同條件就是某被研究現象的原因。
可用下列公式表示:
場合1, 相關情況A,B,C, 被研究對象,a;
場合2, 相關情況A,D,E, 被研究對象,a;
場合3, 相關情況A,F,G, 被研究對象,a;
上述三種場合中,都出現了a現象。而不同場合下都有A條件,是以可以認為A條件是a現象的原因。
廣告内容分析經常會用這種方法。營運投放了那麼多廣告,自然想知道那些效果比較好的廣告到底有什麼特點。
我們可以從投放時間、廣告内容、活動形式等等不同的角度去深入分析這些廣告情況。比如分析的情況是這樣的:
廣告1 早上投放 關鍵字:降價 活動形式:裂變拼團
廣告2 下午投放 關鍵字:免費 活動形式:裂變拼團
廣告3 晚上投放 關鍵字:限時 活動形式:裂變拼團
廣告4 下午投放 關鍵字:限時 活動形式:裂變拼團
價格轉化率比較好的廣告,簡單分拆了三個條件,發現這幾個廣告的共同點是活動形式都是裂變拼團。是以拼團裂變的方式對于廣告轉化率有着比較好的提升效果,是以之後的營銷活動可以考慮多以裂變拼團的方式進行。
求異法,比不同
做化學試驗的時候,人們發現,氯酸鉀加熱會産生氧氣,但速度很慢。而一旦加入少量的二氧化錳,就會快速産生大量的氧氣。
這兩組試驗,唯一的差別在于是否放入少量二氧化錳。是以得出結論:二氧化錳是氧氣快速放出的原因。
這種找出差異的方法被稱為求異法。
求異法的思路是,比較某現象出現的場合和不出現的場合,如果這兩個場合除一點不同外,其他情況都相同,那麼這個不同點就是這個現象的原因。
求異法可用下列公式表示:
場合1, 相關情況A,B,C, 出現被研究對象a
場合2, 相關情況 B,C, 不出現被研究對象a
是以,情況A與現象a之間具有因果關系。
上述兩種場合中,場合1出現了a現象,場合2沒有出現。觀察他們各自的條件,發現,場合1有ABC三個條件,而場合2隻有BC,是以可以認為是A條件導緻了a現象。
現實環境下,想要找到隻有一個條件不同而其他條件完全相同的業務場景幾乎是不可能的。
是以求異法的應用一般都要借助于AB測試。
AB測試可以控制對照組和實驗組的條件,比如投放了兩組廣告,除了廣告文案不同,其他完全相同。如果一個用了“限時折扣”,另一個用了“專屬優惠”,而最終轉化率如果存在明顯差異,那麼廣告文案就是轉化率差異的原因。
共用法,先比相同,再比不同
曾有一位聯合國的官員被派駐越南,他的任務是提高越南兒童的營養健康水準。
下飛機後,他發現自己既沒有辦公室也沒有經費,甚至連當地的語言都不懂,可謂沒有任何資源。
苦思冥想後,這位官員想到了一個辦法。
因為身高是營養水準的一個重要标志,除了特殊情況,一般個子高的孩子營養水準都會比個子矮的要好一些。
于是他先從越南各地各階層中通過測量身高挑選出了一批高個兒的孩子,然後排除其中家庭條件優越的,僅留下了家庭條件一般、身高卻比同齡兒童高出的孩子,這些孩子作為正面樣本。
在家庭環境相當的情況下,他們的家庭是怎樣做到的呢?為了找出其中的原因,這位官員讓這些孩子帶他去觀察他們各自家庭的飲食情況。
經過大量走訪,這位官員發現這些孩子的共同點是:每天都吃四頓飯,他們的家人經常會抓一些小蝦米做菜,還會在米飯裡加入紫薯葉熬出的汁液。這些都是當地可以利用的自然資源,并不會提高家庭的日常開支,且容易推廣複制。而那些個子比較矮的孩子則沒有這些特點。
這位官員總結出了這種飲食方式可以提高營養水準,于是,便将這種飲食方式推廣到越南全境。就這樣,他在沒有任何資源的情況下,将越南兒童的營養水準整體提升了整整20年。
這裡用到的方法就是共用法,也稱求同求異共用法。
運用共用法包括三個步驟:
第一步,把被考察現象出現的正面場合加以比較,發現隻有一個共同的情況,由此根據求同法确定A和a有因果聯系;
第二步,把被研究現象不出現的反面場合加以比較,發現A情況不出現是唯一共同的,由此又根據求同法确定A的不存在與a的不存在有因果聯系;
第三步,比較正反兩組場合,發現有A就有a,無A就無a,由此根據求異法得出結論:A和a有因果聯系。
上述案例的邏輯過程是:
先用求同法從高個兒孩子的飲食中尋找飲食的共同點。然後用求同法發現矮個子孩子中沒有該飲食特點。
最後用求異法對比兩組的情況。最後得出結論。
共用法的目的是找出因果關系,不過現實環境下找到因果關系比較困難,或者說容易找到的因果關系業務人員自己就可以找到。
是以分析到深層的結論我們一般都用相關關系替代因果關系。
隻分析相關關系的話,共用法的步驟會适當精簡。
不追求“有A就有a,無A就無a”的結果,隻追求“有A則a更明顯,無A則a不明顯”。
比如之前提到的廣告分析案例,廣告由于因素太多,過于複雜,是很難找到因果關系的,一般找到與轉化率強相關的因素即可。
- 如果用共用法來分析廣告,首先需要找出正例和反例,一般是用高轉化和低轉化的廣告做正負樣本。
- 然後用求同法對正樣本進行求同,找出普遍存在的一些因素,比如關鍵字帶有“限時”。
- 再用求同法對負樣本進行求同,找出負樣本是否普遍不存在“限時”的關鍵字。
- 最後比較正負樣本,發現帶有“限時”關鍵字的轉化率普遍高,沒有“限時”關鍵字的廣告轉化率普遍低。是以得出結論:“限時”關鍵字對于廣告轉化率有提升作用。
共用法相比求同法和求異法,應用範圍更廣,很多資料分析都會用到共用法。不過共用法隻能說是在求同法、求異法的基礎上,進一步提高了結論的可靠程度,共用法的結論未必完全正确。
使用時應注意:當正事例組和負事例組的組成場合越多,結論的可靠性程度越高;對于負事例組的各個場合,應選擇與正事例組較為相似的來進行比較(盡量做AB測試)。
另外要注意共用法的步驟包含兩次求同,一次求異。最後一步的求異過程大多數人會思考,但是在表達時候不說清楚,還是建議大家表述完整。
共變法,比變化
同樣的一塊地,其他情況都相同,隻有肥料的數量增加了,結果發現水稻的産量也在不斷提高。由此我們可以得出多施肥是水稻增産的原因。
這種分析方法就是共變法。
共變法的思路是:在其他條件不變的情況下,如果某一現象發生變化另一現象也随之發生相應變化,那麼,前一現象就是後一現象的原因。
共變法可用公式表示如下:
場合1, 相關情況A1,B,C, 出現被研究對象a1
場合2, 相關情況A2,B,C, 不出現被研究對象a2
場合3, 相關情況A3,B,C, 不出現被研究對象a3
是以 A是a的原因
資料分析方法中和共變法最像的是相關分析。
相關分析,簡單地說,就是衡量兩個數值型變量的相關性,以及計算相關程度的大小。
如果是肥料數量和水稻産量之間的關系,通過相關分析,可以得出他們之間存在強相關關系,以及相關系數,估算出投入的肥料可以帶來多少水稻産量。
相關分析應用在現實的業務場景裡,就是廣告投放量與銷量之間的相關關系、核心功能使用率與留存率的相關關系等等諸如此類。
這需要一些相關分析的知識,比如回歸、相關系數、偏相關等概念,具體這裡不做展開。
不過現實的業務場景下,很難做到隻有一個因素發生不同程度的變化。想要增加結論的可靠性,要麼增加樣本量,要麼還是老老實實做AB測試吧。
剩餘法,比剩餘
有一次居裡夫人和她的丈夫為了弄清一批瀝青鈾礦樣品中是否含有值得提煉的鈾,對其含鈾量進行了測定。
令他們驚訝的是,有幾塊樣品的放射性甚至比純鈾的還要大。這就意味着,在這些瀝青鈾礦中一定含有别的放射性元素。同時,這些未知的放射性元素隻能是非常少量的,因為用普通的化學分析法不能測出它們來。
量小放射性又那樣強,說明該元素的放射性要遠遠高于鈾。1898年7月,他們終于分離出放射性比鈾強400倍的钋。
該元素的發現,應用的就是剩餘法。
剩餘法的思路是:已知一個複合的被研究對象是由一個複合原因引起的,如果這個現象的一部分是複合原因中的一部分的結果,那麼這個複合現象的剩餘部分就是複合原因中剩餘部分的結果。
剩餘法的公式表示如下:
由a、b、c、d構成的複合現象是複合原因(A、B、C、D)作用的結果,
現象a是原因A作用的結果,
現象b是原因B作用的結果,
現象c是原因C作用的結果;
是以,現象d是原因D作用的結果。
剩餘法的要求非常苛刻,現象和原因的對應關系必須是明确的。這一點在極度複雜的現實業務場景下很難做到,應用範圍有限,這裡就不多介紹了。
對比思維小結
資料分析方法,都值得重新研究一遍。
綜合以上的方法,我們發現,對比分析除了最基礎的“比大小”之外,還有“比相同”,“比不同”,“比變化”等等不同的方法。
這些對比思維的方法還隻是架構,在實際的資料分析過程中,有一些衍生方法。
第一個衍生方法是趨勢分析
趨勢分析的整個分析過程基本都是建立在對比思維的基礎上的。趨勢分析其實就是将一個業務名額,和自己在過去的情況做對比。
趨勢分析過程中還會用到一些對比方法,比如:
如果随着時間的發展,名額穩步上升,那麼基本就是共變法,名額随着時間上升,未來也會上升。
如果趨勢分析中有幾個點異常,特别高或特别低,那麼找出這些異常點和其他點的差別,就是求異法。
如果找出幾個異常點的共同點,那就是求同法。
第二個衍生方法是競品分析
競品分析也是一類幾乎完全建立在對比思維基礎上的分析方法,競品分析其實就是将自己的産品和競争對手的産品在多個次元上進行對比。
競品分析的分析過程中會用到一些對比方法,比如:
如果想找出競品近期快速增長的原因,用的就是共變法。某一時段做了某件事,之後快速增長。
如果想找出成功的APP的共同點,就是求同法,等等。
其他的衍生方法還有比如相關分析、AB測試等等,之前都有提到,這裡就不多說了。
最後說下,以上方法都是不完全歸納,也就是說即使論證過程沒問題,結果依然有可能是錯誤的。而且容易找到的因果關系已經被大家挖掘的差不多了,這些因果關系我們可以直接拿來用,我們沒有必要自己重新造輪子。
是以如果分析處在初步摸索階段,我們可以用這些對比方法找出一些初步結論。
如果在找出解決方案的階段,我們可以直接拿那些已經被驗證的因果關系做演繹法的大前提,用演繹法做論證,這樣的結果更可靠而且高效。
對比分析是資料分析的基礎方法,幾乎所有的分析都需要做對比分析。
但是很多人覺得對比思維就是“比大小”,這未免也太小看了資料分析師的技能水準了。
很多人覺得資料分析很簡單,很多資料分析的技能看起來平平無奇。
實際上,我們不去說那些複雜的算法,即使是基礎的分析思路都是一門很大的學問。
我覺得,資料分析方法,都值得我們再重新研究一遍。
#專欄作家#
三元方差,公衆号:三元方差(sanyuanfangcha),人人都是産品經理專欄作家。專注用資料驅動業務增長,擅長資料分析、使用者增長。喜歡閱讀、思考和創作。
本文原創釋出于人人都是産品經理。未經許可,禁止轉載。
題圖來自Unsplash,基于CC0協定