天天看點

Python分析萬條資料,告訴你奔馳寶馬奧迪誰更垃圾!快來學Python!!

我們知道每輛車都有它的特點和閱聽人群體,特别是對于這種有上百年品牌積澱的BBA。奔馳的高逼格,寶馬的駕駛感,奧迪的科技感等,但是這些特點不一定是你買它的理由。

每輛車肯定都有缺點,如果這些缺點你無法忍受,那一定是你不買的理由。與其打破腦袋做選擇題,不如換個思維方式,用排除法,做“不選”題。

按照這個思路,我就想着怎麼樣把這三個車的問題搜集出來,對比看看哪個更加無法接受。最後在做出選擇。思路有了,問題就有了解決方案了:

搜集各個車型的問題搜集完後做資料清洗聚合問題點生成詞雲對比,更具有視覺效果好了,說幹就幹。第一步,問題搜集。要搜集問題,自然要找投訴網站。有個12365車質網就是讓使用者上報投訴資訊的,我們也可以按照車型搜尋投訴資訊,如圖:

按車型搜尋投訴資訊

Python分析萬條資料,告訴你奔馳寶馬奧迪誰更垃圾!快來學Python!!

搜尋後,得到詳細的投訴資訊清單,很全很強大!

Python分析萬條資料,告訴你奔馳寶馬奧迪誰更垃圾!快來學Python!!

我們隻要把這些資訊寫個爬蟲爬下來就可以了。這個簡單。按照我們之前寫過的爬蟲,5分鐘,總共不超過20行代碼,就把這些資料拿下了。沒辦法,python爬蟲就是這麼強大!特别是對于這種第三方機構的網頁,基本上沒有什麼反爬蟲措施。爬取後的資料如下,大概10000條:

Python分析萬條資料,告訴你奔馳寶馬奧迪誰更垃圾!快來學Python!!

每一行為一個投訴,每個投訴有車型車款投訴資訊和投訴日期等字段,完全夠用了。

原材料有了,接下來就開始做菜了。按照需求:“分析每個車型的主要缺點,看看哪個更加無法接受”來搭建資料分析的名額和方法。

我的思路:第一,總體觀:先看看哪個車型故障比較多 第二,細化到每個車型在看看每個車型的主要問題

總體分析簡單,直接用pandas聚合,看看每個車型的投訴總數和占比:

Python分析萬條資料,告訴你奔馳寶馬奧迪誰更垃圾!快來學Python!!

可視化:

Python分析萬條資料,告訴你奔馳寶馬奧迪誰更垃圾!快來學Python!!

Oh, yeah!做之前我還對奧迪A4抱有一絲希望,沒想到這丫竟然獨占60%的投訴量!比另外兩個加在一起還多。我在想這個是不是和銷量相關呢?可能是因為銷量多,是以投訴多?那好,把銷量資料拿出來。

這裡有一家網站,車主之家,可以按照車型查找到每個月的銷量:

Python分析萬條資料,告訴你奔馳寶馬奧迪誰更垃圾!快來學Python!!

同樣的,我們用爬蟲爬取了2009-2019共11年三個品牌的銷量資料:

Python分析萬條資料,告訴你奔馳寶馬奧迪誰更垃圾!快來學Python!!

OK,把這個資料和投訴資料放到一起:

Python分析萬條資料,告訴你奔馳寶馬奧迪誰更垃圾!快來學Python!!

銷量可視化:

Python分析萬條資料,告訴你奔馳寶馬奧迪誰更垃圾!快來學Python!!

我靠,這下死的明白了!

寶馬11年共賣了近140萬輛3系,在三者中最高,但是投訴數量卻是最少,從資料上看似乎品質比另外兩個可靠。奧迪A4在銷量方面比寶馬3系稍遜一籌,超過120萬輛,但是投訴數量确是寶馬4倍左右。奔馳的銷量和兩外兩兄弟不在一個級别上,但其實投訴也不少。我們再來看一下按月份銷量走勢圖:

Python分析萬條資料,告訴你奔馳寶馬奧迪誰更垃圾!快來學Python!!

2009-2015,寶馬3系的曆年銷量都是最高,但是2015年之後不知道發生了什麼,這種優越感蕩然無存。特别是2019年下半年開始,銷量大幅下滑,現在處于穩步複蘇階段。2009-2014,奔馳C級存在感一直非常低,月銷量大部分時候不到5000。從2014年3月份開始,産品開始發力,一直到現在都是一個穩步上升趨勢。估計是哪個時間點産品換代。最近幾年(2015-2019),三個車型的銷量非常接近,競争越來越激烈。再來看一下按照月份的投訴量統計:

Python分析萬條資料,告訴你奔馳寶馬奧迪誰更垃圾!快來學Python!!

基本上每個月奧迪的投訴總量都是最高,寶馬最低。但是要看到寶馬和奔馳的投訴數量近幾年有增長的趨勢奧迪在2015年前後和2017-2019年有個投訴集中爆發的階段,其實如果把這些非常高的離群點處理掉,奧迪投訴量沒有那麼誇張。綜上,從整體資料來看:

寶馬3系的投訴總量最低,而且是在銷量最高的前提下。但是要看到寶馬3系的黃金時期是在2009-2015年間。銷量大幅領先且投訴少。最近幾年投訴量有上升趨勢。奔馳随着産量銷量的上升,投訴量也在增長。從資料上來看,最不推薦的是奧迪A4,投訴量一直居高不下。但是:

第一,這隻是一家網站的資料,是否全面需要商榷; 第二,每個品牌的車主是否都有上網投訴的習慣,這個也是未知。後期打算做一個各個品牌車主的人物畫像在深入分析。

這裡在此強調以上隻是通過資料就事論事。

第二步:各個品牌的缺點畫像。

這裡的内容主要是用jieba分詞來對統計投訴問題做詞頻統計,之後利用詞雲工具來展示。因為python有這些第三方庫,做這些事情無比簡單。别人做好了工具直接調用即可。

首先先看一下總體的情況:

Python分析萬條資料,告訴你奔馳寶馬奧迪誰更垃圾!快來學Python!!

1. 發動機和變速箱作為車裡面性能最關鍵的兩個大件,在投訴方面也毫不示弱。變速箱異常、發動機異響很能吸引眼球。

2. 車内異味問題也是廣大消費者投訴的重點對象。

下面我們在分車型看一下:

按照字母順序,奧迪先來:

Python分析萬條資料,告訴你奔馳寶馬奧迪誰更垃圾!快來學Python!!

異味和燒機油問題突出。看來燒機油是大衆的通病。我們在把詞分的更細一點看看:

Python分析萬條資料,告訴你奔馳寶馬奧迪誰更垃圾!快來學Python!!

可以看到除了異響異味以外,防凍液和輪胎也很突出。

在看一下奔馳C:

Python分析萬條資料,告訴你奔馳寶馬奧迪誰更垃圾!快來學Python!!
Python分析萬條資料,告訴你奔馳寶馬奧迪誰更垃圾!快來學Python!!

對比奧迪,奔馳C發動機故障燈亮和4S商家服務問題突出一點。細分在看一下可以看到提到比較多有故障燈,凸輪軸等

最後看一下寶馬:

Python分析萬條資料,告訴你奔馳寶馬奧迪誰更垃圾!快來學Python!!
Python分析萬條資料,告訴你奔馳寶馬奧迪誰更垃圾!快來學Python!!

寶馬和奧迪一樣,都有嚴重的燒機油問題,但是寶馬的似乎和氣門機構有關系,這裡漏油。寶馬車主還提到發動機控制子產品故障和高速熄火問題,這個挺嚴重綜上:如果大家對Python感興趣的話,可以加一下我的薇信哦:abb436574,免費領取一套學習資料和視訊課程喲~

1. 車内異味問題,在奧迪和奔馳上非常突出,在寶馬上好一點

2. 燒機油現象在寶馬和奧迪上比較普遍,在奔馳上投訴較少。而且在寶馬上,很多投訴氣門蓋出漏油

3. 奔馳上除了通病以外,有發動機故障燈和4S店的問題。

有了這些問題,在怎麼選擇,就看個人了。