天天看點

Python 爬取吳亦凡的 10 萬轉發資料,扒一扒流量的真假!

由于時間點也挺湊巧,剛好趕在蔡徐坤發律師函給哔哩哔哩之後,不禁讓大家對他們進行一番對比。同為我們印象中的流量明星,吳亦凡跟蔡徐坤之間有什麼不一樣嗎?大夥兒是怎麼看待他們的?又是怎麼看待《大碗寬面》這首歌的呢?

我們通過微網誌移動端随機抓取了吳亦凡釋出新歌《大碗寬面》的微網誌轉發資料10萬條(時間節點2019年4月20日01時)。該微網誌于2019年4月19日10時釋出,到4月20日01時已被轉發超過36萬。

Python 爬取吳亦凡的 10 萬轉發資料,扒一扒流量的真假!

吳亦凡該微網誌的轉發是否存在假流量?

當然,關注我的朋友們估計最關心的問題是,吳亦凡的微網誌轉發是否像蔡徐坤一樣,有很多都是假流量?

我們先從粉絲性别比例入手。我們統計了102118條轉發資料中,有77279條是女性轉發的,占75.7%,其餘24839條是男性轉發的,占24.3%。這是一個比較合理的比例。

Python 爬取吳亦凡的 10 萬轉發資料,扒一扒流量的真假!

我們随機抽取了男性的轉發,發現這裡的男粉絲幾乎都是有簡介、微網誌粉絲數、關注數都大于50的真粉絲。

Python 爬取吳亦凡的 10 萬轉發資料,扒一扒流量的真假!

咦,不是說吳亦凡是流量明星嗎?難道很多假流量都存在于女性的轉發裡?我們又随機抽取了女性轉發的資料,發現,這裡面的女性粉絲幾乎也都是有簡介、微網誌粉絲數、關注數都大于50的真粉絲。

Python 爬取吳亦凡的 10 萬轉發資料,扒一扒流量的真假!

我們就更奇怪了:吳亦凡的假流量哪兒去了?

我們按照跟蔡徐坤一樣的标準,把轉發資料中轉發者的關注或者粉絲數少于等于5、沒有簡介、轉發之後被點贊數評論數再轉發數都為0、微網誌會員等級為0級的資料(注意,這裡的條件都是“且”的關系,而不是“或”,也就是需要滿足所有條件才會被判定是假粉絲),以及轉發者的關注或者粉絲數大于等于5但昵稱長“使用者XXXXXXXX”這樣的資料抽取了出來。看看吳亦凡的真假流量各是多少。

Python 爬取吳亦凡的 10 萬轉發資料,扒一扒流量的真假!

可見,吳亦凡的《大碗寬面》微網誌102118條轉發中,隻有6100條是疑似假粉絲轉發的,占6%,有94%都是真粉絲轉發的。這跟蔡徐坤的轉發資料截然相反。

Python 爬取吳亦凡的 10 萬轉發資料,扒一扒流量的真假!

96018條真粉絲轉發的資料中,除去重複轉發刷榜的數量,裡面還有81872個真粉絲。也就是說,真實轉發的粉絲數量,占總轉發量的80.2%。這比蔡徐坤3.84%的真實轉發粉絲數量高出了一大截。也說明至少在這首歌上,吳亦凡的假流量占比是很少的。這首歌能火起來,靠的是大家對這首歌的接受度。

大家對于《大碗寬面》怎麼看?

既然這樣,那大家是以一種什麼樣的态度看待這首歌的呢?我們利用SnowNLP這個中文文本挖掘庫對轉發中所帶的每一條評論進行情感傾向分析并打分(分值為0-1,越接近0情感越負面,越接近1情感越正面,0.5為中立)。

Python 爬取吳亦凡的 10 萬轉發資料,扒一扒流量的真假!

所有轉發所帶的評論,對《大碗寬面》的平均情感傾向評分是0.686。也就是大家整體對于這首歌的評論都是偏正面的,這跟這首歌的豆瓣評分6.5分(10分制)也相差不遠。

Python 爬取吳亦凡的 10 萬轉發資料,扒一扒流量的真假!

随機抽取出情感傾向高的評論,大家都認為吳亦凡可以自嘲自黑很酷、很接底氣、很可愛,認為吳亦凡可以通過這種方式來破網友對自己的吐槽梗,心胸很開闊。跟律師函警告相比之下,不知道高出了多少。

Python 爬取吳亦凡的 10 萬轉發資料,扒一扒流量的真假!

有多少人拿吳亦凡與蔡徐坤作對比?

由于這首歌釋出的時間比較湊巧,剛好在蔡徐坤發律師函給哔哩哔哩并引起網友一陣吐槽之後,是以大家難免會把吳亦凡和蔡徐坤放在一起比較。那麼,拿他們兩個一起比較的人多嗎?

我們把評論中帶有跟蔡徐坤有關字眼(比如包含“kun”、“坤”、“律師函”等)的評論都抽了出來,發現足足有6229條,也就是大概15條評論中,就有一條把他們兩個放在一起比較的。

抽取其中點贊數最高的10條,看看大家都怎麼進行比較的。

Python 爬取吳亦凡的 10 萬轉發資料,扒一扒流量的真假!

大夥兒都對吳亦凡的公關團隊表示佩服,可以把槽點轉變為亮點,有很多人佩服吳亦凡的氣度和格局,還有很多人認為這和律師函相比,高下立判。

有多少人開始路轉粉了?

既然這首歌風評那麼好,是不是很多人開始路轉粉了呢?我們把帶有“轉粉”、“圈粉”等字眼的評論抽取了出來,發現這裡面有足足3646條評論是關于轉粉的。

Python 爬取吳亦凡的 10 萬轉發資料,扒一扒流量的真假!

而這3646條評論中,有2441條是女性的評論,還有1205條是男性的評論,占1/3!按照比例保守估計,目前37萬的轉發中,吳亦凡已成功圈粉13000人!并且使很多原來不喜歡他的黑粉,開始轉變為路人。

Python 爬取吳亦凡的 10 萬轉發資料,扒一扒流量的真假!

評論的詞雲圖

按照慣例,我們把轉發中所帶的評論制作成了詞雲圖。

Python 爬取吳亦凡的 10 萬轉發資料,扒一扒流量的真假!

如果你在學習Python的過程當中有遇見任何問題,多多交流問題,互幫互助,群裡有不錯的學習教程和開發工具。學習python有任何問題(學習方法,學習效率,如何就業),可以随時來咨詢我

可以看到:

1. 正如微網誌配詞所說“大碗寬面能讓你開心,這确是我本意”,大家對于這首自嘲歌的最大反應是“哈哈哈”;

2. 大家覺得這首歌很好聽、有趣、有意思,覺得吳亦凡很可愛;

3. 有人第一次對吳亦凡說了“對不起”,對吳亦凡開始有Respect,開始路轉粉;

4. 還有人拿蔡徐坤出來比較,拿律師函出來調侃。

看來,在娛樂圈裡生存,開闊的心胸和善于自嘲的态度是很必要的。眼看着吳亦凡被萬千吐槽,今天還能收獲掌聲一片,從一開始的流量明星轉變為一個具有真流量的諧星。

是以說,千萬别虛榮心作祟,娛樂圈嘛,快樂才是真谛,何必針鋒相對。有時候不缺硬剛的勇氣,缺的是娛樂的智慧。人生如戲開個玩笑,聽完歌就洗洗睡。