天天看點

資料視角可視化分析豆瓣電影評分爬蟲資料

豆瓣已經成為國内影迷和影評人的聚集地。 豆瓣評分已經成為評價中國電影的重要名額。 豆瓣積累了大量的電影資料,為電影行業分析提供了重要資源。 豆瓣電影被用來衡量國内外電影的發展。

中國與其他國家對比

彙總年電影總産量。 一直在快速推進的電影産業在2017年出現轉折,電影産量開始下滑。 與現在相比,相差1500部左右。 這種趨勢一直持續。 

資料視角可視化分析豆瓣電影評分爬蟲資料

中國大陸的評分低于整體評分,然後我們選擇電影數量排名前三的國家與中國大陸進行比較。 日本電影的品質非常好,評分一直保持在平均水準以上。 中國大陸、美國和日本的電影評分差距很大。 美國電影評分更高。

總體而言,近年來電影産量有所下降,但評分有所上升。 懷疑兩者之間存在聯系。

電影類型和爛片分析

再來看看拍攝偏好和爛片率。 現在爛片越來越多。 現在讓我們從資料的角度來看。

按爛片率降序排列,不良片定義為:評分低于3.35分(5.9-1.5*(7.6-5.9))。 每種類型的電影數量需要大于200。

資料視角可視化分析豆瓣電影評分爬蟲資料

​​

衆所周知,日本有豐富的和動畫電影,戰争片的爛片率最低,其次是懸疑片。 中國恐怖驚悚片的爛片率非常高,不建議觀看。 而且,國産電影包攬了豆瓣爛片前五名:女娲日記拿下豆瓣爛片之王,得分倒數第一,接着是怨靈宿舍之白紙女生、女導演連環殺人案、靈異實錄。

電影數量分析

統計每個國家的電影數量,選出前4名的觀察值:

豆瓣采用打星的方式,是以最低分是一星,也就是兩分。

影片數量超過500部,綜合評分和數量後,前4名的國家或地區:

資料視角可視化分析豆瓣電影評分爬蟲資料

在豆瓣,收錄在電影裡。 雖然美國、中國大陸、日本都有大量的電影。 但平均評分低于法國、英國、德國和意大利。 其中,德國的電影評分均值最高,英國的電影數量最多,這意味着相對而言,德國電影的品質最高。 從離散值也可以看出,英國部分資料的離散值非常低,比如:《圍攻唐甯街》,豆瓣評分2.4分,但還是沒有國産神劇2.0分低。 豆瓣包括電影500+的國家或地區,大部分為發達國家,或中國、印度等人口大國,說明電影數量可能與一個國家或地區的發展水準有一定的關系。