天天看點

python網絡爬蟲網易雲音樂guihub_GitHub - GreatV/CloudMusic-Crawler: 網易雲音樂爬蟲,資料可視化。...

新版即将到來。。。

python網絡爬蟲網易雲音樂guihub_GitHub - GreatV/CloudMusic-Crawler: 網易雲音樂爬蟲,資料可視化。...
python網絡爬蟲網易雲音樂guihub_GitHub - GreatV/CloudMusic-Crawler: 網易雲音樂爬蟲,資料可視化。...

Introduction

看見有人寫了一篇我用Python分析了42萬字的歌詞,為了搞清楚民謠歌手們在唱些什麼,覺得挺好玩的,于是就想自己也實作一下。于是本作品就誕生了。

爬蟲

爬蟲部分主要是調用已有的 API。這部分的工作可以參考NetEase-MusicBox,該作品作者實作了網易雲音樂的指令行版,我用了一下還不錯。主要參考了該作者的api.py部分。

python網絡爬蟲網易雲音樂guihub_GitHub - GreatV/CloudMusic-Crawler: 網易雲音樂爬蟲,資料可視化。...

檔案處理

該部分主要的工作是将所有歌詞寫入一個檔案,同時每個作者的所有歌詞也放入一個檔案,以備後面的分析之用。

python網絡爬蟲網易雲音樂guihub_GitHub - GreatV/CloudMusic-Crawler: 網易雲音樂爬蟲,資料可視化。...

本次擷取的歌詞大概 26000 行。

文本分析

我首先選取了一位歌手作為代表分析了一下詞頻,如下所示:

python網絡爬蟲網易雲音樂guihub_GitHub - GreatV/CloudMusic-Crawler: 網易雲音樂爬蟲,資料可視化。...
python網絡爬蟲網易雲音樂guihub_GitHub - GreatV/CloudMusic-Crawler: 網易雲音樂爬蟲,資料可視化。...
python網絡爬蟲網易雲音樂guihub_GitHub - GreatV/CloudMusic-Crawler: 網易雲音樂爬蟲,資料可視化。...

做了一個詞雲:

python網絡爬蟲網易雲音樂guihub_GitHub - GreatV/CloudMusic-Crawler: 網易雲音樂爬蟲,資料可視化。...

然後。把所有的歌詞都分析了一下,得到了如下餅狀圖:

python網絡爬蟲網易雲音樂guihub_GitHub - GreatV/CloudMusic-Crawler: 網易雲音樂爬蟲,資料可視化。...

還做了一個詞雲,如下所示:

python網絡爬蟲網易雲音樂guihub_GitHub - GreatV/CloudMusic-Crawler: 網易雲音樂爬蟲,資料可視化。...

接下來的工作

情緒分析

雲音樂的評論很精彩,可以做一下評論,看看有什麼發現

如何使用

git clone https://github.com/GreatV/CloudMusic-Crawler.git

cd CloudMusic-Crawler

python3 -m venv venv

source venv/bin/activate

pip install -r requirements.txt

cd NEMCrawler

python NEM_spider.py

python text_mining.py

firefox render.html