新版即将到來。。。
Introduction
看見有人寫了一篇我用Python分析了42萬字的歌詞,為了搞清楚民謠歌手們在唱些什麼,覺得挺好玩的,于是就想自己也實作一下。于是本作品就誕生了。
爬蟲
爬蟲部分主要是調用已有的 API。這部分的工作可以參考NetEase-MusicBox,該作品作者實作了網易雲音樂的指令行版,我用了一下還不錯。主要參考了該作者的api.py部分。
檔案處理
該部分主要的工作是将所有歌詞寫入一個檔案,同時每個作者的所有歌詞也放入一個檔案,以備後面的分析之用。
本次擷取的歌詞大概 26000 行。
文本分析
我首先選取了一位歌手作為代表分析了一下詞頻,如下所示:
做了一個詞雲:
然後。把所有的歌詞都分析了一下,得到了如下餅狀圖:
還做了一個詞雲,如下所示:
接下來的工作
情緒分析
雲音樂的評論很精彩,可以做一下評論,看看有什麼發現
如何使用
git clone https://github.com/GreatV/CloudMusic-Crawler.git
cd CloudMusic-Crawler
python3 -m venv venv
source venv/bin/activate
pip install -r requirements.txt
cd NEMCrawler
python NEM_spider.py
python text_mining.py
firefox render.html