1 概述
利用Python生成簡單的詞雲,需要的工具是cython,wordcloud與anaconda.
2 準備工作
包括安裝cython,wordcloud與anaconda.
2.1 安裝anaconda
下載下傳官網
選擇對應的版本下載下傳即可.
2.2 安裝cython
cython是為了安裝wordcloud準備的.
pip -m pip install --upgrade cython
2.3 安裝wordcloud
安裝wordcloud前需要先安裝Microsoft Visuall C++ 14.0. 這裡下載下傳 安裝好了以後重新開機,輸入
python -m easy_install wordcloud
3 使用
3.1 打開Jupyter
打開Jupyter Notebook.
然後會在浏覽器打開這個頁面,建立一個notebook.
先把需要的庫導入:
from
3.2 建立文字庫
簡單的文字庫可以直接選擇一個txt檔案,複雜的話可以選擇建立一個excel,導出為csv檔案,然後利用pandas庫的read_csv()讀入檔案.這裡建立一個txt,空格分隔單詞即可.
然後上傳到Jupyter中:
3.3 生成詞雲
首先讀入檔案:
text
然後使用WordCloud().generate(text),在裡面設定各種屬性.
wc
這裡設定了高度與寬度,允許重複.
plt
顯示詞雲,
interpolation
會使顯示平滑更加平滑,axis("off")表示不顯示坐标軸. 下面是效果:
3.4 注意事項
如果含有漢字,首先在讀取時設定編碼:
text
然後再生成詞雲時設定字型:
wc
測試:
text