目錄
wordcloud庫基本介紹
wordcloud庫使用說明
wordcloud應用執行個體
wordcloud庫基本介紹
wordcloud庫概述
- wordcloud是優秀的詞雲展示第三方庫
- 詞雲以詞語為基本機關,更加直覺和藝術地展示文本

wordcloud庫的安裝
(cmd指令行)pip install wordcloud
依賴庫:numpy(pip install numpy) , matplotlib(下載下傳安裝包https://www.lfd.uci.edu/~gohlke/pythonlibs/#matplotlib)
wordcloud庫使用說明
wordcloud庫基本使用
- wordcloud庫把詞雲當作一個WordCloud對象
- wordcloud.WordCloud()代表一個文本對應的詞雲
- 可以根據文本中詞語出現的頻率等參數繪制詞雲
- 詞雲的繪制形狀、尺寸和顔色都可以設定
wordcloud庫正常方法
- w = wordcloud.WordCloud()
- 以WordCloud對象為基礎
- 配置參數、加載文本、輸出檔案
方法 | 描述 |
---|---|
w.generate(txt) | 向WrodCloud對象w中加載文本txt |
w.to_file(filename) | 将詞雲輸出為圖像檔案,.png或.jpg格式 |
import wordcloud
w = wordcloud.WordCloud(); #配置對象參數
w.generate("wordcloud by Python"); #加載詞雲文本
w.to_file("pywordcloud.png"); #輸出詞雲檔案
文本→詞雲
- 分隔:以空格分隔單詞
- 統計:單詞出現次數并過濾
- 字型:根據統計配置字号
- 布局:顔色環境尺寸
配置對象參數
w = wordcloud.WordCloud(<參數>)
參數 | 描述 |
---|---|
width | 指定詞雲對象生成圖檔的寬度,預設400像素 |
height | 指定詞雲對象生成圖檔的高度,預設200像素 |
min_font_size | 指定詞雲中字型的最小字号,預設4号 |
max_font_size | 指定詞雲中字型的最大字号,根據高度自動調節 |
font_step | 指定詞雲中字型字号的步進間隔,預設為1 |
font_path | 指定字型檔案的路徑,預設None |
max_words | 訓示詞雲顯示的最大單詞數量,預設200 |
stop_words | 指定詞雲的排除詞清單,即不顯示的單詞清單 >>>w=wordcloud.WordCloud(stop_word={"Python"}) |
mask | 指定詞雲形狀,預設為長方形,需要引用imread()函數 |
background_color | 指定詞雲圖檔的背景顔色,預設為黑色 |
wordcloud應用執行個體
英文文本
import wordcloud
txt = "life is short, you need python";
w = wordcloud.WordCloud(background_color = "white");
w.generate(txt);
w.to_file("pywcloud.png");
中文文本
import jieba
import wordcloud
txt = "程式設計語言是計算機能夠了解和識别使用者操作意圖的一種互動體系,它按照特定規則組織計算機指令,使計算機能夠自動進行各種運算處理。";
#wordcloud不支援中文,需要設定字型,否則中文将顯示為方框
w = wordcloud.WordCloud(width=1000, height=700, font_path="Song.ttf");
#中文需要先分詞并組成空格分隔字元串
w.generate(" ".join(jieba.lcut(txt)));
w.to_file("pywcloud2.png");
未設定字型font_path="xxx.ttf":
本文僅為學習Python記錄,資料來源于中國大學MOOC《Python語言設計》—嵩天