天天看點

Python-wordcloud庫的使用

目錄

wordcloud庫基本介紹

wordcloud庫使用說明

wordcloud應用執行個體

wordcloud庫基本介紹

wordcloud庫概述

  • wordcloud是優秀的詞雲展示第三方庫
  • 詞雲以詞語為基本機關,更加直覺和藝術地展示文本
Python-wordcloud庫的使用

wordcloud庫的安裝

(cmd指令行)pip install wordcloud

依賴庫:numpy(pip install numpy) , matplotlib(下載下傳安裝包https://www.lfd.uci.edu/~gohlke/pythonlibs/#matplotlib)

wordcloud庫使用說明

wordcloud庫基本使用

  • wordcloud庫把詞雲當作一個WordCloud對象
  • wordcloud.WordCloud()代表一個文本對應的詞雲
  • 可以根據文本中詞語出現的頻率等參數繪制詞雲
  • 詞雲的繪制形狀、尺寸和顔色都可以設定

wordcloud庫正常方法

  • w = wordcloud.WordCloud()
  • 以WordCloud對象為基礎
  • 配置參數、加載文本、輸出檔案

wordcloud庫正常方法

方法 描述
w.generate(txt) 向WrodCloud對象w中加載文本txt
w.to_file(filename) 将詞雲輸出為圖像檔案,.png或.jpg格式
import wordcloud

w = wordcloud.WordCloud();  #配置對象參數
w.generate("wordcloud by Python"); #加載詞雲文本
w.to_file("pywordcloud.png"); #輸出詞雲檔案
           

文本→詞雲

  • 分隔:以空格分隔單詞
  • 統計:單詞出現次數并過濾
  • 字型:根據統計配置字号
  • 布局:顔色環境尺寸

配置對象參數

w = wordcloud.WordCloud(<參數>)

參數 描述
width 指定詞雲對象生成圖檔的寬度,預設400像素
height 指定詞雲對象生成圖檔的高度,預設200像素
min_font_size 指定詞雲中字型的最小字号,預設4号
max_font_size 指定詞雲中字型的最大字号,根據高度自動調節
font_step 指定詞雲中字型字号的步進間隔,預設為1
font_path 指定字型檔案的路徑,預設None
max_words 訓示詞雲顯示的最大單詞數量,預設200
stop_words

指定詞雲的排除詞清單,即不顯示的單詞清單

>>>w=wordcloud.WordCloud(stop_word={"Python"})

mask 指定詞雲形狀,預設為長方形,需要引用imread()函數
background_color 指定詞雲圖檔的背景顔色,預設為黑色

wordcloud應用執行個體

英文文本

import wordcloud

txt = "life is short, you need python";
w = wordcloud.WordCloud(background_color = "white");
w.generate(txt);
w.to_file("pywcloud.png");
           
Python-wordcloud庫的使用

中文文本

import jieba
import wordcloud

txt = "程式設計語言是計算機能夠了解和識别使用者操作意圖的一種互動體系,它按照特定規則組織計算機指令,使計算機能夠自動進行各種運算處理。";

#wordcloud不支援中文,需要設定字型,否則中文将顯示為方框
w = wordcloud.WordCloud(width=1000, height=700, font_path="Song.ttf"); 

#中文需要先分詞并組成空格分隔字元串
w.generate(" ".join(jieba.lcut(txt)));
w.to_file("pywcloud2.png");
           
Python-wordcloud庫的使用

未設定字型font_path="xxx.ttf":

Python-wordcloud庫的使用

本文僅為學習Python記錄,資料來源于中國大學MOOC《Python語言設計》—嵩天