天天看点

利用python生成词云本篇讲解如何利用python第三方库生成词云

本篇讲解如何利用python第三方库生成词云

  1. 导入相应的库
import jieba  #对文本进行分词的库
import wordcloud  #词云库
from imageio import imread #词云展示自己想要的形状所需的库
           
  1. 加载词云展示形状文件
  1. 打开要解析的文件
f = open("data.txt","r",encoding="gb18030") #中文编码一般为utf-8,但是如果运行出现编码错误的话,可以使用  gb18030
t = f.read()
f.close()
           
  1. 加载jieba库,进行文件分词处理
ls = jieba.lcut(t)  #jieba库中的lcut()方法可以对文本进行分词并返回一个列表
txt = " ".join(ls)  #将列表中的每一个元素用空格分隔开
           
  1. 配置词云属性
w = wordcloud.WordCloud(font_path = "msyh.ttc",mask = mask,\
    width = 1000, height = 700, background_color = "white")
           
  1. 加载文件并以图片形式输出
w.generate(txt)
w.to_file("grwordcloud.png")
           

成果展示

利用python生成词云本篇讲解如何利用python第三方库生成词云

完整代码

import jieba
import wordcloud
from imageio import imread
mask = imread("xin.png")
f = open("data.txt","r",encoding="gb18030")
t = f.read()
f.close()
ls = jieba.lcut(t)
txt = " ".join(ls)
w = wordcloud.WordCloud(font_path = "msyh.ttc",mask = mask,\
    width = 1000, height = 700, background_color = "white")
w.generate(txt)
w.to_file("grwordcloud.png")