本篇讲解如何利用python第三方库生成词云
- 导入相应的库
import jieba #对文本进行分词的库
import wordcloud #词云库
from imageio import imread #词云展示自己想要的形状所需的库
- 加载词云展示形状文件
- 打开要解析的文件
f = open("data.txt","r",encoding="gb18030") #中文编码一般为utf-8,但是如果运行出现编码错误的话,可以使用 gb18030
t = f.read()
f.close()
- 加载jieba库,进行文件分词处理
ls = jieba.lcut(t) #jieba库中的lcut()方法可以对文本进行分词并返回一个列表
txt = " ".join(ls) #将列表中的每一个元素用空格分隔开
- 配置词云属性
w = wordcloud.WordCloud(font_path = "msyh.ttc",mask = mask,\
width = 1000, height = 700, background_color = "white")
- 加载文件并以图片形式输出
w.generate(txt)
w.to_file("grwordcloud.png")
成果展示
利用python生成词云本篇讲解如何利用python第三方库生成词云 完整代码
import jieba
import wordcloud
from imageio import imread
mask = imread("xin.png")
f = open("data.txt","r",encoding="gb18030")
t = f.read()
f.close()
ls = jieba.lcut(t)
txt = " ".join(ls)
w = wordcloud.WordCloud(font_path = "msyh.ttc",mask = mask,\
width = 1000, height = 700, background_color = "white")
w.generate(txt)
w.to_file("grwordcloud.png")