試了一下線上的一些詞雲,很多對文本大小有限制,然後發現Python有wordcloud子產品。
示例文本裡有136W單詞,加載速度也沒有很慢
wordcoud的所有參數見:
https://blog.csdn.net/u010309756/article/details/67637930
簡單執行個體
#導入子產品
from wordcloud import WordCloud,ImageColorGenerator
import matplotlib.pyplot as plt
from scipy.misc import imread
#加載文本資訊
text=open('review.txt','r').read()
#詞雲樣式
bgpic=imread('bg.png')
wordcloud=WordCloud(font_path='C:/Windows/Fonts/Tahoma.ttf',mask=bgpic,background_color='white',scale=2).generate(text)
#注意:font_path設定的字型一定要在C:/Windows/Fonts目錄下能找到,否則報錯
image_colors=ImageColorGenerator(bgpic)
plt.imshow(wordcloud)
plt.axis('off')
#plt.show()
輸出: