利用命令pip install wordcloud安裝會提示報錯,讓你安裝VC 14.00很麻煩。直接下載wordcloud的安裝包, 然後,在這個文件所在的文件夾執行 pip install ????.whl命令,就可以實現安裝了。
(1)字符串,利用空格進行分割。詞雲會自動統計詞的出現頻率
(2)準備詞雲配置,包括背景色、圖片大小、文字大小等
(3)利用matlibplot進行繪制圖片
注:如果需要有不同的詞雲圖片效果,需要利用屏蔽圖片,既可以生成形狀。
原理就來數據序列裡面存圖片的顔色值,利用顔色反差值進行文字的顯示。
具體參考代碼如下:
1. #導入詞雲的包
from wordcloud import WordCloud
2. #導入matplotlib作圖的包
import matplotlib.pyplot as plt
from PIL import Image
import numpy as np
import jieba
excludes = {}
txt = open("西遊記2.txt", "r", encoding='gb18030').read()
words = jieba.lcut(txt)
counts = {}
for word in words:
if len(word) == 1:
continue
elif word == "諸葛亮" or word == "孔明曰":
rword = "孔明"
elif word == "關公" or word == "雲長":
rword = "關羽"
elif word == "玄德" or word == "玄德曰":
rword = "劉備"
elif word == "孟德" or word == "丞相":
rword = "曹操"
else:
rword = word
counts[rword] = counts.get(rword,0) 1
for word in excludes:
del(counts[word])
items = list(counts.items())
items.sort(key=lambda x:x[1], reverse=True)
s0=[]
for i in range(100):
word, count = items[i]
s0.append(word)
#print ("{0:<10}{1:>5}".format(word, count))
print(s0)
3 .#讀取文件,返回一個字符串,使用utf-8編碼方式讀取,該文檔位于此python同以及目錄如下 :
s1=" ".join(words)
#print(s1)
f = s1
alice_mask = np.array(Image.open("333.jpg"))
4. #生成一個詞雲對象
wordcloud = WordCloud(
mask=alice_mask,
background_color="white", #設置背景為白色,默認為黑色
font_path="C:/Windows/Fonts/STFANGSO.ttf",
max_font_size=400,
#random_state=100,
#width=1500, #設置圖片的寬度
#height=960, #設置圖片的高度
max_words=2000,
#margin=10 #設置圖片的邊緣
).generate(f)
5. # 繪制圖片
plt.imshow(wordcloud)
6. # 消除坐标軸
plt.axis("off")
7. # 展示圖片
plt.show()
8. # 保存圖片
wordcloud.to_file('my_test2.png')
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!