tft每日頭條

 > 科技

 > python幫助中文手冊

python幫助中文手冊

科技 更新时间:2025-01-10 02:26:42
步驟如下:
  • 首先我們要先安裝wordcloud的安裝包:

利用命令pip install wordcloud安裝會提示報錯,讓你安裝VC 14.00很麻煩。直接下載wordcloud的安裝包, 然後,在這個文件所在的文件夾執行 pip install ????.whl命令,就可以實現安裝了。

  • 詞雲使用步驟:

(1)字符串,利用空格進行分割。詞雲會自動統計詞的出現頻率

(2)準備詞雲配置,包括背景色、圖片大小、文字大小等

(3)利用matlibplot進行繪制圖片

注:如果需要有不同的詞雲圖片效果,需要利用屏蔽圖片,既可以生成形狀。

原理就來數據序列裡面存圖片的顔色值,利用顔色反差值進行文字的顯示。

python幫助中文手冊(不會Python語言中wordcloud的安裝和使用)1

具體參考代碼如下:

1. #導入詞雲的包

from wordcloud import WordCloud

2. #導入matplotlib作圖的包

import matplotlib.pyplot as plt

from PIL import Image

import numpy as np

import jieba

excludes = {}

txt = open("西遊記2.txt", "r", encoding='gb18030').read()

words = jieba.lcut(txt)

counts = {}

for word in words:

if len(word) == 1:

continue

elif word == "諸葛亮" or word == "孔明曰":

rword = "孔明"

elif word == "關公" or word == "雲長":

rword = "關羽"

elif word == "玄德" or word == "玄德曰":

rword = "劉備"

elif word == "孟德" or word == "丞相":

rword = "曹操"

else:

rword = word

counts[rword] = counts.get(rword,0) 1

for word in excludes:

del(counts[word])

items = list(counts.items())

items.sort(key=lambda x:x[1], reverse=True)

s0=[]

for i in range(100):

word, count = items[i]

s0.append(word)

#print ("{0:<10}{1:>5}".format(word, count))

print(s0)

python幫助中文手冊(不會Python語言中wordcloud的安裝和使用)2

3 .#讀取文件,返回一個字符串,使用utf-8編碼方式讀取,該文檔位于此python同以及目錄如下 :

s1=" ".join(words)

#print(s1)

f = s1

alice_mask = np.array(Image.open("333.jpg"))

4. #生成一個詞雲對象

wordcloud = WordCloud(

mask=alice_mask,

background_color="white", #設置背景為白色,默認為黑色

font_path="C:/Windows/Fonts/STFANGSO.ttf",

max_font_size=400,

#random_state=100,

#width=1500, #設置圖片的寬度

#height=960, #設置圖片的高度

max_words=2000,

#margin=10 #設置圖片的邊緣

).generate(f)

5. # 繪制圖片

plt.imshow(wordcloud)

6. # 消除坐标軸

plt.axis("off")

7. # 展示圖片

plt.show()

8. # 保存圖片

wordcloud.to_file('my_test2.png')

python幫助中文手冊(不會Python語言中wordcloud的安裝和使用)3

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2025 - www.tftnews.com All Rights Reserved