python词云高手进阶

本文中的所有示例代码及素材均在 github 项目「shijiu_wordcloud」的 wordcloud2 文件夹中。

python词云模块的安装

制作词云的主要模块为 wordcloud,另外,要使用 jieba 库切割中文句子,用 imageio 读入图片。在命令行中执行以下命令即可安装:

pip install wordcloud jieba imageio

制作图片状词云

关键点在于利用

  • 利用 imageio.imread() 读入图片内容
  • 设置 WordCloud 的 mask 参数
# example1.py
from wordcloud import WordCloud

# 导入 imageio 模块的 imread 函数来读取图片内容
from imageio import imread

# 读取图片内容
mk = imread('素材\\五角星.png')

# 设置 mask 参数以获得图片状词云。另外,设置了 repeat 参数使得一个词重复显示以填满图片
wc = WordCloud(background_color='white', repeat=True, mask=mk)

wc.generate('star')
wc.to_file('词云输出\\mask.png')
mask.png

值得注意的是,如果图片背景不是白色或者透明,则依然会有文字填充。

勾勒图片轮廓

勾勒图片轮廓只需通过 contour_width 参数设置轮廓线宽度,contour_color 参数设置轮廓线颜色。

# example2.py
from wordcloud import WordCloud
from imageio import imread
import matplotlib.pyplot as plt

mk = imread('素材\\belle.png')

# 设置 contour_width 及 contour_width
wc = WordCloud(background_color='white',
               scale=10,
               repeat=True,
               mask=mk,
               contour_width=6,
               contour_color='goldenrod')

wc.generate('star')

# 使用 matplotlib.pyplot 绘制词云和素材的对比图
fig, axes = plt.subplots(1, 2)
axes[0].imshow(wc)
axes[1].imshow(mk)
for ax in axes:
    ax.set_axis_off()

# 保存图片,设置分辨率 dpi=300
plt.savefig('词云输出\\profile.png', dpi=300, bbox_inches='tight')
profile.png

按图片颜色给文字着色

需要先将图片传入 ImageColorGenerator 类,获取返回的颜色函数,再将此函数传入 WordCloud 的 recolor 属性:

# example3.py
from wordcloud import WordCloud, ImageColorGenerator
from imageio import imread

mk = imread('素材\\belle.png')

# 获取颜色函数
image_colors = ImageColorGenerator(mk)

# 将颜色函数 image_colors 传给 recolor
wc = WordCloud(background_color='white',
               scale=10,
               color_func=image_colors,
               repeat=True,
               mask=mk)

wc.generate('star')
wc.to_file('词云输出\\recolor.png')
recolor.png

下面的例子用于对比用图片颜色着色与默认着色效果。在创建 WordCloud 对象时,没有传颜色函数给 color_func,而是在后面调用 WordCloud 对象的 recolor() 方法传入颜色函数:

# example4.py
from wordcloud import WordCloud, ImageColorGenerator
from imageio import imread
import matplotlib.pyplot as plt

mk = imread('素材\\belle.png')
wc = WordCloud(background_color='white',
               scale=20,
               repeat=True,
               mask=mk)
wc.generate('star')

# 利用 ImageColorGenerator 类生成颜色函数
image_colors = ImageColorGenerator(mk)

fig, axes = plt.subplots(1, 3)

# 显示使用默认着色方案的词云
axes[0].imshow(wc, interpolation="bilinear")

# 用 WordCloud 的 recolor 方法根据图片颜色重新给文字上色
axes[1].imshow(wc.recolor(color_func=image_colors), interpolation="bilinear")

# 显示原图片
axes[2].imshow(mk, cmap=plt.cm.gray, interpolation="bilinear")
for ax in axes:
    ax.set_axis_off()

plt.savefig('词云输出\\recolor2.png', dpi=300, bbox_inches='tight')
recolor2.png

指定特定词的颜色

下面代码中,构建了 GroupedColorFunc 类,利用该类产生颜色函数。

构建了一个 color_to_words 字典,键名为颜色,键值是显示为该颜色的词的列表。读者只需修改此字典即可更改词的颜色。

将字典及默认颜色传入 GroupedColorFunc 类创建该类的实例,再将此实例传入 WordCloud 对象的 recolor 方法即可。

# example5
# 此段代码修改自文末的官方文档中的示例
from wordcloud import WordCloud, get_single_color_func

# 创建 GroupedColorFunc 类,用于产生颜色函数
class GroupedColorFunc(object):
    def __init__(self, color_to_words, default_color):
        self.color_func_to_words = [
            (get_single_color_func(color), set(words))
            for (color, words) in color_to_words.items()]

        self.default_color_func = get_single_color_func(default_color)

    def get_color_func(self, word):
        """Returns a single_color_func associated with the word"""
        try:
            color_func = next(
                color_func for (color_func, words) in self.color_func_to_words
                if word in words)
        except StopIteration:
            color_func = self.default_color_func

        return color_func

    def __call__(self, word, **kwargs):
        return self.get_color_func(word)(word, **kwargs)

# 从文件中读入文本
with open('素材\\text.txt', 'r') as f:
    text = f.read()
    f.close()

wc = WordCloud(background_color='white', scale=10)
wc.generate(text)

# 创建颜色字典,指定词的颜色。读者可更改颜色、词的列表、添加新颜色、删除颜色等
color_to_words = {
    # 下面列表中的词显示为 orangered 颜色
    'orangered': ['beautiful', 'explicit', 'simple', 'sparse',
                'readability', 'rules', 'practicality',
                'explicitly', 'one', 'now', 'easy', 'obvious', 'better'],
    # 面列表中的词显示为 blue 颜色
    'blue': ['ugly', 'implicit', 'complex', 'complicated', 'nested',
            'dense', 'special', 'errors', 'silently', 'ambiguity',
            'guess', 'hard']
}

# 设置不在字典中的词的颜色
default_color = 'aquamarine'

# 将字典及默认颜色传入以创建 GroupedColorFunc 实例
grouped_color_func = GroupedColorFunc(color_to_words, default_color)

# 将 GroupedColorFunc 实例传入 recolor 方法以按指定规则着色
wc.recolor(color_func=grouped_color_func)

wc.to_file('词云输出\\group.png')
group.png

至此,你已经是python词云能手了,快去创作自己的词云吧!

相关阅读:python词云入门」 「python安装详细教程

参考资料

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,386评论 6 479
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,939评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,851评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,953评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,971评论 5 369
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,784评论 1 283
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,126评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,765评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,148评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,744评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,858评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,479评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,080评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,053评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,278评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,245评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,590评论 2 343