跳到主要内容

词云

1. 简介

词云(Word Cloud),又称文字云,是文本数据的视觉表示,由词汇组成类似云的彩色图形,用于展示大量文本数据。

截图

2. 图表特点

通常用于描述网站上的关键字元数据(标签),或可视化自由格式文本。 每个词的重要性以字体大小或颜色显示。

词云的作用:

  • 快速感知最突出的文字
  • 快速定位按字母顺序排列的文字中相对突出的部分

词云的本质是点图,是在相应坐标点绘制具有特定样式的文字的结果

3. 使用场景

3.1 适合的场景

  • 对比大量文本
    下图是根据某段时间内使用 某类库的请求量数据绘制的词云,从图中可以一眼看出访问量最大的网站

    截图

  • 使用图片做边界限制

    截图

3.2 不适合的场景

  • 数据区分度不大
    当数据的区分度不大时使用词云起不到突出的效果

    截图

  • 数据太少
    数据太少时很难布局出好看的词云,推荐使用柱状图

    截图

4. 使用实践

5. 其他图表的对比

5.1 词云和柱状图

  • 词云适合大量数据,柱状图适合少量数据
  • 词云展示文字更为直观,柱状图需要借助坐标轴和刻度表示文字的分类和数据
  • 词云可以映射更多分类字段在在文字样式上,柱状图只能映射一个分类字段在颜色上

附录:词云的构成

图表类型词云
适合的数据两个代表坐标的连续数据字段(自动计算)、一个代表文字内容的分类数据字段、多个代表文字样式的分类数据字段如颜色、大小、旋转角度等(可选)
功能对比文字的重要程度
数据与图形的映射两个连续数据字段映射到横轴和纵轴的位置、代表文字内容的分类数据字段映射到文字图形、多个代表文字样式的分类数据字段分别映射到文字图形的样式
适合的数据条数超过 30 条数据