词云
1. 简介
词云(Word Cloud),又称文字云,是文本数据的视觉表示,由词汇组成类似云的彩色图形,用于展示大量文本数据。
2. 图表特点
通常用于描述网站上的关键字元数据(标签),或可视化自由格式文本。 每个词的重要性以字体大小或颜色显示。
词云的作用:
- 快速感知最突出的文字
- 快速定位按字母顺序排列的文字中相对突出的部分
词云的本质是点图,是在相应坐标点绘制具有特定样式的文字的结果
3. 使用场景
3.1 适合的场景
对比大量文本
下图是根据某段时间内使用 某类库的请求量数据绘制的词云,从图中可以一眼看出访问量最大的网站使用图片做边界限制
3.2 不适合的场景
数据区分度不大
当数据的区分度不大时使用词云起不到突出的效果数据太少
数据太少时很难布局出好看的词云,推荐使用柱状图
4. 使用实践
5. 其他图表的对比
5.1 词云和柱状图
- 词云适合大量数据,柱状图适合少量数据
- 词云展示文字更为直观,柱状图需要借助坐标轴和刻度表示文字的分类和数据
- 词云可以映射更多分类字段在在文字样式上,柱状图只能映射一个分类字段在颜色上
附录:词云的构成
图表类型 | 词云 |
---|---|
适合的数据 | 两个代表坐标的连续数据字段(自动计算)、一个代表文字内容的分类数据字段、多个代表文字样式的分类数据字段如颜色、大小、旋转角度等(可选) |
功能 | 对比文字的重要程度 |
数据与图形的映射 | 两个连续数据字段映射到横轴和纵轴的位置、代表文字内容的分类数据字段映射到文字图形、多个代表文字样式的分类数据字段分别映射到文字图形的样式 |
适合的数据条数 | 超过 30 条数据 |