你的图表会说话吗?

 

本文出自我的好友,Excel图表大神:苏有熊。

为保持风格一致,稍作排版和内容修改,具体可以点击【阅读原文】。

更多图表干货,请关注《商业图表指南》。

 

这两天我工作中遇到一个新问题,需要比较两组数据的整体差异性,各有约900个数据点。

从数据结构上来看,是关于 900个类别对象、两组相关数据 的度量值;而本质上,这可以算是,一个统计问题,术语可以称作“多样本的成对数据分析”

/ 1 /

从一个散点图开始

900个数据密密麻麻,单凭对数据的直接观察,很难看出什么东西来。

于是我画了下面这张图,通过可视化的方式去比较这两组数据的整体差异表现:

简单说明一下,这个图表的阅读方法:

1- XY轴最大最小值相同(但是Y轴不等距,为对数刻度),表示数据X和Y因子。加入一条趋势线,可以清晰的表达数据的X和Y坐标关系。

2- 理论上来讲,离趋势线越近的数据点,其XY值之间的差异越小。

为了验证这个猜测,我挑选了几个趋势线上的数据点,利用数据标签显示其XY值,得到如下图形:

成功!趋势线将整个数据区域分割成了两个对等的区域。

拉登解说:因为Y轴是对数刻度,所以视觉上看着是不对等的….

另外,仔细观察,我们不难发现,图表中的几条规律。

1- 趋势线的上方区域,表示Y值大于X值;反之,趋势线的下方,表示X值大于Y值。

2- 通过图形观察数据点与趋势线的分离程度,则可以直观反映出所有数据对象两个度量值的整体差异。

3- 加入R平方值可以量化这个两组数据的吻合度,在这里R平方值等于0.8661,可以看做两组数据的整体吻合程度达到了86.61%,差异是一个较小的程度。

拉登解说:为了让图表的信息传递的更精确,备注图表的阅读方法、关键信息,是非常有必要的,也能体现图表作者的专业度。

/ 2 /

7个会说话的图表

通过上面这个案例,我们可以感受到图表的魅力:让数据变的更加的直观,简单易懂!

实际上,这种呈现的方式在《经济学人》的图表中最为常见。

下面是从经济学人的图表库中挑选的一些例图,我们来感受一下,其应用的方式和细节的处理。

1- 高血压患病率分析图

这个图表的数据,源自是对数十个国家高血压患病率的采样分析,目标是确定高血压的性别差异,其中:

1- X轴为女性高血压的患病率

2- Y轴为男性高血压的患病率

这张图的样式非常好。利用一条对角线将散点图分为对等的两部分,我们可以很清楚的观察出:

1- 数据点,大部分落在上方的三角区域(男性)。这表明,大部分所选国家,男性高血压的患病率远高于女性,女性患病率高于男性的,集中在部分非洲国家;

2- 黄色圆点(高收入西方国家)代表的高血压患病率,整体处于较低水平。

3- 相对的,深蓝色圆点(中欧和东欧国家的男性)高血压患病率在所有样本国家中处于最高水平。

通过对样本国家以所属地理位置的分组,也可以很清晰的观察出各地域之间的差异。

2-GDP和献血次量关系分析图

这个图反映的是,样本国家的人均GDP,和每1000人献血次数的两组度量值的成对比较。

上面的类似,但是稍有不同的是,分割数据区域的趋势线是一个弧形,将XY轴的其中一个设置为对数刻度可以实现这个效果。同样的:

1- 高于趋势线的数据点所代表的国家,居民的献血意愿较强;

2- 反之,趋势线以下的,献血意愿较低。

3- 出生率和财富关系图

 

第2个图表中,两指标间呈现正相关,而上面这张例图,两指标间呈负相关关系。

4-政府工信度和媒体满意度关系图

同样的,图中的斜线代表政府工信度,和媒体可信度的关系。

1- 数据越靠上,代表更相信媒体的可信度。

2- 数据越靠下,则代表相信政府的工信度。

5-男女员工薪酬对比图

数据偏向右侧,表示男性的薪水,高于女性的薪水。

6- 薪酬分布图

 

7- 一胎生育年龄直方图

 

/ 3 /

商业图表巨头《经济学人》

以上7幅世界顶尖水准的例图,除例图5来自于FT金融时报外,其余均来自于世界商业图表领域的巨头、或者说是王者——《经济学人》

大家可以细细品味每一张图表的制图思路,以及细节处理。

更多优质的图表,可以通过下面几种方式,关注经济学人。

1- 官方网站

http://www.economist.com/(需要梯子)

2- 官方微博

3- 官方微信公众号

 

看得多了,遇到合适的案例数据,试着去用自己熟悉的工具去实现,其表现力将是强大的,外观也称得上超凡脱俗、别具一格。

最后强调一句,以上图表样式,均可以用Excel实现。

 

 

我是拉小登,源于Excel,不只是Excel

 

 

= = 推荐文章 = =

如果我是老板,就这样做表格

一个人工成本案例,告诉你为什么要进行数据分析

数据分析第1步:学会用数字思考

你学的Excel高效办公技巧,其实都是假的

避免表格出错,是提高效率最快的捷径

再这么学Excel,你永远都只是一个员工

【收藏】万能输入表,轻松搞定周月报统计

Excel设计大赛第1名,是这样做出来的

 

 

联系作者

公众号:拉小登 | 微博:拉登Dony | B站:拉小登Excel

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注