返回博客
指南10 分钟阅读

折线图生成器如何让真实数据看起来具有误导性?

折线图可以不撒谎却误导读者。本文拆解 Y 轴起点、时间范围和平滑方式如何在读图前改变结论。

Steven Cen, 数据可视化实践者

Steven Cen

数据可视化实践者

分享:
折线图生成器展示坐标轴、时间范围和平滑如何误导真实数据

折线图是商业报告中最受信赖的图表类型之一。它也是最容易被操纵的图表类型之一——不是通过虚假数据,而是通过看似格式选择但实际上起到编辑偏见作用的呈现决策。

大多数折线图生成器工具的设计目的是呈现你提供给它们的内容。它们执行操作,但不进行评估。你看到的趋势线是否准确反映了数据中正在发生的情况,或者它是否受到在任何人查看图表之前就已做出的三个无形决策的影响——这些都不是工具会告诉你的。大多数**趋势图生成器**工具也是如此:只执行而不做判断。

折线图在不撒谎的情况下误导人的三种方式

Y轴截断、时间范围选择和平滑程度——这三个决策看似是格式设置,实则起到了偏差的作用。它们都出现在实际的商业报告中,而且常常无人察觉。理解这些决策,是区分一份能提供信息的趋势图和一份证实某人已有信念的趋势图的关键。

截断的Y轴

一个从85,000而非零开始的Y轴,从85,000移动到92,000,看起来就好像翻倍了一样。这条线在图表上急剧攀升。实际变化为8.2%。

折线图不像条形图那样有严格的零基线要求——在某些合理情况下,将坐标轴起点设为非零值有助于读者看清狭窄范围内的变化。但有一个测试值得应用:如果有人看着这条线的斜率并对变化幅度形成了一种印象,这种印象会准确吗?

当答案是否定时,坐标轴截断就不是一种设计决策,而是一种失真。

商业报告中最常见的此类图表是月度收入图表,其中Y轴从去年的收入数字开始。今年的曲线自信地向上攀升。该图表没有显示的是,这一攀升仅代表3%的增长,如果Y轴从0开始,曲线几乎是平的。

jCHSDV2P
jCHSDV2P

选择故事的时间范围

始于2019年的同一数据集与始于2023年的数据集所讲述的故事截然不同。始于2019年的趋势可能表明企业正在从困难时期中复苏。而始于2023年的同一数据可能显示企业正从近期的峰值开始下滑。两种观点都没有错,但都不完整。

时间范围的选择并非中立的技术决策,而是一种叙事决策。在设定范围之前需要思考的问题是:读者需要什么样的背景信息才能准确解读这一趋势,当前的范围是否提供了这些信息?

相关问题是时间粒度。周度数据可以平滑日度数据所呈现的噪声。月度数据则可以平滑周度数据所显示的内容。一个趋势图生成器默认采用月度聚合方式,这其实是在对哪些信号值得关注做出判断——通常这种判断并不明确。

年度季节性、一次性事件和短期波动在不同的聚合层面上都会消失。选择粒度就是选择让读者看到其中的哪些内容。

SGhzzHgw
SGhzzHgw

掩盖波动性的平滑处理

滚动平均值是合理且有用的。7天滚动平均值可以消除星期几的影响。30天滚动平均值可以在没有噪音的情况下显示月度模式。这些都是合理的选择。

问题在于,当平滑处理被用于掩盖那些真正具有信息价值的波动性时。

在三个月内,净推荐值从\+42降至-8,又回升至\+35,这反映了一个真实事件——产品故障、服务中断、PR问题。按30天滚动平均值来看,这种波动只是一个小低谷。按90天滚动平均值来看,它可能会完全消失。趋势线是准确的。它所掩盖的事件以平滑图表无法解释的方式影响了客户行为。

平滑处理的选择应与所做的决策相匹配,而不是为了让图表看起来更简洁。运营团队需要查看每日波动情况,董事会则需要了解季度趋势。以相同的平滑级别向这两类受众展示相同的数据,必然会对其中一方的需求满足不足。

OFiBSOrc
OFiBSOrc

诚实的折线图究竟需要什么?

截断坐标轴、精心挑选的时间范围和过度平滑的数据都有各自特定的修正方法。没有一种方法需要统计学专业知识。所有方法都要求主动做出决策,而不是接受工具的默认设置。

Y轴起点是否与你要讲述的故事相符?

零并不总是合适的起点。在某些合理的情况下,从更高的数值开始可以使微小但有意义的变化显现出来。关键不在于“坐标轴是否从零点开始?”"这是‘直线的斜率是否准确地代表了变化的幅度?’

在起始于97%的坐标轴上显示3%的增长,与在起始于零的坐标轴上显示50%的增长看起来完全相同。两者在技术上都是准确的。其中一种会造成数据无法支撑的印象。实际的检验方法是:先看折线在视觉上显示的百分比变化,然后根据原始数据计算实际的百分比变化。如果两者相差超过两倍,那么坐标轴范围就造成了值得纠正的失真。

一款优秀的在线折线图制作工具应在导出前使坐标轴范围可见且可编辑,而不是将其隐藏在大多数用户都找不到的子菜单中。

时间范围是否包含读者所需的上下文?

对于大多数商业趋势图表而言,最小可行时间范围是主要季节性周期的两个完整周期。年度季节性意味着至少两年。每周周期意味着至少两个月。任何更短的时间范围都有将局部趋势呈现为普遍趋势的风险。

这种做法避免的具体问题是:一家去年Q4表现强劲的企业,如果今年只展示Q1的数据,就会看起来像是在走下坡路。而展示两个完整年度数据的同一家企业,则会看起来是一家具有正常季节性波动的企业。数据是一样的,但给人的印象却相反。

还有一项额外的检查:如果图表被用来支持某项建议,要问一问不同的起点是否会导致不同的建议。如果是,那么时间范围的选择就在进行论证工作,而这项工作应该明确说明,而不是隐藏在坐标轴设置中。

df9PwHsW
df9PwHsW

平滑级别是否与所做的决策相匹配?

一个运营团队在决定本周是否增加员工时,需要每日或每周的数据。滚动30天平均值会掩盖导致他们加班成本增加的周四高峰。一个董事会在决定是否增加对某一产品线的投资时,需要按季度的方向。在这种情况下,每日的波动是噪音,会使潜在趋势更难解读。

实用方法:确定谁在查看图表以及他们需要做出什么决策,然后选择能保留与该决策相关信号的平滑级别。当受众构成复杂——或未知时——同时展示两者。原始数据用较细的线条表示,平滑趋势用较粗的线条表示。读者可以同时看到信号和噪声,平滑选择也变得可见而非不可见。

折线图生成器如何处理这些决策

Y轴范围、时间段和平滑级别不是工具可以代你正确做出的决策。它们取决于工具所不具备的背景信息:谁在阅读图表、他们正在做什么决策,以及读者需要理解什么,而不是数据碰巧显示了什么。

我们可以使用**ChartGen AI折线图生成器**,使折线图的创建和解读更加透明和可控。当你上传Excel中的折线图CSV中的折线图时,在导出之前,轴范围会显示并可编辑,而不是被锁定在算法选择的任何范围内。如果你要求计算滚动平均值,图表会在可视化界面上直接标注平滑窗口。如果数据中的时间范围短于一个季节周期,AI会标记出来。

其结果是生成一张图表,其中的框架选择对任何查看的人都是可见的,而不仅仅是对创建它的人可见。这可不是小事。大多数流传的误导性趋势图表之所以具有误导性,是因为读者无法知道围绕数据做出了哪些选择。让这些选择清晰可见是使其具有可争议性的第一步。

创建过去90天每日网站流量的折线图,并叠加7天滚动平均值 —— 同时显示原始数据和平滑趋势

创建一个多行图表,比较今年和去年的月收入——两条线均从零点开始

12个月内NPS得分折线图 — 按周粒度,无平滑处理

在线创建折线图,上传文件,描述图表,AI 即可生成。提供免费计划,导出 PNG 无需注册。Ada.im 提供 SVG、PDF 和交互式嵌入格式。

LkinN5rc
LkinN5rc

看似增长的收入图表

一个营销团队在月度业务审查中分享了一张折线图。月度网站收入,Y轴起始于18万美元。折线在八个月内从左到右稳步攀升。与会者将其解读为强劲增长。

实际数字:八个月内从181,200美元增长到196,400美元,增幅为8.4%。这一增长有意义,但并非图表斜率所暗示的那种大幅增长。

同样的数据,Y轴从零点开始,生成的线条几乎没有变动。趋势是真实的,但原始图表给人的印象却并非如此。

两张图表都没有使用虚假数据。Y轴范围的选择改变了读者的结论。在会议上,没有人询问坐标轴的情况。也没有人进行核查。图表讲述了一个故事,而这个故事深入人心。

趋势是真实的。印象可能并非如此。

制作一份诚实的**增长趋势图**最困难的部分从来都不是数据。而是在绘制线条之前做出的三个决定:Y轴从哪里开始、展示多少时间线,以及数据被平滑处理的程度。每一个决定都会在读者看到一个数字之前就影响他们的结论。

大多数折线图生成器工具会默默地做出这些决策。ChartGen AI折线图生成器则让这些决策可视化——轴范围在导出前可编辑,平滑窗口在图表上有标注,并且AI会标记出时间范围过短而无法显示有意义趋势的区间。

一个显示其Y轴范围、标注平滑窗口且涵盖至少两个季节周期的趋势图,是读者能够评估的。而一个将这些选项隐藏在默认设置背后的趋势图,只能被信任或怀疑——永远无法被核查。

折线图生成器趋势图数据可视化ChartGen误导性图表

准备好创建更好的图表了吗?

将这些洞察付诸实践。使用 ChartGen 在几秒钟内生成专业的可视化图表。

免费试用 ChartGen