python数据分析基础《用数据讲故事》#0 引言
0 引言
0.1 糟糕的图表无处不在
0.2 我们天生不擅长用数据讲故事
在学校里,我们学习了很多关于语言和数学的知识。在语言方面,我们学习如何将单词组合成句子和故事。数学方面,我们学习如何理解数字。但很少有人将这两方面结合起来:没有人教我们如何用数字讲故事。更严峻的是,很少有人觉得自己天生就擅长这个领域。
这让我们对这项需求日益增长的重要任务准备不足。技术使我们能够积累越来越多的数据,与此同时,人们也越来越希望从所有这些数据中找出意义。能够将数据可视化并用数据讲故事,是将数据转化为可用于推动更好决策的信息的关键。
由于缺乏这方面的自然技能或培训,我们最终往往只能依赖工具来了解最佳实践。技术的进步,除了增加了数据的数量和获取途径,还使数据处理工具变得无处不在。几乎任何人都可以将一些数据输入图形应用程序(例如 Excel)并创建图形。这一点很重要,所以我再重复一遍:任何人都可以将一些数据输入图形应用程序并创建图形。考虑到创建图表的过程在历史上是科学家或其他技术性很强的角色的专利,这一点非常了不起。这也很可怕,因为如果没有明确的路径可循,我们最好的意图和努力(再加上经常被质疑的工具默认设置)可能会把我们引向一些非常糟糕的方向: 3D、无意义的颜色、饼状图。
能够有效地利用数据讲述故事是一个能让你获得优势的领域,几乎能让你在任何岗位上取得成功。
虽然技术提高了数据处理工具的使用率和熟练程度,但在能力方面仍然存在差距。您可以在Excel 中输入一些数据并创建图表。对许多人来说,数据可视化过程到此为止。这可能会使最有趣的故事变得乏善可陈,或者更糟--难以理解或无法理解。工具默认设置和一般做法往往会使我们的数据和我们想用这些数据讲述的故事严重不足。
你的数据中有故事。但是您的工具不知道这个故事是什么。这就需要你--信息的分析师或传播者--将这个故事形象化、生动化。这个过程就是本书的重点。以下是一些前后对比的例子,让你直观地了解你将学到的内容;我们将在书中的不同部分详细介绍每一个例子。
我们将介绍的课程将使您从简单地展示数据转变为用数据讲故事。
修改后
修改后
修改后
0.3 本书的读者对象
本书是为任何需要使用数据向他人传达信息的人编写的。这包括(但当然不限于):分享工作成果的分析师、将论文数据可视化的学生、需要以数据驱动的方式进行交流的管理者、证明其影响力的慈善家,以及为董事会提供信息的领导者。我相信,任何人都可以提高他们利用数据进行有效沟通的能力。对许多人来说,这是一个令人生畏的领域,但其实大可不必如此。
当你被要求"展示数据"时,你会有什么样的感觉?
也许你感到不自在,因为你不知道从哪里开始。又或者,您觉得这是一项艰巨的任务,因为您认为您正在创建的东西必须非常复杂,必须显示足够的细节来回答所有可能的问题。又或者,你已经有了扎实的基础,但还在寻找能让你的图表和你想用它们讲述的故事更上一层楼的东西。在所有这些情况下,本书都是为您量身定做的。
"当我被要求展示数据时,我感觉......"。我在 Twitter 上进行了一次非正式的民意调查,结果显示,当人们被要求 "展示数据 "时,会有以下不同的情绪。
- 沮丧,因为我觉得我无法讲述整个故事。
- 有压力,必须向需要数据的人讲清楚。
- 不充分。老板:你能深入研究一下吗?给我按x、y和z细分的数据。
您在这方面可能会感到不适,这并不奇怪,因为传统上并不教授如何有效地利用数据进行交流。那些出类拔萃的人通常都是通过不断的尝试和犯错来了解哪些方法有效,哪些方法无效。这可能是一个漫长而乏味的过程。通过本书,我希望能帮助你加快这一过程。
0.4 我是如何学会用数据讲故事的
我一直被数学和商业的交集所吸引。我的教育背景是数学和商业,这使我能够有效地与双方沟通--因为他们并不总是使用同一种语言--并帮助他们更好地相互理解。我喜欢将数据科学用于更好的商业决策。随着时间的推移,我发现成功的关键之一是能够通过数据进行有效的视觉沟通。
我在大学毕业后的第一份工作中就意识到了熟练掌握这方面技能的重要性。我当时在信用风险管理部门担任分析师(当时还没有次贷危机,因此也没有人真正了解什么是信用风险管理)。我的工作是建立和评估预测拖欠和损失的统计模型。这意味着将复杂的东西最终转化为简单的沟通,即我们是否有足够的资金储备来应对预期损失,在什么情况下我们会面临风险,等等。我很快就意识到,在美学这一块花时间--我的同事们通常不会这么做--意味着我的工作获得了我老板和我老板的老板更多的关注。对我来说,这就是我看到花时间在数据视觉传达上的价值的开始。
在经历了信用风险、欺诈和运营管理等多个岗位,并在私募股权领域工作了一段时间后,我决定跳出银行和金融行业,继续我的职业生涯。我静下心来思考我所拥有的技能,我希望每天都能利用这些技能:其核心是利用数据影响商业决策。
我来到了谷歌,加入了人员分析团队。谷歌是一家以数据为导向的公司,以至于他们甚至将数据和分析技术应用到了一个不常见的领域:人力资源。人员分析团队是嵌入谷歌人力资源组织(在谷歌被称为 "人员运营")的分析团队。这个团队的口号是帮助确保谷歌的人事决策--关于员工或未来员工的决策--以数据为导向。在这里,我可以继续磨练自己用数据讲故事的技能,利用数据和分析更好地理解和指导有针对性的招聘、吸引和激励员工、建立高效团队和留住人才等方面的决策。谷歌人员分析技术是最前沿的技术,帮助许多其他公司开辟了一条道路。参与这个团队的建设和发展是一次令人难以置信的经历。
谷歌的 "氧气项目 "是一个在公共领域备受关注的项目,它研究了如何成为一名优秀的管理者。纽约时报》对这项工作进行了描述,《哈佛商业评论》也以这项研究为基础进行了案例分析。我们面临的一个挑战是如何将研究结果传达给不同的受众,包括有时对研究方法持怀疑态度、希望深入研究细节的工程师,以及希望了解大局观研究结果和如何加以利用的经理人。我在项目中主要负责沟通工作,帮助确定如何以最佳方式展示有时非常复杂的内容,既能满足工程师对细节的要求,又能让管理人员和各级领导层理解和接受。为此,我利用了我们将在本书中讨论的许多概念。
对我来说,最大的转折点发生在我们在谷歌的人员运营部建立内部培训项目时,我被要求开发有关数据可视化的内容。这让我有机会研究并开始学习有效数据可视化背后的原理,帮助我理解为什么我多年来通过反复试验得出的一些方法是有效的。通过这项研究,我开发了一门关于数据可视化的课程,并最终在整个谷歌推广开来。
这门课程在谷歌内外都引起了一些反响。通过一系列偶然事件,我收到了在一些慈善组织和活动上就数据可视化主题发表演讲的邀请。消息不胫而走。越来越多的人主动联系我,最初是在慈善界,但也有越来越多的企业界人士向我寻求如何有效利用数据进行沟通的指导。人们越来越清楚地认识到,这一领域的需求并非谷歌独有。相反,几乎所有组织或企业中的人都可以通过有效利用数据进行沟通来提高影响力。我利用业余时间在各种会议和组织中担任演讲者,最终我离开了谷歌,开始追求我的新目标--教世界如何用数据讲故事。
在过去的几年里,我为美国和欧洲的一百多个组织举办了研讨会。有趣的是,我发现许多行业和岗位都需要这方面的技能。我的听众来自咨询、消费品、教育、金融服务、政府、医疗保健、非营利组织、零售、初创企业和技术等领域。我的受众包括各种角色和级别:从每天与数据打交道的分析师,到偶尔需要将数据纳入工作的非分析师,到需要提供指导和反馈的经理,再到向董事会提交季度业绩的执行团队。
通过这项工作,我接触到了许多不同的数据可视化挑战。我逐渐认识到,这一领域所需的技能是最基本的。这些技能并不针对任何行业或角色,而且可以有效地传授和学习--我从研讨会与会者那里收到的持续积极反馈和后续行动就证明了这一点。随着时间的推移,我已经将我在研修班上讲授的课程整理成文。这些就是我要与你分享的课程。
在我的研讨会上,我通常会重点讲解五门关键课程。本书的一大亮点是没有时间限制(在工作坊中是有时间限制的)。我在书中加入了我一直想分享的第六堂额外课程("像设计师一样思考"),还有更多的前后实例、分步指导,以及我在信息视觉设计方面的思考过程。
我将为您提供切实可行的指导,您可以立即开始使用,以更好地通过数据进行可视化交流。我们将介绍一些内容,帮助你学习并自如地运用六条关键经验:
- 了解背景
- 选择合适的视觉展示方式
- 消除杂乱
- 将注意力集中到你想要的地方
- 像设计师一样思考
- 讲述故事
0.5 横跨多个行业的示例
在整本书中,我使用了大量案例来说明所讨论的概念。我们所涉及的课程并不是针对特定行业或角色的,而是侧重于与数据进行有效沟通的基本概念和最佳实践。由于我的工作横跨多个行业,我所借鉴的案例也是如此。您将看到来自技术、教育、消费品、非营利部门等领域的案例研究。
每个例子都是基于我在研讨会上讲授的课程,但在许多情况下,为了保护机密信息,我对数据稍作改动或对情况进行了概括。
对于任何最初看起来与你无关的例子,我鼓励你停下来思考一下,你遇到了哪些数据可视化或沟通方面的挑战,类似的方法可能会很有效。每个例子都有值得学习的地方,即使例子本身与你工作的世界并无明显关联。
0.6 课程并非针对特定工具
我们在本书中介绍的课程主要是可应用于任何图形应用程序或演示软件的最佳实践。有大量的工具可以用来讲述有效的数据故事。然而,无论多么优秀的工具,都无法像你一样了解你的数据和故事。花点时间好好学习你的工具,这样在应用我们将在本书中介绍的课程时,它就不会成为限制因素。
虽然我不会重点讨论特定的工具,但本书中的示例都是使用 Microsoft Excel 制作的。如果您有兴趣更深入地了解如何在 Excel 中创建类似的视觉效果,请访问我的博客storytellingwithdata.com,在那里您可以下载我的文章所附带的Excel文件。
参考资料
- 软件测试精品书籍文档下载持续更新 https://github.com/china-testing/python-testing-examples 请点赞,谢谢!
- 本文涉及的python测试开发库 谢谢点赞! https://github.com/china-testing/python_cn_resouce
- python精品书籍下载 https://github.com/china-testing/python_cn_resouce/blob/main/python_good_books.md
- Linux精品书籍下载 https://www.cnblogs.com/testing-/p/17438558.html
0.7 本书的编排
本书分为一系列大视野课程,每一章都侧重于一个核心课程和相关概念。在有助于理解的情况下,我们会讨论一些理论,但我会强调理论的实际应用,通常是通过具体的实际案例。每章结束时,你都将做好应用所学课程的准备。
本书中的课程是按照时间顺序组织的,这与我用数据讲故事的思路是一致的。正因为如此,而且后面的章节是在前面内容的基础上编写的,在某些情况下还会引用前面的内容,所以我建议大家从头到尾阅读一遍。读完之后,你很可能会发现自己会回溯到与当前面临的数据可视化挑战相关的特定兴趣点或示例。
为了让你更具体地了解我们要走的路,下面是各章的摘要。
- 第1章:背景的重要性
在开始数据可视化之路之前,你应该能够简明扼要地回答几个问题: 你的受众是谁?你需要他们知道什么或做什么?本章阐述了理解情境背景的重要性,包括受众、沟通机制和期望的语气。本章介绍了一些概念,并通过实例加以说明,以帮助确保充分理解语境。对情境背景有了深刻理解,就能减少反复,让你在创建视觉内容时走上成功之路。
- 第2章:选择有效的视觉效果
怎样才能最好地展示你想要传达的数据?我分析了我在工作中最常用的视觉展示方式。在本章中,我将介绍在商业环境中交流数据最常用的可视化类型,讨论每种类型的适当用例,并通过实际示例对每种类型进行说明。具体的可视化类型包括简单文本、表格、热图、折线图、斜线图、垂直条形图、垂直叠加条形图、瀑布图、水平条形图、水平叠加条形图和正方形面积图。我们还介绍了应避免使用的视觉图表,包括饼图和甜甜圈图,并讨论了避免使用3D图表的原因。
- 第3章:杂乱无章是你的敌人!
想象一下空白的页面或屏幕:你在页面或屏幕上添加的每一个元素都会占用受众的认知负荷。这就意味着,我们应该用一双慧眼来观察页面或屏幕上的元素,努力找出那些不必要地占用脑力的东西,并将它们移除。识别和消除杂乱是本章的重点。作为对话的一部分,我介绍并讨论了视觉感知的格式塔原则,以及如何将其应用于表格和图形等信息的视觉显示。我们还讨论了对齐、留白的策略性使用以及对比度等深思熟虑的设计的重要组成部分。我们将用几个例子来说明这些经验。
- 第4章:集中受众的注意力
在本章中,我们将继续探讨人们的视觉方式,以及在制作视觉效果时如何利用这一优势。其中包括对视觉和记忆的简要讨论,这将有助于确定注意前属性(如尺寸、颜色和在页面上的位置)的重要性。我们将探讨如何战略性地使用前注意力属性,以帮助引导受众将注意力集中到你希望他们关注的地方,并创建一个视觉层次结构,以帮助引导受众按照你希望他们处理信息的方式来理解你想要传达的信息。色彩作为一种战略工具,我们将对其进行深入探讨。通过大量实例对概念进行了说明。
第 5 章:像设计师一样思考
形式服从功能。产品设计中的这句格言显然适用于数据交流。在谈到数据可视化的形式和功能时,我们首先要考虑的是,我们希望受众能够用数据做什么(功能),然后再创建一种能够轻松实现这一目标的可视化(形式)。在本章中,我们将讨论如何将传统的设计概念应用于数据交流。我们将借鉴之前介绍过的一些概念,探讨可负担性、可访问性和美学,但会从一个略有不同的视角来看待它们。我们还将讨论如何让受众接受你的视觉设计。
- 第6章:剖析模型视觉效果
对有效的视觉展示进行深入研究,可以学到很多东西。在本章中,我们将研究五个典范视觉效果,并利用到目前为止所学到的知识,讨论创作这些视觉效果的具体思维过程和设计选择。我们将探讨有关图表类型和可视化数据排序的决定。我们考虑通过使用颜色、线条粗细和相对大小来选择强调和不强调的内容和方式。我们还讨论了视觉效果中各组成部分的对齐和定位,以及标题、标签和注释中文字的有效使用。
- 第7章:讲故事
故事能引起我们的共鸣并让我们记忆犹新,而数据本身则无法做到这一点。在本章中,我将介绍可用于数据交流的讲故事概念。我们将考虑从讲故事高手身上可以学到什么。故事有明确的开头、中间和结尾;我们将讨论这一框架如何适用于商业演示,以及在构建商业演示时如何使用这一框架。我们将介绍有效讲故事的策略,包括重复的力量、叙事流程、口头和书面叙事的注意事项,以及确保我们的故事在交流中清晰传达的各种策略。
- 第8章:统筹兼顾
前几章包括零散的应用,以展示所涵盖的各个课程。在本章中,我们将通过一个真实案例,从头至尾地介绍用数据讲故事的过程。我们要了解背景,选择合适的视觉展示方式,识别并消除杂乱无章的内容,将注意力吸引到我们希望受众关注的地方,像设计师一样思考,并讲述一个故事。这些经验以及由此产生的视觉效果和叙事方式共同说明了我们如何从简单地展示数据转变为用数据讲故事。
- 第9章:案例研究
倒数第二章通过大量案例研究,探讨了应对数据交流中常见挑战的具体策略。涉及的主题包括:深色背景下的色彩考虑、在展示的视觉效果和传播的视觉效果中利用动画、建立逻辑顺序、避免意大利面条图的策略以及饼图的替代方案。
- 第10章:最后的思考
数据可视化--以及一般意义上的数据交流--处于科学与艺术的交汇点。这其中当然有科学的成分:需要遵循的最佳实践和准则。同时也有艺术的成分。运用我们已经介绍过的经验来开辟自己的道路,利用自己的艺术天赋让受众更容易理解信息。在最后一章中,我们将讨论下一步的建议,以及在您的团队和组织中提高讲故事和数据能力的策略。最后,我们将回顾所涉及的主要课程。
总之,我们将介绍的课程将使您能够用数据讲故事。让我们开始吧!
热门相关:倾心之恋:总裁的妻子 拒嫁豪门,前妻太抢手 未来兽世:买来的媳妇,不生崽 买妻种田:山野夫君,强势宠! 不科学御兽