Skip to content

Latest commit

 

History

History
123 lines (62 loc) · 8.15 KB

mastering-art-data-storytelling-guide-data-scientists.md

File metadata and controls

123 lines (62 loc) · 8.15 KB

掌握数据讲故事的艺术:数据科学家的指南

原文:www.kdnuggets.com/2023/06/mastering-art-data-storytelling-guide-data-scientists.html

掌握数据讲故事的艺术:数据科学家的指南

图片由Isaac Smith提供,来源于 Unsplash

如果你想成为一名数据科学家,或者已经是数据科学家——你会读到或知道所需的技能。你需要掌握一种编程语言,了解数学统计,能够创建数据可视化等。


我们的前三名课程推荐

1. 谷歌网络安全证书 - 快速进入网络安全职业生涯。

2. 谷歌数据分析专业证书 - 提升你的数据分析能力

3. 谷歌 IT 支持专业证书 - 支持你的组织的 IT 工作


如果你想成为数据科学专业人士并需要一些指导,可以查看这篇文章:五步成为数据科学专业人士。

尽管你大部分时间会花在数据准备阶段,试图找到和清理数据,但数据科学还有其他重要元素。

一旦你找到了有价值的见解,无论是趋势、模式还是可视化,你都需要能够解释这些。作为数据专业人士,非技术人员可能难以理解技术语言。

如果你是一个技术人员,将你的信息传达给非技术人员可能会很具挑战性。你不仅会遇到非技术人员,还可能要面对那些喜欢通过可视化或项目演示来进行解释的人。

因此,一旦你有了发现,你需要迎合各种各样的人——掌握如何做到这一点可能很困难,但这是可以实现的。

让我们开始吧……

非技术语言

作为一名数据科学家,我知道许多利益相关者或管理者并没有技术背景。因此,你日常团队中使用的一些术语对他们来说可能是陌生的。例如,F1 分数或交叉验证。

想想老师是如何向学生解释一个话题的,并在解释给观众时保持这个思路。将你的数据科学术语翻译成所有人都能理解的语言。如果没有办法替换特定的数据科学术语,解释它的含义也没有坏处。你会因为失去观众对技术术语的关注而带来更多的伤害。

数据可视化

不同的人有不同的学习方式。有些人只需读一遍教科书就能理解,有些人需要色彩编码,有些人需要可视化。当你展示你的发现时,不要限制自己,也不要陷入只能回答 1000 个问题的困境。可视化可以为你解答问题。

数据可视化将使你的观众对你采取的步骤和发现有直观的理解。当你在背景中谈论这些可视化时,他们的眼睛在学习并理解你所说的内容。

总结

在你的演示结束时,确保有一页总结所有重要点和数据可视化供观众查看。在这段时间里,你应该对问题保持开放,观众可以持续查看总结板提出新问题。

观众提问并不是坏事,这表明他们在听,他们感兴趣,并且想要学习和理解更多。

三幕式讲故事

以上几点是使你的讲故事有效的元素。然而,一个结构才会让你的数据讲故事成功。

三幕式故事讲述是叙事小说中一种流行的模型,它将故事分为三个部分:

设置

目标: 以最清晰的语言陈述你试图解决的问题。

这包括对你的项目进行介绍,说明项目的目的,你要解决的问题等等。在设置阶段,从数据科学的角度,你将更深入地探讨问题或议题,为项目的目标提供背景。你项目的目标将等同于你的第 1 点。

对抗

目标: 向你的观众解释解决这个问题的重要性以及你解决问题的不同路径。

在对抗部分,你可以继续谈论当前任务,以及公司为何会面临这个问题。你要保持观众的兴趣和好奇心,因此谈论公司面临的问题总是能吸引利益相关者。

一步一步向你的读者解释你所经过的不同路径以及每个路径的结果,以完成当前任务。你在数据科学项目中采取的不同步骤将反映不同的点,例如第 2 点、第 3 点,……

向听众提供你遇到的失败和障碍的背景以及原因,将有助于在你提供解决方案后建立你与听众之间的信任和理解。

解决方案

目标: 解释你可以提供的解决方案,并确保听众感到满意。

这是听众从担忧转为释然的地方。你的解决方案应说明它如何克服了之前的失败和障碍。为这一部分留出提问的机会,因为你的听众会希望对你的数据洞察充满信任,并相信这是正确的方向。

一旦听众感到安心,你可以开始总结并讨论需要采取的行动,以确保任务的成功。

金字塔原理

另一个非常有效的结构是金字塔原理。这是一种有效的沟通工具,用于向繁忙的高管清晰地传达复杂问题。其目的是确保书面中的思想始终在一个单一思想下形成金字塔结构。

让我再详细解释一下。当处理希望了解你的数据洞察但时间紧张或急于了解解决方案的繁忙高管时,金字塔原理是最佳选择。

它被分为三部分:

你的答案

在这种情况下,你的答案将是当前任务的解决方案。这是你希望你的听众记住的重点。这是关键的信息,你希望注意力集中在这一主要点上——解决方案。

支持性论据

一旦你陈述了解决方案,你的下一步是说服你的听众这是正确的方法。为此,你需要带领他们经历一段支持性论据的旅程,提供高层次的见解。在这一部分,听众可能会有一些悬而未决的问题。

支持性事实/数据

在这一部分,所有可能的问题将会得到解答。你所有的支持性论据需要有数据和事实的支持,以确保你的听众相信你做了功课,并且你的初步答案/解决方案不是凭空而来的。

总结

使用非技术性语言和可视化技能,无论是三幕剧故事结构还是金字塔原理,都将帮助你掌握数据讲述的艺术。

你选择的结构取决于你对听众的了解程度。你可以通过反复试验两种结构来查看哪一种最有效。衡量结构对你听众的有效性的一种好方法是注意哪种结构的问题更少。听众的问题越少,说明你的讲述越成功。

Nisha Arya 是一名数据科学家、自由技术写作人以及 KDnuggets 的社区经理。她特别关注提供数据科学职业建议或教程,以及围绕数据科学的理论知识。她还希望探索人工智能如何/可以有益于人类寿命的不同方式。作为一名热衷学习者,她寻求拓宽自己的技术知识和写作技能,同时帮助指导他人。

主题更多内容