Skip to content

Latest commit

 

History

History
143 lines (78 loc) · 8.08 KB

data-science-101-good-at-r.md

File metadata and controls

143 lines (78 loc) · 8.08 KB

数据科学 101:如何在 R 方面变得出色

原文:www.kdnuggets.com/2016/11/data-science-101-good-at-r.html

由 Ari Lamstein 撰写。

最近我在我的 会员网站 上有几个人问了我以下问题:


我们的前 3 个课程推荐

1. 谷歌网络安全证书 - 快速进入网络安全职业轨道。

2. 谷歌数据分析专业证书 - 提升你的数据分析技能

3. 谷歌 IT 支持专业证书 - 支持你的组织 IT


我该如何在 R 方面变得出色?

这个话题出现的次数足够多,我可以概述一下我的想法。这样,下次有人提问时,我可以简单地将他们转发到这篇文章。

数据科学家

我的建议是面向那些想建立一个提升他们职业的在线作品集的人。这是我走过的道路,在某些方面,我只是说说对我有效的方法。

忽视 R

我的建议是完全停止考虑你在 R 方面的能力。相反,只需将其视为一个工具——一个实现目标的手段。这将使你能够将重点转移到

  1. 选择一个你关心的项目

  2. 发布你从研究中获得的结果

  3. 直接与重视你结果的人沟通

在我看来,这种关注点的变化改变了一切。

这些要点中的每一个都可以写成一本书。今天我将简单分享它们如何与我学习 R 的旅程相关。我会概述我如何从“R 作为一个副项目”转变为“R 开发者的职业”。这通常是那些问我这个问题的人真正想知道的。

我为什么以及如何学习 R

我并没有打算学习 R。

R几年前,我在一家房地产公司担任软件工程师。我在处理销售线索时需要分析数据。

MySQL 是我开始分析的一个很好的起点,但我需要做更多的工作。我开始学习 R,希望它能帮助我更好地分析数据。它确实做到了。

就我学习 R 的经历而言,我可能阅读了所有我能找到的资料。没有单一资源能准确告诉我我需要什么。许多资料详细介绍了对我完全无用的技术。从现在回想起来,温斯顿·张的R 图形 cookbook 和 Coursera 数据科学课程是我现在能记住名字的唯一资源。

在这种情况下,以上 3 点得到了满足,因为我有一份全职工作,我在分析与工作相关的数据,并且我与我的团队分享了结果。

自定义需求

在某个时候,我意识到自己有相当特殊的分析需求。我的主要分析单位是邮政编码,这本身就很不寻常。我还想将我们的内部数据与外部来源的人口数据进行融合,例如美国人口普查局。我在 R 生态系统中找不到完全符合需求的工具,所以我自己动手做了。这个项目最终变成了choroplethr

由于我大部分职业生涯都是软件工程师,到目前为止的一切对我来说在某种程度上都是“正常”的。真正让我走出舒适区的是接下来的几个部分。

发布项目

尽管我在旧金山作为软件工程师工作了 10 多年,但我从未创建过开源项目。R 通过其包系统有着丰富的传统,这对我来说似乎是一个尝试新事物的好机会。

将项目从内部使用转变为其他人可以“现成”使用的状态是非常辛苦的工作。我真的不确定是否会有其他人使用这个项目。但当时我想,“如果这个项目能帮助到至少一个人,那就值得了。”

在 R 中没有准确测量包安装量的方法。但根据 metacran/cranlogs 应用程序的统计,截至本文撰写时,主要的choroplethr包已经被安装了 39,000 次。

营销项目

当我第一次发布choroplethr时,营销对我来说是一个禁忌词。现在我已经接受了它。

对不同的人来说,营销的意义各不相同。但对我而言,它主要意味着:

  1. 找到正在使用choroplethr的人,或者可能考虑使用它的人

  2. 了解他们为什么使用它。它如何融入他们项目的更广泛背景?

  3. 了解他们还有哪些其他问题,我可能能够帮助解决。

我主要使用内容营销来推广choroplethr。实际操作中,这意味着我有一个博客和一个让人们订阅我的邮件列表的方式。

电子邮件列表很重要。大多数访问网站的人离开后再也不会回来。如果你有他们的电子邮件地址,你可以在之后与他们讨论上述内容。

我的主要电子邮件订阅是Learn to Map Census Data in R,这是我关于如何使用choroplethr的免费电子邮件课程。目前已有几千人参加过这个课程。

货币化项目

在推出产品之前,最好先有潜在客户排队。理想情况下,你应该通过 Skype 与他们进行过几次访谈、调查过他们,或者至少通过电子邮件与他们保持联系。实际上,这些潜在客户已经在你的邮件列表中。这就是为什么我将“市场”列在“货币化”之前的原因。

我已经通过两种方式实现了choroplethr的货币化:

  1. 创建如何使用它的课程,并进行有关更广泛主题的一般教育

  2. 提供有关项目和更广泛主题的培训和咨询服务

我发现创建第一门课程改变了一切。除了课程的直接销售外,拥有一个付费的教育产品还带来了更高质量的咨询线索。

我最初不确定是否会有人购买的第一门课程,总收入达到了几千美元。

对初学者的建议

我分享自己的故事只是为了帮助那些问我“我怎么才能在 R 方面变得优秀?”的初学者。

我的回答是这是一个漫长的过程。但你今天可以做的两件事是:

  1. 选择一个你感兴趣的话题。

  2. 创建一个博客,并撰写你的第一篇帖子。那篇帖子可以介绍你自己并说明你计划研究的内容。

当然,话题可以更改。但我建议尝试将一个话题坚持至少 3 个月。对特定领域有深入了解会使你在寻求该领域信息的人眼中更有价值。

有问题吗?

如果你对我上面提到的内容有任何问题,或希望我深入撰写关于某个特定部分的未来文章,请随时通过下方的“联系”按钮与我联系。

如果你希望我为你提供个性化帮助,将这些材料应用到你自己的情况中,可以考虑加入我的membership site

原始帖子。经许可转载。

简介: Ari Lamstein是一位软件工程师和数据分析师。他帮助客户进行软件工程和数据分析项目,编写开源软件并举办培训研讨会。详情请见arilamstein.com

相关内容:

  • 学习在 R 中绘制人口普查数据 – 免费电子邮件课程

  • R 图形画廊数据可视化集合

  • 数据科学入门 – R

相关主题