原文:
www.kdnuggets.com/2016/11/data-science-101-good-at-r.html
由 Ari Lamstein 撰写。
最近我在我的 会员网站 上有几个人问了我以下问题:
1. 谷歌网络安全证书 - 快速进入网络安全职业轨道。
2. 谷歌数据分析专业证书 - 提升你的数据分析技能
3. 谷歌 IT 支持专业证书 - 支持你的组织 IT
我该如何在 R 方面变得出色?
这个话题出现的次数足够多,我可以概述一下我的想法。这样,下次有人提问时,我可以简单地将他们转发到这篇文章。
我的建议是面向那些想建立一个提升他们职业的在线作品集的人。这是我走过的道路,在某些方面,我只是说说对我有效的方法。
我的建议是完全停止考虑你在 R 方面的能力。相反,只需将其视为一个工具——一个实现目标的手段。这将使你能够将重点转移到
-
选择一个你关心的项目
-
发布你从研究中获得的结果
-
直接与重视你结果的人沟通
在我看来,这种关注点的变化改变了一切。
这些要点中的每一个都可以写成一本书。今天我将简单分享它们如何与我学习 R 的旅程相关。我会概述我如何从“R 作为一个副项目”转变为“R 开发者的职业”。这通常是那些问我这个问题的人真正想知道的。
我并没有打算学习 R。
几年前,我在一家房地产公司担任软件工程师。我在处理销售线索时需要分析数据。
MySQL 是我开始分析的一个很好的起点,但我需要做更多的工作。我开始学习 R,希望它能帮助我更好地分析数据。它确实做到了。
就我学习 R 的经历而言,我可能阅读了所有我能找到的资料。没有单一资源能准确告诉我我需要什么。许多资料详细介绍了对我完全无用的技术。从现在回想起来,温斯顿·张的R 图形 cookbook 和 Coursera 数据科学课程是我现在能记住名字的唯一资源。
在这种情况下,以上 3 点得到了满足,因为我有一份全职工作,我在分析与工作相关的数据,并且我与我的团队分享了结果。
在某个时候,我意识到自己有相当特殊的分析需求。我的主要分析单位是邮政编码,这本身就很不寻常。我还想将我们的内部数据与外部来源的人口数据进行融合,例如美国人口普查局。我在 R 生态系统中找不到完全符合需求的工具,所以我自己动手做了。这个项目最终变成了choroplethr。
由于我大部分职业生涯都是软件工程师,到目前为止的一切对我来说在某种程度上都是“正常”的。真正让我走出舒适区的是接下来的几个部分。
尽管我在旧金山作为软件工程师工作了 10 多年,但我从未创建过开源项目。R 通过其包系统有着丰富的传统,这对我来说似乎是一个尝试新事物的好机会。
将项目从内部使用转变为其他人可以“现成”使用的状态是非常辛苦的工作。我真的不确定是否会有其他人使用这个项目。但当时我想,“如果这个项目能帮助到至少一个人,那就值得了。”
在 R 中没有准确测量包安装量的方法。但根据 metacran/cranlogs 应用程序的统计,截至本文撰写时,主要的choroplethr包已经被安装了 39,000 次。
当我第一次发布choroplethr时,营销对我来说是一个禁忌词。现在我已经接受了它。
对不同的人来说,营销的意义各不相同。但对我而言,它主要意味着:
-
找到正在使用choroplethr的人,或者可能考虑使用它的人
-
了解他们为什么使用它。它如何融入他们项目的更广泛背景?
-
了解他们还有哪些其他问题,我可能能够帮助解决。
我主要使用内容营销来推广choroplethr。实际操作中,这意味着我有一个博客和一个让人们订阅我的邮件列表的方式。
电子邮件列表很重要。大多数访问网站的人离开后再也不会回来。如果你有他们的电子邮件地址,你可以在之后与他们讨论上述内容。
我的主要电子邮件订阅是Learn to Map Census Data in R,这是我关于如何使用choroplethr的免费电子邮件课程。目前已有几千人参加过这个课程。
在推出产品之前,最好先有潜在客户排队。理想情况下,你应该通过 Skype 与他们进行过几次访谈、调查过他们,或者至少通过电子邮件与他们保持联系。实际上,这些潜在客户已经在你的邮件列表中。这就是为什么我将“市场”列在“货币化”之前的原因。
我已经通过两种方式实现了choroplethr的货币化:
-
创建如何使用它的课程,并进行有关更广泛主题的一般教育
-
提供有关项目和更广泛主题的培训和咨询服务
我发现创建第一门课程改变了一切。除了课程的直接销售外,拥有一个付费的教育产品还带来了更高质量的咨询线索。
我最初不确定是否会有人购买的第一门课程,总收入达到了几千美元。
我分享自己的故事只是为了帮助那些问我“我怎么才能在 R 方面变得优秀?”的初学者。
我的回答是这是一个漫长的过程。但你今天可以做的两件事是:
-
选择一个你感兴趣的话题。
-
创建一个博客,并撰写你的第一篇帖子。那篇帖子可以介绍你自己并说明你计划研究的内容。
当然,话题可以更改。但我建议尝试将一个话题坚持至少 3 个月。对特定领域有深入了解会使你在寻求该领域信息的人眼中更有价值。
如果你对我上面提到的内容有任何问题,或希望我深入撰写关于某个特定部分的未来文章,请随时通过下方的“联系”按钮与我联系。
如果你希望我为你提供个性化帮助,将这些材料应用到你自己的情况中,可以考虑加入我的membership site。
原始帖子。经许可转载。
简介: Ari Lamstein是一位软件工程师和数据分析师。他帮助客户进行软件工程和数据分析项目,编写开源软件并举办培训研讨会。详情请见arilamstein.com。
相关内容:
-
学习在 R 中绘制人口普查数据 – 免费电子邮件课程
-
R 图形画廊数据可视化集合
-
数据科学入门 – R