www.kdnuggets.com/2015/11/machine-learning-apis-data-science.html
作者:Khushbu Shah (DeZyre)
大数据正在通过各种数据源(如传感器、社交媒体数据、Excel 电子表格、评论、客户数据等)流入互联网上的企业。许多公司,如 Google、IBM、亚马逊和微软,正在通过构建机器学习 API 帮助企业处理大数据,以便组织可以充分利用机器学习技术。
机器学习是大数据创新的主要前沿,但对于那些非技术狂人或数据科学领域专家的人来说,它可能令人望而却步。类似于标准 API 帮助开发人员创建应用程序,机器学习 API 使得机器学习变得易于使用,适合每个人。机器学习 API 抽象了创建和部署机器学习模型所涉及的复杂性,使开发人员可以专注于数据处理、用户体验、设计、实验以及从数据中获取洞察。
在早期,机器学习算法和技术主要由科学家、技术狂人或领域专家使用。然而,许多组织现在使用机器学习 API 将这些技术提供给大众。机器学习 API 使得开发人员可以轻松地将机器学习应用于数据集,从而为他们的应用程序添加预测功能。机器学习 API 为开发人员提供了一个抽象层,以将机器学习集成到现实世界的应用程序中,而无需担心在其基础设施上扩展算法以及深入了解机器学习算法的细节。机器学习 API 要求开发人员专注于两个重要方面——
-
开发人员可以通过将机器学习 API 集成到他们的应用程序中,专注于查询预测。
-
开发人员可以跟踪他们应用程序中的事件以收集使用数据。
机器学习 API 为企业提供了整合预测分析的能力,以便他们能够更好地了解客户、理解他们的需求,并基于过去的数据趋势提供产品或服务,从而启动销售过程。实时消费者互动通过机器学习 API 的比例不断增加——使它们成为向应用开发人员展示实时预测分析的理想选择。
应用开发人员总是寻找各种方式来简化用户的生活,通过引入新颖和创新的功能,帮助用户节省时间。这就是机器学习 API 在应用开发人员中受欢迎的原因。一些标准的 API 示例包括智能标记、产品推荐、优先级过滤和垃圾邮件过滤。
使用机器学习 API 相关的挑战
使用机器学习 API 最耗时且最重要的部分是识别需要解决的业务问题并构建有意义的数据集。这意味着 –
-
机器学习从业者必须确保他们对需要预测或分类的内容非常清楚。并非所有问题都可以通过机器学习 API 解决,因此决定场景是否适合非常重要。
-
机器学习从业者应尽可能多地收集关于给定上下文的数据,而不是做出多个假设。这很重要,因为 数据科学家 或分析师经常会发现输入数据与他们试图预测或分类的列(即目标值)之间的不可预测的相关性。
机器学习从业者的顶级机器学习 API
机器学习的最新趋势将被商品化为服务,这将成为主流,就像商品化的可视化和存储一样。以下是一些提供商品化机器学习作为服务(MLaaS)给业务分析师和开发人员进行应用集成的最佳机器学习 API –
1) IBM Watson
对于那些正在使用 IBM Watson 机器智能服务的机器学习从业者来说,无需再苦苦寻找。IBM Watson API 是一种认知服务,它简化了数据准备过程,使预测分析变得更加容易。它还提供了使用视觉讲故事工具,如信息图表、地图或图形,以示例化分析结果。IBM Watson 通过 IBM 的 Bluemix 云服务平台对公众开放。
IBM 的 Watson 通过扩展的工具、机器学习技术和认知 API 听、看、说和理解,让自己更具人性。开发人员可以通过嵌入 IBM Watson 创建具有更多认知技能的产品、服务或应用程序,以了解人们如何与他们的应用程序互动和反应。IBM Watson 在短短 2 年内已经发展出 25 个以上的 API,这些 API 由大约 50 种技术驱动。IBM Watson API 提供的一些最佳服务包括 –
-
机器翻译 – 帮助翻译不同语言对中的文本。
-
信息共鸣 – 了解短语或词汇在预定受众中的受欢迎程度。
-
问答服务 – 此服务提供对由主要文档来源触发的查询的直接答案。
-
用户建模 – 从给定文本中预测某人的社会特征。
2) Microsoft Azure 机器学习 API
Azure Machine Learning API 帮助数据科学家在几分钟内发布模型,而以前开发出可行模型后需要几天时间。Azure Machine Learning 通过提供用于欺诈检测、文本分析、推荐系统和其他业务场景的 API,使数据科学家能够轻松地在 IoT 应用程序中使用预测模型。该 API 基于 Microsoft 产品(如 Bing 和 Xbox)中的机器学习能力。
Azure Machine Learning API 提供了各种功能,如 –
-
能够创建自定义的可配置 R 模块,以便数据分析师或数据科学家可以整合他们自己的 R 语言 代码来进行训练或预测任务。
-
Azure 允许数据科学家或分析师使用各种 Python 库(如 SciPy、SciKit-Learn、NumPy、Pandas 等)来包含他们自己的 Python 脚本。流行的工具,如 iPython Notebook 和其他多种 Visual Studio 的 Python 工具,也可以与 Azure Machine Learning API 一起使用。
“我们添加了 Python,这是数据科学家最喜欢的工具之一。它有一个庞大的生态系统。这个功能将对数据科学家非常有力。我们做了很多改进,添加 Python 就是其中的一部分。Azure Machine Learning 是这个平台。你可以复制一段 Python 代码,将其插入到工作室中并创建一个 API。” - 微软公司副总裁 Joseph Sirosh 说
-
分析师或数据科学家可以使用一个类 SVM 进行异常检测,或通过 PCA 或“计数学习”来训练 PB 级的数据。
-
Azure Machine Learning API 还支持 Spark 和 Hadoop 用于大数据处理,使其成为不论平台如何的理想选择。
1. Google 网络安全证书 - 快速进入网络安全职业的快车道。
2. Google 数据分析专业证书 - 提升你的数据分析能力
3. Google IT 支持专业证书 - 支持组织的 IT