Skip to content

Latest commit

 

History

History
87 lines (44 loc) · 7.86 KB

comprehensive-list-kaggle-solutions-ideas.md

File metadata and controls

87 lines (44 loc) · 7.86 KB

最全面的 Kaggle 解决方案和创意列表

原文:www.kdnuggets.com/2022/11/comprehensive-list-kaggle-solutions-ideas.html

最全面的 Kaggle 解决方案和创意列表

编辑者提供的图片

被称为 Kaggle 的社区是机器学习和数据科学爱好者的首选平台,他们可以在这里与志同道合的用户合作。在这个平台上有很多事情可以做:除了合作,用户还可以搜索和发布数据集,使用集成 GPU 的笔记本电脑,也许最令人兴奋的是,用户可以参与与其他用户的比赛,以解决数据科学和机器学习挑战。


我们的前三大课程推荐

1. Google 网络安全证书 - 快速进入网络安全职业的轨道。

2. Google 数据分析专业证书 - 提升你的数据分析能力

3. Google IT 支持专业证书 - 支持你所在组织的 IT


这些 Kaggle 竞赛 是平台如此受欢迎的一个重要原因;这些竞赛鼓励公司发布各种难以解决的数据科学任务,这些任务的奖品可以被初学者和专家争取。事实上,几乎任何人都可以参加 Kaggle 竞赛——从想深入了解 AI 的学生到在自己领域内的世界顶尖数据科学家,Kaggle 促进了合作的独特融合,并将其用户置于实时排行榜上。

多亏了一位绅士的努力,现在用户还有一个网站 catalogues and organizes solutions 用于组织 Kaggle 竞赛的解决方案。让我们快速深入了解 Kaggle,探索一下这个网站的概况,查看它收集的一些解决方案,并了解如何通过学习其他数据科学家解决 Kaggle 问题的方法来提高自己的实践能力。

Kaggle 简介

你可以把 Kaggle 想象成 AI 和数据科学爱好者的 AirBnB。这个平台是众包的,旨在吸引那些希望通过参与机器学习、数据科学和预测分析挑战来提高解决问题能力的数据科学家。其活跃成员来自 190 多个国家,Kaggle 每月从用户那里收到近 150,000 个提交。

正如我们提到的,Kaggle 的主要吸引力在于其竞争场景。该平台发布的挑战涉及从分析患者数据到预测癌症,再到情感分析的各种内容。这些挑战的共同点是,竞争者必须应用数据科学来获取解决方案。

在 Kaggle 上发布的挑战来自不同来源,其中一些仅为会员提供提升技能的机会,而另一些则由有实际问题的企业发布,需要立即解决。Kaggle 鼓励尽可能多的用户参与,通过提供奖金给竞赛获胜者或解决挑战并取得前 X 名的选手。奖品也可以是公司提供的产品或职位。

什么是 Kaggle 解决方案?

Kaggle 解决方案网站致力于收集几乎每一个顶级竞争者在之前 Kaggle 竞赛中设计的解决方案。每当新的竞赛结束时,网站都会更新,提供竞赛的标题和描述、重要细节(奖品类型、参与创建解决方案的团队成员数量、竞赛类型及其指标以及竞赛发生的年份)。

该网站由单个数据科学家和研究员Farid Rashidi制作。Rashidi 目前担任国家癌症研究所研究员,进行基于数据科学的癌症疫苗研究。Rashidi 曾就读于印第安纳大学,获得计算机科学博士学位,并创建了利用单细胞测序数据分析肿瘤异质性和进化的计算工具。

Kaggle 解决方案和创意示例

现在你对 Kaggle 解决方案有了一个快速的概述,让我们看看网站上发布的一些最近解决方案。

American Express - 违约预测

该竞赛由 American Express 发布,要求预测客户未来是否会违约支付。竞赛奖金高达 100,000 美元,并要求参赛者使用机器学习准确预测客户信用违约。American Express 特别要求参赛者使用工业级数据集来创建一个挑战现有生产模型的机器学习模型。

第一名的解决方案由一位名为“daishu”的用户发布,他是首次独自赢得 Kaggle 竞赛的获胜者。Daishu 使用了重型集成方法与 NN 和 LGB,并将其解决方案的代码发布在Github上。

Ubiquant 市场预测

另一场最近的比赛由中国量化对冲基金 Ubiquant Investment Co., Ltd 提供,奖金为$100,000。Ubiquant 要求参赛者创建一个模型来预测金融投资的回报率,并对其算法进行训练和测试,使用之前的真实世界价格数据。

理想情况下,获胜的解决方案将改善定量研究人员未来预测投资回报的方式。第一名解决方案已发布在 Kaggle,提供了总结和详细描述。

表格游戏系列 - 2022 年 8 月

最新的比赛是 Kaggle 的“Playground Series”系列的一部分,Kaggle 成员需改进一个虚构公司的主要产品。'Playground Series'比赛鼓励所有技能水平的成员对表格数据集进行建模。Kaggle 指出,这些比赛主要适合那些希望接受中级挑战的成员。排名靠前的解决方案由一名名为'Sawaimilert'的用户发布在 Kaggle 上。

参加 Kaggle 比赛的好处

参加 Kaggle 比赛最初可能会让人感到非常畏惧;你可能会觉得获胜的机会很渺茫,也不确定自己是否能学到有价值的东西来提升技能。此外,排名靠前的参赛者通常会利用相当复杂的集成方法来应对那些人工且显然不现实的数据集。

尽管如此,即使你对竞争有一些顾虑,参加至少几个 Kaggle 比赛还是值得的——对某个你尝试过的数据科学相关的事物有一个意见,比对从未参与过的事物有意见更有意义。

例如,你可能会发现一个专注于你感兴趣的新兴话题的比赛,这些话题在数据科学相关领域尚未出现。例如,像区块链这样的新兴话题可能会成为未来比赛的重点。考虑到 Kaggle 作为一个平台正因被 Google 收购而快速发展,这一点尤其可能。定期查看一些能引起你兴趣的新比赛可能会值得你的时间。

结论

我们鼓励你保持对 Kaggle 解决方案和顶级 Kaggle 竞争者开发的想法的最新了解。如果你想涉足数据科学的竞争领域,也可以考虑在正式参与 Kaggle 之前先参加其他非 Kaggle 相关的比赛。

**Nahla Davies**是一名软件开发人员和技术作家。在全职从事技术写作之前,她曾担任 Inc. 5000 经验品牌组织的首席程序员,该组织的客户包括三星、时代华纳、Netflix 和索尼等。

更多相关主题