Vous êtes datascientist chez Kickstarter, une plate-forme de crowdfunding. Vous souhaitez prédire la réussite ou non d'un projet . Avant de créer votre classifieur, vous entreprenez de faire une analyse préparatoire des données (EDA) pour avoir une meilleure intuition sur ces dernières.
Vous avez accès à toutes les ressources que vous souhaitez (cheatsheet, internet, etc.). N'hésitez pas à en faire bon usage.
Pensez à bien organiser votre notebook, à annoter vos graphiques et à les commenter judicieusement. Parmis les critères de notation :
- savoir charger un dataset,
- analyse des valeurs manquantes et dupliquées,
- analyse des outliers,
- analyse univariée,
- analyse multivariée,
- ainsi que toute analyse qui vous semble judicieuse pour prédire le succès d’un projet Kickstarter.
Vous rendrez votre Jupyter Notebook via Github. Pour cela créez un nouveau dépôt (repository) nommé EDA2018
et uploadez le notebook seul sur ce dépôt. Ensuite, envoyez le lien dans un mail aux adresses suivantes :
Ajoutez en pièce jointe votre notebook zippé (afin d'avoir une double sauvegarde de votre travail et pour éviter tout problème éventuel).
Le dataset dataset.csv
est un instantané du site en janvier 2018 :
Colonne | Description |
---|---|
ID | internal kickstarter id |
name | name of project - a project is a finite work with a clear goal that you’d like to bring to life. Think albums, books, or films |
category | category |
main_category | category of campaign |
currency | currency used to support |
deadline | deadline for crowdfunding |
goal | fundraising goal - the funding goal is the amount of money that a creator needs to complete their project |
launched | date launched |
pledged | pledged amount in the project currency |
state | current condition the project is in |
backers | number of backers |
country | country pledged from |
usd pledged | amount of money pledged in USD (conversion made by Kickstarter) |
usd_pledged_real | amount of money pledged in USD (conversion made by fixer.io api) |
usd_goal_real | goal amount in USD (conversion made by fixer.io api) |
Bon courage !