Skip to content

Latest commit

 

History

History
21 lines (11 loc) · 1.89 KB

README.md

File metadata and controls

21 lines (11 loc) · 1.89 KB

Mémoire de Master 2 : Deep Learning pour le NLP : application à la Chimie

Ce repository contient :

Le but du stage a été d’étudier l’apport de méthodes de traitement naturel du langage (ou NLP) pour aider à déterminer la brevetabilité d’une invention ou sa liberté d’exploitation. Pour ce faire, l'objectif a été de trouver des méthodes d’apprentissage profond performantes, pour les tâches de reconnaissance d’entités nommées et d’extraction de relation, afin de pouvoir extraire de l’information contenue dans des brevets appartenant au domaine de la catalyse hétérogène.

Le mémoire comporte les parties suivantes :

  • La présentation de l’entreprise IFPEN, ainsi que du contexte du stage

  • Une montée en compétence et une prise en main des outils de traitement du langage naturel (ou NLP) en appliquant différents modèles de Machine Learning et Deep Learning pour la classification de sentiments sur un jeu de donnéesbien connu.

  • L'évaluation de différents modèles de Deep Learning pour une tâche de reconnaissance d’entités nommées sur, d’une part un jeu de données classique et fréquemment utilisé pour évaluer des modèles, et d’autre part des données de brevets annotées par les experts métiers IFPEN.

  • L'évaluation dans la même idée des modèles pour une tâche d’extraction de relation sur un jeu de données classique, puis sur les données de brevets IFPEN.

  • Enfin, la comparaison des résultats obtenus pour ces tâches dereconnaissance d’entités nommées et d’extraction de relation sur le jeu de données brevets avec les résultats fournis par la plateforme Watson d’IBM.