Au cours de l’année 2022, j’ai eu la chance de suivre la formation Big Data pour l’Entreprise Numérique proposée par Centrale Supelec Exced. Dans le cadre de cette formation, il a été demandé de réaliser un projet Data Science et de le soutenir devans un jury.

Pour ce projet, j’ai choisi d’analyser les offres d’emploi RH mises en ligne sur LinkedIn. Ce projet peut être particulièrement intéressant pour un DRH qui souhaite disposer d’une veille sur le marché du travail pour ses emplois les plus critiques.

Pour cela, j’ai commencé par extraire les données d’offres d’emploi sur LinkedIn. J’ai ensuite réalisé un nettoyage de données spécifique au traitement du langage naturel. Ceci m’a permis d’appliquer un algorithme de machine learning pour identifier les thématiques présentes.

Cette page reprend l’ensemble des étapes que j’ai suivi pour mener à bien ce projet.

En bonus, une petit photo de la soutenance 🙂
books, stack, book store-1163695.jpg

Les offres d’emploi sont disponibles sur les job boards. Les récolter à la main serait long et fastidieux. Découvrez comment j’ai automatisé la collecte des données d’offres d’emploi sur LinkedIn avec un algorithme de Webscraping.

Le traitement du langage naturel demande des opérations de nettoyage spécifiques. Decouvrez les étapes suivies afin que la machine soit capable d’interpréter ces données complexes.

artificial intelligence, brain, think-3382507.jpg

Le développement d’un modèle de Machine Learning se fait par successions d’essai erreur. Découvrez comment j’ai développé un modèle de traitement du langage naturel et comment j’ai exploité les résultats.

1 commentaire pour “Un projet Data Science de bout en bout”

  1. Retour de ping : ChatGPT pour les Ressources Humaines - My People Analytics

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *