Au cours de l’année 2022, j’ai eu la chance de suivre la formation Big Data pour l’Entreprise Numérique proposée par Centrale Supelec Exced. Dans le cadre de cette formation, il a été demandé de réaliser un projet Data Science et de le soutenir devans un jury.
Pour ce projet, j’ai choisi d’analyser les offres d’emploi RH mises en ligne sur LinkedIn. Ce projet peut être particulièrement intéressant pour un DRH qui souhaite disposer d’une veille sur le marché du travail pour ses emplois les plus critiques.
Pour cela, j’ai commencé par extraire les données d’offres d’emploi sur LinkedIn. J’ai ensuite réalisé un nettoyage de données spécifique au traitement du langage naturel. Ceci m’a permis d’appliquer un algorithme de machine learning pour identifier les thématiques présentes.
Cette page reprend l’ensemble des étapes que j’ai suivi pour mener à bien ce projet.
Acquérir les données
Les offres d’emploi sont disponibles sur les job boards. Les récolter à la main serait long et fastidieux. Découvrez comment j’ai automatisé la collecte des données d’offres d’emploi sur LinkedIn avec un algorithme de Webscraping.
Nettoyer les données
Le traitement du langage naturel demande des opérations de nettoyage spécifiques. Decouvrez les étapes suivies afin que la machine soit capable d’interpréter ces données complexes.
Analyser les données
Le développement d’un modèle de Machine Learning se fait par successions d’essai erreur. Découvrez comment j’ai développé un modèle de traitement du langage naturel et comment j’ai exploité les résultats.
Retour de ping : ChatGPT pour les Ressources Humaines - My People Analytics