Le machine learning est un sous-ensemble de l’intelligence artificielle. La distinction est importante. En effet, l’intelligence artificielle se définit par sa finalité « simuler le comportement humain ». Le Machine Learning se définit par des moyens, des modèles statistiques, des algorithmes. Le Deep Learning est ainsi un sous-ensemble de techniques appartenant au Machine Learning.
Concrètement, le Machine Learning consiste en l’ingestion de données par un ordinateur. Des calculs statistiques permettent l’identification de schémas récurrents.
Depuis les années 2000, les grandes compagnies américaines de technologies (GAFAM) ont banalisé cette technologie dans notre quotidien : moteur de recherche, services de navigation, recommandations de produits, assistants vocaux… tous ces outils utilisent le Machine Learning.
Des cas d’usage utilisant le Machine Learning pour les RH sont apparus : recommandation de formation, analyse de CV, workforce planning, sont autant de possibilités offertes par le Machine Learning. Mais ils restent encore balbutiants face aux possibilités offertes.
L’objectif de cet article est d’introduire les éléments de base du Machine Learning afin de comprendre leur potentiel dans un contexte RH. Nous allons commencer par des présentations théoriques que nous illustrerons ensuite par des cas d’usages RH.
Sommaire
Classification et régression
Le Machine Learning permet de réaliser deux types d’opérations (cf : définir les données)
- La classification : c’est la démarche d’attribuer une donnée catégorielle à un individu à partir de ses caractéristiques. (par exemple, le fait qu’un salarié démissionne)
- La régression : c’est la démarche d’attribuer une donnée quantitative à un individu à partir de ses caractéristiques. (par exemple, l’ancienneté au départ d’un salarié).
Dans les parties suivantes, nous allons présenter un cas pratique en présentant la classification et la régression.
Apprentissage supervisé et non supervisé
Les algorithmes de classification se découpent en deux catégories :
- L’apprentissage supervisé : dans ce cas, les données sont étiquetées. On utilise ces algorithmes afin d’identifier les raisons de l’étiquetage et de le répliquer.
- L’apprentissage non supervisé : dans ce cas, les données ne sont pas étiquetées. Il appartient à la machine d’analyser la structure des données et en déduire les similitudes pour proposer des groupes homogènes.
Réduction de dimensions
Le machine learning peut également servir à simplifier des bases contenant un nombre important de variables.
C’est l’objectif de la réduction de dimension. Imaginez que vous disposiez de 40 variables pour chaque collaborateur sur son parcours de formation. La réduction de dimension propose d’identifier les variables les plus déterminantes pour les utiliser dans notre modèle d’analyse.
En synthèse
Vous avez découvert les notions de base de l’apprentissage machine ou machine learning.
Pour la suite, je vous propose de découvrir comment ces technologies peuvent répondre à des problématiques quotidiennes de la fonction Ressources Humaines. Nous verrons les algorithmes de base, leur fonctionnement, et discuterons des points d’attention à garder en tête.