Soyons d’accord sur une chose : nous avons tous entendu parler de Machine Learning, que ce soit dans les nouvelles, à l’école ou dans l’entreprise dans laquelle nous travaillons. Nous croyons même qu’il est à l’origine de la quatrième révolution industrielle après le moteur à vapeur, les chaînes d’approvisionnement fondées sur la science et la numérisation.
Cependant, vous n’avez peut-être jamais eu l’impression de comprendre pleinement son potentiel et les domaines dans lesquels il peut être appliqué.
Dans cet article, je vais définir l’apprentissage machine, présenter ses trois catégories et éventuellement parcourir des domaines d’applications avec quelques exemples concrets.
À LA FIN DE L’ARTICLE, VOUS POURREZ PARLER EN TOUTE CONFIANCE DE L’INTELLIGENCE ARTIFICIELLE
Qu’est-ce que l’apprentissage automatique ?
L’apprentissage machine est un domaine de l’intelligence artificielle (IA) qui étudie la capacité d’apprendre des expériences passées pour s’adapter à un environnement instable.
Cela signifie que les règles déterministes ne sont plus programmées comme on le faisait traditionnellement, mais plutôt apprises à partir des données d’entrée, souvent appelées données d’entraînement. Ces règles doivent incorporer l’information importante tout en ayant un bon pouvoir de généralisation car l’objectif n’est pas de prédire le passé mais l’avenir inconnu.
Il faut distinguer trois catégories différentes d’apprentissage machine : l’apprentissage supervisé, l’apprentissage non supervisé et l’apprentissage de renforcement.
L’apprentissage supervisé est lorsque la variable réponse que nous voulons prédire est contenue dans les données d’entraînement, donc l’algorithme apprend une fonction qui relie les caractéristiques des différents échantillons, souvent appelées prédicteurs, à la variable réponse, souvent appelée cible.
L’apprentissage non supervisé est un apprentissage qui a pour but de trouver des modèles inconnus sans cibles préexistantes. Ceci est surtout utilisé lorsque l’étiquetage est coûteux ou impossible ou lorsque l’objectif est de réduire la complexité des données, ce qu’on appelle la réduction dimensionnelle. Les techniques les plus connues sont : l’analyse en composantes principales et le clustering.
L’apprentissage par renforcement utilise une philosophie différente pour l’apprentissage machine. Elle s’appuie sur quatre acteurs majeurs : l’environnement, l’agent, l’action et la récompense. L’agent doit apprendre la meilleure action à prendre dans l’environnement pour obtenir la meilleure récompense.
Différents algorithmes dans chaque catégorie sont présentés ici : Qu’est-ce que l’apprentissage supervisé ?, Qu’est-ce que l’apprentissage non supervisé ? et Qu’est-ce que l’apprentissage par renforcement ?
Domaines d’application
Détection de fraude
La détection des fraudes a été une tâche importante dans les secteurs de la banque et de l’assurance, car la fraude entraîne des opérations inutiles et coûteuses. Elle englobe les activités qui empêchent l’obtention illégale d’argent ou de biens.
La fraude peut prendre différentes formes : vol de cartes de crédit, falsification d’identité pour vendre les biens de quelqu’un d’autre, demande de paiement d’assurance sous de faux prétextes (faux décès, pertes exagérées, etc.).
Cette détection était traditionnellement effectuée par des analystes humains, cependant, avec le nombre croissant de personnes commettant ces activités illégales à l’ère numérique, ce problème ne peut plus être résolu sans automatisation. L’apprentissage machine vient ici comme un sauveur.
Illustrons cela par un exemple concret. Lending Club est la plus grande société américaine de prêts entre particuliers basée à San Francisco, elle permet aux emprunteurs de créer des prêts personnels de 1 000 $ à 40 000 $ où la période standard est de trois ans. Les investisseurs gagnent ensuite de l’argent à travers les intérêts. Dans ce processus, il est important que les investisseurs aient confiance dans le remboursement du prêt et la plateforme devrait enquêter davantage auprès des personnes qui pourraient commettre des fraudes.
Dans ce contexte, nous avons deux types de personnes : les payeurs et les débiteurs délinquants. Il s’agit d’un problème de classification par apprentissage automatique car nous avons deux classes (0 pour les payeurs et 1 pour les débiteurs délinquants) et l’objectif est d’utiliser les caractéristiques de chaque emprunteur pour prévoir sa classe.
L’information sur les emprunteurs est importante, car c’est la seule chose que le modèle voit. Nous disons que le modèle est tout au plus aussi précis que les données sur lesquelles il a été entraîné. Par conséquent, on ne devrait pas s’attendre à grand-chose si les données recueillies sont faibles ou ambiguës.
Les bonnes caractéristiques (ou prédicteurs) à prendre en compte sont par exemple le montant du prêt, le taux d’intérêt sur le prêt, la date d’émission, le titre d’emploi, la durée de l’emploi, l’accession à la propriété, le revenu annuel, l’objet du prêt et le nombre de mois depuis la dernière défaillance.
Prévisions
Illustrons cela par un exemple concret comme nous l’avons fait plus haut. Intermarché est une grande chaîne de supermarchés en France avec 2 328 magasins. Ils ont un service ” pick & collect ” qu’ils veulent rendre le plus efficace possible. La prévision des commandes des clients est cruciale car elle aidera les gérants des magasins à améliorer l’agencement et à anticiper la demande.
Cette tâche peut être traitée à l’aide de deux philosophies différentes : la considérer comme un problème de séries chronologiques ou comme un problème de régression.
Comme problème de séries chronologiques, on peut utiliser des méthodes statistiques comme ARIMA. Il s’agit d’une technique de prévision qui projette les valeurs futures d’une série basée entièrement sur sa propre inertie. Il suppose que les données sont stationnaires, ce qui implique que la série reste à un niveau relativement constant dans le temps. S’il y a une tendance, ARIMA ne fonctionnera pas bien, il est donc conseillé de supprimer le terme tendance avant.
Comme problème de régression, on peut utiliser comme prédicteurs les caractéristiques des magasins et les indicateurs statistiques sur le passé (p. ex. moyenne mobile, écart type).
De plus, Facebook a développé son propre outil de prévision appelé Prophet. Vous pouvez y jeter un coup d’oeil !
Traduction automatique
Dans la société d’aujourd’hui, des personnes de nationalités différentes parlant des langues différentes doivent interagir dans des environnements complexes. Une bonne communication est clé dans ces collaborations. Traditionnellement, la traduction était effectuée par des traducteurs humains qui offraient leurs services pour des honoraires élevés en général. Cependant, avec le nombre croissant d’associations multilingues, la traduction automatique est une nécessité.
Il existe deux catégories de traductions automatiques : TAS (traduction automatique statistique) et TAN (traduction automatique neuronale).
Le TAS s’appuie sur des modèles statistiques issus de l’analyse de corpus de textes bilingues.
Le NMT utilise des architectures de réseaux de neurones avancés pour apprendre les mécanismes existants dans les données de formation composées de documents appariés (un document dans la langue source et le même document dans la langue cible). En général, l’architecture utilisée est un paradigme codeur/décodeur où le codeur apprend des motifs cachés de la langue source et le décodeur les utilise pour prédire des phrases dans la langue cible.
Voici notre tutoriel sur la traduction automatique en utilisant PyTorch.