Se retrouvant en plein pic dans le cycle de Hype depuis deux ans, le machine learning – ou l’apprentissage automatique – est un domaine d’expertise assez vaste dont l’application dans plusieurs industries, – dont celle de la publicité digitale, – est en plein essor. Décryptage de son fonctionnement et de ses applications.
Le Machine Learning : qu’est-ce que c’est ?
L’apprentissage automatique (de l’anglais Machine Learning, ou ML) est une branche de l’intelligence artificielle qui permet aux ordinateurs d’apprendre et d’exécuter plusieurs tâches sans être explicitement programmés pour les faire. Il s’agit, par exemple, des tâches comme le diagnostic des problèmes ou la prédiction des résultats dans les situations où l’utilisation des algorithmes plus classiques est problématique. En se nourrissant de nouvelles données, les algorithmes de l’apprentissage automatique sont capables d’évoluer en permanence.
Le Machine Learning : comment ça marche ?
Il s’agit pour les algorithmes de s’appuyer sur de nombreuses données historiques pour prédire des résultats statistiquement significatifs de l’évolution future. On peut distinguer deux types d’algorithmes : supervisés et non supervisés.
Un algorithme supervisé fonctionne en deux phases : durant la phase d’apprentissage, on lui soumet des séries de données d’entrée pour le problème à résoudre, accompagnées de la réponse correspondante. En comparant ses propres réponses avec les valeurs correctes, l’algorithme fait progressivement converger ses paramètres internes pour minimiser l’erreur de prédiction. Après la phase d’apprentissage, l’algorithme entrainé permet de traiter des données d’entrées « réelles » pour obtenir des réponses dans des cas non connus à priori.
Les algorithmes non supervisés fonctionnent sans phase d’apprentissage et fournissent directement une réponse à partir des données d’entrée. Ils traitent des classes de problèmes différents des algorithmes supervisés et sont utilisés en complément de ceux-ci. Selon la problématique posée, il est possible d’utiliser plusieurs algorithmes et méthodes comme par exemple, les arbres de décision ou la régression logistique. Certaines méthodes, telles que les réseaux de neurones ou les systèmes immunitaires artificiels, sont inspirées du fonctionnement biologique humain.
Le Machine Learning : quelles applications ?
Les techniques du machine learning sont utilisées dans de très nombreux domaines. A titre d’exemple, il peut s’agir de l’industrie des transports pour le développement d’un système de navigation sans conducteur, du secteur médical où les machines aident à diagnostiquer le cancer, ou bancaire où l’on cherche à estimer la capacité d’une personne à rembourser un prêt. L’utilisation de l’apprentissage automatique se répand rapidement dans le marketing digital. Les réseaux de neurones sont appliqués notamment pour la reconnaissance d’images, et le système immunitaire artificiel est largement utilisé dans le domaine de la détection de la fraude.
✦Reconnaissance d’images
Il est particulièrement intéressant d’utiliser les algorithmes du machine learning pour la reconnaissance d’images, notamment les algorithmes supervisés qui permettent d’effectuer des tâches de classification (où on veut classer les cas d’entrées à des groupes connus) et de régression (où on veut prédire une valeur de sortie à partir des données d’entrée). Par exemple, la reconnaissance d’image de Google utilise un algorithme supervisé à des fins de classification. En montrant à l’algorithme des diverses images de chat, et en précisant à chaque fois une « étiquette » (« chat » ou « pas chat »), il saura, à la fin de son apprentissage, se concentrer sur les éléments distinctifs de chats qu’il aura mémorisés, et différencier un chat des autres félins proches. Dans certains cas de figure où même l’œil humain peut se tromper, l’identification devient particulièrement difficile pour un algorithme, et se joue à un détail près :
(Source : user @teenybiscuit on Twitter, posted on 20 nov 2015, https://twitter.com/teenybiscuit/status/707004279324696577)
Plus globalement, il peut s’agir de la reconnaissance faciale, la reconnaissance de lieux ou de plats, mais aussi de la reconnaissance des situations (est-ce un conducteur attentionné ? un groupe d’étudiants à l’école ? un dîner de famille ?). Les réseaux neuronaux artificiels permettent de traiter au mieux la tâche de la reconnaissance d’images : en s’inspirant du fonctionnement de communication neuronale humain, les réseaux de neurones apprennent à associer des données d’entrée à une étiquette, en passant par plusieurs étapes de validation interconnectés, ce qui permet de retenir la prédiction la plus probable.
✦ Détection des activités frauduleuses
Les algorithmes traditionnels permettent d’identifier les comportements frauduleux sur internet en s’appuyant sur des règles prédéfinies. Par action frauduleuse on entend, par exemple, une visite sur le site effectuée par des robots et non par des humains, un achat effectué sur le site e-commerce depuis un compte piraté ou avec une carte bancaire volée. Les algorithmes traditionnels peuvent s’appuyer sur plusieurs critères fixes pour détecter une fraude. Par exemple, sur un site de commerce électronique français, un achat depuis un pays de l’Amérique Latine pourrait être alarmant. De même, sur un site francophone destiné à une audience française, une hausse de trafic soudaine amenée par des utilisateurs dont la langue de préférence dans le navigateur est le mandarin pourrait signifier qu’il s’agit d’un trafic non-humain.
Cependant, les tactiques des fraudeurs changent rapidement, ce qui rend l’application de règles fixes non pertinentes pour plusieurs cas de figure. Les algorithmes de machine learning qui ont appris à reconnaitre les actions non-frauduleuses en phase d’apprentissage, sont capables de détecter beaucoup plus rapidement la fraude, quelle que soit sa nature.
En effet, grâce aux systèmes immunitaires artificiels (SIA), on n’a plus besoin de connaître en avance à quoi ressemblera la fraude exactement, mais de savoir simplement à quoi elle ne ressemble pas. Comme notre organisme reconnaît des corps étrangers, les SIA arrivent à identifier plus facilement des actions frauduleuses qui ne rentrent pas dans le schéma d’utilisation habituel comme les lieux habituels de connexion ou les séquences habituelles d’actions. Cela permet de reconnaître la séquence frauduleuse en temps réel et d’alerter le système.
Ce ne sont que deux exemples d’application parmi tant d’autres, les méthodes de Machine Learning pouvant être appliquées dans de nombreuses tâches nécessitant la reconnaissance des patterns ou la prédiction. La multiplication de données qu’on observe aujourd’hui est un grand avantage pour le développement de l’apprentissage automatique qui a besoin de « se nourrir » d’une grande quantité de données pour en déduire des modèles de comportements communs. Par extension, pour tout ce qui touche au marketing digital, cette révolution donne aux marketeurs une excellente opportunité d’appliquer ces méthodes d’apprentissage sur les données collectées pour prédire avec le plus de probabilité le comportement des consommateurs dans un futur proche. Le développement du Machine Learning va ainsi de pair avec celui du marketing prédictif.