Comprendre le deep learning – 2/3 : Fonctionnement
Après avoir abordé son histoire, nous allons décrypter le fonctionnement du deep learning. Et évoquer quelques-unes de ses applications majeures, dont celle qui nous intéresse particulièrement : le NLP.
Le deep learning, comment ça marche ?
Le deep learning, ou apprentissage profond, appartient à la grande famille de l’intelligence artificielle. Plus précisément, il constitue un sous-ensemble du machine learning, et fait appel à des types particuliers de réseaux de neurones artificiels. Il présente donc des caractéristiques similaires à ces techniques, notamment la capacité d’apprentissage de façon autonome.
Mais la différence majeure de l’apprentissage profond réside dans la structure de ses neurones, disposés en couches. À l’intérieur de chacune d’entre elles, les neurones ne sont pas interconnectés. En revanche, ils sont tous reliés à ceux des couches précédentes et suivantes. La première couche reçoit les données en entrée, et la dernière fournit le résultat en sortie. Entre les deux, les couches intermédiaires sont dites « cachées ». Dans le schéma ci-dessus, on en compte une seule (en bleu).
Et cette architecture confère des facultés spéciales. En effet, chaque couche permet une analyse de plus en plus approfondie des données d’entrée. Ainsi, le réseau établit lui-même une représentation de ce qu’il reçoit, qu’il s’agisse d’une image, d’un texte, etc. Par exemple, à partir de portraits humains, le programme va d’abord distinguer le visage des cheveux, puis reconnaître le nez, la bouche, les yeux…
L’exemple de la reconnaissance de chiffres
Pour mieux comprendre les apports de cette approche, prenons un cas d’usage réel : la reconnaissance de chiffres manuscrits. Dans les années 1980, les programmes « apprenaient » à partir d’un jeu de caractères écrits à la main. Ils déterminaient ensuite si le symbole qu’on leur présentait ressemblait à un de ceux qu’ils connaissaient. Mais pour que la méthode soit véritablement efficace, il fallait disposer de chiffres de toutes les tailles, de toutes les orientations, etc.
Finalement, on s’est aperçu qu’une technique plus fiable consistait à identifier les caractéristiques de chaque symbole, au lieu de simplement effectuer des comparaisons. Par exemple, un « 8 » serait composé de deux boucles, l’une sur l’autre, elles-mêmes constituées de courbes se rejoignant.
Avec le deep learning, le programme va non seulement privilégier cette approche, mais il va également trouver lui-même les caractéristiques pertinentes à retenir.
Les applications du deep learning
En réalité, il ne faudrait pas parler « du » deep learning, mais « des » deep learnings. Car il existe différents types de réseaux de neurones profonds, chacun étant plus ou moins adapté à des problématiques à traiter. En voici deux exemples emblématiques.
Le NLP
À l’instar d’autres plateformes conversationnelles, Clevy a recours au NLP pour dialoguer avec les utilisateurs. Ce traitement du langage naturel implique notamment de comprendre le sens des mots, d’analyser le sentiment véhiculé par l’interlocuteur, ou encore de replacer les éléments dans le contexte.
Pour cela, le NLP fait généralement appel à des réseaux de neurones dits « récurrents ». Ceux-ci permettent de conserver certains éléments d’un texte en mémoire, afin d’associer un contexte aux phrases suivantes. Associé à la linguistique, cette méthode améliore ainsi la compréhension du langage naturel.
L’analyse d’images
Par ailleurs, l’apprentissage profond peut également être employé pour le traitement d’images, par exemple pour les classer ou identifier des objets. Dans ce cas, on emploie généralement des réseaux de neurones « convolutifs ». Leur rôle est alors de repérer les caractéristiques essentielles de l’image, pour résoudre le problème posé.
De cette façon, on peut analyser des millions de photos en un rien de temps. Ce qui peut être utile dans de nombreux domaines, tels que la reconnaissance visuelle (par exemple pour les voitures autonomes, la sécurité, la médecine…)Suite et fin de cette série d’articles, avec une troisième partie dans laquelle nous allons comparer le deep learning avec le machine learning « classique ». À travers notamment deux exemples : Deep Blue et AlphaGo.