Démystifier l’apprentissage automatique : données, puissance de traitement et logiciels libres

Cat :

 

L’apprentissage automatique qu’est-ce que c’est ?

 

L’apprentissage automatique n’est-il qu’un mot fantaisiste pour désigner la même vieille programmation informatique que nous employons depuis des décennies ? Ou bien, l’apprentissage automatique est-il un ordinateur mystique qui peut apprendre n’importe quoi ? Plus important encore, en quoi cela concerne-t-il votre entreprise ? 

La façon la plus efficace de définir l’apprentissage automatique est de le comparer à la programmation informatique traditionnelle. Dans la programmation informatique traditionnelle, on écrit des instructions spécifiques pour que l’ordinateur traite les données d’entrée qui lui sont fournies et produise une sortie. Par exemple, l’entrée peut être une demande de carte de crédit, le programme informatique est une instruction pour traiter cette demande, extraire les éléments d’information utiles, les comparer à d’autres données et produire une sortie, qui dans ce cas serait une recommandation d’accepter ou de rejeter la demande de carte de crédit.

En revanche, un programme d’apprentissage automatique n’a pas d’instruction spécifique sur les demandes de carte de crédit à accepter ou à rejeter, mais apprendrait plutôt des données d’entrée qui lui ont été fournies et améliorerait progressivement ses performances automatiquement par l’expérience. L’apprentissage automatique – un sous-ensemble de l’intelligence artificielle – améliore ses performances en analysant des quantités massives de données. Il peut modifier ses paramètres pour s’adapter aux nouvelles données qu’il reçoit et améliorer progressivement ses performances. La forme la plus simple de l’apprentissage automatique est la régression linéaire, où les paramètres sont ajustés pour s’adapter à une équation linéaire qui explique  » au mieux  » les données observées.

 

Pour quoi l’apprentissage automatique est-il possible ?

 

Il existe certaines tâches qui sont plus facilement  » programmées  » par la programmation conventionnelle, tandis que d’autres se prêtent davantage à l’apprentissage automatique. Les humains font certaines choses involontairement que nous ne pouvons pas articuler avec des mots. Par exemple, je peux vous dire comment je lace mes chaussures, mais je ne peux pas expliquer pourquoi je reconnais le visage de quelqu’un. Je le fais tout simplement. Par conséquent, il est un peu plus difficile d’écrire un programme informatique traditionnel pour identifier un visage. Cependant, je peux bombarder l’ordinateur de milliers d’images de visages accompagnées d’une photo du visage que je veux qu’il reconnaisse jusqu’à ce qu’il puisse déchiffrer la différence. La reconnaissance faciale est née.

L’apprentissage automatique est possible et populaire maintenant pour un certain nombre de raisons :

 

  • Volume de données : plus que jamais, nous avons accès à de vastes quantités de données – pas seulement des données structurées, mais aussi des données textuelles non structurées, des données audio, des images et des vidéos. Nous pouvons utiliser ces données pour construire des systèmes capables d’apprendre à partir des données.
  • Puissance de traitement : l’accélération de la technologie informatique, notamment les GPU (unités de traitement graphique) massivement parallèles et l’informatique en nuage, a rendu le traitement des grands volumes de données moins cher et plus rapide.
  • Les logiciels open source : les groupes open source axés sur le développement de programmes d’apprentissage automatique ainsi que la disponibilité de grandes données open source pour l’apprentissage accélèrent le développement de l’apprentissage automatique. Par exemple, on peut rapidement utiliser des paquets d’apprentissage automatique open source pour traiter de grands volumes de données d’images afin de reconnaître des images spécifiques. L’apprentissage automatique comporte un énorme potentiel pour la création de produits et de services significatifs. Voici quelques exemples d’apprentissage automatique à l’œuvre :

 

Les hôpitaux créent une bibliothèque d’images scannées pour détecter et diagnostiquer le cancer. Les compagnies d’assurance reconnaissent et évaluent numériquement et automatiquement les dommages causés aux voitures. Les entreprises de sécurité échangent les mots de passe tapés maladroits contre la reconnaissance vocale. Les agences gouvernementales prédisent les modèles météorologiques

L’apprentissage automatique n’est pas magique, mais il a la capacité d’aider les entreprises à développer de puissants produits et des solutions génératrices de revenus. Il ouvre une autre voie qui nous permet de comprendre les données et de faire des recommandations utiles sans nécessairement savoir exactement comment les humains résolvent les problèmes et font des recommandations. C’est aux Chief Data Scientists d’expérimenter des prototypes d’apprentissage automatique et de présenter les possibilités à leurs pairs de la C-Suite pour développer une innovation de rupture.