DALL-E MINI, LE SITE QUI TRANSFORME VOS TEXTES EN IMAGES PSYCHÉDÉLIQUES

Propulsée par une IA transformant de courtes descriptions en représentations visuelles, la plateforme fait le bonheur de Twitter.

Un Pikachu steampunk, une tour Eiffel datée de l’Empire Romain, ou un Demogorgon gagnant Roland-Garros: un compte Twitter, recensant les images générées par l’intelligence artificielle Dall-E Mini (ou Craiyon), tient autant d’un paradis créatif que d’un nouveau cercle des Enfers.

C’est que le site, créé par deux programmateurs – Pedro Cuenca et Boris Dayma – offre la possibilité à ses utilisateurs de transformer en visuels de courtes descriptions. Des visuels sont générés en quelques secondes par un algorithme, avec un réalisme tantôt criant, tantôt défaillant.

Les créations affichées sur Twitter par de fiers internautes dessinent les limites de la plateforme pour le moment. Elle s’en sort mieux avec des personnages de cartoon, plus simples à représenter, ou des motifs très simples :

 

En revanche, c’est plus compliqué avec les visages et les formes complexes, souvent déformées. Les peintres les plus faciles à copier sont plutôt ceux aux lignes abstraites, comme le très peu comique Francis Bacon, que les tenants du réalisme.

Concept déjà exploité par Google

D’abord déposé sur la récente licorne Hugging Face, plateforme open source américaine qui propose des programmes de machine learning, le programme a été reposté sur un site en propre. Et rebaptisé Craiyon, pour se différencier des services proposés par OpenAI, pionnier dans le domaine avec son service Dall-E.

Ce dernier est indisponible du grand public, tout comme Imagen, l’expérience récente de Google dans le domaine. La firme de Cupertino a justifié cette indisponibilité par la nécessité d’une meilleure modération des contenus sur lesquels se base l’intelligence artificielle: étant donné qu’elle apprend des contenus qu’on lui propose sur Internet, les risques d’un dérapage politique sont grands.

L’exemple de Tray, IA développée par Microsoft et devenue haineuse en quelques heures sous l’effet du machine learning, persiste dans les mémoires. De façon moins spectaculaire, la génération d’images s’appuie sur des images stéréotypiques, et renforce donc des clichés (comme celui qui représente, par exemple, un politicien par un homme blanc).

Les créateurs de Craiyon préviennent d’ailleurs de ce risque :

“Si les capacités des modèles de génération d’images sont impressionnantes, elles peuvent également renforcer ou exacerber les préjugés sociétaux. Le modèle ayant été formé à partir de données non filtrées provenant d’Internet, il peut générer des images contenant des stéréotypes nuisibles.”

Mais malgré les risques, les modèles s’améliorent. Dans une interview donnée au média britannique i, Boris Dayma souligne que l’application progresse “semaine après semaine”. Avant que d’autres territoires soient investis sur la base de ces algorithmes.

“Il y a un aspect vidéo. Il existe déjà des prototypes de base – si vous pouvez faire des images, vous pouvez les empiler pour faire de la vidéo – mais cela va probablement s’améliorer. L’étape suivante consistera à créer des objets en 3D pour les jeux et les films.”

Google est déjà très actif sur le sujet : le groupe affiche sa volonté de créer des recherches multimodales, et de permettre à terme de rechercher n’importe quel contenu – image, son ou vidéo – sur Internet. Il a récemment recruté Boris Dayma, développeur de Craiyon, dans son programme sur le machine learning.

 

 

This article is originally published by bfmtv.com