Dernières Infos

Un chercheur affirme qu’une IA génératrice d’images a inventé son propre langage

Image by Getty/Futurism

Selon Giannis Daras, ingénieur en informatique à l’Université du Texas à Austin, l’époustouflant système d’IA de conversion de texte en image d’OpenAI, appelé DALL-E2, semble avoir créé son propre langage écrit.

DALL-E2 a fait grand bruit au début de l’année grâce à son étonnante capacité à transformer des invites textuelles en images photoréalistes, voire artistiques. Il semblerait maintenant qu’il soit encore plus puissant et mystérieux que nous le pensions, capable de générer son propre code secret.

Par exemple, a écrit M. Daras dans un fil Twitter viral, demander à l’algorithme de générer une image de « fermiers parlant de légumes » génère un texte avec le mot inconnu « vicootes ». Mais si vous entrez le mot « vicootes » dans l’algorithme, il génère des images de légumes.

Ce qui est encore plus étrange, ajoute M. Daras, c’est que l’image des agriculteurs contenait le texte apparemment absurde « poploe vesrreaitars ». Introduisez-le dans le système, et vous obtenez un tas d’images d’oiseaux.

« Il semble que les agriculteurs parlent des oiseaux qui s’attaquent à leurs légumes ! » écrit Daras.

Dans un nouvel article rédigé avec un collègue et qui n’a pas encore fait l’objet d’un examen par des pairs, M. Daras affirme que cette IA avancée génératrice d’images semble avoir généré un « vocabulaire caché » sous-jacent ou parallèle à sa fonction principale – un autre exemple, peut-être, de la difficulté d’expliquer le fonctionnement de l’IA avancée.

« DALLE-2 a un langage secret », écrit Daras, ajoutant plus tard que la « découverte du langage DALLE-2 crée de nombreux défis intéressants en matière de sécurité et d’interprétabilité. »

Il convient de noter que les conclusions de Daras sont encore quelque peu ténues. Comme il le note dans son article, les résultats ne sont pas cohérents à 100 %. Parfois, l’invite « Contarra ccetnxniams luryca tanniounons » génère des images d’insectes, alors que d’autres fois, elle génère des images « principalement d’animaux ».

Tout le monde n’est pas non plus convaincu par la théorie de Daras.

« Ma meilleure supposition ? » a soutenu l’analyste de recherche Benjamin Hilton. « C’est un hasard. Ou juste peut-être (si vous me pressez vraiment) ‘Apoploe vesrreaitais’ ressemble à un nom binomial pour certains oiseaux ou insectes. »

« Pour moi, tout cela commence à ressembler beaucoup plus à un bruit stochastique et aléatoire qu’à un langage secret de DALL-E », a ajouté Hilton.

Une autre possibilité est que nous nous préparions beaucoup trop loin, en découvrant la capacité du système d’IA à créer des raccourcis en transformant les images en code, comme le souligne Vice.

Il va sans dire qu’il sera intéressant de voir la communauté des chercheurs examiner de plus près les affirmations de M. Daras.

Si elles sont acceptées, nous pourrions assister à un nouveau développement fascinant dans le domaine – ou, peut-être, lui accordons-nous beaucoup trop de crédit et lisons-nous un peu trop entre les lignes.

Adaptation Terra Projects

source : https://futurism.com/

(115)

Laissez un message

%d blogueurs aiment cette page :