Dernières Infos

Un monde où les IA développeront des découvertes scientifiques

Credit: Pixabay/CC0 Public Domain

Les scientifiques commencent à développer l’IA pour la découverte scientifique en utilisant la technologie du ChatGPT. Une équipe internationale de scientifiques, notamment de l’université de Cambridge, a lancé une nouvelle collaboration de recherche qui s’appuiera sur la même technologie que ChatGPT pour développer un outil de découverte scientifique alimenté par l’IA.

Alors que ChatGPT traite des mots et des phrases, l’IA de l’équipe apprendra à partir de données numériques et de simulations physiques provenant de différents domaines scientifiques, afin d’aider les scientifiques à tout modéliser, des étoiles supergéantes au climat de la Terre.

L’équipe a lancé cette initiative, appelée « Polymathic AI », en début de semaine, parallèlement à la publication d’une série d’articles connexes sur le référentiel en libre accès arXiv.

« Cela va complètement changer la façon dont les gens utilisent l’IA et l’apprentissage automatique dans la science », a déclaré Shirley Ho, chercheuse principale de Polymathic AI et chef de groupe au Center for Computational Astrophysics de l’Institut Flatiron, à New York.

L’idée qui sous-tend l’IA polymathique « est similaire à la façon dont il est plus facile d’apprendre une nouvelle langue lorsque l’on en connaît déjà cinq », a déclaré Mme Ho.

Commencer par un grand modèle pré-entraîné, connu sous le nom de modèle de base, peut être à la fois plus rapide et plus précis que de construire un modèle scientifique à partir de zéro. Cela peut être vrai même si les données d’entraînement ne sont pas manifestement pertinentes pour le problème en question.

« Il a été difficile de mener des recherches universitaires sur des modèles de fondations à l’échelle réelle en raison de l’ampleur de la puissance de calcul requise », a déclaré Miles Cranmer, cochercheur au département de mathématiques appliquées et de physique théorique et à l’institut d’astronomie de Cambridge. « Notre collaboration avec la Fondation Simons nous a fourni des ressources uniques pour commencer à prototyper ces modèles destinés à la science fondamentale, sur lesquels les chercheurs du monde entier pourront s’appuyer – c’est passionnant. »

« L’IA polymathique peut nous montrer des points communs et des connexions entre différents domaines qui auraient pu nous échapper », a déclaré le co-investigateur Siavash Golkar, chercheur invité au Centre d’astrophysique computationnelle de l’Institut Flatiron.

« Au cours des siècles précédents, certains des scientifiques les plus influents étaient des polymathes ayant une connaissance approfondie de différents domaines. Cela leur permettait d’établir des liens qui les aidaient à trouver l’inspiration pour leurs travaux. Chaque domaine scientifique devenant de plus en plus spécialisé, il est de plus en plus difficile de rester à la pointe de plusieurs domaines. Je pense que c’est là que l’IA peut nous aider en regroupant des informations provenant de nombreuses disciplines.

L’équipe Polymathic AI comprend des chercheurs de la Simons Foundation et de son Flatiron Institute, de l’université de New York, de l’université de Cambridge, de l’université de Princeton et du Lawrence Berkeley National Laboratory. L’équipe comprend des experts en physique, en astrophysique, en mathématiques, en intelligence artificielle et en neurosciences.

Les scientifiques ont déjà utilisé des outils d’intelligence artificielle, mais ils ont surtout été conçus à des fins spécifiques et formés à partir de données pertinentes.

« Malgré les progrès rapides de l’apprentissage automatique ces dernières années dans divers domaines scientifiques, dans presque tous les cas, les solutions d’apprentissage automatique sont développées pour des cas d’utilisation spécifiques et formées sur des données très spécifiques », a déclaré le co-investigateur François Lanusse, cosmologiste au Centre national de la recherche scientifique (CNRS) en France.

« Cela crée des frontières à la fois au sein des disciplines et entre elles, ce qui signifie que les scientifiques qui utilisent l’IA pour leurs recherches ne bénéficient pas d’informations qui peuvent exister, mais dans un format différent, ou dans un domaine entièrement différent. »

Le projet de Polymathic AI s’appuiera sur des données provenant de diverses sources dans les domaines de la physique et de l’astrophysique (et éventuellement de la chimie et de la génomique, selon ses créateurs) et appliquera ce savoir-faire multidisciplinaire à un large éventail de problèmes scientifiques. Le projet « reliera de nombreux sous-domaines apparemment disparates en quelque chose de plus grand que la somme de leurs parties », a déclaré Mariel Pettee, membre du projet et chercheuse postdoctorale au Lawrence Berkeley National Laboratory.

« Il est difficile de savoir jusqu’où nous pouvons faire ces sauts entre les disciplines », a déclaré M. Ho. « C’est ce que nous voulons faire, essayer d’y parvenir.

ChatGPT a des limites bien connues en matière de précision (par exemple, le chatbot dit que 2 023 fois 1 234 font 2 497 582 au lieu de la réponse correcte de 2 496 382). Le projet de Polymathic AI évitera bon nombre de ces écueils, a expliqué M. Ho, en traitant les nombres comme de véritables nombres, et non comme de simples caractères au même titre que les lettres et la ponctuation. Les données d’entraînement utiliseront également de véritables ensembles de données scientifiques qui rendent compte de la physique sous-jacente au cosmos.

La transparence et l’ouverture constituent une part importante du projet, a déclaré M. Ho. « Nous voulons tout rendre public. Nous voulons démocratiser l’IA pour la science de telle sorte que, dans quelques années, nous serons en mesure de fournir à la communauté un modèle pré-entraîné qui pourra aider à améliorer les analyses scientifiques dans une grande variété de problèmes et de domaines. »

Adaptation Terra Projects

Source : https://techxplore.com/

(103)

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.