Les grands modèles de langage et les transformeurs
Introduction
Les inscriptions sont ouvertes! Ce semestre thématique se déroulera à Berkeley, en Californie. Nous encourageons les chercheuses et chercheurs canadiens intéressés à participer à ces ateliers (virtuellement ou en personne) pour établir des collaborations et participer à ces discussions déterminantes. Un nombre limité de bourses de voyage est disponible, faites votre demande de financement dès que possible.
IVADO vous invite à Berkeley, en Californie, pour participer à un semestre thématique organisé conjointement avec le Simons Institute for the Theory of Computing. L’objectif principal de ce rendez-vous exceptionnel est de tenter de comprendre la révolution en cours dans les transformeurs et les grands modèles de langage (LLMs) à travers un prisme large. Le semestre thématique, comprenant trois ateliers collaboratifs offerts à compter de février 2025, offre une occasion unique de collaborer et d’approfondir les échanges avec des expertes et experts de renommée mondiale, dans un cadre détendu qui facilite la discussion, le débat et la pollinisation intellectuelle croisée.
Au niveau conceptuel, les LLMs changent profondément le paysage des théories du langage humain, du cerveau et du calcul, et de la nature de l’intelligence humaine. En linguistique, ils offrent une nouvelle manière de penser la grammaire, la sémantique et la représentation conceptuelle. En neurosciences, les modèles vectoriels proposent une nouvelle approche des modèles computationnels du cerveau. En sciences cognitives, ils remettent en question nos notions sur les éléments essentiels de l’intelligence humaine.
Ce programme explorera des questions très concrètes sur les transformeurs en tant que modèles de calcul. Cela inclut des idées algorithmiques pour réduire la complexité de l’entraînement à presque linéaire par rapport à la longueur de l’entrée, ainsi que des lois d’échelle étudiant comment la perte d’entropie croisée varie avec la taille du modèle, la taille des données et la quantité de calcul. Le programme explorera également comment les lois d’échelle pourraient aider à comprendre les résultats de haut niveau tels que l’émergence de compétences complexes dans les modèles LLM.
Au niveau pratique, il est clair que les LLMs auront un impact substantiel sur la société humaine, et les questions d’alignement, de confiance et de sécurité joueront un rôle central. L’alignement fait référence à l’écart entre les valeurs humaines complexes et les mécanismes qui dirigent la prise de décision de l’IA. Les questions connexes incluent la fiabilité (comment savons-nous que le modèle fera ce qu’il est censé faire?), l’interprétabilité (pouvons-nous identifier avec certitude pourquoi un algorithme d’apprentissage automatique fournit une réponse spécifique?), la sécurité (pouvons-nous nous protéger contre les actions destructrices des algorithmes de ML ou des humains les utilisant?), la sécurité (pouvons-nous protéger les données et les systèmes contre les adversaires?), et l’équité (pouvons-nous nous protéger contre les biais?). La dimension légale et réglementaire des développements technologiques en IA, ainsi que son interaction pratique avec les capacités et la conception des grands modèles de langage, seront un autre domaine clé d’enquête.
Ce semestre thématique est la deuxième partie d’un programme spécial d’un an sur les grands modèles de langage et les transformeurs, couvrant l’année académique 2024-2025 et lancé au Simons Institute for the Theory of Computing.
Les trois ateliers prévus au printemps 2025 se dérouleront sur le campus du Simons Institute en Californie, et mettront en lumière les efforts collaboratifs entre les deux institutions. En tant que coorganisateur du semestre thématique, IVADO offre un support financier aux chercheuses et chercheurs canadiens qui assisteront aux ateliers suivants :
- LLMs, Cognitive Science, Linguistics, and Neuroscience (Lundi 3 au vendredi 7 février 2025)
- The Future of Language Models and Transformers (Lundi 24 au vendredi 28 mars 2025)
- Safety-guaranteed LLMs (Lundi 14 au vendredi 18 avril)
Coorganisation scientifique
Siva Reddy est professeur adjoint à l’École d’informatique et de linguistique de l’Université McGill. Il est également titulaire de la chaire IA CIFAR de Facebook, membre principal de la faculté de l’Institut québécois d’intelligence artificielle Mila, et scientifique de recherche chez ServiceNow Research. Ses recherches se concentrent sur l’apprentissage de représentations pour le langage qui facilite le raisonnement, la modélisation conversationnelle et la sécurité. Il a reçu le prix d’innovation en IA de VentureBeat en TAL en 2020 et un prix du meilleur article à EMNLP 2021. Avant de rejoindre McGill, il était chercheur postdoctoral à l’Université Stanford et boursier de doctorat Google à l’Université d’Édimbourg.
Reconnu mondialement comme l’un des plus grands experts en intelligence artificielle, Yoshua Bengio est surtout connu pour ses travaux précurseurs en apprentissage profond, qui lui ont valu, avec Geoff Hinton et Yann LeCun, le Prix A.M. Turing 2018, considéré comme le « prix Nobel de l’informatique ». Il est professeur titulaire à l’Université de Montréal, fondateur et directeur scientifique de Mila – Institut québécois d’IA, et codirige le programme Apprentissage automatique, apprentissage biologique de CIFAR en tant que Senior Fellow. Il est également directeur scientifique d’IVADO.
En 2019, il s’est vu décerner le prestigieux prix Killam et en 2022, il s’est classé au premier rang des informaticiens les plus cités au monde. Il est Fellow de la Royal Society de Londres et de la Société Royale du Canada, Chevalier de la Légion d’honneur en France, Officier de l’Ordre du Canada, membre du Conseil scientifique consultatif de l’ONU pour les percées de la science et de la technologie depuis 2023 et titulaire d’une chaire en IA Canada-CIFAR.
Préoccupé par l’impact social de l’IA, il a activement contribué à l’élaboration de la Déclaration de Montréal pour le développement responsable de l’intelligence artificielle et dirige le rapport scientifique international sur la sécurité de l’intelligence artificielle avancée.
Boaz Barak est professeur Gordon McKay en informatique à l’école d’ingénierie et de sciences appliquées John A. Paulson de l’Université Harvard. Ses intérêts de recherche couvrent tous les domaines de l’informatique théorique, en particulier la cryptographie et la complexité computationnelle. Auparavant, il était chercheur principal chez Microsoft Research New England, et avant cela, professeur associé (titulaire) au département d’informatique de l’Université de Princeton. Barak a remporté le prix de dissertation de l’ACM, les bourses Packard et Sloan, et a également été sélectionné pour la liste des 100 penseurs mondiaux de premier plan en 2014 par le magazine Foreign Policy. Il siège aux comités de rédaction de plusieurs revues et est également membre du Comité pour l’avancement de l’informatique théorique et du conseil d’administration de la Fondation pour la complexité computationnelle. Il a coécrit avec Sanjeev Arora le manuel « Complexité computationnelle : une approche moderne ».
Yejin Choi est professeure Wissner-Slivka et boursière MacArthur à l’école Paul G. Allen de science informatique et d’ingénierie à l’Université de Washington. Elle est également directrice principale chez AI2, supervisant le projet Mosaic, et chercheuse distinguée à l’Institut pour l’éthique en IA à l’Université d’Oxford. Ses recherches examinent si (et comment) les systèmes d’IA peuvent apprendre la connaissance et le raisonnement du sens commun, si les machines peuvent (et devraient) apprendre le raisonnement moral, ainsi que divers autres problèmes en TAL (traitement automatique des langues), IA et vision, y compris l’intégration neuro-symbolique, l’ancrage du langage avec la vision et les interactions, et l’IA pour le bien social. Elle a co-reçu 2 prix Test of Time (à ACL 2021 et ICCV 2021), 8 prix du meilleur article ou article exceptionnel (à ACL 2023, EMNLP 2023, NAACL 2022, ICML 2022, NeurIPS 2021, AAAI 2019 et ICCV 2013), le Borg Early Career Award (BECA) en 2018, le premier Alexa Prize Challenge en 2017, et a été nommée parmi les 10 à surveiller par IEEE AI en 2016.
Surbhi Goel est professeure assistante pour la chaire Magerman en Informatique et Sciences de l’Information à l’Université de Pennsylvanie. Ses intérêts de recherche se situent à l’intersection de l’informatique théorique et de l’apprentissage automatique, avec un accent sur le développement de fondations théoriques pour les paradigmes modernes d’apprentissage automatique. Auparavant, elle était chercheuse postdoctorale chez Microsoft Research NYC dans le groupe d’Apprentissage Automatique. Elle a obtenu son doctorat en Informatique à l’Université du Texas à Austin, où elle était conseillée par Adam Klivans. Parmi ses distinctions figurent le prix de thèse Bert Kay, une bourse d’études en IA de JP Morgan, et une bourse de recherche Simons-Berkeley. Elle est également cofondatrice de l’Alliance de Théorie de l’Apprentissage (LeT-All), une initiative de renforcement communautaire et de mentorat pour la communauté de la théorie de l’apprentissage.
Shafi Goldwasser est directrice de recherche pour le Pôle de Recherche sur la Résilience au Simons Institute pour la Théorie de l’Informatique, et elle est également Professeure C. Lester Hogan en Génie Électrique et Sciences Informatiques à l’UC Berkeley. Elle occupe aussi le poste de Professeure RSA en Génie Électrique et Sciences Informatiques au MIT, ainsi que professeure de sciences informatiques et de mathématiques appliquées à l’Institut Weizmann des Sciences en Israël. Goldwasser a obtenu un BS en mathématiques appliquées de l’Université Carnegie Mellon en 1979, et un MS et un PhD en informatique de l’UC Berkeley en 1984. Goldwasser a reçu le Prix Turing de l’ACM pour l’année 2012. Elle a également été lauréate du Prix Gödel en 1993 et une autre fois en 2001 pour ses travaux sur les preuves interactives et leurs liens avec l’approximation. Elle a été récompensée par le Prix Grace Murray Hopper de l’ACM (1996), le prix RSA en mathématiques (1998), le prix ACM Athena pour les femmes en informatique (2008), la Médaille Benjamin Franklin en Informatique et Science Cognitive (2010), le Prix Emanuel R. Piore de l’IEEE (2011), la Médaille de Distinction du Barnard College (2016), et le Prix Suffrage Science (2016). Elle est membre de l’AAAS, de l’ACM, de la NAE, de la NAS, de l’Académie Israélienne des Sciences, de la Société Mathématique de Londres, et de l’Académie des Sciences de Russie.
Alexander « Sasha » Rush est professeur associé à Cornell Tech. Son travail se situe à l’intersection du traitement du langage naturel et de la modélisation générative, avec des applications dans la génération de texte, l’inférence efficace et la contrôlabilité. Il a écrit plusieurs projets de logiciels libres populaires soutenant la recherche en TAL (traitement automatique du langage) et la science des données, et travaille à temps partiel en tant que chercheur chez Hugging Face. Il a été secrétaire et président général de l’ICLR et est fondateur et président de COLM. Ses travaux ont reçu des prix pour des articles et des démonstrations lors de grandes conférences sur le TAL, la visualisation et le matériel informatique, un prix de carrière NSF et une bourse Sloan. Il tweete et blogue, principalement sur la programmation et l’apprentissage automatique, sous le pseudo @srush_nlp.
Umesh V. Vazirani est directeur de recherche pour l’Informatique Quantique au Simons Institute, et il est également professeur Roger A. Strauch en génie électrique et sciences informatiques à l’Université de Californie, Berkeley, ainsi que directeur du Centre de Calcul Quantique de Berkeley. Il a obtenu son BTech en Informatique au MIT en 1981 et son PhD en Informatique à Berkeley en 1985. Les intérêts de recherche de Vazirani incluent la théorie de l’apprentissage computationnel, les algorithmes combinatoires, la théorie de la complexité computationnelle et l’informatique quantique. Il a reçu le Prix Fulkerson en 2012 (avec Sanjeev Arora et Satish Rao) pour ses travaux sur les algorithmes d’approximation pour la coupe la plus clairsemée.
Ateliers
LLMs, Cognitive Science, Linguistics, and Neuroscience
The Future of Language Models and Transformers
Safety-guaranteed LLMs
Inscription
Veuillez soumettre le formulaire d’inscription ci-dessous pour vous inscrire aux ateliers du semestre thématique “Les grands modèles de langage et les transformeurs” organisé au printemps 2025 par IVADO et le Simons Institute for the Theory of computing. Ces ateliers se tiendront à Berkeley en Californie, États-Unis.
Vous pouvez vous inscrire à un ou à tous les ateliers en utilisant le formulaire ci-dessous.
Participation en personne :
IVADO offre des bourses de voyage de $3000 CAD par atelier, proposées en priorité, aux étudiantes et étudiants au doctorat, aux chercheuses et chercheurs postdoctoraux, ainsi qu’aux chercheuses et chercheurs en début de carrière, qui résident au Canada et désirent se rendre en Californie afin de participer en personne aux ateliers. Cette initiative vise à favoriser la participation de ceux et celles qui souhaitent bénéficier de cette occasion d’échange avec des expertes et experts renommés, et d’autres pairs dans le domaine.
Il est vivement conseillé de soumettre votre candidature le plus tôt possible, le nombre de bourses disponibles étant limité. Pour postuler à la bourse de voyage, inscrivez-vous aux activités via le formulaire ci-dessous, puis soumettez une demande de bourse en cliquant ici.
Veuillez noter que dans le cas d’une participation en personne, les places seront limitées. Les sièges seront attribués sur la base du premier arrivé, premier servi. Dans le cas où l’auditorium serait complet, une salle supplémentaire sera ouverte pour que les participants puissent visionner la diffusion en direct de l’atelier.
Participation en ligne :
L’accès à la diffusion en direct de l’atelier sera envoyé par courriel aux personnes inscrites. Cette URL peut être utilisée pour un accès immédiat à la diffusion en direct et aux conférences enregistrées. Veuillez ne pas partager l’URL de la playlist jusqu’à ce que les enregistrements des conférences soient rendus publics sur SimonsTV, environ 12 à 15 jours après l’atelier.
Inscription :
Deux à trois jours après votre inscription, vous recevrez un courriel de confirmation où vous pourrez mettre à jour les détails de votre inscription à tout moment pour l’atelier ou les ateliers auxquels vous vous êtes inscrit.
Veuillez noter : l’Institut Simons prend régulièrement des photos et des vidéos des activités autour de l’Institut pour utilisation dans des vidéos, des publications et du matériel promotionnel. Les contenus produits dans le cadre de ce semestre thématique pourraient être également utilisés par IVADO.
Thématique LLM Simons
"(Nécessaire)" indique les champs obligatoires
Des questions? Contactez IVADO ici ou contactez le personnel des événements de l’Institut Simons à simonsevents@berkeley.edu.
Pour toute demande d’accommodements spécifiques, nous vous prions de bien vouloir contacter le coordinateur d’accès à simonsevents@berkeley.edu avec le plus de préavis possible.
Bourse de voyage
IVADO offre des bourses de voyage pour assister aux ateliers proposés dans le cadre de ce semestre thématique, qui se tiendront en Californie, États-Unis, sur le campus du Simons Institute for the Theory of computing. Elles sont disponibles en priorité aux étudiantes et étudiants au doctorat, aux chercheuses et chercheurs postdoctoraux ou en début de carrière, qui souhaitent assister en personne à l’un des trois ateliers en Californie. Cette opportunité vise à soutenir la participation de ceux et celles qui désirent bénéficier de cette occasion d’échange avec des expertes et experts renommés, et d’autres pairs dans le domaine.
IVADO fournira une bourse de voyage de 3000 $ CAD par atelier pour couvrir les frais de voyage et d’hébergement.
Le nombre de bourses disponibles est limité. Afin de pouvoir en bénéficier, il est fortement recommandé de vous inscrire à l’atelier de votre choix et d’effectuer la demande de financement dès que possible. Le financement est accordé sur la base de l’éligibilité et de la pertinence de votre candidature, et est disponible selon le principe du premier arrivé, premier servi, sous réserve de la disponibilité des fonds.
Veuillez noter qu’aucune demande de financement ne sera acceptée moins de deux semaines avant l’événement. Assurez-vous de compléter votre inscription et votre demande de financement bien avant cette échéance pour maximiser vos chances de recevoir un soutien.
Critères de sélection :
- Être actif(ve) dans le domaine du TAL, des LLM, et/ou des transformeurs, ou dans un domaine connexe pertinent;
- Être actuellement employé(e) ou inscrit(e) dans une université canadienne;
- Être étudiant(e) au doctorat, chercheur(euse) postdoctoral(e), ou en début de carrière (critère prioritaire, mais non excluant).
Formulaire de demande de bourse de voyage :
Thématique LLM Simons
"(Nécessaire)" indique les champs obligatoires