Does ChatGPT Think in English? On the Multilingual Internal Representation of Large Language Models
Vendredi 12 juillet 2024, 10h00-12h00
Conférence avec Clément Dumas (ENS Paris Sarclay), Veniamin Veselovsky (EPFL) et Jessica Brown (Université de Lausanne /Yale University)
Les grands modèles de langage (LLMs), tels que ChatGPT, sont utilisés mondialement, y compris par des non-anglophones. Cependant, leurs données d'entraînement sont largement dominées par l'anglais (80%+). Cette prédominance signifie que les LLMs n'ont peut-être pas été exposés à suffisamment de données non anglophones pour saisir les nuances présentes dans ces langues. Néanmoins, ils parviennent à produire des réponses cohérentes dans de nombreuses langues sous représentées. Cela soulève d'importantes questions sur la façon dont les LLMs généralisent d'une langue à l'autre et sur de potentielles subtiles influences de la domination de l'anglais:
-
- L'anglais est-il la "lingua franca" de ces modèles ?
- Les LLMs représentent-ils des concepts en anglais ?
- Les LLMs développent-ils des "accents sémantiques" lorsqu'ils génèrent du contenu dans d'autres langues ?
En utilisant des progrès récents en interprétabilité mécanistique, dont l'objectif est de comprendre les modèles en examinant leur structure interne, nous esquissons un début de réponse pour ces trois questions, suggérant que les modèles sont effectivement biaisés par l'anglais.
La linguistique à l'école secondaire: atelier d'initiation à l'attention des enseignants.
Mardi 25 juin 2024, 13h30-15h30, Villanova, Unil.
Intervenants : Daria Zalesskaya (SLAS), Samuel Meyer (SLI/ASA) et Charlotte Vidal Kränzlin (Les Olympiades de linguistique, Berne)
Les deux ateliers « La linguistique, entre logique et intuition » et « Créer une langue », développés par des membres du CLSL pour les élèves du secondaire 2 sont présentés aux enseignants de langues et mathématiques des degrés concernés, et discutés avec l’équipe pédagogique du Laboratoire sciences et société (L’Eprouvette) et avec la représentante des Olympiades de linguistiques, qui se tiennent en Suisse romande chaque année.
L'évaluation des pratiques journalistiques face aux défis de la désinformation
Vendredi 17 mai 2024, 12h30-15h00, Anthropole 3128.
Intervenants : Jaqueline Dalton et Nicki Bailey, Fondation Hirondelle, Lausanne.
Cette rencontre avec les étudiants du séminaire « Ethnographie des pratiques journalistiques » et toutes personnes intéressées par les enjeux linguistique de la recherche sur les médias, vise à présenter les pratiques éditoriales qui guident les médias radiophoniques déployés dans des régions en crise. Elle invite à une réflexion sur les normes linguistiques, dans un environnement professionnel souvent plurilingue, qui doivent être prises en compte dans le processus de production et de circulation de l’information sur les canaux de communication numériques.