Une école doctorale pour aborder la question des modèles de langue, ces modélisations statistiques de la distribution des mots, qui sont au cœur de la linguistique computationnelle actuelle.
Philologie computationnelle: au delà de l’encodage du texte
Jeudi 2 et vendredi 3 décembre 2021
Organisation: Benedetta Salvati (doctorante à l’UniL), Aude Sartenar (doctorante à l’UniGE) et Simon Gabay (maître-assistant à l’UniGE)
Nous nous proposons, à l’aide de spécialistes de linguistique computationnelle, de présenter l’état de la recherche ainsi que les derniers outils en cours de développement. L’accent sera mis sur le français pré-orthographique, avec un intérêt particulier pour le français moyen et moderne (1400-1700). L’absence de stabilité du système graphique à ces époques est à la fois un véritable obstacle à l’étude de ces états de la langue, jusqu’à présent très délaissés par la recherche, mais aussi des objets d’études particulièrement riches pour les approches computationnelles. Nous aborderons ainsi la question des modèles de langue, ces modélisations statistiques de la distribution des mots, qui sont au cœur de la linguistique computationnelle actuelle.
Ces modèles sont utilisés dans une multitude de tâches de TAL, dont trois ont été identifiées comme particulièrement utiles pour les philologues: