Eco‑responsible  images

Image compression reduces page weight and loading times.

Read more about it

Search in
Séminaire Humanités numériques (DH) Actualités formations

PDEN école doctorale - Philologie computationnelle: au delà de l’encodage du texte

Une école doctorale pour aborder la question des modèles de langue, ces modélisations statistiques de la distribution des mots, qui sont au cœur de la linguistique computationnelle actuelle.

Published on 28 Oct 2021
Place
Géopolis, Genève
Format
On site

Philologie computationnelle: au delà de l’encodage du texte

Jeudi 2 et vendredi 3 décembre 2021

Organisation: Benedetta Salvati (doctorante à l’UniL), Aude Sartenar (doctorante à l’UniGE) et Simon Gabay (maître-assistant à l’UniGE)

Nous nous proposons, à l’aide de spécialistes de linguistique computationnelle, de présenter l’état de la recherche ainsi que les derniers outils en cours de développement. L’accent sera mis sur le français pré-orthographique, avec un intérêt particulier pour le français moyen et moderne (1400-1700). L’absence de stabilité du système graphique à ces époques est à la fois un véritable obstacle à l’étude de ces états de la langue, jusqu’à présent très délaissés par la recherche, mais aussi des objets d’études particulièrement riches pour les approches computationnelles. Nous aborderons ainsi la question des modèles de langue, ces modélisations statistiques de la distribution des mots, qui sont au cœur de la linguistique computationnelle actuelle.

Ces modèles sont utilisés dans une multitude de tâches de TAL, dont trois ont été identifiées comme particulièrement utiles pour les philologues: 

  1. L’analyse du changement linguistique, et notamment d’un lexique, en diachronie: quels mots apparaissent, quels mots disparaissent?
  2. La reconnaissance des entités nommées, et notamment les noms de lieux: il est ainsi possible de produire des cartes qui permettent la «lecture distante», si plébiscitée en humanités numériques.
  3. La normalisation linguistique automatique: comment transformer des transcriptions diplomatiques (eſtoit) en transcriptions interprétatives (estoit) ou normalisées (était)?

 

 

Par


Organization

Useful links and documents

View more events