Séminaire en Traitement Automatique des Langues
20 mars 2026

Décrire comment l’incertitude scientifique est reformulée dans la vulgarisation scientifique. Corpus et méthodes algorithmiques.
Avec Ianis Pontier, doctorant en TAL, CRIT
Résumé
Ce séminaire doctoral commence par présenter mon parcours à savoir mes précédentes études et comment elles m’ont amenées vers ce doctorat sur l’incertitude dans le discours de vulgarisation.
L’incertitude scientifique fait partie intégrante du processus de recherche, elle comprend la présentation de résultats sous formes de probabilités mais aussi la formulation d’hypothèses, les marges d’erreur des instruments de mesures, etc. Décrire comment l’incertitude est reformulée dans les textes de vulgarisation destinés au grand public apparaît alors comme une question centrale. Cette présentation reprend les dispositifs mis en place pour tenter de répondre à cette problématique, avec une attention particulière portée sur deux points cruciaux de la recherche.Premièrement, nous évoquerons les questions méthodologiques qui encadrent ma recherche : la recherche et la construction de corpus adaptés. Deuxièmement, nous présenterons un algorithme d’appariement de phrases fondé sur l’extraction de groupes nominaux et le calcul de distance sémantique. En outre, cet exposé sera l’occasion d’évoquer un certain nombre de problématiques propres aux TAL (LLM, web-scrapping, etc.).
.
