Séminaire CSLF – MSH Mondes
Interprétations artificielles
Depuis plus de 20 ans, le concept de « lecture distante » a dominé les approches sur l’analyse des grands corpus de texte (Moretti 2000). Des chercheurs ont complexifié ces approches, en multipliant les réflexions sur les apports d’une analyse massive des textes littéraires (Bode 2014, Moretti 2017, Piper 2018, Underwood 2019, Paige 2020). Mais, comme le montre un ouvrage comme Enumerations de Piper, il s’agit essentiellement de compter: ces méthodes tendent à considérer le texte comme une donnée, c’est-à-dire comme quelque chose de stable, cohérent et objectif, qu’on peut manipuler de manière mathématique. Or les théories de la lecture rendent bien compte du caractère processuel de l’expérience interprétative (Iser 1985, Eco 1989, Charles 1995, Citton 2007): ce qui importe dans la lecture d’un texte n’est pas dans le texte, mais dans la rencontre singulière d’un lecteur et d’une inscription dans un contexte précis, selon une temporalité singulière.
L’analyse massive des traces textuelles produit des connaissances intéressantes — l’augmentation de la fréquence d’utilisation d’un mot dans des ouvrages est un phénomène qu’il faut pouvoir repérer et expliquer. Mais ces analyses ne disent rien des effets locaux réels de l’interprétation de ces traces; de manière plus problématique, elles réduisent la communication lettrée précisément à la lettre, à une représentation abstraite des mots comme suite de caractères, alors que tous les aspects matériels des supports sont porteurs et producteurs de sens (Bachimont 2007), et que la lecture produit un objet dynamique, le texte lu, qui est le véritable lieu de l’interprétation.
Il s’agit d’une certaine manière d’en finir avec la lecture distante, ou du moins de repenser ses techniques traditionnelles (statistiques textuelles, topic modelling, bag of words), dans la mesure où ces pratiques relèvent d’une représentation souvent réductrice des processus de communication. Comment rendre compte de ces aspects, et tenter de les formaliser pour proposer des formes d’interprétations artificielles qui rendent justice à la complexité des objets culturels et des mécanismes herméneutiques (Romele et al. 2020, Longhi 2020)?
Nous disposons aujourd’hui d’outils qui forment de gigantesques mémoires artificielles programmables: les grands modèles de langage (LLM) et les modèles d’intelligence artificielle multimodaux, capables de traiter à la fois du texte, des images, des sons, représentent des opportunités pour créer des agents non humains d’interprétation artificielle, avec la capacité d’endosser des rôles, de produire des cadres d’interprétation multiples et dynamiques, de revenir sur leurs interprétations, de mobiliser des répertoires variés, de créer des représentations synthétiques mémorielles, de dialoguer entre eux pour former des sortes de communautés interprétatives numériques (Fish 2021) — bref, de lire selon des modèles ouverts et de générer des interprétations rendant compte de la complexité des mécanismes de lecture. Plutôt que de chercher à figer des lectures dominantes par la lecture distante, ce séminaire cherchera ainsi à réfléchir aux moyens de formaliser ces pratiques et d’ajouter des interprétations dans le monde.
Programme 2025
29 avril 2025 – 14h30 – 17h
Séance 3 – Motifs
Camille Bouzereau et Adam Faci : Les coups ont un genre. La gifle en motif dans le roman policier
Antoine Silvestre de Sacy et Dominique Legallois : Les librairies MotiveR et Pymotifs pour identifier les patrons lexico-grammaticaux significatifs (ou motifs séquentiels)
20 mars 2025 – 14h30-16h30
Séance 2 – Traitement de corpus
Antoine Bourgois : BookNLP-fr : Chaîne d’analyse computationnelle des œuvres de fiction française
Jean Barré : Approche computationnelle de la naissance du roman policier: Ressemblance de famille, répétition et sédimentation
13 février 2025 – 15h30-17h
Séance 1 – Adam Faci et Julien Schuh, Alberto Romele
Pour des interprétations artificielles
Adam Faci et Julien Schuh : Introduction – Vers une architecture d’agents IA d’interprétation littéraire
Alberto Romele: L’herméneutique numérique : non pas une discipline, mais une « ressemblance de famille »
22 mai 2025 Lecture distante (séance en cours de programmation)
10 juin 2025 Encyclopédie, attention et mémoire (Simon Bréan, Irène Langlet, Adam Faci et Julien Schuh)
2 juillet 2025 Exploration de grands corpus médiatiques avec des LLMs (Olivier Lapointe)