Motifs
Troisième séance du séminaire organisé conjointement par le CSLF et la MSH Mondes “Interprétations artificielles”
La troisième séance du séminaire “Interprétations artificielles”, organisé conjointement par le CSLF et la MSH Mondes, aura lieu le 29 avril 2025, de 14h30 à 17h, en hybride à l’Université Paris Nanterre (bâtiment Ginouvès, Salle des conseils, 4e étage) et en visioconférence (lien ci-dessous).
Lien de visioconférence
Séminaire CSLF x MSH Mondes “Interprétations artificielles”
29 avr. 2025 02:30 PM Paris
https://cnrs.zoom.us/j/96060632758?pwd=GM2aFVjbHJXD33NrskueXsUHOMkUXH.1
ID de réunion: 960 6063 2758
Code secret: jxpE7B
Motifs
Camille Bouzereau et Adam Faci : Les coups ont un genre. La gifle en motif dans le roman policier
Cette recherche s’inscrit dans le cadre de l’ANR POLARisation qui décrit les romans policiers publiés en France de 1945 à 1989. Nous intégrons ce projet, dans une perspective d’analyse de données textuelles pour décrire les dimensions politiques du roman policier, avec un corpus considérable (3015 romans). Dans le roman policier, les corps sont souvent maltraités, retrouvés morts, décomposés, tuméfiés. Dans ce cadre, nous avons décidé de nous focaliser sur une scène stéréotypée du genre : à savoir les scènes de gifles. Nous présentons ici un sous-corpus constitué de 5000 occurrences dans le but de repérer des motifs lexico-grammaticaux construits autour du mot gifle et des schémas narratifs sexistes récurrents.
Camille Bouzereau est chercheuse postdoctorale de l’ANR Polarisation, Université Paris Nanterre.
Adam Faci est postdoctorant à l’IR* Huma-Num sur l’usage des LLMs en SHS.
Antoine Silvestre de Sacy et Dominique Legallois : Les librairies MotiveR et Pymotifs pour identifier les patrons lexico-grammaticaux significatifs (ou motifs séquentiels)
Longtemps, les objectifs de la stylométrie ont été la recherche de l’identité de l’auteur d’un texte, ou bien la datation de textes, ou encore le calcul de la similarité (généralement lexicale) entre plusieurs textes. On pourrait parler pour qualifier ces approches de « stylométrie sans stylistique » dans la mesure où les études visaient à répondre à une question (par exemple : entre ces 10 auteurs, qui a écrit le texte X ?) sans apporter une analyse autre que quantitative sur les formes discriminantes. Désormais, la stylométrie développe des approches prenant également en compte le style d’auteur ou de genre textuel, en identifiant non plus seulement des unités discrètes et simples, mais aussi des patrons syntaxiques qui demandent des techniques complexes d’extraction. Une fois extraits, ces patrons peuvent être analysés et commentés dans une visée stylistique des textes, ou dans des analyses de genres accordant à la syntaxe un poids important dans la description. Une stylistique de corpus peut ainsi être développée : elle conserve la rigueur et le degré de précision de la stylistique traditionnelle, tout en s’appuyant sur de grandes données quantifiées.
Nous présenterons deux outils dédiés à la stylistique de corpus : MotiveR et PyMotifs. Ces outils ont été conçus pour le français mais peuvent être facilement adaptés à d’autres langues. Ils ont pour fonction d’identifier de façon semi-supervisée dans les textes, non pas des lexèmes ou des segments répétés, mais des motifs lexicaux-grammaticaux caractéristiques : des motifs séquentiels. Après avoir expliqué ce qu’est un motif séquentiel, nous présenterons les différentes fonctions offertes par ces librairies et ses potentialités d’interopérabilité avec d’autres traitements.
Antoine Silvestre de Sacy est doctorant à l’université Paris 3 sous la direction de Dominique Legallois et Alexandre Gefen et chercheur associé à la BnF. Ses travaux portent sur l’analyse de corpus romanesques à grande échelle et la détection de filiations stylistiques. Après avoir été ingénieur pendant 5 ans au CNRS à l’infrastructure Huma-Num, il est aujourd’hui datascientist au ministère de l’Economie et des Finances.
Dominique Legallois est professeur en linguistique française à l’Université Sorbonne Nouvelle. Il est membre du laboratoire CNRS Lattice, dont il est le directeur adjoint. Ces travaux portent sur la sémantique grammaticale, notamment la transitivité (dans le cadre de la Grammaire des constructions et la linguistique cognitive), sur l’expressivité (et l’interface sémantique / pragmatique), sur la sémantique lexicale (noms sous spécifiés) et sur la linguistique textuelle. Il s’intéresse aux humanités numériques littéraires et notamment à la stylistique outillée. Dans ce cadre, il développe des analyses informatisées pour distinguer des « motifs », c’est-à-dire des patrons lexico-grammaticaux caractéristiques de genres textuels ou d’auteurs.