Infrastructures numériques pour l’histoire : connecter les archives à grande échelle
La cinquième séance du séminaire « L’œil numérique », co-animé par Laurence Danguy et Julien Schuh, sera consacrée aux infrastructures numériques permettant de connecter les collections historiques à grande échelle. Cette session explorera les enjeux techniques, institutionnels et méthodologiques liés à l’agrégation, à l’enrichissement sémantique et à la mise en relation transinstitutionnelle des archives et des médias historiques, à travers deux projets majeurs portés par le Digital Humanities Laboratory de l’EPFL : Impresso et Time Machine.
La séance se déroulera en présentiel et en visioconférence.
Lien de visioconférence : https://visio.numerique.gouv.fr/nnz-uewq-fvp
Maud Ehrmann: Au-delà des frontières : connecter les médias historiques à grande échelle avec Impresso
La numérisation de masse a profondément renouvelé la recherche historique en rendant disponibles d’importants corpus lisibles par machine, tels que les journaux et archives audiovisuelles. Si la recherche en texte intégral et l’exploration sémantique sont devenues des pratiques courantes, les collections demeurent largement fragmentées – par type de média, langue et institution – limitant les analyses transnationales et à grande échelle. Dépasser cette fragmentation exige bien davantage qu’une simple agrégation. Impresso – Media Monitoring of the Past vise à connecter les collections par la mise en relation sémantique et à garantir un accès juridiquement encadré via des interfaces conçues pour la recherche historique.
Cette présentation expose la stratégie d’Impresso pour connecter les collections médiatiques de plus de vingt institutions culturelles européennes, selon quatre dimensions : la gouvernance des données, conciliant accès transnational et respect du droit d’auteur, dans un contexte marqué par les enjeux liés à l’intelligence artificielle et à la réutilisation des données ; l’interopérabilité, nécessaire au traitement de collections hétérogènes à grande échelle ; l’enrichissement et l’interconnexion sémantiques, opérés à travers langues et modalités au sein d’un espace de représentation multilingue partagé ; et la conception d’interfaces dédiées, allant de l’exploration des sources via l’Impresso WebApp à l’accès programmatique via le Datalab. Ces efforts définissent un cadre d’intégration alliant enrichissement sémantique et gouvernance des données, pour un accès transinstitutionnel, un traitement multilingue et multimodal, et des interfaces adaptées aux besoins de la recherche.
Maud Ehrmann est collaboratrice scientifique au Digital Humanities Laboratory de l’École Polytechnique Fédérale de Lausanne (EPFL). Elle travaille sur Impresso, un projet interdisciplinaire autour de l’enrichissement sémantique et l’exploration des médias historiques et est co-responsable des campagnes d’évaluation HIPE sur le traitement de documents historiques.
Frederic Kaplan : Time Machine 2012-2032
Cet exposé revient sur les principales étapes de la construction du projet Time Machine, initié en 2012 et planifié jusqu’en 2032. Depuis la constitution du premier prototype sur la ville de Venise jusqu’à son extension, via la Time Machine Organisation, à une centaine de villes européennes, il s’agira d’interroger non seulement l’évolution des technologies permettant d’aligner les documents historiques dans le temps et dans l’espace, mais aussi les structures collectives et financières qui rendent possible la construction d’une telle infrastructure comme bien commun. Après avoir présenté les principales interfaces qui permettent aujourd’hui d’accéder à l’ensemble des données du projet, l’exposé dressera une feuille de route pour les prochaines années, notamment en termes d’applications verticales dédiées à la recherche en histoire et en histoire de l’art.
Frédéric Kaplan est professeur associé en digital humanities à l’École Polytechnique Fédérale de Lausanne (EPFL), où il dirige le Digital Humanities Laboratory. Il est également président de la Time Machine Organisation, une initiative européenne visant à construire une infrastructure géohistorique permettant de naviguer dans le passé des villes à partir de données massives issues des archives et des bibliothèques.

Présentation du livre par Eliane-Esther Bots, expérience d’écoute des pistes audio, discussion autour de l’objet lui-même et du projet de transmission et de traduction des témoignages. Passer du film au livre, articuler les récits et les images, traduire les matériaux d’origine en anglais, faire intervenir les voix et le son en accompagnement d’un livre…
Échange entre Eliane-Esther Bots et Alma Imamovic-Ivanov, interprète auprès du TPIY qui témoigne de son expérience.



