Enjeux techniques, juridiques et scientifiques
Journée d’études organisée en partenariat avec la Maison des sciences de l’homme de Dijon, le Consortium ArcMC et Huma Num
Cette journée a pour objectif d’aborder les différents questionnements qui sous-tendent la création de corpus numériques à partir de documents imprimés et d’archives d’organisations (brochures, revues et archives politiques).
Introduction
La journée a débuté par les mots d’accueil de Francis Aubert, directeur de la MSH de Dijon, qui a présenté les enjeux de la chaîne de traitement mise en place à la Maison des Sciences de l’Homme pour la création de corpus numériques, en rappelant que ce travail s’insère bien dans la mission d’éclairer les enjeux du présent par les techniques et ressources d’aujourd’hui et le recul scientifique. Michel Maso, directeur de la Fondation Gabriel Péri a rappelé la genèse du partenariat entre la fondation et la MSH. Il a ensuite souligné l’intérêt porté par la fondation pour la conservation des revues qui, au-delà de la valeur parfois presque sentimentale, représente un véritable enjeu patrimonial et scientifique. Enfin Serge Wolikow, coordinateur scientifique du consortium, a souligné l’importance de penser l’archivage des mondes contemporains pour les données déjà constituées mais aussi en sachant anticiper pour l’organisation des archives de demain.
Table ronde 1 : Expériences acquises à la MSH de Dijon : constitution de corpus numériques.
Cette première table ronde modérée par Françoise Blum a permis de présenter étape par étape la chaîne de traitement de constitution de corpus numériques.
Serge Wolikow a insisté sur l’ambivalence du terme corpus qui peut désigner à la fois un ensemble de données rassemblées à l’occasion de travaux de recherches ou constituées pour leur exploitation future, et qui représentent dans ce sens un ensemble évolutif structuré de données documentaires numériques et/ou numérisées, décrites de façon systématique par des métadonnées permettant leur valorisation (consultation, interrogation, moissonnage, édition).
Ensuite Agnès Viola, documentaliste au Service de Documentation et Archives Scientifique de la MSH de Dijon a évoqué le choix et la méthode de description des brochures.
Hédi Maazaoui, responsable de la numérisation à la MSH a ensuite rappelé les principales étapes du développement du Service de Numérisation et de Base de Données puis a ensuite présenté les préconisations sur lesquelles celui-ci s’appuie en ce qui concerne les fichiers de données notamment pour les choix de formats de conservation et de consultation.
Enfin Céline Alazard, archiviste au Service de Documentation et Archives Scientifique a présenté PANDOR (Portail Archives Numériques et Données de la Recherche), le portail de publication de la MSH, en montrant à partir de requêtes les différentes manières d’interroger les données via les instrument de recherche, pour aller à la notice et parfois même jusqu’au document.
Table ronde 2 : Mise en ligne : conception de la publication : enjeux institutionnels et juridiques.
À l’occasion de cette table ronde, deux portails donnant accès à des ressources documentaires et/ou archivistiques ont été présentés.
Le premier, par Tatiana Sagatni, est celui de l’association Génériques, partenaire du Consortium ArcMC. Son portail Odysseo permet de localiser les ressources sur l’histoire de l’immigration de 1800 à nos jours, conservées dans divers lieux et de consulter des documents numérisés.
Françoise Blum, chercheuse et membre active du consortium a ensuite présenté le Social History Portal qui est le résultat d’un travail collectif international dans le cadre d’un programme européen “Heritage of the People’s Europe” (HOPE) entre 2010-2013 auquel la MSH de Dijon a été associé. Ce portail désormais en ligne mais encore en « working-progress » donne accès aux collections numérisées de 13 institutions européennes spécialisées en histoire sociale. Il contribue aussi à la réflexion et à mise en œuvre d’un guide de pratiques de publication de documents numérisés à travers la création d’un wiki.
Enfin, Éric Heilmann, à partir de l’exemple des illustrations du programme de la journée, a rappelé et explicité plusieurs références législatives du code de la propriété intellectuelle en soulignant l’écart pas forcément prohibitif entre les règles et la pratique. En matière de mise en ligne, les initiatives prises dans les faits peuvent contribuer à faire évoluer le cadre juridique préexistant.
Table ronde 3 : Usages scientifiques et culturels des corpus numériques des revues
La première table ronde de l’après-midi a débuté avec l’intervention de Claude Saligny, maquettiste de plusieurs revues, qui par un retour d’expérience à mis en valeur le besoin de « sauvegarder la mémoire du présent » à l’heure où de plus en plus sont nativement et uniquement numérique.
Ensuite Alain Bertho, ancien rédacteur en chef de la revue Société Française, chercheur et actuel directeur de la MSH Paris Nord, a dressé un historique critique du parcours de la revue.
Anne Jollet, directrice des Cahiers d’histoire a de son côté insisté sur les domaines et l’évolution des choix éditoriaux de sa revue.
Ces deux interventions ont souligné l’intérêt de disposer d’outils numériques pour interroger les collections dans leur intégralité. Ce travail réalisé à la MSH de Dijon rend possible l’émergence de nouveaux projets de recherche à la fois historiques (sur les recherches marxistes dans le domaine de l’histoire) et épistémologiques (historiographie de la recherche sur le mouvement ouvrier) en offrant la possibilité d’accéder à un ensemble original d’articles qui sont à la fois scientifiques et militants mais aussi interdisciplinaires sur les nouveaux terrains de la connaissance historique.
Archives des revues consultables en ligne sur PANDOR (en cliquant sur les liens suivants)
Table ronde 4 : Valorisation des nouveaux corpus
Isabelle Lassignardie et Vincent Chambarlhac ont pris en premier la parole pour évoquer le fonds de la Bibliothèque Marxiste de Paris qui n’est aujourd’hui plus alimentée mais en cours de traitement archivistique et documentaire. Le travail sur les brochures et leur numérisation alimentent la réflexion sur l’imprimé et son rôle politique depuis le XVIIIe s. On peut penser ainsi la sérialité des brochures, cartographier les lieux d’impression, constituer un corpus permettant d’interroger l’ensemble et de croiser la diversité des éditions.
Par-delà la valorisation scientifique le data-mining est de plus en plus en usage pour explorer des données pour le grand public comme l’a souligné Laurent Gautier, médiateur de la discussion.
Fonds consultables en ligne sur le portail PANDOR : Catalogue des brochures de la Bibliothèque Marxiste de Paris (BMP)
Julien Hage est ensuite revenu, sur la base de son expérience sur le fonds Patrick Kessel, sur les catégories de l’éphémère, en indiquant que le travail sur les brochures permet de faire remonter un territoire complètement inconnu, une littérature du quotidien et du militantisme. Il a évoqué les lignes de forces dans cet ensemble de brochures. Celles en particulier qui concernent la Guerre d’Algérie, la période d’avant et mai 68.
Fonds consultables en ligne sur le portail PANDOR : Fonds des archives de Patrick Kessel
Jean Vigreux a présenté les premiers résultats du programme de recherche Paprik@2F qui s’est fixé comme horizon la mise en place d’un portail qui prendra en considération toutes les archives concernant le communisme français de 1917 à 1947, en s’appuyant sur les archives de l’Internationale communiste mais aussi sur les archives de l’État en France, concernant le contrôle et la répression du communisme (par exemple aux Archives Nationales, l’inventaire de la série Z4 sur la répression des menées anarchistes et communistes pendant la guerre). Après 10 mois de travail, plusieurs tâches ont déjà été effectuées comme la cartographie d’INCOMKA dont le toilettage de la base de données et la reprise de l’indexation sont actuellement en cours.
Carnet hypothèses du programme ANR : paprik@2f
Jean-Numa Ducange a évoqué le programme concernant la publication numérique des traductions de Marx et Engels. Le travail engagé depuis plusieurs années a aujourd’hui débouché sur l’élaboration et la publication de 60 volumes d’avant 1914 des œuvres de Marx et Engels. Il a ensuite souligné plusieurs perspectives de recherches ainsi ouvertes (« citomanie » de Marx et Engels, le rôle des médiateurs (traducteurs, diffuseurs, préfaciers, etc.) dans la diffusion des œuvres et leurs parcours au sein du mouvement social et ouvrier….).
Fonds consultables en ligne sur le portail PANDOR : Grande Édition Marx et Engels
Enfin Michel Rogalski a évoqué la revue Recherches internationales dont les archives ne sont pas encore numérisées, mais ont été déposé à la MSH de Dijon. Il est revenu sur le projet éditorial de la revue et a souligné en particulier l’intérêt pour une revue de voir ses archives numérisées.