Comme dans de nombreux autres pays, les bibliothèques françaises sont confrontées au défi fondamental de rendre plus visibles leurs collections sur le web et d’exposer les métadonnées de description afin d’en permettre la réutilisation. Pour relever pleinement ce défi, il faut transformer en profondeur les méthodes de travail et les systèmes intégrés de gestion de bibliothèques (SGB). L’objectif est de structurer les métadonnées selon le modèle conceptuel IFLA LRM et de les retranscrire dans le code de catalogage RDA-FR, qui permet de passer de la création de notices (bibliographiques et d’autorité) à la production de données organisées selon un modèle entités-relations, qui requiert la distribution des données actuelles dans de nouvelles entités reliées entre elles. Le groupe Systèmes & Données conseille et accompagne les éditeurs de SGB et les responsables en bibliothèques dans l’évolution de leur système et les alerte sur plusieurs points de vigilance.

Pour engager la Transition bibliographique dans leurs catalogues, les responsables de SGB sont encouragés à se former au modèle IFLA LRM dès à présent, à connaître les nouveaux standards internationaux et nationaux et à faire en sorte que leur SGB maîtrise et gère les identifiants pérennes et univoques indispensables pour créer des relations entre les données. Ils peuvent déjà engager des travaux préparatoires : intégrer les évolutions du format UNIMARC, aligner leurs données avec celles des agences bibliographiques et, enfin, importer et corriger leurs notices à chaque nouvelle implémentation des agences.

Accès direct aux paragraphes

1. Cible : un catalogue par entités

1.1 Vers un réseau d’entités

Le web de données vise à favoriser la publication de données structurées sur le web, non pas sous la forme de silos de données (notices d’autorité, notices bibliographiques, notices d’exemplaires) isolés les uns des autres, mais en les reliant entre elles pour constituer un réseau global d’informations. Les nouveaux SGB s’appuieront sur le modèle conceptuel IFLA LRM organisé autour d’entités (Œuvre, Expression, Manifestation, Personne, Concept…) et de relations (matérialisé par, a publié, a pour sujet, est une adaptation…). La compréhension de ce modèle générique est donc indispensable dans la phase préparatoire de conception du système informatique.

Vers une nouvelle structure des catalogues_schéma et définitions
Des entités et des relations dans les futurs SIGB : diapo extraite de la présentation de Françoise Leresche lors de la journée S&D 2019 © Transition bibliographique

Ces nouveaux SGB s’appuient sur les standards du web de données (URL, URI, RDF…). Ceux-ci facilitent la navigation par les êtres humains mais aussi le partage d’information entre machines. Cela permet d’interroger automatiquement les données, quels que soient leurs lieux de stockage, et sans avoir à les dupliquer. Les données sont librement accessibles et réutilisables. Cette nouvelle structuration des catalogues de bibliothèque est régulièrement présentée lors des journées professionnelles du groupe Systèmes & Données.

Transposition en RDF d’une entité Œuvre et de ses relations
Transposition en RDF d’une entité Œuvre et de ses relations : diapo extraite de la présentation de Françoise Leresche lors de la journée S&D 2019 © Transition bibliographique

C’est dans cette logique qu’est développé le fichier national d’entités (FNE), projet rattaché au programme Transition bibliographique. Cette future plateforme commune de production de données d’autorité va changer les circuits de catalogage en bibliothèque. En favorisant la mutualisation de la production des données, actuellement effectuée dans plusieurs bases dispersées et en en facilitant leur interconnexion, elle permettra de réduire leurs coûts de production et d’exploitation, pour le bénéfice des communautés professionnelles comme du grand public. Au lieu de dériver des notices comme aujourd’hui, puis de les modifier, les catalogueurs lieront les données produites localement au FNE, réservoir national d’entités bibliographiques. Ils-Elles pourront également participer directement, par le biais de leur institution, à la production de données dans le FNE en fournissant des descriptions d’entités (Oeuvres, Expressions, Personnes, Concepts…) et de relations entre ces entités.

Les chantiers de transformation des outils de catalogage constituent le socle pour améliorer la circulation entre les données des catalogues et leur consultation par les usagers des bibliothèques. Plusieurs expérimentations portant sur l’évolution des interfaces de consultation (OPAC) sont menées par des membres du programme national Transition bibliographique dans la logique du modèle IFLA LRM qui décline des « tâches utilisateur » en cinq objectifs :

  • trouver : rassembler des informations sur une ou plusieurs ressources présentant un intérêt en recherchant par tout critère pertinent ;
  • identifier : comprendre clairement la nature des ressources trouvées et faire la distinction entre des ressources similaires ;
  • sélectionner : déterminer l’adaptation de la ressource trouvée et choisir (en acceptant ou rejetant) des ressources spécifiques ;
  • obtenir : accéder au contenu de la ressource ;
  • explorer : situer les ressources dans un contexte et découvrir les relations qui existent entre une ressource et une autre.

1.2 Conditions requises

Dans une démarche de gestion de projet, la première étape consiste à réaliser un état de l’existant. Il s’agit de bien connaître les données de son propre catalogue, celles en provenance des agences bibliographiques tout autant que celles créées en interne, ainsi que les données mises à disposition des lecteurs à partir de sources externes au SGB (par exemple, les données exploitées par les Outils de découverte ou Discovery Tools). Si le SGB exploite déjà des identifiants pérennes et fait des liens avec des référentiels nationaux ou internationaux, alors la création des relations sera consolidée. Si le SGB utilise déjà des notices d’autorité, alors la transformation des notices actuelles (bibliographiques et d’autorité) vers une structure en entités et relations sera facilitée.  

Il est important de vérifier que le système documentaire peut interroger et exploiter les référentiels internationaux pour gérer automatiquement les évolutions. Par exemple :

Les données codées, comme il en existe dans le format UNIMARC, sont aussi contrôlées par des référentiels nationaux ou des tables locales (par exemple, la table internationale UNIMARC pour les codes de fonction, qui permet d’indiquer le rôle d’un agent par rapport à une ressource : auteur, réalisateur, compositeur, scénariste…). Ces données codées auront toute leur place dans la nouvelle structure du catalogue.

Il est nécessaire de veiller à ce que le système documentaire puisse gérer des identifiants normalisés, pérennes ou univoques. Ceux-ci peuvent être de plusieurs sortes :

  • identifiants internationaux normalisés, comme l’ISSN pour les périodiques, l’ISBN pour les monographies, l’ISNI pour les personnes et les organismes, le DOI pour les documents numériques ;
  • identifiants de l’internet comme les identifiants URI (des identifiants web commençant par http:// et élément clé de l’exposition des données sur le web) ;
  • identifiants des réservoirs de données sources, comme ARK de la BnF (inclus dans l’URL d’une notice, par exemple du Catalogue général). En permettant d’établir un lien fiable entre des données sources et des données dérivées dans un catalogue local, les mises à jour des notices postérieures à l’import sont facilitées ;
  • identifiants système, qui sont des numéros de contrôle attribués et gérés par le système informatique. En revanche, les chaînes de caractères constituant les points d’accès (auteurs notamment) ne sont le plus souvent pas univoques dans les catalogues actuels.

Par exemple, la BnF a récemment publié sa politique identifiant à travers une déclaration de principe.

2. Travaux préparatoires

2.1 Bien veiller à son UNIMARC

Avant même le lancement du programme Transition bibliographique, les éditeurs de logiciel étaient tenus de respecter la structure des formats d’autorité et bibliographiques UNIMARC ; même s’ils utilisent un format propriétaire, le respect de ce format international est indispensable pour les échanges de données et pour faciliter la migration des notices.  En France, c’est le Comité français UNIMARC qui publie les recommandations applicables dans le cadre de ces échanges de données, et notamment la création de nouvelles zones ou la mise à jour de zones existantes.

2.2 Suivre les évolutions de format et des données

Depuis 2015, les deux agences bibliographiques, Abes et BnF, ont mis en application des évolutions du format UNIMARC. Chaque implémentation se fait après une consultation auprès des éditeurs

Type d'information Zone unimarc concernée Date de diffusion Impact dans les SIGB
Adresse bibliographique​ B210 (évolution des règles de catalogage) Janvier 2015 (BnF)
Janvier 2016 (Abes)
Pas d'impact
Type de médiation, type de contenu (zone 0 ISBD) B181 et B182 (création) Janvier 2015 (Abes)
Janvier 2017 (BnF)
Zones à créer avec référentiels couplés
Type de support B183 (création) Avril 2017 (Abes) Zone à créer avec référentiel
Adresse bibliographique B219 (création provisoire) Janvier 2018 (BnF) Livraisons Abes : pas d’impact
Livraisons BnF : export simultané (210 + 219)
Attributs de l’œuvre, évolution du point d’accès B300$a (données supplémentaires)
B500 – AX30 – AX40
Janvier 2019 (Abes et BnF) Pas d’impact
Qualificatif des personnes A200 – A400 – A700
B700 – B701 – B702 (évolution des règles de catalogage)
Janvier 2019 (BnF)
Mai 2019 (Abes)
Traitement rétrospectif
Genre et forme de l’œuvre B606 (évolution des règles de catalogage)
B608 – A280 – A480 – A780
Juin 2019 (Abes et BnF) Nouveau type de notices d’autorité
Utilisation en indexation B606 et B608
Concept — Lieu A250 et A215 (changements de types d’autorité)
B606 et B607 (évolution des règles de catalogage)
Juin 2019 (BnF) Traitement rétrospectif important
Adresse bibliographique B214 (remplace B210 et B219) Janvier 2020 (Abes et BnF) Livraisons Abes : export B210 ou export B214
Livraisons BnF : export simultané (210 + 214)
Type d'information Zone unimarc concernée Date de diffusion Impact dans les SIGB
Adresse bibliographique​ B210 (évolution des règles de catalogage) Janvier 2015 (BnF)
Janvier 2016 (Abes)
Pas d'impact
Type de médiation, type de contenu (zone 0 ISBD) B181 et B182 (création) Janvier 2015 (Abes)
Janvier 2017 (BnF)
Zones à créer avec référentiels couplés
Type de support B183 (création) Avril 2017 (Abes) Zone à créer avec référentiel
Adresse bibliographique B219 (création provisoire) Janvier 2018 (BnF) Livraisons Abes : pas d’impact
Livraisons BnF : export simultané (210 + 219)
Attributs de l’œuvre, évolution du point d’accès B300$a (données supplémentaires)
B500 – AX30 – AX40
Janvier 2019 (Abes et BnF) Pas d’impact
Qualificatif des personnes A200 – A400 – A700
B700 – B701 – B702 (évolution des règles de catalogage)
Janvier 2019 (BnF)
Mai 2019 (Abes)
Traitement rétrospectif
Genre et forme de l’œuvre B606 (évolution des règles de catalogage)
B608 – A280 – A480 – A780
Juin 2019 (Abes et BnF) Nouveau type de notices d’autorité
Utilisation en indexation B606 et B608
Concept — Lieu A250 et A215 (changements de types d’autorité)
B606 et B607 (évolution des règles de catalogage)
Juin 2019 (BnF) Traitement rétrospectif important
Adresse bibliographique B214 (remplace B210 et B219) Janvier 2020 (Abes et BnF) Livraisons Abes : export B210 ou export B214
Livraisons BnF : export simultané (210 + 214)

Pour chaque nouvelle implémentation par les agences, des opérations minutieuses sont à réaliser dans les systèmes et les notices. Des conseils généraux d’implémentation sont régulièrement présentés lors des journées professionnelles du groupe Systèmes & Données.

Exemple d’implémentation pour le genre et la forme suite à la réforme RAMEAU
Exemple d’implémentation pour le genre et la forme suite à la réforme RAMEAU : : diapo extraite de la présentation de Florence Tfibel et Christelle Gianolio lors de la journée S&D 2019 © Transition bibliographique

2.3 Aligner ses données

Aligner ses données sur celles de agences est un bon moyen de suivre les évolutions du format et ses impacts sur les notices. Le groupe Systèmes & Données a mis au point un logiciel en libre téléchargement : Bibliostratus (Stratégie d’Alignement d’URIs pour la Transition bibliographique). Ce logiciel permet d’engager les opérations préalables d’alignement de sa propre base de données avec l’un des deux catalogues de la BnF ou de l’Abes. Pour chaque notice locale (bibliographique ou d’autorité), l’intérêt est de trouver son équivalent dans BnF catalogue général ou dans le Sudoc et d’en rapatrier l’identifiant unique et pérenne ARK ou PPN. Lors des imports ultérieurs, le SGB pourra ainsi plus facilement bénéficier des adaptations au modèle IFLA LRM réalisées par les agences (par exemple, récupérer les notices autorités et bibliographiques impactées par la réforme RAMEAU) et de recharger intégralement son catalogue une fois les travaux de LRMisation réalisés par les agences bibliographiques terminés. 

Avant la mise en place d’imports de notices, il peut être nécessaire d’identifier les problèmes pour lesquels il faudra apporter des correctifs par lots ou manuels :

  • assurer une bonne synchronisation des données grâce aux identifiants système (001, 003, 035) pour une mise à jour sans création de doublons, ni fusion abusive de notices ;
  • analyser l’identifiant ISNI en A010 afin de contrôler la synchronisation des données pour les personnes et les collectivités ;
  • détecter des identifiants en double dans la base pour prévenir la création de doublons de notices ;
  • respecter les traitements particuliers pour les fonds locaux.

Il faudra aussi vérifier les profils d’import :

  • pour s’assurer que les clés de dédoublonnage utilisées sont corrects ;
  • pour stocker tous les éléments de la notice récupérée, même s’ils ne sont pas exploités dans l’immédiat ni obligatoirement affichés pour le public ;
  • pour ne pas écraser de données que l’on souhaitait voir conserver.

2.4 Lier ses données

Plus le système documentaire actuel est en capacité de gérer des liens entre notices et la dérivation de notices de réservoirs externes, plus la transition vers un système d’entités et de relations sera facilitée. La bonne gestion des identifiants et des référentiels est un prérequis indispensable.

La gestion des liens concerne dans les SGB actuels les liens entre notices d’autorités et notices bibliographiques et les liens entre notices bibliographiques. Le système doit être en capacité de :

  • gérer des notices d’autorités correspondant à des points d’accès contrôlés ;
  • gérer des liens entre notices bibliographiques et notices d’autorités (gestion des points d’accès), liens entre notices bibliographiques (liens entre monographies et collections, liens entre périodiques) et liens entre notices d’autorités (entre collectivité, personnes, oeuvres, etc.)
  • établir des liens directs entre les exemplaires et les notices d’autorités (personnes, collectivités), par exemple pour des points d’accès associés aux données exemplaires (anciens possesseurs, dédicataires, etc.).

Cette gestion passe par l’utilisation de la sous-zone de contrôle $3 qui intègre les identifiants de notices d’autorités liées et qui évite l’utilisation de liens basés sur une chaîne de caractères.

Pour en savoir plus

Le groupe Systèmes & Données diffuse des recommandations pour la migration des catalogues actuels vers une nouvelle structuration de l’information bibliographique. Ses membres peuvent être sollicités pour toute demande de conseil, tant par une bibliothèque qu’un fournisseur de systèmes ou de notices.

Date de la dernière modification: 7 septembre 2021