Accueil » Actualités » Notice bibliographique ou manifestation ? Notice d’autorité titre ou oeuvre ?

Notice bibliographique ou manifestation ? Notice d’autorité titre ou oeuvre ?

La Transition bibliographique, on en parle depuis quelques années, on l’attend et on l’annonce, on se demande ce qu’il faudrait faire pour s’y préparer – et on en oublie parfois qu’en réalité, elle est déjà en cours. Mais comme il n’y aura pas de grand soir catalographique, il faut donc identifier les différents signes, les pas qui nous y font progresser, ces petites évolutions successives dans les données de nos catalogues.

Parmi ces signes, ces pas successifs, pour la BnF une étape particulièrement importante, à la fois au niveau symbolique et à un niveau très concret, a été franchie il y a quelques mois en enrichissant massivement plusieurs milliers de notices bibliographiques du catalogue de la BnF, avec des informations venues de data.bnf.fr.

Techniquement, des liens ont été générés entre des notices bibliographiques et des notices d’autorité Titre. Dit comme ça, ça ne semble pas forcément très innovant…

Image1

Si on reprend les concepts du modèle FRBR, ce sont plus de 150.000 liens entre manifestations et oeuvres qui ont ainsi été créés.

Le contexte

Depuis 2011, la plate-forme data.bnf.fr est un outil d’expérimentation des technologies du web sémantique pour tester la modélisation en FRBR et l’exposition des données en RDF.

Les (méta)données sources sont celles pré-existantes dans les bases de production de la BnF, à savoir prioritairement le catalogue général et BnF Archives et manuscrits.

Dans le catalogue général, on trouve notamment 13 millions de notices bibliographiques (le niveau Manifestation du modèle FRBR) et 250.000 notices d’autorité Titre, créées pour les besoins du catalogue :

  • identifier correctement les oeuvres musicales et les classiques de l’Antiquité et du Moyen âge. Dans ces cas-là, le catalogueur qui décrit l’édition d’une de ces oeuvres ajoute manuellement un lien depuis la notice bibliographique vers la notice d’autorité Titre.
  • indexer les documents qui parlent d’une oeuvre. Ces notices d’autorité Titre ont été créées à des fins d’indexation (une étude sur Les Misérables, ou sur le Da Vinci Code) – mais un grand nombre des œuvres ainsi décrites sont aussi présentes dans les collections de la BnF. Sauf qu’ajouter un lien entre une édition des Misérables (ou du Da Vinci Code) et la notice d’oeuvre n’a jamais fait partie des consignes de catalogage…

Image2

Lors du reversement périodique des données dans data.bnf.fr, le lien entre notice bibliographique et notice d’oeuvre a été systématiquement calculé : pour chaque ouvrage, un algorithme récupère la forme de titre, et regarde si une notice d’autorité titre (ou notice d’oeuvre) de forme de titre comparable est associée au même auteur.

Si c’est le cas, elle crée une relation rdarelationships:workManifested de la manifestation vers l’oeuvre.

Image3

Le reversement dans le catalogue

Pendant plusieurs années, ces informations, ces liens, n’ont existé que dans data.bnf.fr.

En 2014-2015, la BnF a souhaité en faire bénéficier les données du catalogue, qui sont davantage partagées, diffusées via les produits bibliographiques.

Pour l’occasion, l’algorithme a été revu pour être plus restrictif (générer quelques erreurs à la volée dans data.bnf.fr est moins gênant que d’inscrire ces erreurs en dur dans les notices du catalogue).

En novembre 2015, 167.000 liens manifestation-oeuvre ont été versés dans les notices bibliographiques du catalogue de la BnF, après un an de spécifications, contrôles et corrections.

Désormais, cet algorithme est rejoué tous les ans : en février 2017, 7.000 nouveaux liens ont été ajoutés de la même manière.

Précision : L’algorithme a pu identifier un certain nombre de liens à générer, mais le processus de chargement dans le catalogue BnF a ajouté des restrictions. Ainsi, toute notice identifiable comme agrégat (agrégat = danger !) a été retirée du traitement. Du moins pour le moment…

Pour la suite…

Le même algorithme a permis d’identifier des propositions de liens, jugées dans un premier temps trop incertaines, qui n’ont pas été reversées mais pourront l’être en partie après des vérifications supplémentaires.

De même le traitement suggère l’ajout de liens entre les notices de spectacles et les notices d’oeuvres (ces liens existent déjà dans data.bnf.fr mais pas encore dans le catalogue).

Du point de vue des utilisateurs des produits bibliographiques

Comment faire pour récupérer les notices enrichies par ces traitements ? Elles sont identifiables (et donc requêtables !) par un code propre à chacun des deux chargements :

Ces termes peuvent servir de critères de recherche via le serveur Z39.50 de la BnF, et donc les notices récupérées par ce biais.
Cela dit, le code lui-même n’est pas visible dans l’affichage en Unimarc (ou les 2 codes sont convertis en libellé “$2 lien automatique” dans la zone 500 générée) :

Image4

mais la recherche par les codes ci-dessus fonctionne aussi quand on souhaite récupérer les notices en format UNIMARC, quand bien même le code n’apparaitrait pas dans la notice récupérée.
Par ailleurs, un grand nombre de ces liens concerne des oeuvres musicales qui font l’objet de dépouillements spécifiques par le département de l’Audiovisuel de la BnF, sous forme de “notices analytiques” (exemple).

Or ces sous-notices s’accommodent mal du protocole Z39.50. Pour le moment, elles sont récupérables au format UNIMARC “à plat” (les informations sont dans des zones de la notice principale, donc une notice contenant plusieurs œuvres musicales aura plusieurs zones 500) :

Image5

… et au-delà ?

La BnF a pour projet d’augmenter le nombre de ces liens manifestations-oeuvres (il sera question d’expressions une autre fois). Pour cela, il faut :

  • trouver de nouveaux liens. Un nouvel outil, baptisé “RobotDonnées”, permet de travailler sur des sous-ensembles du catalogue, pour ajuster les paramètres de l’algorithme d’alignement en fonction des corpus traités – afin d’obtenir un plus grand nombre de propositions de liens sans pour autant générer de faux positifs.
  • générer de nouvelles notices d’œuvres. Car la grande majorité des ouvrages conservés n’ont évidemment pas fait l’objet d’études, donc n’ont pas de notice d’oeuvre auxquelles les associer. Le même outil doit permettre de générer de nouvelles notices d’œuvres, par calcul, à partir des métadonnées présentes dans les notices bibliographiques.

Et c’est ainsi qu’en associant le travail de la machine et l’expertise du catalogueur – expertise portant à la fois sur les données sources et sur le modèle cible – que nous avançons peu à peu dans ce processus de transformation des données.

Pour le groupe Systèmes & Données : Étienne CAVALIÉ, BnF

Last updated: juin 20, 2017 at 13:01

En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies ou autres traceurs. En savoir plus >

Les paramètres des cookies sur ce site sont définis sur « accepter les cookies » pour vous offrir la meilleure expérience de navigation possible. Si vous continuez à utiliser ce site sans changer vos paramètres de cookies ou si vous cliquez sur "Accepter" ci-dessous, vous consentez à cela.

Fermer