Français

Comment votre bibliothèque bénéficiera des données liées

John Chapman /

En janvier 2020, OCLC annonçait avoir reçu une subvention de la Andrew W. Mellon Foundation pour le développement d'une infrastructure partagée de gestion d'entités au profit des bibliothèques, alors que nous nous dirigeons vers de nouvelles façons de créer et de partager les informations sur leurs collections. Ces nouvelles méthodes, dites de « données liées », représentent des changements à la fois dans les données sous-jacentes des bibliothèques et dans le type d'activités réalisées par les employés de bibliothèque.

Plus important encore, elles marquent également un changement dans la manière dont les bibliothèques de la communauté peuvent travailler ensemble afin de tirer parti du travail de chacune. Quel que soit le type de bibliothèque auquel vous êtes associé, ce projet sera avantageux pour vous comme pour vos utilisateurs.

Un point à six mois

Dans un récent billet, nous évoquions le prototype Project Passage, qui donnait un aperçu de quelques nouveaux systèmes et interfaces permettant aux bibliothécaires de créer des données liées. Mais l'histoire ne s'arrête pas là. Nous avons demandé aux participants ce que les grands fournisseurs de données comme OCLC devraient faire pour que ces systèmes fonctionnent véritablement.

Le passé, le présent et l'avenir d'OCLC étant profondément liés à la notion de catalogage partagé, j'ai pensé que faire un point à six mois sur cette nouvelle subvention serait opportun pour parler de ce que notre travail ici signifie pour vous et votre bibliothèque. Lorsqu'elles seront opérationnelles, les données liées fourniront aux bibliothèques participantes :

  • Une collection massive d'informations descriptives et d'identificateurs pour les œuvres, les personnes et d'autres éléments auxquels les bibliothèques doivent se référer;
  • La possibilité d'améliorer ces descriptions ou de les ajouter pour les éléments manquants dans la collection;
  • Un écosystème (comprenant une interface utilisateur et des API légères) qui permettra aux employés de bibliothèque de créer des données liées directement plutôt que par conversion à partir de MARC;
  • Des outils permettant de rapprocher les métadonnées des bibliothèques locales de celles de l'écosystème, et de relier les métadonnées des bibliothèques à des sources autres que celles des bibliothèques.

Cela permettra également de parsemer le web d'identificateurs significatifs pour les utilisateurs et les employés des bibliothèques. Nous créerons et publierons des données sur plusieurs millions d'œuvres et de personnes associées à ces œuvres, fournissant ainsi des liens essentiels pour décrire et découvrir nos collections. Grâce à l'utilisation d'identificateurs cohérents en référence à ces œuvres et personnes, les applications pourront établir des liens entre des collections disparates ou diffuses.

Un démarrage rapide

Après avoir été informés, fin décembre, de l'octroi imminent de cette subvention, nous avons constitué une équipe technique et nous sommes mis au travail. À l'annonce officielle, le 9 janvier, cette équipe de base avait déjà mis en place les outils et environnements techniques nécessaires pour commencer le développement. OCLC apporte au projet une contribution substantielle en temps et en argent, à la hauteur de la subvention Mellon et qui nous permet d'intégrer ces travaux dans de nombreux autres processus existants.

Notre équipe s'est occupée de chacun des points mentionnés plus haut pendant le processus d'octroi de la subvention, en s'attachant particulièrement à fournir des métadonnées liées au moment opportun, durant le processus de création. Avec l'accélération des recherches et la réduction de la durée du cycle de travail d'autorité classique, le projet permettra d'inclure plus facilement et plus rapidement les URI (Uniform Resource Identifiers) de données liées dans tous les types de métadonnées.

Cela signifie que, quel que soit le type de métadonnées que vous adoptez (catalogage traditionnel basé sur le MARC, mélange de termes Dublin Core et locaux dans votre dépôt numérique ou modèle BIBFRAME complet), vous pourrez utiliser ces identificateurs. Et lorsque d'autres bibliothèques commenceront à les utiliser, vous pourrez fournir à vos utilisateurs un contexte et des contenus supplémentaires avec une facilité inédite.

Un travail d'équipe

Étant donné la durée du projet — il s'agit d'une subvention de deux ans, qui se terminera en décembre 2021 —, nous savions qu'il était important de maintenir les voies de communication ouvertes avec les bibliothèques. Le domaine des données liées évolue rapidement, et nous voulons nous assurer qu'à la fin du projet, nous répondrons aux attentes tout en faisant progresser les choses.

En juin, nous avons accueilli de nouvelles bibliothèques dans notre groupe consultatif sur la gestion des entités, où se déroule la plupart des discussions sur le projet. Vingt-cinq bibliothèques de sept pays participent actuellement à ces discussions via des forums en ligne et des réunions mensuelles. Jusqu'à présent, les sujets abordés ont porté sur les API, la recherche sur l'expérience utilisateur et la modélisation des données.

Nous avons poursuivi et intensifié notre partenariat avec le projet LD4P (Linked Data for Production), également financé par Mellon, et le programme PCC (Program for Cooperative Cataloging), qui ont placé les données liées et les concepts de « gestion d'identité » au cœur de leur stratégie.

Afin de mieux répondre aux besoins des employés de bibliothèque, l'équipe d'OCLC chargée de la recherche sur l'expérience utilisateur a également mené des entretiens ciblés auprès de dizaines de bibliothécaires, dans le but de mettre en lumière les défis et les préoccupations liés à l'utilisation de ces nouveaux concepts dans des chaînes de travail réelles.

Une première étape avant d'autres à venir

L'expérience des utilisateurs qui consultent les données et les outils associés, et interagissent avec ces derniers, constitue un autre type de contribution. Afin d'obtenir ces informations, nous avons récemment proposé un premier aperçu du travail que nous avons effectué à certaines bibliothèques du groupe consultatif. Ce test est le premier de trois points préliminaires prévus avant le lancement officiel final, en décembre 2021. Les bibliothèques pourront examiner les données rassemblées sur plus d'un million d'œuvres et de personnes associées à leur création et à leur sujet. Elles auront également la possibilité d'utiliser à la fois une interface utilisateur simple et un ensemble d'API.

Bien que ces tests concernent un ensemble très précoce et limité de fonctionnalités que nous nous efforçons déjà d'améliorer, ils constituent une étape importante dans ce projet capital.

Les données liées représentent un moyen d'augmenter considérablement l'utilité des métadonnées des bibliothèques pour ceux d'entre nous qui travaillent dans les bibliothèques et pour nos utilisateurs. C'est aussi un moyen d'accroître notre capacité à établir des partenariats avec des organisations extérieures, qui disposent de données que nous pouvons utiliser de manière productive et qui valorisent le type de travail que nous menons. Cette étape importante dans l'opérationnalisation des données liées et la création d'une infrastructure partagée pour la communauté est vraiment passionnante pour nous, ici à OCLC, mais aussi pour les bibliothèques qui travaillent avec nous et les organisations partenaires comme la Mellon Foundation. J'ai hâte de partager avec vous de nouvelles informations sur ce projet, plus tard dans l'année.

Pour un aperçu des développements récents, visionnez notre webinaire du 29 juillet 2020, « OCLC and Linked Data: Moving from research to reality » (OCLC et les données liées : de la recherche à la réalité). Lors de cet événement, des intervenants d'OCLC et de l'Université Temple ont présenté le projet de données liées CONTENTdm et le projet d'infrastructure partagée de gestion d'entités.