Canada

Web des données chez OCLC

Par Web des données, ou Web sémantique, on entend un ensemble de meilleures pratiques relatives à la publication et la mise en relation de données structurées sur le Web. À partir des technologies Web standard, ce Web des données utilise des URI (identifiants génériques adressables sur le Web qui permettent d'identifier des entités ou des concepts dans le monde entier) et des RDF (méthode générique de description des liaisons existant entre les données structurées dans un modèle de données basé sur un graphe).

Les opportunités offertes par le Web des données à l'ensemble de la communauté des bibliothèques sont importantes et dans la lignée de la stratégie d'OCLC, à savoir construire en collaboration avec les bibliothèques une plate-forme à l'échelle du Web. Le Web des données est un des moyens grâce auxquels OCLC peut aider les bibliothèques à accroître leur présence et leur visibilité sur le Web. La promotion des documents des bibliothèques par le biais des services de données de cette manière est l'un des principaux atouts de la plate-forme OCLC WorldShare.

OCLC s'appuie sur le Web des données depuis un certain temps. Par exemple, les trois premiers niveaux de la Classification décimale Dewey sont disponibles sous la forme de Web des données depuis plusieurs années. OCLC a récemment transféré l'intégralité de la CDD 23 dans le Web des données : plus de 23 000 notations et libellés en anglais. Le Virtual International Authority File (VIAF) et la Faceted Application of Subject Terminology (FAST) ont également été publiés dans le Web des données.

Web des données WorldCat

Balisage de Schema.org ajouté à WorldCat.org

En juin 2012, OCLC a considérablement augmenté l'accès aux ressources du Web des données via la mise à disposition des métadonnées bibliographiques sous cette forme. Le balisage de Schema.org et les extensions de bibliothèque ont été ajoutés à WorldCat.org pour l'intégralité de la collection de catalogage (titres de livres et de revues principalement; pas les articles de revues ajoutés via les fournisseurs tiers). Cette fonctionnalité améliorée est utile à nos partenaires de recherche et aux créateurs de gadgets qui nécessitent des données structurées présentes dans les pages HTML (via RDFa 1.1).

Le développement du prototype OCLC Research a duré plusieurs mois et fonctionne aujourd'hui en mode expérimental.

La modélisation s'appuie sur le vocabulaire de Schema.org (étendu par le vocabulaire des bibliothèques) afin que les données bibliographiques WorldCat soient indexées et utilisées de la manière la plus complète par les moteurs de recherche et d'autres systèmes.

L'accessibilité de WorldCat.org aux programmes comme aux utilisateurs permet le traitement des données des bibliothèques et des connexions plus efficaces entre ce service et les ressources Web. Notre objectif est de faire de WorldCat, et de tout l'investissement fourni par l'expertise des bibliothèques dont il est issu, un point de référence essentiel pour tous ceux qui recherchent des informations bibliographiques sur le Web.

À noter qu'il ne s'agit pas d'un programme statique, mais d'un premier projet expérimental qui évoluera dans le temps grâce aux commentaires des communautés des bibliothèques et du Web au sens large.

Tout le Web des données téléchargeable pour 1,2 million de ressources WorldCat

En août 2012, le Web des données bibliographiques de près d'1,2 million de ressources WorldCat (contenant approximativement 80 millions de triplets) a été publié sous la forme d'un jeu de données téléchargeable disponible ici (gzip 860 Mo). Le Web des données est disponible au format de sérialisation RDF et utilise l'ontologie de Schema.org ainsi que les extensions des bibliothèques vers Schema.org sur lesquelles OCLC a travaillé en collaboration avec des membres et partenaires l'an passé. L'espoir repose sur l'utilité de cette ressource en tant que source du Web de données brut, afin que les informations sur les œuvres, auteurs et éditeurs soient décortiquées et recompilées plus facilement. Cela en fait un excellent outil pour les chercheurs en bibliothéconomie, ainsi que les personnes qui étudient la culture, l'histoire, la sociologie et d'autres domaines à partir des données enrichies que les bibliothèques ont rassemblées dans WorldCat pendant des dizaines d'années. Le téléchargement est disponible sous une licence ODC-By.

Licence

Le Web des données expérimental sur WorldCat.org est mis à disposition par OCLC sous la licence dite Open Data Commons Attribution License (résumé en texte en clair), faisant référence aux normes communautaires mises en avant par les membres de la coopérative OCLC à l'origine de WorldCat.

La licence permet d'utiliser les données pour les études et les recherches, entre autres, à condition que la paternité des jeux de données ayant servi dans ces travaux soit mentionnée. Si vous envisagez d'utiliser les données bibliographiques à d'autres fins, que vous soyez ou non un membre OCLC, nous vous demandons de consulter et de vous conformer aux normes communautaires. Pour des conseils sur ces normes, veuillez prendre contact avec nous. Veuillez consulter ces directives pour obtenir des conseils et des exemples pour répondre aux exigences relatives à la mention de paternité encadrées par la licence ODC-By.

Problèmes, discussion et commentaires

L'ajout de ces données expérimentales représente le début d'un processus incrémentiel visant à une amélioration pratique sur le long terme. Cette nouvelle ressource du Web des données est conçue d'une part pour être utilisée, et d'autre part pour bénéficier des commentaires et engager une discussion au sein des communautés des bibliothèques et Web au sens large. Pour favoriser cette discussion, nous établissons une liste des problèmes connus au niveau de l'utilisation du vocabulaire de Schema.org et des bibliothèques, et l'analyse du côté pratique de l'intégration du Web des données dans les pages WorldCat.org.

Le réseau OCLC des développeurs est ouvert à tous. Nous vous encourageons à vous inscrire et à participer au groupe de discussion. Vous pouvez également envoyer vos commentaires directement à l'adresse data@oclc.org.

Nous sommes une coopérative mondiale de bibliothèques qui appartient à, est gouvernée et entretenue par, ses membres depuis 1967. Notre utilité publique est une déclaration d’engagement les uns envers les autres, plus précisément que nous travaillerons ensemble pour améliorer l’accès aux informations détenues par les bibliothèques à travers le monde et trouverons des façons de réduire les coûts des bibliothèques par le biais de la collaboration. Plus de détails »