Canada

Licence de données ouverte pour les notices issues de WorldCat

  • Foire aux questions sur les licences de données

Foire aux questions sur les licences de données

1. Pourquoi OCLC préconise-t-elle à ses membres une licence de données ouverte?

De nombreuses bibliothèques étudient actuellement des solutions pour rendre leurs notices bibliographiques disponibles gratuitement sur Internet, afin qu'elles puissent être réutilisées et mieux intégrées dans un environnement Web élargi. Les bibliothèques peuvent publier leurs catalogues sous la forme d'un Web des données au format MARC21 ou MARCXML. Pour un établissement membre d'OCLC, les notices peuvent bien souvent contenir des données dérivées de WorldCat. Associée à une référence aux normes du secteur développées dans la politique Droits et responsabilités WorldCat, la licence ODC-BY est une solution efficace pour partager des notices, en adéquation avec l'aspect coopératif du catalogage OCLC.

Les bonnes pratiques en matière d'environnement Web consistent à mettre à disposition les données, accompagnées d'une licence qui définit clairement les conditions en vertu desquelles ces données sont publiées. Sans licence de cette nature, les utilisateurs ne peuvent pas savoir avec certitude s'ils sont autorisés à utiliser les données, et cela risque à terme d'entraver l'innovation.

Le projet VIAF et l'ajout récent du Web des données Schema.org aux notices WorldCat.org ont tous deux été rendus possibles en vertu de la licence ODC-BY. À l'issue d'un grand nombre d'études et de discussions, il est devenu évident qu'ODC-BY s'avère le choix idéal en termes de licence pour de nombreux services de données d'OCLC. Les membres sont eux aussi invités à adopter cette approche claire et cohérente d'attribution de licences ouvertes pour les données partagées dérivées de WorldCat.

Un groupe de travail d'OCLC, épaulé par un expert externe en licences ouvertes de données, a réalisé une enquête approfondie sur les solutions alternatives existantes, afin de fournir des conseils aux établissements membres d'OCLC. Avant l'adoption de cette recommandation, le Conseil mondial et le Conseil d'administration d'OCLC ont étudié les conclusions du groupe de travail et ont approuvé cette orientation.

2. En quoi la licence ODC-BY est-elle liée à la politique Droits et responsabilités WorldCat?

Le document Droits et responsabilités WorldCat est le fruit d'un processus consultatif mené par les établissements membres d'OCLC, et approuvé par le Conseil mondial ainsi que le Conseil d'administration d'OCLC. Il reflète les opinions des parties prenantes de WorldCat concernant l'élaboration de cette initiative.

Dans la lignée de la politique Droits et responsabilités WorldCat, OCLC recommande actuellement à ses membres qui envisagent de publier leurs catalogues contenant des notices dérivées de WorldCat d'utiliser une licence Open Data Commons Attibution (ODC-BY). Cette dernière doit mentionner la paternité d'OCLC, de WorldCat et de l'établissement membre le cas échéant. OCLC recommande à ses membres utilisant une licence ODC-BY d'ajouter une mention qui stipule que l'utilisation et le transfert des notices dérivées de WorldCat dans la base de données publiée (par exemple, le catalogue) doivent être conformes aux Droits et responsabilités WorldCat.

L'utilisation d'une licence ODC-BY associée à une telle mention est cohérente avec les obligations définies dans la politique Droits et responsabilités WorldCat.

3. Pourquoi OCLC exige-t-elle de mentionner la paternité des notices WorldCat?

Les membres d'OCLC sont convaincus que la mention de la paternité de WorldCat et d'OCLC contribue à faire de WorldCat une ressource fiable, à la fois pour les membres d'OCLC et le grand public, et qui plus est en adéquation avec le document Droits et responsabilités WorldCat.

WorldCat représente un investissement considérable de temps et de ressources de la part d'OCLC et de chacune des établissements membres qui contribuent à l'élaboration des notices. Pour démontrer sa valeur aux établissements appartenant à la coopérative OCLC, la communauté WorldCat s'appuie sur ses membres, tenus de mentionner la paternité de WorldCat. En attribuant la paternité à WorldCat ou en citant WorldCat dans les applications, les sites Web, les témoignages, les articles et les rapports de recherche, les membres contribuent directement à aider la coopérative dans sa mission de fourniture des données à la communauté.

4. Pourquoi l'attribution d'une licence ouverte pour les données WorldCat est-elle recommandée?

Les licences de logiciels libres et de contenus ouverts ont contribué de façon considérable au développement de logiciels stables et utiles ainsi que de contenu de qualité à disposition du grand public. Le but des données ouvertes consiste à appliquer les approches établies de licence libre aux données.

Ces approches reposent essentiellement sur la mise à disposition de ressources au grand public afin qu'il les utilise à sa guise sans avoir besoin de demander à son tour l'autorisation au détendeur des droits d'auteur. Ce dernier accorde en effet à l'avance à tout le monde une licence pour utiliser ses travaux. C'est une avancée très importante, étant donné que la négociation des licences individuelles peut obliger le détenteur des droits d'auteur autant que l'utilisateur à mobiliser une quantité considérable de ressources, tout particulièrement lorsque l'auteur est enclin à partager ses travaux sans disposer toutefois d'une solution simple pour ce faire.

5. Pourquoi une distinction est-elle faite entre la base de données et les contenus?

En règle générale, lorsque les gens parlent des données, ils ne s'intéressent qu'à des informations factuelles, à l'image de l'affirmation « l'eau bout à 100 °C ». Toutefois, dans le contexte des licences de données, le contenu d'une base de données de données peut porter sur une multitude d'informations de différentes natures, notamment :

  • des vidéos filmées avec des mobiles;
  • des images, telles que des photos de Flickr;
  • des documents texte, tels que fichiers Microsoft Word; ou
  • des informations factuelles, telles que des dates ou des données budgétaires.

Dans ce contexte, toute information pouvant être stockée dans une base est une « donnée ». Cela peut s'avérer utile de faire la distinction entre les « contenus de la base » et la « base de données » en elle-même. Cette distinction entre données et base de données peut signifier, d'un point de vue juridique, qu'il existe des droits propres aux contenus d'une base de données (les données, étant donné qu'il s'agit d'une multitude d'informations de différentes natures). De même, toute collection de contenus (la base de données, voire un fichier XML) est susceptible d'être protégée par des droits indépendants de ceux qui couvrent les contenus individuels faisant partie de cette collection.

Par exemple, si vous possédez une base d'images et de vidéos de films de science-fiction des années 1960 et 1970, vous pouvez posséder des droits, protégeant notamment votre sélection et votre arrangement de films, sur la base de données dans son ensemble. Parallèlement, vous devez quand même obtenir les droits (tels que les droits d'auteur) pour les images et vidéos que vous avez ajoutées à votre base.

Un niveau de droits peut porter sur les contenus (notices dans le cas des bibliothèques), tandis qu'un autre niveau peut s'appliquer à la base de données, c'est-à-dire à la compilation, aux noms des champs, à l'agencement et aux autres aspects de la base, excepté les notices.

C'est pourquoi plusieurs licences sont parfois nécessaires pour couvrir à la fois la base de données et les contenus.

6. L'imbrication des mentions de sources peut-elle devenir un problème pour les obligations relatives à la mention de paternité?

Au moment de recommander une licence de paternité, la question se pose souvent de savoir si une approche dans le domaine public ne serait pas préférable en raison du problème d'imbrication des mentions de sources. De nombreuses personnes peuvent contribuer à une base de données. L'argument repose alors sur le fait qu'accorder à chaque participant le crédit qui est lui dû n'est pas adapté. En effet, une personne peut par exemple posséder une base de données d'un million de notices, elles-mêmes issues d'un million de sources différentes. Le respect des conditions de mention de paternité peut alors s'avérer une tâche complexe et coûteuse en raison, entre autres, de la taille des fichiers, de la bande passante et du temps de gestion. Les approches dans le domaine public sont souvent présentées comme la solution idéale, étant donné qu'elles n'imposent pas la mention de paternité, ni le respect de conditions de licence.

Il est important de noter que les problèmes d'imbrication des mentions de sources ne sont pas pour autant résolus si la base de données appartient au domaine public, alors que les contenus sont protégés par différentes licences (photos Flickr, morceaux de musiques, etc.).

Dans le cas de la paternité d'une base de données, l'imbrication des mentions de sources est extérieure aux objets d'information individuels, mais interne à la base. Un service ou une base de données, conçu à partir de nombreuses sources dont la paternité doit être mentionnée, doit comporter une page Web séparée, qui répertorie les sources et les formes de paternité, à laquelle d'autres personnes peuvent se référer.