Deutschland, Österreich, Schweiz

  • Deutsch

Häufig gestellte Fragen zur Lizenzierung von Daten

1. Warum empfiehlt OCLC seinen Mitgliedern eine offene Datenlizenz?

Gegenwärtig prüfen viele Bibliotheken, wie sie ihre bibliografischen Einträge kostenlos im Internet zur Verfügung stellen können, damit diese weiter verwendet und noch umfassender in die weitere Webumgebung integriert werden können. Bibliotheken können ihre Katalogdaten dabei als Linked Data, als MARC21- oder als MARCXML-Datensätze freigeben. Bei einem OCLC-Mitglied werden diese Datensätze häufig von WorldCat abgeleitete Daten enthalten. Zusammen mit einem Verweis auf die Gemeinschaftsnormen, die in den Rechten und Pflichten bezüglich WorldCat formuliert sind, stellt die sogenannte ODC-BY-Lizenz eine gute Möglichkeit zur gemeinsamen Nutzung von Einträgen im Einklang mit der kooperativ angelegten OCLC-Katalogisierung dar.

Im Internet hat es sich unter anderem bewährt, Daten zusammen mit einer Lizenz zur Verfügung zu stellen, in der eindeutig die Bedingungen festgelegt sind, zu denen die Bereitstellung der Daten erfolgt. Ohne eine solche Lizenz können sich die Benutzer nie sicher sein, wie sie die Daten nutzen dürfen – und das kann Innovationen behindern.

Sowohl das VIAF-Projekt als auch die kürzlich erfolgte Integration von, gemäß Schema.org ausgezeichneten, Linked Data in die WorldCat.org-Datensätze erfolgten im Rahmen der ODC-BY-Lizenz. Nach langen Überlegungen und Diskussionen hatte sich abgezeichnet, dass ODC-BY für viele Datendienste von OCLC die beste Wahl in Sachen Lizenz sein würde. Ausgehend von dieser Erfahrung erfolgte die Empfehlung an die Mitglieder, sich diesem klaren und konsequenten Ansatz im Bereich offene Lizenzierung von gemeinsam genutzten Daten aus WorldCat anzuschließen.

Ein Team von OCLC-Mitarbeitern untersuchte mit Hilfe eines externen Fachmanns für die offene Lizenzierung von Daten systematisch bestehende Lizenzierungsmöglichkeiten, um so den OCLC-Mitgliedsinstitutionen eine Orientierung bieten zu können. Ehe die Empfehlung schließlich verabschiedet wurde, beschäftigte sich der OCLC Global Council mit den Schlussfolgerungen des OCLC-Teams und stimmte, ebenso wie das OCLC Board of Trustees, dem vorgeschlagenen Weg zu.

2. In welchem Zusammenhang steht die ODC-BY-Lizenz mit den Rechten und Pflichten bezüglich WorldCat (WCRR)?

Das WCRR-Dokument war das Ergebnis eines Beratungsprozesses, der von den OCLC-Mitgliedsinstitutionen geführt und dessen Befund vom Global Council sowie dem OCLC Board of Trustees verabschiedet wurde. Das WCRR-Dokument zeigt, wie die an WorldCat beteiligten Parteien sich die weitere Entwicklung von WorldCat vorstellen und wünschen.

Im Einklang mit diesen Rechten und Pflichten bezüglich WorldCat lautet die aktuelle Empfehlung von OCLC an diejenigen seiner Mitglieder, die über eine Freigabe ihrer Kataloge mit aus WorldCat abgeleiteten Einträgen nachdenken, eine sogenannte Open Data Commons Attribution-Lizenz (ODC-BY) in Erwägung zu ziehen. Die ODC-BY-Lizenz sieht die Nennung von OCLC, WorldCat und, wenn gewünscht, die Nennung der jeweiligen Mitgliedsinstitution vor. OCLC empfiehlt die Verwendung der ODC-BY-Lizenz zusammen mit einem Hinweis, dass die Nutzung und Übertragung der aus WorldCat abgeleiteten Einträge in der freigegebenen Datenbank (d.h. dem Katalog) in Übereinstimmung mit dem WCRR-Dokument zu erfolgen haben.

Die Verwendung einer ODC-BY-Lizenz in Verbindung mit einem Hinweis, dass die aus WorldCat abgeleiteten Einträge in dem freigegebenen Katalog wie oben beschrieben zu verwenden sind, entspricht den Vorgaben des WCRR-Dokuments.

3. Warum fordert OCLC eine Namensnennung bei WorldCat-Einträgen?

Die OCLC-Mitglieder sind der Auffassung, dass die Nennung von WorldCat und OCLC dazu beiträgt, WorldCat im Einklang mit dem Dokument zu den Rechten und Pflichten bezüglich WorldCat sowohl für die OCLC-Mitglieder als auch für die breite Öffentlichkeit als nachhaltige Ressource zu bewahren.

In WorldCat stecken jede Menge Zeit und Aufwand von OCLC und seinen Mitgliedsinstitutionen, die Einträge einstellen. Die WorldCat-Gemeinschaft verlässt sich darauf, dass ihre Mitglieder den Institutionen im OCLC-Verbund den Wert von WorldCat nahebringen, indem sie WorldCat als Quelle benennen. Durch die Nennung oder Anführung von WorldCat in Anwendungen, Websites, Nachrichten, Artikeln und Forschungsberichten können Mitglieder auf die Fähigkeit des Verbunds, den Benutzern auch weiterhin Daten zur Verfügung zu stellen, direkt Einfluss nehmen.

4. Warum wird für WorldCat-Daten eine offene Lizenz empfohlen?

Der Lizenzierung von Open-Source-Software und den Lizenzen für offene Inhalte ist es zu verdanken, dass der breiten Öffentlichkeit zunehmend zuverlässige und nützliche Software sowie vielfältige Inhalte zur Verfügung stehen. Das Ziel im Zusammenhang mit offenen Daten lautet, diesen bewährten Ansatz der offenen Lizenzierung auf Daten zu übertragen.

Ein zentrales Element hierbei ist, dass ein Werk für die weitere Nutzung durch die Öffentlichkeit zur Verfügung stehen sollte, ohne dass dabei weitere Genehmigungen von dem Rechteinhaber einzuholen sind. Der Rechteinhaber gewährt der Welt also im Voraus eine Lizenz zur Nutzung seiner Werke. Dies ist wichtig, da die Aushandlung individueller Lizenzverträge Ressourcen verschwenden kann (sowohl auf Seiten des Rechteinhabers als auch auf Seiten des Nutzers), zumal wenn der Rechteinhaber eigentlich seine Informationen bereitstellen möchte, dies aber nicht ohne weiteres tun kann.

5. Warum wird zwischen Datenbank und Inhalten unterschieden?

Wenn über Daten gesprochen wird, ist häufig nur die Information an sich gemeint – Wasser kocht bei 100 Grad Celsius, um ein Beispiel zu nennen. Im Zusammenhang mit der Lizenzierung von Daten können die Inhalte einer Datenbank jedoch alles Mögliche sein, zum Beispiel:

  • mit Mobiltelefonen aufgenommene Videos
  • Bilder, zum Beispiel Photos von Flickr
  • Textdokumente, zum Beispiel doc.-Dateien von Microsoft
  • Sachinformationen, zum Beispiel Termine oder Budgetzahlen

Alles, was in einer Datenbank gespeichert werden kann, kann in diesem Kontext als „Daten“ bezeichnet werden. Deshalb kann es hilfreich sein, zwischen den „Inhalten einer Datenbank“ und „der Datenbank“ zu unterscheiden. Das ist der Hintergrund zu der Unterscheidung zwischen Daten und Datenbank. Rechtlich gesehen bedeutet das, dass es bestimmte Rechte für die Inhalte einer Datenbank geben kann (die Daten, da diese alles Mögliche sein können). Zudem kann ein Sammlung von Inhalten (die Datenbank und potentiell sogar eine XML-Datei) mit bestimmten Rechten verknüpft sein, die diese Sammlung betreffen und die unabhängig von den Rechten an einzelnen Inhalten innerhalb dieser Sammlung sind.

Ein Beispiel: Sie haben eine Datenbank mit Bildern und Videos von Science-Fiction-Filmen aus den 1960er und 1970er Jahren und besitzen die Rechte an der Datenbank als Ganzem, einschließlich für Auswahl und Anordnung der Science-Fiction-Filme. Dennoch müssten Sie die Frage der Rechte (wie z. B. das Urheberrecht) an den Bildern und Videos klären, die Sie in Ihrer Datenbank haben.

Es kann also einmal Rechte an den Inhalten (im Fall der Bibliotheken wären dies die Einträge) und einmal Rechte an der Datenbank geben: die Zusammenstellung, die Feldnamen, das Schema und andere Aspekte der Datenbank, die nicht die Einträge selbst betreffen.

Aus diesem Grund kann es sein, dass mehr als eine Lizenz für die Datenbank und die Inhalte erforderlich ist.

6. Kann es bei der geforderten Namensnennung Probleme geben, wenn mehrere Rechteinhaber namentlich aufzuführen sind (sogenanntes „Attribution Stacking“)?

Bei der Empfehlung einer Lizenz, welche die Nennung des Rechteinhabers vorsieht, kommt häufig die Frage auf, ob angesichts des „Attribution Stacking-Problems“ nicht ein Ansatz besser sei, der eine allgemeine Verfügbarkeit vorsieht. Da die Einträge in Datenbanken von einer großen Anzahl von Personen stammen können, so wird hierbei argumentiert, sei die Namensnennung nicht mehr handhabbar. So kann es beispielsweise eine Datenbank mit einer Million Einträge geben, die aus einer Million verschiedener Quellen stammen. Die Bedenken hierbei sind, dass die Umsetzung der vorgeschriebenen Namensnennung schwierig und teuer sein könnte (im Hinblick auf Dateigröße, Datenübertragungsrate, zeitlichen Aufwand usw.), weshalb als Lösung häufig Ansätze vorgeschlagen werden, die eine allgemeine Verfügbarkeit vorsehen, da hier keinerlei Namensnennung erforderlich ist (und auch keine sonstigen Lizenzbedingungen einzuhalten sind).

Hierzu ist anzumerken, dass das Problem der namentlichen Nennung verschiedener Rechteinhaber auch nicht durch eine allgemeine Verfügbarkeit einer Datenbank verschwindet, da die jeweiligen Inhalte verschiedenen Lizenzen unterliegen können (Photos von Flickr, Musik usw.).

Was die Namensnennung im Rahmen einer Datenbank angeht, so wird eine Ansammlung von Nennungen außerhalb der einzelnen Informationsobjekte in der Datenbank erfolgen. Bei Diensten oder Datenbanken, die auf vielen verschiedenen Quellen beruhen, die namentlich aufgeführt werden müssen, ist unter Umständen eine separate Website erforderlich, auf der die Quellen in der vorgeschriebenen Form benannt werden, sodass sie von anderen gefunden werden können.