Deutschland, Österreich, Schweiz

  • Deutsch

Linked Data bei OCLC

Linked Data bezeichnet eine Reihe von bewährten Verfahren zur Veröffentlichung und Verknüpfung strukturierter Daten im Internet. Aufbauend auf allgemeine Internettechniken kommen bei Linked Data URIs (Uniform Resource Identifiers – allgemeine, im Internet aufrufbare Identifikatoren zur Kennzeichnung von Gegenständen oder Konzepten in der Welt) und RDF (Resource Description Framework – eine allgemeine Methode zur Beschreibung von Verknüpfungen zwischen strukturierten Daten in einem auf Graphen basierenden Datenmodell) zur Anwendung.

Mit Linked Data bieten sich wichtige Möglichkeiten für die globale Bibliotheksgemeinschaft, die zudem im Einklang mit der zentralen Strategie von OCLC stehen, „gemeinsam mit den Bibliotheken eine webbasierte Plattform aufzubauen“. Linked Data ist einer der Wege, mit denen OCLC Bibliotheken bei der Erhöhung ihrer Präsenz und Auffindbarkeit im Internet behilflich sein kann. Bibliotheksmaterialien auf diese Art und Weise über Datendienste zu fördern, ist einer der zentralen Vorteile der OCLC WorldShare Platform.

OCLC arbeitet schon seit geraumer Zeit versuchsweise mit Linked Data. So stehen beispielsweise die oberen drei Ebenen der Dewey-Dezimalklassifikation (DDC) seit einigen Jahren als Linked Data zur Verfügung. Vor kurzem hat OCLC die gesamte aktuelle Ausgabe der Dewey-Dezimalklassifikation (DDC 23) als Linked Data zur Verfügung gestellt – über 23.000 zuweisbare Ziffern und Schlagworte auf Englisch. Die Virtual International Authority File (VIAF) und die Faceted Application of Subject Terminology (FAST) wurden ebenfalls als Linked Data zugänglich gemacht.

Linked Data in WorldCat

Auszeichnungsformat Schema.org jetzt neu in WorldCat.org

Im Juni 2012 stellte OCLC bibliografische Metadaten in WorldCat.org in diesem Format zur Verfügung und erhöhte damit deutlich die Präsenz seiner in Form von Linked Data bereitgestellten Ressourcen. Das Auszeichnungsformat Schema.org und die entsprechenden Erweiterungen durch Bibliotheken wurden in WorldCat.org für die gesamte Katalogsammlung aufgenommen (hauptsächlich Buch- und Zeitschriftentitel, keine von Drittanbietern eingestellten Zeitschriftenartikel). Von dieser verbesserten Funktion werden unsere Suchpartner sowie die Ersteller von Widgets profitieren, für die strukturierte Daten innerhalb von HTML-Seiten erforderlich sind (über RDFa 1.1).

Der von OCLC Research über viele Monate entwickelte Prototyp wird nun versuchsweise eingesetzt.

Mit dem Vokabular von Schema.org (erweitert um das vorgeschlagene Bibliotheksvokabular) als Grundlage für die Modellierung werden die bibliografischen Daten von WorldCat eine umfassende Erfassung und Verwendung dieser Daten durch Suchmaschinen und andere Systeme ermöglichen.

Durch die Bereitstellung von WorldCat.org sowohl für Programme als auch für menschliche Benutzer können Dienste nun Bibliotheksdaten verarbeiten und effektivere Verknüpfungen zwischen diesen und anderen Internetressourcen herstellen Unser Ziel hierbei lautet, WorldCat – und das darin steckende geballte Bibliotheksfachwissen – für alle an bibliografischen Informationen im Internet Interessierte zu einem wertvollen Bezugspunkt auszubauen.

Bitte beachten Sie, dass es sich nicht um ein statisches Programm handelt, sondern um ein erstes Versuchsprojekt, das sich im Lauf der Zeit mit den Rückmeldungen von Bibliotheken und anderen Benutzern aus dem Internet ändern wird.

Herunterladbarer Linked Data-Satz für 1,2 Millionen WorldCat-Ressourcen

Im August 2012 wurden bibliografische Informationen als Linked Data für nahezu 1,2 Millionen WorldCat-Ressourcen – mit circa 80 Millionen Tripel – als herunterladbarer Datensatz veröffentlicht, der hier zur Verfügung steht (860 Mb gzip). Die Linked Data werden dabei als RDF-Serialisierung bereitgestellt und bedienen sich sowohl der Schema.org-Ontologie als auch der Bibliothekserweiterungen zu Schema.org, die OCLC im Laufe des vergangenen Jahres mit Mitgliedern und Partnern erarbeitet hat. Daran ist die Hoffnung geknüpft, dass sich diese Ressource als nützliche Quelle für rohe Linked Data erweist und somit Informationen über Werke, Autoren und Verlage leichter zerlegt und wieder neu zusammengesetzt werden können. Damit wird ein großartiges Tool zur Verfügung gestellt: sowohl für Forscher in den Bibliothekswissenschaften als auch für diejenigen, die kulturelle, historische, soziologische oder andere Forschungszwecke verfolgen und dabei auf die vielfältigen Daten zurückgreifen wollen, die Bibliotheken seit Jahrzehnten in WorldCat einpflegen. Die Daten können im Rahmen einer ODC-BY-Lizenz heruntergeladen werden.

Lizenz

Die auf WorldCat.org versuchsweise eingestellten Linked Data werden von OCLC im Rahmen einer sogenannten Open Data Commons Attribution-Lizenz (allgemeinverständliche Zusammenfassung) bereitgestellt, unter Verweis auf die Gemeinschaftsnormen, die von den Mitgliedern des OCLC-Verbunds, die WorldCat aufgebaut haben, formuliert wurden.

Die Lizenz gestattet die Verwendung der Daten u.a. zu Studien- und Forschungszwecken und sieht eine Namensnennung in abgeleiteten Werken vor, die auf Grundlage des Datensatzes erstellt wurden. Sollten Sie die bibliografischen Daten für andere Zwecke verwenden wollen, bitten wir Sie – unabhängig davon, ob Sie ein Mitglied von OCLC sind oder nicht – um die Kenntnisnahme und Beachtung der Gemeinschaftsnormen. Wenn Sie Hinweise oder Anmerkungen zu den Gemeinschaftsnormen haben, können Sie sich gerne an uns wenden. Bitte beachten Sie diese Richtlinien, die Hinweise und Beispiele dafür enthalten, wie die im Rahmen der ODC-BY-Lizenz geforderte Namensnennung erfüllt werden kann.

Fragen, Diskussion und Feedback

Mit der Einstellung dieser Versuchsdaten beginnt ein schrittweiser Prozess, der im Lauf der Zeit für eine Verbesserung in der Praxis sorgen wird. Diese neue Ressource in Form von Linked Data soll nicht nur genutzt, sondern auch von der Bibliotheksgemeinschaft sowie anderen Internetnutzern kommentiert und diskutiert werden. Als Hilfestellung für die Diskussion pflegen wir eine Liste mit bekannten Fragen im Hinblick auf die Nutzung von Schema.org- und Bibliotheksvokabular sowie die praktischen Überlegungen bei der Einbettung von Linked Data in WorldCat.org-Seiten.

Das OCLC Developer Network steht allen offen – wir freuen uns über Ihre Anmeldung und Ihre Mitwirkung in der Diskussionsgruppe. Alternativ können Sie uns Ihr Feedback auch direkt an data@oclc.org senden.

Wir sind eine weltweite Bibliotheksorganisation, die 1967 von Mitgliedern gegründet wurde und von ihnen verwaltet wird. Diese Gemeinschaft setzt sich im öffentlichen Interesse für den breiteren Zugang zum weltweiten Wissen und die Senkung der damit verbundenen Kosten ein.