Nederland

  • Nederlands

OCLC levert downloadbaar linked data bestand voor de miljoen meest voorkomende werken in WorldCat

Leiden, 14 augustus 2012—OCLC heeft bibliografische linked data beschikbaar gemaakt voorde meest voorkomende werken in WorldCat. Dit downloadbare bestand – dat bijna 1,2 miljoen bronnen vertegenwoordigt – bevat ongeveer tachtig miljoen linked data ‘triples’, de term voor de relatie op het diepst mogelijke niveau tussen afzonderlijke delen van informatie.

“Dit is een belangrijke stap voor bibliotheken en linked data,” zegt Richard Wallis, technology evangelist bij OCLC. “Organisaties die linked data diensten willen ontwikkelen, kunnen met deze dataset experimenteren voordat ze een volledige ontwikkeling opstarten. Ze zullen ook nieuwe diensten kunnen onderwerpen aan een stress-test met een zeer grote en belangrijke set actuele linked data van bibliotheken. We kijken met grote belangstelling uit naar wat mensen zullen doen met deze data.”

De linked data zijn beschikbaar als RDF-serialisatie en gebruiken zowel de Schema.org ontologie als bibliotheekuitbreidingen op Schema.org waar OCLC het afgelopen jaar met leden en partners aan gewerkt heeft. Ze zijn beschikbaar onder een ODC-BY licentie, in één enkel, gecomprimeerd (GZip) bestand van 1 GB, die hier kan worden gedownload.

Hoewel WorldCat bibliografische records bevat voor meer dan 275 miljoen items, is ervoor gekozen om de meest voorkomende materialen te selecteren voor deze release, zodat het bestand een beheersbare omvang houdt. Jeff Young, de OCLC Research architect van de software die veel aan de opzet werkte die nodig was voor het genereren van de linked data, legt uit: “Om geselecteerd te worden moest een bron in bezit zijn van ten minste 250 bibliotheken. Dit leek ons een goede balans tussen breed bruikbare data en een redelijke beheersbaarheid voor de meeste gebruiksvormen.”

“OCLC verwacht dat het bestand bruikbaar zal zijn als een bron van onbewerkte data. Informatie over werken, auteurs en uitgevers kan in deze opzet veel makkelijker worden afgesplitst en opnieuw gecombineerd,” aldus Young. “Hierdoor hebben we een geweldig instrument voor onderzoekers in bibliotheekwetenschap, en voor hen die cultureel, historisch, sociologisch of ander onderzoek willen doen op basis van de rijke data die bibliotheken al decennia lang in WorldCat laden.”

“Deze release zal het gemakkelijker maken voor de bredere linked data gemeenschap – commerciële leveranciers, detailhandel, onderzoekers en wetenschappers – om bibliotheekinformatie in hun werkprocessen in te voegen,” voegt Mike Teets toe, vicepresident voor innovatie bij OCLC.“ Dit zal het ook makkelijker maken voor bibliotheken om hetzelfde omgekeerd te doen: hun materialen terug naar het internet verbinden via diensten die mensen elke dag gebruiken.”

In juni van dit jaar voegde OCLC Schema.org tags toe aan WorldCat.org records, waarmee de manier werd verbeterd waarop bibliotheekinformatie in zoekmachines wordt gepresenteerd. OCLC heeft ook linked data bronnen ontwikkeld voor het Dewey Decimal Classification System, FAST (Faceted Application of Subject Terminology) en de VIAF (Virtual International Authority File) dienst. De publicatie van deze 1,2 miljoen records als linked data is de volgende stap in OCLC’s strategie voor linked data.

“We richten onze inspanningen erop om WorldCat data in toegankelijke vormen te brengen voor experimenteren en ontwikkeling,” legt Teets uit, “met het doel dat dit bibliotheken op de kaart zal zetten als betrouwbaar middelpunt voor linked data.”

“Dit is echt een inspanning die input nodig heeft van vele bronnen,” vervolgt Teets. “Linked data op deze manier ontwerpen en genereren vergt veel keuzes in vocabulaire en opzet, en we willen zoveel mogelijk input en commentaar krijgen van bibliotheken.”

Om bij te dragen in de discussie over linked data van bibliotheken kan men zich opgeven voor deelnemen in het linked data discussieforum op het OCLC Developer Network, of men kan ideeën en gedachten (in het Engels) per e-mail insturen naar data@oclc.org.

Over OCLC

OCLC is opgericht in 1967, als organisatie zonder winstoogmerk en op basis van lidmaatschap, die diensten levert en onderzoek uitvoert ten behoeve van bibliotheken, met het doel voor iedereen de toegang tot informatie over de hele wereld te vergroten en de kosten hiervan terug te dringen. Meer dan 72.000 bibliotheken in 170 landen gebruiken OCLC diensten voor het vinden, verwerven, catalogiseren, uitlenen en conserveren van hun materialen. Onderzoekers, studenten, docenten, wetenschappers, bibliotheekmedewerkers en andere informatiezoekers maken gebruik van de OCLC diensten om bibliografische informatie, samenvattingen en fulltext-informatie op te vragen, waar en wanneer ze die maar nodig hebben. OCLC en de deelnemende bibliotheken werken samen aan het vormen en onderhoud van WorldCat, de grootste online database voor het ontdekken van bibliotheekbronnen (ook doorzoekbaar via www.worldcat.org). In Nederland verzorgt OCLC de gemeenschappelijke informatie-infrastructuur, met onder meer het GGC, de NCC, IBL-diensten en PiCarta.

OCLC, WorldCat.org, WorldCat, GGC, NCC en PiCarta zijn handelsmerken en/of dienstmerken van OCLC, Inc. Product-, dienst- en bedrijfsnamen van derden zijn handelsmerken en/of dienstmerken van hun respectieve eigenaren.

Voor meer informatie

  • Bob Murphy

    Bob Murphy

    Manager, Media Relations

    O: 614-761-5136