Nederland

  • Nederlands

Achtergrondnotitie m.b.t. Regeling gebruik data Centrale Pica Database

Voor bibliotheken is niet altijd duidelijk waarom er beperkingen gelden voor het gebruik van de data die zijn verzameld in de Centrale Pica-database. Deze notitie wil dit toelichten.

Aanvankelijk begon Pica als een project van een aantal universiteitsbibliotheken en de KB om gezamenlijk te profiteren van de mogelijkheden die automatisering bood. Na een verkennende fase werd een bureau ingericht (toen nog gehuisvest in de KB) en vanaf ongeveer 1976 een database ingericht en opgebouwd met hierin de data die voorheen op een cataloguskaartje vermeld werden. De deelnemers verplichtten zich alle publicaties die ze aanschaften in deze database te catalogiseren, zodat niet één al het werk zou doen en de ander zou afwachten tot hij alleen nog maar de titel zou kunnen kopiëren voor eigen gebruik, 'ontlenen' genoemd in het jargon. Het Gemeenschappelijk Geautomatiseerd Catalogiseersysteem (GGC) (het functionele en technische ontwerp, de software etc.) om dit gezamenlijk catalogiseren in één gezamenlijke, centrale database mogelijk te maken werd hiermee geboren.

Omdat het een aanzienlijke efficiencywinst voor bibliotheken betekende niet zelf de volledige aanschaf geheel te catalogiseren kozen meer bibliotheken aan het systeem deel te nemen. De eerste formalisering van het project was de oprichting van het Samenwerkingsverband Pica (met als leden degenen die nu onder de UKB vallen). Hieraan namen de universiteitsbibliotheken en de KB deel en er werden afspraken gemaakt over inrichting en gebruik van het GGC. Omdat er aan een record (metadata van een titel in de database) ook holdinggegevens werden toegevoegd (welke bibliotheek de publicatie in zijn bezit had) werd een nieuwe dienst toegevoegd: het IBL, interbibliothecair leenverkeer.

Ook de openbare bibliotheken, verenigd in wat toen LBC heette (Landelijke Bibliotheek Centrale) en een aantal WSF-bibliotheken (grote openbare bibliotheken met een wetenschappelijke steunfunctie) zagen het belang van een centrale database en sloten zich aan.

In 1985 werd besloten een rechtspersoon op te richten omdat de dienstverlening steeds grotere omvang begon aan te nemen. Dit werd Stichting Centrum voor Bibliotheekautomatisering Pica, later vereenvoudigd tot Stichting Pica. Hierin namen bestuursleden namens het Samenwerkingsverband deel alsmede namens de openbare bibliotheken (NBLC).

De twee diensten GGC en NCC/IBL die zijn gebaseerd op de Centrale Pica Database met metadata en holdinggegevens zijn in de loop der tijd aangevuld met andere diensten verleend door Pica: lokale diensten (LBS), eindgebruikersdiensten (NCC/Online Contents/PiCarta/Publiekwijzer) Daarnaast ging Pica vanaf de jaren '90 internationaal door de software die aan de twee genoemde diensten ten grondslag ligt genaamd CBS (Centraal Bibliotheek Systeem), aan consortia/partners in het buitenland te licentiëren. Dit maakte het mogelijk te blijven innoveren voor de redelijk verzadigde Nederlandse markt. Daarnaast zocht Pica naar samenwerkingsmogelijkheden met andere bibliotheekaanbieders om innovaties ondanks een beperkt budget te kunnen doorvoeren. Dit bleek echter niet eenvoudig te realiseren op basis van contractuele afspraken alleen. Om die reden werd besloten de activiteiten van Stichting Pica onder te brengen in een B.V., om zo een derde partij te kunnen laten participeren in Pica. Op het moment dat dit besloten werd was al bekend dat OCLC Online Library Computer Center, Inc. uit Amerika deze derde partij zou zijn en dat OCLC een meerderheidsbelang zou krijgen (60%, gerealiseerd in 2000).

OCLC heeft een soortgelijke ontstaansgeschiedenis als Pica. Begonnen als een initiatief van de Ohio State University is dit uitgegroeid tot een samenwerkingsverband in een juridisch jasje: een not-for profit cooperative (Inc).

In beide gevallen geldt dat er een collectief belang ten grondslag lag aan de samenwerking. De regels voor gebruik die gelden voor GGC en IBL zijn bepaald door de bibliotheken zelf en gebaseerd op een gezamenlijk belang om een goede kwaliteit te realiseren, met complete en accurate data.

De organisatiestatuten van OCLC verwoorden het heel fraai: "Het tot stand brengen, onderhouden en beheren van een geautomatiseerd bibliotheeknetwerk en het bevorderen van de evolutie van bibliotheekgebruik, van de bibliotheken zelf en van het beroep bibliothecaris, en het faciliteren van processen en leveren van producten ten voordele van bibliotheken en bibliotheekgebruikers, inclusief doelstellingen als het vergroten van de beschikbaarheid van bibliotheekbronnen voor de individuele gebruikers en het verkleinen van de kostentoename van bibliotheekhandelingen, alles ten behoeve van de fundamentele publieke doelstelling om de gemakkelijke toegang tot en het gebruik van de steeds groeiende hoeveelheid wetenschappelijke, literaire en educatieve kennis en informatie te bevorderen."

Data
De gerealiseerde databases van Pica en OCLC zijn tot stand gekomen met de input van deelnemende bibliotheken die de metadata en holdings aan de database hebben toegevoegd. Het is voor bibliotheken niet altijd goed te begrijpen waarom de data die in de centrale database zitten niet onbeperkt hergebruikt mogen worden: 'De data zijn van ons'. Deze redenering lijkt sterk maar behoeft nuance. Een bibliotheek behoudt het volledige recht op een record zoals dat door haar is ingevoerd. De meerwaarde van de database is echter dat een bibliotheek het merendeel van de records kan ontlenen en er eventueel nog nadere gegevens aan kan toevoegen. Daarnaast is er geïnvesteerd in het kopen van data van andere partijen en het ontwikkelen van innovaties, verbeteringen en het beheren van de kwaliteit van de data (bijv. ontdubbelen, onderwerpsclassificaties, thesauri). Bibliotheken zouden kunnen stellen dat zij hiervoor betalen/betaald hebben. Bij OCLC Inc. werden en worden 'credits' gegeven voor bibliotheken die een nieuw catalogusrecord toevoegen en zijn bibliotheken op die manier gecompenseerd voor hun bijdrage. Voor de Nederlandse situatie is voor het model gekozen dat er een lagere bijdrage wordt gevraagd van met name de grote catalogiserende bibliotheken die een lumpsum bedrag betaalden voor onbeperkt gebruikt, terwijl de kleinere op tariefbasis moeten afrekenen. Tevens zijn deze bibliotheken als collectief financieel gecompenseerd bij de verkoop van de aandelen van Pica B.V. waardoor de huidige Stichting Pica een fonds heeft om projecten die de Nederlandse informatie infrastructuur ten goede komen te subsidiëren.

Daarbij moet bedacht worden dat totdat OCLC een meerderheid in Pica verkreeg, (vertegenwoordigers namens) de bibliotheken de bestuurders van Pica waren en de gezamenlijke belangen hebben behartigd. Omdat OCLC een sterk verwante structuur heeft met veel zeggenschap voor de deelnemende bibliotheken en er in 2007 een consortium is opgericht om de gezamenlijk belangen te behartigen speelt de collectiviteit en instandhouding van nog steeds een grote rol in de Nederlandse infrastructuur. Indien de data volledig vrij zouden zijn zou de unieke database en infrastructuur kunnen verdwijnen omdat deze niet meer door een collectief wordt gedragen, noch qua input noch financieel. Het risico is dat het individuele korte termijn belang dat van het collectief en de lange termijn zou ondermijnen. Om die reden zijn ook de bibliotheken die deelnemen aan WorldCat bij de herziening van de WorldCat policy niet tot de conclusie gekomen dat de data volledig vrij hergebruikt mogen worden. In Nederland zijn de rechten op de data als geheel veiliggesteld in de Stichting Pica Database voor het geval dat OCLC de diensten niet meer voortzet, failliet gaat of ernstig in gebreke blijft. Uiteindelijk zijn de data en zelfs ook OCLC 'van ons'!

Dit is de uitleg van OCLC Inc. (vertaald uit de FAQ bij de Record Policy)
Waarom zijn WorldCat-gegevens niet gewoon open en beschikbaar voor iedereen in het openbaar domein? Stel u voor wat er zou gebeuren mocht WorldCat (of een aanzienlijk deel ervan) worden vrijgegeven in het openbaar domein: tijdens het overdragen van grote hoeveelheden WorldCat-gegevens aan organisaties van niet-leden. In dat geval zouden leden eigenlijk de belangrijkste activa van het coöperatief overdragen aan organisaties zonder de verplichting om erin te investeren. Analyse van het beleid inzake gebruik van gegevens door de Record Use beleidsraad [die de regeling heeft vormgegeven en die bestond uit bibliotheekleden] suggereert dat dit zou leiden tot meer 'free riding', de stimulans om lid te zijn verminderen en uiteindelijk de economische levensvatbaarheid van de coöperatie in het gedrang zou brengen. Het nut van de database voor leden, hun partners en agenten en andere organisaties zou ook worden gecompromitteerd naarmate WorldCat fragmenteert met als gevolg minder uitgebreide gegevenstoevoer, sporadische inspanningen voor gezamenlijke kennisorganisatie, stijgende kosten voor resource sharing en verminderende wereldwijde raadpleging en zichtbaarheid van collecties van leden.

De nu voorgestelde regeling voor data in de Centrale Pica Database beoogt nauw aan te sluiten bij de nieuwe WorldCat policy. Doel daarbij is het hergebruik van data te optimaliseren zonder dat daarbij de lange termijn en het collectieve belang in gevaar komt.

De strategie van OCLC voor de toekomst is van WorldCat een Open Platform te maken waarop applicaties worden aangeboden van OCLC zelf maar waar ook derde partijen hun applicatie op kunnen bouwen. Het hebben van een abonnement op de basisservice/het platform is dan een vereiste om de derde partij de technische tools daarvoor te geven (WorldCat API krijgt niet iedereen). Het concept van de Nederlandse Bibliotheek Catalogus kan hierin worden gepast.

OCLC, nov. 2011