Deutschland, Österreich, Schweiz

  • Deutsch

Erkennung und Löschung von doppelten Einträgen

Derzeit wird eine neue Software zur Erkennung und Löschung von Doppeleinträgen eingesetzt. Eine Prüfung der gesamten WorldCat-Datenbank (beginnend mit OCLC #1) wurde vom 2. Februar 2010 bis 30. September 2010 durchgeführt. Insgesamt wurden 166.422.941 Einträge überprüft und 5.126.132 Doppeleinträge entfernt.

Darüber hinaus wurde am 26. Januar 2010 ein separater Vorgang gestartet, bei dem ausgewählte neue Einträge und ersetzte Einträge aus täglich erstellten Protokolldateien geprüft werden. Diese Überprüfung wird fortgesetzt.

Geschichte

Seit 1991 setzt OCLC seine Software „Duplicate Detection and Resolution“ (DDR) zum Abgleich bibliografischer Einträge in WorldCat im Buchformat ein, um so Dubletten zu finden und zusammenzuführen.

Bis Mitte 2005, als WorldCat auf seine neue Plattform migrierte, hatten 16 Prüfungen von WorldCat stattgefunden, mit deren Hilfe insgesamt 1,6 Millionen doppelte Einträge gelöscht werden konnten.

Im Jahr 2005 wurde ein Projekt zur Überarbeitung der Software ins Leben gerufen, um deren Funktionalität in der neuen Umgebung sicherzustellen und dahingehend zu erweitern, dass sämtliche Arten von bibliografischen Einträgen geprüft werden können. Dieses umfassende mehrjährige Projekt trägt jetzt Früchte. So wurden umfangreiche Verbesserungen, die nun wesentlicher Bestandteil der neuen Software sind, an der Abgleichsoftware vorgenommen und auch in den Stapelladeprozess integriert. Damit sind die Software und die Stapelladeprozesse in puncto Lösung des Problems der Doppeleinträge in WorldCat wie nie zuvor aufeinander abgestimmt.

Im Mai 2009 wurde die neue Software nach konsequenter Planung, Entwicklung und Überprüfung schließlich in Betrieb genommen. Neben ihrer Fähigkeit, Sammelwerke, Partituren, Tonaufnahmen, Bildmaterialien, Landkarten, elektronische Ressourcen sowie Bücher zu bearbeiten, zeichnet sich die Software gegenüber ihrer Vorgängerversion durch ihr wesentlich höheres Leistungsvermögen bei der Unterscheidung zwischen berechtigten und falschen Übereinstimmungen aus. Zudem können mit ihr bestimmte Kategorien von bibliografischen Einträgen ausgewählt und anschließend auf Doppeleinträge überprüft werden. Der Abgleich kleiner Teilmengen von WorldCat mit der Live-Datenbank hat begonnen. Eine vollständige Prüfung der WorldCat-Datenbank begann im Februar 2010 und endete im September 2010.

Dank des Einsatzes der neuen Software zur Erkennung und Löschung von Doppeleinträgen wird eine Vielzahl bibliografischer Einträge zusammengeführt. Die teilnehmenden Bibliotheken werden feststellen, dass weniger doppelte Einträge in WorldCat angezeigt werden. Besonders deutlich wird diese Verbesserung bei Einträgen für Noten, Tonaufnahmen und audiovisuellen Medien, da Dubletten in diesen Bereichen von der bisher verwendeten Software nicht erkannt wurden. Mit der regelmäßigen Entfernung doppelter Einträge hat WorldCat für alle Nutzer noch mehr Vorteile.

DDR-Statistik

Zwischen Mai 2009 und 30. Juni 2013:

  • 342.080.141Einträge wurden mit DDR geprüft
  • 11.294.384 Dubletten wurden gelöscht

Sie haben Bedenken in Bezug auf die Zusammenführung?

Es wurden alle Anstrengungen unternommen, um nicht sinnvolle Zusammenführungen zu verhindern. Da DDR ein automatisierter Prozess ist, kann in Ausnahmefällen eine unangemessene Zusammenführung auftreten. Wenn Sie einen Datensatz bemerken, bei dem es sich um eine unangemessene Zusammenführung handelt, informieren Sie uns bitte unter bibchange@oclc.org. OCLC-Mitarbeiter prüfen daraufhin den fraglichen Eintrag und machen im Bedarfsfall die Zusammenführung rückgängig.

Wir sind eine weltweite Bibliotheksorganisation, die 1967 von Mitgliedern gegründet wurde und von ihnen verwaltet wird. Diese Gemeinschaft setzt sich im öffentlichen Interesse für den breiteren Zugang zum weltweiten Wissen und die Senkung der damit verbundenen Kosten ein.