Canada

Détection des notices en double et résolution (DDR)

Le logiciel DDR (Duplicate Detection and Resolution) est désormais entièrement opérationnel. Une analyse complète de la base WorldCat (commençant par OCLC #1) a débuté le 1er février 2010 et s'est terminée le 30 septembre 2010. Un total de 166 422 941 notices ont été traitées et 5 126 132 notices en double ont été supprimées.

En outre, un processus distinct qui examine les nouvelles notices sélectionnées et les notices remplacées dans les fichiers journaux d'un jour donné a démarré le 26 janvier 2010. Ce processus est encore en cours.

Historique

En 1991, OCLC lance son logiciel de détection et d'élimination des doublons (Duplicate Detection and Resolution, DDR), qui permet de supprimer les doublons par une mise en correspondance des notices bibliographiques de WorldCat pour le format Poche avec ses propres notices.

À l'été 2005, lors de la migration de WorldCat vers sa nouvelle plate-forme, seize analyses avaient déjà été réalisées, permettant ainsi l'élimination d'1,6 million de doublons.

L'année 2005 vit également le lancement d'un projet visant à réinventer le logiciel DDR afin de l'adapter au nouvel environnement et d'étendre ses fonctionnalités à tous les types de notices bibliographiques. Ce grand projet, prévu sur plusieurs années, porte aujourd'hui ses fruits. Des améliorations significatives ont été apportées régulièrement aux processus de chargement par lots de notre logiciel de mise en correspondance DDR et constituent désormais une composante clé de sa nouvelle version. Cela permet d'utiliser pour la première fois les processus de détection et d'élimination des doublons avec les processus de chargement par lots pour régler le problème des doublons dans les notices de WorldCat.

En mai 2009, le nouveau logiciel a été mis en production après des phases de planification, de développement et de test rigoureuses. Outre sa capacité à gérer ressources continues, partitions musicales, enregistrements sonores, documents visuels, cartes et autres ressources électroniques en plus des livres, ce nouveau logiciel de détection et d'élimination des doublons est nettement plus sophistiqué que son prédécesseur. Il est en effet désormais capable de distinguer les correspondances légitimes des doublons superflus. Il permet par ailleurs de sélectionner de manière flexible certaines catégories de notices bibliographiques pour la recherche et l'élimination des doublons. Le traitement de petits sous-ensembles de WorldCat par mise en correspondance avec la base de données en ligne a débuté. Une analyse complète de la base de données WorldCat a commencé en février 2010 et s'est achevée en septembre 2010.

La mise en production du nouveau logiciel DDR permet de fusionner un grand nombre de notices bibliographiques. Les bibliothèques pourront noter la diminution du nombre de doublons dans WorldCat. Cela devrait être particulièrement visible dans le cas des partitions musicales, des enregistrements sonores et des documents audiovisuels, étant donné que la précédente version du logiciel DDR ne prenait pas en charge ces types de doublons. Grâce à l'élimination régulière des doublons, les utilisateurs bénéficient d'une base de données WorldCat optimale.

Statistiques DDR

De mai 2009 à 30 juin 2013 :

  • 342 080 141notices ont été traitées par le logiciel DDR.
  • 11 294 384 notices en double ont été supprimées.

Des questions sur la fusion de notices?

Tout a été mis en œuvre pour éviter des fusions inappropriées. DDR étant un processus automatisé, des fusions malencontreuses peuvent cependant avoir lieu. Si vous remarquez une notice qui semble être le résultat d'un tel processus, veuillez le signaler en envoyant un courriel à l'adresse bibchange@oclc.org. Le personnel OCLC examinera les notices en question et, si possible, annulera la fusion une fois l'erreur avérée.

Nous sommes une coopérative mondiale de bibliothèques qui appartient à, est gouvernée et entretenue par, ses membres depuis 1967. Notre utilité publique est une déclaration d’engagement les uns envers les autres, plus précisément que nous travaillerons ensemble pour améliorer l’accès aux informations détenues par les bibliothèques à travers le monde et trouverons des façons de réduire les coûts des bibliothèques par le biais de la collaboration. Plus de détails »