Latin America and Caribbean

Duplicate Detection and Resolution

O software DDR (Duplicate Detection and Resolution) agora está em plena operação. Uma execução da base de dados inteira do WorldCat (começando com OCLC #1) começou em 2 de fevereiro de 2010 e foi concluída em 30 de setembro de 2010. Um total de 166.422.941 registros foram processados e 5.126.132 de registros duplicados foram eliminados.

Além disso, um processo separado, que examina registros novos e substituídos selecionados dos arquivos de periódicos diariamente, começou a ser executado em 26 de janeiro de 2010. Esse processo continuará.

Histórico

No início de1991, a OCLC utilizou seu software DDR (Duplicate Detection and Resolution) para comparar os registros bibliográficos em formato de livro do WorldCat com os da OCLC, podendo assim identificar e eliminar as duplicatas.

Até meados de 2005, quando o WorldCat migrou para sua nova plataforma, foram executadas dezesseis verificações no WorldCat que resultaram na eliminação de um total de 1,6 milhão de registros duplicados.

Em 2005, foi iniciado um projeto de renovação do software DDR para adaptá-lo ao novo ambiente e ampliar seus recursos para que oferecesse suporte a todos os tipos de registros bibliográficos. Agora, este grande e demorado projeto está dando frutos. Grandes melhorias – que são um grande diferencial do novo DDR – estão sendo regularmente incorporadas ao recurso de processamento de lotes do nosso software de localização de correspondências. Isso ajuda como nunca a promover o alinhamento do DDR e dos processamentos de lotes para eliminar o problema de registros duplicados do WorldCat.

Em maio de 2009, o novo software começou a ser produzido atendendo a um rigoroso processo de planejamento, desenvolvimento e teste. Além de suportar recursos continuados, partituras, gravações de som, materiais visuais, mapas, recursos eletrônicos e também livros, o novo DDR é muito mais sofisticado que seu antecessor no que se refere à capacidade de distinguir correspondências legítimas de falsas suspeitas. Ele também possui flexibilidade para permitir a seleção de determinadas categorias de registros bibliográficos para eliminação de duplicatas. O processo de comparação entre pequenos subconjuntos do WorldCat e todo o nossa base de dados já começou. A base de dados do WorldCat começou a ser verificada na íntegra em fevereiro de 2010 e o processo terminou em setembro de 2010.

Com o novo software DDR, estamos eliminando um grande número de registros bibliográficos duplicados. As bibliotecas perceberão menos registros duplicados no WorldCat. Isso deve ser visível especialmente para partituras, gravações sonoras e materiais de AV, já que o software DDR anterior não abrangia essas duplicatas. A remoção regular de duplicatas proporciona um WorldCat melhor a todos os seus usuários.

Estatísticas do DDR

Entre maio de 2009 e 30 de junho de 2013:

  • 342.080.141registros foram processados por meio do DDR
  • 11.294.384 registros duplicados foram removidos

Pensando em uma mescla?

Foram empreendidos todos os esforços para evitar mesclas inadequadas. Como DDR é um processo automatizado, ocasionalmente podem ocorrer mesclas inadequadas. Caso observe um registro que pareça ser uma mescla inadequada, por favor, relate isso para o e-mail bibchange@oclc.org. A equipe da OCLC examinará os registros em questão e, se possível, reverterá a mescla caso seja inadequada.

Somos uma cooperativa mundial de bibliotecas mantida, administrada e de propriedade de nossos membros desde 1967. Nossa finalidade pública é uma declaração de compromisso mútuo — que vamos trabalhar juntos para melhorar o acesso às informações contidas em bibliotecas de todo o mundo, e encontrar formas de reduzir os custos para as bibliotecas por meio da colaboração. Saiba mais »