Nederland

  • Nederlands

OCR-uitbreiding

Integreer OCR bij het vormen van collecties

Met de CONTENTdm OCR-uitbreiding integreert u OCR (optical character recognition/optische tekenherkenning) bij het bouwen van digitale collecties. In het OCR-proces wordt een grafisch bestand met tekst (een tiff- of jpeg-bestand) omgezet in een corresponderend ASCII-tekstbestand dat volledig kan worden doorzocht.

Gebruik de OCR-uitbreiding om fulltext transcripties te genereren van grafische bestanden met tekst. De OCR-uitbreiding maakt deel uit van sommige licentieniveaus, maar u kunt elke nieuwe of bestaande CONTENTdm licentie uitbreiden met OCR.

De OCR-uitbreiding ondersteunt 184 talen waaronder Chinees, Japans, Koreaans, Grieks, Russisch en Hebreeuws.

Maak doorzoekbare tekstbestanden van grafische bestanden

De OCR-uitbreiding maakt gebruik van de bekroonde OCR-software FineReader van ABBYY om doorzoekbare velden met metadata toe te voegen aan CONTENTdm collecties. Deze functie zorgt ervoor dat zoekwoorden van eindgebruikers tijdens de weergave in de afbeelding worden gemarkeerd.

[schermafbeelding]

Gemarkeerde zoekwoorden zijn zichtbaar in een afbeelding als de metadata zijn voorbereid met de CONTENTdm OCR-uitbreiding.

Afdrukbare pdf's maken

Bovendien kunt u instellen dat de OCR-uitbreiding een pdf maakt van een volledig samengesteld object zodat eindgebruikers gevonden documenten eenvoudig kunnen afdrukken. Met de geïntegreerde OCR-functie vormt u doeltreffend een collectie, ongeacht of het hulpmiddel nu wordt toegepast op geselecteerde items in een collectie of op uitgebreide documentarchieven.