Deutschland, Österreich, Schweiz

  • Deutsch

OCR-Erweiterung

OCR-Texterkennung in den Sammlungsaufbau integrieren

Die CONTENTdm OCR-Erweiterung ermöglicht Ihnen, die OCR-Texterkennungsfunktion (Optical Character Recognition) in den Aufbau digitaler Sammlungen einzubinden. Im Zuge des OCR-Prozesses werden textbasierte Bilddateien (Format TIFF oder JPEG) in entsprechende ASCII-Textdateien umgewandelt, die im Volltextmodus durchsucht werden können.

Mithilfe der OCR-Erweiterung können Sie Volltextabschriften textbasierter Bilddateien generieren. Die OCR-Erweiterung lässt sich zu jeder neuen oder bereits vorhandenen CONTENTdm-Lizenz hinzufügen und ist im Lieferumfang bestimmter Lizenzberechtigungen bereits enthalten.

Sie unterstützt zudem 184 Sprachen, darunter Chinesisch, Japanisch, Koreanisch, Griechisch, Russisch und Hebräisch.

Textbasierte Bilddateien für die Volltextsuche aufbereiten

Die OCR-Erweiterung verwendet die preisgekrönte ABBYY-Software FineReader, um OCR-Text zu erfassen und zu durchsuchbaren Metadatenfeldern in CONTENTdm-Sammlungen hinzuzufügen. In Objekten, die mit dieser Funktion aufbereitet wurden, werden Treffer im angezeigten Bild als markierte Suchbegriffe dargestellt.

[Screenshot]

Bei Metadaten, die mit der CONTENTdm OCR-Erweiterung aufbereitet wurden, werden Treffer im Bild als markierte Suchbegriffe dargestellt.

Druckfähige PDF-Dateien erstellen

Um Endbenutzern druckfähige PDF-Dateien zur Verfügung zu stellen, haben Sie außerdem die Option, mehrteilige Objekte mithilfe der OCR-Erweiterung in Form einer einzigen PDF auszugeben. Ob auf ausgewählte Objekte in einer Kollektion angewendet oder auf größere Dokumentarchive, die integrierte OCR-Funktion macht den Aufbau Ihrer Sammlungen spürbar effizienter.