Skip to page content

亚洲太平洋地区 (Chinese Simplified) 更改
CONTENTdm : CONTENTdm 选项 : OCR 扩展功能

OCR 扩展功能

将 OCR 与馆藏建设相融合

CONTENTdm OCR 扩展功能使您能够在建设数字馆藏时使用 OCR (光学字符识别)。OCR 过程将文字类图像文件(TIFF 或 JPEG file)转换为 ASCII 文本文件,使之全文可被搜索。

使用 OCR 扩展功能从基于文字的图像文件生成全文的文本。OCR 扩展功能可增加至现有或新的 CONTENTdm 许可中,并包括在所购买的部分许可等级中。

该扩展功能支持 184 种语言,包括中文、日语、韩语、希腊语、俄语、希伯来语及其他语种。

文字类图像文件全文可被搜索

该 OCR 扩展功能采用 ABBYY 荣获大奖的 FineReader OCR 软件捕获文本内容,添加至 CONTENTdm 馆藏中的可搜索元数据域。有了此功能,查看时在图片上高亮显示出最终用户的搜索词。

[屏幕捕获]

使用 CONTENTdm OCR 扩展功能处理元素据时,图片上高亮显示搜索词。

创建可打印 PDF 文件

此外,如果您希望制作可打印 PDF 文件以供最终用户轻松打印,您能选择使用 OCR 扩展功能生成一个完整的复合对象的 PDF 文件。无论是用于选择馆藏中的资料或者众多的文件档案,集成的 OCR 能力将使得馆藏建设更为有效。