|
CONTENTdm : CONTENTdm 选项 : OCR 扩展功能
OCR 扩展功能将 OCR 与馆藏建设相融合CONTENTdm OCR 扩展功能使您能够在建设数字馆藏时使用 OCR (光学字符识别)。OCR 过程将文字类图像文件(TIFF 或 JPEG file)转换为 ASCII 文本文件,使之全文可被搜索。 使用 OCR 扩展功能从基于文字的图像文件生成全文的文本。OCR 扩展功能可增加至现有或新的 CONTENTdm 许可中,并包括在所购买的部分许可等级中。 该扩展功能支持 184 种语言,包括中文、日语、韩语、希腊语、俄语、希伯来语及其他语种。 文字类图像文件全文可被搜索该 OCR 扩展功能采用 ABBYY 荣获大奖的 FineReader OCR 软件捕获文本内容,添加至 CONTENTdm 馆藏中的可搜索元数据域。有了此功能,查看时在图片上高亮显示出最终用户的搜索词。
使用 CONTENTdm OCR 扩展功能处理元素据时,图片上高亮显示搜索词。 创建可打印 PDF 文件此外,如果您希望制作可打印 PDF 文件以供最终用户轻松打印,您能选择使用 OCR 扩展功能生成一个完整的复合对象的 PDF 文件。无论是用于选择馆藏中的资料或者众多的文件档案,集成的 OCR 能力将使得馆藏建设更为有效。
|