Maestro光学字符识别服务器 - 概述

用于高效扫描、存储和检索文档的OCR软件

企事业单位、政府机构和发展中企业可以可靠、高效地利用Maestro 光学字符识别服务器将扫描的纸张和图像文档转换成可搜索的PDF文件。Maestro 将图像预处理和专有的OCR投票引擎结合在一起,提供高精度的文本识别功能。此外,OCR软件还能自动化处理批量的文档,从而简化文档扫描、存储和归档等工作流程,即使是大规模的企业文档处理也能实现。

OCR的准确性、速度和简单性

福昕的Maestro 光学字符识别服务器正是为了解决自动扫描并识别大规模文档的需求而设计的。Maestro 可以将纸质文档转换成可搜索的PDF文件。此外,Maestro 可以根据用户的配置选择,在文档进入监控文件夹时转换文档,从而自动完成OCR过程。除了自动进行OCR过程以外,Maestro 还集成了无限制的多线程和批量OCR处理,以适应大容量扫描,每年可处理的文档页数高达数十亿页,使Maestro 成为名副其实的企业必备OCR软件解决方案。

Maestro 是为了提高OCR的准确率和速度、简化OCR流程而设计。Maestro 使用先进的图像预处理技术和专有的OCR投票引擎来提供高度精确的文本识别率。此外,在将Maestro 处理速度设置成高速的情况下,其平均处理速度可以达到约6000页/时/核。最后,Maestro 是一种灵活的OCR解决方案,可以很轻松集成到当前的文档成像工作流中,允许用户执行许多除了OCR以外的图像处理功能。

  • 高度精确的OCR,专门用于企业文档扫描、存档和数字化

  • 支持监控文件夹模式,无需手动操作,自动进行OCR处理

  • 支持批量OCR和无限制的多线程处理,实现快速、大规模处理

  • 强大稳定的OCR功能,包括错误日志文件和置信度控制

  • 支持13种不同文件格式的OCR输入,包括TIFF和PDF

  • 控制输出13种不同的格式,包括PDF和PDF/A

Maestro光学字符识别服务器的OCR准确率、可靠性

高度精确的OCR可以用一个简单的即时关键字搜索重要信息,避免手动搜索浪费大量时间。Maestro OCR引擎识别准确率高,可以处理复杂的文本,包括低分辨率文档、包含多方向文本的文档以及含有低对比度彩色文本的文档。

更准确的OCR结果可以提高扫描文档的索引、搜索和处理效率,还可以提高数据提取准确率、大数据应用的数据挖掘准确率,以及员工工作效率。在Maestro的 帮助下,用户可以在一个多页文档中立即找到一个单词,而该文档可能包含1-1000个页面,这就像大海捞针一样。

更快的处理速度和更高的OCR准确率

Maestro OCR引擎处理速度快,准确率高。OCR高准确率是通过利用先进的图像处理技术实现的,包括:重新采样、前景和背景分离、自动旋转和字体学习。

先进的图像处理技术

Maestro 光学字符识别服务器独具三大优势,首先它拥有先进的图像处理能力,因而能实现更高的OCR准确率。其次Maestro 支持图像倾斜校正和降噪处理,从而提高文档的质量,此外它还支持图像处理功能,包括自动旋转、自动反色、自动裁剪和颜色重新采样。Maestro 强大的图像处理功能在图像进行处理之前提高了图像质量,并提高了OCR的准确性。

先进的PDF管理

Maestro光学字符识别服务器提供了高级PDF管理功能,包括:PDF线性化处理、高级安全保护、PDF/A标准遵从性、元数据插入、PDF显示控制、贝茨图章、页眉和页脚。Maestro 可以快速输出线性化的PDF,让用户在网页浏览PDF时快速打开文档特定页面,无需等待,而其余部分在后台加载。Maestro 还提供了高级安全保护功能,包括编辑保护、打印保护和读取保护。使用Maestro,用户可以放心地将符合PDF/A标准的文档存档。

  • 监控文件夹:自动进行OCR。监控文件夹允许用户无需特意关注OCR进程;只需要将文件放入一个文件夹就可以将它转换成可搜索的文档。

  • OCR准确性:Maestro提供精确的OCR引擎,能够定位复杂文本。更准确的OCR结果可以提高员工的效率,方便用户更好地存储、访问和管理文档。

  • 快速的OCR:接近6000页/时/核。

  • 不限核数批量OCR和多线程:Maestro 正是为了企业每年上千万甚至高达数十亿页面的大规模处理而设计的。

  • 支持转换多种格式:支持将PDF、TXT、RTF、JPG、TIFF等格式的文件转换成可搜索的PDF文件。

  • 错误监控模块:当处理过程中发生错误时,系统会自动重试之前的操作,并在批处理结束后产生错误日志文件。

  • Maestro 支持识别118种语言,包括简体和繁体中文OCR、日文OCR、韩语和阿拉伯语等。

系统要求

Windows服务器

CPU - 英特尔奔腾处理器或兼容的2.0 GHz和更高版本

内核 - 推荐至少两核

RAM - 1 GB/核(建议至少2 GB/核)

操作系统 - Windows 10/8.1/8/7/2012/2008

Linux用户

使用VirtualBox 3或更高版本在Windows模拟系统上运行(VirtualBox无需付费)

Mac用户

下面是在Mac上运行福昕软件的两种方法:

使用Mac OS X在模拟Windows的系统(VM Fusion 2.0)上运行

使用Mac在Windows操作系统上运行(直接运行或使用Bootcamp运行)