Maestro光学字符识别服务器 – 功能

Maestro光学字符识别服务器的OCR准确率、可靠性

高度精确的OCR可以用一个简单的即时关键字搜索重要信息,避免手动搜索浪费大量时间。Maestro OCR引擎是准确率最高的OCR产品之一。Maestro OCR已经经过测试,证明它能够识别出同类竞争产品经常遗漏的复杂文本,包括低分辨率文档、包含多方向文本的文档以及含有低对比度彩色文本的文档。

更准确的OCR结果可以提高扫描文档的索引、搜索和处理效率,还可以提高数据提取准确率、大数据应用的数据挖掘准确率,以及员工工作效率。在Maestro的 帮助下,用户可以在一个多页文档中立即找到一个单词,而该文档可能包含1-1000个页面,这就像大海捞针一样。

更快的处理速度和更高的OCR准确率

Maestro OCR已经被测试过比领先的OCR引擎更准确。OCR高准确率是通过利用先进的图像处理技术实现的,包括:重新采样、前景和背景分离、自动旋转和字体学习。

福昕 领先的OCR引擎 结果
25份黑白文件 11,650个 单词 10,151 个单词 福昕的准确率高15%
25份彩色文件 4,905个 单词 4,421 个单词 福昕的准确率高11%

先进的图像处理技术

Maestro 光学字符识别服务器独具三大优势,首先它拥有先进的图像处理能力,因而能实现更高的OCR准确率。其次Maestro 支持图像倾斜校正和降噪处理,从而提高文档的质量,此外它还支持图像处理功能,包括自动旋转、自动反色、自动裁剪和颜色重新采样。Maestro 强大的图像处理功能在图像进行处理之前提高了图像质量,并提高了OCR的准确性。

先进的PDF管理

Maestro光学字符识别服务器提供了高级PDF管理功能,包括:PDF线性化处理、高级安全保护、PDF/A标准遵从性、元数据插入、PDF显示控制、贝茨图章、页眉和页脚。Maestro 可以快速输出线性化的PDF,让用户在网页浏览PDF时快速打开文档特定页面,无需等待,而其余部分在后台加载。Maestro 还提供了高级安全保护功能,包括编辑保护、打印保护和读取保护。使用Maestro,用户可以放心地将符合PDF/A标准的文档存档。

  • 监控文件夹:自动进行OCR。监控文件夹允许用户无需特意关注OCR进程;只需要将文件放入一个文件夹就可以将它转换成可搜索的文档。
  • OCR准确性:Maestro 已经被测试为最精确的OCR引擎之一,能够定位那些经常被同类竞争产品所遗漏的复杂文本。更准确的OCR结果可以提高员工的效率,方便用户更好地存储、访问和管理文档。
  • 快速的OCR:接近6000页/时/核。
  • 不限核数批量OCR和多线程:Maestro 正是为了企业每年上千万甚至高达数十亿页面的大规模处理而设计的。
  • 支持转换多种格式:支持将PDF、TXT、RTF、JPG、TIFF等格式的文件转换成可搜索的PDF文件。
  • 错误监控模块:当处理过程中发生错误时,系统会自动重试之前的操作,并在批处理结束后产生错误日志文件。
  • Maestro 支持识别118种语言,包括简体和繁体中文OCR、日文OCR、韩语和阿拉伯语等。