扫一扫添加福昕福利官
银行回单OCR亮点功能?OCR识别过程?
目前银行都使用了银行回单OCR系统,它可以提高银行的业务办理流程。如果大家想在家里识别银行回单的话可以使用福昕编辑器个人版中的OCR识别功能,大家有需要可以去官网下载福昕编辑器个人版。
全字段识别
支持银行回单8个关键字段识别(付款方名称、付款方账号、付款方开户行、收款方名称、收款方账号、收款方开户行、大写金额、小写金额)。
识别种类全
可自动检测、识别国内各大银行的电子及纸质回单,无需人工干预,不区分模板。
可与ERP、记账软件等系统快速集成打通,通过OCR识别技术快速将银行回单信息自动录入到系统中。
返回结构化数据
企业内网部署,保证数据安全,并返回结构化识别结果,能够满足用户对不同样式银行回单进行信息提取的需求。
图像多角度旋转裁切
支持银行回单多角度(支持0°,90°,180°,270°)裁切。
秒级识别
识别速度快,单张识别速度在1秒以内。
提供多种部署方式
支持Windows和Linux部署、WebService部署,提供标准HTTP接口。
1.图像输入
针对不同格式的图像,有着不同的存储格式和压缩方式。目前,用于存取图像的开源项目有OpenCV和CxImage等。
2.预处理
预处理主要包括二值化、噪声去除和倾斜较正,具体内容如下:
二值化:大多数情况下,使用摄像头拍摄的图片都是彩色图像,彩色图像包含的信息量非常丰富,需要进行简化。我们可以将图片的内容简单地分为前景和背景,为了让计算机更快地、更好地识别文字,需要先对彩色图像进行处理,使图片只剩下前景与背景信息,即简单地定义前景信息为黑色,背景信息为白色,这就是二值化图。彩色图像和二值化图像处理前后对比如图1所示。
噪声清除:对于不同的文档,噪声的定义可以不同。根据噪声的特征进行消除处理,这就叫做噪声去除。
倾斜校正:通常情况下,用户拍摄的照片比较随意,很有可能拍照文档会产生倾斜。这时,需要使用文字识别软件进行校正。
3.版面分析
将文档图片分段落、分行的过程叫做版面分析。由于实际文档的多样性和复杂性,目前没有一个固定的、最好的切割模型。
4.字符切割
由于拍照条件的限制,经常会造成字符粘连、断笔等情况,因此极大地限制了识别系统的性能。此时就需要文字识别软件具备字符切割的功能。
5.字符识别
很早的时候就有模板匹配,后来是以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地增加了提取的难度。
6.版面恢复
通常,人类希望识别后的文字,仍然按照原文档图片那样排列着,保持段落不变、位置不变、顺序不变,之后输出到Word文档或PDF文档,这个过程就叫做版面恢复。
7.后处理、核对
不同的语言环境中,语言的逻辑顺序是不同的。因此,需要根据语言特征的上下文,对识别后的结果进行校正,这个过程就是后处理。
银行回单OCR系统可以准确的识别出银行回单的基本内容,并且它可以避免我们人工出现的错误,因为它的正确率非常的高。