ocr识别引擎是什么? OCR引擎包含哪些部分?很多人知道ocr识别技术,但是对于
ocr识别引擎并不是很了解,ocr识别引擎是ocr识别技术的核心,是ocr识别技术的关键,下面福昕全能王就来给大家相信介绍下吧。
ocr识别引擎是什么?
OCR引擎是指将OCR软件的核心技术(不包含UI)整理成SDK(SOFTWARE DEVELOPMENT TOOLKIT)软件开发包的形式,供各种应用程序调用OCR核心技术,开发OCR各种应用软件(如
文档识别、名片识别、证件识别,车牌识别,移动端识别应用等)。
OCR引擎包含哪些部分?
OCR引擎核心技术模块主要是由下面几个部分组成:
图像输入:读取不同图像格式文件的算法。
图像预处理:主要包括图像二值化,噪声去除,倾斜较正等算法
版面分析:将文档图片分段落,分行的算法就叫版面分析算法
字符切割:字符切割算法主要处理因字符粘连、断笔造成字符难以简单切割的问题。
字符特征提取:对字符图像提取多维的特征用于后面的特征匹配模式识别算法。
字符识别:将当前字符提取的特征向量与特征模板库进行模板粗分类和模板细匹配,识别出字符的算法。
版面恢复:识别原文档的排版,按原排版格式将识别结果输出到word或pdf等格式文档,叫做版面恢复算法。
后处理校正: 根据特定的语言上下文的关系,对识别结果进行较正的算法。
OCR识别率受到哪些因素的影响?
1.图片的质量,一般建议150dpi以上。
2.颜色,一般对彩色识别很差,黑白的图片较高,因此建议ocr的为黑白tif格式。
3.最重要的就是字体,如果是手写识别率很低。
国内
OCR识别简体差错率为万分之三,如果要求更高的精度需要投入更大的人工干预。繁体识别由于繁体字库的不统一性(民国时期的字库和现在繁体字库不统一),导致识别困难,在人工干预下,精度能达到90%以上(图文清晰情况下)。
ocr识别引擎是什么? OCR引擎包含哪些部分?ocr识别引擎对于ocr识别技术来说很关键,通常分为图像输入、识别、校正等几个方面,大家可以去福昕全能王官网上详细了解哦。