实时新闻动态更新

为您提供有关金现代的第一手资讯

Title
业务咨询
联系电话
400-600-7966
企业微信
扫码咨询
 

金现代OCR平台|全套OCR组件,速度更快,精度更高!

2025-01-13 10:56:59   来源: 本站原创 

小到一张发票、一个证件,大到会议资料、合同文书,其信息的提取与处理曾是一项费时耗力的任务。如今,只需用摄像头扫一扫就能轻松识别并保存。这一切的背后,都离不开光学字符识别技术(OCR)强大的支持。

 

 

OCR识别示意

近年来,随着人工智能的不断发展,OCR技术持续完善和优化,为生活带来诸多便利。但对于企业而言,OCR技术在实际应用中依然面临挑战:

除了发票、卡证等常见场景外,还有大量非标准版式的需求。

手写体、印章、模糊等因素会影响识别效果。

在处理敏感信息时,数据安全性需要得到保障。

金现代OCR平台应运而生,兼具标准化和定制化、高精度、低成本快捷交付的能力,已从研发端落地实际生产应用,赋能企业数字化发展。

全套OCR组件,一站式快捷调用

金现代OCR平台提供涵盖文件解析、图像校正、目标检测、文字及表格识别等的全套OCR组件,支持基于基础能力快速开发多样化的上层应用,支持通过API接口等快捷调用,可以覆盖企业绝大多数使用场景。

01文档识别:可以对文档中的扫描图片、插图、水印、签字、印章等进行识别和解析。可实现文档信息的定位与抽取,从而辅助业务数据的快速录入、抽取、比对,实现审核过程的降本增效。

 

文档提取关键信息示意

02卡证识别:精准识别身份证、名片、工作证、驾驶证、会员卡、银行卡及营业执照等二十余种证件信息,基本涵盖常见的所有证件类型。

 

卡证识别示意

03票据识别:快速识别财务发票、火车票、航空客票等多样票据数据。借助票据识别能力可以对员工报销中提交的常见票据进行信息的快速抽取,提升报销审核效率。

 

票据识别示意

04设备识别:支持准确读取设备仪表数据,可实现生僻字符识别,小字符识别,图像纠偏,实现设备的自动取数,提升自动化水平。

 

设备识别示意

05图纸识别:支持对DWG、PDF、图片等不同格式的图纸进行识别和解析。支持基于图纸专用模型进行识别,将识别准确率从传统模式识别下的30%提升至95%。

 

传统模式识别和图纸专用模型识别效果对比

06表格识别:支持各类表格内容的识别,对于无框线表格可根据字符位置的分布转换成表格;框线不完整表格可根据直线关系自动补全;跨页表格可根据相似度将两个表格合并。

 

实验报告表格内容识别示意

07印章识别:可使用目标检测算法实现印章位置的检测以及是否遮挡文字,再通过图像处理技术和Unet算法去除文档中的印章,避免对后续OCR的影响。

 

印章识别示意

多种优势支撑,能力持续升维

高精度识别:平台具备对噪点的强抵抗能力,支持对上传文件进行去污、去黑边、纠偏、旋转等图像处理功能,常见印刷体的识别准确率可以达到95%以上。

高并发支持:平台支持100~1000并发,通过集群部署、负载均衡、异步接口调用等技术,确保在高并发场景下依然稳定高效。在主流的GPU服务器支持下,单页A4图片或PDF的识别效率不低于1张/秒。

高安全性:支持私有化部署,保证企业数据安全。

国产化支持:支持与X86、ARM架构服务器,银河麒麟、中科方德、华为欧拉、中兴新支点等国产系统进行适配。

模型自主训练:支持多种模型的自主训练,如文字识别模型(CRNN、SVTR等),文字检测模型(DBNet、PSENet等)、目标检测类模型(yolov5、yoloe+等)、图像分类模型(VGG、ResNet等)。通过模型量化剪枝、知识蒸馏等技术手段,进一步优化模型性能,识别效率与准确性更高。

未来,我们将继续探索人工智能技术,对OCR平台进行持续优化和升级,推动技术创新与应用落地,为企业客户提供更智能、更高效的解决方案。