PaddleOCR 简述-CFANZ编程社区

PaddleOCR 简述

1. PaddleOCR 简述

OCR （Optical Character Recognition，光学字符识别）是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。

PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库，助力开发者训练出更好的模型，并应用落地。

PaddleOCR 的主要特性包括：

（1）超轻量模型

（2）通用识别大模型

（3）算法丰富且开源

（4）支持自定义训练

（5）支持C++预测、端侧部署、服务部署

支持多种OCR相关前沿算法，在此基础上打造产业级特色模型PP-OCR和PP-Structure，并打通数据生产、模型训练、压缩、预测部署全流程。

PaddleOCR 全框架示意图：

Screenshot - 2022-10-20 09.57.00.png

类别	亮点
高精度中文识别模型SVTR	比PP-OCRv3识别模型精度高3%，<br />可用于数据挖掘或对预测效率要求不高的场景。
手写体识别	新增字形支持

0 条评论