Umi-OCR是一款免费,开源,可批量的离线OCR软件,适用于 Windows10,11 平台。可以批量识别普通图片并识别文字内容导出,以及还有支持忽略指定区域的特殊功能,例如可以屏蔽掉视频右上角水印和游戏的 UI 内容。
软件特点
免费:本项目所有代码开源,完全免费。
方便:解压即用,离线运行,无需网络。
批量:可批量导入处理图片,结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。
高效:采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够,通常比在线OCR服务更快。
精准:默认使用PPOCR-v3模型库。除了能准确辨认常规文字,对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落,得到规整的文本。
更新日志
v2.1.4 主要更新:
修复:引擎原始输出项的”text”为空时,导致文本分析越界的错误。 (#625)
新增UI语言:葡萄牙语 Português 。译者:@杨鹏
PaddleOCR 插件相关:
修复:布尔类型选项不生效的问题。
修复: 繁体中文 配置文件错误的问题。
优化:调整默认线程/内存限制,默认内存占用不超过系统总内存的一半。
优化:调整识别语言库结构,精简不必要的文件。
Linux 版本相关:
优化:glibc 依赖降级至 2.31 ,兼容 Debian-11 等发行版。
修复:Docker 部署 在部分旧系统中报错 ‘code’: 803 的问题。(#621)
下载说明
以下的不同版本,仅OCR引擎插件不同,其它功能完全一致。均支持 win7 x64 及以上的系统。
附带 简中/繁中/英/日/韩/俄 多国语言识别库。
Paddle 引擎插件版
(性能好,速度快,占用率高,适合高配机器)
Rapid 引擎插件版
(速度稍慢,内存占用低,兼容好,适合低配机器)