Umi-OCR是一款免费,开源,可批量的离线OCR软件,适用于 Windows10,11 平台。可以批量识别普通图片并识别文字内容导出,以及还有支持忽略指定区域的特殊功能,例如可以屏蔽掉视频右上角水印和游戏的 UI 内容。
软件特点
免费:本项目所有代码开源,完全免费。
方便:解压即用,离线运行,无需网络。
批量:可批量导入处理图片,结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。
高效:采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够,通常比在线OCR服务更快。
精准:默认使用PPOCR-v3模型库。除了能准确辨认常规文字,对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落,得到规整的文本。
更新日志
v2.1.5 主要更新:
新增:日志机制。在命令行中启动 Umi-OCR 可查看实时日志。高于指定级别(默认为ERROR)的日志被保存到 Umi-OCR/UmiOCR-data/logs 目录中,保存级别可以在全局设置标签页中更改。
新增:大部分标签页能手动切换左右/上下双栏模式。 (#789)
新增:Esc键隐藏主窗口。 (#652)
新增:调整二维码生成相关参数后,自动刷新二维码生成。 (#690)
新增:命令行指令 --reload ,用于重新加载配置文件。 👉 文档
修复:文档识别提取PDF自带的文本内容时,未考虑页面旋转的影响。 (#785)
修复:文档识别生成单层PDF时,未写入原PDF自带的文本内容。
修复:OCR结果展示列表的一些显示Bug和鼠标划选Bug。
修复:调整标签页顺序或删除标签页后,未及时保存顺序信息。
修复:HTTP接口 /api/doc/download 参数 ignore_blank 的错误。
修复:Linux版本截图时,系统任务栏推移顶层窗口,导致截图位置偏移。 (#778)
修复:Linux版本截图后,主窗口的位置与操作前不一致。
优化:图片/文档的异步加载机制。现在可以流畅地加载含有数万个子文件的文件夹,且能预览加载进度。 (#710)
Windows 版本更新第三方依赖库:PyMuPDF 1.24.11 ,fontTools 4.56.0 ,Pillow 10.4.0 ,psutil 10.4.0 ,pynput 1.8.0 ,zxing-cpp 2.3.0
新增UI语言:俄语 Português ,译者:Вячеслав Анатольевич Малышев、Muhammadyusuf Kurbonov。泰米尔语 தமிழ் ,译者:தமிழ்நேரம்。
下载说明
以下的不同版本,仅OCR引擎插件不同,其它功能完全一致。均支持 win7 x64 及以上的系统。
附带 简中/繁中/英/日/韩/俄 多国语言识别库。
Paddle 引擎插件版
(性能好,速度快,占用率高,适合高配机器)
Rapid 引擎插件版
(速度稍慢,内存占用低,兼容好,适合低配机器)
下载地址
Umi-OCR文字识别工具(离线OCR软件) v2.1.5 中文绿色版
夸克云:https://pan.quark.cn/s/12f8f9d8e9b5
城通盘:https://url33.ctfile.com/d/2655733-58348836-d9357c?p=2023 (访问密码: 2023)
百度云:https://pan.baidu.com/s/1tNRp6OUxA8c5QhFXDTumLg?pwd=s5cu
蓝奏云:https://gndown.lanzoue.com/b00efn72pi
123 盘:https://www.123pan.com/s/N7M7Vv-De9od.html