吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 49230|回复: 668
上一主题 下一主题
收起左侧

[原创工具] Umi-OCR 离线批量文字识别软件 [更新v1.3.1]

    [复制链接]
跳转到指定楼层
楼主
Nagisa1224 发表于 2022-4-18 12:11 回帖奖励
本帖最后由 Nagisa1224 于 2022-11-4 21:35 编辑

Umi-OCR 文字识别工具

免费、开源、可批量的离线OCR软件;适用于 Windows10,11 平台。

  • 免费:本项目所有代码开源,完全免费。
  • 方便:解压即用,离线运行,无需网络。
  • 批量:可批量导入处理图片,结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。
  • 高效:采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够,通常比在线OCR服务更快。
  • 精准:默认使用PPOCR-v3模型库。除了能准确辨认常规文字,对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落,得到规整的文本。

下载

Umi-OCR 软件本体含 简体中文&英文 通用识别库。
配套 多国语言识别扩展包 可导入 繁中,英,日,韩,俄,德,法 识别库,请按需下载。

Github下载:Release v1.3.1

蓝奏云下载:https://hiroi-sora.lanzoul.com/s/umi-ocr

兼容性

  • 系统支持 Win10 x64 及以上版本。
  • CPU必须具有AVX指令集。常见的家用CPU一般都满足该条件。(出现初始化引擎失败等问题时请检查CPU是否兼容,见楼下置顶回复)

简单上手

准备

下载压缩包并解压全部文件即可。

截图识别

点击截图按钮或自定义快捷键,唤起截图识别。

粘贴图片到软件

在任何地方(如文件管理器,网页,微信)复制图片,软件上点击粘贴按钮,自动识别。

批量识别本地图片文件

将图片或文件夹拖进软件,批量转换文字。也可以点击按钮打开浏览窗口导入。

文本块后处理功能

OCR识别出的文本是按“块”划分的,通常一行文字分为一块,有时还会将一行误划分为多块,这给阅读带来了不便。文本块后处理就是对文本块进行再加工的过程,合并同一行或同一段落内的文字,按正确的顺序排序。

下图表示不同排版应该选用何种处理方案:

忽略区域功能

忽略区域是本软件特色功能,可用于排除图片中水印的干扰,让识别结果只留下所需的文本。

通过设置页的 忽略区域编辑器 进入配置。

其他设置项

软件内有详尽的提示,鼠标悬停在设置项UI上即可显示提示框。

更多高级功能说明,请见项目Github页面。

更新日志

v1.3.1 2022.11.4
  • 修Bug:快捷键模块重写,引入pynput库,舍弃keyboard库,解决几率失效、录制不正确等Bug。
  • 新功能:添加开机自启,桌面快捷方式,开始菜单快捷方式。
  • 新功能:多开软件时提示。
  • 新功能:截图时隐藏窗口。
  • 调整UI:使用频率极低的设置项设为隐藏的高级选项。
  • 优化:检查引擎组件是否存在。
  • 优化:横排-合并多行-自然段 优化逻辑,支持0~2全角空格首行缩进。
v1.3.0 2022.9.29
  • 框选截屏
  • 系统托盘图标
  • 引擎进程常驻
  • 文本块后处理模块
  • 重制UI
  • 自定义主输出栏字体
  • 更新PaddleOCR-json模块至v1.2.1,提供剪贴板支持。
  • 修正了Bug:系统语言兼容性问题 issue #16
  • 修正了Bug:微信图片粘贴问题 issue #22
v1.2.6 2022.9.1
  • 更新PaddleOCR-json模块至v1.2.0,提高识别速度、准确度。
  • 调整UI:更方便地用下拉框切换识别语言。
  • 调整UI:可以从主窗口任意位置/任意选项卡拖入图片。
  • 修正了Bug:提高程序健壮性,增加启动子进程时的更多异常处理情况。
  • 修正了Bug:彻底解决了对边缘过窄的图片,识别结果不准确的问题 issue #7
  • 优化适配PP-OCRv3模型,彻底解决了v3版模型比v2慢、不准的问题 issue #4

…………

喜欢请给个⭐,谢谢支持!

https://github.com/hiroi-sora/Umi-OCR

免费评分

参与人数 263吾爱币 +257 热心值 +240 收起 理由
tk123wc + 1 + 1 感谢您的宝贵建议,我们会努力争取做得更好!
ak3590612 + 1 + 1 我很赞同!
unreally + 1 + 1 谢谢@Thanks!
liziyunabcd + 1 + 1 我很赞同!
wuzhiyong + 1 + 1 谢谢@Thanks!
流年逝水 + 1 + 1 我很赞同!
ren86chicheng + 1 + 1 谢谢@Thanks!
l7518597 + 2 + 1 再加个翻译 就是天若了
Drzzz + 1 谢谢@Thanks!
MissNalia + 1 我很赞同!
BeyondZhang + 1 我很赞同!
独行风云 + 2 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
onlymu + 1 + 1 谢谢@Thanks!
mimc + 1 + 1 我很赞同!
abb666 + 1 我很赞同!
大游 + 1 + 1 谢谢@Thanks!
id3721 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
DuanYu2016 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
冷丶眸 + 1 + 1 谢谢@Thanks!
zhiangsky + 1 + 1 谢谢@Thanks!
STARLHL + 1 真心不错,还不收费!
loading00 + 1 + 1 热心回复!
默生又名黑狗剩 + 1 + 1 热心回复!
超高校级的非命 + 1 + 1 谢谢@Thanks!
志至 + 1 + 1 我很赞同!
zczhyx + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
sihu + 1 + 1 谢谢@Thanks!
tingfengchu + 1 + 1 谢谢@Thanks!
wsabenzhu + 1 + 1 谢谢@Thanks!
X97io + 1 + 1 谢谢@Thanks!
demon86 + 1 + 1 我很赞同!
ljsshen123 + 1 我很赞同!
bhuking + 1 + 1 鼓励转贴优秀软件安全工具和文档!
liangfuyin + 1 + 1 我很赞同!
Gzsod + 1 + 1 热心回复!
aatonghua + 1 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
isffan + 1 + 1 鼓励转贴优秀软件安全工具和文档!
chaoysj + 1 + 1 天若用不了之后,很好的替代品
Fan.s + 1 + 1 热心回复!
awi0100hjz + 1 + 1 谢谢@Thanks!
cjzzz + 1 + 1 谢谢@Thanks!
mimifeng + 1 谢谢@Thanks!
ccedh + 1 + 1 我很赞同!
Skermz + 1 + 1 谢谢@Thanks!
SOWE + 1 + 1 谢谢@Thanks!
jiuqi + 1 + 1 谢谢@Thanks!
johnson_hu + 1 + 1 谢谢@Thanks!
tangkuatian + 1 + 1 谢谢@Thanks!
生逢灿烂的日子 + 1 + 1 大佬 后期集成翻译功能吗
ouzhzh + 1 + 1 谢谢@Thanks!
betterwyt0527 + 3 + 1 鼓励转贴优秀软件安全工具和文档!
zl886868 + 1 + 1 我很赞同!
whan852 + 1 谢谢@Thanks!
aynhzwh + 1 + 1 谢谢@Thanks!
MmxHand + 1 + 1 我很赞同!
cnngtc + 2 + 1 我很赞同!
yjn866y + 1 + 1 谢谢@Thanks!
恰似清风吹过 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
邪帝 + 1 + 1 要是可以加上翻译功能就更好了
pojie1217 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
loveme + 1 + 1 带有翻译就好了~
JadenZh + 1 热心回复!
尤里zlj + 1 + 1 谢谢@Thanks!
sakura3111 + 1 + 1 谢谢@Thanks!
cuixiangyi + 1 + 1 我很赞同!
kyokusanagi2000 + 1 谢谢@Thanks!
wixx + 1 + 1 我很赞同!
jxls086503 + 1 + 1 谢谢@Thanks!
tony991130 + 1 我很赞同!
苦逼人生 + 2 + 1 好用!
hjx8003 + 1 + 1 我很赞同!
shenjunwuai + 2 + 1 我很赞同!
grx742 + 1 + 1 谢谢@Thanks!
TYX + 1 + 1 我很赞同!
wlzhgszgf + 1 + 1 谢谢@Thanks!
tjjstc2018 + 1 我很赞同!
魔王王中王 + 1 + 1 谢谢@Thanks!
slb116763814 + 1 谢谢@Thanks!
FuSu_ChunQiu + 1 + 1 我很赞同!
testblog + 1 + 1 谢谢@Thanks!
buyaozc + 1 + 1 这个离线OCR识别率比较高。能识别那些分二栏,三栏排版的就更好了。
fangchang819 + 1 + 1 谢谢@Thanks!
demigodswl + 1 + 1 谢谢@Thanks!
a7031433 + 1 + 1 鼓励转贴优秀软件安全工具和文档!
TeachingFeeling + 1 + 1 我很赞同!
穿风衣的猫 + 1 谢谢@Thanks!
elanchan + 1 + 1 谢谢@Thanks!
DavisC + 1 + 1 谢谢@Thanks!
wang1anfu + 1 谢谢@Thanks!
kt3v + 1 我很赞同!
WWmc + 1 + 1 我很赞同!
蚂蚱丶 + 1 + 1 我很赞同!
ttkx101 + 1 + 1 我很赞同!
umerl + 1 + 1 我很赞同!
喜欢悠哉独自在 + 1 + 1 谢谢@Thanks!
liufenglei + 1 + 1 谢谢@Thanks!
zhzng + 1 + 1 谢谢@Thanks!
antikou + 1 谢谢@Thanks!
teykzxlzh + 1 + 1 热心回复!
青春易逝 + 1 谢谢@Thanks!

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

来自 #
 楼主| Nagisa1224 发表于 2022-9-3 10:53 |楼主
本帖最后由 Nagisa1224 于 2022-9-3 10:55 编辑

关于初始化失败或进程崩溃的说明:

当出现下图所示的Bug,初始化失败/进程崩溃,且 PaddleOCR-json.exe 报错 0xc000142;很可能是由您的CPU不支持AVX指令集引起。

CPUAVX.png

软件的离线识别引擎依赖Opencv图像处理库,默认启用了AVX指令集加速。在CPU无avx的机器上,引擎无法加载dll完成初始化,报错0xc0000142。

当前版本对此问题无解。未来可能提供一个屏蔽AVX加速的版本的软件以供这些cpu使用。遗憾的是Opencv和Paddle官方似乎未提供 no_avx 版动态库,我需要改写源码编译它们,可能短期内无法实现。

(注:常见的家用CPU一般都支持AVX)

AVX 支持的产品系列 不支持 存疑
Intel 酷睿Core,至强Xeon 凌动Atom,安腾Itanium 赛扬Celeron,奔腾Pentium
AMD 推土机架构及之后的产品,如锐龙Ryzen、速龙Athlon、FX 等 K10架构及之前的产品

(若您的CPU支持AVX仍出现了此Bug,欢迎来告诉我。建议去Github 提 issue,52这边我不一定能及时看到。)

免费评分

参与人数 2吾爱币 +2 热心值 +2 收起 理由
fuma255 + 1 + 1 期待增加截图识别后触发自定义热键,如:ctrl+c+c,完美结合goldendict查词
星夜独行客 + 1 + 1 是个好软件,可惜 Pentium G4560 不支持 AVX 指令集

查看全部评分

推荐
1qaz 发表于 2022-4-20 20:10
本帖最后由 1qaz 于 2022-4-20 20:13 编辑



任务开始时间:2022-04-20 20:09:56


忽略区域:关闭


1.jpg

识别耗时:0.008054733276367188s 置信度:失败


识别失败,错误码:300
错误信息:向识别器进程写入图片地址失败,疑似该进程已崩溃。[Errno 22] Invalid argument




---


任务结束时间:2022-04-20 20:09:57


任务耗时(秒):        0.019047260284423828
单张平均耗时:          0.019047260284423828
共计图片数量:          1
识别正常 的图片数量:    0
未识别到文字 的图片数量:0
识别失败 的图片数量:    1


是什么原因?LTSC 2019 64系统
推荐
richie600 发表于 2022-4-21 12:51
  通过别的工具先把pdf转成图片,再用此软件识别图片提取文字 复制出来 可算解决了  能把PDF直接转成可编辑文字的word文档的免费工具太稀缺了 大部分PDF转换成word后 都是以图片形式呈现在word中 并不能直接编辑 感谢分享解决了大问题
沙发
抚琴的人 发表于 2022-4-18 12:20
收藏备用
3#
wuailisure 发表于 2022-4-18 12:21
楼主厉害
4#
zsw555 发表于 2022-4-18 12:21
很实用,谢谢
5#
lxl217114 发表于 2022-4-18 12:21
哇哦,看起来不错的ocr工具,收藏备用
6#
loppol 发表于 2022-4-18 12:28
支持一下~~~~
7#
wl823 发表于 2022-4-18 12:30
好工具,就是不知道识别率高不高
8#
李佑辰 发表于 2022-4-18 12:33
牛皮啊 支持!!
9#
mcang6 发表于 2022-4-18 12:34
一直很想找一个能批量处理的,太棒了
10#
zztoozzt 发表于 2022-4-18 12:35
优秀,支持一波
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 提醒:禁止复制他人回复等『恶意灌水』行为,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-4-19 16:05

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表