吾爱破解 - LCG - LSG |安卓破解|病毒分析|破解软件|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

搜索
查看: 2470|回复: 34

[原创工具] 以API方式调用C# dll,使用OneNote2013 sp1实现离线OCR识别本地图片

  [复制链接]
liucq 发表于 2019-4-17 16:41
本帖最后由 liucq 于 2019-4-21 01:05 编辑

OneNote2013 OCR API调用使用说明
2019.4.17

解释一下OneNote和百度API的区别:前者离线识别,后者要求在线识别。目前我还没有发现其它什么软件能提供比OneNote更好的离线调用OCR的功能,如果谁知道,请留言说一下,谢谢!

使用说明:
1、安装干净的Office 2013,再安装Office 2013 sp1。不要安装其它OneNote更新(特别是KB3115256)。
2、在OneNote历史记录里面的笔记本回收站,选中禁用此笔记本的历史记录,如果有多个笔记本,最好都禁用
3、确认OneNote里面至少有一个笔记本(notebook)和一个分区(section)。这个应该OneNote默认提供的。然后新建一个页面检查插入图片之后,是否可以从图片中获得文本,能获取说明OneNote OCR功能正常。
4、打开OneNoteAPI.xlsm,运行VBA代码TestOcrB或者TestOCR,观察立即窗口输出是否正确。
5、API函数第一次运行耗时会略长(因为要启动OneNote),之后识别速度会正常。
6、在I7 CPU测试识别速度:小图片大约几十毫秒,大图片可能会上千毫秒。
7、需要简体OneNote2013 Sp1,其它版本不支持(由于OneNote对象库不能嵌入,需要重新编译才能支持其他版本)。

运行环境说明:
1、只支持简体中文版的OneNote2013,并具备至少一个Notebook(笔记本)和一个Section(分区),API运行时会在某个分区上面创建page,插入图片识别后删除。
2、禁用笔记本历史记录,(因为每次OCR都要创建一个page,禁用回收站可以避免文档加载变慢或出现其它错误。)
3、由于OneNote的原因,多次运行可能会在某个分区残留多个名为"无标题页"的page,可以调用API命令清除。
4、如果安装了多个版本的Office(不建议这么做),应保证office2013 sp1为最后安装版本。
5、程序需要.net 4.0环境https://www.microsoft.com/zh-CN/download/details.aspx?id=17718
6、目前只支持简体中文版,其它语言版本需要修改代码。

可能的错误:
1、提示缓冲区溢出。请增加Buffersize。
2、返回的识别文本长度为0。请增加延时。(程序第一次运行耗时会略长,之后会正常。)
3、Excel突然闪退。这与OneNote有关,请增加延时。如果无效请卸载Office2013,重新安装干净的版本及SP1,不要使用精简版的Office 2013。
4、小图片始终无法识别。请在OneNote里面检查是否识别功能处于禁用状态,如果无法选择中文,请重新安装或者修复Office2013或者卸载更新。2016年7月25日OneNote的一个更新可能会造成这个问题(KB3115256)。
5、任何时候,如果发现OCR识别错误,请先检查OneNote插入此图片之后获取文本功能是否正常。

如何卸载Windows更新
Windows 10:在更新历史记录里面,点击卸载更新,选择KB3115256

OCR运行结果:
r.jpg


有问题可以留言。考虑到淘宝某些人会用这个去谋利,所以默认每次启动只能运行二十次左右。

下载: OneNote_OCR_API-2013版.rar (585.56 KB, 下载次数: 63)

免费评分

参与人数 12吾爱币 +17 热心值 +12 收起 理由
zzzain46 + 3 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
lpyedge + 1 + 1 用心讨论,共获提升!
ymx1121 + 1 + 1 谢谢@Thanks!
sasmike + 1 + 1 谢谢@Thanks!
caoyuanyue + 1 + 1 鼓励转贴优秀软件安全工具和文档!
独行风云 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
墨与非 + 1 + 1 谢谢@Thanks!
浪~· + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
suliu0503 + 1 已经处理,感谢您对吾爱破解论坛的支持!
aguai2008 + 1 + 1 我很赞同!
云在天 + 6 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
abs117 + 1 我很赞同!

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| liucq 发表于 2019-4-30 12:32
zsh月夜苍狼 发表于 2019-4-30 03:44
感谢大佬提供识别软件,IdxSubOcr这个软件是识别sub字幕的。调用的是Office2003的识别功能。大佬可以研究下

应该是modi吧,已经淘汰了
 楼主| liucq 发表于 2019-4-23 19:51
dahai2626 发表于 2019-4-23 16:32
office 2016 打开后xlsm,添加图片并不能用宏识别

识别的是本地图片,随附件有例子,但是2016不能识别那个2.jpg,其它的可以。
推荐换2013sp1
浙江-杺庝 发表于 2019-4-17 16:47
 楼主| liucq 发表于 2019-4-17 17:00

你可以试试,我不清楚2016和2013的com组件clsid是否一样,如果不能用的话,谁有需要的可以找我编译2016版的
时光荏苒97 发表于 2019-4-17 19:03
支持一下吧
abs117 发表于 2019-4-17 21:36
感谢,非常有用
哩个名字好难改 发表于 2019-4-17 22:08
下载学习下图像识别!
psx1lin 发表于 2019-4-18 09:01
图像识别
研究一下
yzhyingcool 发表于 2019-4-18 10:23
没有红包,没有心情研究
peng19920604 发表于 2019-4-18 23:37
棒场,暂时用不到
铁索横江 发表于 2019-4-19 10:46
感谢分享
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 提醒:禁止复制他人回复等『恶意灌水』行为,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2019-6-24 17:25

Powered by Discuz!

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表