吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 28162|回复: 244
收起左侧

[原创工具] 【Python】公式识别ocr小工具 v1.0.0 已完结

    [复制链接]
Captain-Li 发表于 2020-5-14 16:53
本帖最后由 Captain-Li 于 2020-10-4 11:48 编辑

此贴自下而上更新,最上面是最新版,下载最上面的就行了
请仔细阅读软件运行时显示的教程,2020.10.4 Windows10测试能用
----------------------------------------------------------------------------------------------
2020.5.29补链接:
     1.清理网盘的时候不小心把之前的文件删掉了
     2.顺手修了点bug
     就当这是1.0了,反正之后也没有了
     32/64位都能用,支持winXP/winXP+源码可以找我要(写得很烂
|||||||||下面这个是链接,2020.8.6测试能用,2020.10.4测试能用||||||||||||
                                                         蓝奏.txt (59 Bytes, 下载次数: 1223)
||||||||||||||||||||||||其他的都失效了不要下载了||||||||||||||||||||||||||||
----------------------------------------------------------------------------------------------
2020.5.24最后一次更新:
     1.现在识别不出来会显示错误而不会闪退(感谢 @JunYong
     2.可以在任意目录下使用了
一些感想:
     写这个软件的最初目的就是为了自己,
     没想到获得了大家的支持,
     这一阵也在论坛认识了很多大佬。
     本来想再加一个mathjax进去的,这样可以直接粘贴到word里,
     发现@luckfish45 已经做了,并且比我做的好得多,
     且由于本人学业繁重(补作业),

    因此,完结。
    引用坛友@but 的评论:“天下苦公式久矣”
    这就是我个人的一点点贡献了
    顺便给隔壁打个广告:(@luckfish45 够不够意思?)
    https://www.52pojie.cn/thread-1164883-1-1.html
    他的OCR工具真的非常好用
     
     V0.4.2:这次只打包了x86版本,源码可以找我要
     蓝奏云:失效
-------------------------------------------------------------------------------------------------
2020.5.15更新
1.因微软接口更新,旧版程序无法使用,请务必更新至0.4.1版本(代码兼容性太差的后果)
2.应用了版主的建议
3.一些代码优化
V0.4.1:
百度云:失效
蓝奏云:失效
--------------------------------------------------------------------------------------------------



刚写完程序发现论坛有人发过有关公式识别的,用的是百度和学而思接口,好尴尬,
还就在几天前发的是@xiyuboy 大佬做的 地址:https://www.52pojie.cn/thread-1143679-1-1.html


无可奈何,大佬的程序没有微软接口,我的程序就当做一个补充好了


代码写的很烂,但毕竟也写了一个多星期,希望各位包容。


王婆卖瓜,我先自夸一下:
微软接口优点:
1.不限次数(好像)
2.识别更准确(个人认为)
3.支持(规范、清晰、楷书的)手写
4.不要钱(不像Mathpix)


前面是小剧场以及制作过程,不想看可以跳过:

近期要帮别人打word版数学卷子
打公式很让人头疼
在网上找了各式各样的ocr识别,比如Mathpix(已收费),学而思出的海马ocr(识别不准)
为这个事头疼了一个月。


然后在AppStore上发现了微软出的“微软数学”
号称可以拍照识别打印或手写的算式并且算出答案

算出答案倒无所谓,能识别这就很香了。
我试了试,识别准确率很高,手写的居然也行,微软nb。


于是去找有没有win版,尴尬地发现:没有

于是,上Fiddler,抓包!
input.png

手机和电脑同一WiFi,手机代{过}{滤}理设置为电脑ip,Fiddler默认接口8888
检查发现,用的接口是bing的

发现#12是识别,#14是计算
这里仅分析#12:
request:

POST https://www.bing.com/cameraexp/api/v1/getlatex HTTP/1.1
Host: www.bing.com
Content-Type: application/json
Connection: keep-alive
Accept: application/json
User-Agent: Math/1 CFNetwork/1121.2.2 Darwin/19.3.0
Content-Length: 27800
Accept-Language: zh-cn
Accept-Encoding: gzip, deflate, br

{"data":"/9j/4AAQSkZJRgABAQAASABIAAD/4QBYRXhpZgAATU0AKgAAAAgAAgESAAMAAAABAAEAAIdpAAQAAAABAAAAJgAAAAAAA6ABAAMAAAABAAEAAKACAAQAAAABAAACiKADAAQAAAABAAAAgwAAAAD/7QA4UGhvdG9zaG9wIDMuMAA4QklNBAQAAAAAAAA4QklNBCUAAAAAABDUHYzZjwCyBOmACZj这一段很长删掉了","inputForm":"Image","clientInfo":{"app":"Math","platform":"ios","configuration":"Unknown","version":"1.8.0","mkt":"zh-cn"},"timestamp":1589441995722}

看起来“data:“这里就是图片了。但不知道什么格式。直接把这一段复制到百度,搜索出来的页面都是讲base64的,猜测是base64。
然后我找了个在线转换工具,随便找了个图片转码重新request,发现正常,于是可以确定是base64格式

response:

HTTP/1.1 200 OK
Cache-Control: max-age=0, no-cache, no-store, must-revalidate
Content-Type: application/json; charset=utf-8
X-MSEdge-Ref: Ref A: 87B72D36038A43019A09E52DDD22BD7B Ref B: BJ1EDGE0212 Ref C: 2020-05-14T07:39:55Z
Set-Cookie: _EDGE_S=SID=187E2349662260010FE72D83670C61A2; path=/; httponly; domain=bing.com
Set-Cookie: MUID=2571D8B0B90864C81F5AD67AB82665B0; samesite=none; path=/; secure; expires=Tue, 08-Jun-2021 07:39:56 GMT; domain=bing.com
Set-Cookie: MUIDB=2571D8B0B90864C81F5AD67AB82665B0; path=/; httponly; expires=Tue, 08-Jun-2021 07:39:56 GMT
Date: Thu, 14 May 2020 07:39:55 GMT
Content-Length: 93

{"ocrText":"F12","solution":"","timestamp":1589441995722.0,"isError":false,"errorMessage":""}


这个response应该有一个“”latex:“”项的,但这次拍的图片里没有公式,所以没有。
这里要注意,返回的latex代码"\"没有转义,需要加一步转义代码。
还有,返回的项数并不固定,有时三项有时四项,需要加一步判断。


于是乎做了一个python小程序:
先上程序效果:
1.在屏幕上分别截取三张公式图片:
(这里找的图片比较清晰,我测试过一些略有模糊或者倾斜的图片,都能识别)
input_0.png
input_1.png
input_2.png
2.程序显示状态:
(主要是看有没有出错)
input_3.png

3.公式代码输出效果:
输出每次使用程序的时间,公式编号,公式代码
input_4.png
这里输出的代码是latex格式,粘贴到MathType里就能使用:
input_5.png



使用python3写的程序
怕大家没有python环境又编译了一下



有问题或建议请回复或私信


如何使用:
1.打开(废话)
2.按F9开始截图
3.选择区域程序,自动识别并储存
重复2.3.步骤即可
个人认为非常方便


更多的提示以及教程都在程序里写了。





注意:
不能改变安装路径,因为pyinstaller打包后不能用相对路径(Pyinstaller太多坑了)
本程序不会改注册表,绿色软件,卸载直接删C:\Pic to Code文件夹就行。
更多的注意事项以及具体教程都在程序里写了


平常都是坛友造福我,
现在终于能为论坛做点贡献了。


因为要开学了,再加上网课没怎么听过,所以短期内不会更新了




V0.4:
已不能使用(因为写的太烂)

觉得好用麻烦给个币,谢谢各位

(完)
突然看到版规,说要附件下载,改了一下











点评

你解救了工科生敲公式的苦:)  发表于 2020-5-24 20:20

免费评分

参与人数 81吾爱币 +85 热心值 +71 收起 理由
冷风中的一把刀 + 1 + 1 谢谢@Thanks!
吃籽的葡萄 + 1 + 1 我很赞同!
ssyssy + 1 + 1 谢谢@Thanks!
rainbow89 + 1 + 1 谢谢@Thanks!
海强 + 1 + 1 我很赞同!
LikyWenke + 1 + 1 谢谢@Thanks!
katkat + 1 + 1 谢谢@Thanks!
danding336 + 1 + 1 谢谢@Thanks!感谢大佬,帮大忙了
曾经少年已成梦 + 1 + 1 谢谢@Thanks!
q0215 + 1 + 1 能否发下源码? 2231205594@qq.com
xiezhanpeng + 1 我很赞同!
liangfuyin + 1 + 1 热心回复!看还能补个链接不
zape + 1 + 1 谢谢@Thanks!
槲寄生2017 + 1 + 1 谢谢@Thanks!
gcsy2018 + 1 谢谢@Thanks!
睡猫猫 + 1 + 1 谢谢 @Thanks!
施施乐 + 1 谢谢@Thanks!
xyx208 + 1 + 1 我很赞同!能提供一下代码学习一下吗?susechen2011@gmail.com,谢谢!
black70 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
Charon_wth + 1 + 1 谢谢@Thanks!
565 + 1 + 1 谢谢@Thanks!
wang3166wang + 1 + 1 谢谢@Thanks!
laolin999 + 1 谢谢@Thanks!
hs7z + 1 + 1 谢谢@Thanks!
半颗糖也很甜 + 2 + 1 造福人类
jackstyle + 1 + 1 数学老师的福音啊
alderaan + 1 + 1 谢谢@Thanks!
CROWNHEAVEN + 1 为啥取消分享了
荒野大鳄鱼 + 1 很棒了
xwei9277 + 1 + 1 谢谢@Thanks!
Edelweissghr + 1 + 1 热心回复!
终结者zzz + 1 + 1 谢谢楼主的无私奉献,你的专业是编程吗,能告诉小白如何开始学吗
zhangjie0506 + 1 + 1 谢谢@Thanks!
Skywhale + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
certainMreleven + 1 谢谢@Thanks!
唯一圣琴士 + 1 + 1 感谢分享
暧阳阳 + 1 + 1 谢谢@Thanks!
ren19950712 + 1 + 1 膜拜大佬
清欢有梦 + 1 谢谢@Thanks!
caoyuanyue + 1 + 1 我很赞同!
中兴壹号 + 1 谢谢@Thanks!
angguandianzi + 1 + 1 我很赞同!
hustlzp + 3 + 1 我很赞同!
吾爱靓女 + 1 我很赞同!
msh30 + 1 好东西!希望继续完善
闻经获益 + 1 + 1 谢谢@Thanks!
fsmode + 1 + 1 谢谢@Thanks!
是你的小小羽啊~ + 1 广告贴,请遵守论坛版规!
chsypj + 1 + 1 谢谢@Thanks!
adauan + 1 + 1 我很赞同!
peso + 1 谢谢@Thanks!
wzs2004 + 1 + 1 666666666
zr2019 + 1 谢谢@Thanks!
风之暇想 + 7 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
chao8709 + 1 + 1 我很赞同!
yangswsw + 1 我很赞同!
zyfwhx + 1 + 1 太赞了,正需要!
xiao164 + 1 + 1 我很赞同!
xiaoxiao70564 + 1 + 1 bravo!
pbgz + 1 + 1 谢谢@Thanks!
zq8389937 + 1 + 1 谢谢@Thanks!
kt3v + 1 谢谢@Thanks!
xinkui + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
HA_Linux + 1 + 1 谢谢@Thanks!
luckfish45 + 1 + 1 https://www.52pojie.cn/thread-1164883-1-1.html感谢:)
笙若 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
ymhld + 1 + 1 必须得顶一下
davidai + 1 谢谢@Thanks!
lwaideingwo + 1 + 1 我很赞同!
miqi1314 + 2 + 1 期待继续更新完善,能中文和公式混合识别就更厉害了。
twostudy + 1 + 1 我很赞同!
蚂蚱丶 + 1 + 1 谢谢@Thanks!
xiyuboy + 2 + 1 我很赞同!
yanglinman + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
AiTogether + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
江米小枣 + 1 + 1 热心回复!
修罗本灭世 + 1 + 1 谢谢@Thanks!
anyucompany + 1 + 1 谢谢@Thanks!
盖世I英雄 + 1 + 1 鼓励转贴优秀软件安全工具和文档!
kexue8 + 1 + 1 感谢发布原创作品,吾爱破解论坛因你更精彩!
庾若楚 + 1 + 1 我很赞同!

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| Captain-Li 发表于 2020-10-13 17:59
2020.10.13 所有找我要源码的人 我都给了,有效期7天,注意查收
cherub0507 发表于 2020-9-15 14:55
蚂蚱丶 发表于 2020-5-14 18:35
 楼主| Captain-Li 发表于 2020-6-28 21:01

倒序,是倒序
所以最上面的是最新的
用最上面的蓝奏链就行了
kexue8 发表于 2020-5-14 17:01
希望化学方程式也能用。
weiyongjun 发表于 2020-5-14 17:29
原创,新鲜
third1979 发表于 2020-5-14 17:37
果然是高手,牛……哪天搞个继续教育在线考试的软件??
bsjasd 发表于 2020-5-14 17:54
很专业论文用的到
rbgaoshou 发表于 2020-5-14 18:08
非常好的东东!
江米小枣 发表于 2020-5-14 18:12
试了一下,还不错,谢谢分享
xiyuboy 发表于 2020-5-14 18:26
6呀,兄弟,找了很久只发现学而思的免费接口
hyoulin68 发表于 2020-5-14 18:44
原创,新鲜,赞一个
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 提醒:禁止复制他人回复等『恶意灌水』行为,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-4-19 23:19

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表