吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 20049|回复: 99
收起左侧

[Windows] 【转载】PDF、OFD电子发票解析V1.5.1-发票信息提取至Excel

    [复制链接]
xinyu444444 发表于 2021-1-12 20:47
本帖最后由 xinyu444444 于 2021-1-12 20:51 编辑

转载自https://blog.csdn.net/cw461890117/article/details/110558735


因工作原因需要转换电子发票,而且量大,上网搜索了很多,发现一个比较好用的,特来分享。


功能说明:
输入PDF电子发票所在路径,程序遍历路径下所有PDF电子发票(可以存在目录),读取并把主要一些信息写入Excel中。
使用说明:
1、下载后解压,得到一个文件和一个文件夹

2、直接运行exe文件(res文件夹中的内容不要动,res文件夹保留与exe文件在同一目录;Excel文件不要编辑,也不要删除,它是作为Excel样式模板而存在,没有这个文件会报错)

3、说明:此程序是在windows10下打包,不保证其他版本操作系统能够运行。
4、输入PDF电子发票所在路径

5、程序就会解析了(测试机上每秒解析3-4个)

6、去PDF文件目录下就可以找到生产的Excel文件了
7、打开Excel就可以看到提取到的信息了。提取的信息如下:



8、说明:1)、此程序仅在windows10下测试,其他操作系统很可能无法运行。2)、若某些电子发票存在限制复制内容,那么此程序无法读取其内容。
感谢作者

白嫖党第一次发帖,如果有违规麻烦管理删除,感谢。
链接:https://pan.baidu.com/s/17ahUHnAN3m2cW3r1nGH47g 提取码:ndrj
image.png

免费评分

参与人数 38吾爱币 +32 热心值 +32 收起 理由
loading00 + 1 + 1 热心回复!
小黑蛋 + 1 + 1 我很赞同!
xueking + 1 + 1 谢谢@Thanks!先收藏了
hardsky + 1 + 1 谢谢@Thanks!
zengzw + 1 + 1 谢谢@Thanks!
dotnetfei123 + 1 + 1 谢谢@Thanks!
yebingbing + 1 + 1 谢谢@Thanks!
supersudda + 1 谢谢@Thanks!
夏天1918 + 1 + 1 谢谢@Thanks!
mirooo1223 + 1 谢谢@Thanks!
my1860 + 1 我很赞同!
yangangel + 1 谢谢@Thanks!
48973312 + 1 + 1 鼓励转贴优秀软件安全工具和文档!
xxw125 + 1 + 1 谢谢@Thanks!
中国好媳妇 + 1 谢谢@Thanks!
N2020 + 1 + 1 谢谢@Thanks!
zeroonetwo + 1 + 1 谢谢@Thanks!
tanzjzj + 1 + 1 谢谢@Thanks!
tianxinjian + 1 + 1 谢谢@Thanks!
bfhcyfy + 1 + 1 谢谢@Thanks!
guoruihotel + 1 + 1 谢谢@Thanks!
虚生之忧 + 1 鼓励转贴优秀软件安全工具和文档!
lxf1971 + 1 + 1 已经处理,感谢您对吾爱破解论坛的支持!
jefflo + 1 谢谢@Thanks!
13927381212 + 1 + 1 我很赞同!
hjjr123 + 1 + 1 谢谢@Thanks!
Jicy + 1 + 1 谢谢@Thanks!
pyqq + 1 + 1 鼓励转贴优秀软件安全工具和文档!
jiang992 + 1 谢谢@Thanks!
lijinmingvip + 1 + 1 谢谢@Thanks!
zixuanting + 1 谢谢@Thanks!
kevinbinhe + 1 + 1 我很赞同!
ymyoo + 1 谢谢@Thanks!
WuAi5324499 + 1 热心回复!
momo_good + 1 + 1 谢谢@Thanks!
yanglinman + 1 谢谢@Thanks!
新手上机 + 1 + 1 鼓励转贴优秀软件安全工具和文档!
王金彪 + 1 + 1 热心回复!

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

carrot_52 发表于 2021-1-12 23:22
厉害鸭,去作者那儿看看原理,学习,感谢lz分享
 楼主| xinyu444444 发表于 2021-1-13 15:21
beyond510 发表于 2021-1-12 23:13
我尝试用了一下,随便找了个发票的PDF,结果报错了
“TypeError: '>' not supported between instances of ...

参考: 1、python,解析pdf使用pdfplumber 2、读取pdf中的txt文本 3、使用正则表达式从txt文本中获取每个字段的值 示例代码(代码不好看,所以就不发全部了)
inv.checkCode = re.search('校(.*)验(.*)码(.*)', txt_h).group().split(':')[1]
inv.BName = re.search('名(.*)称(.*):(.*)', txt_h).group().split(':')[1].lstrip().split(' ')[0].replace(' ', '')
这个是作者发在评论里的,我也看不懂,希望有用吧
hackgsl 发表于 2021-1-12 21:02
xiahhhr 发表于 2021-1-12 21:12
感谢分享,一直想弄电子档做备份,奈何太懒
探索知识 发表于 2021-1-12 21:22
一直想弄电子档做备份
蒲海波 发表于 2021-1-12 21:26
这个东西真是太实用了
yanglinman 发表于 2021-1-12 21:31
实用工具,下载试用,谢谢分享,支持顶贴!
maoer8783 发表于 2021-1-12 21:33

感谢分享,
davidai 发表于 2021-1-12 21:38
谢谢分享  
sxbjgh 发表于 2021-1-12 21:48
挺牛逼的!我服了!~
xxwen 发表于 2021-1-12 21:51
谢谢分享
有哪位朋友在win7成功使用的吗?谢谢
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 提醒:禁止复制他人回复等『恶意灌水』行为,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-4-19 08:25

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表