好友
阅读权限10
听众
最后登录1970-1-1
|
本人是从事制药研发的,因为经常需要向国家药品监督管理局递交药品申报文件,每次递交可能会有成百上千个PDF文件(总页数可能超过10万),这些文件如果有空白页,可能会导致申请被驳回,因此用Python开发了一个汇总指定文件夹及其子文件夹下所有PDF文件空白页的工具,根据“统计字符数小于”中设置的阈值进行判断(考虑到页眉页脚,以及侧面的文件编号等情况,阈值默认为50,大家可以根据自己文件的情况调整),统计结果会汇总到一个带超链接的Excel文件中,大家可以打开PDF源文件,根据具体情况决定后续的处理方式。相信其他行业的朋友,如律师、证券、金融等行业,如果需要处理行业报告,也会需要处理大量PDF文件,希望这个小工具对大家有帮助~~
下载地址(压缩包里有软件和测试文件):
https://pan.baidu.com/s/1cJ261jonqEbFZXg5pz9Tqw?pwd=6666
欢迎里面的老师们试用和提出宝贵意见~~
|
-
软件截图
-
汇总结果Excel文件
免费评分
-
查看全部评分
|
发帖前要善用【论坛搜索】功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。 |
|
|
|
|
|