|
xlqin
发表于 2021-12-5 12:29
最近做了一个python的小脚本用于提取电子加油票PDF文件中的信息到excel文件,因为别人的电脑没有安装python,所以需要打包成exe文件。
代码如下,代码很少:
[Python] 纯文本查看 复制代码 import pdfplumber
import os
import pandas
print('开始提取...请稍后...')
list=[]
tikes=[]
pdf_files=os.listdir()
for file in pdf_files:
if file.endswith('.pdf'):
with pdfplumber.open(file) as pdf:
page=pdf.pages[0]
text=page.extract_text().split('\n')
date=text[0].replace(" ","/")
money=text[-2]
no=file.split('_')[1].split(".")[0]
list=[date,money,no]
tikes.append(list)
if len(tikes)!=0:
ex=pandas.DataFrame(tikes,columns=['日期','金额','发票号码'])
ex.to_excel('邮票.xlsx',index=False)
else:
print("未发现PDF文件...")
打包尝试:
第一种方法:pyinstaller
1.打开CMD,安装pyinstaller模块,使用命令:pip install pyinstaller 等待完成,然后关闭cmd.
2.在需要打包的py文件所在文件夹的地址栏清空后输入cmd,打开cmd,这时候cmd路径会变成当前文件夹路径
3.输入命令:pyinstaller -F 打包的文件名(比如我的打包文件时pdf.py,输入:pyinstaller -F pdf.py)然后等待结束,在当前文件夹的dist文件夹中会生成一个exe文件。
如果想生成的exe有自己的图标,需要把ico格式的图标文件与打包文件放在一个文件夹里,打包命令就变成:pyinstaller -F -i 图标文件名 打包文件名(例如我的是pyinstaller -F -i pdf.ico pdf.py)。这里说明-F表示生成一个单体文件,不用-F 默认产生多个文件作为可执行程序。
结论:pyinstaller生成的文件可以运行,但是体积有点大,我这短短几行代码生成的文件69MB大,于是开始尝试其他方法缩小文件体积。
第二种方法:pipenv虚拟环境下打包,pipenv+pyinstaller。
1.打开cmd 安装pipenv模块:pip install pipenv
2.安装完成后,随便找一个盘符,在这个盘符的根目录(最好是根目录)新建一个文件夹,作为虚拟环境,然后双击进入该文件夹,比如我在D盘创建env文件夹作为虚拟环境。
3.按住Shift键,在文件夹的空白处,点击鼠标右键,在菜单中找到Powershell,点击,出现Powershell的命令界面
4.安装python,例如:pipenv install --python 3.8(因为我的电脑安装的3.8版本python,所以我还选择3.8),安装完成后关闭
5.把打包的py文件和图标文件复制到此文件夹里。
6.文件夹地址栏清空,输入cmd,打开CMD窗口,激活虚拟环境,输入命令:pipenv shell,这时cmd变成下面这样:
7.安装打包文件需要的第三方模块(python自带的不用安装),使用命令:pipenv install 模块名,比如我的py文件7用到了pdfplumber、pandas和pyinstaller也要安装。比如我安装命令是pipenv install pdfplumber,pandas,pyinstaller
8.打包文件,命令跟第一种方法一样:pyinstaller -F py文件名 或带图标的:pyinstaller -F -i 图标文件夹名 py文件夹名 然后等待完成后在dist文件夹中可找到生成的exe文件。
结论,虚拟环境下生成的exe文件37MB,比纯pyinstaller小了近一半。虽然看上去步骤好多8个步骤,实际操作起来很简单,也很快。
第三种:pipenv+upx+pyinstaller,就是把upx这个文件放在同目录下就可以了 用第二种方法打包的时候会自动运行upx,生成的文件会再压缩,只有28MB。虽然还不太满意,目前还没有找到更好的方法。
upx不太好找,我网盘里可以下:
链接:https://pan.baidu.com/s/121064pMlZsrr4JAZxUvR5w
提取码:52pj
还尝试过miniconda虚拟环境打包,生成的文件不是单体文件,也尝试了unitka,结果打包过程时间太长了,而且不知道为什么生成的文件还不能运行,因此这两种方法就不分享了。
|
免费评分
-
查看全部评分
|
发帖前要善用【论坛搜索】功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。 |
|
|
|
|