吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2259|回复: 22
收起左侧

[Python 原创] python批量识别图片表格数据写入到excel表格中

  [复制链接]
Eks6666 发表于 2024-7-2 13:12
[Python] 纯文本查看 复制代码

from PIL import Image
import pytesseract
from openpyxl import Workbook

def load_image(image_path):
    image = Image.open(image_path)
    return image

def convert_to_grayscale(image):
    return image.convert("L")

def extract_text(image):
    return pytesseract.image_to_string(image)

def extract_table_data(text):
    rows = text.strip().split("\n")
    table_data = [row.split("\t") for row in rows]
    return table_data

def save_as_excel(table_data, output_path):
    workbook = Workbook()
    sheet = workbook.active

    for row_index, row_data in enumerate(table_data, start=1):
        for column_index, cell_data in enumerate(row_data, start=1):
            sheet.cell(row=row_index, column=column_index, value=cell_data)

    workbook.save(output_path)

# 调用示例
image_path = "table_image.jpg"
output_path = "table_data.xlsx"

image = load_image(image_path)
grayscale_image = convert_to_grayscale(image)
text = extract_text(grayscale_image)
table_data = extract_table_data(text)
save_as_excel(table_data, output_path)

免费评分

参与人数 7吾爱币 +11 热心值 +6 收起 理由
fadar1111 + 1 手动选择文件,用的 tkinter 库中的 filedialog.askopenfilename() 函数来.
苏紫方璇 + 7 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
hwh425 + 1 谢谢@Thanks!
慢的可以 + 1 + 1 谢谢@Thanks!
ODoItt + 1 用心讨论,共获提升!
canty胖胖 + 1 + 1 用心讨论,共获提升!
fengzi8388 + 1 + 1 谢谢@Thanks!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

rx_y2000 发表于 2024-7-2 16:53
fanny188 发表于 2024-7-2 14:40
C:%users\Administrator>D:\Personal\Desktop\1.py
Traceback (most recent call last):
  File "D:\Pe ...

pip install image
pip install workbook
pip install  pytesseract
这几个都安装一遍再试试
fanny188 发表于 2024-7-3 08:58
rx_y2000 发表于 2024-7-2 16:53
pip install image
pip install workbook
pip install  pytesseract

C:\Users\Administrator>pip install image
'pip' 不是内部或外部命令,也不是可运行的程序
或批处理文件。

C:\Users\Administrator>python

C:\Users\Administrator>pip install workbook
'pip' 不是内部或外部命令,也不是可运行的程序
或批处理文件。

C:\Users\Administrator>pip install  pytesseract
'pip' 不是内部或外部命令,也不是可运行的程序
或批处理文件。

C:\Users\Administrator>
fengzi8388 发表于 2024-7-2 13:22
這個好。前兩天為一些表格數據折騰了chatgpt好長時間才搞好。
baikun791217 发表于 2024-7-2 13:33
谢谢分享
fanny188 发表于 2024-7-2 14:08
这个怎么使用呀,我小白,电脑安装了python3.12.3    上面的代码也保存了.py文件名  
ericwise 发表于 2024-7-2 14:28
fanny188 发表于 2024-7-2 14:08
这个怎么使用呀,我小白,电脑安装了python3.12.3    上面的代码也保存了.py文件名

里面有调用示例的
fanny188 发表于 2024-7-2 14:40
ericwise 发表于 2024-7-2 14:28
里面有调用示例的

C:\Users\Administrator>D:\Personal\Desktop\1.py
Traceback (most recent call last):
  File "D:\Personal\Desktop\1.py", line 1, in <module>
    from PIL import Image
ModuleNotFoundError: No module named 'PIL'

C:\Users\Administrator>
ashirogimuto 发表于 2024-7-2 14:54
这个太有用了,非常感谢。
huliuwa 发表于 2024-7-2 16:50
可以的,会有时常用到
cksincerely 发表于 2024-7-2 17:24
想用,可是不怎么怎么用,有完整的小程序吗
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-12-14 20:34

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表