吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1995|回复: 21
收起左侧

[学习记录] pdf转word

  [复制链接]
henji1005 发表于 2025-11-17 16:41
[Python] 纯文本查看 复制代码
import argparse
import os
from pdf2docx import Converter
from glob import glob


def convert_pdf_to_word(pdf_path, docx_path):
    """转换单个PDF文件到Word文档"""
    cv = Converter(pdf_path)
    cv.convert(docx_path)
    cv.close()


def batch_convert(input_dir, output_dir):
    """批量转换整个文件夹的PDF文件"""
    # 创建输出目录
    os.makedirs(output_dir, exist_ok=True)

    # 获取所有PDF文件
    pdf_files = glob(os.path.join(input_dir, "*.pdf"))

    if not pdf_files:
        print(f"在输入目录中未找到PDF文件:{input_dir}")
        return

    success = 0
    failed = 0

    for pdf_path in pdf_files:
        try:
            # 生成输出路径
            filename = os.path.basename(pdf_path)
            docx_filename = os.path.splitext(filename)[0] + ".docx"
            docx_path = os.path.join(output_dir, docx_filename)

            # 执行转换
            convert_pdf_to_word(pdf_path, docx_path)
            print(f"转换成功:{filename} -> {docx_filename}")
            success += 1
        except Exception as e:
            print(f"转换失败:{filename},错误:{str(e)}")
            failed += 1

    print(f"\n转换完成!成功:{success} 个,失败:{failed} 个")


if __name__ == "__main__":
    # 设置命令行参数
    parser = argparse.ArgumentParser(description="PDF批量转Word工具")
    parser.add_argument("-i", "--input", required=True, help="E:\pdf转word\pdf文档文件")
    parser.add_argument("-o", "--output", required=True, help="E:\pdf转word\转换后的word文件路径)")

    args = parser.parse_args()

    # 验证输入路径
    if not os.path.isdir(args.input):
        print(f"错误:输入路径不存在或不是目录 - {args.input}")
        exit(1)

    # 执行批量转换
    batch_convert(args.input, args.output)

免费评分

参与人数 4吾爱币 +2 热心值 +3 收起 理由
outdoorreadbook + 1 + 1 用心讨论,共获提升!
xiaofeng4929 + 1 谢谢@Thanks!
C__K + 1 谢谢@Thanks!
zbfdyw + 1 我很赞同!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

xhcy001 发表于 2025-11-17 18:36
这个代码有没有成品?潘僧打包比较麻烦的。
soul6 发表于 2025-11-17 19:53
chenfann 发表于 2025-11-17 20:12
yaoshun3 发表于 2025-11-17 20:22
pdf2docx 确实可以
zeweir 发表于 2025-11-17 20:41

pdf2docx 确实可以
lvtiesheng 发表于 2025-11-17 20:50

还行,有点意思
wangwh 发表于 2025-11-17 21:10
希望能发个成品软件。自己不会弄呀
KesinFox 发表于 2025-11-17 21:45
文本不可以复制的大部分都是orc吗?
如果可以直接复制的MinerU挺好用的吧。
Lyaj 发表于 2025-11-17 22:50
小白期待成品
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - 52pojie.cn ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2026-2-20 15:45

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表